chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

心智理論測試:人工智能擊敗人類

AI智勝未來 ? 來源:悅智網(wǎng) ? 2024-11-08 10:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

測試結(jié)果并不一定意味著人工智能可以“理解”人。

心智理論是指可以理解他人心理狀態(tài)的能力,正是它驅(qū)使著人類社會運(yùn)轉(zhuǎn)。它幫助你決定在緊張的情況下該說什么、猜測其他車輛的駕駛員將要做什么,以及與電影中的角色產(chǎn)生共鳴。一項(xiàng)最新的研究表明,ChatGPT等工具所使用的大語言模型在模仿這一典型人類特征方面表現(xiàn)得非常出色。

“在進(jìn)行這項(xiàng)研究之前,我們都相信大語言模型無法通過這些測試,特別是那些判斷不易察覺的心理狀態(tài)能力的測試。”該研究的合著者克里斯蒂娜?貝奇奧(Cristina Becchio)說,她是德國漢堡-埃彭多夫大學(xué)醫(yī)學(xué)中心的認(rèn)知神經(jīng)科學(xué)教授。這項(xiàng)她認(rèn)為“出乎意料和令人驚訝”的研究結(jié)果發(fā)表在2024年5月20日的《自然?人類行為》雜志中。

貝奇奧和她的同事并不是首先提出證據(jù)表明大語言模型的反應(yīng)能夠表現(xiàn)這種推理能力的人。在2023年發(fā)表的一篇預(yù)印本論文中,斯坦福大學(xué)心理學(xué)家邁克爾?科辛斯基(Michal Kosinski)報告了幾個模型在幾種常見心智理論測試中的測試情況。他發(fā)現(xiàn),其中最好的是OpenAI的GPT-4,它正確完成了75%的任務(wù),他說,這相當(dāng)于過去研究中6歲兒童的表現(xiàn)。不過,這項(xiàng)研究中的方法遭到了其他研究人員的批評,他們進(jìn)行了后續(xù)實(shí)驗(yàn),并得出結(jié)論,大語言模型之所以能得出正確答案,往往是基于“淺顯的啟發(fā)”和捷徑,而不是真正基于心智理論推理。

本研究的作者很清楚這種爭論。“在論文中,我們的目標(biāo)是使用廣泛的心理測試,以更加系統(tǒng)的方式來應(yīng)對機(jī)器心智理論的評估挑戰(zhàn)。”該研究的合著者詹姆斯?斯特拉坎(James Strachan)說,他是一名認(rèn)知心理學(xué)家,目前是漢堡-埃彭多夫大學(xué)醫(yī)學(xué)中心的訪問科學(xué)家。他指出,進(jìn)行嚴(yán)謹(jǐn)?shù)难芯恳馕吨獪y試人類和大語言模型處理相同任務(wù)的能力,這項(xiàng)研究比較了1907個人與幾個流行的大語言模型的能力。

大語言模型和人類都完成了5種典型的心智理論測試,前3種是理解暗示、反語和失禮。此外,他們還回答了“錯誤信念”問題,這些問題通常用于確定幼兒心智理論的發(fā)展程度。這些問題是這樣的:如果愛麗絲在鮑勃不在房間的時候移動了某樣?xùn)|西,那么鮑勃回來后應(yīng)該去哪里找這個東西?最后,他們回答了“奇怪故事”中一些相當(dāng)復(fù)雜的問題,這些故事中的人物相互撒謊、操縱并產(chǎn)生了很多誤解。

總體而言,GPT-4占據(jù)了優(yōu)勢。它的得分在錯誤信念測試中與人類相當(dāng),在反語、暗示和奇怪故事方面的總分高于人類,只在失禮測試中表現(xiàn)不如人類。為了理解失禮測試結(jié)果有所不同的原因,研究人員對該模型進(jìn)行了一系列后續(xù)測試,探索了幾種假設(shè)。他們得出的結(jié)論是,GPT-4能夠?qū)τ嘘P(guān)失禮的問題給出正確答案,但在固執(zhí)己見方面受到“極端保守”編程的限制。斯特拉坎指出,OpenAI在模型周圍設(shè)置了許多圍欄,“旨在保持模型真實(shí)、誠實(shí)和正確”,他認(rèn)為,旨在防止GPT-4產(chǎn)生幻覺(即編造內(nèi)容)的策略可能會妨礙它對一些問題輸出觀點(diǎn),比如故事角色是否在高中同學(xué)聚會上無意間侮辱了老同學(xué)。

研究人員很謹(jǐn)慎。他們沒有說自己的研究結(jié)果表明大語言模型實(shí)際上擁有心智理論能力,而是說大語言模型“在心智理論任務(wù)中的表現(xiàn)與人類行為沒有區(qū)別”。這就引出了一個問題:如果一個仿品和真品一樣好,那你怎么知道它不是真品?斯特拉坎說,這是一個社會科學(xué)家以前從未嘗試回答的問題,因?yàn)閷θ祟惖臏y試會假設(shè)這種品質(zhì)在某種程度上是存在的。“我們目前還沒有一種方法甚至是一種理念來測試心智理論的存在,這是一種現(xiàn)象學(xué)品質(zhì)。”他說。

華盛頓大學(xué)計(jì)算語言學(xué)教授艾米麗?本德(Emily Bender)因堅(jiān)持揭露人工智能行業(yè)的膨脹炒作而成為了該領(lǐng)域的傳奇人物。她對這個激勵著研究人員的問題提出了異議?!懊鎸ο嗤瑔栴},文本處理系統(tǒng)能否產(chǎn)生與人類相似的答案為什么如此重要?”她問道,“我們能夠了解大語言模型內(nèi)部是如何運(yùn)作的嗎?它們可能有什么用處,又可能帶來哪些危險?”

本德對論文中的擬人化表示擔(dān)憂,論文研究人員說大語言模型有認(rèn)知、推理和作出選擇的能力,還使用了“大語言模型和人類參與者之間的物種公平比較”這一措辭。本德說,這“完全沒有將軟件囊括在內(nèi)”。

漢堡-埃彭多夫大學(xué)醫(yī)學(xué)中心團(tuán)隊(duì)的研究結(jié)果可能并不表明人工智能真的能理解我們,但值得思考的是,人工智能能夠做出令人信服的行為,這會帶來什么影響。雖然這種大語言模型在與人類用戶交互和預(yù)測用戶需求方面會做得更好,但它們也可能更多地用于欺騙和操縱。它們會引來更多的擬人化,讓人類用戶相信用戶界面的另一端是有思想的。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1811

    文章

    49488

    瀏覽量

    258087

原文標(biāo)題:人工智能在心智理論測試中戰(zhàn)勝人類

文章出處:【微信號:AI智勝未來,微信公眾號:AI智勝未來】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能

    的框架小 10 倍,速度也快 10 倍,甚至可以在最先進(jìn)的邊緣設(shè)備上進(jìn)行人工智能處理。在這篇博文中,我們將介紹這對開發(fā)人員意味著什么,以及使用 Neuton 模型如何改進(jìn)您的開發(fā)和終端
    發(fā)表于 08-31 20:54

    挖到寶了!人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器

    家人們,最近在研究人工智能相關(guān)設(shè)備,挖到了一款超厲害的寶藏——比鄰星人工智能綜合實(shí)驗(yàn)箱,必須來給大伙分享分享!可?(壹捌伍 柒零零玖 壹壹捌陸) 一、開箱即學(xué),便捷拉滿 這個實(shí)驗(yàn)箱真的是為使用者
    發(fā)表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器!

    家人們,最近在研究人工智能相關(guān)設(shè)備,挖到了一款超厲害的寶藏——比鄰星人工智能綜合實(shí)驗(yàn)箱,必須來給大伙分享分享!可?(壹捌伍 柒零零玖 壹壹捌陸) 一、開箱即學(xué),便捷拉滿 這個實(shí)驗(yàn)箱真的是為使用者
    發(fā)表于 08-07 14:23

    迅為RK3588開發(fā)板Linux安卓麒麟瑞芯微國產(chǎn)工業(yè)AI人工智能

    迅為RK3588開發(fā)板Linux安卓麒麟瑞芯微國產(chǎn)工業(yè)AI人工智能
    發(fā)表于 07-14 11:23

    最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門學(xué)習(xí)課程參考2025版(大模型篇)

    人工智能大模型重塑教育與社會發(fā)展的當(dāng)下,無論是探索未來職業(yè)方向,還是更新技術(shù)儲備,掌握大模型知識都已成為新時代的必修課。從職場上輔助工作的智能助手,到課堂用于學(xué)術(shù)研究的智能工具,大模型正在工作生活
    發(fā)表于 07-04 11:10

    開售RK3576 高性能人工智能主板

    ,HDMI-4K 輸出,支 持千兆以太網(wǎng),WiFi,USB 擴(kuò)展/重力感應(yīng)/RS232/RS485/IO 擴(kuò)展/I2C 擴(kuò)展/MIPI 攝像頭/紅外遙控 器等功能,豐富的接口,一個全新八核擁有超強(qiáng)性能的人工智能
    發(fā)表于 04-23 10:55

    迅為iTOP-RK3576人工智能開發(fā)板Android?系統(tǒng)接口功能測試

    迅為iTOP-RK3576人工智能開發(fā)板Android?系統(tǒng)接口功能測試
    的頭像 發(fā)表于 03-28 14:45 ?3306次閱讀
    迅為iTOP-RK3576<b class='flag-5'>人工智能</b>開發(fā)板Android?系統(tǒng)接口功能<b class='flag-5'>測試</b>

    人工智能和機(jī)器學(xué)習(xí)以及Edge AI的概念與應(yīng)用

    作者:DigiKey Editor 人工智能(AI)已經(jīng)是當(dāng)前科技業(yè)最熱門的話題,且其應(yīng)用面涉及人類生活的各個領(lǐng)域,對于各個產(chǎn)業(yè)都帶來相當(dāng)重要的影響,且即將改變人類未來發(fā)展的方方面面。本文將為您介紹
    的頭像 發(fā)表于 01-25 17:37 ?1356次閱讀
    <b class='flag-5'>人工智能</b>和機(jī)器學(xué)習(xí)以及Edge AI的概念與應(yīng)用

    2025年人工智能會發(fā)生哪些變化

    2025年人工智能會發(fā)生哪些革命性的變化?斯坦福大學(xué)以人為中心的人工智能研究所的領(lǐng)先專家表示,2025 年人工智能的一個主要趨勢是協(xié)作人工智能系統(tǒng)的興起,其中多個專業(yè)代理協(xié)同工作,
    的頭像 發(fā)表于 01-21 11:28 ?1372次閱讀

    Reddit測試人工智能問答功能Reddit Answers

    近日,Reddit公司宣布了一項(xiàng)重要的新功能測試計(jì)劃,旨在通過人工智能技術(shù)為用戶提供更加便捷的問答體驗(yàn)。這項(xiàng)新功能被命名為Reddit Answers。 據(jù)Reddit官方介紹,Reddit
    的頭像 發(fā)表于 12-12 09:46 ?838次閱讀

    人工智能時代的秩序、安全與和平

    人類智慧的主觀性,而這對于負(fù)責(zé)任地行使武力至關(guān)重要。與其說人工智能是對未知事物的進(jìn)一步發(fā)現(xiàn),不如說它是對我們現(xiàn)有狀況的揭示。戰(zhàn)爭中的人工智能將揭示人類最美好和最壞的表現(xiàn)。甚至在實(shí)現(xiàn)重大
    的頭像 發(fā)表于 12-07 11:53 ?1050次閱讀

    嵌入式和人工智能究竟是什么關(guān)系?

    領(lǐng)域,如工業(yè)控制、智能家居、醫(yī)療設(shè)備等。 人工智能是計(jì)算機(jī)科學(xué)的一個分支,它研究如何使計(jì)算機(jī)具備像人類一樣思考、學(xué)習(xí)、推理和決策的能力。人工智能的發(fā)展歷程可以追溯到上世紀(jì)50年代,經(jīng)
    發(fā)表于 11-14 16:39

    人工智能、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)存在什么區(qū)別

    人工智能指的是在某種程度上顯示出類似人類智能的設(shè)備。AI有很多技術(shù),但其中一個很大的子集是機(jī)器學(xué)習(xí)——讓算法從數(shù)據(jù)中學(xué)習(xí)。
    發(fā)表于 10-24 17:22 ?3311次閱讀
    <b class='flag-5'>人工智能</b>、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)存在什么區(qū)別

    Anthropic在人工智能領(lǐng)域取得重大突破

     10月23日消息,美國當(dāng)?shù)貢r間周二,人工智能初創(chuàng)企業(yè)Anthropic宣布了一項(xiàng)重大進(jìn)展。這家由前OpenAI高管創(chuàng)立并獲得亞馬遜支持的公司,在人工智能領(lǐng)域取得了新的突破,其研發(fā)的AI智能體已經(jīng)具備了與
    的頭像 發(fā)表于 10-23 14:56 ?1400次閱讀

    人工智能人類的影響有哪些

    人工智能(AI)作為現(xiàn)代科技的杰出代表,正在以前所未有的速度改變著人類的生活、工作和社會結(jié)構(gòu)。這種影響是全方位的,既帶來了顯著的積極變化,也伴隨著一系列挑戰(zhàn)和問題。 一、積極影響 工作變革與經(jīng)濟(jì)增長
    的頭像 發(fā)表于 10-22 17:23 ?7548次閱讀