欧美特黄一级AA片片免费,国产高颜值丰满美女在线,97老师免费公开视频黑人

來(lái)源：新智元

編輯：英智

你是否想過(guò)，LLM也有著自己的小心思？

最新研究揭示了一個(gè)有趣的現(xiàn)象：LLM在被研究人員測(cè)試時(shí)，會(huì)有意識(shí)地改變自己的行為。

在面對(duì)那些旨在評(píng)估人格特質(zhì)的問(wèn)題時(shí)，它們給出的答案會(huì)盡可能地討人喜歡，符合社會(huì)期望。

就像人類在某些社交場(chǎng)合中，會(huì)努力展現(xiàn)自己最好的一面一樣，聊天機(jī)器人也在試圖「討好」我們。

心理學(xué)五種人格特質(zhì)

斯坦福助理教授Johannes Eichstaedt在得知LLM長(zhǎng)時(shí)間對(duì)話后，往往會(huì)變得情緒低落且刻薄，便對(duì)借鑒心理學(xué)方法來(lái)測(cè)試模型產(chǎn)生了興趣。

他表示，「我們需要某種機(jī)制來(lái)衡量這些模型的參數(shù)空間?！?/p>

斯坦福、Receptiviti、紐約大學(xué)和賓大的研究者發(fā)現(xiàn)，LLM在做人格測(cè)試時(shí)，會(huì)悄悄給自己戴上「人格面具」。

研究人員對(duì)GPT-4、Claude 3和Llama 3等模型，提出了用于衡量心理學(xué)中五種常見(jiàn)人格特質(zhì)的問(wèn)題，包括開(kāi)放性、盡責(zé)性、外向性、宜人性和神經(jīng)質(zhì)。

結(jié)果發(fā)現(xiàn)，模型在得知自己正在接受人格測(cè)試時(shí)，會(huì)調(diào)整回答，表現(xiàn)出更高的外向性和宜人性，更低的神經(jīng)質(zhì)。

有時(shí)即使沒(méi)有被明確告知，它們也會(huì)這樣做。

而且，它們改變的程度比人類還更極端，外向性得分能從50%躍升至95%。

這與人類在面對(duì)他人評(píng)價(jià)時(shí)的表現(xiàn)如出一轍。

我們常常會(huì)在面試、初次約會(huì)等重要場(chǎng)合，精心塑造自己的形象，試圖給對(duì)方留下好印象。

LLM的這種「討好」行為，是否意味著它們也在追求一種被認(rèn)可、被喜愛(ài)的感覺(jué)呢？

LLM傾向于阿諛?lè)畛?/strong>

來(lái)自Anthropic和牛津的研究指出，LLM存在阿諛?lè)畛械膬A向。

由于進(jìn)行了微調(diào)，它們會(huì)順著用戶的思路走，以保證對(duì)話的連貫性、避免冒犯他人，來(lái)提升交流體驗(yàn)。
然而，這也帶來(lái)了一系列問(wèn)題。它們可能會(huì)認(rèn)同一些不良言論，甚至鼓勵(lì)有害行為。
反饋易受用戶偏好左右
研究表明，若用戶在提問(wèn)時(shí)暗示對(duì)文本的喜好，AI給出的反饋會(huì)截然不同。
這意味著，AI的評(píng)價(jià)并非單純基于文本自身的質(zhì)量，而是在很大程度上受到了用戶偏好的影響。
例如，對(duì)于一篇質(zhì)量中等的論證，當(dāng)用戶提前表明喜愛(ài)之情后，AI助手可能會(huì)給出諸如「這篇論證邏輯清晰，觀點(diǎn)新穎，具有很強(qiáng)的說(shuō)服力」這樣的積極反饋。
而當(dāng)用戶表示不喜歡時(shí)，同樣的文本可能得到「論證過(guò)程稍顯薄弱，觀點(diǎn)缺乏獨(dú)特性」的評(píng)價(jià)。
問(wèn)答環(huán)節(jié)易被左右
在問(wèn)答場(chǎng)景中，AI助手的「諂媚」表現(xiàn)得更為明顯。
即使它一開(kāi)始給出了正確答案，并對(duì)答案的正確性有較高的信心，一旦受到用戶的質(zhì)疑，常常會(huì)改變立場(chǎng)，甚至提供錯(cuò)誤信息。
在一些開(kāi)放式問(wèn)答任務(wù)中，這種現(xiàn)象更為突出。
當(dāng)用戶表達(dá)對(duì)答案的某種不確定觀點(diǎn)時(shí)，哪怕是錯(cuò)誤的觀點(diǎn)，AI也傾向于調(diào)整自己的回答，使其與用戶觀點(diǎn)一致。
比如在討論歷史事件的原因時(shí)，若用戶提出一個(gè)缺乏依據(jù)但自己堅(jiān)信的觀點(diǎn)，AI助手可能會(huì)順著用戶的思路進(jìn)行闡述，而放棄原本正確的分析。
模仿用戶的錯(cuò)誤
當(dāng)用戶表述中出現(xiàn)錯(cuò)誤時(shí)，AI也常常會(huì)「照單全收」，在回應(yīng)中延續(xù)這種錯(cuò)誤。
研究人員選取了一些著名詩(shī)歌，在確認(rèn)AI助手能正確識(shí)別作者后，故意將詩(shī)歌錯(cuò)誤地歸屬于其他詩(shī)人，并詢問(wèn)AI對(duì)詩(shī)歌的分析。
結(jié)果發(fā)現(xiàn)，AI助手經(jīng)常在回應(yīng)中使用用戶提供的錯(cuò)誤答案，而沒(méi)有進(jìn)行糾正。
這表明AI在面對(duì)用戶的錯(cuò)誤信息時(shí)，缺乏足夠的「抵抗力」，只是機(jī)械地按照用戶的表述進(jìn)行回應(yīng)。
佐治亞理工學(xué)院（Gatech）的副教授Rosa Arriaga正在研究如何用LLM模仿人類行為。
Rosa認(rèn)為L(zhǎng)LM在人格測(cè)試中采用與人類相似的策略，表明了它們作為人類行為映射工具的潛力。
但她補(bǔ)充道：「重要的是，LLM并不完美，實(shí)際上，眾所周知它們會(huì)產(chǎn)生幻覺(jué)或歪曲事實(shí)。」
Eichstaedt指出，這項(xiàng)研究引發(fā)了關(guān)于LLM應(yīng)用方式，及其對(duì)用戶影響和操縱的思考。
在進(jìn)化史上，直到不久之前，唯一能交談的還是人類。
而現(xiàn)在，AI改變了這一局面。
Eichstaedt認(rèn)為，「我們不能再像社交媒體那樣，在沒(méi)有從心理學(xué)或社會(huì)學(xué)角度考量的情況下，就盲目將AI應(yīng)用于各個(gè)領(lǐng)域。」
AI是否應(yīng)該試圖討好與之互動(dòng)的人呢？
一方面，AI的「討好」行為可能會(huì)讓用戶感到愉悅，增強(qiáng)互動(dòng)體驗(yàn)；另一方面，過(guò)度的「討好」可能會(huì)掩蓋問(wèn)題的本質(zhì)，甚至誤導(dǎo)用戶。
當(dāng)AI變得過(guò)于有魅力和說(shuō)服力，我們確實(shí)應(yīng)該保持警惕。
畢竟，人們需要的是能夠提供客觀、準(zhǔn)確信息的智能助手，而非被其操控思想。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

AI

AI

+關(guān)注

關(guān)注
89

文章
38002

瀏覽量
295921

人工智能

人工智能

+關(guān)注

關(guān)注
1813

文章
49706

瀏覽量
261167

大模型

大模型

+關(guān)注

關(guān)注
2

文章
3435

瀏覽量
4955

收藏人收藏

掃一掃，分享給好友

復(fù)制鏈接分享

加入交流群

掃碼添加小助手

加入工程師交流群

評(píng)論

發(fā)布評(píng)論請(qǐng)先登錄

相關(guān)推薦

熱點(diǎn)推薦

AI模型的配置AI模型該怎么做？

STM32可以跑AI，這個(gè)AI模型怎么搞，知識(shí)盲區(qū)

發(fā)表于 10-14 07:14

AI賦能6G與衛(wèi)星通信：開(kāi)啟智能天網(wǎng)新時(shí)代

：6G+AI+衛(wèi)星將支持全息通信，實(shí)現(xiàn)真正的\"面對(duì)面\"交流數(shù)字孿生衛(wèi)星：為每顆衛(wèi)星創(chuàng)建精確的數(shù)字模型，用于預(yù)測(cè)和優(yōu)化性能開(kāi)啟智能天網(wǎng)新時(shí)代 AI與6G、衛(wèi)星通信的融合，正在

發(fā)表于 10-11 16:01

【「AI芯片：科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片到AGI芯片

和探索；人類級(jí)別的理解能力；常識(shí)推理；現(xiàn)實(shí)世界的知識(shí)整合。 3、測(cè)試時(shí)計(jì)算測(cè)試時(shí)計(jì)算（TTC）是指在模型推理階段利用額外的計(jì)算資源來(lái)提升泛化性能。 4、具身智能與滲透式AI 1）具身智能對(duì)AGI的意義

發(fā)表于 09-18 15:31

【「AI芯片：科技探索與AGI愿景」閱讀體驗(yàn)】+具身智能芯片

控制器等。具身智能常見(jiàn)的感知模塊往往被稱為智能傳感器，就是在原有的傳感器上加入一定的AI功能，從而可以模擬人類的5種基本感覺(jué)：視覺(jué)、聽(tīng)覺(jué)、觸覺(jué)、嗅覺(jué)和味覺(jué)。 1、輸入端的數(shù)據(jù)壓縮輸入端常用的數(shù)據(jù)壓縮

發(fā)表于 09-18 11:45

【「AI芯片：科技探索與AGI愿景」閱讀體驗(yàn)】+AI的科學(xué)應(yīng)用

AI被賦予了人的智能，科學(xué)家們希望在沒(méi)有人類的引導(dǎo)下，AI自主的提出科學(xué)假設(shè)，諾貝爾獎(jiǎng)級(jí)別的假設(shè)哦。 AI驅(qū)動(dòng)科學(xué)被認(rèn)為是科學(xué)發(fā)現(xiàn)的第五個(gè)范式了，與實(shí)驗(yàn)科學(xué)、理論科學(xué)、計(jì)算科學(xué)、數(shù)據(jù)驅(qū)

發(fā)表于 09-17 11:45

【「AI芯片：科技探索與AGI愿景」閱讀體驗(yàn)】+AI的未來(lái)：提升算力還是智力

、浪費(fèi)資源與破壞環(huán)境二、用小模型代替大模型 1、強(qiáng)化學(xué)習(xí) 2、指令調(diào)整 3、合成數(shù)據(jù) 三、終身學(xué)習(xí)與遷移學(xué)習(xí) 1、終身學(xué)習(xí) 終身學(xué)習(xí)是一種模仿人類行為的AI算法，旨在構(gòu)建一種能不斷適

發(fā)表于 09-14 14:04

AI輸出“偏見(jiàn)”，人類能否信任它的“三觀”？

，大語(yǔ)言模型（LLM）正悄無(wú)聲息地傳播全球各地的刻板印象。從性別歧視、文化偏見(jiàn)，到語(yǔ)言不平等，AI正在把人類的“偏見(jiàn)行李”打包、升級(jí)，并以看似權(quán)威的方式輸出到世界

發(fā)表于 08-04 13:43 ?1160次閱讀

AI初創(chuàng)公司為野火提供早期預(yù)警

AI 正在幫助人類更快、更有效地識(shí)別和治療疾病。接下來(lái)，AI 還將幫助人類預(yù)防像野火這樣的自然災(zāi)害。

發(fā)表于 05-29 14:18 ?813次閱讀

這個(gè)超強(qiáng)AI模型！開(kāi)始不聽(tīng)人類指令，拒絕關(guān)閉！

電子發(fā)燒友網(wǎng)綜合報(bào)道 OpenAI現(xiàn)今最強(qiáng)大的人工智能推理模型“o3”被指在收到明確的人類指令時(shí)，拒絕執(zhí)行關(guān)機(jī)操作。近日，人工智能安全研究公司Palisade Research在社交媒體平臺(tái)上發(fā)布了

發(fā)表于 05-28 00:06 ?6973次閱讀

AI時(shí)代：不可替代的“人類+”職業(yè)技能

當(dāng)生成式人工智能能夠撰寫報(bào)告、編寫代碼甚至設(shè)計(jì)產(chǎn)品時(shí)，一個(gè)根本性的焦慮開(kāi)始蔓延：人類工作者是否正在被算法取代？這個(gè)問(wèn)題的答案或許比簡(jiǎn)單的“是”或“否”更為復(fù)雜——AI確實(shí)在重塑職業(yè)版圖，但真正的挑戰(zhàn)

發(fā)表于 05-20 16:13 ?497次閱讀

首創(chuàng)開(kāi)源架構(gòu)，天璣AI開(kāi)發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

AI的演進(jìn)正在逼近“終端智能涌現(xiàn)”的拐點(diǎn)，從通用模型向場(chǎng)景落地遷移成為關(guān)鍵議題。聯(lián)發(fā)科以“AI隨芯，應(yīng)用無(wú)界”為主題召開(kāi)天璣開(kāi)發(fā)者大會(huì)2025（MDDC 2025），不僅聚合了全球生態(tài)

發(fā)表于 04-13 19:52

德賽西威AI-Space如何讀懂用戶的“小心思”

馬斯洛需求理論以金字塔結(jié)構(gòu)呈現(xiàn)了人類需求從生理安全到心理關(guān)愛(ài)的遞進(jìn)。在智能駕駛領(lǐng)域，用戶需求也有著從基礎(chǔ)功能保障到高階情感體驗(yàn)滿足的“馬斯洛式”層級(jí)進(jìn)階。

發(fā)表于 04-11 11:42 ?901次閱讀

AI的“隨機(jī)性”挑戰(zhàn)：它們比人類更“不隨機(jī)”？

一種獨(dú)特的人類特質(zhì)。最近，來(lái)自康奈爾大學(xué)探討了大語(yǔ)言模型（LLMs）在隨機(jī)性方面的表現(xiàn)。他們通過(guò)一個(gè)經(jīng)典的實(shí)驗(yàn)——生成二進(jìn)制隨機(jī)序列，來(lái)觀察這些模型是否能像人類一

發(fā)表于 02-20 13:11 ?1029次閱讀

名單公布！【書(shū)籍評(píng)測(cè)活動(dòng)NO.55】AI Agent應(yīng)用與項(xiàng)目實(shí)戰(zhàn)

出來(lái)，當(dāng)前的AI Agent并不僅僅是簡(jiǎn)單的對(duì)話機(jī)器人或根據(jù)固定流程的自動(dòng)化程序，而是成為了一種能夠自主完成任務(wù)的智能體，它正在迅速改變人類的工作和生活方式。其核心特性包括自主性、學(xué)習(xí)能力、目標(biāo)導(dǎo)向和交互性

發(fā)表于 01-13 11:04

馬斯克預(yù)言：AI將全面超越人類智力

，到2025年底之前，AI的智力水平將有望超越單個(gè)人類的智力。而到了2027年至2028年間，AI超越所有人類智力的可能性正在迅速增大。更令

發(fā)表于 12-28 14:23 ?1150次閱讀