全球导航AV中文,千人斩约两个漂亮

AI Agents 是當(dāng)下大模型領(lǐng)域備受關(guān)注的話題，用戶可以引入多個(gè)扮演不同角色的 LLM Agents 參與到實(shí)際的任務(wù)中，Agents 之間會進(jìn)行競爭和協(xié)作等多種形式的動態(tài)交互，進(jìn)而產(chǎn)生驚人的群體智能效果。本文介紹了來自 KAUST 研究團(tuán)隊(duì)的大模型心智交互 CAMEL 框架（“駱駝”），CAMEL 框架是最早基于 ChatGPT 的 autonomous agents 知名項(xiàng)目，目前已被頂級人工智能會議 NeurIPS 2023 錄用。

論文題目：

CAMEL: Communicative Agents for “Mind” Exploration of Large Scale Language Model Society論文鏈接：https://ghli.org/camel.pdf

代碼鏈接：

https://github.com/camel-ai/camel項(xiàng)目主頁：https://www.camel-ai.org/

“什么神奇的技巧讓我們變得智能？竅門就是沒有竅門。智慧的力量源于我們巨大的多樣性，而不是任何單一的、完美的原則?！?/em>

——人工智能先驅(qū) 馬文·明斯基（Marvin Minsky）[1]

目前來看，在機(jī)器通向高級智能的道路上，以 ChatGPT 為代表的大模型（LLMs）應(yīng)該是必須經(jīng)過的里程碑之一，它們以聊天對話的人機(jī)交互方式在多個(gè)領(lǐng)域的復(fù)雜任務(wù)解決方面取得了非常耀眼的成就。
隨著 LLMs 的發(fā)展，AI Agents（AI 智能體）之間的交互框架也逐漸興起，尤其是在一些復(fù)雜的專業(yè)領(lǐng)域，以角色扮演等模式預(yù)置的智能體完全有能力代替人類用戶在任務(wù)中扮演的角色，同時(shí)，智能體之間通過以協(xié)作和競爭形式的動態(tài)交互往往能夠帶來意想不到的效果，這就是被 OpenAI 人工智能專家 Andrej Karpathy 等人看作是“通向 AGI 最重要的前沿研究方向”的 AI Agents。該領(lǐng)域發(fā)展的時(shí)間線如下 [2]：
“CAMEL”（駱駝：大模型心智交互框架）- 發(fā)布于 2023.3.21

“AutoGPT” - 發(fā)布于 2023.3.30

“BabyGPT” - 發(fā)布于 2023.4.3

“Westworld” simulation（斯坦福西部世界小鎮(zhèn)） — 發(fā)布于 2023.4.7

作為最早基于 ChatGPT 的 autonomous agents 知名項(xiàng)目，CAMEL 重點(diǎn)探索了一種稱為角色扮演（role-playing）的新型合作代理框架，該框架可以有效緩解智能體對話過程中出現(xiàn)的錯誤現(xiàn)象，從而有效引導(dǎo)智能體完成各種復(fù)雜的任務(wù)，人類用戶只需要輸入一個(gè)初步的想法就可以啟動整個(gè)過程。目前，CAMEL 已經(jīng)被國際人工智能頂級會議 NeurIPS 2023 錄用。

作者對 CAMEL 框架設(shè)計(jì)了靈活的模塊化功能，包括不同代理的實(shí)現(xiàn)、各種專業(yè)領(lǐng)域的提示示例和 AI 數(shù)據(jù)探索框架等，因此 CAMEL 可以作為一個(gè)基礎(chǔ)的 Agents 后端，支持 AI 研究者和開發(fā)者更加輕松地開發(fā)有關(guān)于多智能體系統(tǒng)、合作人工智能、博弈論模擬、社會分析、人工智能倫理等方面的應(yīng)用。具體的，作者通過涉及兩種角色扮演的合作場景，生成了兩個(gè)大型的指令數(shù)據(jù)集 AI Society 和 AI Code，以及兩個(gè)單輪問答數(shù)據(jù)集 AI Math 和 AI Science，用于探索 LLM 涌現(xiàn)能力的研究。

CAMEL框架

下圖展示了 CAMEL 中的 role-playing 框架，人類用戶需要首先制定一個(gè)想要實(shí)現(xiàn)的想法或目標(biāo)，例如：開發(fā)一個(gè)用于股票市場的交易機(jī)器人。這項(xiàng)任務(wù)涉及的角色是 AI 助理智能體（使其扮演 Python 程序員角色）和 AI 用戶智能體（使其扮演股票交易員角色）。

作者首先為 CAMEL 設(shè)置了一個(gè)任務(wù)細(xì)化器（Task Specifier），該細(xì)化器會根據(jù)輸入的想法來制定一個(gè)較為詳細(xì)的實(shí)現(xiàn)步驟，隨后 AI 助理智能體（AI Assistant）和 AI 用戶智能體（AI User）通過聊天的方式來進(jìn)行協(xié)作通信，各自一步步完成指定的任務(wù)。

其中協(xié)作通信通過系統(tǒng)級的消息傳遞機(jī)制來實(shí)現(xiàn)，令為傳遞給 AI 助理智能體的系統(tǒng)消息，為傳遞給 AI 用戶智能體的系統(tǒng)消息。隨后為 AI 助理智能體和 AI 用戶智能體分別實(shí)例化為兩個(gè) ChatGPT 模型和，相應(yīng)得到 AI 助理智能體和 AI 用戶智能體。角色分配完成后，AI 助理智能體和 AI 用戶智能體會按照指令跟隨的方式協(xié)作完成任務(wù)，令為時(shí)間時(shí)刻獲得的用戶指令消息，為 AI 助理智能體給出的解決方案，因而時(shí)刻得到的對話消息集為：

在下一個(gè)時(shí)刻，AI 用戶智能體會根據(jù)歷史對話消息集，來生成新的指令。然后再將新指令消息與歷史對話消息集一起傳遞給 AI 助理智能體來生成新一時(shí)刻的解決方案：

更多技術(shù)細(xì)節(jié)，可以參考我們先前對CAMEL 的報(bào)道。

CAMEL使用示例

2.1 協(xié)作角色扮演（cooperate role-playing）
CAMEL 內(nèi)置的協(xié)作式 role-playing 框架可以在人類用戶不具備專業(yè)知識的情況下，通過 Agents 之間的協(xié)作方式完成復(fù)雜任務(wù)，下圖展示了 CAMEL 開發(fā)股票市場交易機(jī)器人的例子，其中 AI 助理智能體的扮演的角色是一名 Python 程序員，而 AI 用戶智能體扮演的角色為一名股票交易員。

在 role-playing 框架中，AI 智能體都具有特定領(lǐng)域的專業(yè)知識，此時(shí)我們只需要指定一個(gè)原始想法的 Prompt，隨后兩個(gè)AI智能體就會圍繞著這一想法展開工作，在上圖中，用戶智能體提出交易機(jī)器人需要有對股票評論的情緒分析功能，隨后助理智能體直接給出了安裝情緒分析和股票交易所需的 python 庫的腳本。

隨著任務(wù)的進(jìn)行，用戶智能體給出的指示也會越來越明確，上圖中的指示為：定義一個(gè)函數(shù)以使用 Yahoo Finance API 獲取特定股票的最新股價(jià)。助理智能體會根據(jù)該指示直接生成一段代碼來解決需求。2.2 具身智能體（embodied agent）在先前的研究中，AI Agents 可以理解為在模擬一些操作，而沒有與現(xiàn)實(shí)世界交互或使用外部工具執(zhí)行操作，目前的 LLMs 已經(jīng)具備與互聯(lián)網(wǎng)或其他工具API交互的能力，CAMEL 也提供了能夠在物理世界中執(zhí)行各種操作的具身智能體（embodied agent），它們可以瀏覽互聯(lián)網(wǎng)、閱讀文檔、創(chuàng)建圖像、音頻和視頻等內(nèi)容，甚至可以直接執(zhí)行代碼。

上圖展示了 CAMEL 通過使用 embodied agent 調(diào)用 HuggingFace 提供的 Stable Diffusion 工具鏈生成駱駝科圖像的樣例，在這一過程中，embodied agent 首先會推理出駱駝科所包含的所有動物，隨后調(diào)用擴(kuò)散模型生成圖像并進(jìn)行保存。

2.3 critic在環(huán)（critic-in-the-loop）

為了增強(qiáng) role-playing 框架的可控性，作者團(tuán)隊(duì)還為 CAMEL 設(shè)計(jì)了一種 critic-in-the-loop，這種機(jī)制受到了蒙特卡洛樹搜索（MTCS）方法的啟發(fā)，它可以結(jié)合人類偏好實(shí)現(xiàn)樹搜索的決策邏輯來解決任務(wù)，CAMEL 可以設(shè)置一個(gè)中間評價(jià)智能體（critic）來根據(jù)用戶智能體和助理智能體出的各種觀點(diǎn)進(jìn)行決策來完成最終任務(wù)，整體流程如下圖所示。

考慮這樣一個(gè)場景，我們讓 CAMEL 主持一場很具體的科研項(xiàng)目討論會，而科研項(xiàng)目的主題“大型語言模型”，CAMEL 可以將用戶智能體的角色設(shè)置為一個(gè)博士后，將助理智能體的角色設(shè)置為博士生，而中間評價(jià)智能體的角色設(shè)置為教授。任務(wù)指示博士生來幫助博士后制定研究計(jì)劃，需要圍繞大模型的倫理展開研究。

在接到任務(wù)后，博士后智能體首先拋出了關(guān)于這一項(xiàng)目的三個(gè)觀點(diǎn)，表明項(xiàng)目應(yīng)該首先從調(diào)研大模型倫理方面的相關(guān)工作著手。隨后教授智能體會根據(jù)這三個(gè)觀點(diǎn)給出自己的看法。并且認(rèn)為觀點(diǎn) 2 最為合理的，即研究大模型歧視性算法。同時(shí)還會給出另外兩個(gè)觀點(diǎn)的缺陷，例如觀點(diǎn) 1 缺乏更加清晰的結(jié)構(gòu)，觀點(diǎn) 3 的研究范圍太窄等等。

在教授發(fā)言之后，博士生智能體會進(jìn)行更加具體的項(xiàng)目規(guī)劃，例如直接列出一些大模型倫理安全方向的相關(guān)文獻(xiàn)，并且討論如何開展具體的研究。
實(shí)驗(yàn)效果
本文的性能評估主要從三個(gè)方面進(jìn)行，并且采用兩個(gè) gpt-3.5-turbo 作為實(shí)驗(yàn)智能體，實(shí)驗(yàn)的數(shù)據(jù)集使用 CAMEL 框架生成的四個(gè) AI 數(shù)據(jù)集，其中 AI Society 和 AI Code 側(cè)重于智能體的對話效果，而 AI Math 和 AI Science 側(cè)重于智能體的問題解決能力。3.1 Agent評估在這一部分，作者從 AI Society 和 AI Code 數(shù)據(jù)集中分別隨機(jī)選擇 100 個(gè)任務(wù)進(jìn)行評估，然后使用 CAMEL 框架和單個(gè) gpt-3.5-turbo 進(jìn)行對比實(shí)驗(yàn)，結(jié)果評估方面分為兩部分，一方面由人類受試者對兩種方法給出的解決方案給出 453 份投票數(shù)據(jù)，來決定哪種方案更加可行。另一方面，作者提示 GPT4 模型對兩種方案直接給出評分，具體的對比數(shù)據(jù)如下表所示。

從上表中可以看出，CAMEL 框架給出的解決方案在人類評估和 GPT4 評估中均大幅優(yōu)于 gpt-3.5-turbo 給出的解決方案，其中人類評估和 GPT4 評估的總體趨勢高度一致。3.2 使用GPT-4對ChatBot評估在這一部分，作者在 CAMEL 生成的四個(gè)數(shù)據(jù)集上對 LLaMA-7B 模型進(jìn)行了逐步的微調(diào)，通過向 LLM 中不斷注入來自社會、代碼、數(shù)學(xué)和科學(xué)等不同領(lǐng)域的知識，來觀察模型對知識發(fā)現(xiàn)的接受效果。
作者首先從 AI Society 數(shù)據(jù)集開始，讓模型了解人類的互動常識和社會動態(tài)，隨后 AI Code 和其他數(shù)據(jù)集的注入，模型獲得了編程邏輯和語法的知識，同時(shí)拓寬了模型對科學(xué)理論、經(jīng)驗(yàn)觀察和實(shí)驗(yàn)方法的理解。

上表展示了模型在20 個(gè) Society 任務(wù)、20 個(gè)代碼編寫任務(wù)、20 個(gè)數(shù)學(xué)任務(wù)和 60 個(gè)科學(xué)任務(wù)上的測試效果，可以看到在每次添加數(shù)據(jù)集時(shí)，模型在已訓(xùn)練過的任務(wù)域上都會表現(xiàn)得更好。3.3 HumanEval
為了進(jìn)一步評估 CAMEL 框架的代碼編寫任務(wù)解決能力，作者在 HumanEval 和 HumanEval+ 兩個(gè)評估基準(zhǔn)上進(jìn)行了實(shí)驗(yàn)，實(shí)驗(yàn)結(jié)果如下表所示。

上表中清楚地證明了 CAMEL 框架的卓越性能，它不僅遠(yuǎn)遠(yuǎn)超過了 LLaMA-7B 模型，而且還大大超過了 Vicuna-7B 模型，這表明使用 CAMEL 生成的數(shù)據(jù)集在增強(qiáng) LLM 處理編碼相關(guān)任務(wù)方面有獨(dú)特的效果。
參考文獻(xiàn)
?
[1]Minsky M. Society of mind[M]. Simon and Schuster, 1988.

[2] https://towardsdatascience.com/4-autonomous-ai-agents-you-need-to-know-d612a643fa92

原文標(biāo)題：NeurIPS 2023 | AI Agents先行者CAMEL：首個(gè)基于大模型的多智能體框架

文章出處：【微信公眾號：智能感知與物聯(lián)網(wǎng)技術(shù)研究所】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

物聯(lián)網(wǎng)

物聯(lián)網(wǎng)

+關(guān)注

關(guān)注
2939

文章
47286

瀏覽量
407334

原文標(biāo)題：NeurIPS 2023 | AI Agents先行者CAMEL：首個(gè)基于大模型的多智能體框架

文章出處：【微信號：tyutcsplab，微信公眾號：智能感知與物聯(lián)網(wǎng)技術(shù)研究所】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

收藏人收藏

掃一掃，分享給好友

復(fù)制鏈接分享

加入交流群

掃碼添加小助手

加入工程師交流群

評論

發(fā)布評論請先登錄

相關(guān)推薦

熱點(diǎn)推薦

芯原戴偉民：海南是數(shù)字療法的先行者

環(huán)節(jié)，芯原股份董事長戴偉民表示：“海南是數(shù)字療法（Digital Therapeutics, DTx）產(chǎn)業(yè)的‘先行者’，2022年發(fā)布的《海南省加快推進(jìn)數(shù)字療法產(chǎn)業(yè)發(fā)展的若干措施》，是全球首個(gè)覆蓋數(shù)字療法全周期的支持政策；2025年，海南進(jìn)一步出臺《海南省關(guān)

發(fā)表于 11-11 09:59 ?4756次閱讀

LambdaTest推出全球首個(gè)AI智能體測試平臺

領(lǐng)先的AI原生測試平臺LambdaTest已推出其智能體對智能體測試（Agent-to-Agent Testing）平臺的封閉測試版。這是全

發(fā)表于 08-26 17:37 ?680次閱讀

100%開源！行業(yè)首個(gè)企業(yè)級智能體

近日，京東云正式開源JoyAgent智能體。作為行業(yè)首個(gè)100%開源的企業(yè)級智能體，實(shí)現(xiàn)了產(chǎn)品級開源，包括前端、后端、

發(fā)表于 07-26 09:26 ?960次閱讀

聯(lián)友科技亮相2025未來汽車先行者大會

近日，由中國國際貿(mào)易促進(jìn)委員會汽車行業(yè)分會、中國機(jī)械國際合作股份有限公司主辦的深圳2025（第三屆）未來汽車先行者大會在深圳國際會展中心盛大舉行，與2025（第二十九屆）粵港澳大灣區(qū)車展同期拉開帷幕。

發(fā)表于 06-06 17:04 ?843次閱讀

基本半導(dǎo)體亮相2025未來汽車先行者大會

近日，2025粵港澳大灣區(qū)車展在深圳國際會展中心(寶安)隆重開幕，在同期舉辦的2025未來汽車先行者大會上，基本半導(dǎo)體正式成為深圳全球新能源汽車高端零部件設(shè)計(jì)制造中心成員，董事長汪之涵博士受邀參加啟動儀式。

發(fā)表于 06-06 13:38 ?715次閱讀

芯馳科技亮相2025未來汽車先行者大會

近日，2025（第三屆）未來汽車先行者大會在深圳國際會展中心隆重開幕。作為與粵港澳大灣區(qū)車展同步舉行的汽車產(chǎn)業(yè)年度盛會，以“競渡”為主題，本次大會匯聚了來自廣汽集團(tuán)、長安汽車、小鵬汽車、蔚來

發(fā)表于 06-06 13:32 ?757次閱讀

中科創(chuàng)達(dá)亮相2025未來汽車先行者大會

近日，以「競渡」為主題的2025 未來汽車先行者大會在深圳成功舉行。作為粵港澳大灣區(qū)車展官方配套論壇，這場行業(yè)盛會匯聚了汽車領(lǐng)域頂流大咖與產(chǎn)業(yè)鏈上下游領(lǐng)軍企業(yè)的先鋒代表，共探汽車產(chǎn)業(yè)智能化轉(zhuǎn)型的未來圖景。

發(fā)表于 06-05 17:48 ?991次閱讀

上汽集團(tuán)亮相2025未來汽車先行者大會

近日，2025(第三屆)未來汽車先行者大會在深圳國際會展中心（寶安）正式揭幕。此次大會以“競渡”為主題，設(shè)置π動未來創(chuàng)新峰會、智能網(wǎng)聯(lián)汽車商業(yè)化論壇、AI浪潮峰會和未來圖景峰會4場高端峰會，以及

發(fā)表于 06-05 16:56 ?778次閱讀

廣汽集團(tuán)亮相2025未來汽車先行者大會

近日，廣汽集團(tuán)副總經(jīng)理閤先慶出席了以“競渡”為主題的2025未來汽車先行者大會。大會旨在匯聚汽車行業(yè)頂尖專家學(xué)者、業(yè)界領(lǐng)軍人物，共同探討汽車產(chǎn)業(yè)發(fā)展新趨勢、新機(jī)遇與新挑戰(zhàn)。

發(fā)表于 06-05 16:23 ?697次閱讀

AI耳機(jī)邁入智能體時(shí)代，2037年65%應(yīng)用將為智能體驅(qū)動

在大模型之后，智能體成為AI技術(shù)發(fā)展下一段的關(guān)注點(diǎn)。2025年被認(rèn)為是智能體元年，近期發(fā)布的多款

發(fā)表于 05-24 01:15 ?6909次閱讀

首創(chuàng)開源架構(gòu)，天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

科正將AI能力體系化并賦能終端生態(tài)。大會上，聯(lián)發(fā)科定義了“智能體化用戶體驗(yàn)”的五大特征：主動及時(shí)、知你懂你、互動協(xié)作、學(xué)習(xí)進(jìn)化和專屬隱私信息守護(hù)。這五大特征需要跨越從芯片、模型、應(yīng)

發(fā)表于 04-13 19:52

多智能體仿真中的統(tǒng)一混合模型框架研究

隨著GPT大語言模型的成功，越來越多的工作嘗試使用類GPT架構(gòu)的離散模型來表征駕駛場景中的交通參與者行為，從而生成多智能體仿真。這些方法展現(xiàn)

發(fā)表于 04-01 14:31 ?631次閱讀

維智科技陶闖：AI大模型時(shí)代下時(shí)空智能的發(fā)展機(jī)遇

近日，由知名科技媒體泰伯網(wǎng)主辦的WIF2024創(chuàng)新先行者論壇成功舉辦。

發(fā)表于 12-16 14:49 ?1128次閱讀

大語言模型開發(fā)框架是什么

大語言模型開發(fā)框架是指用于訓(xùn)練、推理和部署大型語言模型的軟件工具和庫。下面，AI部落小編為您介紹大語言模型開發(fā)

發(fā)表于 12-06 10:28 ?811次閱讀

AI智能體生態(tài)圈和軟件棧

層：智能體托管/服務(wù) 智能體框架 LLM模型與存儲二，從LLM到LLM

發(fā)表于 12-03 15:49 ?898次閱讀

chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费

搜索歷史

NeurIPS 2023 | AI Agents先行者CAMEL：首個(gè)基于大模型的多智能體框架

2.1 協(xié)作角色扮演（cooperate role-playing）

評論