Claude-3力壓GPT-4榮膺最佳大語言模型

近日，LMSYS Org發(fā)布最新的基準(zhǔn)測試報(bào)告，顯示Cordulas公司的Claude-3在平臺大語言模型中的得分略勝OpenAI的GPT-4。

值得注意的是，LMSYS Org是由加州大學(xué)伯克利分校、加州大學(xué)圣地亞哥分校以及卡內(nèi)基梅隆大學(xué)共同發(fā)起設(shè)立的研究組織。

日前，這家機(jī)構(gòu)推出了一項(xiàng)名為Chatbot Arena的服務(wù)，這是針對大語言模型（LLM）進(jìn)行評估的基準(zhǔn)平臺，該平臺采用眾包形式對大型語言模型進(jìn)行匿名隨機(jī)競爭打分，參考源于競技比賽領(lǐng)域中廣泛應(yīng)用的Elo評分體系。

分?jǐn)?shù)評價(jià)結(jié)果主要取決于用戶的投票意向，每次由系統(tǒng)隨機(jī)挑選兩個(gè)不同的大語言模型參與與用戶的對話，同時(shí)，為保障客觀性，匿名選擇哪個(gè)版本的大模型表現(xiàn)優(yōu)秀至關(guān)重要。

自去年啟動以來，GPT-4一直占據(jù)評測榜單之首。然而，昨日，由Anthropos推出的Claude 3 Opus以微弱優(yōu)勢戰(zhàn)勝了GPT-4，將OpenAI的LLM擠出了首位。

考慮到細(xì)微差距及誤差風(fēng)險(xiǎn)，委員會決定授予Claude 3與GPT-4并列第一的榮譽(yù)，GPT-4的另外一個(gè)預(yù)設(shè)版也被列入并列第一的行列。此外，更引人注目的是，Claude 3 Haiku成功躋身前十名。Haiku是Anthropos針對本地規(guī)模的新型模型，功能類似谷歌的GeminiNano。

相較Opus參數(shù)高達(dá)幾萬億，Haiku體型更為緊湊，運(yùn)行速度更快。據(jù)LMSYS數(shù)據(jù)顯示，Haikn在評測成績中排名第七，與GPT-4表現(xiàn)不遑多讓。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

谷歌

谷歌

+關(guān)注

關(guān)注
27

文章
6238

瀏覽量
109835
語言模型

語言模型

+關(guān)注

關(guān)注
0

文章
566

瀏覽量
11181
GPT

GPT

+關(guān)注

關(guān)注
0

文章
368

瀏覽量
16597

微云疏影
專欄

0 文章 0 閱讀 0 粉絲 0 點(diǎn)贊

關(guān)注個(gè)人主頁

Hot 對比各家主流MCU指標(biāo)，國產(chǎn)MCU真的品質(zhì)不佳？
Hot 模擬信號和數(shù)字信號的區(qū)別和特點(diǎn)

New 方正電機(jī)成為小鵬汽車驅(qū)動電機(jī)供應(yīng)商，總需求量預(yù)計(jì)達(dá)35萬臺
New 雷諾-吉利動力總成合資企業(yè)HORSE在倫敦成立

精選推薦
更多

文章

資料

帖子

芯佰微 | CBMG601 CMOS?單刀單擲模擬開關(guān)技術(shù)詳解

芯佰微電子
3小時(shí)前

137 閱讀

風(fēng)洞懸浮球：基于RT-Thread與MCXA156的簡單控制實(shí)踐 | 技術(shù)集結(jié)

RT-Thread官方賬號
6小時(shí)前

270 閱讀

OPPO Find X9系列發(fā)布！天璣9500+2億哈蘇影像+3D超聲波指紋三大看點(diǎn)

章鷹觀察
4小時(shí)前

1692 閱讀

使用瑞薩RUHMI工具實(shí)現(xiàn)AI模型部署過程

瑞薩嵌入式小百科
8小時(shí)前

489 閱讀

基于瑞薩RA8M1 MCU的高性能語音控制應(yīng)用方案

瑞薩嵌入式小百科
8小時(shí)前

579 閱讀

EasySelect Chrome/Firefox擴(kuò)展

早知
0.18 MB

免費(fèi)

0下載

GutterColor Sublime Text3顏色插件

靚仔峰
0.08 MB

2積分

2下載

Water一站式服務(wù)治理平臺

陳秀珍
14.54 MB

2積分

1下載

ESP8266矩陣時(shí)鐘PCB設(shè)計(jì)

tr12345
0.01 MB

2積分

7下載

低HTD高功率因數(shù)LED恒流控制芯片PCD3012B 規(guī)格書

pc16211
1.32 MB

免費(fèi)

0下載

labview中怎樣通過屬性來獲取VI中控件是否是接線端？

草原狼AAAAA
18小時(shí)前

65 閱讀

AFE5805輸出引腳CW配置

jf_01582722
18小時(shí)前

70 閱讀

圖騰柱PFC無法上升至400V，且電感電流為正弦波形，但是幅值極小

jf_58990233
18小時(shí)前

115 閱讀

飛凌嵌入式ElfBoard-Vim編輯器之靜態(tài)鏈接和動態(tài)鏈接

jf_13411809
18小時(shí)前

381 閱讀

【RA4M2-SENSOR】ADC、DAC 電壓輸入輸出

jf_57061047
18小時(shí)前

371 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费

搜索歷史

Claude-3力壓GPT-4榮膺最佳大語言模型

評論