chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

國內(nèi)大模型爭霸賽,你最看好哪家?

深度學(xué)習(xí)自然語言處理 ? 來源:深度學(xué)習(xí)自然語言處理 ? 2023-05-19 16:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

OpenAI Vs Google

e597a338-f620-11ed-90ce-dac502259ad0.png

目前大模型 top2 應(yīng)該就是 OpenAI 的 GPT-4,以及谷歌的PALM-2。這兩家公司早已布局,而且技術(shù)實(shí)力雄厚。國內(nèi)大模型和 GPT-4 相比,還是有比較大的差距。

但是國內(nèi)的勢頭目前不錯,百家齊鳴,還沒有一家有絕對的優(yōu)勢。

讓人頭暈的排名

e5a19d3e-f620-11ed-90ce-dac502259ad0.png

之前有媒體給出了目前國內(nèi)Top-5的大模型公司,分別是:百度的文心一言、阿里的通義千問、騰訊的混元、華為的盤古以及360的智腦。

而最近,中文通用大模型基準(zhǔn)(SuperCLUE)評測公布了最新結(jié)果,GPT-4 遙遙領(lǐng)先,而國內(nèi)成績最好的是科大訊飛的星火認(rèn)知大模型。這里面文心一言居然排在了最后一名,甚至比ChatGLM-6B的得分還低,實(shí)在難以置信。

e5aa4c36-f620-11ed-90ce-dac502259ad0.png

但是我又仔細(xì)看了一下這個(gè)評測。媽呀,評測集是SuperCLUE,而非SuperGLUE。

眾所周知,在國際NLP領(lǐng)域,有大名鼎鼎的數(shù)據(jù)集 GLUE 和 SuperGLUE,非常權(quán)威,OpenAI、谷歌等的大模型都在上面評測,極大推動了 NLP 領(lǐng)域的發(fā)展。

這次這份 SuperCLUE 評測的發(fā)起方為 Chinese GLUE 組織 (簡稱 CLUE),CLUE 是仿照 GLUE由國內(nèi)民間組織的評測,權(quán)威度和影響力與 GLUE 相比差很遠(yuǎn),其微信賬號主體屬性為個(gè)人。但這也迷惑了不少圈內(nèi)人,GLUE和 CLUE 分不清楚,堪稱李逵和李鬼。

還有一點(diǎn)存疑,評測榜單發(fā)布當(dāng)天5月9日,其官網(wǎng)顯示信息,中文基準(zhǔn)測評成員顧問中排名第一的是崔一鳴,身份為學(xué)術(shù)顧問委員會主任,哈工大訊飛聯(lián)合實(shí)驗(yàn)室(HFL)資深級研究員。而5月10日,官網(wǎng)已刪除此條顧問的信息。

而001號創(chuàng)始會員徐亮,是會長,相當(dāng)于這個(gè)榜單的實(shí)際負(fù)責(zé)人。昵稱 brightmart,中文任務(wù)基準(zhǔn)測評發(fā)起人。多個(gè)預(yù)訓(xùn)練模型中文版、文本分類和數(shù)據(jù)集開源項(xiàng)目作者。

徐亮還有另一個(gè)身份,在5月9日官網(wǎng)中顯示,他是杭州實(shí)在智能算法專家,也就是元語智能的創(chuàng)始人,曾在2月份發(fā)布自稱“國內(nèi)首個(gè)功能對話大模型ChatYuan”,不僅無法測試,發(fā)布幾天即被監(jiān)管叫停。4月,又被報(bào)道套殼推出開源組件。有分析人士認(rèn)為,不排除創(chuàng)業(yè)公司有融資壓力,蹭熱度吸引投資人關(guān)注。

該 SpuerClue 榜單發(fā)起方,001號顧問是訊飛身份背景、001號基準(zhǔn)發(fā)起人是創(chuàng)業(yè)公司創(chuàng)始人。在榜單發(fā)布后,擔(dān)心行業(yè)質(zhì)疑其公平、公正,相關(guān)信息還被刪除。這就有點(diǎn)不言而喻了。

僅用100道評測題目就出來了一份“權(quán)威報(bào)告”

最后來說下這個(gè)榜單本身,業(yè)內(nèi)人士一眼就可以看出來,評測的很不合理,首先,沒有公布評估數(shù)據(jù),以及具體的評估方式。同時(shí)從它的公開表述,可推斷總共題目就 100 道題目。這個(gè)題目量少到難以置信。專業(yè)人士可能有參與過,像國際權(quán)威 SuperGlue 榜單,題目一般都得有 2 萬多道,離權(quán)威可是差了幾萬倍。況且,它的評測得分榜首都是人類,那這個(gè)評分的基準(zhǔn)到底是什么?是否有很多主觀性因素在里面?是否某些大模型提前在這個(gè)數(shù)據(jù)集上已經(jīng)訓(xùn)練過?

任務(wù)設(shè)計(jì)太武斷,所謂“通用”基準(zhǔn),是用以測試通用的人工認(rèn)知能力的,那么我們自然希望,評測任務(wù)是參考了模型想要模擬的認(rèn)知能力及相關(guān)理論,系統(tǒng)化地選擇出來的。而實(shí)際上,我們觀察到的則是,基準(zhǔn)的作者們在選擇任務(wù)的時(shí)候,更像是圖方便、省事。以往,CLUE 中存在著部分?jǐn)?shù)據(jù)集,一味考慮任務(wù)的復(fù)雜性,卻在最起碼的分布邊界劃分上(如NER各個(gè)類別的邊界,如場所、景點(diǎn)類,組織機(jī)構(gòu)及其子類),模糊不清,且數(shù)據(jù)的一致性無法保證。

要么別比,要比就來點(diǎn)正規(guī)的比賽。自己出題自己考,說不準(zhǔn)還搶跑,自己還是評委,那這是欺不負(fù)了解真相的吃瓜群眾。投機(jī)取巧,終皆散去??嗑殐?nèi)功,才是王道。

國內(nèi)大模型排名(僅供參考)

拋開這些,從模型規(guī)模、模型效果、市場占有率等多個(gè)角度,百度的文心一言、華為的盤古、阿里的通義千問、騰訊的混元排在前四,應(yīng)該是比較合理的,至于后面的排名,就不大能保證了。不過下面的排名也可以參考一下:

e5b3b104-f620-11ed-90ce-dac502259ad0.png

下面是一份完整的名單:

e5b8a9b6-f620-11ed-90ce-dac502259ad0.png

e5c31432-f620-11ed-90ce-dac502259ad0.png

按發(fā)布時(shí)間排序:

e5c914ea-f620-11ed-90ce-dac502259ad0.png

百度:文心一言

作為國內(nèi)最早發(fā)布的大模型,百度的文心一言在今年3月16號就發(fā)布了,隨后經(jīng)過了多個(gè)版本的迭代。目前已經(jīng)有上千家企業(yè)接入。文心一言支持圖片、語音等多模態(tài)。

3月16日,百度在全球大廠中率先發(fā)布對標(biāo) ChatGPT 的大模型產(chǎn)品文心一言。據(jù)了解,文心一言內(nèi)測一個(gè)多月,就完成了4次大的技術(shù)升級,大模型推理性能提升近10倍。

李彥宏在5月4日百度內(nèi)部活動中表示,百度之所以能夠在Google、Meta、Amazon等大廠之前率先發(fā)布生成式大模型產(chǎn)品,是因?yàn)榘俣仍谛酒?、框架、模型、?yīng)用等四個(gè)層面做到全棧布局、層層領(lǐng)先。

360:360智腦

百度是國內(nèi)搜索市場排名第一公司,而排名第二就是360。

大模型依靠的算力、數(shù)據(jù)、算法、場景,這兩家公司都具備,這也是搜索公司的優(yōu)勢,有業(yè)務(wù)和數(shù)據(jù)支撐大模型研發(fā)和落地。

5月16日,360集團(tuán)和智譜AI宣布達(dá)成戰(zhàn)略合作,雙方共同研發(fā)的千億級大模型“360GLM”已具備新一代認(rèn)知智能通用模型水準(zhǔn)。

而在今天的世界智能大會上,周鴻祎展示了“360智腦”的多輪對話和“360鴻圖”的AI生圖兩個(gè)能力。

e5d272d8-f620-11ed-90ce-dac502259ad0.png

就像谷歌和微軟,一個(gè)擁有谷歌搜索,一個(gè)擁有必應(yīng)。國內(nèi)的百度和360,一個(gè)擁有百度搜索,一個(gè)擁有360搜索。

搜索公司應(yīng)該是這場大模型爭霸賽最后的贏家。(只是個(gè)人看法)

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3611

    瀏覽量

    51431
  • GPT
    GPT
    +關(guān)注

    關(guān)注

    0

    文章

    368

    瀏覽量

    16597
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1234

    瀏覽量

    9570

原文標(biāo)題:國內(nèi)大模型爭霸賽,你最看好哪家?這是你心目中的大模型排名嗎?

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    知識分享 | 使用MXAM進(jìn)行AUTOSAR模型的靜態(tài)分析:Embedded Coder與TargetLink模型

    知識分享在知識分享欄目中,我們會定期與讀者分享來自MES模思的基于模型的軟件開發(fā)相關(guān)Know-How干貨,關(guān)注公眾號,隨時(shí)掌握基于模型的軟件設(shè)計(jì)的技術(shù)知識。使用MXAM進(jìn)行AUTOSAR模型
    的頭像 發(fā)表于 08-27 10:04 ?369次閱讀
    知識分享 | 使用MXAM進(jìn)行AUTOSAR<b class='flag-5'>模型</b>的靜態(tài)分析:Embedded Coder與TargetLink<b class='flag-5'>模型</b>

    可編程SLIC語音芯片哪家好?

    呢?思電子科技無疑是其中的佼佼者。思電子科技作為國內(nèi)知名的數(shù)?;旌闲酒瑥S商,在可編程SLIC語音芯片領(lǐng)域展現(xiàn)出了強(qiáng)大的實(shí)力。其推出的ASX630系列芯片,堪稱
    的頭像 發(fā)表于 06-12 13:55 ?455次閱讀
    可編程SLIC語音芯片<b class='flag-5'>哪家</b>好?

    商湯日日新SenseNova融合模態(tài)大模型 國內(nèi)首家獲得最高評級的大模型

    近日,中國信息通信研究院(以下簡稱“中國信通院”)完成可信AI多模態(tài)大模型首輪評估。 商湯日日新SenseNova融合模態(tài)大模型在所有模型中,獲得當(dāng)前最高評級——4+級,并成為國內(nèi)首家
    的頭像 發(fā)表于 06-11 11:57 ?1002次閱讀

    今日看點(diǎn)丨蘋果 iPhone 17 或?qū)⒅С?Qi 2.2 標(biāo)準(zhǔn);國內(nèi)新勢力車企毛利率:力斯第一,小米第二

    1. 國內(nèi)新勢力車企毛利率一覽:力斯第一,小米第二 ? 6月5日消息,國內(nèi)新能源車企內(nèi)卷嚴(yán)重,價(jià)格戰(zhàn)也是越打越激烈,以至于工信部、《人民日報(bào)》都出來喊話應(yīng)該抵制這樣的行為。雖然價(jià)格戰(zhàn)打得激烈,但
    發(fā)表于 06-06 09:43 ?1794次閱讀

    手表芯片多強(qiáng)爭霸賽開啟!小米玄戒T1入局,格局生變?

    電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)當(dāng)前,國內(nèi)可穿戴設(shè)備主控芯片市場呈現(xiàn)出“一超多強(qiáng)、梯度競爭”的競爭態(tài)勢,就在5月,小米重磅推出智能手表玄戒T1,在通信性能、功耗控制和功能擴(kuò)展方面展現(xiàn)了新的突破,標(biāo)志著
    的頭像 發(fā)表于 05-29 01:05 ?9954次閱讀
    手表芯片多強(qiáng)<b class='flag-5'>爭霸賽</b>開啟!小米玄戒T1入局,格局生變?

    當(dāng)我問DeepSeek國內(nèi)壓力傳感器哪家強(qiáng),它這樣回答

    特意問DeepSeek國內(nèi)壓力傳感器發(fā)展現(xiàn)狀,以及國內(nèi)壓力傳感器到底哪家強(qiáng),DeepSeek這樣回復(fù)我——壓力傳感器在工業(yè)自動化、汽車電子和醫(yī)療設(shè)備領(lǐng)域有著廣泛應(yīng)
    的頭像 發(fā)表于 05-28 14:48 ?988次閱讀
    當(dāng)我問DeepSeek<b class='flag-5'>國內(nèi)</b>壓力傳感器<b class='flag-5'>哪家</b>強(qiáng),它這樣回答

    時(shí)鐘系統(tǒng)推薦,時(shí)鐘系統(tǒng)哪家好?思時(shí)鐘系統(tǒng)助力中國氣象科學(xué)研究院構(gòu)建智慧氣象網(wǎng)絡(luò)

    時(shí)鐘系統(tǒng)推薦,時(shí)鐘系統(tǒng)哪家好?思時(shí)鐘系統(tǒng)助力中國氣象科學(xué)研究院構(gòu)建智慧氣象網(wǎng)絡(luò)
    的頭像 發(fā)表于 05-20 09:32 ?583次閱讀
    時(shí)鐘系統(tǒng)推薦,時(shí)鐘系統(tǒng)<b class='flag-5'>哪家</b>好?<b class='flag-5'>賽</b>思時(shí)鐘系統(tǒng)助力中國氣象科學(xué)研究院構(gòu)建智慧氣象網(wǎng)絡(luò)

    LED全息屏與LED晶膜屏:透明顯示新潮流的“雙雄爭霸

    LED全息屏與LED晶膜屏:透明顯示新潮流的“雙雄爭霸
    的頭像 發(fā)表于 05-17 17:31 ?498次閱讀
    LED全息屏與LED晶膜屏:透明顯示新潮流的“雙雄<b class='flag-5'>爭霸</b>”

    西威端側(cè)大模型重塑智能座艙體驗(yàn)

    智能汽車產(chǎn)業(yè)發(fā)展正從規(guī)模擴(kuò)張向質(zhì)量躍升轉(zhuǎn)變,其中大模型驅(qū)動的智能化升級將成為產(chǎn)業(yè)突破的核心引擎。在日前召開的2025上海車展國際汽車關(guān)鍵技術(shù)論壇上,德西威技術(shù)中心人工智能實(shí)驗(yàn)室專家張書赫博士以《端側(cè)智能·重塑體驗(yàn)》為題,分享了對大模型
    的頭像 發(fā)表于 05-15 09:13 ?1436次閱讀

    西威與面壁智能發(fā)布端側(cè)大模型語音交互方案

    日前,全球領(lǐng)先的移動出行科技公司德西威與端側(cè)大模型技術(shù)領(lǐng)軍企業(yè)面壁智能共同發(fā)布業(yè)界首個(gè)基于高通座艙平臺(SA8255P,簡稱8255)的端側(cè)大模型語音交互方案,這是雙方自2024年12月簽署戰(zhàn)略合作協(xié)議以來發(fā)布的首個(gè)合作成果。
    的頭像 發(fā)表于 05-14 17:40 ?911次閱讀

    當(dāng) RDK X3 遇上倉儲機(jī)器人,智鏈團(tuán)隊(duì)讓效率原地起飛

    倉儲界現(xiàn)在是"卷王"爭霸賽!2023年全國消費(fèi)狂飆47萬億,網(wǎng)購更是坐火箭般漲了11%,但老派倉儲還在用"人海戰(zhàn)術(shù)",設(shè)備像戴著近視眼鏡,看啥都不清不楚。別急
    的頭像 發(fā)表于 04-21 01:18 ?502次閱讀
    當(dāng) RDK X3 遇上倉儲機(jī)器人,智鏈團(tuán)隊(duì)讓效率原地起飛

    2024“畫質(zhì)爭霸賽”落下帷幕,海信電視U8N Pro“最強(qiáng)機(jī)皇”實(shí)至名歸

    2024年的電視行業(yè),可以凝練成四大關(guān)鍵詞:“百吋”、“Mini LED”、“AI”和“畫質(zhì)”?!啊盡ini LED”電視成為了用戶和行業(yè)新寵,“百吋”成為增長速度最快的電視尺寸,“AI”則是自ChatGPT流行以來,嵌入到幾乎各行各業(yè),每一個(gè)產(chǎn)品都不可忽略的基礎(chǔ)設(shè)施。而“畫質(zhì)”則是多年不變的,用戶選擇電視時(shí)的第一考量因素,畢竟電視就是用來看的,“好看”才是第一要義。 因此,在電視行業(yè)關(guān)于“畫質(zhì)”水平的競爭從未停止過,各品牌幾乎都祭出了渾身解數(shù)去搶占好畫質(zhì)
    的頭像 發(fā)表于 12-31 17:53 ?1116次閱讀
    2024“畫質(zhì)<b class='flag-5'>爭霸賽</b>”落下帷幕,海信電視U8N Pro“最強(qiáng)機(jī)皇”實(shí)至名歸

    智慧路燈哪家強(qiáng)?看完這些案例就心里有數(shù)了

    智慧路燈哪家強(qiáng)?看完這些案例就心里有數(shù)了
    的頭像 發(fā)表于 11-14 18:05 ?1068次閱讀
    智慧路燈<b class='flag-5'>哪家</b>強(qiáng)?看完這些案例<b class='flag-5'>你</b>就心里有數(shù)了

    第一屆“澎峰云?大模型AI校園應(yīng)用創(chuàng)新完美結(jié)束

    在大模型人工智能的浪潮中,澎峰科技與中科曙光強(qiáng)強(qiáng)聯(lián)合,共同打造了一場大模型AI創(chuàng)新應(yīng)用盛宴——第一屆“澎峰云?大模型 AI 校園應(yīng)用創(chuàng)新”。這場賽事不僅是技術(shù)的較量,更是智慧的火花碰
    的頭像 發(fā)表于 11-11 10:59 ?821次閱讀

    50萬獎金池!開放原子大賽——第二屆OpenHarmony創(chuàng)新應(yīng)用挑戰(zhàn)正式啟動

    基于OpenHarmony4.1及以上版本開展創(chuàng)新應(yīng)用開發(fā),開發(fā)者可自主選擇OpenHarmony創(chuàng)新應(yīng)用題或Cocos游戲創(chuàng)新應(yīng)用題。無論是天馬行空的創(chuàng)意達(dá)人,還是有豐富游戲開發(fā)經(jīng)驗(yàn)的實(shí)力派,都能在此找到專屬競技
    發(fā)表于 10-24 15:40