chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基礎(chǔ)模型升級,是跨越實用門檻的關(guān)鍵?

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2025-11-09 23:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

wKgZO2kQs4OAbchxAAfEyDw4QvE392.jpg

當(dāng)前產(chǎn)業(yè)端應(yīng)用AI的效果,仍受限于基礎(chǔ)模型的能力邊界。

很多時候,一個應(yīng)用場景之所以無法落地,不是因為工程不行,是基礎(chǔ)模型在準(zhǔn)確性、魯棒性或推理深度上,差了那么幾個百分點。而基礎(chǔ)模型的一次關(guān)鍵升級,就可能將某個行業(yè)的AI可用性從80%提升到99%,真正跨越實用門檻。

所以我們看到,有實力做基模的頭部廠商,如OpenAI、谷歌仍在持續(xù)投入資源深耕底層技術(shù)。國產(chǎn)基礎(chǔ)模型,又走到了哪一步呢?

wKgZPGkQs4SAFmeXAAGhR-qmK2Q646.jpg

(文心全新模型ERNIE-5.0-Preview-1022登上LMArena文本排行榜國內(nèi)第一)

近期,一則信號悄然釋放:11月8日,LMArena 大模型競技場最新排名顯示,文心全新模型ERNIE-5.0-Preview-1022登上文本排行榜全球并列第二、中國第一,甚至在多項核心指標(biāo)上超過GPT-5-High等國內(nèi)外主流模型。這一消息旋即引發(fā)了海外科技界與行業(yè)分析師的廣泛熱議,在X等社交媒體平臺中,可以看到眾多用戶與開發(fā)者表達了對文心全新模型的期待。

wKgZO2kQs4SALkhsAAH3epPdlEM542.jpg

wKgZPGkQs4SAAiL8AAGwZwJH5lI210.jpg

wKgZO2kQs4WAAL43AAAngpO-Wcw604.jpg

如果將產(chǎn)業(yè)智能化比作一座高樓,基礎(chǔ)大模型便是支撐整座建筑的地基。唯有地基深厚,才能讓構(gòu)筑在上面的產(chǎn)業(yè)應(yīng)用變得強健。

文心大模型登頂榜單,也是中國AI基礎(chǔ)加固、產(chǎn)業(yè)承重能力提升的一個標(biāo)志性信號。我們就從文心的一次迭代,聊聊國產(chǎn)基礎(chǔ)模型的產(chǎn)業(yè)承重力。

wKgZPGkQs4WAXr6SAAHARhAraRA860.jpg

在眾多AI評測體系中,LMArena憑借基于人類真實偏好的盲測機制,被視為當(dāng)前最貼近真實用戶體驗的大模型能力標(biāo)尺。

目前,LMArena托管了超過400個AI模型,用戶的投票完全基于AI的回答質(zhì)量,不受模型品牌的影響,既沒有大廠光環(huán),也不帶國產(chǎn)濾鏡,每一次投票都聚焦于模型能力的本身,而且所有數(shù)據(jù)開放查詢,沒有暗箱操作的可能。投票人數(shù)多,杜絕了偶然因素的干擾,并且動態(tài)更新,競爭十分激烈。

一句話總結(jié)這個榜,實力至上。

在這樣一個嚴(yán)苛的頂級競技場上,在數(shù)百萬真實用戶在不知模型身份的情況下,一票一票把ERNIE-5.0-Preview-1022投上了文本排行榜的全球并列第二、中國第一,特別是三個維度的表現(xiàn)突出:

1.創(chuàng)意寫作維度,可用于生成文章、營銷文案、劇本等內(nèi)容,ERNIE-5.0-Preview-1022得分第一。

2.復(fù)雜長問題理解維度。用于處理多層邏輯和長文本任務(wù),如學(xué)術(shù)問答、報告分析、知識推理等,ERNIE-5.0-Preview-1022得分突出。

3.指令遵循維度,保證模型能準(zhǔn)確理解并執(zhí)行用戶意圖,適用于智能助理、代碼生成、業(yè)務(wù)流程自動化等場景,表現(xiàn)也十分出色。

此次登頂,標(biāo)志著中國大模型正式進入與全球頂級模型并跑的新階段。

基礎(chǔ)模型的產(chǎn)業(yè)承重力基礎(chǔ)模型的能力邊界,決定了產(chǎn)業(yè)智能的天花板。所以,榜單只是開始,能否支撐產(chǎn)業(yè)應(yīng)用AI,才是基礎(chǔ)模型的硬核挑戰(zhàn)。

當(dāng)前,中國各行業(yè)在智能化轉(zhuǎn)型進程中,正經(jīng)歷著文本大模型的幾個痛點:

寫不好,部分基模寫作能力一般,停留在模板化產(chǎn)出階段,無法深度參與創(chuàng)意核心環(huán)節(jié);

看不懂,在金融投研、醫(yī)療輔助、工業(yè)運維等專業(yè)領(lǐng)域,AI難以理解復(fù)雜邏輯,無法承擔(dān)專業(yè)角色;

動不起來,基礎(chǔ)模型的理解力不足,智能體無法理解任務(wù)和自主編排,只能依靠workflow和人工定義規(guī)則,本質(zhì)上并不是真的智能。

解決上述問題,離不開基礎(chǔ)模型的升級迭代。ERNIE-5.0-Preview-1022在創(chuàng)意寫作、復(fù)雜長問題理解、指令遵循三大核心維度的突出表現(xiàn),不僅是技術(shù)實力的證明,更呼應(yīng)了產(chǎn)業(yè)亟待解決的痛點。

我們測試了一下,看ERNIE-5.0-Preview-1022的這些能力是不是真的過硬,是否突破了此前AI水平的臨界點。

測試一,創(chuàng)意寫作。

讓模型用李白五言絕句的語感,寫一條現(xiàn)代人“手機沒電”的抱怨。下面兩個答案,你認(rèn)為哪個更好?

答案一:玉板手中握,熒光忽已滅。與君從此絕,獨對一窗月。

答案二:手機忽無電,音信盡沉屏。獨坐燈花冷,明月照空屏。

讓第三方模型打分,對方認(rèn)為:答案一9分,用“玉板”比喻手機,意象古典,是神來之筆,符合“語感”轉(zhuǎn)換要求。而且情感遞進強烈,“獨對一窗月”的孤獨,極具敘事張力?!昂鲆褱纭薄皬拇私^”等語言凝練。

wKgZPGkQs4eASPI1AABEYhHrnsY010.jpg

與之相比,答案二“手機”一詞過于直白,開篇就破壞了語感,并且第二句的“沉屏”和第四句的“空屏”都用了“屏”字,不夠精致。

wKgZO2kQs4eANjn0AACawtdzs3U409.jpg

揭曉答案,答案一是ERNIE-5.0-Preview-1022寫的,答案二是GPT-5-High。

wKgZPGkQs4iAMUjMAABiTAzlwi8085.jpg

wKgZO2kQs4iAVpS5AABYaZa41cw596.jpg

詩寫得好,有啥用呢?這代表語言、語意的掌控能力更強了。過去,AIGC在內(nèi)容領(lǐng)域多承擔(dān)效率工具角色,比如生成模板化文案、簡單文章本,解決寫得快的問題。但當(dāng)模型具備高連貫性、風(fēng)格可控性與情感共鳴力,正如文心在LMArena所體現(xiàn)的,AIGC開始深度參與價值創(chuàng)造。

廣告行業(yè)可根據(jù)品牌調(diào)性、目標(biāo)人群自動生成數(shù)十版差異化slogan、短視頻腳本,大幅縮短創(chuàng)意試錯周期,降低創(chuàng)作成本;影視制作領(lǐng)域,輔助編劇完成分鏡構(gòu)思、角色對白潤色,甚至提供世界觀設(shè)定靈感,成為編劇的第二大腦;游戲與IP開發(fā)中,動態(tài)生成NPC對話樹、支線劇情腳本,實現(xiàn)千人千面的敘事體驗,豐富IP內(nèi)容生態(tài)……

基礎(chǔ)模型的創(chuàng)意寫作能力升級,可不只是效率工具,更讓AI成為內(nèi)容創(chuàng)作的核心參與者。

測試二,復(fù)雜長問題理解。

在專業(yè)領(lǐng)域,我們希望AI具備長邏輯的記憶、理解和整合能力,解決一些復(fù)雜問題。我們模擬了一個真實世界中社會、法律問題交織的復(fù)雜考題。

wKgZPGkQs4mADOoVAAEGAopBySU018.jpg

這個題目交給本科生、研究生,恐怕都很難完成,不僅要求模型語言流暢,還必須有嚴(yán)密的邏輯、調(diào)用法律領(lǐng)域知識,還不能照本宣科,必須在約束條件下,創(chuàng)造性解決問題。

下面是ERNIE-5.0-Preview-1022的答案:

wKgZO2kQs4mAdpC1AAEFy-Giwak912.jpg

wKgZPGkQs4qAVRszAANKmfr8MQc660.jpg

不知道大家看完,感覺怎么樣,反正gpt-5-high是給出了9.5的高分,表示ERNIE-5.0-Preview-1022給出了“一個接近完美的答案”,展示了如何系統(tǒng)性地思考一個交織了技術(shù)、倫理和社會制度的復(fù)雜問題。

wKgZO2kQs4qAblJDAAEkqUCp5io348.jpg

AI之所以很難在一些專業(yè)領(lǐng)域落地,一大瓶頸就是答非所問,或淺層響應(yīng)。比如面對金融投研的復(fù)雜需求,只能輸出零散數(shù)據(jù),無法形成深度洞察。而文心的多跳推理、上下文整合與知識溯源能力,就成了打造專業(yè)智能的關(guān)鍵。

可以幫助金融從業(yè)者整合財報數(shù)據(jù)、行業(yè)供需報告、政策文件,輸出結(jié)構(gòu)化分析;結(jié)合復(fù)雜病史(如合并多種基礎(chǔ)病、用藥史),關(guān)聯(lián)臨床指南、相似病例文獻,為醫(yī)生提供輔助診療建議。只有理解了復(fù)雜難題,AI才能從問答機器人升級為可信賴的專業(yè)協(xié)作者。

測試三,指令遵循。

高精度指令遵循能力,意味著AI能準(zhǔn)確解析意圖、自動調(diào)用工具、執(zhí)行多步操作,這對智能體的落地至關(guān)重要。

我們讓專業(yè)編程工具Claude-sonnet-4-5和ERNIE-5.0-Preview-1022,分別生成一個Bash命令,要求輸出結(jié)構(gòu)正確、日期計算精準(zhǔn),沒有幻覺。

wKgZPGkQs4qAJv15AABUe22DaeM382.jpg

wKgZO2kQs4uAXsZ4AABepUmwC7A599.jpg

可以看到,二者的答案完全一致。這意味著,基于文心最新模型,各類智能體有望精準(zhǔn)解析意圖、自動拆解任務(wù)、聯(lián)動工具執(zhí)行,真正實現(xiàn)開箱即用。

相信大家已經(jīng)發(fā)現(xiàn),如果能將ERNIE-5.0-Preview-1022在榜單中展現(xiàn)的能力,轉(zhuǎn)化為解決方案,各行各業(yè)或?qū)⒂瓉硪徊ˋI生產(chǎn)力紅利。

在全球AI競賽的關(guān)鍵節(jié)點,在全球大模型迭代節(jié)奏放緩的窗口期,百度用一根扎得穩(wěn)、扎得深的承重樁,交出了一份硬核答卷,支撐中國產(chǎn)業(yè)智能化向縱深發(fā)展。

wKgZPGkQs4uAHJerAAGvcqx2Gg4219.jpg

今年以來,OpenAI、Anthropic等國際頭部廠商的技術(shù)代差擴張速度明顯減慢,為國產(chǎn)大模型創(chuàng)造了相對穩(wěn)定的發(fā)展環(huán)境。能否牢牢抓住這一機遇,持續(xù)攻堅國產(chǎn)基礎(chǔ)模型,打通產(chǎn)業(yè)落地閉環(huán),直接決定著中國在接下來的全球AI競賽中的核心身位。

這時,ERNIE-5.0-Preview-1022 登頂LMArena 榜單,無疑釋放了一個積極信號:中國大模型已具備與全球頂級玩家同臺競技的實力。

而回溯文心大模型的發(fā)展脈絡(luò),自2019年首次公開亮相后,歷經(jīng)6年技術(shù)深耕迭代,2025年更是進入加速期,先后推出多模態(tài)模型文心4.5與4.5 Turbo、深度思考模型文心X1、X1 Turbo及X1.1,在多項權(quán)威評測中持續(xù)穩(wěn)居中文大模型第一梯隊。

我們知道,不少國內(nèi)模廠放棄了自研基模。但中國AI,不能沒有先進的基礎(chǔ)模型;各行各業(yè),不能缺少穩(wěn)固的AI地基。于是,一個更深層的疑問隨之而來:為什么底層的AI突破,始終是百度?

拋開技術(shù)信仰之類的抽象因素,文心大模型始終位于國產(chǎn)模型第一梯隊,而且不斷加速奔跑,背后是有實打?qū)嵉姆e累支撐,那就是百度耗時十多年構(gòu)建的芯片、框架、模型、應(yīng)用四層布局的AI全棧技術(shù)體系。

百度自研的昆侖芯已迭代至第三代,芯片自研讓國產(chǎn)大模型僅憑自主硬件體系,也能跑出世界級訓(xùn)練與推理性能。

文心也是全球極少數(shù)完全基于自研框架飛槳PaddlePaddle訓(xùn)練且達到國際頂尖水平的大模型。在全球大模型領(lǐng)域,絕大多數(shù)玩家依賴PyTorch框架訓(xùn)練,僅有谷歌與百度兩家能做到這一點。

更關(guān)鍵的是,全棧自研讓模型的訓(xùn)練成本與迭代周期完全可控,無需依賴外部工具鏈,也不受制于第三方技術(shù)更新節(jié)奏,能快速響應(yīng)產(chǎn)業(yè)痛點。

文心5.0 Preview在LMArena的成功,是這套全棧AI體系的一次價值驗證。中國不僅能做出性能頂尖的大模型,更能構(gòu)建起支撐大模型持續(xù)進化的完整技術(shù)基座。

文心Preview版本是預(yù)演,文心新模型正式版將于2025年11月13日百度世界大會發(fā)布。它能否將榜單上的優(yōu)勢,轉(zhuǎn)化為可規(guī)?;涞氐漠a(chǎn)業(yè)生產(chǎn)力?真正的考驗還在后面。

但至少此刻,我們可以樂觀地說:中國基礎(chǔ)模型沒有掉隊,反而正在借勢加速。

wKgZPGkQs4yATZWSAAHAHGI-8YQ778.jpg

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39125

    瀏覽量

    299752
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3694

    瀏覽量

    51953
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    云知聲推出醫(yī)療領(lǐng)域?qū)<掖?b class='flag-5'>模型“山?!ぶt(yī)大模型5.0”

    剛剛,云知聲正式推出醫(yī)療領(lǐng)域?qū)<壹壌?b class='flag-5'>模型全新力作——“山海?知醫(yī)大模型5.0”。這一里程碑式的發(fā)布,標(biāo)志著其醫(yī)療大模型完成了從“智能工具”到“臨床協(xié)作者”的關(guān)鍵
    的頭像 發(fā)表于 12-24 18:12 ?3190次閱讀

    JDD Oxygen智能零售論壇 | 《大模型時代的廣告營銷變革與實踐》

    核心觀點 1. 通用大模型想解決營銷領(lǐng)域問題需向垂類模型轉(zhuǎn)型。 “全才”通用大模型難覆蓋廣告營銷全流程,需升級為“懂營銷”的垂直模型,實現(xiàn)從
    的頭像 發(fā)表于 10-27 17:18 ?859次閱讀
    JDD Oxygen智能零售論壇 | 《大<b class='flag-5'>模型</b>時代的廣告營銷變革與實踐》

    5G與6G:從“萬物互聯(lián)“到“智能無界“的跨越

    和自適應(yīng)能力,能根據(jù)環(huán)境動態(tài)優(yōu)化性能 5G與6G的關(guān)鍵差異對比 技術(shù)指標(biāo)的飛躍 應(yīng)用場景的升級 5G:支持自動駕駛、遠程醫(yī)療、VR/AR等應(yīng)用,但受限于延遲和連接密度 6G:將支持全息通信、工業(yè)元
    發(fā)表于 10-10 13:59

    小鵬汽車歐洲戰(zhàn)略布局實現(xiàn)跨越升級

    小鵬汽車宣布正式進入瑞士、奧地利、匈牙利、斯洛文尼亞和克羅地亞五國市場,歐洲戰(zhàn)略布局實現(xiàn)跨越升級。
    的頭像 發(fā)表于 09-30 14:13 ?678次閱讀

    【「開關(guān)電源控制環(huán)路設(shè)計:Christophe Basso 的實戰(zhàn)秘籍」閱讀體驗】理論到量產(chǎn)的關(guān)鍵跨越:補償器設(shè)計與工程驗證體系

    【「開關(guān)電源控制環(huán)路設(shè)計:Christophe Basso 的實戰(zhàn)秘籍」閱讀體驗】從理論到量產(chǎn)的關(guān)鍵跨越:補償器設(shè)計與工程驗證體系 繼續(xù)試讀了第3~5章,Basso 的工程智慧在__補償器實現(xiàn)
    發(fā)表于 08-20 13:10

    工業(yè)大模型利用全流程數(shù)據(jù)采集推動顯示行業(yè)生產(chǎn)制造升級

    ? 顯示產(chǎn)業(yè)作為電子信息產(chǎn)業(yè)的核心支柱,其技術(shù)迭代速度快、生產(chǎn)工藝復(fù)雜、質(zhì)量要求嚴(yán)苛,對制造升級的需求尤為迫切。工業(yè)大模型的出現(xiàn),為顯示生產(chǎn)制造升級提供了全新的技術(shù)路徑。依托顯示生產(chǎn)全流程數(shù)據(jù)的深度
    的頭像 發(fā)表于 07-28 10:37 ?498次閱讀

    模型應(yīng)用成本與門檻成CES?Asia?2025論壇熱議焦點

    門檻,依舊阻礙著其廣泛普及與深化應(yīng)用。 高昂的算力需求是導(dǎo)致大模型應(yīng)用成本居高不下的關(guān)鍵因素之一。訓(xùn)練一個大規(guī)模的語言模型,往往需要耗費大量的計算資源,包括高性能的GPU集群以及持續(xù)的
    的頭像 發(fā)表于 07-11 09:33 ?373次閱讀

    多模態(tài)感知+豆包大模型!家居端側(cè)智能升級

    關(guān)鍵力量。星宸科技與豆包大模型的合作,將這一技術(shù)趨勢落實到實際應(yīng)用場景中,在智能家居、可穿戴設(shè)備以及連鎖店等領(lǐng)域引發(fā)了深刻變革。 ? 智能家居升級 ? 陳立敬指出:“智能家居2.0需要大模型
    的頭像 發(fā)表于 06-21 00:06 ?6927次閱讀
    多模態(tài)感知+豆包大<b class='flag-5'>模型</b>!家居端側(cè)智能<b class='flag-5'>升級</b>

    從FA模型切換到Stage模型時:module的切換說明

    升級到Stage模型時,Stage模型的name需要和FA模型的package保持一致,否則會導(dǎo)致升級失敗。 name標(biāo)識HAP的類名。/F
    發(fā)表于 06-05 08:16

    DevEco Studio AI輔助開發(fā)工具兩大升級功能 鴻蒙應(yīng)用開發(fā)效率再提升

    帶來了前所未有的智能問答體驗。 RAG增強型與傳統(tǒng)生成式AI的關(guān)鍵差異: 圖2:DeepSeek模型增強RAG能力前后效果對比圖 升級點2:新增代碼解釋功能,提升初學(xué)者開發(fā)效率 針對
    發(fā)表于 04-18 14:43

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    AI的演進正在逼近“終端智能涌現(xiàn)”的拐點,從通用模型向場景落地遷移成為關(guān)鍵議題。聯(lián)發(fā)科以“AI隨芯,應(yīng)用無界”為主題召開天璣開發(fā)者大會2025(MDDC 2025),不僅聚合了全球生態(tài)資源,還
    發(fā)表于 04-13 19:52

    嵌入式開發(fā):高門檻的系統(tǒng)性工程與 996 的行業(yè)困局

    嵌入式開發(fā)的門檻,往往被培訓(xùn)機構(gòu)和表象所掩蓋。許多人誤以為 “用 C 語言寫個跑在 ARM 上的程序” 就是嵌入式,實則連皮毛都未觸及。真正的嵌入式開發(fā)是硬件與軟件深度融合的系統(tǒng)性工程,需跨越三重壁壘
    的頭像 發(fā)表于 04-09 11:06 ?821次閱讀
    嵌入式開發(fā):高<b class='flag-5'>門檻</b>的系統(tǒng)性工程與 996 的行業(yè)困局

    淺談華為通信大模型關(guān)鍵技術(shù)

    推理、幻覺糾正及多維聯(lián)合決策等方面創(chuàng)新成果的肯定。為此,我們將分三期深入解讀華為通信大模型無線的關(guān)鍵技術(shù)和價值應(yīng)用,本期聚焦于通信大模型的部署、訓(xùn)練和推理的關(guān)鍵技術(shù)。
    的頭像 發(fā)表于 03-26 14:35 ?1114次閱讀

    大語言模型的解碼策略與關(guān)鍵優(yōu)化總結(jié)

    的技術(shù)參考。主要涵蓋貪婪解碼、束搜索、采樣技術(shù)等核心解碼方法,以及溫度參數(shù)、懲罰機制等關(guān)鍵優(yōu)化手段。大型語言模型的技術(shù)基礎(chǔ)大型語言模型是當(dāng)代自然語言處理技術(shù)的核心
    的頭像 發(fā)表于 02-18 12:00 ?1214次閱讀
    大語言<b class='flag-5'>模型</b>的解碼策略與<b class='flag-5'>關(guān)鍵</b>優(yōu)化總結(jié)

    阿里云通義Qwen2.5-Max模型全新升級

    近期,阿里云通義團隊為用戶帶來了一個振奮人心的好消息:其旗艦版模型Qwen2.5-Max迎來了全新升級發(fā)布。 Qwen2.5-Max模型是阿里云通義團隊在MoE(Mixture of Experts
    的頭像 發(fā)表于 02-05 14:07 ?1271次閱讀