近日,在2024中國移動全球合作伙伴大會上,一項關于大模型評測體系建設的新成果——《通用大模型評測標準》正式發(fā)布。這一標準由中國移動攜手工信部中國電子技術標準化研究院、中國電信、國家電網(wǎng)、中國石油以及科大訊飛等產(chǎn)業(yè)各方共同推出。
《通用大模型評測標準》旨在為產(chǎn)業(yè)界提供一個重要的參考依據(jù),幫助各方遴選出優(yōu)質(zhì)的AI大模型。隨著人工智能技術的快速發(fā)展,大模型在各個領域的應用日益廣泛,因此建立一個統(tǒng)一、權威的評測標準顯得尤為重要。
此次發(fā)布的評測標準將有力推動AI大模型技術的規(guī)范化發(fā)展,促進產(chǎn)業(yè)界的技術交流與合作,為人工智能技術的進一步創(chuàng)新和應用奠定堅實基礎。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
中國移動
+關注
關注
22文章
5716瀏覽量
78119 -
人工智能
+關注
關注
1817文章
50102瀏覽量
265514 -
科大訊飛
+關注
關注
19文章
860瀏覽量
63740
發(fā)布評論請先 登錄
相關推薦
熱點推薦
百度正式發(fā)布并開源新一代文檔解析模型PaddleOCR-VL-1.5
1 月 29 日,百度正式發(fā)布并開源新一代文檔解析模型 PaddleOCR-VL-1.5。該模型以僅 0.9B 參數(shù)的輕量架構,在全球權威文檔解析評測榜單 OmniDocBench V
阿里巴巴發(fā)布通義千問旗艦推理模型Qwen3-Max-Thinking
今天,我們正式發(fā)布千問旗艦推理模型Qwen3-Max-Thinking,創(chuàng)下數(shù)項權威評測全球新紀錄。
云知聲山海知音大模型2.0重磅發(fā)布
隨著智能體時代到來,云知聲在“山?!tlas”通用智算基座持續(xù)演進基礎上,年前實現(xiàn)了“山?!ぶt(yī)”5.0醫(yī)療大模型升級,今天迎來了“山?!ぶ簟?.0的重磅發(fā)布,正在完成“一基兩翼”技術戰(zhàn)略升級的能力拼圖。
上海交大發(fā)布國產(chǎn)光學大模型Optics GPT
原理,為科研、設計與教學提供智能化助力。 ? 目前,通用人工智能模型雖功能多樣,但在光學這類需要深厚專業(yè)知識和精密計算的硬科技領域,往往難以深入理解。上海交通大學“光生未來”項目組經(jīng)過深入研究,成功打造出這款“光學原生”的專業(yè)模型
商湯科技日日新V6.5榮獲2025年多模態(tài)大模型全國第一
近日,權威大模型評測基準 SuperCLUE 發(fā)布《中文多模態(tài)視覺語言模型測評基準12月報告》,商湯日日新V6.5(SenseNova V6.5 Pro)以75.35的總分位列國內(nèi)第一
云知聲山海醫(yī)療大模型問鼎MedBench4.0三項榜首
12月16日,中文醫(yī)療大模型權威評測平臺MedBench4.0發(fā)布最新評測結果。云知聲自主研發(fā)的“山海醫(yī)療大模型(UniGPT?Med)”展
VESA發(fā)布DisplayPort汽車擴展標準合規(guī)測試規(guī)范模型
,VESA重點介紹了其于2025年5月發(fā)布的DP AE合規(guī)測試規(guī)范模型。這一完全可執(zhí)行的Linux C模型包含500多項功能安全與信息安全合規(guī)測試,使芯片制造商能夠基于VESA DP AE標準
OpenAI發(fā)布2款開源模型
OpenAI開源了兩款高性能權重語言模型gpt-oss-120b和gpt-oss-20b,OpenAI CEO Sam Altman表示:「gpt-oss 發(fā)布了!我們做了一個開放模型,性能達到
螞蟻數(shù)科正式發(fā)布金融推理大模型
7月26日,以“智能時代,同球共濟”為主題的2025世界人工智能大會在上海開幕;亮點很多。我們看到在世界人工智能大會論壇上,螞蟻數(shù)科正式發(fā)布了金融推理大模型Agentar-Fin-R1,金融推理
軟通動力助力軟件智能化領域標準化建設邁上新臺階
近日,由人工智能關鍵技術和應用評測重點實驗室牽頭編寫的《軟件智能化成熟度模型 通用能力要求》(AIIA/T 0223-2025 )正式發(fā)布。作為核心參編單位,軟通動力深度參與
大華問數(shù)智能體一體機通過中國信通院權威評測認證
日前,由中國通信標準化協(xié)會主辦的2025數(shù)據(jù)智能大會在北京召開。會上,中國信息通信研究院(以下簡稱“中國信通院”)發(fā)布了2025年上半年“大模型驅動的智能數(shù)據(jù)分析工具” 專項測試結果,大華問數(shù)智能體一體機順利通過該權威
深蘭科技醫(yī)療大模型榮獲MedBench評測第一
近日,國內(nèi)權威醫(yī)療大模型評測平臺MedBench在官網(wǎng)更新了榜單,多個知名醫(yī)療AI產(chǎn)品及研究團隊入榜,其中深蘭DeepBlue-MR-v1醫(yī)療大模型以復雜醫(yī)學推理評測第一的成績領跑Me
云知聲深度參與三項大模型國家標準編寫
在人工智能技術加速落地的當下,標準化建設已成為推動行業(yè)高質(zhì)量發(fā)展的關鍵因素。近日,云知聲參與編寫的3項人工智能大模型國家標準:20231736-T-469《人工智能 大模型第1部分:
商湯“日日新”融合大模型登頂大語言與多模態(tài)雙榜單
據(jù)弗若斯特沙利文(Frost & Sullivan, 簡稱“沙利文”)聯(lián)合頭豹研究院發(fā)布的《2025年中國大模型年度評測》結果顯示:在語言和多模態(tài)核心能力測評中,商湯“日日新”融合大模型
海康威視發(fā)布視覺大模型周界攝像機
上周,我們發(fā)布了視覺大模型系列攝像機,其中有大模型加持的周界系列攝像機,誤報率下降90%以上。
通用大模型評測標準正式發(fā)布
評論