chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

中國科學院自動化研究所與沐曦合作打造類腦脈沖大模型“瞬悉1.0”

沐曦MetaX ? 來源:中國科學院自動化研究所 ? 2025-09-10 11:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,中國科學院自動化研究所李國齊、徐波團隊在發(fā)表原創(chuàng)內(nèi)生復雜性理論系列論文的工作基礎上,與沐曦MetaX合作,打造了類腦脈沖大模型“瞬悉1.0”(SpikingBrain-1.0),在國產(chǎn)千卡GPU算力平臺上完成全流程訓練和推理,實現(xiàn)了大模型在超長序列推理上數(shù)量級的效率和速度提升,展示了構(gòu)建國產(chǎn)自主可控的新型非Transformer大模型架構(gòu)生態(tài)的可行性。研究團隊開源了SpikingBrain-1.0-7B模型并開放SpikingBrain-1.0-76B測試網(wǎng)址,同步公開了經(jīng)工業(yè)界大規(guī)模驗證的類腦脈沖大模型SpikingBrain-1.0中英文技術(shù)報告。

基于內(nèi)生復雜性的非Transformer架構(gòu)

當前,基于Transformer架構(gòu)的大模型在Scaling law驅(qū)動下,通過增加網(wǎng)絡規(guī)模、算力資源和數(shù)據(jù)量提升模型智能水平,但模型的基本計算單元為簡單的點神經(jīng)元模型,我們將此路徑稱為“基于外生復雜性”的通用智能實現(xiàn)方法。Transformer架構(gòu)的固有缺點訓練時開銷隨序列長度呈平方級增長以及推理時顯存占用也隨序列長度線性增加,構(gòu)成了資源消耗的主要瓶頸,導致其處理超長序列的能力受限。

研發(fā)團隊借鑒大腦神經(jīng)元內(nèi)部復雜工作機制提出“基于內(nèi)生復雜性”的大模型構(gòu)架方式,打造類腦脈沖大模型“瞬悉1.0”( SpikingBrain-1.0),在理論上建立了脈沖神經(jīng)元內(nèi)生動力學與線性注意力模型之間的聯(lián)系,揭示了現(xiàn)有線性注意力機制是樹突計算的特殊簡化形式,從而清晰地展示了一條不斷提升模型復雜度和性能的新型可行路徑。研發(fā)團隊進而構(gòu)建并開源了基于脈沖神經(jīng)元、具有線性(SpikingBrain-1.0-7B)及混合線性復雜度(SpikingBrain-1.0-76B,激活參數(shù)量12B)的新型類腦基礎模型,開發(fā)了面向國產(chǎn)GPU(沐曦MetaX曦云C550)集群高效訓練和推理框架、Triton 算子庫、模型并行策略以及集群通信原語。

兼具效率與性能,實現(xiàn)多個核心突破

SpikingBrain-1.0在多個核心性能上實現(xiàn)突破。

第一,極低數(shù)據(jù)量上的高效訓練:訓練階段具有線性或近線性復雜度,顯著提升長序列訓練效率,并能依托高效轉(zhuǎn)換訓練范式,以約為主流大模型2%的預訓練數(shù)據(jù)量實現(xiàn)與眾多開源Transformer模型在多任務語言理解(MMLU),中文多任務語言理解(CMMLU、Ceval), 常識推理能力(ARC、HS)任務上相媲美的性能。

第二,推理效率的數(shù)量級提升:推理階段結(jié)合脈沖神經(jīng)元事件驅(qū)動特性,SpikingBrain具有常數(shù)或部分層常數(shù)級別的復雜度和存儲開銷,SpikingBrain-7B模型在100萬Token長度下TTFT(生成第一個Token所需時間)相比Transformer架構(gòu)加速達到26.5倍,400萬Token長度下加速超過100倍。同時在手機CPU端64k-128k-256k長度下較Llama3.2的同規(guī)模模型Decoding速度提升4.04x-7.52x-15.39x,在超長序列處理能力上展現(xiàn)出數(shù)量級的效率和速度提升。

第三,國產(chǎn)自主可控類腦大模型生態(tài)的構(gòu)建:SpikingBrain適配了面向國產(chǎn)GPU集群的高效訓練和推理框架、Triton算子庫、模型并行策略以及集群通信原語,表明了構(gòu)建國產(chǎn)自主可控的新型非Transformer大模型架構(gòu)生態(tài)的可行性。

第四,基于動態(tài)閾值脈沖化的多尺度稀疏機制:設計細粒度的兩階段動態(tài)閾值脈沖化策略,結(jié)合粗粒度的混合專家模型(MoE)方案,在7B模型上實現(xiàn)了超過69.15%的稀疏度,長序脈沖占比約1.85%,為低功耗的類腦大模型運行提供有力支撐。

這是我國首次提出大規(guī)模類腦線性基礎模型架構(gòu)、并首次在國產(chǎn)GPU算力集群上構(gòu)建類腦脈沖大模型的訓練和推理框架。提出的模型解決了脈沖驅(qū)動限制下的大規(guī)模類腦模型性能退化問題,其超長序列處理能力在法律/醫(yī)學文檔分析、復雜多智能體模擬、高能粒子物理實驗、DNA序列分析、分子動力學軌跡等超長序列任務建模場景中具有顯著的潛在效率優(yōu)勢。本次發(fā)布的大模型為新一代人工智能發(fā)展提供了非Transformer架構(gòu)的新技術(shù)路線,并將啟迪更低功耗的下一代神經(jīng)形態(tài)計算理論和芯片設計。

關(guān)于沐曦

沐曦致力于自主研發(fā)全棧高性能GPU芯片及計算平臺,為智算、通用計算、云渲染等前沿領域提供高能效、高通用性的算力支撐,助力數(shù)字經(jīng)濟發(fā)展。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 開源
    +關(guān)注

    關(guān)注

    3

    文章

    4018

    瀏覽量

    45537
  • 沐曦
    +關(guān)注

    關(guān)注

    0

    文章

    54

    瀏覽量

    1647
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3435

    瀏覽量

    4958

原文標題:基于內(nèi)生復雜性的類腦脈沖大模型“瞬悉1.0”問世

文章出處:【微信號:沐曦MetaX,微信公眾號:沐曦MetaX】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    潤和軟件與中國科學院廣州生物醫(yī)藥與健康研究院達成戰(zhàn)略合作

    近日,江蘇潤和軟件股份有限公司(以下簡稱“潤和軟件”)與中國科學院廣州生物醫(yī)藥與健康研究院正式簽署戰(zhàn)略合作協(xié)議。雙方強強聯(lián)合,將聚焦人類細胞譜系大科學研究設施場景,在國產(chǎn)操作系統(tǒng)、智能
    的頭像 發(fā)表于 11-18 17:06 ?680次閱讀
    潤和軟件與<b class='flag-5'>中國科學院</b>廣州生物醫(yī)藥與健康<b class='flag-5'>研究</b>院達成戰(zhàn)略<b class='flag-5'>合作</b>

    中國科學院院士王,遞補為中央委員

    、韋韜、鄧亦武、鄧修明、盧紅為中央委員會委員。 ? 公開資料顯示,王,男,漢族,1966年8月生,江蘇南通人,2001年4月加入中國共產(chǎn)黨,1990年6月參加工作,中國科學院上海冶金研究所
    的頭像 發(fā)表于 11-17 18:16 ?1037次閱讀
    <b class='flag-5'>中國科學院</b>院士王<b class='flag-5'>曦</b>,遞補為中央委員

    【精選直播】openDACS 2025 開源EDA與芯片大賽 賽題五 賽題七 直播宣講會

    (中國科學院計算技術(shù)研究員)、王翕(東南大學副教授)、常開顏(中國科學院計算技術(shù)研究所)、蔡思揚(中國
    的頭像 發(fā)表于 11-11 08:08 ?395次閱讀
    【精選直播】openDACS 2025 開源EDA與芯片大賽 賽題五 賽題七 直播宣講會

    【精選直播】openDACS 2025 開源EDA與芯片大賽 賽題二 賽題四 直播宣講會

    (中國科學院計算技術(shù)研究所研究員)、穆嘉楠(中國科學院計算技術(shù)研究所助理研究員)特邀主持何均宏
    的頭像 發(fā)表于 10-28 10:08 ?622次閱讀
    【精選直播】openDACS 2025 開源EDA與芯片大賽 賽題二 賽題四 直播宣講會

    首款全國產(chǎn)通用GPU芯片發(fā)布 集成推出云C600

    ,并支持MetaXLink超節(jié)點擴展技術(shù),在硬件性能和軟件兼容上完全滿足下一代生成式AI的訓練和推理需求。 而且,股份與中國科學院合作的國產(chǎn)千卡集群,已完成多個大
    的頭像 發(fā)表于 10-19 20:04 ?4.5w次閱讀

    華為、中國科學院計算技術(shù)研究所聯(lián)合開發(fā)論文獲USENIX收錄

    的CCF-A會議,本屆ATC共收到634篇論文投稿,僅100篇成功入選,中稿率低至15.8%。其中,華為數(shù)據(jù)中心網(wǎng)絡技術(shù)實驗室與中國科學院計算技術(shù)研究所合作完成的論文——基于Comp
    的頭像 發(fā)表于 10-12 11:00 ?1448次閱讀
    華為、<b class='flag-5'>中國科學院</b>計算技術(shù)<b class='flag-5'>研究所</b>聯(lián)合開發(fā)論文獲USENIX收錄

    中國科學院自動化研究所攜手中科曙光打造高性能工具鏈解決方案

    2019年起,中國科學院自動化研究所以語音、文本、圖像等單模態(tài)大模型研究與應用為基石,全力攻關(guān)全球首個千億參數(shù)多模態(tài)大
    的頭像 發(fā)表于 08-11 11:08 ?854次閱讀

    中科曙光亮相第十屆科學數(shù)據(jù)大會

    近日,第十屆(2025)科學數(shù)據(jù)大會開幕,集中展示中國科學院自動化、高能物理研究所、國家天文臺等依托曙光AI解決方案形成的技術(shù)、科研、行業(yè)
    的頭像 發(fā)表于 08-06 18:12 ?2237次閱讀

    硅基流動攜手首發(fā)基于云的Kimi K2推理服務

    今天,硅基流動聯(lián)合集成電路(上海)股份有限公司(簡稱“”),全球首發(fā)基于
    的頭像 發(fā)表于 07-23 17:33 ?1543次閱讀

    中國科學院沈陽自動化研究所研究基于石墨烯/PDMS封裝的醫(yī)用膠帶柔性傳感器,用于水下機器人運動檢測

    水下應用的需求仍是一項重大挑戰(zhàn)。本文,中國科學院沈陽自動化研究所郭洪吉等研究人員在《ADVANCED MATERIALS TECHNOLOGIES》期刊發(fā)表名為“A Nanocrack
    的頭像 發(fā)表于 07-17 11:51 ?4431次閱讀
    <b class='flag-5'>中國科學院</b>沈陽<b class='flag-5'>自動化</b><b class='flag-5'>研究所</b>:<b class='flag-5'>研究</b>基于石墨烯/PDMS封裝的醫(yī)用膠帶柔性傳感器,用于水下機器人運動檢測

    恭賀 | 晟鵬創(chuàng)始人成會明院士當選歐洲科學院院士!

    近日,歐洲科學院(AcademiaEuropaea)陸續(xù)公布2025年院士入選名單,經(jīng)同行推薦、評審,中國科學院深圳先進技術(shù)研究院碳中和技術(shù)研究所所長、廣東晟鵬材料技術(shù)有限公司(廣東晟
    的頭像 發(fā)表于 06-24 06:33 ?974次閱讀
    恭賀 | 晟鵬創(chuàng)始人成會明院士當選歐洲<b class='flag-5'>科學院</b>院士!

    中國科學院上海微系統(tǒng)開發(fā)出高性能10mm大口徑壓電 MEMS 快反鏡

    ?5 月 16 日消息,中國科學院宣布,上海微系統(tǒng)與信息技術(shù)研究所研究員武震宇、助理研究員王櫟皓團隊,開發(fā)了一種高性能的 10 毫米大口徑壓電 MEMS(微機電系統(tǒng))快反鏡。 這種產(chǎn)品
    的頭像 發(fā)表于 06-07 17:44 ?412次閱讀
    <b class='flag-5'>中國科學院</b>上海微系統(tǒng)<b class='flag-5'>所</b>開發(fā)出高性能10mm大口徑壓電 MEMS 快反鏡

    澎峰科技亮相第六屆中國科學院大學校友創(chuàng)新論壇

    近日,第六屆中國科學院大學校友創(chuàng)新論壇在北京成功舉行。澎峰科技作為國內(nèi)領先的算力基礎軟件與解決方案提供商,榮獲本屆論壇“未來之星校友企業(yè)獎”殊榮。公司創(chuàng)始人兼CEO張先軼博士受邀出席本次活動并領獎。
    的頭像 發(fā)表于 05-29 10:27 ?673次閱讀
    澎峰科技亮相第六屆<b class='flag-5'>中國科學院</b>大學校友創(chuàng)新論壇

    機接口柔性微電極植入機器人問世

    中國科學院自動化研究所傳來好消息;該所科研團隊成功研發(fā)機接口柔性微電極植入機器人CyberSense。 據(jù)悉,CyberSense機器人具備自動化
    的頭像 發(fā)表于 05-22 14:42 ?813次閱讀

    國民技術(shù)與中國科學院深圳先進技術(shù)研究院達成戰(zhàn)略合作

    近日,國民技術(shù)股份有限公司(簡稱“國民技術(shù)”)與中國科學院深圳先進技術(shù)研究院(簡稱“深圳先進院”)電驅(qū)系統(tǒng)專家團隊在深圳簽署合作意向協(xié)議,雙方將在國家重點研發(fā)項目支持下,就智能機器人及關(guān)節(jié)伺服驅(qū)
    的頭像 發(fā)表于 04-25 15:45 ?985次閱讀