2026年4月,隨著小米MiMo-V2.5這一開源原生全模態(tài)智能體模型的正式發(fā)布,AI領(lǐng)域迎來了又一次重要的技術(shù)演進。該模型在統(tǒng)一架構(gòu)下支持文本、圖像、視頻和音頻的理解,并具備強大的智能體(agentic)能力,為開發(fā)者和企業(yè)帶來了全新的應用可能。而在這一前沿模型發(fā)布的第一時間,蘇州登臨科技股份有限公司自主研發(fā)的KS系列高性能通用GPU便已完成深度適配與優(yōu)化,實現(xiàn)了Day0級別的支持。這不僅是登臨科技在大模型生態(tài)領(lǐng)域快速響應能力的體現(xiàn),更是其創(chuàng)新GPU+架構(gòu)強大通用性與高效能的直接驗證。
01 MiMo-V2.5模型:
原生全模態(tài)智能體的全面革新
MiMo-V2.5的開源之前已經(jīng)取得亮眼的成績單:
全球開源大模型綜合智能指數(shù)并列第一
Agent專項指數(shù)開源第一
全球所有大模型總榜前五(含閉源)
OpenRouter周調(diào)用量4.82萬億Token,市占率30%+
推理成本僅為國際閉源旗艦的2.5%,API定價約為國際競品的1/5
其模型架構(gòu)的核心亮點主要體現(xiàn)在以下幾個方面:
原生全模態(tài)理解 :MiMo-V2.5是一個真正的原生全模態(tài)模型,在統(tǒng)一架構(gòu)下支持文本、圖像、視頻和音頻的理解。它基于MiMo-V2-Flash主干網(wǎng)絡構(gòu)建,并擴展了專用的視覺和音頻編碼器,從而實現(xiàn)高質(zhì)量的多模態(tài)感知。
創(chuàng)新的混合注意力架構(gòu) :該模型繼承自MiMo-V2-Flash的混合設(shè)計,以5:1的比例交錯使用滑動窗口注意力(SWA)和全局注意力(GA),滑動窗口大小為128。通過可學習的注意力匯點偏置(attention sink bias),在保持長上下文性能的同時,將KV緩存存儲減少近6倍,顯著提升了推理效率。
強大的智能體能力 :在模型的后訓練階段,結(jié)合了監(jiān)督微調(diào)(SFT)、大規(guī)模智能體強化學習(agentic RL)以及多教師在線策略蒸餾(Multi-Teacher On-Policy Distillation, MOPD),使其在智能體任務和多模態(tài)理解基準測試中均取得優(yōu)異表現(xiàn),能夠勝任復雜的自主任務編排。
高效的推理與訓練機制 :MiMo-V2.5配備了三個輕量級多Token預測(MTP)模塊,采用密集前饋網(wǎng)絡(FFN),通過推測解碼(speculative decoding)加速推理。同時,模型使用FP8混合精度在總計約48T tokens的數(shù)據(jù)上進行訓練,上下文窗口最大支持1M tokens,兼顧了訓練效率與長文本處理能力。
02 Day0適配的背后:
技術(shù)實力與生態(tài)響應
登臨KS系列能夠?qū)崿F(xiàn)對MiMo-V2.5的Day0適配,絕非偶然。這背后是登臨科技在大模型生態(tài)領(lǐng)域的持續(xù)投入和快速響應機制。
成熟的軟件棧與優(yōu)化經(jīng)驗 :登臨科技的軟件棧已在Day0適配了DeepSeek、MiniMax、Kimi、GPT-OSS等國內(nèi)外主流大模型,積累了豐富的模型優(yōu)化和部署經(jīng)驗。這種經(jīng)驗使得團隊能夠迅速理解MiMo-V2.5的新特性,并進行針對性的優(yōu)化。根據(jù)內(nèi)部測試反饋,在MiMo-V2.5發(fā)布后,登臨團隊立即進行了驗證,并確認當前的vLLM版本可以直接運行該模型,體現(xiàn)了極高的技術(shù)響應速度。
架構(gòu)優(yōu)勢的天然契合 :MiMo-V2.5對推理效率、長上下文處理和多模態(tài)并行能力的提升,與GPU+架構(gòu)追求的 高效能、大顯存、高并發(fā) 特性高度契合。KS系列提供的強大算力和超大顯存,為充分發(fā)揮MiMo-V2.5的“原生全模態(tài)理解”、“智能體工作流”等功能提供了硬件基礎(chǔ),確保模型在處理復雜任務時的流暢性和準確性。
賦能開發(fā)者與企業(yè)級應用 :通過KS系列與MiMo-V2.5的深度結(jié)合,登臨科技為開發(fā)者提供了一個高性能、低門檻的本地部署方案。這不僅能幫助開發(fā)者充分利用MiMo-V2.5的新功能進行創(chuàng)新,也為企業(yè)級AI應用的規(guī)?;涞靥峁┝丝煽康乃懔χ危苿?a href="http://www.brongaenegriffin.com/soft/data/42-102/" target="_blank">AI技術(shù)從概念驗證走向?qū)嶋H生產(chǎn)。
03 GPU+架構(gòu):
效率與通用的完美融合
登臨科技定位為國產(chǎn)高性能通用GPU領(lǐng)軍者,其核心技術(shù)優(yōu)勢在于創(chuàng)新的GPU+架構(gòu)——它巧妙地融合了傳統(tǒng)GPU的通用性與ASIC的高效率,為AI應用提供了從算力到能效的全面解決方案。這一架構(gòu)的核心優(yōu)勢可概括為以下四個維度:
卓越能效比,降本增效的關(guān)鍵 :通過創(chuàng)新的可擴展、軟件定義的片內(nèi)異構(gòu)體系結(jié)構(gòu),登臨GPU+架構(gòu)在典型AI場景的性能領(lǐng)先國際主流旗艦產(chǎn)品1.5-4.5倍,而能效比達到競品的3-5倍。這意味著在同等算力下,登臨方案能顯著降低功耗,減少散熱需求,特別適用于高密度數(shù)據(jù)中心和邊緣側(cè)部署。GPU+架構(gòu)的核心技術(shù)優(yōu)勢如圖所示,其架構(gòu)圖完美詮釋了如何在保證通用性的同時,實現(xiàn)極致的計算效率。
高度生態(tài)兼容,降低遷移門檻 :登臨硬件兼容CUDA/OpenCL 等現(xiàn)有軟件生態(tài),算法模型可平滑遷移,極大節(jié)約了企業(yè)的移植成本和開發(fā)周期。這一特性確保了客戶現(xiàn)有的AI模型、開發(fā)工具鏈和人才儲備能夠無縫適配,加速了AI技術(shù)在各行業(yè)場景的落地進程。登臨科技的產(chǎn)業(yè)生態(tài)涵蓋了從底層硬件到上層應用的全鏈條,為大模型應用提供了堅實的生態(tài)基礎(chǔ)。
強大算力與大顯存支持,應對復雜任務 :登臨納適II系列工業(yè)加速卡提供了從70 TOPS到560 TOPS的有效AI算力,以及8GB至128GB的大顯存配置。這為處理高分辨率圖像、復雜缺陷分類、3D點云分析等計算密集型任務提供了堅實基礎(chǔ),能夠?qū)崿F(xiàn)像素級的精準檢測和毫秒級實時推理。對于MiMo-V2.5而言,強大的算力支撐其復雜的多模態(tài)推理邏輯,而大顯存則保證了其在處理長上下文和多任務并行時的流暢性,確保了“原生全模態(tài)理解”和“智能體工作流”等核心功能的完美呈現(xiàn)。
全棧國產(chǎn)化與自主可控,保障供應鏈安全 :登臨堅持全鏈路自主創(chuàng)新,架構(gòu)、微架構(gòu)、運算單元等核心IP全自研,已申請國內(nèi)外知識產(chǎn)權(quán)200余項。產(chǎn)品支持Windows、Linux、麒麟等操作系統(tǒng),兼容各類國產(chǎn)CPU,實現(xiàn)從硬件到軟件的全國產(chǎn)化,為客戶提供安全、穩(wěn)定、可持續(xù)的算力底座。這對于在AI領(lǐng)域追求核心技術(shù)自主可控的企業(yè)和國家而言,具有不可估量的戰(zhàn)略價值。
登臨KS系列對MiMo-V2.5的Day0適配,不僅是一次技術(shù)層面的精準契合,更是國產(chǎn)AI生態(tài)協(xié)同發(fā)展的生動縮影。它展示了登臨科技GPU+架構(gòu)在效率、通用、生態(tài)兼容和國產(chǎn)化方面的綜合優(yōu)勢,以及其在大模型領(lǐng)域的快速響應能力。隨著AI技術(shù)的不斷演進,登臨科技將持續(xù)深化GPU+架構(gòu)在各行業(yè)的應用創(chuàng)新,致力于推動AI視覺與大模型的深度融合,優(yōu)化AI模型部署與優(yōu)化門檻,為中國產(chǎn)業(yè)的高質(zhì)量發(fā)展與現(xiàn)代化轉(zhuǎn)型持續(xù)賦能,讓高性能、高效率、高可靠的國產(chǎn)算力真正服務于產(chǎn)業(yè)升級,催生新質(zhì)生產(chǎn)力。
關(guān)于登臨科技
蘇州登臨科技股份有限公司是國內(nèi)首個實現(xiàn)規(guī)模商業(yè)落地的 GPU 企業(yè),專注于高性能通用 GPU 研發(fā)與應用。以 “GPU+” 為技術(shù)核心,為智算中心、工業(yè)視覺、大模型、AIPC、智慧農(nóng)業(yè)等領(lǐng)域提供高效、通用、安全的算力解決方案,致力于成為 AI 產(chǎn)業(yè)化落地的關(guān)鍵算力基礎(chǔ)設(shè)施提供者。
-
開源
+關(guān)注
關(guān)注
3文章
4368瀏覽量
46451 -
登臨科技
+關(guān)注
關(guān)注
0文章
35瀏覽量
884 -
大模型
+關(guān)注
關(guān)注
2文章
3796瀏覽量
5275
原文標題:全球開源大模型綜合智能指數(shù)并列第一MiMo-V2.5正式開源,登臨KS系列Day0適配
文章出處:【微信號:gh_313558c425fe,微信公眾號:登臨科技 DenglinAI】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
登臨科技GPU+架構(gòu)深度適配DeepSeek-V4大模型
沐曦股份曦云C系列GPU產(chǎn)品Day 0適配小米MiMo-V2.5-Pro模型
沐曦股份Day 0適配DeepSeek-V4-Flash模型
沐曦股份曦云C系列GPU產(chǎn)品Day 0適配騰訊混元Hy3 preview語言模型
燧原科技L600極速適配小米MiMo-V2.5-Pro系列模型
登臨科技KS系列GPU產(chǎn)品Day 0適配Kimi-K2.6模型
沐曦股份曦云C系列GPU產(chǎn)品Day 0適配百度文心ERNIE-Image文生圖模型
天數(shù)智芯Day 0適配MiniMax最新開源M2.7大模型
沐曦股份曦云C系列GPU產(chǎn)品Day 0適配MiniMax M2.7模型
沐曦股份曦云C系列GPU產(chǎn)品Day 0適配智譜GLM-5.1旗艦模型
Day-0支持|摩爾線程完成MiniMax M2.5模型極速適配
曦云C系列GPU Day 0 適配智譜全新一代大模型GLM-5
沐曦股份曦云C系列GPU Day 0適配智譜GLM-4.6V多模態(tài)大模型
登臨科技KS系列高性能通用GPU產(chǎn)品Day 0適配小米MiMo-V2.5模型
評論