近日,蘇州登臨科技股份有限公司(以下簡稱“登臨科技”)自主研發(fā)的KS系列高性能通用GPU已全面完成對最新一代大模型MiniMax M2.5的深度適配與優(yōu)化。通過創(chuàng)新的GPU+架構(gòu),登臨科技不僅實(shí)現(xiàn)了對MiniMax M2.5模型的高效支持,更依托KS38/ KS58云端推理卡——單卡最高配備128GB顯存,推出僅需2卡即可部署MiniMax M2.5的突破性方案,大幅降低整體部署成本。將大模型部署的硬件門檻與成本降至行業(yè)新低,為企業(yè)級AI應(yīng)用的規(guī)?;涞刈⑷霃?qiáng)勁動力。
MiniMax M2.5 深度適配
提供超低成本部署方案
MiniMax M2.5作為MiniMax M2.x系列發(fā)布的最新版本模型,在代碼編寫、智能體工具使用與搜索、辦公任務(wù)以及一系列其他具有經(jīng)濟(jì)價(jià)值的任務(wù)上達(dá)到當(dāng)前最先進(jìn)(SOTA)水平,在 SWE-Bench Verified、Multi-SWE-Bench 和 BrowseComp(含上下文管理)等評測中分別取得了 80.2%、51.3% 和 76.3% 的高分。隨著OpenClaw的爆火,全球API調(diào)用token數(shù)量暴增,據(jù)全球最大LLM API聚合平臺OpenRouter 2月24日數(shù)據(jù),中國AI模型Token消耗量占平臺前十總量的61%,前三名全部來自中國實(shí)驗(yàn)室。MiniMax M2.5以單周2.45萬億Token登頂榜首,環(huán)比暴漲197%。
目前登臨的KS38/ KS58云端推理卡,單卡最高配備128GB顯存,2卡即可部署MiniMax M2.5,極大降低綜合部署成本。并提供單服務(wù)器內(nèi)模型全上下文長度推理,釋放MiniMax M2.5完整能力。

GPU+架構(gòu):效率與通用的完美融合
重新定義算力效能
登臨科技的GPU+架構(gòu)是其核心技術(shù)優(yōu)勢所在,它巧妙地融合了傳統(tǒng) GPU 的通用性與 ASIC 的高效率,為大模型推理等 AI 應(yīng)用提供了從算力到能效的全面解決方案。
卓越能效比,降本增效的關(guān)鍵登臨 GPU+架構(gòu)通過創(chuàng)新的可擴(kuò)展、軟件定義的片內(nèi)異構(gòu)體系結(jié)構(gòu),實(shí)現(xiàn)了能效比的大幅提升,在算力需求暴漲的今天,能源消耗成為算力擴(kuò)展瓶頸的趨勢愈發(fā)明顯,GPU+架構(gòu)正是解決這一困境的鑰匙。
高度生態(tài)兼容性,降低遷移門檻登臨硬件兼容 CUDA/OpenCL 等現(xiàn)有軟件生態(tài),算法模型可平滑遷移,極大節(jié)約了企業(yè)的移植成本和開發(fā)周期。在大模型領(lǐng)域,登臨軟件棧更是在Day0適配了DeepSeek、GLM、MiniMax、Kimi、GPT-OSS等國內(nèi)外主流大模型。
強(qiáng)大算力與內(nèi)存支持,超長上下文處理登臨納適II 系列加速卡提供了高達(dá)560 TOPS 的云端有效AI算力,以及 128GB 的大顯存配置,為大模型推理和超長上下文提供基礎(chǔ)支撐。
全棧國產(chǎn)化與自主可控,保障供應(yīng)鏈安全登臨堅(jiān)持自主創(chuàng)新,核心IP(架構(gòu)/微架構(gòu)/算術(shù)單元等)全自研,已申請國內(nèi)外各類知識產(chǎn)權(quán) 200 余項(xiàng)。其產(chǎn)品支持 Windows10、Linux、麒麟等系統(tǒng),并兼容各類國產(chǎn) CPU,確保了從硬件到軟件的全國產(chǎn)化能力,為客戶提供了安全可靠的算力底座。
行業(yè)價(jià)值與未來展望
登臨科技 KS 系列對 MiniMax M2.5 的支持,以及 KS38/KS58 兩卡部署方案的推出,不僅為企業(yè)提供了高性能、低成本的大模型運(yùn)行平臺,更在多個(gè)層面創(chuàng)造了顯著的行業(yè)價(jià)值:
降低 AI 應(yīng)用門檻 :使更多中小企業(yè)能夠負(fù)擔(dān)得起先進(jìn)的大模型技術(shù),加速 AI 技術(shù)的普及和應(yīng)用。
提升業(yè)務(wù)處理效率 :在內(nèi)容審核、智能客服、數(shù)據(jù)分析等場景中,提供更快、更準(zhǔn)確的處理能力,提升業(yè)務(wù)效率和用戶體驗(yàn)。
推動國產(chǎn)算力發(fā)展 :作為國產(chǎn)高性能通用 GPU 的領(lǐng)先企業(yè),登臨科技通過實(shí)際應(yīng)用驗(yàn)證了國產(chǎn)算力的可靠性和先進(jìn)性,為構(gòu)建自主可控的 AI 算力生態(tài)貢獻(xiàn)力量。
展望未來,登臨科技將持續(xù)深化在大模型領(lǐng)域的技術(shù)創(chuàng)新與行業(yè)應(yīng)用,致力于推動 AI 視覺與大模型的深度融合,優(yōu)化 AI 模型部署與優(yōu)化門檻,拓展全場景 AI 應(yīng)用,為各行業(yè)的智能化升級提供更高效、更智能、更安全的算力解決方案。
關(guān)于登臨
蘇州登臨科技股份有限公司是一家專注于高性能通用 GPU 設(shè)計(jì)與研發(fā)的創(chuàng)新型企業(yè),致力于為 AI 計(jì)算、圖形渲染、高性能計(jì)算等領(lǐng)域提供自主可控、高效能的算力解決方案。公司以“技術(shù)賦能行業(yè)革新”為理念,通過自主研發(fā)的GPU+架構(gòu),在多個(gè)行業(yè)實(shí)現(xiàn)了規(guī)模化商業(yè)落地,成為推動國產(chǎn)算力發(fā)展的關(guān)鍵力量。
-
gpu
+關(guān)注
關(guān)注
28文章
5194瀏覽量
135412 -
登臨科技
+關(guān)注
關(guān)注
0文章
19瀏覽量
823
原文標(biāo)題:登臨科技KS系列全面適配MiniMax M2.5,GPU+架構(gòu)驅(qū)動大模型部署成本革命
文章出處:【微信號:gh_313558c425fe,微信公眾號:登臨科技 DenglinAI】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
沐曦股份曦云C系列GPU全面適配通義千問Qwen3.5三款新模型
摩爾線程業(yè)績快報(bào):2025年?duì)I收同比增長243.37%,S5000全棧適配SOTA大模型加速釋放商業(yè)潛能
壁仞科技壁礪166系列產(chǎn)品深度適配MiniMax M2.5和智譜GLM-5模型
沐曦股份曦云C系列GPU深度適配通義千問Qwen3.5模型
沐曦曦云C500/C550 GPU產(chǎn)品深度適配MiniMax M2.5模型
登臨科技基于納適系列國產(chǎn)化GPU推出文檔PDF解析行業(yè)解決方案
大模型 ai coding 比較
Day-0支持|摩爾線程完成MiniMax M2.5模型極速適配
曦云C系列GPU Day 0 適配智譜全新一代大模型GLM-5
壁仞科技壁礪166M產(chǎn)品適配模思智能MOSS-TTS Family模型
塔力科技與登臨科技達(dá)成戰(zhàn)略合作
沐曦股份曦云C系列GPU Day 0適配智譜GLM-4.6V多模態(tài)大模型
壁仞科技完成Qwen3旗艦模型適配
愛芯通元NPU適配Qwen2.5-VL-3B視覺多模態(tài)大模型
登臨科技KS系列GPU產(chǎn)品全面適配MiniMax M2.5模型
評論