chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

國產(chǎn)AI換芯提速!DeepSeek V4和小米MiMo-V2.5上線,主流國產(chǎn)芯片適配

章鷹觀察 ? 來源:章鷹觀察 ? 作者:章鷹 ? 2026-04-28 15:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

4月24日,中國 AI 新創(chuàng)公司 DeepSeek 宣布兩條重大消息:一是公司首次啟動融資,目標(biāo)估值從100億美元迅速抬升至200億美元到300億美元,騰訊、阿里正在洽談入局;二是DeepSeek正式發(fā)布全新系列 AI 大模型 DeepSeek-V4 的預(yù)覽版本并同步開源,憑借百萬字超長上下文及領(lǐng)先的 Agent 能力引發(fā)業(yè)界高度關(guān)注。

4月25日,梁文鋒出手了,DeepSeek-V4-Pro開啟限時2.5折優(yōu)惠,輸入價格(緩存命中)降至0.25元/百萬tokens。4月26日晚間,DeepSeek就再次降價。全系A(chǔ)PI輸入緩存命中價格直接降至首發(fā)價的1/10。

4月28日,小米技術(shù)官方宣布最強(qiáng)模型小米 MiMo-V2.5 系列,該系列采用MIT協(xié)議,支持商用推理部署與二次訓(xùn)練,無需額外授權(quán)。小米MiMo-V2.5開源 & Orbit 百萬億 Token 計(jì)劃啟動。

這兩款新AI大模型各有何優(yōu)勢?在芯片適配方面,已經(jīng)進(jìn)展到哪里?本文進(jìn)行解析。

DeepSeek V4具備強(qiáng)悍性能,適配國產(chǎn)主流AI芯片

4月24日,DeepSeek-V4預(yù)覽版本上線并同步開源,包含DeepSeek-V4-Pro和DeepSeek-V4-Flash兩個模型。DeepSeek-V4-Pro總參數(shù)1.6萬億,每次推理激活490億參數(shù),定位對標(biāo)頂級閉源模型,適用于復(fù)雜推理、智能體(Agent)及長文本處理。DeepSeek-V4-Flash總參數(shù)2840億,激活130億參數(shù),主打高性價比,適合高并發(fā)、輕量化場景。

DeepSeek V4 Pro新模型將總參數(shù)推至1.6萬億,首次將百萬token上下文打成標(biāo)配,并實(shí)現(xiàn)了百萬上下文下每token的算力消耗僅為V3.2的27%,KV緩存占用只有10%。

DeepSeek V4 在編程(如 SWE-Bench、HumanEval)和數(shù)學(xué)推理(如奧數(shù)題)方面的表現(xiàn)非常出色,甚至在部分開源榜單上超越了 GPT-5.4 和 Claude Opus 4.6 的非思考模式。它非常適合程序員用來寫代碼、做復(fù)雜邏輯分析。

模型輸出質(zhì)量上,V4同時支持三檔推理強(qiáng)度,并針對Agentic Coding做了專項(xiàng)優(yōu)化。

在性能層面,DeepSeek-V4-Pro 實(shí)現(xiàn)了顯著突破。技術(shù)報(bào)告顯示,該模型在 Agent 能力上達(dá)到開源模型最佳水平,Agentic Coding 使用體驗(yàn)優(yōu)于閉源的 Claude Sonnet 4.5。

目前,模型已經(jīng)為華為昇騰950芯片完成適配,預(yù)計(jì)下半年昇騰950超節(jié)點(diǎn)批量上市后,V4 Pro價格進(jìn)一步下調(diào)。華為昇騰超節(jié)點(diǎn)全系列產(chǎn)品已支持DeepSeek V4系列模型,實(shí)現(xiàn)DeepSeek V4-Pro20ms和DeepSeek V4-Flash 10ms低時延推理。

DeepSeek在推理引擎層面兼容CUDA與昇騰CANN并支持FP4/FP8等低精度策略,顯著縮短“模型發(fā)布—芯片適配—產(chǎn)業(yè)部署”的時間差,驗(yàn)證國產(chǎn)卡在超長序列與大規(guī)模推理場景的可用性與性價比,推動“國模國芯”從跑通到高效協(xié)同的躍遷。

此外,寒武紀(jì)、海光信息、摩爾線程、天數(shù)智芯、沐曦等國產(chǎn)芯片廠商也宣布支持DeepSeek-V4新模型。寒武紀(jì)基于vLLM推理框架完成Day 0適配,適配代碼已開源至GitHub社區(qū),支持DeepSeek-V4-Pro和DeepSeek-V4-Flash。

海光DCU(深算系列)完成對DeepSeek-V4的Day 0適配,并對模型進(jìn)行深度調(diào)優(yōu),形成“模型發(fā)布—芯片適配—產(chǎn)業(yè)落地”的閉環(huán),提供即取即用的部署方案。

摩爾線程完成 DeepSeek V4 適配的芯片是其旗艦級 AI 訓(xùn)推一體全功能 GPU——MTT S5000。此次適配由摩爾線程聯(lián)合智源 FlagOS 社區(qū)共同完成,實(shí)現(xiàn)了對 DeepSeek-V4-Flash 模型的“Day-0”(發(fā)布即適配)極速支持,并完成了全量核心算子的深度優(yōu)化。

4月24日,DeepSeek V4發(fā)布當(dāng)日,上海AI實(shí)驗(yàn)室DeepLink團(tuán)隊(duì)依托KernelSwift智能算子遷移系統(tǒng),完成DeepSeek-V4核心算子在多元芯片的Day 0適配,天數(shù)智芯作為核心合作方,實(shí)現(xiàn)天垓訓(xùn)練芯片、智鎧推理芯片對該模型的核心算子適配。

DeepSeekV4是國內(nèi)首個在華為昇騰 910B/C 等國產(chǎn)芯片上實(shí)現(xiàn)“開箱即用”的萬億參數(shù)模型。這意味著在不依賴英偉達(dá)高端AI芯片的情況下,國內(nèi)企業(yè)也能低成本運(yùn)行頂級大模型,戰(zhàn)略意義重大。

根據(jù)OpenRouter的數(shù)據(jù), 2026年3月30日-4月5日,中國AI模型的周調(diào)用量突破12.96萬億Token,是同期美國的4.3倍,國產(chǎn)化無疑有著巨大的市場前景。

小米MiMo-V2.5定位多模態(tài)模型,多個性能超過DeepSeek V4,首日適配國產(chǎn)五大芯片

4月28日,小米宣布旗下最強(qiáng)模型 MiMo-V2.5 系列,包括帶來V2.5-Pro和V2.5兩款版本,MiMo-V2.5-Pro 為混合專家架構(gòu)(MoE)模型,總參數(shù)量達(dá) 1.02 兆(1.02T),其中 420 億(42B)個啟動參數(shù),支持最長 100 萬 Token 的超長上下文處理,Token 效率相較前代大幅提升。

MiMo-V2.5系列包含兩款模型,均支持100萬上下文窗口。其中,MiMo-V2.5-Pro主打復(fù)雜任務(wù)場景,可以支持1T的超大參數(shù)量,以及1M超長上下文的模型推理。該模型深度適配Agent與Coding應(yīng)用,在GDPVal-AA和ClawEval榜單上位列全球開源模型第一。

模型采局部滑動窗口注意力(SWA)與全局注意力(GA)以 6:1 比例交錯設(shè)計(jì),可在長上下文場景下將 KV 高速緩存占用縮減近 7 倍,同時維持效能表現(xiàn)。此外,內(nèi)建輕量級多標(biāo)記預(yù)測(MTP)模塊,可將輸出吞吐量提升約三倍,并加速強(qiáng)化學(xué)習(xí)部署。

預(yù)訓(xùn)練規(guī)模方面,MiMo-V2.5-Pro 使用 27 兆(27T)個 Token、FP8 混合精度進(jìn)行訓(xùn)練,原生序列長度 32K,再透過上下文擴(kuò)展至 100 萬 Token。

小米公布的最新評測結(jié)果顯示,MiMo-V2.5-Pro 在 GDPVal-AA(Elo)、Claw-Eval(Pass^3)等多項(xiàng)基準(zhǔn)檢驗(yàn)中,超越了 DeepSeek 最新開源的 DeepSeek-V4-Pro,也優(yōu)于甫發(fā)布不久的 Kimi K2.6 等主流閉源模型,總體排名第一。

MiMo-V2.5-Pro已于開源首日完成多個芯片廠商的接入適配,其中包括阿里平頭哥、亞馬遜云科技(基于 Trainium2 芯片)、AMD、百度昆侖芯、燧原科技、沐曦、天數(shù)智芯七家芯片廠商接入適配,同步完成 SGLang 與 vLLM 兩大主流推理框架的 Day 0 適配。

小米同步推出「MiMo Orbit 計(jì)劃」,涵蓋兩大方向:百兆 Token 創(chuàng)造者激勵計(jì)劃:面向全球 AI 用戶,于 2026 年 4 月 28 日至 5 月 28 日期間免費(fèi)發(fā)放共計(jì) 100 兆 Token 權(quán)益,通過審核者最高可獲得價值人民幣 659 元的 Max 檔位 Token Plan,額度發(fā)完為止。

代理生態(tài)共建計(jì)劃:面向全球代理框架團(tuán)隊(duì),提供 Token 免費(fèi)支持,并共同舉辦 AI Hackathon 等活動,目前已與 OpenCode、Hermes Agent、KiloCode 等框架廠商展開深度合作。

而在4月28日, DeepSeek官網(wǎng)API文檔相關(guān)頁面顯示,當(dāng)前deepseek-v4-pro模型的2.5折優(yōu)惠活動將延長至今年5月31日23:59。目前,deepseek-v4-pro的輸入價格(緩存命中)為0.025元(每百萬tokens),輸入價格(緩存未命中)為3元,輸出價格為6元。使用成本遠(yuǎn)低于美國競爭對手,僅為 OpenAI 同類產(chǎn)品價格的 3%,分析人士認(rèn)為此舉旨在吸引更多企業(yè)用戶與開發(fā)者

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    463

    文章

    54447

    瀏覽量

    469454
  • 小米
    +關(guān)注

    關(guān)注

    70

    文章

    14551

    瀏覽量

    152604
  • AI大模型
    +關(guān)注

    關(guān)注

    0

    文章

    409

    瀏覽量

    1042
  • DeepSeek
    +關(guān)注

    關(guān)注

    2

    文章

    847

    瀏覽量

    3406
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    DeepSeek V3.1發(fā)布!擁抱國產(chǎn)算力芯片

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)2025年8月21日,DeepSeek正式官宣發(fā)布DeepSeek-V3.1大模型。新版本不僅在技術(shù)架構(gòu)上實(shí)現(xiàn)重大升級,更通過參數(shù)精度優(yōu)化與國產(chǎn)芯片深度
    的頭像 發(fā)表于 08-23 07:55 ?1.8w次閱讀
    <b class='flag-5'>DeepSeek</b> <b class='flag-5'>V</b>3.1發(fā)布!擁抱<b class='flag-5'>國產(chǎn)</b>算力<b class='flag-5'>芯片</b>

    軟通華方超節(jié)點(diǎn)服務(wù)器產(chǎn)品全面適配DeepSeek V4模型

    超節(jié)點(diǎn)服務(wù)器,率先完成了對DeepSeek V4的全棧適配與驗(yàn)證工作。這一舉措不僅展現(xiàn)了公司在國產(chǎn)算力領(lǐng)域的深厚技術(shù)積淀,更為廣大企業(yè)用戶提供了穩(wěn)定、高效的算力底座,加速
    的頭像 發(fā)表于 04-28 16:34 ?17次閱讀

    沐曦股份曦云C系列GPU產(chǎn)品Day 0適配小米MiMo-V2.5-Pro模型

    4月23日,小米開啟 MiMo-V2.5系列模型的公測,并于4月28日正式發(fā)布及開源。沐曦股份已同步完成對 MiMo-V2.5-Pro 的
    的頭像 發(fā)表于 04-28 15:59 ?24次閱讀
    沐曦股份曦云C系列GPU產(chǎn)品Day 0<b class='flag-5'>適配</b><b class='flag-5'>小米</b><b class='flag-5'>MiMo-V2.5</b>-Pro模型

    沐曦股份Day 0適配DeepSeek-V4-Flash模型

    4月24日,沐曦股份攜手FlagOS,已完對DeepSeek最新開源的DeepSeek-V4-Flash模型的Day 0適配。同日,沐曦股份還聯(lián)合上海人工智能實(shí)驗(yàn)室KernelSwif
    的頭像 發(fā)表于 04-28 15:53 ?25次閱讀

    燧原科技L600極速適配小米MiMo-V2.5-Pro系列模型

    2026年4月28日,小米正式發(fā)布 MiMo-V2.5-Pro 系列模型,并于同日正式開源。燧原科技已同步完成對 MiMo-V2.5-Pro的 Day-0 極速
    的頭像 發(fā)表于 04-28 15:21 ?48次閱讀
    燧原科技L600極速<b class='flag-5'>適配</b><b class='flag-5'>小米</b><b class='flag-5'>MiMo-V2.5</b>-Pro系列模型

    燧原科技L600 FP8原生適配DeepSeek-V4-Pro/Flash模型

    2026年4月24日,深度求索(DeepSeek)正式發(fā)布并開源新一代旗艦大模型DeepSeek?V4,同步推出1.6T DeepSeek?
    的頭像 發(fā)表于 04-28 15:19 ?109次閱讀

    國產(chǎn)AI算力:從DeepSeek V4與華為昇騰協(xié)同看全棧自主之路

    Cache滑窗和壓縮算法,顯著降低計(jì)算與訪存開銷,在Agent能力、世界知識和推理性能上處于國內(nèi)及開源領(lǐng)域領(lǐng)先地位。 ? 與此同時,華為宣布昇騰超節(jié)點(diǎn)全系列產(chǎn)品全面支持DeepSeek V4系列,這場
    的頭像 發(fā)表于 04-25 07:02 ?6903次閱讀

    長江計(jì)算G940K V2超節(jié)點(diǎn)服務(wù)器完成對DeepSeek V4模型極速適配

      4月24日,備受行業(yè)關(guān)注的大模型產(chǎn)品DeepSeek V4正式發(fā)布。烽火通信旗下長江計(jì)算憑借深厚的技術(shù)積累與前瞻布局,以G940K V2超節(jié)點(diǎn)服務(wù)器為核心載體,同步完成對
    的頭像 發(fā)表于 04-24 17:40 ?1674次閱讀

    海光信息DCU平臺完成對DeepSeek V4模型極速適配

      4月24日,深度求索正式發(fā)布并開源DeepSeek V4。海光DCU同步完成對DeepSeek V4的Day0
    的頭像 發(fā)表于 04-24 17:32 ?1552次閱讀

    摩爾線程S5000 + 智源FlagOS:基于原生FP8引擎,Day-0適配DeepSeek-V4

    推理力度模式(Flash-Max)下推理能力逼近Pro版本。值得關(guān)注的是,V4模型首次采用“FP4+FP8”混合精度策略,而當(dāng)前國內(nèi)主流 AI 芯片
    發(fā)表于 04-24 16:30 ?1005次閱讀
    摩爾線程S5000 + 智源FlagOS:基于原生FP8引擎,Day-0<b class='flag-5'>適配</b><b class='flag-5'>DeepSeek-V4</b>

    昆侖萬維天工AI大模型SkyReels V4登上Artificial Analysis榜單全球第一

    3月19日,天工AI大模型SkyReels V4登上Artificial Analysis榜單Text to Video (With Audio) 賽道全球第一,顯著超越Kling 3.0
    的頭像 發(fā)表于 03-26 10:10 ?963次閱讀

    太初元碁:40+AI大模型全覆蓋,新版本即發(fā)即適配、上線即可用,實(shí)現(xiàn)國產(chǎn)”速度

    日前,國產(chǎn)AI芯片企業(yè)太初(無錫)電子科技有限公司(又稱“太初元碁”)完成智譜GLM-5.0、阿里千問Qwen3.5-397B-A17B等大模型的深度適配,截至目前,其已完成包括
    的頭像 發(fā)表于 02-25 09:21 ?2053次閱讀

    0.7元/百萬token碾壓競品! 小米新開源大模型,卷出AI普惠關(guān)鍵密碼

    ”“推理成本僅為標(biāo)桿模型2.5%”等重磅信息。 截至2025年12月19日,小米發(fā)布的 MiMo-V2-Flash、深度求索(DeepSeek)的
    的頭像 發(fā)表于 12-21 07:52 ?1.1w次閱讀
    0.7元/百萬token碾壓競品! <b class='flag-5'>小米</b>新開源大模型,卷出<b class='flag-5'>AI</b>普惠關(guān)鍵密碼

    中科曙光AI超集群系統(tǒng)和scaleX640超節(jié)點(diǎn)等產(chǎn)品全面適配DeepSeek V3.2

    12月1日,DeepSeek正式發(fā)布DeepSeek-V3.2和DeepSeek-V3.2-Speciale,大幅強(qiáng)化Agent能力,融入思考推理。基于中國首個AI計(jì)算開放架構(gòu),硬件層
    的頭像 發(fā)表于 12-05 14:32 ?963次閱讀

    國產(chǎn)SL4013芯片如何實(shí)現(xiàn)USB 5V升壓至24V以上?

    穩(wěn)定。 國產(chǎn)SL4013芯片通過技術(shù)創(chuàng)新與工程優(yōu)化,成功解決了USB 5V升壓至24V+場景下的效率、穩(wěn)定性與成本難題。其?高集成度設(shè)計(jì)?(僅需4
    發(fā)表于 04-28 17:39