chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

DeepSeek V3.1發(fā)布!擁抱國產(chǎn)算力芯片

Carol Li ? 來源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2025-08-23 07:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文/李彎彎)2025年8月21日,DeepSeek正式官宣發(fā)布DeepSeek-V3.1大模型。新版本不僅在技術(shù)架構(gòu)上實現(xiàn)重大升級,更通過參數(shù)精度優(yōu)化與國產(chǎn)芯片深度適配。從混合推理架構(gòu)到Agent能力突破,從API價格調(diào)整到國產(chǎn)芯片生態(tài)共建,DeepSeek V3.1的發(fā)布標志著中國AI產(chǎn)業(yè)進入技術(shù)突破與產(chǎn)業(yè)落地協(xié)同發(fā)展的新階段。

圖:DeepSeek正式發(fā)布DeepSeek-V3.1(來自DeepSeek官微)


DeepSeek V3.1的技術(shù)突破與生態(tài)升級

DeepSeek V3.1的核心創(chuàng)新在于混合推理架構(gòu)的規(guī)模化應(yīng)用。該架構(gòu)首次實現(xiàn)單一模型同時支持思考模式與非思考模式:在思考模式下,模型通過深度推理提升復(fù)雜任務(wù)處理能力;在非思考模式下,則通過精簡計算路徑實現(xiàn)高效響應(yīng)。測試數(shù)據(jù)顯示,V3.1-Think在輸出token數(shù)減少20%-50%的情況下,各項任務(wù)平均表現(xiàn)與前代R1-0528持平,而非思考模式的輸出長度控制能力則幫助用戶降低使用成本。

圖:在各項評測指標得分基本持平的情況下(來自DeepSeek官微)


參數(shù)精度優(yōu)化是另一重大突破。V3.1采用UE8M0 FP8 Scale技術(shù),將參數(shù)精度提升至8位浮點數(shù)規(guī)模。這一設(shè)計不僅減少30%的內(nèi)存占用,更通過量化感知訓練保持模型精度。DeepSeek官方透露,UE8M0 FP8標準是專為下一代國產(chǎn)芯片設(shè)計的計算范式,可顯著提升芯片在AI推理場景下的能效比。

FP8是Float8的簡稱,即用8位二進制數(shù)表示浮點數(shù),主要用于深度學習的訓練和推理。相比傳統(tǒng)的FP32(32位浮點數(shù))或FP16(16位浮點數(shù)),F(xiàn)P8顯著降低了顯存占用和計算資源需求,同時通過優(yōu)化設(shè)計(如動態(tài)范圍調(diào)整)維持了較高的精度。??FP8對國產(chǎn)芯片的使用效率提升顯著,將進一步縮小與NVIDIA芯片的效率/成本差距,大大增加國產(chǎn)芯片的可用性。

在Agent能力方面,V3.1通過Post-Training優(yōu)化實現(xiàn)質(zhì)的飛躍。在代碼修復(fù)測評 SWE 與命令行終端環(huán)境下的復(fù)雜任務(wù)(Terminal-Bench)測試中,DeepSeek-V3.1 相比之前的 DeepSeek 系列模型有明顯提高。DeepSeek-V3.1 在多項搜索評測指標上取得了較大提升。在需要多步推理的復(fù)雜搜索測試(browsecomp)與多學科專家級難題測試(HLE)上,DeepSeek-V3.1 性能已大幅領(lǐng)先 R1-0528。官方將其定義為“邁向Agent時代的第一步”。

生態(tài)建設(shè)同步加速。官方App與網(wǎng)頁端同步升級V3.1,用戶可通過“深度思考”按鈕自由切換模式。API接口價格自9月6日起調(diào)整為輸入每百萬tokens 0.5元(緩存命中)/4元(未命中),輸出每百萬tokens 12元,同時取消夜間優(yōu)惠。盡管價格有所上調(diào),但輸入緩存命中成本保持不變,輸出成本增幅控制在50%以內(nèi),體現(xiàn)技術(shù)優(yōu)化帶來的成本分攤效應(yīng)。

國產(chǎn)芯片適配進程:從技術(shù)追趕到生態(tài)共建

DeepSeek與國產(chǎn)芯片的協(xié)同發(fā)展。2025年1月,華為昇騰910B率先完成V3模型適配,通過自研推理加速引擎使模型性能達到高端GPU水平,在智能安防、工業(yè)物聯(lián)網(wǎng)等端側(cè)場景實現(xiàn)本地化決策。2月,海光DCU完成V3與R1模型適配,其GPGPU架構(gòu)支持全精度通用AI加速,通信延遲降低40%,訓練效率提升35%。同月,龍芯中科發(fā)文稱,搭載龍芯3號 CPU 的設(shè)備成功運行DeepSeek R1 7B模型,實現(xiàn)本地化部署。

多芯片廠商形成差異化競爭格局。沐曦曦云C500 GPU在V3推理中性能達國際主流產(chǎn)品的110%-130%,單位token成本僅為H100的70%;天數(shù)智芯支持R1千問蒸餾模型,提供穩(wěn)定推理服務(wù);壁仞科技壁礪系列覆蓋1.5B至70B參數(shù)規(guī)模的全系列蒸餾模型。摩爾線程成為首個支持原生FP8的國產(chǎn)GPU廠商,其MUSA架構(gòu)為V3.1提供原生計算支持;芯原股份NPU芯原VIP9000實現(xiàn)FP8技術(shù)從云端訓練到硬件部署的快速遷移。

政策與市場形成雙輪驅(qū)動。國家超算互聯(lián)網(wǎng)平臺將DeepSeek模型納入標準算力庫,三大運營商在5G基站部署中優(yōu)先采用適配國產(chǎn)芯片的AI推理模塊。

在能源行業(yè)私有化部署實踐中,中國石油、中國海油、國家管網(wǎng)等央企已完成DeepSeek私有化部署,中國海油采用全國產(chǎn)化算力,在“海能”人工智能模型平臺接入DeepSeek系列模型,通過私有化部署面向全集團提供開放服務(wù)。電網(wǎng)故障預(yù)測響應(yīng)時間從分鐘級壓縮至秒級,需結(jié)合實時數(shù)據(jù)采集、高速算力支撐和智能算法優(yōu)化,海光DCU的低延遲計算能力與DeepSeek模型的實時推理能力相結(jié)合,可滿足這一需求。

重構(gòu)中國AI產(chǎn)業(yè)競爭力

技術(shù)突破顯著降低硬件門檻。DeepSeek通過MoE架構(gòu)將激活參數(shù)量控制在合理范圍,V3.1的UE8M0 FP8精度標準使國產(chǎn)芯片在推理場景下的能效比提升40%。實測顯示,在671B參數(shù)規(guī)模下,沐曦曦云C500運行V3的單位算力成本較H100降低35%,推理延遲縮短至8ms以內(nèi)。龍芯芯片在適配DeepSeek后,也憑借其架構(gòu)優(yōu)勢,在特定場景下實現(xiàn)了較低的功耗和較高的性價比,為國產(chǎn)AI應(yīng)用的普及提供了更多選擇。

生態(tài)共建加速產(chǎn)業(yè)落地進程。華為云昇騰算力服務(wù)已承載超過7萬顆910B芯片,訂單價值超20億美元;海光DCU在金融行業(yè)市占率突破28%,其適配的DeepSeek模型日均調(diào)用量達4.7億次。龍芯在完成適配后,積極與眾多軟件廠商和系統(tǒng)集成商展開合作,推動基于龍芯芯片和DeepSeek模型的解決方案在更多行業(yè)落地。例如,在一些教育領(lǐng)域的智能教學系統(tǒng)中,龍芯芯片與DeepSeek模型結(jié)合,實現(xiàn)了智能答疑、個性化學習推薦等功能,提升了教學質(zhì)量和效率。

技術(shù)差距縮短在具體領(lǐng)域表現(xiàn)突出。華為昇騰910C在推理性能上達到H100的60%,能效比優(yōu)于后者;沐曦曦云C500成為首個支持70B參數(shù)大模型單卡推理的國產(chǎn)GPU。龍芯芯片在不斷研發(fā)和優(yōu)化過程中,性能也在逐步提升,在一些特定的AI應(yīng)用場景中,已經(jīng)能夠滿足基本的需求,為中國在AI算力芯片等關(guān)鍵領(lǐng)域的自主化率提升貢獻了力量。

寫在最后

站在2025年的節(jié)點回望,DeepSeek V3.1的發(fā)布不僅是單一產(chǎn)品的迭代,更是中國AI產(chǎn)業(yè)生態(tài)重構(gòu)的縮影。從技術(shù)參數(shù)的優(yōu)化到產(chǎn)業(yè)生態(tài)的共建,從芯片算力的突破到應(yīng)用場景的落地,中國AI正在走出一條不同于國際巨頭的自主化道路。隨著UE8M0 FP8標準成為行業(yè)新范式,隨著“模型+芯片+應(yīng)用”生態(tài)的持續(xù)完善,中國AI產(chǎn)業(yè)有望在2030年前實現(xiàn)全球競爭力的實質(zhì)性躍升。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    DeepSeek一體機背后,國產(chǎn)芯片崛起

    DeepSeek-R1目前已經(jīng)發(fā)布了1.5B/7B/8B/14B/32B/70B/671B共7類,選擇不同規(guī)格的硬件配置。 自2月份以來,已有多家芯片廠商宣布支持DeepSeek模型,
    的頭像 發(fā)表于 03-10 08:19 ?6485次閱讀
    <b class='flag-5'>DeepSeek</b>一體機背后,<b class='flag-5'>國產(chǎn)</b><b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>芯片</b>崛起

    AIGC基礎(chǔ)設(shè)施技術(shù)架構(gòu)與行業(yè)實踐

    AIGC基礎(chǔ)設(shè)施技術(shù)架構(gòu)與行業(yè)實踐 一、硬件層:AI的物理載體 芯片技術(shù)升級? 國際前沿?:某國際
    的頭像 發(fā)表于 05-29 07:44 ?420次閱讀
    AIGC<b class='flag-5'>算</b><b class='flag-5'>力</b>基礎(chǔ)設(shè)施技術(shù)架構(gòu)與行業(yè)實踐

    重磅更新 | 先楫半導體HPM_APPS v1.9.0發(fā)布

    重磅更新 | 先楫半導體HPM_APPS v1.9.0發(fā)布
    的頭像 發(fā)表于 05-13 11:29 ?1097次閱讀
    重磅更新 | 先楫半導體HPM_APPS <b class='flag-5'>v</b>1.9.0<b class='flag-5'>發(fā)布</b>

    DeepSeek推動AI需求:800G光模塊的關(guān)鍵作用

    隨著人工智能技術(shù)的飛速發(fā)展,AI需求正以前所未有的速度增長。DeepSeek等大模型的訓練與推理任務(wù)對的需求持續(xù)攀升,直接推動了服務(wù)
    發(fā)表于 03-25 12:00

    科通技術(shù)推出DeepSeek+AI芯片全場景方案

    份有限公司(以下簡稱“科通技術(shù)”)作為AI供應(yīng)鏈的核心供應(yīng)商,憑借深厚的技術(shù)積累與產(chǎn)業(yè)資源,推出了DeepSeek大模型與AI芯片相結(jié)合的全場景應(yīng)用方案,在AI
    的頭像 發(fā)表于 03-24 10:33 ?933次閱讀

    OrangePi RV2發(fā)布: 8核RISC-V AI CPU,“OpenHarmony5.0?X DeepSeek&amp;quot;引領(lǐng)智能未來

    RISC-VAICPU,提供2TOPSCPU融合的通用,即將支持OpenHarmony5.0,深度適配DeepSeek。國產(chǎn)芯片+
    的頭像 發(fā)表于 03-10 13:35 ?1149次閱讀
    OrangePi RV2<b class='flag-5'>發(fā)布</b>: 8核RISC-<b class='flag-5'>V</b> AI CPU,“OpenHarmony5.0?X <b class='flag-5'>DeepSeek</b>&amp;quot;引領(lǐng)智能未來

    壁仞科技支持DeepSeek-V3滿血版訓練推理

    DeepSeek-V3滿血版在國產(chǎn)GPU平臺的高效全棧式訓練與推理,實現(xiàn)國產(chǎn)大模型與國產(chǎn)GPU的深度融合優(yōu)化,開啟國產(chǎn)
    的頭像 發(fā)表于 03-04 14:01 ?1692次閱讀

    DeepSeek驅(qū)動AI市場升溫,智中心利用率望提升

    。 盡管目前這一需求尚未對供給造成直接影響,但卡價格已經(jīng)呈現(xiàn)出上漲趨勢。這一變化反映出市場對AI的強烈需求,以及DeepSeek等技術(shù)推動下的
    的頭像 發(fā)表于 02-19 14:00 ?612次閱讀

    濟南市中區(qū)存一體化智中心上線DeepSeek

    濟南市中未來產(chǎn)業(yè)發(fā)展有限公司(簡稱“市中產(chǎn)發(fā)”)聯(lián)合華為、北京昇騰和清昴智能基于市中區(qū)存一體化智中心(國家大學科技園節(jié)點)昇騰部署
    的頭像 發(fā)表于 02-19 10:38 ?1024次閱讀

    安霸大AI芯片接入DeepSeek R1

    安霸(Ambarela)在人工智能領(lǐng)域持續(xù)發(fā),已成功在多款 AI 芯片,包括 N 系列大 AI
    的頭像 發(fā)表于 02-17 13:36 ?779次閱讀

    梯度科技推出DeepSeek一體機

    近日,梯度科技搭載DeepSeek大模型的智一體機正式發(fā)布。該產(chǎn)品基于“國產(chǎn)服務(wù)器+國產(chǎn)GPU+自主算法”核心架構(gòu),搭載梯度科技人工智能應(yīng)
    的頭像 發(fā)表于 02-17 09:53 ?1189次閱讀

    deepseek國產(chǎn)芯片加速 DeepSeek國產(chǎn)AI芯片天團

    ,從而紛紛繼續(xù)“卷”起來,效仿DeepSeek的“開源”模式。 對于DeepSeek本身,人們關(guān)注其如何在有限實現(xiàn)強大性能,更關(guān)注其在重重條令圍城之下的未來之路。而在最近,全世界的
    的頭像 發(fā)表于 02-10 15:07 ?4641次閱讀
    <b class='flag-5'>deepseek</b><b class='flag-5'>國產(chǎn)</b><b class='flag-5'>芯片</b>加速 <b class='flag-5'>DeepSeek</b>的<b class='flag-5'>國產(chǎn)</b>AI<b class='flag-5'>芯片</b>天團

    DeepSeek芯片的影響

    DeepSeek模型,尤其是其基于MOE(混合專家)架構(gòu)的DeepSeek-V3,對芯片的要求產(chǎn)生了深遠影響。為了更好地理解這一影響,我
    的頭像 發(fā)表于 02-07 10:02 ?1462次閱讀
    <b class='flag-5'>DeepSeek</b>對<b class='flag-5'>芯片</b><b class='flag-5'>算</b><b class='flag-5'>力</b>的影響

    一體架構(gòu)創(chuàng)新助力國產(chǎn)AI芯片騰飛

    在灣芯展SEMiBAY2024《AI芯片與高性能計算(HPC)應(yīng)用論壇》上,億鑄科技高級副總裁徐芳發(fā)表了題為《存一體架構(gòu)創(chuàng)新助力國產(chǎn)
    的頭像 發(fā)表于 10-23 14:48 ?1121次閱讀