chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

從訓(xùn)練到推理:大模型算力需求的新拐點(diǎn)已至

穎脈Imgtec ? 2026-02-05 16:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在大模型產(chǎn)業(yè)發(fā)展的早期階段,行業(yè)焦點(diǎn)主要集中在大模型訓(xùn)練所需的算力投入。一個(gè)萬(wàn)億參數(shù)大模型的訓(xùn)練可能需要數(shù)千張GPU芯片連續(xù)運(yùn)行數(shù)月,成本高達(dá)數(shù)千萬(wàn)甚至上億元。但隨著大模型技術(shù)的成熟和應(yīng)用落地,推理算力正在成為市場(chǎng)關(guān)注的新焦點(diǎn)。


一、訓(xùn)練算力的"一次性投入"困境

大模型訓(xùn)練是典型的"一次性高成本投入"模式。根據(jù)OpenAI的公開(kāi)數(shù)據(jù),GPT-3.5的訓(xùn)練大約使用了1024張A100芯片,耗時(shí)約3個(gè)月,成本超過(guò)1000萬(wàn)美元。而GPT-4的訓(xùn)練成本更是達(dá)到了上億美元級(jí)別。這種高成本的訓(xùn)練模式使得大模型技術(shù)長(zhǎng)期被少數(shù)巨頭企業(yè)掌握。

但訓(xùn)練只是大模型應(yīng)用的第一步,真正考驗(yàn)算力能力的是大規(guī)模商業(yè)應(yīng)用后的推理階段。一個(gè)活躍用戶每天與大模型的互動(dòng)可能需要消耗數(shù)美元的推理算力成本,而當(dāng)用戶規(guī)模達(dá)到百萬(wàn)級(jí)甚至千萬(wàn)級(jí)時(shí),推理算力的需求將呈指數(shù)級(jí)增長(zhǎng)。


二、推理算力需求的新拐點(diǎn)根據(jù)IDC中國(guó)的預(yù)測(cè),中國(guó)智能算力規(guī)模仍將保持高速增長(zhǎng),2025年將較2024年增長(zhǎng)43%,2026年中國(guó)智能算力規(guī)模將達(dá)到2024年的兩倍。其中,推理算力的增長(zhǎng)速度將遠(yuǎn)超訓(xùn)練算力。

中國(guó)IDC圈創(chuàng)始人、CEO黃超表示,2026年產(chǎn)業(yè)智能體將進(jìn)入百花齊放的發(fā)展階段,算力應(yīng)用正從"訓(xùn)練主導(dǎo)"悄然轉(zhuǎn)向"推理驅(qū)動(dòng)",推理算力需求的爆發(fā)周期即將全面到來(lái)??浦亲稍儼l(fā)布的《算力基礎(chǔ)設(shè)施產(chǎn)業(yè)發(fā)展現(xiàn)狀與未來(lái)趨勢(shì)》報(bào)告顯示,到2026年,中國(guó)智算需求將占新增需求的71%,而其中推理算力的占比將超過(guò)50%。

從用戶數(shù)據(jù)來(lái)看,推理算力的需求增長(zhǎng)已經(jīng)顯現(xiàn)。QuestMobile發(fā)布的AI應(yīng)用周活排行榜顯示,豆包、DeepSeek、元寶、螞蟻阿福位列周活前四,新上線的螞蟻阿福和靈光增長(zhǎng)迅猛,通用AI在用戶規(guī)模上保持優(yōu)勢(shì)。這些活躍用戶每天產(chǎn)生的海量推理請(qǐng)求,對(duì)算力服務(wù)商的推理能力提出了極高要求。


三、推理算力的技術(shù)新挑戰(zhàn)與訓(xùn)練算力相比,推理算力面臨著完全不同的技術(shù)挑戰(zhàn):

  • 低時(shí)延要求:用戶與大模型的交互需要即時(shí)響應(yīng),推理時(shí)延需要控制在數(shù)百毫秒以內(nèi),否則會(huì)嚴(yán)重影響用戶體驗(yàn)。
  • 高并發(fā)支持:商業(yè)應(yīng)用場(chǎng)景下,大模型可能需要同時(shí)處理數(shù)十萬(wàn)甚至數(shù)百萬(wàn)用戶的請(qǐng)求,需要算力系統(tǒng)具備強(qiáng)大的并發(fā)處理能力。
  • 能效比優(yōu)化:推理算力是持續(xù)消耗型需求,能效比直接決定了企業(yè)的運(yùn)營(yíng)成本。根據(jù)國(guó)際能源署的預(yù)測(cè),到2030年,AI設(shè)施的用電量將增長(zhǎng)五倍,對(duì)推理算力的能效比提出了更高要求。
  • 異構(gòu)算力協(xié)同:不同的大模型推理場(chǎng)景對(duì)算力的需求各不相同,需要算力系統(tǒng)支持CPU、GPU、NPU等多種異構(gòu)芯片的協(xié)同工作。

為了應(yīng)對(duì)這些挑戰(zhàn),算力服務(wù)商正在探索新的技術(shù)路徑。比如,中科曙光推出的"scaleX"萬(wàn)卡超集群系統(tǒng)采用浸沒(méi)相變液冷技術(shù),將PUE值降至1.04,顯著提升了推理算力的能效比。華為則推出了昇騰AI芯片及全棧解決方案,針對(duì)推理場(chǎng)景進(jìn)行了深度優(yōu)化,支持高并發(fā)、低時(shí)延的推理服務(wù)。


四、算力服務(wù)商的新機(jī)遇推理算力需求的爆發(fā),為算力服務(wù)商帶來(lái)了新的發(fā)展機(jī)遇:

  • 長(zhǎng)期穩(wěn)定的營(yíng)收來(lái)源:推理算力需求具有持續(xù)性和穩(wěn)定性,相比一次性的訓(xùn)練算力需求,更適合作為算力服務(wù)商的核心營(yíng)收來(lái)源。
  • 垂直行業(yè)定制化服務(wù):不同行業(yè)的大模型應(yīng)用場(chǎng)景對(duì)推理算力的需求各不相同,算力服務(wù)商可以針對(duì)金融、醫(yī)療、教育等垂直行業(yè)提供定制化的推理算力解決方案。
  • 綠色算力應(yīng)用場(chǎng)景:推理算力對(duì)能效比的高要求,推動(dòng)了綠色算力技術(shù)的發(fā)展。廊坊的智算集群通過(guò)AI算法對(duì)系統(tǒng)進(jìn)行數(shù)據(jù)分析,動(dòng)態(tài)調(diào)整負(fù)載分配,將PUE值降至1.25以下,為綠色推理算力應(yīng)用提供了范例。
  • 邊緣推理算力布局:隨著大模型應(yīng)用向終端設(shè)備延伸,邊緣推理算力需求正在快速增長(zhǎng)。算力服務(wù)商可以通過(guò)部署邊緣推理節(jié)點(diǎn),為終端設(shè)備提供低時(shí)延的推理服務(wù)。

ae192636-0269-11f1-96ea-92fbcf53809c.jpg


五、未來(lái)趨勢(shì)展望從訓(xùn)練到推理的算力需求拐點(diǎn)已經(jīng)到來(lái),未來(lái)大模型產(chǎn)業(yè)的競(jìng)爭(zhēng)將更多地圍繞推理算力展開(kāi):

  • 推理芯片將成為市場(chǎng)新寵:專門(mén)針對(duì)大模型推理優(yōu)化的芯片將成為市場(chǎng)關(guān)注的焦點(diǎn),國(guó)產(chǎn)推理芯片廠商有望迎來(lái)發(fā)展黃金期。
  • 推理算力服務(wù)將標(biāo)準(zhǔn)化:隨著推理算力需求的增長(zhǎng),行業(yè)將逐漸形成標(biāo)準(zhǔn)化的推理算力服務(wù)模式,為企業(yè)提供便捷的算力獲取途徑。
  • 大模型推理將走向開(kāi)源:開(kāi)源大模型的推理部署將變得更加便捷,降低企業(yè)的推理算力使用門(mén)檻,推動(dòng)大模型應(yīng)用的廣泛落地。
  • 綠色推理算力將成為標(biāo)配:隨著雙碳目標(biāo)的推進(jìn),綠色推理算力將成為算力服務(wù)商的核心競(jìng)爭(zhēng)力之一。

對(duì)于算力服務(wù)商而言,抓住推理算力需求的新拐點(diǎn),提前布局推理算力基礎(chǔ)設(shè)施和技術(shù)方案,將在未來(lái)的市場(chǎng)競(jìng)爭(zhēng)中占據(jù)主動(dòng)地位。

本文轉(zhuǎn)自:并濟(jì)科技

內(nèi)容來(lái)源于科智咨詢、QuestMobile、中國(guó)IDC圈等公開(kāi)信息,

引用時(shí)請(qǐng)以最新官方版本為準(zhǔn);

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 算力
    +關(guān)注

    關(guān)注

    2

    文章

    1499

    瀏覽量

    16678
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3606

    瀏覽量

    5106
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    中國(guó)芯片的拐點(diǎn)時(shí)刻

    作者|Taylor出品|芯片技術(shù)與工藝當(dāng)OpenAI的GPT-5在得克薩斯州的機(jī)房中晝夜轟鳴,當(dāng)Nvdia的H200芯片被炒數(shù)十萬(wàn)美元仍一卡難求,中國(guó)的芯片產(chǎn)業(yè)正站在一個(gè)歷史性拐點(diǎn)
    的頭像 發(fā)表于 01-31 07:00 ?1332次閱讀
    中國(guó)<b class='flag-5'>算</b><b class='flag-5'>力</b>芯片的<b class='flag-5'>拐點(diǎn)</b>時(shí)刻

    AI正在以肉眼可見(jiàn)的速度不斷攀升

    模型訓(xùn)練到推理部署,單卡性能比拼到整機(jī)柜、整集群的系統(tǒng)能力競(jìng)爭(zhēng),AI 基礎(chǔ)設(shè)施的演進(jìn),早已不再只是“芯片性能”的問(wèn)題。
    的頭像 發(fā)表于 12-24 14:21 ?476次閱讀

    積木+3D堆疊!GPNPU架構(gòu)創(chuàng)新,應(yīng)對(duì)AI推理需求

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)2025年,人工智能正式邁入應(yīng)用推理時(shí)代。大模型從實(shí)驗(yàn)室走向千行百業(yè),推理需求呈指數(shù)級(jí)爆發(fā)。然而,高昂的推理
    的頭像 發(fā)表于 12-11 08:57 ?7734次閱讀

    國(guó)產(chǎn)AI芯片真能扛住“內(nèi)卷”?海思昇騰的這波操作藏了多少細(xì)節(jié)?

    反而壓到了310W。更有意思的是它的異構(gòu)架構(gòu):NPU+CPU+DVPP的組合,居然能同時(shí)扛住訓(xùn)練推理場(chǎng)景,之前做自動(dòng)駕駛算法時(shí),用它跑模型時(shí)延直接降了20%。 但疑惑也有:這種
    發(fā)表于 10-27 13:12

    需求狂飆下的“效率競(jìng)賽”,國(guó)產(chǎn)AI芯片有何破局之道?

    %,同比上升12.8個(gè)百分點(diǎn)。 10月15日,在2025灣芯展上,云天勵(lì)飛副總裁羅憶給現(xiàn)場(chǎng)聽(tīng)眾帶來(lái)《打造智時(shí)代的新質(zhì)生產(chǎn)》演講,他現(xiàn)場(chǎng)提出的兩大觀點(diǎn)引發(fā)大家的共鳴。他表示,目前國(guó)內(nèi)AI產(chǎn)業(yè)面臨兩大拐點(diǎn):一是
    的頭像 發(fā)表于 10-19 01:11 ?9712次閱讀
    <b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>需求</b>狂飆下的“效率競(jìng)賽”,國(guó)產(chǎn)AI芯片有何破局之道?

    與電力的終極博弈,填上了AIDC的“電力黑洞”

    ),專注于提供人工智能訓(xùn)練推理所需的服務(wù)、數(shù)據(jù)服務(wù)和算法服務(wù)。AIDC采用異構(gòu)計(jì)算架構(gòu),結(jié)合GPU、FPGA、ASIC等多種AI加速芯片,形成高并發(fā)分布式系統(tǒng),以滿足大
    的頭像 發(fā)表于 09-22 02:43 ?8078次閱讀

    科技上線赤兔推理引擎服務(wù),創(chuàng)新解鎖FP8大模型

    模型輕量化部署方案。用戶通過(guò)遠(yuǎn)程平臺(tái)預(yù)置的模型鏡像與AI工具,僅需50%的GPU即可解
    的頭像 發(fā)表于 07-30 21:44 ?851次閱讀

    模型推理顯存和計(jì)算量估計(jì)方法研究

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)大模型在各個(gè)領(lǐng)域得到了廣泛應(yīng)用。然而,大模型推理過(guò)程對(duì)顯存和計(jì)算資源的需求較高,給實(shí)際應(yīng)用帶來(lái)了挑戰(zhàn)。為了解決這一問(wèn)題,本文將探討大
    發(fā)表于 07-03 19:43

    AI新基建背后的中國(guó)芯力量——中微愛(ài)芯服務(wù)器芯片國(guó)產(chǎn)化替代全景解讀

    人工智能(AI)技術(shù)正以顛覆性力量重塑全球產(chǎn)業(yè)圖景,深度學(xué)習(xí)的復(fù)雜模型訓(xùn)練到生成式AI的實(shí)時(shí)推理,其背后是海量數(shù)據(jù)與指數(shù)級(jí)增長(zhǎng)的
    的頭像 發(fā)表于 06-20 13:55 ?1675次閱讀
    AI<b class='flag-5'>算</b><b class='flag-5'>力</b>新基建背后的中國(guó)芯力量——中微愛(ài)芯服務(wù)器芯片國(guó)產(chǎn)化替代全景解讀

    革命:RoCE實(shí)測(cè)推理時(shí)延比InfiniBand低30%的底層邏輯

    AI 訓(xùn)練推理中的網(wǎng)絡(luò)效率瓶頸,助力數(shù)據(jù)中心在高帶寬、低延遲、高可靠性的需求下實(shí)現(xiàn)資源的最優(yōu)配置。
    的頭像 發(fā)表于 05-28 14:08 ?2034次閱讀
    <b class='flag-5'>算</b><b class='flag-5'>力</b>革命:RoCE實(shí)測(cè)<b class='flag-5'>推理</b>時(shí)延比InfiniBand低30%的底層邏輯

    AI原生架構(gòu)升級(jí):RAKsmart服務(wù)器在超大規(guī)模模型訓(xùn)練中的突破

    近年來(lái),隨著千億級(jí)參數(shù)模型的崛起,AI訓(xùn)練對(duì)需求呈現(xiàn)指數(shù)級(jí)增長(zhǎng)。傳統(tǒng)服務(wù)器架構(gòu)在應(yīng)對(duì)分布式訓(xùn)練
    的頭像 發(fā)表于 04-24 09:27 ?735次閱讀

    芯片的生態(tài)突圍與革命

    據(jù)的爆發(fā)式增長(zhǎng),大芯片已成為科技競(jìng)爭(zhēng)的核心領(lǐng)域之一。 ? 大芯片的核心應(yīng)用場(chǎng)景豐富多樣。在人工智能訓(xùn)練
    的頭像 發(fā)表于 04-13 00:02 ?3100次閱讀

    智能最具潛力的行業(yè)領(lǐng)域

    智能最具潛力的行業(yè)領(lǐng)域 一、金融行業(yè) 智能風(fēng)控與精準(zhǔn)服務(wù)?:大型銀行通過(guò)集群(6.27萬(wàn)臺(tái)服務(wù)器)支撐AI模型
    的頭像 發(fā)表于 04-11 08:20 ?1309次閱讀
    智能<b class='flag-5'>算</b><b class='flag-5'>力</b>最具潛力的行業(yè)領(lǐng)域

    陣列云訓(xùn)練到推理

    在云場(chǎng)景下,陣列云(分布式計(jì)算集群)模型訓(xùn)練到推理的完整技術(shù)流程可結(jié)構(gòu)化分解如下: 一、訓(xùn)練階段技術(shù)實(shí)現(xiàn) 1,資源動(dòng)態(tài)編排? 基于Kube
    的頭像 發(fā)表于 03-28 08:32 ?601次閱讀

    DeepSeek推動(dòng)AI需求:800G光模塊的關(guān)鍵作用

    隨著人工智能技術(shù)的飛速發(fā)展,AI需求正以前所未有的速度增長(zhǎng)。DeepSeek等大模型訓(xùn)練推理
    發(fā)表于 03-25 12:00