chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI推理需求爆發(fā)!高通首秀重磅產(chǎn)品,國(guó)產(chǎn)GPU的自主牌怎么打?

章鷹觀察 ? 來(lái)源:電子發(fā)燒友原創(chuàng) ? 作者:章鷹 ? 2025-10-30 00:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

(電子發(fā)燒友網(wǎng)報(bào)道 文/章鷹)近日,Omdia半導(dǎo)體研究團(tuán)隊(duì)高級(jí)顧問(wèn)宋卓在2025年灣芯展論壇上表示,該研究團(tuán)隊(duì)對(duì)2025年全球及國(guó)內(nèi)半導(dǎo)體市場(chǎng)保持樂(lè)觀,受到AI云服務(wù)相關(guān)硬件的持續(xù)投入推動(dòng)影響,2025年全球半導(dǎo)體市場(chǎng)收入將達(dá)到7815億美元,預(yù)計(jì)同比2024年增長(zhǎng)16.3%。

云天勵(lì)飛副總裁羅憶看好AI推理需求的增長(zhǎng),他指出國(guó)內(nèi)AI面臨兩大拐點(diǎn):1、算力需求爆發(fā),大模型推理算力需求將在2026年超越訓(xùn)練需求,成為算力消耗的主題,占據(jù)所有算力需求的比例將超過(guò)70%。2、國(guó)產(chǎn)算力芯片的使用比例不久將會(huì)超過(guò)海外芯片,目前兩者達(dá)到五五分。

圖1:AI推理需求爆發(fā)

10月29日,在安博會(huì)的2025智能算力應(yīng)用及產(chǎn)業(yè)發(fā)展論壇上,超聚變數(shù)字技術(shù)有限公司深圳解決方案總監(jiān)丁元釗表示,原來(lái)我們預(yù)計(jì)2026年是AI推理爆發(fā)元年,2025年DeepSeek-R1,V3模型推出,直接推動(dòng)AI推理市場(chǎng)的上揚(yáng),未來(lái)3-5年都是AI推理領(lǐng)域的規(guī)模應(yīng)用階段。不管是行業(yè)應(yīng)用,還是算力相關(guān)的芯片,都將大規(guī)模的圍繞AI推理來(lái)爆發(fā)。

AI推理火爆主要的驅(qū)動(dòng)力是什么?高通最新AI推理芯片,還有國(guó)內(nèi)AI推理芯片領(lǐng)域,沐曦科技、云天勵(lì)飛、百度昆侖芯片的最新進(jìn)展如何?本文將詳細(xì)匯總和分析。

AI推理火爆背后驅(qū)動(dòng)力:邊緣AI需求暴增,Token調(diào)用量攀升,成本可控成新趨勢(shì)

2025年以來(lái),隨著大模型(如DeepSeek、ChatGPT等)在醫(yī)療、金融、政務(wù)、消費(fèi)電子等場(chǎng)景廣泛部署,AI工作負(fù)載正從“訓(xùn)練”轉(zhuǎn)向“推理”。2025年,全球推理任務(wù)占比預(yù)計(jì)達(dá)67%,2028年將提升至73%。

2025年被視為“AI Agent元年”,智能體從被動(dòng)執(zhí)行轉(zhuǎn)向自主規(guī)劃與決策,單次任務(wù)消耗的Token量是傳統(tǒng)對(duì)話的100倍以上。大模型普及正驅(qū)動(dòng)全球日均Token調(diào)用量飛速攀升,據(jù)統(tǒng)計(jì),全球AI巨頭月消耗token量已經(jīng)來(lái)到千萬(wàn)億量級(jí),且仍在持續(xù)提升。Token調(diào)用量的攀升直接帶動(dòng)了推理算力需求的指數(shù)級(jí)增長(zhǎng)。據(jù)麥肯錫預(yù)測(cè),全球AI推理市場(chǎng)將于2028年達(dá)到1500億美元,年復(fù)合增長(zhǎng)率達(dá)40%,遠(yuǎn)高于訓(xùn)練市場(chǎng)的20%。

云天勵(lì)飛副總裁羅憶指出,Token數(shù)可能每年增長(zhǎng)10倍,但是算力基礎(chǔ)設(shè)施投入上,基本是一倍增加,如何彌補(bǔ)中間的鴻溝?這就意味著需要更少的算力解決更多Token的推理。

高通發(fā)布兩款A(yù)I芯片,進(jìn)軍數(shù)據(jù)中心AI推理市場(chǎng)

10月27日晚間,美國(guó)移動(dòng)芯片巨頭高通宣布推出兩款數(shù)據(jù)中心人工智能芯片——AI200和AI250,兩款芯片對(duì)應(yīng)的AI推理優(yōu)化解決方案,可提供更高內(nèi)存容量和優(yōu)秀的AI推理優(yōu)化,預(yù)計(jì)分別于2026年和2027年商用。

英偉達(dá)主導(dǎo)數(shù)據(jù)中心GPU不同的是,高通選擇了一條差異化競(jìng)爭(zhēng)策略:以機(jī)架級(jí)性能、高內(nèi)存實(shí)現(xiàn)快速的生成式AI推理為核心方向,強(qiáng)調(diào)其在能效、總擁有成本等方面的優(yōu)勢(shì)。

AI200 推出一款專用機(jī)架級(jí) AI 推理解決方案,旨在為大型語(yǔ)言和多模態(tài)模型 (LLM、LMM) 推理及其他 AI 工作負(fù)載提供低總擁有成本 (TCO) 和優(yōu)化的性能。它支持每卡 768 GB LPDDR,可提供更高的內(nèi)存容量和更低的成本,從而為 AI 推理提供卓越的擴(kuò)展性和靈活性。

AI250 解決方案將首次采用基于近內(nèi)存計(jì)算的創(chuàng)新內(nèi)存架構(gòu),通過(guò)提供超過(guò) 10 倍的有效內(nèi)存帶寬和更低的功耗,為 AI 推理工作負(fù)載帶來(lái)效率和性能的跨越式提升。

據(jù)悉,AI200 和 AI250 產(chǎn)品均采用直接液體冷卻技術(shù)進(jìn)行冷卻,利用 PCIe 互連進(jìn)行縱向擴(kuò)展,利用以太網(wǎng)進(jìn)行橫向擴(kuò)展,并提供 160kW 的機(jī)架級(jí)功耗。高通沒(méi)有透露有關(guān)每個(gè)機(jī)架的芯片數(shù)量或機(jī)架將提供的計(jì)算性能的信息。

高通還透露,首批AI機(jī)架解決方案將于2026年起部署于中東客戶“HUMAIN”公司的數(shù)據(jù)中心。這被視為高通AI芯片商業(yè)化的重要里程碑。

沐曦C600登場(chǎng),單卡算力和內(nèi)存超越H20

在最新沐曦科技披露的IPO文件看,2025年前3個(gè)月,沐曦來(lái)自訓(xùn)推一體系列產(chǎn)品的收入占比高達(dá)97.87%。沐曦科技主要產(chǎn)品覆蓋AI計(jì)算、通用計(jì)算、圖形渲染三大領(lǐng)域,先后推出用于智算推理的曦思N系列GPU、用于訓(xùn)推一體和通用計(jì)算的曦云C系列GPU,以及正在研發(fā)用于圖形渲染的曦彩G系列GPU。

2023年,沐曦推出首款訓(xùn)推一體GPU芯片曦云C500,并在此基礎(chǔ)上推出了曦云C550;該系列基于國(guó)產(chǎn)供應(yīng)鏈的產(chǎn)品曦云C600已完成流片。

圖:曦云C600 圖片來(lái)自沐曦科技微信

以英偉達(dá) H20為例,其核心優(yōu)勢(shì)在于大容量顯存、高速互連帶寬、多精度計(jì)算能力等。曦云C500系列產(chǎn)品的單卡算力已超過(guò) H20,最新一代曦云 C600 系列產(chǎn)品的單卡算力亦領(lǐng)先于英偉達(dá)H20,并具備 FP8 計(jì)算單元,能夠支持多精度計(jì)算。同時(shí),曦云 C600 系列產(chǎn)品配備了大容量顯存,超過(guò) H20 的96GB 版本,可以有效承載更大規(guī)模數(shù)據(jù)與模型、減少數(shù)據(jù)交換的性能損耗、提升多任務(wù)并行執(zhí)行能力。

據(jù)悉,曦云C500系列產(chǎn)品的下游客戶以國(guó)家人工智能公共算力平臺(tái)、運(yùn)營(yíng)商智算平臺(tái)、商業(yè)化智算中心以及教科研、金融等行業(yè)客戶為主。

云天勵(lì)飛推出四款推理芯片,覆蓋邊緣到云的多種場(chǎng)景

云天勵(lì)飛在灣芯展展出了多款自研芯片——DeepEdge 10、DeepEdge 10C、DeepEdge 10 Max、DeepEdge 200,覆蓋從邊緣到云端的多種推理場(chǎng)景。

DeepEdge10芯片是云天勵(lì)飛自主研發(fā)的AI推理高性能芯片,采用國(guó)產(chǎn)14nm Chiplet工藝,并內(nèi)置國(guó)產(chǎn)RISC-V核。該系列芯片基于“算力積木”AI芯片架構(gòu),能夠封裝成不同算力的芯片,覆蓋8T至256T的算力應(yīng)用,可支持包括Transformer模型、BEV模型、CV大模型、LLM大模型等各類主流模型的高效推理,并已完成DeepSeek 系列模型以及國(guó)產(chǎn)鴻蒙操作系統(tǒng)的適配。

圖:云天勵(lì)飛四款A(yù)I推理芯片

公司還推出了更高階的 DeepEdge 200 芯片,面向更高并發(fā)和云端推理場(chǎng)景。該芯片采用 D2D Chiplet + C2C Mesh Torus 互連,可把多顆 Die 像積木一樣拼成 256 TOPS 的“單片”,這款芯片通過(guò)“算力積木”把 256 TOPS 級(jí)別的大算力塞進(jìn) 35 W 功耗包絡(luò),同時(shí)保留橫向擴(kuò)展和軟件棧兼容性,成為目前國(guó)產(chǎn) AI 推理芯片中少數(shù)能兼顧“邊緣高能效”與“云端高并發(fā)”的單芯片方案。

百度昆侖芯P800,部分性能與A100相當(dāng),中標(biāo)中國(guó)移動(dòng)采購(gòu)大單

2025年2月20日,百度旗下的昆侖芯團(tuán)隊(duì)正式發(fā)布了P800型號(hào)AI芯片,成為國(guó)產(chǎn)AI芯片領(lǐng)域的一次重大創(chuàng)新。此次發(fā)布的重要亮點(diǎn)在于,這款芯片首度支持單機(jī)部署DeepSeek V3/R1671B滿血版大模型。

推理性能:在運(yùn)行DeepSeek-R1/V3滿血版671B模型時(shí),昆侖芯P800單機(jī)8卡的量達(dá)到2437tokens/s,并發(fā)量達(dá)到256,比英偉達(dá)A100更快。在同樣負(fù)載情況下,P800的推理延遲比A100降低了18%。值得關(guān)注的是,昆侖芯P800在能耗方面比A100提高了約15%的功效比,在資源有限的環(huán)境中具有優(yōu)勢(shì)。

2025 年中國(guó)移動(dòng) AI 通用計(jì)算(推理型)集采,P800 拿下三個(gè)標(biāo)包 70%-100% 份額,標(biāo)志著其進(jìn)入電信級(jí)規(guī)模采購(gòu)。

本文由電子發(fā)燒友原創(chuàng),轉(zhuǎn)載請(qǐng)注明以上來(lái)源。微信號(hào)zy1052625525。需入群交流,請(qǐng)?zhí)砑游⑿舉lecfans999,投稿爆料采訪需求,請(qǐng)發(fā)郵箱zhangying@huaqiu.com。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    462

    文章

    53582

    瀏覽量

    459754
  • 高通
    +關(guān)注

    關(guān)注

    78

    文章

    7687

    瀏覽量

    198753
  • 云天勵(lì)飛
    +關(guān)注

    關(guān)注

    0

    文章

    173

    瀏覽量

    12583
  • 沐曦
    +關(guān)注

    關(guān)注

    1

    文章

    56

    瀏覽量

    1662
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    通挑戰(zhàn)英偉達(dá),發(fā)布768GB內(nèi)存AI推理芯片,“出征”AI數(shù)據(jù)中心

    電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)隨著生成式AI應(yīng)用的爆發(fā)式增長(zhǎng),數(shù)據(jù)中心對(duì)高效、低成本、低功耗AI推理能力的需求急劇上升。
    的頭像 發(fā)表于 10-29 10:36 ?3168次閱讀
    <b class='flag-5'>高</b>通挑戰(zhàn)英偉達(dá),發(fā)布768GB內(nèi)存<b class='flag-5'>AI</b><b class='flag-5'>推理</b>芯片,“出征”<b class='flag-5'>AI</b>數(shù)據(jù)中心

    通挑戰(zhàn)英偉達(dá)!發(fā)布768GB內(nèi)存AI推理芯片,“出征”AI數(shù)據(jù)中心

    電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)隨著生成式AI應(yīng)用的爆發(fā)式增長(zhǎng),數(shù)據(jù)中心對(duì)高效、低成本、低功耗AI推理能力的需求急劇上升。
    的頭像 發(fā)表于 10-29 09:14 ?6094次閱讀
    <b class='flag-5'>高</b>通挑戰(zhàn)英偉達(dá)!發(fā)布768GB內(nèi)存<b class='flag-5'>AI</b><b class='flag-5'>推理</b>芯片,“出征”<b class='flag-5'>AI</b>數(shù)據(jù)中心

    英偉達(dá)失守中國(guó)區(qū)!推理需求爆發(fā),國(guó)產(chǎn)GPU搶灘上市

    億元。而在此前,另一家國(guó)產(chǎn)GPU公司摩爾線程已于9月26日率先過(guò)會(huì)。這兩大GPU企業(yè)接連沖刺IPO,背后是中國(guó)AI算力需求
    的頭像 發(fā)表于 10-22 09:09 ?7522次閱讀
    英偉達(dá)失守中國(guó)區(qū)!<b class='flag-5'>推理</b><b class='flag-5'>需求</b><b class='flag-5'>爆發(fā)</b>,<b class='flag-5'>國(guó)產(chǎn)</b><b class='flag-5'>GPU</b>搶灘上市

    算力積木+3D堆疊!GPNPU架構(gòu)創(chuàng)新,應(yīng)對(duì)AI推理需求

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)2025年,人工智能正式邁入應(yīng)用推理時(shí)代。大模型從實(shí)驗(yàn)室走向千行百業(yè),推理需求呈指數(shù)級(jí)爆發(fā)。然而,高昂的推理
    的頭像 發(fā)表于 12-11 08:57 ?6913次閱讀

    華為數(shù)據(jù)存儲(chǔ)與「DaoCloud 道客」發(fā)布AI推理加速聯(lián)合解決方案

    AI產(chǎn)業(yè)已從“追求模型能力極限”轉(zhuǎn)向“追求推理體驗(yàn)最優(yōu)化”,推理體驗(yàn)決定用戶與AI的交互質(zhì)感。當(dāng)前推理應(yīng)用快速發(fā)展,Token調(diào)用量
    的頭像 發(fā)表于 11-28 10:03 ?203次閱讀
    華為數(shù)據(jù)存儲(chǔ)與「DaoCloud 道客」發(fā)布<b class='flag-5'>AI</b><b class='flag-5'>推理</b>加速聯(lián)合解決方案

    國(guó)產(chǎn)AI芯片真能扛住“算力內(nèi)卷”?海思昇騰的這波操作藏了多少細(xì)節(jié)?

    最近行業(yè)都在說(shuō)“算力是AI的命門”,但國(guó)產(chǎn)芯片真的能接住這波需求嗎? 前陣子接觸到海思昇騰910B,實(shí)測(cè)下來(lái)有點(diǎn)超出預(yù)期——7nm工藝下算力直接拉到256 TFLOPS,比上一代提升了40%,但功耗
    發(fā)表于 10-27 13:12

    款全國(guó)產(chǎn)通用GPU芯片發(fā)布 沐曦集成推出曦云C600

    ,并支持MetaXLink超節(jié)點(diǎn)擴(kuò)展技術(shù),在硬件性能和軟件兼容上完全滿足下一代生成式AI的訓(xùn)練和推理需求。 而且,沐曦股份與中國(guó)科學(xué)院合作的國(guó)產(chǎn)千卡集群,已完成多個(gè)大模型全參數(shù)訓(xùn)練,證
    的頭像 發(fā)表于 10-19 20:04 ?4.5w次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片的需求和挑戰(zhàn)

    與邊緣AI的不同特點(diǎn): 邊緣推理的優(yōu)勢(shì):可以提供數(shù)據(jù)處理速度和響應(yīng)速度,滿足實(shí)時(shí)需求;可以縮短網(wǎng)絡(luò)延遲,降低成本;可以提高安全性和隱私性,保護(hù)用戶數(shù)據(jù)。 前面說(shuō)的都是好處,那面臨的困難有哪些呢
    發(fā)表于 09-12 16:07

    國(guó)產(chǎn)真自研高性能圖形 GPU 重磅發(fā)布:跑分超 RTX4060,暢玩《黑神話?悟空》

    電子發(fā)燒友網(wǎng)報(bào)道(文 / 吳子鵬)7 月 26 日,礪算科技在 “砥礪算芯 超越極限” 產(chǎn)品發(fā)布會(huì)上,重磅發(fā)布GPU 芯片 “7G100” 系列和
    發(fā)表于 07-26 21:45 ?5702次閱讀
    <b class='flag-5'>國(guó)產(chǎn)</b>真自研高性能圖形 <b class='flag-5'>GPU</b> <b class='flag-5'>重磅</b>發(fā)布:跑分超 RTX4060,暢玩《黑神話?悟空》

    信而泰×DeepSeek:AI推理引擎驅(qū)動(dòng)網(wǎng)絡(luò)智能診斷邁向 “自愈”時(shí)代

    DeepSeek-R1:強(qiáng)大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司開(kāi)發(fā)的新一代AI大模型。其核心優(yōu)勢(shì)在于強(qiáng)大的推理引擎能力,融合了自然語(yǔ)言處理(
    發(fā)表于 07-16 15:29

    國(guó)產(chǎn)推理服務(wù)器如何選擇?深度解析選型指南與華頡科技實(shí)戰(zhàn)案例

    人工智能技術(shù)的爆發(fā)催生了對(duì)推理算力的迫切需求,而進(jìn)口服務(wù)器的成本與技術(shù)依賴性,推動(dòng)了國(guó)產(chǎn)推理
    的頭像 發(fā)表于 03-24 17:11 ?957次閱讀
    <b class='flag-5'>國(guó)產(chǎn)</b><b class='flag-5'>推理</b>服務(wù)器如何選擇?深度解析選型指南與華頡科技實(shí)戰(zhàn)案例

    摩爾線程GPU原生FP8計(jì)算助力AI訓(xùn)練

    并行訓(xùn)練和推理,顯著提升了訓(xùn)練效率與穩(wěn)定性。摩爾線程是國(guó)內(nèi)率先原生支持FP8計(jì)算精度的國(guó)產(chǎn)GPU企業(yè),此次開(kāi)源不僅為AI訓(xùn)練和推理提供了全新
    的頭像 發(fā)表于 03-17 17:05 ?1248次閱讀
    摩爾線程<b class='flag-5'>GPU</b>原生FP8計(jì)算助力<b class='flag-5'>AI</b>訓(xùn)練

    無(wú)法調(diào)用GPU插件推理的遠(yuǎn)程張量API怎么解決?

    運(yùn)行了使用 GPU 插件的遠(yuǎn)程張量 API 的推理。但是,它未能共享 OpenCL* 內(nèi)存,但結(jié)果不正確。
    發(fā)表于 03-06 06:13

    壁仞科技支持DeepSeek-V3滿血版訓(xùn)練推理

    DeepSeek-V3滿血版在國(guó)產(chǎn)GPU平臺(tái)的高效全棧式訓(xùn)練與推理,實(shí)現(xiàn)國(guó)產(chǎn)大模型與國(guó)產(chǎn)GPU
    的頭像 發(fā)表于 03-04 14:01 ?1945次閱讀

    當(dāng)我問(wèn)DeepSeek AI爆發(fā)時(shí)代的FPGA是否重要?答案是......

    ,以減少數(shù)據(jù)傳輸?shù)皆贫说?b class='flag-5'>需求,降低延遲和帶寬消耗。FPGA在邊緣計(jì)算中表現(xiàn)優(yōu)異,能夠?yàn)榍度胧皆O(shè)備提供高效的AI推理能力。 ? 實(shí)時(shí)應(yīng)用:在自動(dòng)駕駛、工業(yè)自動(dòng)化等需要實(shí)時(shí)數(shù)據(jù)處理的場(chǎng)景中,F(xiàn)PGA的低
    發(fā)表于 02-19 13:55