chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI推理需求爆發(fā)!高通首秀重磅產(chǎn)品,國產(chǎn)GPU的自主牌怎么打?

章鷹觀察 ? 來源:電子發(fā)燒友原創(chuàng) ? 作者:章鷹 ? 2025-10-30 00:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

(電子發(fā)燒友網(wǎng)報道 文/章鷹)近日,Omdia半導體研究團隊高級顧問宋卓在2025年灣芯展論壇上表示,該研究團隊對2025年全球及國內(nèi)半導體市場保持樂觀,受到AI云服務(wù)相關(guān)硬件的持續(xù)投入推動影響,2025年全球半導體市場收入將達到7815億美元,預(yù)計同比2024年增長16.3%。

云天勵飛副總裁羅憶看好AI推理需求的增長,他指出國內(nèi)AI面臨兩大拐點:1、算力需求爆發(fā),大模型推理算力需求將在2026年超越訓練需求,成為算力消耗的主題,占據(jù)所有算力需求的比例將超過70%。2、國產(chǎn)算力芯片的使用比例不久將會超過海外芯片,目前兩者達到五五分。

圖1:AI推理需求爆發(fā)

10月29日,在安博會的2025智能算力應(yīng)用及產(chǎn)業(yè)發(fā)展論壇上,超聚變數(shù)字技術(shù)有限公司深圳解決方案總監(jiān)丁元釗表示,原來我們預(yù)計2026年是AI推理爆發(fā)元年,2025年DeepSeek-R1,V3模型推出,直接推動AI推理市場的上揚,未來3-5年都是AI推理領(lǐng)域的規(guī)模應(yīng)用階段。不管是行業(yè)應(yīng)用,還是算力相關(guān)的芯片,都將大規(guī)模的圍繞AI推理來爆發(fā)。

AI推理火爆主要的驅(qū)動力是什么?高通最新AI推理芯片,還有國內(nèi)AI推理芯片領(lǐng)域,沐曦科技、云天勵飛、百度昆侖芯片的最新進展如何?本文將詳細匯總和分析。

AI推理火爆背后驅(qū)動力:邊緣AI需求暴增,Token調(diào)用量攀升,成本可控成新趨勢

2025年以來,隨著大模型(如DeepSeek、ChatGPT等)在醫(yī)療、金融、政務(wù)、消費電子等場景廣泛部署,AI工作負載正從“訓練”轉(zhuǎn)向“推理”。2025年,全球推理任務(wù)占比預(yù)計達67%,2028年將提升至73%。

2025年被視為“AI Agent元年”,智能體從被動執(zhí)行轉(zhuǎn)向自主規(guī)劃與決策,單次任務(wù)消耗的Token量是傳統(tǒng)對話的100倍以上。大模型普及正驅(qū)動全球日均Token調(diào)用量飛速攀升,據(jù)統(tǒng)計,全球AI巨頭月消耗token量已經(jīng)來到千萬億量級,且仍在持續(xù)提升。Token調(diào)用量的攀升直接帶動了推理算力需求的指數(shù)級增長。據(jù)麥肯錫預(yù)測,全球AI推理市場將于2028年達到1500億美元,年復合增長率達40%,遠高于訓練市場的20%。

云天勵飛副總裁羅憶指出,Token數(shù)可能每年增長10倍,但是算力基礎(chǔ)設(shè)施投入上,基本是一倍增加,如何彌補中間的鴻溝?這就意味著需要更少的算力解決更多Token的推理。

高通發(fā)布兩款A(yù)I芯片,進軍數(shù)據(jù)中心AI推理市場

10月27日晚間,美國移動芯片巨頭高通宣布推出兩款數(shù)據(jù)中心人工智能芯片——AI200和AI250,兩款芯片對應(yīng)的AI推理優(yōu)化解決方案,可提供更高內(nèi)存容量和優(yōu)秀的AI推理優(yōu)化,預(yù)計分別于2026年和2027年商用。

英偉達主導數(shù)據(jù)中心GPU不同的是,高通選擇了一條差異化競爭策略:以機架級性能、高內(nèi)存實現(xiàn)快速的生成式AI推理為核心方向,強調(diào)其在能效、總擁有成本等方面的優(yōu)勢。

AI200 推出一款專用機架級 AI 推理解決方案,旨在為大型語言和多模態(tài)模型 (LLM、LMM) 推理及其他 AI 工作負載提供低總擁有成本 (TCO) 和優(yōu)化的性能。它支持每卡 768 GB LPDDR,可提供更高的內(nèi)存容量和更低的成本,從而為 AI 推理提供卓越的擴展性和靈活性。

AI250 解決方案將首次采用基于近內(nèi)存計算的創(chuàng)新內(nèi)存架構(gòu),通過提供超過 10 倍的有效內(nèi)存帶寬和更低的功耗,為 AI 推理工作負載帶來效率和性能的跨越式提升。

據(jù)悉,AI200 和 AI250 產(chǎn)品均采用直接液體冷卻技術(shù)進行冷卻,利用 PCIe 互連進行縱向擴展,利用以太網(wǎng)進行橫向擴展,并提供 160kW 的機架級功耗。高通沒有透露有關(guān)每個機架的芯片數(shù)量或機架將提供的計算性能的信息。

高通還透露,首批AI機架解決方案將于2026年起部署于中東客戶“HUMAIN”公司的數(shù)據(jù)中心。這被視為高通AI芯片商業(yè)化的重要里程碑。

沐曦C600登場,單卡算力和內(nèi)存超越H20

在最新沐曦科技披露的IPO文件看,2025年前3個月,沐曦來自訓推一體系列產(chǎn)品的收入占比高達97.87%。沐曦科技主要產(chǎn)品覆蓋AI計算、通用計算、圖形渲染三大領(lǐng)域,先后推出用于智算推理的曦思N系列GPU、用于訓推一體和通用計算的曦云C系列GPU,以及正在研發(fā)用于圖形渲染的曦彩G系列GPU。

2023年,沐曦推出首款訓推一體GPU芯片曦云C500,并在此基礎(chǔ)上推出了曦云C550;該系列基于國產(chǎn)供應(yīng)鏈的產(chǎn)品曦云C600已完成流片。

圖:曦云C600 圖片來自沐曦科技微信

以英偉達 H20為例,其核心優(yōu)勢在于大容量顯存、高速互連帶寬、多精度計算能力等。曦云C500系列產(chǎn)品的單卡算力已超過 H20,最新一代曦云 C600 系列產(chǎn)品的單卡算力亦領(lǐng)先于英偉達H20,并具備 FP8 計算單元,能夠支持多精度計算。同時,曦云 C600 系列產(chǎn)品配備了大容量顯存,超過 H20 的96GB 版本,可以有效承載更大規(guī)模數(shù)據(jù)與模型、減少數(shù)據(jù)交換的性能損耗、提升多任務(wù)并行執(zhí)行能力。

據(jù)悉,曦云C500系列產(chǎn)品的下游客戶以國家人工智能公共算力平臺、運營商智算平臺、商業(yè)化智算中心以及教科研、金融等行業(yè)客戶為主。

云天勵飛推出四款推理芯片,覆蓋邊緣到云的多種場景

云天勵飛在灣芯展展出了多款自研芯片——DeepEdge 10、DeepEdge 10C、DeepEdge 10 Max、DeepEdge 200,覆蓋從邊緣到云端的多種推理場景。

DeepEdge10芯片是云天勵飛自主研發(fā)的AI推理高性能芯片,采用國產(chǎn)14nm Chiplet工藝,并內(nèi)置國產(chǎn)RISC-V核。該系列芯片基于“算力積木”AI芯片架構(gòu),能夠封裝成不同算力的芯片,覆蓋8T至256T的算力應(yīng)用,可支持包括Transformer模型、BEV模型、CV大模型、LLM大模型等各類主流模型的高效推理,并已完成DeepSeek 系列模型以及國產(chǎn)鴻蒙操作系統(tǒng)的適配。

圖:云天勵飛四款A(yù)I推理芯片

公司還推出了更高階的 DeepEdge 200 芯片,面向更高并發(fā)和云端推理場景。該芯片采用 D2D Chiplet + C2C Mesh Torus 互連,可把多顆 Die 像積木一樣拼成 256 TOPS 的“單片”,這款芯片通過“算力積木”把 256 TOPS 級別的大算力塞進 35 W 功耗包絡(luò),同時保留橫向擴展和軟件棧兼容性,成為目前國產(chǎn) AI 推理芯片中少數(shù)能兼顧“邊緣高能效”與“云端高并發(fā)”的單芯片方案。

百度昆侖芯P800,部分性能與A100相當,中標中國移動采購大單

2025年2月20日,百度旗下的昆侖芯團隊正式發(fā)布了P800型號AI芯片,成為國產(chǎn)AI芯片領(lǐng)域的一次重大創(chuàng)新。此次發(fā)布的重要亮點在于,這款芯片首度支持單機部署DeepSeek V3/R1671B滿血版大模型。

昆侖芯P800的FP16算力為345TFLOPS,顯著高于英偉達H20的148TFLOPS,但低于英偉達A100的312TFLOPS。

推理性能:在運行DeepSeek-R1/V3滿血版671B模型時,昆侖芯P800單機8卡的量達到2437tokens/s,并發(fā)量達到256,比英偉達A100更快。在同樣負載情況下,P800的推理延遲比A100降低了18%。值得關(guān)注的是,昆侖芯P800在能耗方面比A100提高了約15%的功效比,在資源有限的環(huán)境中具有優(yōu)勢。

2025 年中國移動 AI 通用計算(推理型)集采,P800 拿下三個標包 70%-100% 份額,標志著其進入電信級規(guī)模采購。

本文由電子發(fā)燒友原創(chuàng),轉(zhuǎn)載請注明以上來源。微信號zy1052625525。需入群交流,請?zhí)砑游⑿舉lecfans999,投稿爆料采訪需求,請發(fā)郵箱zhangying@huaqiu.com。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    462

    文章

    53293

    瀏覽量

    455771
  • 高通
    +關(guān)注

    關(guān)注

    78

    文章

    7672

    瀏覽量

    198018
  • 云天勵飛
    +關(guān)注

    關(guān)注

    0

    文章

    166

    瀏覽量

    12558
  • 沐曦
    +關(guān)注

    關(guān)注

    0

    文章

    51

    瀏覽量

    1609
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    通挑戰(zhàn)英偉達,發(fā)布768GB內(nèi)存AI推理芯片,“出征”AI數(shù)據(jù)中心

    電子發(fā)燒友網(wǎng)報道(文/莫婷婷)隨著生成式AI應(yīng)用的爆發(fā)式增長,數(shù)據(jù)中心對高效、低成本、低功耗AI推理能力的需求急劇上升。
    的頭像 發(fā)表于 10-29 10:36 ?1514次閱讀
    <b class='flag-5'>高</b>通挑戰(zhàn)英偉達,發(fā)布768GB內(nèi)存<b class='flag-5'>AI</b><b class='flag-5'>推理</b>芯片,“出征”<b class='flag-5'>AI</b>數(shù)據(jù)中心

    通挑戰(zhàn)英偉達!發(fā)布768GB內(nèi)存AI推理芯片,“出征”AI數(shù)據(jù)中心

    電子發(fā)燒友網(wǎng)報道(文/莫婷婷)隨著生成式AI應(yīng)用的爆發(fā)式增長,數(shù)據(jù)中心對高效、低成本、低功耗AI推理能力的需求急劇上升。
    的頭像 發(fā)表于 10-29 09:14 ?5103次閱讀
    <b class='flag-5'>高</b>通挑戰(zhàn)英偉達!發(fā)布768GB內(nèi)存<b class='flag-5'>AI</b><b class='flag-5'>推理</b>芯片,“出征”<b class='flag-5'>AI</b>數(shù)據(jù)中心

    英偉達失守中國區(qū)!推理需求爆發(fā),國產(chǎn)GPU搶灘上市

    億元。而在此前,另一家國產(chǎn)GPU公司摩爾線程已于9月26日率先過會。這兩大GPU企業(yè)接連沖刺IPO,背后是中國AI算力需求
    的頭像 發(fā)表于 10-22 09:09 ?6641次閱讀
    英偉達失守中國區(qū)!<b class='flag-5'>推理</b><b class='flag-5'>需求</b><b class='flag-5'>爆發(fā)</b>,<b class='flag-5'>國產(chǎn)</b><b class='flag-5'>GPU</b>搶灘上市

    國產(chǎn)AI芯片真能扛住“算力內(nèi)卷”?海思昇騰的這波操作藏了多少細節(jié)?

    最近行業(yè)都在說“算力是AI的命門”,但國產(chǎn)芯片真的能接住這波需求嗎? 前陣子接觸到海思昇騰910B,實測下來有點超出預(yù)期——7nm工藝下算力直接拉到256 TFLOPS,比上一代提升了40%,但功耗
    發(fā)表于 10-27 13:12

    款全國產(chǎn)通用GPU芯片發(fā)布 沐曦集成推出曦云C600

    ,并支持MetaXLink超節(jié)點擴展技術(shù),在硬件性能和軟件兼容上完全滿足下一代生成式AI的訓練和推理需求。 而且,沐曦股份與中國科學院合作的國產(chǎn)千卡集群,已完成多個大模型全參數(shù)訓練,證
    的頭像 發(fā)表于 10-19 20:04 ?1.5w次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰(zhàn)

    與邊緣AI的不同特點: 邊緣推理的優(yōu)勢:可以提供數(shù)據(jù)處理速度和響應(yīng)速度,滿足實時需求;可以縮短網(wǎng)絡(luò)延遲,降低成本;可以提高安全性和隱私性,保護用戶數(shù)據(jù)。 前面說的都是好處,那面臨的困難有哪些呢
    發(fā)表于 09-12 16:07

    國產(chǎn)真自研高性能圖形 GPU 重磅發(fā)布:跑分超 RTX4060,暢玩《黑神話?悟空》

    電子發(fā)燒友網(wǎng)報道(文 / 吳子鵬)7 月 26 日,礪算科技在 “砥礪算芯 超越極限” 產(chǎn)品發(fā)布會上,重磅發(fā)布GPU 芯片 “7G100” 系列和
    發(fā)表于 07-26 21:45 ?5099次閱讀
    <b class='flag-5'>國產(chǎn)</b>真自研高性能圖形 <b class='flag-5'>GPU</b> <b class='flag-5'>重磅</b>發(fā)布:跑分超 RTX4060,暢玩《黑神話?悟空》

    信而泰×DeepSeek:AI推理引擎驅(qū)動網(wǎng)絡(luò)智能診斷邁向 “自愈”時代

    DeepSeek-R1:強大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司開發(fā)的新一代AI大模型。其核心優(yōu)勢在于強大的推理引擎能力,融合了自然語言處理(
    發(fā)表于 07-16 15:29

    谷歌第七代TPU Ironwood深度解讀:AI推理時代的硬件革命

    、架構(gòu)設(shè)計的顛覆性創(chuàng)新 ? 推理專用TPU ? Ironwood是谷歌TPU系列中款完全針對AI推理優(yōu)化的芯片,標志著
    的頭像 發(fā)表于 04-12 11:10 ?2468次閱讀
    谷歌第七代TPU Ironwood深度解讀:<b class='flag-5'>AI</b><b class='flag-5'>推理</b>時代的硬件革命

    國產(chǎn)推理服務(wù)器如何選擇?深度解析選型指南與華頡科技實戰(zhàn)案例

    人工智能技術(shù)的爆發(fā)催生了對推理算力的迫切需求,而進口服務(wù)器的成本與技術(shù)依賴性,推動了國產(chǎn)推理
    的頭像 發(fā)表于 03-24 17:11 ?819次閱讀
    <b class='flag-5'>國產(chǎn)</b><b class='flag-5'>推理</b>服務(wù)器如何選擇?深度解析選型指南與華頡科技實戰(zhàn)案例

    摩爾線程GPU原生FP8計算助力AI訓練

    并行訓練和推理,顯著提升了訓練效率與穩(wěn)定性。摩爾線程是國內(nèi)率先原生支持FP8計算精度的國產(chǎn)GPU企業(yè),此次開源不僅為AI訓練和推理提供了全新
    的頭像 發(fā)表于 03-17 17:05 ?1075次閱讀
    摩爾線程<b class='flag-5'>GPU</b>原生FP8計算助力<b class='flag-5'>AI</b>訓練

    無法調(diào)用GPU插件推理的遠程張量API怎么解決?

    運行了使用 GPU 插件的遠程張量 API 的推理。但是,它未能共享 OpenCL* 內(nèi)存,但結(jié)果不正確。
    發(fā)表于 03-06 06:13

    壁仞科技支持DeepSeek-V3滿血版訓練推理

    DeepSeek-V3滿血版在國產(chǎn)GPU平臺的高效全棧式訓練與推理,實現(xiàn)國產(chǎn)大模型與國產(chǎn)GPU
    的頭像 發(fā)表于 03-04 14:01 ?1771次閱讀

    當我問DeepSeek AI爆發(fā)時代的FPGA是否重要?答案是......

    ,以減少數(shù)據(jù)傳輸?shù)皆贫说?b class='flag-5'>需求,降低延遲和帶寬消耗。FPGA在邊緣計算中表現(xiàn)優(yōu)異,能夠為嵌入式設(shè)備提供高效的AI推理能力。 ? 實時應(yīng)用:在自動駕駛、工業(yè)自動化等需要實時數(shù)據(jù)處理的場景中,F(xiàn)PGA的低
    發(fā)表于 02-19 13:55

    AI 新品 超云重磅亮相 2024 英特爾新質(zhì)生產(chǎn)力技術(shù)生態(tài)大會

    數(shù)字經(jīng)濟如何促進生產(chǎn)力的革新與發(fā)展。 超云作為英特爾鈦金級合作伙伴受邀參會,并攜多款AI新品在大會展區(qū)重磅亮相,其中,備受矚目的超云全新?AI?產(chǎn)品?R8628 G13?更是在此次大會
    的頭像 發(fā)表于 11-29 15:14 ?938次閱讀
    <b class='flag-5'>AI</b> 新品<b class='flag-5'>首</b><b class='flag-5'>秀</b> 超云<b class='flag-5'>重磅</b>亮相 2024 英特爾新質(zhì)生產(chǎn)力技術(shù)生態(tài)大會