chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

ASIC爆火!大廠(chǎng)AI訓(xùn)練推理拋棄GPU;博通的護(hù)城河有多深?

Hobby觀(guān)察 ? 來(lái)源:電子發(fā)燒友 ? 作者:梁浩斌 ? 2024-12-18 01:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)在上周末,博通應(yīng)該可以說(shuō)是投資圈和科技圈最火爆的話(huà)題,大家紛紛驚呼“英偉達(dá)的對(duì)手終于出現(xiàn)了!”“ASIC要超越GPU”云云。

這一切都要源于上周五博通公布的炸裂財(cái)報(bào),AI業(yè)務(wù)營(yíng)收同比暴增220%,當(dāng)天公司股價(jià)大漲24.43%,市值突破萬(wàn)億美元,成為第九家市值突破萬(wàn)億美元的美股上市公司,全球第三家市值超萬(wàn)億美元的半導(dǎo)體公司。

當(dāng)然,更重要的是對(duì)未來(lái)的預(yù)期,博通在數(shù)據(jù)中心高速互連領(lǐng)域有非常大的市場(chǎng)份額,這代表著AI基礎(chǔ)設(shè)施的規(guī)模增長(zhǎng),博通的部分增長(zhǎng)也確實(shí)來(lái)自以太網(wǎng)網(wǎng)絡(luò)部件。但除了高速互連之外,博通還正在與一些大型云服務(wù)供應(yīng)商合作,幫助他們開(kāi)發(fā)定制AI芯片,這部分業(yè)務(wù)的增長(zhǎng)迅速,將會(huì)令博通成為英偉達(dá)的最大挑戰(zhàn)者。

博通的AI芯片布局

博通的傳統(tǒng)優(yōu)勢(shì)是在高速互連方面,比如數(shù)據(jù)中心的以太網(wǎng)傳輸中用到的高速光模塊產(chǎn)品組合,還有在高速互連中使用到的高速SerDes內(nèi)核IP等。而目前博通在A(yíng)I芯片領(lǐng)域,主要也是提供ASIC解決方案,提供設(shè)計(jì)、廣泛IP組合、先進(jìn)封裝等方案,集成了內(nèi)存、高速SerDes、PCIe接口等IP,以及Arm/Power PC等CPU內(nèi)核。

ASIC即專(zhuān)用集成電路,顧名思義,與英偉達(dá)提供的通用GPU不同,ASIC是專(zhuān)門(mén)針對(duì)某種場(chǎng)景或應(yīng)用設(shè)計(jì),目前不少云計(jì)算巨頭都在使用定制的ASIC作為數(shù)據(jù)中心的核心芯片。作為一種專(zhuān)用芯片,在設(shè)計(jì)之初就是為了滿(mǎn)足特定的任務(wù)和算法需求,因此在針對(duì)算法開(kāi)發(fā)的情況下,計(jì)算效率和能效比都能夠相比通用GPU大幅提高。

比如谷歌去年推出的TPU v5e專(zhuān)為提升中大型模型的訓(xùn)練、推理等任務(wù)設(shè)計(jì),相比上一代的TPU v4訓(xùn)練性能提高2倍,推理性能提高2.5倍,但成本只有上一代的一半不到,大幅提升了計(jì)算效率以及成本效益。

對(duì)于云計(jì)算巨頭而言,為了降低對(duì)英偉達(dá)的依賴(lài),同時(shí)也為了降低成本,選擇定制ASIC都會(huì)是一個(gè)比較確定的方向。除了谷歌之外,亞馬遜、華為、阿里、百度等云計(jì)算巨頭都已經(jīng)有自研數(shù)據(jù)中心ASIC產(chǎn)品,并已經(jīng)投入使用。

而博通目前依靠在高速互連方面的關(guān)鍵技術(shù),在對(duì)互連速率要求極高的AI計(jì)算領(lǐng)域就極具優(yōu)勢(shì)。早在2020年,博通推出了公司首款采用臺(tái)積電N5工藝的數(shù)據(jù)中心ASIC,集成了PCIe Gen5協(xié)議、112 Gbps SerDes、運(yùn)行頻率為3.6 Gbps、集成HBM2e,利用TSMC CoWoS Interposer封裝技術(shù)實(shí)現(xiàn)3.6 Tbps Die2Die PHY IP,幾乎將先進(jìn)的高速互連技術(shù)堆滿(mǎn)。

最近博通還推出了3.5D XDSiP封裝平臺(tái),可以將超過(guò)6000平方毫米的3D堆疊硅晶片和12個(gè)HBM模塊集成到一個(gè)系統(tǒng)級(jí)封裝中,同時(shí)大幅提升片內(nèi)互連的性能。

與傳統(tǒng)采用硅通孔TVS的F2B(面到背)的技術(shù)相比,3.5D XDSiP采用HCB(混合銅鍵合)以F2F(面對(duì)面)的方式將邏輯芯片堆疊,堆疊芯片之間的信號(hào)密度提高了7倍;3.5D XDSiP通過(guò)利用3D HCB代替平面芯片到芯片物理接口,芯片到芯片接口的功耗降低了90%,還能最大限度地減少3D堆棧中計(jì)算、內(nèi)存和I/O組件之間的延遲。

據(jù)稱(chēng)博通的3.5D XDSiP目前已經(jīng)被主要的AI領(lǐng)域客戶(hù)使用,已經(jīng)有6款產(chǎn)品正在開(kāi)發(fā)中,博通預(yù)計(jì)最早在2026年2月實(shí)現(xiàn)出貨。其中富士通下一代2nm制程的Arm處理器FUJITSU-MONAKA已經(jīng)確認(rèn)使用博通3.5D XDSiP技術(shù),這款處理器面向數(shù)據(jù)中心、邊緣計(jì)算等應(yīng)用,據(jù)此前富士通的介紹,MONAKA每顆CPU包含一個(gè)中央的I/O die和四個(gè)3D垂直堆疊die,并集成SRAM,預(yù)計(jì)2027年出貨。

今年9月,博通還展示了一種帶有光學(xué)模塊的AI計(jì)算ASIC,實(shí)現(xiàn)片間光互連。博通在制造中使用了FOWLP封裝技術(shù),將CPO模塊與AI ASIC封裝在一起,大幅降低了系統(tǒng)延遲,還實(shí)現(xiàn)了可插拔的激光器設(shè)計(jì),便于數(shù)據(jù)中心維護(hù)。

目前來(lái)看,在A(yíng)I計(jì)算中極為重要的互連技術(shù)上,博通擁有很強(qiáng)大的技術(shù)積累,這也為其ASIC定制服務(wù)建立了穩(wěn)固的壁壘。從客戶(hù)群來(lái)看,博通在財(cái)報(bào)中透露,目前正在與三家非常大型的云計(jì)算客戶(hù)開(kāi)發(fā)AI芯片,并預(yù)計(jì)到2027年,每個(gè)客戶(hù)都將在網(wǎng)絡(luò)集群中部署100萬(wàn)個(gè)AI芯片,屆時(shí)市場(chǎng)對(duì)定制AI ASIC的需求容量將高達(dá)600億-900億美元。

ASIC跑AI,大廠(chǎng)的專(zhuān)屬玩物

最近大廠(chǎng)開(kāi)發(fā)ASIC的消息頻出,在博通公布財(cái)報(bào)的前一天,就傳出蘋(píng)果與博通合作,開(kāi)發(fā)面向AI推理的ASIC芯片,將采用臺(tái)積電N3P工藝,計(jì)劃在2026年投入生產(chǎn)。而亞馬遜也在月初公布了AI芯片Trn2UltraServer和Amazon EC2Trn2的應(yīng)用實(shí)例,展示出ASIC的應(yīng)用性?xún)r(jià)比遠(yuǎn)超GPU。

但可能大家也發(fā)現(xiàn),目前定制開(kāi)發(fā)高算力ASIC的廠(chǎng)商,無(wú)一例外是云計(jì)算大廠(chǎng),本身公司業(yè)務(wù)就有極大規(guī)模的算力需求。這是由于A(yíng)SIC的定制費(fèi)用較高,需要有足夠龐大的規(guī)模才能分?jǐn)偳捌诙ㄖ崎_(kāi)發(fā)費(fèi)用。

ASIC定制費(fèi)用,主要是開(kāi)發(fā)過(guò)程中的一次性工程費(fèi)用,也被業(yè)內(nèi)稱(chēng)為NRE(Non-Recurring Engineering)。顧名思義,NRE費(fèi)用只需要支出一次,后續(xù)規(guī)模生產(chǎn)中不需要再增加這部分費(fèi)用。

NRE費(fèi)用中,包含芯片設(shè)計(jì)的成本,比如研發(fā)人員薪酬、EDA工具授權(quán)費(fèi)等,這與芯片使用的制程工藝、芯片本身的復(fù)雜程度相關(guān);然后是版圖設(shè)計(jì)成本,其實(shí)這里的概念跟芯片設(shè)計(jì)的成本類(lèi)似,主要是涉及芯片的物理布局設(shè)計(jì),需要特定的研發(fā)人員和軟件支持;再是IP授權(quán)費(fèi)用,一般是一些通用的IP,比如CPU IP、內(nèi)存控制器、接口IP等。

以定制一款采用5nm制程的ASIC為例,NRE費(fèi)用可以高達(dá)1億至2億美元。然而一旦能夠大規(guī)模出貨,NRE費(fèi)用就可以很大程度上被攤薄。

博通也提到,未來(lái)每個(gè)客戶(hù)將在網(wǎng)絡(luò)集群中部署100萬(wàn)片AI芯片,即使其中只有30萬(wàn)片是定制的ASIC,那么分?jǐn)偟矫恳黄酒系腘RE費(fèi)用就大約只要300-600美元,相比GPU的成本有明顯的優(yōu)勢(shì)。而據(jù)業(yè)內(nèi)人士分析,中等復(fù)雜程度的ASIC盈虧平衡點(diǎn)在10萬(wàn)片左右。

小結(jié):

盡管目前英偉達(dá)GPU在A(yíng)I訓(xùn)練、推理的應(yīng)用中還是處于一家獨(dú)大的地位,但ASIC的成本效益,讓各大大模型廠(chǎng)商不得不開(kāi)始考慮轉(zhuǎn)向ASIC。加上谷歌推出的Gemini2.0已經(jīng)開(kāi)始帶頭使用自家的TPU來(lái)進(jìn)行訓(xùn)練和推理,以往ASIC不適用于A(yíng)I訓(xùn)練的刻板印象也逐步被打破。

如果ASIC的成本效益未來(lái)能被進(jìn)一步開(kāi)發(fā)至極致,那么至少像百度、阿里、谷歌、騰訊、華為這樣的集大模型開(kāi)發(fā)和云計(jì)算服務(wù)于一體的互聯(lián)網(wǎng)巨頭,會(huì)先擺脫在A(yíng)I大模型上對(duì)GPU的依賴(lài)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 博通
    +關(guān)注

    關(guān)注

    36

    文章

    4346

    瀏覽量

    109185
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    OpenClaw之后,AI邁入“黑暗森林”時(shí)代

    電子發(fā)燒友網(wǎng)報(bào)道(文/黃山明)近期,一款在全球開(kāi)發(fā)者社區(qū)和科技圈現(xiàn)象級(jí)的開(kāi)源AI智能體(AI?Agent)框架出了圈,它被用戶(hù)親切地稱(chēng)
    的頭像 發(fā)表于 03-09 06:13 ?7628次閱讀

    英偉達(dá)失守中國(guó)區(qū)!推理需求爆發(fā),國(guó)產(chǎn)GPU搶灘上市

    億元。而在此前,另一家國(guó)產(chǎn)GPU公司摩爾線(xiàn)程已于9月26日率先過(guò)會(huì)。這兩大GPU企業(yè)接連沖刺IPO,背后是中國(guó)AI算力需求爆發(fā)式增長(zhǎng)與全球供應(yīng)鏈格局重塑的多重驅(qū)動(dòng)。 ? AI
    的頭像 發(fā)表于 10-22 09:09 ?8255次閱讀
    英偉達(dá)失守中國(guó)區(qū)!<b class='flag-5'>推理</b>需求爆發(fā),國(guó)產(chǎn)<b class='flag-5'>GPU</b>搶灘上市

    AI ASIC通份額將達(dá)60%,聯(lián)發(fā)科成長(zhǎng)顯著,臺(tái)積電成最大贏(yíng)家

    Counterpoint指出,AI芯片熱潮進(jìn)入第二階段,ASICGPU競(jìng)爭(zhēng)激烈,通和臺(tái)積電有望成最大贏(yíng)家。 ? Counterpoint預(yù)測(cè),A
    的頭像 發(fā)表于 02-05 18:21 ?1.7w次閱讀
    <b class='flag-5'>AI</b> <b class='flag-5'>ASIC</b>:<b class='flag-5'>博</b>通份額將達(dá)60%,聯(lián)發(fā)科成長(zhǎng)顯著,臺(tái)積電成最大贏(yíng)家

    AI推理芯片需求爆發(fā),OpenAI欲尋求新合作伙伴

    領(lǐng)域占據(jù)主導(dǎo),其GPU憑借強(qiáng)大的海量數(shù)據(jù)處理能力,成為全球AI爆炸式增長(zhǎng)的重要基石。但隨著AI不斷演進(jìn),重點(diǎn)正從大規(guī)模訓(xùn)練轉(zhuǎn)向?qū)σ?b class='flag-5'>訓(xùn)練模型的
    的頭像 發(fā)表于 02-03 17:15 ?2961次閱讀

    開(kāi)源不是削弱競(jìng)爭(zhēng)力,而是新護(hù)城河的開(kāi)始

    。 越來(lái)越多的企業(yè)在開(kāi)源的浪潮中找到了機(jī)會(huì),也有人提出疑問(wèn): 既然代碼都開(kāi)源了,護(hù)城河還從哪里來(lái)?開(kāi)源軟件還有壁壘可言嗎? 事實(shí)上,開(kāi)源并不是沒(méi)有護(hù)城河,它只是 把護(hù)城河從“技術(shù)代碼”轉(zhuǎn)移到了“綜合能力” 。 一、開(kāi)源不是免費(fèi)的
    的頭像 發(fā)表于 11-06 14:26 ?412次閱讀

    AI芯片市場(chǎng)鏖戰(zhàn),GPUASIC誰(shuí)將占據(jù)主動(dòng)?

    本文轉(zhuǎn)自:TechSugar隨著人工智能技術(shù)在大模型訓(xùn)練、邊緣計(jì)算、自動(dòng)駕駛等領(lǐng)域的深度滲透,核心算力硬件的競(jìng)爭(zhēng)進(jìn)入白熱化階段。圖形處理單元(GPU)與專(zhuān)用集成電路(ASIC)作為兩大主流技術(shù)路線(xiàn)
    的頭像 發(fā)表于 10-30 12:06 ?782次閱讀
    <b class='flag-5'>AI</b>芯片市場(chǎng)鏖戰(zhàn),<b class='flag-5'>GPU</b>與<b class='flag-5'>ASIC</b>誰(shuí)將占據(jù)主動(dòng)?

    AI推理需求爆發(fā)!高通首秀重磅產(chǎn)品,國(guó)產(chǎn)GPU的自主牌怎么打?

    10月29日,在安會(huì)的2025智能算力應(yīng)用及產(chǎn)業(yè)發(fā)展論壇上,超聚變數(shù)字技術(shù)有限公司深圳解決方案總監(jiān)丁元釗表示,原來(lái)我們預(yù)計(jì)2026年是AI推理爆發(fā)元年,2025年DeepSeek-R1,V3模型
    的頭像 發(fā)表于 10-30 00:46 ?1.4w次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>推理</b>需求爆發(fā)!高通首秀重磅產(chǎn)品,國(guó)產(chǎn)<b class='flag-5'>GPU</b>的自主牌怎么打?

    一文看懂AI訓(xùn)練推理與訓(xùn)推一體的底層關(guān)系

    我們正在參加全球電子成就獎(jiǎng)的評(píng)選,歡迎大家?guī)臀覀兺镀薄x謝支持很多人聽(tīng)過(guò)“大模型”,但沒(méi)搞懂兩件事。我們總說(shuō)AI有多強(qiáng),但真正決定AI能否落地的,是它的兩個(gè)階段:訓(xùn)練(Training)和
    的頭像 發(fā)表于 09-19 11:58 ?2490次閱讀
    一文看懂<b class='flag-5'>AI</b><b class='flag-5'>訓(xùn)練</b>、<b class='flag-5'>推理</b>與訓(xùn)推一體的底層關(guān)系

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片的需求和挑戰(zhàn)

    的工作嗎? 從書(shū)中也了解到了AI芯片都有哪些?像CPU、GPU、FPGA、ASIC都是AI芯片。 其他的還是知道的,F(xiàn)PGA屬于AI芯片這個(gè)
    發(fā)表于 09-12 16:07

    睿海光電以高效交付與廣泛兼容助力AI數(shù)據(jù)中心800G光模塊升級(jí)

    推理任務(wù)響應(yīng)延遲降低30%,多租戶(hù)帶寬隔離效率提升25%。 亞洲頭部智算中心:采用睿海定制化液冷光模塊,GPU集群訓(xùn)練效率提升18%,PUE值優(yōu)化至1.1以下。 歐洲車(chē)企AI
    發(fā)表于 08-13 19:01

    AI芯片,需要ASIC

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎) 2025年,全球AI芯片市場(chǎng)正迎來(lái)一場(chǎng)結(jié)構(gòu)性變革。在英偉達(dá)GPU占據(jù)主導(dǎo)地位的大格局下,ASIC(專(zhuān)用集成電路)憑借針對(duì)AI任務(wù)的定制化設(shè)計(jì),成為推動(dòng)算
    的頭像 發(fā)表于 07-26 07:30 ?6865次閱讀

    PCIe協(xié)議分析儀能測(cè)試哪些設(shè)備?

    場(chǎng)景:監(jiān)測(cè)GPU與主機(jī)之間的PCIe通信,分析數(shù)據(jù)傳輸效率、延遲和帶寬利用率。 應(yīng)用價(jià)值:優(yōu)化大規(guī)模AI訓(xùn)練任務(wù)的數(shù)據(jù)加載和模型參數(shù)同步,例如在多GPU系統(tǒng)中測(cè)試PCIe交換機(jī)的性能和
    發(fā)表于 07-25 14:09

    信而泰×DeepSeek:AI推理引擎驅(qū)動(dòng)網(wǎng)絡(luò)智能診斷邁向 “自愈”時(shí)代

    網(wǎng)絡(luò)智能診斷平臺(tái)。通過(guò)對(duì)私有化網(wǎng)絡(luò)數(shù)據(jù)的定向訓(xùn)練,信而泰打造了高性能、高可靠性的網(wǎng)絡(luò)診斷模型,顯著提升了AI輔助診斷的精準(zhǔn)度與實(shí)用性。該方案實(shí)現(xiàn)了網(wǎng)絡(luò)全流量深度解析能力與AI智能推理
    發(fā)表于 07-16 15:29

    陣列云從訓(xùn)練推理

    在云場(chǎng)景下,陣列云(分布式計(jì)算集群)從模型訓(xùn)練推理的完整技術(shù)流程可結(jié)構(gòu)化分解如下: 一、訓(xùn)練階段技術(shù)實(shí)現(xiàn) 1,資源動(dòng)態(tài)編排? 基于Kubernetes集群或云廠(chǎng)商彈性計(jì)算服務(wù)(如AWS EC2
    的頭像 發(fā)表于 03-28 08:32 ?686次閱讀

    摩爾線(xiàn)程GPU原生FP8計(jì)算助力AI訓(xùn)練

    并行訓(xùn)練推理,顯著提升了訓(xùn)練效率與穩(wěn)定性。摩爾線(xiàn)程是國(guó)內(nèi)率先原生支持FP8計(jì)算精度的國(guó)產(chǎn)GPU企業(yè),此次開(kāi)源不僅為AI
    的頭像 發(fā)表于 03-17 17:05 ?1545次閱讀
    摩爾線(xiàn)程<b class='flag-5'>GPU</b>原生FP8計(jì)算助力<b class='flag-5'>AI</b><b class='flag-5'>訓(xùn)練</b>