電子發(fā)燒友網(wǎng)綜合報(bào)道,消息人士稱,英偉達(dá)計(jì)劃于 7 月推出第三代 “閹割芯片”。此次推出的 B20 和 B40/B30 芯片將替代 H20 芯片,試圖重新奪回市場(chǎng)份額。
B20 芯片基于 GB202 GPU,采用 GDDR7 內(nèi)存,最大帶寬可達(dá) 800Gbps,適合小規(guī)模集群推理和小模型后訓(xùn)練;B40/B30 芯片則保留了與 H20 相同的 NVLink 互聯(lián)功能,最大帶寬可達(dá) 900GB/s,但性能有所下滑。單卡售價(jià)預(yù)計(jì)在 6500 至 8000 美元之間,服務(wù)器價(jià)格預(yù)計(jì)在 8 萬(wàn)至 10 萬(wàn)美元之間。
英偉達(dá)此次產(chǎn)品的變動(dòng)源自美國(guó)出口管制的升級(jí)。2024 年,美國(guó)將 HBM 內(nèi)存(帶寬密度≥2GB/s?mm2)列為特殊管控對(duì)象,英偉達(dá)被迫采用 GDDR7 規(guī)避限制。此外,芯片的雙精度浮點(diǎn)計(jì)算(FP64)單元、張量核等關(guān)鍵模塊可能通過(guò)后道點(diǎn)斷工藝屏蔽,導(dǎo)致計(jì)算能力進(jìn)一步受限。北京時(shí)間 4 月 16 日凌晨,英偉達(dá)向美國(guó)證券交易委員會(huì)(SEC)提交 8-k 文件,稱已接到美國(guó)政府通知(原文 “特朗普政府” 表述有誤,2024 年特朗普未執(zhí)政 ),H20 芯片及達(dá)到 H20 內(nèi)存帶寬、互連帶寬等的芯片向中國(guó)等國(guó)家和地區(qū)出口需要獲得許可證。
這一調(diào)整直接導(dǎo)致芯片支持的模型并發(fā)數(shù)減少,難以支撐大規(guī)模訓(xùn)練任務(wù)。例如,B20 使用英偉達(dá)的 ConnectX-8 實(shí)現(xiàn)互連功能,通過(guò)以太網(wǎng)實(shí)現(xiàn)連接,最大互連帶寬為 800Gbps。每塊 B20 芯片通過(guò) NVlink 總線連接到 ConnectX-8 芯片,形成一個(gè)相當(dāng)于 PCIe 卡的離散模塊,支持 PCIe 卡格式的互連。而這種連接性能僅適合 8 - 16 卡小規(guī)模集群的推理和小模型后訓(xùn)練,不過(guò)對(duì)于一些偏重網(wǎng)絡(luò)傳輸,且推理任務(wù)繁重但體量小的客戶而言,B20 還是有一定性價(jià)比的。
盡管芯片性能受限,英偉達(dá)仍憑借 CUDA 生態(tài)壟斷(統(tǒng)一編程模型、豐富代碼庫(kù))維持市場(chǎng)地位。此前,英偉達(dá) H20 芯片就在 2024 年被中國(guó)互聯(lián)網(wǎng)公司大批量采購(gòu)。類似邏輯下,B40/B30 因保留 NVLink 互聯(lián)能力,可能被科技巨頭用于構(gòu)建高密度集群(如 NVL72 機(jī)柜),滿足模型微調(diào)、推理等場(chǎng)景需求。
不過(guò),美國(guó)的政策正在引發(fā)反向替代效應(yīng)。在國(guó)內(nèi),已經(jīng)有不少芯片能夠用于替代英偉達(dá)的芯片。比如,昇騰 910B 的 FP16 算力達(dá) 376TFLOPS,超越英偉達(dá) A100 的 312TFLOPS;顯存帶寬 1600GB/s,支持全自研 HCCS 高速互聯(lián)。根據(jù)此前的報(bào)道,在全球 AI 算力競(jìng)賽進(jìn)入關(guān)鍵階段的背景下,硅基風(fēng)暴(Siliconstorm)與華為昇騰云正式達(dá)成深度技術(shù)合作。本次合作基于昇騰 910B 芯片的算力底座,在大型模型推理加速領(lǐng)域取得突破性進(jìn)展 —— 聯(lián)合研發(fā)的 DeepSeek-R1 架構(gòu)實(shí)現(xiàn)推理效率提升 10 倍,推理成本較傳統(tǒng)方案降低 97%。這是國(guó)產(chǎn)算力體系首次在 AI 推理性能與性價(jià)比雙重指標(biāo)上超越國(guó)際主流方案。
因此,美國(guó)的技術(shù)封鎖如同「鲇魚(yú)效應(yīng)」,迫使中國(guó)半導(dǎo)體產(chǎn)業(yè)跳出「跟隨式創(chuàng)新」的路徑依賴,在技術(shù)路線、產(chǎn)業(yè)鏈布局、生態(tài)規(guī)則三大維度實(shí)現(xiàn)范式變革。短期內(nèi),國(guó)產(chǎn)芯片將在中低端推理、邊緣計(jì)算等場(chǎng)景全面替代英偉達(dá)閹割版產(chǎn)品,并通過(guò)算法優(yōu)化(如模型壓縮、稀疏計(jì)算)部分彌補(bǔ)高端訓(xùn)練場(chǎng)景的性能差距。中長(zhǎng)期來(lái)看,隨著存算一體、光子芯片、量子計(jì)算等顛覆性技術(shù)突破,以及 RISC-V、開(kāi)源框架等自主生態(tài)成熟,中國(guó)有望在特定領(lǐng)域建立全球標(biāo)準(zhǔn),推動(dòng)半導(dǎo)體產(chǎn)業(yè)從「單極壟斷」向「多元競(jìng)合」轉(zhuǎn)型。
-
英偉達(dá)
+關(guān)注
關(guān)注
23文章
4016瀏覽量
96824
發(fā)布評(píng)論請(qǐng)先 登錄
開(kāi)啟連接新紀(jì)元——芯科科技第三代無(wú)線SoC現(xiàn)已全面供貨
外媒:英偉達(dá)正開(kāi)發(fā)新款中國(guó)特供芯片B30A 或?yàn)槠炫濧I芯品B300的閹割版

電鏡技術(shù)在第三代半導(dǎo)體中的關(guān)鍵應(yīng)用

第三代半導(dǎo)體的優(yōu)勢(shì)和應(yīng)用領(lǐng)域
瑞能半導(dǎo)體第三代超結(jié)MOSFET技術(shù)解析(1)

能量密度提升15%!TDK第三代電池量產(chǎn)在即
第三代半導(dǎo)體器件封裝:挑戰(zhàn)與機(jī)遇并存

EE-230:第三代SHARC系列處理器上的代碼疊加

第三代半導(dǎo)體廠商加速出海
第三代半導(dǎo)體對(duì)防震基座需求前景?

第三代半導(dǎo)體產(chǎn)業(yè)高速發(fā)展
第三代寬禁帶半導(dǎo)體:碳化硅和氮化鎵介紹

評(píng)論