據(jù)金融時(shí)報(bào)報(bào)道,中國(guó)的互聯(lián)網(wǎng)巨頭正爭(zhēng)相采購(gòu)對(duì)構(gòu)建生成人工智能系統(tǒng)至關(guān)重要的高性能英偉達(dá)芯片,由于擔(dān)心美國(guó)將實(shí)施新的出口管制,中國(guó)的互聯(lián)網(wǎng)巨頭們紛紛購(gòu)買了價(jià)值 50 億美元的訂單。
據(jù)多位知情人士透露,百度、字節(jié)跳動(dòng)、騰訊和阿里巴巴已下達(dá)價(jià)值 10 億美元的訂單,從這家美國(guó)芯片制造商采購(gòu)約 10 萬(wàn)顆 A800 處理器,并將于今年交付。兩位接近 Nvidia 的人士表示,中國(guó)集團(tuán)還購(gòu)買了價(jià)值 40 億美元的圖形處理器,將于 2024 年交付。
領(lǐng)先的云 GPU 提供商表示,Nvidia 最好的 AI 芯片在 2024 年之前的產(chǎn)能已經(jīng)售罄。
Nvidia的產(chǎn)品現(xiàn)已成為科技行業(yè)最寶貴的資源。企業(yè)和初創(chuàng)企業(yè)正在瘋狂地將預(yù)算重點(diǎn)轉(zhuǎn)向新的人工智能項(xiàng)目,并迫切需要 GPU。亞馬遜網(wǎng)絡(luò)服務(wù)首席執(zhí)行官 Adam Selipsky在本周接受 The Verge 采訪時(shí)表示:“[Nvidia GPU] 供不應(yīng)求”。
“我認(rèn)為,至少在短期內(nèi),英偉達(dá)需求超過供應(yīng),這一點(diǎn)毫無(wú)爭(zhēng)議,對(duì)每個(gè)人來(lái)說(shuō)都是如此?!盇dam Selipsky補(bǔ)充說(shuō)。
Adam Selipsky進(jìn)一步指出,生成式人工智能并不便宜。目前它的價(jià)格非常昂貴。GPU 的性能非常好,但也相當(dāng)昂貴。例如,訓(xùn)練模型的成本非常昂貴。然后,運(yùn)行推理或運(yùn)行模型并在生產(chǎn)中對(duì)這些模型進(jìn)行查詢也非常昂貴。因此為了經(jīng)濟(jì)地完成這些任務(wù),您需要云。絕大多數(shù)公司都需要像 AWS 這樣的公司進(jìn)行創(chuàng)新,隨著時(shí)間的推移大幅降低成本,以推動(dòng)我們不可避免地希望看到生成式 AI 使用量的指數(shù)級(jí)增長(zhǎng)。
CoreWeave 聯(lián)合創(chuàng)始人兼首席技術(shù)官 Brian Venturo在接受Barron's Tech的采訪時(shí)也表示,今年第一季度,確保供應(yīng)鏈中的 [GPU] 分配和產(chǎn)能仍然相當(dāng)容易。從四月初開始,市場(chǎng)變得異常緊張。交貨時(shí)間從合理到年底。[這一轉(zhuǎn)變]發(fā)生在一周內(nèi)。不僅僅是云服務(wù)提供商,他們已經(jīng)有了自己的分配。這都是增量需求。它來(lái)自大型企業(yè)和人工智能實(shí)驗(yàn)室。
他表示,任何對(duì)物流和資源規(guī)劃進(jìn)行合理規(guī)劃的人現(xiàn)在都在關(guān)注 2024 年第一季度至 2024 年第二季度。而CoreWeave也將開始為明年第二季度和第三季度的部署進(jìn)行采購(gòu)。
在問到為何大家都在搶購(gòu)英偉達(dá)GPU時(shí),Brian Venturo指出,英偉達(dá)的護(hù)城河是雙重的。
首先是硬件方面。沒有人比英偉達(dá)更擅長(zhǎng)制造芯片。其次是軟件。上市時(shí)間對(duì)于初創(chuàng)企業(yè)來(lái)說(shuō)非常重要。如果您需要重組整個(gè)技術(shù)堆棧以使用 AMD 或 TPU [來(lái)自 Google 的張量處理單元],那么您可能會(huì)失去市場(chǎng)機(jī)會(huì),這是寶貴的時(shí)間。
Nvidia 在 CUDA(軟件編程平臺(tái))生態(tài)系統(tǒng)上進(jìn)行了大量投資,他們的先見之明令人難以置信。他們現(xiàn)在基本上領(lǐng)先其他人10年。這不僅僅是 Nvidia 的 10 年,而是他們的客戶和開發(fā)人員在該生態(tài)系統(tǒng)(使用軟件工具和庫(kù))上構(gòu)建的 10 年,利用了其他人之前的工作。我認(rèn)為在短期甚至中期內(nèi)沒有其他人能夠超越 Nvidia。
使用 Google 的 TPU 和 AWS Trainium 加速器的問題被鎖定在具有非常具體的技術(shù)解決方案的供應(yīng)商身上。對(duì)于初創(chuàng)企業(yè)來(lái)說(shuō),這可能不是最好的選擇。您希望供應(yīng)商具有靈活性,因?yàn)槟揽梢栽诙鄠€(gè)地方獲得相同的東西。
[Nvidia 的專有網(wǎng)絡(luò)] InfiniBand 還提供了當(dāng)今最好的解決方案來(lái)最大限度地減少延遲。其他產(chǎn)品不具備擁塞控制和使工作負(fù)載發(fā)揮最佳性能的功能。
為了供應(yīng),英偉達(dá)將GPU裝換為AI引擎
為了緩解GPU 擠壓的壓力,Nvidia 的 RTX GPU(主要以游戲和圖形聞名)正在為對(duì)桌面 AI 感興趣的愛好者進(jìn)行配置和重新包裝。新的 GPU 是 Nvidia 使 GPU 在客戶需要時(shí)隨時(shí)隨地可用的方法的一部分。
該公司發(fā)布了 RTX GPU,可用于人工智能推理和訓(xùn)練。GPU基于Ada Lovelace架構(gòu),與供不應(yīng)求的紅熱H100 GPU中使用的Hopper架構(gòu)不同。
愛好者已經(jīng)在游戲筆記本電腦上使用 GPU 來(lái)運(yùn)行人工智能驅(qū)動(dòng)的應(yīng)用程序,例如文本到文本或文本到圖像模型。在本周的 SIGGRAPH 會(huì)議上,Nvidia 宣布了采用 RTX GPU 的新桌面和工作站設(shè)計(jì)。
包括戴爾、聯(lián)想和 Boxx 在內(nèi)的計(jì)算機(jī)制造商將推出可在機(jī)箱中容納多達(dá)四個(gè) RTX 6000 數(shù)據(jù)生成的工作站。Nvidia 表示,該 GPU 的建議零售價(jià)為 6,000 美元,但戴爾等供應(yīng)商的售價(jià)(含稅)超過 9,000 美元。
每個(gè) RTX 6000 GPU 均基于 Ada Lovelace 設(shè)計(jì),擁有 48GB GDDR6 內(nèi)存和 200Gbps 網(wǎng)絡(luò)接口卡。GPU 的功耗為 300 瓦,基于較舊的 PCIe 4.0 互連標(biāo)準(zhǔn)。
Nvidia還發(fā)布了L40S Ada GPU,它更像是H100的窮人版本,因?yàn)樗贏I訓(xùn)練和推理方面比上一代A100 GPU更快。新產(chǎn)品是一年前發(fā)布的L40服務(wù)器GPU的變體。
L40S 還具有 48GB GDDR6 內(nèi)存,并將應(yīng)用于基于 OVX 參考服務(wù)器設(shè)計(jì)的系統(tǒng)中,用于 Metaverse 應(yīng)用程序。
與基于上一代 Ampere 架構(gòu)的上一代 A40 GPU 相比,L40S 的 AI 和圖形工作負(fù)載速度提高了四倍。AI訓(xùn)練速度比A100 GPU快1.7倍,推理速度快1.5倍。L40S 具有更快的時(shí)鐘速度和更高的張量和圖形渲染性能。
Nvidia 的企業(yè) RTX 系統(tǒng)是為 Metaverse 和 AI 市場(chǎng)打造的,新硬件將包括 Omniverse 和 AI Enterprise 軟件的許可證。該公司還發(fā)布了 AI Enterprise 4.0,其中將包括 Nemo 大語(yǔ)言模型。
購(gòu)買將于今年晚些時(shí)候發(fā)貨的 L40S GPU 電源應(yīng)該不會(huì)有什么困難。
Nvidia 專業(yè)可視化副總裁 Bob Pette 在新聞發(fā)布會(huì)上表示:“這些不會(huì)像我們?cè)谝恍┳罡叨?GPU 中那樣受到限制?!?/p>
Nvidia 的低端 RTX 4000 GPU 將于 9 月上市,售價(jià)為 1,250 美元。RTX 4500 將于 10 月開始發(fā)售,售價(jià)為 2,250 美元。
對(duì)于 Nvidia 來(lái)說(shuō),人工智能與游戲一樣重要。該公司希望讓 GPU 成為一種商品,愛好者可以在上面創(chuàng)建自己的程序,然后在最接近的 GPU 可用的地方運(yùn)行。Nvidia 的 H100 GPU 很難找到,但已成為公司的資產(chǎn)。一家名為 CoreWeave 的初創(chuàng)公司已將其 Nvidia GPU 作為抵押品,為其發(fā)展提供資金。加密貨幣礦工也在重新利用數(shù)據(jù)中心的 GPU 來(lái)運(yùn)行人工智能。
審核編輯:劉清
-
人工智能
+關(guān)注
關(guān)注
1807文章
49029瀏覽量
249646 -
英偉達(dá)
+關(guān)注
關(guān)注
22文章
3953瀏覽量
93815 -
PCIe接口
+關(guān)注
關(guān)注
0文章
121瀏覽量
10135 -
GPU芯片
+關(guān)注
關(guān)注
1文章
305瀏覽量
6207 -
GDDR6
+關(guān)注
關(guān)注
0文章
52瀏覽量
11492
原文標(biāo)題:傳中國(guó)廠商掃貨英偉達(dá)GPU,豪擲50億買芯片,訂單已經(jīng)排到2024年
文章出處:【微信號(hào):TenOne_TSMC,微信公眾號(hào):芯片半導(dǎo)體】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
AI大模型不再依賴英偉達(dá)GPU?蘋果揭秘自研大模型

IBM攜手英偉達(dá)AI數(shù)據(jù)平臺(tái)推動(dòng)企業(yè)級(jí)AI創(chuàng)新
美銀分析師:英偉達(dá)加大“物理AI”投入為明智之舉
英偉達(dá)收購(gòu)AI初創(chuàng)公司Run:ai
英偉達(dá)加速Rubin平臺(tái)AI芯片推出,SK海力士提前交付HBM4存儲(chǔ)器
英偉達(dá)Blackwell GPU未來(lái)一年訂單爆滿
英偉達(dá)或明年將革新AI GPU設(shè)計(jì),采用插槽設(shè)計(jì)
Inflection AI轉(zhuǎn)向英特爾Gaudi 3,放棄英偉達(dá)GPU
英偉達(dá)AI服務(wù)器將革新采用插槽式設(shè)計(jì)
挑戰(zhàn)英偉達(dá):聚焦本土GPU領(lǐng)軍企業(yè)崛起
英偉達(dá)投資日本AI公司Sakana AI
英偉達(dá)Blackwell可支持10萬(wàn)億參數(shù)模型AI訓(xùn)練,實(shí)時(shí)大語(yǔ)言模型推理

英偉達(dá)Blackwell架構(gòu)揭秘:下一個(gè)AI計(jì)算里程碑?# 英偉達(dá)# 英偉達(dá)Blackwell

評(píng)論