五十度灰,亚洲不卡影院午夜在线观看

據(jù)金融時(shí)報(bào)報(bào)道，中國的互聯(lián)網(wǎng)巨頭正爭相采購對構(gòu)建生成人工智能系統(tǒng)至關(guān)重要的高性能英偉達(dá)芯片，由于擔(dān)心美國將實(shí)施新的出口管制，中國的互聯(lián)網(wǎng)巨頭們紛紛購買了價(jià)值 50 億美元的訂單。

據(jù)多位知情人士透露，百度、字節(jié)跳動(dòng)、騰訊和阿里巴巴已下達(dá)價(jià)值 10 億美元的訂單，從這家美國芯片制造商采購約 10 萬顆 A800 處理器，并將于今年交付。兩位接近 Nvidia 的人士表示，中國集團(tuán)還購買了價(jià)值 40 億美元的圖形處理器，將于 2024 年交付。

領(lǐng)先的云 GPU 提供商表示，Nvidia 最好的 AI 芯片在 2024 年之前的產(chǎn)能已經(jīng)售罄。

Nvidia的產(chǎn)品現(xiàn)已成為科技行業(yè)最寶貴的資源。企業(yè)和初創(chuàng)企業(yè)正在瘋狂地將預(yù)算重點(diǎn)轉(zhuǎn)向新的人工智能項(xiàng)目，并迫切需要 GPU。亞馬遜網(wǎng)絡(luò)服務(wù)首席執(zhí)行官 Adam Selipsky在本周接受 The Verge 采訪時(shí)表示：“[Nvidia GPU] 供不應(yīng)求”。

“我認(rèn)為，至少在短期內(nèi)，英偉達(dá)需求超過供應(yīng)，這一點(diǎn)毫無爭議，對每個(gè)人來說都是如此?！盇dam Selipsky補(bǔ)充說。

Adam Selipsky進(jìn)一步指出，生成式人工智能并不便宜。目前它的價(jià)格非常昂貴。GPU 的性能非常好，但也相當(dāng)昂貴。例如，訓(xùn)練模型的成本非常昂貴。然后，運(yùn)行推理或運(yùn)行模型并在生產(chǎn)中對這些模型進(jìn)行查詢也非常昂貴。因此為了經(jīng)濟(jì)地完成這些任務(wù)，您需要云。絕大多數(shù)公司都需要像 AWS 這樣的公司進(jìn)行創(chuàng)新，隨著時(shí)間的推移大幅降低成本，以推動(dòng)我們不可避免地希望看到生成式 AI 使用量的指數(shù)級增長。

CoreWeave 聯(lián)合創(chuàng)始人兼首席技術(shù)官 Brian Venturo在接受Barron's Tech的采訪時(shí)也表示，今年第一季度，確保供應(yīng)鏈中的 [GPU] 分配和產(chǎn)能仍然相當(dāng)容易。從四月初開始，市場變得異常緊張。交貨時(shí)間從合理到年底。[這一轉(zhuǎn)變]發(fā)生在一周內(nèi)。不僅僅是云服務(wù)提供商，他們已經(jīng)有了自己的分配。這都是增量需求。它來自大型企業(yè)和人工智能實(shí)驗(yàn)室。

他表示，任何對物流和資源規(guī)劃進(jìn)行合理規(guī)劃的人現(xiàn)在都在關(guān)注 2024 年第一季度至 2024 年第二季度。而CoreWeave也將開始為明年第二季度和第三季度的部署進(jìn)行采購。

在問到為何大家都在搶購英偉達(dá)GPU時(shí)，Brian Venturo指出，英偉達(dá)的護(hù)城河是雙重的。

首先是硬件方面。沒有人比英偉達(dá)更擅長制造芯片。其次是軟件。上市時(shí)間對于初創(chuàng)企業(yè)來說非常重要。如果您需要重組整個(gè)技術(shù)堆棧以使用 AMD 或 TPU [來自 Google 的張量處理單元]，那么您可能會(huì)失去市場機(jī)會(huì)，這是寶貴的時(shí)間。

Nvidia 在 CUDA（軟件編程平臺(tái)）生態(tài)系統(tǒng)上進(jìn)行了大量投資，他們的先見之明令人難以置信。他們現(xiàn)在基本上領(lǐng)先其他人10年。這不僅僅是 Nvidia 的 10 年，而是他們的客戶和開發(fā)人員在該生態(tài)系統(tǒng)（使用軟件工具和庫）上構(gòu)建的 10 年，利用了其他人之前的工作。我認(rèn)為在短期甚至中期內(nèi)沒有其他人能夠超越 Nvidia。

使用 Google 的 TPU 和 AWS Trainium 加速器的問題被鎖定在具有非常具體的技術(shù)解決方案的供應(yīng)商身上。對于初創(chuàng)企業(yè)來說，這可能不是最好的選擇。您希望供應(yīng)商具有靈活性，因?yàn)槟揽梢栽诙鄠€(gè)地方獲得相同的東西。

[Nvidia 的專有網(wǎng)絡(luò)] InfiniBand 還提供了當(dāng)今最好的解決方案來最大限度地減少延遲。其他產(chǎn)品不具備擁塞控制和使工作負(fù)載發(fā)揮最佳性能的功能。

為了供應(yīng)，英偉達(dá)將GPU裝換為AI引擎

為了緩解GPU 擠壓的壓力，Nvidia 的 RTX GPU（主要以游戲和圖形聞名）正在為對桌面 AI 感興趣的愛好者進(jìn)行配置和重新包裝。新的 GPU 是 Nvidia 使 GPU 在客戶需要時(shí)隨時(shí)隨地可用的方法的一部分。

該公司發(fā)布了 RTX GPU，可用于人工智能推理和訓(xùn)練。GPU基于Ada Lovelace架構(gòu)，與供不應(yīng)求的紅熱H100 GPU中使用的Hopper架構(gòu)不同。

愛好者已經(jīng)在游戲筆記本電腦上使用 GPU 來運(yùn)行人工智能驅(qū)動(dòng)的應(yīng)用程序，例如文本到文本或文本到圖像模型。在本周的 SIGGRAPH 會(huì)議上，Nvidia 宣布了采用 RTX GPU 的新桌面和工作站設(shè)計(jì)。

包括戴爾、聯(lián)想和 Boxx 在內(nèi)的計(jì)算機(jī)制造商將推出可在機(jī)箱中容納多達(dá)四個(gè) RTX 6000 數(shù)據(jù)生成的工作站。Nvidia 表示，該 GPU 的建議零售價(jià)為 6,000 美元，但戴爾等供應(yīng)商的售價(jià)（含稅）超過 9,000 美元。

每個(gè) RTX 6000 GPU 均基于 Ada Lovelace 設(shè)計(jì)，擁有 48GB GDDR6 內(nèi)存和 200Gbps 網(wǎng)絡(luò)接口卡。GPU 的功耗為 300 瓦，基于較舊的 PCIe 4.0 互連標(biāo)準(zhǔn)。

Nvidia還發(fā)布了L40S Ada GPU，它更像是H100的窮人版本，因?yàn)樗贏I訓(xùn)練和推理方面比上一代A100 GPU更快。新產(chǎn)品是一年前發(fā)布的L40服務(wù)器GPU的變體。

L40S 還具有 48GB GDDR6 內(nèi)存，并將應(yīng)用于基于 OVX 參考服務(wù)器設(shè)計(jì)的系統(tǒng)中，用于 Metaverse 應(yīng)用程序。

與基于上一代 Ampere 架構(gòu)的上一代 A40 GPU 相比，L40S 的 AI 和圖形工作負(fù)載速度提高了四倍。AI訓(xùn)練速度比A100 GPU快1.7倍，推理速度快1.5倍。L40S 具有更快的時(shí)鐘速度和更高的張量和圖形渲染性能。

Nvidia 的企業(yè) RTX 系統(tǒng)是為 Metaverse 和 AI 市場打造的，新硬件將包括 Omniverse 和 AI Enterprise 軟件的許可證。該公司還發(fā)布了 AI Enterprise 4.0，其中將包括 Nemo 大語言模型。

購買將于今年晚些時(shí)候發(fā)貨的 L40S GPU 電源應(yīng)該不會(huì)有什么困難。

Nvidia 專業(yè)可視化副總裁 Bob Pette 在新聞發(fā)布會(huì)上表示：“這些不會(huì)像我們在一些最高端 GPU 中那樣受到限制?！?/p>

Nvidia 的低端 RTX 4000 GPU 將于 9 月上市，售價(jià)為 1,250 美元。RTX 4500 將于 10 月開始發(fā)售，售價(jià)為 2,250 美元。

對于 Nvidia 來說，人工智能與游戲一樣重要。該公司希望讓 GPU 成為一種商品，愛好者可以在上面創(chuàng)建自己的程序，然后在最接近的 GPU 可用的地方運(yùn)行。Nvidia 的 H100 GPU 很難找到，但已成為公司的資產(chǎn)。一家名為 CoreWeave 的初創(chuàng)公司已將其 Nvidia GPU 作為抵押品，為其發(fā)展提供資金。加密貨幣礦工也在重新利用數(shù)據(jù)中心的 GPU 來運(yùn)行人工智能。

審核編輯：劉清

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴