在5月Nvidia推出Ampere A100 GPU之后,Google Cloud宣布在Google Compute Engine上發(fā)布A100“加速器優(yōu)化” VM A2實(shí)例系列的alpha可用性。實(shí)例由HGX A100 16-GPU平臺(tái)提供動(dòng)力,該平臺(tái)使用NVSwitch互連將兩個(gè)HGX A100 8-GPU基板組合在一起。
新實(shí)例家族針對(duì)的是機(jī)器學(xué)習(xí)培訓(xùn)和推理,數(shù)據(jù)分析以及高性能計(jì)算工作負(fù)載。根據(jù)Nvidia的說法,具有新的張量和稀疏性功能,每個(gè)A100 GPU的性能都比上一代GPU提高了20倍。
A2 VM系列提供5種配置,從1個(gè)到16個(gè)GPU,具有兩種不同的CPU和網(wǎng)絡(luò)對(duì)GPU的比率。由于Ampere的多實(shí)例組(MIG)功能,每個(gè)GPU可以劃分為七個(gè)不同的GPU。
AI工作量要求最高的客戶將能夠訪問完整的16-GPU實(shí)例,該實(shí)例提供了總計(jì)640GB的GPU內(nèi)存和1.3TB的系統(tǒng)內(nèi)存,這些實(shí)例通過NVSwitch連接,總帶寬高達(dá)9.6TB / s。目前尚未透露A2系列的價(jià)格,但直接購買此硬件將花費(fèi)近40萬美元,這證明了基于云的方法的民主化力量,其中最新的HPC硬件的價(jià)格僅為后者的一小部分。 -需求。
回想一下,雖然Nvidia的DGX A100系統(tǒng)配備了64核AMD第二代Eypc Rome處理器,但 HGX平臺(tái)可以配置 AMD或Intel處理器。Google Cloud選擇了后者,A2機(jī)器提供了12到96個(gè)Intel Cascade Lake vCPU,以及可選的本地SSD(最高3TB)。
在安培(Ampere)不到兩個(gè)月的時(shí)間里,Google Cloud推出了新的A2系列 。這是從GPU芯片發(fā)布到云采用的創(chuàng)紀(jì)錄時(shí)間,反映了在AI工作負(fù)載的推動(dòng)下,對(duì)云中HPC的需求不斷增加。一直在穩(wěn)步前進(jìn),以加快云提供商對(duì)最新加速器設(shè)備的實(shí)施。Nvidia的K80 GPU花費(fèi)了兩年的時(shí)間才能將其導(dǎo)入云(AWS),Pascal的節(jié)奏約為一年,Volta的節(jié)奏為五個(gè)月,而Ampere則只有數(shù)周。谷歌指出,它也是首家推出英偉達(dá)T4圖形處理器的云提供商。(Google也是 第一個(gè)使用Pascal P100 實(shí)例; AWS跳過了Pascal,但 首先使用了Volta。)
Google Cloud還宣布即將為Nvidia A100提供對(duì)Google Kubernetes Engine,Cloud AI Platform和其他服務(wù)的支持。
根據(jù)Ampere發(fā)行的聲明,我們可以預(yù)期其他著名的云供應(yīng)商采用A100,包括Amazon Web Services,Microsoft Azure,百度云,騰訊云和阿里云。
目前,A2實(shí)例可通過私有Alpha程序獲得,Google報(bào)告說,將于今年晚些時(shí)候宣布其公共可用性和定價(jià)。
-
Google
+關(guān)注
關(guān)注
5文章
1789瀏覽量
59052 -
gpu
+關(guān)注
關(guān)注
28文章
4948瀏覽量
131258 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8503瀏覽量
134635
發(fā)布評(píng)論請(qǐng)先 登錄
粒子加速器?——?科技前沿的核心裝置

Cyusb3014接一塊I2C eeprom的情況下,A0、A1、A2的地址要設(shè)置嗎?
懌星科技完成數(shù)千萬元A2輪融資
Arm技術(shù)助力Google Axion處理器加速AI工作負(fù)載推理

英偉達(dá)A100和H100比較

英特爾Gaudi 2D AI加速器助力DeepSeek Janus Pro模型性能提升
DeepSeek發(fā)布Janus Pro模型,英特爾Gaudi 2D AI加速器優(yōu)化支持
Google Cloud發(fā)布兩款針對(duì)企業(yè)客戶的全新解決方案
亞馬遜云科技宣布Amazon Trainium2實(shí)例正式可用


使用bq769x0對(duì)高可用性系統(tǒng)進(jìn)行故障監(jiān)控

評(píng)論