本周,亞馬遜推出首款自研Arm架構(gòu)云服務(wù)器CPU Graviton和首款云端AI推理芯片AWS Inferentia,拳打TPU,腳踢英特爾,力圖走一條自己的云端芯一體化路線,未來云計(jì)算市場將迎巨變!
亞馬遜出手了,一出手就是兩顆炸彈!
本周一,亞馬遜推出首款自研Arm架構(gòu)云服務(wù)器CPU Graviton,目標(biāo)直指英特爾;
昨天,亞馬遜又推出了首款云端AI推理芯片AWS Inferentia,目標(biāo)是殺傷微軟Azure、谷歌云等一批對(duì)手,并讓中小玩家無牌可打。
亞馬遜力圖走一條自己的云端芯一體化路線,似乎沒有給其他人留出可趁之機(jī)。
未來云計(jì)算的市場,將迎來巨變!
亞馬遜自研Arm架構(gòu)數(shù)據(jù)中心CPU,成本最低降45%
據(jù)The Register報(bào)道,本周公布的亞馬遜AWS定制版Graviton——支持AWS的A1EC2實(shí)例的多核Arm處理器,處理器性能幾乎與AMD的基于Arm的芯片相當(dāng),這些虛擬機(jī)現(xiàn)在可在美國和歐洲使用。
Graviton:亞馬遜基于Arm架構(gòu)的CPU
關(guān)于Graviton的性能參數(shù),目前能了解到的是:CPU內(nèi)核基于Arm 2015年的Cortex-A72設(shè)計(jì),主頻為2.3GHz,為64位Armv8-A、非NUMA處理器,具備浮點(diǎn)數(shù)學(xué)計(jì)算、SIMD、AES,SHA-1、SHA-256、GCM和CRC-32算法的硬件加速功能。
片上系統(tǒng)使用Arm的數(shù)據(jù)中心優(yōu)化型Neoverse技術(shù)和Annapurna的內(nèi)部設(shè)計(jì)。 16個(gè)vCPU實(shí)例排列在4個(gè)四核集群中,每個(gè)集群有2MB的共享L2緩存,每個(gè)核有32KB的L1數(shù)據(jù)緩存和48KB的L1指令緩存。一個(gè)vCPU對(duì)應(yīng)一個(gè)物理核心。
亞馬遜一位發(fā)言人表示:“AWS Graviton處理器是由AWS定制設(shè)計(jì)的新處理器系列,設(shè)計(jì)中融入了亞馬遜為大規(guī)模云應(yīng)用程序構(gòu)建平臺(tái)方案上的廣泛專業(yè)知識(shí)。”
據(jù)亞馬遜全球基礎(chǔ)設(shè)施和客戶服務(wù)VP Peter DeSantis所說,使用新的芯片能讓AWS虛擬機(jī)特定工作負(fù)載的價(jià)格再降低45%。
亞馬遜云首款A(yù)I芯片問世,降低推理成本75%
在亞馬遜美國拉斯維加斯大會(huì)上,昨天還放出另一個(gè)炸彈——首款云端AI芯片AWS Inferentia。
AWS Inferentia是一款機(jī)器學(xué)習(xí)推理芯片,支持TensorFlow、Apache MXNet和PyTorch深度學(xué)習(xí)框架,以及使用ONNX格式的模型。
使用經(jīng)過訓(xùn)練的機(jī)器學(xué)習(xí)模型進(jìn)行預(yù)測可以驅(qū)動(dòng)應(yīng)用程序高達(dá)90%的計(jì)算成本。開發(fā)人員可以將GPU支持的推理加速附加到Amazon EC2和Amazon SageMaker實(shí)例中,從而將推理成本降低75%。
根據(jù)官網(wǎng)介紹,每個(gè)Inferentia芯片提供高達(dá)幾百TOPS的算力,使復(fù)雜的模型能夠做出快速的預(yù)測。多個(gè)AWS Inferentia芯片可以一起使用來驅(qū)動(dòng),形成成千上萬的TOPS算力。
這款芯片將于2019年底上市,AWS用戶可以通過Amazon SageMaker、Amazon EC2等一起使用 Inferentia的算力。
云計(jì)算巨頭自己造芯:擺脫束縛、降低成本、打擊對(duì)手
Graviton的問世顯示出亞馬遜AWS擺脫英特爾的決心。
目前,英特爾擁有全球數(shù)據(jù)中心計(jì)算幾乎全部市場份額,英特爾的服務(wù)器芯片價(jià)格居高不下,而且有供應(yīng)短缺的風(fēng)險(xiǎn)。
為了擺脫這種束縛,越來越多互聯(lián)網(wǎng)巨頭們正考慮使用Arm,OpenPower,RISC-V和AMD Epyc產(chǎn)品,定制自己的芯片,全球云計(jì)算巨頭(包括微軟,谷歌,F(xiàn)acebook,亞馬遜,百度等) 都在尋找替代芯片供應(yīng)商。
早在2015年左右,亞馬遜與AMD合作開發(fā)64位Arm服務(wù)器處理器,用于亞馬遜的數(shù)據(jù)中心。AMD還在2016年就推出了與亞馬遜合作的Arm芯片,代號(hào)“西雅圖”的Opteron A1100處理器。
不過,AMD未能達(dá)到亞馬遜的性能標(biāo)準(zhǔn),于是亞馬遜退出了與AMD的合作,收購了Arm授權(quán)許可持有者和片上系統(tǒng)設(shè)計(jì)企業(yè)Annapurna Labs,讓收購后的團(tuán)隊(duì)開始設(shè)計(jì)物聯(lián)網(wǎng)網(wǎng)關(guān)及其Nitro芯片組,負(fù)責(zé)處理托管EC2虛擬機(jī)的亞馬遜服務(wù)器的網(wǎng)絡(luò)和存儲(chǔ)任務(wù)。
今天的高端Arm CPU的應(yīng)用范圍,遠(yuǎn)遠(yuǎn)超出了智能手機(jī),還能夠運(yùn)行桌面端和輕型服務(wù)器上的應(yīng)用程序。Graviton的問世就是Annapurna Labs的成果。
而AWS Inferentia的問世則是打擊對(duì)手的思路。
第三季度,亞馬遜有一半利潤來自AWS云服務(wù),AWS業(yè)務(wù)在第三季度的營業(yè)利潤率為31%,這是四年多以來的最高水平。
評(píng)論