日前,英偉達(dá)GTC 2018(GPU Technology Conference 2018,以下簡(jiǎn)稱GTC)在美國(guó)圣何塞舉行。英偉達(dá)再一次在提升計(jì)算力的路上越走越遠(yuǎn)。GPU產(chǎn)品依然是主旋律,Tesla V100系列、DGX系列和Quadro GPU系列都進(jìn)行了更新。
新產(chǎn)品—全世界最大的GPU只要399
全新Tesla V100顯存將從原來(lái)的16GB提升至32GB。2017年5月11日,英偉達(dá)正式發(fā)布了全新Volta架構(gòu)GPU——NVIDIA Tesla V100,它擁有超過210億個(gè)晶體管,是上代TeslaP100的1.37倍。它的單精度浮點(diǎn)性能高達(dá)15 TFLOPS,雙精度浮點(diǎn)7.5 TFLOPS。
基于此前的NVIDIA NVLink架構(gòu),英偉達(dá)還推出了全新的NVSwitch架構(gòu)。這一互聯(lián)架構(gòu)的帶寬比PCle交換機(jī)高5倍,足以支持更大規(guī)模和復(fù)雜的數(shù)據(jù)集運(yùn)算,讓開發(fā)者和科學(xué)家可以構(gòu)建更高級(jí)的系統(tǒng)。
基于Tesla V100的升級(jí)和全新的NVSwitch架構(gòu),英偉達(dá)將DGX 2的性能較前一代產(chǎn)品有大幅度提升。
在2016年的GTC上英偉達(dá)正式發(fā)布DGX 1,它擁有8顆帕斯卡架構(gòu)GP100核心的Tesla P100 GPU,以及7TB的SSD,由兩顆16核心的Xeon E5-2698v3以及512GB的DDR4內(nèi)存驅(qū)動(dòng)。售價(jià)為129000美元。2017年9月份,英偉達(dá)推出了一款基于Volta架構(gòu)的DGX 1V,擁有8塊Tesla V100。
而DGX 2應(yīng)用了最新的NVSwitch架構(gòu),通過12個(gè)NVSwitch支持16塊全新的Tesla V100共享同一的內(nèi)存空間,總計(jì)512 GB HBM2存儲(chǔ),能實(shí)現(xiàn)每秒高達(dá)2千萬(wàn)次的浮點(diǎn)運(yùn)算。此外,基于NVSwitch架構(gòu)的應(yīng)用,16塊GPU可以實(shí)現(xiàn)2.4TB/秒的數(shù)據(jù)傳輸能力。
DGX 2內(nèi)含16顆Tesla V100芯片
“這是全球最大的GPU?!?a href="http://www.brongaenegriffin.com/tags/黃仁勛/" target="_blank">黃仁勛表示,他還用“美麗、性感”等詞語(yǔ)來(lái)形容這一款最新的DGX系列產(chǎn)品。
DGX 2的售價(jià),黃仁勛首先給出的是150萬(wàn)美元,最后直接減價(jià)為39.9萬(wàn)美元,將在今年的第三季度正式開放購(gòu)買。
面向藝術(shù)及設(shè)計(jì)領(lǐng)域,英偉達(dá)還推出了搭載了NVIDIA RTX(實(shí)時(shí)光線追蹤)技術(shù)的NVIDIA Quadro GV100 GPU。單塊GPU擁有32GB內(nèi)存,可以基于NVLink技術(shù)將兩塊GV100 GPU并聯(lián),從而將內(nèi)存提升至64GB。在前一周的游戲開發(fā)者大會(huì)上,英偉達(dá)正式推出了NVIDIA RTX技術(shù)。
GV100 GPU基于最新的Volta架構(gòu),可以提供每秒7.4萬(wàn)億次浮點(diǎn)運(yùn)算的雙精度性能,每秒14.8萬(wàn)億次浮點(diǎn)運(yùn)算的單精度性能,以及每秒118.5萬(wàn)億次浮點(diǎn)運(yùn)算的深度學(xué)習(xí)性能。
黃仁勛手中的GV100 GPU
這款產(chǎn)品主要針對(duì)傳媒娛樂從業(yè)者、產(chǎn)品設(shè)計(jì)師、建筑設(shè)計(jì)師等專業(yè)設(shè)計(jì)與流媒體專業(yè)人員。其中,NVIDIA RTX內(nèi)置的NVIDIA OpitX AI-denoiser可以實(shí)現(xiàn)實(shí)時(shí)的AI降噪去噪。
硬件之外,英偉達(dá)還發(fā)布了針對(duì)軟件的更新——TensorRT 4軟件。這一軟件可用于優(yōu)化、驗(yàn)證和部署在超大規(guī)模數(shù)據(jù)中心、嵌入式與汽車GPU平臺(tái)中經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)。
為了籠絡(luò)更多的開發(fā)者,英偉達(dá)與谷歌的工程師將TensorRT集成至谷歌的TensorFlow 1.7中。
自動(dòng)駕駛—暫停自動(dòng)駕駛研發(fā)
自動(dòng)駕駛?cè)栽诒敬蜧TC的討論之列
英偉達(dá)的自動(dòng)駕駛平臺(tái)可以統(tǒng)稱為Drive PX系列。但是其實(shí),Drive PX只是NVIDIA車載AI平臺(tái)的系列名稱。而這個(gè)系列目前主要包括兩代產(chǎn)品:已經(jīng)量產(chǎn)的Drive PX 2平臺(tái),以及在2018年初展示的新一代平臺(tái)Xavier。
不過黃仁勛卻在GTC 2018上宣布英偉達(dá)將暫停自動(dòng)駕駛的研發(fā)工作,雖然沒有說明何時(shí)能再推進(jìn)這一進(jìn)程,但是他也表示“不會(huì)太久。”
在2018年2月9日對(duì)外發(fā)布的2018財(cái)年第四季度及全年財(cái)報(bào)中,英偉達(dá)曾經(jīng)提到過與Uber、Aurora合作打造自動(dòng)駕駛汽車,采用的就是開源的NVIDIA Drive人工智能自動(dòng)駕駛平臺(tái)。
美國(guó)當(dāng)?shù)貢r(shí)間3月18日晚上,亞利桑那州一名女子被Uber自動(dòng)駕駛汽車撞傷,之后不幸身亡。這是全球首例自動(dòng)駕駛車輛致人死亡的事故,隨后Uber宣布將暫停其在美國(guó)和加拿大的自動(dòng)駕駛項(xiàng)目。隨后在26日,亞利桑那州州長(zhǎng)宣布暫禁Uber在亞利桑那州公路測(cè)試自駕車。
黃仁勛在回答媒體關(guān)于該案件的提問時(shí)表示,英偉達(dá)對(duì)于這個(gè)意外感到悲傷,但是自動(dòng)駕駛的研究本身是沒有錯(cuò)的,應(yīng)該從這個(gè)案件中吸取經(jīng)驗(yàn),提升自動(dòng)駕駛的安全性。作為Uber在自動(dòng)駕駛領(lǐng)域的合作方之一,英偉達(dá)暫停自動(dòng)駕駛的研發(fā)可能和Uber的自動(dòng)駕駛汽車撞人致死案有關(guān),但其并沒有完全放棄自動(dòng)駕駛項(xiàng)目。
英偉達(dá)的DRIVE Constellation仿真系統(tǒng)
英偉達(dá)在GTC上推出了針對(duì)自動(dòng)駕駛汽車測(cè)試的仿真系統(tǒng)——DRIVE Constellation。
DRIVE Constellation仿真系統(tǒng)是一套使用照片級(jí)真實(shí)感模擬,基于云的自動(dòng)駕駛汽車測(cè)試系統(tǒng)。它基于兩個(gè)不同的服務(wù)器,第一臺(tái)服務(wù)器運(yùn)行的是DRIVE Sim軟件,可以模擬自動(dòng)駕駛汽車的傳感器,比如攝像頭、激光雷達(dá)和雷達(dá)等。
DRIVE Sim軟件可以通過生成照片級(jí)的數(shù)據(jù)流,從而創(chuàng)建不同的測(cè)試環(huán)境,比如晴天、暴雨、暴雪等不同的天氣狀況、日間和夜間等不同的光線狀況、急轉(zhuǎn)彎或陡坡等不同的路面狀況。并且在模擬過程中設(shè)置各種危險(xiǎn)和突發(fā)狀況,比如行人突然穿越馬路等,以測(cè)試自動(dòng)駕駛汽車的反應(yīng)能力,以確定其不會(huì)對(duì)人帶來(lái)安全威脅。
第二臺(tái)服務(wù)器搭載的是NVIDIA DRIVE Pegasus AI汽車計(jì)算平臺(tái),運(yùn)行完整的自動(dòng)駕駛汽車軟件堆棧,并能夠處理傳感器搜集模擬數(shù)據(jù)。經(jīng)過處理的數(shù)據(jù)會(huì)被反饋給傳感器,一直進(jìn)行數(shù)據(jù)的循環(huán)。
從時(shí)間來(lái)看,英偉達(dá)推出的這個(gè)仿真系統(tǒng)和Uber的自動(dòng)駕駛汽車撞人致死案并無(wú)太大關(guān)聯(lián),不過在長(zhǎng)遠(yuǎn)的未來(lái),它將能有效幫助提升自動(dòng)駕駛汽車測(cè)試的安全性。
英偉達(dá)還宣布與ARM達(dá)成了合作,共同為全球數(shù)十億臺(tái)IoT設(shè)備提供深度學(xué)習(xí)的能力。雙方將開源的英偉達(dá)深度學(xué)習(xí)加速器整合到ARM的Project Trillium機(jī)器學(xué)習(xí)平臺(tái)上。
2018年2月23日,ARM推出了Project Trillium項(xiàng)目,這是一套包括新的高度可擴(kuò)展處理器的ARM IP組合,這些產(chǎn)品可以提供增強(qiáng)的機(jī)器學(xué)習(xí)(ML)和神經(jīng)網(wǎng)絡(luò)(NN)功能。當(dāng)前的技術(shù)產(chǎn)品主要針對(duì)移動(dòng)設(shè)備市場(chǎng),將讓全新的搭載機(jī)器學(xué)習(xí)功能的設(shè)備具有先進(jìn)的計(jì)算能力,包括先進(jìn)的目標(biāo)檢測(cè)功能。
在將英偉達(dá)深度學(xué)習(xí)加速器整合到Project Trillium之后,全球數(shù)十億臺(tái)的消費(fèi)電子設(shè)備上的IoT芯片將具備機(jī)器學(xué)習(xí)能力。
GTC之外—計(jì)算力提升從創(chuàng)新驅(qū)動(dòng)變?yōu)樾枨篁?qū)動(dòng)
提到英偉達(dá)和黃仁勛,就不得不提到CPU。在2017年的GTC上,黃仁勛曾聲稱摩爾定律已經(jīng)終結(jié),設(shè)計(jì)人員無(wú)法再創(chuàng)造出可以實(shí)現(xiàn)更高指令集并行的GPU架構(gòu),晶體管數(shù)量每年增長(zhǎng)50%,但CPU的性能每年僅增長(zhǎng)10%。
在演講中,黃仁勛沒有放過任何一次揶揄CPU的機(jī)會(huì)。不管是更新后的Tesla V100、DGX 2,還是最新發(fā)布的GV100 GPU,黃仁勛聲稱“在提供相同的計(jì)算力下,它們都比CPU組成的集群要更節(jié)能、高效,占用更少的空間?!?/p>
“買得越多,省得越多?!币呀?jīng)成了他的口頭禪。然而回歸到英偉達(dá)本身,其本身的高速增長(zhǎng)很大一部分是依賴于市場(chǎng)對(duì)圖形芯片的巨大需求。
在英偉達(dá)公布的2018財(cái)年第四季度財(cái)報(bào)中,雖然數(shù)據(jù)中心業(yè)務(wù)同比實(shí)現(xiàn)了一倍多的增長(zhǎng)達(dá)到6.06億美元。但游戲圖形芯片業(yè)務(wù)的營(yíng)收達(dá)17.4億美元,同比增長(zhǎng)29%,占該季度總營(yíng)收的一半以上。
“加密貨幣市場(chǎng)的強(qiáng)勁需求超出了我們的預(yù)期。” 英偉達(dá)首席財(cái)務(wù)官科萊特·克雷斯表示,“盡管加密貨幣對(duì)我們業(yè)務(wù)的總體貢獻(xiàn)仍難以量化,但我們認(rèn)為,其在營(yíng)收中所比例高于上一季度?!?/p>
從產(chǎn)品本身來(lái)說, GPU目前只能是不斷疊加性能,帶來(lái)的驚喜越來(lái)越少。以DGX系列為例,內(nèi)含的GPU芯片從4顆變成了8顆,今年從8顆增長(zhǎng)到了16顆,改變的只不過是互聯(lián)的架構(gòu)。單顆芯片的算力提升越來(lái)越難,英偉達(dá)的“橫向發(fā)展”只是另辟蹊徑。
不過,英特爾的Nervana芯片,谷歌的TPU(目前只在谷歌內(nèi)部使用)對(duì)于英偉達(dá)來(lái)說是潛在的競(jìng)爭(zhēng)對(duì)手。有競(jìng)爭(zhēng)在,更大的驚喜才有可能會(huì)到來(lái)。
未來(lái)智能實(shí)驗(yàn)室是人工智能學(xué)家與科學(xué)院相關(guān)機(jī)構(gòu)聯(lián)合成立的人工智能,互聯(lián)網(wǎng)和腦科學(xué)交叉研究機(jī)構(gòu)。
未來(lái)智能實(shí)驗(yàn)室的主要工作包括:建立AI智能系統(tǒng)智商評(píng)測(cè)體系,開展世界人工智能智商評(píng)測(cè);開展互聯(lián)網(wǎng)(城市)云腦研究計(jì)劃,構(gòu)建互聯(lián)網(wǎng)(城市)云腦技術(shù)和企業(yè)圖譜,為提升企業(yè),行業(yè)與城市的智能水平服務(wù)。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5653瀏覽量
109925 -
gpu
+關(guān)注
關(guān)注
28文章
5222瀏覽量
135732 -
人工智能
+關(guān)注
關(guān)注
1819文章
50160瀏覽量
266000
原文標(biāo)題:Nvidia黃仁勛發(fā)布了全球最大GPU
文章出處:【微信號(hào):AItists,微信公眾號(hào):人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
Oracle和NVIDIA合作加速向量搜索和企業(yè)數(shù)據(jù)處理
NVIDIA推出cuEST量子化學(xué)加速庫(kù)
借助NVIDIA CUDA Tile IR后端推進(jìn)OpenAI Triton的GPU編程
NVIDIA RTX PRO 5000 Blackwell GPU的深度評(píng)測(cè)
NVIDIA RTX PRO 4000 Blackwell GPU性能測(cè)試
NVIDIA RTX PRO 5000 72GB Blackwell GPU現(xiàn)已全面上市
在Python中借助NVIDIA CUDA Tile簡(jiǎn)化GPU編程
利用NVIDIA Cosmos開放世界基礎(chǔ)模型加速物理AI開發(fā)
NVIDIA RTX PRO 2000 Blackwell GPU性能測(cè)試
NVIDIA Isaac Lab多GPU多節(jié)點(diǎn)訓(xùn)練指南
NVIDIA RTX PRO 4500 Blackwell GPU測(cè)試分析
Nvidia發(fā)布世界最大GPU
評(píng)論