在人工智能和智能機(jī)器新時(shí)代,隨著模型的準(zhǔn)確性和復(fù)雜性越來(lái)越高,CPU已經(jīng)無(wú)法再提供互動(dòng)用戶(hù)體驗(yàn),GPU作為人工智能新時(shí)代的計(jì)算引擎,可加快大規(guī)模深度學(xué)習(xí)應(yīng)用程序的速度,提供卓越的用戶(hù)體驗(yàn)。
一個(gè)值得三維設(shè)計(jì)師擊掌同樂(lè)的消息:渲云GPU渲染服務(wù)(http://www.xrender.com)將全面配備N(xiāo)VIDIA Tesla P40,可部署提供更大的吞吐量。每個(gè)GPU可帶來(lái)47TOPS(萬(wàn)億次運(yùn)算/秒)的推理性能和INT8運(yùn)算能力,使得一臺(tái)配備8個(gè)Tesla P40的服務(wù)器可提供相當(dāng)于超過(guò)140臺(tái)CPU服務(wù)器的性能。Tesla P40 可在極其復(fù)雜的模型中實(shí)現(xiàn)實(shí)時(shí)響應(yīng),能夠降低延遲,將性能提升為CPU的30倍以上。
TESLA P40加速器產(chǎn)品特點(diǎn)
??140倍吞吐量應(yīng)對(duì)爆炸性數(shù)據(jù)
Tesla P40配備新的Pascal架構(gòu),可帶來(lái)超過(guò)47 TOPS的深度學(xué)習(xí)推理性能。在處理深度學(xué)習(xí)工作負(fù)載方面,一臺(tái)使用8個(gè)Tesla P40服務(wù)器可替代140臺(tái)只使用CPU的服務(wù)器,因而可以大幅提升吞吐量并降低購(gòu)買(mǎi)成本。
??單一訓(xùn)練和推理平臺(tái)簡(jiǎn)化了操作
目前,深度學(xué)習(xí)模型在 GPU 服務(wù)器上接受訓(xùn)練,但在 CPU 服務(wù)器上部署,以便進(jìn)行推理。Tesla P40 提供極簡(jiǎn)工作流程,因此組織可以使用相同的服務(wù)器進(jìn)行迭代和部署。
??強(qiáng)悍的實(shí)時(shí)推理能力
Tesla P40具備INT8運(yùn)算能力,可在極其復(fù)雜的深度學(xué)習(xí)模型中實(shí)現(xiàn)實(shí)時(shí)響應(yīng),能將推理性能速度提升高達(dá)30倍。
??超高顯存配備及性能
密集型計(jì)算應(yīng)用需要高性能計(jì)算單元,同時(shí)高速訪(fǎng)問(wèn)數(shù)據(jù)也非常重要。在很多HPC應(yīng)用中,簡(jiǎn)單的提升HPC計(jì)算性能實(shí)際計(jì)算效率并不明顯,除非顯存性能也同時(shí)提升?;谶@個(gè)原因,Tesla P40提供了更好的性能及顯存規(guī)格,24GB,帶寬346 GB/s,無(wú)論是在顯存容量,還是顯存頻率上,都是遠(yuǎn)超同類(lèi)產(chǎn)品。
對(duì)于消費(fèi)級(jí)用戶(hù)來(lái)說(shuō),GPU就是玩游戲。對(duì)于專(zhuān)業(yè)人員來(lái)說(shuō),GPU是計(jì)算工具。NVIDIA 針對(duì)消費(fèi)級(jí)用戶(hù)設(shè)計(jì)GeForce系列產(chǎn)品,針對(duì)專(zhuān)業(yè)領(lǐng)域企業(yè)級(jí)用戶(hù)設(shè)計(jì)Tesla系列產(chǎn)品。與同類(lèi)型產(chǎn)品相較,Tesla P40有哪些優(yōu)勢(shì)?
Tesla P40 與同類(lèi)型產(chǎn)品比較
Tesla P40??VS??GeForce 1080Ti
1、錯(cuò)誤檢測(cè)和糾正,術(shù)業(yè)有專(zhuān)攻
在計(jì)算領(lǐng)域,非常依賴(lài)于GPU返回?cái)?shù)據(jù)的準(zhǔn)確性,即使內(nèi)存出現(xiàn)單比特錯(cuò)誤也可能導(dǎo)致計(jì)算結(jié)果的極大誤差。Tesla P40不僅能檢測(cè)并糾正單比特錯(cuò)誤也可以發(fā)現(xiàn)并警告雙比特錯(cuò)誤,這對(duì)保證計(jì)算結(jié)果的精準(zhǔn)性來(lái)說(shuō)非常重要。
2、顯存性能及配備高人一等
系統(tǒng)內(nèi)存越多,運(yùn)行速度越快。尤其對(duì)于某些HPC應(yīng)用程序來(lái)說(shuō),內(nèi)存不夠甚至不能執(zhí)行單次運(yùn)行。GeForce顯卡只能提供12GB顯存,而Tesla P40 GPU可提供2倍顯存——24GB,這對(duì)GPU執(zhí)行深度學(xué)習(xí)運(yùn)算時(shí)使用更大的框架提供了支持。
3、雙DMA引擎,贏在起跑線(xiàn)
GeForce產(chǎn)品一般只有單個(gè)DMA引擎,Tesla GPU產(chǎn)品采用雙DMA引擎,數(shù)據(jù)可以在CPU和GPU之間同時(shí)輸入和輸出,無(wú)需等待,效率更高。
4、64-bit雙精度浮點(diǎn)運(yùn)算
P40擁有雙精度浮點(diǎn)運(yùn)算能力,對(duì)于專(zhuān)業(yè)領(lǐng)域來(lái)說(shuō),準(zhǔn)確性是計(jì)算結(jié)果的重要指標(biāo),Tesla與GeForce的雙精度浮點(diǎn)運(yùn)算能力相差十幾倍之多。
電子發(fā)燒友App


































評(píng)論