NVIDIA宣布推出 Pascal 架構(gòu)深度學(xué)習(xí)平臺的最新生力軍 Tesla P4 及 P40 GPU 加速器
NVIDIA(英偉達)21 日宣布推出 Pascal 架構(gòu)深度學(xué)習(xí)平臺的最新生力軍 NVIDIA Tesla P4 及 P40 GPU 加速器與全新軟件,在效能及速度提供大幅度的提升以加速人工智能服務(wù)的推論生產(chǎn)作業(yè)負載。
語音助理、待過濾垃圾郵件及電影與產(chǎn)品推薦引擎等現(xiàn)代人工智能(AI)服務(wù)越來越復(fù)雜,與一年前的神經(jīng)網(wǎng)絡(luò)相比需要高出 10 倍的運算。目前以 CPU 為主的技術(shù)無法提供現(xiàn)代人工智能服務(wù)所需要的即時回應(yīng)能力,導(dǎo)致不佳的使用者經(jīng)驗。
Tesla P4 及 P40 特別針對推論設(shè)計,使用經(jīng)訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)辨識語音、影像及文字以回應(yīng)使用者和設(shè)備要求。Pascal 架構(gòu) GPU 具備以 8 位(INT8)運算為主的專門推論指令,提供比 CPU 快 45 倍的反應(yīng)速度,與不到一年前推出的 GPU 解決方案相比則提升了 4 倍。
Tesla P4 為數(shù)據(jù)中心帶來最高的能源效率,其小尺寸及最小 50 瓦特的低功率設(shè)計可安裝于任何服務(wù)器內(nèi),讓生產(chǎn)作業(yè)負載推論的能源效率達 CPU 的 40 倍。在進行視訊推論作業(yè)負載時,單一服務(wù)器里安裝單顆 Tesla P4 即可取代 13 臺僅采用 CPU 的服務(wù)器;而包含服務(wù)器及用電量的總持有成本則能節(jié)省達 8 倍。
Tesla P40 為深度學(xué)習(xí)作業(yè)負載帶來最大的處理量。一臺搭載 8 顆 Tesla P40 加速器的服務(wù)器擁有每秒 47 兆次運算(TOPS)的推論效能及 INT8 指令,可取代 140 臺以上的 CPU 服務(wù)器的效能。若以每臺 CPU 服務(wù)器約 5,000 美元計算,可節(jié)省 65 萬美元以上的服務(wù)器采購成本。
NVIDIA 加速運算總經(jīng)理 Ian Buck 表示:“有了 Tesla P100 以及新推出的 Tesla P4 及 P40,NVIDIA 為數(shù)據(jù)中心提供唯一的端對端深度學(xué)習(xí)平臺,為各大產(chǎn)業(yè)釋放龐大的人工智能潛力。將訓(xùn)練時間從數(shù)天大幅縮短至數(shù)小時,能立即解析資料,并透過人工智能服務(wù)即時對消費者做出回應(yīng)?!?/span>
實現(xiàn)更快速推論的軟件工具
另外與 Tesla P4 及 P40 推出的包含兩項加速人工智能推論的創(chuàng)新軟件:NVIDIA TensorRT 及 NVIDIA DeepStream SDK。
TensorRT 為針對優(yōu)化生產(chǎn)部署所設(shè)計的深度學(xué)習(xí)模型函式庫,具有立即回應(yīng)極度復(fù)雜網(wǎng)絡(luò)的能力。透過訓(xùn)練過的 32 位或 16 位定義神經(jīng)網(wǎng)絡(luò)以及設(shè)定以降低精度的 INT8 運算為目的進行優(yōu)化,將深度學(xué)習(xí)應(yīng)用的處理量及效率極大化。
NVIDIA DeepStream SDK 銜接強大的 Pascal 服務(wù)器,與雙 CPU 只能處理 7 個串流的運算能力相比,能即時同步解碼并分析高達 93 個 HD 視訊串流。這解決人工智能的其中一項重大挑戰(zhàn):處理大規(guī)模的影音內(nèi)容分析以應(yīng)用到如自駕車、互動式機器人、過濾及廣告投放等領(lǐng)域。深度學(xué)習(xí)整合至視訊應(yīng)用中讓企業(yè)能提供前所未有、智能且創(chuàng)新的視訊服務(wù)。
協(xié)助客戶向前邁進NVIDIA 的客戶提供越來越多需要最高運算效能的創(chuàng)新人工智能服務(wù)。其中中國***廠商廣達持續(xù)在服務(wù)器業(yè)務(wù)與 NVIDIA 合作,從世上首座人工智能超級電腦系統(tǒng) DGX-1、Facebook Big Sur 推論服務(wù)器到搭載 NVIDIA 糖果盒大小 Tesla P4 輕巧 1U 服務(wù)器,皆透過該公司而得以打造出優(yōu)異的產(chǎn)品陣容。
NVIDIA 共同創(chuàng)辦人暨CEO黃仁勛表示:“廣達從早期便與我們一同致力于 GPU 服務(wù)器發(fā)展,不論想建造何種類型數(shù)據(jù)中心,透過我們與廣達及云達的合作都能達成?!?/span>
云達科技總經(jīng)理楊晴華表示:“我們的客戶相當(dāng)倚重云達在超大規(guī)模 、高密度融合機架式等級解決方案中的領(lǐng)導(dǎo)地位,這些解決方案通常都需要高效能的作業(yè)負載。以深度學(xué)習(xí)的應(yīng)用而言,平行運算回應(yīng)之間的延遲性表現(xiàn)十分重要,而 Tesla P40 和 P4 正是能表現(xiàn)出準(zhǔn)確與靈敏效能的新一代 GPU 解決方案。”
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%
相關(guān)閱讀:
- [電子說] Blackwell GB100能否在超級計算機和AI市場保持領(lǐng)先優(yōu)勢? 2023-10-24
- [電子說] 如何創(chuàng)建FPGA控制的機器人手臂 2023-10-24
- [電子說] 怎樣延長半導(dǎo)體元器件的壽命呢? 2023-10-24
- [電子說] 射頻識別技術(shù)漫談(27)——CPU卡概述 2023-10-24
- [電子說] 講一講Apple Macintosh處理器過渡的故事 2023-10-24
- [電子說] 智能時代的三大核心技術(shù) 2023-10-24
- [電子說] 國產(chǎn)金融工控機的廣泛應(yīng)用領(lǐng)域和獨特優(yōu)勢 2023-10-24
- [人工智能] 研華推出EPC-B3000系列嵌入式工控機,搭載先進X86架構(gòu)CPU,助力邊緣人工智能應(yīng)用 2023-10-24
( 發(fā)表人:steve )