借助 NVIDIA NGC 目錄中的 GPU 優(yōu)化容器,更快地開(kāi)發(fā)和部署應(yīng)用。
什么是容器?
容器是一種便攜式軟件單元,可將應(yīng)用及其所有依賴項(xiàng)合并為一個(gè)軟件包,該軟件包不受底層主機(jī)操作系統(tǒng)限制。這樣無(wú)需再構(gòu)建復(fù)雜的環(huán)境,并簡(jiǎn)化了應(yīng)用開(kāi)發(fā)到部署的過(guò)程。
NVIDIA NGC 目錄包含一系列用于深度學(xué)習(xí)、機(jī)器學(xué)習(xí)、可視化和高性能計(jì)算(HPC)應(yīng)用的 GPU 優(yōu)化容器,這些容器均已經(jīng)過(guò)了性能、安全性和可擴(kuò)展性測(cè)試。
NGC 目錄中的容器的優(yōu)勢(shì)
輕松部署
內(nèi)置庫(kù)和依賴項(xiàng)可讓您輕松部署和運(yùn)行應(yīng)用。
加快訓(xùn)練速度
TensorFlow 和 PyTorch 等 NVIDIA AI 容器每月會(huì)提供針對(duì)性能優(yōu)化的更新版本,以便加快 AI 訓(xùn)練和推理速度。
運(yùn)行位置不受限制
在 bare metal、虛擬機(jī)(VM)和 Kubernetes 上,將容器部署在任意位置(云端、內(nèi)部私有云和邊緣)的多 GPU/多節(jié)點(diǎn)系統(tǒng)上。
放心部署
容器經(jīng)過(guò)常見(jiàn)漏洞和暴露(CVE)掃描(附有安全報(bào)告),并通過(guò) NVIDIA AI Enterprise 得到了可選的企業(yè)支持。
性能優(yōu)化
NVIDIA 構(gòu)建的 Docker 容器每月都會(huì)更新,第三方軟件也會(huì)定期更新,以提供所需的功能,便于您從現(xiàn)有基礎(chǔ)架構(gòu)中獲得出色性能,并縮短找出解決方案的時(shí)間。
借助 BERT-Large 進(jìn)行自然語(yǔ)言處理
BERT-Large 利用 VoltaV100 和 Ampere A100 GPU 上的混合精度運(yùn)算和 Tensor Core,在保持目標(biāo)準(zhǔn)確性的同時(shí)縮短訓(xùn)練時(shí)間。
在單節(jié)點(diǎn)的 8x V100 (16GB) 和 A100 (40GB) 上使用 TensorFlow 時(shí),BERT-Large 和訓(xùn)練的性能表現(xiàn)。混合精度。BERT 的批量大?。? (V100)、24(A100)
用于圖像處理的 ResNet50 v1.5
此模型使用 Volta、Turing 和 NVIDIA Ampere GPU 體系架構(gòu)上的 Tensor Core 進(jìn)行混合精度訓(xùn)練,以加快訓(xùn)練速度。
在單節(jié)點(diǎn) 8x V100 (16GB) 和 A100 (40GB) 上使用 TensorFlow 時(shí),ResNet 50 的性能表現(xiàn)。混合精度。ResNet50 批量大小:26
用于深度學(xué)習(xí)的 Matlab
持續(xù)開(kāi)發(fā) Matlab 深度學(xué)習(xí)容器可提高訓(xùn)練和推理性能。
Windows 10,Intel Xeon E5-2623 @2.4GHz,NVIDIA Titan V 12GB GPU
用于各種工作負(fù)載的容器
AI 容器
TensorFlow
TensorFlow 是一個(gè)用于高性能數(shù)值計(jì)算的開(kāi)源軟件庫(kù)。
PyTorch
PyTorch 是具有 Python 前端的 GPU 加速型張量計(jì)算框架。
NVIDIA Triton 推理服務(wù)器
NVIDIA Triton 推理服務(wù)器是一種開(kāi)源推理解決方案,可更大限度地提高 GPU 的利用率和性能。
NVIDIA TensorRT
NVIDIA TensorRT 是一個(gè)C++ 庫(kù),可加快 NVIDIA GPU 上的高性能推理。
應(yīng)用框架
NVIDIA Clara
用于醫(yī)療成像的 NVIDIA Clara Train 是一個(gè)應(yīng)用框架,包含超過(guò) 20 個(gè)先進(jìn)的預(yù)訓(xùn)練模型、遷移學(xué)習(xí)和聯(lián)合學(xué)習(xí)工具、AutoML,以及 AI 輔助的標(biāo)記數(shù)據(jù)。
DeepStream
DeepStream 是一款流分析工具包,可用于基于 AI 的視頻、音頻和圖像理解和多傳感器處理。
NVIDIA Riva
NVIDIA Riva 是一個(gè)應(yīng)用框架,適用于在 GPU 上提供實(shí)時(shí)性能的多模態(tài)對(duì)話式 AI 服務(wù)。
Merlin Training
Merlin HugeCTR 是 NVIDIA Merlin 的組件,是一款專為推薦系統(tǒng)設(shè)計(jì)的深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練框架。
HPC 容器
NAMD
NAMD 是一段并行分子動(dòng)力學(xué)代碼,旨在實(shí)現(xiàn)生物大分子系統(tǒng)的高性能模擬。
GROMACS 是一款熱門的分子動(dòng)力學(xué)應(yīng)用,用于模擬蛋白質(zhì)和脂質(zhì)。
Relion
Relion 采用經(jīng)驗(yàn)貝葉斯方法分析低溫電子顯微鏡(cryo EM)。
NVIDIA HPC SDK
NVIDIA HPC SDK 是編譯器、庫(kù)和工具的綜合套件,用于構(gòu)建、部署和管理 HPC 應(yīng)用。
點(diǎn)擊閱讀原文,了解更多 AI 和 HPC 容器相關(guān)內(nèi)容
NVIDIA 深度學(xué)習(xí)培訓(xùn)中心
我們的 NVIDIA 深度學(xué)習(xí)培訓(xùn)中心還推出了 AI 和 HPC 容器及 NGC 相關(guān)課程,您可以復(fù)制鏈接查看課程詳情。
使用容器實(shí)現(xiàn)高性能計(jì)算
學(xué)習(xí)使用容器化環(huán)境開(kāi)發(fā)高性能計(jì)算(HPC)應(yīng)用程序,降低編碼的復(fù)雜性和可移植性,從而提高開(kāi)發(fā)效率。
原文標(biāo)題:DevZone | AI和HPC容器
文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
審核編輯:湯梓紅
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5570瀏覽量
109379 -
gpu
+關(guān)注
關(guān)注
28文章
5150瀏覽量
134747 -
容器
+關(guān)注
關(guān)注
0文章
524瀏覽量
22893
原文標(biāo)題:DevZone | AI和HPC容器
文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
NVIDIA RTX PRO 5000 Blackwell GPU的深度評(píng)測(cè)
NVIDIA RTX PRO 4000 Blackwell GPU性能測(cè)試
NVIDIA RTX PRO 5000 72GB Blackwell GPU現(xiàn)已全面上市
NVIDIA Omniverse基于Container的部署推流方案
在Python中借助NVIDIA CUDA Tile簡(jiǎn)化GPU編程
NVIDIA RTX PRO 2000 Blackwell GPU性能測(cè)試
NVIDIA Isaac Lab多GPU多節(jié)點(diǎn)訓(xùn)練指南
DeepSeek R1 MTP在TensorRT-LLM中的實(shí)現(xiàn)與優(yōu)化
NVIDIA RTX PRO 4500 Blackwell GPU測(cè)試分析
NVIDIA桌面GPU系列擴(kuò)展新產(chǎn)品
如何在Ray分布式計(jì)算框架下集成NVIDIA Nsight Systems進(jìn)行GPU性能分析
NVIDIA Blackwell GPU優(yōu)化DeepSeek-R1性能 打破DeepSeek-R1在最小延遲場(chǎng)景中的性能紀(jì)錄
NVIDIA NGC目錄中的GPU優(yōu)化容器
評(píng)論