Kubernetes 是一個(gè)開源的容器編排系統(tǒng),用于自動(dòng)化計(jì)算機(jī)應(yīng)用程序部署、擴(kuò)展和管理。它是一個(gè)非常流行的工具,可以用于自動(dòng)展開和回滾、水平擴(kuò)展、存儲(chǔ)編排等。對(duì)于許多組織來說, Kubernetes 是其基礎(chǔ)架構(gòu)的關(guān)鍵組件。
安裝和擴(kuò)展 Kubernetes 的一個(gè)關(guān)鍵步驟是確保它正確利用基礎(chǔ)設(shè)施的其他組件。 NVIDIA 運(yùn)營商優(yōu)化 Kubernetes 上的 GPU 和 NIC 的安裝和管理,使軟件堆棧能夠在云中運(yùn)行最需要資源的工作負(fù)載,如 AI 、 ML 、 DL 和 HPC ,數(shù)據(jù)中心和邊緣。 NVIDIA 運(yùn)營商由 GPU 運(yùn)營商和網(wǎng)絡(luò)運(yùn)營商組成,是開源的,基于運(yùn)營商框架。
NVIDIA GPU 運(yùn)算符
NVIDIA GPU 操作符被打包為一個(gè) Helm 圖表,并安裝和管理軟件組件的生命周期,以便 GPU 加速的應(yīng)用程序可以在 Kubernetes 上運(yùn)行。這些組件包括 GPU 功能發(fā)現(xiàn)、 NVIDIA 驅(qū)動(dòng)程序、 Kubernetes 設(shè)備插件、 NVIDIA 容器工具包和 DCGM 監(jiān)控。
GPU 操作符使基礎(chǔ)結(jié)構(gòu)團(tuán)隊(duì)能夠在集群級(jí)別與 Kubernetes 一起使用時(shí)管理 GPU 的生命周期,因此無需單獨(dú)管理每個(gè)節(jié)點(diǎn)。以前,基礎(chǔ)架構(gòu)團(tuán)隊(duì)必須管理兩個(gè)操作系統(tǒng)映像,一個(gè)用于 GPU 節(jié)點(diǎn),另一個(gè)用于 CPU 節(jié)點(diǎn)。當(dāng)使用 GPU 操作符時(shí),基礎(chǔ)設(shè)施團(tuán)隊(duì)也可以將 CPU 映像與 GPU 工作節(jié)點(diǎn)一起使用。
NVIDIA 網(wǎng)絡(luò)運(yùn)營商
網(wǎng)絡(luò)運(yùn)營商負(fù)責(zé)自動(dòng)化 Kubernetes 集群中主機(jī)網(wǎng)絡(luò)組件的部署和管理。它包括 Kubernetes 設(shè)備插件、 NVIDIA 驅(qū)動(dòng)程序、 NVIDIA 對(duì)等內(nèi)存驅(qū)動(dòng)程序和 Multus 、 macvlan CNIs 。這些組件以前是手動(dòng)安裝的,但通過網(wǎng)絡(luò)運(yùn)營商實(shí)現(xiàn)了自動(dòng)化,簡(jiǎn)化了部署過程,并通過增強(qiáng)的客戶體驗(yàn)實(shí)現(xiàn)了加速計(jì)算。
單獨(dú)或一起使用, NVIDIA 操作符簡(jiǎn)化了 Kubernetes 上的 GPU 和 SmartNIC 配置,并與合作伙伴云平臺(tái)兼容。要了解有關(guān)這些組件的更多信息,以及 NVIDIA 操作員如何解決運(yùn)行 AI 、 ML 、 DL 和 HPC 工作負(fù)載的關(guān)鍵挑戰(zhàn),并簡(jiǎn)化初始設(shè)置和第 2 天操作,請(qǐng)查看按需網(wǎng)絡(luò)研討會(huì)“ 用 NVIDIA Operators 加速 Kubernetes ”。
關(guān)于作者
Troy Estes 是 NVIDIA Edge 和企業(yè)計(jì)算解決方案的產(chǎn)品營銷經(jīng)理。在加入 Edge & Enterprise 業(yè)務(wù)部門之前,特洛伊曾在自主汽車業(yè)務(wù)部門和 NVIDIA 電網(wǎng)產(chǎn)品集團(tuán)從事營銷活動(dòng)和支持產(chǎn)品 GTM 。
審核編輯:郭婷
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5570瀏覽量
109394 -
gpu
+關(guān)注
關(guān)注
28文章
5154瀏覽量
134762 -
計(jì)算機(jī)
+關(guān)注
關(guān)注
19文章
7790瀏覽量
92981
發(fā)布評(píng)論請(qǐng)先 登錄
如何在TensorFlow Lite Micro中添加自定義操作符(1)
利用NVIDIA Cosmos開放世界基礎(chǔ)模型加速物理AI開發(fā)
C語言位操作符
NVIDIA助力構(gòu)建人形機(jī)器人全身遙操作仿真平臺(tái)
NVIDIA Dynamo新增對(duì)亞馬遜云科技服務(wù)的支持
NVIDIA RTX AI加速FLUX.1 Kontext現(xiàn)已開放下載
NVIDIA全棧加速代理式AI應(yīng)用落地
NVIDIA Isaac Sim與NVIDIA Isaac Lab的更新
NVIDIA攜手微軟加速代理式AI發(fā)展
Kubernetes Helm入門指南
NVIDIA Cosmos加速機(jī)器人和自動(dòng)駕駛汽車物理AI發(fā)展
NVIDIA加速的Apache Spark助力企業(yè)節(jié)省大量成本
英偉達(dá)GTC2025亮點(diǎn):Oracle與NVIDIA合作助力企業(yè)加速代理式AI推理
Oracle 與 NVIDIA 合作助力企業(yè)加速代理式 AI 推理
使用NVIDIA操作符加速Kubernetes
評(píng)論