現(xiàn)代數(shù)據(jù)中心變得越來(lái)越難以管理。應(yīng)用程序和 PB 級(jí)日志數(shù)據(jù)之間有數(shù)十億條可能的連接路徑。靜態(tài)規(guī)則不足以適應(yīng)動(dòng)態(tài)微服務(wù)的安全策略,而且人工已經(jīng)無(wú)法應(yīng)對(duì)數(shù)量龐大的日志數(shù)據(jù)的分析。
AI 是通往未來(lái)安全和自主管理式數(shù)據(jù)中心的唯一出路。
NVIDIA 融合加速器在業(yè)界率先推出 AI 增強(qiáng)型 DPU。它將 GPU 的強(qiáng)大計(jì)算能力與 DPU 的網(wǎng)絡(luò)加速和安全優(yōu)勢(shì)相結(jié)合,為 AI 增強(qiáng)型數(shù)據(jù)中心管理創(chuàng)造了統(tǒng)一平臺(tái)。融合加速器可將 AI 生成的規(guī)則應(yīng)用于數(shù)據(jù)中心網(wǎng)絡(luò)中的每個(gè)數(shù)據(jù)包,為實(shí)現(xiàn)實(shí)時(shí)安全和管理創(chuàng)造新的可能性。圖像展示了將 BlueField2 DPU 和 Ampere GPU 相結(jié)合的 NVIDIA 新型融合加速器。

圖 1.在標(biāo)準(zhǔn)模式下,BlueField-2 DPU 和 GPU 通過(guò)專用 PCIe 4.0 交換機(jī)連接以獲得完整帶寬,獨(dú)立于主機(jī) PCIE 系統(tǒng)帶寬。
在 NVIDIA GTC 大會(huì)上,我們推出了兩款新型融合加速器。A100X 在單一模組中融合了 A100 Tensor Core GPU 和 NVIDIA BlueField-2 數(shù)據(jù)處理器。A30X 則融合了 A30 Tensor Core GPU 和相同的 BlueField-2 DPU。融合卡具有獨(dú)特的能力,除了BlueField-2 的卸載、隔離和加速網(wǎng)絡(luò)功能,進(jìn)一步拓展到 AI 推理和訓(xùn)練功能。
兩款加速器都包含一個(gè)集成的 PCIe 交換機(jī)實(shí)現(xiàn)DPU 和 GPU 連接。集成交換機(jī)能夠消除對(duì)主機(jī)資源的爭(zhēng)用,實(shí)現(xiàn)線速 GPUDirect RDMA 性能。集成交換機(jī)還通過(guò)隔離 GPU 和網(wǎng)卡之間移動(dòng)的數(shù)據(jù)來(lái)提高安全性。
AI 增強(qiáng)型 DPU
融合加速器支持兩種運(yùn)行模式:
標(biāo)準(zhǔn)模式 – BlueField-2 DPU 和 GPU 分別獨(dú)立運(yùn)行。
BlueField-X模式 – PCI 交換機(jī)進(jìn)行了重新配置,GPU 將專用于 DPU,并且對(duì)于主機(jī)系統(tǒng)不可見(jiàn)。
在 BlueField-X 模式下,只有DPU 上運(yùn)行的操作系統(tǒng)可見(jiàn)到GPU。BlueField-X 模式在業(yè)界首創(chuàng)了一種新型加速器類型:GPU 加速的 DPU。圖像展示了在 BlueField-X 模式下,主機(jī)服務(wù)器中的 CPU 連接到融合加速器。融合加速器的 PCIe 交換機(jī)連接到 CPU 和 DPU。而GPU 僅通過(guò)PCIe 交換機(jī)與 DPU連接。

圖 2.在 BlueField-X 模式下,x86 主機(jī)只能看到 BlueField-2 DPU,支持 DPU 在網(wǎng)絡(luò)數(shù)據(jù)上運(yùn)行 AI 工作負(fù)載。
在 BlueField-X 模式下,GPU 可以對(duì)流經(jīng) DPU 的數(shù)據(jù)運(yùn)行 AI 模型,成為“bump in the wire”。保障安全同時(shí),無(wú)性能損耗。AI 模型無(wú)需消耗主機(jī)資源,實(shí)現(xiàn)完全加速。
BlueField-X 為網(wǎng)絡(luò)安全、數(shù)據(jù)中心管理和 I/O 加速解鎖新穎使用場(chǎng)景。例如,Morpheus 網(wǎng)絡(luò)安全框架使用機(jī)器學(xué)習(xí)對(duì)以往無(wú)法識(shí)別的安全威脅進(jìn)行有效處理。Morpheus 通過(guò) DPU 從數(shù)據(jù)中心的各個(gè)服務(wù)器獲取遙測(cè)數(shù)據(jù),并將其發(fā)送到配備 GPU 的服務(wù)器進(jìn)行分析。
有了 BlueField-X,AI 模型可以在每個(gè)服務(wù)器的融合加速器上直接本地運(yùn)行。這使 Morpheus 能夠更快地分析更多數(shù)據(jù),同時(shí)消除代價(jià)很高的數(shù)據(jù)移動(dòng),并縮小惡意攻擊面。由 BlueField-X 加速的 Morpheus 使用案例包括惡意軟件檢測(cè)、數(shù)據(jù)泄漏預(yù)防和動(dòng)態(tài)防火墻規(guī)則創(chuàng)建等。
Morpheus 示例僅僅是BlueField-X實(shí)現(xiàn)加速的一種使用場(chǎng)景。我們的客戶經(jīng)常與我們分享一些我們尚未考慮到的新想法。為了對(duì) AI 增強(qiáng)的網(wǎng)絡(luò)進(jìn)行更多創(chuàng)造性的探索,我們現(xiàn)正推出 NVIDIA 融合加速器開(kāi)發(fā)套件。
結(jié)合此開(kāi)發(fā)套件,我們?yōu)橛幸鈽?gòu)建新一代加速 AI 網(wǎng)絡(luò)應(yīng)用的特定客戶和合作伙伴提供 A30X 加速器的搶先體驗(yàn)計(jì)劃。在邊緣計(jì)算或數(shù)據(jù)中心管理中探索 BlueField-X 的新應(yīng)用場(chǎng)景。以下例子為您做參考:
透明視頻預(yù)處理 – Bump in the wire視頻預(yù)處理(解密、交錯(cuò)、格式轉(zhuǎn)換等),以提高 IVA 吞吐量和攝像頭密度。
小基站RU 解決方案 – RAN 信號(hào)處理聚合加速器,以增加商業(yè) gNodeB 服務(wù)器上的用戶密度和吞吐量。
計(jì)算存儲(chǔ) – Bump in the wire存儲(chǔ)加密、索引和哈希,為長(zhǎng)期存儲(chǔ)主機(jī)數(shù)據(jù)準(zhǔn)備處理卸載昂貴的 CPU 資源。
作弊檢測(cè) – 檢測(cè)流式游戲服務(wù)中的惡意游戲/作弊
開(kāi)始使用 NVIDIA 融合加速器開(kāi)發(fā)套件
NVIDIA 融合加速器開(kāi)發(fā)套件包含有結(jié)合 CUDA 和 NVIDIA DOCA 的示例應(yīng)用程序,以及幫助您安裝、配置新型融合加速器的文檔。最重要的是,我們可以提供 A30X 及應(yīng)用支持來(lái)?yè)Q取您的寶貴反饋。
關(guān)于作者
Jacob Liberman 是 NVIDIA 企業(yè)和邊緣加速集團(tuán)的產(chǎn)品經(jīng)理。他利用 20 多年的技術(shù)計(jì)算經(jīng)驗(yàn)提供高性能、云計(jì)算原生邊緣人工智能解決方案。此前,他曾在紅帽、 AMD 和戴爾擔(dān)任產(chǎn)品管理和工程職務(wù)。
Pete Lumbis 是 NVIDIA 以太網(wǎng)網(wǎng)絡(luò)技術(shù)營(yíng)銷總監(jiān)。 Pete 幫助客戶構(gòu)建、設(shè)計(jì)、自動(dòng)化和加速下一代數(shù)據(jù)中心網(wǎng)絡(luò)。皮特是 CCIE # 28677 和 CCDE 2012 :: 3 。
審核編輯:郭婷
-
amd
+關(guān)注
關(guān)注
25文章
5669瀏覽量
139431 -
NVIDIA
+關(guān)注
關(guān)注
14文章
5570瀏覽量
109384 -
服務(wù)器
+關(guān)注
關(guān)注
14文章
10182瀏覽量
91244 -
應(yīng)用程序
+關(guān)注
關(guān)注
38文章
3343瀏覽量
60096
發(fā)布評(píng)論請(qǐng)先 登錄
利用NVIDIA Cosmos開(kāi)放世界基礎(chǔ)模型加速物理AI開(kāi)發(fā)
邊緣計(jì)算中的AI加速器類型與應(yīng)用
Cadence 借助 NVIDIA DGX SuperPOD 模型擴(kuò)展數(shù)字孿生平臺(tái)庫(kù),加速 AI 數(shù)據(jù)中心部署與運(yùn)營(yíng)
睿海光電以高效交付與廣泛兼容助力AI數(shù)據(jù)中心800G光模塊升級(jí)
加速AI未來(lái),睿海光電800G OSFP光模塊重構(gòu)數(shù)據(jù)中心互聯(lián)標(biāo)準(zhǔn)
Microchip推出Adaptec? SmartRAID 4300 系列加速器 提供安全的可擴(kuò)展 NVMe? RAID 存儲(chǔ)解決方案
粒子加速器?——?科技前沿的核心裝置
面向半定制AI基礎(chǔ)架構(gòu)的NVIDIA NVLink Fusion技術(shù)
利用NVIDIA技術(shù)構(gòu)建從數(shù)據(jù)中心到邊緣的智慧醫(yī)院解決方案
是德科技推出AI數(shù)據(jù)中心構(gòu)建器
適用于數(shù)據(jù)中心和AI時(shí)代的800G網(wǎng)絡(luò)
NVIDIA加速的Apache Spark助力企業(yè)節(jié)省大量成本
Cadence 利用 NVIDIA Grace Blackwell 加速AI驅(qū)動(dòng)的工程設(shè)計(jì)和科學(xué)應(yīng)用
Oracle 與 NVIDIA 合作助力企業(yè)加速代理式 AI 推理
利用NVIDIA融合加速器加速數(shù)據(jù)中心AI
評(píng)論