NVIDIA NetQ 是一種高度可擴(kuò)展的現(xiàn)代網(wǎng)絡(luò)操作工具,為 NVIDIA Spectrum Ethernet 平臺提供可操作的可見性。它將高級遙測技術(shù)與用戶界面相結(jié)合,使網(wǎng)絡(luò)工作流程更易于故障排除和自動化,同時減少維護(hù)和停機(jī)時間。
我們最近發(fā)布了 NetQ 4.2.0 ,其中包括:
簡化的事件管理
增強(qiáng)的流量遙測分析
新 RoCE 驗證
新增 DPU 監(jiān)控
有關(guān)新功能和增強(qiáng)功能的更多信息,請參閱 NetQ 4.2.0 用戶指南。
簡化的事件管理
通過 NetQ 4.2 ,我們簡化了通過接口傳遞網(wǎng)絡(luò)事件的方式。事件的嚴(yán)重性各不相同。一些事件是網(wǎng)絡(luò)警報,可能需要進(jìn)一步調(diào)查,而其他事件是信息性通知,可能不需要干預(yù)。在此版本之前,NetQ 將報警和信息事件顯示為兩個單獨(dú)的卡。NetQ 4.2 版本將兩個卡合并為一個卡,擴(kuò)展后,該卡將顯示一個儀表板,以幫助您快速可視化所有網(wǎng)絡(luò)事件。

圖 1 . NetQ 事件儀表板
儀表板顯示事件的時間線,以及導(dǎo)致大多數(shù)事件的開關(guān)。您可以按類型篩選事件,包括接口、網(wǎng)絡(luò)服務(wù)、系統(tǒng)和閾值交叉事件。
確認(rèn)事件有助于您專注于需要您關(guān)注的活動事件。從儀表板中,還可以創(chuàng)建規(guī)則以抑制事件。此功能還可幫助您關(guān)注活動事件,從而使已知問題或錯誤警報的顯示方式與錯誤顯示方式不同。
增強(qiáng)的流量遙測分析
NetQ 4.1.0 為 Cumulus Linux 5.x 數(shù)據(jù)中心結(jié)構(gòu)引入了結(jié)構(gòu)范圍的網(wǎng)絡(luò)延遲和緩沖區(qū)占用分析?,F(xiàn)在,NetQ 4.2 支持混合結(jié)構(gòu)中的部分路徑流遙測分析,即那些將 Cumulus Linux 5.x 交換機(jī)與其他交換機(jī)(包括非 Cumulus Linux 5.x 和第三方交換機(jī))結(jié)合使用的結(jié)構(gòu)。Cumulus Linux 5.x 設(shè)備在路徑中顯示流量統(tǒng)計信息,例如延遲和緩沖區(qū)占用。不受支持的設(shè)備在流量分析中表示為帶有紅色 X 的黑條,并且設(shè)備不顯示流量統(tǒng)計信息。

圖 2 . NetQ 流量遙測分析結(jié)果
此外,NetQ 4.2 流量遙測分析顯示了所分析流量的上下文“剛剛發(fā)生的事情”(WJH)事件和下降。帶有 WJH 事件的交換機(jī)在流分析圖中表示為紅色條紋條。將鼠標(biāo)懸停在帶有紅色條的設(shè)備上,會顯示 WJH 事件摘要。

圖 3 . 利用 WJH 數(shù)據(jù)進(jìn)行 NetQ 流量遙測分析
新 RoCE 驗證
通過聚合以太網(wǎng)使用 RDMA (RoCE),您可以通過以太網(wǎng)使用遠(yuǎn)程直接內(nèi)存訪問(RDMA)而不是使用主機(jī) CPU 來寫入計算或存儲元素。NetQ 4.0.0 引入了 RoCE 配置和計數(shù)器,包括設(shè)置各種 RoCE 閾值交叉警報(TCA)的能力。
使用 NetQ 4.2.0 ,RoCE 驗證檢查:
交換機(jī)間有損或無損模式配置的一致性
DSCP 、服務(wù)池、端口組和流量類設(shè)置的一致性
ECN 閾值設(shè)置的一致性
無損模式 PFC 配置的一致性
增強(qiáng)型變速箱選擇設(shè)置的一致性
您可以安排 RoCE 驗證定期或按需運(yùn)行。
新增 DPU 監(jiān)控
NVIDIA BlueField DPU(數(shù)據(jù)處理器)通過卸載、加速和隔離廣泛的高級網(wǎng)絡(luò)、存儲和安全服務(wù),為任何工作負(fù)載提供安全、加速的基礎(chǔ)架構(gòu)。
NetQ 幫助您監(jiān)控網(wǎng)絡(luò)上的 DPU 庫存。您可以監(jiān)視 DPU 操作系統(tǒng)、ASIC 、CPU 型號、磁盤和內(nèi)存信息,以幫助管理升級、法規(guī)遵從性和其他規(guī)劃任務(wù)。使用 NetQ ,您可以查看和監(jiān)視鍵 DPU 屬性,包括已安裝的軟件包以及 CPU 、磁盤和內(nèi)存利用率。

圖 4 . NetQ- DPU 利用率詳細(xì)信息
在本文中,您已經(jīng)看到了 NetQ 4.2.0 提供的一些新功能的概述。有關(guān)更多信息,參閱 NetQ 4.2.0 用戶指南,并使用 NVIDIA Air 瀏覽 NetQ 。
原文標(biāo)題:使用最新版本的 NVIDIA NetQ 自動化網(wǎng)絡(luò)監(jiān)控并減少停機(jī)時間
文章出處:【微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5496瀏覽量
109116 -
網(wǎng)絡(luò)
+關(guān)注
關(guān)注
14文章
8135瀏覽量
93108 -
DPU
+關(guān)注
關(guān)注
0文章
407瀏覽量
26227
原文標(biāo)題:使用最新版本的 NVIDIA NetQ 自動化網(wǎng)絡(luò)監(jiān)控并減少停機(jī)時間
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
AMD Vivado Design Suite 2025.2版本現(xiàn)已發(fā)布
NVIDIA RAPIDS 25.06版本新增多項功能
【直播預(yù)告】RT-Trace調(diào)試工具V1.1.0版本功能全解析 | 問學(xué)直播
匠芯創(chuàng)發(fā)布新版GUI開發(fā)工具 新增多國語言設(shè)置等功能
NVIDIA DOCA 3.0版本的亮點解析
CANoe產(chǎn)品體系19版本新特性及新增Option(上)
NVIDIA虛擬GPU 18.0版本的亮點
Altium Designer 25.4.2版本的新功能
NVIDIA Blackwell數(shù)據(jù)手冊與NVIDIA Blackwell架構(gòu)技術(shù)解析
芯來科技發(fā)布Nuclei Studio 2025.02版本
motorBench 2.45.0版本說明
SOLIDWORKS 2025 PDM新增功能

解析NVIDIA NetQ 4.2.0版本的新增功能
評論