chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

InfiniBand和遠(yuǎn)程直接訪問是什么,如何進(jìn)行配置

sakobpqhz ? 來源:算力基建 ? 作者:算力基建 ? 2022-11-25 14:26 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文簡單描述了InfiniBand 和遠(yuǎn)程直接訪問(RDMA)是什么,以及在實(shí)踐中如何配置InfiniBand網(wǎng)絡(luò)硬件。另外,本文檔解釋了如何配置與 InfiniBand 相關(guān)的服務(wù)。

01InfiniBand 和 RDMA 介紹

InfiniBand代表兩個(gè)不同的因素:

1、InfiniBand網(wǎng)絡(luò)的物理鏈路協(xié)議

2、InfiniBand Verbs API,這是RDMA(remote direct memory access)技術(shù)的一個(gè)實(shí)現(xiàn)。

RDMA 可在不涉及計(jì)算機(jī)操作系統(tǒng)的情況下,從一個(gè)計(jì)算機(jī)訪問另一臺計(jì)算機(jī)的內(nèi)存。此技術(shù)啟用了高吞 吐量和低延遲聯(lián)網(wǎng),且 CPU 使用率較低。 在典型的 IP 數(shù)據(jù)傳輸中,當(dāng)機(jī)器中的某個(gè)應(yīng)用程序向另一臺機(jī)器上的應(yīng)用程序發(fā)送數(shù)據(jù)時(shí),在接收層時(shí)會(huì)出現(xiàn)以下情況:

1、內(nèi)核必須接收數(shù)據(jù)。

2、內(nèi)核必須確定該數(shù)據(jù)是否屬于該應(yīng)用程序。

3、內(nèi)核喚醒應(yīng)用程序。

4、內(nèi)核會(huì)等待應(yīng)用程序執(zhí)行系統(tǒng)調(diào)用到內(nèi)核。

5、應(yīng)用程序?qū)?nèi)核本身的內(nèi)部內(nèi)存空間數(shù)據(jù)復(fù)制到應(yīng)用程序提供的緩沖中。

這個(gè)過程意味著,如果主機(jī)適配器使用直接內(nèi)存訪問(DMA),或者至少兩次,則大多數(shù)網(wǎng)絡(luò)流量會(huì)被復(fù)制 到系統(tǒng)的主內(nèi)存中。另外,計(jì)算機(jī)執(zhí)行很多上下文開關(guān)以在內(nèi)核和應(yīng)用程序上下文間進(jìn)行切換。這些上下 文切換都可能造成高流量率的 CPU 負(fù)載,并可能造成其他任務(wù)的性能下降。 RDMA 通訊會(huì)繞過內(nèi)核在溝通過程中的干預(yù),這和普通的 IP 通訊不同這可減少 CPU 開銷。RDMA 協(xié)議 讓主機(jī)適配器知道數(shù)據(jù)包何時(shí)來自網(wǎng)絡(luò),應(yīng)用程序應(yīng)該接收它,并在應(yīng)用程序的內(nèi)存空間中保存數(shù)據(jù)包。對于 InfiniBand,主機(jī)適配器不將數(shù)據(jù)包發(fā)送到內(nèi)核,然后將其復(fù)制到用戶應(yīng)用程序的內(nèi)存中,而是,主機(jī)適 配器將數(shù)據(jù)包的內(nèi)容直接放置在應(yīng)用程序的緩沖中。此過程需要單獨(dú)的 API、InfiniBand Verbs API,應(yīng)用 程序必須支持這個(gè)API才能使用 RDMA。 Red Hat Linux同時(shí)支持 InfiniBand 硬件和 InfiniBand Verbs API。另外,Red Hat Enterprise Linux 支持以下技術(shù),以便在非 InfiniBand 硬件中使用 InfiniBand Verbs API:

互聯(lián)網(wǎng)廣域 RDMA 協(xié)議(iWARP):通過 IP 網(wǎng)絡(luò)實(shí)施 RDMA 的網(wǎng)絡(luò)協(xié)議。

RDMA over Converged Ethernet(RoCE),也稱為以太網(wǎng)的 InfiniBand(IBoE):通過以太網(wǎng)實(shí)現(xiàn) RDMA 的網(wǎng)絡(luò)協(xié)議。

02配置 ROCE

比如 Mellanox、Broadcom 和 QLogic 都提供 RoCE 硬件。 RoCE 是一種網(wǎng)絡(luò)協(xié)議,可實(shí)現(xiàn)通過以太網(wǎng)的遠(yuǎn)程直接訪問(RDMA)。以下是不同的 RoCE 版本:

RoCE v1

RoCE 版本 1 協(xié)議是帶有 ethertype 0x8915 的以太網(wǎng)鏈路層協(xié)議,它允許同一以太網(wǎng)廣播域中任何兩個(gè)主機(jī)之間進(jìn)行通信。 默認(rèn)情況下,在使用 Mellanox ConnectX-3 網(wǎng)絡(luò)適配器時(shí),Red Hat Enterprise Linux 使用 RoCE v1 作為 RDMA 連接管理器(RDMA_CM)。

RoCE v2

RoCE 版本 2 協(xié)議在 IPv4 或 IPv6 協(xié)議的 UDP 上存在。RoCE v2 保留 UDP 目標(biāo)端口號 4791。默認(rèn)情況下,在使用 Mellanox ConnectX-3 Pro、ConnectX-4 Lx 或 ConnectX-5 網(wǎng)絡(luò)適配器時(shí),Red Hat Enterprise Linux將RoCE v2 用于 RDMA_CM,但硬件支持 RoCE v1 和 RoCE v2。 RDMA_CM 設(shè)置客戶端和服務(wù)器之間用來傳輸數(shù)據(jù)的可靠連接。RDMA_CM 為建立連接提供了一個(gè)與 RDMA 傳輸相關(guān)的接口。該通信使用特定的 RDMA 設(shè)備,數(shù)據(jù)傳輸是基于消息的。 在客戶端使用 RoCE v2,在服務(wù)器使用 RoCE v1 不被支持。在這種情況下,將服務(wù)器和客戶端都配置為通過 RoCE v1 進(jìn)行通信。 不支持在客戶端和服務(wù)器上的 RoCE v1 使用 RoCE v2 協(xié)議。如果您的服務(wù)器中硬件只支持 RoCE v1,請將 您的客戶端配置為使用 RoCE v1 與服務(wù)器通信。這部分論述了如何在將 mlx5_0驅(qū)動(dòng)程序用于 Mellanox ConnectX-5 Infiniband 設(shè)備的客戶端上強(qiáng)制實(shí)施 RoCE v1。 Soft-RoCE 是 RDMA over Ethernet 的一個(gè)軟件實(shí)現(xiàn),它也稱為 RXE。在沒有 RoCE 主機(jī)頻道適配器(HCA)的主機(jī)上使用 Soft-RoCE。 Soft-RoCE 功能僅作為技術(shù)預(yù)覽提供。紅帽產(chǎn)品服務(wù)級別協(xié)議(SLA)不支持技術(shù)預(yù)覽功 能,且其功能可能并不完善,因此紅帽不建議在生產(chǎn)環(huán)境中使用它們。

03配置核心RDMA子系統(tǒng)

默認(rèn)情況下,內(nèi)核命名 IP over InfiniBand(IPoIB)設(shè)備,如 ib0,ib1 等。為避免沖突,紅帽建議在 udev 設(shè) 備管理器中創(chuàng)建一條規(guī)則來創(chuàng)建持久且有意義的名稱,如 mlx4_ib0。 RDMA 操作需要固定物理內(nèi)存。這意味著內(nèi)核不允許把內(nèi)存寫入到 swap 空間中。如果用戶固定太多內(nèi) 存,系統(tǒng)會(huì)耗盡內(nèi)存,并且內(nèi)核會(huì)終止進(jìn)程來釋放更多內(nèi)存。因此,內(nèi)存固定是一個(gè)特權(quán)操作。如果非 root 用戶運(yùn)行大型 RDMA 應(yīng)用程序,則可能需要增加這些用戶可在系統(tǒng)中的內(nèi)存量。這部分論述 了如何為 rdma 組配置無限內(nèi)存。 配置RDMA服務(wù),rdma 服務(wù)在內(nèi)核中管理RDMA堆棧。如果Red Hat Enterprise Linux 檢測到 InfiniBand、iWARP 或 RoCE 設(shè)備,udev 設(shè)備管理器會(huì)指示 systemd 啟動(dòng) rdma 服務(wù)。

04配置InfiniBand子網(wǎng)管理器

所有 InfiniBand 網(wǎng)絡(luò)都必須運(yùn)行子網(wǎng)管理器才能正常工作。即使兩臺機(jī)器沒有使用交換機(jī)直接進(jìn)行連接, 也是如此。有可能有一個(gè)以上的子網(wǎng)管理器。在那種情況下,當(dāng)主子網(wǎng)管理器出現(xiàn)故障時(shí),另外一個(gè)作為從網(wǎng)管理器 的系統(tǒng)會(huì)接管。大多數(shù) InfiniBand 交換機(jī)都包含一個(gè)嵌入式子網(wǎng)管理器。 但是,如果您需要一個(gè)更新的子網(wǎng)管理器,需使用 Red Hat Enterprise Linux 提供的 OpenSM 子網(wǎng)管理器。

05配置 IPOIB

默認(rèn)情況下,InfiniBand 不使用 IP 進(jìn)行通信。但是,IP over InfiniBand(IPoIB)在 InfiniBand 遠(yuǎn)程直接訪問(RDMA)網(wǎng)絡(luò)之上提供一個(gè) IP 網(wǎng)絡(luò)模擬層。這允許現(xiàn)有未經(jīng)修改的應(yīng)用程序通過 InfiniBand 網(wǎng)絡(luò)傳輸數(shù) 據(jù),但性能低于應(yīng)用程序原生使用 RDMA 時(shí)的數(shù)據(jù)。 互聯(lián)網(wǎng)廣域 RDMA 協(xié)議(iWARP)和 RoCE 網(wǎng)絡(luò)已基于 IP。因此,您不能在 IWARP 或 RoCE 設(shè)備之上創(chuàng)建 IPoIB 設(shè)備。Mellanox 設(shè)備從 ConnectX-4 及更高版本開始,默認(rèn)使用 Enhanced IPoIB 模式(僅限數(shù) 據(jù)報(bào))。這些設(shè)備不支持連接的模式。 IPOIB通訊模式,在Datagram或Connected模式下配置 IPoIB 設(shè)備。不同之處在,IPoIB 層試圖使用什么類型的隊(duì)列對在通信的另一端的機(jī)器中打開: 在Datagram模式中,系統(tǒng)打開了一個(gè)不可靠、斷開連接的隊(duì)列對。這個(gè)模式不支持大于 InfiniBand link-layer 的最大傳輸單元(MTU)的軟件包。IPoIB 層在傳輸?shù)?IP 數(shù)據(jù)包之上添加了一個(gè) 4 字節(jié) IPoIB 標(biāo)頭。因此,IPoIB MTU 需要比 InfiniBand link-layer MTU 小 4 字節(jié)。因?yàn)?2048 是一個(gè)常見的 InfiniBand 鏈路層 MTU,數(shù)據(jù)數(shù)報(bào)模式中常見的 IPoIB 設(shè)備 MTU 是 2044。 在Connected模式中,系統(tǒng)會(huì)打開一個(gè)可靠、連接的隊(duì)列對。此模式允許大于 InfiniBand 鏈路層 MTU 的消息,主機(jī)適配器處理數(shù)據(jù)包分段和重新傳輸。因 此,InfiniBand 適配器以Connected模式發(fā)送的 IPoIB 信息大小沒有限制。但是,IP 數(shù)據(jù)包會(huì)受size字段和 TCP/IP 標(biāo)頭的限制。因此,Connected模式中的 IPoIB MTU 最大為65520字節(jié)。 連接 模式模 的性能更高,但消耗的內(nèi)核內(nèi)存更多。 如果系統(tǒng)被配置為使用Connected模式,它仍然會(huì)以Datagram模式發(fā)送多播流量,因?yàn)?InfiniBand 交換機(jī)和光纖無法在Connected模式下傳遞多播流量。另外,當(dāng)與任何未在Connected模式中配置的主 機(jī)通信時(shí),系統(tǒng)將返回Datagram模式。 在運(yùn)行將多播數(shù)據(jù)發(fā)送到接口上最大 MTU 的應(yīng)用程序時(shí),您必須將接口配置為Datagram模式,或者將應(yīng)用程序配置為以數(shù)據(jù)包大小數(shù)據(jù)包的大小封頂數(shù)據(jù)包發(fā)送的大小。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 計(jì)算機(jī)
    +關(guān)注

    關(guān)注

    19

    文章

    7787

    瀏覽量

    92959
  • 操作系統(tǒng)
    +關(guān)注

    關(guān)注

    37

    文章

    7382

    瀏覽量

    129014
  • RDMA
    +關(guān)注

    關(guān)注

    0

    文章

    95

    瀏覽量

    9583

原文標(biāo)題:關(guān)于InfiniBand和RDMA網(wǎng)絡(luò)配置實(shí)踐

文章出處:【微信號:算力基建,微信公眾號:算力基建】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    本地智能家居系統(tǒng)ESPHome,實(shí)現(xiàn)遠(yuǎn)程訪問調(diào)試

    ESPHome 是一個(gè)開源固件框架,支持通過 YAML 配置實(shí)現(xiàn)智能家居自動(dòng)化,可本地部署并公網(wǎng)訪問,便于遠(yuǎn)程開發(fā)。
    的頭像 發(fā)表于 12-30 14:48 ?1032次閱讀
    本地智能家居系統(tǒng)ESPHome,實(shí)現(xiàn)<b class='flag-5'>遠(yuǎn)程</b><b class='flag-5'>訪問</b>調(diào)試

    如何確保電能質(zhì)量在線監(jiān)測裝置遠(yuǎn)程配置通信參數(shù)的安全性?

    遠(yuǎn)程配置通信參數(shù)的核心安全風(fēng)險(xiǎn)包括: 未授權(quán)訪問、傳輸數(shù)據(jù)竊聽 / 篡改、配置誤操作、設(shè)備仿冒接入 等。需通過 “身份認(rèn)證、傳輸加密、權(quán)限管控、操作審計(jì)、
    的頭像 發(fā)表于 12-17 16:40 ?996次閱讀
    如何確保電能質(zhì)量在線監(jiān)測裝置<b class='flag-5'>遠(yuǎn)程</b><b class='flag-5'>配置</b>通信參數(shù)的安全性?

    電能質(zhì)量在線監(jiān)測裝置能遠(yuǎn)程配置通信參數(shù)嗎?

    ≥1000 元)。 一、遠(yuǎn)程配置的實(shí)現(xiàn)方式 實(shí)現(xiàn)途徑 適用場景 典型操作方式 Web 界面 局域網(wǎng) / 公網(wǎng)可訪問 通過瀏覽器輸入裝置 IP,登錄后在 "系統(tǒng)設(shè)置 - 通訊設(shè)置" 中修改 上位機(jī)軟件 本地 /
    的頭像 發(fā)表于 12-12 16:01 ?315次閱讀
    電能質(zhì)量在線監(jiān)測裝置能<b class='flag-5'>遠(yuǎn)程</b><b class='flag-5'>配置</b>通信參數(shù)嗎?

    在使用CW32L083系列微控制器時(shí)如何進(jìn)行系統(tǒng)復(fù)位和看門狗定時(shí)器配置?

    在使用CW32L083系列微控制器時(shí),如何進(jìn)行系統(tǒng)復(fù)位和看門狗定時(shí)器配置?
    發(fā)表于 12-10 06:46

    內(nèi)網(wǎng)穿透:從原理到實(shí)戰(zhàn)部署

    本文介紹了內(nèi)網(wǎng)穿透技術(shù)的原理及其應(yīng)用解決方案。由于NAT網(wǎng)絡(luò)和動(dòng)態(tài)IP的限制,外部無法直接訪問內(nèi)網(wǎng)設(shè)備。內(nèi)網(wǎng)穿透通過公網(wǎng)中轉(zhuǎn)服務(wù)器建立連接通道,實(shí)現(xiàn)外部訪問內(nèi)網(wǎng)服務(wù)。文章詳細(xì)講解了ZeroNews
    的頭像 發(fā)表于 11-04 16:57 ?1375次閱讀
    內(nèi)網(wǎng)穿透:從原理到實(shí)戰(zhàn)部署

    能源監(jiān)測管理平臺支持手機(jī)端遠(yuǎn)程訪問

    能源監(jiān)測管理平臺普遍支持手機(jī)端遠(yuǎn)程訪問 ,用戶可通過手機(jī)APP或網(wǎng)頁端實(shí)時(shí)查看能耗數(shù)據(jù)、設(shè)備狀態(tài)及報(bào)警信息,實(shí)現(xiàn)遠(yuǎn)程監(jiān)控與管理。以下為具體說明: 一、手機(jī)端遠(yuǎn)程
    的頭像 發(fā)表于 09-30 11:48 ?318次閱讀
    能源監(jiān)測管理平臺支持手機(jī)端<b class='flag-5'>遠(yuǎn)程</b><b class='flag-5'>訪問</b>嗎

    【NCS隨筆】如何進(jìn)入system_off深度睡眠模式以及配置GPIO中斷喚醒

    【NCS隨筆】如何進(jìn)入system_off深度睡眠模式以及配置GPIO中斷喚醒 本文章主要是講解NCS下面使用nRF54L15如何進(jìn)入system_off模式,以及如何配置通過按鍵喚醒
    的頭像 發(fā)表于 09-29 00:56 ?636次閱讀
    【NCS隨筆】如<b class='flag-5'>何進(jìn)</b>入system_off深度睡眠模式以及<b class='flag-5'>配置</b>GPIO中斷喚醒

    遠(yuǎn)程訪問NAS不折騰,輕松獲取固定訪問地址!

    。 傳統(tǒng)方案通常需要公網(wǎng)IP或復(fù)雜的路由器設(shè)置,不僅成本高且操作繁瑣。 ZeroNews 無需公網(wǎng)IP、免配置路由器,三步即可實(shí)現(xiàn)NAS的遠(yuǎn)程訪問。 簡易配置,快速生成固定
    的頭像 發(fā)表于 09-02 19:20 ?644次閱讀
    <b class='flag-5'>遠(yuǎn)程</b><b class='flag-5'>訪問</b>NAS不折騰,輕松獲取固定<b class='flag-5'>訪問</b>地址!

    多臺IR615如何通過vpn進(jìn)行遠(yuǎn)程管理?

    現(xiàn)有多臺IR615路由器,希望將其配置為vpn客戶端,連接云服務(wù)器的vpn服務(wù)端 工程師遠(yuǎn)程連接云服務(wù)器對IR615進(jìn)行管理 在IR615中可以選用哪種vpn協(xié)議?如何進(jìn)行
    發(fā)表于 08-06 07:21

    禁用直接LPB訪問,如何與TC3x 上的 SWAPEN 協(xié)同工作?

    禁用直接 LPB 訪問 (xDDIS) 位可通過 TC37x 的 FLASHCON4 和 PROCONTP 進(jìn)行配置。在 SOTA 場景中,我們應(yīng)該如何
    發(fā)表于 07-29 10:26

    遠(yuǎn)程訪問內(nèi)網(wǎng)MySQL數(shù)據(jù)庫?這個(gè)方案更簡單

    ,開發(fā)者和運(yùn)維人員趕緊看過來! 為什么需要這樣做? 遠(yuǎn)程辦公必備:無需 VPN,在家或外出時(shí)也能輕松連接公司內(nèi)網(wǎng)數(shù)據(jù)庫 靈活開發(fā)測試:開發(fā)人員可遠(yuǎn)程連接本地?cái)?shù)據(jù)庫進(jìn)行調(diào)試,提高協(xié)作效率 數(shù)據(jù)安全保障:通過 ZeroNews 的安
    的頭像 發(fā)表于 07-04 18:06 ?792次閱讀
    <b class='flag-5'>遠(yuǎn)程</b><b class='flag-5'>訪問</b>內(nèi)網(wǎng)MySQL數(shù)據(jù)庫?這個(gè)方案更簡單

    10萬用戶見證!樹莓派 Connect 正式版發(fā)布:遠(yuǎn)程訪問功耗直降50%!

    樹莓派官方宣布其遠(yuǎn)程連接服務(wù)RaspberryPiConnect正式結(jié)束測試階段:優(yōu)化后的遠(yuǎn)程訪問功能更簡單、更強(qiáng)大!
    的頭像 發(fā)表于 05-12 15:49 ?868次閱讀
    10萬用戶見證!樹莓派 Connect 正式版發(fā)布:<b class='flag-5'>遠(yuǎn)程</b><b class='flag-5'>訪問</b>功耗直降50%!

    使用CAN以及CANIF配置了S32K310的CAN驅(qū)動(dòng)模塊,如何進(jìn)行報(bào)文的接收呢?

    我使用CAN以及CANIF配置了S32K310的CAN驅(qū)動(dòng)模塊。我知道調(diào)用CAN_Write()函數(shù)進(jìn)行報(bào)文的發(fā)送,但我存有以下的一些問題: 1.我該如何進(jìn)行報(bào)文的接收呢?我看到有一些文章說能夠通過
    發(fā)表于 03-21 07:24

    DLP4710EVM-LC如何進(jìn)行燒錄?

    DLP4710EVM-LC: 如何進(jìn)行燒錄
    發(fā)表于 02-20 08:07

    Impero:革新安全遠(yuǎn)程訪問方案

    借助 Impero Connect,您的 IT 支持團(tuán)隊(duì)可以確信您的遠(yuǎn)程訪問軟件將用于提供高效和簡化的支持,而不是網(wǎng)絡(luò)攻擊或惡意行為。 超越自我的安全遠(yuǎn)程訪問 無論在哪個(gè)行業(yè),大多數(shù)網(wǎng)
    的頭像 發(fā)表于 02-10 11:42 ?822次閱讀
    Impero:革新安全<b class='flag-5'>遠(yuǎn)程</b><b class='flag-5'>訪問</b>方案