chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

高性能、低延遲的InfiniBand式網絡并不是唯一的選擇

芯片半導體 ? 來源:半導體行業(yè)觀察 ? 2023-08-27 09:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

正如我們喜歡指出的那樣,當談到高性能、低延遲的 InfiniBand 式網絡時,Nvidia 并不是唯一的選擇,自 20 世紀 90 年代末 InfiniBand 互連出現以來就一直不是唯一的選擇。三年前從英特爾收購了 Omni-Path 互連業(yè)務的Cornelis Networks 就是另一種選擇。雖然它跳過了 200 Gb/秒一代,但仍在銷售改進的 100 Gb/秒 Omni-Path Express 變體,并為未來的 400 Gb/秒一代奠定了基礎。

Cornelis Networks 的高管們從 SilverStorm 和 PathScale 的 InfiniBand 開始,最終成為 QLogic 的 TruScale InfiniBand 的基礎,而 QLogic 又成為來自 Mellanox Technologies 的 InfiniBand 的替代供應商。早在 2012 年 1 月,英特爾就以 1.25 億美元的價格從 QLogic 手中收購了 TruScale InfiniBand 業(yè)務——這似乎是很久以前的事了?三個月后又斥資 1.4 億美元從Cray 收購了“Gemini”XT 和“Aries”XC 互連業(yè)務,將它們整合起來創(chuàng)建 Omni-Path 互連。

從技術上講,這是 InfiniBand 主題的三種不同變體,而 Cornelis Networks 正在做的事情在許多方面代表了第四種變體。

InfiniBand 的最初目標是取代 PCI-Express、光纖通道,或許還有以太網,并創(chuàng)建融合結構。TruScale 變體采用了一種稱為 Performance Scale Messaging (PSM) 的技術,QLogic 當然認為該技術比 InfiniBand verbs approach更好,并且其創(chuàng)建者認為可以提供更好的擴展性。但 PSM 已有二十多年歷史,Cornelis Networks 正在基于 libfabric 驅動程序構建新的軟件堆棧,該驅動程序是 Linux 操作系統(tǒng)的一部分,并取代了 QLogic TruScale 和 Intel Omni-Path 中的 PSM 提供程序與Open Fabrics Interfaces 工作組的 OPX 提供商進行堆棧。

這個新堆棧經過開發(fā),可以在 Cornelis Networks 從 Intel 購買的 100 Gb/秒 Omni-Path 硬件上運行(該公司稱之為 Omni-Path Express,縮寫為 OPX),并且將是未來 400 Gb 上唯一可用的堆棧/sec Omni-Path Express CN5000 系列目前正在開發(fā)中。

2ede39b2-4423-11ee-a2ef-92fbcf53809c.jpg

libfabric 庫是 OFI 標準的第一個實現,它是一個位于網絡接口卡和 OFI 提供程序驅動程序之上的層,位于 MPI、SHMEM、PGAS 和通常在 HPC 分布式計算系統(tǒng)上運行的其他內存共享協(xié)議之間和人工智能。它看起來像這樣:

以下是 Omni-Path Express 主機軟件堆?,F在的樣子,其中第二代 PSM2 提供程序和本機 OFI 提供程序并行運行:

2ef6c8ec-4423-11ee-a2ef-92fbcf53809c.jpg

您會注意到,原始 OpenFabrics Alliance Verbs 仍然可以在 Linux 內核模式下使用,以支持舊版協(xié)議和框架的 InfiniBand verbs 提供程序,但 PSM2 和 OFI 提供程序都在 Linux 用戶空間中運行,其MPI的各種實現也是如此——它們有很多。

在下一代 CN5000 平臺中,紫色的 PSM2 內容將消失,我們推測 Verbs 提供程序以及運行在 Linux 內核中的 OFA Verbs 代碼之上的內容也會消失。Cornelis Networks 軟件工程副總裁 Doug Fuller 本周在Hot Interconnects 30 會議上發(fā)表演講,他表示,OPX 和 Nvidia InfiniBand 之間的主要區(qū)別之一是 Cornelis Networks 使用的所有堆棧都將是開放的源并添加到內核的上游。

“我們的 Omni-Path OFI 驅動程序是 Linux 內核的一部分,”Fuller 在演講中解釋道?!拔业囊馑际?,我們在內核開發(fā)方面也首先處于上游。因此,我們所有的補丁都在上游合并,并且我們有來自 Linus 的火焰來證明這一點。然后我們合并。我們鼓勵它向下游合并并集成到各種 Linux 發(fā)行版中。因此,在大多數情況下,如果您啟動現代 Linux 發(fā)行版,您的驅動程序已經存在,無需安裝其他軟件。我們致力于上游優(yōu)先開發(fā),我們希望確?;仞佄覀兪褂玫纳鐓^(qū),并為用戶提供良好的用戶體驗?!?/p>

三年來我們一直希望看到的,以及 Fuller 向 Hot Interconnects 觀眾提供的,是備受期待的 Cornelis Network 硬件路線圖。話不多說,這里是:

2f1c2100-4423-11ee-a2ef-92fbcf53809c.jpg

HPC 中心、云構建商和超大規(guī)模企業(yè)都喜歡可預測的路線圖,這些路線圖使每一代的比特轉移成本越來越低,并且還增加了網絡規(guī)模,即可以通過合理的響應連接到網絡的端點數量時間。這些是 Cornelis Networks 最終公開投入的賭注,眾所周知,公司不會購買點產品,而是購買路線圖,因為我們都生活在未來。

通過 Omni-Path 100 系列,Cornelis Networks 正在轉售由英特爾創(chuàng)建的硬件,該硬件于 2015 年底開始在基于其“Knights”系列多核處理器的早期采用者 HPC 系統(tǒng)中推出。(我們認為 Cornelis 忘記將品牌的“Express”部分放入路線圖中。) 該產品系列包括 100 Gb/秒適配器、48 端口邊緣交換機、288 端口導向器交換機和 1,152 端口導向器交換機。Omni-Path 100 互連支持 3 米及更短的直連電纜 (DAC) 和 100 米或更短的有源光纜 (AOC)。交換機的基數在fat tree上以全二分帶寬支持多達 13,800 個節(jié)點,或以半二分帶寬支持 27,600 個節(jié)點,在網絡逐漸變細的情況下最多支持 36,800 個節(jié)點。

考慮到其聯合創(chuàng)始人多年來推出的產品的悠久歷史,憑借 Omni-Path CN5000 CN5000 系列(Cornelis Networks 稱之為第五代高性能互連),交換機和適配器中的 ASIC 正在發(fā)生變化高達 400 Gb/秒,這將是性能的巨大飛躍。將會有一個 48 端口邊緣交換機(看起來像一個普通的披薩盒機器,而不是英特爾在 Omni-Path 100 上做的那種時髦的形狀),并且將在導向器交換機上進行差異化,并與單個 576 端口機器一起使用。至于電纜,將支持 DAC 和 AOC,以及將銅電纜拉伸到 5 米或更短長度的有源銅電纜 (ACC),這比 DAC 長 2 米,從而提供更具創(chuàng)意的接線配置。

CN5000 系列將支持全二分帶寬樹和部分二分帶寬樹,例如 Omni-Path 100,還將支持 Dragonfly 和 Megafly(有時稱為 Dragonfly+)拓撲,并且單個集群中最多可擴展至 330,000 個節(jié)點。(我們不知道這樣的網絡中有多少層和跳數,但我們的目標是找出答案。)Cornelius Networks 正在添加基于遙測的動態(tài)自適應路由和擁塞控制,這聽起來可能基于一些想法是從 Cornelis Networks 通過英特爾獲得的 Cray“Aries”技術中挑選出來的。(同樣,我們會找到結果。)延遲(我們假設是從節(jié)點到節(jié)點)承諾低至 1 微秒以下,消息速率預計為每秒 12 億條。CN5000 導向器交換機將提供風冷和液冷選項。

以下是 CN5000 邊緣交換機的一些規(guī)格和機械結構:

2f397138-4423-11ee-a2ef-92fbcf53809c.jpg

這些是 CN5000 導向器交換機的規(guī)格:

2f567242-4423-11ee-a2ef-92fbcf53809c.jpg

最后,主機結構適配器如下所示:

2f8ef8ba-4423-11ee-a2ef-92fbcf53809c.jpg

到 2026 年,Cornelis 路線圖將超越 Omni-Path CN6000,后者具有支持 800 Gb/秒的交換機和適配器 ASIC。交換機電纜選項的適配器在二等分帶寬、拓撲選項以及 330,000 個節(jié)點的規(guī)模方面保持不變。這里有趣的變化是使用 RISC-V 內核的 DPU,插入 CXL 端口,并且可能會執(zhí)行一些集體操作卸載以及安全和存儲加速功能。某些結構功能將被卸載,并且可能在交換機和適配器中都有特定于結構的加速器。

隨著第七代產品將于 2028 年推出,Cornelis Networks 將把端口速度提高到 1.6 Tb/秒,并將 HyperX 拓撲添加到網絡幾何結構列表中,并對 DPU 核心以及結構和應用程序卸載進行增強。

我們已經有一段時間沒有看到 Nvidia 或 Mellanox 的 InfiniBand 路線圖了,而且肯定不會走那么遠。但節(jié)奏和減速帶可能會在某個時刻或多或少同步。






審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 以太網
    +關注

    關注

    41

    文章

    6188

    瀏覽量

    181559
  • 人工智能
    +關注

    關注

    1820

    文章

    50325

    瀏覽量

    266952
  • InfiniBand
    +關注

    關注

    1

    文章

    31

    瀏覽量

    9585
  • PSM
    PSM
    +關注

    關注

    1

    文章

    45

    瀏覽量

    14132
  • LINUX內核
    +關注

    關注

    1

    文章

    321

    瀏覽量

    23298

原文標題:InfiniBand的挑戰(zhàn)者,來勢洶洶

文章出處:【微信號:TenOne_TSMC,微信公眾號:芯片半導體】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    探索IDT Tsi578? Serial RapidIO Switch:高性能嵌入通信新選擇

    探索IDT Tsi578? Serial RapidIO Switch:高性能嵌入通信新選擇 在電子工程師的設計工作中,選擇合適的器件對于系統(tǒng)的
    的頭像 發(fā)表于 04-14 10:40 ?107次閱讀

    IDT Tsi572 Serial RapidIO Switch:高性能嵌入網絡的理想選擇

    IDT Tsi572 Serial RapidIO Switch:高性能嵌入網絡的理想選擇 在嵌入
    的頭像 發(fā)表于 04-14 10:15 ?110次閱讀

    IDT Tsi568A Serial RapidIO開關:高性能嵌入通信解決方案

    IDT Tsi568A Serial RapidIO開關:高性能嵌入通信解決方案 在嵌入通信領域,款優(yōu)秀的開關設備對于提升系統(tǒng)性能、降
    的頭像 發(fā)表于 04-14 10:15 ?111次閱讀

    使用 ISL6160 和 HIP6006 ICs 設計 InfiniBand Class I 電源

    使用 ISL6160 和 HIP6006 ICs 設計 InfiniBand Class I 電源 在高性能、交換互連系統(tǒng)不斷發(fā)展的今天,InfiniBand 架構應運而生,它為連接
    的頭像 發(fā)表于 04-13 09:05 ?194次閱讀

    LTC2436-1:高性能16位無延遲ΔΣ ADC的深度解析

    LTC2436-1:高性能16位無延遲ΔΣ ADC的深度解析 在電子設計領域,ADC(模擬 - 數字轉換器)是連接模擬世界和數字世界的關鍵橋梁。今天我們要深入探討的是Linear
    的頭像 發(fā)表于 04-09 09:40 ?92次閱讀

    ADM5120 系統(tǒng)級芯片(SoC)網絡控制器:高性能與多功能的完美結合

    ADM5120 系統(tǒng)級芯片(SoC)網絡控制器:高性能與多功能的完美結合 在當今數字化的時代,網絡設備的性能和功能需求不斷提升。對于電子工程師而言,
    的頭像 發(fā)表于 03-30 14:20 ?130次閱讀

    ADAU1372延遲低功耗編解碼器:音頻設計的理想之選

    無疑是個理想的選擇。今天,我們就來深入了解下這款編解碼器的特點、性能和應用。 文件下載: ADAU1372.pdf 、ADAU1372
    的頭像 發(fā)表于 03-23 15:25 ?158次閱讀

    網絡接口到 DMA,套面向工程師的 FPGA 網絡開發(fā)框架

    Development Kit,是由 Liberouter 研究團隊開發(fā)的套框架,用于在 FPGA 加速卡上快速實現高性能網絡應用。它并不是
    的頭像 發(fā)表于 02-12 11:28 ?521次閱讀
    從<b class='flag-5'>網絡</b>接口到 DMA,<b class='flag-5'>一</b>套面向工程師的 FPGA <b class='flag-5'>網絡</b>開發(fā)框架

    高性能網絡存儲設計:NVMe-oF IP的實現探討

    仍可保持穩(wěn)定延遲表現。 ② 基于 UID 的 Capsule–NVMe解耦映射機制 NVMeoF層的 Capsule CID 與底層 NVMe HC 的物理 CID 完全解耦,通過唯一UID 建立
    發(fā)表于 12-19 18:45

    240FPS超低延遲網絡相機 帶寬可控

    延遲在無人設備的控制中是個很重要的指標,越是延遲越能夠體現出“人機協(xié)同”。而在影響無人設備控制
    的頭像 發(fā)表于 09-24 17:59 ?985次閱讀
    240FPS超低<b class='flag-5'>延遲</b><b class='flag-5'>網絡</b>相機   帶寬可控

    有哪些方法可以降低分布光伏集群通信網絡中的延遲?

    微機小電流 降低分布光伏集群通信網絡延遲,需從 接入優(yōu)化、數據處理、協(xié)議適配、環(huán)境抗擾、邊緣 - 云端協(xié)同 等多維度入手,結合場景特點針對性解決瓶頸。以下是具體方法: 、優(yōu)化接入
    的頭像 發(fā)表于 08-22 09:54 ?896次閱讀
    有哪些方法可以降低分布<b class='flag-5'>式</b>光伏集群通信<b class='flag-5'>網絡</b>中的<b class='flag-5'>延遲</b>?

    DP4363 高性能、電流的Sub-GHz收發(fā)芯片

    DP4363是高性能、電流收發(fā)器,覆蓋119~1050MHz的Sub-GHz頻段。它是完整的發(fā)射器、接收器和收發(fā)器產品系列的部分,適用于各種應用。該器件具有-126dBm的出色
    發(fā)表于 07-28 17:48

    游戲黨的福音:支持ALLM自動延遲模式的HDMI線推薦

    對于游戲愛好者來說,每次操作都至關重要。毫秒之間的差異可能意味著勝利與失敗的區(qū)別。因此,在構建理想的游戲環(huán)境時,除了高性能的游戲主機和顯示器外,選擇條合適的HDMI線纜也是提升游戲
    的頭像 發(fā)表于 06-10 18:14 ?1817次閱讀

    延遲至30ms+ LLSM流媒體傳輸模塊延遲方案推薦

    LLSM流媒體傳輸模塊,憑借帶寬、延遲的傳輸特點,經推出就受到了廣泛關注。由于延遲傳輸跟
    的頭像 發(fā)表于 06-04 17:57 ?1635次閱讀
    <b class='flag-5'>延遲</b><b class='flag-5'>低</b>至30ms+  LLSM流媒體傳輸模塊<b class='flag-5'>低</b><b class='flag-5'>延遲</b>方案推薦

    RDMA簡介1之RDMA開發(fā)必要性

    解決FPGA存儲容量不足的問題。 直接內存訪問技術提供了種不經過CPU的數據傳輸方式,其具有高性能延遲、CPU旁路等多種優(yōu)勢,在現代數據中心和計算機系統(tǒng)中得到廣泛應用 。DMA技
    發(fā)表于 06-03 14:38