chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA助力CoreWeave云平臺性能升級

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 2025-07-23 10:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

CoreWeave 為高性能、安全、多租戶環(huán)境開發(fā)了云規(guī)模加速計算基礎設施

AI 變革正在重塑數(shù)據(jù)中心格局,亟需能夠提供更靈活、高性價比的計算和數(shù)據(jù)能力的平臺。為了滿足這些需求,作為推動 AI 變革的超大規(guī)模云服務提供商,CoreWeave 致力于開發(fā)一種用于加速計算工作負載的云平臺,該云平臺能夠在多租戶環(huán)境中提供高性能、嚴格的租戶隔離和安全性。

CoreWeave 云平臺使用 NVIDIA BlueField DPU,簡化了大規(guī)模先進基礎設施的工程、組裝、運行和監(jiān)測,為 AI 工作負載提供頂尖的性能與效率。

挑戰(zhàn)

為了滿足 AI 的需求,數(shù)據(jù)中心需要具有靈活、高性能、高性價比的計算與數(shù)據(jù)能力的平臺。CoreWeave 致力于開發(fā)一個云規(guī)模的加速計算基礎設施,以便在多租戶環(huán)境中提供高性能、嚴格的租戶隔離和安全性。

CoreWeave 的基礎設施需要支持外部網(wǎng)絡訪問和內(nèi)部網(wǎng)絡計算,還必須能夠管理數(shù)十萬顆 NVIDIA GPU 之間的網(wǎng)絡流量,并在高負載下保持性能。此外,該基礎設施還需要卸載并加速網(wǎng)絡和存儲任務,以釋放 CPU 資源,從而使處理器能夠?qū)W⒂谔幚碛嬎忝芗凸ぷ髫撦d,并加快存儲訪問速度,從而實現(xiàn)更高效的AI計算。CoreWeave 的另一個主要目標是開發(fā)一個能夠滿足 AI 應用日益增長需求的基礎設施,并確保其可擴展性,以便在未來更好的處理日益復雜的計算密集型大規(guī)模工作負載。CoreWeave 借助NVIDIA BlueField 網(wǎng)絡平臺和 NVIDIA DOCA 軟件框架的強大功能來滿足這些需求。

解決方案

CoreWeave 借助 NVIDIA BlueField-3 DPU 來提高其 AI 云基礎設施的效率,提供可擴展性并優(yōu)化其性能。他們使用 DPU 來卸載并加速網(wǎng)絡、管理、存儲和安全服務,并釋放 CPU 資源。

CoreWeave 使用 NVIDIA DOCA 軟件框架在應用程序域和基礎設施服務域進行開發(fā)。

CoreWeave 使用 BlueField DPU 和 DOCA 開發(fā)了一個具有強大、高性價比且快速擴展的平臺,使任何規(guī)模的客戶都能夠創(chuàng)建、訓練和微調(diào)為其特定業(yè)務挑戰(zhàn)而定制的模型。

CoreWeave 將其管理和存儲基礎設施與運行 NVIDIA Cumulus Linux 的NVIDIA Spectrum 以太網(wǎng)交換機連接起來,以實現(xiàn) API 為中心的網(wǎng)絡運營。

CoreWeave 使用 NVIDIA Quantum-2 InfiniBand 網(wǎng)絡平臺作為其 GPU 到 GPU 的 AI 計算網(wǎng)絡,不僅實現(xiàn)了低延遲、高帶寬、高效數(shù)據(jù)傳輸和性能隔離,還確保為要求苛刻的 AI 工作負載提供極佳的性能和可擴展性。

借助 BlueField DPU 和 DOCA增強網(wǎng)絡功能

CoreWeave 使用NVIDIA DOCA 軟件框架中的組件—特別是基于 OVS-DOCA 和DOCA FLOW 的 DOCA基 于主機的網(wǎng)絡(DOCA HBN)服務,加速了云網(wǎng)絡服務和 API。DOCA HBN 利用與 NVIDIA Cumulus Linux 網(wǎng)絡操作系統(tǒng)相同的核心組件,如 FRRouting 和 NVIDIA User Experience(NVUE),并將它們打包到在 BlueField DPU 上運行的容器中。此設置使 CoreWeave 能夠以可擴展、分布式的方式管理復雜的網(wǎng)絡功能,支持多租戶環(huán)境中的租戶隔離、負載均衡和流量引導。這確保每個云租戶只能訪問自己的數(shù)據(jù)和計算任務,并確保這些任務在不影響性能的情況下得到高效管理,從而實現(xiàn)可擴展且安全的網(wǎng)絡。通過卸載和加速這些任務,DOCA HBN 減輕了 CPU 負載,使其能夠處理計算密集型進程,并提高整體系統(tǒng)性能。

借助 DOCA HBN,CoreWeave 將網(wǎng)絡隔離功能遷移至BlueField DPU,并采用 EVPN VXLAN 為每個租戶創(chuàng)建了獨立的虛擬網(wǎng)絡,通過 VXLAN 網(wǎng)絡標識符處理路由流量,以確保實現(xiàn)完全隔離。由于嚴格的網(wǎng)絡隔離對于安全性與合規(guī)性在多租戶環(huán)境中至關重要。CoreWeave 還通過在 BlueField 上部署互聯(lián)網(wǎng)網(wǎng)關實現(xiàn)了去中心化架構,并使用 OVS-DOCA 進行流量引導和網(wǎng)絡地址轉(zhuǎn)換(NAT)。BlueField 還通過托管網(wǎng)關和 BGP 路由,在網(wǎng)絡流量管理方面發(fā)揮至關重要的作用,從而實現(xiàn)高效的網(wǎng)絡管理。

通過 BlueField 集成實現(xiàn)系統(tǒng)級優(yōu)化

為了構建下一代 AI 存儲服務,即 CoreWeave AI 對象存儲,CoreWeave 與 VAST Data 合作,充分利用雙方與 NVIDIA 技術的深度集成。VAST 將 BlueField DPU 作為控制數(shù)據(jù)節(jié)點(DNode),通過 NVIDIA DOCA API 將數(shù)據(jù)服務直接卸載到 BlueField DPU,從而消除了對傳統(tǒng) x86 CPU 的需求。

該架構重新定義了數(shù)據(jù)層的控制和策略執(zhí)行方式,更加接近數(shù)據(jù)流向且效率更高。CoreWeave 最初使用的 NVIDIA DPU 是 BlueField-1,現(xiàn)已發(fā)展至 BlueField-3,并持續(xù)致力于將 BlueField 部署到計算相鄰節(jié)點(CNode)。這實現(xiàn)了基礎設施級的多租戶,其中每個 CoreWeave AI 對象存儲租戶都能在一個隔離且安全的網(wǎng)絡域中運行。實時遙測和細粒度策略執(zhí)行直接在 DPU 層完成。該平臺對多協(xié)議訪問的支持進一步簡化了復雜性,并實現(xiàn)了跨不同計算和數(shù)據(jù)環(huán)境的無縫互操作性。

這種靈活性使 CoreWeave 能夠在不影響性能或犧牲租戶隔離性的情況下擴展 AI 對象存儲。將控制服務卸載到 BlueField DPU 徹底重塑了基礎設施的經(jīng)濟學,因其優(yōu)化了性能、安全性和可擴展性。性能基準測試顯示了該架構演進的優(yōu)點:與基于 x86 架構、配備 DRAM 和傳統(tǒng) NVIDIA ConnectX 網(wǎng)卡的 DNode 相比,基于 BlueField 的 DNode 在連續(xù)吞吐量方面提高了 60%,從 40GB/s 增加至 64GB/s,同時功耗降低了 58%,從 1200 W 下降至 500 W。這相當于每瓦性能提高了 3.84 倍。該設計為現(xiàn)代 AI 基礎設施提供了藍圖,展示了基礎設施層的軟硬件協(xié)同設計如何為 CoreWeave 等云服務提供商帶來效率、可擴展性和性能的巨大提升。

新系統(tǒng)還通過采用四塊 BlueField DPU 和八個 100GbE 端口,將線路帶寬提高至原來的兩倍。雖然部分功耗節(jié)省歸因于采用了更大、更高效的固態(tài)硬盤(SSD),但其整體效率提升主要歸功于 DPU 的集成。此次測試展現(xiàn)了 BlueField DPU 變革數(shù)據(jù)中心架構的潛力,為像 CoreWeave 這樣尋求提升 AI 基礎設施性能和能效的公司提供了夢寐以求的解決方案。

93e5b4bc-6626-11f0-a6aa-92fbcf53809c.png

x86 CPU 與 BlueField DPU 的對比

上圖通過對比,顯示出運行在 x86 CPU 和運行在 NVIDIA BlueField DPU 之間的差異。

借助 NVIDIA Spectrum 以太網(wǎng)交換機和 Cumulus Linux 實現(xiàn)云規(guī)模效率

除了利用 BlueField DPU 來卸載、加速和隔離工作負載外,CoreWeave 還通過運行 NVIDIA Cumulus Linux 的 NVIDIA Spectrum 以太網(wǎng)交換機來連接存儲和管理基礎設施。Cumulus Linux 旨在通過軟件驅(qū)動的自動化來簡化網(wǎng)絡管理。通過將純?nèi)龑?EVPN VXLAN 與 NVUE 對象模型的 API 相結合,CoreWeave 即使在大規(guī)模情況下也能輕松管理網(wǎng)絡的自動化、運營和更新。

利用 NVIDIA Quantum-2 InfiniBand實現(xiàn)極高的 AI 性能

CoreWeave 利用 BlueField DPU 和 Spectrum 以太網(wǎng)交換機構建存儲與管理網(wǎng)絡,同時使用 NVIDIA Quantum-2 InfiniBand 網(wǎng)絡平臺構建 GPU 到 GPU 的 AI 計算網(wǎng)絡。InfiniBand 是 AI 網(wǎng)絡的黃金標準,可為高負載和大規(guī)模 AI 訓練工作負載提供極高的有效帶寬和超低的延遲。InfiniBand 的功能,如動態(tài)路由和基于遙測的擁塞控制,對于多租戶 AI 云環(huán)境至關重要,能夠?qū)崿F(xiàn)性能隔離,并確保所有 CoreWeave 用戶都能獲得所需的全部網(wǎng)絡帶寬。CoreWeave 還使用 Quantum InfiniBand 的 NVIDIA 可擴展分層聚合和歸約協(xié)議(SHARP)進行 AI 集合操作網(wǎng)絡計算,卸載 GPU 的通信操作,簡化網(wǎng)絡流量模式,并加快任務完成時間。

總結

CoreWeave 使用 NVIDIA DOCA 部署 NVIDIA BlueField DPU,從而變革了其 AI 云基礎設施,并在技術、運營和業(yè)務層面帶來了顯著的價值。通過集成 BlueField DPU,CoreWeave 構建出一個高效、可擴展、安全的平臺,滿足了現(xiàn)代 AI 工作負載和云端運營的嚴苛要求。憑借將 VAST Data 的存儲解決方案與NVIDIA BlueField DPU相結合這一創(chuàng)新方法,CoreWeave 已躋身領先的 AI 云服務提供商之列,并通過對創(chuàng)新技術的不懈追求來滿足未來的客戶需求,同時應對日益復雜的 AI 工作負載。

戰(zhàn)略性的部署 NVIDIA BlueField DPU 和 NVIDIA DOCA 軟件框架等先進技術,可以徹底改變 AI 應用的云基礎設施。CoreWeave 成功利用 BlueField DPU 構建了可擴展、高效且安全的 AI 云平臺,彰顯了 BlueField DPU 在優(yōu)化 AI 和高性能計算基礎設施方面的顯著優(yōu)勢。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5597

    瀏覽量

    109796
  • 數(shù)據(jù)中心

    關注

    18

    文章

    5654

    瀏覽量

    75039
  • AI
    AI
    +關注

    關注

    91

    文章

    39844

    瀏覽量

    301505
  • DPU
    DPU
    +關注

    關注

    0

    文章

    414

    瀏覽量

    27001

原文標題:CoreWeave 借助 NVIDIA BlueField DPU 開創(chuàng)數(shù)據(jù)中心新范式

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    NVIDIA DRIVE AV軟件平臺與Halos架構助力梅賽德斯奔馳CLA車型獲得最高安全評分

    NVIDIA DRIVE AV 軟件平臺NVIDIA Halos 架構助力 CLA 車型獲得最高安全評分(top safety rating)。
    的頭像 發(fā)表于 02-02 09:28 ?1360次閱讀

    超擎數(shù)智為您深度解析NVIDIA Quantum-X800 InfiniBand平臺

    NVIDIA
    專精特新
    發(fā)布于 :2026年01月08日 19:47:03

    NVIDIA攜手Mistral AI發(fā)布全新開源大語言模型系列

    全新 Mistral 3 系列涵蓋從前沿級到緊湊型模型,針對 NVIDIA 平臺進行了優(yōu)化,助力 Mistral AI 實現(xiàn)到邊緣分布式智能愿景。
    的頭像 發(fā)表于 12-13 09:58 ?1253次閱讀

    途MCU助力BCM控制器智能升級

    Yuntu途YTM32B1LE04H0MLFT車規(guī)級MCU以64KB存儲容量和ARM Cortex-M0+內(nèi)核,為BCM控制器提供高性價比解決方案。其通過AEC-Q100/ASIL-B認證,集成多路通信接口與硬件加密模塊,顯著提升車身控制的實時性與安全性,助力汽車電子架
    的頭像 發(fā)表于 11-25 09:48 ?416次閱讀
    <b class='flag-5'>云</b>途MCU<b class='flag-5'>助力</b>BCM控制器智能<b class='flag-5'>升級</b>

    NVIDIA Spectrum-X 以太網(wǎng)交換機助力 Meta 和 Oracle 加速網(wǎng)絡性能

    Facebook 開放交換系統(tǒng)平臺。 Oracle 采用 Spectrum-X 以太網(wǎng)交換機構建十億瓦級(Giga-Scale)AI 超級計算機。 NVIDIA 宣布 Meta 和 Oracle 將升級
    的頭像 發(fā)表于 10-14 10:26 ?1822次閱讀
    <b class='flag-5'>NVIDIA</b> Spectrum-X 以太網(wǎng)交換機<b class='flag-5'>助力</b> Meta 和 Oracle 加速網(wǎng)絡<b class='flag-5'>性能</b>

    使用RTT的維護進行遠程固件升級(OTA),怎么沒有網(wǎng)絡升級的方式?

    使用RTT的維護進行遠程固件升級(OTA),怎么沒有網(wǎng)絡升級的方式的?只有藍牙,近距離的固件升級。詳細如圖所示,只有藍牙,沒有連接互聯(lián)網(wǎng),通過固件上傳服務器進行在線
    發(fā)表于 10-13 06:36

    睿海光電以高效交付與廣泛兼容助力AI數(shù)據(jù)中心800G光模塊升級

    器件敏捷調(diào)配。 定制化服務:支持OEM/ODM/JDM模式,滿足客戶從標準品到液冷模塊的多元化需求。 這一優(yōu)勢已助力多家頭部服務商在AI平臺部署中搶占市場窗口期。 三、廣泛兼容性:
    發(fā)表于 08-13 19:01

    信捷視覺平臺全新升級

    當機器視覺的精準遇上AI的智能,會碰撞出怎樣的火花?信捷視覺平臺全新升級——XINJE VISION STUDIO 3.7 + Vision AI算法平臺雙劍合璧,覆蓋從規(guī)則化檢測到復雜場景分析的全鏈路需求,
    的頭像 發(fā)表于 07-28 15:56 ?884次閱讀
    信捷視覺<b class='flag-5'>平臺</b>全新<b class='flag-5'>升級</b>

    NVIDIA Dynamo新增對亞馬遜科技服務的支持

    亞馬遜科技 (AWS) 開發(fā)者和解決方案架構師現(xiàn)在可以在基于 NVIDIA GPU 的 Amazon EC2 上使用 NVIDIA Dynamo,包括由 NVIDIA Blackwe
    的頭像 發(fā)表于 07-28 14:31 ?984次閱讀
    <b class='flag-5'>NVIDIA</b> Dynamo新增對亞馬遜<b class='flag-5'>云</b>科技服務的支持

    NVIDIA計劃打造全球首個工業(yè)AI平臺

    NVIDIA 宣布,其正在為歐洲制造商構建全球首個工業(yè) AI 。這家總部位于德國的 AI 工廠將配備 1 萬個 GPU,包括通過 NVIDIA DGX B200 系統(tǒng) 和 NVIDIA
    的頭像 發(fā)表于 06-16 14:17 ?1440次閱讀

    NVIDIA技術助力歐洲廠商推出機器人系統(tǒng)與平臺

    基于 NVIDIA 安全的全棧機器人開發(fā)平臺,Agile?Robots、Humanoid、Neura?Robotics、Universal Robots、Vorwerk?和?Wandelbots 等公司推出 NVIDIA 加速的
    的頭像 發(fā)表于 06-16 13:54 ?1484次閱讀

    NVIDIA推出AI平臺DGX Cloud Lepton

    CoreWeave、Crusoe、Firmus、Foxconn、GMI Cloud、Lambda、Nebius、Nscale、SoftBank Corp. 和 Yotta Data Services 為 DGX Cloud Lepton Marketplace 提供數(shù)以萬計的 GPU 資源。
    的頭像 發(fā)表于 05-22 09:42 ?997次閱讀

    NVIDIA助力影眸科技3D生成工具Rodin升級

    。在 NVIDIA Omniverse 平臺、OpenUSD 以及 Isaac Lab 解決方案的助力下,影眸科技實現(xiàn)了 Rodin 平臺升級
    的頭像 發(fā)表于 04-27 15:09 ?1305次閱讀

    NVIDIA攜手谷歌助力企業(yè)引入代理式AI

    谷歌 Gemini 模型即將支持本地部署,可通過搭載 NVIDIA Blackwell 架構的基礎設施,在 Google 分布式上運行 NVIDIA 機密計算。
    的頭像 發(fā)表于 04-11 16:32 ?1223次閱讀

    NVIDIA助力解決量子計算領域重大挑戰(zhàn)

    NVIDIA 加速量子研究中心提供了強大的工具,助力解決量子計算領域的重大挑戰(zhàn)。
    的頭像 發(fā)表于 03-27 09:17 ?1284次閱讀