chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA 推出 Dynamo 生產(chǎn)版本:廣泛采用的 AI 工廠推理操作系統(tǒng)

海闊天空的專(zhuān)欄 ? 來(lái)源:廠商供稿 ? 作者:廠商供稿 ? 2026-03-17 14:22 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

mmexport1773723774466.jpg

新聞?wù)?/strong>

● NVIDIA Dynamo 1.0 為大規(guī)模分布式推理提供了生產(chǎn)級(jí)的開(kāi)源基礎(chǔ)架構(gòu)。

● Dynamo 和 NVIDIA TensorRT LLM 優(yōu)化已原生集成到 LangChain、llm-d、LMCache、SGLang 和 vLLM 等開(kāi)源框架中,以提升推理性能。

● Dynamo 將 NVIDIA Blackwell GPU 推理性能至高提升 7 倍,并通過(guò)免費(fèi)的開(kāi)源軟件降低了 Token 成本,為數(shù)百萬(wàn) GPU 提供了增加收益的機(jī)會(huì)。

● NVIDIA 推理平臺(tái)已被云服務(wù)提供商亞馬遜云科技 (AWS)、微軟 Azure、谷歌云和 Oracle Cloud Infrastructure (OCI) 以及 NVIDIA 云合作伙伴阿里云、CoreWeave、Together AI 和 Nebius 所集成,并被 AI 原生公司 Cursor 和 Perplexity、推理端點(diǎn)提供商 Baseten、Deep Infra 和 Fireworks 以及字節(jié)跳動(dòng)、美團(tuán)、PayPal 和 Pinterest 等全球企業(yè)采用。

**加利福尼亞州圣何塞—— GTC —— 太平洋時(shí)間 2026 年 3 月 16 日 —— **NVIDIA 今日宣布,用于大規(guī)模生成式和智能體推理的開(kāi)源軟件 NVIDIA Dynamo 1.0 現(xiàn)已在全球范圍內(nèi)被廣泛采用。Dynamo 1.0 與 NVIDIA Blackwell 平臺(tái)相結(jié)合,助力云提供商、AI 創(chuàng)新者和全球企業(yè)能夠以無(wú)與倫比的規(guī)模、效率和速度提供高性能的 AI 推理服務(wù)。

隨著代理式 AI 系統(tǒng)在各行各業(yè)的應(yīng)用,數(shù)據(jù)中心內(nèi)的推理擴(kuò)展已成為一項(xiàng)復(fù)雜的資源編排挑戰(zhàn),不同規(guī)模、不同模態(tài)的請(qǐng)求以及性能目標(biāo)會(huì)以不可預(yù)測(cè)的突發(fā)形式出現(xiàn)。

正如計(jì)算機(jī)的操作系統(tǒng)協(xié)調(diào)硬件和應(yīng)用程序一樣,Dynamo 1.0 作為 AI 工廠的分布式“操作系統(tǒng)”,在集群中無(wú)縫地協(xié)調(diào) GPU 和顯存、內(nèi)存等存儲(chǔ)資源,以驅(qū)動(dòng)復(fù)雜的 AI 工作負(fù)載。在最近的行業(yè)基準(zhǔn)測(cè)試中,Dynamo 將 NVIDIA Blackwell GPU 的推理性能至高提升 7 倍,并通過(guò)免費(fèi)的開(kāi)源軟件降低了 Token 成本,為數(shù)百萬(wàn) GPU 帶來(lái)了增加收益的機(jī)會(huì)。

NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“推理是智能的引擎,驅(qū)動(dòng)了每一次查詢(xún)、每一個(gè)智能體以及每一個(gè)應(yīng)用。通過(guò) NVIDIA Dynamo,我們創(chuàng)建了首個(gè)面向 AI 工廠的‘操作系統(tǒng)’。整個(gè)生態(tài)系統(tǒng)中的快速采用表明新一波代理式 AI 浪潮已經(jīng)到來(lái),NVIDIA 正在全球范圍內(nèi)推動(dòng)其發(fā)展?!?/p>

Dynamo 1.0 通過(guò)引入更智能的“流量控制”以及在 GPU 和低成本存儲(chǔ)之間移動(dòng)數(shù)據(jù)的能力,將推理工作分配到多個(gè) GPU 上,從而減少了資源浪費(fèi)并緩解了顯存限制。針對(duì)代理式 AI 和長(zhǎng)提示,它可以將請(qǐng)求路由到已在稍早步驟獲得最相關(guān)“短期記憶”的 GPU,然后在無(wú)需使用時(shí)卸載該顯存。

NVIDIA 推理平臺(tái)發(fā)展勢(shì)頭強(qiáng)勁

通過(guò)將 NVIDIA Dynamo 和 NVIDIA TensorRT? LLM 庫(kù)優(yōu)化集成到 LangChain、llm-d、LMCache、SGLang、vLLM 等各大供應(yīng)商的熱門(mén)框架中,NVIDIA 正在加速開(kāi)源生態(tài)系統(tǒng)的發(fā)展。核心的 Dynamo 構(gòu)建模塊,例如用于實(shí)現(xiàn)更智能 KV 存儲(chǔ)管理的 KVBM、用于實(shí)現(xiàn)快速 GPU 到 GPU 數(shù)據(jù)移動(dòng)的 NVIDIA NIXL 以及用于簡(jiǎn)化擴(kuò)展的 NVIDIA Grove,也可作為獨(dú)立模塊使用。NVIDIA 還將 TensorRT LLM CUDA^?^ 內(nèi)核貢獻(xiàn)給 FlashInfer 項(xiàng)目,以便將其原生集成到開(kāi)源框架中。

NVIDIA 推理平臺(tái)在整個(gè) AI 生態(tài)系統(tǒng)中得到支持,包括:

云服務(wù)提供商: 亞馬遜云科技 (AWS) 、微軟 Azure、谷歌云、OCI

NVIDIA 云合作伙伴: 阿里云、CoreWeave、Crusoe、DigitalOcean、Gcore、GMI Cloud、Lightning AI、Nebius、Nscale、Together AI、Vultr

AI 原生公司: Cursor、Hebbia、Perplexity

推理端點(diǎn)提供商: Baseten、Deep Infra、Fireworks

全球企業(yè): 阿斯利康、貝萊德、字節(jié)跳動(dòng)、Coupang、Instacart、美團(tuán)、PayPal、Pinterest、Shopee、軟銀集團(tuán)

CoreWeave 產(chǎn)品和工程執(zhí)行副總裁 Chen Goldberg 表示:“隨著 AI 從實(shí)驗(yàn)性試點(diǎn)轉(zhuǎn)向持續(xù)的大規(guī)模生產(chǎn),底層基礎(chǔ)設(shè)施必須像其支持的模型一樣具備動(dòng)態(tài)性。采用 NVIDIA Dynamo 使我們能夠?yàn)椴渴饛?fù)雜的 AI 智能體提供更無(wú)縫、更具彈性的環(huán)境。這一底座具有穩(wěn)定性和高性能編排能力,助力業(yè)界具有挑戰(zhàn)性的智能體工作負(fù)載實(shí)現(xiàn)全球部署。”

Nebius 首席技術(shù)官 Danila Shtan 表示:“大規(guī)模交付可靠的 AI 推理不僅需要強(qiáng)大的 GPU,還需要將性能轉(zhuǎn)化為實(shí)際客戶(hù)價(jià)值的軟件。從 Dynamo 到 TensorRT LLM,我們高度重視 NVIDIA 的軟件堆棧,其帶來(lái)了深度優(yōu)化、可預(yù)測(cè)的性能以及更快的部署速度,幫助我們?yōu)榭蛻?hù)提供更簡(jiǎn)單、更高性能的 AI 生產(chǎn)路徑?!?/p>

Pinterest 首席技術(shù)官 Matt Madrigal 表示:“為數(shù)億用戶(hù)提供直觀的多模態(tài) AI 體驗(yàn),需要全球規(guī)模的實(shí)時(shí)智能。作為開(kāi)源領(lǐng)域的重要實(shí)踐者,我們致力于構(gòu)建可擴(kuò)展的 AI 技術(shù)。通過(guò) NVIDIA Dynamo 對(duì)部署進(jìn)行優(yōu)化,我們得以基于高性能 AI 基礎(chǔ)設(shè)施持續(xù)拓展,為用戶(hù)提供無(wú)縫、個(gè)性化體驗(yàn)。”

Together AI 聯(lián)合創(chuàng)始人兼首席執(zhí)行官 Vipul Ved Prakash 表示:“AI 原生企業(yè)需要能夠可靠、高效地隨其應(yīng)用規(guī)模而擴(kuò)展的推理能力。NVIDIA Dynamo 1.0 與 Together AI 的前沿推理研究相結(jié)合,助力我們構(gòu)建高性能堆棧,為大規(guī)模生產(chǎn)工作負(fù)載提供加速且經(jīng)濟(jì)高效的推理?!?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5617

    瀏覽量

    109864
  • 操作系統(tǒng)
    +關(guān)注

    關(guān)注

    37

    文章

    7410

    瀏覽量

    129396
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40086

    瀏覽量

    301719
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    【免費(fèi)直播】讓AI芯片擁有最強(qiáng)大腦—AI芯片的操作系統(tǒng)設(shè)計(jì)介紹.

    智慧化進(jìn)程。人工智能芯片是人工智能發(fā)展的基石,是數(shù)據(jù)、算法和算力在各類(lèi)場(chǎng)景應(yīng)用落地的基礎(chǔ)依托?!盁o(wú)芯片不AI”已經(jīng)深入人心,成為業(yè)界共識(shí)。本次直播將述說(shuō)AI芯片設(shè)計(jì)帶你解析AI算法及其芯片操作
    發(fā)表于 11-07 14:18

    NVIDIA 在首個(gè)AI推理基準(zhǔn)測(cè)試中大放異彩

    NVIDIA與合作伙伴和客戶(hù)一同向用戶(hù)全面地展示了NVIDIA產(chǎn)品組合的潛力。 全新的視角與產(chǎn)品推理指的是在實(shí)時(shí)生產(chǎn)系統(tǒng)中,通過(guò)運(yùn)行
    發(fā)表于 11-08 19:44

    深度剖析OpenHarmony AI調(diào)度管理與推理接口

    的原因,原因包括:申請(qǐng)的內(nèi)存等,線(xiàn)索的線(xiàn)索,回收。約束語(yǔ)言限制:C/C++語(yǔ)言操作系統(tǒng)限制:OpenHarmony 操作系統(tǒng)使用實(shí)例化類(lèi)AiInference。調(diào)用的成員函數(shù)的推理路徑,在網(wǎng)絡(luò)模型中創(chuàng)建
    發(fā)表于 03-25 11:15

    蘋(píng)果正式推出全新操作系統(tǒng)的子版本iOS 14.2

    繼上周推出GM版后,蘋(píng)果今(6日)凌晨起,開(kāi)始正式推送iOS 14.2、iPadOS 14.2,作為旗下行動(dòng)裝置最新操作系統(tǒng)的子版本
    的頭像 發(fā)表于 11-06 14:16 ?2966次閱讀

    NVIDIA宣布其AI推理平臺(tái)的重大更新

    軟件的新功能,該軟件為所有AI模型和框架提供跨平臺(tái)推理;同時(shí)也包含對(duì)NVIDIA TensorRT的更新,該軟件優(yōu)化AI模型并為NVIDIA
    的頭像 發(fā)表于 11-12 14:42 ?2832次閱讀

    VIDAA發(fā)展速度領(lǐng)先的智能電視操作系統(tǒng)平臺(tái)推出最新版本

    作為一家專(zhuān)為本地市場(chǎng)量身打造智能聯(lián)網(wǎng)電視操作系統(tǒng)的領(lǐng)先供應(yīng)商,VIDAA宣布推出其創(chuàng)新平臺(tái)的最新版本。新版本讓各品牌和廠商能夠獲得通常僅應(yīng)用于高端品牌的最先進(jìn)技術(shù)。新
    的頭像 發(fā)表于 04-15 19:04 ?3285次閱讀

    英偉達(dá)推出AI模型推理服務(wù)NVIDIA NIM

    英偉達(dá)近日宣布推出一項(xiàng)革命性的AI模型推理服務(wù)——NVIDIA NIM。這項(xiàng)服務(wù)將極大地簡(jiǎn)化AI模型部署過(guò)程,為全球的2800萬(wàn)英偉達(dá)開(kāi)發(fā)者
    的頭像 發(fā)表于 06-04 09:15 ?1439次閱讀

    英偉達(dá)推出全新NVIDIA AI Foundry服務(wù)和NVIDIA NIM推理微服務(wù)

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務(wù)和 NVIDIA NIM 推理
    的頭像 發(fā)表于 07-25 09:48 ?1488次閱讀

    銀河麒麟發(fā)布AIPC版本,填補(bǔ)操作系統(tǒng)推理能力研發(fā)缺口

    近日,在2024中國(guó)操作系統(tǒng)產(chǎn)業(yè)大會(huì)上,國(guó)產(chǎn)桌面操作系統(tǒng)銀河麒麟正式推出首個(gè)AIPC版。而這也是一款貼合人工智能的國(guó)產(chǎn)桌面操作系統(tǒng),成功彌補(bǔ)了我國(guó)在此項(xiàng)技術(shù)研發(fā)上的缺口。   作
    的頭像 發(fā)表于 08-09 15:55 ?1489次閱讀

    潤(rùn)和軟件推出首個(gè)AI原生操作系統(tǒng)HopeOS V24

    近日,操作系統(tǒng)大會(huì)&openEuler Summit 2024在北京隆重舉辦。江蘇潤(rùn)和軟件股份有限公司(以下簡(jiǎn)稱(chēng)“潤(rùn)和軟件”)于會(huì)上重磅發(fā)布基于openEuler 24.03 LTS版本的商業(yè)發(fā)行版——潤(rùn)和企業(yè)級(jí)操作系統(tǒng)(服務(wù)器
    的頭像 發(fā)表于 11-17 09:16 ?2169次閱讀

    使用NVIDIA推理平臺(tái)提高AI推理性能

    NVIDIA推理平臺(tái)提高了 AI 推理性能,為零售、電信等行業(yè)節(jié)省了數(shù)百萬(wàn)美元。
    的頭像 發(fā)表于 02-08 09:59 ?1736次閱讀
    使用<b class='flag-5'>NVIDIA</b><b class='flag-5'>推理</b>平臺(tái)提高<b class='flag-5'>AI</b><b class='flag-5'>推理</b>性能

    英偉達(dá)GTC25亮點(diǎn):NVIDIA Dynamo開(kāi)源庫(kù)加速并擴(kuò)展AI推理模型

    DeepSeek-R1 上的吞吐量提高了 30 倍 NVIDIA 發(fā)布了開(kāi)源推理軟件 NVIDIA Dynamo,旨在以高效率、低成本加速并擴(kuò)展
    的頭像 發(fā)表于 03-20 15:03 ?1330次閱讀

    NVIDIA驅(qū)動(dòng)的AI工廠正在重新定義數(shù)據(jù)中心

    NVIDIA 及其生態(tài)系統(tǒng)合作伙伴正在為 AI 推理時(shí)代構(gòu)建大規(guī)模 AI 工廠,而每家企業(yè)都將需
    的頭像 發(fā)表于 04-11 11:27 ?1032次閱讀
    <b class='flag-5'>NVIDIA</b>驅(qū)動(dòng)的<b class='flag-5'>AI</b><b class='flag-5'>工廠</b>正在重新定義數(shù)據(jù)中心

    樹(shù)莓派操作系統(tǒng)版本、特性及設(shè)置完整指南!

    樹(shù)莓派操作系統(tǒng)是什么?樹(shù)莓派操作系統(tǒng)是由樹(shù)莓派基金會(huì)專(zhuān)為樹(shù)莓派開(kāi)發(fā)的官方操作系統(tǒng)。它基于DebianLinux發(fā)行版,并針對(duì)樹(shù)莓派的ARM架構(gòu)進(jìn)行了專(zhuān)門(mén)優(yōu)化。樹(shù)莓派操作系統(tǒng)有多個(gè)
    的頭像 發(fā)表于 07-28 18:26 ?1497次閱讀
    樹(shù)莓派<b class='flag-5'>操作系統(tǒng)</b>:<b class='flag-5'>版本</b>、特性及設(shè)置完整指南!

    Commotion推出NVIDIA Nemotron?開(kāi)源模型驅(qū)動(dòng)的企業(yè)級(jí)AI操作系統(tǒng),助力數(shù)字員工團(tuán)隊(duì)提升生產(chǎn)

    投資的領(lǐng)先AI原生初創(chuàng)企業(yè)Commotion Inc.今日宣布,推出一款與NVIDIA合作構(gòu)建的全新AI操作系統(tǒng)
    的頭像 發(fā)表于 02-25 21:17 ?132次閱讀
    Commotion<b class='flag-5'>推出</b>由<b class='flag-5'>NVIDIA</b> Nemotron?開(kāi)源模型驅(qū)動(dòng)的企業(yè)級(jí)<b class='flag-5'>AI</b><b class='flag-5'>操作系統(tǒng)</b>,助力數(shù)字員工團(tuán)隊(duì)提升<b class='flag-5'>生產(chǎn)</b>力