chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

利用NVIDIA推理模型構(gòu)建AI智能體

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 2025-08-13 14:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

開放式推理模型能夠更快、更廣泛地進行思考,為客戶服務(wù)、網(wǎng)絡(luò)安全、制造、物流和機器人等領(lǐng)域的 AI 智能體生成更明智的結(jié)果。

Capgemini 數(shù)據(jù)表明,截至 2028 年,AI 智能體將通過推動收入增長與節(jié)省成本創(chuàng)造高達 4,500 億美元的價值。構(gòu)建這些智能體的開發(fā)者正轉(zhuǎn)向更高性能的推理模型,以改進 AI 智能體平臺和物理 AI 系統(tǒng)。

NVIDIA 在 SIGGRAPH 大會上宣布擴展兩個支持推理功能的系列模型:NVIDIA Nemotron和NVIDIA Cosmos,各行業(yè)的領(lǐng)導(dǎo)者都在使用這些模型,通過 AI 智能體和人形機器人編隊來提高生產(chǎn)力。

CrowdStrike、Uber、Magna、NetApp 和 Zoom 等一些企業(yè)都在使用這些系列模型。

全新 NVIDIA Nemotron Nano 2 和 Llama Nemotron Super 1.5 模型在同等規(guī)模模型中的科學(xué)推理、數(shù)學(xué)、編碼、工具調(diào)用、指令遵循和對話方面展現(xiàn)出優(yōu)異的精度表現(xiàn)。借助這些新模型,AI 智能體能夠提高思考深度和工作效率,從而探索更廣泛的選項、加速研究并在設(shè)定時限內(nèi)提供更明智的結(jié)果。

模型能被視為 AI 智能體的“大腦”,它提供了核心智能。但要使這類“大腦”在企業(yè)中發(fā)揮作用,必須將其嵌入到能理解特定工作流以及行業(yè)和業(yè)務(wù)術(shù)語,并能夠安全運行的智能體中。NVIDIA 可通過領(lǐng)先的庫和 AI 藍圖幫助企業(yè)大規(guī)模部署、定制和管理 AI 智能體,從而彌合這一差距。

Cosmos Reason是用于物理 AI 應(yīng)用的新型推理視覺語言模型 (VLM),擅長了解現(xiàn)實世界的運作機制,使用結(jié)構(gòu)化推理來理解物理學(xué)、客體永久性和時空對齊等概念。

Cosmos Reason 經(jīng)過量身定制,可作為機器人視覺語言動作 (VLA) 模型的推理主干,或為機器人和智能汽車訓(xùn)練數(shù)據(jù)評論和注釋提供支持,并賦予運行時視覺 AI 智能體在工廠或城市等環(huán)境中對時空理解和物理操作的推理能力。

Nemotron:更大限度地提高

代理式企業(yè)級 AI 的精度和效率

隨著企業(yè)開發(fā) AI 智能體來處理復(fù)雜的多步驟任務(wù),能夠通過高效生成 token 來提供超高推理準確性的模型將可實現(xiàn)大規(guī)模智能且自主的決策制定。

NVIDIA Nemotron 包含一系列先進的開放式推理模型,可使用領(lǐng)先的模型、NVIDIA 精選的開放數(shù)據(jù)集和先進 AI 技術(shù),幫助 AI 智能體提高準確性和效率。

最新 Nemotron 模型在以下三個方面實現(xiàn)了出色的效率:全新混合模型架構(gòu)、緊湊型量化模型以及可配置的思考預(yù)算,可幫助開發(fā)者控制 token 生成,從而將推理成本降低 60%。這種組合便于模型更深入地進行推理并更快響應(yīng),無需投入更多時間或算力。這意味著能夠以更低成本取得更好的結(jié)果。

與其他同等規(guī)模的領(lǐng)先模型相比,Nemotron Nano 2 將 token 生成提速 6 倍。

Llama Nemotron Super 1.5 在同類產(chǎn)品中實現(xiàn)了領(lǐng)先性能和極高的推理準確性,有助于 AI 智能體更高效地進行推理,做出更明智決策并獨立處理復(fù)雜任務(wù)。它現(xiàn)以 NVFP4(即 4 位浮點)格式提供,與 NVIDIA H100 GPU 相比,在 NVIDIA B200 GPU 上可將吞吐量提高 6 倍。

aaa7a49e-7751-11f0-a18e-92fbcf53809c.png

上圖顯示,在同一時段內(nèi)且計算預(yù)算相同的情況下,Nemotron 模型的推理實現(xiàn)了極高的準確性,并實現(xiàn)了單位成本下的極佳準確率。

在發(fā)布這兩個全新 Nemotron 模型的同時,NVIDIA 還宣布推出首個開放 VLM 訓(xùn)練數(shù)據(jù)集 Llama Nemotron VLM 數(shù)據(jù)集 v1,該數(shù)據(jù)集包含 300 萬個光學(xué)字符識別、視覺 QA 和字幕數(shù)據(jù)樣本,可支持之前發(fā)布的 Llama 3.1 Nemotron Nano VL 8B 模型。

除推理模型精度以外,智能體還依賴檢索增強生成 (RAG) 技術(shù),跨不同來源從聯(lián)網(wǎng)數(shù)據(jù)中獲取最新、最相關(guān)的信息,以便做出明智決策。最近發(fā)布的 Llama 3.2 NeMo Retriever 嵌入模型在三個視覺文檔檢索排行榜 (ViDoRe V1、ViDoRe V2 和 MTEB VisualDocumentRetrieval) 中均排名前列,可幫助提高智能體系統(tǒng)的準確性。

借助這些推理和信息檢索模型,使用AI-Q NVIDIA Blueprint構(gòu)建的深度研究智能體目前在 DeepResearch Bench 上的開放可移植式智能體排行榜中排名首位。

NVIDIA NeMo和NVIDIA NIM可從開發(fā)、部署到智能體系統(tǒng)的監(jiān)管和優(yōu)化,支持整個 AI 智能體生命周期。

Cosmos Reason:物理 AI 領(lǐng)域的突破

VLM 標志著計算機視覺和機器人領(lǐng)域的突破,可助力機器識別物體和模式。但是,非推理的 VLM 缺乏理解現(xiàn)實世界并與之交互的能力,意味著它們既無法處理不確定性或新奇的情景,也無法執(zhí)行復(fù)雜的多步驟任務(wù)。

NVIDIA Cosmos Reason是一種專為物理 AI 和機器人而打造的全新開放式可定制 70 億參數(shù)推理 VLM。借助 Cosmos Reason,機器人和視覺 AI 智能體能夠像人類一樣進行推理,利用先驗知識、物理理解和常識來了解物理世界并采取行動。

Cosmos Reason 可為機器人和物理 AI 應(yīng)用提供高級功能,例如訓(xùn)練數(shù)據(jù)評論和字幕支持、機器人決策制定和視頻分析 AI 智能體。

它可以幫助自動處理并標注大型多樣化的訓(xùn)練數(shù)據(jù)集,加速高精度 AI 模型的開發(fā)。它也可以充當(dāng)用于機器人規(guī)劃的精密推理引擎,從而將復(fù)雜指令解析為即使在新環(huán)境也可供 VLA 模型執(zhí)行的步驟。

它還可為NVIDIA Metropolis平臺上基于視頻搜索和總結(jié) (VSS) NVIDIA Blueprint 構(gòu)建的視頻分析 AI 智能體提供支持,從大量存儲或?qū)崟r的視頻數(shù)據(jù)中獲取寶貴見解。這些視覺感知和交互式 AI 智能體可以通過查明異常,來幫助工廠、倉庫、零售商店、機場、交叉路口等場所簡化操作。

NVIDIA 的機器人研究團隊將 Cosmos Reason 用于數(shù)據(jù)篩選和整理,并將其用作 VLA 模型(例如后續(xù)版本的NVIDIA Isaac GR00T NX)背后的 "System 2" 推理 VLM。

現(xiàn)已推出:適用于 AI 智能體和機器人的NVIDIA 推理模型無處不在

多元化企業(yè)和咨詢行業(yè)領(lǐng)導(dǎo)者都在采用 NVIDIA 的最新推理模型。從網(wǎng)絡(luò)安全到電信,各行業(yè)的領(lǐng)導(dǎo)者都開始使用 Nemotron 來構(gòu)建企業(yè)級 AI 智能體。

Zoom計劃將 Nemotron 推理模型與 Zoom AI Companion 相結(jié)合,幫助做出決策并管理多步驟任務(wù),以便 Zoom Meetings、Zoom Chat 和 Zoom 文檔用戶執(zhí)行操作。

CrowdStrike正在測試 Nemotron 模型,以便其 Charlotte AI 智能體在 CrowdStrike Falcon 平臺上寫入請求。

Amdocs正在其 amAIz 套件中使用 NVIDIA Nemotron 模型,以支持 AI 智能體處理護理、銷售、網(wǎng)絡(luò)和客戶支持等領(lǐng)域的復(fù)雜、多步驟自動化操作。

鑒于 Nemotron Nano 2 的高吞吐量,安永正采用該模型來支持大型企業(yè)組織中的代理式 AI,用于處理稅務(wù)、風(fēng)險管理和金融用例。

NetApp正在測試 Nemotron 推理模型,以便 AI 智能體能夠搜索和分析業(yè)務(wù)數(shù)據(jù)。

DataRobot正在與 Nemotron 模型合作,用于其 Agent Workforce Platform,以實現(xiàn)端到端的智能體生命周期管理。

Tabnine正使用 Nemotron 模型,為開發(fā)者提供編碼任務(wù)建議和實現(xiàn)自動化編碼任務(wù)。

Automation Anywhere、CrewAI和Dataiku等代理式 AI軟件開發(fā)商都在其平臺中集成了 Nemotron 模型。

交通運輸、安全和 AI 智能領(lǐng)域的領(lǐng)先企業(yè)正使用 Cosmos Reason 來加強輔助駕駛、視頻分析、道路和工作場所的安全。

Uber正在探索如何使用 Cosmos Reason 來分析智能汽車的行為。此外,Uber 還在對 Cosmos Reason 進行后訓(xùn)練,以總結(jié)視覺數(shù)據(jù)并分析行人穿行高速公路等場景,進而執(zhí)行質(zhì)量分析并指導(dǎo)輔助駕駛行為。

Cosmos Reason 也可以作為智能汽車的“大腦”。它讓機器人能夠解讀環(huán)境,在接收到復(fù)雜指令時將其分解為任務(wù),并使用常識去執(zhí)行任務(wù),即便在陌生環(huán)境中也是如此。

Centific正在測試 Cosmos Reason,以增強其 AI 賦能的視頻智能平臺。運用 VLM,該平臺能夠?qū)?fù)雜的視頻數(shù)據(jù)處理為可供行動參考的見解,幫助減少誤報并提高決策制定的效率。

VAST正采用 NVIDIA Cosmos Reason 及其 AI 操作系統(tǒng)來大規(guī)模處理海量視頻流,推動實時城市智能發(fā)展。借助 VSS Blueprint,VAST 可構(gòu)建能夠識別突發(fā)事件并觸發(fā)響應(yīng)的智能體,將視頻流和元數(shù)據(jù)轉(zhuǎn)化為可操作的主動式公共安全工具。

Ambient.ai正使用 Cosmos Reason 的時間物理感知推理,自動檢測丟失的個人防護設(shè)備并監(jiān)測危險狀況,幫助改善建筑、制造、物流和其他工業(yè)環(huán)境中的環(huán)境健康與安全。

Magna正在將 Cosmos Reason 集成至其 City Delivery Platform(一個高度自主、低成本即時配送解決方案),幫助車輛更快地適應(yīng)新城市。該模型為車輛的長期軌跡規(guī)劃增添了對世界的理解能力。

這些模型預(yù)計將以 NVIDIA NIM 的形式提供,以便安全可靠地部署到任意 NVIDIA 加速基礎(chǔ)設(shè)施上,更大限度地提高隱私性和控制力。這些模型計劃不久后通過 Amazon Bedrock 和 Amazon SageMaker AI (用于 Nemotron 模型),以及 Azure AI Foundry、Oracle Data Science Platform 和 Google Vertex AI 發(fā)布。

您可在 NVIDIA 官網(wǎng)上試用 Cosmos Reason,或通過 Hugging Face 和 GitHub 下載。

Nemotron Nano 2 和 Llama Nemotron Super 1.5 (NVFP4) 將在不久后開放下載。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5494

    瀏覽量

    109016
  • AI
    AI
    +關(guān)注

    關(guān)注

    89

    文章

    38001

    瀏覽量

    295913
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3644

    瀏覽量

    51683

原文標題:SIGGRAPH 2025 | 全球行業(yè)先驅(qū)利用NVIDIA Nemotron和Cosmos推理模型,為企業(yè)構(gòu)建AI智能體

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    什么是AI模型推理能力

    NVIDIA 的數(shù)據(jù)工廠團隊為 NVIDIA Cosmos Reason 等 AI 模型奠定了基礎(chǔ),該模型近日在 Hugging Face
    的頭像 發(fā)表于 09-23 15:19 ?792次閱讀

    NVIDIA Nemotron Nano 2推理模型發(fā)布

    NVIDIA 正式推出準確、高效的混合 Mamba-Transformer 推理模型系列 NVIDIA Nemotron Nano 2。
    的頭像 發(fā)表于 08-27 12:45 ?1345次閱讀
    <b class='flag-5'>NVIDIA</b> Nemotron Nano 2<b class='flag-5'>推理模型</b>發(fā)布

    澎峰科技完成OpenAI最新開源推理模型適配

    澎峰科技現(xiàn)已完成 OpenAI 最新開源推理模型 gpt-oss-20b 在 DeepFusion 大模型機上的原生適配與優(yōu)化,用戶可一鍵啟用這顆“小而強悍”的新引擎,在本地享受企業(yè)級 A
    的頭像 發(fā)表于 08-14 11:34 ?1127次閱讀

    基于NVIDIA Llama Nemotron Super v1.5模型構(gòu)建AI智能

    AI 智能體現(xiàn)在已經(jīng)能夠解決多步驟問題、編寫生產(chǎn)級代碼并在多個領(lǐng)域擔(dān)任通用助手。但要充分發(fā)揮其潛力,還需要在控制成本的前提下加入先進的邏輯推理模型
    的頭像 發(fā)表于 08-05 16:17 ?1083次閱讀
    基于<b class='flag-5'>NVIDIA</b> Llama Nemotron Super v1.5<b class='flag-5'>模型</b><b class='flag-5'>構(gòu)建</b><b class='flag-5'>AI</b><b class='flag-5'>智能</b><b class='flag-5'>體</b>

    信而泰×DeepSeek:AI推理引擎驅(qū)動網(wǎng)絡(luò)智能診斷邁向 “自愈”時代

    模態(tài)的技術(shù)特性,DeepSeek正加速推動AI在金融、政務(wù)、科研及網(wǎng)絡(luò)智能化等關(guān)鍵領(lǐng)域的深度應(yīng)用。 信而泰:AI推理引擎賦能網(wǎng)絡(luò)智能診斷新范
    發(fā)表于 07-16 15:29

    企業(yè)使用NVIDIA NeMo微服務(wù)構(gòu)建AI智能平臺

    已發(fā)布的 NeMo 微服務(wù)可與合作伙伴平臺集成,作為創(chuàng)建 AI 智能構(gòu)建模塊,使用商業(yè)智能與強大的邏輯
    的頭像 發(fā)表于 04-27 15:05 ?979次閱讀

    詳解 LLM 推理模型的現(xiàn)狀

    領(lǐng)域的最新研究進展,特別是自DeepSeekR1發(fā)布后興起的推理時間計算擴展相關(guān)內(nèi)容。在LLM中實施和改進推理簡單來說,基于LLM的推理模型是一種旨在通過生成中間
    的頭像 發(fā)表于 04-03 12:09 ?1212次閱讀
    詳解 LLM <b class='flag-5'>推理模型</b>的現(xiàn)狀

    英偉達GTC2025亮點 NVIDIA推出Cosmos世界基礎(chǔ)模型和物理AI數(shù)據(jù)工具的重大更新

    推理模型,讓開發(fā)者以前所未有的方式控制世界生成。 NVIDIA 還推出了兩款由 NVIDIA Omniverse 和 Cosmos 平臺提供支持的新藍圖,為開發(fā)者提供用于機
    的頭像 發(fā)表于 03-20 19:01 ?1171次閱讀

    英偉達GTC25亮點:NVIDIA Dynamo開源庫加速并擴展AI推理模型

    DeepSeek-R1 上的吞吐量提高了 30 倍 NVIDIA 發(fā)布了開源推理軟件 NVIDIA Dynamo,旨在以高效率、低成本加速并擴展 AI 工廠中的
    的頭像 發(fā)表于 03-20 15:03 ?1061次閱讀

    NVIDIA 推出開放推理 AI 模型系列,助力開發(fā)者和企業(yè)構(gòu)建代理式 AI 平臺

    月 18 日 —— ?NVIDIA 今日發(fā)布具有推理功能的開源 Llama Nemotron 模型系列,旨在為開發(fā)者和企業(yè)提供業(yè)務(wù)就緒型基礎(chǔ),助力構(gòu)建能夠獨立工作或以團隊形式完成復(fù)雜
    發(fā)表于 03-19 09:31 ?333次閱讀
    <b class='flag-5'>NVIDIA</b> 推出開放<b class='flag-5'>推理</b> <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>系列,助力開發(fā)者和企業(yè)<b class='flag-5'>構(gòu)建</b>代理式 <b class='flag-5'>AI</b> 平臺

    AI模型在汽車應(yīng)用中的推理、降本與可解釋性研究

    佐思汽研發(fā)布《2024-2025年AI模型及其在汽車領(lǐng)域的應(yīng)用研究報告》。 推理能力成為大模型性能提升的驅(qū)動引擎 2024下半年以來,國內(nèi)外大模型
    的頭像 發(fā)表于 02-18 15:02 ?1797次閱讀
    <b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>在汽車應(yīng)用中的<b class='flag-5'>推理</b>、降本與可解釋性研究

    科大訊飛發(fā)布星火深度推理模型X1

    今天,科大訊飛正式發(fā)布星火深度推理模型X1,星火4.0 Turbo底座全面升級,首發(fā)星火語音同傳大模型
    的頭像 發(fā)表于 01-15 15:54 ?1023次閱讀

    科大訊飛即將發(fā)布訊飛星火深度推理模型X1

    ,標志著科大訊飛在AI技術(shù)領(lǐng)域的又一次重大突破。訊飛星火深度推理模型X1將為科大訊飛的智能產(chǎn)品注入更為強大的AI能力,使其在處理復(fù)雜任務(wù)和
    的頭像 發(fā)表于 01-08 10:30 ?1016次閱讀

    智譜推出深度推理模型GLM-Zero預(yù)覽版

    近日,智譜公司正式發(fā)布了其深度推理模型GLM-Zero的預(yù)覽版——GLM-Zero-Preview。這款模型標志著智譜在擴展強化學(xué)習(xí)技術(shù)訓(xùn)練推理模型方面的重大突破,成為其首個專注于增強AI
    的頭像 發(fā)表于 01-03 10:42 ?755次閱讀

    智譜GLM-Zero深度推理模型預(yù)覽版正式上線

    近日,智譜公司宣布其深度推理模型GLM-Zero的初代版本——GLM-Zero-Preview已正式上線。這款模型是智譜首個基于擴展強化學(xué)習(xí)技術(shù)訓(xùn)練的推理模型,標志著智譜在AI
    的頭像 發(fā)表于 01-02 10:55 ?791次閱讀