chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

利用NVIDIA推理模型構(gòu)建AI智能體

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來(lái)源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2025-08-13 14:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

開(kāi)放式推理模型能夠更快、更廣泛地進(jìn)行思考,為客戶服務(wù)、網(wǎng)絡(luò)安全、制造、物流和機(jī)器人等領(lǐng)域的 AI 智能體生成更明智的結(jié)果。

Capgemini 數(shù)據(jù)表明,截至 2028 年,AI 智能體將通過(guò)推動(dòng)收入增長(zhǎng)與節(jié)省成本創(chuàng)造高達(dá) 4,500 億美元的價(jià)值。構(gòu)建這些智能體的開(kāi)發(fā)者正轉(zhuǎn)向更高性能的推理模型,以改進(jìn) AI 智能體平臺(tái)和物理 AI 系統(tǒng)。

NVIDIA 在 SIGGRAPH 大會(huì)上宣布擴(kuò)展兩個(gè)支持推理功能的系列模型:NVIDIA Nemotron和NVIDIA Cosmos,各行業(yè)的領(lǐng)導(dǎo)者都在使用這些模型,通過(guò) AI 智能體和人形機(jī)器人編隊(duì)來(lái)提高生產(chǎn)力。

CrowdStrike、Uber、Magna、NetApp 和 Zoom 等一些企業(yè)都在使用這些系列模型。

全新 NVIDIA Nemotron Nano 2 和 Llama Nemotron Super 1.5 模型在同等規(guī)模模型中的科學(xué)推理、數(shù)學(xué)、編碼、工具調(diào)用、指令遵循和對(duì)話方面展現(xiàn)出優(yōu)異的精度表現(xiàn)。借助這些新模型,AI 智能體能夠提高思考深度和工作效率,從而探索更廣泛的選項(xiàng)、加速研究并在設(shè)定時(shí)限內(nèi)提供更明智的結(jié)果。

模型能被視為 AI 智能體的“大腦”,它提供了核心智能。但要使這類“大腦”在企業(yè)中發(fā)揮作用,必須將其嵌入到能理解特定工作流以及行業(yè)和業(yè)務(wù)術(shù)語(yǔ),并能夠安全運(yùn)行的智能體中。NVIDIA 可通過(guò)領(lǐng)先的庫(kù)和 AI 藍(lán)圖幫助企業(yè)大規(guī)模部署、定制和管理 AI 智能體,從而彌合這一差距。

Cosmos Reason是用于物理 AI 應(yīng)用的新型推理視覺(jué)語(yǔ)言模型 (VLM),擅長(zhǎng)了解現(xiàn)實(shí)世界的運(yùn)作機(jī)制,使用結(jié)構(gòu)化推理來(lái)理解物理學(xué)、客體永久性和時(shí)空對(duì)齊等概念。

Cosmos Reason 經(jīng)過(guò)量身定制,可作為機(jī)器人視覺(jué)語(yǔ)言動(dòng)作 (VLA) 模型的推理主干,或?yàn)闄C(jī)器人和智能汽車訓(xùn)練數(shù)據(jù)評(píng)論和注釋提供支持,并賦予運(yùn)行時(shí)視覺(jué) AI 智能體在工廠或城市等環(huán)境中對(duì)時(shí)空理解和物理操作的推理能力。

Nemotron:更大限度地提高

代理式企業(yè)級(jí) AI 的精度和效率

隨著企業(yè)開(kāi)發(fā) AI 智能體來(lái)處理復(fù)雜的多步驟任務(wù),能夠通過(guò)高效生成 token 來(lái)提供超高推理準(zhǔn)確性的模型將可實(shí)現(xiàn)大規(guī)模智能且自主的決策制定。

NVIDIA Nemotron 包含一系列先進(jìn)的開(kāi)放式推理模型,可使用領(lǐng)先的模型、NVIDIA 精選的開(kāi)放數(shù)據(jù)集和先進(jìn) AI 技術(shù),幫助 AI 智能體提高準(zhǔn)確性和效率。

最新 Nemotron 模型在以下三個(gè)方面實(shí)現(xiàn)了出色的效率:全新混合模型架構(gòu)、緊湊型量化模型以及可配置的思考預(yù)算,可幫助開(kāi)發(fā)者控制 token 生成,從而將推理成本降低 60%。這種組合便于模型更深入地進(jìn)行推理并更快響應(yīng),無(wú)需投入更多時(shí)間或算力。這意味著能夠以更低成本取得更好的結(jié)果。

與其他同等規(guī)模的領(lǐng)先模型相比,Nemotron Nano 2 將 token 生成提速 6 倍。

Llama Nemotron Super 1.5 在同類產(chǎn)品中實(shí)現(xiàn)了領(lǐng)先性能和極高的推理準(zhǔn)確性,有助于 AI 智能體更高效地進(jìn)行推理,做出更明智決策并獨(dú)立處理復(fù)雜任務(wù)。它現(xiàn)以 NVFP4(即 4 位浮點(diǎn))格式提供,與 NVIDIA H100 GPU 相比,在 NVIDIA B200 GPU 上可將吞吐量提高 6 倍。

aaa7a49e-7751-11f0-a18e-92fbcf53809c.png

上圖顯示,在同一時(shí)段內(nèi)且計(jì)算預(yù)算相同的情況下,Nemotron 模型的推理實(shí)現(xiàn)了極高的準(zhǔn)確性,并實(shí)現(xiàn)了單位成本下的極佳準(zhǔn)確率。

在發(fā)布這兩個(gè)全新 Nemotron 模型的同時(shí),NVIDIA 還宣布推出首個(gè)開(kāi)放 VLM 訓(xùn)練數(shù)據(jù)集 Llama Nemotron VLM 數(shù)據(jù)集 v1,該數(shù)據(jù)集包含 300 萬(wàn)個(gè)光學(xué)字符識(shí)別、視覺(jué) QA 和字幕數(shù)據(jù)樣本,可支持之前發(fā)布的 Llama 3.1 Nemotron Nano VL 8B 模型。

除推理模型精度以外,智能體還依賴檢索增強(qiáng)生成 (RAG) 技術(shù),跨不同來(lái)源從聯(lián)網(wǎng)數(shù)據(jù)中獲取最新、最相關(guān)的信息,以便做出明智決策。最近發(fā)布的 Llama 3.2 NeMo Retriever 嵌入模型在三個(gè)視覺(jué)文檔檢索排行榜 (ViDoRe V1、ViDoRe V2 和 MTEB VisualDocumentRetrieval) 中均排名前列,可幫助提高智能體系統(tǒng)的準(zhǔn)確性。

借助這些推理和信息檢索模型,使用AI-Q NVIDIA Blueprint構(gòu)建的深度研究智能體目前在 DeepResearch Bench 上的開(kāi)放可移植式智能體排行榜中排名首位。

NVIDIA NeMo和NVIDIA NIM可從開(kāi)發(fā)、部署到智能體系統(tǒng)的監(jiān)管和優(yōu)化,支持整個(gè) AI 智能體生命周期。

Cosmos Reason:物理 AI 領(lǐng)域的突破

VLM 標(biāo)志著計(jì)算機(jī)視覺(jué)和機(jī)器人領(lǐng)域的突破,可助力機(jī)器識(shí)別物體和模式。但是,非推理的 VLM 缺乏理解現(xiàn)實(shí)世界并與之交互的能力,意味著它們既無(wú)法處理不確定性或新奇的情景,也無(wú)法執(zhí)行復(fù)雜的多步驟任務(wù)。

NVIDIA Cosmos Reason是一種專為物理 AI 和機(jī)器人而打造的全新開(kāi)放式可定制 70 億參數(shù)推理 VLM。借助 Cosmos Reason,機(jī)器人和視覺(jué) AI 智能體能夠像人類一樣進(jìn)行推理,利用先驗(yàn)知識(shí)、物理理解和常識(shí)來(lái)了解物理世界并采取行動(dòng)。

Cosmos Reason 可為機(jī)器人和物理 AI 應(yīng)用提供高級(jí)功能,例如訓(xùn)練數(shù)據(jù)評(píng)論和字幕支持、機(jī)器人決策制定和視頻分析 AI 智能體。

它可以幫助自動(dòng)處理并標(biāo)注大型多樣化的訓(xùn)練數(shù)據(jù)集,加速高精度 AI 模型的開(kāi)發(fā)。它也可以充當(dāng)用于機(jī)器人規(guī)劃的精密推理引擎,從而將復(fù)雜指令解析為即使在新環(huán)境也可供 VLA 模型執(zhí)行的步驟。

它還可為NVIDIA Metropolis平臺(tái)上基于視頻搜索和總結(jié) (VSS) NVIDIA Blueprint 構(gòu)建的視頻分析 AI 智能體提供支持,從大量存儲(chǔ)或?qū)崟r(shí)的視頻數(shù)據(jù)中獲取寶貴見(jiàn)解。這些視覺(jué)感知和交互式 AI 智能體可以通過(guò)查明異常,來(lái)幫助工廠、倉(cāng)庫(kù)、零售商店、機(jī)場(chǎng)、交叉路口等場(chǎng)所簡(jiǎn)化操作。

NVIDIA 的機(jī)器人研究團(tuán)隊(duì)將 Cosmos Reason 用于數(shù)據(jù)篩選和整理,并將其用作 VLA 模型(例如后續(xù)版本的NVIDIA Isaac GR00T NX)背后的 "System 2" 推理 VLM。

現(xiàn)已推出:適用于 AI 智能體和機(jī)器人的NVIDIA 推理模型無(wú)處不在

多元化企業(yè)和咨詢行業(yè)領(lǐng)導(dǎo)者都在采用 NVIDIA 的最新推理模型。從網(wǎng)絡(luò)安全到電信,各行業(yè)的領(lǐng)導(dǎo)者都開(kāi)始使用 Nemotron 來(lái)構(gòu)建企業(yè)級(jí) AI 智能體。

Zoom計(jì)劃將 Nemotron 推理模型與 Zoom AI Companion 相結(jié)合,幫助做出決策并管理多步驟任務(wù),以便 Zoom Meetings、Zoom Chat 和 Zoom 文檔用戶執(zhí)行操作。

CrowdStrike正在測(cè)試 Nemotron 模型,以便其 Charlotte AI 智能體在 CrowdStrike Falcon 平臺(tái)上寫入請(qǐng)求。

Amdocs正在其 amAIz 套件中使用 NVIDIA Nemotron 模型,以支持 AI 智能體處理護(hù)理、銷售、網(wǎng)絡(luò)和客戶支持等領(lǐng)域的復(fù)雜、多步驟自動(dòng)化操作。

鑒于 Nemotron Nano 2 的高吞吐量,安永正采用該模型來(lái)支持大型企業(yè)組織中的代理式 AI,用于處理稅務(wù)、風(fēng)險(xiǎn)管理和金融用例。

NetApp正在測(cè)試 Nemotron 推理模型,以便 AI 智能體能夠搜索和分析業(yè)務(wù)數(shù)據(jù)。

DataRobot正在與 Nemotron 模型合作,用于其 Agent Workforce Platform,以實(shí)現(xiàn)端到端的智能體生命周期管理。

Tabnine正使用 Nemotron 模型,為開(kāi)發(fā)者提供編碼任務(wù)建議和實(shí)現(xiàn)自動(dòng)化編碼任務(wù)。

Automation Anywhere、CrewAI和Dataiku等代理式 AI軟件開(kāi)發(fā)商都在其平臺(tái)中集成了 Nemotron 模型。

交通運(yùn)輸、安全和 AI 智能領(lǐng)域的領(lǐng)先企業(yè)正使用 Cosmos Reason 來(lái)加強(qiáng)輔助駕駛、視頻分析、道路和工作場(chǎng)所的安全。

Uber正在探索如何使用 Cosmos Reason 來(lái)分析智能汽車的行為。此外,Uber 還在對(duì) Cosmos Reason 進(jìn)行后訓(xùn)練,以總結(jié)視覺(jué)數(shù)據(jù)并分析行人穿行高速公路等場(chǎng)景,進(jìn)而執(zhí)行質(zhì)量分析并指導(dǎo)輔助駕駛行為。

Cosmos Reason 也可以作為智能汽車的“大腦”。它讓機(jī)器人能夠解讀環(huán)境,在接收到復(fù)雜指令時(shí)將其分解為任務(wù),并使用常識(shí)去執(zhí)行任務(wù),即便在陌生環(huán)境中也是如此。

Centific正在測(cè)試 Cosmos Reason,以增強(qiáng)其 AI 賦能的視頻智能平臺(tái)。運(yùn)用 VLM,該平臺(tái)能夠?qū)?fù)雜的視頻數(shù)據(jù)處理為可供行動(dòng)參考的見(jiàn)解,幫助減少誤報(bào)并提高決策制定的效率。

VAST正采用 NVIDIA Cosmos Reason 及其 AI 操作系統(tǒng)來(lái)大規(guī)模處理海量視頻流,推動(dòng)實(shí)時(shí)城市智能發(fā)展。借助 VSS Blueprint,VAST 可構(gòu)建能夠識(shí)別突發(fā)事件并觸發(fā)響應(yīng)的智能體,將視頻流和元數(shù)據(jù)轉(zhuǎn)化為可操作的主動(dòng)式公共安全工具。

Ambient.ai正使用 Cosmos Reason 的時(shí)間物理感知推理,自動(dòng)檢測(cè)丟失的個(gè)人防護(hù)設(shè)備并監(jiān)測(cè)危險(xiǎn)狀況,幫助改善建筑、制造、物流和其他工業(yè)環(huán)境中的環(huán)境健康與安全。

Magna正在將 Cosmos Reason 集成至其 City Delivery Platform(一個(gè)高度自主、低成本即時(shí)配送解決方案),幫助車輛更快地適應(yīng)新城市。該模型為車輛的長(zhǎng)期軌跡規(guī)劃增添了對(duì)世界的理解能力。

這些模型預(yù)計(jì)將以 NVIDIA NIM 的形式提供,以便安全可靠地部署到任意 NVIDIA 加速基礎(chǔ)設(shè)施上,更大限度地提高隱私性和控制力。這些模型計(jì)劃不久后通過(guò) Amazon Bedrock 和 Amazon SageMaker AI (用于 Nemotron 模型),以及 Azure AI Foundry、Oracle Data Science Platform 和 Google Vertex AI 發(fā)布。

您可在 NVIDIA 官網(wǎng)上試用 Cosmos Reason,或通過(guò) Hugging Face 和 GitHub 下載。

Nemotron Nano 2 和 Llama Nemotron Super 1.5 (NVFP4) 將在不久后開(kāi)放下載。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5431

    瀏覽量

    108254
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    37012

    瀏覽量

    289995
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3610

    瀏覽量

    51423

原文標(biāo)題:SIGGRAPH 2025 | 全球行業(yè)先驅(qū)利用NVIDIA Nemotron和Cosmos推理模型,為企業(yè)構(gòu)建AI智能體

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    什么是AI模型推理能力

    NVIDIA 的數(shù)據(jù)工廠團(tuán)隊(duì)為 NVIDIA Cosmos Reason 等 AI 模型奠定了基礎(chǔ),該模型近日在 Hugging Face
    的頭像 發(fā)表于 09-23 15:19 ?555次閱讀

    NVIDIA Nemotron Nano 2推理模型發(fā)布

    NVIDIA 正式推出準(zhǔn)確、高效的混合 Mamba-Transformer 推理模型系列 NVIDIA Nemotron Nano 2。
    的頭像 發(fā)表于 08-27 12:45 ?1173次閱讀
    <b class='flag-5'>NVIDIA</b> Nemotron Nano 2<b class='flag-5'>推理模型</b>發(fā)布

    澎峰科技完成OpenAI最新開(kāi)源推理模型適配

    澎峰科技現(xiàn)已完成 OpenAI 最新開(kāi)源推理模型 gpt-oss-20b 在 DeepFusion 大模型機(jī)上的原生適配與優(yōu)化,用戶可一鍵啟用這顆“小而強(qiáng)悍”的新引擎,在本地享受企業(yè)級(jí) A
    的頭像 發(fā)表于 08-14 11:34 ?990次閱讀

    基于NVIDIA Llama Nemotron Super v1.5模型構(gòu)建AI智能

    AI 智能體現(xiàn)在已經(jīng)能夠解決多步驟問(wèn)題、編寫生產(chǎn)級(jí)代碼并在多個(gè)領(lǐng)域擔(dān)任通用助手。但要充分發(fā)揮其潛力,還需要在控制成本的前提下加入先進(jìn)的邏輯推理模型。
    的頭像 發(fā)表于 08-05 16:17 ?866次閱讀
    基于<b class='flag-5'>NVIDIA</b> Llama Nemotron Super v1.5<b class='flag-5'>模型</b><b class='flag-5'>構(gòu)建</b><b class='flag-5'>AI</b><b class='flag-5'>智能</b><b class='flag-5'>體</b>

    信而泰×DeepSeek:AI推理引擎驅(qū)動(dòng)網(wǎng)絡(luò)智能診斷邁向 “自愈”時(shí)代

    模態(tài)的技術(shù)特性,DeepSeek正加速推動(dòng)AI在金融、政務(wù)、科研及網(wǎng)絡(luò)智能化等關(guān)鍵領(lǐng)域的深度應(yīng)用。 信而泰:AI推理引擎賦能網(wǎng)絡(luò)智能診斷新范
    發(fā)表于 07-16 15:29

    企業(yè)使用NVIDIA NeMo微服務(wù)構(gòu)建AI智能平臺(tái)

    已發(fā)布的 NeMo 微服務(wù)可與合作伙伴平臺(tái)集成,作為創(chuàng)建 AI 智能構(gòu)建模塊,使用商業(yè)智能與強(qiáng)大的邏輯
    的頭像 發(fā)表于 04-27 15:05 ?831次閱讀

    詳解 LLM 推理模型的現(xiàn)狀

    領(lǐng)域的最新研究進(jìn)展,特別是自DeepSeekR1發(fā)布后興起的推理時(shí)間計(jì)算擴(kuò)展相關(guān)內(nèi)容。在LLM中實(shí)施和改進(jìn)推理簡(jiǎn)單來(lái)說(shuō),基于LLM的推理模型是一種旨在通過(guò)生成中間
    的頭像 發(fā)表于 04-03 12:09 ?941次閱讀
    詳解 LLM <b class='flag-5'>推理模型</b>的現(xiàn)狀

    英偉達(dá)GTC2025亮點(diǎn) NVIDIA推出Cosmos世界基礎(chǔ)模型和物理AI數(shù)據(jù)工具的重大更新

    推理模型,讓開(kāi)發(fā)者以前所未有的方式控制世界生成。 NVIDIA 還推出了兩款由 NVIDIA Omniverse 和 Cosmos 平臺(tái)提供支持的新藍(lán)圖,為開(kāi)發(fā)者提供用于機(jī)
    的頭像 發(fā)表于 03-20 19:01 ?1053次閱讀

    英偉達(dá)GTC25亮點(diǎn):NVIDIA Dynamo開(kāi)源庫(kù)加速并擴(kuò)展AI推理模型

    DeepSeek-R1 上的吞吐量提高了 30 倍 NVIDIA 發(fā)布了開(kāi)源推理軟件 NVIDIA Dynamo,旨在以高效率、低成本加速并擴(kuò)展 AI 工廠中的
    的頭像 發(fā)表于 03-20 15:03 ?914次閱讀

    NVIDIA 推出開(kāi)放推理 AI 模型系列,助力開(kāi)發(fā)者和企業(yè)構(gòu)建代理式 AI 平臺(tái)

    月 18 日 —— ?NVIDIA 今日發(fā)布具有推理功能的開(kāi)源 Llama Nemotron 模型系列,旨在為開(kāi)發(fā)者和企業(yè)提供業(yè)務(wù)就緒型基礎(chǔ),助力構(gòu)建能夠獨(dú)立工作或以團(tuán)隊(duì)形式完成復(fù)雜
    發(fā)表于 03-19 09:31 ?298次閱讀
    <b class='flag-5'>NVIDIA</b> 推出開(kāi)放<b class='flag-5'>推理</b> <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>系列,助力開(kāi)發(fā)者和企業(yè)<b class='flag-5'>構(gòu)建</b>代理式 <b class='flag-5'>AI</b> 平臺(tái)

    AI模型在汽車應(yīng)用中的推理、降本與可解釋性研究

    佐思汽研發(fā)布《2024-2025年AI模型及其在汽車領(lǐng)域的應(yīng)用研究報(bào)告》。 推理能力成為大模型性能提升的驅(qū)動(dòng)引擎 2024下半年以來(lái),國(guó)內(nèi)外大模型
    的頭像 發(fā)表于 02-18 15:02 ?1622次閱讀
    <b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>在汽車應(yīng)用中的<b class='flag-5'>推理</b>、降本與可解釋性研究

    科大訊飛發(fā)布星火深度推理模型X1

    今天,科大訊飛正式發(fā)布星火深度推理模型X1,星火4.0 Turbo底座全面升級(jí),首發(fā)星火語(yǔ)音同傳大模型。
    的頭像 發(fā)表于 01-15 15:54 ?942次閱讀

    科大訊飛即將發(fā)布訊飛星火深度推理模型X1

    ,標(biāo)志著科大訊飛在AI技術(shù)領(lǐng)域的又一次重大突破。訊飛星火深度推理模型X1將為科大訊飛的智能產(chǎn)品注入更為強(qiáng)大的AI能力,使其在處理復(fù)雜任務(wù)和
    的頭像 發(fā)表于 01-08 10:30 ?918次閱讀

    智譜推出深度推理模型GLM-Zero預(yù)覽版

    近日,智譜公司正式發(fā)布了其深度推理模型GLM-Zero的預(yù)覽版——GLM-Zero-Preview。這款模型標(biāo)志著智譜在擴(kuò)展強(qiáng)化學(xué)習(xí)技術(shù)訓(xùn)練推理模型方面的重大突破,成為其首個(gè)專注于增強(qiáng)AI
    的頭像 發(fā)表于 01-03 10:42 ?683次閱讀

    智譜GLM-Zero深度推理模型預(yù)覽版正式上線

    近日,智譜公司宣布其深度推理模型GLM-Zero的初代版本——GLM-Zero-Preview已正式上線。這款模型是智譜首個(gè)基于擴(kuò)展強(qiáng)化學(xué)習(xí)技術(shù)訓(xùn)練的推理模型,標(biāo)志著智譜在AI
    的頭像 發(fā)表于 01-02 10:55 ?690次閱讀