chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA發(fā)布Nemotron 3 Nano Omni開(kāi)放式多模態(tài)模型

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來(lái)源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2026-05-08 10:06 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

這一領(lǐng)先的開(kāi)放式全模態(tài)推理模型可提供更高的效率和準(zhǔn)確性,能夠?yàn)橛?jì)算機(jī)操作、文檔智能和音頻-視頻推理等智能體工作流提供動(dòng)力。

如今的 AI 智能體系統(tǒng)需要分別調(diào)用視覺(jué)、語(yǔ)音和語(yǔ)言模型 —— 而在模型間傳遞數(shù)據(jù)的過(guò)程中,不僅耗時(shí),還會(huì)丟失上下文信息。

今日發(fā)布的 NVIDIA Nemotron 3 Nano Omni 是一款開(kāi)放式多模態(tài)模型,它將上述功能集成至一個(gè)系統(tǒng)中,使智能體能夠?qū)σ曨l、音頻、圖像和文本進(jìn)行高級(jí)推理,從而提供更快、更智能的響應(yīng)。這一出色的模型為企業(yè)和開(kāi)發(fā)者提供了一條生產(chǎn)路徑,幫助其構(gòu)建更高效且更準(zhǔn)確的多模態(tài) AI 智能體,并賦予他們完全的部署靈活性與控制權(quán)。

Nemotron 3 Nano Omni 憑借其較高的準(zhǔn)確性和成本優(yōu)勢(shì),為開(kāi)放式多模態(tài)模型設(shè)定了新的效率邊界,并在復(fù)雜文檔智能以及視頻和音頻理解領(lǐng)域的六項(xiàng)榜單中名列前茅。

目前已采用 Nemotron 3 Nano Omni 的 AI 和軟件公司包括Aible、Applied Scientific Intelligence (ASI)、Eka Care、Foxconn、H Company、Palantir 和Pyler,同時(shí)戴爾科技、Docusign、Infosys、K-Dense、Lila、Oracle 和Zefr正在評(píng)估該模型。

H Company 首席執(zhí)行官 Gautier Cloix 表示:“要構(gòu)建實(shí)用的智能體,不能花幾秒鐘等待模型來(lái)解析屏幕。我們的智能體基于 Nemotron 3 Nano Omni 進(jìn)行構(gòu)建,可以快速解析全高清屏幕錄制內(nèi)容 —— 而這在過(guò)去是無(wú)法實(shí)現(xiàn)的。這不僅僅是速度上的提升,也改變了我們的智能體實(shí)時(shí)感知和與數(shù)字環(huán)境交互的方式。

Nemotron 3 Nano Omni 助力打造更快、更精簡(jiǎn)的多模態(tài)智能體

試想一個(gè)客戶支持 AI 智能體在處理屏幕錄制內(nèi)容的同時(shí),還需要分析上傳的通話音頻并檢查數(shù)據(jù)日志;或是一個(gè)財(cái)務(wù) AI 智能體需要負(fù)責(zé)解析多個(gè) PDF、電子表格、圖表和語(yǔ)音筆記。如今,大多數(shù)智能體系統(tǒng)都通過(guò)獨(dú)立的視覺(jué)、語(yǔ)音和語(yǔ)言模型來(lái)完成這些任務(wù)。

這種方法會(huì)因?yàn)橹貜?fù)推理而增加延遲,導(dǎo)致不同模態(tài)之間的上下文碎片化,并隨時(shí)間推移增加成本和誤差性。
通過(guò)在其 30B-A3B 的混合專(zhuān)家模型 (MoE)架構(gòu)中結(jié)合視覺(jué)和音頻編碼器,Nemotron 3 Nano Omni 無(wú)需獨(dú)立的感知模型,從而大規(guī)模提高推理效率。它將這種效率與強(qiáng)大的多模態(tài)感知準(zhǔn)確性相結(jié)合,使 AI 系統(tǒng)在保持相同交互性能的情況下,實(shí)現(xiàn)比其他開(kāi)放式全模態(tài)模型高 9 倍的吞吐量。因此,其能夠在不犧牲響應(yīng)速度或質(zhì)量的前提下降低成本并提高可擴(kuò)展性。

在智能體系統(tǒng)中,Nemotron 3 Nano Omni 可以與專(zhuān)有云模型或其他 NVIDIA Nemotron 開(kāi)放模型,例如用于高頻執(zhí)行的 Nemotron 3 Super 或用于復(fù)雜規(guī)劃的 Nemotron 3 Ultra,同時(shí)也可結(jié)合其他供應(yīng)商的專(zhuān)有模型協(xié)同工作,來(lái)支持計(jì)算機(jī)操作、文檔智能和音頻-視頻推理等智能體工作流中的子智能體。

計(jì)算機(jī)操作智能體 ——Nemotron 3 Nano Omni 為智能體提供感知回路,幫助其在圖形用戶界面導(dǎo)航、對(duì)屏幕內(nèi)容進(jìn)行推理,并理解隨時(shí)間變化的用戶界面狀態(tài)。H Company 最新推出的由 Nemotron 3 Nano Omni 驅(qū)動(dòng)的計(jì)算機(jī)操作智能體,采用 1920×1080 像素的原生輸入分辨率,以實(shí)現(xiàn)高保真視覺(jué)推理。在對(duì) OSWorld 基準(zhǔn)測(cè)試的初步評(píng)估中,這種集成在導(dǎo)航復(fù)雜圖形界面上實(shí)現(xiàn)了重大飛躍,并利用了 Nemotron 3 Nano Omni 處理超高分辨率圖像的能力。

文檔智能 ——解析文檔、圖表、表格、屏幕截圖和混合媒體輸入,使智能體能夠連貫地推理視覺(jué)結(jié)構(gòu)和文本內(nèi)容。這對(duì)企業(yè)分析和合規(guī)性工作流至關(guān)重要。

音頻和視頻理解 ——針對(duì)客戶服務(wù)、研究和監(jiān)測(cè)工作流,Nemotron 3 Nano Omni 能夠保持音頻-視頻上下文,將所說(shuō)、所顯示和所記錄的內(nèi)容綁定到單個(gè)推理流中,而非毫無(wú)關(guān)聯(lián)的摘要。

開(kāi)放且可定制,隨處可部署

Nemotron 3 Nano Omni 發(fā)布時(shí)附帶開(kāi)放權(quán)重、數(shù)據(jù)集和訓(xùn)練技術(shù),賦予組織對(duì)模型定制和部署方式的完全透明度與控制力。

開(kāi)發(fā)者可以使用諸如NVIDIA NeMo等工具來(lái)定制、評(píng)估和優(yōu)化特定領(lǐng)域的用例。由于 Nemotron 系列模型是開(kāi)放的,組織可以將其部署在符合監(jiān)管、主權(quán)或數(shù)據(jù)本地化要求的環(huán)境中。

過(guò)去一年中,Nemotron 3 系列 —— 包括 Nano、Super 和 Ultra 模型 —— 下載量已超 5,000 萬(wàn)次。Omni 將該系列的能力擴(kuò)展到多模態(tài)和智能體領(lǐng)域。

該模型已在Hugging Face、OpenRouter和NVIDIA 官網(wǎng)以 NVIDIA NIM 的形式上線,并通過(guò)廣泛的NVIDIA 云合作伙伴、推理平臺(tái)和云服務(wù)提供商生態(tài)系統(tǒng)提供支持。

其開(kāi)放、輕量級(jí)的架構(gòu)可支持從NVIDIA Jetson硬件、NVIDIA DGX Spark等本地系統(tǒng)到數(shù)據(jù)中心和云環(huán)境的一致性部署。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5706

    瀏覽量

    110154
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41459

    瀏覽量

    302789
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3841

    瀏覽量

    52293

原文標(biāo)題:NVIDIA 發(fā)布 Nemotron 3 Nano Omni 模型,融合視覺(jué)、音頻和語(yǔ)言,助力 AI 智能體效率提升高達(dá) 9 倍

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    模態(tài)模型 前沿算法與實(shí)戰(zhàn)應(yīng)用 第一季》精品課程簡(jiǎn)介

    優(yōu)化 模態(tài)模型參數(shù)量大,需采用混合精度訓(xùn)練(FP16+FP32)和梯度累積技術(shù)減少顯存占用。例如在訓(xùn)練視頻理解模型時(shí),可將batch size從16降至4,同時(shí)通過(guò)梯度累積模擬16的
    發(fā)表于 05-01 17:46

    NVIDIA開(kāi)放模型助力構(gòu)建下一代數(shù)字健康智能體

    NVIDIA Nemotron 系列開(kāi)放模型NVIDIA NeMo 庫(kù)正在為臨床醫(yī)生、研究人員和開(kāi)發(fā)者提供
    的頭像 發(fā)表于 03-25 09:46 ?473次閱讀

    NVIDIA 成立由全球領(lǐng)先 AI 實(shí)驗(yàn)室組成的 Nemotron Coalition,推動(dòng)開(kāi)放前沿模型發(fā)展

    新聞?wù)?● NVIDIA Nemotron Coalition 是模型構(gòu)建者和 AI 實(shí)驗(yàn)室的首個(gè)此類(lèi)全球合作項(xiàng)目,致力于通過(guò)共享專(zhuān)業(yè)知識(shí)、數(shù)據(jù)和計(jì)算來(lái)推進(jìn)開(kāi)放前沿基礎(chǔ)
    的頭像 發(fā)表于 03-17 11:14 ?352次閱讀
    <b class='flag-5'>NVIDIA</b> 成立由全球領(lǐng)先 AI 實(shí)驗(yàn)室組成的 <b class='flag-5'>Nemotron</b> Coalition,推動(dòng)<b class='flag-5'>開(kāi)放</b>前沿<b class='flag-5'>模型</b>發(fā)展

    NVIDIA 擴(kuò)展開(kāi)放模型系列,推動(dòng)代理式、物理和醫(yī)療 AI 下一階段發(fā)展

    新聞?wù)?●NVIDIA Nemotron 3模態(tài)理解模型 (Omni-understan
    的頭像 發(fā)表于 03-17 09:18 ?553次閱讀
    <b class='flag-5'>NVIDIA</b> 擴(kuò)展<b class='flag-5'>開(kāi)放</b><b class='flag-5'>模型</b>系列,推動(dòng)代理式、物理和醫(yī)療 AI 下一階段發(fā)展

    全新NVIDIA Nemotron 3 Super模型重磅發(fā)布

    一款全新的開(kāi)放 1,200 億參數(shù)混合式 MoE (mixture?of?experts) 模型,專(zhuān)為 NVIDIA Blackwell 進(jìn)行了優(yōu)化,可解決拖慢自主智能體工作流的長(zhǎng)時(shí)推理和上下文爆炸的成本難題。
    的頭像 發(fā)表于 03-16 16:22 ?561次閱讀

    利用NVIDIA Nemotron開(kāi)放模型構(gòu)建智能文檔處理系統(tǒng)

    基于 NVIDIA Nemotron 開(kāi)放模型的 AI 驅(qū)動(dòng)文檔智能,增強(qiáng)科學(xué)研究、金融和法律等領(lǐng)域工作流。
    的頭像 發(fā)表于 02-25 11:21 ?721次閱讀

    NVIDIA在CES 2026發(fā)布全新開(kāi)放模型、數(shù)據(jù)和工具

    為擴(kuò)展開(kāi)放模型生態(tài),NVIDIA 發(fā)布全新開(kāi)放模型、數(shù)據(jù)和工具,推動(dòng)各行業(yè) AI 技術(shù)的發(fā)展。
    的頭像 發(fā)表于 01-09 10:42 ?761次閱讀

    深入解析NVIDIA Nemotron 3系列開(kāi)放模型

    這一全新開(kāi)放模型系列引入了開(kāi)放的混合 Mamba-Transformer MoE 架構(gòu),使智能體系統(tǒng)能夠進(jìn)行快速長(zhǎng)上下文推理。
    的頭像 發(fā)表于 12-24 10:34 ?4380次閱讀
    深入解析<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Nemotron</b> <b class='flag-5'>3</b>系列<b class='flag-5'>開(kāi)放</b><b class='flag-5'>模型</b>

    NVIDIA 推出 Nemotron 3 系列開(kāi)放模型

    新聞?wù)?● Nemotron 3 系列開(kāi)放模型包含 Nano、Super 和 Ultra 三種規(guī)模,具有極高的效率和領(lǐng)先的精度,適用于代
    的頭像 發(fā)表于 12-16 09:27 ?877次閱讀
    <b class='flag-5'>NVIDIA</b> 推出 <b class='flag-5'>Nemotron</b> <b class='flag-5'>3</b> 系列<b class='flag-5'>開(kāi)放</b><b class='flag-5'>模型</b>

    NVIDIA推動(dòng)面向數(shù)字與物理AI的開(kāi)源模型發(fā)展

    NVIDIA 發(fā)布一系列涵蓋語(yǔ)音、安全與輔助駕駛領(lǐng)域的全新 AI 工具,其中包括面向移動(dòng)出行領(lǐng)域的行業(yè)級(jí)開(kāi)源視覺(jué)-語(yǔ)言-動(dòng)作推理模型(Reasoning VLA) NVIDIA DRI
    的頭像 發(fā)表于 12-13 09:50 ?1594次閱讀

    商湯科技正式發(fā)布并開(kāi)源全新模態(tài)模型架構(gòu)NEO

    商湯科技正式發(fā)布并開(kāi)源了與南洋理工大學(xué)S-Lab合作研發(fā)的全新模態(tài)模型架構(gòu) —— NEO,為日日新SenseNova
    的頭像 發(fā)表于 12-08 11:19 ?1207次閱讀
    商湯科技正式<b class='flag-5'>發(fā)布</b>并開(kāi)源全新<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b><b class='flag-5'>模型</b>架構(gòu)NEO

    使用NVIDIA Nemotron RAG和Microsoft SQL Server 2025構(gòu)建高性能AI應(yīng)用

    搜索和調(diào)用外部 AI 模型的 SQL 原生 API。NVIDIA 與微軟共同將 SQL Server 2025 與 NVIDIA Nemotron RAG
    的頭像 發(fā)表于 12-01 09:31 ?1106次閱讀
    使用<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Nemotron</b> RAG和Microsoft SQL Server 2025構(gòu)建高性能AI應(yīng)用

    利用NVIDIA Cosmos開(kāi)放世界基礎(chǔ)模型加速物理AI開(kāi)發(fā)

    NVIDIA 最近發(fā)布NVIDIA Cosmos 開(kāi)放世界基礎(chǔ)模型(WFM)的更新,旨在加速物理 AI
    的頭像 發(fā)表于 12-01 09:25 ?1502次閱讀

    面向科學(xué)仿真的開(kāi)放模型系列NVIDIA Apollo正式發(fā)布

    用于加速工業(yè)和計(jì)算工程的開(kāi)放模型系列 NVIDIA Apollo 于近日舉行的 SC25 大會(huì)上正式發(fā)布。
    的頭像 發(fā)表于 11-25 11:15 ?7.4w次閱讀

    NVIDIA Nemotron Nano 2推理模型發(fā)布

    NVIDIA 正式推出準(zhǔn)確、高效的混合 Mamba-Transformer 推理模型系列 NVIDIA Nemotron Nano 2。
    的頭像 發(fā)表于 08-27 12:45 ?2068次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Nemotron</b> <b class='flag-5'>Nano</b> 2推理<b class='flag-5'>模型</b><b class='flag-5'>發(fā)布</b>