AI 智能體現(xiàn)在已經(jīng)能夠解決多步驟問題、編寫生產(chǎn)級(jí)代碼并在多個(gè)領(lǐng)域擔(dān)任通用助手。但要充分發(fā)揮其潛力,還需要在控制成本的前提下加入先進(jìn)的邏輯推理模型。
NVIDIA Nemotron系列在生態(tài)系統(tǒng)中強(qiáng)大的開放模型基礎(chǔ)上,通過使用 NVIDIA 開源合成數(shù)據(jù)集、先進(jìn)的技術(shù)以及工具,進(jìn)一步提升了模型的準(zhǔn)確性、效率和透明度。使得創(chuàng)建實(shí)用、適配、高性能的 AI 智能體成為了可能。
該系列最新發(fā)布的 Llama Nemotron Super 48B v1.5 版本在保持高吞吐量和計(jì)算效率的情況下,顯著提升了在數(shù)學(xué)、科學(xué)、編碼、函數(shù)調(diào)用、指令跟隨、對(duì)話等核心邏輯推理與代理任務(wù)中的性能。
該模型現(xiàn)已位居 Artificial Analysis Intelligence Index 排行榜榜首。
本文將詳細(xì)介紹這一最新 NVIDIA Nemotron 模型的準(zhǔn)確性與推理性能、訓(xùn)練方法、數(shù)據(jù)透明度、架構(gòu)優(yōu)化及部署選項(xiàng)。
Llama Nemotron Super v1.5
領(lǐng)跑 Artificial Analysis 排行榜
新模型采用與原 Llama Nemotron Ultra v1 相同的方法構(gòu)建而成,但使用了更多高質(zhì)量的邏輯推理數(shù)據(jù)來進(jìn)一步進(jìn)行優(yōu)化和訓(xùn)練后微調(diào)。
該模型憑借在多項(xiàng)邏輯推理和代理任務(wù)中展現(xiàn)出的領(lǐng)先性能,問鼎 Artificial Analysis Intelligence Index 排行榜。排行榜匯集 MMLU-Pro、GPQA Diamond、Humanity’s Last Exam、LiveCodeBench、SciCode、AIME 和 MATH-500 等基準(zhǔn)測(cè)試的準(zhǔn)確率數(shù)據(jù)。

圖 1. Artificial Analysis Intelligence Index 排行榜
根據(jù)第三方在一系列行業(yè)標(biāo)準(zhǔn)邏輯推理及指令和函數(shù)調(diào)用任務(wù)基準(zhǔn)測(cè)試中的評(píng)估,Llama Nemotron Super v1.5 在高等數(shù)學(xué)、編碼、邏輯推理和對(duì)話指標(biāo)上的表現(xiàn)優(yōu)于其他開放模型,使其穩(wěn)居 700 億參數(shù)級(jí)模型榜首。

圖 2. Llama Nemotron Super v1.5 為邏輯推理和代理任務(wù)提供更高的準(zhǔn)確性
除了在邏輯推理和代理能力上領(lǐng)先外,該模型還使用能夠提高吞吐量性能 (Neural Architecture Search, 神經(jīng)架構(gòu)搜索) 的后訓(xùn)練方法,大幅提升了吞吐量。

圖 3. Llama Nemotron Super v1.5 為代理任務(wù)提供更高的準(zhǔn)確性和吞吐量,降低了推理成本
最終得到了一個(gè)適合在單個(gè) NVIDIA Hopper 架構(gòu) GPU 上運(yùn)行的高性能模型,使開發(fā)者能夠開發(fā)出更加有效和高效的代理系統(tǒng)。
專為邏輯推理和代理工作負(fù)載開發(fā)
Llama Nemotron Super v1.5 使用多項(xiàng) NVIDIA 核心技術(shù)開發(fā)而成:
Llama Nemotron 后訓(xùn)練開源數(shù)據(jù)集
該數(shù)據(jù)集完全通過合成數(shù)據(jù)生成技術(shù)創(chuàng)建而成,其使用了 Qwen3 235B 和 DeepSeek R1 671B 0528 等先進(jìn)的邏輯推理模型。它使團(tuán)隊(duì)能夠生成超過 2,600 萬行高質(zhì)量的函數(shù)調(diào)用、指令跟隨、邏輯推理、對(duì)話、數(shù)學(xué)和代碼數(shù)據(jù)。
發(fā)布該數(shù)據(jù)集使我們能公開透明地展示模型訓(xùn)練的具體內(nèi)容,讓開發(fā)者和企業(yè)更加放心地選擇 Llama Nemotron Super v1.5 作為其代理系統(tǒng)的引擎。
除了公開透明外,發(fā)布該數(shù)據(jù)集還使開發(fā)者在自行開發(fā)模型時(shí)無需投入大量的時(shí)間和精力去生成高質(zhì)量數(shù)據(jù)集,降低了開發(fā)新型高性能模型的門檻。
該數(shù)據(jù)集即將在 Hugging Face 上發(fā)布,可通過數(shù)據(jù)集卡片獲得更詳細(xì)的信息。
后訓(xùn)練流程
如此前文章所述,后訓(xùn)練流程如下:

圖 4. Llama Nemotron Super v1.5 后訓(xùn)練流程
團(tuán)隊(duì)利用強(qiáng)化學(xué)習(xí)將該模型性能提高到極限,以此實(shí)現(xiàn)了上述邏輯推理能力。該模型經(jīng)過了多道后訓(xùn)練流程,所有流程均針對(duì)需要提升的能力定制,包括監(jiān)督式微調(diào) (SFT) 以及:
獎(jiǎng)勵(lì)感知偏好優(yōu)化 (RPO):使用 NVIDIA 先進(jìn)的獎(jiǎng)勵(lì)模型提升對(duì)話能力
直接偏好優(yōu)化 (DPO):用于提升工具調(diào)用的能力
可驗(yàn)證獎(jiǎng)勵(lì)強(qiáng)化學(xué)習(xí) (RLVR):用于提升指令執(zhí)行、數(shù)學(xué)、科學(xué)等能力
這套全面的后訓(xùn)練流程確保模型的每項(xiàng)能力都得到了訓(xùn)練,將邏輯推理準(zhǔn)確性推向了新高度。
團(tuán)隊(duì)還使用了NeMo Skills評(píng)估和驗(yàn)證模型檢查點(diǎn),加快了迭代速度和研究周期,并實(shí)現(xiàn)可復(fù)現(xiàn)性。
以 NIM 形式提供Llama Nemotron Super v1.5
Llama Nemotron Super v1.5 很快將作為NVIDIA NIM提供,以便快速、可靠地將其部署到首選的 NVIDIA 加速基礎(chǔ)設(shè)施上。用戶只需使用幾行簡(jiǎn)單命令就能完成部署,并且能夠直接集成兼容 OpenAI API 的私有端點(diǎn),以提升 AI 智能體和邏輯推理應(yīng)用的性能。此外,Llama Nemotron Super 的強(qiáng)大推理性能可根據(jù)需求自動(dòng)擴(kuò)展。
開始使用
Llama Nemotron Super v1.5
Llama Nemotron Super v1.5 模型在保持計(jì)算效率的同時(shí),還提供強(qiáng)大的邏輯推理能力。它能夠驅(qū)動(dòng)從個(gè)人開發(fā)者到大型企業(yè)的各類代理應(yīng)用。
現(xiàn)可先在 NVIDIA 官網(wǎng)上試用模型。如要對(duì)模型進(jìn)行測(cè)試,可通過 Hugging Face 下載檢查點(diǎn),或按照模型卡片通過所提供的指令運(yùn)行模型。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5570瀏覽量
109383 -
AI
+關(guān)注
關(guān)注
91文章
39085瀏覽量
299646 -
模型
+關(guān)注
關(guān)注
1文章
3692瀏覽量
51947
原文標(biāo)題:使用全新 NVIDIA Llama Nemotron Super v1.5 構(gòu)建更加準(zhǔn)確、高效的 AI 智能體
文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
NVIDIA AI Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成式 AI 模型
NVIDIA Nemotron-4 340B模型幫助開發(fā)者生成合成訓(xùn)練數(shù)據(jù)
英偉達(dá)發(fā)布AI模型 Llama-3.1-Nemotron-51B AI模型
使用NVIDIA TensorRT提升Llama 3.2性能
NVIDIA推出開放式Llama Nemotron系列模型
NVIDIA 推出開放推理 AI 模型系列,助力開發(fā)者和企業(yè)構(gòu)建代理式 AI 平臺(tái)
企業(yè)使用NVIDIA NeMo微服務(wù)構(gòu)建AI智能體平臺(tái)
ServiceNow攜手NVIDIA構(gòu)建150億參數(shù)超級(jí)助手
NVIDIA Nemotron Nano 2推理模型發(fā)布
NVIDIA Nemotron模型如何推動(dòng)AI發(fā)展
使用NVIDIA Nemotron RAG和Microsoft SQL Server 2025構(gòu)建高性能AI應(yīng)用
NVIDIA Nemotron如何助力企業(yè)構(gòu)建專業(yè)AI智能體
NVIDIA 推出 Nemotron 3 系列開放模型
基于NVIDIA Llama Nemotron Super v1.5模型構(gòu)建AI智能體
評(píng)論