NVIDIA 為 gpt-oss-120b 帶來(lái)業(yè)界領(lǐng)先性能,在單個(gè) NVIDIA Blackwell 系統(tǒng)上實(shí)現(xiàn)每秒 150 萬(wàn)個(gè) Token。
OpenAI 發(fā)布了兩個(gè)全新開(kāi)放權(quán)重 AI 邏輯推理模型,為全球各個(gè)行業(yè)、規(guī)模的開(kāi)發(fā)者、愛(ài)好者、企業(yè)、初創(chuàng)公司及政府機(jī)構(gòu)帶來(lái)前沿 AI 開(kāi)發(fā)技術(shù)。
由 NVIDIA 與 OpenAI 共同開(kāi)發(fā)的開(kāi)放模型 gpt-oss-120b 和 gpt-oss-20b,展現(xiàn)了由社區(qū)驅(qū)動(dòng)創(chuàng)新的力量,并凸顯 NVIDIA 在推動(dòng)全球 AI 普及中的關(guān)鍵作用。
任何人都可以使用這兩個(gè)模型開(kāi)發(fā)生成式 AI、邏輯推理 AI 和物理 AI 以及醫(yī)療和制造領(lǐng)域的突破性應(yīng)用,甚至在 AI 驅(qū)動(dòng)的新一輪工業(yè)革命發(fā)展過(guò)程中開(kāi)拓新的行業(yè)領(lǐng)域。
OpenAI 新發(fā)布的靈活、開(kāi)放權(quán)重的文本推理大語(yǔ)言模型 (LLM) 在 NVIDIA Hopper 架構(gòu) GPU 上訓(xùn)練而成,能夠在全球數(shù)億顆運(yùn)行NVIDIA CUDA平臺(tái)的 GPU 上實(shí)現(xiàn)極佳推理性能。
這些模型現(xiàn)已作為NVIDIA NIM的形式提供,可輕松地部署在任何 GPU 加速基礎(chǔ)設(shè)施上,并同時(shí)具有靈活性、數(shù)據(jù)隱私和提供企業(yè)級(jí)安全等特性。
憑借專為 NVIDIA Blackwell 平臺(tái)開(kāi)發(fā)的軟件優(yōu)化措施,這兩個(gè)模型可在 NVIDIA GB200 NVL72 系統(tǒng)上實(shí)現(xiàn)每秒 150 萬(wàn)個(gè) Token 的卓越推理性能,極大提升推理效率。
NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“OpenAI 向世界展示了基于 NVIDIA AI 開(kāi)發(fā)的技術(shù),現(xiàn)在他們正在推動(dòng)開(kāi)源軟件領(lǐng)域的創(chuàng)新。新發(fā)布的 gpt-oss 模型使全球各地的開(kāi)發(fā)者都能夠在先進(jìn)的開(kāi)源基礎(chǔ)上進(jìn)行開(kāi)發(fā),而這一切都要依托領(lǐng)先的 AI 計(jì)算基礎(chǔ)設(shè)施?!?/p>
NVIDIA Blackwell 提供先進(jìn)的推理技術(shù)
隨著 gpt-oss 等先進(jìn)邏輯推理模型所生成 Token 的數(shù)量指數(shù)級(jí)增長(zhǎng),對(duì)計(jì)算基礎(chǔ)設(shè)施的需求也大幅增加。NVIDIA Blackwell 驅(qū)動(dòng)的專用 AI 工廠能夠滿足這一需求,該架構(gòu)旨在提供超高性能推理所需的規(guī)模、效率和投資回報(bào)。
NVIDIA Blackwell 包含 NVFP4 4 位精度等創(chuàng)新技術(shù),可在大幅降低功耗和顯存需求的同時(shí),實(shí)現(xiàn)極高的推理效率和準(zhǔn)確性。這使得實(shí)時(shí)部署萬(wàn)億參數(shù)級(jí)的大語(yǔ)言模型 (LLM) 成為可能,進(jìn)而為企業(yè)創(chuàng)造數(shù)十億美元的價(jià)值。
幫助全球數(shù)百萬(wàn) AI 構(gòu)建者實(shí)現(xiàn)開(kāi)放式開(kāi)發(fā)
NVIDIA CUDA 是全球廣泛使用的計(jì)算基礎(chǔ)設(shè)施。無(wú)論是在強(qiáng)大的NVIDIA DGX Cloud平臺(tái),還是NVIDIA GeForce RTX和NVIDIA RTX PRO驅(qū)動(dòng)的 PC 和工作站,用戶都可以任意部署和運(yùn)行 AI 模型。
截至目前,NVIDIA CUDA 的下載量已超過(guò) 4.5 億次。龐大的 CUDA 開(kāi)發(fā)者社區(qū)現(xiàn)已能夠使用這兩個(gè)最新模型,并在其自身使用的 NVIDIA 技術(shù)棧上運(yùn)行。
為進(jìn)一步推動(dòng)軟件開(kāi)源,OpenAI 與 NVIDIA 還攜手頂級(jí)開(kāi)源框架提供商,為 FlashInfer、Hugging Face、llama.cpp、Ollama 和 vLLM 等框架以及NVIDIA Tensor-RT LLM等庫(kù)提供模型優(yōu)化方案,使開(kāi)發(fā)者能夠選擇自己常用的框架進(jìn)行開(kāi)發(fā)。
建立在開(kāi)源基礎(chǔ)上的長(zhǎng)期合作
新發(fā)布的模型展現(xiàn)了 NVIDIA 的全棧技術(shù)如何將全球前沿的 AI 項(xiàng)目帶給盡可能廣泛的用戶群體。
這個(gè)故事可追溯到 NVIDIA 與 OpenAI 的初期合作。2016 年,黃仁勛親自將首臺(tái) NVIDIA DGX-1 AI 超級(jí)計(jì)算機(jī)送至 OpenAI 位于舊金山的總部。
自那時(shí)起,兩家公司就一直共同推動(dòng) AI 技術(shù)的邊界,為用戶提供大規(guī)模訓(xùn)練所需的核心技術(shù)與專業(yè)知識(shí)。
如今,全球 250 個(gè)國(guó)家 / 地區(qū)共有 650 萬(wàn)開(kāi)發(fā)者正在使用 900 多種 NVIDIA 軟件開(kāi)發(fā)套件和 AI 模型進(jìn)行開(kāi)發(fā),這一數(shù)字仍在持續(xù)增長(zhǎng)。通過(guò)對(duì) OpenAI 的 gpt-oss 模型進(jìn)行 NVIDIA Blackwell 和 RTX GPU 適配優(yōu)化以及推出豐富的軟件堆棧,NVIDIA 正在為這些開(kāi)發(fā)者提供更加快速、更具有經(jīng)濟(jì)效益的先進(jìn) AI 技術(shù)。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5594瀏覽量
109782 -
AI
+關(guān)注
關(guān)注
91文章
39814瀏覽量
301481 -
模型
+關(guān)注
關(guān)注
1文章
3755瀏覽量
52118 -
OpenAI
+關(guān)注
關(guān)注
9文章
1245瀏覽量
10090
原文標(biāo)題:OpenAI 與 NVIDIA 共同開(kāi)發(fā)專為全球大型 AI 推理基礎(chǔ)設(shè)施優(yōu)化的全新開(kāi)放模型,推動(dòng) AI 創(chuàng)新
文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
NVIDIA推出代理式AI藍(lán)圖與電信推理模型
谷歌推出TranslateGemma全新開(kāi)放翻譯模型系列
NVIDIA全新開(kāi)放物理AI模型和框架加速人形機(jī)器人開(kāi)發(fā)
NVIDIA在CES 2026發(fā)布全新開(kāi)放模型、數(shù)據(jù)和工具
深入解析NVIDIA Nemotron 3系列開(kāi)放模型
NVIDIA 推出 Nemotron 3 系列開(kāi)放模型
NVIDIA攜手Mistral AI發(fā)布全新開(kāi)源大語(yǔ)言模型系列
NVIDIA推動(dòng)面向數(shù)字與物理AI的開(kāi)源模型發(fā)展
利用NVIDIA Cosmos開(kāi)放世界基礎(chǔ)模型加速物理AI開(kāi)發(fā)
面向科學(xué)仿真的開(kāi)放模型系列NVIDIA Apollo正式發(fā)布
NVIDIA推出面向語(yǔ)言、機(jī)器人和生物學(xué)的全新開(kāi)源AI技術(shù)
NVIDIA 利用全新開(kāi)源模型與仿真庫(kù)加速機(jī)器人研發(fā)進(jìn)程
NVIDIA從云到邊緣加速OpenAI gpt-oss模型部署,實(shí)現(xiàn)150萬(wàn)TPS推理
OpenAI與NVIDIA共同開(kāi)發(fā)全新開(kāi)放模型
評(píng)論