chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA為全球企業(yè)開發(fā)和部署大型語(yǔ)言模型打開一扇新的大門

NVIDIA英偉達(dá) ? 來(lái)源:NVIDIA英偉達(dá) ? 作者:NVIDIA英偉達(dá) ? 2021-11-12 14:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NVIDIA NeMo Megatron 框架; 可定制的大規(guī)模語(yǔ)言模型Megatron 530B;多GPU、多節(jié)點(diǎn) Triton推理服務(wù)器助力基于語(yǔ)言的AI開發(fā)和部署,推動(dòng)行業(yè)和科學(xué)發(fā)展

NVIDIA為全球企業(yè)開發(fā)和部署大型語(yǔ)言模型打開了一扇新的大門——使這些企業(yè)能夠建立他們自己的、特定領(lǐng)域的聊天機(jī)器人、個(gè)人助理和其他AI應(yīng)用程序,并能夠以前所未有的水平理解語(yǔ)言中的微妙和細(xì)微差別。

NVIDIA推出了為訓(xùn)練具有數(shù)萬(wàn)億參數(shù)的語(yǔ)言模型而優(yōu)化的NVIDIA NeMo Megatron框架、為新領(lǐng)域和語(yǔ)言進(jìn)行訓(xùn)練的可定制大型語(yǔ)言模型(LLM)Megatron 530B以及具有多GPU、多節(jié)點(diǎn)分布式推理功能的NVIDIA Triton推理服務(wù)器。

這些工具與NVIDIA DGX系統(tǒng)相結(jié)合,提供了一個(gè)可部署到實(shí)際生產(chǎn)環(huán)境的企業(yè)級(jí)解決方案,以簡(jiǎn)化大型語(yǔ)言模型的開發(fā)和部署。

“大型語(yǔ)言模型已被證明是靈活且功能強(qiáng)大的,無(wú)需專門的培訓(xùn)或監(jiān)督,即可回答深層次領(lǐng)域問(wèn)題,翻譯語(yǔ)言,理解和總結(jié)文件,編寫故事和計(jì)算程序?!?NVIDIA應(yīng)用深度學(xué)習(xí)研究副總裁Bryan Catanzaro表示?!?為新的語(yǔ)言和領(lǐng)域建立大型語(yǔ)言模型可能仍然是最大的超級(jí)計(jì)算的應(yīng)用,現(xiàn)在這些功能對(duì)全球的企業(yè)也變得觸手可及?!?/p>

NVIDIA NeMo Megatron和Megatron 530B

加速大型語(yǔ)言模型開發(fā)

NVIDIA NeMo Megatron是在Megatron的基礎(chǔ)上發(fā)展起來(lái)的開源項(xiàng)目,由NVIDIA研究人員主導(dǎo),研究大型轉(zhuǎn)換語(yǔ)言模型的高效訓(xùn)練。Megatron 530B是世界上最大的可定制語(yǔ)言模型。

NeMo Megatron框架使企業(yè)能夠克服訓(xùn)練復(fù)雜自然語(yǔ)言處理模型的挑戰(zhàn)。經(jīng)過(guò)優(yōu)化,可以在NVIDIA DGX SuperPOD的大規(guī)模加速計(jì)算基礎(chǔ)設(shè)施上進(jìn)行擴(kuò)展。

NeMo Megatron通過(guò)數(shù)據(jù)處理庫(kù)自動(dòng)處理LLM訓(xùn)練的復(fù)雜性,這些數(shù)據(jù)處理庫(kù)可以攝入、策劃、組織和清理數(shù)據(jù)。利用先進(jìn)的數(shù)據(jù)、張量和管道并行化技術(shù),它能使大型語(yǔ)言模型的訓(xùn)練有效地分布在成千上萬(wàn)的GPU上。企業(yè)可以通過(guò)NeMo Megatron框架進(jìn)一步訓(xùn)練它以服務(wù)新的領(lǐng)域和語(yǔ)言。

NVIDIA Triton推理服務(wù)器

助力實(shí)時(shí)大型語(yǔ)言模型推理

此外,今日發(fā)布的最新NVIDIA Triton推理服務(wù)器中的多GPU、多節(jié)點(diǎn)特性,使大型語(yǔ)言模型推理工作負(fù)載能夠?qū)崟r(shí)在多個(gè)GPU和節(jié)點(diǎn)上擴(kuò)展。這些模型需要的內(nèi)存比單個(gè)GPU甚至是包含多個(gè)GPU的大型服務(wù)器所能提供的還要多,并且,實(shí)際應(yīng)用對(duì)其推理實(shí)時(shí)性有著極高的要求。

通過(guò)Triton推理服務(wù)器,Megatron530B能夠在兩個(gè)NVIDIA DGX系統(tǒng)上運(yùn)行,將處理時(shí)間從CPU服務(wù)器上的1分鐘以上縮短到半秒,令實(shí)時(shí)應(yīng)用部署大型語(yǔ)言模型成為可能。

全球范圍開發(fā)的大規(guī)模定制語(yǔ)言模型

使用NVIDIA DGX SuperPOD構(gòu)建大型復(fù)雜語(yǔ)言模型的早期客戶包括SiDi、京東探索研究院和VinBrai。 SiDi是巴西的一家大型AI 研究和開發(fā)機(jī)構(gòu),已經(jīng)采用三星虛擬助手,供全國(guó) 2 億巴西葡萄牙語(yǔ)者使用。 SiDi 首席執(zhí)行官John Yi 表示:“SiDi 團(tuán)隊(duì)在AI 虛擬助理和聊天機(jī)器人開發(fā)方面擁有豐富的經(jīng)驗(yàn),此類開發(fā)既需要強(qiáng)大的 AI 性能,也需要經(jīng)過(guò)訓(xùn)練并適應(yīng)人類語(yǔ)言不斷變化的細(xì)微差別的專用軟件。NVIDIA DGX SuperPOD 非常適合推動(dòng)我們團(tuán)隊(duì)的先進(jìn)工作,幫助我們?yōu)榘臀鞯钠咸蜒勒Z(yǔ)者提供領(lǐng)先的AI 服務(wù)?!?京東探索研究院,是以供應(yīng)鏈為基礎(chǔ)的領(lǐng)先技術(shù)和服務(wù)提供商京東的研發(fā)部門,他們利用 NVIDIA DGX SuperPOD 開發(fā)NLP,應(yīng)用于智能客戶服務(wù)、智能零售、智能物流、物聯(lián)網(wǎng)、醫(yī)療健康等領(lǐng)域。 VinBrain,越南的醫(yī)療健康 AI 公司,他們使用 DGX SuperPOD 為100 家醫(yī)院的放射科醫(yī)生和遠(yuǎn)程醫(yī)療醫(yī)生開發(fā)和部署了一種臨床語(yǔ)言模型。在這些醫(yī)院,已有 600 多名醫(yī)療健康從業(yè)者使用該模型。

供應(yīng)情況

企業(yè)可以利用今天同期發(fā)布的NVIDIA LaunchPad,免費(fèi)體驗(yàn)開發(fā)和部署大型語(yǔ)言模型。行業(yè)組織可以申請(qǐng)加入搶先體驗(yàn)計(jì)劃,了解用于訓(xùn)練大規(guī)模語(yǔ)言模型的 NVIDIA NeMo Megatron 加速框架。

NVIDIA Triton可從NVIDIA NGC目錄中獲得,該目錄是GPU優(yōu)化的AI軟件中心,包括框架、工具包、預(yù)訓(xùn)練模型和Jupyter Notebooks,并可從Triton GitHub repository中獲取開放源代碼。

Triton也包含在NVIDIA AI Enterprise軟件套件中,該套件由NVIDIA優(yōu)化、認(rèn)證和支持。企業(yè)可以使用該軟件套件,在內(nèi)部數(shù)據(jù)中心和私有云的主流加速服務(wù)器上運(yùn)行語(yǔ)言模型推理。

NVIDIA DGX SuperPOD 和NVIDIA DGX 系統(tǒng)通過(guò)NVIDIA 的全球經(jīng)銷商提供,這些合作伙伴能夠根據(jù)要求為符合條件的客戶提供詢價(jià)服務(wù)。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5682

    瀏覽量

    110110
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41026

    瀏覽量

    302549
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3813

    瀏覽量

    52261

原文標(biāo)題:GTC21 | NVIDIA 借助超大規(guī)模 AI 語(yǔ)言模型為全球企業(yè)賦能

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    解讀大型語(yǔ)言模型的偏見

    項(xiàng)新的研究中,研究人員發(fā)現(xiàn)了LLM中某種偏見的根本原因,更準(zhǔn)確、更可靠的AI系統(tǒng)鋪平了道路。研究表明,大型語(yǔ)言模型(LLM)往往傾向于
    的頭像 發(fā)表于 04-15 14:44 ?659次閱讀
    解讀<b class='flag-5'>大型</b><b class='flag-5'>語(yǔ)言</b><b class='flag-5'>模型</b>的偏見

    NVIDIA 攜手全球機(jī)器人領(lǐng)導(dǎo)者,將物理 AI 帶入現(xiàn)實(shí)世界

    基于 NVIDIA 技術(shù),大規(guī)模開發(fā)部署物理 AI。 NVIDIA 發(fā)布全新 NVIDIA Cosmos 世界
    的頭像 發(fā)表于 03-17 11:22 ?586次閱讀
    <b class='flag-5'>NVIDIA</b> 攜手<b class='flag-5'>全球</b>機(jī)器人領(lǐng)導(dǎo)者,將物理 AI 帶入現(xiàn)實(shí)世界

    在AI基礎(chǔ)設(shè)施中部署語(yǔ)言模型的三大舉措

    文:Gartner研究副總裁周玲中國(guó)企業(yè)機(jī)構(gòu)已逐步在生產(chǎn)環(huán)境中運(yùn)行或者計(jì)劃運(yùn)行大語(yǔ)言模型,但在AI基礎(chǔ)設(shè)施的生產(chǎn)部署與高效運(yùn)營(yíng)方面仍面臨諸多挑戰(zhàn)。目前,中國(guó)正加速提升其生成式AI能力,
    的頭像 發(fā)表于 02-09 16:28 ?543次閱讀
    在AI基礎(chǔ)設(shè)施中<b class='flag-5'>部署</b>大<b class='flag-5'>語(yǔ)言</b><b class='flag-5'>模型</b>的三大舉措

    能源管理:御控?cái)?shù)采網(wǎng)關(guān)讓每度電“看得見、管得精、省得下”

    御控能源數(shù)采網(wǎng)關(guān)與可視化能源管理系統(tǒng)的完美融合,正為企業(yè)開啟一扇通往智慧能源管理的新大門。
    的頭像 發(fā)表于 01-07 13:28 ?187次閱讀

    NVIDIA 推出 Alpamayo 系列開源 AI 模型與工具,加速安全可靠的推理型輔助駕駛汽車開發(fā)

    新聞?wù)?: l NVIDIA 率先發(fā)布應(yīng)對(duì)輔助駕駛長(zhǎng)尾場(chǎng)景挑戰(zhàn)而設(shè)計(jì)的開源視覺(jué)-語(yǔ)言-動(dòng)作推理模型(Reasoning VLA);NVIDIA
    的頭像 發(fā)表于 01-06 09:40 ?510次閱讀
    <b class='flag-5'>NVIDIA</b> 推出 Alpamayo 系列開源 AI <b class='flag-5'>模型</b>與工具,加速安全可靠的推理型輔助駕駛汽車<b class='flag-5'>開發(fā)</b>

    如何在NVIDIA Jetson AGX Thor上部署1200億參數(shù)大模型

    期介紹了如何在 NVIDIA Jetson AGX Thor 上使用 Docker 部署 vLLM 推理服務(wù),以及使用 Chatbox 作為前端調(diào)用 vLLM 運(yùn)行的模型(上期文章
    的頭像 發(fā)表于 12-26 17:06 ?5246次閱讀
    如何在<b class='flag-5'>NVIDIA</b> Jetson AGX Thor上<b class='flag-5'>部署</b>1200億參數(shù)大<b class='flag-5'>模型</b>

    利用NVIDIA Cosmos開放世界基礎(chǔ)模型加速物理AI開發(fā)

    NVIDIA 最近發(fā)布了 NVIDIA Cosmos 開放世界基礎(chǔ)模型(WFM)的更新,旨在加速物理 AI 模型的測(cè)試與驗(yàn)證數(shù)據(jù)生成。借助 NVID
    的頭像 發(fā)表于 12-01 09:25 ?1412次閱讀

    NVIDIA ACE現(xiàn)已支持開源Qwen3-8B小語(yǔ)言模型

    助力打造實(shí)時(shí)、動(dòng)態(tài)的 NPC 游戲角色,NVIDIA ACE 現(xiàn)已支持開源 Qwen3-8B 小語(yǔ)言模型(SLM),可實(shí)現(xiàn) PC 游戲中的本地部署
    的頭像 發(fā)表于 10-29 16:59 ?1401次閱讀

    DeepSeek模型如何在云服務(wù)器上部署?

    隨著大型語(yǔ)言模型(LLM)的應(yīng)用日益普及,許多開發(fā)者和企業(yè)希望將像DeepSeek這樣的優(yōu)秀模型
    的頭像 發(fā)表于 10-13 16:52 ?1131次閱讀

    Votee AI借助NVIDIA技術(shù)加速方言小語(yǔ)種LLM開發(fā)

    了精準(zhǔn)的方言及小語(yǔ)種大語(yǔ)言模型 (LLM)。此舉成功解決了數(shù)據(jù)稀缺、語(yǔ)言復(fù)雜及計(jì)算效率等挑戰(zhàn),全球數(shù)以百萬(wàn)計(jì)、缺乏數(shù)字化資源的
    的頭像 發(fā)表于 08-20 14:21 ?1014次閱讀

    Cognizant加速AI模型企業(yè)級(jí)開發(fā)

    -Cognizant推出AI Training Data Services,助力企業(yè)級(jí)AI模型加速開發(fā) Cognizant是數(shù)據(jù)與AI模型訓(xùn)練合作伙伴,長(zhǎng)期深受
    的頭像 發(fā)表于 07-31 17:25 ?810次閱讀

    如何本地部署NVIDIA Cosmos Reason-1-7B模型

    近日,NVIDIA 開源其物理 AI 平臺(tái) NVIDIA Cosmos 中的關(guān)鍵模型——NVIDIA Cosmos Reason-1-7B。這款先進(jìn)的多模態(tài)大
    的頭像 發(fā)表于 07-09 10:17 ?1006次閱讀

    歐洲借助NVIDIA Nemotron優(yōu)化主權(quán)大語(yǔ)言模型

    NVIDIA 正攜手歐洲和中東的模型構(gòu)建商與云提供商,共同優(yōu)化主權(quán)大語(yǔ)言模型 (LLM),加速該地區(qū)各行業(yè)采用企業(yè)級(jí) AI。
    的頭像 發(fā)表于 06-12 15:42 ?1376次閱讀

    企業(yè)部署AI大模型怎么做

    當(dāng)下,AI大模型已成為驅(qū)動(dòng)決策自動(dòng)化、服務(wù)智能化與產(chǎn)品創(chuàng)新的核心引擎。然而,企業(yè)面對(duì)動(dòng)輒數(shù)百億參數(shù)的大模型部署時(shí),常陷入算力不足、響應(yīng)延遲高、成本失控等困境。如何突破瓶頸,實(shí)現(xiàn)高效、穩(wěn)
    的頭像 發(fā)表于 06-04 09:26 ?1012次閱讀

    CCLINKIE轉(zhuǎn)PROFINET:電機(jī)的“網(wǎng)絡(luò)沖浪神器”!

    工作,還能和其他設(shè)備共用電源,簡(jiǎn)直不要太省心! 總結(jié)下,耐達(dá)訊CCLINKIE轉(zhuǎn)PROFINET連接電機(jī),就像給電機(jī)打開一扇通往新世界的大門,讓它在工業(yè)網(wǎng)絡(luò)的海洋里盡情“沖浪”。
    發(fā)表于 05-28 15:21