NVIDIA 發(fā)布了 NVIDIA Riva 在語音人工智能方面的新突破, NVIDIA NeMo 在大規(guī)模語言建模( LLM )方面的新突破。 Riva 是一款 GPU 加速語音人工智能 SDK ,用于企業(yè)為其品牌和虛擬助手生成富有表現(xiàn)力的類人語音。 NeMo 是語音和 NLU 的加速培訓(xùn)框架,它現(xiàn)在有能力開發(fā)具有數(shù)萬億參數(shù)的大規(guī)模語言模型。
語音和語言人工智能的這些進(jìn)步使企業(yè)和研究機(jī)構(gòu)能夠輕松構(gòu)建針對(duì)其行業(yè)和領(lǐng)域定制的最先進(jìn)的對(duì)話人工智能功能。
英偉達(dá) Riva
NVIDIA 發(fā)布了一個(gè)具有定制語音功能的新版本,企業(yè)只需 30 分鐘的語音數(shù)據(jù)即可輕松創(chuàng)建獨(dú)特的語音來代表其品牌。
此外, NVIDIA 宣布了Riva Enterprise,這是一項(xiàng)付費(fèi)計(jì)劃,包括為需要大規(guī)模 Riva 部署的企業(yè)提供 NVIDIA 專家支持。 Riva 仍然免費(fèi)提供給工作量較小的客戶和合作伙伴。
亮點(diǎn)包括:
在 A100 上用一天 30 分鐘的音頻數(shù)據(jù)創(chuàng)建一個(gè)新的神經(jīng)語音。
細(xì)粒度控件以生成富有表現(xiàn)力的聲音。
A100 上的 Fastpitch + HiFiGAN 比 V100 上的 Tacotron2 + WaveGlow 性能高 12 倍。
支持五種其他語言的世界級(jí)語音識(shí)別。
擴(kuò)展到成百上千的實(shí)時(shí)流。
在任何云端、本地和邊緣運(yùn)行。
注冊(cè)以接收有關(guān) Riva Enterprise 的最新消息和更新,以進(jìn)行大規(guī)模部署 》》
使用 Riva 開發(fā)應(yīng)用程序
閱讀此introductory post to了解 Riva 工作流中的組件。
接下來,按照本教程構(gòu)建您自己的端到端語音識(shí)別服務(wù):
Parthart: 1-EC6
Parthart: H2-Em7
Parthut: 3-ECEN-18
有關(guān)構(gòu)建virtual assistants和transcription with entity recognition等語音應(yīng)用程序的更多教程,請(qǐng)?jiān)L問Riva Getting Started. 》》
NVIDIA NeMo Megatron 、 Triton 多 – GPU 多節(jié)點(diǎn)推理和 Megatron 530B
NVIDIA 還推出了為企業(yè)構(gòu)建、定制和部署大型語言模型的功能。 NeMo Megatron 是 NeMo 框架中的一項(xiàng)新功能,用于培訓(xùn)多達(dá)數(shù)萬億個(gè)參數(shù)的大型語言模型( LLM )。
它包括Megatron方面的進(jìn)步,這是一個(gè)由 NVIDIA 研究人員領(lǐng)導(dǎo)的開源項(xiàng)目,旨在開發(fā)有效培訓(xùn)法學(xué)碩士的技術(shù)。企業(yè)可以使用 NeMo Megatron 定制 LLM ,如 Megatron 530B ,并使用 NVIDIA Triton 推理服務(wù)器跨多個(gè) GPU 和節(jié)點(diǎn)進(jìn)行部署。
亮點(diǎn)包括:
在包含數(shù)十億頁文本的龐大數(shù)據(jù)集上自動(dòng)化數(shù)據(jù)整理。
為新的域和語言培訓(xùn)Megatron 530B等模型。
從單節(jié)點(diǎn)擴(kuò)展到超級(jí)計(jì)算機(jī),包括數(shù)十個(gè)DGX A100系統(tǒng)。
導(dǎo)出到多個(gè)節(jié)點(diǎn)和 GPU s ,用于使用 NVIDIA Triton 推理服務(wù)器進(jìn)行實(shí)時(shí)推理。
關(guān)于作者
Siddharth Sharma 是NVIDIA 加速計(jì)算的高級(jí)技術(shù)營銷經(jīng)理。在加入NVIDIA 之前, Siddharth 是 Mathworks Simulink 和 Stateflow 的產(chǎn)品營銷經(jīng)理,與汽車和航空航天公司密切合作,采用基于模型的設(shè)計(jì)來創(chuàng)建控制軟件。
審核編輯:郭婷
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5495瀏覽量
109019 -
服務(wù)器
+關(guān)注
關(guān)注
13文章
10080瀏覽量
90834 -
人工智能
+關(guān)注
關(guān)注
1813文章
49711瀏覽量
261251 -
LLM
+關(guān)注
關(guān)注
1文章
340瀏覽量
1256
發(fā)布評(píng)論請(qǐng)先 登錄
NVIDIA宣布開源Aerial軟件
NVIDIA TensorRT LLM 1.0推理框架正式上線
MediaTek攜手NVIDIA開啟個(gè)人AI算力新紀(jì)元
Votee AI借助NVIDIA技術(shù)加速方言小語種LLM開發(fā)
如何在魔搭社區(qū)使用TensorRT-LLM加速優(yōu)化Qwen3系列模型推理部署
使用NVIDIA Triton和TensorRT-LLM部署TTS應(yīng)用的最佳實(shí)踐
LM Studio使用NVIDIA技術(shù)加速LLM性能
Cognizant將與NVIDIA合作部署神經(jīng)人工智能平臺(tái),加速企業(yè)人工智能應(yīng)用
Oracle 與 NVIDIA 合作助力企業(yè)加速代理式 AI 推理
無法在OVMS上運(yùn)行來自Meta的大型語言模型 (LLM),為什么?
NVIDIA發(fā)布全新NIM AI Guardrail微服務(wù)
NVIDIA 發(fā)布保障代理式 AI 應(yīng)用安全的 NIM 微服務(wù)
NVIDIA推出面向RTX AI PC的AI基礎(chǔ)模型
在NVIDIA TensorRT-LLM中啟用ReDrafter的一些變化

NVIDIA發(fā)布Riva語音AI和大型LLM軟件
評(píng)論