當涉及到高質量的合成語音開發(fā)和定制時,深度學習被證明是一個強大的工具。一家總部位于多倫多的初創(chuàng)公司, NVIDIA Inception 成員類似人工智能正在利用一種新的生成語音工具增加賭注,該工具能夠創(chuàng)建高質量的合成人工智能語音。
這項技術可以在 50 多種最流行的語言中生成跨語言和自然說話的聲音,通過相似填充,用戶可以創(chuàng)建編程音頻,編輯和替換音頻片段中的單詞。
構建、部署和擴展現(xiàn)實人工智能語音的能力將幫助眾多行業(yè)。應用范圍廣泛,從為廣告創(chuàng)建人工智能生成的文本,到交互式語音應答系統(tǒng),再到視頻游戲開發(fā)。
自 2020 年 7 月以來,相似人工智能團隊與 NVIDIA 的對話人工智能團隊密切合作,將 NVIDIA riva多模態(tài)對話人工智能 SDK 集成到他們的語音管道中。據(jù)人工智能創(chuàng)始人兼首席執(zhí)行官佐哈伊布·艾哈邁德( Zohaib Ahmed )稱,這種經(jīng)歷讓他們在整個人工智能對話管道中融入了獨特的 i NSight 。
“ NVIDIA Inception 計劃有助于為對話人工智能領域提供關鍵 i NSight 以及為我們作為產(chǎn)品的每項工作推薦 GPU 計算提供技術支持,” Ahmed 說。
為了訓練他們的語音模型和推理能力,該團隊正在使用 Amazon 彈性 Kubernetes 服務( Amazon EKS )和 NVIDIA T4 GPU s 集群。然后,他們使用 NVIDIA Triton 推理服務器在生產(chǎn)中大規(guī)模部署他們訓練有素的人工智能模型。
最近一個與 NVIDIA Omniverse Audio2Face集成的類似人工智能合成語音演示展示了組合技術如何從單一音頻源創(chuàng)建富有表情的面部動畫和聲音。
Ahmed 說:“ Audio2Face 是一個很好的例子,它是一個強大的工具,可以很容易地與生成性人工智能語音相結合,在幾秒鐘內(nèi)產(chǎn)生結果,否則需要幾天時間。”。
公司 已經(jīng)發(fā)展到擁有超過 150000 個用戶,建立了超過 60000 個語音。迄今為止, 類似人工智能在電信、金融、通訊中心、教育、游戲、媒體和娛樂等行業(yè)擁有 240 多個付費客戶。
關于作者
Michelle Horton 是 NVIDIA 的高級開發(fā)人員通信經(jīng)理,擁有通信經(jīng)理和科學作家的背景。她在 NVIDIA 為開發(fā)者博客撰文,重點介紹了開發(fā)者使用 NVIDIA 技術的多種方式。
審核編輯:郭婷
-
NVIDIA
+關注
關注
14文章
5431瀏覽量
108288 -
人工智能
+關注
關注
1811文章
49504瀏覽量
258288
發(fā)布評論請先 登錄
標貝科技參編《人工智能高質量數(shù)據(jù)集建設指南》
TTS文字合成語音芯片的使用場景
大模型時代,如何推進高質量數(shù)據(jù)集建設?
挖到寶了!人工智能綜合實驗箱,高校新工科的寶藏神器
挖到寶了!比鄰星人工智能綜合實驗箱,高校新工科的寶藏神器!
最新人工智能硬件培訓AI 基礎入門學習課程參考2025版(大模型篇)
明遠智睿SSD2351開發(fā)板:語音機器人領域的變革力量
人工合成石墨片與天然石墨片的差別
淺析:數(shù)字經(jīng)濟時代,高質量數(shù)據(jù)集對AI產(chǎn)業(yè)帶來哪些新的變化
大模型時代的新燃料:大規(guī)模擬真多風格語音合成數(shù)據(jù)集
傳統(tǒng)工廠如何利用人工智能技術實現(xiàn)運籌優(yōu)化與效率提升
智慧路燈如何應用人工智能技術

喜報丨阿丘科技榮登蘇州市人工智能大模型與高質量數(shù)據(jù)集雙項榜單

評論