搶先體驗(yàn) AI 微服務(wù)在云端提供的優(yōu)質(zhì)通信。
新版NVIDIA Maxine為實(shí)時(shí)音頻和視頻通信鋪平了道路。無論是參加視頻會議、致電客戶服務(wù)中心,還是進(jìn)行直播,Maxine 都能夠助您實(shí)現(xiàn)清晰明確的溝通,增強(qiáng)虛擬交互的效果。
NVIDIA Maxine 是一套由 GPU 加速的 AI 軟件開發(fā)套件 (SDK) 和云原生微服務(wù),用于部署經(jīng)過優(yōu)化和加速的 AI 功能,可達(dá)到實(shí)時(shí)增強(qiáng)音頻、視頻和增強(qiáng)現(xiàn)實(shí) (AR) 效果的目的。
借助 Maxine 的先進(jìn)模型,最終用戶無需使用昂貴的設(shè)備即可改進(jìn)音頻和視頻質(zhì)量?;?NVIDIA AI 的技術(shù)使標(biāo)準(zhǔn)的麥克風(fēng)和攝像頭設(shè)備也能夠達(dá)到這些高質(zhì)量的效果。
在 GTC 上,NVIDIA 宣布為云原生微服務(wù)重新構(gòu)建 Maxine,并推出了 Maxine 音頻效果微服務(wù)的搶先體驗(yàn)版。此外,還推出了新的 Maxine SDK 功能,包括發(fā)言者聚焦和人臉表情估計(jì),并正式推出了眼神交流功能。NVIDIA Maxine 現(xiàn)在還包含現(xiàn)有 SDK 功能的增強(qiáng)版。
Maxine 實(shí)現(xiàn)云原生
Maxine 的云原生微服務(wù)允許開發(fā)者構(gòu)建實(shí)時(shí) AI 應(yīng)用。微服務(wù)可以獨(dú)立管理,并在云端進(jìn)行無縫部署,從而縮短開發(fā)周期。
搶先體驗(yàn)版的 Audio Effects 微服務(wù)中包含四種先進(jìn)的音頻功能:
背景噪音消除:使用 AI 模型消除多種常見的背景噪音,同時(shí)保留說話者的自然聲音。
房間回聲消除:使用 AI 模型消除音頻中的混響,恢復(fù)說話者聲音的清晰度。
音頻超高分辨率:提高音頻信號的時(shí)間分辨率,改善音頻質(zhì)量。該功能目前支持 8 kHz 到 16 kHz 以及 16 kHz 到 48 kHz 的上采樣。
聲學(xué)回聲消除:消除輸入音頻流中的實(shí)時(shí)聲學(xué)設(shè)備回聲,從而去除不匹配的聲對和雙聲。借助基于 AI 的技術(shù),Maxine 實(shí)現(xiàn)了比傳統(tǒng)數(shù)字信號處理算法更有效的回聲消除。
Pexip 是一家領(lǐng)先的企業(yè)視頻會議和協(xié)作解決方案提供商,正在利用 NVIDIA 的 AI 技術(shù)將虛擬會議提升到更高水平,為現(xiàn)代員工隊(duì)伍提供先進(jìn)的功能。
Pexip 戰(zhàn)略聯(lián)盟高級副總裁 Eddie Clifton 表示:“隨著 Maxine 向云原生微服務(wù)的轉(zhuǎn)化,我們能夠更加輕松地將 NVIDIA 的先進(jìn) AI 技術(shù)與我們獨(dú)特的服務(wù)器端架構(gòu)結(jié)合起來。這使我們的 Pexip 團(tuán)隊(duì)能夠?yàn)樘摂M會議提供更強(qiáng)的體驗(yàn)?!?/p>
探索 SDK 的增強(qiáng)功能
Maxine 提供了三款由 GPU 加速的 SDK,能夠通過 AI 重塑實(shí)時(shí)通信的音頻、視頻和 AR 效果。
音頻效果 SDK 可提供多效果、低延遲,以及基于 AI 的音頻質(zhì)量增強(qiáng)算法。發(fā)言者聚焦是搶先體驗(yàn)版中的新功能,該功能能夠分離前景和背景發(fā)言者的音軌,使聽眾能夠更加輕松地識別每種聲音。此外,還更新了音頻超高分辨率SDK 功能,使其具備更高的質(zhì)量。
視頻效果 SDK 會使用標(biāo)準(zhǔn)網(wǎng)絡(luò)攝像頭輸入創(chuàng)建基于 AI 的視頻效果。虛擬背景功能已獲得更新,增強(qiáng)了時(shí)間穩(wěn)定性,該功能能夠分割個(gè)人形象并應(yīng)用由 AI 驅(qū)動(dòng)的背景去除、替換或模糊功能。
AR SDK 基于標(biāo)準(zhǔn)網(wǎng)絡(luò)攝像頭饋送,提供基于 AI 的實(shí)時(shí) 3D 面部追蹤和身體姿態(tài)估計(jì)。新功能包括:
眼神交流:通過預(yù)估和將視線與攝像頭對齊來模擬眼神交流。
人臉表情估計(jì):追蹤人臉并推斷主體所呈現(xiàn)的表情。
更新了以下 AR 功能:
身體姿態(tài)估計(jì):以 2D 和 3D 形式預(yù)測和追蹤人體的 34 個(gè)關(guān)鍵點(diǎn),并且現(xiàn)已支持多人追蹤。
面部特征點(diǎn)追蹤:使用 126 個(gè)關(guān)鍵點(diǎn)來識別面部特征和輪廓?,F(xiàn)已可使用“畫質(zhì)”模式來追蹤由于頭部運(yùn)動(dòng)和表情造成的頭部姿勢和面部變形(實(shí)時(shí)追蹤的自由度為 3 度),實(shí)現(xiàn)了更高質(zhì)量的跟蹤效果。
人臉網(wǎng)格:以高達(dá) 3000 個(gè)頂點(diǎn)和 6 個(gè)自由度的 3D 網(wǎng)格表示人臉,并且現(xiàn)在包括USC 創(chuàng)意技術(shù)研究所的 3D 可變形模型。
直接體驗(yàn) Maxine 的驚艷效果。
體驗(yàn)由 AI 的強(qiáng)大功能帶來的先進(jìn)效果
Maxine SDK 和微服務(wù)可為您提供一套低延遲的 AI 效果,且可與現(xiàn)有的客戶基礎(chǔ)設(shè)施進(jìn)行集成。由于 Maxine 的尖端 AI 功能的構(gòu)建以 NVIDIA AI 平臺為基礎(chǔ),并且擁有領(lǐng)先的預(yù)訓(xùn)練模型,所以開發(fā)者用戶可利用其來創(chuàng)建、定制和部署優(yōu)質(zhì)的音頻和視頻質(zhì)量功能。
Maxine 也是NVIDIA Omniverse Avatar Cloud Engine的一部分,NVIDIA Omniverse Avatar Cloud Engine 是一系列基于云的 AI 模型和服務(wù),可供開發(fā)者構(gòu)建、定制和部署交互式虛擬形象。Maxine 的可定制云原生微服務(wù)允許您在 AI 效果制作流程中進(jìn)行獨(dú)立部署。而且,您可以在本地、云端或邊緣部署 Maxine。
審核編輯:湯梓紅
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5570瀏覽量
109390 -
AI
+關(guān)注
關(guān)注
91文章
39126瀏覽量
299775 -
云原生
+關(guān)注
關(guān)注
0文章
265瀏覽量
8520
原文標(biāo)題:GTC22 | 全新 NVIDIA Maxine 云原生架構(gòu)可大規(guī)模實(shí)現(xiàn)突破性影音質(zhì)量
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
充電樁與電氣連接技術(shù)助力電動(dòng)汽車產(chǎn)業(yè)蓬勃發(fā)展
Vision Pro只是開始?蘋果新專利為輕量級XR眼鏡鋪平道路
NVIDIA技術(shù)推動(dòng)化學(xué)和材料科學(xué)發(fā)展
NVIDIA IGX Thor 機(jī)器人處理器將實(shí)時(shí)物理 AI 引入工業(yè)和醫(yī)療邊緣場景
【飛凌OK-MX9596-C開發(fā)板試用】②體驗(yàn)WIFI、藍(lán)牙、音頻、視頻,為AI應(yīng)用打下基礎(chǔ)
音頻技術(shù)新革命:WT2605-24SS錄音芯片實(shí)現(xiàn)實(shí)時(shí)輸出與隱私保護(hù)完美融合
NVIDIA助力樞途科技突破視頻提取具身數(shù)據(jù)技術(shù)鴻溝
恩智浦區(qū)域控制開發(fā)驗(yàn)證平臺的功能
工業(yè)5G通信網(wǎng)關(guān)賦能智慧園區(qū)道路測速應(yīng)用
ST 意法半導(dǎo)體與高通合作開發(fā)的Wi-Fi/藍(lán)牙模塊交鑰匙方案正式量產(chǎn)及重要客戶應(yīng)用案例成功落地
樂鑫ESP-RTC實(shí)時(shí)音視頻通信方案
智慧路燈于實(shí)時(shí)交通信息供給之作用
羅德與施瓦茨和高通合作加速下一代無線通信發(fā)展
哈佛新技術(shù)為先進(jìn)機(jī)器視覺鋪平道路
新版NVIDIA Maxine為實(shí)時(shí)音頻和視頻通信鋪平道路
評論