谷歌推出了一項(xiàng)新技術(shù),當(dāng)服務(wù)無法維持穩(wěn)定的WaveNetEQ連接時(shí),可以提高Duo通話的音頻質(zhì)量。它是基于谷歌的DeepMind部門的技術(shù),該部門的目標(biāo)是用人工噪音代替音頻抖動(dòng),這種噪音聽起來就像人類說話一樣,是通過機(jī)器學(xué)習(xí)產(chǎn)生的。
如果你曾經(jīng)在網(wǎng)上打過電話,那么你很有可能經(jīng)歷過音頻抖動(dòng)。當(dāng)作為調(diào)用的一部分發(fā)送的音頻數(shù)據(jù)包在傳輸過程中丟失,或出現(xiàn)延遲或順序錯(cuò)誤時(shí),就會(huì)發(fā)生這種情況。谷歌說99%的Duo呼叫都經(jīng)歷過數(shù)據(jù)包丟失:20%的丟失超過3%的音頻,10%的丟失超過8%。有很多音頻需要替換。
每個(gè)呼叫應(yīng)用程序都必須以某種方式處理這種丟包,但谷歌表示,這些丟包隱藏(PLC)過程可能很難填補(bǔ)60毫秒或更長的空白,聽起來既不像機(jī)器人,也不重復(fù)。WaveNetEQ的解決方案是基于DeepMind的神經(jīng)網(wǎng)絡(luò)技術(shù),它已經(jīng)對(duì)來自48種不同語言的100多個(gè)使用者的數(shù)據(jù)進(jìn)行了訓(xùn)練。
將WaveNetEQ與NetEQ(一種常用的PLC技術(shù))進(jìn)行了比較。嘗試替換60ms丟包時(shí)的聲音。不過,這個(gè)系統(tǒng)可以替換的音頻是有限制的。谷歌的技術(shù)旨在取代短音,而不是完整的單詞。因此,120毫秒后,它會(huì)逐漸消失,并產(chǎn)生靜音。谷歌說,它對(duì)系統(tǒng)進(jìn)行了評(píng)估,以確保沒有引入任何重要的新聲音。另外,所有的處理都需要在設(shè)備上進(jìn)行,因?yàn)楣雀鐳uo調(diào)用默認(rèn)是端到端加密的。一旦通話的真實(shí)音頻恢復(fù),WaveNetEQ將無縫地回到現(xiàn)實(shí)中。
這是一個(gè)巧妙的小技術(shù),當(dāng)互聯(lián)網(wǎng)讓他們失望時(shí),打電話應(yīng)該更容易理解。由于Pixel 4手機(jī)在12月的功能下降,該技術(shù)已經(jīng)可以用于在Pixel 4手機(jī)上撥打Duo電話。谷歌表示,它正在將這項(xiàng)技術(shù)推廣到其他未命名的手機(jī)上。
-
谷歌
+關(guān)注
關(guān)注
27文章
6246瀏覽量
110312 -
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4829瀏覽量
106853
發(fā)布評(píng)論請(qǐng)先 登錄
今日看點(diǎn):谷歌芯片實(shí)現(xiàn)量子計(jì)算比經(jīng)典超算快13000倍;NFC 技術(shù)突破:讀取距離從 5 毫米提升至 20 毫米
易飛揚(yáng)獲得一項(xiàng)有源電纜系統(tǒng)的關(guān)鍵發(fā)明專利
知行科技機(jī)器人業(yè)務(wù)新獲一項(xiàng)合作
即時(shí)通話軟件音頻傳輸質(zhì)量測(cè)試方案介紹
解鎖高品質(zhì)音頻體驗(yàn):探索音頻質(zhì)量評(píng)估與測(cè)試的科學(xué)之道
XR空間音頻革命:蘋果、三星推出新技術(shù),ASAF成Vision Pro最佳搭檔
【Milk-V Duo S 開發(fā)板免費(fèi)體驗(yàn)】鏡像燒錄與開箱上電
【Milk-V Duo S 開發(fā)板免費(fèi)體驗(yàn)】Milk-V Duo S 開發(fā)板試用報(bào)告(1)開箱
LE-Audio是什么?
東芝推出兩項(xiàng)創(chuàng)新技術(shù)提升碳化硅功率器件性能

谷歌推出了一項(xiàng)新技術(shù),可以提高Duo通話的音頻質(zhì)量
評(píng)論