chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌擬用WaveNetEQ技術提高Duo的通話質量 可自動判斷且替換丟失的音頻數(shù)據(jù)

工程師鄧生 ? 來源:雷鋒網(wǎng) ? 作者:雷鋒網(wǎng) ? 2020-04-08 16:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著 4G5G通信技術發(fā)展,網(wǎng)絡通話越來越盛行。但是網(wǎng)絡不穩(wěn)定是常態(tài),所以通話中我們時不時可能會蹦出一句,“你能再重復一遍嗎,剛剛網(wǎng)絡不太好?!睘榱颂?a href="http://www.brongaenegriffin.com/tags/高通/" target="_blank">高通話質量,谷歌近期在視頻聊天應用 Duo 中應用了一種新技術 WaveNetEQ ,在出現(xiàn)音頻丟包情況時,該技術會判斷丟失的音頻數(shù)據(jù)可能是什么,并替換掉它。

背后的技術支持來自谷歌聲名在外的 DeepMind 團隊。

一個完整的在線呼叫,數(shù)據(jù)經(jīng)常會被分成多個小塊,每小塊就是一個數(shù)據(jù)包 packet 。然而,在這些“數(shù)據(jù)包”從發(fā)送方傳輸?shù)浇邮辗降倪^程中,數(shù)據(jù)包通常會以錯誤的順序到達,從而產(chǎn)生抖動相關問題,或者直接丟失,造成音頻空白。

谷歌給出一份資料顯示, Duo 99% 的通話都有數(shù)據(jù)包丟失、過度抖動或網(wǎng)絡延遲情況。20% 的通話丟失了超過 3% 的音頻,10% 的通話丟包率超過 8% ,也就是說每次通話都有很多音頻需要替換。

每個視音頻 app 都會用某種方式處理丟包。谷歌表示,這些數(shù)據(jù)包丟失隱藏 (PLC) 過程可能很難更好地填補 60 毫秒或更長時間的空白。過去常用算法是 NetEQ ,這是 webRTC 中音頻技術方面的兩大核心技術之一(另一核心技術是音頻的前后處理,包括AEC、ANS、AGC等)。webRTC 是谷歌收購 GIPS 再開源的,是目前影響力極大的實時音視頻通信解決方案,但用它處理丟包,大多情況下聽起來像機器人機械重復。

谷歌就用了大量的語音數(shù)據(jù),訓練出了基于 DeepMind WaveRNN 技術的 WaveNetEQ 模型。訓練數(shù)據(jù)集來自 100 多名、48 種不同語言的志愿者,也就是說它可以自動填補 48 種語言的丟包情況。

WaveNetEQ 是一種用于語音合成的遞歸神經(jīng)網(wǎng)絡模型,由兩部分組成,即自回歸網(wǎng)絡(autoregressive network)和條件網(wǎng)絡(conditioning network)。自回歸網(wǎng)絡的作用是保持信號的平穩(wěn)流動,而條件網(wǎng)絡控制和影響自回歸網(wǎng)絡以保持音頻一致性。

谷歌用 WaveNetEQ 取代了原來的 NetEQ PLC 組件,相對于 NetEQ ,它在聲音質感方面無疑有提升,而且 WaveNetEQ 模型跑得足夠快,可以在手機上運行,如此也可以規(guī)避用戶可能擔心的數(shù)據(jù)隱私問題。谷歌稱所有的處理都是在設備上進行,因為 Duo 的通話默認情況下就是端到端加密。一旦通話的真實音頻恢復,將無縫地切換到現(xiàn)實對話。

不過,WaveNetEQ 替換的內(nèi)容和時長有限制。目前是支持在 120 毫秒以內(nèi)的空白,之后會逐漸消失并歸零;WaveNetEQ 不是生成完整的單詞,而是簡單的音節(jié)。

目前 WaveNetEQ 已經(jīng)應用到 Pixel 4 手機上的 Duo APP 中,谷歌表示,它正在將其推廣到其他安卓手機上。

當然用機器學習處理音頻丟包并不是頭一遭,許多公司都在研究相關技術,以國內(nèi)公司為例,有些是自身業(yè)務本就涉及視音頻,比如騰訊;有些是音視頻云服務商,比如阿里,還有一些是專門的音視頻第三方服務商如聲網(wǎng)等。
責任編輯:wv

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6238

    瀏覽量

    109852
  • 通話
    +關注

    關注

    0

    文章

    29

    瀏覽量

    9800
  • DeepMind
    +關注

    關注

    0

    文章

    131

    瀏覽量

    11972
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    即時通話軟件音頻傳輸質量測試方案介紹

    傳輸質量。即時通話軟件基于移動網(wǎng)絡鏈路傳輸信號,通過本套測試方案中配套的網(wǎng)絡損傷仿真設備對傳輸鏈路添加不同的網(wǎng)絡影響,模擬軟件在不同網(wǎng)絡環(huán)境下的使用情況,進而測得更接近真實應用場景下的音頻傳輸
    的頭像 發(fā)表于 08-10 15:21 ?3263次閱讀
    即時<b class='flag-5'>通話</b>軟件<b class='flag-5'>音頻</b>傳輸<b class='flag-5'>質量</b>測試方案介紹

    解鎖高品質音頻體驗:探索音頻質量評估與測試的科學之道

    一、引言在數(shù)字化浪潮席卷的今天,音頻質量直接影響著從VoIP通話、視頻會議到智能音箱等應用的沉浸式體驗。音頻質量評估與測試,不僅是電信、廣播
    發(fā)表于 07-22 11:15

    如何通過I2S使用CYW4373 HFP音頻數(shù)據(jù)

    請教我使用 CYW4373 通過 I2S 使用 HFP 音頻數(shù)據(jù)所需的步驟和供應商特定命令。 配對完成,SCO 已連接,數(shù)據(jù)正在通過 I2S 發(fā)送,但Bluetooth?耳機沒有音頻輸出。此外
    發(fā)表于 07-17 07:43

    LE-Audio是什么?

    音頻編解碼、音頻數(shù)據(jù)傳輸和音頻控制方面進行了優(yōu)化。與傳統(tǒng)藍牙音頻相比,LE-Audio通過采用更高效的編碼算法和改進的數(shù)據(jù)壓縮
    發(fā)表于 06-28 21:32

    請問AD7768-4、ADAU1979的配套Evaluation Software能否進行原始音頻數(shù)據(jù)

    請問AD7768-4、ADAU1979的配套Evaluation Software能否進行原始音頻數(shù)據(jù)? 另外請問有沒有MCU+AD架構的高精度、多通道的聲卡的解決方案?
    發(fā)表于 04-15 07:53

    LPC55S28修改音頻數(shù)據(jù)格式后USB Aduio類異常的原因?

    您好 NXP 前輩,我已經(jīng)更改了 LPC55S28 官方 SDK 上的 USB 音頻數(shù)據(jù)格式。 我的主要問題是修改音頻流格式類型描述符。 我的想法是將 USB Aduio 每個通道的數(shù)據(jù)字節(jié)數(shù)從 2
    發(fā)表于 03-20 07:33

    如何才能獲取到Testmode下Sn65LVDS324的視頻數(shù)據(jù)?

    ,我們先采用Testmode測試數(shù)據(jù), AR0331 配置的為 1channel 4-lanes 16bpp模式,sn65lvds324csr寄存器的csr 09[2:0]=3\'b110, csr
    發(fā)表于 01-22 06:20

    如何提高嵌入式代碼質量?

    嵌入式系統(tǒng)的發(fā)展已經(jīng)深刻地影響了我們?nèi)粘I畹姆椒矫婷妫瑥闹悄芗揖拥狡嚳刂葡到y(tǒng),再到醫(yī)療設備和工業(yè)自動化等領域,嵌入式系統(tǒng)無處不在。嵌入式軟件的質量直接關系到系統(tǒng)的安全性、穩(wěn)定性和性能。因此,提高
    發(fā)表于 01-15 10:48

    判斷膨脹石墨好壞的方法

    ,使其成為眾多工業(yè)應用中的優(yōu)選材料。然而,如何確定膨脹石墨的好壞,成為許多采購商和制造商關注的焦點。以下是一些判斷膨脹石墨好壞的方法: 外觀檢測:初步判斷
    的頭像 發(fā)表于 01-09 15:09 ?879次閱讀

    為什么活動現(xiàn)場都是使用內(nèi)部通話系統(tǒng)而不是對講機?

    無論多好的對講機,本質的核心技術采用半雙工通信,同一個頻道下聽和說無法同時進行,通話時需要長按PTT按鍵,這對于直播現(xiàn)場的崗位很不適用,如導播需要雙手操作切換臺,攝像師需要操作攝像機等,這個時候
    發(fā)表于 12-16 16:19

    即時通話軟件音頻傳輸質量測試方案

    使用過程中的音頻傳輸質量。即時通話軟件基于移動網(wǎng)絡鏈路傳輸信號,通過本套測試方案中配套的網(wǎng)絡損傷仿真設備對傳輸鏈路添加不同的網(wǎng)絡影響,模擬軟件在不同網(wǎng)絡環(huán)境下的使用情況,進而測得更接近真實應用場景下的
    的頭像 發(fā)表于 12-03 14:34 ?966次閱讀
    即時<b class='flag-5'>通話</b>軟件<b class='flag-5'>音頻</b>傳輸<b class='flag-5'>質量</b>測試方案

    請問TLV320AIC3254EVM-K怎么讀取音頻數(shù)據(jù)流?

    您好,我在學習TLV320AIC3254EVM-K開發(fā)板的過程中碰到一個這樣的問題,TI提供的軟件是否具備讀取I2S的音頻數(shù)據(jù)流的功能,或者是否有PC機軟件可以讀取音頻數(shù)據(jù)流,或者其它方法?請高手幫忙解決,萬分感謝!
    發(fā)表于 10-31 06:14

    請問TLV320AIC3254采樣后的音頻數(shù)據(jù)如何在電腦上播放?

    TLV320AIC3254采樣后的音頻數(shù)據(jù)如何在電腦上播放
    發(fā)表于 10-25 07:58

    使用兩片TLV320ADC3101芯片接到同一條i2s總線上,能實現(xiàn)音頻數(shù)據(jù)的同時采集嗎?

    我想 請問一下,使用兩片TLV320ADC3101芯片接到同 一條 i2s總線上,能實現(xiàn)音頻數(shù)據(jù)的同時采集嗎?目前只實現(xiàn)了兩個芯片音頻數(shù)據(jù)的分時采集,需要做到實時同步采集。
    發(fā)表于 10-24 07:03

    TLV320ADC3101錄音經(jīng)過ADC轉換,通過IIS獲得音頻數(shù)據(jù)還原出的波形,如何讓波形更加平滑?

    ADC:TLV320ADC3101FS=44.1K 音頻:1KHZ正弦波 MIC錄音經(jīng)過ADC轉換,通過IIS獲得音頻數(shù)據(jù)還原出的波形如下 請問:如何是還原的波形更加平滑(目前采集到的數(shù)據(jù)連續(xù)4個都是同樣的值)
    發(fā)表于 10-22 07:14