chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Google最新推出的音頻編解碼器Lyra

LiveVideoStack ? 來源:LiveVideoStack ? 作者:LiveVideoStack ? 2021-03-11 16:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Google最新推出的音頻編解碼器Lyra,不僅實(shí)現(xiàn)了以每秒3kb網(wǎng)絡(luò)寬帶提供聽起來自然清晰的語(yǔ)音聊天,還可以在僅90ms延遲的情況下在從高端云服務(wù)器到中端智能手機(jī)的任何設(shè)備上運(yùn)行。

2月25日,Google AI blog發(fā)布了一篇文章詳細(xì)的介紹了最新推出的Lyra——一種用于語(yǔ)音壓縮的新型超低比特率編解碼器。該編解碼器使Google Duo,以及未來的其他應(yīng)用程序能夠以每秒3kb的網(wǎng)絡(luò)寬帶提供聽起來很自然清晰的語(yǔ)音聊天。

眾所周知,人們對(duì)實(shí)時(shí)音視頻的需求不斷增加。特別是去年由于受到疫情的影響,許多人不得不隔離在家,只能與親朋好友通過視頻通話的方式保持聯(lián)系。例如,僅去年一年Google Duo和Meet就承載了超過1萬億分鐘的視頻。而這些情況無疑是給全球的互聯(lián)網(wǎng)基礎(chǔ)設(shè)施帶來了巨大的挑戰(zhàn)。除此之外,雖然有些人可以使用一致的高質(zhì)量,高速網(wǎng)絡(luò),但這種連接并不普遍。比如在網(wǎng)絡(luò)通信并不發(fā)達(dá)的農(nóng)村地區(qū)。然而,盡管在連接良好的地區(qū),人們有時(shí)也會(huì)遇到質(zhì)量差、帶寬低的問題。那么如何在有限的帶寬下實(shí)現(xiàn)高質(zhì)量的音頻輸出就成為了目前最重要的議題。

Lyra音頻編解碼器

6e8f3e5c-7e1a-11eb-8b86-12bb97331649.png

因此,Google推出了一種高質(zhì)量、低比特率的新型音頻編解碼器——Lyra。盡管用戶在網(wǎng)速很慢的情況下,也能進(jìn)行語(yǔ)音聊天。Lyra編解碼器的基本結(jié)構(gòu)體系非常簡(jiǎn)單,如上圖所示。而Lyra與其他音頻編解碼器的不同之處在于:它利用機(jī)器學(xué)習(xí)模型,開發(fā)了一種新的模型,能夠使用最少的數(shù)據(jù)來重建語(yǔ)音。這種模型不僅能夠區(qū)分信號(hào),還能生成全新的信號(hào)。與之相比,傳統(tǒng)的參數(shù)編解碼器只從語(yǔ)音中提取關(guān)鍵參數(shù),然后用于在接收端重建信號(hào)。雖然實(shí)現(xiàn)低比特率,但得到的音頻通常聽起來很機(jī)械,不自然。而Lyra利用這些新的自然聲生成模型,即能夠保持參數(shù)編解碼器的低比特率,同時(shí)又能實(shí)現(xiàn)高質(zhì)量的音頻輸出。這與目前大多流媒體平臺(tái)中使用的波形編解碼器幾乎不相上下。更重要的是,Lyra的效率足夠高,可以在僅90ms延遲的情況下在從高端云服務(wù)器到中端智能手機(jī)的任何設(shè)備上運(yùn)行。

與現(xiàn)有編解碼器對(duì)比

Lyra目前被設(shè)計(jì)運(yùn)行在3kbps情況下,聽力測(cè)試表明,Lyra的表現(xiàn)優(yōu)于任何其他編解碼器。并且優(yōu)于在相同8kbps情況下的Opus,從而實(shí)現(xiàn)了超過60%的帶寬減少。Lyra可以在帶寬條件不適合高比特率和現(xiàn)有的低比特率編解碼器不能提供足夠質(zhì)量的情況下使用,這是它的一大優(yōu)勢(shì),也是解決現(xiàn)在低音頻質(zhì)量的方案。

以下是Lyra與現(xiàn)有編解碼器的對(duì)比:

在安靜的環(huán)境下:

Original原始音頻

Opus@6kbps

Lyra@3kbps

Speex@3kbps

在嘈雜的環(huán)境下:

Original原始音頻

Opus@6kbps

Lyra@3kbps

Speex@3kbps

上方是Google提供的Lyra與Opus、Speex分別以6kbps和3kbps,對(duì)同一音頻的壓縮質(zhì)量對(duì)比。能夠明顯感受到即使Lyra在3kbps情況下,自然語(yǔ)音音頻的清晰程度也遠(yuǎn)優(yōu)于Opus在6kbps下的情況。

適用情況

Google已經(jīng)利用開源音頻庫(kù)對(duì)Lyra使用超過70種語(yǔ)言的揚(yáng)聲器進(jìn)行了數(shù)千小時(shí)的音頻培訓(xùn),然后與專家和來自廣泛的聽眾一起驗(yàn)證音頻質(zhì)量。Lyra在一個(gè)廣泛的數(shù)據(jù)集中訓(xùn)練,包括大量不同語(yǔ)言的使用者,以確保編解碼器能夠應(yīng)對(duì)各種情況。另外,Lyra還可以在云環(huán)境中使用,以方便使用各種網(wǎng)絡(luò)和設(shè)備的用戶能夠無縫對(duì)接聊天。不僅如此,Google還將Lyra與新的視頻壓縮技術(shù)(例如AV1)配對(duì)后,即使用戶通過56kbps撥號(hào)調(diào)制調(diào)節(jié)器連接到Internet,也可以進(jìn)行視頻聊天。

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Google
    +關(guān)注

    關(guān)注

    5

    文章

    1803

    瀏覽量

    60390
  • 音頻編解碼器
    +關(guān)注

    關(guān)注

    4

    文章

    158

    瀏覽量

    56706
  • 應(yīng)用程序
    +關(guān)注

    關(guān)注

    38

    文章

    3343

    瀏覽量

    60095

原文標(biāo)題:在3kbps的帶寬下還能清晰地語(yǔ)音聊天?

文章出處:【微信號(hào):livevideostack,微信公眾號(hào):LiveVideoStack】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    德州儀器PCM2900C/2902C立體聲音頻編解碼器深度解析

    的首選。今天,我們就來深入探討這兩款編解碼器的特點(diǎn)、應(yīng)用及設(shè)計(jì)要點(diǎn)。 文件下載: PCM2900CDBR.pdf 產(chǎn)品概述 PCM2900C和PCM2902C是TI推出的單芯片USB立體聲音頻
    的頭像 發(fā)表于 01-13 17:45 ?1033次閱讀

    德州儀器PCM2904/PCM2906立體聲音頻編解碼器:特性、應(yīng)用與設(shè)計(jì)指南

    概述 PCM2904和PCM2906是德州儀器推出的單芯片USB立體聲音頻編解碼器,集成了符合USB全速協(xié)議的控制。兩
    的頭像 發(fā)表于 12-23 15:05 ?294次閱讀

    TLV320AIC12KIDBTR 低功耗單聲道語(yǔ)音頻編解碼器

    TLV320AIC12KIDBTR低功耗單聲道語(yǔ)音頻編解碼器產(chǎn)品型號(hào):TLV320AIC12KIDBTR產(chǎn)品品牌:TI/德州儀器產(chǎn)品封裝:TSSOP30產(chǎn)品功能:語(yǔ)音頻編解碼器
    的頭像 發(fā)表于 12-20 11:30 ?246次閱讀
    TLV320AIC12KIDBTR   低功耗單聲道語(yǔ)<b class='flag-5'>音頻</b><b class='flag-5'>編解碼器</b>

    基于E203 RISC-V的音頻信號(hào)處理系統(tǒng) -CODEC(音頻編解碼器)配置

    CODEC介紹 本設(shè)計(jì)采用的音頻編解碼器是WM8731,該編解碼器可以通過I2C進(jìn)行寄存配置,可以調(diào)節(jié)主從模式、數(shù)據(jù)位數(shù)可設(shè)置為16bit、24bit、32bit??梢栽O(shè)置的傳輸模
    發(fā)表于 10-28 06:29

    集成了32位RISC處理和SPDIF音頻接口的音頻編解碼

    音頻編解碼器的工作原理主要涉及將音頻信號(hào)轉(zhuǎn)換為數(shù)字格式并進(jìn)行壓縮處理,以實(shí)現(xiàn)高效存儲(chǔ)和傳輸。
    的頭像 發(fā)表于 10-11 09:52 ?646次閱讀
    集成了32位RISC處理<b class='flag-5'>器</b>和SPDIF<b class='flag-5'>音頻</b>接口的<b class='flag-5'>音頻</b><b class='flag-5'>編解碼</b>

    新唐科技推出低延遲音頻編解碼器NAU88L21C

    Audio CODEC (Audio Coder-Decoder) 是音頻編解碼器”,主要功能是進(jìn)行音頻信號(hào)的編碼(壓縮)和解碼(解壓)。在音頻
    的頭像 發(fā)表于 09-30 09:25 ?5856次閱讀
    新唐科技<b class='flag-5'>推出</b>低延遲<b class='flag-5'>音頻</b><b class='flag-5'>編解碼器</b>NAU88L21C

    增強(qiáng)T-BOX設(shè)計(jì),新唐編解碼器的重要作用

    。 T-BOX音頻架構(gòu): T-BOX 音頻架構(gòu)的主要特點(diǎn)包括: 獨(dú)立電源管理系統(tǒng) 雙麥克風(fēng)音頻處理 編解碼器、D類音頻放大器和車載信
    發(fā)表于 09-05 06:26

    如何使用 M487 微控制和外部音頻編解碼器NAU88L25將 AMR 格式的聲音錄制到 MicroSD 卡中?

    使用 M487 微控制和外部音頻編解碼器NAU88L25將 AMR 格式的聲音錄制到 MicroSD 卡中
    發(fā)表于 08-20 06:28

    一款低功耗、高質(zhì)量的24位立體聲編解碼器-CJC8972

    24位立體聲編解碼器通過數(shù)字信號(hào)處理實(shí)現(xiàn)高精度音頻編碼與解碼,核心在于對(duì)立體聲信號(hào)的數(shù)字化處理及還原。
    的頭像 發(fā)表于 08-07 09:22 ?1141次閱讀
    一款低功耗、高質(zhì)量的24位立體聲<b class='flag-5'>編解碼器</b>-CJC8972

    Texas Instruments TAC5x42接口編解碼器數(shù)據(jù)手冊(cè)

    Texas Instruments TAC5x42接口編解碼器包括低功耗立體聲音頻模數(shù)轉(zhuǎn)換 (ADC) 和音頻數(shù)模轉(zhuǎn)換器 (DAC),集成了豐富的功能。這些支持時(shí)分復(fù)用 (TDM)、
    的頭像 發(fā)表于 07-14 14:43 ?677次閱讀
    Texas Instruments TAC5x42接口<b class='flag-5'>編解碼器</b>數(shù)據(jù)手冊(cè)

    Texas Instruments TAC5311-Q1汽車單聲道音頻編解碼器數(shù)據(jù)手冊(cè)

    Texas Instruments TAC5311-Q1汽車單聲道音頻編解碼器是一款低功耗單聲道編解碼器,具有10V~RMS ~差分輸入、104dB ADC和2V~RMS~ 差分輸出、114dB
    的頭像 發(fā)表于 07-09 15:35 ?828次閱讀
    Texas Instruments TAC5311-Q1汽車單聲道<b class='flag-5'>音頻</b><b class='flag-5'>編解碼器</b>數(shù)據(jù)手冊(cè)

    CYW20721內(nèi)置的所有編解碼器類型有哪些?

    您能告訴我們 CYW20721 內(nèi)置的所有編解碼器類型嗎? LDAC、LC3(LE 音頻)、AAC、SBC 等。
    發(fā)表于 06-27 08:03

    AI玩具爆發(fā),音頻編解碼器如何滿足語(yǔ)音交互需求

    電子發(fā)燒友網(wǎng)綜合報(bào)道,在AI玩具已經(jīng)開始逐漸爆發(fā)的當(dāng)下,人機(jī)交互已經(jīng)成為標(biāo)配功能,而最重要的便是語(yǔ)音控制。而語(yǔ)音控制的第一步,便需要讓AI玩具聽懂你在說什么這就需要用到音頻編解碼器。 ? 音頻
    的頭像 發(fā)表于 06-20 01:07 ?7097次閱讀

    TWL6040 用于便攜式應(yīng)用的 8 通道高質(zhì)量低功耗音頻編解碼器數(shù)據(jù)手冊(cè)

    TWL6040 設(shè)備是具有高集成度的音頻編碼/解碼器編解碼器),可為便攜式應(yīng)用程序提供模擬音頻編解碼
    的頭像 發(fā)表于 04-27 17:52 ?921次閱讀
    TWL6040 用于便攜式應(yīng)用的 8 通道高質(zhì)量低功耗<b class='flag-5'>音頻</b><b class='flag-5'>編解碼器</b>數(shù)據(jù)手冊(cè)

    TWL6041 用于便攜式應(yīng)用的 8 通道高質(zhì)量低功耗音頻編解碼器數(shù)據(jù)手冊(cè)

    TWL6041 是一種具有高集成度的音頻編解碼器,為便攜式應(yīng)用程序提供模擬音頻編解碼器功能,如 所示。該設(shè)備包含多個(gè)音頻模擬輸入和輸出,以及
    的頭像 發(fā)表于 04-27 14:55 ?925次閱讀
    TWL6041 用于便攜式應(yīng)用的 8 通道高質(zhì)量低功耗<b class='flag-5'>音頻</b><b class='flag-5'>編解碼器</b>數(shù)據(jù)手冊(cè)