chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

比MP3小10倍,Meta公開全新音頻壓縮技術(shù)

OSC開源社區(qū) ? 來源:OSC開源社區(qū) ? 作者:OSC開源社區(qū) ? 2022-11-07 11:39 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Meta 近日在一篇題為 “High Fidelity Neural Audio Compression”(高保真神經(jīng)音頻壓縮)的論文中公布了一項(xiàng)名為 "EnCodec" 的開源音頻壓縮技術(shù),該技術(shù)由 AI 驅(qū)動(dòng),可以在音頻質(zhì)量沒有損失的前提下,將音頻壓縮到比 MP3 格式還要小 10 倍的程度。

bc8c974c-5dd1-11ed-a3b6-dac502259ad0.jpg

Meta 將這項(xiàng)技術(shù)的實(shí)現(xiàn)方法分成了一個(gè)由三部分組成的系統(tǒng),經(jīng)過訓(xùn)練后的 AI 可以將音頻壓縮到所需的目標(biāo)大小,其實(shí)現(xiàn)過程如下:

首先,編碼器將未壓縮的數(shù)據(jù)轉(zhuǎn)換為較低幀率的 "latent space" 表示(representation);

然后,量化器將這個(gè)表示壓縮到目標(biāo)大小,同時(shí)跟蹤最重要的信息,這些信息以后將被用于重建原始信號(hào)(這個(gè)壓縮信號(hào)將通過網(wǎng)絡(luò)發(fā)送或保存在磁盤上);

最后,解碼器使用單個(gè) CPU 上的神經(jīng)網(wǎng)絡(luò)將壓縮的數(shù)據(jù)實(shí)時(shí)地轉(zhuǎn)變回音頻;

至于應(yīng)用,Meta 表示這種由人工智能驅(qū)動(dòng)的 "超壓縮音頻" 可以在惡劣的網(wǎng)絡(luò)條件下獲得更快、更優(yōu)質(zhì)的通話效果。作為一家 “梭哈” 元宇宙的公司,這項(xiàng)技術(shù)還可以提供更加豐富的元宇宙體驗(yàn)(視頻會(huì)議、影音流媒體、VR 游戲等),而不需要提高帶寬。 除了語音通話,這項(xiàng)技術(shù)同樣可以應(yīng)用于音樂領(lǐng)域,未來我們有望可以獲得高品質(zhì)、小體積的音頻文件。 目前這項(xiàng)技術(shù)仍處于研究階段,源代碼和一些音頻樣本都已公開在 GitHub 上:https://github.com/facebookresearch/encodec

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    49028

    瀏覽量

    249531
  • Meta
    +關(guān)注

    關(guān)注

    0

    文章

    303

    瀏覽量

    11866

原文標(biāo)題:比MP3小10倍,Meta公開全新音頻壓縮技術(shù)

文章出處:【微信號(hào):OSC開源社區(qū),微信公眾號(hào):OSC開源社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    新品|Unit AudioPlayer,支持 MP3/WAV 播放的音頻播放單元

    UnitAudioPlayer是一款自帶MP3解碼功能的音頻播放單元,內(nèi)置高性能音頻解碼芯片N9301,自帶microSD卡座。該產(chǎn)品采用UART通信接口,用戶可通過配置指令實(shí)現(xiàn)音頻
    的頭像 發(fā)表于 06-20 15:59 ?322次閱讀
    新品|Unit AudioPlayer,支持 <b class='flag-5'>MP3</b>/WAV 播放的<b class='flag-5'>音頻</b>播放單元

    請(qǐng)問k230如何讀取sd卡并播放其中的mp3音頻,他有庫(kù)支持嗎?

    k230如何讀取sd卡并播放其中的mp3音頻,他有庫(kù)支持嗎?
    發(fā)表于 06-04 06:24

    芯資訊|廣州唯創(chuàng)電子語音芯片U盤MP3播放IC技術(shù)解析與應(yīng)用指南

    ,在語音芯片領(lǐng)域積累了深厚的技術(shù)實(shí)力。唯創(chuàng)電子的核心創(chuàng)新之一是其支持U盤直讀的MP3語音芯片系列,這些芯片解決了傳統(tǒng)語音芯片需要專用工具更新語音內(nèi)容的痛點(diǎn),為用戶提
    的頭像 發(fā)表于 05-30 09:17 ?216次閱讀
    芯資訊|廣州唯創(chuàng)電子語音芯片U盤<b class='flag-5'>MP3</b>播放IC<b class='flag-5'>技術(shù)</b>解析與應(yīng)用指南

    芯資訊|廣州唯創(chuàng)電子MP3語音芯片IC的音頻解碼方式解析

    格式支持、技術(shù)特性及應(yīng)用場(chǎng)景三方面,解析其解碼方案的設(shè)計(jì)邏輯與優(yōu)勢(shì)。一、音頻解碼格式的支持MP3播放類芯片的主流解碼能力唯創(chuàng)電子的MP3語音芯片(如WT2003H系列)
    的頭像 發(fā)表于 05-28 08:48 ?171次閱讀
    芯資訊|廣州唯創(chuàng)電子<b class='flag-5'>MP3</b>語音芯片IC的<b class='flag-5'>音頻</b>解碼方式解析

    KT142C語音芯片支持的語音文件格式什么?Mp3還是wav呢?

    真沒有必要 2、如果客戶強(qiáng)烈需要,我們也是可以添加的。但是KT142C內(nèi)置的寶貴可用空間就變少了 3、因?yàn)橥纫糍|(zhì)、同等時(shí)長(zhǎng)的mp3文件,wav文件體積小很多很多。 所以優(yōu)先壓縮
    的頭像 發(fā)表于 02-17 11:07 ?410次閱讀
    KT142C語音芯片支持的語音文件格式什么?<b class='flag-5'>Mp3</b>還是wav呢?

    學(xué)習(xí)機(jī)MP3語音芯片方案:WMV硬解碼芯片,N9301-316

    在當(dāng)今數(shù)字化時(shí)代,學(xué)習(xí)機(jī)已不再僅僅是靜態(tài)的物品。隨著技術(shù)的快速發(fā)展和不斷探索創(chuàng)新方法,人們將音樂與互動(dòng)學(xué)習(xí)相融合,為兒童創(chuàng)造出更加富有創(chuàng)意和學(xué)習(xí)機(jī)產(chǎn)品。其中,九芯電子N9301系列MP3解碼芯片
    的頭像 發(fā)表于 02-07 18:31 ?402次閱讀
    學(xué)習(xí)機(jī)<b class='flag-5'>MP3</b>語音芯片方案:WMV硬解碼芯片,N9301-316

    KT148A語音芯片一個(gè)mp3語音,有辦法分成一段一段的嗎

    第一步:生成語音素材:到這一步,就實(shí)現(xiàn)了語音素材的生成,下載下來就是一整個(gè)mp3文件 詳見KT148A資料包里面的文檔說明 第二步:將需要的語音素材剪裁 使用的是Adobe
    的頭像 發(fā)表于 01-22 16:11 ?524次閱讀
    KT148A語音芯片一個(gè)<b class='flag-5'>mp3</b>語音,有辦法分成一段一段的嗎

    N930X指定曲目播放MP3音樂芯片:提升睡眠儀體驗(yàn)

    N930X MP3芯片集成硬解碼,支持定制播放、智能定時(shí)、低功耗、自主更新,兼容多種控制及音頻格式,提升睡眠儀體驗(yàn),滿足高質(zhì)量睡眠追求。
    的頭像 發(fā)表于 12-11 14:29 ?587次閱讀
    N930X指定曲目播放<b class='flag-5'>MP3</b>音樂芯片:提升睡眠儀體驗(yàn)

    N930X指定曲目播放MP3音樂芯片:提升睡眠儀體驗(yàn)

    和自然之聲,幫助人們更好地入睡,提高睡眠質(zhì)量。而N930X指定曲目播放MP3音樂芯片,就是這款睡眠儀的核心部件。芯片簡(jiǎn)介N930X是一個(gè)提供串口的MP3芯片,完美的集
    的頭像 發(fā)表于 12-11 14:25 ?524次閱讀
    N930X指定曲目播放<b class='flag-5'>MP3</b>音樂芯片:提升睡眠儀體驗(yàn)

    魅族E2 MP3使用手冊(cè)(說明書)

    魅族 E2 MP3 操作使用手冊(cè)(說明書)
    發(fā)表于 11-12 13:41 ?0次下載

    請(qǐng)問TLV320DAC3120可以用作MP3的解壓芯片嗎?

    TLV320DAC3120項(xiàng)目要求用喇叭播MP3音頻,我選用的方案是MCU+TLV320DAC3120,計(jì)劃按以下步驟進(jìn)行: 1. MCU通過I2C來配置TLV320DAC3120 2. MCU
    發(fā)表于 11-06 06:26

    能在DSP的存儲(chǔ)器上存MP3或其他格式的音頻文件,由DSP讀后控制TLV320AIC23轉(zhuǎn)換成語音?

    我想用TLV320AIC23和DSP做一個(gè)音頻系統(tǒng)。我想問一下能在DSP的存儲(chǔ)器上存MP3或其他格式的音頻文件,由DSP讀后控制TLV320AIC23轉(zhuǎn)換成語音?有沒有好的方案推薦謝謝!
    發(fā)表于 11-01 06:45

    請(qǐng)問如何把WAV,MP3格式的音頻文件轉(zhuǎn)化為16位的數(shù)據(jù)IIS格式?

    你好,請(qǐng)問如何把WAV,MP3格式的音頻文件轉(zhuǎn)化為16位的數(shù)據(jù)IIS格式?
    發(fā)表于 10-23 07:24

    九芯電子電子琴語音芯片的無限可能——N930X-S16 MP3解碼芯片

    播放,是置入了音樂芯片,目前流行的高性價(jià)比語音芯片N930X音樂芯片;此款芯片是一個(gè)提供串口的MP3芯片,完美地集成了MP3、WMV的硬解碼芯片,在音頻壓縮方面有著
    的頭像 發(fā)表于 10-13 08:01 ?840次閱讀
    九芯電子電子琴語音芯片的無限可能——N930X-S16 <b class='flag-5'>MP3</b>解碼芯片

    N9305 MP3語音芯片:外掛FLASH自定義語音播放解決方案

    隨著科技的飛速發(fā)展,語音芯片作為電子產(chǎn)品中的重要組成部分,不斷引入新的特性和功能以滿足市場(chǎng)需求。其中,N9305系列MP3語音芯片支持外掛Flash、U盤、USB下載的功能成為語音芯片領(lǐng)域的一大亮點(diǎn)
    的頭像 發(fā)表于 10-11 08:01 ?816次閱讀
    N9305 <b class='flag-5'>MP3</b>語音芯片:外掛FLASH自定義語音播放解決方案