chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

深度學(xué)習(xí)將對音頻處理產(chǎn)生深遠(yuǎn)影響 亞馬遜團隊深度噪聲抑制挑戰(zhàn)賽中獲勝

LiveVideoStack ? 來源:LiveVideoStack ? 作者:LiveVideoStack ? 2020-09-08 09:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

該團隊的非實時系統(tǒng)是性能最好的,而它的實時系統(tǒng)在整個系統(tǒng)中排名第三,在實時系統(tǒng)中排名第二,盡管只使用了4%的CPU核心。

文 / Arvindh Krishnaswamy 原文鏈接: https://www.amazon.science/blog/amazon-team-takes-first-place-in-interspeech-2020-deep-noise-suppression-challenge

在電子語音通信中,噪音和混響不僅會損害語音清晰度,而且會導(dǎo)致聽者在長時間努力理解低質(zhì)量語音時感到疲勞。在COVID-19大流行期間,我們花在遠(yuǎn)程會議上的時間越來越多,這一問題比以往任何時候都更加重要。 在今年的Interspeech會議上的深度噪聲抑制挑戰(zhàn)便是為了幫助解決這個問題的一個嘗試,分別在實時語音增強和非實時語音增強上進(jìn)行比賽。在19個團隊中,Amazon取得了最好的結(jié)果,在非實時賽道上獲得了第一名(階段1 |階段2-final),在實時賽道上獲得了第二名。

上面是一個有噪聲的語音樣本(上圖) 下面是被研究者的系統(tǒng)抑制了噪聲的同一個樣本(下圖) 為了滿足真實世界的需求,我們將實時輸入限制在CPU使用量的4%(在i7-8565U內(nèi)核上測量),這遠(yuǎn)遠(yuǎn)低于競賽所允許的最大限度。 然而,我們的實時輸入非常接近(0.03平均意見分?jǐn)?shù))的第一名,并且擊敗了其他非實時的輸入。 Amazon團隊實時和非實時噪聲抑制結(jié)果的音頻示例可以在這里找到。 我們還發(fā)表了兩篇論文(paper1-offline | paper2-real)來更詳細(xì)地描述我們的技術(shù)方法。 在Interspeech中獲勝的技術(shù)已經(jīng)在Alexa通信公告和Drop in Everywhere功能中發(fā)布,并且從今天開始,我們的客戶也可以通過使用Amazon Chime蘋果macOS和微軟Windows客戶端來進(jìn)行視頻會議和在線會議。

優(yōu)化的感知 傳統(tǒng)的語音增強算法使用人工調(diào)整的語音和噪聲模型,通常假設(shè)噪聲是恒定的。 對于某些類型的噪音(例如汽車噪音),在噪音不太大或低混響的環(huán)境下,這種方法工作得相當(dāng)好。不幸的是,它們經(jīng)常在非平穩(wěn)噪音上失敗,比如鍵盤噪音和雜音。因此,研究人員轉(zhuǎn)向了深度學(xué)習(xí)方法。

語音增強不僅需要從噪音和混響中提取原始語音,而且需要以一種人類耳朵感覺自然和愉快的方式進(jìn)行。這使得自動回歸測試變得困難,并使深度學(xué)習(xí)語音增強系統(tǒng)的設(shè)計復(fù)雜化。 我們的實時系統(tǒng)實際上通過直接優(yōu)化了語音的感知特征(spectral envelope and voicing),利用了人類的感知因素同時忽略了與感知無關(guān)的方面。由此產(chǎn)生的算法產(chǎn)生了最先進(jìn)的語音質(zhì)量,同時保持非常高的計算效率。 對于非實時系統(tǒng),我們采取了一種不妥協(xié)的方法,使用改進(jìn)的U-Net深度卷積網(wǎng)絡(luò)從增強的語音壓縮每一點可能的質(zhì)量,從而贏得了輸入挑戰(zhàn)。

一描繪經(jīng)被允許使用的研究人員的實時系統(tǒng)的百分比中央處理器核心降噪后的一語音樣本的平均意見分?jǐn)?shù)(MOS)的變化的圖像 在深度噪聲抑制的挑戰(zhàn)中,經(jīng)過處理的音頻示例被盲發(fā)送給人類聽眾,由他們對其進(jìn)行評分,產(chǎn)生平均意見分?jǐn)?shù)(MOS)。 在實時應(yīng)用程序中,復(fù)雜性和質(zhì)量之間總是需要權(quán)衡的。 右邊的圖顯示了我們?nèi)绾瓮ㄟ^增加CPU需求來進(jìn)一步提高實時提交的質(zhì)量,或者通過犧牲一些質(zhì)量來進(jìn)一步節(jié)省CPU的使用。 紅點表示提交挑戰(zhàn)的實時系統(tǒng),圖像顯示了MOS分?jǐn)?shù)相對于不同CPU負(fù)載的變化。

人們普遍認(rèn)為,深度學(xué)習(xí)最終將對音頻處理產(chǎn)生深遠(yuǎn)影響。 雖然仍有很多挑戰(zhàn),比如數(shù)據(jù)增強,感知相關(guān)的損失函數(shù)或者處理看不見的情況,但未來依然非常令人興奮。

原文標(biāo)題:亞馬遜團隊在Interspeech 2020深度噪聲抑制挑戰(zhàn)賽中獲得第一名

文章出處:【微信公眾號:LiveVideoStack】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11332

    瀏覽量

    225975
  • MOS
    MOS
    +關(guān)注

    關(guān)注

    32

    文章

    1764

    瀏覽量

    101270
  • 噪音
    +關(guān)注

    關(guān)注

    1

    文章

    172

    瀏覽量

    24596
  • 亞馬遜
    +關(guān)注

    關(guān)注

    8

    文章

    2738

    瀏覽量

    85895
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5610

    瀏覽量

    124652

原文標(biāo)題:亞馬遜團隊在Interspeech 2020深度噪聲抑制挑戰(zhàn)賽中獲得第一名

文章出處:【微信號:livevideostack,微信公眾號:LiveVideoStack】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    人工智能-Python深度學(xué)習(xí)進(jìn)階與應(yīng)用技術(shù):工程師高培解讀

    深度學(xué)習(xí)的工程化落地,早已不是紙上談兵的事。從卷積神經(jīng)網(wǎng)絡(luò)到Transformer,從目標(biāo)檢測到大模型私有化部署,技術(shù)棧不斷延伸,工程師面臨的知識體系也越來越龐雜。現(xiàn)根據(jù)威工程師
    的頭像 發(fā)表于 04-21 11:01 ?373次閱讀
    人工智能-Python<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>進(jìn)階與應(yīng)用技術(shù):工程師高培解讀

    思必馳斬獲Interspeech 2026音頻推理挑戰(zhàn)賽智能體賽道亞軍

    近日,國際語音與語言處理領(lǐng)域頂級賽事Interspeech 2026音頻推理挑戰(zhàn)賽結(jié)果正式揭曉。在這場首次將評估焦點從“答案正確性”轉(zhuǎn)向“推理過程質(zhì)量”的變革性賽事,思必馳-上海交通
    的頭像 發(fā)表于 02-28 14:13 ?841次閱讀

    AICAS 2026 Grand Challenge全球挑戰(zhàn)賽啟動

    第四屆AICAS Grand Challenge——AICAS 2026全球技術(shù)挑戰(zhàn)賽現(xiàn)已正式啟動,誠邀各界英才和技術(shù)先鋒共同參與,以“芯”智能驅(qū)動未來!
    的頭像 發(fā)表于 02-04 14:59 ?1029次閱讀

    TDK MAF1005P型噪聲抑制濾波器:設(shè)計利器的深度剖析

    TDK MAF1005P型噪聲抑制濾波器:設(shè)計利器的深度剖析 在電子設(shè)備的設(shè)計,噪聲抑制一直是
    的頭像 發(fā)表于 12-26 14:40 ?335次閱讀

    “芯”年來襲 | 瑞薩邊緣AI線上技術(shù)月暨挑戰(zhàn)賽

    自1月7日起,瑞薩邊緣AI技術(shù)月活動將每周開啟一場在線技術(shù)交流,涵蓋MCU/MPU產(chǎn)品、應(yīng)用案例及開發(fā)實踐,并同步開啟瑞薩AI評測挑戰(zhàn)賽,借助教程資源及每周在線講解和答疑,幫助嵌入式開發(fā)者從入門學(xué)習(xí)到上手第一個AI項目。
    的頭像 發(fā)表于 12-25 10:21 ?2494次閱讀
    “芯”年來襲 | 瑞薩邊緣AI線上技術(shù)月暨<b class='flag-5'>挑戰(zhàn)賽</b>

    摩爾線程在SIGGRAPH Asia 2025斬獲3DGS重建挑戰(zhàn)賽銀獎

    Challenge(3DGS 重建挑戰(zhàn)賽憑借自研技術(shù)LiteGS出色的算法實力和軟硬件協(xié)同優(yōu)化能力,斬獲銀獎,再次證明摩爾線程在新一代圖形渲染技術(shù)上的深度積累與全球?qū)W術(shù)界的高度認(rèn)可。
    的頭像 發(fā)表于 12-22 18:01 ?1982次閱讀
    摩爾線程在SIGGRAPH Asia 2025斬獲3DGS重建<b class='flag-5'>挑戰(zhàn)賽</b>銀獎

    傳音TEX AI團隊斬獲ICCV 2025大型視頻目標(biāo)分割挑戰(zhàn)賽雙料亞軍

    近日,國際計算機視覺大會(ICCV 2025)舉辦了第七屆大型視頻目標(biāo)分割挑戰(zhàn)賽(LSVOS Challenge),傳音TEX AI團隊憑借自主研發(fā)的創(chuàng)新技術(shù)方案,在復(fù)雜視頻目標(biāo)分割和語言指引視頻
    的頭像 發(fā)表于 10-31 09:42 ?759次閱讀
    傳音TEX AI<b class='flag-5'>團隊</b>斬獲ICCV 2025大型視頻目標(biāo)分割<b class='flag-5'>挑戰(zhàn)賽</b>雙料亞軍

    2025 EDA精英挑戰(zhàn)賽華大九天題發(fā)布

    中國研究生創(chuàng)“ 芯 ” 大賽·EDA精英挑戰(zhàn)賽(以下簡稱EDA精英挑戰(zhàn)賽)是由教育部學(xué)位管理與研究生教育司指導(dǎo),中國學(xué)位與研究生教育學(xué)會、中國科協(xié)青少年科技中心主辦的“ 中國研究生創(chuàng)‘芯 ’大賽
    的頭像 發(fā)表于 08-26 15:00 ?1874次閱讀
    2025 EDA精英<b class='flag-5'>挑戰(zhàn)賽</b>華大九天<b class='flag-5'>賽</b>題發(fā)布

    2025 EDA精英挑戰(zhàn)賽紫光同創(chuàng)題發(fā)布

    中國研究生創(chuàng)“ 芯 ” 大賽·EDA精英挑戰(zhàn)賽(以下簡稱EDA精英挑戰(zhàn)賽)是由教育部學(xué)位管理與研究生教育司指導(dǎo),中國學(xué)位與研究生教育學(xué)會、中國科協(xié)青少年科技中心主辦的“ 中國研究生創(chuàng)‘芯 ’大賽
    的頭像 發(fā)表于 08-25 09:40 ?1982次閱讀
    2025 EDA精英<b class='flag-5'>挑戰(zhàn)賽</b>紫光同創(chuàng)<b class='flag-5'>賽</b>題發(fā)布

    自動駕駛Transformer大模型會取代深度學(xué)習(xí)嗎?

    [首發(fā)于智駕最前沿微信公眾號]近年來,隨著ChatGPT、Claude、文心一言等大語言模型在生成文本、對話交互等領(lǐng)域的驚艷表現(xiàn),“Transformer架構(gòu)是否正在取代傳統(tǒng)深度學(xué)習(xí)”這一話題一直被
    的頭像 發(fā)表于 08-13 09:15 ?4387次閱讀
    自動駕駛<b class='flag-5'>中</b>Transformer大模型會取代<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>嗎?

    e絡(luò)盟社區(qū)攜手 Würth Elektronik 發(fā)起全球 LED 設(shè)計挑戰(zhàn)賽

    安富利旗下e絡(luò)盟社區(qū)與 Würth Elektronik 合作推出全球設(shè)計挑戰(zhàn)賽。這項全新競賽誠邀工程師、創(chuàng)客和愛好者們使用 Würth Elektronik 先進(jìn)的 SMD LED(集成了 WL-ICLED 控制器)開發(fā)原型或測試裝置。
    的頭像 發(fā)表于 07-23 10:15 ?1091次閱讀
    e絡(luò)盟社區(qū)攜手 Würth Elektronik 發(fā)起全球 LED 設(shè)計<b class='flag-5'>挑戰(zhàn)賽</b>

    傳音多媒體團隊攬獲CVPR NTIRE 2025兩項挑戰(zhàn)賽冠亞軍,推動視頻畫質(zhì)升級

    近日,在計算機視覺領(lǐng)域最具影響力的國際競賽CVPRNTIRE2025,傳音多媒體團隊與上海交通大學(xué)圖像所MediaLab聯(lián)合團隊分別斬獲高效超分辨率挑戰(zhàn)賽
    的頭像 發(fā)表于 06-24 17:03 ?1041次閱讀
    傳音多媒體<b class='flag-5'>團隊</b>攬獲CVPR NTIRE 2025兩項<b class='flag-5'>挑戰(zhàn)賽</b>冠亞軍,推動視頻畫質(zhì)升級

    傳音多媒體團隊攬獲CVPR NTIRE 2025兩項挑戰(zhàn)賽冠亞軍

    近日,在計算機視覺領(lǐng)域最具影響力的國際競賽 CVPR NTIRE 2025,傳音多媒體團隊與上海交通大學(xué)圖像所MediaLab聯(lián)合團隊分別斬獲 高效超分辨率挑戰(zhàn)賽(NTIRE 202
    的頭像 發(fā)表于 06-24 16:08 ?1795次閱讀
    傳音多媒體<b class='flag-5'>團隊</b>攬獲CVPR NTIRE 2025兩項<b class='flag-5'>挑戰(zhàn)賽</b>冠亞軍

    ASML杯光刻「芯 」勢力知識挑戰(zhàn)賽正式啟動

    ASML光刻「芯」勢力知識挑戰(zhàn)賽由全球半導(dǎo)體行業(yè)領(lǐng)先供應(yīng)商ASML發(fā)起,是一項面向中國半導(dǎo)體人才與科技愛好者的科普賽事。依托ASML在光刻領(lǐng)域的技術(shù)積累與行業(yè)洞察,賽事致力于為參賽者打造一個深度探索光刻技術(shù)的知識競技窗口,同時培養(yǎng)優(yōu)秀科技「芯」勢力,共同推動摩爾定律演進(jìn)。
    的頭像 發(fā)表于 06-23 17:04 ?1452次閱讀
    ASML杯光刻「芯 」勢力知識<b class='flag-5'>挑戰(zhàn)賽</b>正式啟動

    如何抑制電子電路噪聲

    在電子電路的運行過程,噪聲如同不速之客,嚴(yán)重干擾信號的正常傳輸與處理,影響電路性能甚至導(dǎo)致系統(tǒng)故障。如何有效抑制電子電路
    的頭像 發(fā)表于 05-05 10:04 ?2140次閱讀