chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

云知聲2篇論文參展國際語音頂會INTERSPEECH 2022

云知聲 ? 來源:云知聲 ? 作者:云知聲 ? 2022-09-21 19:50 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2022年9月18日-22日,全球語音領(lǐng)域頂級會議INTERSPEECH 2022在韓國仁川舉辦。“云知聲-上師大自然人機(jī)交互”聯(lián)合實(shí)驗(yàn)室攜提出的關(guān)于聲音事件檢測、單通道語音增強(qiáng)方向的2篇論文參會。這是繼2022年6月亮相ICASSP2022(技術(shù)論文被收錄)之后,云知聲在2022年再一次獲得國際語音頂會的認(rèn)可。

b53e0852-399d-11ed-9e49-dac502259ad0.png

INTERSPEECH在國際上享有極高盛譽(yù)并具有廣泛的學(xué)術(shù)影響力,是由國際語音通訊協(xié)會(ISCA)創(chuàng)辦的旗艦級國際會議,也是全球最大的綜合性語音領(lǐng)域的科技盛會,對參會企業(yè)和單位有著嚴(yán)苛的準(zhǔn)入門檻,歷屆INTERSPEECH會議都倍受全球各地語音研究領(lǐng)域人士的廣泛關(guān)注。

本屆會議以“Human and humanizing speech technology”為主題,內(nèi)容涵蓋信號處理、語音識別、自然語言處理、神經(jīng)機(jī)器翻譯等領(lǐng)域,收到近萬篇投稿論文。會議研究成果代表著語音相關(guān)領(lǐng)域的最新研究水平和未來的技術(shù)發(fā)展趨勢。此次論文入選,代表云知聲在語音交互領(lǐng)域持續(xù)的技術(shù)創(chuàng)新。

聲音事件檢測

b5534028-399d-11ed-9e49-dac502259ad0.png

在聲音事件檢測方向,研究團(tuán)隊(duì)提出了一個教師-學(xué)生(Teacher-Student)半監(jiān)督學(xué)習(xí)框架,充分利用強(qiáng)標(biāo)簽數(shù)據(jù)、弱標(biāo)簽數(shù)據(jù)與大量無標(biāo)簽數(shù)據(jù)訓(xùn)練模型,有效解決標(biāo)簽數(shù)據(jù)匱乏的問題。為了提高模型的檢測能力,研究團(tuán)隊(duì)提出通過兩階段的訓(xùn)練策略并聚焦于難以分類的事件,以及利用一種深度特征蒸餾方法,更詳細(xì)地關(guān)注到時間軸上細(xì)致的聲學(xué)信息。

同時,研究團(tuán)隊(duì)還提出語音分離技術(shù)輔助聲音事件檢測系統(tǒng)建模的方法,通過使用分離數(shù)據(jù)與混合數(shù)據(jù)聯(lián)合調(diào)整訓(xùn)練模型的方式,有效解決事件重疊與背景噪聲干擾對系統(tǒng)建模帶來的影響。在DCASE2019 Task4 數(shù)據(jù)集上,研究團(tuán)隊(duì)所提出的方案在F1, PSDS1 and PSDS2得分上分別達(dá)到了46.5%, 44.5%以及75.4%,相比baseline提高了2.2%, 7.2%以及20.5%,充分體現(xiàn)了所提出方案的優(yōu)勢。

b57ba9fa-399d-11ed-9e49-dac502259ad0.png

單通道語音增強(qiáng)

b5a7977c-399d-11ed-9e49-dac502259ad0.png

在單通道實(shí)時語音增強(qiáng)方向,研究團(tuán)隊(duì)提出了一個基于PercepNet模型并感知語音相位與信噪比的實(shí)時語音增強(qiáng)方案(PercepNet+: A Phase and SNR Aware PercepNet for Real-Time Speech Enhancement),該方案提取多種聲學(xué)特征,以獲取語音包括幅度,相位,基音周期在內(nèi)的多種聲學(xué)屬性。這些特征被進(jìn)一步在模型中使用提取時間相關(guān)性和頻率相關(guān)性的GRU網(wǎng)絡(luò)層進(jìn)行融合,以提升該語音增強(qiáng)系統(tǒng)的性能。

同時,研究團(tuán)隊(duì)還提出一種基于信噪比的后處理機(jī)制,旨在改善語音增強(qiáng)中的過度抑制問題。該機(jī)制利用網(wǎng)絡(luò)估計(jì)得到的語音信噪比為閾值條件,決定基于MMSE-LSA的后處理方法是否被應(yīng)用于當(dāng)前輸入語音。研究團(tuán)隊(duì)的模型在VCTK測試集上達(dá)到了2.65 (PESQ) 的得分,相比原PercepNet模型的得分相對提升了8%,充分驗(yàn)證了所提出方案的有效性。

b5d1d6e0-399d-11ed-9e49-dac502259ad0.png

人工智能成功的關(guān)鍵在于應(yīng)用。為不斷拓寬自身基礎(chǔ)能力邊界,云知聲深入探究語音領(lǐng)域中的語音識別、語音增強(qiáng)、信號處理、聲紋識別、聲音事件檢測等諸多方向,形成豐富技術(shù)積累,并將相關(guān)技術(shù)在多個領(lǐng)域以及行業(yè)進(jìn)行應(yīng)用,取得諸多成功案例。比如云知聲的ASR技術(shù)被廣泛應(yīng)用于音視頻翻譯、會議系統(tǒng)、同聲傳譯、三代共6款專用AI語音交互芯片等相關(guān)產(chǎn)品與場景。

其中,云知聲輸出的軟硬一體的語音交互芯片產(chǎn)品,覆蓋各種形態(tài)的多品類產(chǎn)品,市占率領(lǐng)先,出貨量不斷增長。為國內(nèi)傳統(tǒng)行業(yè)迅速實(shí)現(xiàn)智能化產(chǎn)品升級與改造,提供了技術(shù)保障。

本次在 INTERSPEECH 2022 大會上提出的原創(chuàng)技術(shù),也將進(jìn)一步夯實(shí)云知聲全棧+硬核的人工智能技術(shù)“底座”,提高云知聲在語音交互領(lǐng)域的技術(shù)領(lǐng)先性,推動人工智能系統(tǒng)以更人性化、高效的方式服務(wù)于千行百業(yè),為用戶帶來更好的交互體驗(yàn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39707

    瀏覽量

    301314
  • 語音識別
    +關(guān)注

    關(guān)注

    39

    文章

    1812

    瀏覽量

    116040
  • 語音交互
    +關(guān)注

    關(guān)注

    3

    文章

    350

    瀏覽量

    29166
  • 云知聲
    +關(guān)注

    關(guān)注

    0

    文章

    314

    瀏覽量

    9360
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    2126

    瀏覽量

    36762

原文標(biāo)題:云知聲技術(shù)實(shí)力再獲認(rèn)可:2篇論文參展國際語音頂會INTERSPEECH 2022

文章出處:【微信號:云知聲,微信公眾號:云知聲】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    與嘉會醫(yī)療達(dá)成戰(zhàn)略合作

    2月5日下午,國內(nèi)人工智能技術(shù)與服務(wù)領(lǐng)軍企業(yè)智能科技股份有限公司(以下簡稱“
    的頭像 發(fā)表于 02-06 09:05 ?1004次閱讀

    后摩智能六論文入選四大國際

    2025年以來,后摩智能在多項(xiàng)前沿研究領(lǐng)域取得突破性進(jìn)展,近期在NeurIPS、ICCV、AAAI、ACMMM四大國際會上有 6 論文入選。致力于大模型的推理優(yōu)化、微調(diào)、部署等關(guān)鍵
    的頭像 發(fā)表于 11-24 16:42 ?1231次閱讀
    后摩智能六<b class='flag-5'>篇</b><b class='flag-5'>論文</b>入選四大<b class='flag-5'>國際</b><b class='flag-5'>頂</b><b class='flag-5'>會</b>

    理想汽車12論文入選全球五大AI

    2025年三季度以來,理想汽車基座模型團(tuán)隊(duì)在國際頂級AI學(xué)術(shù)會議上取得重大突破,共有12高質(zhì)量研究論文入選AAAI、NeurIPS、EMNLP、ACM MM、ICCV五大
    的頭像 發(fā)表于 11-21 14:44 ?751次閱讀
    理想汽車12<b class='flag-5'>篇</b><b class='flag-5'>論文</b>入選全球五大AI<b class='flag-5'>頂</b><b class='flag-5'>會</b>

    論文入選自然語言處理EMNLP 2025

    近日,自然語言處理(NLP)領(lǐng)域國際權(quán)威會議 ——2025 年計(jì)算語言學(xué)與自然語言處理國際會議(EMNLP 2025)公布論文錄用結(jié)果,
    的頭像 發(fā)表于 11-10 17:30 ?798次閱讀
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b><b class='flag-5'>論文</b>入選自然語言處理<b class='flag-5'>頂</b><b class='flag-5'>會</b>EMNLP 2025

    三項(xiàng)技術(shù)成果達(dá)到國際領(lǐng)先水平

    2025年10月28日,由中國人工智能學(xué)會組織的“多模態(tài)數(shù)字專家關(guān)鍵技術(shù)及產(chǎn)業(yè)應(yīng)用”科技成果鑒定會在北京舉行。經(jīng)專家委員嚴(yán)格評審,研發(fā)的“多模態(tài)醫(yī)療垂類大模型”“芯上端側(cè)小模型
    的頭像 發(fā)表于 11-04 10:26 ?770次閱讀

    與申能達(dá)簽署戰(zhàn)略合作協(xié)議

    日前,智能科技股份有限公司(以下簡稱“”)股票代碼:09678.HK)與廣西申能達(dá)智
    的頭像 發(fā)表于 10-11 09:12 ?685次閱讀

    多項(xiàng)業(yè)務(wù)營收大漲

    依托山海大模型,不斷開拓陣地,開發(fā)了面向東盟等海外市場和國內(nèi)方言市場的語音大模型,模型顯著提升了在多語種、多方言環(huán)境下的語音識別、語義
    的頭像 發(fā)表于 09-10 15:44 ?660次閱讀

    攜手TCL空調(diào)煥新智能家電體驗(yàn)

    “空調(diào)開24度,新風(fēng)打開”——剛打完籃球的小濤對著客廳遠(yuǎn)處的TCL空調(diào)發(fā)出指令,而空調(diào)無需聯(lián)網(wǎng)仍精準(zhǔn)執(zhí)行操作。這一離線狀態(tài)下的智能響應(yīng)場景,正是TCL空調(diào)與聯(lián)手研發(fā)的“基于端協(xié)
    的頭像 發(fā)表于 08-25 13:53 ?1192次閱讀

    與廣西壯族自治區(qū)衛(wèi)生健康委員達(dá)成戰(zhàn)略合作

    近日,智能科技股份有限公司(以下簡稱“”,09678.HK)與廣西壯族自治區(qū)衛(wèi)生健康
    的頭像 發(fā)表于 07-11 18:20 ?1253次閱讀

    在港交所成功上市

    近日,智能科技股份有限公司(以下簡稱“”)于香港聯(lián)合交易所主板掛牌上市,股份代號:0
    的頭像 發(fā)表于 07-03 17:41 ?1049次閱讀

    AGI龍頭企業(yè)港股上市,市值達(dá)147億港元

    為147.44億港元。 ? 圖:創(chuàng)始人董事長CEO黃偉博士在現(xiàn)場致辭表示:從今天起,我們將以香港為支點(diǎn),將中國AGI產(chǎn)品帶向全世界——用更敏捷的創(chuàng)新、更好的商業(yè)化和更開放的心胸,讓人類智慧與機(jī)器智能共振全球! ?
    的頭像 發(fā)表于 06-30 11:44 ?3372次閱讀
    AGI龍頭企業(yè)<b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b>港股上市,市值達(dá)147億港元

    與商湯科技達(dá)成戰(zhàn)略合作

    近日,智能科技股份有限公司(以下簡稱“”)與上海商湯智能科技有限公司(以下簡稱“商湯
    的頭像 發(fā)表于 06-20 14:52 ?980次閱讀

    攜手南寧軌道打造智慧生活新范本

    報(bào)事報(bào)修系統(tǒng)基于獸牙智能體平臺,定制開發(fā)了專屬智能體。系統(tǒng)全面覆蓋公共報(bào)修、家政服務(wù)、知識問答、投訴建議四大應(yīng)用場景,真正實(shí)現(xiàn)了“語音下單—自動派單—實(shí)時反饋”的全流程閉環(huán)服務(wù)。
    的頭像 發(fā)表于 06-09 14:48 ?1117次閱讀

    后摩智能四論文入選三大國際

    2025 年上半年,繼年初被 AAAI、ICLR、DAC 三大國際會收錄 5 論文后,后摩智能近期又有 4
    的頭像 發(fā)表于 05-29 15:37 ?1321次閱讀

    論文入選自然語言處理ACL 2025

    結(jié)果正式公布。在此次國際學(xué)術(shù)盛會中表現(xiàn)卓越,共有4論文被接收,其中包括
    的頭像 發(fā)表于 05-26 14:15 ?1306次閱讀
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b>四<b class='flag-5'>篇</b><b class='flag-5'>論文</b>入選自然語言處理<b class='flag-5'>頂</b><b class='flag-5'>會</b>ACL 2025