chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

云知聲AGI技術(shù)實(shí)力在2023年再次獲得國際頂會(huì)認(rèn)可

云知聲 ? 來源:云知聲 ? 2023-09-07 10:27 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,國際性語音及語言科學(xué)技術(shù)領(lǐng)域盛會(huì)INTERSPEECH 2023在愛爾蘭都柏林舉行。云知聲聯(lián)合上海師范大學(xué)發(fā)表的4篇論文被大會(huì)成功收錄,成果覆蓋語言增強(qiáng)、語音識(shí)別、防攻擊聲紋等研究方向。這是繼ACM MM 2023后,云知聲AGI技術(shù)實(shí)力在2023年再次獲得國際頂會(huì)認(rèn)可。

INTERSPEECH在國際上享有極高盛譽(yù)并具有廣泛的學(xué)術(shù)影響力,是由國際語音通訊協(xié)會(huì)(ISCA)創(chuàng)辦的旗艦級(jí)國際會(huì)議,是國際性語音及語言科學(xué)技術(shù)領(lǐng)域的頂級(jí)會(huì)議之一,對(duì)參會(huì)企業(yè)和單位有著嚴(yán)苛的準(zhǔn)入門檻,歷屆INTERSPEECH會(huì)議都倍受全球各地語音研究領(lǐng)域人士的廣泛關(guān)注。

此次獲得國際頂會(huì)認(rèn)可,既是云知聲與上海師范大學(xué)通力合作、持續(xù)探索智能語音技術(shù)的結(jié)果,也離不開云知聲AGI技術(shù)架構(gòu)的有力支撐。

云知聲:通過通用人工智能(AGI)創(chuàng)建互聯(lián)直覺的世界

云知聲AI技術(shù)體系及U+X戰(zhàn)略

作為中國AGI技術(shù)產(chǎn)業(yè)化的先驅(qū)之一,云知聲于2016年打造Atlas人工智能基礎(chǔ)設(shè)施,并構(gòu)建公司云知大腦(UniBrain)技術(shù)中臺(tái),以山海(UniGPT)通用認(rèn)知大模型為核心,包括多模態(tài)感知與生成、知識(shí)圖譜、物聯(lián)平臺(tái)等智能組件,并通過領(lǐng)域增強(qiáng)能力,為云知聲智慧物聯(lián)、智慧醫(yī)療等業(yè)務(wù)提供高效的產(chǎn)品化支撐,推動(dòng)“U(云知大腦)+X(應(yīng)用場(chǎng)景)”戰(zhàn)略落實(shí),踐行公司“通過通用人工智能(AGI)創(chuàng)建互聯(lián)直覺的世界”的使命。

作為云知大腦(UniBrain)的重要組件,智能語音技術(shù)包含語音識(shí)別、聲紋識(shí)別、語音合成等,目前已廣泛應(yīng)用于家居、車載、客服等領(lǐng)域。以車載場(chǎng)景為例,在云知聲智能語音技術(shù)的加持下,可實(shí)現(xiàn)多音區(qū)識(shí)別、連續(xù)語音交互、個(gè)性化語音播報(bào)、所見即可說、模糊指令匹配等強(qiáng)大語音能力,為用戶帶來更智能更自然的交互體驗(yàn)。隨著云知聲智能語音技術(shù)的不斷發(fā)展,其在各個(gè)場(chǎng)景的落地應(yīng)用也將進(jìn)一步提速。此次論文收錄,充分印證了云知聲在智能語音領(lǐng)域的技術(shù)創(chuàng)新實(shí)力,同時(shí),也將進(jìn)一步夯實(shí)其AGI技術(shù)底座,加速千行百業(yè)的智慧化升級(jí)。

接下來,云知聲將繼續(xù)踐行“U+X”戰(zhàn)略,攜手上海師范大學(xué)等高校機(jī)構(gòu),共同加強(qiáng)AI基礎(chǔ)理論和關(guān)鍵技術(shù)的研發(fā),不斷拓展AGI應(yīng)用場(chǎng)景,為智慧物聯(lián)與智慧醫(yī)療兩大領(lǐng)域提供更廣泛、更深入的人工智能解決方案,致力實(shí)現(xiàn)以人工智能賦能千行百業(yè)的美好愿景。

以下為入選論文概覽:

研究方向:語音增強(qiáng)

目前主流時(shí)頻語音增強(qiáng)系統(tǒng)以復(fù)頻譜作為輸入,存在著訓(xùn)練工具不支持復(fù)數(shù),復(fù)數(shù)建模方式不易訓(xùn)練,以及基于掩蔽的方法理論上無法完全恢復(fù)出干凈語音的問題。為解決以上問題,本文提出了一種無需掩蔽的語音增強(qiáng)系統(tǒng)。該系統(tǒng)利用短時(shí)離散余弦變換(STDCT)作為特征,不僅與STFT同樣具備信息完備性,而且是一種實(shí)數(shù)特征。我們?cè)贛etaFomer基礎(chǔ)上,結(jié)合MobileNet block的輕量架構(gòu)以及NAFNet的設(shè)計(jì)理念構(gòu)建了全局局部模塊,整個(gè)網(wǎng)絡(luò)由此模塊堆疊而成。結(jié)果表明,相比其他網(wǎng)絡(luò),MFNet的性能達(dá)到了SOTA水平,且計(jì)算量具有優(yōu)勢(shì)。

1b353b40-4c9d-11ee-a25d-92fbcf53809c.png

研究方向:語音識(shí)別

Multi-pass Training and Cross-information Fusion for Low-resource End-to-end Accented Speech Recognition

低資源重口音語音識(shí)別是當(dāng)前ASR技術(shù)在實(shí)際應(yīng)用中面臨的重要挑戰(zhàn)之一。在這項(xiàng)研究中,我們提出了一個(gè)基于Conformer的架構(gòu),稱為Aformer,以利用大量非口音和有限口音訓(xùn)練數(shù)據(jù)的聲學(xué)信息。在Aformer中設(shè)計(jì)了一個(gè)普通編碼器和一個(gè)口音編碼器來提取互補(bǔ)的聲學(xué)信息。此外,我們使用多通道的方式訓(xùn)練Aformer,并研究了三種交叉信息融合方法,以有效地結(jié)合來自一般編碼器和口音編碼器的信息。結(jié)果表明,在六個(gè)域內(nèi)和域外口音測(cè)試集上,我們提出的方法優(yōu)于Conformer基線,詞/字錯(cuò)誤率相對(duì)減少了10.2%到24.5%。

1b7e7af8-4c9d-11ee-a25d-92fbcf53809c.png

研究方向:語音識(shí)別

Phonetic-assisted Multi-Target Units Modeling for Improving Conformer-Transducer ASR system

在端到端的自動(dòng)語音識(shí)別(ASR)中,開發(fā)有效的目標(biāo)建模單元是非常重要的,也是大家一直關(guān)注的問題。我們提出一種語音輔助的多目標(biāo)單元(PMU)建模方法,以漸進(jìn)式表征學(xué)習(xí)的方式增強(qiáng)Conformer-TransducerASR系統(tǒng)。具體來說,PMU首先使用語音輔助子詞建模(PASM)和字節(jié)對(duì)編碼(BPE)分別產(chǎn)生語音誘導(dǎo)和文本誘導(dǎo)的目標(biāo)單元;在此基礎(chǔ)上,我們提出了三種增強(qiáng)聲學(xué)編碼器的框架,包括基本PMU、paraCTC和paCTC,它們集成了不同層次的PASM和BPE單元,用于CTC和transducer多任務(wù)訓(xùn)練。在LibriSpeech和口音ASR測(cè)試集上的實(shí)驗(yàn)結(jié)果表明,與傳統(tǒng)的BPE相比,提出的PMU方法顯著降低了LibriSpeech clean、other和6個(gè)重音ASR測(cè)試集的WER,分別降低了12.7%、6.0%和7.7%。

1bb882ac-4c9d-11ee-a25d-92fbcf53809c.png

研究方向:防攻擊聲紋

Advanced RawNet2 with Attention-based Channel Masking for Synthetic Speech Detection

自動(dòng)揚(yáng)聲器驗(yàn)證系統(tǒng)通常很容易受到欺騙攻擊,特別是不可見的攻擊。由于語音合成和語音轉(zhuǎn)換算法的多樣性,如何提高合成語音檢測(cè)系統(tǒng)的泛化能力是一個(gè)具有挑戰(zhàn)性的問題。為了解決這個(gè)問題,我們提出了一種改進(jìn)的RawNet2,通過引入一個(gè)基于注意力的通道掩蔽模塊來改進(jìn)RawNet2,其中包括三個(gè)主要組成部分:SE、通道掩蔽和全局-局部特征聚合。在ASVspoof2019和ASVspoof 2021數(shù)據(jù)集上評(píng)估了該系統(tǒng)的有效性。其中,ARawNet2在ASVspoof 2019 LA任務(wù)上達(dá)到了4.61%,在ASVspoof 2021 LA和DF任務(wù)上的EER分別達(dá)到了8.36%和19.03%,比RawNet2基線分別降低了12.00%和14.97%。

1beb130c-4c9d-11ee-a25d-92fbcf53809c.png

1c1799ea-4c9d-11ee-a25d-92fbcf53809c.png

審核編輯:彭菁

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 語音識(shí)別
    +關(guān)注

    關(guān)注

    39

    文章

    1802

    瀏覽量

    115526
  • 人工智能
    +關(guān)注

    關(guān)注

    1813

    文章

    49708

    瀏覽量

    261239
  • Agi
    Agi
    +關(guān)注

    關(guān)注

    0

    文章

    95

    瀏覽量

    10738
  • 云知聲
    +關(guān)注

    關(guān)注

    0

    文章

    279

    瀏覽量

    9068

原文標(biāo)題:云知聲4篇論文入選國際頂會(huì)INTERSPEECH 2023

文章出處:【微信號(hào):云知聲,微信公眾號(hào):云知聲】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    榮膺2025浙江省服務(wù)業(yè)領(lǐng)軍企業(yè)

    近日,浙江省發(fā)展和改革委員會(huì)正式公示《2025浙江省服務(wù)業(yè)領(lǐng)軍企業(yè)名單》。經(jīng)過多輪嚴(yán)格評(píng)審,(杭州)智能科技有限公司(以下簡(jiǎn)稱 “
    的頭像 發(fā)表于 11-13 17:49 ?1137次閱讀

    論文入選自然語言處理會(huì)EMNLP 2025

    成果不僅是國際學(xué)術(shù)界對(duì)技術(shù)實(shí)力的高度認(rèn)可,更標(biāo)
    的頭像 發(fā)表于 11-10 17:30 ?472次閱讀
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b>論文入選自然語言處理<b class='flag-5'>頂</b><b class='flag-5'>會(huì)</b>EMNLP 2025

    入選國家知識(shí)產(chǎn)權(quán)示范企業(yè)創(chuàng)建推薦單位

    ”。這一榮譽(yù)標(biāo)志著人工智能領(lǐng)域的技術(shù)實(shí)力與知識(shí)產(chǎn)權(quán)建設(shè)成果
    的頭像 發(fā)表于 11-04 10:28 ?400次閱讀

    三項(xiàng)技術(shù)成果達(dá)到國際領(lǐng)先水平

    202510月28日,由中國人工智能學(xué)會(huì)組織的“多模態(tài)數(shù)字專家關(guān)鍵技術(shù)及產(chǎn)業(yè)應(yīng)用”科技成果鑒定會(huì)在北京舉行。經(jīng)專家委員會(huì)嚴(yán)格評(píng)審,
    的頭像 發(fā)表于 11-04 10:26 ?577次閱讀

    榮膺河南省2025首批高新技術(shù)企業(yè)認(rèn)定

    近日,(信陽)數(shù)字科技有限公司成功通過河南省2025第一批高新技術(shù)企業(yè)認(rèn)定。這一資質(zhì)的獲得
    的頭像 發(fā)表于 10-29 13:52 ?315次閱讀

    聯(lián)合行業(yè)伙伴推出多款智能硬件解決方案

    近日,智慧生活產(chǎn)品線迎來一系列新產(chǎn)品和解決方案升級(jí),大模型全面進(jìn)入產(chǎn)品線,讓AGI從“技術(shù)概念”切實(shí)走進(jìn)“日常好用”的智慧化生活。
    的頭像 發(fā)表于 10-29 13:47 ?687次閱讀

    斬獲財(cái)經(jīng)天下X未來商業(yè)品牌獎(jiǎng)

    技術(shù)如何重塑未來。活動(dòng)現(xiàn)場(chǎng)揭曉的「X未來」獎(jiǎng)項(xiàng)中,(股票代碼:09678.HK)憑借
    的頭像 發(fā)表于 10-11 09:13 ?411次閱讀

    加入華為昇騰萬里伙伴計(jì)劃

    近日,(09678.HK)正式加入華為昇騰萬里伙伴計(jì)劃,標(biāo)志著其大模型領(lǐng)域的技術(shù)實(shí)力與創(chuàng)
    的頭像 發(fā)表于 09-22 09:16 ?616次閱讀

    梁家恩受聘為廣西人工智能戰(zhàn)略咨詢專家委員會(huì)委員

    近日,聯(lián)合創(chuàng)始人&董事長&CTO梁家恩博士正式受聘為廣西人工智能戰(zhàn)略咨詢專家委員會(huì)委員。這一榮譽(yù)不僅是對(duì)他人工智能領(lǐng)域多年深耕所獲成
    的頭像 發(fā)表于 07-18 17:27 ?897次閱讀

    獸牙智能體平臺(tái)通過華為昇騰技術(shù)認(rèn)證

    近日,(09678.HK)自主研發(fā)的獸牙智能體平臺(tái)v1.0成功通過華為昇騰應(yīng)用開發(fā)技術(shù)認(rèn)證,獲得Ascend Native認(rèn)證證書及認(rèn)
    的頭像 發(fā)表于 07-11 18:20 ?1247次閱讀

    港交所成功上市

    近日,智能科技股份有限公司(以下簡(jiǎn)稱“”)于香港聯(lián)合交易所主板掛牌上市,股份代號(hào):0
    的頭像 發(fā)表于 07-03 17:41 ?880次閱讀

    AGI龍頭企業(yè)港股上市,市值達(dá)147億港元

    為147.44億港元。 ? 圖:創(chuàng)始人董事長CEO黃偉博士現(xiàn)場(chǎng)致辭表示:從今天起,我們將以香港為支點(diǎn),將中國AGI產(chǎn)品帶向全世界——
    的頭像 發(fā)表于 06-30 11:44 ?2546次閱讀
    <b class='flag-5'>AGI</b>龍頭企業(yè)<b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b>港股上市,市值達(dá)147億港元

    營收超9億!這家AI巨頭將靠AGI逆襲,醫(yī)療AI成新戰(zhàn)場(chǎng)

    ? 電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)3月底,再次向港交所遞交招股書。在這之前
    的頭像 發(fā)表于 04-07 08:31 ?2412次閱讀
    <b class='flag-5'>年</b>營收超9億!這家AI巨頭將靠<b class='flag-5'>AGI</b>逆襲,醫(yī)療AI成新戰(zhàn)場(chǎng)

    榮耀斬獲四項(xiàng)年度大獎(jiǎng)

    歲末年初,不僅是時(shí)間流轉(zhuǎn)的標(biāo)志,更是萬物更新、夢(mèng)想揚(yáng)帆的新篇章。在這個(gè)交織著希望與挑戰(zhàn)的關(guān)鍵時(shí)刻,憑借其人工智能領(lǐng)域的卓越成就和深厚技術(shù)
    的頭像 發(fā)表于 01-07 16:06 ?751次閱讀

    近期斬獲多項(xiàng)年度大獎(jiǎng)

    科技迅猛發(fā)展的當(dāng)下,人工智能(AI)已成為推動(dòng)各行業(yè)革新的核心動(dòng)力。,以其卓越的技術(shù)實(shí)力
    的頭像 發(fā)表于 12-24 10:26 ?790次閱讀