chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

研究人員已經(jīng)開發(fā)出一種能夠檢測“無聲語音”的AI模型

倩倩 ? 來源:文財網(wǎng) ? 作者:文財網(wǎng) ? 2020-12-17 10:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

加州大學(xué)伯克利分校的研究人員已經(jīng)開發(fā)出一種能夠檢測“無聲語音”的AI模型。該模型基于數(shù)字語音預(yù)測單詞并生成合成語音。肌電圖(EMG)的電極位于臉部和喉嚨,用于檢測無聲語音。

研究人員斷言,該模型可以為無法發(fā)出可聽語音的人們啟用許多應(yīng)用程序,并可以幫助AI工具和其他響應(yīng)語音命令的設(shè)備進(jìn)行語音檢測。

該小組指出,以數(shù)字方式為無聲語音發(fā)聲具有廣泛的應(yīng)用。例如,它可以生成類似于藍(lán)牙耳機(jī)的工具,該工具可以使個人繼續(xù)通話,而不會打擾周圍的人。當(dāng)環(huán)境聲音太大而無法捕獲可聽見的語音或必須保持安靜時,這種設(shè)備將非常有用。

口頭閱讀AI是可以從靜音語音中捕獲單詞的AI的另一個示例。它可以為監(jiān)視設(shè)備供電,并支持聾人的用例。

研究人員使用了一種方法,其中將所需語句的音頻輸出目標(biāo)從發(fā)聲錄音轉(zhuǎn)換為無聲錄音。然后,使用WaveNet解碼器生成音頻語音預(yù)測。

通過比較發(fā)聲的EMG數(shù)據(jù)和基線訓(xùn)練的數(shù)據(jù),發(fā)現(xiàn)發(fā)聲的EMG方法在從書中轉(zhuǎn)錄句子時,單詞錯誤率降低了64%至4%,而基線降低了95%。研究人員開源了約20小時的面部EMG數(shù)據(jù)集,以鼓勵對該領(lǐng)域進(jìn)行進(jìn)一步研究。

在其他工作中,中國的研究人員建立了諷刺檢測模型,該模型在多模式Twitter數(shù)據(jù)集上提供SOTA性能。Masakhane開放源代碼非洲語言翻譯項目的成員已發(fā)布了 有關(guān)低資源機(jī)器翻譯的 案例研究。

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 解碼器
    +關(guān)注

    關(guān)注

    9

    文章

    1176

    瀏覽量

    41991
  • 藍(lán)牙耳機(jī)
    +關(guān)注

    關(guān)注

    20

    文章

    5675

    瀏覽量

    61759
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35164

    瀏覽量

    279998
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    無刷直流電機(jī)雙閉環(huán)串級控制系統(tǒng)仿真研究

    Madlab進(jìn)行BLDC建模仿真的方法,并且也提出了很多的建模仿真方案。例如有研究人員提出采用節(jié)點(diǎn)電流法對電機(jī)控制系統(tǒng)進(jìn)行分析,通過列寫m函數(shù),建立BLDC控制系統(tǒng)真模型,這種方法實質(zhì)上是一種整體建模
    發(fā)表于 07-07 18:36

    最新人工智能硬件培訓(xùn)AI基礎(chǔ)入門學(xué)習(xí)課程參考2025版(離線AI語音視覺識別篇)

    端側(cè)離線 AI 智能硬件作為 AI 技術(shù)的重要載體之,憑借其無需依賴網(wǎng)絡(luò)即可實現(xiàn)智能功能的特性,在些網(wǎng)絡(luò)條件受限或?qū)?shù)據(jù)隱私有較高要求的場景中,發(fā)揮著不可或缺的作用。本章基于CSK
    發(fā)表于 07-04 11:14

    芯知識|語音芯片“無聲之謎”:當(dāng)DACL波形正常,功放開啟卻無聲音時……

    信號“通道沖突”這關(guān)鍵陷阱。、無聲故障的典型表現(xiàn)與診斷盲點(diǎn)“正?!钡谋硐螅汗こ處熡檬静ㄆ?b class='flag-5'>檢測語音芯片(如廣州唯創(chuàng)電子某型號)的關(guān)鍵引腳:
    的頭像 發(fā)表于 06-13 08:53 ?184次閱讀
    芯知識|<b class='flag-5'>語音</b>芯片“<b class='flag-5'>無聲</b>之謎”:當(dāng)DACL波形正常,功放開啟卻<b class='flag-5'>無聲</b>音時……

    研究人員開發(fā)出基于NVIDIA技術(shù)的AI模型用于檢測瘧疾

    瘧疾曾度在委內(nèi)瑞拉銷聲匿跡,但如今正卷土重來。研究人員已經(jīng)訓(xùn)練出模型來幫助檢測這種傳染病。
    的頭像 發(fā)表于 04-25 09:58 ?403次閱讀

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    基石。 Neuron Studio打造全流程站式開發(fā)體驗,為AI應(yīng)用開發(fā)按下加速鍵 AI 應(yīng)用的開發(fā)
    發(fā)表于 04-13 19:52

    AI Agent 應(yīng)用與項目實戰(zhàn)》----- 學(xué)習(xí)如何開發(fā)視頻應(yīng)用

    再次感謝發(fā)燒友提供的閱讀體驗活動。本期跟隨《AI Agent 應(yīng)用與項目實戰(zhàn)》這本書學(xué)習(xí)如何構(gòu)建開發(fā)個視頻應(yīng)用。AI Agent是一種智能
    發(fā)表于 03-05 19:52

    NVIDIA助力初創(chuàng)公司BioTuring發(fā)布新型AI模型

    癌癥研究人員公布了一種能夠提供細(xì)胞級癌細(xì)胞映射圖和可視化圖像的新型 AI 模型??茖W(xué)家希望這能揭示某些細(xì)胞間的關(guān)系以及引發(fā)癌細(xì)胞生長的誘因。
    的頭像 發(fā)表于 02-14 10:08 ?335次閱讀

    Qwen大模型助力開發(fā)低成本AI推理方案

    阿里巴巴的開源Qwen2.5模型近期在AI領(lǐng)域引發(fā)了廣泛關(guān)注。這模型的推出,為斯坦福大學(xué)與伯克利大學(xué)的研究人員提供了強(qiáng)大的技術(shù)支持,使他
    的頭像 發(fā)表于 02-12 09:19 ?653次閱讀

    一種高靈敏的化學(xué)檢測系統(tǒng)

    近日,美國加州大學(xué)伯克利分校、勞倫斯伯克利國家實驗室和Adamas Nanotechnologies公司等機(jī)構(gòu)的研究人員將量子傳感與液滴微流控技術(shù)相結(jié)合,開發(fā)出一種高靈敏的化學(xué)檢測
    的頭像 發(fā)表于 01-02 11:35 ?413次閱讀
    <b class='flag-5'>一種</b>高靈敏的化學(xué)<b class='flag-5'>檢測</b>系統(tǒng)

    AI模型部署邊緣設(shè)備的奇妙之旅:目標(biāo)檢測模型

    的是百度的Picodet模型,它是一種基于深度卷積網(wǎng)絡(luò)(DNN)的輕量級目標(biāo)檢測模型,具有非常高的檢測精度,可以在低算力設(shè)備進(jìn)行實時的端到端
    發(fā)表于 12-19 14:33

    研究人員利用激光束開創(chuàng)量子計算新局面

    演示設(shè)備 威特沃特斯蘭德大學(xué)(Wits)的物理學(xué)家利用激光束和日常顯示技術(shù)開發(fā)出一種創(chuàng)新的計算系統(tǒng),標(biāo)志著在尋求更強(qiáng)大的量子計算解決方案方面取得了重大飛躍。 該大學(xué)結(jié)構(gòu)光實驗室的研究人員取得的這
    的頭像 發(fā)表于 12-18 06:24 ?374次閱讀
    <b class='flag-5'>研究人員</b>利用激光束開創(chuàng)量子計算新局面

    AMD發(fā)布10億參數(shù)開源AI模型OLMo

    AMD公司近日宣布了項重大進(jìn)展,推出了首個完全開放的10億參數(shù)語言模型系列——AMD OLMo。這舉措為開發(fā)者和研究人員提供了強(qiáng)大的
    的頭像 發(fā)表于 11-12 18:08 ?787次閱讀

    AI模型的最新研究進(jìn)展

    AI模型的最新研究進(jìn)展體現(xiàn)在多個方面,以下是對其最新進(jìn)展的介紹: 、技術(shù)創(chuàng)新與突破 生成式AI技術(shù)的爆發(fā) : 生成式
    的頭像 發(fā)表于 10-23 15:19 ?1523次閱讀

    BitEnergy AI公司開發(fā)出一種AI處理方法

    BitEnergy AI公司,家專注于人工智能(AI)推理技術(shù)的企業(yè),其工程師團(tuán)隊創(chuàng)新性地開發(fā)一種名為線性復(fù)雜度乘法(L-Mul)的
    的頭像 發(fā)表于 10-22 15:15 ?839次閱讀

    AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得

    偏見、倫理道德等問題。此外,如何更好地將AI與科學(xué)研究人員的傳統(tǒng)工作模式相融合,也是個亟待解決的問題。未來,隨著技術(shù)的不斷進(jìn)步和應(yīng)用場景的拓展,AI for Science有望在更多
    發(fā)表于 10-14 09:16