chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

人工智能閱讀的突破唇語(yǔ)

我快閉嘴 ? 來(lái)源: 智東西 ? 作者: 智東西 ? 2020-01-29 16:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

12月5日消息,據(jù)外媒報(bào)道,阿里巴巴浙江大學(xué)研究中心和史蒂文斯理工學(xué)院(Stevens Institute of Technology)的研究人員近日推出了一種提升AI閱讀唇語(yǔ)準(zhǔn)確率的方法——“Lip by Speech(LIBS)”。該方法利用視頻中的語(yǔ)音信息作為輔助線索,減少了AI對(duì)視頻中無(wú)關(guān)幀的關(guān)注,使其注意力更加集中。據(jù)研究人員稱,使用該方法的AI在兩個(gè)唇語(yǔ)閱讀基準(zhǔn)測(cè)試中,字符錯(cuò)誤率分別降低了7.66%和2.75%。

一、圖像語(yǔ)音相結(jié)合解讀唇語(yǔ)

▲面部圖像識(shí)別的過(guò)程示例

實(shí)際上,能夠從視頻中讀唇語(yǔ)的AI和機(jī)器學(xué)習(xí)算法并不是什么新鮮事物。早在2016年,谷歌和牛津大學(xué)的研究人員就詳細(xì)介紹了一種系統(tǒng),該系統(tǒng)可以以46.8%的精度注釋視頻素材,優(yōu)于專業(yè)讀唇語(yǔ)人員12.4%的精度。但是,即使是最先進(jìn)的系統(tǒng)也難以解決唇部運(yùn)動(dòng)的“一語(yǔ)多義”問(wèn)題,從而使唇語(yǔ)識(shí)別的準(zhǔn)確率一直無(wú)法超越語(yǔ)音識(shí)別

為了追求唇語(yǔ)閱讀性能更加強(qiáng)大的系統(tǒng),阿里巴巴浙江大學(xué)研究中心和史蒂文斯理工學(xué)院的研究人員設(shè)計(jì)了一種方法,稱為“Lip by Speech(LIBS)”。該方法利用從語(yǔ)音識(shí)別器中提取的特征信息作為補(bǔ)充線索。他們說(shuō),利用該方法的系統(tǒng)在兩個(gè)基準(zhǔn)測(cè)試中都達(dá)到了業(yè)界領(lǐng)先的準(zhǔn)確性,在字符錯(cuò)誤率方面分別降低了7.66%和2.75%。

LIBS和其他類似的解決方案可以幫助那些聽(tīng)障人士觀看缺少字幕的視頻。據(jù)估計(jì),全世界有4.66億人患有失能性聽(tīng)力障礙(disabling hearing loss),約占世界人口的5%。根據(jù)世界衛(wèi)生組織的數(shù)據(jù),到2050年,這一數(shù)字可能會(huì)超過(guò)9億。

二、LIBS方法是怎樣應(yīng)用的?

▲WAS與LIBS方法唇語(yǔ)解讀標(biāo)記范圍的對(duì)比

LIBS會(huì)以多種規(guī)模等級(jí),從有聲視頻中提取有用的音頻數(shù)據(jù),包括序列級(jí)(sequence level)、文本級(jí)(context level)和幀級(jí)(frame level)。然后,將這些提取的數(shù)據(jù)與視頻數(shù)據(jù)通過(guò)他們之間的對(duì)應(yīng)關(guān)系對(duì)齊,最后利用一種篩選(filtering)技術(shù)來(lái)優(yōu)化(refine)提取的數(shù)據(jù)。

LIBS的語(yǔ)音識(shí)別器和唇語(yǔ)閱讀器這兩部分均為一種“基于注意力的序列到序列的(attention-based sequence-to-sequence)”體系結(jié)構(gòu),這種體系結(jié)構(gòu)可將一段音頻或視頻序列的輸入信息轉(zhuǎn)化為帶有標(biāo)簽和注意價(jià)值(attention value)的輸出信息。

研究人員通過(guò)上述方法在LRS2數(shù)據(jù)集上對(duì)系統(tǒng)進(jìn)行訓(xùn)練,LRS2包含來(lái)自BBC的45,000多個(gè)口頭句子,同時(shí)也在CMLR上訓(xùn)練,CMLR是現(xiàn)有的最大中文普通話口語(yǔ)語(yǔ)料庫(kù),具有來(lái)自中國(guó)網(wǎng)絡(luò)電視臺(tái)的10萬(wàn)多個(gè)自然句子(包括3,000多個(gè)中文字符和20,000個(gè)詞組)。

三、“幀級(jí)知識(shí)提取”是關(guān)鍵

該團(tuán)隊(duì)指出,由于LRS2數(shù)據(jù)集中的某些句子過(guò)短,該系統(tǒng)難以在LRS2數(shù)據(jù)集上實(shí)現(xiàn)“合理的”結(jié)果。但是,一旦對(duì)最大長(zhǎng)度為16個(gè)單詞的句子進(jìn)行了預(yù)訓(xùn)練,解碼器就可以利用文本級(jí)的知識(shí),提高LRS2數(shù)據(jù)集中句子結(jié)尾部分的質(zhì)量。

研究人員在論文中寫道:“LIBS減少了對(duì)無(wú)關(guān)幀的關(guān)注”,“幀級(jí)知識(shí)的提取(frame-level knowledge distillation)進(jìn)一步提高了視頻幀特征的可分辨性,使注意力更加集中?!?/p>

結(jié)語(yǔ):AI唇語(yǔ)識(shí)別市場(chǎng)仍具有較高增長(zhǎng)潛力

目前AI唇語(yǔ)識(shí)別在基準(zhǔn)測(cè)試中的準(zhǔn)確率仍然在50%左右,現(xiàn)實(shí)應(yīng)用價(jià)值還有待于準(zhǔn)確率的進(jìn)一步提升。此次新提出的LIBS方法為這一領(lǐng)域的研究提供了更好的思路,一種視頻語(yǔ)音相結(jié)合的研究思路。金融身份識(shí)別、嘈雜環(huán)境下的語(yǔ)音識(shí)別輔助、聽(tīng)障人士的輔助交流等領(lǐng)域均為AI唇語(yǔ)識(shí)別的重要應(yīng)用場(chǎng)景。期待國(guó)內(nèi)外科技巨頭在該領(lǐng)域有更多新的突破。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1807

    文章

    49029

    瀏覽量

    249642
  • 阿里巴巴
    +關(guān)注

    關(guān)注

    7

    文章

    1638

    瀏覽量

    48247
  • 唇語(yǔ)識(shí)別
    +關(guān)注

    關(guān)注

    0

    文章

    4

    瀏覽量

    2068
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    人工智能是什么?

    ` 人工智能是什么?什么是人工智能人工智能是未來(lái)發(fā)展的必然趨勢(shì)嗎?以后人工智能技術(shù)真的能達(dá)到電影里機(jī)器人的智能水平嗎?如果技術(shù)成熟的那一天
    發(fā)表于 09-16 15:40

    百度總裁:百度在人工智能領(lǐng)域已有重大突破

      隨著阿法狗大戰(zhàn)李世石,人工智能引發(fā)越來(lái)越多的關(guān)注。百度總裁張亞勤28日表示,百度長(zhǎng)期堅(jiān)持技術(shù)創(chuàng)新,2015年研發(fā)投入超過(guò)100億元,目前在人工智能領(lǐng)域已有重大突破?! 垇喦谠谔旖蛳募具_(dá)沃斯論壇
    發(fā)表于 07-01 15:22

    百度人工智能大神離職,人工智能的出路在哪?

    `今天,吳恩達(dá)確認(rèn)離職百度的消息迅速在業(yè)界刷屏。吳恩達(dá)曾不止一次感慨,現(xiàn)在人工智能最大的問(wèn)題就是“機(jī)會(huì)太多,但人才太少”。AI,人工智能,該領(lǐng)域的研究包括機(jī)器人、語(yǔ)言識(shí)別、圖像識(shí)別、自然語(yǔ)言處理
    發(fā)表于 03-23 17:00

    人工智能就業(yè)前景

    據(jù)相關(guān)招聘機(jī)構(gòu)數(shù)據(jù)顯示,2018年AI領(lǐng)域仍然是大部分資深技術(shù)人才轉(zhuǎn)崗的首選目標(biāo),在人才最緊缺的前十大職位中,時(shí)下最火的大數(shù)據(jù)、人工智能、算法類崗位占據(jù)半壁江山。據(jù)調(diào)查指出,2017年技術(shù)研發(fā)類崗位
    發(fā)表于 03-29 15:46

    解讀人工智能的未來(lái)

    `已歷經(jīng)60多年的人工智能在物聯(lián)網(wǎng)以及大數(shù)據(jù)的推動(dòng)下,實(shí)現(xiàn)飛躍式的發(fā)展,并且迎來(lái)了第三個(gè)黃金周期。必優(yōu)傳感今天和大家解讀一下關(guān)于人工智能的未來(lái)。自從有了人工智能,引發(fā)了人類的各種“未來(lái)論”。有人說(shuō)
    發(fā)表于 11-14 10:43

    【2019人工智能大會(huì)】大咖齊聚,共同探討加速人工智能技術(shù)落地

    金額就突破了 1500 億元。2017 年,全球人工智能芯片市場(chǎng)規(guī)模是 44.7 億美元,2018 年達(dá)到 57 億美元,預(yù)計(jì) 2020 年有望突破百億大關(guān),而到 2025 年人工智能
    發(fā)表于 01-21 17:20

    人工智能醫(yī)生未來(lái)或上線,人工智能醫(yī)療市場(chǎng)規(guī)模持續(xù)增長(zhǎng)

      導(dǎo)讀:機(jī)構(gòu)預(yù)測(cè),中國(guó)醫(yī)療人工智能的市場(chǎng)需求已達(dá)數(shù)百億元。專家認(rèn)為,“人工智能醫(yī)生”的應(yīng)用,有利于緩解社會(huì)老齡化帶來(lái)的醫(yī)療資源供需失衡以及地域分配不均等問(wèn)題。那么,“人工智能醫(yī)生”何時(shí)能真正
    發(fā)表于 02-24 09:29

    人工智能:超越炒作

    開(kāi)車或飛行,您可以相信會(huì)涉及一些嚴(yán)重的AI功能。閱讀,說(shuō)話或翻譯語(yǔ)言,預(yù)測(cè)物體的質(zhì)量和速度,代表你購(gòu)買股票,識(shí)別面部或診斷乳腺癌,都是通過(guò)算法完成的人工智能特征?,F(xiàn)在,想象一下整個(gè)AI事物的連接世界
    發(fā)表于 05-29 10:46

    什么是基于云計(jì)算的人工智能服務(wù)?

    如今,采用人工智能的企業(yè)遇到了一個(gè)主要障礙,那就是在內(nèi)部開(kāi)發(fā)人工智能產(chǎn)品成本高昂,因此有了外包人工智能產(chǎn)品的需求。而對(duì)于從中小企業(yè)到預(yù)算受限的大型企業(yè)來(lái)說(shuō),通過(guò)云計(jì)算來(lái)采用人工智能的成
    發(fā)表于 09-11 11:51

    人工智能未來(lái)的突破點(diǎn)究竟在哪里?是電子硬件還是軟件呢?

    在給定的硅片上能裝多少個(gè)晶體管?人工智能未來(lái)的突破點(diǎn)究竟在哪里?是電子硬件還是軟件呢?
    發(fā)表于 06-17 06:13

    人工智能芯片是人工智能發(fā)展的

    人工智能芯片是人工智能發(fā)展的 | 特倫斯謝諾夫斯基責(zé)編 | 屠敏本文內(nèi)容經(jīng)授權(quán)摘自《深度學(xué)習(xí) 智能時(shí)代的核心驅(qū)動(dòng)力量》從AlphaGo的人機(jī)對(duì)戰(zhàn),到無(wú)人駕駛汽車的上路,再到AI合成主播上崗
    發(fā)表于 07-27 07:02

    物聯(lián)網(wǎng)人工智能是什么?

    一、人工智能介紹工作以后想要拿高薪的話,人工智能是你的不二之選,那么問(wèn)題來(lái)了,究竟什么是人工智能呢?又需要了解哪些才能去開(kāi)發(fā)人工智能產(chǎn)品呢?接下來(lái)小編帶領(lǐng)大家進(jìn)入
    發(fā)表于 09-09 14:12

    嵌入式與人工智能關(guān)系是什么

    嵌入式與人工智能關(guān)系_嵌入式人工智能的發(fā)展趨勢(shì)  所謂嵌入式人工智能,就是設(shè)備無(wú)須聯(lián)網(wǎng)通過(guò)云端數(shù)據(jù)中心進(jìn)行大規(guī)模計(jì)算去實(shí)現(xiàn)人工智能,而是在本地計(jì)算,在不聯(lián)網(wǎng)的情況下就可以做實(shí)時(shí)的環(huán)境感
    發(fā)表于 10-27 07:41

    《移動(dòng)終端人工智能技術(shù)與應(yīng)用開(kāi)發(fā)》人工智能的發(fā)展與AI技術(shù)的進(jìn)步

    人工智能的發(fā)展是隨著人類生活需要,產(chǎn)業(yè)需求不斷提升的,其中人工智能的發(fā)展很大程度上受到了計(jì)算機(jī)算力的影響,隨著數(shù)據(jù)處理量的增大,人工智能算法對(duì)算力的要求逐年增加,而且沒(méi)過(guò)兩年算力上升一倍,因此往往
    發(fā)表于 02-17 11:00

    谷歌人工智能小組DeepMind研發(fā)“讀”軟件 毫不遜色于人類

    谷歌(微博)人工智能部門DeepMind正與牛津大學(xué)研究人員合作,希望開(kāi)發(fā)出全球最先進(jìn)的“讀”軟件,可能比人類的“讀”能力還要出色。
    發(fā)表于 11-25 10:00 ?775次閱讀