chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

智能語(yǔ)音語(yǔ)義在產(chǎn)業(yè)化方面有哪些應(yīng)用

機(jī)器人創(chuàng)新生態(tài) ? 來(lái)源:未知 ? 作者:工程師郭婷 ? 2018-09-04 14:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

智能語(yǔ)音發(fā)展如火如荼

根據(jù)《2018中國(guó)智能語(yǔ)音行業(yè)前景研究報(bào)告》,2017年中國(guó)的智能語(yǔ)音市場(chǎng)規(guī)模已經(jīng)達(dá)到了105.71億元,比2016年增長(zhǎng)了70%,而2018年這個(gè)規(guī)模預(yù)計(jì)將繼續(xù)擴(kuò)大三分之一,達(dá)到159.7億元。

國(guó)內(nèi)的行業(yè)規(guī)模越來(lái)越大,但從技術(shù)角度看,目前的智能語(yǔ)音發(fā)展到了什么階段呢?我們先從頭開(kāi)始說(shuō)。

上世紀(jì)50年代到60年代,語(yǔ)音識(shí)別研究著眼于單個(gè)字詞到連續(xù)語(yǔ)音的識(shí)別,當(dāng)時(shí)最大的困境是對(duì)相關(guān)數(shù)據(jù)的計(jì)算能力的低下,這直接導(dǎo)致該時(shí)期研究進(jìn)展極其緩慢。到了70年代,計(jì)算機(jī)性能大幅提升,之前的問(wèn)題便不復(fù)存在,并且隨著計(jì)算機(jī)軟硬件技術(shù)的高速發(fā)展,該研究已不再受困于計(jì)算能力,人們便開(kāi)始將研究重點(diǎn)放在數(shù)據(jù)算法的優(yōu)化提升上,并將這一方向保持至今。

簡(jiǎn)單來(lái)講,這個(gè)方向的問(wèn)題解決方案是基于一個(gè)框架,通過(guò)對(duì)框架內(nèi)的各部分進(jìn)行改進(jìn),最終向著識(shí)別的極限正確率邁進(jìn)。各部分中,聲學(xué)模型和語(yǔ)言模型的構(gòu)建,則是整個(gè)方案中的研究焦點(diǎn)。

80年代末李開(kāi)復(fù)將隱馬爾科夫模型與高斯混合模型(GMM)相結(jié)合進(jìn)行語(yǔ)音識(shí)別建模,開(kāi)發(fā)出世界上第一個(gè)“非特定人連續(xù)語(yǔ)音識(shí)別系統(tǒng)”,即SPHINX系統(tǒng)。隨后,主流的GMM-HMM技術(shù)框架的發(fā)展日益穩(wěn)定,但語(yǔ)音識(shí)別效果難以轉(zhuǎn)向應(yīng)用化的局面長(zhǎng)時(shí)期沒(méi)有被打破,這意味著語(yǔ)音識(shí)別技術(shù)又遇到了瓶頸。

轉(zhuǎn)機(jī)出現(xiàn)在2006年。這一年,深度學(xué)習(xí)的概念被辛頓提出,深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network,DNN)研究因此而復(fù)蘇。2009年,辛頓和他的學(xué)生將深度神經(jīng)網(wǎng)絡(luò)應(yīng)用于語(yǔ)音的聲學(xué)建模上并獲得成功。到了2010年前后,微軟研究院的俞棟、鄧力等人將深度學(xué)習(xí)在圖像領(lǐng)域的突破移植到語(yǔ)音識(shí)別領(lǐng)域,使識(shí)別錯(cuò)誤率降低了20%以上。從此,基于GMM-HMM的語(yǔ)音識(shí)別框架被打破,人們開(kāi)始轉(zhuǎn)向基于DNN-HMM的語(yǔ)音識(shí)別模型的研究。

從2011年到2018年,以深度神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的語(yǔ)音識(shí)別建模技術(shù)迅速發(fā)展,語(yǔ)音識(shí)別乃至語(yǔ)音交互行業(yè)呈現(xiàn)出這樣一個(gè)現(xiàn)象:全世界范圍內(nèi)的企業(yè)的建模技術(shù)萬(wàn)變不離“深度神經(jīng)網(wǎng)絡(luò)”這一宗,雖大同小異但又各顯神通。

技術(shù)篇:語(yǔ)音識(shí)別和NLP技術(shù)仍不成熟

智能語(yǔ)音語(yǔ)義包含語(yǔ)音合成、語(yǔ)音識(shí)別和自然語(yǔ)言處理(NLP)三項(xiàng)主要技術(shù)。

語(yǔ)音合成技術(shù)發(fā)展最早,應(yīng)用已較為普遍,除了合成音仍偏機(jī)械之外,基本不存在太大技術(shù)問(wèn)題;語(yǔ)音識(shí)別在2012年卷積神經(jīng)網(wǎng)絡(luò)(CNN)應(yīng)用之后,準(zhǔn)確率大幅提升,已經(jīng)在C端、B端得到了廣泛應(yīng)用,但效果和體驗(yàn)還不夠理想;NLP技術(shù)雖然在搜索引擎中早有應(yīng)用,但在人機(jī)交互領(lǐng)域仍屬于淺層處理。

語(yǔ)音識(shí)別“魯棒性“問(wèn)題顯著

在生物學(xué)中,有個(gè)術(shù)語(yǔ)叫做“魯棒性”,是指系統(tǒng)在擾動(dòng)或不確定的情況下,仍能保持它的特征行為。這一問(wèn)題在語(yǔ)音識(shí)別領(lǐng)域也存在。

語(yǔ)音識(shí)別整個(gè)過(guò)程包含語(yǔ)音信號(hào)處理、靜音切除、聲學(xué)特征提取、模式匹配等多個(gè)環(huán)節(jié)。由于語(yǔ)音信號(hào)的多樣性和復(fù)雜性,系統(tǒng)只能在一定限制條件下才能獲得滿意效果。在真實(shí)使用場(chǎng)景中,考慮到遠(yuǎn)場(chǎng)、方言、噪音、斷句等問(wèn)題,準(zhǔn)確率會(huì)大打折扣。目前業(yè)內(nèi)普遍宣稱的97%識(shí)別準(zhǔn)確率,更多的是人工測(cè)評(píng)結(jié)果,只在安靜室內(nèi)的進(jìn)場(chǎng)識(shí)別中才能實(shí)現(xiàn)。

要解決語(yǔ)音識(shí)別魯棒性問(wèn)題,需要在技術(shù)和產(chǎn)品兩方面進(jìn)行優(yōu)化。一方面,在語(yǔ)音增強(qiáng)、麥克風(fēng)陣列以及說(shuō)話人分離等多項(xiàng)技術(shù)領(lǐng)域持續(xù)投入,并結(jié)合后端語(yǔ)義,促進(jìn)對(duì)上下文的理解,從而提升識(shí)別效果;另一方面,需要從產(chǎn)品設(shè)計(jì)上進(jìn)行優(yōu)化,比如通過(guò)進(jìn)一步交互,使語(yǔ)音識(shí)別變得更為準(zhǔn)確。

語(yǔ)義分析仍是淺層處理

NLP技術(shù)大致包含三個(gè)層面:詞法分析、句法分析、語(yǔ)義分析,三者之間既遞進(jìn)又相互包含。

詞義消歧是NLP技術(shù)的最大瓶頸。機(jī)器在切詞、標(biāo)注詞性、并識(shí)別完后,需要對(duì)各個(gè)詞語(yǔ)進(jìn)行理解。由于語(yǔ)言中往往一詞多義,人在理解時(shí)會(huì)基于已有知識(shí)儲(chǔ)備和上下文環(huán)境,但機(jī)器很難做到。雖然系統(tǒng)會(huì)對(duì)句子做句法分析,可以在一定程度上幫助機(jī)器理解詞義和語(yǔ)義,但實(shí)際情況并不理想。

目前,機(jī)器對(duì)句子的理解還只能做到語(yǔ)義角色標(biāo)注層面,即標(biāo)出句中的句子成分和主被動(dòng)關(guān)系等,它屬于比較成熟的淺層語(yǔ)義分析技術(shù)。未來(lái)要讓機(jī)器更好地理解人類語(yǔ)言,并實(shí)現(xiàn)自然交互,還是需要依賴深度學(xué)習(xí)技術(shù),通過(guò)大規(guī)模的數(shù)據(jù)訓(xùn)練,讓機(jī)器不斷學(xué)習(xí)。當(dāng)然,在實(shí)際應(yīng)用領(lǐng)域中,也可以通過(guò)產(chǎn)品設(shè)計(jì)來(lái)減少較為模糊的問(wèn)答內(nèi)容,以提升用戶體驗(yàn)。

由于人工智能技術(shù)對(duì)數(shù)據(jù)依賴性極高,因此,這一領(lǐng)域的技術(shù)進(jìn)步和產(chǎn)業(yè)化推進(jìn)是一種協(xié)同關(guān)系——通過(guò)工程化的方法提升技術(shù)效果和體驗(yàn),從而促進(jìn)產(chǎn)業(yè)化應(yīng)用,再根據(jù)實(shí)際應(yīng)用中的數(shù)據(jù)和反饋,反過(guò)來(lái)推動(dòng)技術(shù)實(shí)現(xiàn)突破。那么,智能語(yǔ)音語(yǔ)義在產(chǎn)業(yè)化方面都有哪些應(yīng)用領(lǐng)域,又存在哪些問(wèn)題?

應(yīng)用篇:C端提升體驗(yàn),B端提升效率

以問(wèn)答和聊天為服務(wù)形式,智能語(yǔ)音語(yǔ)義在多個(gè)使用場(chǎng)景和行業(yè)領(lǐng)域都有廣泛應(yīng)用,我們可以簡(jiǎn)單從C端和B端兩個(gè)方向分別來(lái)看。

C端應(yīng)用方面,主要用于移動(dòng)設(shè)備、汽車、家居三大場(chǎng)景,用來(lái)變革原有人機(jī)交互方式;B端則針對(duì)垂直行業(yè)需求,提升人工效率,比如幫助醫(yī)生做電子病歷錄入,或代替部分人力工作,比如回答大部分簡(jiǎn)單重復(fù)的客服問(wèn)題。由于兩大領(lǐng)域解決的問(wèn)題不同,因此遇到的挑戰(zhàn)也各不相同。

特別地,在智能機(jī)器人的應(yīng)用方面,目前的機(jī)器人與用戶一般都會(huì)采用相互問(wèn)答的小型對(duì)話形式進(jìn)行交流。為實(shí)現(xiàn)上方便,問(wèn)答對(duì)話的領(lǐng)域?qū)⒈贿M(jìn)行合理的限制。

除迎賓和問(wèn)候語(yǔ)外,一般設(shè)計(jì)為4個(gè)問(wèn)題域:有關(guān)時(shí)間、日期和星期的問(wèn)答,有關(guān)全世界各大城市所在時(shí)區(qū)和當(dāng)?shù)貢r(shí)間的問(wèn)答,100以內(nèi)的數(shù)學(xué)四則運(yùn)算題目的問(wèn)答,沒(méi)有關(guān)系機(jī)器人的身世、本領(lǐng)等自身情況的問(wèn)答。對(duì)于每個(gè)限定的問(wèn)題域,相應(yīng)詞匯表的大小是有限的。在限定領(lǐng)域、有限詞匯的條件下,機(jī)器人基本可以與觀眾進(jìn)行自由問(wèn)答,并可以在不同的問(wèn)題與之間相互切換。系統(tǒng)工作流程圖如下:

智能語(yǔ)音語(yǔ)義在產(chǎn)業(yè)化方面有哪些應(yīng)用

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    30665

    瀏覽量

    220041
  • 語(yǔ)音識(shí)別
    +關(guān)注

    關(guān)注

    39

    文章

    1804

    瀏覽量

    115639
  • 智能語(yǔ)音
    +關(guān)注

    關(guān)注

    11

    文章

    823

    瀏覽量

    50088

原文標(biāo)題:智能語(yǔ)音主題月開(kāi)啟,DNN時(shí)代語(yǔ)音技術(shù)的突破口在哪?

文章出處:【微信號(hào):robotplaces,微信公眾號(hào):機(jī)器人創(chuàng)新生態(tài)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    請(qǐng)問(wèn)WWDT和IWDT保護(hù)系統(tǒng)方面有哪些不同?

    WWDT和IWDT保護(hù)系統(tǒng)方面有哪些不同?
    發(fā)表于 12-10 06:43

    位移傳感器工控自動(dòng)方面有哪些具體的應(yīng)用?

    位移傳感器工控自動(dòng)方面有著廣泛的應(yīng)用,以下是一些具體的應(yīng)用場(chǎng)景: 一、機(jī)械加工與數(shù)控機(jī)床 機(jī)械加工和數(shù)控機(jī)床領(lǐng)域,位移傳感器用于精確控制機(jī)械部件的位置和運(yùn)動(dòng)軌跡。例如,在數(shù)控機(jī)床
    的頭像 發(fā)表于 10-29 18:26 ?557次閱讀

    加氫站和電力系統(tǒng),誰(shuí)是AEM產(chǎn)業(yè)化破局的關(guān)鍵?

    AEM(陰離子交換膜)電解水制氫技術(shù)目前正處于商用的關(guān)鍵階段,全球氫能市場(chǎng)的波動(dòng)對(duì)于新技術(shù)的影響顯而易見(jiàn),但經(jīng)過(guò)早期的商用實(shí)踐,AEM制氫技術(shù)也眾多的市場(chǎng)方向中,找到了突破口。 加氫站與電力儲(chǔ)能,成為AEM規(guī)模應(yīng)用適配度較高的場(chǎng)景,二者相較之下,誰(shuí)是AEM
    的頭像 發(fā)表于 09-25 17:21 ?581次閱讀
    加氫站和電力系統(tǒng),誰(shuí)是AEM<b class='flag-5'>產(chǎn)業(yè)化</b>破局的關(guān)鍵?

    2025世界機(jī)器人大會(huì)亮點(diǎn):ADI探討具身智能產(chǎn)業(yè)化應(yīng)用技術(shù)挑戰(zhàn)

    芯片與解決方案的專業(yè)視角,分享了ADI如何為具身智能產(chǎn)業(yè)化進(jìn)程提供堅(jiān)實(shí)的底層支撐。 具身智能,這個(gè)承載著將AI賦予物理實(shí)體的宏大愿景,正站在從實(shí)驗(yàn)室突破走向產(chǎn)業(yè)規(guī)模
    的頭像 發(fā)表于 08-15 15:53 ?2383次閱讀
    2025世界機(jī)器人大會(huì)亮點(diǎn):ADI探討具身<b class='flag-5'>智能</b><b class='flag-5'>產(chǎn)業(yè)化</b>應(yīng)用技術(shù)挑戰(zhàn)

    旭派動(dòng)力斬獲“鈉電產(chǎn)業(yè)化先鋒獎(jiǎng)”:硬核實(shí)力領(lǐng)跑新賽道!

    近日,備受矚目的2025中國(guó)鈉電科技與產(chǎn)業(yè)發(fā)展大會(huì)上,浙江旭派動(dòng)力科技有限公司(以下簡(jiǎn)稱“旭派動(dòng)力”)憑借其鈉電池產(chǎn)業(yè)化領(lǐng)域的卓越貢獻(xiàn)與領(lǐng)先實(shí)踐,榮膺大會(huì)授予的“鈉電
    的頭像 發(fā)表于 08-11 14:14 ?841次閱讀
    旭派動(dòng)力斬獲“鈉電<b class='flag-5'>產(chǎn)業(yè)化</b>先鋒獎(jiǎng)”:硬核實(shí)力領(lǐng)跑新賽道!

    固態(tài)電池技術(shù)路線及產(chǎn)業(yè)化進(jìn)展

    固態(tài)電池技術(shù)路線及產(chǎn)業(yè)化進(jìn)展
    的頭像 發(fā)表于 08-01 06:36 ?946次閱讀
    固態(tài)電池技術(shù)路線及<b class='flag-5'>產(chǎn)業(yè)化</b>進(jìn)展

    無(wú)噴粉三維掃描高反光場(chǎng)景的產(chǎn)業(yè)化實(shí)踐:激光偏振技術(shù)如何重塑精密測(cè)量

    精密制造、文物保護(hù)等領(lǐng)域,高反光場(chǎng)景下的三維測(cè)量長(zhǎng)期面臨技術(shù)瓶頸。傳統(tǒng)噴粉測(cè)量雖能改善效果,但存在損傷物體、污染環(huán)境等弊端,難以滿足產(chǎn)業(yè)化需求。激光偏振技術(shù)的突破,推動(dòng)無(wú)噴粉三維掃描高反光場(chǎng)景
    的頭像 發(fā)表于 07-07 09:42 ?402次閱讀
    無(wú)噴粉三維掃描<b class='flag-5'>在</b>高反光場(chǎng)景的<b class='flag-5'>產(chǎn)業(yè)化</b>實(shí)踐:激光偏振技術(shù)如何重塑精密測(cè)量

    敏芯股份入選江蘇省國(guó)家專利產(chǎn)業(yè)化樣板企業(yè)培育庫(kù)

    近日,根據(jù)國(guó)家知識(shí)產(chǎn)權(quán)局、工業(yè)和信息部、中國(guó)人民銀行、金融監(jiān)管總局、中國(guó)證監(jiān)會(huì)聯(lián)合印發(fā)的《專利產(chǎn)業(yè)化促進(jìn)中小企業(yè)成長(zhǎng)計(jì)劃實(shí)施方案》(以下簡(jiǎn)稱“《實(shí)施方案》”),江蘇省知識(shí)產(chǎn)權(quán)局公布了全省進(jìn)入國(guó)家專利產(chǎn)業(yè)化樣板企業(yè)培育庫(kù)名單,敏
    的頭像 發(fā)表于 06-20 17:49 ?1079次閱讀

    智能語(yǔ)音交互方案客服領(lǐng)域的應(yīng)用

    在當(dāng)今數(shù)字浪潮中,客服領(lǐng)域正經(jīng)歷著前所未有的變革,智能語(yǔ)音交互方案憑借其高效、便捷的特性,成為推動(dòng)這一變革的核心力量。其中,語(yǔ)音識(shí)別模型優(yōu)化私部署方案與
    的頭像 發(fā)表于 04-11 14:35 ?660次閱讀

    格科GC7272榮獲第八屆“IC創(chuàng)新獎(jiǎng)”成果產(chǎn)業(yè)化獎(jiǎng)

    近日,中國(guó)集成電路創(chuàng)新聯(lián)盟正式公布第八屆“IC創(chuàng)新獎(jiǎng)”獲獎(jiǎng)名單。格科GalaxyCore自主研發(fā)的觸控顯示驅(qū)動(dòng)集成芯片(TDDI)GC7272憑借超1億顆出貨規(guī)模及自主技術(shù)產(chǎn)業(yè)化成果,榮膺“成果產(chǎn)業(yè)化獎(jiǎng)”。這一獎(jiǎng)項(xiàng)不僅是對(duì)格科技術(shù)創(chuàng)新的高度認(rèn)可,更是對(duì)其
    的頭像 發(fā)表于 03-25 16:55 ?901次閱讀

    東風(fēng)汽車一體壓鑄產(chǎn)業(yè)化項(xiàng)目進(jìn)入沖刺階段

    東風(fēng)汽車一體壓鑄產(chǎn)業(yè)化項(xiàng)目是東風(fēng)汽車新能源汽車領(lǐng)域關(guān)鍵制造技術(shù)項(xiàng)目,項(xiàng)目指揮部最新通報(bào)顯示,8月24日廠房將具備竣工驗(yàn)收條件,預(yù)計(jì)9月15日產(chǎn)線開(kāi)始聯(lián)調(diào),這一節(jié)點(diǎn)的確立,標(biāo)志著全球最大噸位一體壓鑄工廠正式進(jìn)入投產(chǎn)倒計(jì)時(shí)。
    的頭像 發(fā)表于 03-21 09:16 ?753次閱讀

    宇樹(shù)科技物聯(lián)網(wǎng)方面

    場(chǎng)景中,如智能家居、智能工廠、智慧城市等。例如,與中大力德等企業(yè)減速器供應(yīng)方面合作,保障機(jī)器人關(guān)節(jié)運(yùn)動(dòng)的準(zhǔn)確性和穩(wěn)定性;與科大訊飛等企業(yè)
    發(fā)表于 02-04 06:48

    FPGAAI方面有哪些應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,對(duì)計(jì)算性能的需求也日益增長(zhǎng)。FPGA(現(xiàn)場(chǎng)可編程門陣列)作為一種高性能、低功耗、可靈活編程的硬件平臺(tái),正逐漸 AI 領(lǐng)域嶄露頭角,展現(xiàn)出獨(dú)特的優(yōu)勢(shì),為 AI 應(yīng)用的落地
    的頭像 發(fā)表于 01-06 17:37 ?2217次閱讀

    解鎖個(gè)性語(yǔ)音交互新時(shí)代:九芯智能語(yǔ)音云平臺(tái),讓創(chuàng)意聲音觸手可及!

    九芯智能語(yǔ)音云平臺(tái)提供全面高效安全的智能語(yǔ)音服務(wù),支持自定義語(yǔ)音內(nèi)容,簡(jiǎn)化燒錄流程,依托AI技術(shù),助力各行業(yè)
    的頭像 發(fā)表于 01-02 16:51 ?1480次閱讀
    解鎖個(gè)性<b class='flag-5'>化</b><b class='flag-5'>語(yǔ)音</b>交互新時(shí)代:九芯<b class='flag-5'>智能</b><b class='flag-5'>語(yǔ)音</b>云平臺(tái),讓創(chuàng)意聲音觸手可及!

    基于W2605C語(yǔ)音識(shí)別合成芯片的智能語(yǔ)音交互鬧鐘方案-AI對(duì)話享受智能生活

    隨著科技的飛速發(fā)展,智能家居產(chǎn)品正逐步滲透到我們的日常生活中,其中智能鬧鐘作為時(shí)間管理的得力助手,也不斷進(jìn)化?;赪2605C語(yǔ)音識(shí)別與語(yǔ)音
    的頭像 發(fā)表于 12-31 11:54 ?1465次閱讀