chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

語(yǔ)音識(shí)別技術(shù)必定會(huì)滲透在人們生活的每個(gè)角落

Dbwd_Imgtec ? 來(lái)源:未知 ? 作者:李倩 ? 2018-04-20 14:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一、概述

作為最自然的人機(jī)交互方式 ——語(yǔ)音,正在改變?nèi)藗兊纳?,豐富多媒體技術(shù)的應(yīng)用。語(yǔ)音識(shí)別技術(shù)是語(yǔ)音信號(hào)處理的一個(gè)重要分支,也是近年來(lái)很火的一個(gè)研究領(lǐng)域。隨著科技的飛速發(fā)展,語(yǔ)音識(shí)別不僅在桌面PC和大型工作站得到了廣泛應(yīng)用,而且在嵌入式系統(tǒng)領(lǐng)域也占有一席之地,如智能家居、語(yǔ)音助手、車(chē)載語(yǔ)音識(shí)別系統(tǒng)等。相信在不久的將來(lái),語(yǔ)音識(shí)別技術(shù)必定會(huì)滲透在人們生活的每個(gè)角落。

二、語(yǔ)音識(shí)別系統(tǒng)的分類(lèi)

語(yǔ)音識(shí)別按照說(shuō)話(huà)人的說(shuō)話(huà)方式可以分為孤立詞(IsolatedWord)識(shí)別、連接詞(Connected Word)識(shí)別和連續(xù)語(yǔ)音(Continuous Speech)識(shí)別。孤立詞識(shí)別是指說(shuō)話(huà)人每次只說(shuō)一個(gè)詞或短語(yǔ),每個(gè)詞或短語(yǔ)在詞匯表中都算作一個(gè)詞條,一般用在語(yǔ)音電話(huà)撥號(hào)系統(tǒng)中;連接詞語(yǔ)音識(shí)別支持一個(gè)小的語(yǔ)法網(wǎng)絡(luò),其內(nèi)部形成一個(gè)狀態(tài)機(jī),可以實(shí)現(xiàn)簡(jiǎn)單的家用電器的控制,而復(fù)雜的連接詞語(yǔ)音識(shí)別系統(tǒng)可以用于電話(huà)語(yǔ)音查詢(xún)、航空訂票等系統(tǒng);連續(xù)語(yǔ)音識(shí)別是指對(duì)說(shuō)話(huà)人以日常自然的方式發(fā)音,通常特指用于語(yǔ)音錄入的聽(tīng)寫(xiě)機(jī)。

從識(shí)別對(duì)象的類(lèi)型來(lái)看,語(yǔ)音識(shí)別可以分為特定人(SpeakerDependent)語(yǔ)音識(shí)別和非特定人(Speaker Independent)語(yǔ)音識(shí)別。特定人是指只針對(duì)一個(gè)用戶(hù)的語(yǔ)音識(shí)別,非特定人則可用于不同的用戶(hù)。

從識(shí)別的詞匯量大小可以分為小詞匯量(詞數(shù)少于100)、中等詞匯量(詞數(shù)100~500)和大詞匯量(詞數(shù)多于500)。

非特定人大詞匯量連續(xù)語(yǔ)音識(shí)別是近幾年研究的重點(diǎn),也是研究的難點(diǎn)。目前的連續(xù)語(yǔ)音識(shí)別大多是基于HMM(隱馬爾科夫模型)框架,并將聲學(xué)、語(yǔ)言學(xué)的知識(shí)統(tǒng)一引入來(lái)改善這個(gè)框架,其硬件平臺(tái)通常是功能強(qiáng)大的工作站或PC機(jī)。

三、語(yǔ)音識(shí)別的原理

語(yǔ)音識(shí)別就是對(duì)麥克風(fēng)輸入的語(yǔ)音信號(hào)進(jìn)行解析和理解,并將其轉(zhuǎn)化為相應(yīng)的文本或命令。

一個(gè)完整的語(yǔ)音識(shí)別系統(tǒng)主要包括三個(gè)部分:

語(yǔ)音特征提取(前端處理部分):目的是濾除各種干擾成分,從語(yǔ)音波形中提取出隨時(shí)間變化的能表現(xiàn)語(yǔ)音內(nèi)容的特征矢量序列。

聲學(xué)模型和模式匹配(識(shí)別算法):聲學(xué)模型通常由獲得的語(yǔ)音特征通過(guò)訓(xùn)練產(chǎn)生,目的是為每個(gè)發(fā)音建立發(fā)音模板。在識(shí)別時(shí)將輸入的語(yǔ)音特征同聲學(xué)模型進(jìn)行匹配與比較,得到最佳識(shí)別結(jié)果。

語(yǔ)義理解(后處理):計(jì)算機(jī)對(duì)識(shí)別結(jié)果進(jìn)行語(yǔ)義、語(yǔ)法分析,明白語(yǔ)音的意義以便做出相應(yīng)的反應(yīng),通常通過(guò)語(yǔ)言模型來(lái)實(shí)現(xiàn)。

語(yǔ)音識(shí)別原理如下圖所示:

待識(shí)別語(yǔ)音經(jīng)話(huà)筒轉(zhuǎn)化為電信號(hào)后加在識(shí)別系統(tǒng)的輸入端,經(jīng)過(guò)預(yù)處理,接著進(jìn)行語(yǔ)音特征提取,用反映語(yǔ)音信號(hào)特征的若干參數(shù)來(lái)代表原始語(yǔ)音。常用的語(yǔ)音特征包括:線(xiàn)性預(yù)測(cè)系數(shù)(LPC)、線(xiàn)性預(yù)測(cè)倒譜系數(shù)(LPCC)、Mel頻譜系數(shù)(MFCC)等。

接下來(lái)分為兩個(gè)階段::訓(xùn)練階段和識(shí)別階段。

在訓(xùn)練階段,對(duì)用特征參數(shù)形式表示的語(yǔ)音信號(hào)進(jìn)行相應(yīng)處理,獲得表示識(shí)別基本單元共性特點(diǎn)的標(biāo)準(zhǔn)數(shù)據(jù),以此構(gòu)成參考模板,將所有能識(shí)別的基本單元的參考模板結(jié)合在一起,形成參考模式庫(kù);

在識(shí)別階段,將待識(shí)別的語(yǔ)音信號(hào)經(jīng)特征提取后逐一與參考模式庫(kù)中的各個(gè)模板按某種原則進(jìn)行匹配,找出最相似的參考模板所對(duì)應(yīng)的發(fā)音,即為識(shí)別結(jié)果。

最后進(jìn)行語(yǔ)音處理,涉及語(yǔ)法分析、語(yǔ)音理解、語(yǔ)義網(wǎng)絡(luò)等。

語(yǔ)音識(shí)別過(guò)程要根據(jù)模式匹配原則,計(jì)算未知語(yǔ)音模式與語(yǔ)音模板庫(kù)中的每一個(gè)模板的距離測(cè)度,從而得到最佳的匹配模式。語(yǔ)音識(shí)別所應(yīng)用的模式匹配方法主要有動(dòng)態(tài)時(shí)間規(guī)整(Dynamic Time Warping,DTW),隱馬爾科夫模型(Hidden Markov Model,HMM)和人工神經(jīng)元網(wǎng)絡(luò)(Artificial Neural Networks,ANN)。

四、難題

識(shí)別率是衡量語(yǔ)音識(shí)別系統(tǒng)性能好壞的一個(gè)重要指標(biāo),在實(shí)際應(yīng)用中,識(shí)別率主要受到以下幾個(gè)因素的影響:

對(duì)于漢語(yǔ)語(yǔ)音識(shí)別,方言或口音會(huì)降低識(shí)別率;

背景噪聲。公共場(chǎng)所的強(qiáng)噪聲對(duì)識(shí)別效果影響甚大,即使是在實(shí)驗(yàn)室環(huán)境下,敲擊鍵盤(pán)、移動(dòng)麥克風(fēng)都會(huì)成為背景噪聲;

“口語(yǔ)”問(wèn)題。它既涉及到自然語(yǔ)言理解,又與聲學(xué)有關(guān)。語(yǔ)音識(shí)別技術(shù)的最終目的是要讓用戶(hù)在“人機(jī)對(duì)話(huà)”時(shí),能夠像進(jìn)行“人與人對(duì)話(huà)”一樣自然,而一旦用戶(hù)以跟人交談的方式進(jìn)行語(yǔ)音輸入時(shí),口語(yǔ)的語(yǔ)法不規(guī)范和語(yǔ)序不正常的特點(diǎn)會(huì)給語(yǔ)義的分析和理解帶來(lái)困難。

此外,識(shí)別率還與說(shuō)話(huà)人的性別、說(shuō)話(huà)時(shí)間長(zhǎng)短等有關(guān)。

實(shí)時(shí)性是衡量語(yǔ)音識(shí)別系統(tǒng)性能好壞的另一指標(biāo)。對(duì)于具有高速運(yùn)算能力的CPU和大容量存儲(chǔ)器的PC而言,基本上能夠滿(mǎn)足實(shí)時(shí)性的要求;而對(duì)于資源有限的嵌入式系統(tǒng)來(lái)說(shuō),實(shí)時(shí)性幾乎得不到保證。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 存儲(chǔ)器
    +關(guān)注

    關(guān)注

    39

    文章

    7714

    瀏覽量

    170850
  • 智能家居
    +關(guān)注

    關(guān)注

    1942

    文章

    9943

    瀏覽量

    195512
  • 語(yǔ)音識(shí)別
    +關(guān)注

    關(guān)注

    39

    文章

    1803

    瀏覽量

    115560

原文標(biāo)題:語(yǔ)音識(shí)別之初體驗(yàn)

文章出處:【微信號(hào):Imgtec,微信公眾號(hào):Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    音頻信息識(shí)別與檢索技術(shù)

    隨著互聯(lián)網(wǎng)(Internet)和電信網(wǎng)等信息網(wǎng)絡(luò)的蓬勃發(fā)展,人們的信息交互變得越來(lái)越方便,除了文字信息,語(yǔ)音、音樂(lè)、圖像等多媒體信息也越來(lái)越多地進(jìn)入了人們的日常生活中。例如,
    發(fā)表于 03-05 22:53

    優(yōu)秀移動(dòng)應(yīng)用對(duì)人們生活的影響

    互聯(lián)“指尖時(shí)代” 隨著移動(dòng)互聯(lián)網(wǎng)市場(chǎng)規(guī)模的不斷擴(kuò)增,移動(dòng)應(yīng)用開(kāi)始變得越來(lái)越多樣化,服務(wù)越來(lái)越精細(xì)化,幾乎已滲透到與人們生活息息相關(guān)的各個(gè)領(lǐng)域,每天人們只需輕輕的觸碰指尖,就能夠隨時(shí)隨地
    發(fā)表于 07-22 16:41

    基于labview的語(yǔ)音識(shí)別

    `1系統(tǒng)概述語(yǔ)音識(shí)別技術(shù)是二十世紀(jì)信息技術(shù)領(lǐng)域十大重要的科技發(fā)展技術(shù)之一。語(yǔ)音
    發(fā)表于 03-10 22:00

    LWIP數(shù)據(jù)量大時(shí)傳輸必定會(huì)終止但又能ping通是怎么回事?

    ; failed at line 650 in ..\LWIP\lwip-1.4.1\src\core\pbuf.c出現(xiàn)上面這些錯(cuò)誤必定會(huì)丟數(shù)據(jù);Assertion "pbuf_take
    發(fā)表于 08-29 00:50

    模式識(shí)別的關(guān)鍵技術(shù)

    領(lǐng)域中,聲紋識(shí)別技術(shù)以其獨(dú)特的方便性、經(jīng)濟(jì)性和準(zhǔn)確性等優(yōu)勢(shì)受到世人矚目,并日益成為人們日常生活和工作中重要且普及的安驗(yàn)證方式。而且利用基因算法訓(xùn)練連續(xù)隱馬爾柯夫模型的
    發(fā)表于 12-11 14:17

    語(yǔ)音識(shí)別技術(shù)的概念及應(yīng)用前景

    解決的問(wèn)題,就是使得設(shè)備可以用聽(tīng)覺(jué)感知周?chē)氖澜?,用聲音和人做最自然的交互,讓操控?b class='flag-5'>生活更為便捷。 智能語(yǔ)音的基礎(chǔ)在于通過(guò)神經(jīng)網(wǎng)絡(luò)技術(shù),提升語(yǔ)音識(shí)別
    發(fā)表于 05-27 09:41

    2010年必定會(huì)成為pcb市場(chǎng)復(fù)蘇的一年

    2010年必定會(huì)成為pcb市場(chǎng)復(fù)蘇的一年 經(jīng)歷了2009年的衰退之后,無(wú)論是全球市場(chǎng)還是中國(guó)市場(chǎng),2010年必定會(huì)成為pcb市場(chǎng)復(fù)蘇的一年。
    發(fā)表于 01-25 09:02 ?1001次閱讀

    國(guó)內(nèi)語(yǔ)音識(shí)別技術(shù)上市公司匯總_語(yǔ)音識(shí)別技術(shù)現(xiàn)狀_語(yǔ)音識(shí)別原理及應(yīng)用

    語(yǔ)音識(shí)別技術(shù)的發(fā)展已經(jīng)普遍的存在了我們生活當(dāng)中,本文主要詳細(xì)介紹了語(yǔ)音識(shí)別
    發(fā)表于 12-13 18:04 ?1.1w次閱讀
    國(guó)內(nèi)<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>識(shí)別</b><b class='flag-5'>技術(shù)</b>上市公司匯總_<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>識(shí)別</b><b class='flag-5'>技術(shù)</b>現(xiàn)狀_<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>識(shí)別</b>原理及應(yīng)用

    AI語(yǔ)音識(shí)別技術(shù)將改變我們的生活

    互聯(lián)網(wǎng)人工智能的時(shí)代,各種各樣的語(yǔ)音識(shí)別技術(shù)越來(lái)越智能成熟,生活中手機(jī)我們也常常都在使用語(yǔ)音
    發(fā)表于 08-29 16:27 ?1627次閱讀

    聲紋識(shí)別具備怎樣的優(yōu)勢(shì)

    隨著5G的商用進(jìn)一步的推進(jìn)了物聯(lián)網(wǎng)的構(gòu)建,萬(wàn)物互聯(lián)作為發(fā)展目標(biāo),非接觸式識(shí)別技術(shù)聲紋識(shí)別必定會(huì)有非常大的應(yīng)用場(chǎng)景。
    發(fā)表于 09-30 10:38 ?2462次閱讀

    聲紋識(shí)別具備怎樣的優(yōu)勢(shì)

    隨著5G的商用進(jìn)一步的推進(jìn)了物聯(lián)網(wǎng)的構(gòu)建,萬(wàn)物互聯(lián)作為發(fā)展目標(biāo),非接觸式識(shí)別技術(shù)聲紋識(shí)別必定會(huì)有非常大的應(yīng)用場(chǎng)景。
    發(fā)表于 04-22 16:24 ?3789次閱讀

    美國(guó)發(fā)展EDA,華為業(yè)務(wù)必定會(huì)受到影響

    美國(guó)商務(wù)部針對(duì)華為進(jìn)行制裁升級(jí),除了祭出致命的晶圓代工外,另一大利器就是EDA,兩大招一齊使出,華為輪值董事長(zhǎng)郭平?也不得不承認(rèn)華為業(yè)務(wù)必定會(huì)受到影響。
    發(fā)表于 07-14 08:54 ?1255次閱讀
    美國(guó)發(fā)展EDA,華為業(yè)務(wù)<b class='flag-5'>必定會(huì)</b>受到影響

    語(yǔ)音識(shí)別技術(shù)的行業(yè)應(yīng)用與發(fā)展趨勢(shì)

    一、引言 隨著科技的不斷發(fā)展,語(yǔ)音識(shí)別技術(shù)已經(jīng)滲透到各個(gè)行業(yè)中,并逐漸改變著人們生活方式。本文
    的頭像 發(fā)表于 10-18 16:10 ?1683次閱讀

    語(yǔ)音識(shí)別技術(shù)智能家居領(lǐng)域的應(yīng)用與前景

    一、引言 隨著人工智能和物聯(lián)網(wǎng)技術(shù)的快速發(fā)展,智能家居成為了人們日常生活的重要部分。語(yǔ)音識(shí)別技術(shù)
    的頭像 發(fā)表于 10-26 14:27 ?2244次閱讀

    語(yǔ)音識(shí)別技術(shù)智能家居領(lǐng)域的創(chuàng)新應(yīng)用與挑戰(zhàn)

    隨著人工智能和物聯(lián)網(wǎng)技術(shù)的快速發(fā)展,智能家居成為了人們日常生活的重要部分。語(yǔ)音識(shí)別技術(shù)作為智能家
    的頭像 發(fā)表于 11-01 17:11 ?1572次閱讀