首頁: 電子電路圖,電子技術(shù)資料網(wǎng)站首頁

電子資料下載: 電子資料下載頻道 -- 為電子工程師提供激發(fā)創(chuàng)新靈感的新方案、新的參考設(shè)計、新的設(shè)計構(gòu)想等可下載的電子資料！

電子技術(shù)應(yīng)用: 電子技術(shù)應(yīng)用頻道 -- 為電子工程師提供電子產(chǎn)品設(shè)計所需的技術(shù)分析、設(shè)計技巧、設(shè)計工具、測試工具等技術(shù)文章！

電子元器件: 專業(yè)的電子元器件平臺 -- 及時發(fā)布大量最新IC、分立器件、模組等電子元器件產(chǎn)品信息！; 電阻器電容器電感器電位器變壓器繼電器二極管三極管場效應(yīng)管晶閘管集成電路開關(guān)器件發(fā)光二極管接插件電聲器件電子管晶振溫敏元件光敏元器件濕敏元器件壓敏電阻傳感器數(shù)碼管保險絲可控硅電子鎮(zhèn)流器 PCB 熱敏電阻電池接口定義芯片引腳圖元件代換光耦

電子電路圖: 電路圖頻道 -- 提供電子電路圖,原理圖,汽車電路圖,手機電路圖,功放電路圖,電源電路圖等電路圖紙

電子技術(shù)論壇: 構(gòu)建電子工程師交流的平臺 -- 在交流中進(jìn)一步學(xué)習(xí)設(shè)計技巧、規(guī)劃技術(shù)人生、提升自我價值！

您的位置：電子發(fā)燒友網(wǎng)>電子元器件>集成電路>

語音識別芯片的工作原理和分類

2019年06月12日 09:49 lq 作者：用戶評論（0）

關(guān)鍵字：芯片(425098)信號處理(103326)語音識別(112734)

語音識別芯片也叫語音識別IC，與傳統(tǒng)的語音芯片相比，語音識別芯片最大的特點就是能夠語音識別，它能讓機器聽懂人類的語音，并且可以根據(jù)命令執(zhí)行各種動作，如眨眼睛、動嘴巴（智能娃娃）。除此之外，語音識別芯片還具有高品質(zhì)、高壓縮率錄音放音功能，可實現(xiàn)人機對話。

語音識別芯片所涉及的技術(shù)包括：信號處理、模式識別、概率論和信息論、發(fā)聲機理和聽覺機理、人工智能等等。

語音識別芯片的工作原理

嵌入式語音識別系統(tǒng)都采用了模式匹配的原理。錄入的語音信號首先經(jīng)過預(yù)處理，包括語音信號的采樣、反混疊濾波、語音增強，接下來是特征提取，用以從語音信號波形中提取一組或幾組能夠描述語音信號特征的參數(shù)。特征提取之后的數(shù)據(jù)一般分為兩個步驟，第一步是系統(tǒng)“學(xué)習(xí)”或“訓(xùn)練”階段，這一階段的任務(wù)是構(gòu)建參考模式庫，詞表中每個詞對應(yīng)一個參考模式，它由這個詞重復(fù)發(fā)音多遍，再經(jīng)特征提取和某種訓(xùn)練中得到。第二是“識別”或“測試”階段，按照一定的準(zhǔn)則求取待測語音特征參數(shù)和語音信息與模式庫中相應(yīng)模板之間的失真測度，最匹配的就是識別結(jié)果。

LD332X系列語音識別芯片的工作原理：

LD3320提供的語音識別技術(shù)，是基于“關(guān)鍵詞語列表”的識別技術(shù)：ASR（Autospeechrecognition）技術(shù)。

語音識別芯片完成的工作就是：把通過MIC輸入的聲音進(jìn)行頻譜分析-》提取語音特征-》和關(guān)鍵詞語列表中的關(guān)鍵詞語進(jìn)行對比匹配-》找出得分最高的關(guān)鍵詞語作為識別結(jié)果輸出。

語音識別芯片的工作原理和分類

語音識別芯片能在兩種情況下給出識別結(jié)果：

1）外部送入預(yù)定時間的語音數(shù)據(jù)后（比如5秒鐘的語音數(shù)據(jù)），芯片對這些語音數(shù)據(jù)運算分析后，給出識別結(jié)果

2）外部送入語音數(shù)據(jù)流，語音識別芯片通過端點檢測VAD（voiceactivitydetection）檢測出用戶停止說話，把用戶開始說話到停止說話之間的語音數(shù)據(jù)進(jìn)行運算分析后，給出識別結(jié)果

對于第一種情況，可以理解為設(shè)定了一個定時錄音（比如為5秒鐘），芯片在5秒鐘后，會停止把聲音送入識別引擎，并且根據(jù)已送入引擎的語音數(shù)據(jù)計算出一個識別結(jié)果。

對于第二種情況，需要了解VAD的工作原理：

VAD（VoiceActivityDetection）技術(shù)是在一段語音數(shù)據(jù)流中，判斷出哪個時間點是人聲的開始，哪個時間點是人聲的結(jié)束。判斷的依據(jù)是，在背景聲音的基礎(chǔ)上有了語音發(fā)音，則視為聲音的開始。而后，檢測到一段持續(xù)時間的背景音（比如600毫秒），則視為人聲說話結(jié)束。

通過VAD判斷出人聲說話的區(qū)域后，語音識別芯片會把這期間的聲音數(shù)據(jù)進(jìn)行識別處理后，計算出識別結(jié)果。

需要說明的是，除了以上兩種情況外，語音識別算法無法“主動”地判斷出是否識別出了一個結(jié)果。這是因為，在計算的過程中的任何時刻，語音識別器都會對已送入識別芯片的聲音數(shù)據(jù)進(jìn)行分析，并根據(jù)匹配程度為識別列表中的關(guān)鍵詞語進(jìn)行打分，最匹配的打分最高。但是，由于識別算法不知道用戶后面是否還繼續(xù)說語音，所以無法“主動”地判斷已經(jīng)識別出一個結(jié)果。

比如，識別列表中有兩個關(guān)鍵詞語分別是“李曉”和“李曉明”，當(dāng)用戶說到“曉”這個音節(jié)時，在識別芯片內(nèi)部是“李曉”的得分最高，但此時識別芯片是無法給出識別結(jié)果。隨著用戶說出“明”音節(jié)后，“李曉明”則成為得分最高。此時，用戶停止說話，或者是定時錄音已到，使得識別芯片可以判斷出用戶已經(jīng)停止說話了，才能給出識別結(jié)果是“李曉明”。

語音識別芯片的分類

按照使用者的限制而言，語音識別芯片可以分為特定人語音識別芯片和非特定人語音識別芯片。

特定人語音識別芯片

特定人語音識別芯片是針對指定人的語音識別，其他人的話不識別，須先把使用者的語音參考樣本存入當(dāng)成比對的資料庫，即特定人語音識別在使用前必須要進(jìn)行語音訓(xùn)練，一般按照機器提示訓(xùn)練2遍語音詞條即可使用。

非特定人語音識別芯片

非特定人語音識別是不用針對指定的人的識別技術(shù)，不分年齡、性別，只要說相同語言就可以，應(yīng)用模式是在產(chǎn)品定型前按照確定的十幾個語音交互詞條，采集200人左右的聲音樣本，經(jīng)過PC算法處理得到交互詞條的語音模型和特征數(shù)據(jù)庫，然后燒錄到芯片上。應(yīng)用這種芯片的機器（智能娃娃、電子寵物、兒童電腦）就具有交互功能了。

非特定人語音識別應(yīng)用有的是基于音素的算法，這種模式下不需要采集很多人的聲音樣本就可以做交互識別，但是缺點是識別率不高，識別性能不穩(wěn)定。

按照說話方式的連續(xù)性，語音識別芯片又可分為非連續(xù)語音識別和連續(xù)語音識別。

非連續(xù)語音識別芯片

對于非連續(xù)語音來說，識別所說的每一個字必須分開辨認(rèn)，要求說完每個字后都要停頓。

連續(xù)語音識別芯片

連續(xù)語音識別可以一般自然流利的說話方式來進(jìn)行人性化的語音識別，但由于關(guān)系到相連音的問題，很難達(dá)到好的辨認(rèn)效果。

非常好我支持^.^

(300) 98.7%

不好我反對

(4) 1.3%

分享到:

加入收藏(0) + 推薦給朋友 + 挑錯

用戶評論

發(fā)表評論即可獲得積分！ 詳見積分規(guī)則

發(fā)表評論

用戶評論

評價:好評中評差評

發(fā)表評論，獲取積分！請遵守相關(guān)規(guī)定！

or

注冊會員

游客:

chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费

語音識別芯片的工作原理和分類

語音識別芯片的工作原理

語音識別芯片的分類

相關(guān)閱讀：

用戶評論

發(fā)表評論

深度閱讀

相關(guān)電子資料下載

電子元器件閱讀排行

熱門詞

chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

語音識別芯片的工作原理和分類

語音識別芯片的工作原理

語音識別芯片的分類

相關(guān)閱讀：

用戶評論

發(fā)表評論

深度閱讀

相關(guān)電子資料下載

電子元器件閱讀排行

熱門詞

chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费