語音控制芯片或者說模塊的應(yīng)用前景越來越廣泛,無論是設(shè)計(jì)方案還是廠家生產(chǎn)的產(chǎn)品在越來越多越來越頻繁的使用語音控制芯片。當(dāng)然行業(yè)內(nèi)更多的是稱呼為語音識(shí)別芯片,因?yàn)檎Z音控制的前提是要先識(shí)別用戶的聲音,才能夠發(fā)出正確的指令。
語音芯片控制模塊是實(shí)現(xiàn) “語音指令 - 設(shè)備響應(yīng)” 的核心組件,其工作原理可拆解為信號(hào)采集、處理、識(shí)別及指令執(zhí)行的完整鏈路,下面將以WTK69000為例給大家分享一下整個(gè)流程的工作原理。

一、語音信號(hào)采集與預(yù)處理
①.信號(hào)采集:通過內(nèi)置麥克風(fēng)或外接麥克風(fēng)收集用戶的語音信號(hào)。芯片以 16kHz 采樣率對(duì)語音信號(hào)進(jìn)行采樣,將其轉(zhuǎn)化為數(shù)字信號(hào)。
②.預(yù)處理:包括預(yù)加重、分幀、加窗等操作。預(yù)加重用于提升高頻信號(hào)的能量,分幀是將連續(xù)的語音信號(hào)分成若干個(gè)短幀,加窗則是對(duì)每幀信號(hào)進(jìn)行加權(quán)處理,以減少頻譜泄漏。此外,芯片還采用了神經(jīng)網(wǎng)絡(luò)降噪系統(tǒng)、AI 識(shí)別降噪等技術(shù),抑制穩(wěn)態(tài)噪聲和動(dòng)態(tài)噪聲,提高信號(hào)質(zhì)量。
③語音特征提取經(jīng)過預(yù)處理的語音信號(hào),會(huì)被提取特征向量。WTK6900 系列芯片通常提取包含 12 維 MFCC(梅爾頻率倒譜系數(shù))+ 能量 + 差分參數(shù)的特征向量,這些特征能夠較好地表征語音的特性,為后續(xù)的語音識(shí)別提供基礎(chǔ)。

二、語音識(shí)別
采用混合識(shí)別架構(gòu):應(yīng)用改進(jìn)型 DTW(動(dòng)態(tài)時(shí)間規(guī)整)算法,計(jì)算測(cè)試模板與參考模板之間的距離,衡量語音的相似度。同時(shí),該系列部分芯片采用深度神經(jīng)網(wǎng)絡(luò)算法進(jìn)行語音識(shí)別,具有識(shí)別精準(zhǔn)、誤判率低等優(yōu)勢(shì)。
決策機(jī)制:將最近鄰得分與閾值 θ1 進(jìn)行比較,若得分大于閾值,則觸發(fā)對(duì)應(yīng)指令;否則進(jìn)入拒識(shí)狀態(tài)。通過這種方式來確定用戶所說的語音是否與預(yù)設(shè)的指令詞匹配,從而實(shí)現(xiàn)語音識(shí)別功能。
三、指令輸出與設(shè)備控制
WTK6900 系列芯片識(shí)別出語音指令后,通過 UART 等通信接口將命令推送到設(shè)備原有的上位機(jī),上位機(jī)接收到指令后,控制相關(guān)設(shè)備執(zhí)行相應(yīng)的動(dòng)作,如智能玩具中的舵機(jī)轉(zhuǎn)動(dòng)、電機(jī)旋轉(zhuǎn),投影儀的功能切換,智能晾衣架的升降等。
此外,WTK6900 系列芯片還支持多模態(tài)學(xué)習(xí)方式,用戶可通過物理按鍵、串口指令、語音命令或?qū)S?APP 啟動(dòng)學(xué)習(xí)流程,實(shí)現(xiàn)命令詞的自學(xué)習(xí)功能,可存儲(chǔ) 100 多個(gè)自定義語音模板,還支持方言自適應(yīng)學(xué)習(xí),能靈活適應(yīng)不同用戶的語音指令需求。
四、云端交互
云端大模型(如 GPT、BERT)接收 WTK6900 上傳的語音數(shù)據(jù)或特征向量,進(jìn)行多輪對(duì)話、意圖識(shí)別、知識(shí)推理等復(fù)雜處理。例如:用戶說 “幫我查一下明天深圳的天氣”,WTK6900 本地識(shí)別為 “天氣查詢” 指令碼,云端大模型解析出 “深圳”“明天” 等語義要素,調(diào)用天氣 API 獲取結(jié)果。
方言或模糊指令(如 “搞凍 D”)通過云端大數(shù)據(jù)訓(xùn)練的模型進(jìn)行精準(zhǔn)識(shí)別。
通信機(jī)制:WTK支持UART串口/SPI接口/藍(lán)牙BLE/wifi模組擴(kuò)展。
場(chǎng)景案例:
①本地處理:WTK6900H-A 芯片通過 UART 接收用戶語音指令 “調(diào)至 26 度”,本地識(shí)別為 “溫度調(diào)節(jié)” 指令碼(0x05),并通過 I2C 接口直接控制空調(diào)模塊。
②云端擴(kuò)展:若用戶指令為 “根據(jù)空氣質(zhì)量自動(dòng)調(diào)節(jié)”,WTK6900 將 “自動(dòng)模式” 指令碼上傳至云端,云端大模型結(jié)合實(shí)時(shí)空氣質(zhì)量數(shù)據(jù)生成最優(yōu)溫度參數(shù),返回后驅(qū)動(dòng)空調(diào)執(zhí)行。
以上就是“語音控制模塊工作原理”的全部?jī)?nèi)容,希望可以幫助到大家。
審核編輯 黃宇
-
芯片
+關(guān)注
關(guān)注
462文章
53489瀏覽量
458334 -
模塊
+關(guān)注
關(guān)注
7文章
2820瀏覽量
52761 -
語音控制
+關(guān)注
關(guān)注
5文章
510瀏覽量
29536
發(fā)布評(píng)論請(qǐng)先 登錄
廣州唯創(chuàng)電子錄音語音芯片IC:工作原理與應(yīng)用場(chǎng)景全解析
廣州唯創(chuàng)電子語音芯片的工作原理與應(yīng)用解析
解析Profinet無線通訊模塊的工作原理與技術(shù)特點(diǎn)
語音輸出模塊是什么?自控語音播報(bào)
正弦波逆變器的工作原理與控制方式

語音控制模塊工作原理
評(píng)論