“Hey NXP”、”哈啰恩智浦”……一聲又一聲的問候在寧靜的辦公室里格外惹人注目,原來是恩智浦公司又一嘔心瀝血的得意新作——智能語音技術(VIT)。
智能語音技術(Voice Intelligent Technology – VIT)基于最先進的深度學習和語音識別技術,是一款完整的喚醒詞/語音命令解決方案。
VIT在MCUXpresso SDK中支持的恩智浦設備上免費提供,目前已經(jīng)可以支持英語,而中文、土耳其語、西班牙語等其他語言也正如火如荼地開發(fā)測試當中。
VIT功能包括
喚醒詞引擎(Wake Word Engine - WWE):它使用了訓練所需要并且已記錄的觸發(fā)詞文件。
在訓練階段使用數(shù)據(jù)增強技術來整合數(shù)據(jù)集中的可變性。
利用神經(jīng)網(wǎng)絡分類器來確定提取的音素序列是否與目標關鍵字對應。
不需要音頻數(shù)據(jù)集的語音命令引擎(Voice Commands Engine - VCE)。
目標語音命令在脫機過程中被轉換為單詞符號序列,VCE在運行時確定提取的音素序列是否對應于特定的單詞符號序列以及命令。
一個模型可以支持從大量詞匯當中所挑選的30個語音命令。
簡而言之VIT可以
通過Text2Model工具創(chuàng)建的自定義命令
自定義觸發(fā)字選項
低延遲檢測(<200ms)
VIT現(xiàn)已經(jīng)支持的平臺有
i.MX RT600系列:Cortex-M33內核,HiFi4 DSP協(xié)處理器,評估板為MIMXRT685-EVK
i.MX RT1060系列:Cortex-M7內核,評估板為MIMXRT1060-EVK
VIT可以利用語音服務來喚醒并控制物聯(lián)網(wǎng)裝置或家用設備。目前的VIT版本可以支持喚醒詞以及利用Text2Model工具所產(chǎn)生的語音命令,如下圖所示↓↓↓

喚醒詞模型是從關鍵詞檔案數(shù)據(jù)庫所創(chuàng)建,而語音命令模型則是由Text2Model工具所產(chǎn)生。目前SDK中所內建的VIT函式庫可以偵測 “Hey NXP” 關鍵詞以及12個在VIT_Voice_Commands.h當中所預設的語音命令。
這次VIT的發(fā)布包含了以下的部分:
Lib/libVIT_PLATFORM_VERSION.a :平臺可以選HIFI4或Cortex-M7
Lib/VIT.h :描述VIT公用的API庫
Lib/VIT_Model.h :VIT模型檔案包含了喚醒詞和語音命令的描述
VIT_Voice_Commands.h :列舉VIT函式庫所支持的語音命令
Lib/Inc :涵蓋VIT公用接口定義的文件夾
ExApp/VIT_ExApp.c :VIT范例
VIT提供豐富API以供使用者操作:
VIT_SetModel:儲存VIT模塊的地址,并確認此模塊是否能被VIT函式庫所支持
VIT_GetMemoryTable:通知軟件應用程序VIT函式所需要的內存。共定義四種不同的內存區(qū)塊,F(xiàn)ast data / Slow data / fast coefficient /Temporary or scratch
VIT_GetInstanceHandle:設置并初始化VIT,所有的內存都被映像到子模塊所需的緩沖區(qū)
VIT_SetControlParameters:設置或修改VIT的控制參數(shù)
VIT_Process:分析音頻以辨識是喚醒詞或語音命令
VIT_GetVoiceCommandFound:VIT讀取命令編號與名稱
VIT_GetModelInfo:輔助API,用來取得VIT模塊的訊息
VIT_ResetInstance:輔助API,用來重置VIT模塊
VIT_GetControlParameters:輔助API,用來取得VIT的控制參數(shù)
VIT_GetStatusParameters:輔助API,用來取得VIT的狀態(tài)參數(shù)
以下為簡單的API調用流程↓↓↓

原文標題:免費提供!VIT智能語音技術:恩智浦深度學習應用又一得意之作!
文章出處:【微信公眾號:NXP客?!繗g迎添加關注!文章轉載請注明出處。
-
恩智浦
+關注
關注
14文章
6028瀏覽量
127033 -
智能語音
+關注
關注
11文章
819瀏覽量
49917 -
深度學習
+關注
關注
73文章
5587瀏覽量
123737
原文標題:免費提供!VIT智能語音技術:恩智浦深度學習應用又一得意之作!
文章出處:【微信號:NXP客棧,微信公眾號:NXP客?!繗g迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
飛凌嵌入式亮相恩智浦技術日杭州站:共探技術,共謀發(fā)展
恩智浦與吉利汽車研究院成立聯(lián)合創(chuàng)新實驗室,共創(chuàng)汽車智能化未來
2025年恩智浦創(chuàng)新技術峰會上海站圓滿落幕
「2025恩智浦創(chuàng)新技術峰會」飛凌嵌入式亮相上海首站
啟揚智能受邀參加2025恩智浦技術峰會

恩智浦公司得意新作智能語音技術亮相
評論