在設(shè)計(jì)智能音箱和其他語(yǔ)音功能的設(shè)備,例如可穿戴設(shè)備、可聽(tīng)覺(jué)設(shè)備時(shí),開(kāi)發(fā)者面臨的首要挑戰(zhàn)是如何讓麥克風(fēng)準(zhǔn)確有效地檢測(cè) “Alexa ”和 “Hey Google ”等喚醒詞,以便在云端處理。
當(dāng)DSP Group推出支持語(yǔ)音的語(yǔ)音系統(tǒng)級(jí)芯片(SoC)DBM10時(shí),EDN向該公司SmartVoice芯片的產(chǎn)品經(jīng)理Yosi Brosh提出了這個(gè)問(wèn)題。這款基于DSP和神經(jīng)網(wǎng)絡(luò)(NN)加速器的雙核SoC,針對(duì)電池設(shè)備中的語(yǔ)音和傳感器處理進(jìn)行了優(yōu)化,如可聽(tīng)、可穿戴設(shè)備、真正的無(wú)線立體聲(TWS)耳機(jī)和智能家居遙控器等。
上圖:用于語(yǔ)音智能產(chǎn)品的DBM10芯片宣稱的采用平臺(tái)方式,具有全面的軟件框架支持。
Brosh表示,像亞馬遜網(wǎng)絡(luò)服務(wù)(AWS)這樣的云平臺(tái)對(duì)在芯片上配置寄存器不感興趣。相反,這些云服務(wù)關(guān)注的是語(yǔ)音算法如何高效檢測(cè)喚醒詞。Brosh說(shuō)“他們希望算法能夠檢測(cè)到喚醒詞,而不需要工程師花費(fèi)大量時(shí)間研究和配置芯片上的寄存器?!?/p>
因此,DSP Group開(kāi)發(fā)了一個(gè)API,使語(yǔ)音檢測(cè)算法很容易集成到云服務(wù)中。他補(bǔ)充道;“在某種程度上,云服務(wù)提供商的語(yǔ)音算法成為芯片的黑匣子。”
通常的做法是,設(shè)備制造商發(fā)布帶有麥克風(fēng)設(shè)置的軟件代碼,并告訴算法提供商如何在麥克風(fēng)驅(qū)動(dòng)中集成算法。以DSP Group的DBM10芯片為例,它使用語(yǔ)音固件采集音頻,使語(yǔ)音采集算法的集成變得高效簡(jiǎn)單。
DSP Group一直在與十幾家云公司密切合作,其中包括阿里巴巴、亞馬遜、百度、谷歌和三星,同時(shí)在其芯片上移植他們的語(yǔ)音算法。據(jù)Brosh介紹,該公司在某些情況下還提供一套完整的軟件。
該芯片能夠?yàn)橄到y(tǒng)設(shè)計(jì)人員提供簡(jiǎn)單的部署路徑,Brosh表示,公司對(duì)運(yùn)行在DBM10語(yǔ)音接口芯片上軟件的支持一直提供到生產(chǎn)層面,“系統(tǒng)工程師不需要編寫(xiě)一行代碼”。
這就是為什么DSP Group稱其DBM10芯片為完整解決方案的原因。該SoC通過(guò)通用DSP和名為nNetLite的神經(jīng)網(wǎng)絡(luò)處理器對(duì)音頻算法以及傳感AI算法進(jìn)行了優(yōu)化。除此以外DSP Group還提供運(yùn)行在Wi-Fi芯片上用于與DBM10芯片進(jìn)行通信的額外驅(qū)動(dòng)程序。
SoC還具有跨平臺(tái)的工具鏈,支持所有常用的人工智能(AI)和機(jī)器學(xué)習(xí)(ML)框架,以簡(jiǎn)化算法部署。工程師們可以開(kāi)發(fā)、訓(xùn)練和測(cè)試算法,然后將算法以標(biāo)準(zhǔn)格式保存,工具鏈會(huì)將其提取并創(chuàng)建一個(gè)圖像,下載到SoC中。
上圖:nNetLite編譯器可以快速優(yōu)化、修剪和部署任何框架的AI/ML模型到DBM10 SoC。
該SoC的外形尺寸很小,只有4平方毫米,可以進(jìn)入像智能手表這樣的極小設(shè)備。同樣,在SoC的神經(jīng)網(wǎng)絡(luò)nNetLite引擎上運(yùn)行的始終處于開(kāi)啟狀態(tài)的wake word算法只消耗幾微瓦的電能。
編輯:lyn
-
語(yǔ)音
+關(guān)注
關(guān)注
3文章
399瀏覽量
38707 -
算法
+關(guān)注
關(guān)注
23文章
4710瀏覽量
95392 -
云服務(wù)
+關(guān)注
關(guān)注
0文章
855瀏覽量
39707
原文標(biāo)題:簡(jiǎn)化云服務(wù)的語(yǔ)音檢測(cè)算法部署
文章出處:【微信號(hào):livevideostack,微信公眾號(hào):LiveVideoStack】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
軟通動(dòng)力榮膺“2024華為云卓越解決方案提供商”和“上海云銷售伙伴核心貢獻(xiàn)獎(jiǎng)”
Arm架構(gòu)將占據(jù)半數(shù) 2025年出貨到頭部云服務(wù)提供商的算力
Raksmart云服務(wù)器如何支持AIGC創(chuàng)作
華礪智行榮獲“2024車路云一體化優(yōu)秀服務(wù)提供商”
跪求各位大神指導(dǎo)熊貓光纖中間黑匣子是什么東西?作用是什么?
Akamai被選為戰(zhàn)略云計(jì)算服務(wù)提供商,承諾投入超過(guò)1億美元
微軟最新消息:微軟入歐洲云服務(wù)提供商協(xié)會(huì) 微軟執(zhí)行副總裁將離職
RAKsmart公司介紹:全球領(lǐng)先的互聯(lián)網(wǎng)基礎(chǔ)設(shè)施與云服務(wù)提供商
GPU加速云服務(wù)器怎么用的
PingCAP選擇亞馬遜云科技為首選云服務(wù)商 加速全球業(yè)務(wù)拓展
電梯黑匣子:守護(hù)安全的智慧守護(hù)者
億華云-互聯(lián)網(wǎng)基礎(chǔ)應(yīng)用云服務(wù)提供商

評(píng)論