chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

恩智浦發(fā)布新一代智能語(yǔ)音技術(shù)組合的語(yǔ)音識(shí)別引擎

NXP客棧 ? 來(lái)源:NXP客棧 ? 2024-01-26 09:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

恩智浦發(fā)布新一代智能語(yǔ)音技術(shù)組合的語(yǔ)音識(shí)別引擎。本文將探討開(kāi)發(fā)人員在嵌入式語(yǔ)音控制設(shè)計(jì)中面臨的挑戰(zhàn)、恩智浦新的Speech to Intent引擎,以及您如何在應(yīng)用中使用它。

嵌入式系統(tǒng)中語(yǔ)音命令的挑戰(zhàn)

隨著亞馬遜、谷歌和蘋(píng)果等公司推出了具有革命性意義的智能揚(yáng)聲器,嵌入式語(yǔ)音控制的設(shè)備已經(jīng)成為了當(dāng)下的熱門(mén)趨勢(shì),而這種技術(shù)其實(shí)已經(jīng)存在了很多年。通過(guò)這些智能揚(yáng)聲器,終端用戶第一次體驗(yàn)到了語(yǔ)音優(yōu)先設(shè)備的便捷性、實(shí)用性和直觀性。語(yǔ)音是這些設(shè)備的用戶界面(UI),也是它們最重要或唯一的交互方式。借助云端的自然語(yǔ)言理解技術(shù),智能揚(yáng)聲器可以讓語(yǔ)音優(yōu)先設(shè)備的終端用戶用自然語(yǔ)言與智能設(shè)備進(jìn)行溝通,無(wú)論是請(qǐng)求、查詢(xún)還是命令,都可以得到理解和響應(yīng)。

為了實(shí)現(xiàn)自然語(yǔ)言處理,設(shè)計(jì)人員和終端用戶需要面對(duì)一些挑戰(zhàn),比如要求有穩(wěn)定、可靠的網(wǎng)絡(luò)連接,以及要承受始終在線、始終聆聽(tīng)的設(shè)備的高耗電,更別提這種聯(lián)網(wǎng)設(shè)備可能帶來(lái)的隱私風(fēng)險(xiǎn)了。

針對(duì)嵌入式設(shè)計(jì)中的語(yǔ)音引擎難題,恩智浦推出了其智能語(yǔ)音技術(shù)(VIT)產(chǎn)品組合的最新產(chǎn)品VIT Speech to Intent (VIT S2I) 引擎,了解該技術(shù)詳情,點(diǎn)擊這里>>

本地語(yǔ)音控制vs.云語(yǔ)音控制

為了讓設(shè)備具備語(yǔ)音控制功能,工程師通常有三種選擇:本地處理、在云端處理或兩者的組合,我們稱(chēng)之為“混合處理”。

通過(guò)本地語(yǔ)音控制,終端設(shè)備在邊緣本地處理所有語(yǔ)音,而無(wú)需連接到云端或遠(yuǎn)程服務(wù)器進(jìn)行二次處理。基于云的處理就是利用云端的計(jì)算能力來(lái)處理語(yǔ)音音頻,然后把云端生成的響應(yīng)通過(guò)網(wǎng)絡(luò)傳回設(shè)備。在混合處理的情況下,通常會(huì)使用本地喚醒詞引擎來(lái)喚醒設(shè)備(如“Hey NXP”),然后將該喚醒詞之后的所有語(yǔ)音命令流式傳輸?shù)皆贫嘶蜻h(yuǎn)程服務(wù)器進(jìn)行處理。

本地處理具有低延遲、低功耗和獨(dú)立于網(wǎng)絡(luò)等優(yōu)點(diǎn),但它通常只支持需要精確措辭的基本關(guān)鍵詞和命令。例如,開(kāi)燈可能需要準(zhǔn)確的短語(yǔ)“Hey, NXP(喚醒詞),開(kāi)燈(語(yǔ)音命令)”,并且不能有任何變化。

對(duì)于云端處理和混合系統(tǒng),云服務(wù)的使用增加了延遲,但提供了能夠運(yùn)行極其復(fù)雜的算法的優(yōu)勢(shì),包括自然語(yǔ)言理解模型。重溫剛才說(shuō)的開(kāi)燈示例,使用任何詞語(yǔ)組合,系統(tǒng)都可以理解所要求操作的環(huán)境,例如“這里很黑,請(qǐng)開(kāi)燈”。

如前所述,基于云的自然語(yǔ)言處理的一個(gè)主要缺點(diǎn)是安全和隱私問(wèn)題。簡(jiǎn)單地說(shuō),這種方式的原理是把語(yǔ)音音頻流通過(guò)網(wǎng)絡(luò)傳送到遠(yuǎn)程服務(wù)器進(jìn)行處理,但是這也可能導(dǎo)致系統(tǒng)誤啟動(dòng)并把無(wú)關(guān)的音頻流傳輸?shù)皆贫?。這些音頻流可能包括個(gè)人對(duì)話、憑證或其他敏感信息。

恩智浦VIT S2I引擎介紹

針對(duì)嵌入式設(shè)計(jì)中的語(yǔ)音引擎難題,恩智浦推出了其智能語(yǔ)音技術(shù)(VIT)產(chǎn)品組合的最新產(chǎn)品VIT Speech to Intent引擎。S2I引擎是VIT產(chǎn)品組合的高端產(chǎn)品,其中還包括免費(fèi)的喚醒詞引擎 (WWE) 和語(yǔ)音命令引擎 (VCE)。

與依賴(lài)遠(yuǎn)程云服務(wù)的系統(tǒng)不同,VIT S2I能夠在本地確定自然語(yǔ)言的意圖。這一功能要?dú)w功于恩智浦針對(duì)嵌入式系統(tǒng)設(shè)計(jì)的神經(jīng)網(wǎng)絡(luò)算法和機(jī)器學(xué)習(xí)模型的最新開(kāi)發(fā)成果。因此,要實(shí)現(xiàn)“開(kāi)燈”的目的,可以用很多不同的方式來(lái)表達(dá),比如“開(kāi)燈”、“太暗了”和“你能讓光線更亮嗎”等。

觀看視頻,進(jìn)一步了解基于RW61x上的本地語(yǔ)音控制功能——

這種Speech to Intent功能使用戶能夠更自然地與嵌入式系統(tǒng)進(jìn)行交互,同時(shí)降低了系統(tǒng)延遲和云連接系統(tǒng)的功耗。此外,消除云服務(wù)也有助于提高安全性和隱私,因?yàn)樗姓Z(yǔ)音都在設(shè)備上本地處理。此外,如果搭配恩智浦喚醒詞引擎,可以開(kāi)發(fā)超低功耗設(shè)計(jì),只有在聽(tīng)到特定的喚醒詞后,才會(huì)啟動(dòng)VIT S2I引擎來(lái)處理語(yǔ)音命令。

支持VIT S2I的恩智浦器件包括:Arm Cortex-M (i.MX RT跨界MCU和RW61x MCU),以及Cortex A (i.MX 8M Mini、i.MX 8MPlus和i.MX 9x應(yīng)用處理器)。VIT S2I目前支持英語(yǔ)、普通話和韓語(yǔ),于2023年底推出。用于創(chuàng)建自定義命令和訓(xùn)練模型的在線開(kāi)發(fā)工具計(jì)劃將于2024年發(fā)布。

052f8c90-bbdf-11ee-8b88-92fbcf53809c.jpg

VIT Speech to Intent框圖

VIT S2I為您的下一個(gè)設(shè)計(jì)增加語(yǔ)音功能

物聯(lián)網(wǎng)領(lǐng)域日新月異,VIT S2I能夠適應(yīng)各種應(yīng)用場(chǎng)景,無(wú)論是家居自動(dòng)化、可穿戴電子產(chǎn)品,還是汽車(chē)遠(yuǎn)程信息處理和樓宇門(mén)禁等,都能發(fā)揮其優(yōu)勢(shì)。消費(fèi)者喜歡用自然語(yǔ)言來(lái)免手動(dòng)控制設(shè)備的基本功能,消除邊緣語(yǔ)音處理的云服務(wù)不僅減少了系統(tǒng)延遲,還減少了隱私和安全問(wèn)題。

對(duì)于那些需要使用語(yǔ)音優(yōu)先用戶界面的設(shè)備,VIT S2I系統(tǒng)是一個(gè)不可或缺的部分,它可以應(yīng)用在智能恒溫器、智能電器、家居自動(dòng)化、燈光控制、遮陽(yáng)控制等領(lǐng)域。VIT S2I也適用于可穿戴設(shè)備和健身設(shè)備,一些用例包括設(shè)置提醒、控制藍(lán)牙設(shè)備和監(jiān)測(cè)健康狀況。

使用恩智浦的VIT產(chǎn)品組合增強(qiáng)您的應(yīng)用

如果您想要使用恩智浦智能語(yǔ)音技術(shù)組合進(jìn)行開(kāi)發(fā),歡迎使用我們免費(fèi)的VIT喚醒詞和語(yǔ)音命令引擎,通過(guò)MCUXpresso SDK和在線模型工具即可獲得。這些引擎可以讓您方便地定制喚醒詞和基本的語(yǔ)音控制,適用于那些不涉及自然語(yǔ)言理解的快速原型制作和開(kāi)發(fā)周期。

如果您的應(yīng)用需要更多自然語(yǔ)言理解功能,請(qǐng)聯(lián)系當(dāng)?shù)氐亩髦瞧执?,開(kāi)始使用VIT Speech to Intent。




審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    20070

    瀏覽量

    242913
  • mcu
    mcu
    +關(guān)注

    關(guān)注

    147

    文章

    18392

    瀏覽量

    379143
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4819

    瀏覽量

    106096
  • 恩智浦
    +關(guān)注

    關(guān)注

    14

    文章

    6028

    瀏覽量

    125862
  • 語(yǔ)音識(shí)別
    +關(guān)注

    關(guān)注

    39

    文章

    1795

    瀏覽量

    115075

原文標(biāo)題:將意圖轉(zhuǎn)化為行動(dòng):恩智浦新一代語(yǔ)音識(shí)別引擎,開(kāi)啟嵌入式語(yǔ)音控制新時(shí)代!

文章出處:【微信號(hào):NXP客棧,微信公眾號(hào):NXP客棧】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    助力億境虛擬打造新一代AI眼鏡解決方案

    半導(dǎo)體宣布,深圳市億境虛擬現(xiàn)實(shí)技術(shù)有限公司(簡(jiǎn)稱(chēng)“億境虛擬”)在其新一代 AI 眼鏡解決方案SW3021中采用
    的頭像 發(fā)表于 10-16 09:03 ?605次閱讀

    語(yǔ)音識(shí)別---大家怎么看呢?

    語(yǔ)音識(shí)別門(mén)交叉學(xué)科。近二十年來(lái),語(yǔ)音識(shí)別技術(shù)取得顯著進(jìn)步,開(kāi)始從實(shí)驗(yàn)室走向市場(chǎng)。人們預(yù)計(jì),未
    發(fā)表于 08-09 10:54

    廣和通發(fā)布新一代AI語(yǔ)音智能體FiboVista

    近日,2025火山引擎Force原動(dòng)力大會(huì)正式開(kāi)幕。廣和通發(fā)布新一代AI語(yǔ)音智能體FiboVista,并已率先應(yīng)用于車(chē)聯(lián)網(wǎng),成為
    的頭像 發(fā)表于 06-17 09:22 ?892次閱讀

    智能家電創(chuàng)新方案文看盡 智能家電技術(shù)日給你答案

    ? 科技賦能,將會(huì)讓我們?nèi)粘5募揖由钭兊枚?b class='flag-5'>智能?讓我們起到 “智能家電技術(shù)日” 中找答
    的頭像 發(fā)表于 03-28 11:46 ?5516次閱讀
    <b class='flag-5'>恩</b>智<b class='flag-5'>浦</b><b class='flag-5'>智能</b>家電創(chuàng)新方案<b class='flag-5'>一</b>文看盡  <b class='flag-5'>恩</b>智<b class='flag-5'>浦</b><b class='flag-5'>智能</b>家電<b class='flag-5'>技術(shù)</b>日給你答案

    語(yǔ)音識(shí)別技術(shù)在通信領(lǐng)域中的應(yīng)用實(shí)例

    語(yǔ)音識(shí)別技術(shù)也被稱(chēng)為自動(dòng)語(yǔ)音識(shí)別(Automatic Speech Recognition,ASR),是通過(guò)計(jì)算機(jī)對(duì)
    的頭像 發(fā)表于 02-21 17:12 ?919次閱讀

    詳解語(yǔ)音識(shí)別技術(shù)在通信領(lǐng)域中的應(yīng)用

    語(yǔ)音識(shí)別技術(shù)也被稱(chēng)為自動(dòng)語(yǔ)音識(shí)別(Automatic Speech Recognition,ASR),是通過(guò)計(jì)算機(jī)對(duì)
    的頭像 發(fā)表于 02-21 17:05 ?948次閱讀
    詳解<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>識(shí)別</b><b class='flag-5'>技術(shù)</b>在通信領(lǐng)域中的應(yīng)用

    【「嵌入式系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)」閱讀體驗(yàn)】+ 基于語(yǔ)音識(shí)別智能杯墊

    項(xiàng)目二維碼下圖 該作品通過(guò)采集飲水?dāng)?shù)據(jù),多種交互方式,數(shù)據(jù)分析處理,提醒用戶定期飲水,達(dá)到保持健康的作用。 主要功能是語(yǔ)音識(shí)別。 ASR-PRO語(yǔ)音模塊是款高度集成的
    發(fā)表于 01-02 18:15

    離線語(yǔ)音識(shí)別技術(shù)引領(lǐng)智能語(yǔ)音燈具市場(chǎng)——NRK3502

    智能語(yǔ)音燈具集高科技與人性化設(shè)計(jì),內(nèi)置NRK3502離線語(yǔ)音識(shí)別芯片,支持遠(yuǎn)場(chǎng)識(shí)別與自定義指令,提供便捷
    的頭像 發(fā)表于 12-30 15:04 ?1081次閱讀
    離線<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>識(shí)別</b><b class='flag-5'>技術(shù)</b>引領(lǐng)<b class='flag-5'>智能</b><b class='flag-5'>語(yǔ)音</b>燈具市場(chǎng)——NRK3502

    基于語(yǔ)音識(shí)別智能會(huì)議系統(tǒng)具備哪些交互功能

    標(biāo)貝科技專(zhuān)注智能語(yǔ)音交互領(lǐng)域多年,在語(yǔ)音識(shí)別語(yǔ)音合成領(lǐng)域有著多項(xiàng)大型企業(yè)合作案例,標(biāo)貝與多個(gè)智能
    的頭像 發(fā)表于 12-20 10:35 ?783次閱讀

    標(biāo)貝智能語(yǔ)音識(shí)別智能會(huì)議場(chǎng)景中的落地案例

    標(biāo)貝科技專(zhuān)注智能語(yǔ)音交互領(lǐng)域多年,在語(yǔ)音識(shí)別語(yǔ)音合成領(lǐng)域有著多項(xiàng)大型企業(yè)合作案例,標(biāo)貝與多個(gè)智能
    的頭像 發(fā)表于 12-20 10:31 ?940次閱讀
    標(biāo)貝<b class='flag-5'>智能</b><b class='flag-5'>語(yǔ)音</b><b class='flag-5'>識(shí)別</b>在<b class='flag-5'>智能</b>會(huì)議場(chǎng)景中的落地案例

    發(fā)布首個(gè)UWB無(wú)線BMS解決方案

    汽車(chē)市場(chǎng)值得信賴(lài)的創(chuàng)新解決方案合作伙伴半導(dǎo)體發(fā)布新一代無(wú)線電池管理系統(tǒng)(BMS)解決方案,
    的頭像 發(fā)表于 11-26 17:36 ?2484次閱讀

    語(yǔ)音識(shí)別智能家居中的應(yīng)用

    隨著科技的飛速發(fā)展,智能家居逐漸成為人們生活中不可或缺的部分。智能家居系統(tǒng)通過(guò)物聯(lián)網(wǎng)技術(shù)將家中的各種設(shè)備連接起來(lái),實(shí)現(xiàn)遠(yuǎn)程控制和自動(dòng)化管理。在眾多的控制方式中,
    的頭像 發(fā)表于 11-26 09:31 ?1811次閱讀

    語(yǔ)音識(shí)別與自然語(yǔ)言處理的關(guān)系

    在人工智能的快速發(fā)展中,語(yǔ)音識(shí)別和自然語(yǔ)言處理(NLP)成為了兩個(gè)重要的技術(shù)支柱。語(yǔ)音識(shí)別
    的頭像 發(fā)表于 11-26 09:21 ?1914次閱讀

    語(yǔ)音識(shí)別技術(shù)的應(yīng)用與發(fā)展

    語(yǔ)音識(shí)別技術(shù)的發(fā)展可以追溯到20世紀(jì)50年,但直到近年來(lái),隨著計(jì)算能力的提升和機(jī)器學(xué)習(xí)技術(shù)的進(jìn)步,這項(xiàng)
    的頭像 發(fā)表于 11-26 09:20 ?2052次閱讀

    ASR語(yǔ)音識(shí)別技術(shù)應(yīng)用

    ASR(Automatic Speech Recognition)語(yǔ)音識(shí)別技術(shù),是計(jì)算機(jī)科學(xué)與人工智能領(lǐng)域的重要突破,能將人類(lèi)語(yǔ)音轉(zhuǎn)換為文本
    的頭像 發(fā)表于 11-18 15:12 ?2551次閱讀