chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

語音UI的基本原則

星星科技指導(dǎo)員 ? 來源:嵌入式計(jì)算設(shè)計(jì) ? 作者:Paul Beckmann ? 2022-10-25 16:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Amazon Echo和Google Home中的語音用戶界面(語音UI)功能吸引了消費(fèi)者的注意。語音識(shí)別系統(tǒng)的效率很大程度上取決于麥克風(fēng)陣列和算法集合,這些算法允許陣列聚焦于用戶的語音并拒絕不需要的噪聲。下面解釋這些算法的基本功能。

觸發(fā)/喚醒詞

語音 UI 系統(tǒng)使用分配的觸發(fā)詞(如“Alexa”或“確定谷歌”)來激活語音 UI 設(shè)備。設(shè)備必須使用自己的算法立即進(jìn)行識(shí)別,因?yàn)槭褂没ヂ?lián)網(wǎng)資源會(huì)產(chǎn)生太多的延遲。

觸發(fā)詞必須產(chǎn)生一個(gè)獨(dú)特的波形,該波形可以使算法與正常語音區(qū)分開來,否則成功識(shí)別的百分比可能低得令人無法接受。通常,使用三到五個(gè)音節(jié)的觸發(fā)詞是最好的。

小觸發(fā)詞算法占用較少的內(nèi)存和處理,但犯更多的錯(cuò)誤,而大的算法需要更多的資源,但犯的錯(cuò)誤更少。模型也是可調(diào)的 - 它們可以更嚴(yán)格(更少的誤報(bào),但更難觸發(fā))或更寬松(更多的誤報(bào),但更容易觸發(fā))。大多數(shù)產(chǎn)品設(shè)計(jì)師選擇更嚴(yán)格的調(diào)整,因?yàn)榭蛻魧?duì)錯(cuò)誤觸發(fā)沒有同情心。

圖 1 比較了不同調(diào)諧點(diǎn)的三觸發(fā)模型的性能。在測(cè)試條件下,每小時(shí)實(shí)現(xiàn)少于兩個(gè)錯(cuò)誤觸發(fā)器是一個(gè)合理的目標(biāo)。小模型只能通過圖形最左側(cè)的兩個(gè)最嚴(yán)格的調(diào)諧來實(shí)現(xiàn)這一點(diǎn)。中型和大型型號(hào)在更寬的工作范圍內(nèi)實(shí)現(xiàn)了這一目標(biāo)。

pYYBAGNXm7eAXMiVAAFTjAUgeAU218.png

圖 1. 每小時(shí)使用小型、中型和大型算法模型測(cè)試誤報(bào),左側(cè)調(diào)整更嚴(yán)格,右側(cè)調(diào)整更寬松。

到達(dá)目的地(到達(dá)方向)

一旦觸發(fā)詞被識(shí)別出來,下一步就是確定用戶語音的到達(dá)方向(DOA)。一旦確定了方向,DOA算法就會(huì)告訴波束成形算法它應(yīng)該聚焦在哪個(gè)方向。

DOA算法的核心功能是檢查來自陣列中不同麥克風(fēng)的信號(hào)的相位關(guān)系,并使用此信息來確定哪個(gè)麥克風(fēng)首先接收聲音。但是,由于來自墻壁,地板,天花板和房間內(nèi)其他物體的反射,用戶的聲音也將從其他方向傳來。為此,DOA算法包括優(yōu)先邏輯,它將更響亮的初始到達(dá)與更安靜的反射分開。

DOA 算法的操作通過自動(dòng)調(diào)整環(huán)境噪聲水平得到增強(qiáng)。該算法測(cè)量房間內(nèi)的平均噪聲水平,并且僅當(dāng)輸入信號(hào)至少比環(huán)境噪聲水平高出一定數(shù)量的分貝時(shí),才會(huì)重新計(jì)算用戶嘴巴的位置。

回聲消除器

為了更好地關(guān)注用戶的聲音,語音 UI 設(shè)備必須從其麥克風(fēng)拾取的聲音中減去自己的揚(yáng)聲器產(chǎn)生的聲音。這似乎很簡(jiǎn)單,就像將節(jié)目材料的相位反轉(zhuǎn)版本混合到來自麥克風(fēng)的信號(hào)中一樣簡(jiǎn)單。然而,該過程不足以處理揚(yáng)聲器對(duì)波形的改變、數(shù)字信號(hào)處理(DSP)均衡、麥克風(fēng)和聲學(xué)反射。

AEC算法中的第一步是將麥克風(fēng)的輸出與原始(前DSP)輸入信號(hào)進(jìn)行比較,并計(jì)算校正曲線,以從語音命令的波形中減去揚(yáng)聲器的直接聲音。

第二步是減去聲學(xué)回聲。該算法必須在一定的誤差范圍內(nèi)“尋找”與節(jié)目材料匹配的聲音(以補(bǔ)償由聲學(xué)引起的波形變化),以及對(duì)應(yīng)于預(yù)期混響時(shí)間的已定義時(shí)間窗口內(nèi)的聲音。由于每個(gè)麥克風(fēng)接收的回聲集略有不同,并且來自揚(yáng)聲器的直接聲音也不同,因此要實(shí)現(xiàn)最佳性能,需要對(duì)每個(gè)麥克風(fēng)進(jìn)行單獨(dú)的 AEC 處理。

AEC 查找反射的時(shí)間段稱為“回波尾部長度”。回聲尾部長度越長,可以消除的反射越多,算法的性能就越好。然而,較長的尾巴需要更多的內(nèi)存和更多的處理。圖2顯示了回聲消除器在逐漸增加混響的房間中的表現(xiàn)。對(duì)更長的回聲尾部的需求是顯而易見的。

poYBAGNXm8KACjm8AAFJhHlrwKk343.png

圖 2. 回聲消除器在四個(gè)房間中表現(xiàn),混響時(shí)間增加。較大的房間受益于使用長回聲尾部的算法。

波束成形

波束成形允許麥克風(fēng)陣列聚焦于來自特定方向的聲音。它提高了信噪比(SNR),因?yàn)樗兄诟綦x用戶的聲音,同時(shí)抑制來自其他方向的聲音。

例如,如果用戶位于麥克風(fēng)陣列的一側(cè),而空調(diào)位于另一側(cè),則來自空調(diào)的聲音首先到達(dá)用戶對(duì)面的麥克風(fēng),然后在幾分之一秒后到達(dá)離用戶最近的麥克風(fēng)。波束成形算法使用這些時(shí)差來消除空調(diào)聲音,同時(shí)保留用戶的聲音。

具有兩個(gè)麥克風(fēng)的陣列取消聲音的能力有限,但具有三個(gè)或更多麥克風(fēng)的陣列可以消除來自更多方向的聲音。麥克風(fēng)越少,性能就越會(huì)隨著視角(用戶的聲音與語音 UI 產(chǎn)品前軸之間的角度)的變化而變化。

雖然麥克風(fēng)陣列系統(tǒng)使用定向拾音模式來濾除噪聲,但某些噪聲可以通過識(shí)別將噪聲與所需信號(hào)分離的特性,然后消除噪聲的算法進(jìn)行衰減。降噪算法可以幫助觸發(fā)單詞識(shí)別,并在所有其他算法完成其工作后提高語音UI性能。

語音命令是瞬時(shí)事件??梢詸z測(cè)到始終存在或重復(fù)的任何聲音,并將其從來自麥克風(fēng)陣列的信號(hào)中刪除。示例包括汽車中的道路噪聲,以及家庭中的洗碗機(jī)和HVAC系統(tǒng)噪聲。高于或低于人聲頻譜的聲音也可以從信號(hào)中濾除。

手機(jī)中使用的常見降噪算法傾向于突出顯示對(duì)人類理解最關(guān)鍵的頻譜,而不是對(duì)電子系統(tǒng)隔離和理解語音命令最關(guān)鍵的頻譜。大多數(shù)此類算法實(shí)際上會(huì)降低語音 UI 性能。簡(jiǎn)單地說,人類聽的東西與語音UI系統(tǒng)不同。

圖3顯示了在有和沒有降噪的情況下觸發(fā)字檢測(cè)的功效。降噪算法將整體語音識(shí)別提高了2 dB -考慮到用戶的聲音通常僅比周圍噪聲大幾dB,這是一個(gè)很大的差異。

pYYBAGNXm86AEU3SAAFj-NKmSMQ786.png

圖 3. 降噪算法對(duì)觸發(fā)字檢測(cè)的影響。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • dsp
    dsp
    +關(guān)注

    關(guān)注

    561

    文章

    8276

    瀏覽量

    368295
  • 觸發(fā)器
    +關(guān)注

    關(guān)注

    14

    文章

    2065

    瀏覽量

    63563
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    直供微電網(wǎng)設(shè)計(jì)中,設(shè)備選型的基本原則如何應(yīng)用于實(shí)際項(xiàng)目中

    模式等靈活適配,西格電力提供智能微電網(wǎng)系統(tǒng)解決方案,咨詢服務(wù):1.3.7-5.0.0.4-6.2.0.0。本文將先明確直供微電網(wǎng)設(shè)備選型的核心基本原則,再結(jié)合不同類型實(shí)際項(xiàng)目,詳細(xì)拆解各原則的落地應(yīng)用路徑,為直供微電網(wǎng)設(shè)備選型提供實(shí)操性參考。
    的頭像 發(fā)表于 03-10 14:27 ?189次閱讀
    直供微電網(wǎng)設(shè)計(jì)中,設(shè)備選型的<b class='flag-5'>基本原則</b>如何應(yīng)用于實(shí)際項(xiàng)目中

    電氣接線規(guī)范詳解

    電氣接線是電力系統(tǒng)、工業(yè)設(shè)備及民用建筑中不可或缺的基礎(chǔ)環(huán)節(jié),其規(guī)范性和安全性直接關(guān)系到設(shè)備運(yùn)行穩(wěn)定性和人身財(cái)產(chǎn)安全。以下從基本原則、常見類型、操作規(guī)范及安全注意事項(xiàng)四個(gè)方面,系統(tǒng)闡述電氣接線的核心
    的頭像 發(fā)表于 01-18 07:41 ?1052次閱讀

    直供微電網(wǎng)設(shè)計(jì)中,設(shè)備選型的基本原則是什么?

    、運(yùn)行模式靈活”的特性,需圍繞“安全優(yōu)先、適配場(chǎng)景、經(jīng)濟(jì)高效、可靠可控、綠色兼容”五大核心導(dǎo)向,建立科學(xué)的設(shè)備選型原則體系。以下將從五大核心原則出發(fā),詳細(xì)拆解直供微電網(wǎng)設(shè)備選型的關(guān)鍵邏輯與實(shí)踐要求。
    的頭像 發(fā)表于 01-16 10:12 ?422次閱讀
    直供微電網(wǎng)設(shè)計(jì)中,設(shè)備選型的<b class='flag-5'>基本原則</b>是什么?

    基于i.MX RT106V跨界MCU的智能語音UI邊緣就緒解決方案

    基于i.MX RT106V跨界MCU的智能語音UI邊緣就緒解決方案 在當(dāng)今智能化的時(shí)代,智能語音交互技術(shù)在工業(yè)和物聯(lián)網(wǎng)領(lǐng)域的應(yīng)用越來越廣泛。NXP推出的基于i.MX RT106V跨界MCU的智能
    的頭像 發(fā)表于 12-24 17:15 ?770次閱讀

    RUI Builder 圖形化UI設(shè)計(jì)工具

    RUI Builder 圖形化UI設(shè)計(jì)工具 該軟件為圖形化UI設(shè)計(jì)軟件,搭配瑞佑圖形處理器,輕松設(shè)計(jì)UI界面!主要特色功能: 在PC上直接設(shè)計(jì)界面,再生成UI渲染源碼(.c),程序中
    發(fā)表于 12-12 20:14

    RESTful API設(shè)計(jì)原則: 構(gòu)建易用、可擴(kuò)展的API接口。

    一、理解REST架構(gòu)的核心約束 1.1 RESTful API的六大基本原則 Roy Fielding博士在其博士論文中定義了REST架構(gòu)的六大核心約束: 統(tǒng)一接口(Uniform
    的頭像 發(fā)表于 10-24 10:45 ?717次閱讀

    RESTful API設(shè)計(jì)原則: 構(gòu)建易用、可擴(kuò)展的API接口

    基本原則 Roy Fielding博士在其博士論文中定義了REST架構(gòu)的六大核心約束: 統(tǒng)一接口(Uniform Interface):確保API使用標(biāo)準(zhǔn)化的交互
    的頭像 發(fā)表于 10-20 13:45 ?1484次閱讀

    電氣設(shè)計(jì)線號(hào)標(biāo)記規(guī)則

    在電氣工程設(shè)計(jì)中,線號(hào)標(biāo)記是保證系統(tǒng)可維護(hù)性和安全性的基礎(chǔ)工作。一套科學(xué)、規(guī)范的線號(hào)標(biāo)記規(guī)則不僅能提高施工效率,還能為后續(xù)的檢修、改造提供清晰指引。本文將系統(tǒng)介紹電氣設(shè)計(jì)中線號(hào)標(biāo)記的基本原則、常用
    的頭像 發(fā)表于 08-23 23:12 ?5551次閱讀
    電氣設(shè)計(jì)線號(hào)標(biāo)記規(guī)則

    HarmonyOS AI輔助編程工具(CodeGenie)UI生成

    UI Generator基于BitFun Platform AI能力平臺(tái),用于快速生成可編譯、可運(yùn)行的HarmonyOS UI工程,支持基于已有UI布局文件(XML),快速生成
    發(fā)表于 07-10 11:51

    零知開源——STM32F4實(shí)現(xiàn)ILI9486顯示屏UI界面系列教程(四):相冊(cè)預(yù)覽和大圖功能

    支持、動(dòng)畫過渡等,并總結(jié)了開發(fā)注意事項(xiàng)和UI設(shè)計(jì)建議。該設(shè)計(jì)符合現(xiàn)代UI原則,在低端硬件上也能保持流暢交互。
    的頭像 發(fā)表于 06-27 12:01 ?1028次閱讀
    零知開源——STM32F4實(shí)現(xiàn)ILI9486顯示屏<b class='flag-5'>UI</b>界面系列教程(四):相冊(cè)預(yù)覽和大圖功能

    請(qǐng)問如何通過OpenVINO?加速啟用穩(wěn)定的擴(kuò)散 Web UI?

    無法運(yùn)行具有OpenVINO?加速的穩(wěn)定擴(kuò)散 Web UI。
    發(fā)表于 06-24 06:48

    UI開發(fā)概述

    基于ArkTS的聲明式開發(fā)范式的方舟開發(fā)框架是一套開發(fā)極簡(jiǎn)、高性能、支持跨設(shè)備的UI開發(fā)框架,提供了構(gòu)建應(yīng)用UI所必需的能力,主要包括: ArkTS ArkTS是優(yōu)選的主力應(yīng)用開發(fā)語言,圍繞
    發(fā)表于 06-24 06:36

    使用 ai cude 里面自帶的案例訓(xùn)練UI顯示異常的原因?怎么解決?

    案例的配置是默認(rèn)的,顯示訓(xùn)練ui更改顯示異常
    發(fā)表于 06-23 06:21

    高速PCB布局/布線的原則

    目錄:一、布線的一般原則1、PCB板知識(shí)2、5-5原則3、20H原則4、3W/4W/10W原則(W:Width)5、重疊電源與地線層規(guī)則6、1/4波長規(guī)則7、芯片引腳布線二、信號(hào)走線下
    的頭像 發(fā)表于 05-28 19:34 ?2673次閱讀
    高速PCB布局/布線的<b class='flag-5'>原則</b>

    FPGA芯片選型的核心原則

    本文總結(jié)了FPGA選型的核心原則和流程,旨在為設(shè)計(jì)人員提供決策依據(jù),確保項(xiàng)目成功。
    的頭像 發(fā)表于 04-30 10:58 ?1855次閱讀