chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

語音喚醒技術(shù)的對(duì)比,語音喚醒技術(shù)哪家強(qiáng)

語音技術(shù)智能匯 ? 來源:語音技術(shù)智能匯 ? 作者:語音技術(shù)智能匯 ? 2022-03-23 10:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

編輯導(dǎo)語:

隨著語音交互技術(shù)的日漸成熟,越來越多的智能硬件都選擇增加語音能力作為產(chǎn)品賣點(diǎn)之一。但是,設(shè)備在進(jìn)入語音交互工作狀態(tài)的時(shí)候,需要先進(jìn)行喚醒操作。

常見的喚醒語音交互的操作有按鍵或者觸屏形式,但是,為了進(jìn)一步降低學(xué)習(xí)成本和操作復(fù)雜度,也有不少的智能硬件選擇通過語音喚醒的方式來激活交互功能。

本文將綜合對(duì)比市面上各家提供的語音喚醒技術(shù)相關(guān)指標(biāo),可以幫助你快速掌握語音喚醒技術(shù)的情況。

一、語音喚醒技術(shù)的相關(guān)核心指標(biāo)

1、喚醒率

語音喚醒的主要目的既然是激活設(shè)備進(jìn)入交互工作狀態(tài),那么,喚醒率的高低就顯得額外重要了。理論上,最好的狀態(tài)就是我只要說一次喚醒詞,設(shè)備就能立即響應(yīng)。不過,受說話人與設(shè)備距離、發(fā)音標(biāo)準(zhǔn)、噪聲等各種各樣的因素,實(shí)際工作中比較難達(dá)到次次響應(yīng)的完美工作狀態(tài)。

一般來說,在近距離的安靜場(chǎng)景下,市面上的技術(shù)都能夠做到喚醒率在95%以上。

不過,消費(fèi)者的實(shí)際使用場(chǎng)景是較復(fù)雜的,因此,需要模擬不同的應(yīng)用場(chǎng)景進(jìn)行實(shí)測(cè),才能得到最后的喚醒率指標(biāo)。

2、誤喚醒率

指設(shè)備被非喚醒詞喚醒的概率,誤喚醒率越高,效果越不好。

大家在日常生活中可能會(huì)經(jīng)常碰到,放在家里的智能音箱,大晚上莫名其妙答一句“我在”,把人嚇個(gè)半死;還有如果家里用的智能電視,喚醒手機(jī)語音助手的時(shí)候,不是同一個(gè)喚醒詞,電視也會(huì)蹦出一句“我在”。

這就是典型的誤喚醒場(chǎng)景,一般用24小時(shí)被誤喚醒多少次來衡量。

3、響應(yīng)時(shí)長(zhǎng)

主要是指用戶說完喚醒詞后,設(shè)備給出反饋的耗時(shí),一般越短越好。

而反饋的形式則比較多樣,可以通過語音應(yīng)答響應(yīng)、也可以通過亮屏或者指示燈閃爍響應(yīng)。統(tǒng)計(jì)來看,如果是亮屏或者指示燈閃爍響應(yīng),控制在200ms以內(nèi)用戶體驗(yàn)較好;如果是語音應(yīng)答響應(yīng),太快反而體驗(yàn)不好,一般控制在500ms左右更佳。

4、功耗

主要是針對(duì)電池供電設(shè)備,理論上越低越好,這樣,設(shè)備的使用時(shí)長(zhǎng)不會(huì)受到太大的影響。

因?yàn)閱拘训?a target="_blank">工作原理是會(huì)持續(xù)檢測(cè)聲音中是否包含喚醒詞的特定片段,所以,會(huì)持續(xù)耗電。

為了進(jìn)一步降低功耗,部分產(chǎn)品也會(huì)采取DSP來完成語音喚醒,再通過AP層兜底的模式,保證喚醒和功耗的均衡。

總結(jié):語音喚醒的技術(shù)指標(biāo),除了與算法相關(guān)之外,還與智能硬件的結(jié)構(gòu)設(shè)計(jì)、芯片算力、使用場(chǎng)景等息息相關(guān)。最后的實(shí)際效果,則應(yīng)以實(shí)際測(cè)試效果為準(zhǔn),參考下圖:

二、語音喚醒技術(shù)對(duì)比

該對(duì)比信息均從互聯(lián)網(wǎng)公開渠道獲取,相關(guān)信息來源于提供商官網(wǎng)公開信息,如其官網(wǎng)有更新,請(qǐng)以更新信息為準(zhǔn)。(PS:百度搜索關(guān)鍵詞“語音喚醒”)

poYBAGI6i66AIXdTAAn5A2rKJxY710.png

三、喚醒詞的區(qū)別

喚醒詞的定義實(shí)際是比較廣泛,至少包含了四種使用場(chǎng)景:品牌喚醒詞(如,小飛小飛)、離線命令詞(如,我要聽周杰倫的歌)、云端命令詞(如,我要聽周杰倫的歌)、免喚醒詞(如,下一首、暫停)。這些使用場(chǎng)景,實(shí)際上都是使用了喚醒詞的原理,只是喚醒后執(zhí)行不同的動(dòng)作。

四、語音喚醒項(xiàng)目實(shí)施要點(diǎn)

1、喚醒詞評(píng)估

大部分服務(wù)商都提供了喚醒詞評(píng)估服務(wù),不過,有部分服務(wù)商對(duì)喚醒詞有一定的限制。因此,在選擇喚醒詞的時(shí)候,需要充分考慮品牌、發(fā)音特點(diǎn)、詞語等因素,綜合確定最終的喚醒詞。

2、確認(rèn)測(cè)試環(huán)境和工具

以以往交付的喚醒項(xiàng)目來看,主要測(cè)試的環(huán)境包括:外噪場(chǎng)景測(cè)試、自噪場(chǎng)景測(cè)試、安靜場(chǎng)景測(cè)試和誤喚醒測(cè)試。

3、聲音采集

根據(jù)產(chǎn)品主要面向的使用人群,采集真人發(fā)音音頻。

示例:【某某投影儀音頻采集需求】

  • 采集人數(shù)200人,總音頻2000句
  • 男女比=1:1
  • 一人10句
  • 語速快:中:慢=1:3:1
  • 年齡兒童:青年:中年=1:3:1
  • 區(qū)域:北上廣深
  • 普通話

4、測(cè)試音頻處理

包括去除破音的音頻、去除時(shí)長(zhǎng)>1.7s的測(cè)試音頻、音頻幅度歸一化。

5、數(shù)據(jù)記錄表

根據(jù)實(shí)測(cè)結(jié)果,如實(shí)填寫表格中對(duì)應(yīng)測(cè)試結(jié)果,完成項(xiàng)目驗(yàn)收。

如果需要更深入地咨詢了解,可添加筆者V:HolaAI,詳細(xì)交流。

審核編輯:符乾江

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 語音控制
    +關(guān)注

    關(guān)注

    5

    文章

    507

    瀏覽量

    29442
  • 語音交互
    +關(guān)注

    關(guān)注

    3

    文章

    329

    瀏覽量

    29009
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    揭秘AI玩具“聽得清”的秘密!這幾款語音前端芯片撐起交互體驗(yàn)天花板

    、混響,而主控SoC的算力/功耗/實(shí)時(shí)性都扛不住這些7×24的AEC+NR+Beamforming+喚醒運(yùn)算;前端芯片把“干凈的人聲”先截出來,再送給主控或云端,才能保證打斷喚醒、低誤觸發(fā)、低功耗三樣同時(shí)成立。 ? 因此,目前AI玩具中,一款好的
    的頭像 發(fā)表于 10-17 08:42 ?9106次閱讀

    強(qiáng)智能語音技術(shù)重新定義車載交互邊界

    強(qiáng)憑借自主研發(fā)的智能語音技術(shù),為某國內(nèi)頭部車企提供的語音前處理、喚醒詞、ASR、TTS等技術(shù)
    的頭像 發(fā)表于 07-11 14:00 ?842次閱讀

    智芯科超低功耗離線語音喚醒芯片的應(yīng)用場(chǎng)景

    想讓設(shè)備無需聯(lián)網(wǎng)也能秒速響應(yīng)語音指令?我們的超低功耗離線語音喚醒芯片正是答案!采用前沿技術(shù),待機(jī)能耗近乎“休眠”,續(xù)航焦慮一掃而空,智能穿戴、智能家居等設(shè)備電量更持久。
    的頭像 發(fā)表于 07-08 10:24 ?840次閱讀

    告別 “起床氣”!NV340D 語音芯片解鎖電子鬧鐘喚醒新體驗(yàn)!

    在快節(jié)奏的現(xiàn)代生活中,電子鬧鐘作為我們每天清晨的“喚醒伙伴”,其重要性不言而喻。如今,隨著科技的飛速發(fā)展,電子鬧鐘也在不斷進(jìn)化,功能日益豐富。而這背后,離不開關(guān)鍵技術(shù)——語音芯片的強(qiáng)力支持
    的頭像 發(fā)表于 07-05 11:09 ?944次閱讀
    告別 “起床氣”!NV340D <b class='flag-5'>語音</b>芯片解鎖電子鬧鐘<b class='flag-5'>喚醒</b>新體驗(yàn)!

    芯知識(shí)|廣州唯創(chuàng)電子WT2003H語音芯片:智能低功耗,喚醒隨心控

    在電池供電或?qū)拿舾械?b class='flag-5'>語音應(yīng)用場(chǎng)景中,WT2003H語音芯片憑借其精心設(shè)計(jì)的雙模式低功耗休眠架構(gòu),為開發(fā)者提供了靈活高效的節(jié)能解決方案,顯著延長(zhǎng)設(shè)備續(xù)航時(shí)間。核心低功耗模式解析深度休眠模式
    的頭像 發(fā)表于 06-30 08:52 ?322次閱讀
    芯知識(shí)|廣州唯創(chuàng)電子WT2003H<b class='flag-5'>語音</b>芯片:智能低功耗,<b class='flag-5'>喚醒</b>隨心控

    語音助手只能聊天?啟明云端AI語音交互方案偷偷修煉了音樂才藝!

    設(shè)備演示:技術(shù)落地的全景呈現(xiàn)在實(shí)測(cè)場(chǎng)景中,搭載樂鑫科技ESP32-S3芯片的“賽博地平線”手辦伴侶率先登場(chǎng),響應(yīng)指令。通過深度整合豆包大模型,用戶通過喚醒詞即可實(shí)現(xiàn)
    的頭像 發(fā)表于 06-27 18:03 ?551次閱讀
    <b class='flag-5'>語音</b>助手只能聊天?啟明云端AI<b class='flag-5'>語音</b>交互方案偷偷修煉了音樂才藝!

    可編程SLIC語音芯片哪家好?

    在當(dāng)今數(shù)字化快速發(fā)展的時(shí)代,語音芯片的應(yīng)用越來越廣泛,而可編程SLIC(用戶線路接口電路)語音芯片更是憑借其獨(dú)特的優(yōu)勢(shì),受到眾多行業(yè)的青睞。那么,面對(duì)眾多的選擇,哪家的可編程SLIC語音
    的頭像 發(fā)表于 06-12 13:55 ?470次閱讀
    可編程SLIC<b class='flag-5'>語音</b>芯片<b class='flag-5'>哪家</b>好?

    小安AI語音板,“廣西表哥”強(qiáng)勢(shì)上線!

    集成度、高性價(jià)比等特性,支持 離線語音喚醒語音打斷 功能。 此款開發(fā)板結(jié)合 2W/8Ω 揚(yáng)聲器與雙供電模式(Type-C + 電池),適用于快速部署語音交互能力的硬件創(chuàng)新場(chǎng)景,如
    的頭像 發(fā)表于 06-10 17:30 ?543次閱讀
    小安AI<b class='flag-5'>語音</b>板,“廣西表哥”強(qiáng)勢(shì)上線!

    芯資訊|基于廣州唯創(chuàng)電子語音芯片的煙霧報(bào)警器語音方案技術(shù)解析

    了三大煙霧報(bào)警器語音方案,覆蓋傳統(tǒng)、高集成度與智能化需求,為不同場(chǎng)景提供靈活選擇。以下從技術(shù)特性、應(yīng)用場(chǎng)景及行業(yè)價(jià)值三方面展開分析。一、方案對(duì)比技術(shù)特性方案類型核
    的頭像 發(fā)表于 04-21 08:54 ?449次閱讀
    芯資訊|基于廣州唯創(chuàng)電子<b class='flag-5'>語音</b>芯片的煙霧報(bào)警器<b class='flag-5'>語音</b>方案<b class='flag-5'>技術(shù)</b>解析

    強(qiáng)信息入選2024語音識(shí)別技術(shù)公司TOP30榜單

    強(qiáng)憑借在語音識(shí)別領(lǐng)域多年的技術(shù)積淀與持續(xù)的創(chuàng)新突破,成功入選“2024語音識(shí)別技術(shù)公司TOP30”榜單。作為行業(yè)標(biāo)桿,普
    的頭像 發(fā)表于 04-18 17:25 ?927次閱讀

    離線語音模組VC系列出廠固件使用教程——SDK開源?

    安信可VC系列離線語音模組,采用云知聲方案,在語音識(shí)別技術(shù)上不斷優(yōu)化和創(chuàng)新算法,離線識(shí)別算法與芯片架構(gòu)深度融合,為客戶提供超低成本的離線語音識(shí)別方案,可廣泛且快速應(yīng)用于智能家居,各類智
    的頭像 發(fā)表于 02-26 14:14 ?710次閱讀
    離線<b class='flag-5'>語音</b>模組VC系列出廠固件使用教程——SDK開源?

    谷歌“減法”新動(dòng)作:砍掉耳機(jī)按鍵喚醒朗讀功能

    電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)近期,谷歌宣布將對(duì)耳機(jī)上的 Google Assistant語音助手功能進(jìn)行調(diào)整,取消通過觸控喚醒助理“自動(dòng)朗讀未讀通知”的功能。谷歌表示,要想完成該功能可以通過語音
    的頭像 發(fā)表于 02-22 22:56 ?2748次閱讀
    谷歌“減法”新動(dòng)作:砍掉耳機(jī)按鍵<b class='flag-5'>喚醒</b>朗讀功能

    領(lǐng)先技術(shù)語音識(shí)別芯片,探索NRK3502芯片的技術(shù)特點(diǎn)

    九芯電子NRK3502芯片以卓越創(chuàng)新力和技術(shù)積累引領(lǐng)語音識(shí)別領(lǐng)域,低成本純離線,高精度識(shí)別保障隱私,支持多喚醒詞,低功耗高性能,推動(dòng)智能家居、智慧辦公等領(lǐng)域發(fā)展。
    的頭像 發(fā)表于 12-25 13:06 ?850次閱讀

    語音識(shí)別技術(shù)的應(yīng)用與發(fā)展

    語音識(shí)別技術(shù)的發(fā)展可以追溯到20世紀(jì)50年代,但直到近年來,隨著計(jì)算能力的提升和機(jī)器學(xué)習(xí)技術(shù)的進(jìn)步,這項(xiàng)技術(shù)才真正成熟并廣泛應(yīng)用于各個(gè)領(lǐng)域。語音
    的頭像 發(fā)表于 11-26 09:20 ?2100次閱讀

    ASR語音識(shí)別技術(shù)應(yīng)用

    ASR(Automatic Speech Recognition)語音識(shí)別技術(shù),是計(jì)算機(jī)科學(xué)與人工智能領(lǐng)域的重要突破,能將人類語音轉(zhuǎn)換為文本,廣泛應(yīng)用于智能家居、醫(yī)療、交通等多個(gè)領(lǐng)域。以下是對(duì)ASR
    的頭像 發(fā)表于 11-18 15:12 ?2584次閱讀