chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

華為研發(fā)語(yǔ)音喚醒方法及電子設(shè)備的語(yǔ)音交互技術(shù)

454398 ? 來(lái)源:搜狐 ? 作者:搜狐 ? 2021-01-09 09:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

通常語(yǔ)音交互過(guò)程通常分為喚醒、響應(yīng)、輸入、理解、反饋幾個(gè)環(huán)節(jié),語(yǔ)音交互技術(shù)也一直是IBM、微軟、百度等遙遙領(lǐng)先。

幾個(gè)月前,華為消費(fèi)者業(yè)務(wù)CEO余承東表示華為正在研發(fā)國(guó)際版的語(yǔ)音助手,同時(shí)建立自己的AI服務(wù),并將在未來(lái)擴(kuò)展到國(guó)際市場(chǎng)。

人工智能的潮流推動(dòng)下,智能化語(yǔ)音技術(shù)不斷發(fā)展,許多電子設(shè)備中都添加了語(yǔ)音助手,如Siri、小愛同學(xué)、天貓精靈等,用來(lái)協(xié)助用戶進(jìn)行人機(jī)交互過(guò)程。為了使得語(yǔ)音助手能夠及時(shí)檢測(cè)并響應(yīng)用戶發(fā)出的語(yǔ)音交互指令,電子設(shè)備一般會(huì)預(yù)設(shè)一些喚醒詞,如“Hi Siri”等,當(dāng)檢測(cè)到用戶輸入喚醒詞時(shí),可觸發(fā)電子設(shè)備與用戶進(jìn)行交流。通常設(shè)備設(shè)置喚醒詞的聲強(qiáng)門限60dB,當(dāng)用戶輸入聲強(qiáng)大于60dB時(shí),電子設(shè)備檢測(cè)成功,然而當(dāng)用戶距離設(shè)備較遠(yuǎn)時(shí),由于輸入聲強(qiáng)的降低,電子設(shè)備往往難以檢測(cè)到輸入語(yǔ)音信號(hào)從喚醒失敗。在這種情況下,如何在遠(yuǎn)距離下提高語(yǔ)音助手喚醒成功率成為諸多企業(yè)競(jìng)相研究的熱點(diǎn)。

華為公司于2019年7月25日提出了一項(xiàng)名為“一種語(yǔ)音喚醒方法及電子設(shè)備”的發(fā)明專利(申請(qǐng)?zhí)枺?01910677390 .9),申請(qǐng)人為華為技術(shù)有限公司。

此發(fā)明專利介紹了一種語(yǔ)音喚醒方法及相對(duì)應(yīng)的電子設(shè)備,可以在較廣的位置范圍內(nèi)保證電子設(shè)備被成功喚醒的幾率,從而提高用戶的使用體驗(yàn),而該種方法可以被應(yīng)用于諸如智能家居設(shè)備、PC、手機(jī)、音箱等具有語(yǔ)音交互功能的電子設(shè)備之中。

o4YBAF9uXB6ASSloAACJI4NT3Lc054.png

圖1 語(yǔ)音交互過(guò)程示意圖

通常語(yǔ)音交互過(guò)程可分為喚醒、響應(yīng)、輸入、理解、反饋幾個(gè)環(huán)節(jié)。當(dāng)設(shè)備處于待機(jī)狀態(tài)時(shí),需要識(shí)別用戶輸入的語(yǔ)音喚醒信號(hào),如果識(shí)別成功則切換到工作狀態(tài),此后則可以通過(guò)語(yǔ)音識(shí)別算法用戶對(duì)輸入的語(yǔ)義內(nèi)容進(jìn)行識(shí)別并響應(yīng),整個(gè)過(guò)程如圖1所示。

從上述過(guò)程可以看出,成功喚醒電子設(shè)備是實(shí)現(xiàn)人機(jī)語(yǔ)音交互的基礎(chǔ),而喚醒設(shè)備的過(guò)程就是通過(guò)預(yù)設(shè)的喚醒參數(shù)檢測(cè)用戶的語(yǔ)音輸入。喚醒參數(shù)如喚醒門限、拾音方向、噪聲抑制參數(shù)、放大增益等的取值決定了電子設(shè)備在檢測(cè)喚醒輸入語(yǔ)音時(shí)喚醒率的高低。在實(shí)際使用過(guò)程中,用戶相對(duì)設(shè)備的位置差異導(dǎo)致了喚醒率的不同,因此根據(jù)用戶所在的位置動(dòng)態(tài)設(shè)置喚醒參數(shù)可以使得電子設(shè)備在不同位置場(chǎng)景下保持較高的喚醒率。

pIYBAF9uXCCACWbGAAEKoHGuKwk742.png

圖2 語(yǔ)音喚醒方法應(yīng)用場(chǎng)景示意圖

圖2為上述提到的基于用戶位置信息來(lái)劃分區(qū)域,從而進(jìn)行語(yǔ)音喚醒的示意圖。電子設(shè)備在待機(jī)狀態(tài)時(shí)可周期性地通過(guò)攝像頭采集用戶圖像信息,并根據(jù)圖像確定用戶所在的位置信息。對(duì)于不同區(qū)域,設(shè)備可預(yù)先設(shè)置對(duì)應(yīng)的喚醒參數(shù),以聲強(qiáng)為例,在近處的區(qū)域設(shè)置較大的門限,而在遠(yuǎn)處區(qū)域設(shè)置較小的門限,從而使各個(gè)區(qū)域都達(dá)到較高的喚醒率。如圖2所示的三個(gè)區(qū)域各自具有一套喚醒參數(shù),從而提高了語(yǔ)音交互場(chǎng)景下用戶的使用體驗(yàn)。

o4YBAF9uXCGAUjaBAAITFAM0hTk601.png

圖3 語(yǔ)音喚醒方法流程圖

圖3是此專利提供的一種語(yǔ)音喚醒方法流程示意圖。以智能電視為例,首先設(shè)備通過(guò)攝像頭采集圖像,并通過(guò)采集的圖像確定其中是否包含用戶,如果包含則確定圖像中第一用戶所在的第一目標(biāo)位置,并獲取該位置下的喚醒參數(shù)。當(dāng)用戶輸入語(yǔ)音后,設(shè)備根據(jù)上述喚醒參數(shù)處理輸入語(yǔ)音信號(hào)。如果用戶從區(qū)域1切換到區(qū)域2,則設(shè)備獲取區(qū)域2中的喚醒參數(shù)并進(jìn)行信號(hào)處理,包括模數(shù)轉(zhuǎn)換、降噪、放大等,因此該設(shè)備可根據(jù)用戶所在位置實(shí)時(shí)動(dòng)態(tài)的對(duì)切換喚醒參數(shù),達(dá)到更好的人機(jī)交互效果。

在智能語(yǔ)音服務(wù)上,Google和亞馬遜的是目前公認(rèn)的業(yè)界巨頭,然而從此項(xiàng)專利可以推斷出華為在語(yǔ)音業(yè)務(wù)上也在不斷努力發(fā)展!

編輯:hfy
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 華為
    +關(guān)注

    關(guān)注

    217

    文章

    35618

    瀏覽量

    259736
  • 人工智能
    +關(guān)注

    關(guān)注

    1812

    文章

    49536

    瀏覽量

    259245
  • 語(yǔ)音交互
    +關(guān)注

    關(guān)注

    3

    文章

    329

    瀏覽量

    29010
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    揭秘AI玩具“聽得清”的秘密!這幾款語(yǔ)音前端芯片撐起交互體驗(yàn)天花板

    電子發(fā)燒友網(wǎng)報(bào)道(文/黃山明)在AI大模型的加持下,AI玩具的最重要的功能便是語(yǔ)音交互,而要做到較好的語(yǔ)音交互,少不了
    的頭像 發(fā)表于 10-17 08:42 ?9129次閱讀

    廣州唯創(chuàng)電子WTN6系列語(yǔ)音芯片:四維控制模式重塑智能設(shè)備交互體驗(yàn)

    在智能化設(shè)備普及的今天,靈活高效的控制方式成為產(chǎn)品差異化競(jìng)爭(zhēng)的關(guān)鍵。廣州唯創(chuàng)電子WTN6系列語(yǔ)音芯片以其獨(dú)特的四種控制模式,為智能設(shè)備提供了前所未有的設(shè)計(jì)靈活性。隨著物聯(lián)網(wǎng)
    的頭像 發(fā)表于 10-09 08:45 ?171次閱讀
    廣州唯創(chuàng)<b class='flag-5'>電子</b>WTN6系列<b class='flag-5'>語(yǔ)音</b>芯片:四維控制模式重塑智能<b class='flag-5'>設(shè)備</b><b class='flag-5'>交互</b>體驗(yàn)

    “芯”聲代,智未來(lái)—VS680本地語(yǔ)音交互系統(tǒng) #語(yǔ)音交互 #芯片

    語(yǔ)音交互
    深蕾半導(dǎo)體
    發(fā)布于 :2025年09月17日 10:59:30

    賦能智能語(yǔ)音交互:廣州唯創(chuàng)電子WTV系列語(yǔ)音芯片IC引領(lǐng)播放與報(bào)警設(shè)備新變革

    在萬(wàn)物互聯(lián)與智能化浪潮的推動(dòng)下,語(yǔ)音交互已成為人機(jī)溝通最自然、最直接的橋梁。語(yǔ)音播放器與報(bào)警器作為這一技術(shù)的關(guān)鍵載體,正廣泛應(yīng)用于公共安全、智能家居、工業(yè)控制及交通管理等領(lǐng)域。然而,傳
    的頭像 發(fā)表于 09-01 09:30 ?266次閱讀
    賦能智能<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>:廣州唯創(chuàng)<b class='flag-5'>電子</b>WTV系列<b class='flag-5'>語(yǔ)音</b>芯片IC引領(lǐng)播放與報(bào)警<b class='flag-5'>設(shè)備</b>新變革

    廣州唯創(chuàng)電子常用語(yǔ)音芯片全解析:賦能智能語(yǔ)音交互的多場(chǎng)景應(yīng)用

    語(yǔ)音芯片作為智能設(shè)備實(shí)現(xiàn)語(yǔ)音交互的核心部件,已廣泛應(yīng)用于家居、車載、醫(yī)療、工業(yè)等領(lǐng)域。廣州唯創(chuàng)電子憑借多年的
    的頭像 發(fā)表于 08-28 08:41 ?343次閱讀
    廣州唯創(chuàng)<b class='flag-5'>電子</b>常用<b class='flag-5'>語(yǔ)音</b>芯片全解析:賦能智能<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>的多場(chǎng)景應(yīng)用

    普強(qiáng)智能語(yǔ)音技術(shù)重新定義車載交互邊界

    普強(qiáng)憑借自主研發(fā)的智能語(yǔ)音技術(shù),為某國(guó)內(nèi)頭部車企提供的語(yǔ)音前處理、喚醒詞、ASR、TTS等技術(shù)
    的頭像 發(fā)表于 07-11 14:00 ?842次閱讀

    告別 “起床氣”!NV340D 語(yǔ)音芯片解鎖電子鬧鐘喚醒新體驗(yàn)!

    在快節(jié)奏的現(xiàn)代生活中,電子鬧鐘作為我們每天清晨的“喚醒伙伴”,其重要性不言而喻。如今,隨著科技的飛速發(fā)展,電子鬧鐘也在不斷進(jìn)化,功能日益豐富。而這背后,離不開關(guān)鍵技術(shù)——
    的頭像 發(fā)表于 07-05 11:09 ?947次閱讀
    告別 “起床氣”!NV340D <b class='flag-5'>語(yǔ)音</b>芯片解鎖<b class='flag-5'>電子</b>鬧鐘<b class='flag-5'>喚醒</b>新體驗(yàn)!

    語(yǔ)音助手只能聊天?啟明云端AI語(yǔ)音交互方案偷偷修煉了音樂才藝!

    語(yǔ)音助手只能聊天?太out了!”語(yǔ)音交互的新樂章已經(jīng)奏響!啟明云端基于樂鑫科技芯片的AI語(yǔ)音方案正式解鎖音樂技能樹,只需一句指令,智能設(shè)備
    的頭像 發(fā)表于 06-27 18:03 ?555次閱讀
    <b class='flag-5'>語(yǔ)音</b>助手只能聊天?啟明云端AI<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>方案偷偷修煉了音樂才藝!

    芯資訊|廣州唯創(chuàng)電子WTK6900P語(yǔ)音識(shí)別芯片:離線語(yǔ)音交互的革新者

    在智能設(shè)備全面普及的浪潮中,語(yǔ)音交互技術(shù)正逐步從“云端依賴”向“本地化高效處理”演進(jìn)。廣州唯創(chuàng)電子推出的WTK6900P
    的頭像 發(fā)表于 05-22 09:22 ?486次閱讀
    芯資訊|廣州唯創(chuàng)<b class='flag-5'>電子</b>WTK6900P<b class='flag-5'>語(yǔ)音</b>識(shí)別芯片:離線<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>的革新者

    芯資訊|廣州唯創(chuàng)電子WTV系列語(yǔ)音芯片:以技術(shù)創(chuàng)新賦能智能語(yǔ)音交互

    在萬(wàn)物互聯(lián)的智能化時(shí)代,語(yǔ)音交互技術(shù)已成為人機(jī)交互的重要橋梁。廣州唯創(chuàng)電子深耕語(yǔ)音芯片領(lǐng)域多年,
    的頭像 發(fā)表于 05-21 08:45 ?439次閱讀
    芯資訊|廣州唯創(chuàng)<b class='flag-5'>電子</b>WTV系列<b class='flag-5'>語(yǔ)音</b>芯片:以<b class='flag-5'>技術(shù)</b>創(chuàng)新賦能智能<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>

    智能收銀語(yǔ)音交互新標(biāo)桿—WT3000T8語(yǔ)音合成芯片TTS技術(shù)應(yīng)用解析

    一、行業(yè)應(yīng)用背景在零售業(yè)態(tài)智能化轉(zhuǎn)型的浪潮中,收銀設(shè)備正經(jīng)歷從功能型向服務(wù)型轉(zhuǎn)變的關(guān)鍵階段。WT3000T8語(yǔ)音合成芯片應(yīng)運(yùn)而生,專為滿足新零售場(chǎng)景下智能收銀終端的語(yǔ)音交互需求而設(shè)計(jì)。
    的頭像 發(fā)表于 04-24 08:45 ?515次閱讀
    智能收銀<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>新標(biāo)桿—WT3000T8<b class='flag-5'>語(yǔ)音</b>合成芯片TTS<b class='flag-5'>技術(shù)</b>應(yīng)用解析

    智能語(yǔ)音交互方案在客服領(lǐng)域的應(yīng)用

    著客服行業(yè)的面貌,為企業(yè)和用戶帶來(lái)了全新的體驗(yàn)。 語(yǔ)音識(shí)別模型優(yōu)化私部署 方案:精準(zhǔn)高效,定制專屬服務(wù) 語(yǔ)音識(shí)別技術(shù)作為智能語(yǔ)音交互的基礎(chǔ),
    的頭像 發(fā)表于 04-11 14:35 ?480次閱讀

    零知開源——ESP32語(yǔ)音交互系統(tǒng)(AI小智)開發(fā)教程

    小智AI聊天機(jī)器人是一個(gè)基于嵌入式硬件與人工智能技術(shù)深度融合的智能交互系統(tǒng)。該項(xiàng)目以ESP32開發(fā)板為核心,結(jié)合語(yǔ)音喚醒、自然語(yǔ)言處理、音頻解碼播放及圖形化
    的頭像 發(fā)表于 03-29 15:33 ?9329次閱讀
    零知開源——ESP32<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>系統(tǒng)(AI小智)開發(fā)教程

    基于智能語(yǔ)音交互的智能呼叫中心工作機(jī)制

    作為實(shí)現(xiàn)智能呼叫中心的關(guān)鍵技術(shù)之一的智能語(yǔ)音交互技術(shù),它通過(guò)集成自然語(yǔ)言處理(NLP)、語(yǔ)音識(shí)別(ASR)和
    的頭像 發(fā)表于 12-03 16:44 ?919次閱讀
    基于智能<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>的智能呼叫中心工作機(jī)制

    智能語(yǔ)音的驅(qū)動(dòng)力:揭秘8腳語(yǔ)音芯片在智能設(shè)備中的非凡角色

    語(yǔ)音技術(shù)滲透生活,8腳語(yǔ)音芯片以微縮體積、低功耗、卓越性能成智能設(shè)備語(yǔ)音功能核心,集成識(shí)別、合成、壓縮解碼等功能,實(shí)現(xiàn)精準(zhǔn)
    的頭像 發(fā)表于 12-02 14:23 ?700次閱讀