chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

華為研發(fā)語音喚醒方法及電子設備的語音交互技術

454398 ? 來源:搜狐 ? 作者:搜狐 ? 2021-01-09 09:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

通常語音交互過程通常分為喚醒、響應、輸入、理解、反饋幾個環(huán)節(jié),語音交互技術也一直是IBM、微軟、百度等遙遙領先。

幾個月前,華為消費者業(yè)務CEO余承東表示華為正在研發(fā)國際版的語音助手,同時建立自己的AI服務,并將在未來擴展到國際市場。

人工智能的潮流推動下,智能化語音技術不斷發(fā)展,許多電子設備中都添加了語音助手,如Siri、小愛同學、天貓精靈等,用來協(xié)助用戶進行人機交互過程。為了使得語音助手能夠及時檢測并響應用戶發(fā)出的語音交互指令,電子設備一般會預設一些喚醒詞,如“Hi Siri”等,當檢測到用戶輸入喚醒詞時,可觸發(fā)電子設備與用戶進行交流。通常設備設置喚醒詞的聲強門限60dB,當用戶輸入聲強大于60dB時,電子設備檢測成功,然而當用戶距離設備較遠時,由于輸入聲強的降低,電子設備往往難以檢測到輸入語音信號從喚醒失敗。在這種情況下,如何在遠距離下提高語音助手喚醒成功率成為諸多企業(yè)競相研究的熱點。

華為公司于2019年7月25日提出了一項名為“一種語音喚醒方法及電子設備”的發(fā)明專利(申請?zhí)枺?01910677390 .9),申請人為華為技術有限公司。

此發(fā)明專利介紹了一種語音喚醒方法及相對應的電子設備,可以在較廣的位置范圍內(nèi)保證電子設備被成功喚醒的幾率,從而提高用戶的使用體驗,而該種方法可以被應用于諸如智能家居設備、PC、手機、音箱等具有語音交互功能的電子設備之中。

o4YBAF9uXB6ASSloAACJI4NT3Lc054.png

圖1 語音交互過程示意圖

通常語音交互過程可分為喚醒、響應、輸入、理解、反饋幾個環(huán)節(jié)。當設備處于待機狀態(tài)時,需要識別用戶輸入的語音喚醒信號,如果識別成功則切換到工作狀態(tài),此后則可以通過語音識別算法用戶對輸入的語義內(nèi)容進行識別并響應,整個過程如圖1所示。

從上述過程可以看出,成功喚醒電子設備是實現(xiàn)人機語音交互的基礎,而喚醒設備的過程就是通過預設的喚醒參數(shù)檢測用戶的語音輸入。喚醒參數(shù)如喚醒門限、拾音方向、噪聲抑制參數(shù)、放大增益等的取值決定了電子設備在檢測喚醒輸入語音時喚醒率的高低。在實際使用過程中,用戶相對設備的位置差異導致了喚醒率的不同,因此根據(jù)用戶所在的位置動態(tài)設置喚醒參數(shù)可以使得電子設備在不同位置場景下保持較高的喚醒率。

pIYBAF9uXCCACWbGAAEKoHGuKwk742.png

圖2 語音喚醒方法應用場景示意圖

圖2為上述提到的基于用戶位置信息來劃分區(qū)域,從而進行語音喚醒的示意圖。電子設備在待機狀態(tài)時可周期性地通過攝像頭采集用戶圖像信息,并根據(jù)圖像確定用戶所在的位置信息。對于不同區(qū)域,設備可預先設置對應的喚醒參數(shù),以聲強為例,在近處的區(qū)域設置較大的門限,而在遠處區(qū)域設置較小的門限,從而使各個區(qū)域都達到較高的喚醒率。如圖2所示的三個區(qū)域各自具有一套喚醒參數(shù),從而提高了語音交互場景下用戶的使用體驗。

o4YBAF9uXCGAUjaBAAITFAM0hTk601.png

圖3 語音喚醒方法流程圖

圖3是此專利提供的一種語音喚醒方法流程示意圖。以智能電視為例,首先設備通過攝像頭采集圖像,并通過采集的圖像確定其中是否包含用戶,如果包含則確定圖像中第一用戶所在的第一目標位置,并獲取該位置下的喚醒參數(shù)。當用戶輸入語音后,設備根據(jù)上述喚醒參數(shù)處理輸入語音信號。如果用戶從區(qū)域1切換到區(qū)域2,則設備獲取區(qū)域2中的喚醒參數(shù)并進行信號處理,包括模數(shù)轉換、降噪、放大等,因此該設備可根據(jù)用戶所在位置實時動態(tài)的對切換喚醒參數(shù),達到更好的人機交互效果。

在智能語音服務上,Google和亞馬遜的是目前公認的業(yè)界巨頭,然而從此項專利可以推斷出華為在語音業(yè)務上也在不斷努力發(fā)展!

編輯:hfy
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 華為
    +關注

    關注

    216

    文章

    35200

    瀏覽量

    255819
  • 人工智能
    +關注

    關注

    1806

    文章

    48996

    瀏覽量

    249244
  • 語音交互
    +關注

    關注

    3

    文章

    307

    瀏覽量

    28607
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    普強智能語音技術重新定義車載交互邊界

    普強憑借自主研發(fā)的智能語音技術,為某國內(nèi)頭部車企提供的語音前處理、喚醒詞、ASR、TTS等技術
    的頭像 發(fā)表于 07-11 14:00 ?312次閱讀

    告別 “起床氣”!NV340D 語音芯片解鎖電子鬧鐘喚醒新體驗!

    在快節(jié)奏的現(xiàn)代生活中,電子鬧鐘作為我們每天清晨的“喚醒伙伴”,其重要性不言而喻。如今,隨著科技的飛速發(fā)展,電子鬧鐘也在不斷進化,功能日益豐富。而這背后,離不開關鍵技術——
    的頭像 發(fā)表于 07-05 11:09 ?308次閱讀
    告別 “起床氣”!NV340D <b class='flag-5'>語音</b>芯片解鎖<b class='flag-5'>電子</b>鬧鐘<b class='flag-5'>喚醒</b>新體驗!

    語音助手只能聊天?啟明云端AI語音交互方案偷偷修煉了音樂才藝!

    語音助手只能聊天?太out了!”語音交互的新樂章已經(jīng)奏響!啟明云端基于樂鑫科技芯片的AI語音方案正式解鎖音樂技能樹,只需一句指令,智能設備
    的頭像 發(fā)表于 06-27 18:03 ?151次閱讀
    <b class='flag-5'>語音</b>助手只能聊天?啟明云端AI<b class='flag-5'>語音</b><b class='flag-5'>交互</b>方案偷偷修煉了音樂才藝!

    芯資訊|廣州唯創(chuàng)電子WTK6900P語音識別芯片:離線語音交互的革新者

    在智能設備全面普及的浪潮中,語音交互技術正逐步從“云端依賴”向“本地化高效處理”演進。廣州唯創(chuàng)電子推出的WTK6900P
    的頭像 發(fā)表于 05-22 09:22 ?234次閱讀
    芯資訊|廣州唯創(chuàng)<b class='flag-5'>電子</b>WTK6900P<b class='flag-5'>語音</b>識別芯片:離線<b class='flag-5'>語音</b><b class='flag-5'>交互</b>的革新者

    芯資訊|廣州唯創(chuàng)電子WTV系列語音芯片:以技術創(chuàng)新賦能智能語音交互

    在萬物互聯(lián)的智能化時代,語音交互技術已成為人機交互的重要橋梁。廣州唯創(chuàng)電子深耕語音芯片領域多年,
    的頭像 發(fā)表于 05-21 08:45 ?200次閱讀
    芯資訊|廣州唯創(chuàng)<b class='flag-5'>電子</b>WTV系列<b class='flag-5'>語音</b>芯片:以<b class='flag-5'>技術</b>創(chuàng)新賦能智能<b class='flag-5'>語音</b><b class='flag-5'>交互</b>

    智能收銀語音交互新標桿—WT3000T8語音合成芯片TTS技術應用解析

    一、行業(yè)應用背景在零售業(yè)態(tài)智能化轉型的浪潮中,收銀設備正經(jīng)歷從功能型向服務型轉變的關鍵階段。WT3000T8語音合成芯片應運而生,專為滿足新零售場景下智能收銀終端的語音交互需求而設計。
    的頭像 發(fā)表于 04-24 08:45 ?267次閱讀
    智能收銀<b class='flag-5'>語音</b><b class='flag-5'>交互</b>新標桿—WT3000T8<b class='flag-5'>語音</b>合成芯片TTS<b class='flag-5'>技術</b>應用解析

    智能語音交互方案在客服領域的應用

    著客服行業(yè)的面貌,為企業(yè)和用戶帶來了全新的體驗。 語音識別模型優(yōu)化私部署 方案:精準高效,定制專屬服務 語音識別技術作為智能語音交互的基礎,
    的頭像 發(fā)表于 04-11 14:35 ?286次閱讀

    零知開源——ESP32語音交互系統(tǒng)(AI小智)開發(fā)教程

    小智AI聊天機器人是一個基于嵌入式硬件與人工智能技術深度融合的智能交互系統(tǒng)。該項目以ESP32開發(fā)板為核心,結合語音喚醒、自然語言處理、音頻解碼播放及圖形化
    的頭像 發(fā)表于 03-29 15:33 ?6975次閱讀
    零知開源——ESP32<b class='flag-5'>語音</b><b class='flag-5'>交互</b>系統(tǒng)(AI小智)開發(fā)教程

    芯資訊|WT3000T8語音合成芯片:高性價比語音交互解決方案

    在智能終端設備快速普及的當下,語音交互已成為提升用戶體驗的關鍵功能。廣州唯創(chuàng)電子推出的WT3000T8語音合成芯片,憑借其卓越的
    的頭像 發(fā)表于 03-24 09:05 ?423次閱讀
    芯資訊|WT3000T8<b class='flag-5'>語音</b>合成芯片:高性價比<b class='flag-5'>語音</b><b class='flag-5'>交互</b>解決方案

    WTV380-8S語音芯片:智能清潔設備的“語音助手”,小體積大能量,重塑人機交互體驗

    隨著智能家居的普及,掃地機器人、擦窗機器人、洗地機等清潔設備正從“功能型”向“智能交互型”躍遷。用戶不僅需要高效的清潔能力,更期待直觀的語音提示、多傳感器協(xié)同以及穩(wěn)定可靠的性能。WTV380-8S
    的頭像 發(fā)表于 03-14 09:12 ?350次閱讀
    WTV380-8S<b class='flag-5'>語音</b>芯片:智能清潔<b class='flag-5'>設備</b>的“<b class='flag-5'>語音</b>助手”,小體積大能量,重塑人機<b class='flag-5'>交互</b>體驗

    基于WT3000A-M6語音識別模組的智慧廚房語音交互系統(tǒng)設計方案

    %喚醒率多模態(tài)交互:支持語音+手勢復合指令(需擴展傳感器)安全防護:燃氣泄漏/干燒等風險場景100ms級應急響應生態(tài)兼容:無縫接入HomeKit/Alexa/華為HiLink等主流平臺
    的頭像 發(fā)表于 03-12 09:18 ?451次閱讀
    基于WT3000A-M6<b class='flag-5'>語音</b>識別模組的智慧廚房<b class='flag-5'>語音</b><b class='flag-5'>交互</b>系統(tǒng)設計方案

    基于WTV380-8S語音芯片的智能電子語音交互系統(tǒng)設計方案介紹

    ?一、方案背景與需求智能電子鎖作為現(xiàn)代家居安防的核心設備,用戶對交互友好性、功能多樣性和系統(tǒng)穩(wěn)定性的需求日益提升。WTV380-8S語音芯片憑借多模式控制、高集成度、低功耗設計及豐富的
    的頭像 發(fā)表于 03-06 08:56 ?406次閱讀
    基于WTV380-8S<b class='flag-5'>語音</b>芯片的智能<b class='flag-5'>電子</b>鎖<b class='flag-5'>語音</b><b class='flag-5'>交互</b>系統(tǒng)設計方案介紹

    【智能語音交互新標桿】WTK6900HC語音識別芯片:重新定義離線語音控制體驗

    在萬物智聯(lián)時代,離線語音控制技術正以革命性姿態(tài)重塑智能設備交互方式。WTK6900HC語音識別芯片憑借其突破性的
    的頭像 發(fā)表于 03-05 09:26 ?398次閱讀
    【智能<b class='flag-5'>語音</b><b class='flag-5'>交互</b>新標桿】WTK6900HC<b class='flag-5'>語音</b>識別芯片:重新定義離線<b class='flag-5'>語音</b>控制體驗

    基于智能語音交互的智能呼叫中心工作機制

    作為實現(xiàn)智能呼叫中心的關鍵技術之一的智能語音交互技術,它通過集成自然語言處理(NLP)、語音識別(ASR)和
    的頭像 發(fā)表于 12-03 16:44 ?702次閱讀
    基于智能<b class='flag-5'>語音</b><b class='flag-5'>交互</b>的智能呼叫中心工作機制

    智能語音的驅(qū)動力:揭秘8腳語音芯片在智能設備中的非凡角色

    語音技術滲透生活,8腳語音芯片以微縮體積、低功耗、卓越性能成智能設備語音功能核心,集成識別、合成、壓縮解碼等功能,實現(xiàn)精準
    的頭像 發(fā)表于 12-02 14:23 ?528次閱讀