chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何使用音頻來估計(jì)與講話用戶之間的距離,并識(shí)別周圍的聲音

倩倩 ? 來源:百度粉絲網(wǎng) ? 作者:百度粉絲網(wǎng) ? 2021-01-22 16:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

最新研究表明,蘋果公司正在研究HomePod或其他設(shè)備如何使用音頻來估計(jì)與講話用戶之間的距離,并識(shí)別周圍的聲音。

Apple的HomePod已經(jīng)非常擅長(zhǎng)于聽到您的聲音,即使它正在大聲播放音樂。蘋果公司有兩項(xiàng)單獨(dú)的新專利申請(qǐng)表明,蘋果公司希望將其改進(jìn),并將設(shè)備的聆聽能力提高到一個(gè)新水平。

其中之一,“基于學(xué)習(xí)的距離估計(jì)”,不僅涉及使用音頻來識(shí)別用戶,而且要弄清楚他們?cè)谀睦铩?/p>

專利申請(qǐng)說:“通常希望設(shè)備使用[其]緊湊型麥克風(fēng)陣列來估算從設(shè)備到用戶的距離。” “例如,該設(shè)備可以基于用戶到該設(shè)備的估計(jì)距離來調(diào)整播放音量或來自智能輔助設(shè)備的響應(yīng)?!?/p>

繼續(xù)說:“因此,如果用戶離設(shè)備非常近,則不會(huì)大量播放音樂或語音?!?或者,如果用戶離得很遠(yuǎn),則可以將媒體播放或來自智能助手設(shè)備的響應(yīng)調(diào)整為更大的音量。”

同樣的想法也意味著將其引入蘋果公司目前令人印象深刻但有些瑕疵的系統(tǒng),在該系統(tǒng)中,所有設(shè)備都會(huì)嘗試確定您對(duì)“嘿,Siri”說的是什么。

蘋果公司說:“在有多個(gè)設(shè)備的應(yīng)用程序中,這些設(shè)備可以在彼此之間進(jìn)行協(xié)調(diào)或仲裁,以根據(jù)從每個(gè)設(shè)備到用戶的距離來決定應(yīng)回答一個(gè)或多個(gè)設(shè)備的查詢?!?/p>

蘋果公司提出了簡(jiǎn)單和更復(fù)雜的解決方案,它們都可以同時(shí)使用。更簡(jiǎn)單的方法是讓設(shè)備先執(zhí)行HomePod的工作并首先繪制其環(huán)境圖。

然后,它實(shí)際上具有“在聲學(xué)環(huán)境中的測(cè)量點(diǎn)或模擬點(diǎn)的網(wǎng)格”。在這種情況下,可以將聲音與此“網(wǎng)格”進(jìn)行比較,以大致了解說話者所在的位置。

但是,Apple認(rèn)為這本身并不足夠好,并且還說它與Siri最少一起使用。那是因?yàn)橐粋€(gè)人說話時(shí)可能會(huì)動(dòng)彈,而且他們要求快速回應(yīng)-此提議不適合。

備選地,然后,“如果至少兩個(gè)麥克風(fēng)陣列可用”,則“可以使用三角測(cè)量方法來估計(jì)語音源的距離”。

但是,這里的關(guān)鍵部分是至少需要兩個(gè)帶麥克風(fēng)的設(shè)備。因此,Apple提供了另一個(gè)涉及更多的解決方案,其中涉及“基于學(xué)習(xí)的系統(tǒng),如深度神經(jīng)網(wǎng)絡(luò)(DNN)”,并且不需要多個(gè)設(shè)備。

專利申請(qǐng)說:“深度學(xué)習(xí)系統(tǒng)可以根據(jù)緊湊型麥克風(fēng)陣列接收到的語音信號(hào)來估計(jì)每個(gè)時(shí)間幀的語音源距離。”

這個(gè)DNN系統(tǒng)可以做的是確定什么是語音,什么是背景噪聲。然后,它可以計(jì)算“有關(guān)直接信號(hào)傳播的信息”以及“混響效果和噪聲”。

該申請(qǐng)歸功于三位發(fā)明者,包括Mehrez Souden和Joshua D. Atkins。他們先前的相關(guān)工作包括已獲專利的如何使用比普通麥克風(fēng)少的聲音來錄制完整空間聲音的專利。

這特別涉及Apple AR中的音頻,該最新專利申請(qǐng)涉及真實(shí)環(huán)境中的物理設(shè)備。但是,如果只是為了避免用太大聲的HomePod mini炸毀別人的耳朵而感到很麻煩,那還有很多事情要做。

該專利申請(qǐng)說:“例如,助聽器之類的輔助和增強(qiáng)型助聽器可以根據(jù)語音源的距離來增強(qiáng)音頻信號(hào)。”

這也是第二個(gè)新公開的專利申請(qǐng)重點(diǎn)關(guān)注的內(nèi)容。

識(shí)別重要的聲音

“基于觀察到的聲音識(shí)別聲源的系統(tǒng)和方法”,是關(guān)于讓一些設(shè)備識(shí)別其他聲音并為我們做出反應(yīng)。

“許多家用電器,例如微波爐,洗衣機(jī),洗碗機(jī)和門鈴,會(huì)發(fā)出聲音來提醒用戶該器具的狀況已經(jīng)改變,”該專利申請(qǐng)開始。

它繼續(xù)說:“但是,由于各種原因,用戶可能無法聽到家用電器發(fā)出的聲音警報(bào)?!?“例如,用戶可能有聽力障礙,用戶可能在外面或在另一個(gè)房間里,或者設(shè)備可能發(fā)出被家庭聲學(xué)場(chǎng)景遮擋的聲音?!?/p>

也不必是您的煮蛋計(jì)時(shí)器關(guān)閉。該專利同樣涉及“公共場(chǎng)所(政府大樓),半公共場(chǎng)所(辦公室大廳)和私人場(chǎng)所(住宅或辦公大樓)”中的聲音。

它說:“(這些)也有聲學(xué)場(chǎng)景,可以包含帶有信息的聲音?!?“例如,鈴,鈴或蜂鳴器可能指示門已經(jīng)打開或關(guān)閉,或者警報(bào)器可能發(fā)出警報(bào)聲或其他聲音,警告附近的人有危險(xiǎn)(例如,煙,火或一氧化碳)?!?/p>

總體而言,該專利申請(qǐng)主要詳述了可以“訓(xùn)練”設(shè)備以識(shí)別“常見聲音”的方法。然后,它將繼續(xù)偵聽其中的任何一個(gè),并且當(dāng)聽到一個(gè)聲音時(shí),可以發(fā)出“響應(yīng)于確定聲音存在于聲學(xué)場(chǎng)景中的選定輸出”。

換句話說,如果是您的煮蛋計(jì)時(shí)器關(guān)閉,則該設(shè)備可能會(huì)使您的Apple Watch在手腕上輕按?;蛘?,如果是防盜警報(bào),則該設(shè)備可以通知當(dāng)局。

蘋果公司表示:“聲音中包含大量的上下文信息?!?“識(shí)別常見的聲音可以使電子設(shè)備響應(yīng)于觀察到的環(huán)境(例如,根據(jù)觀察到的聲音確定)來適應(yīng)其行為或提供服務(wù),從而增加它們對(duì)用戶的相關(guān)性和價(jià)值,同時(shí)需要更少的用戶幫助或輸入?!?/p>

第二項(xiàng)專利申請(qǐng)歸功于包括丹尼爾·克林格(Daniel C. Klinger)在內(nèi)的四位發(fā)明家。他先前的工作包括一項(xiàng)專利申請(qǐng),該專利用于通過HomePod或其他設(shè)備進(jìn)行安全的電話呼叫。

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 音頻
    +關(guān)注

    關(guān)注

    31

    文章

    3136

    瀏覽量

    84944
  • 蘋果公司
    +關(guān)注

    關(guān)注

    2

    文章

    448

    瀏覽量

    23964
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5591

    瀏覽量

    123923
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    哪款二維條碼識(shí)別器支持遠(yuǎn)距離連續(xù)掃描的?遠(yuǎn)距離掃描模組介紹

    在物流倉(cāng)儲(chǔ)、停車場(chǎng)收費(fèi)、高速公路自助繳費(fèi)等場(chǎng)景中,工作人員常常需要對(duì)遠(yuǎn)距離的二維條碼進(jìn)行快速識(shí)別,傳統(tǒng)設(shè)備因掃描距離有限、穩(wěn)定性不足,難以滿足高效作業(yè)需求。此時(shí),搭載專業(yè)“遠(yuǎn)距離掃描模
    的頭像 發(fā)表于 11-12 16:20 ?189次閱讀
    哪款二維條碼<b class='flag-5'>識(shí)別</b>器支持遠(yuǎn)<b class='flag-5'>距離</b>連續(xù)掃描的?遠(yuǎn)<b class='flag-5'>距離</b>掃描模組介紹

    解鎖聲音定位新維度,AR-1105 雙數(shù)字麥克風(fēng)陣列板引領(lǐng)音頻感知革命

    AR-1105 是一款性能卓越的雙數(shù)字麥克風(fēng)陣列板,具備 360 度 6 方向聲音識(shí)別能力,工作電壓覆蓋 4-6.5V,拾音范圍達(dá) 10-200CM,支持模擬和數(shù)字音頻雙端口輸出。它可
    的頭像 發(fā)表于 11-07 09:14 ?535次閱讀
    解鎖<b class='flag-5'>聲音</b>定位新維度,AR-1105 雙數(shù)字麥克風(fēng)陣列板引領(lǐng)<b class='flag-5'>音頻</b>感知革命

    使用 APx 音頻分析儀進(jìn)行開環(huán)音頻測(cè)試

    在本文中,我們將討論開環(huán)音頻測(cè)試的一些挑戰(zhàn),介紹APx500軟件中可用于簡(jiǎn)化這些測(cè)試的資源。閉環(huán)測(cè)試與開環(huán)測(cè)試首先,一些定義:我們使用“閉環(huán)”這一術(shù)語指代一種經(jīng)典的音頻測(cè)試方法,即
    的頭像 發(fā)表于 10-13 09:07 ?316次閱讀
    使用 APx <b class='flag-5'>音頻</b>分析儀進(jìn)行開環(huán)<b class='flag-5'>音頻</b>測(cè)試

    釋放聲音的維度:高性能評(píng)估板為沉浸式音頻體驗(yàn)快速便捷構(gòu)建聲場(chǎng)工具

    A316-V71-Game-V1是一款基于XMOS XU316技術(shù)的虛擬7.1游戲聲卡評(píng)估平臺(tái),能夠?qū)⒘Ⅲw聲音頻轉(zhuǎn)換為虛擬7.1聲道環(huán)繞聲,為游戲玩家提供身臨其境的音頻體驗(yàn),幫助精確定位游戲中的聲音方向。
    的頭像 發(fā)表于 09-30 14:14 ?343次閱讀
    釋放<b class='flag-5'>聲音</b>的維度:高性能評(píng)估板為沉浸式<b class='flag-5'>音頻</b>體驗(yàn)快速便捷構(gòu)建聲場(chǎng)工具

    【上海晶珩睿莓1開發(fā)板試用體驗(yàn)】GPIO事件監(jiān)控&amp;USB asound聲卡設(shè)備錄入聲音通過云平臺(tái)識(shí)別

    系統(tǒng)中直接使用命令arecord -f S16_LE -c 1 -r 16000 -d 3 -D hw:1 /home/arecord.wav錄制聲音。 將錄制好的wav文件通過libcurl庫(kù)
    發(fā)表于 09-09 18:28

    Texas Instruments TAD5142立體聲音頻DAC數(shù)據(jù)手冊(cè)

    Texas Instruments TAD5142立體聲音頻數(shù)模轉(zhuǎn)換器(DAC)是一款2V~RMS~ 110dB立體聲音頻DAC,可配置為線路輸出或耳機(jī)負(fù)載,支持單端和差分輸出選項(xiàng)。該設(shè)備集成
    的頭像 發(fā)表于 07-17 09:43 ?484次閱讀
    Texas Instruments TAD5142立體<b class='flag-5'>聲音頻</b>DAC數(shù)據(jù)手冊(cè)

    紫光展銳T8300 5G SoC為用戶開創(chuàng)主流音頻新體驗(yàn)

    數(shù)字化時(shí)代,從語音通話到智能交互,從聆聽音樂到創(chuàng)作Vlog,聲音已成為隱形的基礎(chǔ)措施。日益發(fā)展的音頻技術(shù)正在重構(gòu)用戶感知世界的方式,重塑用戶的聽覺體驗(yàn)。
    的頭像 發(fā)表于 06-13 10:07 ?766次閱讀

    筆記本聲音問題

    各位大佬,我求助一下:我的筆記本電腦,win10系統(tǒng),之前的聲卡就是英特爾智音技術(shù),但是因?yàn)榇嬖谕桃舻膯栴},我更新了兩次,結(jié)果現(xiàn)在外放沒聲音了,插入耳機(jī)不識(shí)別耳機(jī)但是外放有聲音,連接
    發(fā)表于 04-22 11:38

    電機(jī)、變頻器之間距離多少為宜?·

    在工業(yè)自動(dòng)化領(lǐng)域,電機(jī)與變頻器作為驅(qū)動(dòng)系統(tǒng)的核心組件,其性能與穩(wěn)定性直接影響到生產(chǎn)線的效率與安全性。而電機(jī)與變頻器之間距離,作為影響這一系統(tǒng)性能的關(guān)鍵因素之一,往往被工程師們所重視。本文將從理論
    的頭像 發(fā)表于 04-17 16:44 ?1439次閱讀
    電機(jī)、變頻器<b class='flag-5'>之間</b>的<b class='flag-5'>距離</b>多少為宜?·

    一款帶有采樣速率8kHz-96kHz的立體聲音頻模數(shù)轉(zhuǎn)換器-MS2358

    MS2358是帶有采樣速率8kHz-96kHz的立體聲音頻模數(shù)轉(zhuǎn)換器,適合于面向消費(fèi)者的專業(yè)音頻系統(tǒng)。MS2358通過使用增強(qiáng)型雙位Δ-∑技術(shù)實(shí)現(xiàn)其高精度的特點(diǎn)。
    的頭像 發(fā)表于 04-16 09:44 ?530次閱讀
    一款帶有采樣速率8kHz-96kHz的立體<b class='flag-5'>聲音頻</b>模數(shù)轉(zhuǎn)換器-MS2358

    CLRC663如何增強(qiáng)對(duì)RFID標(biāo)簽ic的識(shí)別距離

    我現(xiàn)在在使用clrc663通過ISO15693協(xié)議識(shí)別rifd標(biāo)簽 ic無線圈(尺寸5*5mm),我現(xiàn)在的方案識(shí)別距離很短接近0時(shí)才能識(shí)別,我這邊需要將
    發(fā)表于 03-17 07:50

    均衡器與音頻效果器的區(qū)別

    強(qiáng)度。它允許用戶增強(qiáng)或減弱特定頻率范圍的聲音,以達(dá)到改善音質(zhì)、去除不需要的噪聲或增強(qiáng)音樂的特定部分等目的。 工作原理 均衡器通過一系列可調(diào)節(jié)的濾波器工作,這些濾波器可以是低通、高通、帶通或帶阻濾波器。
    的頭像 發(fā)表于 12-26 09:31 ?3900次閱讀

    如何使用音頻均衡器提高音質(zhì)

    、更富有表現(xiàn)力的音質(zhì)效果。 音頻均衡器的基本原理 音頻均衡器通過調(diào)整不同頻率的聲音強(qiáng)度改善音質(zhì)。它通常包含多個(gè)頻段,每個(gè)頻段都可以獨(dú)立調(diào)整,以增強(qiáng)或減弱該頻段的
    的頭像 發(fā)表于 12-26 09:28 ?3197次閱讀

    TIKOOL太酷信息無線內(nèi)部通話系統(tǒng)允許多個(gè)人一起講話,頻道內(nèi)會(huì)不會(huì)很吵?

    傳統(tǒng)的對(duì)講機(jī)聲音采樣率普遍是4K,音質(zhì)差,往往音量大但稍有干擾就聽不清內(nèi)容;TIKOOL太酷無線內(nèi)部通話系統(tǒng)音頻采樣率可達(dá)16K,音質(zhì)數(shù)倍的提升,具備極高的聲音還原度,如同面對(duì)面聊天,多人講話
    發(fā)表于 12-18 09:07

    音頻功放芯片:音頻設(shè)備的核心驅(qū)動(dòng)力

    音頻功放芯片是音頻設(shè)備核心,放大音頻信號(hào)精準(zhǔn)控制音質(zhì)、音量。高保真、穩(wěn)定、易集成,但面臨散熱和成本問題。盡管如此,它仍是呈現(xiàn)高品質(zhì)聲音不可
    的頭像 發(fā)表于 12-17 16:37 ?1333次閱讀
    <b class='flag-5'>音頻</b>功放芯片:<b class='flag-5'>音頻</b>設(shè)備的核心驅(qū)動(dòng)力