新專(zhuān)利顯示,蘋(píng)果正在研究HomePod或其他設(shè)備如何利用音頻來(lái)估計(jì)與說(shuō)話(huà)用戶(hù)的距離,還可以識(shí)別周?chē)穆曇?。蘋(píng)果的HomePod已經(jīng)很好地聽(tīng)到了你的聲音,即使是在大聲播放音樂(lè)的時(shí)候。現(xiàn)在新專(zhuān)利申請(qǐng)顯示,蘋(píng)果希望改進(jìn)這一點(diǎn),并將設(shè)備的聽(tīng)覺(jué)能力,提升到一個(gè)新的水平。
一項(xiàng)是名為 “基于學(xué)習(xí)的距離估計(jì)”的專(zhuān)利,涉及到使用音頻不僅僅是為了識(shí)別用戶(hù),而是為了弄清用戶(hù)的位置。蘋(píng)果在專(zhuān)利當(dāng)中表示,設(shè)備使用緊湊麥克風(fēng)陣列估計(jì)設(shè)備到用戶(hù)的距離,例如,設(shè)備可以根據(jù)用戶(hù)與設(shè)備的估計(jì)距離來(lái)調(diào)整播放音量或智能輔助設(shè)備的響應(yīng)。因此,如果用戶(hù)離設(shè)備非常近,音樂(lè)或語(yǔ)音將不會(huì)以高音量播放,另外,如果用戶(hù)離得很遠(yuǎn),媒體播放或智能助理設(shè)備的響應(yīng)可能會(huì)被調(diào)整到更大的音量。
這個(gè)想法也是為了改進(jìn)蘋(píng)果目前令人印象深刻但又有些缺陷的系統(tǒng),即多個(gè)蘋(píng)果設(shè)備都會(huì)嘗試確定你對(duì)哪個(gè)設(shè)備說(shuō)了 “嘿,Siri”。對(duì)此,蘋(píng)果在專(zhuān)利當(dāng)中表示,在有多個(gè)設(shè)備的應(yīng)用場(chǎng)景中,設(shè)備之間可以相互協(xié)調(diào)或仲裁,根據(jù)每個(gè)設(shè)備到用戶(hù)的距離來(lái)決定哪一個(gè)或多個(gè)設(shè)備應(yīng)該回復(fù)查詢(xún)。
在專(zhuān)利當(dāng)中,蘋(píng)果提出了簡(jiǎn)單和更復(fù)雜的解決方案,這些方案都可以協(xié)同使用。比較簡(jiǎn)單的是讓設(shè)備像HomePod一樣,先繪制出環(huán)境圖。然后,它有效地?fù)碛幸粋€(gè)聲學(xué)環(huán)境中的測(cè)量或模擬點(diǎn)的網(wǎng)格。在這種情況下,就可以將聲音與這個(gè) “網(wǎng)格 ”進(jìn)行對(duì)比,從而大致判斷出說(shuō)話(huà)的人所在的位置。
如果這不夠好,蘋(píng)果還有另一個(gè)解決方案,它涉及 “基于學(xué)習(xí)的系統(tǒng),如深度神經(jīng)網(wǎng)絡(luò)(DNN),而且不需要多個(gè)設(shè)備互相協(xié)調(diào)幫助。蘋(píng)果在專(zhuān)利當(dāng)中表示,深度學(xué)習(xí)系統(tǒng)可以根據(jù)緊湊的麥克風(fēng)陣列接收到的語(yǔ)音信號(hào),估計(jì)語(yǔ)音源在每個(gè)時(shí)間段的距離。這個(gè)DNN系統(tǒng)可以做的是確定什么是語(yǔ)音,什么是背景噪聲。然后,它可以計(jì)算出 關(guān)于直接信號(hào)傳播的信息,還可以計(jì)算出混響效應(yīng)和噪聲。
責(zé)任編輯:haq
-
音頻
+關(guān)注
關(guān)注
31文章
3107瀏覽量
84624 -
蘋(píng)果
+關(guān)注
關(guān)注
61文章
24581瀏覽量
206444
發(fā)布評(píng)論請(qǐng)先 登錄
輕量化AI+AR顯示設(shè)備的新變局拉開(kāi)帷幕
不止三折!華為新專(zhuān)利暗示四折屏設(shè)備已在路上?
XR空間音頻革命:蘋(píng)果、三星推出新技術(shù),ASAF成Vision Pro最佳搭檔
大模型推理顯存和計(jì)算量估計(jì)方法研究
神經(jīng)網(wǎng)絡(luò)RAS在異步電機(jī)轉(zhuǎn)速估計(jì)中的仿真研究
音頻功放芯片:音頻設(shè)備的核心驅(qū)動(dòng)力

專(zhuān)利顯示蘋(píng)果正在研究如何利用音頻來(lái)估計(jì)設(shè)備與說(shuō)話(huà)用戶(hù)的距離
評(píng)論