AI可能很快就會成為盟友,以消除語音助手的喚醒詞。卡內(nèi)基梅隆大學的研究人員開發(fā)了一種機器學習模型,該模型可以估計語音的發(fā)出方向,無需特殊的短語或手勢即可表明您的意圖。該方法依賴于聲音在房間周圍反彈時的固有特性。
系統(tǒng)認識到,第一個,最響亮和最清晰的聲音始終是直接針對給定對象的聲音。其他任何事情都傾向于安靜,延遲和悶悶不樂。該模型還知道,人類的語音頻率會根據(jù)您所面對的方向而變化。較低的頻率傾向于全向。
研究人員補充說,這種方法基于軟件“輕巧”,不需要將音頻數(shù)據(jù)發(fā)送到云。
盡管團隊已經(jīng)公開發(fā)布了代碼和數(shù)據(jù)來幫助其他人繼續(xù)工作,但是您可能還需要一段時間才能看到使用的技術。至少很容易看出這可能導致什么。您可以告訴智能揚聲器播放音樂,而無需使用喚醒詞或引起大量其他連接設備的騷擾。它可能需要您的身體狀態(tài),而無需使用注視檢測相機,從而有助于保護隱私。換句話說,它將更接近“星際迷航”中語音助手的愿景,后者始終會在您與他們交談時知道。
責任編輯:lq
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
代碼
+關注
關注
30文章
4956瀏覽量
73516 -
機器學習
+關注
關注
66文章
8546瀏覽量
136535 -
語音助手
+關注
關注
7文章
241瀏覽量
27575
發(fā)布評論請先 登錄
相關推薦
熱點推薦
研究人員復興針孔相機技術以推動下一代紅外成像發(fā)展
研究人員運用具有數(shù)百年歷史的針孔成像原理,開發(fā)出一種無需透鏡的高性能中紅外成像系統(tǒng)。這種新型相機能夠在大范圍距離內(nèi)和弱光條件下拍攝極其清晰的照片,使其在傳統(tǒng)相機難以應對的場景中發(fā)揮重要作用。
利用 Banana Pi BPI-CM5 Pro(ARMSoM CM5 SoM) 加速保護科學
政府、大學和非政府組織的研究人員。通過使用開源計算硬件,實時聲學監(jiān)測的構建成本可以低于使用專用微控制器的系統(tǒng)。
實施過程
為了展示開源硬件在生物聲學邊緣處理方面的優(yōu)勢,我們需要一個演示浮標。我們專注于
發(fā)表于 10-27 09:18
超小型Neuton機器學習模型, 在任何系統(tǒng)級芯片(SoC)上解鎖邊緣人工智能應用.
Neuton 是一家邊緣AI 公司,致力于讓機器 學習模型更易于使用。它創(chuàng)建的模型比競爭對手的框架小10 倍,速度也快10 倍,甚至可以在最
發(fā)表于 07-31 11:38
山西大學實現(xiàn)一種壓縮激光新型光源
圖1.壓縮激光原理示意圖 近日,山西大學光電研究所利用壓縮庫增強光學參量耦合新方案,實驗實現(xiàn)了一種壓縮激光新型光源。相關研究成果“Reservoir-engineered squeez
無刷直流電機雙閉環(huán)串級控制系統(tǒng)仿真研究
Madlab進行BLDC建模仿真的方法,并且也提出了很多的建模仿真方案。例如有研究人員提出采用節(jié)點電流法對電機控制系統(tǒng)進行分析,通過列寫m函數(shù),建立BLDC控制系統(tǒng)真模型,這種方法實質(zhì)上是一種整體建模
發(fā)表于 07-07 18:36
大模型推理顯存和計算量估計方法研究
(如全連接層、卷積層等)確定所需的顯存大?。?(3)將各層顯存大小相加,得到模型總的顯存需求。
基于神經(jīng)網(wǎng)絡剪枝的顯存估計
神經(jīng)網(wǎng)絡剪枝是一種減少模型參數(shù)數(shù)量的技術,可以降低顯存需求。通過剪枝,可以
發(fā)表于 07-03 19:43
輪式移動機器人電機驅(qū)動系統(tǒng)的研究與開發(fā)
系統(tǒng),開發(fā)了一套二輪差速驅(qū)動轉(zhuǎn)向移動機器人電機驅(qū)動系統(tǒng),完成了系統(tǒng)各部件的整體裝配和調(diào)試。試驗結果表明,該設計方案可行、系統(tǒng)運行穩(wěn)定可靠、成本低廉、所用元件易于購置,具有較好的實用的價值和應用前景。
純
發(fā)表于 06-11 14:30
【「# ROS 2智能機器人開發(fā)實踐」閱讀體驗】機器人入門的引路書
的限制和調(diào)控)
本書還有很多前沿技術項目的擴展
比如神經(jīng)網(wǎng)絡識別例程,機器學習圖像識別的原理,yolo圖像追蹤的原理
機器學習訓練三大點:
先準備
發(fā)表于 04-30 01:05
研究人員開發(fā)出基于NVIDIA技術的AI模型用于檢測瘧疾
瘧疾曾一度在委內(nèi)瑞拉銷聲匿跡,但如今正卷土重來。研究人員已經(jīng)訓練出一個模型來幫助檢測這種傳染病。
NanoEdge AI Studio 面向STM32開發(fā)人員機器學習(ML)技術
NanoEdge? AI Studio*(NanoEdgeAIStudio)是一種新型機器學習(ML)技術,可以讓終端用戶輕松享有真正的創(chuàng)新成果。只需幾步,開發(fā)人員便可基于最少量的數(shù)據(jù)
Raspberry Pi Pico 2 上實現(xiàn):實時機器學習(ML)音頻噪音抑制功能
Arm公司的首席軟件工程師SandeepMistry為我們展示了一種全新的巧妙方法:在RaspberryPiPico2上如何將音頻噪音抑制應用于麥克風輸入。機器學習(ML)技術徹底改變了許多軟件應用
機器學習模型市場前景如何
當今,隨著算法的不斷優(yōu)化、數(shù)據(jù)量的爆炸式增長以及計算能力的飛速提升,機器學習模型的市場前景愈發(fā)廣闊。下面,AI部落小編將探討機器學習
阿里巴巴Qwen大模型助力開發(fā)低成本DeepSeek替代方案
近日,阿里巴巴的開源Qwen2.5模型在AI領域再次展現(xiàn)其強大實力,為斯坦福大學與伯克利大學的研究人員提供了低成本的AI訓練解決方案。借助這一
Qwen大模型助力開發(fā)低成本AI推理方案
阿里巴巴的開源Qwen2.5模型近期在AI領域引發(fā)了廣泛關注。這一大模型的推出,為斯坦福大學與伯克利大學
嵌入式機器學習的應用特性與軟件開發(fā)環(huán)境
作者:DigiKey Editor 在許多嵌入式系統(tǒng)中,必須采用嵌入式機器學習(Embedded Machine Learning)技術,這是指將機器學習
卡內(nèi)基梅隆大學的研究人員開發(fā)了一種機器學習模型
評論