chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

什么是無聲語音接口?

SSDFans ? 來源:SSDFans ? 2023-04-28 10:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

可穿戴設(shè)備依賴于具有標(biāo)準(zhǔn)物理能力的人機(jī)界面,如語音、觸摸或運(yùn)動(dòng)。雖然這種形式的機(jī)器交互適用于大多數(shù)消費(fèi)者,但殘疾人可能很難或無法操作標(biāo)準(zhǔn)的可穿戴設(shè)備。為了使更多人能夠使用可穿戴設(shè)備,研究人員正在研究新的人機(jī)界面。

最近,康奈爾大學(xué)的一個(gè)團(tuán)隊(duì)發(fā)表了一篇論文,描述了一副為不能發(fā)聲的用戶配備了無聲語音接口(SSI)的智能眼鏡。本文將討論無聲語音接口和來自康奈爾大學(xué)的可穿戴原型。

什么是無聲語音接口?

無聲語音接口(Silent speech interface,簡稱SSI)允許人們無需發(fā)聲就能與機(jī)器互動(dòng)。雖然AI助手(如蘋果的Siri)等技術(shù)是通過聲音交流工作的,但SSI通過與語音相關(guān)的動(dòng)作來完成交流。

SSI技術(shù)通過嘴巴和舌頭的運(yùn)動(dòng)而不是聲音來識別語音。為了做到這一點(diǎn),SSI依賴于各種不同的傳感器,包括放置在嘴巴附近的振動(dòng)傳感器,用于檢測人們嘴巴的振動(dòng),以及跟蹤和分類與語音相關(guān)運(yùn)動(dòng)的攝像頭。在許多情況下,這些信息會被機(jī)器學(xué)習(xí)算法處理,該算法會解釋嘴巴的動(dòng)作,并將其翻譯成文字。

雖然大多數(shù)人可能找不到SSI的用途,但這項(xiàng)技術(shù)對于因疾病或受傷而失聲的人來說是必不可少的,可以讓他們更容易地交流。例如,患有聲帶損傷或影響語言的神經(jīng)系統(tǒng)疾病的患者可以從SSI中獲益良多。

康奈爾大學(xué)開發(fā)無攝像頭SSI眼鏡

最近,康奈爾大學(xué)的研究人員在SSI技術(shù)方面取得了重大進(jìn)展,發(fā)明了基于SSI的智能眼鏡。

該系統(tǒng)被稱為EchoSpeech,是一種新穎的、侵入性最小的SSI技術(shù),它使用低功率有源聲學(xué)傳感來捕捉由無聲語音引起的細(xì)微皮膚變形,并將這些信息轉(zhuǎn)換為可操作的數(shù)據(jù)。這款智能眼鏡的原型建立在康奈爾大學(xué)之前對一種類似的聲學(xué)傳感可穿戴設(shè)備(“EarIO”)的研究基礎(chǔ)上,EarIO可以從耳朵內(nèi)追蹤面部運(yùn)動(dòng)。

cf967ebe-e4fb-11ed-ab56-dac502259ad0.png

該系統(tǒng)依靠安裝在眼鏡框架上的一系列揚(yáng)聲器和麥克風(fēng)向皮膚發(fā)射聽不見的聲波。發(fā)出的聲波產(chǎn)生沿多條路徑傳播的回聲,并被系統(tǒng)解釋推斷為佩戴者的無聲語音。EchoSpeech完全可以在標(biāo)準(zhǔn)的智能手機(jī)上運(yùn)行,只需要1到6分鐘的訓(xùn)練數(shù)據(jù),并以73.3 mW的低功耗實(shí)時(shí)運(yùn)行。該團(tuán)隊(duì)的深度學(xué)習(xí)算法可以實(shí)時(shí)分析回聲,準(zhǔn)確率約為95%。

該系統(tǒng)通過12名用戶研究進(jìn)行了評估,成功展示了識別31個(gè)獨(dú)立命令和三到六位連接數(shù)字的能力,單詞錯(cuò)誤率(WER)分別為4.5%(標(biāo)準(zhǔn)3.5%)和6.1%(標(biāo)準(zhǔn)4.2%)。此外,在行走和噪聲注入等場景中測試了系統(tǒng)的魯棒性。

更私密、低功耗、易使用

大多數(shù)SSI技術(shù)使用面部攝像頭,從用戶和與其交流的人那里收集數(shù)據(jù)。除了造成隱私問題外,可穿戴攝像頭還會收集高帶寬視頻數(shù)據(jù)。

由于EchoSpeech不需要可穿戴攝像機(jī),設(shè)備只捕捉音頻數(shù)據(jù),這比圖像或視頻數(shù)據(jù)需要的帶寬要少得多,并且可以通過藍(lán)牙實(shí)時(shí)發(fā)送到手機(jī)。隱私信息永遠(yuǎn)不會脫離用戶的控制,因?yàn)閿?shù)據(jù)是在智能手機(jī)上本地處理的(不用在云中處理)。研究人員表示,純音頻傳感器的電池效率也更高:音頻傳感器可以工作10個(gè)小時(shí),而攝像頭只能工作30分鐘。

康奈爾大學(xué)的研究小組表示,他們發(fā)現(xiàn)EchoSpeech在很多應(yīng)用中都有應(yīng)用價(jià)值,從默念密碼來解鎖智能手機(jī),到跳過播放列表中的歌曲。該設(shè)備還可以與智能手機(jī)配對,在說話不方便的地方與他人交談,比如嘈雜的餐廳或安靜的圖書館。研究人員表示,該界面與手寫筆和CAD等設(shè)計(jì)軟件兼容,從而消除了對鼠標(biāo)和鍵盤的需求。





審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 人機(jī)界面
    +關(guān)注

    關(guān)注

    5

    文章

    551

    瀏覽量

    45455
  • SSI
    SSI
    +關(guān)注

    關(guān)注

    0

    文章

    40

    瀏覽量

    20054
  • 可穿戴設(shè)備
    +關(guān)注

    關(guān)注

    55

    文章

    3863

    瀏覽量

    169740

原文標(biāo)題:什么?無聲語音接口?

文章出處:【微信號:SSDFans,微信公眾號:SSDFans】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    什么是語音芯片串口AT指令?實(shí)現(xiàn)智能語音交互的核心技術(shù)詳解

    什么是AT指令A(yù)T指令是一套基于串行通信接口的標(biāo)準(zhǔn)化指令集,專門用于聲音播放芯片與其他設(shè)備之間的數(shù)據(jù)傳輸和控制操作。這種通信協(xié)議通過簡單的文本命令格式,實(shí)現(xiàn)了對語音
    的頭像 發(fā)表于 11-10 12:53 ?202次閱讀
    什么是<b class='flag-5'>語音</b>芯片串口AT指令?實(shí)現(xiàn)智能<b class='flag-5'>語音</b>交互的核心技術(shù)詳解

    無聲的守護(hù)者:醫(yī)療設(shè)備電源濾波器的生命線作用

    無聲的守護(hù)者:醫(yī)療設(shè)備電源濾波器的生命線作用|深圳維愛普
    的頭像 發(fā)表于 09-28 11:50 ?368次閱讀

    廣州唯創(chuàng)電子WTN6xxx-8S語音芯片:智能充電樁的語音提示完美解決方案

    的使用說明或面對無聲的操作流程,體驗(yàn)不夠友好。據(jù)統(tǒng)計(jì),清晰的語音提示可以降低40%以上的用戶操作錯(cuò)誤率,并顯著提升用戶滿意度。廣州唯創(chuàng)電子的WTN6xxx-8S語音芯片以其出色的低功耗、
    的頭像 發(fā)表于 09-19 09:27 ?3233次閱讀
    廣州唯創(chuàng)電子WTN6xxx-8S<b class='flag-5'>語音</b>芯片:智能充電樁的<b class='flag-5'>語音</b>提示完美解決方案

    語音輸出模塊是什么?自控語音播報(bào)

    語音輸出模塊(VoiceOutputModule)是一種將數(shù)字信號或文本信息轉(zhuǎn)換為人類可聽語音的硬件/軟件組件。相當(dāng)于設(shè)備的“嘴巴”,讓機(jī)器能夠通過聲音與人進(jìn)行交互。 一、工作原理 1.輸入接收
    的頭像 發(fā)表于 08-13 15:20 ?621次閱讀

    語音跳線和網(wǎng)絡(luò)跳線區(qū)別

    語音跳線和網(wǎng)絡(luò)跳線在傳輸信號類型、接口類型、線纜結(jié)構(gòu)、應(yīng)用場景等方面存在明顯區(qū)別,以下是詳細(xì)介紹: 傳輸信號類型 語音跳線:主要用于傳輸模擬語音信號,也就是我們?nèi)粘4螂娫挄r(shí)所使用的聲音
    的頭像 發(fā)表于 06-27 10:09 ?654次閱讀

    芯知識|語音芯片發(fā)碼無聲解析:上電無聲、連發(fā)指令才響的三大根源及解決之道

    在嵌入式語音方案開發(fā)中,廣州唯創(chuàng)電子語音芯片(如WT系列)以其高性價(jià)比和易用性廣受青睞。但當(dāng)開發(fā)者遭遇“上電發(fā)碼無聲”或“必須連發(fā)兩次指令才有聲音”的問題時(shí),往往陷入調(diào)試?yán)Ь?。本文將深入剖析這些現(xiàn)象
    的頭像 發(fā)表于 06-19 09:14 ?556次閱讀
    芯知識|<b class='flag-5'>語音</b>芯片發(fā)碼<b class='flag-5'>無聲</b>解析:上電<b class='flag-5'>無聲</b>、連發(fā)指令才響的三大根源及解決之道

    芯知識|語音芯片“無聲之謎”:當(dāng)DACL波形正常,功放開啟卻無聲音時(shí)……

    信號“通道沖突”這一關(guān)鍵陷阱。一、無聲故障的典型表現(xiàn)與診斷盲點(diǎn)“正?!钡谋硐螅汗こ處熡檬静ㄆ鳈z測語音芯片(如廣州唯創(chuàng)電子某型號)的關(guān)鍵引腳:供電電壓穩(wěn)定,邏輯通信正常
    的頭像 發(fā)表于 06-13 08:53 ?652次閱讀
    芯知識|<b class='flag-5'>語音</b>芯片“<b class='flag-5'>無聲</b>之謎”:當(dāng)DACL波形正常,功放開啟卻<b class='flag-5'>無聲</b>音時(shí)……

    明遠(yuǎn)智睿SSD2351開發(fā)板:語音機(jī)器人領(lǐng)域的變革力量

    連續(xù)的長句語音識別,還是復(fù)雜口音的處理,都能快速響應(yīng),保證語音機(jī)器人與用戶之間流暢的對話體驗(yàn)。 其豐富的接口語音機(jī)器人的功能拓展提供了可能。USB
    發(fā)表于 05-28 11:36

    芯知識|廣州唯創(chuàng)電子藍(lán)牙音頻語音芯片IC通信接口配置與常見問題解析

    隨著智能硬件設(shè)備的快速發(fā)展,藍(lán)牙音頻語音芯片在智能家居、穿戴設(shè)備、車載電子等領(lǐng)域得到廣泛應(yīng)用。廣州唯創(chuàng)電子推出的藍(lán)牙音頻語音芯片憑借其低功耗、高集成度和靈活的通信接口,成為許多開發(fā)者的選擇。然而,在
    的頭像 發(fā)表于 05-19 09:45 ?604次閱讀
    芯知識|廣州唯創(chuàng)電子藍(lán)牙音頻<b class='flag-5'>語音</b>芯片IC通信<b class='flag-5'>接口</b>配置與常見問題解析

    芯資訊|廣州唯創(chuàng)電子錄音語音芯片應(yīng)用指南及常見問題解析

    、存儲及播放功能,但在實(shí)際應(yīng)用中,用戶可能遇到錄音后播放無聲音的問題。本文將從技術(shù)原理、常見故障及解決方案展開解析。二、錄音語音芯片的工作原理唯創(chuàng)電子語音芯片的核心
    的頭像 發(fā)表于 05-16 08:41 ?439次閱讀
    芯資訊|廣州唯創(chuàng)電子錄音<b class='flag-5'>語音</b>芯片應(yīng)用指南及常見問題解析

    明遠(yuǎn)智睿SSD2351核心板在語音對講與HMI領(lǐng)域的創(chuàng)新應(yīng)用

    在現(xiàn)代智能設(shè)備中,語音對講和HMI(人機(jī)界面)作為重要的交互方式,直接影響著用戶體驗(yàn)。明遠(yuǎn)智睿SSD2351核心板憑借其獨(dú)特的硬件特性和豐富接口,在這兩個(gè)領(lǐng)域?qū)崿F(xiàn)了諸多創(chuàng)新應(yīng)用。 在語音對講方面
    發(fā)表于 04-16 10:46

    labview語音轉(zhuǎn)文字

    labview語音轉(zhuǎn)文字怎么實(shí)現(xiàn),目前在論壇上找到了文字轉(zhuǎn)語音
    發(fā)表于 04-07 19:44

    基于WTV380-8S語音芯片的智能電子鎖語音交互系統(tǒng)設(shè)計(jì)方案介紹

    ?一、方案背景與需求智能電子鎖作為現(xiàn)代家居安防的核心設(shè)備,用戶對交互友好性、功能多樣性和系統(tǒng)穩(wěn)定性的需求日益提升。WTV380-8S語音芯片憑借多模式控制、高集成度、低功耗設(shè)計(jì)及豐富的外設(shè)接口,為
    的頭像 發(fā)表于 03-06 08:56 ?756次閱讀
    基于WTV380-8S<b class='flag-5'>語音</b>芯片的智能電子鎖<b class='flag-5'>語音</b>交互系統(tǒng)設(shè)計(jì)方案介紹

    Flash語音芯片相比OTP語音芯片的優(yōu)勢

    Flash語音芯片和OTP語音芯片是兩種常見的語音解決方案,在各自的應(yīng)用領(lǐng)域中發(fā)揮著重要作用。本文?將介紹Flash語音芯片相比OTP(One-TimeProgrammable)
    的頭像 發(fā)表于 12-16 16:02 ?950次閱讀
    Flash<b class='flag-5'>語音</b>芯片相比OTP<b class='flag-5'>語音</b>芯片的優(yōu)勢

    Flash語音芯片相比OTP語音芯片的優(yōu)勢

    Flash語音芯片和OTP語音芯片是兩種常見的語音解決方案,在各自的應(yīng)用領(lǐng)域中發(fā)揮著重要作用。本文?將介紹Flash語音芯片相比OTP(One-Time Programmable)
    的頭像 發(fā)表于 12-16 15:44 ?810次閱讀