微軟一直致力于開(kāi)發(fā)一種新的語(yǔ)音輸入接口,允許用戶在沒(méi)有語(yǔ)音泄漏的情況下進(jìn)行說(shuō)話和錄音。該研究由微軟研究院進(jìn)行,并在UIST 2018中進(jìn)行了介紹。該模塊名為SilentVoice,可以捕捉來(lái)自口腔的空氣并記錄聲音而不會(huì)打擾周圍的人。此外,該模塊還將過(guò)濾周圍的語(yǔ)音,因此即使有外界干擾,用戶也可以捕獲清晰的語(yǔ)音。
SilentVoice是一種新的語(yǔ)音輸入接口設(shè)備,所提出的“漸進(jìn)式語(yǔ)音”方法使得能夠?qū)Ⅺ溈孙L(fēng)放置在非??拷斓那安慷皇墉h(huán)境噪聲的影響,捕獲具有良好信噪比非常柔和的語(yǔ)音。它實(shí)現(xiàn)了超?。ǖ陀?9dB)的語(yǔ)音泄漏,允許用戶使用語(yǔ)音輸入,而不會(huì)在公共和移動(dòng)情況下以及在辦公室和家庭中煩擾周圍的人。
通過(guò)測(cè)量氣流方向,SilentVoice可以很容易地與正常話語(yǔ)分離,準(zhǔn)確率為98.8%,它可以用于帶有經(jīng)過(guò)專門訓(xùn)練的語(yǔ)音識(shí)別器的語(yǔ)音激活系統(tǒng),微軟評(píng)估其單詞錯(cuò)誤率(WERs)為1.8%,(依賴說(shuō)話者的條件),7.0%(和說(shuō)話者無(wú)關(guān)的條件)。
該技術(shù)仍處于研究階段,但肯定會(huì)幫助人們?cè)诓淮驍_周圍人的情況下工作并且錄制語(yǔ)音。
-
微軟
+關(guān)注
關(guān)注
4文章
6686瀏覽量
105768 -
語(yǔ)音識(shí)別
+關(guān)注
關(guān)注
39文章
1782瀏覽量
114244
原文標(biāo)題:微軟正在研發(fā)新語(yǔ)音輸入技術(shù):用戶小聲說(shuō)話也能輸入
文章出處:【微信號(hào):robot-1hjqr,微信公眾號(hào):1號(hào)機(jī)器人網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
評(píng)論