10月30日消息,剛剛結(jié)束的李佳琦直播間里,剁手黨通過阿里語音機(jī)器人首次實(shí)現(xiàn)與主播的實(shí)時(shí)互動(dòng)。直播過程中,數(shù)十萬用戶同時(shí)用語音回答李佳琦的提問,最終機(jī)器人在50毫秒內(nèi)就完成了語音識(shí)別和語音反饋全過程,反應(yīng)速度是傳統(tǒng)語音的20倍。
淘寶直播間觀眾用語音與李佳琦互動(dòng)
今年雙11期間,淘寶直播間推出 “語音猜價(jià)格”功能,觀眾在直播間也能實(shí)現(xiàn)語音交互,例如動(dòng)動(dòng)嘴就可以響應(yīng)主播發(fā)出的猜產(chǎn)品價(jià)格任務(wù)。語音機(jī)器人成為決定這一互動(dòng)過程能否順暢的關(guān)鍵。
據(jù)介紹,一場(chǎng)淘寶直播的觀眾數(shù)量可達(dá)百萬甚至千萬,并且用戶分布在全國(guó)各地,口音差異較大,目前主流的語音技術(shù)方案很難做到短時(shí)間內(nèi)快速響應(yīng)如此體量的用戶語音,例如類似Siri識(shí)別用戶語音的響應(yīng)時(shí)長(zhǎng)就在1秒以上,無法滿足直播場(chǎng)景強(qiáng)互動(dòng)的要求。
此次淘寶直播間采用了達(dá)摩院最新的移動(dòng)端離線端到端語音識(shí)別技術(shù)?;谌碌木W(wǎng)絡(luò)結(jié)構(gòu)和語音識(shí)別框架,即便在低配手機(jī)上,也能在50毫秒內(nèi)完成語音交互過程,速度是傳統(tǒng)語音識(shí)別的20倍;此外,該技術(shù)還解決了快語速、重口音等問題,高難度場(chǎng)景中的語音識(shí)別錯(cuò)誤率降低近三成。
達(dá)摩院語音實(shí)驗(yàn)室技術(shù)專家萬玉龍表示,“在實(shí)時(shí)性要求極高的場(chǎng)景,傳統(tǒng)的云端語音方案無法滿足需求,這套語音技術(shù)的創(chuàng)新在于同時(shí)實(shí)現(xiàn)了識(shí)別速度和準(zhǔn)確度的提升,語音AI模型部署在每個(gè)用戶的淘寶直播APP上,即便直播間有千萬級(jí)別的用戶,AI也不會(huì)漏聽慢判?!?/p>
過去幾年,阿里語音AI在基礎(chǔ)研究和應(yīng)用上取得了一系列突破。2019年,阿里語音AI入選《麻省理工評(píng)論》“全球十大突破性技術(shù)”,是唯一上榜的中國(guó)科技公司;今年7月IDC發(fā)布的《中國(guó)AI云服務(wù)市場(chǎng)半年度研究報(bào)告》顯示,阿里語音AI以44%的市場(chǎng)份額,在云上語音AI市場(chǎng)中位居第一。
責(zé)任編輯:PSY
-
機(jī)器人
+關(guān)注
關(guān)注
213文章
29718瀏覽量
212759 -
語音識(shí)別
+關(guān)注
關(guān)注
39文章
1779瀏覽量
114206 -
Siri
+關(guān)注
關(guān)注
4文章
206瀏覽量
37835 -
阿里
+關(guān)注
關(guān)注
6文章
454瀏覽量
33321
發(fā)布評(píng)論請(qǐng)先 登錄
評(píng)論