chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

亞馬遜Echo大獲成功,遠(yuǎn)場(chǎng)語(yǔ)音交互技術(shù)在其中究竟扮演了什么

454398 ? 來(lái)源:雷鋒網(wǎng) ? 作者:李智勇 ? 2017-05-26 16:00 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

關(guān)于遠(yuǎn)場(chǎng)語(yǔ)音交互,聲智科技 CEO 陳孝良告訴雷鋒網(wǎng):“語(yǔ)音是最簡(jiǎn)單、最自然的人機(jī)交互方式,同時(shí)也是技術(shù)難度最大的交互方式,特別是語(yǔ)音交互從近場(chǎng)走向遠(yuǎn)場(chǎng)落地到真實(shí)場(chǎng)景,必須考慮噪聲、混響、回聲等聲學(xué)問(wèn)題,以及數(shù)據(jù)差異引入的機(jī)器學(xué)習(xí)模型問(wèn)題,這些都是保證自由人機(jī)交互的核心技術(shù)。”

但是網(wǎng)絡(luò)上橫跨聲學(xué)和計(jì)算機(jī)學(xué)科的教育資源太少,李智勇老師的這篇文章不僅揭示了遠(yuǎn)場(chǎng)語(yǔ)音交互的核心技術(shù),還對(duì)商業(yè)化落地的路徑進(jìn)行了深入的解讀,無(wú)論是語(yǔ)音交互的技術(shù)人員,還是產(chǎn)品經(jīng)理,都值得一讀。

手機(jī)之后國(guó)外各大巨頭非常罕見(jiàn)的步調(diào)一致的在做同一件事情:智能音箱。而這一切最初的驅(qū)動(dòng)力來(lái)自于Amazon Echo,但有意思的事情是Amazon Echo這產(chǎn)品根本沒(méi)做任何的功能上的創(chuàng)新,聽(tīng)歌、看新聞、設(shè)鬧鐘、說(shuō)笑話(huà)、控制家電等所有東西都可以在手機(jī)上找到替代品,它唯一的變化只是把語(yǔ)音交互的方式從近場(chǎng)升級(jí)為遠(yuǎn)場(chǎng),并把精度和速度打磨到非常優(yōu)秀的程度。只是這么一點(diǎn)點(diǎn)變化,似乎就要?jiǎng)?chuàng)造一個(gè)無(wú)比巨大的行業(yè),那遠(yuǎn)場(chǎng)語(yǔ)音交互為什么有這么大的威力?

語(yǔ)音交互等價(jià)于遠(yuǎn)場(chǎng)語(yǔ)音交互

極端的講法是世界上并不存在一種方式叫近場(chǎng)語(yǔ)音交互,語(yǔ)音交互基本等價(jià)于遠(yuǎn)場(chǎng)語(yǔ)音交互。事實(shí)證明過(guò)去很多年里各種近場(chǎng)語(yǔ)音交互的嘗試(比如Siri)并沒(méi)獲得很好的進(jìn)展,甚至簡(jiǎn)單實(shí)用的語(yǔ)音輸入法也沒(méi)能成為主流。從應(yīng)用場(chǎng)景來(lái)看遠(yuǎn)場(chǎng)和近場(chǎng)的核心差別是拉開(kāi)和語(yǔ)音設(shè)備的距離后,雙手再也沒(méi)用了。這樣和觸屏就可以徹底的差異化,可以徹底的發(fā)揮語(yǔ)音的快捷優(yōu)勢(shì)。想象下面的場(chǎng)景:

在微信里給一個(gè)人打視頻電話(huà),如果用手機(jī)那是下面這樣的過(guò)程

亞馬遜 Echo大獲成功,遠(yuǎn)場(chǎng)語(yǔ)音交互技術(shù)在其中究竟扮演了什么角色? | 深度

如果變成遠(yuǎn)場(chǎng)語(yǔ)音,那核心步驟會(huì)變成兩個(gè)

亞馬遜 Echo大獲成功,遠(yuǎn)場(chǎng)語(yǔ)音交互技術(shù)在其中究竟扮演了什么角色? | 深度

顯然在這兩種場(chǎng)景下便利程度是完全不一樣的,這種便利理論上講在近場(chǎng)的情形下同樣存在,但核心點(diǎn)在于近場(chǎng)時(shí)就需要挑戰(zhàn)用戶(hù)根深蒂固的觸屏習(xí)慣,這很難。觸屏雖然大流行,但顯然并沒(méi)能在筆記本上挑戰(zhàn)鍵盤(pán)鼠標(biāo)的既有地位。這不單是偏好問(wèn)題,也與各種應(yīng)用與特定交互方式的綁定有關(guān)。觸屏雖然好用,但并不能完全在Office上用起來(lái),所以如果Office根深蒂固,那么鍵盤(pán)鼠標(biāo)就根深蒂固。所以我們說(shuō),語(yǔ)音交互基本等價(jià)于遠(yuǎn)場(chǎng)語(yǔ)音交互,一旦它真的成為主流交互方式,培養(yǎng)了用戶(hù)習(xí)慣,那反過(guò)來(lái)才可能在近場(chǎng)的場(chǎng)景(比如近場(chǎng)的Siri)下占有一席之地。

遠(yuǎn)場(chǎng)語(yǔ)音交互的核心技術(shù)

遠(yuǎn)場(chǎng)語(yǔ)音交互如果變的無(wú)處不在,那Amazon Alexa(以及同類(lèi)產(chǎn)品)會(huì)變成新一代的Android,那個(gè)時(shí)候整個(gè)生態(tài)會(huì)像下面這樣:

亞馬遜 Echo大獲成功,遠(yuǎn)場(chǎng)語(yǔ)音交互技術(shù)在其中究竟扮演了什么角色? | 深度

這個(gè)時(shí)候Alexa這樣的系統(tǒng)同時(shí)覆蓋了傳統(tǒng)上Android和應(yīng)用商店的角色,在其上面則會(huì)有新的今日頭條、新的O2O等。而如果要把Alexa所依托的技術(shù)進(jìn)行細(xì)分的話(huà),那么基本上是三層:

前端的聲學(xué)部分(算法+陣列)

識(shí)別

NLU

這樣一來(lái)遠(yuǎn)場(chǎng)語(yǔ)音交互就正好面臨一大一小兩個(gè)瓶頸:

亞馬遜 Echo大獲成功,遠(yuǎn)場(chǎng)語(yǔ)音交互技術(shù)在其中究竟扮演了什么角色? | 深度

第一個(gè)瓶頸是眼下就要解決的問(wèn)題,即在語(yǔ)義仍然有限制的條件下,打造偏命令控制的產(chǎn)品,這個(gè)時(shí)候產(chǎn)品的ID很難擬人化(想想Echo,Airpods這些產(chǎn)品),一旦擬人用戶(hù)的潛在期望就會(huì)無(wú)限拔高,你也就不可能做出非常滿(mǎn)足用戶(hù)體驗(yàn)的產(chǎn)品。

第二個(gè)瓶頸則具有一定的不確定性,具有探索性質(zhì),我們?nèi)匀贿€不知道什么時(shí)候自然語(yǔ)言理解中可以體現(xiàn)出真的智能,但確實(shí)只有這點(diǎn)做了突破,并且同計(jì)算機(jī)視覺(jué)進(jìn)行融合才能真的做好擬人的機(jī)器人。

而為了解決第一個(gè)瓶頸事實(shí)上需要做好的事情有兩個(gè):

一個(gè)是前端聲學(xué)算法軟硬件的持續(xù)優(yōu)化

一個(gè)是通過(guò)獲取的數(shù)據(jù)重新訓(xùn)練云端的ASR

這個(gè)過(guò)程可以用下圖橙色的部分來(lái)概括。

亞馬遜 Echo大獲成功,遠(yuǎn)場(chǎng)語(yǔ)音交互技術(shù)在其中究竟扮演了什么角色? | 深度

上述這個(gè)看著并不太長(zhǎng)的鏈條其實(shí)復(fù)雜度非常高,它即跨越不同的學(xué)科(聲學(xué)部分屬于經(jīng)典物理,識(shí)別部分則屬于CS),也需要打穿軟硬件。

在算法層面只是前端就需要處理大量經(jīng)典問(wèn)題,比如降噪、去混響、回聲抵消、Beamforming等。加不加這些算法的音頻信號(hào)差異極大,如:

亞馬遜 Echo大獲成功,遠(yuǎn)場(chǎng)語(yǔ)音交互技術(shù)在其中究竟扮演了什么角色? | 深度

(具體效果試聽(tīng)可以參照http://soundai.com/demo.html)

而我們經(jīng)常說(shuō)的麥克風(fēng)陣列即使拋開(kāi)算法不論,單只在硬件層次上也遠(yuǎn)不是標(biāo)準(zhǔn)品:

上圖是一款強(qiáng)調(diào)通用性的麥克風(fēng)陣列,通過(guò)USB連接可以隨便連接到筆記本、PAD、手機(jī)上進(jìn)行使用。同樣的陣列還可以做成線(xiàn)性、L型、球形,最終的目的都是匹配特定的場(chǎng)景,讓最終遠(yuǎn)場(chǎng)交互的精度最優(yōu)。


如果進(jìn)一步下探,那就會(huì)出現(xiàn)更為底層的選擇,比如是用駐極體麥克風(fēng)還是用MEMS的,是用數(shù)字的還是用模擬的。

再進(jìn)一步挖掘,麥克風(fēng)從特性上還可以進(jìn)一步細(xì)分,比如:

亞馬遜 Echo大獲成功,遠(yuǎn)場(chǎng)語(yǔ)音交互技術(shù)在其中究竟扮演了什么角色? | 深度

所有上面這些點(diǎn)如果不能一一理順,那就沒(méi)法給用戶(hù)輸出一種綜合性的體驗(yàn),單點(diǎn)最優(yōu)在遠(yuǎn)場(chǎng)語(yǔ)音交互這里價(jià)值很小,相當(dāng)于必要不充分條件。只有能夠綜合,并且能夠優(yōu)化單點(diǎn)才真的能夠解決當(dāng)前產(chǎn)品落地中的實(shí)際問(wèn)題。

技術(shù)和商業(yè)上的正反饋

幾乎所有大公司都感受到了遠(yuǎn)場(chǎng)語(yǔ)音交互背后的價(jià)值,所以紛紛試水:繼亞馬遜、Google之后,微軟宣布了自己的智能音箱產(chǎn)品,預(yù)計(jì)蘋(píng)果也會(huì)宣布自己的相似產(chǎn)品。但是遠(yuǎn)場(chǎng)語(yǔ)音交互的落地卻可能比大家期望的要慢。核心點(diǎn)就在于技術(shù)-商業(yè)上的正反饋需要一定的啟動(dòng)周期。顯然的技術(shù)不好用,產(chǎn)品體驗(yàn)就不好;而反過(guò)來(lái)產(chǎn)品沒(méi)銷(xiāo)量技術(shù)就缺乏打磨的場(chǎng)景,內(nèi)容配套也就不會(huì)跟上。這種互鎖狀態(tài)就會(huì)形成一個(gè)冷啟動(dòng)周期,在這個(gè)周期里做技術(shù)的公司打磨自己的技術(shù),在沒(méi)那么大量的產(chǎn)品上落地,產(chǎn)品公司則接受技術(shù)現(xiàn)實(shí),打磨自己的產(chǎn)品。這樣一來(lái)整個(gè)遠(yuǎn)場(chǎng)語(yǔ)音交互很可能會(huì)跑下面的曲線(xiàn):

亞馬遜 Echo大獲成功,遠(yuǎn)場(chǎng)語(yǔ)音交互技術(shù)在其中究竟扮演了什么角色? | 深度

這個(gè)過(guò)程是可以和過(guò)去很多商業(yè)現(xiàn)實(shí)驗(yàn)證的,比如2007年iPhone發(fā)布,小米手機(jī)則要遲到2011年,這期間的4年可以看成是智能手機(jī)的啟動(dòng)期,一旦這個(gè)市場(chǎng)啟動(dòng)后則進(jìn)入一個(gè)高速增長(zhǎng)期,小米手機(jī)的銷(xiāo)量迅速?gòu)?012的700多萬(wàn)臺(tái)增加到2014年的6000多萬(wàn)臺(tái)。

遠(yuǎn)場(chǎng)語(yǔ)音交互的這個(gè)技術(shù)-商業(yè)正反饋當(dāng)前還處在非常初期的階段,亞馬遜的Echo(各種型號(hào))如果2017年的銷(xiāo)量真的逼近2000萬(wàn)臺(tái),那基本上可以認(rèn)為在美國(guó),技術(shù)-商業(yè)的正反饋第一回合完成。而在國(guó)內(nèi),同品類(lèi)產(chǎn)品銷(xiāo)量都還處在幾萬(wàn)、十幾萬(wàn)量級(jí)的水平,這個(gè)技術(shù)-商業(yè)的正反饋遠(yuǎn)未完成。

當(dāng)然這并非壞事,在格局已定的市場(chǎng)上,后來(lái)者是沒(méi)有機(jī)會(huì)的;只有在這種充滿(mǎn)未知的領(lǐng)域上,創(chuàng)業(yè)者才真的有顛覆性的機(jī)會(huì)。如果回退到20年前,聯(lián)想、門(mén)戶(hù)相對(duì)于現(xiàn)在的BAT都是巨無(wú)霸型公司,要資源有資源,要渠道有渠道,要人有人但很有意思的事情是BAT最終崛起了。

小結(jié)

手機(jī)的觸屏把很多人塑造成了低頭族,遠(yuǎn)場(chǎng)語(yǔ)音交互估計(jì)會(huì)塑造出許多和機(jī)器說(shuō)話(huà)的人。那時(shí)候語(yǔ)言不再只是人和人的交互手段。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • ECHO
    +關(guān)注

    關(guān)注

    1

    文章

    73

    瀏覽量

    27763
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    高通與蘋(píng)果會(huì)給遠(yuǎn)場(chǎng)語(yǔ)音交互帶來(lái)什么?

    短期來(lái)看高通、蘋(píng)果的入局實(shí)質(zhì)影響不大,更多的是在信心層面。兩個(gè)顯然的后果里:一個(gè)是高度確定的,那就是遠(yuǎn)場(chǎng)語(yǔ)音交互必成;一個(gè)則具有高度不確定性,傳統(tǒng)的OS一層上到底會(huì)發(fā)生什么?
    發(fā)表于 06-07 10:10 ?823次閱讀

    應(yīng)對(duì)亞馬遜Echo挑戰(zhàn) 谷歌密謀語(yǔ)音控制產(chǎn)品

    智能硬件在語(yǔ)音控制領(lǐng)域掀起了一場(chǎng)新的競(jìng)爭(zhēng)。亞馬遜語(yǔ)音控制類(lèi)產(chǎn)品Echo是一款成功的產(chǎn)品,它不僅
    發(fā)表于 04-05 10:26 ?1146次閱讀

    亞馬遜拒絕警方搜查Echo語(yǔ)音數(shù)據(jù) 理由是這樣的

    據(jù)媒體報(bào)道,亞馬遜拒絕向警方移交一名殺人嫌犯的Echo數(shù)據(jù),盡管警方出示了搜查證。The Information網(wǎng)站報(bào)道稱(chēng),案件所涉及的Echo語(yǔ)音
    發(fā)表于 12-29 10:52 ?866次閱讀

    亞馬遜Echo占據(jù)7成美國(guó)語(yǔ)音市場(chǎng) 微軟發(fā)新品挑戰(zhàn)Echo

    根據(jù)市場(chǎng)咨詢(xún)公司eMarketer發(fā)布的報(bào)告,亞馬遜在美國(guó)語(yǔ)音控制市場(chǎng)中占據(jù)了統(tǒng)治地位。今年,美國(guó)語(yǔ)音智能音箱用戶(hù)約有70.6%使用亞馬遜產(chǎn)品,遠(yuǎn)遠(yuǎn)超過(guò)了排位第二的谷歌,谷歌只占到23
    發(fā)表于 05-10 09:37 ?1105次閱讀

    亞馬遜Echo接入教程

    即可。Echo亞馬遜推出的智能家居的控制裝置,還是一款便攜式揚(yáng)聲器同時(shí)還包含了一位名叫Alexa的語(yǔ)音助理,連上機(jī)智云后用戶(hù)可以通過(guò)語(yǔ)音和音箱進(jìn)行
    發(fā)表于 12-15 10:48

    輕松搞定亞馬遜Echo控制智能設(shè)備

    2017年在CES上亞馬遜Alexa大放光彩,而Echo日前也已爆出貨1000多萬(wàn)臺(tái),引爆了智能硬件市場(chǎng)。據(jù)說(shuō),智能語(yǔ)音助理將成為下一代計(jì)算平臺(tái)!身為潮牌IoT工程師的你,是準(zhǔn)備繼續(xù)觀(guān)望?還是想馬上
    發(fā)表于 02-24 16:08

    亞馬遜Echo控制智能家居的原理

    2017年在CES上亞馬遜Alexa大放光彩,而Echo日前也已爆出貨1000多萬(wàn)臺(tái),引爆了智能硬件市場(chǎng)。據(jù)說(shuō),智能語(yǔ)音助理將成為下一代計(jì)算平臺(tái)! 身為潮牌IoT工程師的你,是準(zhǔn)備繼續(xù)觀(guān)望?還是想
    發(fā)表于 03-08 14:20

    智能音箱還能走多遠(yuǎn) 智能交互還未發(fā)展成熟

    識(shí)別準(zhǔn)確率方面紛紛秀出97%以上的成績(jī),卷積神經(jīng)網(wǎng)絡(luò)、隱藏馬可夫模型、遷移學(xué)習(xí)、語(yǔ)義分析等新名詞充斥網(wǎng)絡(luò),亞馬遜Echo巧妙的解決了遠(yuǎn)場(chǎng)語(yǔ)音
    發(fā)表于 07-11 09:32

    智能音箱混戰(zhàn) 遠(yuǎn)場(chǎng)語(yǔ)音交互只是開(kāi)始

      導(dǎo)讀:遠(yuǎn)場(chǎng)語(yǔ)音交互開(kāi)始是智能音響,但是將來(lái)絕對(duì)不僅僅是智能音響,技術(shù)還會(huì)擴(kuò)展到很多其他的產(chǎn)品。   7月5日,阿里推出了自己的首款消費(fèi)
    發(fā)表于 07-17 09:37

    基于賽普拉斯CYW43438語(yǔ)音交互中麥克風(fēng)陣列的解決方案

    隨著語(yǔ)音交互技術(shù)在AI時(shí)代的出鏡率越來(lái)越高,以及以亞馬遜ECHO為代表的智能音箱等遠(yuǎn)
    的頭像 發(fā)表于 08-30 11:04 ?1w次閱讀

    亞馬遜Echo的發(fā)展歷史及開(kāi)發(fā)出Echo智能音響的軟硬件分析

    年銷(xiāo)售目標(biāo)更是上了 1000 萬(wàn)臺(tái)。這也讓其他很多智能音箱廠(chǎng)商羨慕不已。對(duì)于亞馬遜 Echo 來(lái)說(shuō),其核心技術(shù)則是其集成的智能語(yǔ)音助手 Alexa。而早在 2015 年 6 月 25
    發(fā)表于 09-25 09:13 ?13次下載

    靈云遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別解決方案

    醒、聲源定向等關(guān)鍵技術(shù),在引起產(chǎn)業(yè)界廣泛關(guān)注的同時(shí),16日正式宣布推出面向智能終端的完整靈云遠(yuǎn)場(chǎng)語(yǔ)音交互解決方案,該套方案完美整合了國(guó)內(nèi)最新
    發(fā)表于 10-13 11:54 ?0次下載

    Synaptics AudioSmart遠(yuǎn)場(chǎng)語(yǔ)音技術(shù)支持哈曼卡頓 Allure智能音箱

    Synaptics AudioSmart遠(yuǎn)場(chǎng)語(yǔ)音技術(shù)將帶來(lái)性能無(wú)與倫比的兩麥克風(fēng)和四麥克風(fēng)支持亞馬遜Alexa
    的頭像 發(fā)表于 01-10 14:47 ?9490次閱讀

    語(yǔ)音交互領(lǐng)域亞馬遜能否一直占到先機(jī)

    個(gè)全新的概念,「Voice First」。當(dāng)時(shí)亞馬遜 Echo 的負(fù)責(zé)人 Mike George 認(rèn)為,語(yǔ)音交互具有完全無(wú)門(mén)檻的易用性和高度直覺(jué)化的引導(dǎo),所以人機(jī)
    的頭像 發(fā)表于 05-24 14:50 ?4255次閱讀

    百度正式發(fā)布遠(yuǎn)場(chǎng)語(yǔ)音交互技術(shù)芯片

    在2019年百度AI開(kāi)發(fā)者大會(huì)上,百度首席技術(shù)官王海峰宣布百度正式發(fā)布遠(yuǎn)場(chǎng)語(yǔ)音交互芯片“鴻鵠”。
    發(fā)表于 08-30 16:16 ?729次閱讀