由B12、觀數(shù)·涂子沛頻道主辦,智東西、良倉加速器、騰訊大浙網(wǎng)、創(chuàng)享基金聯(lián)合主辦的第二屆萬物互聯(lián)創(chuàng)新大會「創(chuàng)業(yè)下一潮水:大數(shù)據(jù)與智能時代」在杭州召開。本次大會邀請國內(nèi)外的尖端大腦,用一場盛大的跨界聚會,帶你突破人類延伸的極限,探索人工智能的未來,創(chuàng)造腦洞大開的生產(chǎn)力。
圖1 思必馳VP雷雄國演講現(xiàn)場
你一定有所意識,人工智能的應(yīng)用已經(jīng)逐漸滲透到生活的方方面面,并開始影響、改變?nèi)藗兊母鞣N習(xí)慣。在人工智能覆蓋的眾多應(yīng)用里,語音識別無疑是最接地氣也是落地最快的,例如,語音助手已經(jīng)成為了智能手機的標(biāo)配。
不過,語音識別的下一個戰(zhàn)場并不是智能手機行業(yè),國內(nèi)外企業(yè)已經(jīng)紛紛把目光投向了市場空間更大的物聯(lián)網(wǎng)領(lǐng)域,這是語音識別乃至人工智能領(lǐng)域的一個最新的動向。在昨天的第二屆萬物互聯(lián)創(chuàng)新大會上,思必馳副總裁雷雄國分享了語音識別公司的下一個突破口以及面臨的挑戰(zhàn)。
語音識別將成為萬億級的物聯(lián)網(wǎng)設(shè)備的標(biāo)配
其實上午有聊到很多的例子,訊飛聽見的語音識別其實已經(jīng)達到一個很高的水平。怎么樣才能讓未來機器為人服務(wù),能夠幫人完成任務(wù)這件事情,事實上還有很長的路要走。我們回頭來看互聯(lián)網(wǎng)以及交互方式的發(fā)展,能夠看到一個比較清晰的脈絡(luò)。
我們已經(jīng)完成了從PC互聯(lián)網(wǎng)到移動互聯(lián)網(wǎng)的跨越,下一個階段將是物聯(lián)網(wǎng)(IoT),而在這個發(fā)展過程中,用戶數(shù)基數(shù)是呈倍數(shù)增長的。雷雄國認為,圍繞硬件形態(tài)以及聯(lián)網(wǎng)的形態(tài),在上述轉(zhuǎn)變過程中,交互模式也在不斷的發(fā)生變化。
傳統(tǒng)的PC端,無外乎網(wǎng)頁的搜索,文字形的。再到手機端是通過觸屏的方式,甚至有一些帶語音交互的APP,甚至包括手機自帶的一些語音服務(wù),都逐步從實驗室走向大眾消費者。舉個例子,蘋果早在iPhone 4s上就加入了語音工具siri,在此之后,siri在每一代iPhone中都有質(zhì)的提升。從最開始命令式的控制,到最后聊天式,再到現(xiàn)在蘋果未來大的方向,它真正能夠達到一個助理、個人秘書的產(chǎn)品發(fā)展方向。
不過,智能手機市場已經(jīng)遇到了天花板,語音識別公司也必須做出戰(zhàn)略上的改變。那么手機之后,還有什么設(shè)備會集成語音識別的功能呢?
雷雄國給出的答案是所有物聯(lián)網(wǎng)設(shè)備,小至智能音響,大到汽車、風(fēng)力發(fā)電機,這些設(shè)備的交互方式都會因語音識別在未來得到改變。而這樣的改變也是必然趨勢,“因為它可能沒有屏幕,或者屏幕非常小,這個時候語音的交互顯得尤為重要。”
毫無疑問,如果每一臺物聯(lián)網(wǎng)設(shè)備都植入語音識別功能,那么以萬億級出貨量的物聯(lián)網(wǎng)市場來算,這將會是一個巨大的市場空間。
挑戰(zhàn):如何從聽見到聽懂?
這和語音交互密不可分,可以說語音交互第一個入口就是語音識別,語音交互能夠得到快速的發(fā)展得益于聲學(xué)模型、語言模型以及聲學(xué)處理這三個核心技術(shù)的逐步成熟,以及移動互聯(lián)網(wǎng)時代收集的大量數(shù)據(jù)。
不過,雷雄國也坦言,雖然語音識別已經(jīng)達到非常高的可用化程度,但要從聽見到聽懂,還有很多挑戰(zhàn)要克服。例如,對于人說話習(xí)慣的適應(yīng),以及在人使用這個設(shè)備時不同的場景,不同的噪音環(huán)境都會有比較大的條件。在這些深入垂直領(lǐng)域需要更多的技術(shù)人員,以及創(chuàng)業(yè)的團隊,甚至像BAT這些大公司投入比較大的力量,把這些核心技術(shù)攻關(guān)掉。
從學(xué)術(shù)角度講,有一種語義不確定性,即同一句話,它能夠代表的意思根據(jù)上下文,根據(jù)你所在的用戶使用場景,會是非常大的不一樣。
雷雄國表示,圍繞這個不確定性,在學(xué)術(shù)界語音識別公司要從語義,以及從多輪交互上,甚至在統(tǒng)計模型上做一些比較深入的解決方案出來,才能準(zhǔn)確的識別信息;另外,深度神經(jīng)網(wǎng)絡(luò)也將在語音識別問題上發(fā)揮重要作用。
除此之外,在機器人以及其它形態(tài)的智能硬件中,因為交互距離會比手機更遠,所以還需要加入一些遠場降噪的核心技術(shù),同時在應(yīng)用場景上需要把一些回聲對消做上去,這樣使得整個交互場景更加的人性化,體驗會更好。
具體來講,從聽見到聽懂的過程就是人機對話。雷雄國表示,人機對話可以分成三類:第一類,閑聊式的,舉個例子,用戶說“我餓了”,siri會跟你說,你餓了就去吃飯唄,它的應(yīng)用場景非常有限;第二是問答式對話,例如,用戶問現(xiàn)在是幾點鐘了,語音助手就會給出確定的回答;第三類是最熱的任務(wù)式對話,它會結(jié)合你個人很多信息,然后綜合去判斷接下來怎么樣去做歸零,完成一個任務(wù)。
這是一個完全不同的場景,例如你還是說我餓了,任務(wù)式對話會問你要吃什么菜,什么口味,大概是什么價位,以及你能夠承受送貨的時間是多少,等等這一系列的對話,通過這種對話式交互之后,最后才幫你解決問題,這是對話式交互核心要素。
雷雄國介紹,在任務(wù)對話模式下,要完成“我餓了”到實現(xiàn)定餐的閉環(huán),有兩個核心點:第一是語義,一定要理解“我餓了”,他并沒有說要買什么東西,一定要理解他在這個情景下需要定餐;第二,對于這個意圖的跟蹤,多輪次的交互要結(jié)合上下文,甚至在縱向緯度需要結(jié)合你的日常,例如,未來我們可能會和阿里后臺一些數(shù)據(jù)做一些對接,對于你餓了的習(xí)慣做一些多緯度的決策依據(jù),做更人性化的自然語言交互。
這和傳統(tǒng)一輪式的語音交互(語音輸入進去,理解后給一個反饋)有很大的區(qū)別,我們需要有關(guān)于對話的管理,以及對于環(huán)境和當(dāng)前對話所在的知識理解更為系列的后臺知識庫,圍繞這些知識庫做不同的反饋。最終的效果就是,不同的人說相同的話,機器也能給出不同的反饋。
??中國為何造不出Echo??
在眾多語音識別和智能硬件的結(jié)合案例里,亞馬遜的Echo無疑是最受追捧的一個產(chǎn)品。但遺憾的是,中國有大量的智能硬件公司,也有不少優(yōu)秀的語音識別企業(yè),卻并沒有一款像Echo這樣的產(chǎn)品。
雷雄國認為這主要有兩個原因:
其中一個很重要的原因是交互并沒有做好,我們知道亞馬遜在做Echo這件事情上面投入非常大,第一是2C產(chǎn)品本身的事情上。萬眾創(chuàng)新,雙創(chuàng)的這兩年里死了非常多的創(chuàng)業(yè)企業(yè),這里說明一件事情,要把硬件2C產(chǎn)品做好是非常難的一件事。
第二,人工智能整個語音交互,以及它背后不僅僅是語音識別,包括語義,包括你們聽懂它之后,里面的內(nèi)容和服務(wù)都是非常大的挑戰(zhàn)。我們能夠欣喜的看到國內(nèi)有出類似的產(chǎn)品,但是并沒有把這個熱潮,把這個產(chǎn)品做成一個爆款。
綜合這兩個原因,我們可以理解為語音識別的落地需要以模式創(chuàng)新和技術(shù)創(chuàng)新為基礎(chǔ),盡管要做到這兩點道阻且長,但可以確定的是,未來語音識別將無處不在,也是最有效地交互方式之一。
-
物聯(lián)網(wǎng)
+關(guān)注
關(guān)注
2938文章
46980瀏覽量
403572 -
語音識別
+關(guān)注
關(guān)注
39文章
1795瀏覽量
115191 -
人工智能
+關(guān)注
關(guān)注
1812文章
49529瀏覽量
259066
發(fā)布評論請先 登錄
國星光電LED植物照明技術(shù)助力農(nóng)業(yè)新質(zhì)生產(chǎn)力發(fā)展
5G與6G:從“萬物互聯(lián)“到“智能無界“的跨越
華為攜手共贏萬物互聯(lián)的智能時代
靈汐科技邀您共赴2025人工智能計算大會
鯤云科技即將亮相AICC 2025人工智能計算大會
自主生產(chǎn):制造業(yè)的未來
它人機器人亮相2025綿陽統(tǒng)一戰(zhàn)線助力新質(zhì)生產(chǎn)力發(fā)展大會
CES Asia 2025蓄勢待發(fā),聚焦低空經(jīng)濟與AI,引領(lǐng)未來產(chǎn)業(yè)新變革
最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門學(xué)習(xí)課程參考2025版(大模型篇)
華為中國行2025廣東新質(zhì)生產(chǎn)力創(chuàng)新峰會成功舉辦
光電感知賦能智能未來 靈途科技護航新質(zhì)生產(chǎn)力發(fā)展
萬物相連通訊:共繪萬物互聯(lián)藍圖

人工智能與計算產(chǎn)業(yè)生態(tài)峰會暨哈爾濱新質(zhì)生產(chǎn)力峰會圓滿落幕
嵌入式和人工智能究竟是什么關(guān)系?
58大新質(zhì)生產(chǎn)力產(chǎn)業(yè)鏈圖譜

評論