從 CES(國際消費(fèi)類電子產(chǎn)品展覽會(huì) International Consumer Electronics Show)的進(jìn)展來看,Google 現(xiàn)在確實(shí)在把語音互動(dòng)這件事搞砸,而越來越變成一家很能折騰但不太能干好事的公司。Google 在公有云上不太可能超過 Amazon 了,自動(dòng)駕駛折騰了好多年但看起來失敗的可能性非常大,而在語音互動(dòng)上 Google 很可能會(huì)再一次敗給 Amazon。
語音助手上的大 PK今年 CES 上最有意思的事情是語音互動(dòng)型產(chǎn)品泛濫,從英偉達(dá)到聯(lián)想,各大巨頭對此達(dá)成了共識(shí),紛紛殺入。這里面比較核心的兩家分別是 Amazon 和 Google,前者的代表產(chǎn)品是 Echo 和內(nèi)建的語音助手 Alexa,后者則是 Google Home 和內(nèi)建的語音助手 Google Assistant。
正常來講不管從那個(gè)角度來看都是 Google 有足夠的優(yōu)勢,有技術(shù)、有資源、有積累,但具體看下來 Google 實(shí)際上落后甚遠(yuǎn),甚至可能難以挽回。
要想看懂語音互動(dòng)這方向的走勢,那么需要深度理解與之相關(guān)的產(chǎn)品和技術(shù)的本質(zhì)特征。
Echo 這類產(chǎn)品的核心特征是多層技術(shù)高度融合(聲學(xué)、語音辨識(shí)、語義、搜索、內(nèi)容)。其中聲學(xué)是軟硬件的分割點(diǎn),向下關(guān)聯(lián)產(chǎn)品 ID 以及內(nèi)部架構(gòu),向上影響語音辨識(shí)。而語義之后的部分則是純軟件與內(nèi)容。
對于 Amazon 和 Google 這樣的公司,它們先天把自己定義為做生態(tài)和平臺(tái)的公司,所以其核心一定不是 Echo 這個(gè)硬件產(chǎn)品本身,而是背后的語音助手比如 Alexa,因?yàn)橹挥?Alexa 才代表新的生態(tài)。
Alexa 這種語音助手很多人覺得是像 Android 一樣的操作系統(tǒng),但實(shí)際上看成是一個(gè)操作系統(tǒng)+超級 App 更為合適。
要把 Alexa 這樣的語音助手裝載到各種硬件里事實(shí)上有兩種途徑:
一種是純軟性方式。我就把語音助手做好,不管誰要用裝進(jìn)去就可以了。這種型態(tài)下在技術(shù)層次上最多需要下探到語音辨識(shí),核心則是語義和對話。這型態(tài)最明顯的參照是搜索引擎。
另一種則是軟硬融合的方式。我做一個(gè)標(biāo)竿型的硬件產(chǎn)品,然后再把硬件產(chǎn)品中的助手開放出去。這型態(tài)最明顯的參照是 Android 這樣的操作系統(tǒng)。
純互聯(lián)網(wǎng)公司會(huì)傾向第一種方式,因?yàn)檫@種型態(tài)最輕,而后一種型態(tài)要組織生產(chǎn)和銷售,還要下探到聲學(xué)這樣的層次,無疑重很多。
但型態(tài)一的核心問題有兩個(gè):
語音互動(dòng)很難在現(xiàn)有平臺(tái)上啟動(dòng)(手機(jī)、平板、電腦),而直接把近場的語音互動(dòng)遷移到遠(yuǎn)場效果會(huì)很差,誰來解決落地過程中各種坑坑洼洼的問題?
不知道硬件上的需求,如何設(shè)計(jì)出與各種硬件適配的 API,如何知道怎么提供對硬件廠商最便利的方案?把這種苦累活完全下放給各個(gè)硬件廠商自己摸索嗎?
Google 開放 ASR 和 NLP 的 API 其實(shí)已經(jīng)許久了,但從 CES 的結(jié)果來看,顯然 Alexa 這種系統(tǒng)整合型的方案更受歡迎,它既解決了與下層硬件的適配問題,也解決了后端內(nèi)容整合問題。
提高一層來看整件事情,我們可以講做語音助手這事,事實(shí)上有幾個(gè)關(guān)鍵控制點(diǎn):
做標(biāo)竿型的硬件產(chǎn)品,但不與已有用戶習(xí)慣對立。直接講就是新品類必須避開手機(jī)和 PAD,否則一定會(huì)被覆寫掉。
豐富后端內(nèi)容,對于語音助手而言,硬件、音樂甚至打電話都是內(nèi)容。內(nèi)容需要從頭部開始逐漸填補(bǔ)長尾內(nèi)容。引申就是要把 Alexa 和 Echo 這個(gè)產(chǎn)品分割開來,讓它后面的東西盡可能多。
樹立技術(shù)優(yōu)勢,在這里技術(shù)既包含深度學(xué)習(xí)這樣的純演算法也包含聲學(xué)等與物理緊密相連的網(wǎng)域。當(dāng)內(nèi)容沒多到一定程度時(shí),前端技術(shù)(聲學(xué)和語音辨識(shí))要比語義重要。因?yàn)樗鼈兏绊懰俣群途取?/p> 亞馬遜做對了什么?
在上一節(jié)提到的幾個(gè)點(diǎn)上亞馬遜幾乎每個(gè)都做對了。
第一亞馬遜沒回避硬件的煩難,花了 4、5 年打造了 Echo,這樣一來亞馬遜就掌握了一個(gè)很難被超越的制高點(diǎn)。
這看著很詭異,但事實(shí)就會(huì)這樣,否則的話 Google 直接把 Google Assistant 開放出來就行了,根本不需要自己打造什么 Google Home。但實(shí)際上硬件和背后 Assistant 的耦合程度遠(yuǎn)高于搜索和瀏覽器,搜索和瀏覽器的耦合程度事實(shí)上是便利不便利,但 Alexa 和前端硬件的耦合程度則牽涉好不好用的問題。而 Google 則是迫于 Echo 的壓力才開始做 Google Home。
第二亞馬遜在 Echo 獲得初步成功后迅速開始分離 Echo 和 Alexa,具體動(dòng)作就包括完整 SDK(ASK&AVS)的檔案和案例,成立 Alexa Fund,積極搜索戰(zhàn)略合作伙伴等。最終結(jié)果之一就是所謂的 7,000 項(xiàng)技能。7,000 項(xiàng)技能是非常可怕的事,完全足以覆寫技術(shù)和某些內(nèi)容上的劣勢。這就好比淘寶上商家數(shù)一旦超過某個(gè)臨界值,QQ 流量再大也搞不定了。
那現(xiàn)在 Google 有幾個(gè)第三方伙伴呢?1 個(gè)。而且 Google 似乎還在神游,它做為后來者本應(yīng)該上來就把這一家族的東西都做了,這樣才體現(xiàn)后發(fā)優(yōu)勢,但它并沒有。
第三是用可靠的方案打造更優(yōu)異的體驗(yàn)??煽康姆桨甘钦f前端至少要和亞馬遜持平,后端再體現(xiàn)語義和內(nèi)容連線上的優(yōu)勢,這樣就可以在整體上反超。但 Google Home 很有意思的選了只裝兩支麥克風(fēng)的方案,直接導(dǎo)致互動(dòng)效果很差。這實(shí)在是大昏招,從便宜的角度解釋是合理的,但你在做的是個(gè)標(biāo)竿型產(chǎn)品,便宜與否真的那么關(guān)鍵嗎?
這意味著什么?
這意味著 Google 可能很難追上 Amazon 了。
Google 和 Amazon 相比,無疑在技術(shù)層面會(huì)有優(yōu)勢,但是如果對技術(shù)進(jìn)行分解,我們會(huì)發(fā)現(xiàn)實(shí)際上 Google 真正可能具優(yōu)勢只有 NLP 和搜索部分。這就非常可怕,因?yàn)?NLP 部分不存在質(zhì)的差異,你并無法在這個(gè)點(diǎn)上單憑演算法明顯拉開體驗(yàn),且內(nèi)容沒多到一定程度的時(shí)候,搜索的優(yōu)勢根本體現(xiàn)不出來。一旦技術(shù)突破,亞馬遜在這部分就會(huì)累積足夠的資料。請注意這里的資料是完全和場景符合的資料,而不是符合度低的網(wǎng)頁公開資料,其中還包含了用戶的各種偏好。
這時(shí)候沒人會(huì)扮演陪練 Google 的角色,一起從頭玩一遍。
在過去漫長的時(shí)間里,Google 這個(gè)公司有點(diǎn)被神話了,讓人潛意識(shí)覺得它無所不能,但 Google 實(shí)在不是一個(gè)做產(chǎn)品的公司,我們也許可以把它定義為做演算法的公司或?qū)ρ菟惴òV迷的公司。如果 Google 真的在語音互動(dòng)這事上玩大了,那核心原因很可能就在這里。
做演算法的時(shí)候技術(shù)是第一角度,但做產(chǎn)品的時(shí)候體驗(yàn)是第一角度,你無法掉過來玩:我這項(xiàng)技術(shù)很厲害,所以我要把它放進(jìn)產(chǎn)品里,用戶要為此買單;是要反過來思考,比如延遲、回應(yīng)率和對答準(zhǔn)確率在這類產(chǎn)品上影響用戶體驗(yàn),所以我要在現(xiàn)有技術(shù)上把這體驗(yàn)做到極致。
從表現(xiàn)出來的行為來看,Google 正好屬于前一種。
上面說到的只裝兩支麥克風(fēng)方案來達(dá)到 Google Home,從這個(gè)角度來解釋也是合理的。比如說如果想在云端用深度學(xué)習(xí)等處理前端訊號問題,并堅(jiān)信能做好,那這么選取前端方案就完全沒問題,后端持續(xù)改善演算法就行了。
但這樣一來產(chǎn)品體驗(yàn)上打折扣就非常厲害。如果 Google 是第一個(gè)發(fā)布這種產(chǎn)品,可用時(shí)間很多,那也問題不大,關(guān)鍵它不是,它需要這樣一款產(chǎn)品來和亞馬遜的 Echo 競爭,這就可怕了。你是后發(fā),哪怕做到一樣的水準(zhǔn)也沒啥優(yōu)勢,何況你還差一截。挑戰(zhàn)新技術(shù)這事在工程師思惟下是合理的,但在產(chǎn)品思惟下就錯(cuò)得離譜。
這類的問題點(diǎn)還有很多,比如你喚醒詞叫什么不好非叫“OK Google”,做智能助理顯然 Alexa 更適合這種擬人一點(diǎn)的情景。
Google Home 出來后本應(yīng)該使勁推廣 Google Assistant 到各大廠商,而不是躺在既有的優(yōu)勢上睡大覺(Google 在技術(shù)、不同設(shè)備關(guān)聯(lián)、內(nèi)容上是有優(yōu)勢的,畢竟它有 YouTube 等),但從 CES 上來看,Google 并沒有忙著做這事,至少到現(xiàn)在為止我們還看不到 Google 版的 Alexa Service Kit 和 Alexa Voice Service。
這樣看來 Google 和亞馬遜之間差了至少一年的差異。對打造產(chǎn)品的用戶來講選擇哪家甚至是個(gè)不用考慮的問題,一邊是有開放 API 很多第三方用戶,一邊是沒有開放 API 只有一個(gè)第三方用戶。換你也會(huì)這么選吧?。ò衍浻泊蛲?,API 封裝到這個(gè)程度還是很費(fèi)勁的,如果你不信,看看這里的文件吧。)
小結(jié)Google 的業(yè)務(wù)最依賴云端,但事實(shí)上在云服務(wù)敗于亞馬遜,Google 自動(dòng)駕駛啟動(dòng)最早,但看趨勢似乎會(huì)起個(gè)大早趕晚集;Google 人工智能投入最多,但從現(xiàn)在的進(jìn)展來看,很可能會(huì)再次敗給亞馬遜。
如果說前兩次失敗不動(dòng)搖根本,那這次很不一樣,因?yàn)樵?AI 這里互動(dòng)即是搜索,它其實(shí)輸不起,輸了就會(huì)變成另一個(gè)微軟。
評論