語音交互在汽車行業(yè)的應(yīng)用并非是最近幾年才出現(xiàn)的,早在2000年的時候就已經(jīng)有汽車搭載了語音交互,但那時用戶對這種交互方式還非常陌生,使用頻率也很低。
近年來,隨著人工智能、車聯(lián)網(wǎng)以及無人駕駛技術(shù)的快速發(fā)展,車載語音才真正地火爆起來為用戶所熟知。
盡管主機廠、供應(yīng)商叫囂著汽車的車載語音如何準(zhǔn)確、如何智能等,尷尬的現(xiàn)實情況卻是車載語音的火熱程度和它的用戶體驗度之間并不是一個正向遞增關(guān)系。
簡而言之,就是用戶對現(xiàn)今車載語音的體驗并不滿意。想讓用戶心甘情愿的為語音交互買單,語音技術(shù)廠商需要做出更多成果讓用戶信服。
合格的車載語音首先要保證聽得見
作為一家語音技術(shù)方案商,思必馳一直專注垂直領(lǐng)域下的智能對話式交互,根據(jù)各個垂直行業(yè)做場景化的語音技術(shù)創(chuàng)新、優(yōu)化,做差異化的語音解決方案。先后推出環(huán)形6+1遠(yuǎn)場麥克風(fēng)陣列、車載天琴助手、DUI-對話定制平臺和會話精靈企業(yè)服務(wù)等多種業(yè)務(wù)方案。
在車載語音交互上,思必馳始終保持對車載的垂直領(lǐng)域進(jìn)行不斷的技術(shù)創(chuàng)新,包括不斷引進(jìn)國際化專家人才和人工智能人才培養(yǎng)。除了技術(shù)端,產(chǎn)品端口也一直不斷從穩(wěn)定性、客戶剛需以及增加樂趣三個維度來進(jìn)行產(chǎn)品體驗的提升。
互聯(lián)網(wǎng)在汽車領(lǐng)域的大規(guī)模普及和應(yīng)用已經(jīng)成為了既定的事實,未來車聯(lián)網(wǎng)和自動駕駛技術(shù)的不斷發(fā)展將會把汽車變成一個重要的入網(wǎng)端口。
作為一個人機交互系統(tǒng),汽車上所有的功能應(yīng)用都是基于安全這個大前提進(jìn)行的,所以選擇一個安全自然的交互方式就顯得尤為重要,這也是為什么當(dāng)下的觸屏 交互并不是最合適的車內(nèi)交互方式。
思必馳車載事業(yè)部副總經(jīng)理宋佳認(rèn)為,與按鍵和觸控相比,語音交互是一個更好好的選擇,它可以讓駕駛員的雙眼鎖定在前方道路,不用低頭或是視線偏移,而僅靠語音指令就能夠?qū)崟r溝通。在確保駕駛安全的前提下,駕駛員也能夠獲得更舒適流暢的車內(nèi)交流體驗。
現(xiàn)在很多用戶抱怨車載語音不好用,很大原因在于車載語音在第一階段的接收和識別過程就已經(jīng)出現(xiàn)問題。一方面是來自于語音識別引擎本身存在不完善,另一方面,其實對汽車的使用環(huán)境而言,麥克風(fēng)陣列的設(shè)計也影響著整個車載語音的識別準(zhǔn)確性。
宋佳表示,車載語音的交互并不是簡單的把識別引擎和硬件車機進(jìn)行綁定就能夠達(dá)到一個很好的體驗效果,如果麥克風(fēng)和音腔結(jié)構(gòu)不合格,語音識別引擎再準(zhǔn)確也難以發(fā)揮作用。因此在硬件方面,麥克風(fēng)陣列和整個車機設(shè)計將是未來語音識別需要重點關(guān)注的部分。
對于車載語音交互來說,首先需要做到語音識別結(jié)果的準(zhǔn)確性,保證識別率,才能真的聽的清、聽得懂,其次是對接豐富的第三方資源,具備較廣泛的知識面,能夠完成車內(nèi)生活相關(guān)的指令。
宋佳表示,目前思必馳打造的天琴系統(tǒng)就已經(jīng)初步具備了用戶對智能車載語音交互的需求。
天琴系統(tǒng)是一個人車合一的多模式交互系統(tǒng),語音是首要的交互入口,用戶可以通過語音發(fā)布指令,完成搜索、查找等動作。在導(dǎo)航時,用戶不需要手動操作就可以快速完成搜索目的地、查找路線等一系列操作,減少了用戶使用雙手帶來的駕駛安全問題。
此外,語音并不是唯一的交互選擇,在天琴系統(tǒng)中,思必馳將語音、觸控屏和方向盤進(jìn)行了高度的融合,使三者之間的交互實現(xiàn)了互融互通。這其實也是現(xiàn)在車載交互發(fā)展的趨勢,在觸控和物理按鍵無法被完全取代之前,三者不同交互方式之間實現(xiàn)有機的結(jié)合是最好的選擇。
值得一提的是, 思必馳的天琴系統(tǒng)優(yōu)化了基于場景化的語音提醒,解決了用戶不知道如何與語音產(chǎn)品對話的煩惱,也省去用戶自己花費時間挖掘產(chǎn)品功能,降低學(xué)習(xí)使用的門檻,實現(xiàn)了可見即可說。
智能化的車載語音應(yīng)該具有主動思考和預(yù)判能力
除了在識別準(zhǔn)確率上存在的問題,現(xiàn)階段的車載語音還面臨著如何提高智能化的問題,比如,用戶希望車載語音系統(tǒng)能夠像真正的人工智能一樣,具有主動思考的能力。當(dāng)用戶發(fā)出指令的時候,能夠快速的反應(yīng)并捕獲用戶接下來的意圖,幫助用戶做出決定。
宋佳表示,車載語音交互再往更高一層發(fā)展必然是智能化的語音交互,而智能語音交互不是簡單的語音+車聯(lián)網(wǎng)的組合,它背后必然是基于機器大量的深度學(xué)習(xí),包括從數(shù)據(jù)中尋找類似事例來訓(xùn)練或是通過歸納大數(shù)據(jù)樣本的共性對語音指令做出決斷。
這也是語音技術(shù)發(fā)展的難點。
事實上,當(dāng)前市面上多數(shù)語音技術(shù)方案商研發(fā)的語音+車聯(lián)網(wǎng)場景的應(yīng)用平臺,大部分是基于硬性的問答式語音交互,而針對智能化、人性化的語音交互的探索還不夠深入,導(dǎo)致車機的主動思考及預(yù)判能力幾乎為零。
因此,對于語音供應(yīng)商來說,如何讓車載語音覆蓋更多的應(yīng)用場景提高它的思考預(yù)判能力成為車載語音智能化的關(guān)鍵。
思必馳的天琴系統(tǒng)通過場景化語義解析,涵蓋導(dǎo)航、電臺、音樂、電話、應(yīng)用操控、汽車操控、違章查詢、指定地點查詢、路況、今日限行等各領(lǐng)域內(nèi)容。
基于周邊服務(wù)的整合,語音系統(tǒng)已經(jīng)可以開始預(yù)判用戶的需求,并幫助用戶做出預(yù)判。例如用戶語音搜索目的地電影院,系統(tǒng)除了快速彈出電影院推薦、結(jié)合導(dǎo)航時間進(jìn)行場次推薦外,還能直接幫助訂票、選位。
技術(shù)的不斷創(chuàng)新對語音交互來說非常重要 ,因為語音底層技術(shù)能確保系統(tǒng)更清晰的識別用戶的語音指令,從而更好的接收指令、理解指令,最后快速的做出反饋。
但是隨著底層技術(shù)能力的不斷提升,未來關(guān)于語音交互服務(wù)的整合能力將成為影響用戶體驗的關(guān)鍵。這種整合能力不僅是讓車載語音系統(tǒng)聽得清楚、聽得懂,更重要的是如何將不同資源、服務(wù)對接,成為名副其實的智能語音。
畢竟,語音交互只是手段,不是最終目的,交互的目的只是為了讓機器更好地完成任務(wù)提升用戶體驗。
據(jù)思必馳介紹,公司現(xiàn)在已經(jīng)占據(jù)了車載語音后裝市場70%的市場份額,今年進(jìn)入前裝市場,目前前裝已經(jīng)合作幾十家tier1企業(yè)和車廠,大部分都已量產(chǎn)上市。
宋佳表示,未來思必馳還將繼續(xù)拓寬車載語音的應(yīng)用,2019年將實現(xiàn)聲紋商用落地,單輛車多賬戶并存成為可能,同時,還會有基于聲紋的個性化推薦和回復(fù)。在語音識別上,多麥克風(fēng)陣列實現(xiàn)對不同方位的聲源定位,可以提供不同座位的獨立車控操作。
-
智能化
+關(guān)注
關(guān)注
15文章
5127瀏覽量
57274 -
車載語音
+關(guān)注
關(guān)注
0文章
21瀏覽量
10444
原文標(biāo)題:從聽見到聽懂,思必馳在車載語音方面如何做好垂直化、差異化? | GGAI專訪
文章出處:【微信號:ilove-ev,微信公眾號:高工智能汽車】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
思必馳宣布完成一筆新融資
思必馳宣布,再獲新一輪融資
思必馳AI辦公本助力政企數(shù)字化轉(zhuǎn)型
ArkUI-X平臺差異化
思必馳AI辦公本亮相京東直播間
思必馳助力吉利領(lǐng)克900打造語音助手Lynkye
何維率一行蒞臨思必馳調(diào)研
EM儲能網(wǎng)關(guān) ZWS智慧儲能云應(yīng)用(8) — 電站差異化支持

評論