chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

車載語音如何攻克技術(shù)與體驗門檻

高工智能汽車 ? 來源:cg ? 2018-12-17 15:52 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近年來,語音交互算是真正在市面上火了一把。智能手機智能音箱、機器人,但凡是市面上我們能看到的所謂標(biāo)榜智能的產(chǎn)品,或多或少都搭載了語音交互的功能。

和觸控、按鍵、手勢等交互方式一樣,語音交互也是一種人機交互方式,并且是被業(yè)界認為是最便捷、最符合人類交互習(xí)慣的一種交互方式,甚至有業(yè)內(nèi)人士宣稱,未來語音交互將會逐步取代按鍵和觸控,成為主流的人機交互方式。

無論是考慮到用戶的使用習(xí)慣還是市場競爭和變革的壓力,對于汽車行業(yè)來說,主機廠和車載語音供應(yīng)商都不愿意放過這個機會,致力于在車載語音交互方面實現(xiàn)從量到質(zhì)的轉(zhuǎn)變。

但,就目前大多數(shù)用戶的使用體驗來看,類似于山東大漢怒罵車載語音服務(wù)這類讓人哭笑不得的新聞,背后反映的其實是現(xiàn)階段的車載語音恐怕還沒我們想的那樣成熟和智能。

其實也很容易理解,發(fā)展比較完善的消費電子端的語音交互都還停留在向智能進化的過程中,車載語音就更“低能”了。

下面是一些實際車主對于目前已經(jīng)搭載智能語音交互的車型的評價:

語音助手莫名其妙被激話,這時導(dǎo)航的語音提示會停止,如果此時你正在叉路口是不是要懵逼?

特別是語音導(dǎo)航,多人試過,沒有一次可識別的。

語音識別還湊合,主要問題是聽不懂同音字,車機可玩性差。

我們體驗過的眾多語音識別系統(tǒng)中,雖然有支持多輪對話的,但對話節(jié)奏、語速、還有這句話說完了,多久再說下一句它還能接上,這些問題還都沒有很好的解決掉。

車載語音很雞肋,沒網(wǎng)絡(luò)用不了。語音功能不開網(wǎng)絡(luò)時幾乎就是個聾子,是不識別的話,再說下一句話,還需要你低頭還要點下麥克風(fēng)圖標(biāo)。

汽車的使用場景與消費電子不同,汽車在行駛過程中一直面臨著來自各方的噪音干擾,如發(fā)動機、車噪、胎噪、空調(diào)噪聲、風(fēng)噪、中控多媒體等。

這樣就對車載語音的拾音和降噪能力提出了很高的要求,而這也正是車載語音當(dāng)前比較難以攻克的問題。

多麥克風(fēng)陣列技術(shù)

機器在進行語音識別時主要是通過前端的信號處理和提取,也就是拾音降噪處理,然后將接收到的聲音輸入到識別系統(tǒng)中,經(jīng)過識別系統(tǒng)執(zhí)行指令或進行智能回復(fù)。

在語音識別前期,工程師需要對機器進行大量的訓(xùn)練和學(xué)習(xí)。從前端的降噪處理將聲學(xué)信號進行處理,轉(zhuǎn)變?yōu)闄C器能夠聽懂的語言,當(dāng)有了足夠的文本數(shù)據(jù)和語音之后,后端模塊將負責(zé)讓機器學(xué)習(xí)如何理解閱讀,比如每個字的讀音、什么樣的文本組合是通順的,然后提取有用的數(shù)據(jù)模型構(gòu)成數(shù)據(jù)庫。最后機器從數(shù)據(jù)庫和語言模型信息的網(wǎng)絡(luò)搜索相應(yīng)的信息解碼,輸出結(jié)果。

這只是語音識別和降噪的一個簡單過程,在實際應(yīng)用中,情況遠比這更加復(fù)雜。

就拿第一步拾音這個過程,麥克風(fēng)要如何接收到不同方位的聲波?最明顯的一個問題就是現(xiàn)在中控區(qū)的語音主要是針對主駕駛員方向的,如果副駕和后座乘客想要進行語音交互,機器能分別接收和識別到他們的聲源嗎?

答案是肯定的,實際體驗過車載語音交互的用戶大概有所體會。當(dāng)我們坐在主副駕位置時,我們可以很輕松的使用語音交互,它可以清晰的辨別這兩個位置的聲源進行識別。

但如果是后座的乘客想要使用中控區(qū)的語音交互就顯得有些困難,用戶需要大聲呼叫或者是身體向前傾,也就是必須要讓聲源和麥克風(fēng)的距離足夠的近,才能夠采集到聲源信息。

在這方面業(yè)內(nèi)大多采用麥克風(fēng)陣列技術(shù)進行多位置識別,通過多個麥克風(fēng)能夠計算聲源的角度和距離,從而對目標(biāo)聲源進行定向拾音。此外,這也涉及到麥克風(fēng)的設(shè)計位置和組合方式,比如主駕駛方位需要安放幾個麥克風(fēng),什么樣的組合方式,副駕以及后座需要安放幾個。

通常情況下有兩種方案:單麥克風(fēng)方案和雙麥克風(fēng)方案。單麥克風(fēng)方案只接收主駕位置的聲音,對于其他方位傳來的聲音會選擇過濾屏蔽掉。雙麥克風(fēng)就是在主副駕各放置一個麥克風(fēng),通過聲音發(fā)出的強弱和響度來判斷方位。

現(xiàn)在的語音廠商更多會把自家的技術(shù)優(yōu)勢和市場的需求結(jié)合起來,希望在龐大的車載語音市場里打造自己特色的語音服務(wù)。思必馳告訴高工智能汽車,每家語音廠商采用的識別方案都不盡相同,但最終的目的都是希望能提升用戶的體驗。

在定向拾音方面,思必馳也有他們自己的方案,如主駕模式和整車模式。當(dāng)用戶設(shè)置為主駕模式時,主要針對駕駛員方向進行識別,整車模式就是多方位拾音,包括駕駛員、副駕駛和后座乘客。背后主要依靠強大的軟件算法能力,實現(xiàn)定向增強或抑制某個方向的聲音。

車載語音的降噪

除了定向拾音,車載語音的降噪也是現(xiàn)在面臨的一大難點。總體來說汽車遇到的噪音干擾可以分為三大類,第一種是汽車硬件里面發(fā)出的底噪。第二種是車機或設(shè)備發(fā)出的聲音,如多媒體播放的音視頻、空調(diào)聲音等。第三種就是汽車外部的環(huán)境音,諸如風(fēng)噪、交通噪音等。

在我們普通人理解降噪就是對那些噪音進行過濾和隔離,實際上廠商也確實是這樣做的。不過,它是針對不同的噪音采用不同的降噪方案。

根據(jù)思必馳介紹,第一類噪音主要是通過軟件的算法來過濾或者是調(diào)整硬件結(jié)構(gòu)的設(shè)計達到降噪的效果。

第二類噪音是通過AEC回聲消除法(即對揚聲器信號與由它產(chǎn)生的多路徑回聲的相關(guān)性為基礎(chǔ),建立遠端信號的語音模型,利用它對回聲進行估計,將回聲估計值從話筒的輸入信號減去,最后達到消除回聲的目的)。

第三類是針對空調(diào)、胎噪這種有固定頻率的噪音,需要采用軟件算法來消除。

在汽車實際駕駛過程中,遇到的噪音干擾只會更加復(fù)雜和多變?,F(xiàn)在的降噪方案也并不是完美的,至少從技術(shù)上來說還有很大的提升空間。

其實車載語音面臨的技術(shù)難關(guān)遠不止降噪和識別,比如,在拾音后要如何識別語義進行解析?解析之后如何對接更多豐富的信源,讓車載語音的適用范圍變得廣泛,這其中包括對聲紋、性別和場景的識別,也就是車載語音交互的情感化和智能化。

不過,在期待車載語音變得更加聰明之前,我們還是先寄希望于車載語音能夠聽得見聽得懂。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 車載語音
    +關(guān)注

    關(guān)注

    0

    文章

    21

    瀏覽量

    10444
  • 語音交互
    +關(guān)注

    關(guān)注

    3

    文章

    307

    瀏覽量

    28607

原文標(biāo)題:車主抱怨不斷,車載語音如何攻克“技術(shù)與體驗門檻” | GGAI頭條

文章出處:【微信號:ilove-ev,微信公眾號:高工智能汽車】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    普強智能語音技術(shù)重新定義車載交互邊界

    普強憑借自主研發(fā)的智能語音技術(shù),為某國內(nèi)頭部車企提供的語音前處理、喚醒詞、ASR、TTS等技術(shù)模塊,構(gòu)建覆蓋泰語、俄語、韓語、日語等多語種的語音
    的頭像 發(fā)表于 07-11 14:00 ?326次閱讀

    汽車智能座艙ITU-T測試認證,車載語音通信測試智慧解決方案

    隨著車聯(lián)網(wǎng)和人工智能技術(shù)的不斷發(fā)展,駕駛者與車機互動場景越來越多,車機系統(tǒng)的語音通信質(zhì)量正在變得越來越重要,各個國家和車輛生產(chǎn)廠越來越重視車載語音通信質(zhì)量的提升。然而,
    的頭像 發(fā)表于 06-25 11:04 ?841次閱讀
    汽車智能座艙ITU-T測試認證,<b class='flag-5'>車載</b><b class='flag-5'>語音</b>通信測試智慧解決方案

    芯資訊|廣州唯創(chuàng)電子WTK6900P語音識別芯片:離線語音交互的革新者

    智能家電、工業(yè)控制、消費電子等領(lǐng)域提供了低門檻、高可靠性的語音交互解決方案。以下從核心技術(shù)、性能優(yōu)勢及行業(yè)應(yīng)用三個層面,深度解析其核心競爭力。一、核心性能:離線語音
    的頭像 發(fā)表于 05-22 09:22 ?239次閱讀
    芯資訊|廣州唯創(chuàng)電子WTK6900P<b class='flag-5'>語音</b>識別芯片:離線<b class='flag-5'>語音</b>交互的革新者

    離線語音交互賦能車載氛圍燈:NRK3502芯片引領(lǐng)人車關(guān)系新紀元

    分散駕駛員的注意力。隨著智能網(wǎng)聯(lián)技術(shù)的發(fā)展,NRK3502語音識別芯片的引入,為車載氛圍燈賦予了更智能、更便捷的交互方式。NRK3502芯片在車載燈上的性能1.離線
    的頭像 發(fā)表于 04-30 18:16 ?229次閱讀
    離線<b class='flag-5'>語音</b>交互賦能<b class='flag-5'>車載</b>氛圍燈:NRK3502芯片引領(lǐng)人車關(guān)系新紀元

    智能座艙:車載語音交互測試內(nèi)容

    隨著汽車智能化的飛速發(fā)展,車載語音交互系統(tǒng)已從早期的輔助功能逐漸演變?yōu)橹悄茏摰暮诵慕换シ绞街?。駕駛者通過語音指令即可輕松完成導(dǎo)航設(shè)置、音樂播放、電話撥打,甚至車輛部分功能的控制,這種便捷性不僅
    的頭像 發(fā)表于 04-24 15:29 ?1049次閱讀
    智能座艙:<b class='flag-5'>車載</b><b class='flag-5'>語音</b>交互測試內(nèi)容

    車載語音高階功能裝配率飆升,趨向認知交互發(fā)展

    佐思汽研發(fā)布《2025年車載語音行業(yè)研究報告》。 01 車載語音裝配率突破83%,高階語音功能裝配率大幅提高 2024年1-11月,
    的頭像 發(fā)表于 02-10 13:43 ?1304次閱讀
    <b class='flag-5'>車載</b><b class='flag-5'>語音</b>高階功能裝配率飆升,趨向認知交互發(fā)展

    MCU在車載系統(tǒng)中的展望

    和實時性表現(xiàn),以滿足車載系統(tǒng)中多任務(wù)處理的需求,如自動駕駛輔助系統(tǒng)中同時處理多個傳感器數(shù)據(jù),信息娛樂系統(tǒng)中同時處理語音指令和手勢動作等。此外,隨著車聯(lián)網(wǎng)技術(shù)的發(fā)展,MCU將承擔(dān)更多網(wǎng)絡(luò)通信與遠程監(jiān)控
    發(fā)表于 01-17 12:11

    標(biāo)貝數(shù)據(jù)標(biāo)注案例分享:車載語音系統(tǒng)數(shù)據(jù)標(biāo)注

    車載語音識別系統(tǒng)是指利用機器學(xué)習(xí)算法實現(xiàn)的一種自然語言處理技術(shù),載語音識別系統(tǒng)通過辨別聲音的語調(diào)、語速和音量,將所聽到的語音轉(zhuǎn)化成可讀取的語
    的頭像 發(fā)表于 12-24 14:24 ?571次閱讀
    標(biāo)貝數(shù)據(jù)標(biāo)注案例分享:<b class='flag-5'>車載</b><b class='flag-5'>語音</b>系統(tǒng)數(shù)據(jù)標(biāo)注

    語音識別技術(shù)的應(yīng)用與發(fā)展

    語音識別技術(shù)的發(fā)展可以追溯到20世紀50年代,但直到近年來,隨著計算能力的提升和機器學(xué)習(xí)技術(shù)的進步,這項技術(shù)才真正成熟并廣泛應(yīng)用于各個領(lǐng)域。語音
    的頭像 發(fā)表于 11-26 09:20 ?1629次閱讀

    車載網(wǎng)關(guān)解決方案,車載網(wǎng)關(guān)應(yīng)用和技術(shù)分享

    從實驗室到車間:一名技術(shù)工程師眼中的SV900 ——星創(chuàng)易聯(lián)車載網(wǎng)關(guān)的研發(fā)歷程與實踐作為星創(chuàng)易聯(lián)的技術(shù)支持工程師,我想以一個理性派的視角,談?wù)勎覀兊腟V900車載網(wǎng)關(guān)
    的頭像 發(fā)表于 11-19 10:48 ?537次閱讀
    <b class='flag-5'>車載</b>網(wǎng)關(guān)解決方案,<b class='flag-5'>車載</b>網(wǎng)關(guān)應(yīng)用和<b class='flag-5'>技術(shù)</b>分享

    ASR語音識別技術(shù)應(yīng)用

    ASR(Automatic Speech Recognition)語音識別技術(shù),是計算機科學(xué)與人工智能領(lǐng)域的重要突破,能將人類語音轉(zhuǎn)換為文本,廣泛應(yīng)用于智能家居、醫(yī)療、交通等多個領(lǐng)域。以下是對ASR
    的頭像 發(fā)表于 11-18 15:12 ?2061次閱讀

    車載空氣凈化器離線語音識別聲控芯片方案

    如人意,嚴重威脅著駕乘人員的健康。因此,車載空氣凈化器應(yīng)運而生,并逐漸成為現(xiàn)代汽車的標(biāo)配之一。為了提升用戶的使用體驗,聲控技術(shù)被廣泛應(yīng)用于車載空氣凈化器中。離線語音識別
    的頭像 發(fā)表于 11-14 01:02 ?634次閱讀
    <b class='flag-5'>車載</b>空氣凈化器離線<b class='flag-5'>語音</b>識別聲控芯片方案

    車載空氣凈化器語音芯片方案

    車載空氣凈化器采用離線語音識別NRK3301芯片,提升便捷性、安全性,高識別率、低誤報率,支持多語言、自定義指令,滿足用戶需求,增強使用體驗。
    的頭像 發(fā)表于 11-13 10:22 ?475次閱讀
    <b class='flag-5'>車載</b>空氣凈化器<b class='flag-5'>語音</b>芯片方案

    雷諾下一代車載語音助手Reno將引入生成式AI技術(shù)

    11月1日,賽輪思軟件技術(shù)公司與雷諾公司宣布深化合作,旨在將生成式AI技術(shù)和類人交互功能融入雷諾下一代多模態(tài)虛擬車載助手Reno中。   雷諾推出的虛擬助手Reno被設(shè)計為智能旅行伴侶,旨在
    的頭像 發(fā)表于 11-01 16:39 ?1779次閱讀

    語音集成電路是指什么意思

    語音集成電路(Voice Integrated Circuit,簡稱VIC)是一種專門用于處理語音信號的集成電路。它通常包括了語音識別、語音合成、
    的頭像 發(fā)表于 09-30 15:44 ?878次閱讀