chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

百億美元市場的語音識別為何如此受青睞?

高工智能汽車 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:工程師譚軍 ? 2018-07-12 10:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

有數(shù)據(jù)顯示,到2020年,全球語音市場規(guī)模預(yù)計將達(dá)到 191.7 億美元。語音識別作為研究人工智能的方向之一,隨著語音交互技術(shù)的發(fā)展,語音AI芯片也隨之誕生。現(xiàn)在不論是互聯(lián)網(wǎng)巨頭,還是AI 初創(chuàng)公司,都陸續(xù)宣布進(jìn)軍芯片領(lǐng)域。

回頭看國內(nèi)車載語音市場,真正開始發(fā)展可以說是在2013年。在此之前,車內(nèi)語音部分的運用最多也就是聽音樂和廣播,雖然車載語音已經(jīng)出現(xiàn),但系統(tǒng)還處于初級階段,準(zhǔn)確率還不夠高,市場普及度很低。

2013年是一個轉(zhuǎn)折點,行業(yè)開始變革,更多人開始關(guān)注車載語音市場的發(fā)展。2015年之后側(cè)重云端方向,和智能汽車、車聯(lián)網(wǎng)的發(fā)展方向相關(guān),產(chǎn)品形態(tài)也越來越標(biāo)準(zhǔn)。

2016年,隨著人工智能領(lǐng)域的發(fā)展,很多公司在智能語音部分加大了力度, 特別是對語音芯片的研發(fā)。今年更是語音芯片“爆發(fā)”的一年,并且在之后的一段時間,語音芯片還會持續(xù)作為熱點。

多場景、低功耗

不同的語音技術(shù)公司研發(fā)語音芯片的考慮可能都不太一樣,大體上來講有幾方面原因。

首先是快速集成和低功耗的需要。語音芯片能夠更好地將本地功能進(jìn)行集成,同時由于現(xiàn)在涉及深度學(xué)習(xí)的計算量巨大,終端設(shè)備對功耗的要求也很高,低功耗的芯片成為市場需求。

其次是IoT時代下多樣化場景的需要。物聯(lián)網(wǎng)場景下,設(shè)備形態(tài)是多樣化的,需要一個硬件載體,成本低,算力強,同時能承載多樣化終端設(shè)備的需求,芯片在這個過程中扮演著核心的角色。

此外還有盈利的目的。任何語音技術(shù)公司,推出產(chǎn)品或者技術(shù)、以及軟硬件一體化的方案,最終都是為了盈利。研發(fā)語音芯片也不例外,現(xiàn)在正是物聯(lián)網(wǎng)時代推動產(chǎn)品落地的時間點,增加硬件功能之后的產(chǎn)品會帶來更高的市場效益。

語音芯片,從IOT到車載

不久前,云知聲,思必馳、出門問問等語音技術(shù)公司相繼發(fā)布了自己的AI芯片計劃。

5月16日,云知聲發(fā)布了首款面向物聯(lián)網(wǎng)領(lǐng)域的AI芯片UniOne,同時,億咖通和云知聲簽署了戰(zhàn)略合作,將攜手在UniOne芯片的基礎(chǔ)上打造車規(guī)級AI芯片,這一芯片可以為用戶與車之間提供更深層次的智能語音交互能力。

5月24日,出門問問發(fā)布了國內(nèi)首款已經(jīng)量產(chǎn)的AI語音芯片模組“問芯”Mobvoi A1,它可以幫助傳統(tǒng)家電廠商獲得遠(yuǎn)場語音交互的能力,之后會在創(chuàng)維電視和微鯨電視上實現(xiàn)合作落地。

6月26日,智能語音技術(shù)公司思必馳宣布已完成新一輪融資,并宣布已與某芯片巨頭在AI芯片方面達(dá)成合作,雙方將成立合資公司,并且適用于智能語音交互的AI芯片已在研發(fā)過程中。

雖然語音技術(shù)公司陸續(xù)宣布自己在研發(fā)語音芯片,但高工智能汽車咨詢了多家語音技術(shù)公司以及主機廠,了解到現(xiàn)在還沒有專門針對車載領(lǐng)域的語音芯片。

云知聲芯片負(fù)責(zé)人李霄寒博士介紹,云知聲5月16日發(fā)布的這款芯片是UniOne 系列芯片中的第一款,從語音AI切入,芯片命名“雨燕”,主要面向的是IoT領(lǐng)域,適合智能家電、智能車載等多個人機交互場景。目前在積極推進(jìn)車規(guī)級芯片設(shè)計,預(yù)計明年推出符合車規(guī)要求的“雨燕”產(chǎn)品。

另一家語音公司思必馳宣布研發(fā)的AI芯片,也不是專門針對車載領(lǐng)域的語音芯片,預(yù)計下半年流片;出門問問推出“問芯”Mobvoi A1是語音芯片模組,即語音模組和芯片的結(jié)合,最先是在智能家居領(lǐng)域,也不是針對車載領(lǐng)域的語音芯片。

現(xiàn)在市場上推出的“語音芯片”可以稱作是傳統(tǒng)芯片的“智能化”,將芯片和語音技術(shù)融合在一起,相比傳統(tǒng)的芯片和語音技術(shù)獨立而言,語音和芯片一體化之后,二者相互結(jié)合,如果芯片能夠和語音技術(shù)很好地匹配,不僅能夠解決兼容性的問題,同時還能實現(xiàn)降低功耗需求。

車規(guī)級的語音芯片是市場需求

車載領(lǐng)域的語音芯片首先一定要滿足車規(guī)的技術(shù)要求,通過溫度、穩(wěn)定性的測試才可以上車,研發(fā)出可以通過車規(guī)的語音芯片還存在難點。

技術(shù)上,開發(fā)芯片本身就有一定的難度。軟件和芯片要結(jié)合在一起,其實就是把交互的東西放到硬件載體上,配比和兼容就是有難度的,還要做到識別速度快、適配不同的CPU、最后到實現(xiàn)量產(chǎn),都需要強大的技術(shù)支撐。

雖然現(xiàn)在缺乏車載領(lǐng)域的語音芯片,隨著汽車智能化以及車載語音交互的發(fā)展,未來車規(guī)級的語音芯片會成為市場需求。

吉利汽車負(fù)責(zé)HMI的相關(guān)人士表示,現(xiàn)在車載語音控制能力還遠(yuǎn)遠(yuǎn)不夠,就目前已經(jīng)上市的車型而言,語音的在線控制識別速度很慢,而本地詞庫又很少,自然語音狀況下語音內(nèi)容和詞庫無法匹配,就會出現(xiàn)無法識別或識別有誤。

而目前市面上推出“云+端+芯片”或者“云端芯”一體化的芯片,優(yōu)化了網(wǎng)絡(luò)識別的能力,但本地識別的能力依舊比較差,識別速度慢,用戶是比較難接受的。

語音芯片需要提高本地識別功能,但未來比較理想的是,隨著網(wǎng)絡(luò)傳輸速度的完善,研發(fā)出能夠?qū)⒈镜刈R別和在線識別結(jié)合在一起的語音芯片。

億咖通相關(guān)人士表示,隨著車聯(lián)網(wǎng),人工智能的發(fā)展,車載芯片性能遠(yuǎn)遠(yuǎn)不能滿足汽車娛樂和多樣化交互功能需求。語音作為車載系統(tǒng)的剛需和亮點,更希望有強勁的硬件加速能力和適應(yīng)力的平臺,車規(guī)級智能語音芯片會是大勢所趨。

響應(yīng)速度和識別率如何提升

最近,首款搭載“祺云概念”智聯(lián)系統(tǒng)的中期換代車型傳祺GS4搭載的智能語音控制系統(tǒng),用戶發(fā)出語音指令,系統(tǒng)便能在1.2秒內(nèi)快速反應(yīng)。官方宣稱,速度和靈敏度遠(yuǎn)超同級。

傳祺智能語音控制系統(tǒng)能夠在正常環(huán)境中實現(xiàn)95%識別正確率并具備多方言口音普通話的識別能力,離線語音識別能力、汽車訓(xùn)練的麥克陣列降噪能力、語音打斷技術(shù)、可見即可說、自定義語音喚醒等多項核心技術(shù)能力。

針對傳祺GS4智能語音控制系統(tǒng)這一大賣點,有業(yè)內(nèi)人士表示:“在網(wǎng)速、使用環(huán)境、車機CPU、內(nèi)存等各方面最佳工況時,達(dá)到1.2S響應(yīng)、95%識別率并不難?!?/p>

而在實際應(yīng)用中,車輛噪音、網(wǎng)速波動、車機后臺多進(jìn)程、硬件資源被占用、第三方執(zhí)行器件延遲等等,都會造成語音控制系統(tǒng)延遲

科大訊飛相關(guān)人士表示:“影響語音識別響應(yīng)時間有:音頻后端檢測、網(wǎng)絡(luò)傳輸、引擎處理和應(yīng)用處理四個方面。”

音頻后端點檢測是影響語音響應(yīng)速度最重要的部分,也是不可減少和用時最長的部分。講完一句語音指令,系統(tǒng)需要800ms-1000ms靜音段來識別講話是否結(jié)束,減少這個時間,則會帶來體驗下降。例如,用戶說話停頓,系統(tǒng)誤認(rèn)為用戶已經(jīng)說完了,導(dǎo)致錯誤的識別結(jié)果。

引擎處理,車機硬件配置低或其它進(jìn)程占用CPU、內(nèi)存等硬件資源,導(dǎo)致語音處理進(jìn)程沒有足夠的系統(tǒng)資源,引起處理延遲。

通過升級車機硬件和優(yōu)化引擎算法兩種方案可以有效解決問題,但升級硬件配置需要增加成本,所以主機廠更加傾向于,優(yōu)化引擎算法,在低成本硬件平臺上實現(xiàn)高效語音系統(tǒng)應(yīng)用。

網(wǎng)絡(luò)速度慢、不穩(wěn)定也是會導(dǎo)致語音識別延遲的一大因素。通過提升網(wǎng)絡(luò)傳輸速率,如未來的5G通訊,也可以有效減少延遲。

除此之外,優(yōu)化信源(地圖、音樂、電臺等等)和第三方執(zhí)行器件(開車內(nèi)燈、開天窗、座椅加熱等等),也能減少語音控制系統(tǒng)延遲,提升用戶體驗。

語音控制、觸屏、機械按鍵等都屬于控制層,最終做出執(zhí)行反饋的是信源和第三方執(zhí)行器件。如果信源和第三方執(zhí)行器件運行緩慢,也會影響用戶對語音控制系統(tǒng)的體驗。

目前,車載領(lǐng)域已經(jīng)量產(chǎn)的語音產(chǎn)品大多數(shù)響應(yīng)時間在1.5s-3s之間,當(dāng)響應(yīng)時間達(dá)到2s以上時,用戶能夠感覺到明顯的延遲。

低NVH可提高識別率

識別率對用戶體驗至關(guān)重要,識別率太低、不準(zhǔn)確,用戶好似對牛彈琴,不但不能體現(xiàn)語音控制系統(tǒng)的便利性,反而會成為雞肋配置。

主機廠相關(guān)人士表示:“提升語音識別率除了技術(shù)方面,降低車輛NVH也是一個重要的途徑。”

車輛行駛中,外界環(huán)境噪音、發(fā)動機震動噪音、胎噪、風(fēng)噪、車身共振等等都會影響語音指令識別率,所以除了不斷對語音系統(tǒng)優(yōu)化之外,降低車輛NVH也是提升語音識別率和用戶體驗的方法之一。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    462

    文章

    53215

    瀏覽量

    454504
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    37099

    瀏覽量

    290906
  • 人工智能
    +關(guān)注

    關(guān)注

    1811

    文章

    49512

    瀏覽量

    258742
  • 車聯(lián)網(wǎng)
    +關(guān)注

    關(guān)注

    76

    文章

    2680

    瀏覽量

    93430

原文標(biāo)題:“語音AI芯片”持續(xù)發(fā)酵,車載語音去向何處?| GGAI深度

文章出處:【微信號:ilove-ev,微信公眾號:高工智能汽車】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    瑞芯微RK3576語音識別算法

    1.語音識別簡介語音識別技術(shù),也被稱為自動語音識別(AutomaticSpeechRecogni
    的頭像 發(fā)表于 08-15 15:13 ?1680次閱讀
    瑞芯微RK3576<b class='flag-5'>語音</b><b class='flag-5'>識別</b>算法

    語音識別---大家怎么看呢?

    語音識別是一門交叉學(xué)科。近二十年來,語音識別技術(shù)取得顯著進(jìn)步,開始從實驗室走向市場。人們預(yù)計,未來10年內(nèi),
    發(fā)表于 08-09 10:54

    CYUSB3014無法識別為USB3.0設(shè)備怎么解決?

    我開發(fā)了一款CYUSB3014硬件,但是我在燒錄了syncfifo示例代碼后,板卡只能被識別為USB2.0設(shè)備。我確認(rèn)我的線材是支持USB3.0的,并且我檢查了19.2Mhz的晶振工作正常
    發(fā)表于 04-30 07:24

    電網(wǎng)波動測試為何如此重要?

    電網(wǎng)中常會因雷擊、短路故障、大功率設(shè)備啟動、電網(wǎng)切換或負(fù)載突變等原因,可能會導(dǎo)致如設(shè)備停機、異常重啟、醫(yī)療設(shè)備斷電危及患者等嚴(yán)重后果,那么該如何避免呢?電網(wǎng)中常會因雷擊、短路故障、大功率設(shè)備啟動、電網(wǎng)切換或負(fù)載突變等原因,出現(xiàn)電壓暫降(Dip)、短時中斷(Interruption)或電壓波動(Variation),可能會導(dǎo)致如設(shè)備停機、異常重啟、醫(yī)療設(shè)備斷電
    的頭像 發(fā)表于 03-31 11:40 ?402次閱讀
    電網(wǎng)波動測試<b class='flag-5'>為何如此</b>重要?

    語音識別技術(shù)在通信領(lǐng)域中的應(yīng)用實例

    語音識別技術(shù)也被稱為自動語音識別(Automatic Speech Recognition,ASR),是通過計算機對語音信號進(jìn)行分析和
    的頭像 發(fā)表于 02-21 17:12 ?926次閱讀

    詳解語音識別技術(shù)在通信領(lǐng)域中的應(yīng)用

    語音識別技術(shù)也被稱為自動語音識別(Automatic Speech Recognition,ASR),是通過計算機對語音信號進(jìn)行分析和
    的頭像 發(fā)表于 02-21 17:05 ?954次閱讀
    詳解<b class='flag-5'>語音</b><b class='flag-5'>識別</b>技術(shù)在通信領(lǐng)域中的應(yīng)用

    【「嵌入式系統(tǒng)設(shè)計與實現(xiàn)」閱讀體驗】+ 基于語音識別的智能杯墊

    語音命令Q 識別,適用于智能家居控制、玩具、人機交互等多個領(lǐng)域。該模塊以其高識別率、低功耗和易于集成的特點受到廣大開發(fā)者的青睞。 主要技術(shù)及功能有: 磁力攪拌、重量采集、
    發(fā)表于 01-02 18:15

    離線語音識別技術(shù)引領(lǐng)智能語音燈具市場——NRK3502

    智能語音燈具集高科技與人性化設(shè)計,內(nèi)置NRK3502離線語音識別芯片,支持遠(yuǎn)場識別與自定義指令,提供便捷智能體驗,推動智能家居行業(yè)發(fā)展。
    的頭像 發(fā)表于 12-30 15:04 ?1089次閱讀
    離線<b class='flag-5'>語音</b><b class='flag-5'>識別</b>技術(shù)引領(lǐng)智能<b class='flag-5'>語音</b>燈具<b class='flag-5'>市場</b>——NRK3502

    基于語音識別的智能會議系統(tǒng)具備哪些交互功能

    標(biāo)貝科技專注智能語音交互領(lǐng)域多年,在語音識別語音合成領(lǐng)域有著多項大型企業(yè)合作案例,標(biāo)貝與多個智能會議系統(tǒng)廠商合作,成功將語音
    的頭像 發(fā)表于 12-20 10:35 ?789次閱讀

    NRK3502系列芯片 | 制氧機離線語音識別方案

    NRK3502芯片制氧機離線語音識別方案制氧機離線語音識別方案是基于NRK3502藍(lán)牙雙模智能語音IoT芯片,依托于九芯電子在
    的頭像 發(fā)表于 12-04 01:02 ?706次閱讀
    NRK3502系列芯片 | 制氧機離線<b class='flag-5'>語音</b><b class='flag-5'>識別</b>方案

    語音識別技術(shù)在醫(yī)療領(lǐng)域的應(yīng)用

    語音識別技術(shù)在醫(yī)療領(lǐng)域的應(yīng)用已經(jīng)越來越廣泛,為醫(yī)療服務(wù)帶來了諸多便利和效率提升。以下是對語音識別技術(shù)在醫(yī)療領(lǐng)域應(yīng)用的介紹: 一、語音病歷
    的頭像 發(fā)表于 11-26 09:35 ?1545次閱讀

    語音識別與自然語言處理的關(guān)系

    在人工智能的快速發(fā)展中,語音識別和自然語言處理(NLP)成為了兩個重要的技術(shù)支柱。語音識別技術(shù)使得機器能夠理解人類的語音,而自然語言處理則讓
    的頭像 發(fā)表于 11-26 09:21 ?1929次閱讀

    語音識別技術(shù)的應(yīng)用與發(fā)展

    語音識別技術(shù)的發(fā)展可以追溯到20世紀(jì)50年代,但直到近年來,隨著計算能力的提升和機器學(xué)習(xí)技術(shù)的進(jìn)步,這項技術(shù)才真正成熟并廣泛應(yīng)用于各個領(lǐng)域。語音識別技術(shù)的應(yīng)用不僅提高了工作效率,也極大
    的頭像 發(fā)表于 11-26 09:20 ?2076次閱讀

    ASR與傳統(tǒng)語音識別的區(qū)別

    ASR(Automatic Speech Recognition,自動語音識別)與傳統(tǒng)語音識別在多個方面存在顯著的區(qū)別。以下是對這兩者的對比: 一、技術(shù)基礎(chǔ) ASR : 基于深度學(xué)習(xí)算
    的頭像 發(fā)表于 11-18 15:22 ?1807次閱讀

    ASR語音識別技術(shù)應(yīng)用

    ASR(Automatic Speech Recognition)語音識別技術(shù),是計算機科學(xué)與人工智能領(lǐng)域的重要突破,能將人類語音轉(zhuǎn)換為文本,廣泛應(yīng)用于智能家居、醫(yī)療、交通等多個領(lǐng)域。以下是對ASR
    的頭像 發(fā)表于 11-18 15:12 ?2567次閱讀