chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

百度與科大訊飛的競(jìng)爭(zhēng)正在從語音交互延伸到視覺交互等多模態(tài)技術(shù)上

電子工程師 ? 來源:未知 ? 作者:李倩 ? 2018-03-22 09:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近兩年來,隨著人們?cè)絹碓筋l繁使用智能產(chǎn)品,所產(chǎn)生的數(shù)據(jù)越來越龐大,這些數(shù)據(jù)又被大公司所利用,龐大的數(shù)據(jù)也將催生“機(jī)器人大腦”。

目前市面上已經(jīng)誕生出越來越多的機(jī)器人產(chǎn)品,如:早教機(jī)器人、陪護(hù)機(jī)器人、商場(chǎng)機(jī)器人、銀行機(jī)器人、法務(wù)機(jī)器人等等,但是在實(shí)際的場(chǎng)景應(yīng)用中,機(jī)器人并不能帶來真正的智能。

最主要的功能就是體現(xiàn)在機(jī)器人大腦,用專業(yè)術(shù)語講就是“語義”,我們?cè)谡Z義的采集上還處在非常初級(jí)的階段,如果處理不了語義理解,那機(jī)器人在實(shí)際場(chǎng)景中的應(yīng)用就是一個(gè)“呆子”。

讓機(jī)器人開口說話,除了語義之外,語音也是關(guān)鍵的技術(shù),國內(nèi)科大訊飛在語音技術(shù)上的造詣,讓國內(nèi)很多做機(jī)器人的企業(yè)受惠,其語音處理技術(shù)基本上已經(jīng)能滿足人們?nèi)粘I钪械氖褂眯枨蟆?/p>

但是國內(nèi)機(jī)器人產(chǎn)業(yè)接下來的發(fā)展將會(huì)開始加速,在這次1號(hào)機(jī)器人網(wǎng)研討會(huì)上,不管是百度,還是科大訊飛所傳遞的信息就是已做好全面出擊的準(zhǔn)備。

雖然國內(nèi)語音語義的發(fā)展正在加速,但是對(duì)機(jī)器人企業(yè)而言,速度還不夠快,目前不管是百度,還是科大訊飛所提供的語音語義還是不能滿足機(jī)器人在實(shí)際應(yīng)用中的要求。

城市漫步總經(jīng)理李正說:“在人們與機(jī)器人對(duì)話的過程中,一些簡(jiǎn)單的問題,機(jī)器人是可以回答,但是稍微復(fù)雜一些的問題,機(jī)器人就回答不了,BAT或科大訊飛所提供的語義,讓機(jī)器人處在小孩3歲左右的智力水平。對(duì)很多機(jī)器人企業(yè)而言,目前的瓶頸也是在這里,很難有所突破。”

科大訊飛銷售總監(jiān)廖凱說:“其實(shí)訊飛也很苦惱,語音助理已經(jīng)通過國家各種考試,很難說它的智力不行,訊飛高考機(jī)器人基于目前的成長(zhǎng)速度,到2020年會(huì)考上一本,去年的數(shù)據(jù)顯示,語文考了90多分,數(shù)學(xué)考了110多分?!?/p>

只能說人們?nèi)粘=涣髦?,所體現(xiàn)的語言很復(fù)雜,目前的大數(shù)據(jù)還不能夠支撐人們復(fù)雜的日常交流。

百度自然語言技術(shù)開放負(fù)責(zé)人張晶晶說:“人工智能聰明程度其實(shí)很大程度上取決于數(shù)據(jù),百度為什么在人工智能領(lǐng)域國內(nèi)領(lǐng)先,因?yàn)楸澈笫驱嫶蟮臄?shù)據(jù),比如百度搜索,每天有60億次搜索,這些數(shù)據(jù)支撐百度深度語義理解,像這種過億用戶的APP,百度有14個(gè),這些數(shù)據(jù)支撐了百度大腦每時(shí)每刻都在進(jìn)化?!?/p>

“國內(nèi)各大平臺(tái),如:百度UNIT、訊飛AIUI、小i機(jī)器人、思必馳等,其實(shí)各家的側(cè)重點(diǎn)不同,因此,最終的測(cè)試結(jié)果也會(huì)不同,像百度的對(duì)話效果只有達(dá)到95%以上才會(huì)放出來?!?/p>

但是在這次1號(hào)機(jī)器人網(wǎng)研討會(huì)上,機(jī)器人企業(yè)對(duì)各大平臺(tái)所提供的語義依然不是特別滿意。

或許國內(nèi)各大機(jī)器人企業(yè)過于依賴BAT等企業(yè),希望依靠BAT大企業(yè)的投入完善語音語義技術(shù),但是百度已經(jīng)在語音語義上投入了3億元,雖然技術(shù)積累很快,但是目前的瓶頸是依然還不能支撐機(jī)器人日常復(fù)雜的對(duì)話交流。

狗尾草聯(lián)合創(chuàng)始人張博說:“3至5歲小孩,同一個(gè)問題,在每個(gè)年齡段尋求的答案都不同,所以對(duì)語義的要求非常高,如果真要做好語義理解,就需要把語義理解做的足夠細(xì),再接入知識(shí)圖譜,如果是批量的知識(shí)圖譜,那就需要各大平臺(tái)開放知識(shí)庫,讓機(jī)器人企業(yè)去調(diào)用,滿足更高級(jí)開發(fā)的產(chǎn)品需求?!?/p>

從這次1號(hào)機(jī)器人網(wǎng)研討會(huì)上反饋,現(xiàn)階段讓各大平臺(tái)完全開放知識(shí)庫不現(xiàn)實(shí),像百度、科大訊飛、小i機(jī)器人等投入巨資打造知識(shí)庫,機(jī)器人企業(yè)想調(diào)用深層次語義,就需要支付相應(yīng)的報(bào)酬。

當(dāng)然很多機(jī)器人企業(yè)對(duì)語音還是另有看法,比如AI與UI,明明很多場(chǎng)景直接通過UI就可以解決的事情,干嘛非要用語音,把簡(jiǎn)單的事情復(fù)雜化。

這個(gè)問題的著重點(diǎn)在于,目前看來語音確實(shí)還不是最好用的產(chǎn)品,但是長(zhǎng)遠(yuǎn)看語音將會(huì)是最便捷的交互方式。

當(dāng)汽車和火車剛發(fā)明的時(shí)候,跑起來還沒有馬車快,但是終究汽車和火車是發(fā)展方向。

科大訊飛廖凱說:“人與機(jī)器發(fā)生交互的時(shí)候,輸入輸出信息有兩種,我們從機(jī)器身上獲取的信息,最簡(jiǎn)單的方式就是視覺,一目了然;但我們輸出的信息最自然的方式是語音。這是語音的特性,未來一定會(huì)顛覆傳統(tǒng)以鍵盤或觸屏的輸出方式?!?/p>

接下來,我們回到產(chǎn)品上來,對(duì)機(jī)器人企業(yè)而言,現(xiàn)階段就算依靠BAT等企業(yè)的語音語義技術(shù),也不能讓產(chǎn)品具備高智慧,充其量只能達(dá)到小孩3歲左右的智力水平。

所以未來的方向在于細(xì)分場(chǎng)景,比如:訂機(jī)票、訂酒店等,采用百度和科大訊飛的語音語義可以非常成熟的完成,讓用戶從查詢機(jī)票到預(yù)訂票到購買機(jī)票等全過程,期間進(jìn)行的多輪復(fù)雜人機(jī)對(duì)話可達(dá)7層以上。

因此,在一些細(xì)分商用場(chǎng)景,語音已經(jīng)可以做到替代客服的工作,對(duì)機(jī)器人企業(yè)而言,如何讓機(jī)器人+語音語義+使用場(chǎng)景落地才是接下來重點(diǎn)思考的方向。

百度張晶晶認(rèn)為,通過百度大數(shù)據(jù)分析,兒童故事機(jī)的市場(chǎng)規(guī)模很大,目前正是更新?lián)Q代的時(shí)間節(jié)點(diǎn),因此,百度對(duì)兒童領(lǐng)域的投入會(huì)有所加大。

科大訊飛廖凱說:“今年大型商用機(jī)器人會(huì)有所發(fā)展,目前訊飛曉曼機(jī)器人已經(jīng)入駐紅星美凱龍、居然之家,以及一些零售商場(chǎng)。曉曼機(jī)器人目前已經(jīng)可以做到導(dǎo)航領(lǐng)路、提供資訊、針對(duì)商場(chǎng)還提供了一套機(jī)器人營銷方案,通過大數(shù)據(jù)幫助商家提高客戶的轉(zhuǎn)化率?!?/p>

目前國內(nèi)大型商用機(jī)器人研發(fā)投入大,但是相對(duì)售價(jià)高、利潤高,很多機(jī)器人企業(yè)在大型商用機(jī)器人身上舍得投入,因此,對(duì)科大訊飛而言,也有更強(qiáng)的動(dòng)力去做技術(shù)的迭代。

如果從競(jìng)爭(zhēng)的角度去分析,目前百度和科大訊飛提供的語音語義方案是旗鼓相當(dāng)。

但是接下來的競(jìng)爭(zhēng)將會(huì)更加深入,涉及到多模態(tài)技術(shù)交互。

科大訊飛在AIUI的構(gòu)架下,加入手勢(shì)識(shí)別、圖像識(shí)別,使得人機(jī)交互技術(shù)更加復(fù)雜;百度也是一樣,在提供語音交互的基礎(chǔ)上加入圖像識(shí)別,提供一站式服務(wù)。

因此,百度與科大訊飛的競(jìng)爭(zhēng)正在從語音交互延伸到視覺交互等多模態(tài)技術(shù)上,對(duì)機(jī)器人企業(yè)而言,全新的時(shí)代即將來臨,在主流人工智能企業(yè)激烈的競(jìng)爭(zhēng)下,能夠享受到的技術(shù)紅利是,可以以低成本的方案去創(chuàng)造一臺(tái)全新的機(jī)器人。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    31170

    瀏覽量

    222856
  • 科大訊飛
    +關(guān)注

    關(guān)注

    19

    文章

    862

    瀏覽量

    63824
  • 自然語言
    +關(guān)注

    關(guān)注

    1

    文章

    292

    瀏覽量

    14016

原文標(biāo)題:百度與科大訊飛競(jìng)爭(zhēng)將從語音擴(kuò)散到視覺

文章出處:【微信號(hào):robot-1hjqr,微信公眾號(hào):1號(hào)機(jī)器人網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    以智能交互拓展邊界,樂鑫芯片模組的場(chǎng)景化應(yīng)用實(shí)踐

    樂鑫科技ESP系列芯片模組通過邊緣AI與模態(tài)交互技術(shù),為智能設(shè)備提供創(chuàng)新解決方案。支持"邊緣預(yù)處理+云端智能"的AI語音
    的頭像 發(fā)表于 01-08 15:52 ?1831次閱讀
    以智能<b class='flag-5'>交互</b>拓展邊界,樂鑫芯片模組的場(chǎng)景化應(yīng)用實(shí)踐

    端到端語音交互革命:百度智能云聯(lián)合地瓜機(jī)器人,重塑AI陪伴體驗(yàn)

    總監(jiān)孫穎欣在地瓜機(jī)器人的DDC2025 人機(jī)交互分論壇指出,大模型時(shí)代的交互方式經(jīng)歷了三個(gè)關(guān)鍵階段的演進(jìn):第一階段是文本、語音交互第二階段
    發(fā)表于 12-01 01:07 ?1784次閱讀
    端到端<b class='flag-5'>語音</b><b class='flag-5'>交互</b>革命:<b class='flag-5'>百度</b>智能云聯(lián)合地瓜機(jī)器人,重塑AI陪伴體驗(yàn)

    2025科大全球1024開發(fā)者節(jié)精彩回顧

    當(dāng)全球產(chǎn)業(yè)格局和競(jìng)爭(zhēng)形態(tài)重塑之時(shí),AI將如何發(fā)展?11月6日,在第八屆世界聲博會(huì)暨2025科大全球1024開發(fā)者節(jié)發(fā)布會(huì)上,科大
    的頭像 發(fā)表于 11-10 11:51 ?943次閱讀
    2025<b class='flag-5'>科大</b><b class='flag-5'>訊</b><b class='flag-5'>飛</b>全球1024開發(fā)者節(jié)精彩回顧

    科大發(fā)布星火X1.5及系列AI產(chǎn)品

    11月6日,第八屆世界聲博會(huì)暨2025科大全球1024開發(fā)者節(jié)發(fā)布會(huì)上,科大以《更懂你的
    的頭像 發(fā)表于 11-10 11:49 ?989次閱讀

    大模型驅(qū)動(dòng)下的人機(jī)交互革命,“超擬真人互動(dòng)”?讓玩具讀懂你的情緒

    電子發(fā)燒友網(wǎng)報(bào)道(文/黃山明)日前,在大灣區(qū)AI玩具生態(tài)大會(huì)上,百度智能云正式發(fā)布基于“超擬真人互動(dòng)”理念的智能硬件模態(tài)交互解決方案。該方案通過大模型與
    的頭像 發(fā)表于 10-31 09:21 ?6488次閱讀
    大模型驅(qū)動(dòng)下的人機(jī)<b class='flag-5'>交互</b>革命,“超擬真人互動(dòng)”?讓玩具讀懂你的情緒

    “芯”聲代,智未來—VS680本地語音交互系統(tǒng) #語音交互 #芯片

    語音交互
    深蕾半導(dǎo)體
    發(fā)布于 :2025年09月17日 10:59:30

    米爾RK3576部署端側(cè)模態(tài)輪對(duì)話,6TOPS算力驅(qū)動(dòng)30億參數(shù)LLM

    “看圖說話+語音問答”的融合交互。 五、結(jié)論與未來發(fā)展方向如果說 “大模型云” 是 AI 的 “星辰大?!?,那么 “模態(tài)落地端側(cè)” 就
    發(fā)表于 09-05 17:25

    超擬人交互API上線

    讓AI感知用戶情緒,從冰冷服務(wù)進(jìn)化成為心意相通的助手,這并非存在于《Her》或《鋼鐵俠》科幻電影。大模型加持的語音交互全新升級(jí),能夠輕松應(yīng)對(duì)輪對(duì)話,而且實(shí)現(xiàn)情緒響應(yīng)和個(gè)性定制。
    的頭像 發(fā)表于 07-10 15:21 ?1556次閱讀

    汽車模態(tài)交互測(cè)試:智能交互的深度驗(yàn)證

    在汽車智能座艙測(cè)試的關(guān)鍵進(jìn)程中,北京沃華慧通測(cè)控技術(shù)有限公司展現(xiàn)出了獨(dú)特的價(jià)值與優(yōu)勢(shì)。作為一家專注于測(cè)控技術(shù)領(lǐng)域的企業(yè),沃華慧通在智能座艙測(cè)試方面積累了豐富的經(jīng)驗(yàn)和專業(yè)的技術(shù)能力。其研發(fā)的測(cè)試設(shè)備能夠精準(zhǔn)模擬各種復(fù)雜的車載環(huán)境,
    的頭像 發(fā)表于 06-25 09:00 ?1465次閱讀
    汽車<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b><b class='flag-5'>交互</b>測(cè)試:智能<b class='flag-5'>交互</b>的深度驗(yàn)證

    打破交互困局:科大這樣出手

    十年深耕,科大智能交互如何引領(lǐng)未來
    的頭像 發(fā)表于 06-17 11:50 ?1205次閱讀
    打破<b class='flag-5'>交互</b>困局:<b class='flag-5'>科大</b><b class='flag-5'>訊</b><b class='flag-5'>飛</b>這樣出手

    回顧科大26周年慶精彩瞬間

    近日,科大26周年司慶,董事長(zhǎng)劉慶峰對(duì)這個(gè)作文題感觸很深:“從1999年創(chuàng)業(yè)時(shí)在“中國被人扼住了咽喉”背景下以語音合成系統(tǒng)破局,到這些
    的頭像 發(fā)表于 06-13 14:08 ?1032次閱讀

    2025科大智能交互產(chǎn)品升級(jí)發(fā)布會(huì)定檔

    從命令行到圖形界面,從觸屏操作到語音助手,技術(shù)浪潮重新定義人機(jī)交互的邊界。當(dāng)大模型的智慧涌現(xiàn),機(jī)器從“能聽會(huì)說”真正走向“能理解會(huì)思考”,那么未來交互的新范式將是什么?
    的頭像 發(fā)表于 06-11 17:12 ?1298次閱讀

    芯資訊|廣州唯創(chuàng)電子WTK6900P語音識(shí)別芯片:離線語音交互的革新者

    在智能設(shè)備全面普及的浪潮中,語音交互技術(shù)正逐步從“云端依賴”向“本地化高效處理”演進(jìn)。廣州唯創(chuàng)電子推出的WTK6900P語音識(shí)別芯片,憑借其本地化離線
    的頭像 發(fā)表于 05-22 09:22 ?859次閱讀
    芯資訊|廣州唯創(chuàng)電子WTK6900P<b class='flag-5'>語音</b>識(shí)別芯片:離線<b class='flag-5'>語音</b><b class='flag-5'>交互</b>的革新者

    智能收銀語音交互新標(biāo)桿—WT3000T8語音合成芯片TTS技術(shù)應(yīng)用解析

    性的TTS技術(shù)集成,解決了傳統(tǒng)收銀系統(tǒng)語音播報(bào)存在的多語言支持不足、資源占用過高、語音定制不靈活行業(yè)痛點(diǎn)。二、芯片核心特性
    的頭像 發(fā)表于 04-24 08:45 ?1105次閱讀
    智能收銀<b class='flag-5'>語音</b><b class='flag-5'>交互</b>新標(biāo)桿—WT3000T8<b class='flag-5'>語音</b>合成芯片TTS<b class='flag-5'>技術(shù)</b>應(yīng)用解析

    科大亮相第137屆廣交會(huì)

    今天,第137屆中國進(jìn)出口商品交易會(huì)(廣交會(huì))在廣州開幕。科大又一年參展,集中展示了星火大模型的最新
    的頭像 發(fā)表于 04-17 09:30 ?1190次閱讀