chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

百度與科大訊飛的競爭正在從語音交互延伸到視覺交互等多模態(tài)技術(shù)上

電子工程師 ? 來源:未知 ? 作者:李倩 ? 2018-03-22 09:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近兩年來,隨著人們越來越頻繁使用智能產(chǎn)品,所產(chǎn)生的數(shù)據(jù)越來越龐大,這些數(shù)據(jù)又被大公司所利用,龐大的數(shù)據(jù)也將催生“機(jī)器人大腦”。

目前市面上已經(jīng)誕生出越來越多的機(jī)器人產(chǎn)品,如:早教機(jī)器人、陪護(hù)機(jī)器人、商場機(jī)器人、銀行機(jī)器人、法務(wù)機(jī)器人等等,但是在實(shí)際的場景應(yīng)用中,機(jī)器人并不能帶來真正的智能。

最主要的功能就是體現(xiàn)在機(jī)器人大腦,用專業(yè)術(shù)語講就是“語義”,我們在語義的采集上還處在非常初級的階段,如果處理不了語義理解,那機(jī)器人在實(shí)際場景中的應(yīng)用就是一個“呆子”。

讓機(jī)器人開口說話,除了語義之外,語音也是關(guān)鍵的技術(shù),國內(nèi)科大訊飛在語音技術(shù)上的造詣,讓國內(nèi)很多做機(jī)器人的企業(yè)受惠,其語音處理技術(shù)基本上已經(jīng)能滿足人們?nèi)粘I钪械氖褂眯枨蟆?/p>

但是國內(nèi)機(jī)器人產(chǎn)業(yè)接下來的發(fā)展將會開始加速,在這次1號機(jī)器人網(wǎng)研討會上,不管是百度,還是科大訊飛所傳遞的信息就是已做好全面出擊的準(zhǔn)備。

雖然國內(nèi)語音語義的發(fā)展正在加速,但是對機(jī)器人企業(yè)而言,速度還不夠快,目前不管是百度,還是科大訊飛所提供的語音語義還是不能滿足機(jī)器人在實(shí)際應(yīng)用中的要求。

城市漫步總經(jīng)理李正說:“在人們與機(jī)器人對話的過程中,一些簡單的問題,機(jī)器人是可以回答,但是稍微復(fù)雜一些的問題,機(jī)器人就回答不了,BAT或科大訊飛所提供的語義,讓機(jī)器人處在小孩3歲左右的智力水平。對很多機(jī)器人企業(yè)而言,目前的瓶頸也是在這里,很難有所突破?!?/p>

科大訊飛銷售總監(jiān)廖凱說:“其實(shí)訊飛也很苦惱,語音助理已經(jīng)通過國家各種考試,很難說它的智力不行,訊飛高考機(jī)器人基于目前的成長速度,到2020年會考上一本,去年的數(shù)據(jù)顯示,語文考了90多分,數(shù)學(xué)考了110多分?!?/p>

只能說人們?nèi)粘=涣髦?,所體現(xiàn)的語言很復(fù)雜,目前的大數(shù)據(jù)還不能夠支撐人們復(fù)雜的日常交流。

百度自然語言技術(shù)開放負(fù)責(zé)人張晶晶說:“人工智能聰明程度其實(shí)很大程度上取決于數(shù)據(jù),百度為什么在人工智能領(lǐng)域國內(nèi)領(lǐng)先,因?yàn)楸澈笫驱嫶蟮臄?shù)據(jù),比如百度搜索,每天有60億次搜索,這些數(shù)據(jù)支撐百度深度語義理解,像這種過億用戶的APP,百度有14個,這些數(shù)據(jù)支撐了百度大腦每時每刻都在進(jìn)化?!?/p>

“國內(nèi)各大平臺,如:百度UNIT、訊飛AIUI、小i機(jī)器人、思必馳等,其實(shí)各家的側(cè)重點(diǎn)不同,因此,最終的測試結(jié)果也會不同,像百度的對話效果只有達(dá)到95%以上才會放出來。”

但是在這次1號機(jī)器人網(wǎng)研討會上,機(jī)器人企業(yè)對各大平臺所提供的語義依然不是特別滿意。

或許國內(nèi)各大機(jī)器人企業(yè)過于依賴BAT等企業(yè),希望依靠BAT大企業(yè)的投入完善語音語義技術(shù),但是百度已經(jīng)在語音語義上投入了3億元,雖然技術(shù)積累很快,但是目前的瓶頸是依然還不能支撐機(jī)器人日常復(fù)雜的對話交流。

狗尾草聯(lián)合創(chuàng)始人張博說:“3至5歲小孩,同一個問題,在每個年齡段尋求的答案都不同,所以對語義的要求非常高,如果真要做好語義理解,就需要把語義理解做的足夠細(xì),再接入知識圖譜,如果是批量的知識圖譜,那就需要各大平臺開放知識庫,讓機(jī)器人企業(yè)去調(diào)用,滿足更高級開發(fā)的產(chǎn)品需求。”

從這次1號機(jī)器人網(wǎng)研討會上反饋,現(xiàn)階段讓各大平臺完全開放知識庫不現(xiàn)實(shí),像百度、科大訊飛、小i機(jī)器人等投入巨資打造知識庫,機(jī)器人企業(yè)想調(diào)用深層次語義,就需要支付相應(yīng)的報酬。

當(dāng)然很多機(jī)器人企業(yè)對語音還是另有看法,比如AI與UI,明明很多場景直接通過UI就可以解決的事情,干嘛非要用語音,把簡單的事情復(fù)雜化。

這個問題的著重點(diǎn)在于,目前看來語音確實(shí)還不是最好用的產(chǎn)品,但是長遠(yuǎn)看語音將會是最便捷的交互方式。

當(dāng)汽車和火車剛發(fā)明的時候,跑起來還沒有馬車快,但是終究汽車和火車是發(fā)展方向。

科大訊飛廖凱說:“人與機(jī)器發(fā)生交互的時候,輸入輸出信息有兩種,我們從機(jī)器身上獲取的信息,最簡單的方式就是視覺,一目了然;但我們輸出的信息最自然的方式是語音。這是語音的特性,未來一定會顛覆傳統(tǒng)以鍵盤或觸屏的輸出方式?!?/p>

接下來,我們回到產(chǎn)品上來,對機(jī)器人企業(yè)而言,現(xiàn)階段就算依靠BAT等企業(yè)的語音語義技術(shù),也不能讓產(chǎn)品具備高智慧,充其量只能達(dá)到小孩3歲左右的智力水平。

所以未來的方向在于細(xì)分場景,比如:訂機(jī)票、訂酒店等,采用百度和科大訊飛的語音語義可以非常成熟的完成,讓用戶從查詢機(jī)票到預(yù)訂票到購買機(jī)票等全過程,期間進(jìn)行的多輪復(fù)雜人機(jī)對話可達(dá)7層以上。

因此,在一些細(xì)分商用場景,語音已經(jīng)可以做到替代客服的工作,對機(jī)器人企業(yè)而言,如何讓機(jī)器人+語音語義+使用場景落地才是接下來重點(diǎn)思考的方向。

百度張晶晶認(rèn)為,通過百度大數(shù)據(jù)分析,兒童故事機(jī)的市場規(guī)模很大,目前正是更新?lián)Q代的時間節(jié)點(diǎn),因此,百度對兒童領(lǐng)域的投入會有所加大。

科大訊飛廖凱說:“今年大型商用機(jī)器人會有所發(fā)展,目前訊飛曉曼機(jī)器人已經(jīng)入駐紅星美凱龍、居然之家,以及一些零售商場。曉曼機(jī)器人目前已經(jīng)可以做到導(dǎo)航領(lǐng)路、提供資訊、針對商場還提供了一套機(jī)器人營銷方案,通過大數(shù)據(jù)幫助商家提高客戶的轉(zhuǎn)化率?!?/p>

目前國內(nèi)大型商用機(jī)器人研發(fā)投入大,但是相對售價高、利潤高,很多機(jī)器人企業(yè)在大型商用機(jī)器人身上舍得投入,因此,對科大訊飛而言,也有更強(qiáng)的動力去做技術(shù)的迭代。

如果從競爭的角度去分析,目前百度和科大訊飛提供的語音語義方案是旗鼓相當(dāng)。

但是接下來的競爭將會更加深入,涉及到多模態(tài)技術(shù)交互。

科大訊飛在AIUI的構(gòu)架下,加入手勢識別、圖像識別,使得人機(jī)交互技術(shù)更加復(fù)雜;百度也是一樣,在提供語音交互的基礎(chǔ)上加入圖像識別,提供一站式服務(wù)。

因此,百度與科大訊飛的競爭正在從語音交互延伸到視覺交互等多模態(tài)技術(shù)上,對機(jī)器人企業(yè)而言,全新的時代即將來臨,在主流人工智能企業(yè)激烈的競爭下,能夠享受到的技術(shù)紅利是,可以以低成本的方案去創(chuàng)造一臺全新的機(jī)器人。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    30552

    瀏覽量

    219307
  • 科大訊飛
    +關(guān)注

    關(guān)注

    19

    文章

    852

    瀏覽量

    63181
  • 自然語言
    +關(guān)注

    關(guān)注

    1

    文章

    292

    瀏覽量

    13913

原文標(biāo)題:百度與科大訊飛競爭將從語音擴(kuò)散到視覺

文章出處:【微信號:robot-1hjqr,微信公眾號:1號機(jī)器人網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    端到端語音交互革命:百度智能云聯(lián)合地瓜機(jī)器人,重塑AI陪伴體驗(yàn)

    總監(jiān)孫穎欣在地瓜機(jī)器人的DDC2025 人機(jī)交互分論壇指出,大模型時代的交互方式經(jīng)歷了三個關(guān)鍵階段的演進(jìn):第一階段是文本、語音交互第二階段
    發(fā)表于 12-01 01:07 ?1068次閱讀
    端到端<b class='flag-5'>語音</b><b class='flag-5'>交互</b>革命:<b class='flag-5'>百度</b>智能云聯(lián)合地瓜機(jī)器人,重塑AI陪伴體驗(yàn)

    科大發(fā)布星火X1.5及系列AI產(chǎn)品

    11月6日,第八屆世界聲博會暨2025科大全球1024開發(fā)者節(jié)發(fā)布會上,科大以《更懂你的
    的頭像 發(fā)表于 11-10 11:49 ?577次閱讀

    大模型驅(qū)動下的人機(jī)交互革命,“超擬真人互動”?讓玩具讀懂你的情緒

    電子發(fā)燒友網(wǎng)報道(文/黃山明)日前,在大灣區(qū)AI玩具生態(tài)大會上,百度智能云正式發(fā)布基于“超擬真人互動”理念的智能硬件模態(tài)交互解決方案。該方案通過大模型與
    的頭像 發(fā)表于 10-31 09:21 ?6077次閱讀
    大模型驅(qū)動下的人機(jī)<b class='flag-5'>交互</b>革命,“超擬真人互動”?讓玩具讀懂你的情緒

    “芯”聲代,智未來—VS680本地語音交互系統(tǒng) #語音交互 #芯片

    語音交互
    深蕾半導(dǎo)體
    發(fā)布于 :2025年09月17日 10:59:30

    米爾RK3576部署端側(cè)模態(tài)輪對話,6TOPS算力驅(qū)動30億參數(shù)LLM

    “看圖說話+語音問答”的融合交互。 五、結(jié)論與未來發(fā)展方向如果說 “大模型云” 是 AI 的 “星辰大?!?,那么 “模態(tài)落地端側(cè)” 就
    發(fā)表于 09-05 17:25

    超擬人交互API上線

    讓AI感知用戶情緒,從冰冷服務(wù)進(jìn)化成為心意相通的助手,這并非存在于《Her》或《鋼鐵俠》科幻電影。大模型加持的語音交互全新升級,能夠輕松應(yīng)對輪對話,而且實(shí)現(xiàn)情緒響應(yīng)和個性定制。
    的頭像 發(fā)表于 07-10 15:21 ?1256次閱讀

    汽車模態(tài)交互測試:智能交互的深度驗(yàn)證

    在汽車智能座艙測試的關(guān)鍵進(jìn)程中,北京沃華慧通測控技術(shù)有限公司展現(xiàn)出了獨(dú)特的價值與優(yōu)勢。作為一家專注于測控技術(shù)領(lǐng)域的企業(yè),沃華慧通在智能座艙測試方面積累了豐富的經(jīng)驗(yàn)和專業(yè)的技術(shù)能力。其研發(fā)的測試設(shè)備能夠精準(zhǔn)模擬各種復(fù)雜的車載環(huán)境,
    的頭像 發(fā)表于 06-25 09:00 ?1191次閱讀
    汽車<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b><b class='flag-5'>交互</b>測試:智能<b class='flag-5'>交互</b>的深度驗(yàn)證

    打破交互困局:科大這樣出手

    十年深耕,科大智能交互如何引領(lǐng)未來
    的頭像 發(fā)表于 06-17 11:50 ?855次閱讀
    打破<b class='flag-5'>交互</b>困局:<b class='flag-5'>科大</b><b class='flag-5'>訊</b><b class='flag-5'>飛</b>這樣出手

    移遠(yuǎn)通信智能模組全面接入模態(tài)AI大模型,重塑智能交互新體驗(yàn)

    隨著千行業(yè)數(shù)智化進(jìn)程的不斷加速,模態(tài)AI大模型的應(yīng)用需求不斷攀升,圖像、語音、視頻多樣化的交互
    發(fā)表于 03-21 14:12 ?412次閱讀
    移遠(yuǎn)通信智能模組全面接入<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>AI大模型,重塑智能<b class='flag-5'>交互</b>新體驗(yàn)

    移遠(yuǎn)通信智能模組全面接入模態(tài)AI大模型,重塑智能交互新體驗(yàn)

    隨著千行業(yè)數(shù)智化進(jìn)程的不斷加速,模態(tài)AI大模型的應(yīng)用需求不斷攀升,圖像、語音、視頻多樣化的交互
    的頭像 發(fā)表于 03-20 19:03 ?661次閱讀
    移遠(yuǎn)通信智能模組全面接入<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>AI大模型,重塑智能<b class='flag-5'>交互</b>新體驗(yàn)

    ?模態(tài)交互技術(shù)解析

    模態(tài)交互 模態(tài)交互( Multimodal Interaction )是指通過多種感官通道(
    的頭像 發(fā)表于 03-17 15:12 ?3460次閱讀

    科大Air 2電紙書和掌閱Ocean4 Plus區(qū)別

    首先說說科大Air 2,這款設(shè)備的核心亮點(diǎn)在于它的AI功能和辦公屬性。8.2英寸的墨水屏,分辨率高達(dá)1920*1440,顯示效果非常細(xì)膩,閱讀時眼睛不會感到疲勞。它的屏占比達(dá)到了88.5%,
    發(fā)表于 03-03 14:01

    科大推出大模型極速超擬人交互軟硬件方案

    隨著大模型技術(shù)的不斷發(fā)展,大模型的應(yīng)用越來越受到行業(yè)的重視。如何在智能硬件的語音交互快速應(yīng)用和普及大模型,一直是業(yè)內(nèi)熱議和探索的話題。
    的頭像 發(fā)表于 01-16 11:07 ?1193次閱讀

    科大即將發(fā)布星火深度推理模型X1

    ,標(biāo)志著科大飛在AI技術(shù)領(lǐng)域的又一次重大突破。星火深度推理模型X1將為科大
    的頭像 發(fā)表于 01-08 10:30 ?1016次閱讀

    科大AI虛擬人交互平臺榮獲行業(yè)最高評級

    近日,科大的AI虛擬人交互平臺順利完成中國信通院人工智能研究所組織的大模型數(shù)字人基礎(chǔ)能力分級測試,并獲得最高等級L5認(rèn)證,系國內(nèi)首批。
    的頭像 發(fā)表于 12-13 11:39 ?1442次閱讀