語音交互無論是人與人溝通,還是AI人工智能時代人與機器人互動以及機器人與機器人之間的交互等都是最為基礎(chǔ)重要的一種方式。
對于今天AI人工智能時代基本的平臺載體--機器人來說,人機語音交互必須首先具有的主要功能之一。
盡管國內(nèi)的科大訊飛,百度以及目前最為火爆的國外Chat GPT已經(jīng)在人機語音交互技術(shù)上不斷地進行突破,特別是Chat GPT給人的體驗感。相信人機語音交互近年來市場化的應用會帶來較大的變革與突破。但這多年實際市場上幾乎人機語音交互仍然還停留在最為初級還不足以支撐一個基本完整場景下的人與人交互的效果。
我們通過2016年至今2000臺左右機器人不同產(chǎn)業(yè)領(lǐng)域場景實際市場上的反饋以及人機語音交互市場化要求的不斷探索已基本上找到并驗證過的方法與路徑。
首先我們回歸分析日常人與人語言交流的場景狀況。其主要特點如下:
1交談的主要內(nèi)容話題:無論是初次見面還是相識后的交流,基本上都是群體(行業(yè)/公司/朋友/親戚等)內(nèi)的相關(guān)的內(nèi)容。
2內(nèi)容的屬性:大部分溝通的內(nèi)容中是不便對外界完全可公開的。也就是說具有一定范圍群體的私密性。
3內(nèi)容的范圍延展性: 交談的內(nèi)容有些是已發(fā)生的;有些是計劃要做的;有些是即興而說的。
4內(nèi)容的頻次與關(guān)聯(lián)性:前后交流的內(nèi)容話題基本上關(guān)聯(lián)度比較高;前后之間交流內(nèi)容的跨度不大,內(nèi)容頻次較高。
5公共話題內(nèi)容:交流中也會涉及到與話題引發(fā)的公眾內(nèi)容,也就是可以對任何人不存在隱私的內(nèi)容。
6交互的時長與內(nèi)容跨度:一般交流的時間與交談內(nèi)容的跨度不會很大。
然后我們再來分析一下人機語音交互內(nèi)容的主要方法:
目前主流方法就是通過對相關(guān)大數(shù)據(jù)的訓練并賦予模型深度學習的辦法。當然效果要好就需要有大量的相關(guān)數(shù)據(jù)資源以及技術(shù)團隊包括資金的支撐。
最后的結(jié)論與正確的做法路徑
1 我們從上述方法與人與人溝通的主要特點對比不難看出:目前主流做法訓練出的人機語音交互還是不能支撐替代人與人實際交流溝通場景的主要內(nèi)容。
2 正確的做法就是:基于訊飛/百度/Chat GPT基礎(chǔ)上+自有系統(tǒng)上的數(shù)據(jù)庫(這個才是支撐交互溝通內(nèi)容的主要部分)而且這個數(shù)據(jù)庫的內(nèi)容也必須由用戶/相關(guān)人自己隨時根據(jù)實際需要來完善增添。
3我們近2年來通過上述辦法開發(fā)的人機語音交互軟件,通過實際用戶的使用體驗以及與別家的對比;效果非常明顯;用戶體驗感強;愿意使用,評價較高。當然我們會繼續(xù)按此思路不斷完善升級軟件。
-
機器人
+關(guān)注
關(guān)注
213文章
30249瀏覽量
217794 -
人機語音
+關(guān)注
關(guān)注
0文章
3瀏覽量
7228
發(fā)布評論請先 登錄
語音機器人交互系統(tǒng):核心技術(shù)與應用挑戰(zhàn)
再掀語音交互革命,廣和通AI解決方案加速機器人聽覺進化
工業(yè)機器人的特點
明遠智睿SSD2351開發(fā)板:語音機器人領(lǐng)域的變革力量
盤點#機器人開發(fā)平臺
詳細介紹機場智能指路機器人的工作原理
大象機器人攜手進迭時空推出 RISC-V 全棧開源六軸機械臂產(chǎn)品
基于WTVxxx語音芯片的智能清潔機器人語音交互系統(tǒng)設(shè)計方案介紹

廣州唯創(chuàng)電子WTK6900HC語音識別芯片:掃地機器人智能化的理想選擇

廣州唯創(chuàng)WTK6900HC語音識別芯片:掃地機器人智能化的理想選擇
開源項目!能夠精確地行走、跳舞和執(zhí)行復雜動作的機器人—Tillu
【「具身智能機器人系統(tǒng)」閱讀體驗】2.具身智能機器人大模型
【「具身智能機器人系統(tǒng)」閱讀體驗】+數(shù)據(jù)在具身人工智能中的價值
從市場角度對機器人的基本解讀

評論