chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

其實自然語言交互就是個坑,為什么會出現(xiàn)這種情況?

JsPm_robot_1hjq ? 來源:未知 ? 作者:李倩 ? 2018-11-06 11:50 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

前兩天在崔牛會(一個做2B客戶的企業(yè)家社群)的群里聊天,一朋友說如果我早點(diǎn)跟他講NLP的難度,他就不入這個行了。

我們說的NLP其實主要是人機(jī)自然語言交互。NLP也包含好幾個細(xì)分領(lǐng)域:搜索、機(jī)器翻譯、問答等。我人機(jī)自然語言交互也就是問答。

很多年前,別人說我做的東西不過就是關(guān)鍵字模糊查詢,他找?guī)讉€會編程的高中生都能做。這基本上就是無知無畏了。所以我當(dāng)時也沒去爭辯。

這個行業(yè)就是我朋友說的,外行看簡單,進(jìn)來發(fā)現(xiàn)很難那種。其實自然語言交互就是個坑。

為什么會出現(xiàn)這種情況?

因為第一,這個行業(yè)沒有標(biāo)準(zhǔn)。有人說誰家機(jī)器人很聰明,誰家機(jī)器人很厲害,都是憑感覺的。有個同行在行業(yè)群里問有沒有什么標(biāo)準(zhǔn)測試機(jī)器人水平,喊了很長時間也沒有找到。有人認(rèn)為圖靈測試是一個標(biāo)準(zhǔn),但至今沒有多少機(jī)器人能通過圖靈測試。即便有公司聲稱他們的機(jī)器人通過了圖靈測試,也很難得到公眾認(rèn)可。我認(rèn)為原因在于,機(jī)器人根本不可能完全偽裝成人。另外,圖靈測試隨意行太強(qiáng),很難給出客觀并科學(xué)的評測結(jié)果。

為什么這個行業(yè)沒有標(biāo)準(zhǔn)呢?因為問答是個新領(lǐng)域,而很多時候人們把它當(dāng)成搜索。搜索給的結(jié)果是模糊的,問答需要給精準(zhǔn)結(jié)果。搜索用關(guān)鍵字模糊查詢就行,問答要關(guān)注語義的細(xì)微差別。這個我在別的文章里有論述。搜索的標(biāo)準(zhǔn)是召回率和準(zhǔn)確率,但這個標(biāo)準(zhǔn)用在問答上就沒用了。你的召回率和準(zhǔn)確率做再高,用戶體驗依然很差。因為搜索其實處理的是關(guān)鍵字,而問答要求處理好句子里每一個詞。

沒有標(biāo)準(zhǔn)就意味著你做好做不好都一樣。所以才有人說高中生都能做聊天機(jī)器人。

也意味著沒有方向。于是有的人跟著感覺走,有的人用搜索的標(biāo)準(zhǔn)測試問答。

同時意味著開發(fā)人員總是自我感覺良好。其實我們的產(chǎn)品在用戶眼里都跟狗屎一樣。

雖然行業(yè)內(nèi)沒有標(biāo)準(zhǔn),我們有自己的問答技術(shù)標(biāo)準(zhǔn),即:差異原則,同一原則,模糊原則和一致原則。差異原則就是機(jī)器理解兩句話之間的差異。同一原則就是機(jī)器理解兩句話語義是相同的。模糊原則就是機(jī)器能容忍自然語言輸入中的小錯誤。一致原則就是機(jī)器前后說的話是一致的,不相互矛盾。

如果用我們的標(biāo)準(zhǔn)去測試,很多問答機(jī)器人是不能過關(guān)的。期待我們的標(biāo)準(zhǔn)能成為行業(yè)標(biāo)準(zhǔn)。我們就是按照這套標(biāo)準(zhǔn)要求自己的。

圖:小諦機(jī)器人語義理解測試標(biāo)準(zhǔn)1.1

第二,用戶預(yù)期高。因為藝術(shù)作品的宣傳,人們對人工智能的期望值很高。你只要叫個機(jī)器人,叫人工智能,別人就認(rèn)為你是萬能的,應(yīng)該什么都懂,應(yīng)該比人厲害。即便你說你是個企業(yè)客服機(jī)器人,人家也認(rèn)為你應(yīng)該比人類聰明。

但實際上,藝術(shù)作品是虛構(gòu)的,變形金剛霸天虎在現(xiàn)實世界并不存在。因為基礎(chǔ)技術(shù)沒有。

用戶要求高,我們做不到,用戶產(chǎn)生的心理落差就很大。

第三,有人總認(rèn)為用窮舉可以解決問題。實際上一個問題的多種表達(dá)是無窮盡的。人家加個“啊”“呀”“的”可能你的機(jī)器人就不會回答了。有人統(tǒng)計過關(guān)于查話費(fèi)余額的表達(dá)方式據(jù)說有接近一萬種。普通程序員根本無法去窮舉用戶的各種語言表達(dá)。實際上解決這個問題只能用算法。我們相對做得好點(diǎn),用我們算法,一個句子可以覆蓋用戶許許多多問法。

第四,這個行業(yè)工作量很大,即便是小領(lǐng)域工作量也很大。有人說通用問答機(jī)器人我做不好,我做個法律、醫(yī)療、稅務(wù)的難道還做不好嗎?其實把一個企業(yè)的客服機(jī)器人做好都很難。如果用窮舉的話,即使建設(shè)一個企業(yè)客服相關(guān)問題的知識庫也有很大工作量。我們算法雖然有優(yōu)勢,能大幅降低知識庫建設(shè)工作量,但依然后面有很大的工作量。

第五,缺理論依據(jù)。什么是語義?從網(wǎng)上找的概念對我們工作沒有什么指導(dǎo)意義。語義和語言之間具體的關(guān)系是怎樣的?有些人還沒意識到我們應(yīng)該通過語言處理語義,還在生搬硬套的處理語言文字。用戶說“是”也許表達(dá)的是否定的意思,用戶說“南京”也許是想吃東西。自然語言問答最終處理的是語義,也就是用戶意圖。有人說,用戶意圖不就是和產(chǎn)品功能對應(yīng)的么?這句話有一定道理。但并不總是這樣。智能家居產(chǎn)品可能是這樣。開燈關(guān)燈,對著一盞燈用戶意圖也就這兩個了。但如果是對電視機(jī),用戶意圖就會復(fù)雜點(diǎn)。比如,用戶可能想看劉德華的電影,或者聽劉德華的演唱會,或者看劉德華的寫真。用戶說的“劉德華”怎么理解用戶的意圖呢?如果是對著機(jī)器人,用戶也許會表達(dá)愛慕或者厭惡或者其他情緒,怎么理解用戶意圖呢?產(chǎn)品功能越復(fù)雜,對應(yīng)的用戶意圖越復(fù)雜。所以從產(chǎn)品功能反推用戶意圖是不現(xiàn)實的。

怎么讓機(jī)器透過用戶自然語言表達(dá)去理解用戶意圖呢?很多人根本不研究語言,不研究語法規(guī)則,這怎么可能處理好語言呢?大多數(shù)同行用數(shù)學(xué)的方法處理語言,比如他們從一句話中提取關(guān)鍵字的依據(jù)是詞頻。詞頻是絕對的,是統(tǒng)計出來的,而一個詞在一句話里的語義權(quán)重是變化的。其實語義本身就是變化的。我的另一篇文章講述了我對語義的看法。

我認(rèn)為不研究語言,不了解語法規(guī)則根本處理不好語言。漢語有很多特殊的語法結(jié)構(gòu)。比如倒裝句、“把”字句、“被”字句等等。單純用統(tǒng)計學(xué)技術(shù)不可能處理好語義,可能連句子的主語和賓語都分不清。比如:“酒喝光了,我”這句不是酒把我喝光了,而是我把酒喝光了?!熬坪裙饬嗽趺赐妗边@句的“怎么玩”其實是一個詞。

我們在課本上學(xué)的語法規(guī)則,在我們做自然語言交互技術(shù)時可能根本不管用。人能理解的東西,機(jī)器理解不了。怎么讓機(jī)器理解語法規(guī)則呢?需要有系統(tǒng)深入地研究,需要有科學(xué)嚴(yán)謹(jǐn)?shù)睦碚摗?/p>

我研究這個很長時間了,我們對漢語的語法規(guī)則做了細(xì)化,讓機(jī)器更加方便處理。

第六,誤解。前幾年投資過熱,人工智能想象空間巨大,是投資的理想標(biāo)的。但實際上投資人根本不懂行,他們也只能看看團(tuán)隊背景、看看公司收入、看看產(chǎn)品。這樣一堆被資本捧紅的明星企業(yè)誕生了。他們大多數(shù)有大公司出來的創(chuàng)始人并且養(yǎng)著一堆博士或者博士后。他們經(jīng)常嘴里一堆學(xué)術(shù)名詞,一堆洋文。但看不到他們產(chǎn)品。于是很多人基本就認(rèn)為這是正確的方向了。

但實際上誰家也沒有能讓用戶持續(xù)使用的自然語言交互產(chǎn)品。這個行業(yè)沒有領(lǐng)頭人。

我去推廣我們分詞技術(shù),經(jīng)常被問,有很多開源的分詞工具可以用,為什么要自己去研究呢?他們認(rèn)為大家都用的東西就是正確的。碰到這種情況我一般也不去爭論。

我們做企業(yè)不是給投資人看的,做產(chǎn)品也不是給投資人用的。用戶認(rèn)可才是我們追求的。獨(dú)立思考,才能讓我們找到解決問題的辦法。盡管失敗了一次又一次,我依然在前進(jìn)。我看到我們的產(chǎn)品越來越好,我相信遲早會得到更多用戶認(rèn)可。

第七,用戶習(xí)慣。小米的語音電視遙控器功能其實很強(qiáng)大。但小米的數(shù)據(jù)顯示,遙控器的語音交互功能使用量很低?,F(xiàn)在其實每款手機(jī)都有語音助手,但幾乎沒人用。大家普遍認(rèn)為,現(xiàn)在用戶還很難改變使用鍵盤和觸摸屏的習(xí)慣。其實改變用戶使用習(xí)慣從來都是一件十分困難的事情。

第八,順暢交流。如果不能流暢交流,用戶的體驗就會很差。缺內(nèi)容、不理解用戶意圖都會造成交流不能流暢進(jìn)行下去。缺內(nèi)容是最難解決的,誰也做不出來無所不知的機(jī)器人。如果能給用戶一個知識邊界,讓用戶明確知道這個邊界,用戶只在邊界里提問,這就能讓交流的流暢性大大提高。但這個邊界怎么展示呢?不理解用戶意圖主要是算法的問題。對于有些企業(yè)來講,算法問題可能是難以突破的。這就好像一只猴子不可能擁有人類的智能一樣不可能得到改變。我們在算法上有優(yōu)勢,但我們在內(nèi)容上短板明顯。

我一直認(rèn)為自然語言交互是非常難的行業(yè),沒有積累很難做出來好的產(chǎn)品。這個行業(yè)不適合急功近利。以為能賺到快錢的人,必然會掉坑里。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機(jī)器翻譯
    +關(guān)注

    關(guān)注

    0

    文章

    141

    瀏覽量

    15464
  • 自然語言
    +關(guān)注

    關(guān)注

    1

    文章

    292

    瀏覽量

    13913
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    491

    瀏覽量

    23182

原文標(biāo)題:自然語言交互是個坑

文章出處:【微信號:robot-1hjqr,微信公眾號:1號機(jī)器人網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    云知聲論文入選自然語言處理頂會EMNLP 2025

    近日,自然語言處理(NLP)領(lǐng)域國際權(quán)威會議 ——2025 年計算語言學(xué)與自然語言處理國際會議(EMNLP 2025)公布論文錄用結(jié)果,云知聲提交的《面向門診病歷生成的高質(zhì)量醫(yī)患對話合成技術(shù)
    的頭像 發(fā)表于 11-10 17:30 ?472次閱讀
    云知聲論文入選<b class='flag-5'>自然語言</b>處理頂會EMNLP 2025

    HarmonyOSAI編程自然語言代碼生成

    安裝CodeGenie后,在下方對話框內(nèi),輸入代碼需求描述,將根據(jù)描述智能生成代碼,生成內(nèi)容可一鍵復(fù)制或一鍵插入至編輯區(qū)當(dāng)前光標(biāo)位置。 提問示例 使用ArkTs語言寫一段代碼,在頁面中間部分
    發(fā)表于 09-05 16:58

    【HZ-T536開發(fā)板免費(fèi)體驗】5- 無需死記 Linux 命令!用 CangjieMagic 在 HZ-T536 開發(fā)板上搭建 MCP 服務(wù)器,自然語言輕松控板

    引言:為什么需要 “自然語言控板”? 痛點(diǎn)引入 :嵌入式開發(fā)中,開發(fā)者常需通過 SSH 等工具登錄開發(fā)板,手動輸入復(fù)雜的 Linux 命令(如ls -l、gpio readall、ifconfig等
    發(fā)表于 08-23 13:10

    自然語言提示原型在英特爾Vision大會上首次亮相

    在英特爾Vision大會上,Network Optix首次展示了自然語言提示原型,該方案將重新定義視頻管理,為各行各業(yè)由AI驅(qū)動的洞察和效率提速。
    的頭像 發(fā)表于 04-09 09:30 ?771次閱讀

    開關(guān)電源會出現(xiàn)漏電的情況,這種情況該怎么避免漏電?

    開關(guān)電源會出現(xiàn)漏電的情況,這種情況該怎么避免漏電?
    發(fā)表于 03-31 06:17

    零知開源——ESP32語音交互系統(tǒng)(AI小智)開發(fā)教程

    小智AI聊天機(jī)器人是一基于嵌入式硬件與人工智能技術(shù)深度融合的智能交互系統(tǒng)。該項目以ESP32開發(fā)板為核心,結(jié)合語音喚醒、自然語言處理、音頻解碼播放及圖形化交互界面四大核心模塊,實現(xiàn)人
    的頭像 發(fā)表于 03-29 15:33 ?1w次閱讀
    零知開源——ESP32語音<b class='flag-5'>交互</b>系統(tǒng)(AI小智)開發(fā)教程

    ADS1291測試中經(jīng)常會出現(xiàn)R波變小的情況,為什么?

    最近使用ADS1291的過程中,剛開始非常順利,很快就能正確的采集到波形,噪聲情況良好,但是后面測試的時候發(fā)現(xiàn)了一非常奇怪的問題,測試中經(jīng)常會出現(xiàn)R波變小的情況,或者R波根本就看不
    發(fā)表于 01-09 06:39

    ADS1271使用不當(dāng)會不會出現(xiàn)采樣率的主時鐘不是這個對應(yīng)關(guān)系的情況?

    ADS1271在MODE浮空的情況下采樣率Wie主時鐘的512分之一,即fs=fclk/512,如果使用不當(dāng),會不會出現(xiàn)采樣率的主時鐘不是這個對應(yīng)關(guān)系的情況,例如當(dāng)fclk=1024kHz時,理論上fs=2K,但實際上fs=1
    發(fā)表于 12-20 08:24

    DAC7564使用外部參考,偶爾會出現(xiàn)禁用指令失敗的情況,這是為什么呢?

    這個方案有問題,就是偶爾會出現(xiàn)禁用指令失敗的情況,請問這是為什么呢?手冊上給的指令是012000h,意思是地址為A1,A0=00的時候的指令么?
    發(fā)表于 12-16 08:34

    使用ADS1256中出現(xiàn)重新上電會出現(xiàn)讀取AD值不一樣的情況,怎么解決?

    您好,我在使用ADS1256中出現(xiàn)重新上電會出現(xiàn)讀取AD值不一樣的情況:我這邊一直給一恒定的電壓輸入,重復(fù)上電斷電讀取AD值的實驗,10次中大約
    發(fā)表于 12-13 09:34

    如何優(yōu)化自然語言處理模型的性能

    優(yōu)化自然語言處理(NLP)模型的性能是一多方面的任務(wù),涉及數(shù)據(jù)預(yù)處理、特征工程、模型選擇、模型調(diào)參、模型集成與融合等多個環(huán)節(jié)。以下是一些具體的優(yōu)化策略: 一、數(shù)據(jù)預(yù)處理優(yōu)化 文本清洗 :去除文本中
    的頭像 發(fā)表于 12-05 15:30 ?2370次閱讀

    如何使用自然語言處理分析文本數(shù)據(jù)

    使用自然語言處理(NLP)分析文本數(shù)據(jù)是一復(fù)雜但系統(tǒng)的過程,涉及多個步驟和技術(shù)。以下是一基本的流程,幫助你理解如何使用NLP來分析文本數(shù)據(jù): 1. 數(shù)據(jù)收集 收集文本數(shù)據(jù) :從各種來源(如社交
    的頭像 發(fā)表于 12-05 15:27 ?2370次閱讀

    自然語言處理在聊天機(jī)器人中的應(yīng)用

    上歸功于自然語言處理技術(shù)的進(jìn)步。 聊天機(jī)器人的工作原理 聊天機(jī)器人的核心是一對話系統(tǒng),它能夠處理用戶的輸入(通常是文本形式),并生成相應(yīng)的回復(fù)。這個系統(tǒng)通常包括以下幾個關(guān)鍵組件: 語言理解 :機(jī)器人需要理解用
    的頭像 發(fā)表于 12-05 15:24 ?1707次閱讀

    自然語言處理與機(jī)器學(xué)習(xí)的關(guān)系 自然語言處理的基本概念及步驟

    自然語言處理(Natural Language Processing,簡稱NLP)是人工智能和語言學(xué)領(lǐng)域的一分支,它致力于研究如何讓計算機(jī)能夠理解、解釋和生成人類語言。機(jī)器學(xué)習(xí)(Ma
    的頭像 發(fā)表于 12-05 15:21 ?2526次閱讀

    基于智能語音交互的智能呼叫中心工作機(jī)制

    作為實現(xiàn)智能呼叫中心的關(guān)鍵技術(shù)之一的智能語音交互技術(shù),它通過集成自然語言處理(NLP)、語音識別(ASR)和語音合成(TTS)等先進(jìn)技術(shù),實現(xiàn)了與客戶的智能交互,提升客戶服務(wù)效率和體驗感。標(biāo)貝科技專
    的頭像 發(fā)表于 12-03 16:44 ?984次閱讀
    基于智能語音<b class='flag-5'>交互</b>的智能呼叫中心工作機(jī)制