chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NLP技術(shù)為什么這么難落地其中有什么困難

傳感器技術(shù) ? 來源:未知 ? 2019-02-03 12:23 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

AI 很火,但是 AI 的門檻也很高,普通的開發(fā)者想要搭上這波 AI 紅利依然困難。

近期,人工智能公司推出了新一代智能 Bot 開放平臺,它整合了小i機器人 Chatting Bot、FAQ Bot、Discovery Bot 三大核心能力,為企業(yè)和開發(fā)者提供智能機器人服務(wù)+人工在線服務(wù)+智能人機協(xié)作學習的完整使用閉環(huán),除智能客服場景應(yīng)用外,智能營銷、智能外呼、智能硬件等多種不同類型的應(yīng)用場景也將陸續(xù)開放。

平臺開放的目的就是降低企業(yè)使用和擁有AI技術(shù)的成本與門檻,讓企業(yè)和開發(fā)者快速開發(fā)出滿足自身業(yè)務(wù)需求的智能服務(wù)系統(tǒng)或者具有智能交互能力的對話機器人。

近日,CSDN主編下午茶邀請到了小i機器人技術(shù)委員會輪值主席兼首席架構(gòu)師李波,與我們一起探討了NLP技術(shù)落地的難點,以及如何降低開發(fā)者門檻的問題,希望能對廣大讀者有所啟發(fā)。

NLP的發(fā)展方向

AI科技大本營:能簡單介紹下 NLP 技術(shù)嗎?

李波:NLP 技術(shù)目前有兩種,一種是基于規(guī)則,還有一種是基于統(tǒng)計。近年來,基于統(tǒng)計的 NLP 技術(shù)占據(jù)了上風,特別是深度學習出現(xiàn)之后,基于統(tǒng)計的 NLP 技術(shù)進展快很多。并不是說誰更優(yōu),或者誰更差,它們各有所長,比如基于統(tǒng)計的模型的泛化性比較好,但是它是一個黑盒。一些應(yīng)用還需要兩者結(jié)合使用,比如在問答系統(tǒng)中,有些機器回答并不是很友好,就可以利用基于規(guī)則的方法做補充,兩者結(jié)合來達到產(chǎn)品化的程度。

拋開運算智能,人工智能主要包含兩個層面,一個是認知智能,一個是感知智能。比如常見的語音識別、圖像識別就屬于感知智能的層面,目前比較成熟的 落地應(yīng)用也比較多,而 NLP 則屬于認知智能層面。NLP 往往需要結(jié)合上下文信息,甚至考慮背景知識、常識性知識等。另外,感知智能(如圖片識別)的輸入輸出一般是單輪的(single-turn),但是 NLP 往往需要多輪的(multi-turn)交互后才能得到結(jié)果。目前 NLP 技術(shù)還處于發(fā)展的早起階段,還有很多難點需要突破。

AI科技大本營:你覺得它未來還會有很快的進展嗎?還有哪些需要探索的方向?

李波:常識和背景知識:用 NLP 做專業(yè)性很強的事情,可能效果會很好,反到是小概率簡單的事情做不到,因為缺乏常識。想要解決這個問題就需要構(gòu)建常識庫,然后與模型結(jié)合,這是一個難點,也是大家比較愿意探索的一個方向。

多模態(tài):人類是通過視覺、聽覺等各種感觀結(jié)合在一起來理解一件事情的,也就是多模態(tài)。假設(shè) NLP 系統(tǒng)可以同時結(jié)合音頻視頻來理解用戶的意圖,那么可能會有更大的突破。

預(yù)訓練:這是近期大家可以嘗試的一個熱點。預(yù)訓練在音頻和圖片領(lǐng)域已經(jīng)得到了廣泛應(yīng)用,最近 Google 的 BERT 則是把預(yù)訓練運用到了 NLP 領(lǐng)域,取得了不錯的效果。這也是近期的一個熱點,大家可以去嘗試。

強化學習:在認知智能方面,強化學習也有些不錯的方向。

NLP如何走出實驗室

AI科技大本營:學術(shù)界的成果能夠及時地應(yīng)用到工業(yè)界嗎?

李波:有些技術(shù)可以及時轉(zhuǎn)化,有些技術(shù)還需要轉(zhuǎn)化周期。這個轉(zhuǎn)化周期意思就是說,我們要考慮商用模型的性能和準確率,此外還有其他的工程條件,滿足這些標準之后,才可以把研究成果輸出到產(chǎn)品。學術(shù)界訓練一個模型只看最后的評價指標,也就是一個百分比的結(jié)果,但落地的時候考慮更多因素,比如一個準確率 99% 的模型,但剩下 1% 的工程化的工作量,不一定比99%工作量小。

AI科技大本營:從實驗室到模型商用化落地,你們最關(guān)心什么?

李波:我們最關(guān)心的首先是要模型的可用性要達到工業(yè)化落地的標準,除此之外包括產(chǎn)品的 UI 設(shè)計、體驗設(shè)計等也非常重要。NLP 不像圖片和語音,在 UI 方面需要考慮的更多。比如機器翻譯系統(tǒng)的準確率達到一定程度后,如果 UI 做得不好,用戶體驗不好,可能會對落地造成的很大的影響。這是一個系統(tǒng)化的工程,包括成本、用戶體驗,為客戶帶來多少價值等,都需要考慮。

AI科技大本營:關(guān)于 AI 創(chuàng)業(yè)公司落地難的問題,小i機器人有什么好的經(jīng)驗可以分享嗎?

李波:跟圖片和語音對比,NLP 特別難,NLP涉及到的多模態(tài)是它的一個難點。第二個難點是需要結(jié)合背景知識及常識。這兩個問題在目前并沒有很好的處理方式。小i 主要是結(jié)合基于規(guī)則+統(tǒng)計的方式,引入知識,比如我之前提到的領(lǐng)域語義庫,目的就是融入常識和背景知識。最后就是個性化的問題,NLP 的輸出往往和個體相關(guān),不同的個體需要依據(jù)人物畫像等信息給出不同的個性化的結(jié)果,這樣才更接近人類的處理方式。

此外,NLP 的落地場景不是那么直接,需要結(jié)合客戶或者是產(chǎn)品設(shè)計。比如做推薦,我們訓練模型的關(guān)注點可能就是模型對應(yīng)的幾個指標,比如查準率等,但是客戶看的是最后推薦的效果,也就是用戶實際的評價和購買情況。因此,不管實驗室的效果如何,在實際效果中,需要根據(jù)客戶的反饋不斷調(diào)整系統(tǒng)參數(shù),調(diào)整訓練數(shù)據(jù),或者結(jié)合其他算法等等,以此來提高最終落地的效果。

上線運行之后,我們還需要根據(jù)運營的日志和客戶的行為,再迭代模型,這是一個閉環(huán)。而不是說不結(jié)合實際場景,把模型訓練好后直接投入使用,然后就不管了,不是這回事,需要根據(jù)運營的數(shù)據(jù),不斷調(diào)優(yōu)迭代。

AI科技大本營:模型可控性的問題怎么解決?

李波:比如我們幫客戶做的智能客服機器人,主要依靠混合模型引擎來達到可控的目的。另外也可以通過一些工程化手段來做到可控,如在問答中涉及到一些敏感的內(nèi)容,我們可以通過前處理、后處理等方式及時干預(yù),而無需更新模型、重啟系統(tǒng)。在用戶真實的使用過程中發(fā)現(xiàn)問題時,我們需要有渠道、有方法控制系統(tǒng)的輸出,甚至邏輯,保證系統(tǒng)是可控的。

AI科技大本營:哪些方法可以使它可控?

李波:我們的混合模型引擎包含兩種模型,一個是黑盒子,就是深度學習模型,另一個是語義理解模型,基于傳統(tǒng)的語義表達式,可以用來做干預(yù)。語義理解模型可以直接通過語義表達式來進行更改,而深度學習模型想要干預(yù)則必須重新訓練。因此我們可以讓深度學習模型和語義理解模型同時作用,然后調(diào)整深度學習模型和語義理解模型的輸出策略(如優(yōu)先級策略等)來調(diào)優(yōu)。

小i機器人如何收集數(shù)據(jù)?

AI科技大本營:小i機器人是如何積累數(shù)據(jù)的?

李波:主要是三個方面:第一,我們會通過爬蟲去爬取相關(guān)的行業(yè)數(shù)據(jù)。第二,我們的云端產(chǎn)品產(chǎn)生的日志數(shù)據(jù),會直接收集到我們的數(shù)據(jù)平臺里。第三,客戶提供的素材,我們會把它轉(zhuǎn)化成數(shù)據(jù)和知識。

AI科技大本營:數(shù)據(jù)收集之后怎么處理?

李波:非結(jié)構(gòu)化數(shù)據(jù):首先我們會對收集到數(shù)據(jù)進行數(shù)據(jù)清洗,然后再按照知識的分類通過機器+人工方式將其歸類,再通過一些手段(如規(guī)則等)做一些粗顆粒度的標注,之后由人工確認,確認完后入庫。

半結(jié)構(gòu)化數(shù)據(jù):客戶提供的原始帶格式文檔,通過格式規(guī)則分析或者機器學習模型等手段來進行分類或者聚類等輔助處理,然后再進行人工梳理,最后入庫。

AI科技大本營:數(shù)據(jù)的處理靠機器和人工的結(jié)合?

李波:機器做前期輔助,人工做最終的確認,而不是機器處理之后直接入庫。小i有一個大的數(shù)據(jù)平臺和一個標注系統(tǒng),還有一個實驗室系統(tǒng),共同運作來產(chǎn)生這些行業(yè)訓練數(shù)據(jù)以及行業(yè)背景知識,然后以領(lǐng)域語義庫的形式部署到實際系統(tǒng)中。

小i機器人如何賦能開發(fā)者?

AI科技大本營:現(xiàn)在有很多平臺和工具可以幫助開發(fā)者去降低門檻,據(jù)我所知,小i最近也推出了新一代智能 Bot 開放平臺,這個平臺能給開發(fā)者帶來什么?

李波:幫助中小企業(yè)或者開發(fā)者快速打造一個適應(yīng)各種實際場景的AI系統(tǒng)。第一個落地的場景是智能客服,以問答能力為主,降低人工客服的成本。第二個應(yīng)用場景是智能營銷,以營銷推薦為主,包括用戶畫像等,我們會在后期推出。第三個應(yīng)用場景是智能外呼。后續(xù)我們還會推出更多的場景。開發(fā)者不僅可以直接使用這些場景,還可以基于每個場景的API來擴充應(yīng)用的能力。

AI科技大本營:因為現(xiàn)在有各種各樣的平臺和工具,假設(shè)我是個新手,我就做一個小項目練練手,應(yīng)該怎么做?

李波:這個平臺的目的是降低開發(fā)者的門檻。開發(fā)者如果是自己收集數(shù)據(jù),然后訓練模型,開發(fā)周期很長,而且有很多的坑要趟。我們的這個平臺有兩個目標,第一,讓用戶可以直接使用;第二個,開發(fā)者可以基于這個平臺擴充自己的能力。

使用我們的平臺,開發(fā)者需要提供的數(shù)據(jù)只是問答的基本意圖點,我們在底層有領(lǐng)域語義庫做支撐,我們會自動在詞的層面,在句法層面幫你擴充數(shù)據(jù)集,然后自動幫你去訓練。

AI科技大本營:關(guān)于NLP技術(shù)的工程實踐,您對開發(fā)者有什么建議嗎?

李波:針對NLP的開發(fā)者有幾點建議:首先,你要對相關(guān)技術(shù)有全面的了解,不一定要特別細化,這樣對開發(fā)會有幫助;第二,一定要明確你的輸入和輸出;最后,開發(fā)者要更多地關(guān)注產(chǎn)品體驗。

AI科技大本營:最后,您平時都是怎樣自我學習的,有哪些經(jīng)驗可以分享下嗎?

李波:互聯(lián)網(wǎng)是一個非常好的渠道,我比較喜歡“碰到問題后在解決問題的過程中學習“的方式。如果你只是通過書本去學習,而忽略實踐,就會比較虛。因此要結(jié)合實踐,哪怕是做一些Demo嘗試也可以。在嘗試過程中遇到問題,然后通過各種方式去獲取答案,而不是像學校里的傳統(tǒng)方式去學習。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關(guān)注

    關(guān)注

    213

    文章

    29730

    瀏覽量

    212839
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35109

    瀏覽量

    279610
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    490

    瀏覽量

    22621

原文標題:NLP技術(shù)落地為何這么難?里面有哪些坑?

文章出處:【微信號:WW_CGQJS,微信公眾號:傳感器技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    華興變壓器:絕緣壽命預(yù)測為何這么

    您在使用華興變壓器時,是不是也在疑惑:三相隔離變壓器的絕緣壽命預(yù)測咋就這么呢?這可困擾著不少企業(yè)。先看絕緣材料的個體差異。即便是同一批次生產(chǎn)的絕緣材料,由于原材料微小雜質(zhì)、生產(chǎn)時的溫度濕度波動
    的頭像 發(fā)表于 07-11 11:24 ?102次閱讀
    華興變壓器:絕緣壽命預(yù)測為何<b class='flag-5'>這么</b><b class='flag-5'>難</b>?

    業(yè)界首款支持星閃車鑰匙的智能手機亮相

    華為全新一代先鋒影像美學旗艦Pura80系列手機重磅發(fā)布,其中有一項產(chǎn)品定位格外吸引業(yè)界的關(guān)注:業(yè)界首款支持星閃車鑰匙的智能手機!
    的頭像 發(fā)表于 06-13 11:09 ?764次閱讀

    如何在MCXN947板的FlexSPI接口接HyperRAM

    MCXN947芯片是一款高度集成的微控制器,具有強大的處理能力、豐富的外設(shè)支持和高級安全特性,適用于多種復雜應(yīng)用。其中有個非常重要的外設(shè)為FlexSPI。
    的頭像 發(fā)表于 06-04 09:39 ?1029次閱讀
    如何在MCXN947板的FlexSPI接口接HyperRAM

    ??低暟l(fā)布視覺大模型周界攝像機

    上周,我們發(fā)布了視覺大模型系列攝像機,其中有大模型加持的周界系列攝像機,誤報率下降90%以上。
    的頭像 發(fā)表于 03-11 18:12 ?952次閱讀

    DeepSeek一體機:加速AI訓推超融合,推動行業(yè)智能化落地

    在人工智能技術(shù)迅猛發(fā)展的今天,大模型技術(shù)正加速從“實驗室”邁向“產(chǎn)業(yè)場景”,然而數(shù)據(jù)工程復雜、模型適配、訓練成本高等問題,仍是行業(yè)化落地的“攔路虎”。 華為DCS AI解決方案針對D
    的頭像 發(fā)表于 02-20 11:14 ?769次閱讀
    DeepSeek一體機:加速AI訓推超融合,推動行業(yè)智能化<b class='flag-5'>落地</b>

    達實智能近期五件大事

    乙巳蛇年開工以來 僅僅過去1周時間 達實智能發(fā)生了這幾件大事 或許其中有你正在關(guān)心的 最熱門的當下話題 一起來看!
    的頭像 發(fā)表于 02-12 13:37 ?677次閱讀

    使用PIC的32位單片機控制ADS8361,連續(xù)采集ADS8361的輸出其中有好幾對一模一樣的數(shù)據(jù),為什么?

    使用PIC的32位單片機控制ADS8361,時鐘頻率80MHz,ADS8361設(shè)置在模式1工作。然后連續(xù)采集十次ADS8361的輸出,每次間隔300ms,采集到的十個數(shù),其中有好幾對一模一樣的數(shù)據(jù)
    發(fā)表于 01-17 08:21

    請問關(guān)于ADS5407內(nèi)部寄存器有沒有相關(guān)的中文介紹的?

    請問關(guān)于ADS5407內(nèi)部寄存器有沒有相關(guān)的中文介紹的?其中有幾個寄存器的功能不是特別明白,麻煩啦
    發(fā)表于 01-17 07:36

    全球地理定位技術(shù)的發(fā)展歷程

    根據(jù) Google 提供的數(shù)據(jù),目前有 5,465 顆衛(wèi)星在環(huán)繞地球軌道運行,其中有 154 顆衛(wèi)星主要用于導航。
    的頭像 發(fā)表于 12-16 11:37 ?1095次閱讀

    使用了了4片DAC81416,工作模式相同,有1片當碼值為0x8000時,輸出電壓值為30mV~40mV,請問正常嗎?

    電路中使用了了4片DAC81416,工作模式相同,輸出配置為為正負10V范圍。 其中有3片當碼值為0x8000時,輸出電壓為零點幾個mV或者幾個mV,但是有1片當碼值為0x8000時,輸出電壓值為30mV~40mV,請問這是正常的嗎?該芯片在其他碼值沒有發(fā)現(xiàn)偏差這么
    發(fā)表于 12-04 06:10

    NLP技術(shù)在聊天機器人中的作用

    聊天機器人,也稱為聊天AI,是一種通過文本或語音與人類進行交流的軟件。它們廣泛應(yīng)用于客戶服務(wù)、在線購物、個人助理等領(lǐng)域。NLP技術(shù)是實現(xiàn)聊天機器人智能對話能力的關(guān)鍵。 1. 理解用戶意圖 NLP
    的頭像 發(fā)表于 11-11 10:33 ?1025次閱讀

    用兩片TAS5630B做八聲道機器,其中有一片有很大噪音,怎么解決?

    我用兩片TAS5630B做八聲道機器,其中有一片有很大噪音,請專家指點。謝謝!
    發(fā)表于 11-05 06:09

    求助,一個對線儀故障問題。

    一個由單片機組成的電子電路,其中有一個攝像頭輸入口和一個視頻輸出口,顯示器顯示攝像頭投射畫面,其中有兩條軸線,X和Y,X由編碼器開關(guān)控制,Y軸由電位器控制,現(xiàn)在X軸的線條消失了,請問這種是什么元件的故障?要從哪里排查?
    發(fā)表于 10-18 15:36

    商業(yè)水電抄表收費困難怎么解決?

    一 、 商業(yè)水電收費困難的原因 分戶計量不準確:水電表可能存在精度問題或故障,導致讀數(shù)不準確,從而引發(fā)業(yè)主對水電費的質(zhì)疑和糾紛; ? 水電費明細無法實時查看:水電的使用量和項管費用無法形成明細報表或
    的頭像 發(fā)表于 10-14 10:38 ?948次閱讀
    商業(yè)水電抄表收費<b class='flag-5'>困難</b>怎么解決?

    OPA2333AQDRQ1其中有一路AMP沒有使用,沒有使用的引腳應(yīng)該如何處理?

    OPA2333AQDRQ1其中有一路AMP沒有使用,請問沒有使用的引腳應(yīng)該如何處理? 當前處理為: 5pin:下拉接地 6pin,7pin接在一起 這樣可以嗎?還有有其他建議?
    發(fā)表于 08-14 07:56