chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

深度文本匹配的簡介,深度文本匹配在智能客服中的應用

電子工程師 ? 來源:未知 ? 作者:李倩 ? 2018-10-26 10:38 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

▌一、深度文本匹配的簡介

1. 文本匹配的價值

文本匹配是自然語言理解中的一個核心問題,它可以應用于大量的自然語言處理任務中,例如信息檢索、問答系統(tǒng)、復述問題、對話系統(tǒng)、機器翻譯等等。這些自然語言處理任務在很大程度上都可以抽象成文本匹配問題,比如信息檢索可以歸結(jié)為搜索詞和文檔資源的匹配,問答系統(tǒng)可以歸結(jié)為問題和候選答案的匹配,復述問題可以歸結(jié)為兩個同義句的匹配,對話系統(tǒng)可以歸結(jié)為前一句對話和回復的匹配,機器翻譯則可以歸結(jié)為兩種語言的匹配。

2. 深度文本匹配的優(yōu)勢

傳統(tǒng)的文本匹配技術(shù)如圖1中的 BoW、TFIDF、VSM等算法,主要解決詞匯層面的匹配問題,而實際上基于詞匯重合度的匹配算法存在著詞義局限、結(jié)構(gòu)局限和知識局限等問題。

詞義局限:的士和出租車雖然字面上不相似,但實為同一種交通工具;而蘋果在不同的語境下表示的東西不同,或為水果或為公司;

結(jié)構(gòu)局限:機器學習和學習機器雖詞匯完全重合,但表達的意思不同;

知識局限:秦始皇打 Dota,這句話雖從詞法和句法上看均沒問題,但結(jié)合知識看這句話是不對的。

傳統(tǒng)的文本匹配模型需要基于大量的人工定義和抽取的特征,而這些特征總是根據(jù)特定的任務(信息檢索或者自動問答)人工設(shè)計的,因此傳統(tǒng)模型在一個任務上表現(xiàn)很好的特征很難用到其他文本匹配任務上。而深度學習方法可以自動從原始數(shù)據(jù)中抽取特征,省去了大量人工設(shè)計特征的開銷。首先特征的抽取過程是模型的一部分,根據(jù)訓練數(shù)據(jù)的不同,可以方便適配到各種文本匹配的任務當中;其次,深度文本匹配模型結(jié)合上詞向量的技術(shù),更好地解決了詞義局限問題;最后得益于神經(jīng)網(wǎng)絡(luò)的層次化特性,深度文本匹配模型也能較好地建模短語匹配的結(jié)構(gòu)性和文本匹配的層次性[1]。

3. 深度文本匹配的發(fā)展路線

圖 1 深度文本匹配的發(fā)展路線

隨著深度學習在計算機視覺、語音識別和推薦系統(tǒng)領(lǐng)域中的成功運用,近年來有很多研究致力于將深度神經(jīng)網(wǎng)絡(luò)模型應用于自然語言處理任務,以降低特征工程的成本。最早將深度學習應用于文本匹配的是微軟 Redmond 研究院。2013年微軟 Redmond 研究院發(fā)表了 DSSM [2],當時 DSSM 在真實數(shù)據(jù)集上的效果超過了SOTA(State of the Art);為了彌補 DSSM 會丟失上下文的問題,2014年微軟又設(shè)計了CDSSM [3];2016年又相繼發(fā)表了 DSSM-LSTM, MV-DSSM。微軟的 DSSM 及相關(guān)系列模型是深度文本匹配模型中比較有影響力的,據(jù)了解百度、微信和阿里的搜索場景中都有使用。

其他比較有影響的模型有:2014年華為諾亞方舟實驗室提出的 ARC-I和ARC-II [4],2015年斯坦福的 Tree-LSTM [5],2016年 IBM 的 ABCNN [6],中科院的 MatchPyramid [7],2017年朱曉丹的 ESIM[8],2018 年騰訊 MIG 的多信道信息交叉模型 MIX [9]。

一般來說,深度文本匹配模型分為兩種類型,表示型和交互型。表示型模型更側(cè)重對表示層的構(gòu)建,它會在表示層將文本轉(zhuǎn)換成唯一的一個整體表示向量。典型的網(wǎng)絡(luò)結(jié)構(gòu)有 DSSM、CDSMM 和 ARC-I。這種模型的核心問題是得到的句子表示失去語義焦點,容易發(fā)生語義偏移,詞的上下文重要性難以衡量。交互型模型摒棄后匹配的思路,假設(shè)全局的匹配度依賴于局部的匹配度,在輸入層就進行詞語間的先匹配,并將匹配的結(jié)果作為灰度圖進行后續(xù)的建模。典型的網(wǎng)絡(luò)結(jié)構(gòu)有 ARC-II、DeepMatch 和 MatchPyramid。它的優(yōu)勢是可以很好的把握語義焦點,對上下文重要性合理建模。由于模型效果顯著,業(yè)界都在逐漸嘗試交互型的方法。

圖 2 深度文本匹配模型的類型

▌二、智能客服的簡介

1. 智能客服的應用背景

由于人工客服在響應時間、服務時間和業(yè)務知識等方面的局限性,有必要研發(fā)智能客服系統(tǒng),使其通過智能化的手段來輔助人工客服為用戶服務。智能客服與人工客服的優(yōu)劣勢對比如圖 4 所示。

圖 3 智能客服與人工客服的優(yōu)劣勢對比

2. 智能客服的核心模塊

智能客服的一般框架如圖 5 所示:當有 Query 請求時,首先對 Query 進行補全、解析和需求理解;其次,問題召回模塊通過精準召回、核心召回和語義召回從 FAQ 庫召回與 Query 相關(guān)的問題;接著,問題排序模塊通過 CTR 模型和相似度模型對召回的問題進行排序,選出 Top k 返回給用戶;最后,反饋系統(tǒng)記錄用戶的點擊行為等,對模型進行更新。具體哪些模型會被更新,與語義召回和相似度模型階段使用的算法有關(guān)。

圖 4 智能客服的一般框架

在智能客服的框架中,最重要的模塊是 FAQ 庫的構(gòu)建、語義召回、相似度模型和模型更新,它們性能的好壞對用戶的使用體驗有很大影響。

FAQ 庫的構(gòu)建

對于重視用戶體驗的客服系統(tǒng)來說,F(xiàn)AQ 庫的構(gòu)建是非常嚴格的,它的內(nèi)容需要非常完整和標準,不能像聊天機器人那樣可以插科打諢。一般的做法是將積累的 FAQ ,或是將場景相關(guān)的設(shè)計文檔、PRD文檔中的相應內(nèi)容整理成 FAQ,添加到 FAQ 庫中。日常的維護就是運營人員根據(jù)線上用戶的提問做總結(jié),把相應的問題和答案加入 FAQ 庫。不難想像,隨著用戶量的增加,用戶的問題種類五花八門,問法多種多樣,這種維護方式肯定會給運營帶來很大的壓力,也會給用戶帶來糟糕的體驗。那么,有沒有什么自動或是半自動的方法可以解決新問題的挖掘和 FAQ 庫的更新?

一種理想的 FAQ 庫構(gòu)建的流程應該是:從客服的直接對話出發(fā),提取出與產(chǎn)品相關(guān)的問題,計算問題之間的距離,通過增量聚類的方法把用戶相似的問題聚到一起,最后由運營人員判斷新增的問題能否進入 FAQ 庫,同時將他們的反饋更新給文本匹配模型。

圖 5 理想的FAQ 庫構(gòu)建的流程

語義召回

當 FAQ 庫達到一定規(guī)模時,再讓用戶請求的 Query 與 FAQ 庫中的問題一一計算相似度是非常耗時的,而問題召回模塊可以通過某些算法只召回與請求 Query 相關(guān)的問題,減少問題相似度模型階段的復雜度。精準召回和核心召回是基于詞匯重合度的檢索方法,它們的局限是不能召回那些 FAQ 庫中與請求 Query 無詞匯重合,但語義表達是一樣的問題,而語義召回可以解決此類問題。

相似度模型

相似度模型分別計算召回的相關(guān)問題與請求 Query 之間的相似度,作為排序模型的特征之一。需要注意,此處的相似度模型不同于語義召回中的相似度計算,前者更靠近輸出端,對準確率要求高;后者對召回率要求高。因此,這兩個模塊在實現(xiàn)時使用的模型往往不同,在我們的文本匹配引擎中,語義召回使用的是基于表示型的深度文本匹配模型,相似度模型使用的是基于交互型的深度文本匹配模型和其他傳統(tǒng)文本匹配模型的混合模型。

模型更新

智能客服投入線上使用后,用戶 query 可能與某些模型的訓練數(shù)據(jù)分布不一致,導致智能客服的響應不理想。因此,十分有必要從收集到的用戶行為數(shù)據(jù)中挖掘相關(guān)知識,并更新相關(guān)模型。

▌三、深度文本匹配在智能客服中的應用

1. 為什么使用深度文本匹配

問題聚類、語義召回和相似度模型都可以歸結(jié)為文本匹配問題。傳統(tǒng)智能客服在這些模塊中使用的是傳統(tǒng)文本匹配方法,不可避免地會遇到詞義局限、結(jié)構(gòu)局限和知識局限等問題;加上傳統(tǒng)文本匹配方法多是無監(jiān)督的學習方法,那么由這些方法訓練的模型就無法利用運營人員的反饋和用戶的點擊行為等知識。然而,使用深度文本匹配的方法則可以有效地解決這些弊端。具體改進方面如圖 6 所示。

圖 6 深度文本匹配對傳統(tǒng)智能客服的改進

2. 怎么樣使用深度文本匹配

我們曾在智能客服的不同領(lǐng)域中嘗試過多種深度文本匹配方法,通過業(yè)務場景推動技術(shù)演進的方式,逐淅形成了一套成熟的文本匹配引擎。我們的文本匹配引擎除了使用傳統(tǒng)的機器學習模型(如話題匹配模型、詞匹配模型、VSM等)外,還使用了基于表示型和基于交互型的深度文本匹配模型。

深度文本匹配模型

Representation-based Model

表示型的深度文本匹配模型能抽出句子主成分,將文本序列轉(zhuǎn)換為向量,因此,在問題聚類模塊,我們使用表示型的深度文本匹配模型對挖掘的問題和 FAQ 庫的問題做預處理,方便后續(xù)增量聚類模塊的計算;在語義召回模塊,我們使用表示型的深度文本匹配模型對 FAQ 庫的問題做向量化處理,并建立索引,方便問題召回模塊增加對用戶 query 的召回。另外,我們使用基于 Bi-LSTM 的表示型模型以捕獲句子內(nèi)的長依賴關(guān)系。模型結(jié)構(gòu)如圖 7 所示。

圖 7 基于 Bi-LSTM 的表示型模型

Iteraction-based Model

我們在相似度模型模塊使用了基于交互型的深度文本匹配模型 MatchPyramid,其原因有三點:

第一點,表示型的深度文本匹配模型對句子表示時容易失去語義焦點和發(fā)生語義偏移,而交互型的深度文本匹配模型不存在這種問題,它能很好地把握語義焦點,對上下文重要性進行合理建模。

第二點,在語義召回階段,用戶 query 與召回問題間的語義相似度會作為排序模型的特征之一,同樣地,相似度模型階段,用戶 query 與召回問題間的另一種語義相似度也會作為排序模型的特征之一。

第三點,相似度模型需要實時計算,用戶每請求一次,相似度模型就需要計算 n 個句對的相似度,n 是問題召回的個數(shù)。而序列型的神經(jīng)網(wǎng)絡(luò)不能并行計算,因此我們選擇了網(wǎng)絡(luò)結(jié)構(gòu)是 CNN 的 MatchPyramid 模型。模型結(jié)構(gòu)如圖 8 所示。

圖 8 An overview of MatchPyramid on Text Matching

文本匹配引擎

由于自然語言的多樣性,文本匹配問題不是某個單一模型就能解決的,它涉及到的是算法框架的問題。每個模型都有獨到之處,如何利用不同模型的優(yōu)點去做集成,是任何文本匹配引擎都需要解決的問題。我們的文本匹配引擎融合了傳統(tǒng)文本匹配模型和深度文本匹配模型,具體的框架如圖 9 所示。

圖 9 文本匹配引擎的框架

3. 深度智能客服的效果評測

應用上述的文本匹配引擎后,我們?yōu)槟称嚬鹃_發(fā)的智能客服系統(tǒng),在測試集上的 precision 達到了 97%;與某壽險公司合作完成的智能客服,其 precision 比 baseline 高出 10 個點。除此之外,在對話系統(tǒng)的音樂領(lǐng)域中,使用深度文本匹配引擎替代模糊匹配后,整體 precision 提高了 10 個點;在通用領(lǐng)域的測試集上,我們的文本匹配引擎也與百度的 SimNet 表現(xiàn)不相上下。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 計算機視覺
    +關(guān)注

    關(guān)注

    9

    文章

    1714

    瀏覽量

    47455
  • 機器學習
    +關(guān)注

    關(guān)注

    66

    文章

    8541

    瀏覽量

    136236
  • 深度學習
    +關(guān)注

    關(guān)注

    73

    文章

    5591

    瀏覽量

    123912

原文標題:深度文本匹配在智能客服中的應用

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    深度學習對工業(yè)物聯(lián)網(wǎng)有哪些幫助

    、實施路徑三個維度展開分析: 一、深度學習如何突破工業(yè)物聯(lián)網(wǎng)的技術(shù)瓶頸? 1. 非結(jié)構(gòu)化數(shù)據(jù)處理:解鎖“沉睡數(shù)據(jù)”價值 傳統(tǒng)困境 :工業(yè)物聯(lián)網(wǎng)70%以上的數(shù)據(jù)為非結(jié)構(gòu)化數(shù)據(jù)(如設(shè)備振動波形、紅外圖像、日志文本),傳統(tǒng)方法難以
    的頭像 發(fā)表于 08-20 14:56 ?761次閱讀

    UPS電源—UPS電源參數(shù)匹配常見錯鬧笑話

    在UPS電源的使用過程,參數(shù)匹配是至關(guān)重要的環(huán)節(jié)。錯誤的參數(shù)匹配可能導致UPS電源無法正常工作,甚至對負載設(shè)備造成損害。
    的頭像 發(fā)表于 08-20 09:22 ?529次閱讀
    UPS電源—UPS電源參數(shù)<b class='flag-5'>匹配</b>常見錯鬧笑話

    自動駕駛Transformer大模型會取代深度學習嗎?

    [首發(fā)于智駕最前沿微信公眾號]近年來,隨著ChatGPT、Claude、文心一言等大語言模型在生成文本、對話交互等領(lǐng)域的驚艷表現(xiàn),“Transformer架構(gòu)是否正在取代傳統(tǒng)深度學習”這一話題一直被
    的頭像 發(fā)表于 08-13 09:15 ?3922次閱讀
    自動駕駛<b class='flag-5'>中</b>Transformer大模型會取代<b class='flag-5'>深度</b>學習嗎?

    毫米之間定成?。篜CB背鉆深度設(shè)計與生產(chǎn)如何精準把控

    。 PCB 背鉆(Back Drilling)的核心目的是去除多層板中導通孔(Via)在深層多余的 “stub”(未連接的孔壁鍍層殘留),以減少高頻信號傳輸的反射、損耗和串擾。背鉆深度的精準控制直接影響其
    發(fā)表于 07-28 14:20

    飛書富文本組件庫RichTextVista開源

    近日,飛書正式將其自研的富文本組件庫 RichTextVista(簡稱“RTV”)開源,并上線OpenHarmony 三方庫中心倉。該組件以領(lǐng)先的性能、流暢的渲染體驗與高度的開放性,為鴻蒙生態(tài)提供了更高效的富文本解決方案。
    的頭像 發(fā)表于 07-16 16:47 ?767次閱讀

    飛書開源“RTV”富文本組件 重塑鴻蒙應用富文本渲染體驗

    更高效的富文本解決方案。 富文本作為內(nèi)容展示和信息交互的重要形式,在內(nèi)容創(chuàng)作、辦公協(xié)作、教育學習、企業(yè)應用等多種復雜業(yè)務場景扮演著重要角色。隨著鴻蒙生態(tài)應用類型的不斷豐富,富文本渲染
    的頭像 發(fā)表于 07-11 15:20 ?460次閱讀
    飛書開源“RTV”富<b class='flag-5'>文本</b>組件 重塑鴻蒙應用富<b class='flag-5'>文本</b>渲染體驗

    雙工不匹配如何修復它

    ,確保所有相關(guān)設(shè)備的雙工模式一致,例如都設(shè)置為全雙工或半雙工。 啟用自動協(xié)商功能:推薦在所有端口啟用自協(xié)商功能,以便設(shè)備能夠自動匹配最佳的雙工模式和速度?,F(xiàn)代設(shè)備通常支持智能匹配,可以減少配置錯誤。 手動配置雙工模式:如果自動協(xié)
    的頭像 發(fā)表于 07-02 09:46 ?412次閱讀

    存儲示波器的存儲深度對信號分析有什么影響?

    存儲深度(Memory Depth)是數(shù)字示波器的核心參數(shù)之一,它直接決定了示波器在單次采集過程能夠記錄的采樣點數(shù)量。存儲深度對信號分析的影響貫穿時域細節(jié)捕捉、頻域分析精度、觸發(fā)穩(wěn)定性等多個維度
    發(fā)表于 05-27 14:39

    基于LockAI視覺識別模塊:C++多模板匹配

    多模板匹配是一種在圖像同時尋找多個模板的技術(shù)。通過對每個模板逐一進行匹配,找到與輸入圖像最相似的區(qū)域,并標記出匹配度最高的結(jié)果。本實驗提供了一個簡單的多模板
    的頭像 發(fā)表于 05-14 14:37 ?1338次閱讀
    基于LockAI視覺識別模塊:C++多模板<b class='flag-5'>匹配</b>

    把樹莓派打造成識別文本的“神器”!

    在許多項目中,RaspberryPi被用作監(jiān)控攝像頭或執(zhí)行機器學習任務。在這些場景,圖像中經(jīng)常包含應用程序感興趣的文本信息。我們希望提取這些信息并將其轉(zhuǎn)換,以便通過程序分析文本
    的頭像 發(fā)表于 03-25 09:30 ?757次閱讀
    把樹莓派打造成識別<b class='flag-5'>文本</b>的“神器”!

    普強信息深思大模型全面接入DeepSeek 深度賦能智能座艙、智能客服

    大模型進行深度融合,在交互準確性、穩(wěn)定性、可靠性等維度上實現(xiàn)優(yōu)勢互補,釋放出巨大的協(xié)同效能。 在DeepSeek大模型和普強深思大模型的加持下, 智能座艙、智能客服等領(lǐng)域的人機交互準確
    的頭像 發(fā)表于 03-04 11:31 ?1085次閱讀

    百度搜索與文心智能體平臺接入DeepSeek及文心大模型深度搜索

    近日,百度搜索與文心智能體平臺聯(lián)合宣布了一項重要更新:將全面接入DeepSeek及文心大模型最新的深度搜索功能。這一更新將為用戶和開發(fā)者帶來更加智能、高效的搜索和智能體創(chuàng)建體驗。 據(jù)悉
    的頭像 發(fā)表于 02-17 09:14 ?975次閱讀

    軍事應用深度學習的挑戰(zhàn)與機遇

    人工智能尤其是深度學習技術(shù)的最新進展,加速了不同應用領(lǐng)域的創(chuàng)新與發(fā)展。深度學習技術(shù)的發(fā)展深刻影響了軍事發(fā)展趨勢,導致戰(zhàn)爭形式和模式發(fā)生重大變化。本文將概述深度學習的歷史和架構(gòu)。然后,回
    的頭像 發(fā)表于 02-14 11:15 ?821次閱讀

    電源濾波器的阻抗匹配問題:源阻抗和負載阻抗不匹配時的優(yōu)化策略

    在電子設(shè)備,電源濾波器的性能受到源阻抗和負載阻抗不匹配的影響。諧振現(xiàn)象可能導致電感和電容元件形成共振回路,影響濾波器的濾波效果和電路元件的穩(wěn)定性。優(yōu)化濾波器設(shè)計采用 L 型匹配網(wǎng)絡(luò),T 型和 Π 型
    的頭像 發(fā)表于 02-10 11:02 ?1220次閱讀
    電源濾波器的阻抗<b class='flag-5'>匹配</b>問題:源阻抗和負載阻抗不<b class='flag-5'>匹配</b>時的優(yōu)化策略

    請問DAC5682z內(nèi)部FIFO深度為多少,8SAMPLE具體怎么理解?

    你好,請問DAC5682z內(nèi)部FIFO深度為多少,8SAMPLE具體怎么理解。 另外,DAC5682zEVM是否可以直接通過TI的ADC-HSMC板卡與ALTERA的FPGA開發(fā)相連(FPGA板HSMC接口與電壓都匹配條件下)。 謝謝
    發(fā)表于 01-03 07:27