chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種處理多標(biāo)簽文本分類的新穎推理機制

深度學(xué)習(xí)自然語言處理 ? 來源:南大NLP ? 作者:南大NLP ? 2021-02-05 09:21 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

研究動機

標(biāo)簽文本分類(multi-label text classification, 簡稱MLTC)的目的是在給定文本后要求模型預(yù)測其多個非互斥的相關(guān)標(biāo)簽。該任務(wù)在許多自然語言處理任務(wù)上都有體現(xiàn)。如在表1中,需要給該文檔打上標(biāo)簽:basketball、NBA、sport。

表1多標(biāo)簽文本分類的例子

文本 This article is about a game between Houston Rockets and Los Angeles Lakers.
相關(guān)標(biāo)簽 basketball, NBA, sport
不相關(guān)標(biāo)簽 football

一種處理MLTC的簡單方法是將其轉(zhuǎn)換為多個獨立的二分類問題。該方法被稱為BinaryRelevance (BR),由于其簡單性而被大規(guī)模使用。但該方法的弊端也十分明顯,即該方法完全忽略了標(biāo)簽之間的相關(guān)信息。直覺上,知道一些標(biāo)簽——如上例中的basketball及NBA——會使得預(yù)測其他標(biāo)簽(如sport)更加簡單。研究者指出對于多標(biāo)簽分類任務(wù)而言,有效利用標(biāo)簽之間的相關(guān)性是有益的、甚至是必要的。為此,涌現(xiàn)出許多利用標(biāo)簽關(guān)系的算法,其中最知名的就是算法Classifier Chains(CC)。該算法將多個二分類器串聯(lián)起來,其中每個分類器使用之前分類器的預(yù)測結(jié)果作為額外的輸入。該方法將潛在的標(biāo)簽依賴納入考慮,但該問題的最大缺陷在于不同的標(biāo)簽順序會產(chǎn)生天壤之別的性能。同時,CC算法的鏈?zhǔn)浇Y(jié)構(gòu)使得算法無法并行,在處理大規(guī)模數(shù)據(jù)集時效率低下。

近年來,也有學(xué)者將標(biāo)簽集合視作標(biāo)簽序列,并使用基于神經(jīng)網(wǎng)絡(luò)的端到端模型(seq2seq)來處理該任務(wù)。相較于CC預(yù)測所有標(biāo)簽,這類seq2seq的模型只預(yù)測相關(guān)標(biāo)簽。因此該類模型的決策鏈條長度更短,性能更優(yōu)。但這類模型的性能強烈依賴于標(biāo)簽的順序。在多標(biāo)簽數(shù)據(jù)集中,標(biāo)簽本質(zhì)上是無序的集合,未必可以線性排列。學(xué)者們指出不同的標(biāo)簽順序?qū)τ趯W(xué)習(xí)和預(yù)測有著重大影響。舉例來說,對于表1中的例子,如果標(biāo)簽序列以sport開始,則對于預(yù)測其他相關(guān)標(biāo)簽的幫助不大。

02

解決方案

為了處理上述問題,我們提出了Multi-Label Reasoner(ML-Reasoner),一個基于推理機制的算法。ML-Reasoner的框架如圖1所示,我們?yōu)槊恳粋€標(biāo)簽分配一個二分類器,它們同時預(yù)測所有標(biāo)簽以滿足標(biāo)簽的無序性質(zhì)。這樣的話,ML-Reasoner可以同時計算每一個標(biāo)簽相關(guān)的概率。例如在處理上例時,ML-Reasoner可能認為標(biāo)簽NBA相關(guān)的概率為0.9,basketball的為0.7,sport為0.55,football為0.3.這樣,ML-Reasoner就完全避免依賴標(biāo)簽順序。同時為了有效利用標(biāo)簽的相關(guān)性,我們設(shè)置了一種新穎的迭代推理機制,即將上一輪對所有標(biāo)簽相關(guān)的預(yù)測作為下一次迭代的額外特征輸入。這種方法使得ML-Reasoner可以在每一輪的迭代中完善預(yù)測結(jié)果。舉例來說,考慮到標(biāo)簽NBA與basketball相關(guān)的概率較高,模型可以在后續(xù)迭代中,將標(biāo)簽sport的概率調(diào)高。

274e6dc8-603e-11eb-8b86-12bb97331649.png

圖1 Multi-Label Reasoner整體框架圖

具體到Reasoner的實現(xiàn),我們將其劃分為五個組件,其相關(guān)交互關(guān)系見圖2。

2a98ed0a-603e-11eb-8b86-12bb97331649.png

圖2多標(biāo)簽文本分類的Reasoner模塊

- Text Encoder將詞語序列轉(zhuǎn)換為稠密的向量表示,主要負責(zé)抽取文本特征;

- Label Encoder將上一輪次所有標(biāo)簽的相關(guān)概率轉(zhuǎn)換為相應(yīng)的標(biāo)簽表示;

- Attention模塊負責(zé)計算文本與不同標(biāo)簽之間的相關(guān)性;

- Combiner則將文本的原始特征與標(biāo)簽特征進行整合;

- 具有相同結(jié)構(gòu)但不同參數(shù)的Classifier則預(yù)測各個標(biāo)簽的相關(guān)性。

至于損失函數(shù),我們選擇了Binary Cross Entropy (BCE)。更具體的設(shè)置請參見原文。

03

實驗

我們在兩個常用的多標(biāo)簽文本分類數(shù)據(jù)集Arxiv Acadmeic Paper Dataset(AAPD)及Reuters Corpus Volum I (RCV1-V2)上進行了實驗。AAPD數(shù)據(jù)量更少、標(biāo)簽密度更大,分類難度更大。評價指標(biāo)則選用了hamming loss,micro-precision,micro-recall及micro-F1;其中hamming loss越低越好,其他則越高越好。至于基準(zhǔn)模型,我們選用了經(jīng)典模型如BR、CC、LP,也有性能優(yōu)越的seq2seq模型如CNN-RNN、SGM,還有其他一些表現(xiàn)卓越的多標(biāo)簽文本分類模型如LSAN,之外也將seq2set納入進來作為比較。seq2set使用強化學(xué)習(xí)算法來緩解seq2seq模型對于標(biāo)簽順序的依賴程度。同時,為了驗證ML-Reasoner在不同文本編碼器上能帶來的性能提升,我們分別使用了CNN、LSTM及BERT作為ML-Reasoner框架中的Text Encoder模塊。實驗結(jié)果如表2所示。

表2 ML-Reasoner及基準(zhǔn)模型在兩個數(shù)據(jù)集上的性能

2dc99416-603e-11eb-8b86-12bb97331649.png

從表中可以看出,ML-Reasoner在兩個數(shù)據(jù)集上均達到了SOTA水準(zhǔn),且在三種不同文本編碼器上都能帶來顯著提升。

為了驗證ML-Reasoner可以完全避免對標(biāo)簽順序的依賴,我們隨機打亂AAPD數(shù)據(jù)集的標(biāo)簽順序,并進行了測試;各個模型的性能如表3所示。從表中可以看到,CC及seq2seq模型的性能受標(biāo)簽順序的劇烈影響;seq2set可以顯著緩解seq2seq的問題;而ML-Reasoner則完全不受標(biāo)簽順序的影響。

表3各模型在標(biāo)簽打亂的AAPD數(shù)據(jù)集上的性能

31375fac-603e-11eb-8b86-12bb97331649.png

我們也通過燒蝕實驗(見圖3),確定了推理機制確實是性能提升的關(guān)鍵。

317b44e2-603e-11eb-8b86-12bb97331649.png

圖3 ML-Reasoner(T=1,2,5)及CNN-Round(T=1,2,5)在AAPD測試集上的性能雷達圖

我們也探究了迭代次數(shù)對模型性能的影響,由圖4可知,進行了一次推理就可以帶來顯著提升;而推理次數(shù)的再次提高并不能帶來更多的提升。這可能是因為模型及數(shù)據(jù)集的選擇導(dǎo)致的。

31f4a364-603e-11eb-8b86-12bb97331649.png

圖4不同迭代輪數(shù)下的ML-Reasoner在AAPD測試集上的性能雷達圖

為了進一步理解Reasoner發(fā)揮作用的機制,我們從數(shù)據(jù)集中選取了一些典型示例(見表4)。在第一個例子中,模型通過推理將相關(guān)標(biāo)簽math.OC添上;模型處理第二個例子時,則將無關(guān)標(biāo)簽cs.LO剔除;有時添加與刪除的動作也會同時發(fā)生(見第三個例子)。當(dāng)然,推理偶爾也會使預(yù)測結(jié)果變差(見第四、第五個例子)。

表4 AAPD測試集中一些由于推理機制預(yù)測結(jié)果出現(xiàn)變化的實例

32b5cb2a-603e-11eb-8b86-12bb97331649.png

為了驗證上述例子的變化確實是因為考慮了標(biāo)簽之間的相關(guān)性,我們進一步統(tǒng)計模型在添加或刪除某個標(biāo)簽時與其他標(biāo)簽的共現(xiàn)頻率。從圖5中,可以觀察到模型往往在添加某個標(biāo)簽時,其共現(xiàn)頻率(第二行)與真實共現(xiàn)頻率接近(第一行);而刪除某個標(biāo)簽時,其共現(xiàn)頻率(第三行)與真實共現(xiàn)頻率(第一行)則相差較遠。

3333a39c-603e-11eb-8b86-12bb97331649.png

圖5 AAPD標(biāo)簽的共現(xiàn)頻率圖

04

結(jié)論

在本文中,我們提出了算法ML-Reasoner。該算法可以同時預(yù)測所有標(biāo)簽進而避免了對標(biāo)簽順序的依賴;之外,他通過新穎的推理機制利用了標(biāo)簽之間的高階關(guān)系。實驗結(jié)果表明了ML-Reasoner在捕獲標(biāo)簽依賴之間的有效性;進一步的分析驗證了其確實未對標(biāo)簽順序產(chǎn)生依賴。一些經(jīng)驗性試驗也揭示了該算法發(fā)揮作用的機制。由于ML-Reasoner未顯式利用標(biāo)簽之間的關(guān)系,如層次結(jié)構(gòu)等,如何將這些信息納入考慮是值得進一步探索的。

原文標(biāo)題:【IPM2020】一種處理多標(biāo)簽文本分類的新穎推理機制

文章出處:【微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1813

    文章

    49708

    瀏覽量

    261239
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    66

    文章

    8540

    瀏覽量

    136207
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    491

    瀏覽量

    23182

原文標(biāo)題:【IPM2020】一種處理多標(biāo)簽文本分類的新穎推理機制

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    發(fā)布元服務(wù)配置應(yīng)用分類標(biāo)簽和資質(zhì)信息(僅分發(fā)手表設(shè)備)

    ,參考華為應(yīng)用市場應(yīng)用分類規(guī)則,選擇元服務(wù)分類。 5.點擊“管理標(biāo)簽”,選擇元服務(wù)的標(biāo)簽。 最多可以選擇5個標(biāo)簽,且必須設(shè)置其中
    發(fā)表于 10-30 17:47

    發(fā)布元服務(wù)配置應(yīng)用分類、標(biāo)簽和資質(zhì)信息

    ”按鈕查看已上傳的資質(zhì)文件。 9.資質(zhì)與標(biāo)簽審核通過后,點擊“添加標(biāo)簽”,選擇已生效的標(biāo)簽。選擇多個標(biāo)簽時,需點擊”設(shè)置主標(biāo)簽”,將其中
    發(fā)表于 10-29 16:47

    RFID電子標(biāo)簽的工作原理與分類

    RFID電子標(biāo)簽如同物品的"數(shù)字身份證",是一種精巧的數(shù)據(jù)載體。它不僅能像海綿吸水般存儲海量信息,還能敏銳地感知讀寫器發(fā)出的電磁場信號,如同位訓(xùn)練有素的舞者,在接收到指令后立即
    的頭像 發(fā)表于 09-24 11:30 ?979次閱讀
    RFID電子<b class='flag-5'>標(biāo)簽</b>的工作原理與<b class='flag-5'>分類</b>

    米爾RK3576部署端側(cè)模態(tài)輪對話,6TOPS算力驅(qū)動30億參數(shù)LLM

    加載 → 圖片預(yù)處理 → 用戶交互 → 推理輸出”的核心流程,支持圖文體的模態(tài)對話,適配輪問答、視覺問答等典型場景。 具體運行
    發(fā)表于 09-05 17:25

    RFID標(biāo)簽在垃圾分類的應(yīng)用

    二、RFID標(biāo)簽在垃圾分類中的優(yōu)勢高效率:RFID可以快速批量讀取垃圾信息,大幅縮短操作時間,提高垃圾分類效率。準(zhǔn)確性:RFID減少了人工操作的錯誤率,提高了垃圾分類的準(zhǔn)確性和可靠性。
    的頭像 發(fā)表于 07-31 16:48 ?615次閱讀
    RFID<b class='flag-5'>標(biāo)簽</b>在垃圾<b class='flag-5'>分類</b>的應(yīng)用

    【「DeepSeek 核心技術(shù)揭秘」閱讀體驗】書籍介紹+第章讀后心得

    分析(趨勢分析、數(shù)據(jù)可視化 ),輔助決策流程 自然語言處理 :語言理解(文本分類、意圖識別等 )、翻譯(多語言 )、轉(zhuǎn)換(文體、格式轉(zhuǎn)換 )、文本生成(文案、故事、詩歌文學(xué)創(chuàng)作 ),處理
    發(fā)表于 07-17 11:59

    信而泰×DeepSeek:AI推理引擎驅(qū)動網(wǎng)絡(luò)智能診斷邁向 “自愈”時代

    學(xué)習(xí)、大規(guī)模數(shù)據(jù)分析等前沿技術(shù)。DeepSeek-R1具備卓越的邏輯推理、模態(tài)分析(文本/圖像/語音)和實時交互能力,能夠高效處理代碼生成、復(fù)雜問題求解、跨模態(tài)學(xué)習(xí)等高階任務(wù)。憑借其
    發(fā)表于 07-16 15:29

    大模型推理顯存和計算量估計方法研究

    方法。 、引言 大模型推理是指在已知輸入數(shù)據(jù)的情況下,通過深度學(xué)習(xí)模型進行預(yù)測或分類的過程。然而,大模型的推理過程對顯存和計算資源的需求較高,這給實際應(yīng)用帶來了以下挑戰(zhàn): 顯存不足:
    發(fā)表于 07-03 19:43

    詳解 LLM 推理模型的現(xiàn)狀

    領(lǐng)域的最新研究進展,特別是自DeepSeekR1發(fā)布后興起的推理時間計算擴展相關(guān)內(nèi)容。在LLM中實施和改進推理簡單來說,基于LLM的推理模型是一種旨在通過生成中間
    的頭像 發(fā)表于 04-03 12:09 ?1216次閱讀
    詳解 LLM <b class='flag-5'>推理</b>模型的現(xiàn)狀

    如何使用攝像頭作為OpenVINO?推理的輸入?

    無法確定如何使用攝像頭作為OpenVINO?推理的輸入
    發(fā)表于 03-06 07:30

    DeepSeek推出NSA機制,加速長上下文訓(xùn)練與推理

    近日,DeepSeek公司宣布推出一種全新的稀疏注意力機制——NSA(Native Sparse Attention)。據(jù)DeepSeek介紹,NSA旨在與現(xiàn)代硬件實現(xiàn)高度致,并且具備本機可訓(xùn)練
    的頭像 發(fā)表于 02-19 14:01 ?898次閱讀

    文詳解視覺語言模型

    視覺語言模型(VLM)是一種模態(tài)、生成式 AI 模型,能夠理解和處理視頻、圖像和文本。
    的頭像 發(fā)表于 02-12 11:13 ?3176次閱讀
    <b class='flag-5'>一</b>文詳解視覺語言模型

    k230如何將yolo分類視頻流推理后的視頻結(jié)果保存到本地?

    請問k230如何將yolo分類視頻流推理后的視頻結(jié)果保存到本地?
    發(fā)表于 02-08 08:09

    如何使用自然語言處理分析文本數(shù)據(jù)

    媒體、新聞報道、用戶評論等)收集你感興趣的文本數(shù)據(jù)。 數(shù)據(jù)清洗 :去除無關(guān)字符(如HTML標(biāo)簽、特殊符號等),確保文本數(shù)據(jù)干凈且致。 2. 預(yù)處理
    的頭像 發(fā)表于 12-05 15:27 ?2370次閱讀

    文看懂RFID電子標(biāo)簽的特點及應(yīng)用

    ,是與讀寫器起構(gòu)成 RFID 系統(tǒng)的硬件主體。 ? RFID 系統(tǒng)基本組成包括RFID電子標(biāo)簽、讀寫器、射頻天線、應(yīng)用軟件,是一種利用射頻識別技術(shù)進行數(shù)據(jù)采集與傳輸?shù)淖詣幼R別系統(tǒng)。 ? 在智能制造大趨勢下,RFID作為
    的頭像 發(fā)表于 12-02 10:09 ?5076次閱讀
    <b class='flag-5'>一</b>文看懂RFID電子<b class='flag-5'>標(biāo)簽</b>的特點及應(yīng)用