chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

語義分割在三元組關(guān)系抽取中的作用是什么?

深度學習自然語言處理 ? 來源:浙大KG ? 作者:陳想,張寧豫 ? 2021-06-26 11:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1. 總述

關(guān)系抽取(Relation Extraction, RE)是從純文本中提取未知關(guān)系事實,是自然語言處理領(lǐng)域非常重要的一項任務(wù)。過去的關(guān)系抽取方法主要將注意力集中于抽取單個實體對在某個句子內(nèi)反映的關(guān)系,然而單句關(guān)系抽取在實踐中受到不可避免的限制:在真實場景如醫(yī)療、金融文檔中,有許多關(guān)系事實是蘊含在文檔中不同句子的實體對中的,且文檔中的多個實體之間,往往存在復雜的相互關(guān)系。如下圖所示:

7063c540-d5ea-11eb-9e57-12bb97331649.png

圖中包括了文章中的三個關(guān)系事實(從文檔標注的諸多關(guān)系事實中采樣得到),其中涉及這些關(guān)系事實的命名實體用彩色著色,其它命名實體用下劃線標出。與句子級相比,文檔級關(guān)系抽取中的文本要長得多,并且包含更多的實體, 這使得文檔級關(guān)系抽取更加困難。其中(Maryland, country, US)、(Baltimore, located_in, Maryland) 和 (Eldersburg, located_in, Maryland)三組triples中的實體在同一個句子中的出現(xiàn),這種句內(nèi)關(guān)系相對容易識別。然而,跨句實體之間的關(guān)系識別更具挑戰(zhàn)性, 例如,關(guān)系事實(Baltimore,country,U.S.)和(Eldersburg,country,U.S.)中的相關(guān)實體并沒有出現(xiàn)在同一個句子中并且需要長距離依賴, 具體來說,多個三元組之間的相互依賴是有利的,可以為實體多的情況下的關(guān)系分類提供指導。例如,如果句內(nèi)關(guān)系 (Maryland, country, US) 已被識別,則{US} 不可能處于任何 person-social 關(guān)系中,例如"is the father of." 此外,根據(jù){Eldersburg} 位于{Maryland} 和{Maryland} 屬于{US} 的三元組,我們可以推斷{Eldersburg} 屬于{US} . 如上所述,每個關(guān)系三元組可以向同一文本中的其他關(guān)系三元組提供信息。

文檔級關(guān)系抽取主要面臨以下三個挑戰(zhàn):

1.相同關(guān)系會出現(xiàn)在多個句子。在文檔級關(guān)系抽取中,單一關(guān)系可能出現(xiàn)在多個輸入的句子中,因此模型需要依賴多個句子進行關(guān)系推斷。

2.相同實體會具有多個指稱。在復雜的文檔中,同一個實體具有各種各樣的指稱,因此模型需要聚合不同的指稱學習實體表示。

3.不同三元組之間需要信息交互。文檔包含多個實體關(guān)系三元組,不同的實體關(guān)系三元組之間存在邏輯關(guān)聯(lián),因此模型需要捕捉同一篇文檔中三元組之間的信息交互。

然而先前的基于graph或基于transformer的模型僅單獨地使用實體對,而未考慮關(guān)系三元組之間的全局信息。本文創(chuàng)新性地提出DocuNet模型,首次將文檔級關(guān)系抽取任務(wù)類比于計算機視覺中的語義分割任務(wù)。DocuNet模型利用編碼器模塊捕獲實體的上下文信息,并采用U-shaped分割模塊在image-style特征圖上捕獲三元組之間的全局相互依賴性,通過預(yù)測實體級關(guān)系矩陣來捕獲local和global信息以增強文檔級關(guān)系抽取。實驗結(jié)果表明,我們的方法可以在三個基準數(shù)據(jù)集DocRED,CDR和GDA上獲得SOTA性能。

2.方法

71415ebe-d5ea-11eb-9e57-12bb97331649.png

具體來說,DocuNet模型分為三個模塊:

(1)Encoder Module

我們將triple抽取視為sequence-to-sequence的任務(wù),以更好地對實體和關(guān)系之間的交叉依賴進行建模。我們將輸入文本和輸出三元組定義為源和目標序列。源序列僅由輸入句子的標記組成,例如“[CLS] The United States President Trump was raised in the borough of Queens ...[SEP]”。我們連接由特殊標記 ”< e >” 和 ”< /e >”分隔的每個實體/關(guān)系的三元組作為目標序列。

715264d4-d5ea-11eb-9e57-12bb97331649.png

717d912c-d5ea-11eb-9e57-12bb97331649.png

71962354-d5ea-11eb-9e57-12bb97331649.png

其中是實體感知注意力的注意力權(quán)重,對于矩陣中的每個實體,它們的相關(guān)性由一維特征向量捕獲。

(2)U-shaped Segmentation Module

三元組之間存在局部語義依賴,語義分割中的CNN可以促進感受野中實體對之間的局部信息交換。文檔級RE還需要全局信息來推斷三元組之間的關(guān)系,語義分割模塊中的下采樣和上采樣可以擴大當前實體pair對嵌入的感受野,能夠增強全局隱式推理:

71c4a83c-d5ea-11eb-9e57-12bb97331649.png

我們把實體級關(guān)系矩陣作為D-channel圖像,我們將文檔級關(guān)系預(yù)測公式化為像素級掩碼, 其中N是從所有數(shù)據(jù)集樣本中統(tǒng)計出的最大實體數(shù)。

(3)Classification Module

給定實體pair的特征表示和實體級關(guān)系矩陣Y,我們使用前饋神經(jīng)網(wǎng)絡(luò)將它們映射到隱藏表示z。然后,我們通過雙線性函數(shù)獲得實體pair之間關(guān)系預(yù)測的概率表示如下:

71e0f366-d5ea-11eb-9e57-12bb97331649.png

由于觀察到 RE 存在不平衡關(guān)系分布(許多實體對具有 NA 的關(guān)系),我們引入了一種平衡的 softmax 方法進行訓練:

71ff3740-d5ea-11eb-9e57-12bb97331649.png

3. 實驗

(1)數(shù)據(jù)集

為了驗證DocuNet的效果,我們在三個文檔級關(guān)系抽取數(shù)據(jù)集上評測,數(shù)據(jù)集具體分析如下所示:

72270bd0-d5ea-11eb-9e57-12bb97331649.png

(2)實驗結(jié)果

由下面實驗結(jié)果表明,DocuNet比以往的文檔級關(guān)系抽取方法效果更佳。

7233d586-d5ea-11eb-9e57-12bb97331649.png

7241ef04-d5ea-11eb-9e57-12bb97331649.png

4. 總結(jié)與展望

在本文中,我們把文檔級關(guān)系抽取任務(wù)看作語義分割來求解,直接給出了如何將 UNet 應(yīng)用于文檔級 RE 的解決方案,實驗結(jié)果表明U-shaped模塊能有效得理解局部上下文和全局相互依賴性。目前結(jié)果表明U-shaped模塊中的卷積學習了 RE 三元組之間的相互作用,但仍U-shaped模塊的推理作用尚是隱式的,未來對U-shaped模塊進一步的可視化分析有助于我們加強理解其是如何做三元組之間推理的。我們的方法證實了語義分割模塊在處理RE中有效性,仍需要更多的工作去探索U-shaped模塊在如aspect-based sentiment analysis等其他nlp任務(wù)上的應(yīng)用。

責任編輯:lq6
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 語義
    +關(guān)注

    關(guān)注

    0

    文章

    22

    瀏覽量

    8795
  • 文本
    +關(guān)注

    關(guān)注

    0

    文章

    119

    瀏覽量

    17759

原文標題:【IJCAI2021】長文本知識抽?。夯谡Z義分割的文檔級三元組關(guān)系抽取

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    MOSFET在電源控制作用是什么?

    請問MOSFET在電源控制作用是什么?
    發(fā)表于 12-16 06:37

    【NPU實戰(zhàn)】在迅為RK3588上玩轉(zhuǎn)YOLOv8:目標檢測與語義分割一站式部署指南

    【NPU實戰(zhàn)】在迅為RK3588上玩轉(zhuǎn)YOLOv8:目標檢測與語義分割一站式部署指南
    的頭像 發(fā)表于 12-12 14:30 ?5414次閱讀
    【NPU實戰(zhàn)】在迅為RK3588上玩轉(zhuǎn)YOLOv8:目標檢測與<b class='flag-5'>語義</b><b class='flag-5'>分割</b>一站式部署指南

    請問NUC505 的 VMID 引腳的作用是什么?如何設(shè)計電路圖?

    NUC505 的 VMID 引腳的作用是什么?如何設(shè)計電路圖?
    發(fā)表于 08-28 06:26

    北京迅為itop-3588開發(fā)板NPU例程測試deeplabv3 語義分割

    北京迅為itop-3588開發(fā)板NPU例程測試deeplabv3 語義分割
    的頭像 發(fā)表于 07-22 15:51 ?844次閱讀
    北京迅為itop-3588開發(fā)板NPU例程測試deeplabv3 <b class='flag-5'>語義</b><b class='flag-5'>分割</b>

    進行濾波器的諧波測試,它的作用是什么呢

    進行濾波器的諧波測試,它的作用是什么呢,沒理解?測個頻點來看它超過規(guī)定值沒
    發(fā)表于 06-23 19:19

    OCAD應(yīng)用:四連續(xù)變焦系統(tǒng)

    連續(xù)變焦系統(tǒng)是在三連續(xù)變焦系統(tǒng)的基礎(chǔ)上增加了一個變焦組分擔系統(tǒng)像面位移,由兩個變焦
    發(fā)表于 05-20 08:49

    DLPC3439的的3DR引腳的作用是什么?

    請問一下 1.DLPC3439的的3DR引腳的作用是什么? 2.該引腳該如何配置?只要給它輸入一個高電平就可以了嗎? 3.對于雙控制器來說,是不是主控制器和從控制器的3DR引腳配置相同? 非常感謝
    發(fā)表于 02-24 08:28

    三元鋰8650電池 3.7V7.4V12V2.5AH10AH機器人智能設(shè)備專用電池

    三元鋰 8650 電池憑借其多樣的電壓和容量選擇、卓越的性能優(yōu)勢以及廣泛的應(yīng)用場景,成為了機器人智能設(shè)備的理想電源。隨著科技的不斷進步,相信這款電池還將在更多領(lǐng)域發(fā)揮重要作用,推動
    的頭像 發(fā)表于 02-06 16:23 ?955次閱讀
    <b class='flag-5'>三元</b>鋰8650電池<b class='flag-5'>組</b> 3.7V7.4V12V2.5AH10AH機器人智能設(shè)備專用電池

    ads1174的DIN腳的功能說是Daisy-chain,它的作用是什么?

    我看的ads1174的DIN腳的功能說是Daisy-chain,也就是雛菊鏈的意思,請問他的作用是什么?求解答
    發(fā)表于 02-05 06:23

    鋰離子電池和三元鋰電池,誰更安全?

    鋰離子電池和三元鋰電池在安全性上各有優(yōu)劣。鋰離子電池憑借其成熟的技術(shù)和穩(wěn)定的性能,在安全性方面有著堅實的保障;三元鋰電池雖然在能量密度上表現(xiàn)突出,但在安全性上仍需不斷改進和完善。隨著科技的不斷進步
    的頭像 發(fā)表于 01-23 15:19 ?1429次閱讀
    鋰離子電池和<b class='flag-5'>三元</b>鋰電池,誰更安全?

    必知!三元鋰電池的正確充電法,讓你的設(shè)備壽命倍增

    掌握三元鋰電池這些充電門道,不僅能延長電池服役期,還能時刻保障設(shè)備電力滿滿,為我們的便捷生活持續(xù)護航。從今天起,改變充電習慣,讓電池陪你更久!
    的頭像 發(fā)表于 01-17 16:57 ?4395次閱讀
    必知!<b class='flag-5'>三元</b>鋰電池的正確充電法,讓你的設(shè)備壽命倍增

    三元鋰電池和磷酸鐵鋰電池哪個好?看完這篇你就懂了!

    三元鋰電池和磷酸鐵鋰電池哪個好?看完這篇你就懂了!
    的頭像 發(fā)表于 01-17 16:53 ?3475次閱讀

    水庫太陽能監(jiān)控供電 太陽能板 三元鋰電池

    水庫太陽能監(jiān)控供電系統(tǒng)的太陽能板和三元鋰電池相互配合,以清潔、可再生的太陽能為能源,擺脫了對傳統(tǒng)市電的依賴,降低了長期運營成本,提高了監(jiān)控系統(tǒng)的可靠性和靈活性,是水庫現(xiàn)代化管理中一項極具價值的技術(shù)應(yīng)用,為保障水庫的安全穩(wěn)定運行貢獻著重要力量,也為水利設(shè)施的智能化發(fā)展提供
    的頭像 發(fā)表于 12-31 16:40 ?913次閱讀
    水庫太陽能監(jiān)控供電 太陽能板 <b class='flag-5'>三元</b>鋰電池

    特斯拉三元鋰電池真實壽命,鋰電池電芯批發(fā) 朗凱威

    特斯拉三元鋰電池的壽命受多種因素影響,但在正常使用和維護下,其壽命可以相當長。特斯拉官方提供的數(shù)據(jù)和質(zhì)保政策也為車主提供了額外的保障。然而,為了延長電池的使用壽命,車主仍然需要注意使用方式、充電循環(huán)次數(shù)以及定期維護等方面的問題。
    的頭像 發(fā)表于 12-30 09:40 ?1462次閱讀
    特斯拉<b class='flag-5'>三元</b>鋰電池真實壽命,鋰電池電芯批發(fā) 朗凱威

    朗凱威鋰電池 電池 動力鋰電池批發(fā)三元鋰電池跑了 30 萬還能用嗎?答案來了!

    三元鋰電池在行駛 30 萬公里后,雖然性能有所下降,但仍有可能繼續(xù)使用,或者通過合理的回收利用方式,實現(xiàn)其剩余價值。
    的頭像 發(fā)表于 12-30 09:36 ?749次閱讀
    朗凱威鋰電池 電池<b class='flag-5'>組</b> 動力鋰電池批發(fā)<b class='flag-5'>三元</b>鋰電池跑了 30 萬還能用嗎?答案來了!