chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

細(xì)解讀關(guān)系抽取SOTA論文

深度學(xué)習(xí)自然語(yǔ)言處理 ? 來(lái)源:深度學(xué)習(xí)自然語(yǔ)言處理 ? 作者:廠妹 ? 2021-02-10 17:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文主要詳細(xì)解讀關(guān)系抽取SOTA論文Two are Better than One:Joint Entity and Relation Extraction with Table-Sequence Encoders[1], 順帶簡(jiǎn)要介紹關(guān)系抽取的背景,方便完全不了解童鞋。

信息抽取

我們說(shuō)的信息抽取一般是指從文本數(shù)據(jù)中抽取特定數(shù)據(jù)結(jié)構(gòu)信息的一種手段。對(duì)于不同結(jié)構(gòu)形式的數(shù)據(jù)如結(jié)構(gòu)化文本,半結(jié)構(gòu)化文本,自由文本,有各自對(duì)應(yīng)的方案,其中從自由文本中抽取難度最大??傊?,我們的目的是希望在海量文本中,快速抽出我們關(guān)注的事實(shí)。

了解信息抽取必須要知道關(guān)系抽取。

關(guān)系抽取

大部分情況下,我們喜歡用三元組的數(shù)據(jù)結(jié)構(gòu)來(lái)描述抽取到的信息

三元組

三元組的表達(dá)能力非常豐富,幾乎所有事情都可以自然或者強(qiáng)行的表達(dá)成三元組,比如隨便一句”今天天氣真冷“ 表達(dá)為天氣-狀態(tài)-冷。

三元組與后續(xù)的知識(shí)圖譜工作非常適配,如Neo4j等圖數(shù)據(jù)庫(kù)就是以三元組為存儲(chǔ)單位,圖譜的查詢推斷等工具使用三元組比普通的關(guān)系型數(shù)據(jù)庫(kù)來(lái)的方便的多。

三元組千千萬(wàn),我應(yīng)該怎么抽?

Schema

當(dāng)我們拿到一個(gè)信息抽取的任務(wù),需要明確我們抽取的是什么,”今天天氣真冷“,我們要抽的天氣的狀態(tài)天氣-狀態(tài)-冷,而非今天-氣候-冷(雖然也可以這樣抽),因此一般會(huì)首先定義好我們要抽取的數(shù)據(jù)結(jié)構(gòu)模式shcema, 會(huì)確定謂詞以及主語(yǔ)并與的類型

一個(gè)三元組schema的例子,其中Subject_type代表主語(yǔ)類型,Predicate是謂詞,Object_type指賓語(yǔ)類型:

Subject_type:人物 Predicate:出生地 Object_type:地點(diǎn)

確定了schema,我們一般如何抽取呢?

常規(guī)RE方案

目前主流關(guān)系抽取一般兩種解決方法

pipline兩步走:將關(guān)系抽取分解為NER任務(wù)和分類任務(wù),NER任務(wù)標(biāo)注主語(yǔ)或賓語(yǔ),分類主要針對(duì)定義的schema中的有限個(gè)謂詞進(jìn)行分類。根據(jù)具體任務(wù)不同,有些可能是兩步走或者三步走,pipline任務(wù)的順序先分類還是先標(biāo)注也會(huì)有差異

Pipline優(yōu)勢(shì):每一步分別針對(duì)各個(gè)任務(wù)進(jìn)行,表征是task-specific, 相對(duì)來(lái)說(shuō)精度較高

Pipline缺陷:- 任務(wù)有順序會(huì)存在誤差傳遞問(wèn)題,即在預(yù)測(cè)時(shí)下一步任務(wù)會(huì)受上一步誤差影響,而在訓(xùn)練階段沒(méi)有這種誤差,因此存在訓(xùn)練和預(yù)測(cè)階段的gap- 分開的任務(wù)在一句話中多個(gè)實(shí)體關(guān)系時(shí),比較難解決實(shí)體和關(guān)系的對(duì)應(yīng)問(wèn)題,以及重疊關(guān)系

joint learning:joint learing可以理解為采用多任務(wù)的方式,同時(shí)進(jìn)行NER和關(guān)系分類任務(wù), 在眾多joint learning中最出眾的是采用tabel filled 方式,即任務(wù)的輸出是filled一張有text-sequence構(gòu)成的表,在表中的位置表達(dá)除了詞與詞的連接,該位置的標(biāo)注則標(biāo)出了謂語(yǔ)(如下圖)

abb062f2-603d-11eb-8b86-12bb97331649.jpg

優(yōu)勢(shì):1. 兩個(gè)任務(wù)的表征有交互作用可能輔助任務(wù)的學(xué)習(xí)2. 不用訓(xùn)練多個(gè)模型,一個(gè)模型解決問(wèn)題,不存在訓(xùn)練與預(yù)測(cè)時(shí)的gap

缺陷:1. 兩個(gè)任務(wù)的表征可能沖突,影響任務(wù)效果2. 解決了主謂賓之間的對(duì)應(yīng)關(guān)系,無(wú)法解決重疊問(wèn)題3. Fill table本質(zhì)仍然是轉(zhuǎn)成sequence來(lái)fill,未能充分利用table結(jié)構(gòu)信息(下文會(huì)解釋)

下面重點(diǎn)解讀table fill方式的一篇SOTA,解決了joint learning的多任務(wù)表征沖突以及為利用table結(jié)構(gòu)信息

RE with Table Sequence

終于來(lái)到本篇的主題啦,為了解決一般filled table的問(wèn)題, 作者提出table-sequence encoder的方法,分別對(duì)table和sequence做表征,本文的最大貢獻(xiàn)在于

分別對(duì)table和sequence做表征(encoder),并設(shè)計(jì)了一個(gè)Table-Guided Attention來(lái)對(duì)table和sequence進(jìn)行交互,這樣即不會(huì)完全共享表征導(dǎo)致對(duì)不同的任務(wù)表征沖突,也不會(huì)丟失表征的相互指導(dǎo)作用

在table encoder中采用多維GRU來(lái)捕獲更多的句子結(jié)構(gòu)信息

在架構(gòu)上table encoder和 sequence encoder多層交互

ac3efaee-603d-11eb-8b86-12bb97331649.jpg

下面仔細(xì)介紹各個(gè)部分,看看它是如何神奇做到SOTA的

Text Embedder

在上圖的結(jié)構(gòu)圖中,Text Embedder采用類似FLAT分別做了基于lstm的char()和word(),以及基于bert的word ()作為預(yù)訓(xùn)練的embedding ,并拼接起來(lái)

圖中

Table Encoder

整個(gè)Table Encoder部分由多個(gè)Table Encoding的單元組成,每個(gè)Encoding單元的輸入分別是起始輸入,對(duì)應(yīng)senquence結(jié)構(gòu)的輸入,以及上一個(gè)Tabel Encoding單元的輸出,Table Encoding 采用MDRNN結(jié)構(gòu)提取輸入的特征信息,作者在這選擇MDGRU(多維度GRU),tabel結(jié)構(gòu)本身有2維,加上前后層實(shí)際有4維,但是層的維度信息單向流動(dòng),實(shí)際上是只用到了3個(gè)方向()

aca0965a-603d-11eb-8b86-12bb97331649.jpg

如圖所示,是來(lái)自sequence的輸入,作者分別測(cè)了使用所有方向和分別使用幾個(gè)方向,發(fā)現(xiàn)上圖中a,c效果類似,這種多維GRU全面的考慮了整個(gè)table的結(jié)構(gòu)信息,即一個(gè)詞的狀態(tài)跟其他所有詞的狀態(tài)相關(guān),并且受其他詞的不同程度的影響,這種影響程度由GRU門控機(jī)制控制

Sequence Encoder

sequence Encoder 也由多個(gè)sequence encoding夠成,sequence encoding結(jié)構(gòu)直接采用transformer中的encoder

acd7cc4c-603d-11eb-8b86-12bb97331649.jpg

只不過(guò)將其中的self attention替換為table-guide attention,這種attention的改造非常巧妙,能更好捕捉word-word之間的關(guān)系

ad42628c-603d-11eb-8b86-12bb97331649.jpg

正常的dot attention如上圖

Table-Guided attention具體來(lái)說(shuō):

為參數(shù)矩陣

采用加性

是table encoder中的table的隱藏節(jié)點(diǎn),該節(jié)點(diǎn)由多個(gè)方向的經(jīng)過(guò)GRU編碼得到,不管是哪個(gè)方向它的來(lái)源始終是由構(gòu)造而來(lái),理論上是可以由擬合而來(lái),因此這里直接由 來(lái)代替 ,也就是這個(gè)attention,其實(shí)是計(jì)算了table 結(jié)構(gòu)中各個(gè)位置對(duì)該的權(quán)重,是一個(gè)四面八方attention

剩下就是transform中正常的LayerNorm 和殘差結(jié)構(gòu)了

輸出和loss

輸出比較常規(guī),loss采用常規(guī)

輸出:

loss:

實(shí)驗(yàn) and 效果

作者在各個(gè)數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),對(duì)比各個(gè)目前SOTA分別有一定的提高,且時(shí)效果最佳,模型參數(shù)量不到5M,要什么自行車,附上開源地址[2],作者的代碼與論文在attention計(jì)算有一丟丟不一致,但是并不影響效果

ad840d72-603d-11eb-8b86-12bb97331649.jpg

責(zé)任編輯:xj

原文標(biāo)題:關(guān)系抽取一步到位!

文章出處:【微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5589

    瀏覽量

    123880
  • 自然語(yǔ)言
    +關(guān)注

    關(guān)注

    1

    文章

    292

    瀏覽量

    13913
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    491

    瀏覽量

    23182

原文標(biāo)題:關(guān)系抽取一步到位!

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    產(chǎn)品在工程打樣階段極細(xì)同軸線束的標(biāo)準(zhǔn)型號(hào)選型指南

    在工程打樣階段,極細(xì)同軸線束的標(biāo)準(zhǔn)型號(hào)選型,不僅關(guān)系到高速信號(hào)完整性,還影響項(xiàng)目推進(jìn)效率。掌握阻抗、線徑、帶寬與端接方式等核心指標(biāo),合理利用標(biāo)準(zhǔn)型號(hào)資源,可以讓研發(fā)團(tuán)隊(duì)更快從驗(yàn)證走向量產(chǎn)。
    的頭像 發(fā)表于 10-03 16:55 ?1003次閱讀
    產(chǎn)品在工程打樣階段極<b class='flag-5'>細(xì)</b>同軸線束的標(biāo)準(zhǔn)型號(hào)選型指南

    USB3.1傳輸能用極細(xì)同軸線嗎?要注意哪些選型誤區(qū)?

    細(xì)同軸線束確實(shí)能夠用于 USB3.1 的高速傳輸,但前提是做好完整的設(shè)計(jì)與驗(yàn)證工作。若能避開“線越細(xì)越好”這樣的誤區(qū),合理平衡電氣性能、機(jī)械性能與工藝可行性,才能真正發(fā)揮極細(xì)同軸線束在小型化、高速化產(chǎn)品中的優(yōu)勢(shì)。
    的頭像 發(fā)表于 09-26 14:28 ?1313次閱讀
    USB3.1傳輸能用極<b class='flag-5'>細(xì)</b>同軸線嗎?要注意哪些選型誤區(qū)?

    細(xì)同軸線與傳統(tǒng)射頻同軸線區(qū)別有哪些?

    細(xì)同軸線束與傳統(tǒng)射頻同軸線的差別,主要體現(xiàn)在尺寸、傳輸信號(hào)類型、應(yīng)用場(chǎng)景和加工難度上。前者更多服務(wù)于高速數(shù)字信號(hào)傳輸,強(qiáng)調(diào)小型化與高速性;后者則立足于射頻通信,強(qiáng)調(diào)穩(wěn)定性與低損耗。兩者并非簡(jiǎn)單的替代關(guān)系,而是在不同應(yīng)用需求下各有優(yōu)勢(shì)。
    的頭像 發(fā)表于 09-18 15:52 ?1456次閱讀
    極<b class='flag-5'>細(xì)</b>同軸線與傳統(tǒng)射頻同軸線區(qū)別有哪些?

    細(xì)同軸線束能做到多細(xì)?揭秘高速互連中的極限工藝

    細(xì)同軸線束不僅可以做到“極細(xì)”,而且在這種微型化設(shè)計(jì)中,還能保持高速信號(hào)的完整性與傳輸穩(wěn)定性。它已經(jīng)成為現(xiàn)代電子產(chǎn)品小型化和高性能化的幕后功臣。隨著材料與工藝的不斷提升,未來(lái)的極細(xì)同軸線束必將突破更小的直徑極限,并在更多前沿應(yīng)
    的頭像 發(fā)表于 09-08 15:02 ?1149次閱讀
    極<b class='flag-5'>細(xì)</b>同軸線束能做到多<b class='flag-5'>細(xì)</b>?揭秘高速互連中的極限工藝

    細(xì)同軸線束和柔性電纜(FPC/FFC)的區(qū)別

    細(xì)同軸線束和柔性電纜并不是相互替代的關(guān)系,而是針對(duì)不同應(yīng)用需求的兩種解決方案:前者在高速、抗干擾、可靠性方面表現(xiàn)突出;后者則在柔性布線和低成本方面具有優(yōu)勢(shì)。工程師在設(shè)計(jì)時(shí),應(yīng)根據(jù)系統(tǒng)的速率需求、空間布局和成本預(yù)算做出合理選擇。
    的頭像 發(fā)表于 09-06 15:45 ?1061次閱讀
    極<b class='flag-5'>細(xì)</b>同軸線束和柔性電纜(FPC/FFC)的區(qū)別

    HarmonyOSAI編程智能代碼解讀

    CodeGenie > Explain Code,開始解讀當(dāng)前代碼內(nèi)容。 說(shuō)明 最多支持解讀20000字符以內(nèi)的代碼片段。 使用該功能需先完成CodeGenie登錄授權(quán)。 本文主要從參考引用自HarmonyOS官方文檔
    發(fā)表于 09-02 16:29

    AURIX tc367通過(guò) MCU SOTA 更新邏輯 IC 閃存是否可行?

    你好專家:我的用例是 MCU 通過(guò) SPI 連接到邏輯 IC,邏輯 IC 連接到 8MB 閃存,但 MCU PFLASH 大小為 2MB,通過(guò) MCU SOTA 更新邏輯 IC 閃存是否可行?
    發(fā)表于 08-11 06:36

    求助,關(guān)于TC387使能以及配置SOTA 中一些問(wèn)題求解

    你好, 之前我拿到貴司給一個(gè)demo,里面有一些使能以及配置SWAP的代碼, 這里有些疑問(wèn) 問(wèn)題1. 判斷SOTA功能是否生效,demo中使用的是 SCU_STMEM1中的bit位, 代碼如下
    發(fā)表于 08-08 07:31

    SPI協(xié)議,寄存器解讀

    最近在學(xué)習(xí)SPI協(xié)議,對(duì)寄存器操作不是特別熟練。發(fā)帖希望有大佬能從寄存器角度提供幫助,幫忙指導(dǎo)根據(jù)手冊(cè)去解讀協(xié)議。有償。
    發(fā)表于 05-22 20:08

    老板必修課:如何用NotebookLM 在上下班路上吃透一篇科技論文

    常必要的,這有助于我們理解技術(shù)邊界,更好地定義產(chǎn)品并做出更精準(zhǔn)的投資決策。 一,使用NotebookLM,隨身解讀科技論文 我經(jīng)常使用的解讀科技論文的工具是Notebook,只需要把科
    的頭像 發(fā)表于 05-07 16:13 ?547次閱讀
    老板必修課:如何用NotebookLM 在上下班路上吃透一篇科技<b class='flag-5'>論文</b>?

    AFE5801細(xì)調(diào)增益不起作用的原因?怎么解決?

    采用STATIC PGA模式配置AFE5801芯片時(shí),99【2:0】為細(xì)調(diào)增益配置單元,寫如0代表0dB,寫入7代表0.875dB。但是寫入0和7時(shí)采集到的數(shù)據(jù)大小沒(méi)有發(fā)生變化,不知道為什么?
    發(fā)表于 01-24 08:00

    AFE5801細(xì)調(diào)增益不起作用是什么原因?qū)е碌模?/a>

    采用STATIC PGA模式配置AFE5801芯片時(shí),99【2:0】為細(xì)調(diào)增益配置單元,99地址單元分別寫的是24\'h990009和24\'h99000f,分別對(duì)應(yīng)著0.125dB
    發(fā)表于 01-24 07:01

    Mamba入局圖像復(fù)原,達(dá)成新SOTA

    MambaIRv2,更高性能、更高效率!另外還有ACM MM 2024上的Freqmamba方法,在圖像去雨任務(wù)中取得了SOTA性能! 顯然,這種基于Mamba的方法在圖像復(fù)原領(lǐng)域,比基于CNN
    的頭像 發(fā)表于 12-30 18:09 ?1595次閱讀
    Mamba入局圖像復(fù)原,達(dá)成新<b class='flag-5'>SOTA</b>

    MOSFET參數(shù)解讀

    SGT-MOSFET各項(xiàng)參數(shù)解讀
    發(fā)表于 12-30 14:15 ?1次下載

    請(qǐng)問(wèn)AMC1203文檔中的OSC過(guò)采樣率和sinc3濾波器中的抽取率是不是同一個(gè)概念?

    1、請(qǐng)問(wèn)AMC1203文檔中的OSC過(guò)采樣率和sinc3濾波器中的抽取率是不是同一個(gè)概念?同為256? 2、抽取率是不是MCLK時(shí)鐘的分頻因子? 3、Combining the ADS1202
    發(fā)表于 12-16 06:42