論文:A Span-Based Model for Joint Overlapped and DiscontinuousNamed Entity Recognition
鏈接:https://aclanthology.org/2021.acl-long.372.pdf
代碼:https://github.com/foxlf823/sodner
提取摘要
由于普通的NER問題被研究的透透的了,本文主要解決一種稍微復(fù)雜些問題:一種帶有覆蓋和不連續(xù)(Overlapped and Discontinuous)的命名實體識別任務(wù)。
而在這兩者研究上來說,前人只是要么解決覆蓋問題,要么解決不連續(xù)問題,但是本文提出一種聯(lián)合解決這兩種問題的span-based方法。
span-based方法昨天也提到過了,所以關(guān)于實體+關(guān)系抽取的任務(wù)都可以嘗試。
本文通過兩個步驟構(gòu)建模型:
通過列舉所有可能的text span來識別出實體片段(entity fragments);
在這些entity fragments上預(yù)測是兩種關(guān)系overlapping or succession。
這樣,我們不僅可以識別Discontinuous的實體,同時也可以對Overlapped的實體進行雙重檢查。
通過上述方法輕松將NER裝換成RE(Relation Extraction)任務(wù)。最終實驗在很多數(shù)據(jù)集上比如CLEF, GENIA andACE05上展現(xiàn)除了很強勁的性能。
該模型的步驟為
input一方面通過pre-train模型獲取word rep,一方面通過dependency parsing獲取句法信息;
GCN集合LSTM的輸出和句法輸入,得到syntax-enhanced的新的表達;
獲取所有span表示;
通過兩個MLP預(yù)測span是否為實體,以及實體時間是否有關(guān)系;
最后每個loss加上權(quán)重,為最終優(yōu)化目標。
關(guān)鍵分類
AGGCN用來融入句法信息
attention-guided GCN (AGGCN)比普通GCN要強一些,所以這里選用該方法。傳統(tǒng)的GCN:

而AGGCN就是使用self-attention,替換以前的鄰接矩陣A,最后通過線性方法將multi head生成的結(jié)果合一:

Span的表示
解碼先預(yù)測實體片段,再預(yù)測關(guān)系。

解碼公式
損失計算
實驗實驗數(shù)據(jù)介紹
在數(shù)據(jù)上的表現(xiàn)
在其他數(shù)據(jù)上與前人的對比,雖然性能不如SOTA,但是這種Span-based方式和SOTA差不了多少,是個新穎的想法。
責(zé)任編輯:haq
-
模型
+關(guān)注
關(guān)注
1文章
3645瀏覽量
51685 -
nlp
+關(guān)注
關(guān)注
1文章
491瀏覽量
23182
原文標題:ACL2021 | 一種巧妙解決NER覆蓋和不連續(xù)問題的方法
文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
Neway微波的高頻覆蓋
安康電纜外徑測量儀:連續(xù)測線不漂移 廠家直供價更低
如何解決羅德與施瓦茨示波器新探頭量程不匹配問題
87233系列USB連續(xù)波功率探頭
各位大佬好 請問如何能將DAQ采集程序內(nèi)部波形圖的數(shù)連續(xù)送給DAQ輸出程序?
STM32 LCD驅(qū)動段碼屏,SEG1-SEG8可以不連續(xù)配置嗎?
DLPC3478投影灰階圖像出現(xiàn)條紋,亮度不連續(xù)的原因?
DLP6500FYE投影時灰度不連續(xù)是怎么回事?
采用AD62P29進行模數(shù)轉(zhuǎn)換,對正弦信號的轉(zhuǎn)換后的波形不連續(xù),會出現(xiàn)臺階?為什么?
使用ADS1158進入自動掃描模式,對REF GAIN TEMP VCC OFFSET內(nèi)部信息進行AD轉(zhuǎn)換,如何連續(xù)讀???
通過ADS5421 EVM采樣正弦波轉(zhuǎn)換輸出的數(shù)據(jù)有偏置,負值到正值的連接點處不連續(xù),怎么解決?
ADS1282無法實現(xiàn)轉(zhuǎn)換速率為128K的連續(xù)轉(zhuǎn)換與數(shù)據(jù)讀取,如何解決?
使用ADS1293EVM接心電模擬器做測試,波形不連續(xù)中間有跳躍是什么原因?
磁極是如何解決磁集成產(chǎn)品電磁干擾的?

如何解決NER覆蓋和不連續(xù)問題
評論