chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NLP事件抽取綜述之挑戰(zhàn)與展望

深度學(xué)習(xí)自然語(yǔ)言處理 ? 來(lái)源:深度學(xué)習(xí)自然語(yǔ)言處理 ? 作者:lucy ? 2021-01-18 16:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本系列文章主要分享近年來(lái)事件抽取方法總結(jié),包括中文事件抽取、開(kāi)放域事件抽取、事件數(shù)據(jù)生成、跨語(yǔ)言事件抽取、小樣本事件抽取、零樣本事件抽取等。主要包括以下幾大部分:

定義(Define)

綜述(Survey)

模型(Models)

數(shù)據(jù)集(Datasets)

挑戰(zhàn)與展望(Future Research Challenges)

Github地址:https://github.com/xiaoqian19940510/Event-Extraction

Few-shot or zero-shot

2020

Meta-Learning with Dynamic-Memory-Based Prototypical Network for Few-Shot Event Detection, WSDM 2020[1]

事件檢測(cè)(ED)是事件抽取的一個(gè)子任務(wù),涉及到識(shí)別觸發(fā)器和對(duì)提到的事件進(jìn)行分類。現(xiàn)有的方法主要依賴于監(jiān)督學(xué)習(xí),并需要大規(guī)模的標(biāo)記事件數(shù)據(jù)集,不幸的是,這些數(shù)據(jù)集在許多實(shí)際應(yīng)用中并不容易獲得。

在這篇論文中,考慮并重新制定了一個(gè)有限標(biāo)記數(shù)據(jù)的教育任務(wù)作為一個(gè)少樣本的學(xué)習(xí)問(wèn)題。提出了一個(gè)基于動(dòng)態(tài)記憶的原型網(wǎng)絡(luò)(DMB-PN),它利用動(dòng)態(tài)記憶網(wǎng)絡(luò)(DMN)不僅可以更好地學(xué)習(xí)事件類型的原型,還可以為提到事件生成更健壯的句子編碼。傳統(tǒng)的原型網(wǎng)絡(luò)只使用一次事件提及次數(shù),通過(guò)平均計(jì)算事件原型,與之不同的是,由于DMNs的多跳機(jī)制,我們的模型更加健壯,能夠從多次提及的事件中提取上下文信息。

實(shí)驗(yàn)表明,與一系列基線模型相比,DMB-PN不僅能更好地解決樣本稀缺問(wèn)題,而且在事件類型變化較大、實(shí)例數(shù)量極小的情況下性能更強(qiáng)。

Exploiting the Matching Information in the Support Set for Few Shot Event Classification, PAKDD 2020[2]

現(xiàn)有的事件分類(EC)的工作主要集中在傳統(tǒng)的監(jiān)督學(xué)習(xí)設(shè)置,其中模型無(wú)法提取的事件提到新的/看不見(jiàn)的事件類型。盡管EC模型能夠?qū)⑵洳僮鲾U(kuò)展到未觀察到的事件類型,但在這一領(lǐng)域還沒(méi)有研究過(guò)少樣本習(xí)。為了填補(bǔ)這一空白,在本研究中,我們調(diào)查了在少樣本學(xué)習(xí)設(shè)置下的事件分類。

針對(duì)這一問(wèn)題們提出了一種新的訓(xùn)練方法,即在訓(xùn)練過(guò)程中擴(kuò)展利用支持集。特別地,除了將查詢示例與用于訓(xùn)練的支持集中的示例進(jìn)行匹配之外,我們還試圖進(jìn)一步匹配支持集中本身的示例。該方法為模型提供了更多的訓(xùn)練信息,可應(yīng)用于各種基于度量學(xué)習(xí)的少樣本學(xué)習(xí)方法。我們?cè)趦蓚€(gè)EC基準(zhǔn)數(shù)據(jù)集上的廣泛實(shí)驗(yàn)表明,該方法可以提高事件分類準(zhǔn)確率達(dá)10%

Towards Few-Shot Event Mention Retrieval : An Evaluation Framework and A Siamese Network Approach, LREC 2020[3]

在大量的文本中自動(dòng)分析事件對(duì)于情境意識(shí)和決策是至關(guān)重要的。以前的方法將事件抽取視為“一刀切”,并預(yù)先定義了本體。所建立的提取模型用于提取本體中的類型。這些方法不能很容易地適應(yīng)新的事件類型或感興趣的新領(lǐng)域。

為了滿足以事件為中心的個(gè)性化信息需求,本文引入了少樣本事件提及檢索(EMR)任務(wù):給定一個(gè)由少量事件提及組成的用戶提供的查詢,返回在語(yǔ)料庫(kù)中找到的相關(guān)事件提及。這個(gè)公式支持“按例查詢”,這大大降低了指定以事件為中心的信息需求的門(mén)檻。檢索設(shè)置還支持模糊搜索。我們提供了一個(gè)利用現(xiàn)有事件數(shù)據(jù)集(如ACE)的評(píng)估框架。

2018

Zero-Shot Transfer Learning for Event Extraction, ACL 2018[4]

以前的大多數(shù)事件抽取研究都嚴(yán)重依賴于從標(biāo)注的事件提及中衍生出來(lái)的特性,因此如果不進(jìn)行注釋就不能應(yīng)用于新的事件類型。在這項(xiàng)工作中,我們重新審視事件抽取,并將其建模為一個(gè)接地問(wèn)題。我們?cè)O(shè)計(jì)一個(gè)Transfer的神經(jīng)結(jié)構(gòu),映射事件提及和類型共同到一個(gè)共享語(yǔ)義空間使用神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和組成,每個(gè)事件提及的類型可以由所有候選人的最親密的類型。

通過(guò)利用一組現(xiàn)有事件類型可用的手工標(biāo)注和現(xiàn)有事件本體,我們的框架應(yīng)用于新的事件類型而不需要額外的標(biāo)注。在現(xiàn)有事件類型(如ACE、ERE)和新事件類型(如FrameNet)上的實(shí)驗(yàn)證明了我們的方法的有效性。對(duì)于23種新的事件類型,我們的zero-shot框架實(shí)現(xiàn)了可以與最先進(jìn)的監(jiān)督模型相比較的性能,該模型是從500個(gè)事件提及的標(biāo)注數(shù)據(jù)中訓(xùn)練出來(lái)的。

中文事件抽取

2019

Doc2EDAG: An End-to-End Document-level Framework for Chinese Financial Event Extraction, EMNLP2019 [5]

任務(wù): 與其他研究不同,該任務(wù)被定義為:事件框架填充:也就是論元檢測(cè)+識(shí)別

不同點(diǎn)有:不需要觸發(fā)詞檢測(cè);文檔級(jí)的抽取;論元有重疊

動(dòng)機(jī): 解碼論元需要一定順序,先后有關(guān)

主要思想:發(fā)布數(shù)據(jù)集,具有特性:arguments-scattering and multi-event,先對(duì)事件是否觸發(fā)進(jìn)行預(yù)測(cè);然后,按照一定順序先后來(lái)分別解碼論元

數(shù)據(jù)集:ten years (2008-2018) Chinese financial announcements:ChFinAnn;

Cross-lingual Structure Transfer for Relation and Event Extraction, EMNLP 2019) [6]

動(dòng)機(jī):從資源不足以及注釋不足的語(yǔ)料庫(kù)中進(jìn)行復(fù)雜語(yǔ)義結(jié)構(gòu)的識(shí)別(例如事件和實(shí)體關(guān)系)是很困難的,這已經(jīng)變成了一個(gè)很有挑戰(zhàn)性的信息抽取任務(wù)。

14b9ee86-58b3-11eb-8b86-12bb97331649.png

主要思想:通過(guò)使用卷積神經(jīng)網(wǎng)絡(luò),將所有實(shí)體信息片段、事件觸發(fā)詞、事件背景放入一個(gè)復(fù)雜的、結(jié)構(gòu)化的多語(yǔ)言公共空間,然后我們可以從源語(yǔ)言注釋中訓(xùn)練一個(gè)事件抽取器,并將它應(yīng)用于目標(biāo)語(yǔ)言。

數(shù)據(jù)集:ACE2005

2018

DCFFE: A Document-level Chinese Financial Event Extraction System based on Automatically Labelled Training Data, ACL 2018 [7]

動(dòng)機(jī):在某些特定領(lǐng)域,例如金融,醫(yī)療和司法領(lǐng)域,由于數(shù)據(jù)標(biāo)記過(guò)程的成本很高,因此標(biāo)記數(shù)據(jù)不足。此外,當(dāng)前大多數(shù)方法都關(guān)注于從一個(gè)句子中提取事件,但通常在一個(gè)文檔中,一個(gè)事件由多個(gè)句子表示。我們提出一種方法來(lái)解決這個(gè)問(wèn)題。

1583dfe8-58b3-11eb-8b86-12bb97331649.png

主要思想:我們提供了一個(gè)名為DCFEE的框架,該框架可以從被自動(dòng)標(biāo)記過(guò)的訓(xùn)練數(shù)據(jù)中抽取文檔級(jí)事件。我們使用一個(gè)序列標(biāo)記模型來(lái)自動(dòng)抽取句子級(jí)事件,并且提出了一個(gè)關(guān)鍵事件檢測(cè)模型和一個(gè)論元填充策略,進(jìn)而從文檔中提取整個(gè)事件。

數(shù)據(jù)集:Chinese financial event dataset

2016

A convolution bilstm neural network model for chinese event extraction, NLPCC 2016 [8]

動(dòng)機(jī):在中文的事件抽取中,以前的方法非常依賴復(fù)雜的特征工程以及復(fù)雜的自然語(yǔ)言處理工具。本文提出了一種卷積雙向LSTM神經(jīng)網(wǎng)絡(luò),該神經(jīng)網(wǎng)絡(luò)將LSTM和CNN結(jié)合起來(lái),可以捕獲句子級(jí)和詞匯信息,而無(wú)需任何人為提供的特征。

162c5c5e-58b3-11eb-8b86-12bb97331649.png

主要思想:首先使用雙向LSTM將整個(gè)句子中的單詞的語(yǔ)義編碼為句子級(jí)特征,不做任何句法分析。然后,我們利用卷積神經(jīng)網(wǎng)絡(luò)來(lái)捕獲突出的局部詞法特征來(lái)消除觸發(fā)器的歧義,整個(gè)過(guò)程無(wú)需來(lái)自POS標(biāo)簽或NER的任何幫助。

數(shù)據(jù)集:ACE2005, KBP2017 Corpus

半監(jiān)督遠(yuǎn)程監(jiān)督事件抽取

2018

Semi-supervised event extraction with paraphrase clusters, NAACL 2018[9]

動(dòng)機(jī):受監(jiān)督的事件抽取系統(tǒng)由于缺乏可用的訓(xùn)練數(shù)據(jù)而其準(zhǔn)確性受到限制。我們提出了一種通過(guò)對(duì)額外的訓(xùn)練數(shù)據(jù)進(jìn)行重復(fù)抽樣來(lái)使事件抽取系統(tǒng)自我訓(xùn)練的方法。這種方法避免了訓(xùn)練數(shù)據(jù)缺乏導(dǎo)致的問(wèn)題。

主要思想:我們通過(guò)詳細(xì)的事件描述自動(dòng)生成被標(biāo)記過(guò)的訓(xùn)練數(shù)據(jù),然后用這些數(shù)據(jù)進(jìn)行事件觸發(fā)詞識(shí)別。具體來(lái)說(shuō),首先,將提及該事件的片段聚集在一起,形成一個(gè)聚類。然后用每個(gè)聚類中的簡(jiǎn)單示例來(lái)給整個(gè)聚類貼一個(gè)標(biāo)簽。最后,我們將新示例與原始訓(xùn)練集結(jié)合在一起,重新訓(xùn)練事件抽取器。

數(shù)據(jù)集:ACE2005, TAC-KBP 2015

開(kāi)放域事件抽取

2020

Open-domain Event Extraction and Embedding for Natural Gas Market Prediction, arxiv 2020

動(dòng)機(jī):以前的方法大多數(shù)都將價(jià)格視為可推斷的時(shí)間序列,那些分析價(jià)格和新聞之間的關(guān)系的方法是根據(jù)公共新聞數(shù)據(jù)集相應(yīng)地修正其價(jià)格數(shù)據(jù)、手動(dòng)注釋標(biāo)題或使用現(xiàn)成的工具。與現(xiàn)成的工具相比,我們的事件抽取方法不僅可以檢測(cè)現(xiàn)象的發(fā)生,還可以由公共來(lái)源檢測(cè)變化的歸因和特征。

166db014-58b3-11eb-8b86-12bb97331649.png

主要思想:依靠公共新聞API的標(biāo)題,我們提出一種方法來(lái)過(guò)濾不相關(guān)的標(biāo)題并初步進(jìn)行事件抽取。價(jià)格和文本均被反饋到3D卷積神經(jīng)網(wǎng)絡(luò),以學(xué)習(xí)事件與市場(chǎng)動(dòng)向之間的相關(guān)性。

數(shù)據(jù)集:NYTf、FT、TG

2019

Open Domain Event Extraction Using Neural Latent Variable Models, ACL2019 [10]

動(dòng)機(jī):我們考慮開(kāi)放領(lǐng)域的事件抽取,即從新聞集群中抽取無(wú)約束的事件類型的任務(wù)。結(jié)果表明,與最新的事件模式歸納方法相比,這種無(wú)監(jiān)督模型具有更好的性能。

主要思想:以前關(guān)于生成模式歸納的研究非常依賴人工生成的指標(biāo)特征,而我們引入了由神經(jīng)網(wǎng)絡(luò)產(chǎn)生的潛在變量來(lái)獲得更好的表示能力。我們?cè)O(shè)計(jì)了一種新穎的圖模型,該模型具有潛在的事件類型矢量以及實(shí)體的文本冗余特征,而這些潛在的事件類型矢量來(lái)自全局參數(shù)化正態(tài)分布的新聞聚類。

數(shù)據(jù)集:GNBusiness

Reporting the unreported: Event Extraction for Analyzing the Local Representation of Hate Crimes, EMNLP 2019[11]

動(dòng)機(jī):將事件抽取和多實(shí)例學(xué)習(xí)應(yīng)用于本地新聞文章的語(yǔ)料庫(kù),可以用來(lái)預(yù)測(cè)仇恨犯罪的發(fā)生。

171110ba-58b3-11eb-8b86-12bb97331649.png

主要思想:根據(jù)是否為仇恨罪標(biāo)記每篇文章的任務(wù)被定義為多實(shí)例學(xué)習(xí)(MIL)問(wèn)題。我們通過(guò)使用文章所有句子中嵌入的信息來(lái)確定文章是否報(bào)道了仇恨犯罪。在一組帶注釋的文章上測(cè)試了模型之后,我們將被訓(xùn)練過(guò)的模型應(yīng)用于聯(lián)邦調(diào)查局沒(méi)有報(bào)道過(guò)的城市,并對(duì)這些城市中仇恨犯罪的發(fā)生頻率進(jìn)行了下界估計(jì)。

多語(yǔ)言事件抽取

2019

Cross-lingual Structure Transfer for Relation and Event Extraction, EMNLP 2019) [12]

動(dòng)機(jī):從資源不足以及標(biāo)注不足的語(yǔ)料庫(kù)中進(jìn)行復(fù)雜語(yǔ)義結(jié)構(gòu)的識(shí)別(例如事件和實(shí)體關(guān)系)是很困難的,這已經(jīng)變成了一個(gè)很有挑戰(zhàn)性的信息抽取任務(wù)。

1781107c-58b3-11eb-8b86-12bb97331649.png

主要思想:通過(guò)使用卷積神經(jīng)網(wǎng)絡(luò),將所有實(shí)體信息片段、事件觸發(fā)詞、事件背景放入一個(gè)復(fù)雜的、結(jié)構(gòu)化的多語(yǔ)言公共空間,然后我們可以從源語(yǔ)言標(biāo)注數(shù)據(jù)中訓(xùn)練一個(gè)事件抽取器,并將它應(yīng)用于目標(biāo)語(yǔ)言。

數(shù)據(jù)集:ACE2005

2016

Leveraging Multilingual Training for Limited Resource Event Extraction, COLING 2016[13]

動(dòng)機(jī):迄今為止,利用跨語(yǔ)言訓(xùn)練來(lái)提高性能的工作非常有限。因此我們提出了一種新的事件抽取方法。

17ac1790-58b3-11eb-8b86-12bb97331649.png

主要思想:在本文中,我們提出了一種新穎的跨語(yǔ)言事件抽取方法,該方法可在多種語(yǔ)言上進(jìn)行訓(xùn)練,并利用依賴于語(yǔ)言的特征和不依賴于語(yǔ)言的特征來(lái)提高性能。使用這種系統(tǒng),我們旨在同時(shí)利用可用的多語(yǔ)言資源(帶標(biāo)注的數(shù)據(jù)和引入的特征)來(lái)克服目標(biāo)語(yǔ)言中的標(biāo)注數(shù)據(jù)稀缺性問(wèn)題。從經(jīng)驗(yàn)上我們認(rèn)為,我們的方法可以極大地提高單語(yǔ)系統(tǒng)對(duì)中文事件論元提取任務(wù)的性能。與現(xiàn)有工作相比,我們的方法是新穎的,我們不依賴于使用高質(zhì)量的機(jī)器翻譯的或手動(dòng)對(duì)齊的文檔,這因?yàn)檫@種需求對(duì)于給定的目標(biāo)語(yǔ)言可能是無(wú)法滿足的。

數(shù)據(jù)集:ACE2005

數(shù)據(jù)生成

2019

Exploring Pre-trained Language Models for Event Extraction and Geenration, ACL 2019[14]

動(dòng)機(jī):ACE事件抽取任務(wù)的傳統(tǒng)方法通常依賴被手動(dòng)標(biāo)注過(guò)的數(shù)據(jù),但是手動(dòng)標(biāo)注數(shù)據(jù)非常耗費(fèi)精力并且也限制了數(shù)據(jù)集的規(guī)模。我們提出了一個(gè)方法來(lái)克服這個(gè)問(wèn)題。

17db0abe-58b3-11eb-8b86-12bb97331649.png

主要思想:本文提出了一個(gè)基于預(yù)訓(xùn)練語(yǔ)言模型的框架,該框架包含一個(gè)作為基礎(chǔ)的事件抽取模型以及一種生成被標(biāo)注事件的方法。我們提出的事件抽取模型由觸發(fā)詞抽取器和論元抽取器組成,論元抽取器用前者的結(jié)果進(jìn)行推理。此外,我們根據(jù)角色的重要性對(duì)損失函數(shù)重新進(jìn)行加權(quán),從而提高了論元抽取器的性能。

數(shù)據(jù)集:ACE2005

Open Event Extraction from Online Text using a Generative Adversarial Network, EMNLP 2019 [15]

動(dòng)機(jī):提取開(kāi)放域事件的結(jié)構(gòu)化表示的方法通常假定文檔中的所有單詞都是從單個(gè)事件中生成的,因此他們通常不適用于諸如新聞文章之類的長(zhǎng)文本。為了解決這些局限性,我們提出了一種基于生成對(duì)抗網(wǎng)絡(luò)的事件抽取模型,稱為對(duì)抗神經(jīng)事件模型(AEM)。

181a27c6-58b3-11eb-8b86-12bb97331649.png

主要思想:AEM使用Dirichlet先驗(yàn)對(duì)事件建模,并使用生成器網(wǎng)絡(luò)來(lái)捕獲潛在事件的模式。鑒別符用于區(qū)分原始文檔和從潛在事件中重建的文檔。鑒別器的副產(chǎn)品是鑒別器網(wǎng)絡(luò)生成的特征允許事件抽取的可視化。

數(shù)據(jù)集:Twitter, and Google datasets

Reporting the unreported: Event Extraction for Analyzing the Local Representation of Hate Crimes, EMNLP 2019[16]

動(dòng)機(jī):將事件抽取和多實(shí)例學(xué)習(xí)應(yīng)用于本地新聞文章的語(yǔ)料庫(kù),可以用來(lái)預(yù)測(cè)仇恨犯罪的發(fā)生。

1aabba90-58b3-11eb-8b86-12bb97331649.png

主要思想:根據(jù)是否為仇恨罪標(biāo)記每篇文章的任務(wù)被定義為多實(shí)例學(xué)習(xí)(MIL)問(wèn)題。我們通過(guò)使用文章所有句子中嵌入的信息來(lái)確定文章是否報(bào)道了仇恨犯罪。在一組帶標(biāo)注數(shù)據(jù)的文章上測(cè)試了模型之后,我們將被訓(xùn)練過(guò)的模型應(yīng)用于聯(lián)邦調(diào)查局沒(méi)有報(bào)道過(guò)的城市,并對(duì)這些城市中仇恨犯罪的發(fā)生頻率進(jìn)行了下界估計(jì)。

2017

Automatically Labeled Data Generation for Large Scale Event Extraction, ACL 2017 [17]

動(dòng)機(jī):手動(dòng)標(biāo)記的訓(xùn)練數(shù)據(jù)成本太高,事件類型覆蓋率低且規(guī)模有限,這種監(jiān)督的方法很難從知識(shí)庫(kù)中抽取大量事件。

1b0153ba-58b3-11eb-8b86-12bb97331649.png

主要思想:1)提出了一種按重要性排列論元并且為每種事件類型選取關(guān)鍵論元或代表論元方法。2)僅僅使用關(guān)鍵論元來(lái)標(biāo)注事件,并找出關(guān)鍵詞。3)用外部語(yǔ)言知識(shí)庫(kù)FrameNet來(lái)過(guò)濾噪聲觸發(fā)詞并且擴(kuò)展觸發(fā)詞庫(kù)。

數(shù)據(jù)集:ACE2005

閱讀理解式事件抽取

2020

Event Extraction by Answering (Almost) Natural Questions, EMNLP 2020 [18]

主要思想:事件抽取問(wèn)題需要檢測(cè)事件觸發(fā)并提取其相應(yīng)的參數(shù)。事件參數(shù)抽取中的現(xiàn)有工作通常嚴(yán)重依賴于作為預(yù)處理/并發(fā)步驟的實(shí)體識(shí)別,這導(dǎo)致了眾所周知的錯(cuò)誤傳播問(wèn)題。為了避免這個(gè)問(wèn)題,我們引入了一種新的事件抽取范式,將其形式化為問(wèn)答(QA)任務(wù),該任務(wù)以端到端的方式抽取事件論元。實(shí)證結(jié)果表明,我們的框架優(yōu)于現(xiàn)有的方法; 此外,它還能夠抽取訓(xùn)練時(shí)未見(jiàn)角色的事件論元。

1b60a3ec-58b3-11eb-8b86-12bb97331649.png

數(shù)據(jù)集:ACE

2019

Neural Cross-Lingual Event Detection with Minimal Parallel Resources, EMNLP2019[19]

標(biāo)注數(shù)據(jù)的缺乏給事件檢測(cè)帶來(lái)了巨大的挑戰(zhàn)。跨語(yǔ)言教育旨在解決這一挑戰(zhàn),通過(guò)在不同語(yǔ)言之間傳遞知識(shí),提高性能。但是,以前用于ED的跨語(yǔ)言方法對(duì)并行資源有嚴(yán)重依賴,這可能限制了它們的適用性。

在本文中,我們提出了一種跨語(yǔ)言的ED的新方法,證明了并行資源的最小依賴性。具體來(lái)說(shuō),為了構(gòu)建不同語(yǔ)言之間的詞匯映射,我們?cè)O(shè)計(jì)了一種上下文依賴的翻譯方法; 為了解決語(yǔ)序差異問(wèn)題,我們提出了一種用于多語(yǔ)言聯(lián)合訓(xùn)練的共享句法順序事件檢測(cè)器。通過(guò)在兩個(gè)標(biāo)準(zhǔn)數(shù)據(jù)集上的大量實(shí)驗(yàn),研究了該方法的有效性。實(shí)證結(jié)果表明,我們的方法在執(zhí)行不同方向的跨語(yǔ)言遷移和解決注解不足的情況下是有效的。

Entity-relation extraction as multi-turn question answering, ACL2019[20]

提出了一種新的實(shí)體-關(guān)系抽取的范式。我們把任務(wù)作為多向問(wèn)答的問(wèn)題,也就是說(shuō),實(shí)體和關(guān)系的抽取轉(zhuǎn)化為確定答案的任務(wù)。這種多輪QA形式化有幾個(gè)關(guān)鍵的優(yōu)點(diǎn):

首先,問(wèn)題查詢?yōu)槲覀兿胍R(shí)別的實(shí)體/關(guān)系類編碼重要的信息;

其次,QA為實(shí)體與關(guān)系的聯(lián)合建模提供了一種自然的方式;

第三,它允許我們開(kāi)發(fā)良好的機(jī)器閱讀理解(MRC)模型。

在ACE和CoNLL04語(yǔ)料庫(kù)上的實(shí)驗(yàn)表明,提出的范式顯著優(yōu)于之前的最佳模型。我們能夠在所有的ACE04、ACE05和CoNLL04數(shù)據(jù)集上獲得最先進(jìn)的結(jié)果,將這三個(gè)數(shù)據(jù)集上的SOTA結(jié)果分別提高到49.4(+1.0)、60.2(+0.6)和68.9(+2.1)。此外,我們構(gòu)建了一個(gè)新開(kāi)發(fā)的中文數(shù)據(jù)集恢復(fù),它需要多步推理來(lái)構(gòu)建實(shí)體依賴關(guān)系,而不是以往數(shù)據(jù)集的三元提取的單步依賴關(guān)系抽取。提出的多輪質(zhì)量保證模型在簡(jiǎn)歷數(shù)據(jù)集上也取得了最好的效果。

2017

Zero-shot relation extraction via reading comprehension, CoNLL 2017[21]

通過(guò)將一個(gè)或多個(gè)自然語(yǔ)言問(wèn)題與每個(gè)關(guān)系槽相關(guān)聯(lián),可以將關(guān)系提取簡(jiǎn)化為回答簡(jiǎn)單的閱讀理解問(wèn)題。減少有幾個(gè)好處:我們可以

學(xué)習(xí)relation-extraction模型通過(guò)擴(kuò)展最近神經(jīng)閱讀理解技術(shù)

為這些模型相結(jié)合構(gòu)建大訓(xùn)練集關(guān)系專用眾包與遠(yuǎn)方監(jiān)督問(wèn)題,

zero-shot學(xué)習(xí)通過(guò)提取新關(guān)系類型,只有指定的測(cè)試時(shí)間,我們沒(méi)有標(biāo)簽的訓(xùn)練例子。

在Wikipedia填槽任務(wù)上的實(shí)驗(yàn)表明,該方法可以高精度地將已知關(guān)系類型的新問(wèn)題概括為新問(wèn)題,并且在較低的精度水平下,Zero-shot地概括為不可見(jiàn)的關(guān)系類型是可能的,這為該任務(wù)的未來(lái)工作設(shè)置了標(biāo)準(zhǔn)。

責(zé)任編輯:xj

原文標(biāo)題:超全必讀!NLP 事件抽取綜述(下)

文章出處:【微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 事件
    +關(guān)注

    關(guān)注

    0

    文章

    12

    瀏覽量

    10078
  • 自然語(yǔ)言處理
    +關(guān)注

    關(guān)注

    1

    文章

    628

    瀏覽量

    14165
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    490

    瀏覽量

    22629

原文標(biāo)題:超全必讀!NLP 事件抽取綜述(下)

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    太陽(yáng)能電池金屬化印刷技術(shù)綜述:絲網(wǎng)印刷優(yōu)化、質(zhì)量控制與新興技術(shù)展望

    本文全面綜述了硅太陽(yáng)能電池金屬化印刷技術(shù),重點(diǎn)關(guān)注絲網(wǎng)印刷的演進(jìn)、核心挑戰(zhàn)(如細(xì)線柵線、銀漿消耗優(yōu)化)、漿料流變學(xué)作用,并通過(guò)美能網(wǎng)版智能檢測(cè)儀進(jìn)行質(zhì)量控制,確保印刷過(guò)程的精度。最后對(duì)比新興技術(shù)(如
    的頭像 發(fā)表于 07-04 09:04 ?317次閱讀
    太陽(yáng)能電池金屬化印刷技術(shù)<b class='flag-5'>綜述</b>:絲網(wǎng)印刷優(yōu)化、質(zhì)量控制與新興技術(shù)<b class='flag-5'>展望</b>

    永磁同步電機(jī)參數(shù)辨識(shí)研究綜述

    參數(shù)辨識(shí)的技術(shù)成果,再對(duì) PMSM 辨識(shí)方法進(jìn)行歸納和比較,最后,揭示 PMSM 參數(shù)辨識(shí)過(guò)程中亟需關(guān)注的研究問(wèn)題并 展望其未來(lái)的發(fā)展方向,旨在實(shí)現(xiàn) PMSM 系統(tǒng)的高效可靠運(yùn)行。純分享帖,點(diǎn)擊附件查看全文*附件:永磁同步電機(jī)參數(shù)辨識(shí)研究綜述.pdf
    發(fā)表于 03-26 14:13

    無(wú)橋PFC變換器綜述

    拓?fù)涞陌l(fā)展歷程進(jìn)行了全面綜述,并將無(wú)橋 PFC 變換器拓?fù)浜铣煞桨阜譃槿箢?,分別進(jìn)行了詳細(xì)介紹。最后,給出了無(wú)橋變換器拓?fù)涞陌l(fā)展方向。 關(guān)鍵詞:無(wú)橋 PFC 變換器;雙極性增益;Boost 變換器
    發(fā)表于 03-13 13:50

    輪轂電機(jī)驅(qū)動(dòng)電動(dòng)汽車垂向動(dòng)力學(xué)控制研究綜述

    電動(dòng)汽車的懸架控制策略進(jìn)行歸納和總結(jié),最后對(duì)輪轂電機(jī)驅(qū)動(dòng)電動(dòng)汽車未 來(lái)的發(fā)展進(jìn)行展望。下載附件參閱本期全文?。。?附件:輪轂電機(jī)驅(qū)動(dòng)電動(dòng)汽車垂向動(dòng)力學(xué)控制研究綜述.docx
    發(fā)表于 03-07 15:21

    PID發(fā)展趨勢(shì)分析

    摘要:文檔中簡(jiǎn)要回顧了 PID 控制器的發(fā)展歷程,綜述了 PID 控制的基礎(chǔ)理論。對(duì) PID 控制今后的發(fā)展進(jìn)行了展望。重點(diǎn)介紹了比例、積分、微分基本控制規(guī)律,及其優(yōu)、缺點(diǎn)。關(guān)鍵詞:PID 控制器 PID 控制 控制 回顧 展望
    發(fā)表于 02-26 15:27

    光伏產(chǎn)業(yè)的挑戰(zhàn)與未來(lái)展望:砥礪前行,迎接光明

    盡管光伏產(chǎn)業(yè)取得了顯著的成就,但在發(fā)展過(guò)程中仍面臨著一系列挑戰(zhàn)。技術(shù)創(chuàng)新是推動(dòng)光伏產(chǎn)業(yè)持續(xù)發(fā)展的關(guān)鍵。雖然目前光伏電池的轉(zhuǎn)換效率不斷提高,但與理論極限仍有一定差距,需要進(jìn)一步研發(fā)新型光伏材料和技術(shù)
    的頭像 發(fā)表于 01-23 14:31 ?472次閱讀

    ADS1299用ADS采集數(shù)據(jù),ADS可以不抽取看原始得數(shù)據(jù)嗎?

    1.用ADS采集數(shù)據(jù),將時(shí)域的數(shù)據(jù)進(jìn)行FFT變換,得到頻譜里面看似有 Sinc Filter 抽取,不需要抽取是否可以?ADS可以不抽取看原始得數(shù)據(jù)嗎? 2.這個(gè)和手冊(cè)上的頻譜不一樣? 請(qǐng)問(wèn)這個(gè)是什么問(wèn)題呢?
    發(fā)表于 11-20 06:05

    高效大模型的推理綜述

    大模型由于其在各種任務(wù)中的出色表現(xiàn)而引起了廣泛的關(guān)注。然而,大模型推理的大量計(jì)算和內(nèi)存需求對(duì)其在資源受限場(chǎng)景的部署提出了挑戰(zhàn)。業(yè)內(nèi)一直在努力開(kāi)發(fā)旨在提高大模型推理效率的技術(shù)。本文對(duì)現(xiàn)有的關(guān)于高效
    的頭像 發(fā)表于 11-15 11:45 ?1467次閱讀
    高效大模型的推理<b class='flag-5'>綜述</b>

    求助,關(guān)于AMC1306M25抽取率OSR的疑問(wèn)求解

    我客戶目前正在評(píng)估AMC1306M25,有以下疑問(wèn)需要解答,可否幫忙確認(rèn)一下: 圖為官方的例程,兩個(gè)都應(yīng)該指的是抽取率OSR。但是當(dāng)客戶在第一個(gè)函數(shù)中填的抽取率為64,到第二張圖中ratio的值
    發(fā)表于 11-14 07:09

    NLP技術(shù)在聊天機(jī)器人中的作用

    聊天機(jī)器人,也稱為聊天AI,是一種通過(guò)文本或語(yǔ)音與人類進(jìn)行交流的軟件。它們廣泛應(yīng)用于客戶服務(wù)、在線購(gòu)物、個(gè)人助理等領(lǐng)域。NLP技術(shù)是實(shí)現(xiàn)聊天機(jī)器人智能對(duì)話能力的關(guān)鍵。 1. 理解用戶意圖 NLP技術(shù)
    的頭像 發(fā)表于 11-11 10:33 ?1036次閱讀

    語(yǔ)義分割25種損失函數(shù)綜述展望

    綜述提供了對(duì)25種用于圖像分割的損失函數(shù)的全面且統(tǒng)一的回顧。我們提供了一種新穎的分類法,并詳細(xì)審查了這些損失函數(shù)如何在圖像分割中被定制和利用,強(qiáng)調(diào)了它們的重要特征和應(yīng)用,并進(jìn)行了系統(tǒng)的分類。摘要
    的頭像 發(fā)表于 10-22 08:04 ?1624次閱讀
    語(yǔ)義分割25種損失函數(shù)<b class='flag-5'>綜述</b>和<b class='flag-5'>展望</b>

    【?嵌入式機(jī)電一體化系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)?閱讀體驗(yàn)】+磁力輸送機(jī)系統(tǒng)設(shè)計(jì)的創(chuàng)新與挑戰(zhàn)

    系統(tǒng)的設(shè)計(jì)細(xì)節(jié)、技術(shù)優(yōu)勢(shì)、面臨的挑戰(zhàn)及未來(lái)展望,特別是在鐵路工業(yè)及自動(dòng)化生產(chǎn)線的應(yīng)用中所展現(xiàn)出的重要現(xiàn)實(shí)意義。 磁懸浮技術(shù)的應(yīng)用背景 磁懸浮技術(shù),以其無(wú)接觸、低摩擦、高效率的特點(diǎn),早已在高速列車系統(tǒng)如
    發(fā)表于 09-14 22:44

    求助,AD7190關(guān)于Σ-Δ ADC其中的抽取濾波器的數(shù)據(jù)轉(zhuǎn)換問(wèn)題求解

    AD7190可以通過(guò)模式寄存器的FS[0:9]設(shè)置輸出速率, 0-1023的范圍;此時(shí)設(shè)置的數(shù)據(jù)速率選擇位是否就是Σ-Δ ADC抽取濾波器的抽取比? 關(guān)于抽取濾波器,此時(shí)我設(shè)置的為1023,那我是否
    發(fā)表于 09-09 06:11

    燧原科技聯(lián)合主辦“智繪藝術(shù)家詩(shī)畫(huà)點(diǎn)軍”文生圖挑戰(zhàn)賽圓滿結(jié)束

    燧原科技攜手OpenI啟智社區(qū)聯(lián)合主辦的"智繪藝術(shù)家詩(shī)畫(huà)點(diǎn)軍"文生圖挑戰(zhàn)賽日前圓滿落幕。
    的頭像 發(fā)表于 09-02 10:15 ?951次閱讀

    防水和防振動(dòng)功能2.5 英寸SAS/SATA硬盤(pán)抽取盒 非常適合車載數(shù)據(jù)存儲(chǔ)

    首創(chuàng)的防水和防振動(dòng)功能 2.5 英寸 SAS/SATA 硬盤(pán)抽取盒 – 非常適合車載數(shù)據(jù)存儲(chǔ)
    的頭像 發(fā)表于 08-12 19:16 ?663次閱讀
    防水和防振動(dòng)功能2.5 英寸SAS/SATA硬盤(pán)<b class='flag-5'>抽取</b>盒 非常適合車載數(shù)據(jù)存儲(chǔ)