chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

了解信息抽取必須要知道關(guān)系抽取

深度學(xué)習(xí)自然語(yǔ)言處理 ? 來(lái)源:CSDN ? 作者:CSDN ? 2021-04-15 14:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文主要詳細(xì)解讀關(guān)系抽取SOTA論文Two are Better than One:Joint Entity and Relation Extraction with Table-Sequence Encoders[1], 順帶簡(jiǎn)要介紹關(guān)系抽取的背景,方便完全不了解童鞋。

信息抽取

我們說(shuō)的信息抽取一般是指從文本數(shù)據(jù)中抽取特定數(shù)據(jù)結(jié)構(gòu)信息的一種手段。對(duì)于不同結(jié)構(gòu)形式的數(shù)據(jù)如結(jié)構(gòu)化文本,半結(jié)構(gòu)化文本,自由文本,有各自對(duì)應(yīng)的方案,其中從自由文本中抽取難度最大??傊覀兊哪康氖窍M诤A课谋局?,快速抽出我們關(guān)注的事實(shí)。

了解信息抽取必須要知道關(guān)系抽取。

關(guān)系抽取

大部分情況下,我們喜歡用三元組的數(shù)據(jù)結(jié)構(gòu)來(lái)描述抽取到的信息

三元組

三元組的表達(dá)能力非常豐富,幾乎所有事情都可以自然或者強(qiáng)行的表達(dá)成三元組,比如隨便一句”今天天氣真冷“ 表達(dá)為天氣-狀態(tài)-冷。

三元組與后續(xù)的知識(shí)圖譜工作非常適配,如Neo4j等圖數(shù)據(jù)庫(kù)就是以三元組為存儲(chǔ)單位,圖譜的查詢推斷等工具使用三元組比普通的關(guān)系型數(shù)據(jù)庫(kù)來(lái)的方便的多。

三元組千千萬(wàn),我應(yīng)該怎么抽?

Schema

當(dāng)我們拿到一個(gè)信息抽取的任務(wù),需要明確我們抽取的是什么,”今天天氣真冷“,我們要抽的天氣的狀態(tài)天氣-狀態(tài)-冷,而非今天-氣候-冷(雖然也可以這樣抽),因此一般會(huì)首先定義好我們要抽取的數(shù)據(jù)結(jié)構(gòu)模式shcema, 會(huì)確定謂詞以及主語(yǔ)并與的類型

一個(gè)三元組schema的例子,其中Subject_type代表主語(yǔ)類型,Predicate是謂詞,Object_type指賓語(yǔ)類型:

Subject_type:人物 Predicate:出生地 Object_type:地點(diǎn)

確定了schema,我們一般如何抽取呢?

常規(guī)RE方案

目前主流關(guān)系抽取一般兩種解決方法

pipline兩步走:將關(guān)系抽取分解為NER任務(wù)和分類任務(wù),NER任務(wù)標(biāo)注主語(yǔ)或賓語(yǔ),分類主要針對(duì)定義的schema中的有限個(gè)謂詞進(jìn)行分類。根據(jù)具體任務(wù)不同,有些可能是兩步走或者三步走,pipline任務(wù)的順序先分類還是先標(biāo)注也會(huì)有差異

Pipline優(yōu)勢(shì):每一步分別針對(duì)各個(gè)任務(wù)進(jìn)行,表征是task-specific, 相對(duì)來(lái)說(shuō)精度較高

Pipline缺陷:- 任務(wù)有順序會(huì)存在誤差傳遞問(wèn)題,即在預(yù)測(cè)時(shí)下一步任務(wù)會(huì)受上一步誤差影響,而在訓(xùn)練階段沒(méi)有這種誤差,因此存在訓(xùn)練和預(yù)測(cè)階段的gap- 分開(kāi)的任務(wù)在一句話中多個(gè)實(shí)體關(guān)系時(shí),比較難解決實(shí)體和關(guān)系的對(duì)應(yīng)問(wèn)題,以及重疊關(guān)系

joint learning:joint learing可以理解為采用多任務(wù)的方式,同時(shí)進(jìn)行NER和關(guān)系分類任務(wù), 在眾多joint learning中最出眾的是采用tabel filled 方式,即任務(wù)的輸出是filled一張有text-sequence構(gòu)成的表,在表中的位置表達(dá)除了詞與詞的連接,該位置的標(biāo)注則標(biāo)出了謂語(yǔ)(如下圖)

a82e50a8-9cd8-11eb-8b86-12bb97331649.jpg

優(yōu)勢(shì):1. 兩個(gè)任務(wù)的表征有交互作用可能輔助任務(wù)的學(xué)習(xí)2. 不用訓(xùn)練多個(gè)模型,一個(gè)模型解決問(wèn)題,不存在訓(xùn)練與預(yù)測(cè)時(shí)的gap

缺陷:1. 兩個(gè)任務(wù)的表征可能沖突,影響任務(wù)效果2. 解決了主謂賓之間的對(duì)應(yīng)關(guān)系,無(wú)法解決重疊問(wèn)題3. Fill table本質(zhì)仍然是轉(zhuǎn)成sequence來(lái)fill,未能充分利用table結(jié)構(gòu)信息(下文會(huì)解釋)

下面重點(diǎn)解讀table fill方式的一篇SOTA,解決了joint learning的多任務(wù)表征沖突以及為利用table結(jié)構(gòu)信息

RE with Table Sequence

終于來(lái)到本篇的主題啦,為了解決一般filled table的問(wèn)題, 作者提出table-sequence encoder的方法,分別對(duì)table和sequence做表征,本文的最大貢獻(xiàn)在于

分別對(duì)table和sequence做表征(encoder),并設(shè)計(jì)了一個(gè)Table-Guided Attention來(lái)對(duì)table和sequence進(jìn)行交互,這樣即不會(huì)完全共享表征導(dǎo)致對(duì)不同的任務(wù)表征沖突,也不會(huì)丟失表征的相互指導(dǎo)作用

在table encoder中采用多維GRU來(lái)捕獲更多的句子結(jié)構(gòu)信息

在架構(gòu)上table encoder和 sequence encoder多層交互

a84af794-9cd8-11eb-8b86-12bb97331649.jpg

下面仔細(xì)介紹各個(gè)部分,看看它是如何神奇做到SOTA的

Text Embedder

在上圖的結(jié)構(gòu)圖中,Text Embedder采用類似FLAT分別做了基于lstm的char()和word(),以及基于bert的word ()作為預(yù)訓(xùn)練的embedding ,并拼接起來(lái)

圖中

Table Encoder

整個(gè)Table Encoder部分由多個(gè)Table Encoding的單元組成,每個(gè)Encoding單元的輸入分別是起始輸入,對(duì)應(yīng)senquence結(jié)構(gòu)的輸入,以及上一個(gè)Tabel Encoding單元的輸出,Table Encoding 采用MDRNN結(jié)構(gòu)提取輸入的特征信息,作者在這選擇MDGRU(多維度GRU),tabel結(jié)構(gòu)本身有2維,加上前后層實(shí)際有4維,但是層的維度信息單向流動(dòng),實(shí)際上是只用到了3個(gè)方向()

a879c3bc-9cd8-11eb-8b86-12bb97331649.jpg

如圖所示,是來(lái)自sequence的輸入,作者分別測(cè)了使用所有方向和分別使用幾個(gè)方向,發(fā)現(xiàn)上圖中a,c效果類似,這種多維GRU全面的考慮了整個(gè)table的結(jié)構(gòu)信息,即一個(gè)詞的狀態(tài)跟其他所有詞的狀態(tài)相關(guān),并且受其他詞的不同程度的影響,這種影響程度由GRU門控機(jī)制控制

Sequence Encoder

sequence Encoder 也由多個(gè)sequence encoding夠成,sequence encoding結(jié)構(gòu)直接采用transformer中的encoder

a88c27dc-9cd8-11eb-8b86-12bb97331649.jpg

只不過(guò)將其中的self attention替換為table-guide attention,這種attention的改造非常巧妙,能更好捕捉word-word之間的關(guān)系

a8c91868-9cd8-11eb-8b86-12bb97331649.jpg

正常的dot attention如上圖

Table-Guided attention具體來(lái)說(shuō):

為參數(shù)矩陣

采用加性

是table encoder中的table的隱藏節(jié)點(diǎn),該節(jié)點(diǎn)由多個(gè)方向的經(jīng)過(guò)GRU編碼得到,不管是哪個(gè)方向它的來(lái)源始終是由構(gòu)造而來(lái),理論上是可以由擬合而來(lái),因此這里直接由 來(lái)代替 ,也就是這個(gè)attention,其實(shí)是計(jì)算了table 結(jié)構(gòu)中各個(gè)位置對(duì)該的權(quán)重,是一個(gè)四面八方attention

剩下就是transform中正常的LayerNorm 和殘差結(jié)構(gòu)了

輸出和loss

輸出比較常規(guī),loss采用常規(guī)

輸出:

loss:

實(shí)驗(yàn) and 效果

作者在各個(gè)數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),對(duì)比各個(gè)目前SOTA分別有一定的提高,且時(shí)效果最佳,模型參數(shù)量不到5M,要什么自行車,附上開(kāi)源地址[2],作者的代碼與論文在attention計(jì)算有一丟丟不一致,但是并不影響效果

a8d23eac-9cd8-11eb-8b86-12bb97331649.jpg

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:關(guān)系抽取一步到位!

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    高效部署磁盤陣列:選對(duì)硬盤抽取盒,省心又強(qiáng)力

    挑戰(zhàn):散熱壓力、安裝維護(hù)的便捷性,以及寶貴的機(jī)箱空間。此時(shí),一款設(shè)計(jì)出色的硬盤抽取盒就能成為關(guān)鍵助力。ICYDOCK的ToughArmor系列——MB998SP-
    的頭像 發(fā)表于 11-07 16:34 ?881次閱讀
    高效部署磁盤陣列:選對(duì)硬盤<b class='flag-5'>抽取</b>盒,省心又強(qiáng)力

    多塊 M.2 硬盤拆到崩潰?M.2 硬盤抽取盒才是救星!

    新硬盤,而是讓機(jī)箱內(nèi)每塊硬盤“活”起來(lái)的方案——一款設(shè)計(jì)精良的具有可抽取功能M.2硬盤盒,能徹底改變你與數(shù)據(jù)的交互方式。極速連接,釋放完整性能一款優(yōu)秀的M.2硬盤盒
    的頭像 發(fā)表于 10-11 15:15 ?462次閱讀
    多塊 M.2 硬盤拆到崩潰?M.2 硬盤<b class='flag-5'>抽取</b>盒才是救星!

    工業(yè)相機(jī)數(shù)據(jù)爆炸?ICY DOCK硬盤抽取盒極速存 + 0宕機(jī)!

    與更換能力。針對(duì)這些關(guān)鍵需求,ICYDOCK旗艦級(jí)硬盤抽取盒MB699VP-B與MB720MK-BV3以其工業(yè)級(jí)設(shè)計(jì),提供了可靠的存儲(chǔ)解決方案。MB699VP-B
    的頭像 發(fā)表于 09-05 16:02 ?290次閱讀
    工業(yè)相機(jī)數(shù)據(jù)爆炸?ICY DOCK硬盤<b class='flag-5'>抽取</b>盒極速存 + 0宕機(jī)!

    【ICY DOCK新品】4盤位2.5英寸U.2/U.3 NVMe SSD硬盤抽取

    企業(yè)級(jí)免工具硬盤托盤設(shè)計(jì)搭配PCIe4.0極致速度ICYDOCKExpressCageMB324V4P-B是一款具備高性能的硬盤抽取盒,它可在單個(gè)標(biāo)準(zhǔn)的5.25英寸光驅(qū)位中容納多達(dá)4個(gè)
    的頭像 發(fā)表于 08-08 14:39 ?976次閱讀
    【ICY DOCK新品】4盤位2.5英寸U.2/U.3 NVMe SSD硬盤<b class='flag-5'>抽取</b>盒

    最新PCIe5.0 U.2硬盤抽取盒— ICY DOCK MB491V5K-B 開(kāi)箱測(cè)評(píng)

    ——ICYDOCKToughArmorMB491V5K-B,正是專為高安全、高性能、高強(qiáng)度環(huán)境打造的U.2/U.3NVMeSSD抽取盒,不僅支持PCIe5.0,還擁有軍規(guī)
    的頭像 發(fā)表于 08-01 14:48 ?1021次閱讀
    最新PCIe5.0 U.2硬盤<b class='flag-5'>抽取</b>盒— ICY DOCK MB491V5K-B 開(kāi)箱測(cè)評(píng)

    【硬盤抽取盒民主實(shí)驗(yàn)】你的真話,決定產(chǎn)品命運(yùn)!敢說(shuō)就送!

    這不是一場(chǎng)營(yíng)銷,而是一次硬盤抽取盒民主實(shí)驗(yàn)。ICYDOCK誠(chéng)邀敢說(shuō)真話的你!你的每一條真實(shí)反饋,都可能被采納,直接塑造CP138產(chǎn)品的命運(yùn)!你的聲音,至關(guān)重要!CP138核心亮點(diǎn)速覽CP138是專為
    的頭像 發(fā)表于 07-18 16:32 ?260次閱讀
    【硬盤<b class='flag-5'>抽取</b>盒民主實(shí)驗(yàn)】你的真話,決定產(chǎn)品命運(yùn)!敢說(shuō)就送!

    ICY DOCK PCIe可拆卸式擴(kuò)展插槽硬盤抽取盒或轉(zhuǎn)接器,革新存儲(chǔ)解決方案

    插槽硬盤抽取盒或轉(zhuǎn)接器站在創(chuàng)新的最前沿。我們的解決方案重新定義了易用性,提供快速、免工具的硬盤抽取盒安裝和無(wú)縫的硬盤更換。它們非常適合存儲(chǔ)敏捷性,專為快速維護(hù)和輕
    的頭像 發(fā)表于 04-18 14:42 ?678次閱讀
    ICY DOCK PCIe可拆卸式擴(kuò)展插槽硬盤<b class='flag-5'>抽取</b>盒或轉(zhuǎn)接器,革新存儲(chǔ)解決方案

    步進(jìn)電機(jī)選型時(shí)必須要了解什么?

    步進(jìn)電機(jī)選型時(shí),必須要了解以下幾個(gè)方面的信息以確保所選電機(jī)能夠滿足特定的應(yīng)用需求: 1. 轉(zhuǎn)矩需求: ? ?● 步進(jìn)電機(jī)的保持轉(zhuǎn)矩類似于傳統(tǒng)電機(jī)的“功率”,但物理結(jié)構(gòu)和輸出特性有所不同
    的頭像 發(fā)表于 04-14 07:38 ?847次閱讀

    使用轉(zhuǎn)輪流量計(jì)必須要知道的事!

    流量計(jì)
    華泰天科
    發(fā)布于 :2025年03月11日 17:46:47

    分體超聲波液位計(jì)的安裝注意事項(xiàng)必須要知道

    有客戶經(jīng)常詢問(wèn)分體超聲波液位計(jì)有什么需要注意的事項(xiàng)嗎?肯定有的呀,不同的產(chǎn)品有不同的安裝注意事項(xiàng)哦。接下來(lái)就給大家講講都有哪些在安裝時(shí)需要注意的事項(xiàng),跟我來(lái)! 一、當(dāng)我們準(zhǔn)備安裝這款產(chǎn)品時(shí)我們要分辨下,如果是戶外安裝我們盡可能的安裝在陰涼干燥處或者給產(chǎn)品加裝遮陽(yáng)板,這樣可以有效的延長(zhǎng)產(chǎn)品的使用周期,幫助我們更長(zhǎng)時(shí)間的測(cè)量液位位置。 二、連接電纜和電纜保護(hù)管時(shí)我們要注意連接位置不要有過(guò)多的積水,容易對(duì)產(chǎn)
    的頭像 發(fā)表于 01-14 15:14 ?623次閱讀
    分體超聲波液位計(jì)的安裝注意事項(xiàng)<b class='flag-5'>必須要知道</b>

    AMC1210對(duì)AMC1305進(jìn)行數(shù)字抽取濾波,輸出后的數(shù)據(jù)是否需要用處理器進(jìn)行一次平均和移位處理?

    我使用的AMC1210對(duì)AMC1305進(jìn)行抽取濾波。AMC1210配置為SIN3,256倍抽取。積分器為128倍積分。AMC1210配置為中斷方式SPI接口32bit輸出。輸出后的數(shù)據(jù),是否需要用
    發(fā)表于 01-14 08:21

    使用AMC1210為AMC1305L25做3階的256抽1的sinc抽取濾波器,請(qǐng)問(wèn)是否可以呢?

    我使用AMC1305L25做1200V高壓 高邊電流隔離采集。想使用AMC1210為AMC1305L25做3階的256抽1的sinc抽取濾波器,請(qǐng)問(wèn)是否可以呢?(備注:AMC1305L25與AMC1210之間加入了LVDS轉(zhuǎn)LVTTL電平的轉(zhuǎn)換芯片。)
    發(fā)表于 12-27 07:37

    請(qǐng)問(wèn)TFP501必須要接EEPROM嗎?

    TFP501芯片必須要接EEPROM嗎? EEPROM中存儲(chǔ)的數(shù)據(jù)哪里提供,是需要提前寫到EEPROM里,還是TFP501自己來(lái)操作的不需要額外來(lái)讀寫? TFP501是不是搭接好硬件就可以工作,不需要配置寄存器或編程下載什么的
    發(fā)表于 12-27 06:11

    請(qǐng)問(wèn)AMC1203文檔中的OSC過(guò)采樣率和sinc3濾波器中的抽取率是不是同一個(gè)概念?

    ,濾波器的輸出結(jié)果(Dfilter) 又怎么和輸入電壓一一對(duì)應(yīng)? 我個(gè)人理解是AMC1203輸出占空比=Dfilter/DC_Gain 占空比=>輸入電壓(線性關(guān)系?) 輸入電壓 => 采樣電流 不知道對(duì)不對(duì),望解答!謝謝,十分感謝!
    發(fā)表于 12-16 06:42

    請(qǐng)問(wèn)AFE5809 decimation功能如何實(shí)現(xiàn)?

    正在測(cè)試AFE5809抽取功能,通過(guò)給的sonar例子不能實(shí)現(xiàn)其抽取功能,想知道如何實(shí)現(xiàn)
    發(fā)表于 12-02 06:02