chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一個(gè)新任務(wù):給定知識(shí)圖譜中的一條query path,生成對(duì)應(yīng)的問題

深度學(xué)習(xí)自然語言處理 ? 來源:深度學(xué)習(xí)自然語言處理 ? 作者:深度學(xué)習(xí)自然語言 ? 2020-10-10 10:29 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

引言

EMNLP2020中,復(fù)旦大學(xué)數(shù)據(jù)智能與社會(huì)計(jì)算實(shí)驗(yàn)室 (Fudan DISC) 提出了一篇基于事實(shí)的問題生成工作,論文題目為:PathQG: Neural Question Generation from Facts,被錄取為長文。

文章摘要

關(guān)于問題生成的當(dāng)前研究通常將輸入文本作為序列直接編碼,而沒有明確建模其中的事實(shí)信息,這會(huì)導(dǎo)致生成的問題和文本不太相關(guān)或者信息量較少。在這篇論文中,我們考慮結(jié)合文本中的事實(shí)以幫助問題生成。我們基于輸入文本的事實(shí)信息構(gòu)造了知識(shí)圖,并提出了一個(gè)新任務(wù):給定知識(shí)圖中的一條query路徑生成問題。任務(wù)可以被分為兩個(gè)步驟,(1)對(duì)query表示的學(xué)習(xí);(2)基于query的問題生成。我們首先將query表示學(xué)習(xí)定義為序列標(biāo)記問題,以識(shí)別涉及的事實(shí)從而學(xué)習(xí)到一個(gè)query表示,之后使用基于RNN的生成器進(jìn)行問題生成。我們以端到端的方式共同訓(xùn)練這兩個(gè)模塊,并提出通過變分框架加強(qiáng)這兩個(gè)模塊之間的交互。我們基于SQuAD構(gòu)造了實(shí)驗(yàn)數(shù)據(jù)集,實(shí)驗(yàn)結(jié)果表明我們的模型優(yōu)于其他方法,并且當(dāng)目標(biāo)問題復(fù)雜時(shí),性能提升更多。通過人工評(píng)估,也驗(yàn)證了我們生成的問題的確和文本更相關(guān)且信息更豐富。

研究動(dòng)機(jī)

本文關(guān)注基于文本的問題生成任務(wù)(Question Generation from Text):輸入一段文本,自動(dòng)生成對(duì)應(yīng)的問題。

當(dāng)前端到端的問題生成研究,通常對(duì)輸入文本直接編碼并學(xué)習(xí)一個(gè)隱表示,而沒有對(duì)其中的語義信息進(jìn)行明確建模,這會(huì)使得生成過程有較大不確定性,導(dǎo)致生成的問題包含和給定文本不相關(guān)的信息或者信息量較少,如下圖顯示,生成的問題Q2包含了不相關(guān)的信息“Everton Fc”,而Q1雖然正確但是缺少特定的信息描述,顯得比較簡略。

先對(duì)輸入文本中的事實(shí)(facts)進(jìn)行建??梢詼p輕這些問題,并且針對(duì)文本中的多個(gè)事實(shí),可以生成較為復(fù)雜(complex)的問題。我們通過對(duì)給定文本構(gòu)建知識(shí)圖譜(Knowledge Graph,KG)來表示其中的事實(shí),并提出一個(gè)新任務(wù):給定知識(shí)圖譜中的一條query path來生成問題,其中query path是一條由多個(gè)事實(shí)三元組構(gòu)成的序列,每個(gè)事實(shí)三元組包含兩個(gè)實(shí)體以及它們的關(guān)系。如上圖(b)顯示了一個(gè)KG以及其中的兩條query paths。

由于query path中并非所有事實(shí)都會(huì)在目標(biāo)問題中被提及,我們首先需要學(xué)習(xí)一個(gè)query representation來表示query path中會(huì)被提及的事實(shí)信息,并基于此生成對(duì)應(yīng)的問題,因此任務(wù)可以分成兩個(gè)步驟:(1)對(duì)query representation的學(xué)習(xí);(2)基于query的問題生成。我們以端到端的方式共同訓(xùn)練這兩個(gè)模塊,并提出通過變分框架加強(qiáng)這兩個(gè)模塊之間的交互。

我們使用了數(shù)據(jù)集SQuAD,并且為了驗(yàn)證模型在復(fù)雜問題生成上的效果,基于SQuAD構(gòu)造了一個(gè)復(fù)雜問題數(shù)據(jù)集,并分別進(jìn)行了實(shí)驗(yàn)。

模型

Path-based Question Generation

給定query path的問題生成任務(wù)包含兩個(gè)步驟,我們?cè)O(shè)計(jì)兩個(gè)模塊:Query Representation Learner和Query-based Question Generator分別進(jìn)行任務(wù)中的兩個(gè)步驟。我們首先以端到端的框架PathQG共同訓(xùn)練這兩個(gè)模塊,具體結(jié)構(gòu)如下圖顯示。

1. Query Representation Learner

由于query path中的不同的實(shí)體和關(guān)系會(huì)對(duì)生成目標(biāo)問題有不同的貢獻(xiàn)度,我們首先計(jì)算它們各自的貢獻(xiàn)權(quán)重,從而學(xué)到一個(gè)query representation來表示目標(biāo)問題將涉及的事實(shí)信息。

貢獻(xiàn)權(quán)重計(jì)算:將query path看作是一條由實(shí)體和關(guān)系相間構(gòu)成的序列,并將query path中各個(gè)成分的貢獻(xiàn)度計(jì)算看作是一個(gè)序列標(biāo)記過程。并且對(duì)輸入文本進(jìn)行編碼作為context,通過attention幫助序列標(biāo)記的概率計(jì)算,最后將各個(gè)位置的sigmoid概率作為各自的貢獻(xiàn)權(quán)重。

Query表示學(xué)習(xí):得到query path的各個(gè)成分的貢獻(xiàn)權(quán)重后,我們以加權(quán)的方式對(duì)query path編碼,學(xué)習(xí)到對(duì)應(yīng)的query representationL??紤]到query path由實(shí)體和關(guān)系相間構(gòu)成的特殊結(jié)構(gòu),我們使用循環(huán)跳躍網(wǎng)絡(luò)(recurrent skipping network, RSN)來對(duì)路徑序列進(jìn)行編碼。

2. Query-based Question Generator

基于學(xué)到的query representationL,解碼生成對(duì)應(yīng)的問題。將最后的query representation和context表示聯(lián)合作為解碼器的初始狀態(tài),并分別對(duì)他們執(zhí)行注意力機(jī)制,逐步生成問題。

Variational Path-based Question Generation

對(duì)query representation的學(xué)習(xí)可以看成是對(duì)query path的一個(gè)推斷過程,參考變分推斷的思想,我們將query representation的學(xué)習(xí)看作是推導(dǎo)query的先驗(yàn)分布(prior query distribution),而基于query的問題生成是在計(jì)算目標(biāo)問題的likelihood,我們又引入了一個(gè)額外的后驗(yàn)query分布(posterior query distribution),通過將目標(biāo)問題作為指導(dǎo)來幫助減少query representation學(xué)習(xí)的不確定性。并且通過訓(xùn)練,使得query的先驗(yàn)分布不斷靠近后驗(yàn)分布,最終提升生成的問題質(zhì)量。變分PathQG的結(jié)構(gòu)如下圖。

實(shí)驗(yàn)

我們?cè)赟QuAD數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn),對(duì)每一條文本,通過場景圖解析器(scene garph parser)和詞性標(biāo)注器(part-of-speech tagger)自動(dòng)構(gòu)建了知識(shí)圖譜,并且根據(jù)參考問題從知識(shí)圖譜中抽取出對(duì)應(yīng)的query path。為了進(jìn)一步驗(yàn)證模型在復(fù)雜問題生成上的效果,我們還根據(jù)query path中事實(shí)三元組的個(gè)數(shù)從SQuAD中劃分了一個(gè)復(fù)雜問題數(shù)據(jù)集。在全數(shù)據(jù)集和復(fù)雜數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果顯示我們的模型都優(yōu)于其他模型。

除了自動(dòng)評(píng)估,我們還通過Amazon Mechanical Turk (AMT)進(jìn)行了人工評(píng)估,分別從問題的流利度、正確性(和給定文本和答案一致)、信息量對(duì)不同模型生成的問題進(jìn)行了兩兩比較,結(jié)果顯示我們的模型也取得不錯(cuò)效果。

我們還通過對(duì)不同模型生成的問題和給定文本之間的重疊率進(jìn)行比較,來評(píng)估生成問題和給定文本的相關(guān)性。

最后還進(jìn)行了一些案例分析,可以看出相對(duì)模型NQG+,我們生成的問題更加和文本相關(guān)和有信息量。在第一個(gè)樣例中,我們生成的問題包含有特定信息“plymouth”和“l(fā)ate 18th”而*NQG+沒有,而在第二個(gè)例子中NQG+*生成的問題包含不相關(guān)的“swazi economye”而我們生成的和給定文本更一致。

總結(jié)

這篇文章中,我們通過知識(shí)圖譜對(duì)文本中的事實(shí)建模用于問題生成,并提出一個(gè)新任務(wù):給定知識(shí)圖譜中的一條query path,生成對(duì)應(yīng)的問題。我們提出先學(xué)習(xí)一個(gè)query representation來表示問題中可能涉及的事實(shí),再生成問題,將這兩個(gè)模塊聯(lián)合進(jìn)行訓(xùn)練并提出一個(gè)變分模型提升問題的生成。我們通過自動(dòng)構(gòu)建知識(shí)圖譜并抽取出對(duì)應(yīng)的query path構(gòu)建了我們的實(shí)驗(yàn)數(shù)據(jù)集,結(jié)果驗(yàn)證了我們模型的有效性。

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 編碼
    +關(guān)注

    關(guān)注

    6

    文章

    969

    瀏覽量

    55783
  • 生成器
    +關(guān)注

    關(guān)注

    7

    文章

    322

    瀏覽量

    21901
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1224

    瀏覽量

    25449

原文標(biāo)題:【論文】PathQG: 基于事實(shí)的神經(jīng)問題生成

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    CYUSB3014采用5根地址線通信,但其中一條地址線懸空,對(duì)數(shù)據(jù)通信有影響嗎?

    CYUSB3014采用5根地址線通信,但其中一條地址線懸空,對(duì)數(shù)據(jù)通信有影響嗎??是否還能進(jìn)行正常的多個(gè)端點(diǎn)通信,只要跳過那個(gè)地址線對(duì)應(yīng)的socket即可?
    發(fā)表于 05-21 07:59

    電路識(shí)圖從入門到精通高清電子資料

    由淺入深地介紹了電路圖的基礎(chǔ)知識(shí)、典型單元電路的識(shí)圖方法,通過“入門篇”和“精通篇”循序漸進(jìn)、由淺入深地介紹了電路圖的基礎(chǔ)知識(shí)、典型單元電路的識(shí)圖方法,以及典型小家電、電動(dòng)車、洗衣機(jī)、
    發(fā)表于 04-10 16:22

    一條光纖怎么分兩

    一條光纖可以通過以下方式分成兩使用: 使用分光器 分光器是種光學(xué)器件,它可以將光信號(hào)按照定的比例分成多路。通常,分光器有1:2、1:4、1:8等不同的分光比例,這意味著
    的頭像 發(fā)表于 02-25 10:07 ?1583次閱讀

    彩色PAL信號(hào)輸入到TVP5150,輸出到顯示器上時(shí)有出現(xiàn)圖像好像被一條條豎線隔開樣,什么原因引起的?

    彩色PAL信號(hào)輸入到5150,輸出到顯示器上時(shí)有出現(xiàn)圖像好像被一條條豎線隔開樣。 當(dāng)我輸入黑白PAL時(shí)沒出現(xiàn)這種現(xiàn)象。
    發(fā)表于 02-14 08:32

    2025未來產(chǎn)業(yè)創(chuàng)新任務(wù) | 清潔氫

    據(jù)悉,1月17日,工業(yè)和信息化部辦公廳發(fā)布《關(guān)于組織開展2025年未來產(chǎn)業(yè)創(chuàng)新任務(wù)揭榜掛帥工作的通知》(簡稱《通知》)。《通知》顯示,揭榜任務(wù)內(nèi)容面向量子科技、原子級(jí)制造、清潔氫3個(gè)未來產(chǎn)業(yè),布局
    的頭像 發(fā)表于 01-22 08:19 ?487次閱讀
    2025未來產(chǎn)業(yè)創(chuàng)<b class='flag-5'>新任務(wù)</b> | 清潔氫

    使用ADS1294R做產(chǎn)品過程,靜電接觸電極放電時(shí),DOUT只輸出個(gè)固定的值,心電波形顯示只是一條直線,為什么?

    在使用ADS1294R做產(chǎn)品過程,靜電接觸電極放電時(shí),芯片的DOUT只輸出個(gè)固定的值,心電波形顯示只是一條直線。這時(shí)進(jìn)行芯片復(fù)位或者如果再次進(jìn)行放電,又能恢復(fù)正常。 所有的輸入端
    發(fā)表于 12-17 07:31

    傳音旗下人工智能項(xiàng)目榮獲2024年“上海產(chǎn)學(xué)研合作優(yōu)秀項(xiàng)目獎(jiǎng)”等獎(jiǎng)

    和華東師范大學(xué)聯(lián)合申報(bào)的“跨語言知識(shí)圖譜構(gòu)建與推理技術(shù)研究及應(yīng)用”項(xiàng)目憑借創(chuàng)新性和技術(shù)先進(jìn)性榮獲等獎(jiǎng)。該項(xiàng)目成功突破了多形態(tài)信息抽取技術(shù)、跨語言知識(shí)圖譜對(duì)齊技術(shù)和知識(shí)問答對(duì)
    的頭像 發(fā)表于 12-16 17:04 ?658次閱讀
    傳音旗下人工智能項(xiàng)目榮獲2024年“上海產(chǎn)學(xué)研合作優(yōu)秀項(xiàng)目獎(jiǎng)”<b class='flag-5'>一</b>等獎(jiǎng)

    數(shù)據(jù)手冊(cè)些參數(shù)的數(shù)值有時(shí)畫一條橫線或者空著不填是什么意思?

    數(shù)據(jù)手冊(cè)些參數(shù)的數(shù)值有時(shí)畫一條橫線或者空著不填是什么意思? 如上表, tCS的最大值是15ns,最小值和典型值都是空著的,是不是最小值和典型值我可以隨便?。ù笥?小于15就行)?還是說只有最大值給出了,我只能取給出的最
    發(fā)表于 12-16 07:45

    三星自主研發(fā)知識(shí)圖譜技術(shù),強(qiáng)化Galaxy AI用戶體驗(yàn)與數(shù)據(jù)安全

    據(jù)外媒11月7日?qǐng)?bào)道,三星電子全球AI中心總監(jiān)Kim Dae-hyun近日透露,公司正致力于自主研發(fā)知識(shí)圖譜技術(shù),旨在進(jìn)步優(yōu)化Galaxy AI的功能,提升其易用性,并加強(qiáng)用戶數(shù)據(jù)的隱私保護(hù)。
    的頭像 發(fā)表于 11-07 15:19 ?1391次閱讀

    AI 大模型行業(yè)應(yīng)用:企業(yè)如何走出一條智能化蛻變之路?

    隨著 chatGPT 的橫空問世,我們對(duì)于人工智能在日常生活的應(yīng)用場景逐漸了解,無論是搜索、問答、文生圖還是文生視頻都出現(xiàn)了很多創(chuàng)意,甚至 AI 還可以做詩,輸入一條指令,就可以讓它當(dāng)場賦詩
    的頭像 發(fā)表于 09-27 18:16 ?1012次閱讀

    個(gè)socket對(duì)應(yīng)個(gè)連接嗎

    在探討“個(gè)socket對(duì)應(yīng)個(gè)連接”這命題時(shí),我們首先需要明確socket的基本概念和它在網(wǎng)
    的頭像 發(fā)表于 08-16 10:55 ?936次閱讀

    請(qǐng)問LM311能準(zhǔn)確的交截生成對(duì)應(yīng)的PWM波形嗎?

    UC3825, TLV3501輸入正是100k的正弦波 輸入負(fù)是100kHz的鋸齒波 二者交截生成PWM波形 請(qǐng)問LM311能準(zhǔn)確的交截生成對(duì)應(yīng)的PWM波形嗎 之前使用UC3525里面自帶的比較器做的,LM311能達(dá)到這樣的速度嗎
    發(fā)表于 08-06 07:46

    革新未來智能版圖,神州數(shù)碼榮登IDC生成式AI圖譜

    的顯著位置,在GenAI應(yīng)用行業(yè)板塊、GenAI平臺(tái)模型構(gòu)建與編排板塊均榜上有名,標(biāo)志著神州數(shù)碼不僅自身在生成式AI領(lǐng)域的技術(shù)創(chuàng)新和行業(yè)應(yīng)用方面邁出了堅(jiān)實(shí)的步,也為企業(yè)智能化轉(zhuǎn)型提供了一條
    的頭像 發(fā)表于 07-29 15:20 ?646次閱讀
    革新未來智能版圖,神州數(shù)碼榮登IDC<b class='flag-5'>生成</b>式AI<b class='flag-5'>圖譜</b>

    OPA855輸入是正弦波,為什么輸出是一條直流線呢?

    IG1是幅值為1nA,頻率為100HZ的交流電。為什么VOUT波形沒有放大50K呢,反而是一條直流線,在2.23V附近震蕩
    發(fā)表于 07-26 06:06

    在No-OS SDK 1.4.0上,如何直接收UART0消息呢?

    我應(yīng)該在 interupt 函數(shù)添加代碼還是在新任務(wù)添加代碼 誰能幫忙給出個(gè)完整的可行例子?
    發(fā)表于 07-22 06:14