chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

三種LM任務(wù)形式:?jiǎn)蜗騆M,雙向LM,序列到序列LM

深度學(xué)習(xí)自然語(yǔ)言處理 ? 來(lái)源:深度學(xué)習(xí)自然語(yǔ)言處理 ? 作者:深度學(xué)習(xí)自然語(yǔ)言 ? 2021-01-03 09:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

今天分享一個(gè)論文UniLM[1],核心點(diǎn)是掌握三種LM任務(wù)形式:?jiǎn)蜗騆M,雙向LM,序列到序列LM;

1. 生成任務(wù)

NLP任務(wù)大致可以分為NLU和NLG兩種;Bert在NLU任務(wù)上效果很好,但是天生不適合處理生成任務(wù)。

原因在于Bert的預(yù)訓(xùn)練過(guò)程是使用的MLM,和生成任務(wù)的目標(biāo)并不一致。

生成任務(wù)目標(biāo)是每次蹦出來(lái)一個(gè)詞,只能看到當(dāng)前位置之前的詞匯。

而B(niǎo)ert采用的是雙向的語(yǔ)言模型,除了mask的單詞,兩個(gè)方向的詞匯都可以被看到。

所以對(duì)Bert的一個(gè)改進(jìn)思路就是讓它在具有NLU能力的時(shí)候,同時(shí)兼?zhèn)銷(xiāo)LG能力。

2. 三種LM任務(wù)

UniLM做的就是這樣一個(gè)事情。

具體的實(shí)現(xiàn)方式是設(shè)計(jì)了一系列的完形填空任務(wù),這些完形填空任務(wù)的不同之處在于對(duì)上下文的定義。

從左到右的LM:使用mask單詞的左側(cè)單詞來(lái)預(yù)測(cè)被遮掩的單詞

從右到左的LM:和上面第一個(gè)相比就是方向的變化,使用mask單詞的右側(cè)單詞來(lái)預(yù)測(cè)遮掩的單詞

雙向LM:就是當(dāng)前mask的左右詞匯都可以看到

sequence-to-sequence LM:這個(gè)就是UniLM能夠具有生成能力的關(guān)鍵。我們的輸入是source句子和target句子,mask單詞在target上,那么當(dāng)前mask的上下文就是source句子的所有單詞和target句子中mask單詞左側(cè)的詞匯可以被看到

我們把從左到右LM和從右到左LM我們歸為一種任務(wù)叫單向LM;

有個(gè)點(diǎn)需要注意,三個(gè)任務(wù)是一起優(yōu)化的,具體來(lái)講是這樣做的:

在訓(xùn)練的時(shí)候,1/3的時(shí)候使用雙向LM,1/3的時(shí)候使用序列到序列 LM,1/6的時(shí)候使用從左到右的LM,1/6的時(shí)間使用從右到做的LM。

我們是使用不同的Mask矩陣來(lái)對(duì)應(yīng)不同任務(wù)輸入數(shù)據(jù)形式。

文中使用的是這樣一張圖來(lái)展示:

f1836372-4690-11eb-8b86-12bb97331649.jpg

UniLM不同mask

3. 其他細(xì)枝末節(jié)

Gelu 激勵(lì)函數(shù)

24層TRM,最大長(zhǎng)度512,1024Hidden Size,16Heads,340M參數(shù)量

初始化使用Bert Large

15%被mask,其中80%真正替換mask,10%隨機(jī)替換,10%不動(dòng)。替換的時(shí)候,80% 的時(shí)候替換單個(gè)token,20%的時(shí)候替換bigram 或者 trigram

第四個(gè)步驟類(lèi)似中文實(shí)體詞的mask,也算是一點(diǎn)改進(jìn)。

有個(gè)細(xì)節(jié)點(diǎn)需要注意的是,作者強(qiáng)調(diào),不同的segment embedding用來(lái)區(qū)分不同LM任務(wù)。

Bert的時(shí)候,區(qū)分上下句子,我們使用0和1,在這里,我們使用這個(gè)segment embedding用來(lái)區(qū)分任務(wù):

比如說(shuō),雙向?qū)?yīng)0和1;單向left-right對(duì)應(yīng)2;單向right-left對(duì)應(yīng)3;序列對(duì)應(yīng)4和5;

4. 總結(jié)

掌握以下幾個(gè)細(xì)節(jié)點(diǎn)就可以:

聯(lián)合訓(xùn)練三種任務(wù):?jiǎn)蜗騆M,雙向LM,序列LM

使用不同的attention矩陣控制三種任務(wù)形式的參與

segment embedding可以區(qū)分不同的任務(wù)形式

mask的時(shí)候15% 的有被替換的概率,其中80% 被真正替換。在這80%真正替換的里面有80%單個(gè)token被替換,20%的二元或者三元tokens被替換

參考資料

[1]

Unified Language Model Pre-training for Natural Language Understanding and Generation: https://arxiv.org/pdf/1905.03197.pdf,

責(zé)任編輯:xj

原文標(biāo)題:如何讓BERT具有文本生成能力

文章出處:【微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 自然語(yǔ)言
    +關(guān)注

    關(guān)注

    1

    文章

    292

    瀏覽量

    13913
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    491

    瀏覽量

    23182

原文標(biāo)題:如何讓BERT具有文本生成能力

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    德州儀器LM63460/LM64460評(píng)估模塊技術(shù)解析與應(yīng)用指南

    Texas Instruments LM63460EVM-2MHZ/LM64460EVM-2MHZ轉(zhuǎn)換器評(píng)估模塊 (EVM) 設(shè)計(jì)用于演示LM63460-Q1或LM64460-Q1高性
    的頭像 發(fā)表于 09-17 10:37 ?505次閱讀
    德州儀器<b class='flag-5'>LM</b>63460/<b class='flag-5'>LM</b>64460評(píng)估模塊技術(shù)解析與應(yīng)用指南

    LM3410/LM3410-Q1 LED驅(qū)動(dòng)器數(shù)據(jù)手冊(cè)總結(jié)

    LM3410 和 LM3410-Q1 恒流 LED 驅(qū)動(dòng)器是一款單片、高頻、 PWM DC-DC轉(zhuǎn)換器,采用6引腳WSON、8引腳MSOP-PowerPad?和5引腳SOT-23封裝。至少 外部元件
    的頭像 發(fā)表于 09-04 13:39 ?736次閱讀
    <b class='flag-5'>LM</b>3410/<b class='flag-5'>LM</b>3410-Q1 LED驅(qū)動(dòng)器數(shù)據(jù)手冊(cè)總結(jié)

    德州儀器LMx39x/LM2901x系列比較器技術(shù)解析

    Texas Instruments LMx39/LM2901/LM2901-Q1四通道差分比較器包含四個(gè)獨(dú)立的電壓比較器,設(shè)計(jì)用于在寬電壓范圍內(nèi)由單電源供電運(yùn)行。LM339B/LM
    的頭像 發(fā)表于 08-29 11:02 ?611次閱讀
    德州儀器LMx39x/<b class='flag-5'>LM</b>2901x系列比較器技術(shù)解析

    LM358數(shù)據(jù)手冊(cè)

    電子發(fā)燒友網(wǎng)站提供《LM358數(shù)據(jù)手冊(cè).pdf》資料免費(fèi)下載
    發(fā)表于 08-25 15:40 ?0次下載

    LM3881系列 3軌簡(jiǎn)單功率定序器技術(shù)手冊(cè)

    LM3881 簡(jiǎn)單電源定序器提供了控制上電和電源的最簡(jiǎn)單方法 多個(gè)電源(開(kāi)關(guān)或線性穩(wěn)壓器)的關(guān)閉。通過(guò)錯(cuò)開(kāi)啟動(dòng) 序列,可以避免可能影響 系統(tǒng)的可靠性。
    的頭像 發(fā)表于 08-19 13:49 ?701次閱讀
    <b class='flag-5'>LM</b>3881系列 3軌簡(jiǎn)單功率定序器技術(shù)手冊(cè)

    ?LM185/LM285/LM385-2.5-N系列微功耗電壓基準(zhǔn)芯片技術(shù)文檔總結(jié)

    ? 1. 產(chǎn)品概述 ? ? 型號(hào)系列 ?:LM185-2.5-N、LM285-2.5-N、LM385-2.5-N,均為2端帶隙電壓基準(zhǔn)芯片。 ? 關(guān)鍵特性 ?: ? 高精度 ?:A級(jí)初始容差
    的頭像 發(fā)表于 08-18 09:07 ?1006次閱讀
    ?<b class='flag-5'>LM</b>185/<b class='flag-5'>LM</b>285/<b class='flag-5'>LM</b>385-2.5-N系列微功耗電壓基準(zhǔn)芯片技術(shù)文檔總結(jié)

    Texas Instruments LM5171雙通道雙向控制器數(shù)據(jù)手冊(cè)

    Texas Instruments LM5171雙通道雙向控制器支持多相并行運(yùn)行,每個(gè)相位均具有平衡的電流共享。 該控制器還支持獨(dú)立通道雙向操作,因此可在多相降壓/升壓或獨(dú)立降壓/升壓模式下運(yùn)行。
    的頭像 發(fā)表于 07-28 15:20 ?527次閱讀
    Texas Instruments <b class='flag-5'>LM</b>5171雙通道<b class='flag-5'>雙向</b>控制器數(shù)據(jù)手冊(cè)

    Texas Instruments LM4041/LM4041xQ精密電壓基準(zhǔn)數(shù)據(jù)手冊(cè)

    Texas Instruments LM4041/LM4041xQ精密電壓基準(zhǔn)功能多樣,使用方便,應(yīng)用廣泛。該器件無(wú)需外部電容器即可工作,搭配所有容性負(fù)載均可穩(wěn)定工作。
    的頭像 發(fā)表于 07-11 15:01 ?508次閱讀
    Texas Instruments <b class='flag-5'>LM</b>4041/<b class='flag-5'>LM</b>4041xQ精密電壓基準(zhǔn)數(shù)據(jù)手冊(cè)

    LM5068 -10V至 -80V熱插拔控制器數(shù)據(jù)手冊(cè)

    的背板中的電源瞬變 卡。LM5068 控制外部 N 溝道 MOSFET 以提供可編程負(fù)載電流 使用單個(gè)外部電流檢測(cè)電阻器的限流和斷路器功能。The LM5068 在成功開(kāi)機(jī)序列結(jié)束時(shí)發(fā)出電源正常 (PWRGD) 信號(hào)。輸入 過(guò)壓
    的頭像 發(fā)表于 05-14 15:49 ?573次閱讀
    <b class='flag-5'>LM</b>5068 -10V至 -80V熱插拔控制器數(shù)據(jù)手冊(cè)

    LM3017系列 具有真正關(guān)斷功能的高效低側(cè)控制器數(shù)據(jù)手冊(cè)

    SEPIC 設(shè)計(jì)。這 5V 至 18V 的輸入電壓范圍可容納兩節(jié)或節(jié)鋰離子電池或 12V 軌。使能引腳接受單個(gè)輸入來(lái)驅(qū)動(dòng)三種不同的作模式:升壓、 pass-through 或 shutdown 模式。LM3017 在關(guān)斷模式
    的頭像 發(fā)表于 03-26 10:32 ?714次閱讀
    <b class='flag-5'>LM</b>3017系列 具有真正關(guān)斷功能的高效低側(cè)控制器數(shù)據(jù)手冊(cè)

    LM5171 80V 雙通道雙向降壓-升壓控制器數(shù)據(jù)手冊(cè)

    LM5171 控制器提供雙通道雙向轉(zhuǎn)換器的高電壓和精密元件。示例包括雙電池系統(tǒng)。LM5171 支持多相并聯(lián)運(yùn)行,每相均流平衡。LM5171 還支持獨(dú)立通道
    的頭像 發(fā)表于 03-19 15:38 ?856次閱讀
    <b class='flag-5'>LM</b>5171 80V 雙通道<b class='flag-5'>雙向</b>降壓-升壓控制器數(shù)據(jù)手冊(cè)

    運(yùn)算放大器LM358的常見(jiàn)電路

    本文主要學(xué)習(xí)LM358的幾種外圍電路設(shè)計(jì),希望能幫助大家更進(jìn)一步的了解和使用LM358。
    的頭像 發(fā)表于 03-17 14:48 ?7235次閱讀

    LM2621工作電流大如何解決?

    LM2621的輸入為兩節(jié)干電池3.0V,輸出3.3V,負(fù)載電流10.5mA,測(cè)試LM2621工作電流12mA左右,LM2621的電路采用的使用手冊(cè)中的推薦電路,如下圖。工作電流大應(yīng)該怎么解決?
    發(fā)表于 02-27 08:27

    LM73605/LM73606 EVM用戶指南

    電子發(fā)燒友網(wǎng)站提供《LM73605/LM73606 EVM用戶指南.pdf》資料免費(fèi)下載
    發(fā)表于 01-03 15:33 ?0次下載
    <b class='flag-5'>LM</b>73605/<b class='flag-5'>LM</b>73606 EVM用戶指南

    LM5171評(píng)估模塊

    電子發(fā)燒友網(wǎng)站提供《LM5171評(píng)估模塊.pdf》資料免費(fèi)下載
    發(fā)表于 12-05 14:12 ?3次下載
    <b class='flag-5'>LM</b>5171評(píng)估模塊