chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

簡(jiǎn)述六種優(yōu)雅的精調(diào)方法

jf_78858299 ? 來(lái)源:李rumor ? 作者:rumor ? 2023-02-22 11:21 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

經(jīng)常會(huì)收到一些比較簡(jiǎn)要的技術(shù)咨詢(xún),描述了是什么任務(wù),發(fā)現(xiàn)用BERT粗暴精調(diào)效果不好之后,問(wèn)我有什么辦法可以提升。

在面對(duì)第一把梭就失敗時(shí),我通常是這么判斷的:

  1. 如果效果差的很離譜,比如二分類(lèi)準(zhǔn)確率在60%以下,那大概率是模型有問(wèn)題,開(kāi)始用小數(shù)據(jù)集debug
  2. 如果有點(diǎn)效果,但一言難盡,那估計(jì)是數(shù)據(jù)有問(wèn)題,要不然噪聲多,要不然是真的難,可以自己看一下訓(xùn)練集,如果人看完后在幾秒內(nèi)都不能給出答案,就別太指望模型可以做好

在第一把效果還行的情況下,推薦嘗試以下策略:

  1. In-Domain Further Pre-train:利用同領(lǐng)域下的無(wú)監(jiān)督數(shù)據(jù)繼續(xù)MLM預(yù)訓(xùn)練,這個(gè)方法我真的百試不厭,一般用一兩百萬(wàn)的數(shù)據(jù)就能提升1-2個(gè)點(diǎn)
  2. Within-Task Further Pre-Training:利用不同領(lǐng)域的同任務(wù)數(shù)據(jù)預(yù)先精調(diào),選通用一些的一般也有提升
  3. Multi-Task Fine-Tuning:利用不同任務(wù)預(yù)先精調(diào)
  4. Layer-wise Decreasing Layer Rate:每層學(xué)到的知識(shí)都是不同的,前面幾層會(huì)更通用,所以學(xué)的時(shí)候可以用小一點(diǎn)的學(xué)習(xí)率,防止災(zāi)難性遺忘
  5. Features from Different layers:把不同層的輸出集成起來(lái),不過(guò)這個(gè)方法不一定有提升
  6. 長(zhǎng)文本處理:截?cái)嗷蚴褂脤哟位幋a

以上這些方法,都出自復(fù)旦邱錫鵬老師的《How to fine-tune BERT for text classification?》,該文進(jìn)行了各種詳細(xì)的實(shí)驗(yàn),得出了不少有用的結(jié)論,推薦大家去學(xué)習(xí)。即使有的方法在論文數(shù)據(jù)集中表現(xiàn)一般,在自己的數(shù)據(jù)上也可以嘗試。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1223

    瀏覽量

    25408
  • DEBUG
    +關(guān)注

    關(guān)注

    3

    文章

    94

    瀏覽量

    20518
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    490

    瀏覽量

    22597
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    保持電容性負(fù)載穩(wěn)定的六種方法

    本帖最后由 gk320830 于 2015-3-8 23:36 編輯 保持電容性負(fù)載穩(wěn)定的六種方法本系列的第10部分是我們所熟悉的《電氣工程》雜志(Electrical Engineering
    發(fā)表于 09-25 09:31

    基于labview的六種模式的跑馬燈程序

    基于labview的六種模式的跑馬燈
    發(fā)表于 12-31 12:01

    linux下查看網(wǎng)卡流量的六種方法

    本文介紹了linux下查看網(wǎng)卡流量的六種方法,linux系統(tǒng)中使用nload、iftop、iostat等工具查看網(wǎng)卡流量,需要的朋友參考下。
    發(fā)表于 07-25 06:29

    六種常見(jiàn)的伺服電機(jī)故障以及相對(duì)應(yīng)的電機(jī)維修方法

    論是哪種伺服電機(jī),使用時(shí)間久了,都會(huì)產(chǎn)生一些小問(wèn)題,那今天就給大家?guī)?lái)的是六種常見(jiàn)的電機(jī)故障表現(xiàn)。當(dāng)伺服電機(jī)出現(xiàn)小問(wèn)題,不僅要及時(shí)檢測(cè)出來(lái),而且要找到產(chǎn)生這些故障的原因,伺服電機(jī)電機(jī)維修師才能對(duì)癥下藥,才可以修理好伺服電機(jī)。以下是六種常見(jiàn)的伺服電機(jī)故障以及相對(duì)應(yīng)的電機(jī)維修
    發(fā)表于 02-01 06:29

    分析六種電流測(cè)量方法優(yōu)缺點(diǎn)對(duì)比

    在極端條件下六種電流測(cè)量方法的優(yōu)缺點(diǎn)對(duì)比
    發(fā)表于 05-07 06:29

    幫助減少制造的ERP與MES集成的六種方法

    本文主要介紹了幫助減少制造的ERP與MES集成的六種方法
    發(fā)表于 06-04 08:00 ?5次下載

    個(gè)人制作電路板的六種方法及操作步驟

    本文主要介紹了個(gè)人制作電路板的六種方法及詳細(xì)操作步驟。根據(jù)電路原理圖中所用的元件形狀和印刷板面積的大小合理安排元件的密度和各元件的位置。確定元件位置應(yīng)按照先大后小、先整體后局部的原則進(jìn)行,使電路中相鄰元件就近放置,排列整齊均勻。
    發(fā)表于 04-25 16:15 ?7.2w次閱讀

    PCB溶液濃度的六種計(jì)算方法

    在PCB生產(chǎn)過(guò)程中,很多工序要用到各種溶液,往往這些溶液對(duì)PCB板的產(chǎn)品質(zhì)量起到?jīng)Q定性的作用。精確的計(jì)算好各種溶液的濃度才能確保各種溶液在工藝中起到它應(yīng)有的作用。下面介紹六種計(jì)算方法
    的頭像 發(fā)表于 10-03 16:39 ?4172次閱讀

    手機(jī)NFC的六種實(shí)用用法

    每當(dāng)新機(jī)發(fā)布時(shí),相信不少小伙伴除了會(huì)關(guān)注手機(jī)的性能、拍照、續(xù)航、價(jià)格之外,而且還會(huì)關(guān)注手機(jī)是否還帶NFC功能。隨著科技發(fā)展,現(xiàn)在手機(jī)里的NFC功能已經(jīng)多達(dá)六種了,接下來(lái)筆者就來(lái)告訴大家NFC究竟那六種實(shí)用的用法。
    的頭像 發(fā)表于 01-23 11:37 ?2.2w次閱讀

    導(dǎo)致開(kāi)關(guān)電源嘯叫的六種情況及解決方法

    導(dǎo)致開(kāi)關(guān)電源嘯叫的六種情況及解決方法(深圳市中遠(yuǎn)通電源技術(shù)開(kāi)發(fā)有限公司怎么樣)-導(dǎo)致開(kāi)關(guān)電源嘯叫的六種情況及解決方法
    發(fā)表于 09-24 17:14 ?61次下載
    導(dǎo)致開(kāi)關(guān)電源嘯叫的<b class='flag-5'>六種</b>情況及解決<b class='flag-5'>方法</b>

    手機(jī)觸摸屏失靈的六種解決方法

    針對(duì)于個(gè)別用戶(hù)反饋手機(jī)低概率出現(xiàn)觸屏不靈的現(xiàn)象,小編總結(jié)了六種解決方法。
    發(fā)表于 07-11 11:45 ?12.7w次閱讀

    防止別人蹭wifi蹭網(wǎng)的六種方法介紹

    如何防止別人蹭wifi 防止別人蹭網(wǎng)六種方法介紹
    發(fā)表于 09-27 14:57 ?0次下載

    關(guān)于機(jī)器學(xué)習(xí)的六種基礎(chǔ)算法來(lái)源、用途、演變

    六種算法分別是:線性回歸、邏輯回歸、梯度下降、神經(jīng)網(wǎng)絡(luò)、決策樹(shù)與k均值聚類(lèi)算法。
    發(fā)表于 11-04 10:18 ?1208次閱讀

    測(cè)電阻的六種方法 電阻測(cè)試方法 電阻好壞測(cè)量方法

    測(cè)電阻的六種方法 電阻測(cè)試方法 電阻好壞測(cè)量方法 電阻是一常見(jiàn)的電子元件,它的作用是限制電流的流動(dòng),從而保護(hù)電路以及電子元器件。在實(shí)際中,電阻由于長(zhǎng)時(shí)間的使用或是外力的損壞,很容易失
    的頭像 發(fā)表于 08-24 15:17 ?4.9w次閱讀

    抑制電磁干擾的六種常用方法

    抑制電磁干擾的六種常用方法 電磁干擾(EMI)是現(xiàn)代電子設(shè)備中最常見(jiàn)的問(wèn)題之一。隨著無(wú)線技術(shù)和電子設(shè)備的不斷發(fā)展,電磁干擾問(wèn)題變得越來(lái)越普遍和嚴(yán)重。電磁干擾會(huì)影響到電子設(shè)備的性能,甚至可能導(dǎo)致設(shè)備
    的頭像 發(fā)表于 09-18 14:14 ?3.5w次閱讀