chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

適配器微調(diào)在推薦任務中的幾個關(guān)鍵因素

智能感知與物聯(lián)網(wǎng)技術(shù)研究所 ? 來源:智能感知與物聯(lián)網(wǎng)技術(shù)研 ? 2024-03-04 09:50 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文對基于適配器的可遷移推薦系統(tǒng)進行了實驗探索和深入研究。發(fā)現(xiàn)在文本推薦方面,基于適配器的可遷移推薦取得了有競爭力的結(jié)果;在圖像推薦方面,基于適配器的可遷移推薦略落后于全量微調(diào)。后續(xù)本文對四種著名的適配器微調(diào)方法進行了基準測試,并深入研究了可能影響適配器微調(diào)在推薦任務中的幾個關(guān)鍵因素。

e993c106-d969-11ee-a297-92fbcf53809c.png

論文題目:

Exploring Adapter-based Transfer Learning for Recommender Systems: Empirical Studies and Practical Insights

論文鏈接:

https://arxiv.org/abs/2305.15036

代碼鏈接:

https://github.com/westlake-repl/Adapter4Rec/

研究動機

可遷移的推薦系統(tǒng) (TransRec) 通常包含一個用戶編碼器和一個或多個基于模態(tài)的物品編碼器,其中基于模態(tài)的物品編碼器通常是經(jīng)過預訓練的 ViT, BERT, RoBERTA, 與 GPT 等模型,他們往往包含很大的參數(shù)量。常見使用 TransRec 的范式是先經(jīng)過一個源域數(shù)據(jù)集的預訓練之后再遷移到目標域,遷移的過程往往都需要再進行微調(diào)。

e9aa3a76-d969-11ee-a297-92fbcf53809c.png

傳統(tǒng)的全參數(shù)微調(diào) (Fine-tune All, FTA) 是很有效的方式,但它存在如下幾個問題:

1. 如上圖所示,推薦系統(tǒng)往往都包含一個主頻道和多個垂直頻道,如果想利用主頻道預訓練過的模型遷移至每個垂直頻道,則每個垂直通道的模型更新、維護和存儲都需要很多額外成本;

2. 全參數(shù)微調(diào)往往存在過擬合問題;

3. 昂貴的訓練成本,往往微調(diào)越大的模型所需要的 GPU 顯存越高。

這促使研究者們在 TransRec 中探索基于適配器 (Adapter) 的高效微調(diào)范式 (Adapter tuning, AdaT) 。AdaT 與傳統(tǒng) FTA 的比較如下圖所示,AdaT 僅僅微調(diào)新插入的適配器和對應的 layer-normalization 層:

e9b80246-d969-11ee-a297-92fbcf53809c.png

適配器是一種在 NLP 和 CV 中廣泛采用的參數(shù)高效方法用于解決高效遷移大規(guī)模基礎模型,然而在當前 TransRec 范式的推薦系統(tǒng)領(lǐng)域并沒有被系統(tǒng)的探究過該方法的有效性。針對于該有效性的探究,論文提出如下幾個關(guān)鍵研究問題:

RQ1: 基于適配器的 TransRec 性能上能否與典型的基于微調(diào)的 TransRec 相當?該結(jié)論適用于不同模態(tài)的場景嗎?

RQ2: 如果 RQ1 為正確或部分正確,那么這些 NLP 和 CV 社區(qū)當中流行的適配器性能又如何呢?

RQ3: 是否有因素影響這些基于適配器的 TransRec 模型的性能?

針對于 RQ1, 論文在兩種物品模態(tài)(即文本和圖像)上對基于適配器和基于全參數(shù)微調(diào)的 TransRec 進行了嚴格的比較研究。其中包括采用兩種流行的推薦架構(gòu)(即 SASRec 和 CPC)以及四種強大的模態(tài)編碼(即 BERT、RoBERTa、ViT 和 MAE)。

針對于 RQ2, 論文對 NLP 和 CV 中廣泛采用的四種適配器進行了基準測試。還加入了 LoRA、Prompt-tuning 和 layer-normalization tuning 的結(jié)果,以進行綜合比較。

針對于 RQ3, 該文章進行了不同策略的性能比較,這些策略包括插入適配器的方式和位置,以及是否調(diào)整相應的 layer-normalization 等。除此之外,論文還研究了 TransRec 在源域和目標域中的數(shù)據(jù)縮放效應,以考察在使用較大數(shù)據(jù)集預訓練 TransRec 時 AdaT 的有效性。

網(wǎng)絡架構(gòu)

TransRec 架構(gòu)包含兩個子模塊,即物品編碼器和用戶編碼器,這兩個模塊都基于 Transformer 模塊。論文采用插入適配器到物品和用戶編碼器當中?;谶m配器的 TransRec 架構(gòu)如下圖所示。論文采用 SASRec 和 CPC 框架對 TransRec 進行二元交叉熵 (BCE) 損失訓練。

e9db93be-d969-11ee-a297-92fbcf53809c.png

實驗設置

數(shù)據(jù)集:論文用兩種模式對基于適配器的 TransRec 進行了評估。對于具有文本模態(tài)的物品,使用 MIND 英語新聞推薦數(shù)據(jù)集作為源域,并使用 Adressa 挪威語新聞推薦數(shù)據(jù)集作為目標域。對于視覺模態(tài),使用亞馬遜用于服裝和鞋類的評論數(shù)據(jù)集作為目標域,并使用 H&M 個性化時尚推薦數(shù)據(jù)集作為源域。

e9e889ac-d969-11ee-a297-92fbcf53809c.png

預訓練模型的使用:文本模態(tài)采用 bert-base-uncased 和 roberta-base 模型;圖片模態(tài)采用 vit-base-patch16-224 和 vit-mae-base 模型。

評價標準:論文采用 "leave-one-out"的策略來分割數(shù)據(jù)集:交互序列中的最后一項用于評估,最后一項之前的一項用于驗證,其余的用于訓練。評估指標采用 HR@10(命中率)和 NDCG@10(歸一化累計收益)。所有實驗結(jié)果均為測試集的結(jié)果。

主要發(fā)現(xiàn)

RQ1: 在文本內(nèi)容中,使用 AdaT 的 TransRec 可獲得與 FTA 相當?shù)男阅埽谝曈X場景中性能有所下降。

對比 FTA 和 AdaT 在文本和圖片場景下的實驗結(jié)果如下表所示:

e9f77048-d969-11ee-a297-92fbcf53809c.png

RQ2: 與其他流行的參數(shù)高效微調(diào)的方法相比,經(jīng)典的Houlsby 適配器在 TransRec 中取得了最佳效果。

對比常用不同的參數(shù)高效微調(diào)方法的基準測試:

ea61ddac-d969-11ee-a297-92fbcf53809c.png

RQ3: 該文章認為,TransRec 應為用戶和物品編碼器放置適配器,以獲得最佳效果。插入位置同樣也很重要,Transformer當中的FFN (Feed-Forward Network) 和 MHA (Multi-Head Attentions) 的后面一層都需要單獨的適配器模塊。其次插入方式 (串行或并行) 和 LayerNorm 優(yōu)化等其他因素對于推薦任務的性能上并不重要。

插入適配器的位置到物品 (Ei) 或用戶編碼器 (Eu) 的性能對比:

ea76aaf2-d969-11ee-a297-92fbcf53809c.png

插入適配器到 MHA 和 FFN 之后的位置的性能對比:

ea824b8c-d969-11ee-a297-92fbcf53809c.png

采用序列和并行插入的性能對比:

ea862086-d969-11ee-a297-92fbcf53809c.png

除此之外,該文章還進行了充分的數(shù)據(jù)縮放實驗,發(fā)現(xiàn) TransRec 的遷移學習中如果有更多預訓練的源領(lǐng)域數(shù)據(jù),目標域性能會有更大的提升:

ea90360c-d969-11ee-a297-92fbcf53809c.png

總結(jié)

文章發(fā)現(xiàn)了兩個事實:1)在文本推薦方面,與微調(diào)所有參數(shù) (FTA) 相比,AdaT 取得了有競爭力的結(jié)果;2)在圖像推薦方面,AdaT 性能良好,但略落后于 FTA。

論文對四種著名的 AdaT 方法進行了基準測試,發(fā)現(xiàn)經(jīng)典的 Houlsby 適配器性能最佳。隨后,該文章深入研究了可能影響 AdaT 在推薦任務中的結(jié)果的幾個關(guān)鍵因素。最后,論文發(fā)現(xiàn) TransRec 的 AdaT 和 FTA 符合理想的數(shù)據(jù)縮放效應——TransRec 在增大源領(lǐng)域數(shù)據(jù)時能提升性能。

該工作為模態(tài)推薦模型的參數(shù)高效遷移學習提供了重要指導。它對推薦系統(tǒng)社區(qū)的基礎模型也有重要的實際意義,是實現(xiàn)推薦系統(tǒng)社區(qū)“one model for all”的目標上重要的一環(huán)。該方向未來的工作包括探究圖片推薦當中如何提升 AdaT 的性能以及引入更多不同的模態(tài)等。

審核編輯:黃飛

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 編碼器
    +關(guān)注

    關(guān)注

    45

    文章

    3900

    瀏覽量

    141352
  • 適配器
    +關(guān)注

    關(guān)注

    9

    文章

    2114

    瀏覽量

    70948
  • 推薦系統(tǒng)
    +關(guān)注

    關(guān)注

    1

    文章

    44

    瀏覽量

    10400
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1229

    瀏覽量

    26031

原文標題:WSDM 2024 | 系統(tǒng)探究適配器微調(diào)對于可遷移推薦的影響

文章出處:【微信號:tyutcsplab,微信公眾號:智能感知與物聯(lián)網(wǎng)技術(shù)研究所】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    提高電源適配器效率,滿足六級能效的幾個小秘訣 (附案例)

    提高電源適配器效率,滿足六級能效的幾個小秘訣 (附案例)
    的頭像 發(fā)表于 08-08 11:32 ?4149次閱讀
    提高電源<b class='flag-5'>適配器</b>效率,滿足六級能效的<b class='flag-5'>幾個</b>小秘訣 (附案例)

    電源適配器如何進行鹽霧測試?

    1.電源適配器為什么要做鹽霧測試?電源適配器在儲存、運輸和使用過程,經(jīng)常受到周圍環(huán)境有害因素的影響,電源適配器工作性能、使用可靠性和壽命會
    發(fā)表于 06-26 09:28

    透射適配器

    透射適配器 透射適配器(TMA)也叫透掃描適配器、光罩或是透掃描精靈,主要用于平板式
    發(fā)表于 12-29 11:26 ?719次閱讀

    網(wǎng)絡適配器,什么是網(wǎng)絡適配器

    網(wǎng)絡適配器,什么是網(wǎng)絡適配器 網(wǎng)卡,又稱網(wǎng)絡適配器或網(wǎng)絡接口卡(NIC),英文名為Network Interface Card。在網(wǎng)絡,如果有一臺計算
    發(fā)表于 04-03 14:11 ?2337次閱讀

    光纖適配器是什么_光纖適配器的作用介紹

    本文開始介紹了什么是光纖適配器和光纖適配器的特點,其次分析了光纖適配器性能指標、分類以及常見的幾種光纖連接器,最后闡述了光纖適配器的作用與應用范圍。
    發(fā)表于 02-26 16:22 ?4.2w次閱讀

    分享幾個電源適配器的EMI整改過程

    分享幾個電源適配器的EMI整改過程。
    發(fā)表于 05-30 10:59 ?14次下載

    雜亂的適配器!

    雜亂的適配器
    發(fā)表于 11-07 08:07 ?1次下載
    雜亂的<b class='flag-5'>適配器</b>!

    熱設計軟件在電源適配器設計的應用有哪些?

    熱設計軟件在電源適配器設計的應用有哪些? 熱設計軟件在電源適配器設計的應用有很多,下面將詳細介紹電源適配器設計
    的頭像 發(fā)表于 11-23 15:34 ?1580次閱讀

    如何儲存和運輸電源適配器?如何選擇具有節(jié)能功能的電源適配器?

    如何儲存和運輸電源適配器?如何選擇具有節(jié)能功能的電源適配器? 標題:電源適配器的儲存與運輸及選擇節(jié)能功能的方法 引言: 電源適配器是我們?nèi)粘I?b class='flag-5'>中
    的頭像 發(fā)表于 11-24 14:08 ?2063次閱讀

    移動電源適配器是什么 移動設備的電源適配器有何特點?

    。移動電源適配器通常配備一個或多個充電口,可以連接到移動設備的充電接口,從而為其提供電力。 移動設備的電源適配器具有以下幾個主要特點: 1. 小巧輕便:移動電源適配器通常設計得非常小巧
    的頭像 發(fā)表于 11-24 14:08 ?2190次閱讀

    如何為多設備選擇合適的電源適配器

    多設備選擇合適的電源適配器。 首先,我們需要了解不同設備的功率需求。每個設備都有不同的功率需求,這是選擇電源適配器關(guān)鍵因素。設備的功率要求通常在其說明書上或產(chǎn)品規(guī)格中有明確說明。功率通常以瓦特(W)或安培(
    的頭像 發(fā)表于 11-24 14:15 ?2220次閱讀

    什么是電源適配器的浪涌電流?浪涌電流對電源適配器有何影響?

    什么是電源適配器的浪涌電流?浪涌電流對電源適配器有何影響? 電源適配器的浪涌電流是指在電源啟動或斷開時,由于電源電壓的突變引起的瞬態(tài)電流。這種瞬態(tài)電流瞬間達到峰值,然后逐漸衰減到穩(wěn)定狀態(tài)。 浪涌電流
    的頭像 發(fā)表于 01-30 16:38 ?3257次閱讀

    什么是藍牙適配器?它有哪些性能特點?

    或其他接口與設備連接,然后通過藍牙協(xié)議和其他設備進行數(shù)據(jù)傳輸和通信。 藍牙適配器有以下幾個性能特點: 1. 高度兼容性:藍牙適配器可以兼容不同版本的藍牙協(xié)議,從藍牙1.0到最新的藍牙5.0和藍牙LE(低功耗)技術(shù)。這意味著它可
    的頭像 發(fā)表于 02-02 14:56 ?4886次閱讀

    適配器的電流大于原適配器可以嗎

    適配器的電流大于原適配器是否可行,這是一個涉及到電子設備電源適配器使用和安全性的問題。 一、適配器的基本原理 適配器,也稱為電源
    的頭像 發(fā)表于 08-02 09:38 ?4359次閱讀

    藍牙適配器連接技巧

    在現(xiàn)代生活,藍牙技術(shù)已經(jīng)成為連接各種設備的重要方式。藍牙適配器作為一種小巧的設備,能夠使不具備藍牙功能的設備也能享受到無線連接的便利。 藍牙適配器的類型 在開始連接之前,了解藍牙適配器
    的頭像 發(fā)表于 02-06 17:05 ?2622次閱讀