chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

我們可以使用transformer來干什么?

深度學習自然語言處理 ? 來源:AI部落聯(lián)盟 ? 作者:AI部落聯(lián)盟 ? 2021-04-22 10:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

前言

2021年4月,距離論文“Attention is all you need”問市過去快4年了。這篇論文的引用量正在沖擊2萬大關。

筆者所在的多個學習交流群也經常有不少同學在討論:transformer是什么?transformer能干啥?為什么要用transformer?transformer能替代cnn嗎?怎么讓transformer運行快一點?以及各種個樣的transformer技術細節(jié)問題。

解讀以上所有問題不再本文范疇內,但筆者也將在后續(xù)文章中繼續(xù)探索以上問題。本文重點關注:我們用transformer干啥?

我們用transformer干啥?筆者突然發(fā)現(xiàn)這句話有兩種理解(orz中文博大精深),希望我的語文不是體育老師教的。

疑問句:

我們使用transformer在做什么?

解決什么深度學習任務?

反問句:

我們用用transformer干啥?

為啥不用LSTM和CNN或者其他神經網絡呢?

疑問句:用transformer干啥?

谷歌學術看一眼。

為了簡潔+有理有據回答這個問題(有缺失之處忘大家指出),筆者首先在谷歌學術上搜尋了一下“Attention is all you need”看了一下被引,到底是哪些文章在引用transformer呢?

“Attention is all you need”被引:19616次。

先看一下前幾名引用的被引:

最高引用的“Bert:Pre-training of deep bidirectional transformers for language understanding“被引:17677次。BERT在做自然語言處理領域的語言模型。

第2和4名:“Squeeze and Excitaion Networks”被引用6436次,“Non-local neural networks”。計算機視覺領域,但還沒有直接用transformer。

第3名:“Graph attention networks”被引用3413,一種圖神經網絡,該文也不是直接使用transformer的,但使用了attention。

第5和6名:“Xlnet:Generalized autoregressive pretraining for language undersstanding“ 2318次和 ”Improving language understanding by generative pretraining“ 1876次。自然語言處理領域預訓練/語言模型/生成模型。

第7名“self-attention generative adversarial networks” 1508次?;趕elf-attetnion的生成對抗網絡。

第8、9、10都屬于自然語言處理領域,一個是GLUE數(shù)據集,一個做multi-task learning。

從Top的引用已經看出自然語言處理領域肯定是使用transformer的大頭了。隨后筆者對熟悉的深度學習任務關鍵詞搜了一下被引用:

計算機視覺領域vision前2的被引用:“Vibert”和“Stand-alone self-attetnion in vision model”分別為385和171次。

語音信號處理領域speech:“state-of-the-art speech recognition with sequence-to-sequence model” 被引710次。

多模態(tài)任務modal:“Unicoder-Vl:

A universal encoder for vision and language by cross-model pre-training。

檢索領域etrieval:“multilingual universal sentence encoder for semantic retrieval”被引73次

推薦領域recommendation:驚訝的我發(fā)現(xiàn)居然只有10篇文章orz。

初步結論:transformer在自然語言處理任務中大火,隨后是語音信號領域和計算機視覺領域,然后信息檢索領域也有所啟航,推薦領域文章不多似乎剛剛起步。

執(zhí)著的筆者擴大搜索范圍直接谷歌搜索了一下,找到了這篇文章BERT4Rec(被引用128):”BERT4Rec: Sequential Recommendation with Bidirectional Encoder Representations from Transformer“。

Github上搜一搜。

排名第1的是HuggingFace/transformers代碼庫。筆者對這個庫還算熟悉,但最近瘋狂新增的模型缺失還沒有完全跟進過,于是也整理看了一下。

7d5ac588-a295-11eb-aece-12bb97331649.png

圖1 HuggingFace/transformers代碼庫關系圖

如圖1所示,左邊展示了Huggingface/transformers代碼庫能處理的各種深度學習任務,中間展示的是處理這些任務的統(tǒng)一流水線(pipeline),右邊展示的是與任務對應的transformers模型名稱,下方表示用transformers解決這些深度學習任務可以在cpu或者gpu上進行,可以使用tensorflow也可以使用pytorch框架。

那么根據谷歌和github結果基本可以得到這個核心結論啦:transformer能干啥?目前已有的transformer開源代碼和模型里自然語言處理任務占大頭(幾乎覆蓋了所有自然語言處理任務),隨后是計算機視覺和語音信號處理,最后自然而然進行多模態(tài)信號處理啦,推薦系統(tǒng)中的序列建模也逐步開始應用transformer啦。

有一點值得注意:自然語言處理里,所有研究同學的詞表庫基本統(tǒng)一,所有谷歌/facebook在大規(guī)模語料上預訓練的transformer模型大家都可以使用。推薦系統(tǒng)不像自然語言處理,各家對user ID,Item ID或者物品類別ID的定義是不一樣的,所以各家的pretrain的模型基本也沒法分享給其他家使用(哈哈哈商業(yè)估計也不讓分享),也或許也是為什么transformer的開源推薦系統(tǒng)較少的原因之一吧,但不代表各大廠/研究機構用的少哦。

反問句:用transformer干啥?

為什么非要使用transformer呢?

筆者從一個散修(哈哈修仙界對修煉者的一種稱呼)的角度聊一聊自己的看法。

不得不用。

首先谷歌/Facebook一眾大廠做出來了基于transformer的BERT/roberta/T5等,刷新了各種任務的SOTA,還開源了模型和代碼。

注意各種任務啊,啊這,咱們做論文一般都得在幾個數(shù)據集上驗證自己的方法是否有效,人家都SOTA了,咱得引,得復現(xiàn)呀,再說,站在巨人的肩上創(chuàng)下新SOTA也是香的。

的確好用。

Transformer是基于self-attetion的,self-attention的確有著cnn和lstm都沒有的優(yōu)勢:

比如比cnn看得更寬更遠,比lstm訓練更快。

重復累加多層multi-head self-attetion還在被不短證明著其強大的表達能力!

改了繼續(xù)用。

如果不說transformer的各種優(yōu)點,說一個大缺點自然就是:

參數(shù)量大、耗時耗機器。

但這些問題又被一眾efficient transformers再不斷被解決。

比如本來整型數(shù)運算的硬件開發(fā)板無法使用transformers,隨后就有INT-BERT說我們不僅可以用,還能更快更好。

上手就用。

以Huggingface/Transformers為例子,一個代碼庫包含多種深度學習任務,多個開源的transfromer模型,各種預訓練transformer模型,以至于各種深度學習任務上手就來,十分方便。

筆者似乎并沒有看到其他模型結構有如此大的應用范圍和規(guī)模了。

未來還要用。

從上一章節(jié)可以看出,transformer這股風已經從自然語言處理領域吹出去了,其他領域的SOTA也在不斷被transformer打破,那么以為這,自然語言處理領域的歷史逐漸在其他領域復現(xiàn)(當然只是筆者個人觀點哈)。

原文標題:我們用transformer干啥?

文章出處:【微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Transforme
    +關注

    關注

    0

    文章

    12

    瀏覽量

    8937
  • 深度學習
    +關注

    關注

    73

    文章

    5589

    瀏覽量

    123878

原文標題:我們用transformer干啥?

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    Transformer如何讓自動駕駛變得更聰明?

    ]自動駕駛中常提的Transformer本質上是一種神經網絡結構,最早在自然語言處理里火起來。與卷積神經網絡(CNN)或循環(huán)神經網絡(RNN)不同,Transformer能夠自動審視所有輸入信息,并動態(tài)判斷哪些部分更為關鍵,同時可以
    的頭像 發(fā)表于 11-19 18:17 ?1857次閱讀

    科普|5G CPE是什么?可以干什么用?

    在很多項目中,經常會遇到5GCPE設備,很多小伙伴不知道5GCPE是什么設備?具體有哪些用途。首先我們要知道什么是CPE?這是英文CustomerPremiseEquipment的縮寫,可以翻譯成
    的頭像 發(fā)表于 08-14 17:38 ?7864次閱讀
    科普|5G CPE是什么?<b class='flag-5'>可以</b><b class='flag-5'>干什么</b>用?

    可以使用 wiced_hal_write_nvram API 更改 BD 地址嗎?

    /WICED-Module-Programmer-Download/td-p/290595 我想知道模塊中正確的地址或 SV ID BD 地址在哪里? 我可以使用 wiced_hal_write_nvram API 更改 BD 地址嗎?
    發(fā)表于 07-03 06:20

    請問下CYW20829 是否可以使用miniprog3燒錄呢?

    請問下CYW20829 是否可以使用miniprog3燒錄呢? 我嘗試MTB programmer無法識別miniprog3,PSOC programmer識別后貌似不支持20829的燒錄。
    發(fā)表于 07-01 07:00

    芯片前端設計與后端設計的區(qū)別

    前端設計(Front-end Design):聚焦于電路的邏輯功能實現(xiàn)。本質上是在“紙上”設計電路,包括芯片要“干什么”,要“如何運算”。
    的頭像 發(fā)表于 05-16 14:56 ?962次閱讀

    粘接聚酰亞胺PI膜除了使用PI膜專用UV膠粘接,還可以使用熱固化環(huán)氧膠解決!

    粘接聚酰亞胺PI膜可以使用PI膜專用UV膠粘接,但使用UV膠粘接時,需要粘接材料至少有一方要透UV紫外光方可,如不能透UV光,那么粘接PI這種難于粘接的材料時,還可以使用熱固化環(huán)氧膠解決!熱固化環(huán)
    的頭像 發(fā)表于 05-07 09:11 ?1087次閱讀
    粘接聚酰亞胺PI膜除了使用PI膜專用UV膠粘接,還<b class='flag-5'>可以使</b>用熱固化環(huán)氧膠<b class='flag-5'>來</b>解決!

    鉗形表是干什么用的?點開看看就知道了

    的運行過程中,我們需要實時了解電路中的電流大小,以判斷設備是否正常工作。比如工廠里的大型電機,通過鉗形表可以快速準確地測量電機運行時的電流。如果電流值超出了正常范圍,就可能意味著電機存在故障,需要及時檢修
    發(fā)表于 05-06 15:34

    是否可以使用FX2LP對XCF02SVO20C進行編程?

    我們有一款使用 FX2LP 和 XCF02SVO20C PROM 的產品。在我們的系統(tǒng)中,我們利用 PROM 更新 FPGA 固件。由于我不是固件專家,我想問是否
    發(fā)表于 05-06 09:48

    請問圖片中電路板的功能?

    朋友們幫看看,這電路模塊是干什么用的?
    發(fā)表于 04-14 09:40

    gtta光纜是干什么

    扮演著重要角色。它主要用于室外通信,如饋線和配線等,特別是在接入網中。此外,它還可以用于管道、非金屬自承架空等常規(guī)敷設方式,以及樓道內豎井布線。 二、結構特點 纜芯:光纜的纜芯由一定數(shù)量的光纖組成,這些光纖按照一定方式排列并形成纜
    的頭像 發(fā)表于 03-06 10:21 ?857次閱讀

    AI云服務平臺可以干什么

    當今,AI云服務平臺,作為連接技術與應用的橋梁,正以其廣泛的功能覆蓋和深度應用場景,逐步滲透到社會經濟的各個角落。下面,AI部落小編帶您詳細了解AI云服務平臺。
    的頭像 發(fā)表于 02-27 10:11 ?1013次閱讀
    AI云服務平臺<b class='flag-5'>可以</b><b class='flag-5'>干什么</b>

    如何使用MATLAB構建Transformer模型

    Transformer 模型在 2017 年由 Vaswani 等人在論文《Attentionis All You Need》中首次提出。其設計初衷是為了解決自然語言處理(Nature
    的頭像 發(fā)表于 02-06 10:21 ?5700次閱讀
    如何使用MATLAB構建<b class='flag-5'>Transformer</b>模型

    transformer專用ASIC芯片Sohu說明

    2022年,我們打賭說transformer會統(tǒng)治世界。 我們花了兩年時間打造Sohu,這是世界上第一個用于transformer(ChatGPT中的“T”)的專用芯片。 將
    的頭像 發(fā)表于 01-06 09:13 ?1657次閱讀
    <b class='flag-5'>transformer</b>專用ASIC芯片Sohu說明

    安泰高壓大功率放大器可以干什么用途

    放大器的基本原理 高壓大功率放大器的基本原理是通過增加輸入信號的幅度和驅動電壓產生大功率輸出。它通常由功率放大電路、電源供應系統(tǒng)和保護電路組成。功率放大電路使用適當?shù)姆糯笃髌骷ㄈ缯婵展堋⒕w管或功率模塊)
    的頭像 發(fā)表于 12-10 10:30 ?830次閱讀
    安泰高壓大功率放大器<b class='flag-5'>可以</b><b class='flag-5'>干什么</b>用途

    PLM項目管理系統(tǒng)主要干什么?制造業(yè)企業(yè)的PLM應用與效益

    在制造業(yè)的數(shù)字化轉型浪潮中,PLM(Product Lifecycle Management,產品全生命周期管理)項目管理系統(tǒng)扮演著至關重要的角色。那么,PLM項目管理系統(tǒng)主要干什么呢?簡而言之
    的頭像 發(fā)表于 12-04 11:19 ?1891次閱讀
    PLM項目管理系統(tǒng)主要<b class='flag-5'>干什么</b>?制造業(yè)企業(yè)的PLM應用與效益