chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

根據(jù)關鍵詞了解機器學習的趨勢窺探

zhKF_jqr_AI ? 來源:未知 ? 作者:易水寒 ? 2018-04-02 11:06 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

編者按:“趨勢”表現(xiàn)了事物發(fā)展的動向,它的目標可以是模糊的,但這種持續(xù)的前進反映到數(shù)據(jù)上是明確的。去年4月,特斯拉AI總監(jiān)Andrej Karpathy發(fā)表了一篇A Peek at Trends in Machine Learning,揭示了機器學習論文總數(shù)(arxiv)、深度學習框架、CNN模型、優(yōu)化算法及研究人員的發(fā)展趨勢。而就在幾天前,他又更新了一波數(shù)據(jù),并從中看到了一種非常有趣的變化。

注:本文已更新論文總數(shù)與流行框架排名,其余內容仍為2017年4月數(shù)據(jù)。

好像少了點啥

不知道各位讀者有沒有用過Google Trends,這是一個很cool的工具——輸入關鍵詞,你就能查看相應Google搜索結果隨時間發(fā)生的變化。而現(xiàn)在,我們也已經有了一個機器學習論文庫arxiv-sanity,它在過去6年內積累了43108篇(arxiv)相關論文,所以我們?yōu)槭裁床宦渎渌滋祝瞾砜纯?年來機器學習研究的演變情況呢?

注:該論文庫由Andrej Karpathy創(chuàng)建,由于機器學習涉及內容過廣,文中很大一部分都圍繞深度學習展開,尤其是Andrej Karpathy熟悉的領域。

arxiv奇點

首先我們先來看看arxiv-sanity上的論文總數(shù)(cs.AI,cs.LG,cs.CV,cs.CL,cs.NE,stat.ML)。截至去年4月,arxiv-sanity共收錄28303篇機器學習論文,其中僅在2017年3月,數(shù)據(jù)庫就突增近2000份新論文,機器學習學術成果迎來爆發(fā)期。

根據(jù)關鍵詞了解機器學習的趨勢窺探

arxiv上ML論文提交量變化

而就在短短一年后,arxiv-sanity上的論文總數(shù)已經突破43000篇,考慮到近年來機器學習國際頂會的熱門程度,我們先來看看幾個主要會議(去年4月后)的“吸金”能力:

根據(jù)關鍵詞了解機器學習的趨勢窺探

雖然參與會議投稿的論文未必都會提交給arxiv,但可以看出,2017年以前,arxiv-sanity上收錄的論文總量尚不足3萬篇,而去年光這幾個會議就吸引了近2萬篇投稿,另外還有其他的頂會數(shù)據(jù)未計入其中,機器學習的熱度可見一斑。

當然,這也帶來了一個問題,就是學者需要通過閱讀大量論文才能從中篩選出真正有價值的內容,這也是許多人開始詬病頂會“灌水”嚴重的一個要因。但本文只關注發(fā)展趨勢,因此這些論文總數(shù)將作為分母,用來分析一些有趣的關鍵詞“現(xiàn)象”。

深度學習框架

談及機器學習,一個不可避免的熱門關鍵詞是深度學習框架,那么學術界更偏好哪種框架呢?我們匯總了去年和今年的統(tǒng)計結果,請結合表格對比感受:

根據(jù)關鍵詞了解機器學習的趨勢窺探

需要注意的是,這里我們的分母是統(tǒng)計的論文總數(shù),以2017年3月為例,TensorFlow(9.1%)指在去年3月投到arxiv的機器學習論文中,有將近10%提到了TensorFlow,當然這也意味著該月的大多數(shù)論文并沒有介紹自己使用的框架。但如果我們假設論文指出使用框架的現(xiàn)象遵循某種固定的隨機概率,那么經過粗略估計,我們可以猜測大約有40%的實驗室正在使用TensorFlow。而今年2月TensorFlow的比例提升到了14.3%,再算上把TF作為后端的各類框架,毫無疑問,TensorFlow確實是大多數(shù)學術界人士的首選框架。

而Caffe和Theano由于“歷史悠久”,已經積累了數(shù)量可觀的老用戶和論文基礎,因此它們的占比仍然很突出。

根據(jù)關鍵詞了解機器學習的趨勢窺探

2017年4月前各框架發(fā)展情況

為了更直觀地感受各框架的發(fā)展趨勢,我們來看看去年和今年的這兩幅圖。上圖中紫色的Caffe和深藍色的Theano在很長一段時間內深受學界歡迎,而綠色的TensorFlow在2016年異軍突起,只用一年時間就超越了“前輩”,增長勢頭顯著。當時Andrej Karpathy曾預測Caffe和Theano的市場占有率會緩慢下降,同時TensorFlow的增長也會減緩,他更看好當時幾乎沒有存在感的PyTorch。

根據(jù)關鍵詞了解機器學習的趨勢窺探

2018年3月前各框架發(fā)展情況

果不其然,最近的這幅統(tǒng)計圖顯示,粉色的TensorFlow經歷了兩年增長,至2017年年末開始趨向平穩(wěn),而Caffe和Theano的曲線幾乎同步下降,后者的占有率已跌至第五位,還在第二位苦苦掙扎的Caffe也被“后起之秀”Keras和PyTorch趕上。其中最亮眼的是PyTorch,這個在2017年3月不足0.2%的框架到2018年2月已經達到4.7%,考慮到近年來論文的爆炸式增長,PyTorch前景可期,拿原twitter下的留言來說,就是:

PyTorch is on fire! ( PyTorch要火?。?/p>

CNN模型

CNN最初是為解決圖像識別等問題設計的,當然其現(xiàn)在的應用不僅限于圖像和視頻,也可用于時間序列信號,比如音頻信號、文本數(shù)據(jù)等。在處理上述這些問題時,除了特殊情況,通常我們不會從頭新建一個CNN,而是在已有模型的基礎上調整參數(shù)。那么,哪個是最受歡迎的CNN模型呢?Andrej Karpathy沒有更新模型的相關數(shù)據(jù),所以我們仍以去年的數(shù)據(jù)為準。

根據(jù)關鍵詞了解機器學習的趨勢窺探

CNN有四大經典模型:AlexNet、VGGNet、Google Inception Net和ResNet。從上圖我們可以看到,在關于AlexNet的論文開始大量出現(xiàn)前,Inception在較長時間內一枝獨秀,2014年年末,AlexNet迎來快速增長,并長期穩(wěn)定在高水平位置。而就在一年后,ResNet也迎來爆發(fā)期,到2017年3月占比9%,躍升至第一位。

優(yōu)化算法

就優(yōu)化算法而言,Adam是毫無疑問的“掌門人”。截至去年4月,約23%的機器學習論文都提到了它。當然我們很難估計它的實際使用占比:它可能高于23%,因為一些論文沒有介紹使用的優(yōu)化算法,其中的大部分甚至根本沒有提及神經網(wǎng)絡優(yōu)化;它也可能需要在23%的基礎上減去5%,因為這個關鍵詞不是手動提取的,所以不排除論文里的Adam其實是個人名,而且作為一個優(yōu)化算法,Adam的提出時間是2014年12月。

根據(jù)關鍵詞了解機器學習的趨勢窺探

研究人員

雖然現(xiàn)在大家對Deep Learning熱情高漲,業(yè)界也有大量被追捧的專家偶像,但這些偶像真的適合每個人嗎?你追的偶像是不是真正的專家?從論文實際引用情況來看,哪些人的論文“含金量”更高?Andrej Karpathy也用數(shù)據(jù)給了我們一點啟示。

根據(jù)關鍵詞了解機器學習的趨勢窺探

上文中由上往下的四個人分別是Bengio、Lecun、Hinton、Schmidhuber,他們是業(yè)內公認的對深度學習貢獻最大的四名活躍學者??梢园l(fā)現(xiàn),Bengio在論文中的出現(xiàn)次數(shù)和Hinton齊頭并進,以35%位列首位,而Hinton則以30%排名第二。但考慮到Yoshua Bengio的弟弟Samy同樣在機器學習領域有不錯的成就,35%這個占比含有一定水分。

另外需要提的一位是LSTM之父Jürgen Schmidhuber,他的論文引用量也頗為可觀。Schmidhuber現(xiàn)任瑞士人工智能實驗室主管,因為喜歡自己獨立研究,可能國內對他的關注度不高,但這不妨礙業(yè)界對他的肯定。這里介紹一篇他的新作One Big Net For Everything,除了標題看得讓人害怕,引用的文獻都有將近一半是他參與寫的,感興趣的讀者可以參考著體會下大神的腦回路。

熱門/冷門的關鍵詞

Andrej Karpathy同樣爬取了論文中的一些關鍵詞,并觀察了它們的熱度情況。

根據(jù)關鍵詞了解機器學習的趨勢窺探

根據(jù)關鍵詞了解機器學習的趨勢窺探

以上數(shù)值是這樣計算的:以resnet為例,2016年3月前它的出現(xiàn)頻率只有1.044%,而它在2017年3月的出現(xiàn)頻率是8.53%,因此它的熱度增長為8.53/1.044?=8.17。這樣對比下來,去年最熱門的論文關鍵詞依次是ResNets、GANs、Adam、BatchNorm,而最受歡迎的研究領域則是風格遷移、深度強化學習、神經機器翻譯、圖像生成,熱門架構的排名則是FCN、LSTM/GRU、連體網(wǎng)絡和編碼-解碼網(wǎng)絡。

根據(jù)關鍵詞了解機器學習的趨勢窺探

另外,一些關鍵詞也被研究人員們“無情”地拋進了角落。雖然不清楚排名第一的fractal具體指什么,但估計是貝葉斯參數(shù)那一塊的內容。

根據(jù)關鍵詞了解機器學習的趨勢窺探

小結

看完全文,你的“將基于全卷積編碼-解碼批規(guī)范化架構、經Adam優(yōu)化處理的ResNet GAN用于風格遷移”這篇論文準備得怎么樣了(英文名字都幫你想好了,就叫Fully Convolutional Encoder Decoder BatchNorm ResNet GAN applied to Style Transfer, optimized with Adam),這個選題聽起來也不怎么離譜嘛:)

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器學習
    +關注

    關注

    66

    文章

    8546

    瀏覽量

    136522
  • 深度學習
    +關注

    關注

    73

    文章

    5594

    瀏覽量

    124142

原文標題:PyTorch要火!Andrej Karpathy更新機器學習趨勢窺探

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    科普:12大關鍵詞讓你了解機器學習

    隨著人工智能(AI)技術對各行各業(yè)有越來越深入的影響,我們也更多地在新聞或報告中聽到“機器學習”、“深度學習”、“增強學習”、“神經網(wǎng)絡”等詞匯,對于非專業(yè)人士來說略為玄幻。這篇文章為
    發(fā)表于 05-30 14:39 ?3196次閱讀

    [討論]提高網(wǎng)站關鍵詞排名的28個SEO小技巧

    提高網(wǎng)站關鍵詞排名的28個SEO小技巧關鍵詞位置、密度、處理 URL中出現(xiàn)關鍵詞(英文) 網(wǎng)頁標題中出現(xiàn)關鍵詞(1-3個) 關鍵詞標簽中出現(xiàn)
    發(fā)表于 12-01 17:08

    亞馬遜代運營 amazon Search term 關鍵詞填寫的“神技”

    、轉化率,且與自己產品相關的關鍵詞,單獨拿出來放進 search term 里面進行優(yōu)化 listing 的操作。2.自己利用一些工具去篩選出一些買家搜索,然后根據(jù)自己對產品的理解,買家的搜索習慣,適當
    發(fā)表于 06-05 15:41

    HanLP關鍵詞提取算法分析詳解

    ,也受窗口大小的影響。雖然說代碼是大致看懂了,但是還是有一些疑問的:比如,為什么用上面那個公式計算,得分高的詞語就是關鍵詞了?根據(jù)TextRank求關鍵詞與Term Frequency求關鍵詞
    發(fā)表于 11-05 10:41

    關鍵詞優(yōu)化有哪些實用的方法

    是做文章更新,交換友情鏈接,但是他們對于這里的意義卻比較陌生還有對于其它的一些優(yōu)化的手段是不了解的,那么我們在做seo排名的時候應該怎么擁有一套實用的方法來優(yōu)化我們的關鍵詞呢?接下來東莞seo博客
    發(fā)表于 08-11 01:19

    百度關鍵詞排名掉完了怎么辦

    一夜之間關鍵詞排名掉完了,沒有被K,也沒有出現(xiàn)違規(guī)操作,這是怎么回事呢?
    發(fā)表于 01-27 11:01

    #2023,你的 FPGA 年度關鍵詞是什么? #

    FPGA 年度關鍵詞,我的想法是“標準化”;今年的工作中遇到了不少同事的issues,本身都是小問題或者很細節(jié)的東西但是卻反復出現(xiàn)問題,目前想到的最好的辦法是做好設計規(guī)則的標準化才能避免,不知道大家有沒有更好的建議?
    發(fā)表于 12-06 20:31

    IT產業(yè)2012熱點趨勢:智能化成關鍵詞

      3月25日下午消息,2012年深圳IT峰會今日召開,數(shù)字中國常務理事、金沙江創(chuàng)投董事總經理丁健受組委會委托發(fā)布2012年IT產業(yè)熱點和趨勢,其中智能化成為關鍵詞。
    發(fā)表于 03-26 09:12 ?1150次閱讀

    基于強度熵解決中文關鍵詞識別

    文本的關鍵詞識別是文本挖掘中的基本問題之一。在研究現(xiàn)有基于復雜網(wǎng)絡的關鍵詞識別方法的基礎上,從整個復雜網(wǎng)絡拓撲結構特征的信息缺失角度來考察各節(jié)點的重要程度。提出強度熵測度來量化評估各節(jié)點重要程度,用于解決中文關鍵詞識別問題。實驗
    發(fā)表于 11-24 09:54 ?7次下載
    基于強度熵解決中文<b class='flag-5'>關鍵詞</b>識別

    基于自動關鍵詞抽取方法

    自動關鍵詞抽取是從文本或文本集合中自動抽取主題性或重要性的或短語,是文本檢索、文本摘要等許多文本挖掘任務的基礎性和必要性的工作.探討了關鍵詞和自動關鍵詞抽取的內涵,從語言學、認知科學
    發(fā)表于 12-26 16:47 ?2次下載
    基于自動<b class='flag-5'>關鍵詞</b>抽取方法

    三大“關鍵詞”來了解AI

    面對人工智能即將開啟的新疆域,正在建設具有全球影響力科創(chuàng)中心的上海雄心勃勃,立志在人工智能領域形成世界級新興產業(yè)集群。那么,上海創(chuàng)新該如何玩轉“AI”呢?業(yè)內專家學者不約而同建言三大“關鍵詞”。
    的頭像 發(fā)表于 01-21 11:16 ?4954次閱讀

    2020年云計算發(fā)展六大關鍵詞,以及六大關鍵詞背后的重要趨勢

    中國信通院云計算與大數(shù)據(jù)研究所副所長栗蔚在會上正式發(fā)布并解讀白皮書,披露了中國信通院基于對云計算市場的長期觀察和研究,總結出的2020年云計算發(fā)展六大關鍵詞,以及六大關鍵詞背后的重要趨勢。
    的頭像 發(fā)表于 08-24 11:02 ?1.1w次閱讀
    2020年云計算發(fā)展六大<b class='flag-5'>關鍵詞</b>,以及六大<b class='flag-5'>關鍵詞</b>背后的重要<b class='flag-5'>趨勢</b>

    融合BERT向量與TextRank的關鍵詞抽取方法

    結合文檔本身的結構信息與外部詞語的語義信息,提出一種融合BERT向量與 Textrank的關鍵詞抽取方法。在基于網(wǎng)絡圖的 Textrank方法基礎上,引入語義差異性并利用BERT向量加權方式優(yōu)化
    發(fā)表于 03-21 09:55 ?18次下載
    融合BERT<b class='flag-5'>詞</b>向量與TextRank的<b class='flag-5'>關鍵詞</b>抽取方法

    淺談京東關鍵詞

    一、京東搜索關鍵詞的核心特性 支持中文直接搜索 :京東官網(wǎng)支持中文關鍵詞輸入(如 “筆記本電腦”、“華為手機”),但在 HTTP 請求中,中文關鍵詞會被自動進行 URL 編碼 (將中文轉換為%XX
    的頭像 發(fā)表于 01-04 10:40 ?223次閱讀

    京東關鍵詞的應用

    京東關鍵詞應用核心是圍繞搜索匹配與流量獲取,貫穿商品上架、搜索優(yōu)化、付費推廣、精細化運營等全鏈路,以精準匹配用戶需求、提升排名與轉化為目標。以下是具體應用與實操方法: 一、關鍵詞分類與篩選
    的頭像 發(fā)表于 01-20 09:05 ?237次閱讀