chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

研究人員提出了“Skim-RNN”的概念,用很少的時間進行快速閱讀

zhKF_jqr_AI ? 2018-01-10 12:41 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)是用于自然語言建模的主流架構(gòu),通常,RNN按順序讀取輸入的token,再輸出每個token的分布式表示。通過利用相同的函數(shù)來循環(huán)更新隱藏狀態(tài),RNN的計算成本將保持不變。雖然這一特點對于某些應(yīng)用來說很常見,但在語言處理過程中,并不是所有token都同等重要,關(guān)鍵要學(xué)會取舍。例如,在問答題中,只對重要部分進行大量計算,不相關(guān)部分分配較少的計算才是有效的方法。

雖然有注意力模型和LSTM等方法提高計算效率或挑選重要任務(wù),但它們的表現(xiàn)都不夠好。在本篇論文中,研究人員提出了“Skim-RNN”的概念,用很少的時間進行快速閱讀,不影響讀者的主要目標。

Skim-RNN的構(gòu)成

研究人員提出了“Skim-RNN”的概念,用很少的時間進行快速閱讀

受人類快速閱讀原理的啟發(fā),Skim-RNN的結(jié)構(gòu)由兩個RNN模型構(gòu)成:較大的默認RNN模型d和較小的RNN模型d’。d和d’是用戶定義的超參數(shù),并且d’<< d。

如果當(dāng)前token比較重要,Skim-RNN就會使用大的RNN;如果不重要,它就會轉(zhuǎn)向使用小的RNN。由于小RNN比大RNN需要的浮點運算次數(shù)更少,所以該模型比單獨使用大RNN所得結(jié)果更快,甚至更好。

推理過程

在每一步驟t中,Skim-RNN將輸入的Xt∈Rd和之前的隱藏狀態(tài)ht-1∈Rd作為其參數(shù),輸出新的狀態(tài)ht。k代表每一步做出harddecision的次數(shù)。在Skim-RNN中,不論是完全閱讀或跳過,k=2。

研究人員使用多項隨機變量Qt對選擇概率分布Pt的決策過程進行建模。Pt表示為:

這里,W∈Rk×2d,b∈Rk。

接下來我們定義隨機變量Qt,通過從概率分布Pt對Qt進行采樣:

如果Qt=1,那么該模型與標準RNN模型一樣。如果Qt=2,那么模型選用了較小RNN模型以獲取較小的隱藏狀態(tài)。即:

其中f是帶有d輸出的完全RNN,而f'是帶有d'輸出的小RNN,d'<< d。

實驗結(jié)果

研究人員在七組數(shù)據(jù)集上對Skim-RNN進行測試,包括分類測試和問答題兩種形式,目的是為了檢驗?zāi)P偷臏蚀_度和浮點運算減少率(Flop-R)。

研究人員提出了“Skim-RNN”的概念,用很少的時間進行快速閱讀

文本分類

在這項任務(wù)中,輸入的是單詞序列,輸出的是分類概率的向量。最終,下表顯示出Skim-RNN模型與LSTM、LSTM-Jump的精確度和計算成本對比。

研究人員提出了“Skim-RNN”的概念,用很少的時間進行快速閱讀

以SST、爛番茄、IMDB和AGnews四個網(wǎng)站為例進行本文分類,在標準LSTM、Skim-RNN、LSTM-Jump和最先進的模型(SOTA)上進行對比

研究人員提出了“Skim-RNN”的概念,用很少的時間進行快速閱讀

改變較小隱藏狀態(tài)的尺寸的影響,以及參數(shù)γ對精確度和計算成本的影響(默認d=100,d'=10,γ=0.02)

下圖是IMDB數(shù)據(jù)集中的一個例子,其中Skim-RNN的參數(shù)為:d=200,d'=10,γ=0.01,最終將本段文字正確分類的概率為92%。

研究人員提出了“Skim-RNN”的概念,用很少的時間進行快速閱讀

其中黑色的字被略過(用小LSTM模型,d'=10),藍色的字表示被閱讀(用較大的LSTM模型,d=200)

和預(yù)期的一樣,模型忽略了類似介詞等不重要的詞語,而注意到了非常重要的單詞,例如“喜歡”、“可怕”、“討厭的”。

回答問題

這項任務(wù)的目的是在給定段落中找到答案的位置。為了檢測Skim-RNN的準確度,研究人員建立了兩個不同的模型:LSTM+注意力和BiDAF。結(jié)果如下所示:

F1和EM值可表明Skim-RNN的準確度。最終發(fā)現(xiàn),速讀(skimming)模型的F1分數(shù)比默認沒有速讀(non-skimming)的模型相同甚至更高,并且計算成本消耗得更少(大于1.4倍)。

LSTM+注意力模型中,不同層的LSTM速度率(skimming rate)隨γ的變化而變化的情況

LSTM+注意力模型的F1分數(shù)。計算成本越大,模型表現(xiàn)得越好。在同樣的計算成本下,Skim LSTM(紅色)比標準LSTM(藍色)的表現(xiàn)要好。另外,Skim-LSTM的F1分數(shù)在不同參數(shù)和計算成本下都更穩(wěn)定

F1分數(shù)與Flop-R之間的關(guān)系

下圖是模型回答問題的一個例子,問題為:最大的建筑項目(construction project)也稱作什么?(正確答案:megaprojects)

模型給出的答案:megaprojects。

研究人員提出了“Skim-RNN”的概念,用很少的時間進行快速閱讀

紅色代表閱讀,白色代表略過

運行時間

上圖顯示了與標準LSTM相比,Skim-LSTM的相對速度增益的隱藏狀態(tài)有不同大小和速度速率。在這一過程中,研究人員使用的是NumPy,并在CPU的單個線程上進行推論。

可以看到,實際增益(實線)和理論增益(虛線)之間的差距無法避免。隨著隱藏狀態(tài)增大,這一差距會減小。所以對于更大的隱藏狀態(tài),Skim-RNN的表現(xiàn)會更好。

結(jié)語

本次研究表明,新型循環(huán)神經(jīng)網(wǎng)絡(luò)Skim-RNN可以根據(jù)輸入的重要性決定使用大的RNN還是小的RNN,同時計算成本比RNN更低,準確度與標準LSTM和LSTM-Jump相比類似甚至更好。由于Skim-RNN與RNN具有相同的輸入輸出接口,因此可以輕松替換現(xiàn)有應(yīng)用中的RNN。

所以,這樣工作適用于需要更高隱藏狀態(tài)的應(yīng)用,比如理解視頻,同時還可以利用小RNN做不同程度的略讀。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標題:用Skim-RNN顯著降低計算成本,實現(xiàn)“速讀”

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    美國普渡大學(xué)和哈佛大學(xué)的研究人員出了一項新發(fā)明 新...

    據(jù)物理學(xué)家組織網(wǎng)報道,美國普渡大學(xué)和哈佛大學(xué)的研究人員出了一項極為應(yīng)景的新發(fā)明:一種外形如同一顆圣誕樹一樣的新型晶體管,其重要組件“門”(柵極)的長度縮減到了突破性的20納米。這個被稱為“4維
    發(fā)表于 02-03 20:30

    研究人員提出了一種柔性可拉伸擴展的多功能集成傳感器陣列

    研究人員提出了一種柔性可拉伸擴展的多功能集成傳感器陣列,成功將電子皮膚的探測能力擴展到7種,實現(xiàn)溫度、濕度、紫外光、磁、應(yīng)變、壓力和接近等多種外界刺激的實時同步監(jiān)測。
    的頭像 發(fā)表于 01-24 15:15 ?8002次閱讀
    <b class='flag-5'>研究人員</b><b class='flag-5'>提出了</b>一種柔性可拉伸擴展的多功能集成傳感器陣列

    日本研究人員利用單晶硅對可見光進行精確的顏色控制

    研究人員最近展示了使用單晶硅對可見光進行精確的顏色控制,該研究成果發(fā)表在納米快報上。
    的頭像 發(fā)表于 02-09 14:20 ?6410次閱讀

    研究人員提出了一系列新的點云處理模塊

    為了探索這些問題的解決辦法、來自倫敦大學(xué)學(xué)院的研究人員提出了一系列新的點云處理模塊,從效率、信息共享和點云卷積操作等方面進行研究,得到了更寬、更深、更快效率更高的點云處理網(wǎng)絡(luò),讓更
    的頭像 發(fā)表于 08-02 14:44 ?3543次閱讀
    <b class='flag-5'>研究人員</b>們<b class='flag-5'>提出了</b>一系列新的點云處理模塊

    Facebook的研究人員提出了Mesh R-CNN模型

    這一研究的目標是通過單張圖像輸入,對圖像中的物體進行檢測、獲取不同物體的類別、掩膜和對應(yīng)的三維網(wǎng)格,并對真實世界中的復(fù)雜模型進行有效處理。在2D深度網(wǎng)絡(luò)的基礎(chǔ)上,研究人員改進并
    的頭像 發(fā)表于 08-02 15:51 ?4528次閱讀
    Facebook的<b class='flag-5'>研究人員</b><b class='flag-5'>提出了</b>Mesh R-CNN模型

    研究人員使用聲音技術(shù)來進行藥物的傳遞

    從電信技術(shù)改造而來的技術(shù)有望實現(xiàn)更有效的癌癥治療。墨爾本研究人員發(fā)現(xiàn),藥物可以通過聲波傳遞到各個細胞中。
    發(fā)表于 03-11 09:38 ?618次閱讀

    研究人員提出了一個名為CommPlan的框架

    使用CommPlan,開發(fā)人員首先使用數(shù)據(jù),領(lǐng)域?qū)I(yè)知識和學(xué)習(xí)算法指定五個模塊-任務(wù)模型,通信功能,通信成本模型,人員響應(yīng)模型和人員可選動作模型。通過對所有模塊的分析組合,得出決策模型,并且在任務(wù)執(zhí)行期間,機器人使用硬件傳感器
    的頭像 發(fā)表于 04-09 14:30 ?2466次閱讀

    研究人員最新開發(fā)出了快速、微米級的電光調(diào)制器

    喬治華盛頓大學(xué)的研究人員首次開發(fā)并演示了一種硅基電光調(diào)制器,該調(diào)制器比最新技術(shù)更小,更快,更高效。
    的頭像 發(fā)表于 04-15 20:07 ?2686次閱讀

    研究人員使用AI教機器人如何將物體交給人類

    英偉達(Nvidia)研究人員在本周發(fā)表的預(yù)印研究論文中提出了一種人類到機器人交接的方法,其中機器人會在半途中遇到人類,對人類的抓握進行分類,并計劃一條從人類手中拿走物體的軌跡。
    發(fā)表于 04-28 17:16 ?1972次閱讀

    研究人員利用3D打印技術(shù)設(shè)計出了微米大小的鏡片

    波蘭華沙大學(xué)的研究人員利用激光直接書寫(DLW)3D打印技術(shù)設(shè)計出了微米大小的鏡片。這種3D打印的透鏡可以在各種材料上制作,包括易碎的石墨烯類材料。
    的頭像 發(fā)表于 05-18 23:36 ?4462次閱讀

    佐治亞理工研究人員通過仿生樹懶推出了自己的巡檢機器人

    生活的快節(jié)奏讓很多人喘不過氣,這種影響似乎也蔓延到了機器人領(lǐng)域。但是來自佐治亞理工學(xué)院的研究人員更看重慢速、高效和節(jié)能,最近他們通過仿生樹懶推出了自己的巡檢機器人,也許這是研究人員第一次將目光放到樹懶這種慵懶的動物身上。
    發(fā)表于 07-08 16:06 ?1425次閱讀

    AI研究人員如何應(yīng)對透明AI

    許多現(xiàn)代的AI系統(tǒng)都在神經(jīng)網(wǎng)絡(luò)上運行,而我們僅了解其基礎(chǔ)知識,因為算法本身很少提供解釋方式。缺乏解釋性通常被稱為AI系統(tǒng)的“黑匣子”。研究人員將注意力集中在神經(jīng)網(wǎng)絡(luò)如何工作的細節(jié)上
    的頭像 發(fā)表于 07-14 16:31 ?2246次閱讀

    研究人員發(fā)現(xiàn)自動駕駛車輛可將交通流量速度大幅提高40%

    研究人員提出了實現(xiàn)有效監(jiān)管的指導(dǎo)方針,發(fā)現(xiàn)即使道路上的自動駕駛車輛不到5%,自動駕駛汽車還是能夠互相配合,以顯著改善交通流量。據(jù)研究人員所說,如果在擁堵道路上出發(fā),自動駕駛汽車能夠在不到2分鐘的
    的頭像 發(fā)表于 09-09 15:20 ?3199次閱讀

    研究人員為鋰硫電池提出一種新陰極設(shè)計概念

    研究團隊,為鋰硫電池(Li–S)提出了一種新穎的陰極設(shè)計概念,將可大幅提升此類具有發(fā)展前景的下一代電池的性能。
    發(fā)表于 12-29 10:48 ?706次閱讀

    如何使用RNN進行時間序列預(yù)測

    一種強大的替代方案,能夠?qū)W習(xí)數(shù)據(jù)中的復(fù)雜模式,并進行準確的預(yù)測。 RNN的基本原理 RNN是一種具有循環(huán)結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò),它能夠處理序列數(shù)據(jù)。在RNN中,每個輸入序列的元素都會通過一個或
    的頭像 發(fā)表于 11-15 09:45 ?1332次閱讀