chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

深度分析RNN的模型結(jié)構(gòu),優(yōu)缺點(diǎn)以及RNN模型的幾種應(yīng)用

智能感知與物聯(lián)網(wǎng)技術(shù)研究所 ? 來源:人工智能與算法學(xué)習(xí) ? 作者:人工智能與算法學(xué) ? 2021-05-13 10:47 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)的載體,而神經(jīng)網(wǎng)絡(luò)模型中,最經(jīng)典非RNN模型所屬,盡管它不完美,但它具有學(xué)習(xí)歷史信息的能力。后面不管是encode-decode 框架,還是注意力模型,以及自注意力模型,以及更加強(qiáng)大的Bert模型家族,都是站在RNN的肩上,不斷演化、變強(qiáng)的。

這篇文章,闡述了RNN的方方面面,包括模型結(jié)構(gòu),優(yōu)缺點(diǎn),RNN模型的幾種應(yīng)用,RNN常使用的激活函數(shù),RNN的缺陷,以及GRU,LSTM是如何試圖解決這些問題,RNN變體等。

這篇文章最大特點(diǎn)是圖解版本,其次語言簡(jiǎn)練,總結(jié)全面。

概述

傳統(tǒng)RNN的體系結(jié)構(gòu)。Recurrent neural networks,也稱為RNNs,是一類允許先前的輸出用作輸入,同時(shí)具有隱藏狀態(tài)的神經(jīng)網(wǎng)絡(luò)。它們通常如下所示:

e2923ba4-b364-11eb-bf61-12bb97331649.png

對(duì)于每一時(shí)步 , 激活函數(shù) ,輸出 被表達(dá)為:

這里是時(shí)間維度網(wǎng)絡(luò)的共享權(quán)重系數(shù)

是激活函數(shù)

e2a0bf26-b364-11eb-bf61-12bb97331649.png

下表總結(jié)了典型RNN架構(gòu)的優(yōu)缺點(diǎn):

處理任意長(zhǎng)度的輸入 計(jì)算速度慢
模型形狀不隨輸入長(zhǎng)度增加 難以獲取很久以前的信息
計(jì)算考慮了歷史信息 無法考慮當(dāng)前狀態(tài)的任何未來輸入
權(quán)重隨時(shí)間共享
優(yōu)點(diǎn) 缺點(diǎn)

RNNs應(yīng)用

RNN模型主要應(yīng)用于自然語言處理和語音識(shí)別領(lǐng)域。下表總結(jié)了不同的應(yīng)用:

一對(duì)一

e2d8925c-b364-11eb-bf61-12bb97331649.png

傳統(tǒng)神經(jīng)網(wǎng)絡(luò)

一對(duì)多

e2e514fa-b364-11eb-bf61-12bb97331649.png

音樂生成

多對(duì)一

e2f52660-b364-11eb-bf61-12bb97331649.png

e303047e-b364-11eb-bf61-12bb97331649.png

機(jī)器翻譯e31699da-b364-11eb-bf61-12bb97331649.png

RNN 類型圖解例子

對(duì)于RNN網(wǎng)絡(luò),所有時(shí)間步的損失函數(shù) 是根據(jù)每個(gè)時(shí)間步的損失定義的,如下所示:損失函數(shù)

時(shí)間反向傳播

在每個(gè)時(shí)間點(diǎn)進(jìn)行反向傳播。在時(shí)間步,損失相對(duì)于權(quán)重矩陣的偏導(dǎo)數(shù)表示如下:

處理長(zhǎng)短依賴

常用激活函數(shù)

RNN模塊中最常用的激活函數(shù)描述如下:

5e33166de-b364-11eb-bf61-12bb97331649.png

e33ef948-b364-11eb-bf61-12bb97331649.png

e3539de4-b364-11eb-bf61-12bb97331649.png

SigmoidTanhRELU

梯度消失/爆炸

在RNN中經(jīng)常遇到梯度消失和爆炸現(xiàn)象。之所以會(huì)發(fā)生這種情況,是因?yàn)楹茈y捕捉到長(zhǎng)期的依賴關(guān)系,因?yàn)槌朔ㄌ荻瓤梢噪S著層的數(shù)量呈指數(shù)遞減/遞增。

梯度修剪

梯度修剪是一種技術(shù),用于執(zhí)行反向傳播時(shí),有時(shí)遇到的梯度爆炸問題。通過限制梯度的最大值,這種現(xiàn)象在實(shí)踐中得以控制。

e367c954-b364-11eb-bf61-12bb97331649.png

門的類型

為了解決消失梯度問題,在某些類型的RNN中使用特定的門,并且通常有明確的目的。它們通常標(biāo)注為,等于:

其中,是特定于門的系數(shù),是sigmoid函數(shù)。主要內(nèi)容總結(jié)如下表:

Gated Recurrent Unit(GRU)和長(zhǎng)-短期記憶單元(LSTM)處理傳統(tǒng)RNNs遇到的消失梯度問題,LSTM是GRU的推廣。下表總結(jié)了每種結(jié)構(gòu)的特征方程:GRU/LSTM

e3730e68-b364-11eb-bf61-12bb97331649.png

注:符號(hào)表示兩個(gè)向量之間按元素相乘。

RNN的變體

下表總結(jié)了其他常用的RNN模型:

e3a643e6-b364-11eb-bf61-12bb97331649.png

e3e31410-b364-11eb-bf61-12bb97331649.png

Bidirectional (BRNN)Deep (DRNN)

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 函數(shù)
    +關(guān)注

    關(guān)注

    3

    文章

    4413

    瀏覽量

    67197
  • rnn
    rnn
    +關(guān)注

    關(guān)注

    0

    文章

    92

    瀏覽量

    7329

原文標(biāo)題:神經(jīng)網(wǎng)絡(luò)RNN圖解!

文章出處:【微信號(hào):tyutcsplab,微信公眾號(hào):智能感知與物聯(lián)網(wǎng)技術(shù)研究所】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    無刷電機(jī)轉(zhuǎn)子永磁體的幾種結(jié)構(gòu)優(yōu)缺點(diǎn)

    幾種中,表貼式是最為常用的一種,即弧形磁片(釹鐵硼或鐵氧體磁瓦)粘貼在轉(zhuǎn)子鐵心表面的結(jié)構(gòu),磁片內(nèi)外圓可以采用不同心設(shè)計(jì)而形成不等寬氣隙,使反電動(dòng)勢(shì)波形接近正弦波。
    的頭像 發(fā)表于 01-16 14:27 ?79次閱讀
    無刷電機(jī)轉(zhuǎn)子永磁體的<b class='flag-5'>幾種</b><b class='flag-5'>結(jié)構(gòu)</b><b class='flag-5'>優(yōu)缺點(diǎn)</b>

    一文讀懂LSTM與RNN:從原理到實(shí)戰(zhàn),掌握序列建模核心技術(shù)

    RNN的核心局限。今天,我們從原理、梯度推導(dǎo)到實(shí)踐,全面解析這兩大經(jīng)典模型。一、基礎(chǔ)鋪墊:RNN的核心邏輯與痛點(diǎn)RNN的核心是讓模型“記住
    的頭像 發(fā)表于 12-09 13:56 ?1034次閱讀
    一文讀懂LSTM與<b class='flag-5'>RNN</b>:從原理到實(shí)戰(zhàn),掌握序列建模核心技術(shù)

    正確的連接電機(jī)傳動(dòng)軸的幾種常見連接方式及其優(yōu)缺點(diǎn)

    方式及其優(yōu)缺點(diǎn)分析。 1. 聯(lián)軸器連接 ? 聯(lián)軸器是電機(jī)與傳動(dòng)軸之間最常用的連接方式之一,其核心功能是傳遞扭矩并補(bǔ)償兩軸之間的偏差(如徑向、軸向或角向偏差)。根據(jù)結(jié)構(gòu)不同,聯(lián)軸器可分為以下幾類: ? (1)剛性聯(lián)軸器 ?
    的頭像 發(fā)表于 09-10 07:41 ?2463次閱讀

    模型推理顯存和計(jì)算量估計(jì)方法研究

    、顯存估計(jì)方法 基于模型結(jié)構(gòu)的顯存估計(jì) 根據(jù)深度學(xué)習(xí)模型的層次結(jié)構(gòu)和參數(shù)數(shù)量,可以估算模型在推理
    發(fā)表于 07-03 19:43

    模型在半導(dǎo)體行業(yè)的應(yīng)用可行性分析

    的應(yīng)用,比如使用機(jī)器學(xué)習(xí)分析數(shù)據(jù),提升良率。 這一些大模型是否真的有幫助 能夠在解決工程師的知識(shí)斷層問題 本人純小白,不知道如何涉足這方面 應(yīng)該問什么大模型比較好,或者是看什么視頻能夠涉足這個(gè)行業(yè)
    發(fā)表于 06-24 15:10

    FA模型卡片和Stage模型卡片切換

    ,Stage卡片配置在module.json5和form_config.json中(如下圖1和圖2)。 卡片業(yè)務(wù)邏輯:FA模型和Stage模型在卡片入口文件以及生命周期存在細(xì)微的差異(如下圖3和圖4
    發(fā)表于 06-06 08:10

    PCBA 表面處理:優(yōu)缺點(diǎn)大揭秘,應(yīng)用場(chǎng)景全解析

    的表面處理工藝,不僅能提升PCBA板的焊接質(zhì)量,還能延長(zhǎng)其使用壽命。以下將詳細(xì)介紹幾種常見的PCBA表面處理工藝,分析它們的優(yōu)缺點(diǎn)及應(yīng)用場(chǎng)景,幫助您做出最佳的工藝選擇。 PCBA表面處理優(yōu)缺點(diǎn)
    的頭像 發(fā)表于 05-05 09:39 ?1268次閱讀
    PCBA 表面處理:<b class='flag-5'>優(yōu)缺點(diǎn)</b>大揭秘,應(yīng)用場(chǎng)景全解析

    AI眼鏡大模型激戰(zhàn):多大模型協(xié)同、交互時(shí)延低至1.3S

    與AI大模型深度融合,一場(chǎng)技術(shù)演進(jìn)與場(chǎng)景革命正在悄然進(jìn)行。 ? ? 一款眼鏡搭載多個(gè)大模型:AI 智能眼鏡下的“百模大戰(zhàn)” AI大模型指的是具有大量參數(shù)(通常超過數(shù)十億)的
    的頭像 發(fā)表于 03-20 08:59 ?2553次閱讀
    AI眼鏡大<b class='flag-5'>模型</b>激戰(zhàn):多大<b class='flag-5'>模型</b>協(xié)同、交互時(shí)延低至1.3S

    在OpenVINO?工具套件的深度學(xué)習(xí)工作臺(tái)中無法導(dǎo)出INT8模型怎么解決?

    無法在 OpenVINO? 工具套件的深度學(xué)習(xí) (DL) 工作臺(tái)中導(dǎo)出 INT8 模型
    發(fā)表于 03-06 07:54

    深度學(xué)習(xí)模型在傳感器數(shù)據(jù)處理中的應(yīng)用(二):LSTM

    序列數(shù)據(jù)時(shí)遇到的梯度消失或梯度爆炸問題。標(biāo)準(zhǔn) RNN 在反向傳播過程中,由于鏈?zhǔn)椒▌t的應(yīng)用,梯度可能會(huì)在多層傳播中指數(shù)級(jí)地減?。ㄌ荻认В┗蛟龃螅ㄌ荻缺ǎ?,這使得網(wǎng)絡(luò)難以學(xué)習(xí)和記住長(zhǎng)時(shí)間步的依賴關(guān)系。 ? ? 1.?遞歸神經(jīng)網(wǎng)絡(luò)(RNN
    的頭像 發(fā)表于 02-20 10:48 ?1566次閱讀
    <b class='flag-5'>深度</b>學(xué)習(xí)<b class='flag-5'>模型</b>在傳感器數(shù)據(jù)處理中的應(yīng)用(二):LSTM

    惠斯通電橋的優(yōu)缺點(diǎn)分析

    惠斯通電橋作為一種經(jīng)典的電阻測(cè)量工具,具有其獨(dú)特的優(yōu)缺點(diǎn)。以下是對(duì)惠斯通電橋優(yōu)缺點(diǎn)的詳細(xì)分析: 優(yōu)點(diǎn) 高精度 : 惠斯通電橋通過比較電壓差來精確測(cè)量電阻值,對(duì)于微小的電阻變化也能迅速作出反應(yīng),因此
    的頭像 發(fā)表于 02-13 15:26 ?2268次閱讀

    BP神經(jīng)網(wǎng)絡(luò)的優(yōu)缺點(diǎn)分析

    BP神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Network)作為一種常用的機(jī)器學(xué)習(xí)模型,具有顯著的優(yōu)點(diǎn),同時(shí)也存在一些不容忽視的缺點(diǎn)。以下是對(duì)BP神經(jīng)網(wǎng)絡(luò)優(yōu)缺點(diǎn)分析
    的頭像 發(fā)表于 02-12 15:36 ?1884次閱讀

    硅谷物理服務(wù)器的優(yōu)缺點(diǎn)分析

    硅谷物理服務(wù)器因其高性能、高質(zhì)量和先進(jìn)的技術(shù)支持而在全球范圍內(nèi)享有很高的聲譽(yù)。硅谷物理服務(wù)器的優(yōu)缺點(diǎn)分析如下,主機(jī)推薦小編為您整理發(fā)布硅谷物理服務(wù)器的優(yōu)缺點(diǎn)分析。
    的頭像 發(fā)表于 02-12 09:30 ?639次閱讀

    吉利星睿大模型與DeepSeek完成深度融合

    2 月 6 日,吉利汽車宣布其自研睿大模型已與 DeepSeek 完成深度融合。 在智能化浪潮下,AI 大模型成為車企競(jìng)爭(zhēng)的關(guān)鍵技術(shù)。吉利此次與 DeepSeek 合作,是其在智能汽車領(lǐng)域的又一
    的頭像 發(fā)表于 02-07 18:13 ?1214次閱讀

    光譜傳感器的優(yōu)缺點(diǎn)

    光譜傳感器是一種能夠檢測(cè)并響應(yīng)光譜范圍內(nèi)不同波長(zhǎng)光線的傳感器。以下是對(duì)其優(yōu)缺點(diǎn)的詳細(xì)分析
    的頭像 發(fā)表于 01-27 15:28 ?1396次閱讀