chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

深度分析RNN的模型結構,優(yōu)缺點以及RNN模型的幾種應用

智能感知與物聯網技術研究所 ? 來源:人工智能與算法學習 ? 作者:人工智能與算法學 ? 2021-05-13 10:47 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

神經網絡深度學習的載體,而神經網絡模型中,最經典非RNN模型所屬,盡管它不完美,但它具有學習歷史信息的能力。后面不管是encode-decode 框架,還是注意力模型,以及自注意力模型,以及更加強大的Bert模型家族,都是站在RNN的肩上,不斷演化、變強的。

這篇文章,闡述了RNN的方方面面,包括模型結構,優(yōu)缺點,RNN模型的幾種應用,RNN常使用的激活函數,RNN的缺陷,以及GRU,LSTM是如何試圖解決這些問題,RNN變體等。

這篇文章最大特點是圖解版本,其次語言簡練,總結全面。

概述

傳統RNN的體系結構。Recurrent neural networks,也稱為RNNs,是一類允許先前的輸出用作輸入,同時具有隱藏狀態(tài)的神經網絡。它們通常如下所示:

e2923ba4-b364-11eb-bf61-12bb97331649.png

對于每一時步 , 激活函數 ,輸出 被表達為:

這里是時間維度網絡的共享權重系數

是激活函數

e2a0bf26-b364-11eb-bf61-12bb97331649.png

下表總結了典型RNN架構的優(yōu)缺點:

處理任意長度的輸入 計算速度慢
模型形狀不隨輸入長度增加 難以獲取很久以前的信息
計算考慮了歷史信息 無法考慮當前狀態(tài)的任何未來輸入
權重隨時間共享
優(yōu)點 缺點

RNNs應用

RNN模型主要應用于自然語言處理和語音識別領域。下表總結了不同的應用:

一對一

e2d8925c-b364-11eb-bf61-12bb97331649.png

傳統神經網絡

一對多

e2e514fa-b364-11eb-bf61-12bb97331649.png

音樂生成

多對一

e2f52660-b364-11eb-bf61-12bb97331649.png

e303047e-b364-11eb-bf61-12bb97331649.png

機器翻譯e31699da-b364-11eb-bf61-12bb97331649.png

RNN 類型圖解例子

對于RNN網絡,所有時間步的損失函數 是根據每個時間步的損失定義的,如下所示:損失函數

時間反向傳播

在每個時間點進行反向傳播。在時間步,損失相對于權重矩陣的偏導數表示如下:

處理長短依賴

常用激活函數

RNN模塊中最常用的激活函數描述如下:

5e33166de-b364-11eb-bf61-12bb97331649.png

e33ef948-b364-11eb-bf61-12bb97331649.png

e3539de4-b364-11eb-bf61-12bb97331649.png

SigmoidTanhRELU

梯度消失/爆炸

在RNN中經常遇到梯度消失和爆炸現象。之所以會發(fā)生這種情況,是因為很難捕捉到長期的依賴關系,因為乘法梯度可以隨著層的數量呈指數遞減/遞增。

梯度修剪

梯度修剪是一種技術,用于執(zhí)行反向傳播時,有時遇到的梯度爆炸問題。通過限制梯度的最大值,這種現象在實踐中得以控制。

e367c954-b364-11eb-bf61-12bb97331649.png

門的類型

為了解決消失梯度問題,在某些類型的RNN中使用特定的門,并且通常有明確的目的。它們通常標注為,等于:

其中,是特定于門的系數,是sigmoid函數。主要內容總結如下表:

Gated Recurrent Unit(GRU)和長-短期記憶單元(LSTM)處理傳統RNNs遇到的消失梯度問題,LSTM是GRU的推廣。下表總結了每種結構的特征方程:GRU/LSTM

e3730e68-b364-11eb-bf61-12bb97331649.png

注:符號表示兩個向量之間按元素相乘。

RNN的變體

下表總結了其他常用的RNN模型:

e3a643e6-b364-11eb-bf61-12bb97331649.png

e3e31410-b364-11eb-bf61-12bb97331649.png

Bidirectional (BRNN)Deep (DRNN)

編輯:jq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 函數
    +關注

    關注

    3

    文章

    4421

    瀏覽量

    67822
  • rnn
    rnn
    +關注

    關注

    0

    文章

    92

    瀏覽量

    7374

原文標題:神經網絡RNN圖解!

文章出處:【微信號:tyutcsplab,微信公眾號:智能感知與物聯網技術研究所】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    算法工程師需要具備哪些技能?

    景:神經網絡中的權重矩陣計算、降維算法(如PCA)等。 概率論與數理統計核心內容:貝葉斯定理、最大似然估計、假設檢驗等。應用場景:模型不確定性分析、A/B測試效果評估等。 微積分核心內容:導數、梯度
    發(fā)表于 02-27 10:53

    無刷電機轉子永磁體的幾種結構優(yōu)缺點

    幾種中,表貼式是最為常用的一種,即弧形磁片(釹鐵硼或鐵氧體磁瓦)粘貼在轉子鐵心表面的結構,磁片內外圓可以采用不同心設計而形成不等寬氣隙,使反電動勢波形接近正弦波。
    的頭像 發(fā)表于 01-16 14:27 ?451次閱讀
    無刷電機轉子永磁體的<b class='flag-5'>幾種</b><b class='flag-5'>結構</b><b class='flag-5'>優(yōu)缺點</b>

    星地數據大模型融合分析與應用分系統平臺的應用與未來發(fā)展

    ? ? 星地數據大模型融合分析與應用分系統 ? ?北京華盛恒輝星地數據大模型融合分析與應用分系統,是一套整合衛(wèi)星通信與地面網絡數據,依托大模型
    的頭像 發(fā)表于 12-29 10:12 ?304次閱讀

    一文讀懂LSTM與RNN:從原理到實戰(zhàn),掌握序列建模核心技術

    RNN的核心局限。今天,我們從原理、梯度推導到實踐,全面解析這兩大經典模型。一、基礎鋪墊:RNN的核心邏輯與痛點RNN的核心是讓模型“記住
    的頭像 發(fā)表于 12-09 13:56 ?1853次閱讀
    一文讀懂LSTM與<b class='flag-5'>RNN</b>:從原理到實戰(zhàn),掌握序列建模核心技術

    正確的連接電機傳動軸的幾種常見連接方式及其優(yōu)缺點

    方式及其優(yōu)缺點分析。 1. 聯軸器連接 ? 聯軸器是電機與傳動軸之間最常用的連接方式之一,其核心功能是傳遞扭矩并補償兩軸之間的偏差(如徑向、軸向或角向偏差)。根據結構不同,聯軸器可分為以下幾類: ? (1)剛性聯軸器 ?
    的頭像 發(fā)表于 09-10 07:41 ?3912次閱讀

    知識分享 | 使用MXAM進行AUTOSAR模型的靜態(tài)分析:Embedded Coder與TargetLink模型

    分析:EmbeddedCoder與TargetLink模型文章內容來源:MES模賽思官方網站AUTOSAR(AUTomotiveOpenSystemARchite
    的頭像 發(fā)表于 08-27 10:04 ?878次閱讀
    知識分享 | 使用MXAM進行AUTOSAR<b class='flag-5'>模型</b>的靜態(tài)<b class='flag-5'>分析</b>:Embedded Coder與TargetLink<b class='flag-5'>模型</b>

    研華科技攜手創(chuàng)新奇智推出多模態(tài)大模型AI一體機

    這是一款基于研華高性能邊緣計算平臺MIC-733,深度集成創(chuàng)新奇智視覺小模型與多模態(tài)大模型的邊緣智能終端,通過創(chuàng)新的“視覺識別 + 深度語義理解”融合
    的頭像 發(fā)表于 07-17 17:14 ?1072次閱讀
    研華科技攜手創(chuàng)新奇智推出多模態(tài)大<b class='flag-5'>模型</b>AI一體機

    模型推理顯存和計算量估計方法研究

    、顯存估計方法 基于模型結構的顯存估計 根據深度學習模型的層次結構和參數數量,可以估算模型在推理
    發(fā)表于 07-03 19:43

    模型在半導體行業(yè)的應用可行性分析

    的應用,比如使用機器學習分析數據,提升良率。 這一些大模型是否真的有幫助 能夠在解決工程師的知識斷層問題 本人純小白,不知道如何涉足這方面 應該問什么大模型比較好,或者是看什么視頻能夠涉足這個行業(yè)
    發(fā)表于 06-24 15:10

    FA模型卡片和Stage模型卡片切換

    ,Stage卡片配置在module.json5和form_config.json中(如下圖1和圖2)。 卡片業(yè)務邏輯:FA模型和Stage模型在卡片入口文件以及生命周期存在細微的差異(如下圖3和圖4
    發(fā)表于 06-06 08:10

    從FA模型切換到Stage模型時:module的切換說明

    mainAbility。mainElement標簽名稱變更,Stage模型不在使用“.”符號。 package標識HAP的包結構名稱,在應用內保證唯一性。/Stage模型使用name來保證應用唯一性。FA
    發(fā)表于 06-05 08:16

    FA模型訪問Stage模型DataShareExtensionAbility說明

    FA模型訪問Stage模型DataShareExtensionAbility 概述 無論FA模型還是Stage模型,數據讀寫功能都包含客戶端和服務端兩部分。 FA
    發(fā)表于 06-04 07:53

    PCBA 表面處理:優(yōu)缺點大揭秘,應用場景全解析

    的表面處理工藝,不僅能提升PCBA板的焊接質量,還能延長其使用壽命。以下將詳細介紹幾種常見的PCBA表面處理工藝,分析它們的優(yōu)缺點及應用場景,幫助您做出最佳的工藝選擇。 PCBA表面處理優(yōu)缺點
    的頭像 發(fā)表于 05-05 09:39 ?1581次閱讀
    PCBA 表面處理:<b class='flag-5'>優(yōu)缺點</b>大揭秘,應用場景全解析

    模型時代的深度學習框架

    作者:算力魔方創(chuàng)始人/英特爾創(chuàng)新大使劉力 在 CNN時代 ,AI模型的參數規(guī)模都在百萬級別,僅需在單張消費類顯卡上即可完成訓練。例如,以業(yè)界知名的CNN模型: ResNet50 為例,模型參數
    的頭像 發(fā)表于 04-25 11:43 ?957次閱讀
    大<b class='flag-5'>模型</b>時代的<b class='flag-5'>深度</b>學習框架

    KaihongOS操作系統FA模型與Stage模型介紹

    FA模型與Stage模型介紹 KaihongOS操作系統中,FA模型(Feature Ability)和Stage模型是兩種不同的應用模型
    發(fā)表于 04-24 07:27