chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

電子發(fā)燒友App

硬聲App

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示
創(chuàng)作
電子發(fā)燒友網(wǎng)>電子資料下載>電子資料>PyTorch教程8.5之批量歸一化

PyTorch教程8.5之批量歸一化

2023-06-05 | pdf | 0.40 MB | 次下載 | 免費

資料介紹

訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)很困難。讓它們在合理的時間內(nèi)收斂可能很棘手。在本節(jié)中,我們將介紹 批量歸一化,這是一種流行且有效的技術(shù),可以持續(xù)加速深度網(wǎng)絡(luò)的收斂 Ioffe 和 Szegedy,2015 年。連同殘差塊(稍后將在第 8.6 節(jié)中介紹),批量歸一化使從業(yè)者可以例行地訓(xùn)練超過 100 層的網(wǎng)絡(luò)。批量歸一化的第二個(偶然的)好處在于其固有的正則化。

import torch
from torch import nn
from d2l import torch as d2l
from mxnet import autograd, init, np, npx
from mxnet.gluon import nn
from d2l import mxnet as d2l

npx.set_np()
from functools import partial
import jax
import optax
from flax import linen as nn
from jax import numpy as jnp
from d2l import jax as d2l
import tensorflow as tf
from d2l import tensorflow as d2l

8.5.1. 訓(xùn)練深度網(wǎng)絡(luò)

在處理數(shù)據(jù)時,我們經(jīng)常在訓(xùn)練前進(jìn)行預(yù)處理。關(guān)于數(shù)據(jù)預(yù)處理的選擇通常會對最終結(jié)果產(chǎn)生巨大影響。回想一下我們將 MLP 應(yīng)用于預(yù)測房價(第 5.7 節(jié))。我們處理真實數(shù)據(jù)的第一步是將我們的輸入特征標(biāo)準(zhǔn)化為零均值 μ=0和單位方差 Σ=1across multiple observations ( Friedman, 1987 )至少,人們經(jīng)常重新縮放它,使對角線是統(tǒng)一的,即 Σii=1. 另一種策略是將向量重新調(diào)整為單位長度,每次觀察的均值可能為零。這可以很好地工作,例如,對于空間傳感器數(shù)據(jù)。這些預(yù)處理技術(shù)以及更多技術(shù)有助于很好地控制估計問題。參見例如Guyon等人的文章。( 2008 )審查特征選擇和提取技術(shù)。標(biāo)準(zhǔn)化向量還有一個很好的副作用,即限制作用于它的函數(shù)的函數(shù)復(fù)雜性。例如,支持向量機(jī)中著名的半徑邊界( Vapnik, 1995 )和感知器收斂定理( Novikoff, 1962 )依賴有界范數(shù)的輸入。

直覺上,這種標(biāo)準(zhǔn)化與我們的優(yōu)化器配合得很好,因為它先驗地參數(shù)放在相似的范圍內(nèi)。因此,很自然地會問 深度網(wǎng)絡(luò)中相應(yīng)的規(guī)范化步驟是否可能沒有好處。雖然這并不是導(dǎo)致批量歸一化發(fā)明的原因 Ioffe 和 Szegedy,2015 年 ,但它是在統(tǒng)一框架內(nèi)理解它及其堂兄層歸一化Ba等人,2016 年的有用方法。

其次,對于典型的 MLP 或 CNN,在我們訓(xùn)練時,中間層中的變量(例如,MLP 中的仿射變換輸出)可能采用幅度變化很大的值:沿著從輸入到輸出的層,跨同一層中的單元,隨著時間的推移,由于我們對模型參數(shù)的更新。批量歸一化的發(fā)明者非正式地假設(shè),這種變量分布的漂移可能會阻礙網(wǎng)絡(luò)的收斂。憑直覺,我們可能會推測,如果一層的可變激活是另一層的 100 倍,這可能需要對學(xué)習(xí)率進(jìn)行補(bǔ)償性調(diào)整。自適應(yīng)求解器,例如 AdaGrad Duchi等人,2011 年、Adam Kingma 和 Ba,2014 年))、Yogi ( Zaheer et al. , 2018 )或 Distributed Shampoo ( Anil et al. , 2020 )旨在從優(yōu)化的角度解決這個問題,例如,通過添加二階方法的方面。另一種方法是通過自適應(yīng)規(guī)范化來防止問題發(fā)生。

第三,更深層次的網(wǎng)絡(luò)很復(fù)雜,而且往往更容易過度擬合。這意味著正則化變得更加關(guān)鍵。一種常用的正則化技術(shù)是噪聲注入。這已經(jīng)為人所知很長時間了,例如,關(guān)于輸入的噪聲注入( Bishop, 1995 )。它還構(gòu)成了第 5.6 節(jié)中 dropout 的基礎(chǔ) 事實證明,批歸一化帶來了所有三個好處:預(yù)處理、數(shù)值穩(wěn)定性和正則化。

批歸一化應(yīng)用于單個層,或者可選地應(yīng)用于所有層:在每次訓(xùn)練迭代中,我們首先通過減去它們的均值并除以它們的標(biāo)準(zhǔn)差來歸一化(批歸一化的)輸入,其中兩者都是基于統(tǒng)計數(shù)據(jù)估計的當(dāng)前的小批量。接下來,我們應(yīng)用比例系數(shù)和偏移量來恢復(fù)丟失的自由度。批歸一化正是由于這種 基于統(tǒng)計的歸一化 而得名。

請注意,如果我們嘗試對大小為 1 的小批量應(yīng)用批量歸一化,我們將無法學(xué)習(xí)任何東西。這是因為在減去均值后,每個隱藏單元的值為 0。正如您可能猜到的那樣,由于我們將整個部分用于批量歸一化,并且具有足夠大的小批量,因此該方法被證明是有效且穩(wěn)定的。這里的一個要點是,當(dāng)應(yīng)用批量歸一化時,批量大小的選擇甚至比沒有批量歸一化更重要,或者至少需要適當(dāng)?shù)男?zhǔn),因為我們可能會調(diào)整它。

表示為B一個小批量并讓 x∈B作為批量歸一化的輸入(BN). 在這種情況下,批量歸一化定義如下:

(8.5.1)BN(x)=γ⊙x?μ^Bσ^B+β.

在(8.5.1),μ^B 是樣本均值和σ^B是 minibatch 的樣本標(biāo)準(zhǔn)差B. 應(yīng)用標(biāo)準(zhǔn)化后,生成的小批量具有零均值和單位方差。單位方差的選擇(相對于其他一些幻數(shù))是一個任意選擇。我們通過包含元素尺度參數(shù)來恢復(fù)這種自由度 γ轉(zhuǎn)移參數(shù) β具有相同的形狀x. 兩者都是需要在模型訓(xùn)練中學(xué)習(xí)的參數(shù)。

中間層的可變幅度在訓(xùn)練期間不能發(fā)散,因為批量歸一化主動將它們居中并將它們重新縮放回給定的均值和大小(通過 μ^Bσ^B). 實踐經(jīng)驗證實,正如在討論特征重新縮放時所提到的,批量歸一化似乎允許更積極的學(xué)習(xí)率。我們計算μ^Bσ^B(8.5.1)如下:

?

下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評論

查看更多

下載排行

本周

  1. 1PFC電路與BOOST電路設(shè)計實例分享
  2. 1.83 MB   |  12次下載  |  4 積分
  3. 2世平基于靈動微 SPIN560C 的低壓無刷電機(jī)應(yīng)用方案
  4. 10.93 MB  |  11次下載  |  免費
  5. 3電源測試報告-基于 國民技術(shù) N32L406 和杰華特 JW3376+3330 的 BMS 方案
  6. 6.47 MB  |  11次下載  |  免費
  7. 4PWM控制器的控制方法
  8. 0.39 MB   |  3次下載  |  4 積分
  9. 5電流檢測芯片F(xiàn)P135應(yīng)用說明
  10. 1.24 MB   |  3次下載  |  免費
  11. 6全面解讀被動式與主動式PFC電路
  12. 1.27 MB   |  1次下載  |  4 積分
  13. 7HC88L051F4低功耗芯片規(guī)格書
  14. 4.76 MB  |  1次下載  |  免費
  15. 8CIU32D655x5數(shù)據(jù)手冊
  16. 2.14 MB   |  1次下載  |  免費

本月

  1. 1常用電子元器件使用手冊
  2. 2.40 MB   |  52次下載  |  免費
  3. 2高功率密度碳化硅MOSFET軟開關(guān)三相逆變器損耗分析
  4. 2.27 MB   |  33次下載  |  10 積分
  5. 3PFC電路與BOOST電路設(shè)計實例分享
  6. 1.83 MB   |  12次下載  |  4 積分
  7. 4世平基于靈動微 SPIN560C 的低壓無刷電機(jī)應(yīng)用方案
  8. 10.93 MB  |  11次下載  |  免費
  9. 5電源測試報告-基于 國民技術(shù) N32L406 和杰華特 JW3376+3330 的 BMS 方案
  10. 6.47 MB  |  11次下載  |  免費
  11. 6USB拓展塢PCB圖資料
  12. 0.57 MB   |  11次下載  |  免費
  13. 7MS1826 HDMI 多功能視頻處理器數(shù)據(jù)手冊
  14. 4.51 MB   |  9次下載  |  免費
  15. 8HAL9303線性霍爾效應(yīng)傳感器技術(shù)手冊
  16. 0.70 MB   |  9次下載  |  免費

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935134次下載  |  10 積分
  3. 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計
  4. 1.48MB  |  420064次下載  |  10 積分
  5. 3Altium DXP2002下載入口
  6. 未知  |  233089次下載  |  10 積分
  7. 4電路仿真軟件multisim 10.0免費下載
  8. 340992  |  191424次下載  |  10 積分
  9. 5十天學(xué)會AVR單片機(jī)與C語言視頻教程 下載
  10. 158M  |  183352次下載  |  10 積分
  11. 6labview8.5下載
  12. 未知  |  81600次下載  |  10 積分
  13. 7Keil工具M(jìn)DK-Arm免費下載
  14. 0.02 MB  |  73818次下載  |  10 積分
  15. 8LabVIEW 8.6下載
  16. 未知  |  65991次下載  |  10 積分