chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

13個PyTorch使用的小竅門

深度學習自然語言處理 ? 來源:知乎 ? 作者:z.defying@知乎 ? 2021-03-12 09:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

【導讀】本文整理了13則PyTorch使用的小竅門,包括了指定GPU編號、梯度裁剪、擴展單張圖片維度等實用技巧,能夠幫助工作者更高效地完成任務。

目錄

1、指定GPU編號

2、查看模型每層輸出詳情3、梯度裁剪4、擴展單張圖片維度5、one hot編碼6、防止驗證模型時爆顯存7、學習率衰減8、凍結某些層的參數9、對不同層使用不同學習率10、模型相關操作11、Pytorch內置one hot函數12、網絡參數初始化13、加載內置預訓練模型

1、指定GPU編號

設置當前使用的GPU設備僅為0號設備,設備名稱為 /gpu:0:os.environ[“CUDA_VISIBLE_DEVICES”] = “0”

設置當前使用的GPU設備為0,1號兩個設備,名稱依次為 /gpu:0、/gpu:1:os.environ[“CUDA_VISIBLE_DEVICES”] = “0,1” ,根據順序表示優(yōu)先使用0號設備,然后使用1號設備。

指定GPU的命令需要放在和神經網絡相關的一系列操作的前面。

2、查看模型每層輸出詳情

Keras有一個簡潔的API來查看模型的每一層輸出尺寸,這在調試網絡時非常有用?,F在在PyTorch中也可以實現這個功能。

使用很簡單,如下用法:

from torchsummary import summarysummary(your_model, input_size=(channels, H, W))

input_size 是根據你自己的網絡模型的輸入尺寸進行設置。

3、梯度裁剪(Gradient Clipping)

import torch.nn as nn

outputs = model(data)loss= loss_fn(outputs, target)optimizer.zero_grad()loss.backward()nn.utils.clip_grad_norm_(model.parameters(), max_norm=20, norm_type=2)optimizer.step()

nn.utils.clip_grad_norm_ 的參數:

parameters – 一個基于變量的迭代器,會進行梯度歸一化

max_norm – 梯度的最大范數

norm_type – 規(guī)定范數的類型,默認為L2

@不橢的橢圓 提出:梯度裁剪在某些任務上會額外消耗大量的計算時間,可移步評論區(qū)查看詳情。

4、擴展單張圖片維度

因為在訓練時的數據維度一般都是 (batch_size, c, h, w),而在測試時只輸入一張圖片,所以需要擴展維度,擴展維度有多個方法:

import cv2import torch

image = cv2.imread(img_path)image = torch.tensor(image)print(image.size())

img = image.view(1, *image.size())print(img.size())

# output:# torch.Size([h, w, c])# torch.Size([1, h, w, c])

或import cv2import numpy as np

image = cv2.imread(img_path)print(image.shape)img = image[np.newaxis, :, :, :]print(img.shape)

# output:# (h, w, c)# (1, h, w, c)

或(感謝 @coldleaf 的補充)

import cv2import torch

image = cv2.imread(img_path)image = torch.tensor(image)print(image.size())

img = image.unsqueeze(dim=0) print(img.size())

img = img.squeeze(dim=0)print(img.size())

# output:# torch.Size([(h, w, c)])# torch.Size([1, h, w, c])# torch.Size([h, w, c])

tensor.unsqueeze(dim):擴展維度,dim指定擴展哪個維度。

tensor.squeeze(dim):去除dim指定的且size為1的維度,維度大于1時,squeeze()不起作用,不指定dim時,去除所有size為1的維度。

5、獨熱編碼

在PyTorch中使用交叉熵損失函數的時候會自動把label轉化成onehot,所以不用手動轉化,而使用MSE需要手動轉化成onehot編碼。

import torchclass_num = 8batch_size = 4

def one_hot(label): “”“ 將一維列表轉換為獨熱編碼 ”“” label = label.resize_(batch_size, 1) m_zeros = torch.zeros(batch_size, class_num) # 從 value 中取值,然后根據 dim 和 index 給相應位置賦值 onehot = m_zeros.scatter_(1, label, 1) # (dim,index,value)

return onehot.numpy() # Tensor -》 Numpy

label = torch.LongTensor(batch_size).random_() % class_num # 對隨機數取余print(one_hot(label))

# output:[[0. 0. 0. 1. 0. 0. 0. 0.] [0. 0. 0. 0. 1. 0. 0. 0.] [0. 0. 1. 0. 0. 0. 0. 0.] [0. 1. 0. 0. 0. 0. 0. 0.]]

注:第11條有更簡單的方法。

6、防止驗證模型時爆顯存

驗證模型時不需要求導,即不需要梯度計算,關閉autograd,可以提高速度,節(jié)約內存。如果不關閉可能會爆顯存。

with torch.no_grad(): # 使用model進行預測的代碼 pass

感謝@zhaz 的提醒,我把 torch.cuda.empty_cache() 的使用原因更新一下。

這是原回答:

Pytorch 訓練時無用的臨時變量可能會越來越多,導致 out of memory ,可以使用下面語句來清理這些不需要的變量。

官網 上的解釋為:

Releases all unoccupied cached memory currently held by the caching allocator so that those can be used in other GPU application and visible innvidia-smi. torch.cuda.empty_cache()

意思就是PyTorch的緩存分配器會事先分配一些固定的顯存,即使實際上tensors并沒有使用完這些顯存,這些顯存也不能被其他應用使用。這個分配過程由第一次CUDA內存訪問觸發(fā)的。而 torch.cuda.empty_cache() 的作用就是釋放緩存分配器當前持有的且未占用的緩存顯存,以便這些顯存可以被其他GPU應用程序中使用,并且通過 nvidia-smi命令可見。注意使用此命令不會釋放tensors占用的顯存。對于不用的數據變量,Pytorch 可以自動進行回收從而釋放相應的顯存。更詳細的優(yōu)化可以查看 優(yōu)化顯存使用 和 顯存利用問題。

7、學習率衰減

import torch.optim as optimfrom torch.optim import lr_scheduler

# 訓練前的初始化optimizer = optim.Adam(net.parameters(), lr=0.001)scheduler = lr_scheduler.StepLR(optimizer, 10, 0.1) # # 每過10個epoch,學習率乘以0.1

# 訓練過程中for n in n_epoch: scheduler.step() 。..

可以隨時查看學習率的值:optimizer.param_groups[0][‘lr’]。還有其他學習率更新的方式:1、自定義更新公式:scheduler = lr_scheduler.LambdaLR(optimizer, lr_lambda=lambda epoch:1/(epoch+1))2、不依賴epoch更新學習率:lr_scheduler.ReduceLROnPlateau()提供了基于訓練中某些測量值使學習率動態(tài)下降的方法,它的參數說明到處都可以查到。

提醒一點就是參數 mode=‘min’ 還是‘max’,取決于優(yōu)化的的損失還是準確率,即使用 scheduler.step(loss)還是scheduler.step(acc) 。

8、凍結某些層的參數

參考:https://www.zhihu.com/question/311095447/answer/589307812在加載預訓練模型的時候,我們有時想凍結前面幾層,使其參數在訓練過程中不發(fā)生變化。我們需要先知道每一層的名字,通過如下代碼打印:

net = Network() # 獲取自定義網絡結構for name, value in net.named_parameters(): print(‘name: {0}, grad: {1}’.format(name, value.requires_grad))

假設前幾層信息如下:

name: cnn.VGG_16.convolution1_1.weight, grad: Truename: cnn.VGG_16.convolution1_1.bias, grad: Truename: cnn.VGG_16.convolution1_2.weight, grad: Truename: cnn.VGG_16.convolution1_2.bias, grad: Truename: cnn.VGG_16.convolution2_1.weight, grad: Truename: cnn.VGG_16.convolution2_1.bias, grad: Truename: cnn.VGG_16.convolution2_2.weight, grad: Truename: cnn.VGG_16.convolution2_2.bias, grad: True

后面的True表示該層的參數可訓練,然后我們定義一個要凍結的層的列表:

no_grad = [ ‘cnn.VGG_16.convolution1_1.weight’, ‘cnn.VGG_16.convolution1_1.bias’, ‘cnn.VGG_16.convolution1_2.weight’, ‘cnn.VGG_16.convolution1_2.bias’]

凍結方法如下:

net = Net.CTPN() # 獲取網絡結構for name, value in net.named_parameters(): if name in no_grad: value.requires_grad = False else: value.requires_grad = True

凍結后我們再打印每層的信息:

name: cnn.VGG_16.convolution1_1.weight, grad: Falsename: cnn.VGG_16.convolution1_1.bias, grad: Falsename: cnn.VGG_16.convolution1_2.weight, grad: Falsename: cnn.VGG_16.convolution1_2.bias, grad: Falsename: cnn.VGG_16.convolution2_1.weight, grad: Truename: cnn.VGG_16.convolution2_1.bias, grad: Truename: cnn.VGG_16.convolution2_2.weight, grad: Truename: cnn.VGG_16.convolution2_2.bias, grad: True

可以看到前兩層的weight和bias的requires_grad都為False,表示它們不可訓練。

最后在定義優(yōu)化器時,只對requires_grad為True的層的參數進行更新。

optimizer = optim.Adam(filter(lambda p: p.requires_grad, net.parameters()), lr=0.01)

9、對不同層使用不同學習率

我們對模型的不同層使用不同的學習率。還是使用這個模型作為例子:

net = Network() # 獲取自定義網絡結構for name, value in net.named_parameters(): print(‘name: {}’.format(name))

# 輸出:# name: cnn.VGG_16.convolution1_1.weight# name: cnn.VGG_16.convolution1_1.bias# name: cnn.VGG_16.convolution1_2.weight# name: cnn.VGG_16.convolution1_2.bias# name: cnn.VGG_16.convolution2_1.weight# name: cnn.VGG_16.convolution2_1.bias# name: cnn.VGG_16.convolution2_2.weight# name: cnn.VGG_16.convolution2_2.bias

對 convolution1 和 convolution2 設置不同的學習率,首先將它們分開,即放到不同的列表里:

conv1_params = []conv2_params = []

for name, parms in net.named_parameters(): if “convolution1” in name: conv1_params += [parms] else: conv2_params += [parms]

# 然后在優(yōu)化器中進行如下操作:optimizer = optim.Adam( [ {“params”: conv1_params, ‘lr’: 0.01}, {“params”: conv2_params, ‘lr’: 0.001}, ], weight_decay=1e-3,)

我們將模型劃分為兩部分,存放到一個列表里,每部分就對應上面的一個字典,在字典里設置不同的學習率。當這兩部分有相同的其他參數時,就將該參數放到列表外面作為全局參數,如上面的`weight_decay`。

也可以在列表外設置一個全局學習率,當各部分字典里設置了局部學習率時,就使用該學習率,否則就使用列表外的全局學習率。

10、模型相關操作

這個內容比較多,我寫成了一篇文章:https://zhuanlan.zhihu.com/p/73893187

11、Pytorch內置one_hot函數

感謝@yangyangyang 補充:Pytorch 1.1后,one_hot可以直接用torch.nn.functional.one_hot。然后我將Pytorch升級到1.2版本,試用了下 one_hot 函數,確實很方便。具體用法如下:

import torch.nn.functional as Fimport torch

tensor = torch.arange(0, 5) % 3 # tensor([0, 1, 2, 0, 1])one_hot = F.one_hot(tensor)

# 輸出:# tensor([[1, 0, 0],# [0, 1, 0],# [0, 0, 1],# [1, 0, 0],# [0, 1, 0]])

F.one_hot會自己檢測不同類別個數,生成對應獨熱編碼。我們也可以自己指定類別數:

tensor = torch.arange(0, 5) % 3 # tensor([0, 1, 2, 0, 1])one_hot = F.one_hot(tensor, num_classes=5)

# 輸出:# tensor([[1, 0, 0, 0, 0],# [0, 1, 0, 0, 0],# [0, 0, 1, 0, 0],# [1, 0, 0, 0, 0],# [0, 1, 0, 0, 0]])

升級 Pytorch (cpu版本)的命令:conda install pytorch torchvision -c pytorch(希望Pytorch升級不會影響項目代碼)

12、網絡參數初始化

神經網絡的初始化是訓練流程的重要基礎環(huán)節(jié),會對模型的性能、收斂性、收斂速度等產生重要的影響。

以下介紹兩種常用的初始化操作。

(1) 使用pytorch內置的torch.nn.init方法。

常用的初始化操作,例如正態(tài)分布、均勻分布、xavier初始化、kaiming初始化等都已經實現,可以直接使用。具體詳見PyTorch 中 torch.nn.init 中文文檔。

init.xavier_uniform(net1[0].weight)

(2) 對于一些更加靈活的初始化方法,可以借助numpy。

對于自定義的初始化方法,有時tensor的功能不如numpy強大靈活,故可以借助numpy實現初始化方法,再轉換到tensor上使用。

for layer in net1.modules(): if isinstance(layer, nn.Linear): # 判斷是否是線性層 param_shape = layer.weight.shape layer.weight.data = torch.from_numpy(np.random.normal(0, 0.5, size=param_shape)) # 定義為均值為 0,方差為 0.5 的正態(tài)分布

13、加載內置預訓練模型

torchvision.models模塊的子模塊中包含以下模型:

AlexNet

VGG

ResNet

SqueezeNet

DenseNet

導入這些模型的方法為:

import torchvision.models as modelsresnet18 = models.resnet18()alexnet = models.alexnet()vgg16 = models.vgg16()

有一個很重要的參數為pretrained,默認為False,表示只導入模型的結構,其中的權重是隨機初始化的。

如果pretrained 為 True,表示導入的是在ImageNet數據集上預訓練的模型。

import torchvision.models as modelsresnet18 = models.resnet18(pretrained=True)alexnet = models.alexnet(pretrained=True)vgg16 = models.vgg16(pretrained=True)

更多的模型可以查看:https://pytorch-cn.readthedocs.io/zh/latest/torchvision/torchvision-models/
編輯:lyn

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4948

    瀏覽量

    131248
  • pytorch
    +關注

    關注

    2

    文章

    809

    瀏覽量

    13963

原文標題:【PyTorch】Trick集錦

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    操作指南:pytorch云服務器怎么設置?

    設置PyTorch云服務器需選擇云平臺,創(chuàng)建合適的GPU實例,安裝操作系統、Python及Anaconda,創(chuàng)建虛擬環(huán)境,根據CUDA版本安裝PyTorch,配置環(huán)境變量,最后驗證安裝。過程中需考慮
    的頭像 發(fā)表于 02-08 10:33 ?358次閱讀

    利用Arm Kleidi技術實現PyTorch優(yōu)化

    PyTorch 是一廣泛應用的開源機器學習 (ML) 庫。近年來,Arm 與合作伙伴通力協作,持續(xù)改進 PyTorch 的推理性能。本文將詳細介紹如何利用 Arm Kleidi 技術提升 Arm
    的頭像 發(fā)表于 12-23 09:19 ?1059次閱讀
    利用Arm Kleidi技術實現<b class='flag-5'>PyTorch</b>優(yōu)化

    vLLM項目加入PyTorch生態(tài)系統,引領LLM推理新紀元

    近日,vLLM項目宣布正式成為PyTorch生態(tài)系統的一部分,標志著該項目與PyTorch的合作進入了一全新的階段。本文將從以下幾個方面進行介紹,特別提醒:安裝方案在第四部分,可選
    的頭像 發(fā)表于 12-18 17:06 ?830次閱讀
    vLLM項目加入<b class='flag-5'>PyTorch</b>生態(tài)系統,引領LLM推理新紀元

    PyTorch 2.5.1: Bugs修復版發(fā)布

    ? 一,前言 在深度學習框架的不斷迭代中,PyTorch 社區(qū)始終致力于提供更穩(wěn)定、更高效的工具。最近,PyTorch 2.5.1 版本正式發(fā)布,這個版本主要針對 2.5.0 中發(fā)現的問題進行了修復
    的頭像 發(fā)表于 12-03 16:11 ?1622次閱讀
    <b class='flag-5'>PyTorch</b> 2.5.1: Bugs修復版發(fā)布

    PyTorch 數據加載與處理方法

    PyTorch 是一流行的開源機器學習庫,它提供了強大的工具來構建和訓練深度學習模型。在構建模型之前,一重要的步驟是加載和處理數據。 1. PyTorch 數據加載基礎 在
    的頭像 發(fā)表于 11-05 17:37 ?937次閱讀

    如何在 PyTorch 中訓練模型

    PyTorch 是一流行的開源機器學習庫,廣泛用于計算機視覺和自然語言處理等領域。它提供了強大的計算圖功能和動態(tài)圖特性,使得模型的構建和調試變得更加靈活和直觀。 數據準備 在訓練模型之前,首先需要
    的頭像 發(fā)表于 11-05 17:36 ?931次閱讀

    如何使用 PyTorch 進行強化學習

    強化學習(Reinforcement Learning, RL)是一種機器學習方法,它通過與環(huán)境的交互來學習如何做出決策,以最大化累積獎勵。PyTorch 是一流行的開源機器學習庫,它提供了靈活
    的頭像 發(fā)表于 11-05 17:34 ?1043次閱讀

    使用PyTorch在英特爾獨立顯卡上訓練模型

    PyTorch 2.5重磅更新:性能優(yōu)化+新特性》中的一新特性就是:正式支持在英特爾獨立顯卡上訓練模型!
    的頭像 發(fā)表于 11-01 14:21 ?2054次閱讀
    使用<b class='flag-5'>PyTorch</b>在英特爾獨立顯卡上訓練模型

    Pytorch深度學習訓練的方法

    掌握這 17 種方法,用最省力的方式,加速你的 Pytorch 深度學習訓練。
    的頭像 發(fā)表于 10-28 14:05 ?657次閱讀
    <b class='flag-5'>Pytorch</b>深度學習訓練的方法

    新手小白怎么通過云服務器跑pytorch?

    安裝PyTorch的步驟可以根據不同的操作系統和需求有所差異,通過云服務器運行PyTorch的過程主要包括選擇GPU云服務器平臺、配置服務器環(huán)境、部署和運行PyTorch模型、優(yōu)化性能等步驟。
    的頭像 發(fā)表于 09-25 11:35 ?564次閱讀

    pycharm配置pytorch運行環(huán)境

    在PyCharm中配置PyTorch運行環(huán)境主要包括安裝PyCharm、安裝Python(如果尚未安裝)、配置PyTorch環(huán)境以及驗證安裝等步驟。以下是詳細的步驟說明: 一、安裝PyCharm
    的頭像 發(fā)表于 08-01 16:25 ?2439次閱讀

    pytorch怎么在pycharm中運行

    第一部分:PyTorch和PyCharm的安裝 1.1 安裝PyTorch PyTorch是一開源的機器學習庫,用于構建和訓練神經網絡。要在PyCharm中使用
    的頭像 發(fā)表于 08-01 16:22 ?2550次閱讀

    pycharm如何調用pytorch

    引言 PyTorch是一開源的機器學習庫,廣泛用于計算機視覺、自然語言處理等領域。PyCharm是一流行的Python集成開發(fā)環(huán)境(IDE),提供了代碼編輯、調試、測試等功能。將PyTor
    的頭像 發(fā)表于 08-01 15:41 ?1223次閱讀

    pytorch環(huán)境搭建詳細步驟

    PyTorch作為一廣泛使用的深度學習框架,其環(huán)境搭建對于從事機器學習和深度學習研究及開發(fā)的人員來說至關重要。以下將介紹PyTorch環(huán)境搭建的詳細步驟,包括安裝Anaconda、配置清華鏡像源
    的頭像 發(fā)表于 08-01 15:38 ?1869次閱讀

    pytorch和python的關系是什么

    ,PyTorch已經成為了一非常受歡迎的框架。本文將介紹PyTorch和Python之間的關系,以及它們在深度學習領域的應用。 Python簡介 Python是一種高級、解釋型、通用的編程語言,由Guido van Rossu
    的頭像 發(fā)表于 08-01 15:27 ?3283次閱讀