PyTorch 1.6 nightly增加了一個子模塊amp,支持自動混合精度訓(xùn)練。值得期待。來看看性能如何,相比Nvidia Apex 有哪些優(yōu)勢?
A developer-friendly guide to mixed precision training with PyTorch
https://spell.run/blog/mixed-precision-training-with-pytorch-Xuk7YBEAACAASJam
即將在 PyTorch 1.6上發(fā)布的 torch.cuda.amp 混合精度訓(xùn)練模塊實現(xiàn)了它的承諾,只需增加幾行新代碼就可以提高大型模型訓(xùn)練50-60% 的速度。
-
模塊
+關(guān)注
關(guān)注
7文章
2813瀏覽量
52324 -
代碼
+關(guān)注
關(guān)注
30文章
4922瀏覽量
72247 -
pytorch
+關(guān)注
關(guān)注
2文章
812瀏覽量
14429
原文標題:訓(xùn)練提速60%!只需5行代碼,PyTorch 1.6即將原生支持自動混合精度訓(xùn)練
文章出處:【微信號:cas-ciomp,微信公眾號:中科院長春光機所】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
環(huán)旭電子即將推出新一代1.6T光模組產(chǎn)品
請問CYBT-343026-01是否支持AVRCP 1.6?
摩爾線程發(fā)布Torch-MUSA v2.0.0版本 支持原生FP8和PyTorch 2.5.0
摩爾線程GPU原生FP8計算助力AI訓(xùn)練

使用OpenVINO? 2021.4將經(jīng)過訓(xùn)練的自定義PyTorch模型加載為IR格式時遇到錯誤怎么解決?
大模型訓(xùn)練框架(五)之Accelerate
利用Arm Kleidi技術(shù)實現(xiàn)PyTorch優(yōu)化

構(gòu)建云原生機器學(xué)習(xí)平臺流程
PyTorch 2.5.1: Bugs修復(fù)版發(fā)布

評論