chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

PyTorch 1.8發(fā)布,支持AMD ROCm

深度學(xué)習(xí)自然語(yǔ)言處理 ? 來(lái)源:量子位 ? 作者:夢(mèng)晨 ? 2021-03-08 10:50 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1.8版本中,官方終于加入了對(duì)AMD ROCm的支持,可以方便的在原生環(huán)境下運(yùn)行,不用去配置Docker了。

△AMD ROCm只支持Linux操作系統(tǒng)

1.8版本集合了自2020年10月1.7發(fā)布以來(lái)的超過(guò)3000次GitHub提交。 此外,本次更新還有諸多亮點(diǎn):

優(yōu)化代碼,更新編譯器

Python內(nèi)函數(shù)轉(zhuǎn)換

增強(qiáng)分布式訓(xùn)練

新的移動(dòng)端教程與演示

新的性能檢測(cè)工具

相關(guān)的庫(kù)TorchCSPRNG, TorchVision, TorchText和TorchAudio也會(huì)隨之更新。 要注意的是,自1.6起,Pytorch新特性將分為Stable、Beta、Prototype三種版本。其中Prototype不會(huì)包含到穩(wěn)定發(fā)行版中,需要從Nightly版本自行編譯。

Python to Python函數(shù)轉(zhuǎn)換

新增的Beta特性torch.fx可以實(shí)現(xiàn)Python到Python的函數(shù)轉(zhuǎn)換,可以方便的加入任何工作流程。

新的API,向NumPy學(xué)習(xí)!

1.7版本中增加的Beta特性torch.fft已成為正式特性。實(shí)現(xiàn)了與Numpy中的np.fft類(lèi)似的快速傅立葉變換,還增加了硬件加速支持與自動(dòng)求導(dǎo),以更好的支持科學(xué)計(jì)算。 還增加了Beta版NumPy風(fēng)格的線(xiàn)性代數(shù)模塊torch.linalg,支持Cholesky分解、行列式、特征值等功能。

增強(qiáng)分布式訓(xùn)練

增加了穩(wěn)定的異步錯(cuò)誤與超時(shí)處理,增加NCCL的可靠性。 增加了Beta版的流水線(xiàn)并行功能*(Pipeline Parallelism)*,可將數(shù)據(jù)拆解成更小的塊以提高并行計(jì)算效率。

△Pipeline Parallelism使用4個(gè)GPU時(shí)的工作示意圖

增加Beta版的DDP通訊鉤子,用于控制如何在workers之間同步梯度。 另外還有一些Prototype版的分布式訓(xùn)練新特性。ZeroRedundancyOptimizer:用于減少所有參與進(jìn)程的內(nèi)存占用。Process Group NCCL Send/Recv:讓用戶(hù)可在Python而不是C++上進(jìn)行集合運(yùn)算。CUDA-support in RPC using TensorPipe:增加對(duì)N卡多卡運(yùn)算的效率。Remote Module:讓用戶(hù)像操作本地模塊一樣操作遠(yuǎn)程模塊。

移動(dòng)端新教程

隨本次更新發(fā)布了圖像分割模型DeepLabV3在安卓和IOS上的詳細(xì)教程。 以及圖像分割、目標(biāo)檢測(cè)、神經(jīng)機(jī)器翻譯等在安卓和IOS上的演示程序,方便大家更快上手。

另外還有PyTorch Mobile Lite Interpreter解釋器,可以減少運(yùn)行時(shí)文件的大小。

原文標(biāo)題:PyTorch 1.8來(lái)了!正式支持AMD GPU,煉丹不必NVIDIA

文章出處:【微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5645

    瀏覽量

    138967
  • python
    +關(guān)注

    關(guān)注

    57

    文章

    4856

    瀏覽量

    89522
  • pytorch
    +關(guān)注

    關(guān)注

    2

    文章

    812

    瀏覽量

    14661

原文標(biāo)題:PyTorch 1.8來(lái)了!正式支持AMD GPU,煉丹不必NVIDIA

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    ROCm部署PP-StructureV3到AMD GPU上

    作者:AVNET 李鑫杰 我們?cè)谏弦黄恼轮薪榻B了ROCm+PP-OCRv5,為實(shí)現(xiàn)在AMD計(jì)算平臺(tái)上完成復(fù)雜文檔的端到端智能解析,本文基于ROCm軟件棧,提供一套完整的PP-StructureV3
    的頭像 發(fā)表于 11-13 16:56 ?5173次閱讀
    用<b class='flag-5'>ROCm</b>部署PP-StructureV3到<b class='flag-5'>AMD</b> GPU上

    AMD Vitis AI 5.1測(cè)試版發(fā)布

    AMD Vitis AI 5.1全新發(fā)布——新增了對(duì) AMD Versal AI Edge 系列神經(jīng)網(wǎng)絡(luò)處理單元 (NPU) 的支持。Vitis AI 包含優(yōu)化的 NPU IP、模型編
    的頭像 發(fā)表于 10-31 12:46 ?455次閱讀

    全新升級(jí) | 匠芯創(chuàng)AiUIBuilder V2.0.0發(fā)布

    近日,匠芯創(chuàng)自主研發(fā)的GUI開(kāi)發(fā)工具AiUIBuilderV2.0.0發(fā)布。作為一款基于LVGL的UI設(shè)計(jì)工具,AiUIBuilder致力于通過(guò)拖拽式操作,加速基于匠芯創(chuàng)嵌入式平臺(tái)的圖形應(yīng)用開(kāi)發(fā)
    的頭像 發(fā)表于 10-29 10:03 ?561次閱讀
    全新升級(jí) | 匠芯創(chuàng)AiUIBuilder V2.0.0<b class='flag-5'>發(fā)布</b>

    G2發(fā)布最新報(bào)告,Splashtop 榮膺多區(qū)域領(lǐng)導(dǎo)者,IT 遠(yuǎn)程解決方案獲全球認(rèn)可

    近日,全球權(quán)威軟件評(píng)測(cè)平臺(tái)G2發(fā)布了2025年秋季報(bào)告,Splashtop在端點(diǎn)管理、補(bǔ)丁管理、遠(yuǎn)程支持和遠(yuǎn)程桌面類(lèi)別中表現(xiàn)亮眼,榮獲多項(xiàng)榮譽(yù)。憑借在歐洲、中東和非洲(EMEA)、歐洲、英國(guó)和加
    的頭像 發(fā)表于 10-20 17:02 ?981次閱讀
    G2<b class='flag-5'>發(fā)布</b>最新報(bào)告,Splashtop 榮膺多區(qū)域領(lǐng)導(dǎo)者,IT 遠(yuǎn)程解決方案獲全球認(rèn)可

    技嘉2025發(fā)布會(huì):“從心出發(fā) 我們的主張”,邁向AI新紀(jì)元

    體驗(yàn)優(yōu)化,全方位展現(xiàn)技嘉在主板、整機(jī)、軟件工具等領(lǐng)域的技術(shù)沉淀與產(chǎn)品實(shí)力,為全球硬件愛(ài)好者呈現(xiàn)一場(chǎng) “始于需求,忠于體驗(yàn)” 的科技盛宴。 在技嘉新品發(fā)布會(huì)上,行業(yè)巨頭與意見(jiàn)領(lǐng)袖齊聚一堂。英偉達(dá)、英特爾和AMD代表共同出席,同時(shí)邀
    的頭像 發(fā)表于 09-19 10:07 ?377次閱讀
    技嘉2025<b class='flag-5'>發(fā)布</b>會(huì):“從心出發(fā) 我們的主張”,邁向AI新紀(jì)元

    ROCm 6.2.4 成功移植至 SG2044: 大模型部署速率飆升,RISC-V + AI 新紀(jì)元!代碼已經(jīng)開(kāi)源,一起來(lái)試試!

    。AMD7900xtxonSOPHGOSG2044PCLT團(tuán)隊(duì)傾注心血,精心完成了將ROCm軟件棧適配到SG2044獨(dú)特架構(gòu)的復(fù)雜工作。這包括:內(nèi)核級(jí)適配:確保ROCm驅(qū)動(dòng)程序和底層組件能夠與SG
    的頭像 發(fā)表于 07-14 17:04 ?995次閱讀
    <b class='flag-5'>ROCm</b> 6.2.4 成功移植至 SG2044: 大模型部署速率飆升,RISC-V + AI 新紀(jì)元!代碼已經(jīng)開(kāi)源,一起來(lái)試試!

    請(qǐng)問(wèn)CYUSB232開(kāi)發(fā)板 是否支持1.8V Uart輸入?

    請(qǐng)問(wèn)CYUSB232開(kāi)發(fā)板 是否支持1.8V Uart輸入
    發(fā)表于 05-30 06:51

    重磅更新 | 先楫半導(dǎo)體HPM_APPS v1.9.0發(fā)布

    重磅更新 | 先楫半導(dǎo)體HPM_APPS v1.9.0發(fā)布
    的頭像 發(fā)表于 05-13 11:29 ?1315次閱讀
    重磅更新 | 先楫半導(dǎo)體HPM_APPS v1.9.0<b class='flag-5'>發(fā)布</b>

    摩爾線(xiàn)程發(fā)布Torch-MUSA v2.0.0版本 支持原生FP8和PyTorch 2.5.0

    近日,摩爾線(xiàn)程正式發(fā)布Torch-MUSA v2.0.0版本,這是其面向PyTorch深度學(xué)習(xí)框架的MUSA擴(kuò)展庫(kù)的重要升級(jí)。新版本基于MUSA Compute Capability 3.1計(jì)算架構(gòu)
    的頭像 發(fā)表于 05-11 16:41 ?1238次閱讀

    先楫半導(dǎo)體HPM_SDK v1.7.0發(fā)布!這些更新你值得關(guān)注!

    先楫半導(dǎo)體HPM_SDK v1.7.0發(fā)布!這些更新你值得關(guān)注!
    的頭像 發(fā)表于 02-08 13:42 ?1022次閱讀
    先楫半導(dǎo)體HPM_SDK v1.7.0<b class='flag-5'>發(fā)布</b>!這些更新你值得關(guān)注!

    利用Arm Kleidi技術(shù)實(shí)現(xiàn)PyTorch優(yōu)化

    PyTorch 是一個(gè)廣泛應(yīng)用的開(kāi)源機(jī)器學(xué)習(xí) (ML) 庫(kù)。近年來(lái),Arm 與合作伙伴通力協(xié)作,持續(xù)改進(jìn) PyTorch 的推理性能。本文將詳細(xì)介紹如何利用 Arm Kleidi 技術(shù)提升 Arm
    的頭像 發(fā)表于 12-23 09:19 ?1593次閱讀
    利用Arm Kleidi技術(shù)實(shí)現(xiàn)<b class='flag-5'>PyTorch</b>優(yōu)化

    AMD Alveo媒體加速產(chǎn)品組合SDK 1.2.1發(fā)布

    我們很高興地宣布AMD Alveo 媒體加速產(chǎn)品組合( AMA )SDK 1.2.1 版本發(fā)布,從而進(jìn)一步擴(kuò)展 AMD Alveo MA35D 媒體加速卡功能。
    的頭像 發(fā)表于 12-18 16:01 ?1017次閱讀

    AMD發(fā)布Ryzen Master軟件2.14.1.3286版本

    AMD最近發(fā)布了Ryzen Master軟件的2.14.1.3286版本,該版本在內(nèi)存超頻和CPU參數(shù)調(diào)整方面進(jìn)行了顯著改進(jìn)。其中最引人注目的新功能是支持即時(shí)動(dòng)態(tài)超頻的AMD EXPO
    的頭像 發(fā)表于 12-13 16:14 ?1705次閱讀

    ADS4449的spi信號(hào)支持1.8v電平嗎?

    ADS4449的數(shù)據(jù)手冊(cè)中是這樣描述的:“All digital inputs support 1.8-V logic levels. SPI supports 3.3-V logic levels”;問(wèn)下ADS4449的spi信號(hào)支持
    發(fā)表于 12-09 06:04

    PyTorch 2.5.1: Bugs修復(fù)版發(fā)布

    ? 一,前言 在深度學(xué)習(xí)框架的不斷迭代中,PyTorch 社區(qū)始終致力于提供更穩(wěn)定、更高效的工具。最近,PyTorch 2.5.1 版本正式發(fā)布,這個(gè)版本主要針對(duì) 2.5.0 中發(fā)現(xiàn)的問(wèn)題進(jìn)行了修復(fù)
    的頭像 發(fā)表于 12-03 16:11 ?1939次閱讀
    <b class='flag-5'>PyTorch</b> 2.5.1: Bugs修復(fù)版<b class='flag-5'>發(fā)布</b>