chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA 與飛槳團(tuán)隊(duì)合作開(kāi)發(fā)基于 ResNet50 的模型示例

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來(lái)源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 作者:NVIDIA英偉達(dá)企業(yè)解 ? 2022-10-18 10:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

你還在頭疼于經(jīng)典模型的復(fù)現(xiàn)嗎?不知何處可以得到全面可參照的 Benchmark?

為了讓飛槳開(kāi)發(fā)者可以快速?gòu)?fù)現(xiàn)頂尖的精度和超高的性能,NVIDIA 與飛槳團(tuán)隊(duì)合作開(kāi)發(fā)了基于 ResNet50 的模型示例,并將持續(xù)開(kāi)發(fā)更多的基于 NLP 和 CV 等領(lǐng)域的經(jīng)典模型,后續(xù)陸續(xù)發(fā)布的模型有 BERT、PP-OCR、PP-YOLO 等,歡迎持續(xù)關(guān)注。

深度學(xué)習(xí)模型是什么?

深度學(xué)習(xí)包括訓(xùn)練和推理兩個(gè)環(huán)節(jié)。訓(xùn)練是指通過(guò)大數(shù)據(jù)訓(xùn)練出一個(gè)復(fù)雜的神經(jīng)網(wǎng)絡(luò)模型,即用大量標(biāo)記過(guò)的數(shù)據(jù)來(lái)“訓(xùn)練”相應(yīng)的系統(tǒng),使之可以適應(yīng)特定的功能。推理是指利用訓(xùn)練好的模型,使用新數(shù)據(jù)推理出各種結(jié)論。深度學(xué)習(xí)模型是在訓(xùn)練工作過(guò)程中生成,并將其保存,用于推理當(dāng)中。

3a7b4034-4e20-11ed-a3b6-dac502259ad0.png

深度學(xué)習(xí)訓(xùn)練推理示意圖

NVIDIA Deep Learning Examples

全新上線飛槳 ResNet50

NVIDIA Deep Learning Examples 倉(cāng)庫(kù)上線了基于飛槳實(shí)現(xiàn)的 ResNet50 模型的性能優(yōu)化結(jié)果,該示例全面適配各類 NVIDIA GPU 和各種硬件拓?fù)洌▎螜C(jī)單卡,單機(jī)多卡),極致優(yōu)化性能。值得一提的是,Deep Learning Examples 中飛槳 ResNet50 模型訓(xùn)練速度已超過(guò)對(duì)應(yīng)的 PyTorch 版 ResNet50。

3af18e88-4e20-11ed-a3b6-dac502259ad0.png

NVIDIA Deep Learning Examples 倉(cāng)庫(kù)中基于飛槳與 PyTorch 的 ResNet50 模型在同等 GPU 配置下的訓(xùn)練性能比較,GPU 配置為 NVIDIA DGX A100(8x A100 80GB)。

*數(shù)據(jù)來(lái)源:[1][2]

NVIDIA Deep Learning Examples 倉(cāng)庫(kù)中飛槳 ResNet50 有哪些優(yōu)勢(shì)?

優(yōu)勢(shì)一:通過(guò)使用 DALI 等工具,加速 GPU 數(shù)據(jù)預(yù)處理性能

NVIDIA Data Loading Library( DALI )專注于使用 GPU 加速深度學(xué)習(xí)應(yīng)用中的數(shù)據(jù)加載和預(yù)處理。深度學(xué)習(xí)數(shù)據(jù)預(yù)處理涉及到復(fù)雜的、多個(gè)階段的處理過(guò)程,如 ResNet50 模型訓(xùn)練過(guò)程中,在 CPU 上處理圖片的加載、解碼、裁剪、翻轉(zhuǎn)、縮放和其他數(shù)據(jù)增強(qiáng)等操作會(huì)成為瓶頸,限制訓(xùn)練和推理的性能和可擴(kuò)展性。DALI 將這些操作轉(zhuǎn)移到 GPU 上,最大限度地提高輸入流水線的吞吐量,并且其中數(shù)據(jù)預(yù)取,并行執(zhí)行和批處理的操作對(duì)用戶是透明的。

優(yōu)勢(shì)二:通過(guò)使用 AMP,ASP 等工具,提高推理性能

飛槳內(nèi)置支持 AMP(自動(dòng)混合精度)及 ASP(自動(dòng)稀疏化)模塊,AMP 模塊可在模型訓(xùn)練過(guò)程中,自動(dòng)為算子選擇合適的計(jì)算精度(FP32/FP16),充分利用 Tensor Cores 的性能,在不影響模型精度的前提下,大幅加速模型訓(xùn)練。

ASP 模塊實(shí)現(xiàn)了一個(gè)工作流將深度學(xué)習(xí)模型從稠密修剪為 2:4 的稀疏模式,經(jīng)過(guò)重訓(xùn)練之后,可恢復(fù)到與稠密模型相當(dāng)?shù)木?。稀疏模型可以充分利?A100 Tensor Core GPU 的加速特性,被修剪的權(quán)重矩陣參數(shù)存儲(chǔ)量減半,并且可以獲得理論上 2 倍的計(jì)算加速,從而大幅提高推理性能。

優(yōu)勢(shì)三:通過(guò)集成 TensorRT,優(yōu)化推理模型

飛槳推理集成了 TensorRT,稱為 Paddle-TRT。它可以把部分模型子圖交給 TensorRT 加速,而其他部分仍然用飛槳執(zhí)行,從而達(dá)到最佳的推理性能。

優(yōu)勢(shì)四:豐富的 Benchmark

NVIDIA Deep Learning Examples 倉(cāng)庫(kù)中

有哪些 Benchmark?

NVIDIA Deep Learning Examples 倉(cāng)庫(kù)中的 Benchmark 主要包含訓(xùn)練精度結(jié)果、訓(xùn)練性能結(jié)果、推理性能結(jié)果、Paddle-TRT 性能結(jié)果幾個(gè)方面。

1、訓(xùn)練精度結(jié)果

3b0a8dac-4e20-11ed-a3b6-dac502259ad0.png

訓(xùn)練精度: NVIDIA DGX A100 (8x A100 80GB)

*數(shù)據(jù)來(lái)源:[1]

3b4da61e-4e20-11ed-a3b6-dac502259ad0.png

集成 ASP 的提高精度: NVIDIA DGX A100 (8x A100 80GB)

*數(shù)據(jù)來(lái)源:[1]

2、訓(xùn)練性能結(jié)果

3b6ce75e-4e20-11ed-a3b6-dac502259ad0.png

訓(xùn)練性能: NVIDIA DGX A100 (8x A100 80GB)

*數(shù)據(jù)來(lái)源:[1]

3b8aa3b6-4e20-11ed-a3b6-dac502259ad0.png

集成 ASP 的訓(xùn)練性能: NVIDIA DGX A100 (8x A100 80GB)

*數(shù)據(jù)來(lái)源:[1]

3、推理性能結(jié)果

3bfc266c-4e20-11ed-a3b6-dac502259ad0.jpg

推理性能: NVIDIA DGX A100 (1x A100 80GB)

*數(shù)據(jù)來(lái)源:[1]

4、Paddle-TRT 性能結(jié)果

3c63f922-4e20-11ed-a3b6-dac502259ad0.jpg

Paddle-TRT 性能結(jié)果: NVIDIA DGX A100 (1x A100 80GB)

*數(shù)據(jù)來(lái)源:[1]

3cdb0cc4-4e20-11ed-a3b6-dac502259ad0.jpg

Paddle-TRT 性能結(jié)果: NVIDIA A30 (1x A30 24GB)

*數(shù)據(jù)來(lái)源:[1]

3cfce2ea-4e20-11ed-a3b6-dac502259ad0.jpg

Paddle-TRT 性能結(jié)果: NVIDIA A10 (1x A10 24GB)

*數(shù)據(jù)來(lái)源:[1]

如何下載 NVIDIA Deep Learning Examples 中的飛槳 ResNet50?

登錄 GitHub NVIDIA Deep Learning Examples 倉(cāng)庫(kù), 找到 PaddlePaddle/Classification/RN50/1.5,下載模型源代碼即可。

3d60954c-4e20-11ed-a3b6-dac502259ad0.png

NVIDIA Deep Learning Examples 飛槳 ResNet50 下載頁(yè)面

飛槳容器如何安裝?

容器包含了深度學(xué)習(xí)框架在運(yùn)行時(shí)所需的所有部件(包括驅(qū)動(dòng),工具包等),它具有輕量化與可復(fù)制性、打包和執(zhí)行環(huán)境合二為一以及簡(jiǎn)化應(yīng)用程序部署等優(yōu)勢(shì),因此,被認(rèn)為是在同一環(huán)境中實(shí)現(xiàn)“構(gòu)建、測(cè)試、部署”的最佳平臺(tái)。容器允許我們創(chuàng)建標(biāo)準(zhǔn)化可復(fù)制的輕量級(jí)開(kāi)發(fā)環(huán)境,擺脫來(lái)自 Hypervisor 所帶來(lái)運(yùn)行開(kāi)銷。應(yīng)用程序可以基于 Container Runtime 運(yùn)行在“任意”系統(tǒng)中。

NVIDIA 與百度飛槳聯(lián)合開(kāi)發(fā)了 NGC 飛槳容器,將最新版本的飛槳與最新的 NVIDIA 的軟件棧進(jìn)行了無(wú)縫的集成與性能優(yōu)化,最大程度的釋放飛槳框架在 NVIDIA 最新硬件上的計(jì)算能力。這樣,用戶不僅可以快速開(kāi)啟 AI 應(yīng)用,專注于創(chuàng)新和應(yīng)用本身,還能夠在 AI 訓(xùn)練和推理任務(wù)上獲得飛槳+NVIDIA 帶來(lái)的飛速體驗(yàn)。

NGC 飛槳容器已經(jīng)集成入飛槳官網(wǎng)主頁(yè)。你可以選擇 “飛槳版本”+“Linux”+“Docker”+“CUDA 11.7”找到對(duì)應(yīng)的 Container 下載指令。

3e05508c-4e20-11ed-a3b6-dac502259ad0.png

并參考《NGC 飛槳容器安裝指南》下載安裝:https://www.paddlepaddle.org.cn/documentation/docs/zh/install/install_NGC_PaddlePaddle_ch.html

3e57eb58-4e20-11ed-a3b6-dac502259ad0.png

運(yùn)行結(jié)果如下:

3f156b06-4e20-11ed-a3b6-dac502259ad0.png

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5494

    瀏覽量

    109016
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3644

    瀏覽量

    51685
  • 大數(shù)據(jù)
    +關(guān)注

    關(guān)注

    64

    文章

    9027

    瀏覽量

    143000
  • 飛槳
    +關(guān)注

    關(guān)注

    0

    文章

    37

    瀏覽量

    2613

原文標(biāo)題:NVIDIA Deep Learning Examples飛槳ResNet50模型上線訓(xùn)練速度超PyTorch ResNet50

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    利用NVIDIA Cosmos開(kāi)放世界基礎(chǔ)模型加速物理AI開(kāi)發(fā)

    NVIDIA 最近發(fā)布了 NVIDIA Cosmos 開(kāi)放世界基礎(chǔ)模型(WFM)的更新,旨在加速物理 AI 模型的測(cè)試與驗(yàn)證數(shù)據(jù)生成。借助 NVID
    的頭像 發(fā)表于 12-01 09:25 ?406次閱讀

    基于瑞芯微RK3576的resnet50訓(xùn)練部署教程

    Resnet50簡(jiǎn)介ResNet50網(wǎng)絡(luò)是2015年由微軟實(shí)驗(yàn)室的何愷明提出,獲得ILSVRC2015圖像分類競(jìng)賽第一名。在ResNet網(wǎng)絡(luò)提出之前,傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)都是將一系列的卷積層和池化層
    的頭像 發(fā)表于 09-10 11:19 ?1093次閱讀
    基于瑞芯微RK3576的<b class='flag-5'>resnet50</b>訓(xùn)練部署教程

    龍芯中科與文心系列模型開(kāi)展深度技術(shù)合作

    ”解決方案。 強(qiáng)強(qiáng)聯(lián)合!自主架構(gòu)賦能大模型訓(xùn)練 文心大模型 文心4.5系列模型均使用深度學(xué)習(xí)框架進(jìn)行高效訓(xùn)練、推理和部署。在大語(yǔ)言
    的頭像 發(fā)表于 07-02 16:53 ?1111次閱讀

    全志科技攜凌嵌入式T527核心板亮相OpenHarmony開(kāi)發(fā)者大會(huì)

    全志科技作為OpenHarmony生態(tài)的重要合作伙伴受邀參會(huì),還重點(diǎn)介紹了與凌嵌入式合作開(kāi)發(fā)的FET527-C核心板
    的頭像 發(fā)表于 05-30 11:02 ?1391次閱讀
    全志科技攜<b class='flag-5'>飛</b>凌嵌入式T527核心板亮相OpenHarmony<b class='flag-5'>開(kāi)發(fā)</b>者大會(huì)

    模型時(shí)代的深度學(xué)習(xí)框架

    作者:算力魔方創(chuàng)始人/英特爾創(chuàng)新大使劉力 在 CNN時(shí)代 ,AI模型的參數(shù)規(guī)模都在百萬(wàn)級(jí)別,僅需在單張消費(fèi)類顯卡上即可完成訓(xùn)練。例如,以業(yè)界知名的CNN模型ResNet50 為例,模型
    的頭像 發(fā)表于 04-25 11:43 ?639次閱讀
    大<b class='flag-5'>模型</b>時(shí)代的深度學(xué)習(xí)框架

    基于RV1126開(kāi)發(fā)板的resnet50訓(xùn)練部署教程

    本教程基于圖像分類算法ResNet50的訓(xùn)練和部署到EASY-EAI-Nano(RV1126)進(jìn)行說(shuō)明
    的頭像 發(fā)表于 04-18 15:07 ?910次閱讀
    基于RV1126<b class='flag-5'>開(kāi)發(fā)</b>板的<b class='flag-5'>resnet50</b>訓(xùn)練部署教程

    燧原科技正式納入例行版本發(fā)布體系

    燧原科技與經(jīng)過(guò)長(zhǎng)時(shí)間的適配合作和持續(xù)集成(CI)建設(shè),對(duì)合?的每?行代碼都在燧原硬件上進(jìn)?了驗(yàn)證。如今,燧原正式納入
    的頭像 發(fā)表于 04-11 11:31 ?807次閱讀
    燧原科技正式納入<b class='flag-5'>飛</b><b class='flag-5'>槳</b>例行版本發(fā)布體系

    百度框架3.0正式版發(fā)布

    、推理等任務(wù)都離不開(kāi)深度學(xué)習(xí)框架的優(yōu)化與支撐。 框架3.0,從設(shè)計(jì)理念上實(shí)現(xiàn)了從底層硬件適配到頂層開(kāi)發(fā)體驗(yàn)的全面進(jìn)化,在訓(xùn)練效率、性能、兼容性等關(guān)鍵指標(biāo)上建立了新標(biāo)桿。 其中, “動(dòng)靜統(tǒng)一自動(dòng)并行”、“大
    的頭像 發(fā)表于 04-02 19:03 ?1037次閱讀
    百度<b class='flag-5'>飛</b><b class='flag-5'>槳</b>框架3.0正式版發(fā)布

    NVIDIA 推出開(kāi)放推理 AI 模型系列,助力開(kāi)發(fā)者和企業(yè)構(gòu)建代理式 AI 平臺(tái)

    月 18 日 —— ?NVIDIA 今日發(fā)布具有推理功能的開(kāi)源 Llama Nemotron 模型系列,旨在為開(kāi)發(fā)者和企業(yè)提供業(yè)務(wù)就緒型基礎(chǔ),助力構(gòu)建能夠獨(dú)立工作或以團(tuán)隊(duì)形式完成復(fù)雜
    發(fā)表于 03-19 09:31 ?334次閱讀
    <b class='flag-5'>NVIDIA</b> 推出開(kāi)放推理 AI <b class='flag-5'>模型</b>系列,助力<b class='flag-5'>開(kāi)發(fā)</b>者和企業(yè)構(gòu)建代理式 AI 平臺(tái)

    NVIDIA 發(fā)布全球首個(gè)開(kāi)源人形機(jī)器人基礎(chǔ)模型 Isaac GR00T N1——并推出加速機(jī)器人開(kāi)發(fā)的仿真框架

    推出完全可定制的 GR00T N1 基礎(chǔ)模型,為人形機(jī)器人賦予通用技能與推理技能 NVIDIA、Google DeepMind 和 Disney Research 合作開(kāi)發(fā)新一代開(kāi)源物理引擎
    發(fā)表于 03-19 09:30 ?588次閱讀
    <b class='flag-5'>NVIDIA</b> 發(fā)布全球首個(gè)開(kāi)源人形機(jī)器人基礎(chǔ)<b class='flag-5'>模型</b> Isaac GR00T N1——并推出加速機(jī)器人<b class='flag-5'>開(kāi)發(fā)</b>的仿真框架

    GaN HEMT的SPICE模型使用指南及示例

    GaN HEMT的SPICE模型使用指南及示例總結(jié) 本文檔基于GaN HEMT的實(shí)測(cè)特性描述了當(dāng)前版本的模型。該模型專為與PSpice和LTspice配合使用而
    的頭像 發(fā)表于 03-11 17:43 ?1898次閱讀
    GaN HEMT的SPICE<b class='flag-5'>模型</b>使用指南及<b class='flag-5'>示例</b>

    如何在C#中部署PP-OCRv4模型

    《超4萬(wàn)6千星的開(kāi)源OCR黑馬登場(chǎng),PaddleOCR憑什么脫穎而出?》收到了讀者熱烈反響c,很多讀者提出:如何在C#中部署PP-OCRv4模型?本文從零開(kāi)始詳細(xì)介紹整個(gè)過(guò)程。
    的頭像 發(fā)表于 02-17 10:58 ?2632次閱讀
    如何在C#中部署<b class='flag-5'>飛</b><b class='flag-5'>槳</b>PP-OCRv4<b class='flag-5'>模型</b>

    使用OpenVINO C# API輕松部署PP-OCRv4模型

    ? 作者:算力魔方創(chuàng)始人/英特爾創(chuàng)新大使劉力 《超4萬(wàn)6千星的開(kāi)源OCR黑馬登場(chǎng),PaddleOCR憑什么脫穎而出?》 收到了讀者熱烈反響,很多讀者提出:如何在C#中部署PP-OCRv4模型
    的頭像 發(fā)表于 02-12 10:42 ?2000次閱讀
    使用OpenVINO C# API輕松部署<b class='flag-5'>飛</b><b class='flag-5'>槳</b>PP-OCRv4<b class='flag-5'>模型</b>

    NVIDIA推出面向RTX AI PC的AI基礎(chǔ)模型

    NVIDIA 今日發(fā)布能在 NVIDIA RTX AI PC 本地運(yùn)行的基礎(chǔ)模型,為數(shù)字人、內(nèi)容創(chuàng)作、生產(chǎn)力和開(kāi)發(fā)提供強(qiáng)大助力。
    的頭像 發(fā)表于 01-08 11:01 ?854次閱讀

    Orange與OpenAI、Meta合作開(kāi)發(fā)非洲語(yǔ)言AI大模型

    OpenAI和Meta將攜手法國(guó)電信運(yùn)營(yíng)商O(píng)range SA,共同開(kāi)發(fā)針對(duì)非洲語(yǔ)言的人工智能大模型。該項(xiàng)目旨在解決非洲大陸數(shù)千種方言模型短缺的問(wèn)題,計(jì)劃于明年上半年正式啟動(dòng)。
    的頭像 發(fā)表于 12-02 11:00 ?869次閱讀