chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA助力騰訊助力“開悟”AI開放研究平臺

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-04-21 10:47 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

案例簡介

? 本案例中通過NVIDIA V100 GPUTensorRT,騰訊“開悟”AI開放研究平臺將強(qiáng)化學(xué)習(xí)模型訓(xùn)練中的自對弈推理部分,從CPU遷移到GPU上,實現(xiàn)了10倍的加速,并使推理成本下降90%,整體訓(xùn)練成本下降 67%。

? 本案例主要應(yīng)用到 NVIDIA V100 GPU 和 TensorRT。

客戶簡介及應(yīng)用背景

騰訊一直積極地推動強(qiáng)化學(xué)習(xí)在游戲AI領(lǐng)域的發(fā)展,并在2019年推出了“開悟”AI開放研究平臺,提供不同游戲的訓(xùn)練場景、支撐AI進(jìn)行強(qiáng)化訓(xùn)練的大規(guī)模算力、統(tǒng)一的強(qiáng)化學(xué)習(xí)框架以加速研發(fā)速度、通用的訓(xùn)練與推理服務(wù),加快AI訓(xùn)練速度。

客戶挑戰(zhàn)

和圖像以及語音的訓(xùn)練方式不同,目前在游戲AI訓(xùn)練上表現(xiàn)最好的方式是強(qiáng)化學(xué)習(xí)。強(qiáng)化學(xué)習(xí)除了需要大量的算力來訓(xùn)練深度學(xué)習(xí)網(wǎng)絡(luò)之外,還需要一個自對弈的模塊用來產(chǎn)生訓(xùn)練數(shù)據(jù)。在自對弈模塊當(dāng)中,會模擬游戲環(huán)境,并且選擇不同時期的模型來操控游戲內(nèi)的角色,AI對游戲內(nèi)角色的每一操控都需要對模型進(jìn)行一次前向推理。由于更新模型的訓(xùn)練數(shù)據(jù)來自于自對弈模塊,因此自對弈的推理速度會對整個模型的訓(xùn)練速度和效果造成非常大的影響。

而自對弈推理每一次前向推理對延時的要求比實際的線上服務(wù)小,因此常見的方式是通過CPU來進(jìn)行自對弈中的推理,但CPU成本太高。為了提高自對弈的速度與吞吐,減少推理成本,騰訊希望在“開悟”AI開放研究平臺里面充分利用GPU去進(jìn)行自對弈中的模型前向推理。

應(yīng)用方案

為了解決上述在自對弈推理當(dāng)中GPU利用率不高的問題, 騰訊“開悟”AI開放研究平臺選擇使用NVIDIA V100 GPU和NVIDIA TensorRT推理引擎來加速推理。

為了自動化地將模型從TensorFlow轉(zhuǎn)換到TensorRT, 騰訊“開悟”AI開放研究平臺一開始通過自行開發(fā)parser,將TensorFlow的算子映射到TensorRT的算子。同時,為了支持更廣泛的模型與算子,減少維護(hù)和開發(fā)的成本, 騰訊“開悟”AI開放研究平臺也積極地與NVIDIA合作,推動從TensorFlow轉(zhuǎn)換成ONNX模型,再通過TensorRT ONNX parser轉(zhuǎn)換到TensorRT的流程。

在自對弈的過程中,需要頻繁地更新模型的權(quán)重,讓自對弈模型始終能保持在較新的狀態(tài)。這個更新的頻率大概幾分鐘一次,每次必須限制在幾百個毫秒。如果通過重新build engine 的方式來更新模型的話,無法滿足上述要求。因此 騰訊“開悟”AI開放研究平臺采用 TensorRT refit engine的功能來更新權(quán)重。同時,為了對更新權(quán)重有更好的支持、以及支持更多的算子, 騰訊“開悟”AI開放研究平臺從原本的TensorRT 5 升級到TensorRT 7。

TensorRT 7雖然在部分算子上支持權(quán)重更新,但并不支持LSTM這個在游戲AI當(dāng)中很重要的算子。為了解決這個問題, 騰訊“開悟”AI開放研究平臺通過開發(fā)TensorRT插件的方式封裝LSTM算子,并在插件當(dāng)中更新權(quán)重。

為了充分利用NVIDIA V100 GPU的Tensor core, 騰訊“開悟”AI開放研究平臺希望能夠使用TensorRT FP16精度來加速推理。由于TensorRT對FP16的支持非常成熟和簡便,整個推理流程很快被切換到FP16,并取得了2倍左右的加速。

尋找模型推理時的性能瓶頸,通過開發(fā)TensorRT插件進(jìn)行算子融合,進(jìn)一步地提升推理的速度。

在完成以上的工作之后,對比TensorFlow的基礎(chǔ)版本,TensorRT 7 能提供5倍以上的加速效果。

使用效果及影響

通過NVIDIA V100 GPU以及TensorRT推理引擎加速自對弈訓(xùn)練的推理部分,騰訊“開悟”AI開放研究平臺極大地提升了自對弈推理的吞吐量與速度,進(jìn)一步地提升了整個模型訓(xùn)練的速度與降低訓(xùn)練成本,加快模型迭代的周期。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5687

    瀏覽量

    110117
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5271

    瀏覽量

    136070
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41115

    瀏覽量

    302607
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    NVIDIA開放模型助力構(gòu)建下一代數(shù)字健康智能體

    NVIDIA Nemotron 系列開放模型和 NVIDIA NeMo 庫正在為臨床醫(yī)生、研究人員和開發(fā)者提供開放權(quán)重和方法,使他們能夠在自
    的頭像 發(fā)表于 03-25 09:46 ?422次閱讀

    NVIDIA加速計算平臺助力從地球到太空的AI應(yīng)用

    NVIDIA 今日宣布,其最新一代加速計算平臺正在開啟太空創(chuàng)新的新時代,將為軌道數(shù)據(jù)中心 (ODC)、地理空間信息收集以及自主太空運行提供 AI 算力。
    的頭像 發(fā)表于 03-18 14:44 ?536次閱讀

    NVIDIA 成立由全球領(lǐng)先 AI 實驗室組成的 Nemotron Coalition,推動開放前沿模型發(fā)展

    在內(nèi)的領(lǐng)先創(chuàng)新者皆是創(chuàng)始成員,助力塑造新一代 AI 系統(tǒng)。 ● 聯(lián)盟成員將協(xié)作開發(fā)一款基于 NVIDIA DGX? Cloud 訓(xùn)練的開放模型,并將生成的模型開源,使全球開發(fā)者和組織
    的頭像 發(fā)表于 03-17 11:14 ?304次閱讀
    <b class='flag-5'>NVIDIA</b> 成立由全球領(lǐng)先 <b class='flag-5'>AI</b> 實驗室組成的 Nemotron Coalition,推動<b class='flag-5'>開放</b>前沿模型發(fā)展

    NVIDIA DRIVE AV軟件平臺與Halos架構(gòu)助力梅賽德斯奔馳CLA車型獲得最高安全評分

    NVIDIA DRIVE AV 軟件平臺NVIDIA Halos 架構(gòu)助力 CLA 車型獲得最高安全評分(top safety rating)。
    的頭像 發(fā)表于 02-02 09:28 ?2324次閱讀

    生命科學(xué)領(lǐng)先企業(yè)采用 NVIDIA BioNeMo 平臺加速 AI 驅(qū)動的藥物研發(fā)

    —— NVIDIA 近日宣布對 NVIDIA BioNeMo? 進(jìn)行重大擴(kuò)展, 將通過一個開放式開發(fā)平臺支持實現(xiàn)實驗室閉環(huán)(lab-in-the-loop)工作流,以推動
    的頭像 發(fā)表于 01-14 11:40 ?661次閱讀
    生命科學(xué)領(lǐng)先企業(yè)采用 <b class='flag-5'>NVIDIA</b> BioNeMo <b class='flag-5'>平臺</b>加速 <b class='flag-5'>AI</b> 驅(qū)動的藥物研發(fā)

    NVIDIA攜手Mistral AI發(fā)布全新開源大語言模型系列

    全新 Mistral 3 系列涵蓋從前沿級到緊湊型模型,針對 NVIDIA 平臺進(jìn)行了優(yōu)化,助力 Mistral AI 實現(xiàn)云到邊緣分布式智能愿景。
    的頭像 發(fā)表于 12-13 09:58 ?1446次閱讀

    利用NVIDIA Cosmos開放世界基礎(chǔ)模型加速物理AI開發(fā)

    NVIDIA 最近發(fā)布了 NVIDIA Cosmos 開放世界基礎(chǔ)模型(WFM)的更新,旨在加速物理 AI 模型的測試與驗證數(shù)據(jù)生成。借助 NVID
    的頭像 發(fā)表于 12-01 09:25 ?1437次閱讀

    NVIDIA DGX Spark助力構(gòu)建自己的AI模型

    作為個人 AI 超級計算機(jī),為世界各地的 AI 研究人員、數(shù)據(jù)科學(xué)家和學(xué)生提供 NVIDIA Grace Blackwell 平臺的強(qiáng)大功
    的頭像 發(fā)表于 11-21 09:25 ?1540次閱讀
    <b class='flag-5'>NVIDIA</b> DGX Spark<b class='flag-5'>助力</b>構(gòu)建自己的<b class='flag-5'>AI</b>模型

    騰訊地圖推出全新時空智能開放平臺“蓋亞”

    )。 該平臺基于騰訊位置服務(wù)開放平臺與位置大數(shù)據(jù)平臺的底層能力,深度融合騰訊混元大模型與時空動態(tài)
    的頭像 發(fā)表于 09-18 10:26 ?2248次閱讀

    Arm率先適配騰訊混元開源模型,助力端側(cè)AI創(chuàng)新開發(fā)

    共同賦能端側(cè)人工智能 (AI) 部署,助力本土開發(fā)者實現(xiàn) AI 應(yīng)用創(chuàng)新! 這次的首日開源適配是雙方再次攜手提升端側(cè)應(yīng)用功能和用戶體驗的又一例證。去年,Arm 將 Arm KleidiAI 技術(shù)與
    的頭像 發(fā)表于 08-08 09:16 ?1553次閱讀
    Arm率先適配<b class='flag-5'>騰訊</b>混元開源模型,<b class='flag-5'>助力</b>端側(cè)<b class='flag-5'>AI</b>創(chuàng)新開發(fā)

    NVIDIA AI助力科學(xué)研究領(lǐng)域持續(xù)突破

    隨著 AI 技術(shù)的廣泛應(yīng)用,AI 正在成為科學(xué)研究的引擎。NVIDIA 作為重要的技術(shù)推手,持續(xù)驅(qū)動著 AI 系統(tǒng)解鎖更多領(lǐng)域的科學(xué)突破。
    的頭像 發(fā)表于 08-05 16:30 ?1328次閱讀

    安森美助力NVIDIA AI系統(tǒng)檢測實驗室

    NVIDIA Halos綜合安全系統(tǒng),將NVIDIA的汽車硬件、軟件安全解決方案與其自動駕駛汽車安全領(lǐng)域前沿的AI研究相結(jié)合。
    的頭像 發(fā)表于 07-10 16:21 ?947次閱讀

    NVIDIA技術(shù)助力歐洲加強(qiáng)AI原生無線網(wǎng)絡(luò)研究與開發(fā)

    來自 30 多個歐洲國家的 200 多家公司和大學(xué)正在利用 NVIDIA 6G 研究組合,在 AI 原生無線網(wǎng)絡(luò)領(lǐng)域取得突破。
    的頭像 發(fā)表于 06-19 14:49 ?1476次閱讀

    NVIDIA AI技術(shù)助力歐洲醫(yī)療健康行業(yè)發(fā)展

    從構(gòu)建全球規(guī)模最大的生物多樣性數(shù)據(jù)庫,到打造賦能罕見病研究AI 工廠,NVIDIAAI 初創(chuàng)企業(yè)生態(tài)系統(tǒng)正持續(xù)為歐洲醫(yī)療健康領(lǐng)域注入創(chuàng)新動能。
    的頭像 發(fā)表于 06-19 14:40 ?3525次閱讀

    NVIDIA AI如何助力藝術(shù)創(chuàng)意落地

    本次 GTC 將在歐洲著名藝術(shù)之都巴黎舉辦,特別策劃的藝術(shù)畫廊將展示 AI 如何助力創(chuàng)意落地,實現(xiàn)技術(shù)與靈感碰撞的愿景。
    的頭像 發(fā)表于 06-12 15:26 ?1148次閱讀