chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA助力騰訊AI LAB打造一體AI生態(tài)

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-04-21 10:50 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

案例簡(jiǎn)介

? 本案例中通過使用NVIDIA T4 GPUTensorRT,OpenGL,CUDA, CUDA/OpenGL interoperability等GPU軟件技術(shù)棧,助力騰訊AI LAB虛擬人項(xiàng)目在人臉生成階段達(dá)到了超過3倍的加速。

? 本案例主要應(yīng)用到 NVIDIA T4 GPU,TensorRT, OpenGL,CUDA, CUDA/OpenGL interoperability等AI加速平臺(tái)。

客戶簡(jiǎn)介及應(yīng)用背景

騰訊AI LAB致力于打造產(chǎn)學(xué)研用一體的 AI 生態(tài),主要的研究方向包括計(jì)算機(jī)視覺、語音識(shí)別、自然語言處理和機(jī)器學(xué)習(xí),結(jié)合騰訊場(chǎng)景與業(yè)務(wù)優(yōu)勢(shì),在社交AI,游戲AI,內(nèi)容AI及平臺(tái)AI等領(lǐng)域取得了顯著的成果,技術(shù)被應(yīng)用于微信、QQ、天天快報(bào)和QQ音樂等上百個(gè)騰訊產(chǎn)品。其中圍棋AI “絕藝” 多次獲得世界人工智能圍棋大賽的冠軍。

騰訊AI LAB打造的虛擬人,具有自然,生動(dòng)且飽含情緒的表情,其背后由一套騰訊 AI Lab 自研的復(fù)雜系統(tǒng)支撐,系統(tǒng)首先要從文本中提取不同信息,包括表情、情感、重音位置、和激動(dòng)程度等;之后,這些信息被輸入到模型中生成,再同步生成語音、口型和表情參數(shù),最終才有了虛擬人自然生動(dòng)的表現(xiàn)。

客戶挑戰(zhàn)

根據(jù)虛擬人物需要表達(dá)的語言和情感,生成自然生動(dòng)的人臉,是打造虛擬人重要的一個(gè)階段。需要先渲染人臉的紋理圖和渲染圖,并將它們輸入到深度學(xué)習(xí)模型中,最終生成自然生動(dòng)的人臉。在這個(gè)過程中,需要用到OpenGL、OpenCV、CUDA、TensorFlow等軟件技術(shù),騰訊原有的方案有很多CPU與GPU的數(shù)據(jù)交互,且有很多計(jì)算型的操作通過CPU來實(shí)現(xiàn),效率非常低下, 無論是吞吐還是延時(shí)都不滿足要求,具體體現(xiàn)在:

OpenGL在GPU上渲染好圖像繪制到framebuffer后,需要先用glReadPixels拷貝數(shù)據(jù)到CPU,再用cudaMemcpy將數(shù)據(jù)從CPU拷回到GPU以進(jìn)行深度學(xué)習(xí)模型的推理,這里有兩次不必要的CPU與GPU之間的數(shù)據(jù)傳輸。

顏色空間轉(zhuǎn)換,深度學(xué)習(xí)推理的前后處理等操作在CPU上完成,效率非常低下。

應(yīng)用方案

NVIDIA 技術(shù)在虛擬人項(xiàng)目的渲染和推理階段均提供了強(qiáng)大的支持。在渲染階段,NVIDIA 助力提升了顏色空間轉(zhuǎn)換效率,降低整體延時(shí),主要體現(xiàn)在:

用NVIDIA CUDA/OpenGL interoperability 代替騰訊之前使用glReadPixels在CUDA和OpenGL之間拷貝數(shù)據(jù)的方案,大幅減少了CPU和GPU之間的數(shù)據(jù)拷貝,從而降低了整體的延時(shí)。

把原來在CPU上做的顏色空間轉(zhuǎn)換的操作,遷移到NVIDIA T4 GPU上用CUDA kernel實(shí)現(xiàn),利用GPU的并行優(yōu)勢(shì),大大提高了顏色空間轉(zhuǎn)換的效率,進(jìn)一步降低了整體的延時(shí)。

將多幀的mesh組成一個(gè)batch分別繪制到framebuffer的不同區(qū)域,在提高OpenGL并行度的同時(shí),給下一階段的深度學(xué)習(xí)模型的推理提供了更大的輸入數(shù)據(jù)的batch size,充分發(fā)揮NVIDIA T4 GPU高并發(fā)計(jì)算的優(yōu)勢(shì),進(jìn)一步提高GPU的利用率,從而提高整體的吞吐。

在推理階段,NVIDIA助力提高推理整體吞吐,降低推理延時(shí),主要體現(xiàn)在以下幾點(diǎn):用NVIDIA TensorRT替換TensorFlow對(duì)模型推理進(jìn)行加速,并利用NVIDIA T4 GPU上的FP16 Tensor Core可以極大提高矩陣乘等操作速度的特性,在最終視覺效果幾乎不變的情況下,進(jìn)一步提升推理的吞吐,降低推理延時(shí)。

用NVIDIA TensorRT替換TensorFlow對(duì)模型推理進(jìn)行加速,并利用NVIDIA T4 GPU上的FP16 Tensor Core可以極大提高矩陣乘等操作速度的特性,在最終視覺效果幾乎不變的情況下,進(jìn)一步提升推理的吞吐,降低推理延時(shí)。

在NVIDIA T4 GPU上利用CUDA kernel 替代原始流程中在CPU上使用OpenCV實(shí)現(xiàn) Mat-to-Tensor 和 Tensor-to-Mat 等格式轉(zhuǎn)換操作,并使用OpenCV-CUDA版替換OpenCV-CPU版的部分操作(如Resize等),充分發(fā)揮GPU相對(duì)于CPU更高的并發(fā)優(yōu)勢(shì),在加速這些操作的同時(shí)減少GPU到CPU的數(shù)據(jù)傳輸通信量,提高格式轉(zhuǎn)換效率,降低端到端的推理延時(shí)。

通過Pipeline的方式,使GPU和CPU上的操作進(jìn)行overlap,并結(jié)合NVIDIA的MPS技術(shù)提高單卡上多個(gè)進(jìn)程同時(shí)處理多個(gè)數(shù)據(jù)流的同時(shí)提高整體的吞吐。

使用效果及影響

在虛擬人項(xiàng)目中,NVIDIA CUDA技術(shù)大幅提升了渲染速度,NVIDIA TensorRT 方便快速地加速深度學(xué)習(xí)模型的推理,結(jié)合MPS技術(shù),實(shí)現(xiàn)了單卡多路推流,使整體推理效率達(dá)到了原來的三倍!性能的大幅提升,既提升了GPU的利用率,又降低了AI技術(shù)的使用成本。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5496

    瀏覽量

    109118
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5102

    瀏覽量

    134485
  • AI
    AI
    +關(guān)注

    關(guān)注

    90

    文章

    38189

    瀏覽量

    297027
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    南京微雀與華為打造法律AI一體機(jī)聯(lián)合解決方案

    站式“行業(yè)+AI”解決方案,讓服務(wù)更精準(zhǔn)、決策更高效、治理更智能。本期將重點(diǎn)呈現(xiàn)南京微雀與華為共同打造的法律AI一體機(jī)聯(lián)合解決方案,讓我們
    的頭像 發(fā)表于 10-24 09:23 ?587次閱讀
    南京微雀與華為<b class='flag-5'>打造</b>法律<b class='flag-5'>AI</b><b class='flag-5'>一體</b>機(jī)聯(lián)合解決方案

    BPI-AIM7 RK3588 AINvidia Jetson Nano 生態(tài)系統(tǒng)兼容的低功耗 AI 模塊

    應(yīng)用。 []() AIM-IO是款專為 Jetson Nano 生態(tài)系統(tǒng)設(shè)計(jì)的開源擴(kuò)展板。它與 RK3588 AI Module7 配合使用,為您提供個(gè)微型
    發(fā)表于 10-11 09:08

    大家都在用什么AI軟件?有沒有好用的免費(fèi)的AI軟件推薦下?

    大家都在用什么AI軟件?有沒有好用的免費(fèi)的AI軟件推薦下?直接發(fā)個(gè)安裝包,謝謝。比如deepseek、Chatgpt、豆包、阿里AI、百度AI
    發(fā)表于 07-09 18:30

    NVIDIA AI技術(shù)助力歐洲醫(yī)療健康行業(yè)發(fā)展

    從構(gòu)建全球規(guī)模最大的生物多樣性數(shù)據(jù)庫,到打造賦能罕見病研究的 AI 工廠,NVIDIAAI 初創(chuàng)企業(yè)生態(tài)系統(tǒng)正持續(xù)為歐洲醫(yī)療健康領(lǐng)域注
    的頭像 發(fā)表于 06-19 14:40 ?3179次閱讀

    NVIDIA技術(shù)助力企業(yè)創(chuàng)建主權(quán)AI智能

    AI Factory 的經(jīng)驗(yàn)證設(shè)計(jì)將加速基礎(chǔ)設(shè)施與軟件(包括全新 NVIDIA NIM 微服務(wù)和經(jīng)擴(kuò)展的 NVIDIA Blueprint)相結(jié)合,為各國(guó)和企業(yè)簡(jiǎn)化了全棧式 AI 開發(fā)
    的頭像 發(fā)表于 06-16 14:28 ?1101次閱讀

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    套件2.0,打造整套圍繞AI開發(fā)效率與落地路徑展開的“系統(tǒng)性解法”,為開發(fā)者提供了AI應(yīng)用開發(fā)工具全家桶。同時(shí),全新升級(jí)的旗艦5G智能
    發(fā)表于 04-13 19:52

    硅基覺醒已至前夜,聯(lián)發(fā)科攜手生態(tài)加速智能化用戶體驗(yàn)時(shí)代到來

    、適配與部署;Dimensity Profiler提供深層調(diào)試能力;而天璣AI開發(fā)套件2.0則在模型規(guī)模、訓(xùn)練性能與平臺(tái)接口全面升級(jí),為開發(fā)者打造從芯片到底層算法的閉環(huán)支持。 駛向AI
    發(fā)表于 04-13 19:51

    Banana Pi 發(fā)布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 計(jì)算與嵌入式開發(fā)

    和 Renesas直致力于推動(dòng)開源生態(tài)的發(fā)展,并積極合作打造高效、開放的計(jì)算平臺(tái)。BPI-AI2N & BPI-AI2N Car
    發(fā)表于 03-19 17:54

    《零基礎(chǔ)開發(fā)AI Agent——手把手教你用扣子做智能

    《零基礎(chǔ)開發(fā)AI Agent——手把手教你用扣子做智能》是本為普通人量身打造AI開發(fā)指南。它不僅深入淺出地講解了Agent的概念和發(fā)展
    發(fā)表于 03-18 12:03

    軟通動(dòng)力昇騰AI一體機(jī)助力中鐵魯班AI升級(jí)

    近期,隨著DeepSeek大模型的推出,人工智能正以前所未有的速度重塑各行業(yè)的發(fā)展格局。緊隨行業(yè)趨勢(shì),中鐵魯班基于軟通動(dòng)力昇騰AI一體機(jī)自主打造魯班平臺(tái)大模型底座-魯小寶,并實(shí)現(xiàn)與DeepSeek大模型全棧應(yīng)用對(duì)接,為各單位招投
    的頭像 發(fā)表于 02-24 18:00 ?1338次閱讀

    智海AI教育一體機(jī):加速人工智能教育普及

    壁仞科技攜手中興通訊、浙江大學(xué)上海高等研究院及驀科技,共同推出了智海AI教育一體機(jī)。這款一體機(jī)產(chǎn)品是壁仞科技針對(duì)行業(yè)特定需求,聯(lián)合多方力量共同打造
    的頭像 發(fā)表于 02-11 11:47 ?1452次閱讀

    NVIDIA技術(shù)助力Pantheon Lab數(shù)字人實(shí)時(shí)交互解決方案

    、NVIDIA Triton,Pantheon Lab 訓(xùn)練速度提高 10 倍、推理延遲降低 50%,以及用戶參與度提升 30%。這些進(jìn)步使對(duì)話式 AI 能夠提供實(shí)時(shí)且真實(shí)的互動(dòng),使 Pantheon
    的頭像 發(fā)表于 01-14 11:19 ?931次閱讀

    NVIDIA推出可分析視頻的AI智能藍(lán)圖

    由 Metropolis 驅(qū)動(dòng)的全新 NVIDIA AI Blueprint 可助力企業(yè)和個(gè)人提高生產(chǎn)力、增強(qiáng)安全性,甚至還能幫助 NVIDIA 首席執(zhí)行官提升快球投球水平。
    的頭像 發(fā)表于 01-09 11:10 ?1343次閱讀

    NVIDIA推出多個(gè)生成式AI模型和藍(lán)圖

    NVIDIA 宣布推出多個(gè)生成式 AI 模型和藍(lán)圖,將 NVIDIA Omniverse 一體化進(jìn)步擴(kuò)展至物理
    的頭像 發(fā)表于 01-08 10:48 ?1038次閱讀

    NVIDIA和GeForce RTX GPU專為AI時(shí)代打造

    NVIDIA 和 GeForce RTX GPU 專為 AI 時(shí)代打造。
    的頭像 發(fā)表于 01-06 10:45 ?1271次閱讀