chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

TensorRT極致推理加速,望塵科技打造新一代實(shí)時(shí)AI體育全場(chǎng)景多維重構(gòu)引擎

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來(lái)源:未知 ? 2022-12-01 22:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

深圳望塵科技公司擁有國(guó)內(nèi)領(lǐng)先的 AI 視覺(jué)算法團(tuán)隊(duì)和實(shí)時(shí)渲染引擎,十年來(lái)一直專(zhuān)注于體育游戲與其相關(guān) AI 視覺(jué)技術(shù)的研發(fā),積累了巨量的球員角色數(shù)據(jù)庫(kù),不僅有所有在國(guó)際足聯(lián)注冊(cè)的 2 萬(wàn)名職業(yè)球員精確到厘米的球員體型、骨長(zhǎng)、BMI、體脂肌肉比等數(shù)據(jù),還有數(shù)千名頂級(jí)球員高精度的 3D 模型,幾乎全球所有主要球場(chǎng)的高精度模型。




基于這些高質(zhì)量結(jié)構(gòu)化的數(shù)據(jù),Arena4D 可將捕捉結(jié)果在實(shí)時(shí)渲染引擎中以接近照片級(jí)真實(shí)的質(zhì)量渲染,用完全自由的鏡頭特效和運(yùn)鏡方式實(shí)現(xiàn)前所未有的震撼體驗(yàn)。


Arena4D 空間追蹤識(shí)別及數(shù)據(jù)處理

面臨算力挑戰(zhàn)


  • 球員和球的運(yùn)動(dòng)速度快,姿態(tài)變化大,且衣服外貌相似性較大,難以使用行業(yè)通用的 MOT 算法進(jìn)行高質(zhì)量的追蹤和姿態(tài)識(shí)別。

  • 即使是 4k 圖像,球員和球在圖像中太小,追蹤困難。

  • 多臺(tái)高清攝像頭每幀圖像需上傳到顯卡進(jìn)行實(shí)時(shí)轉(zhuǎn)碼、降噪等前處理工作,數(shù)據(jù)吞吐量較大。

  • 基于神經(jīng)網(wǎng)絡(luò)的計(jì)算流水線(xiàn),需要實(shí)時(shí)進(jìn)行多個(gè)視角、多個(gè)運(yùn)動(dòng)員的追蹤、識(shí)別、姿態(tài)估計(jì)與降噪計(jì)算。

  • 在多個(gè) AI 模型級(jí)聯(lián)計(jì)算流水線(xiàn)中,每個(gè) AI 模型之間的數(shù)據(jù)處理與拷貝占用了大量的時(shí)間。


NVIDIA AI 計(jì)算平臺(tái)為Arena4D

實(shí)現(xiàn)全流程GPU加速提供算力支持


基于以上挑戰(zhàn),望塵科技選擇了采用 NVIDIA AI 計(jì)算平臺(tái)來(lái)提供支持,使用后給研發(fā)和項(xiàng)目落地帶來(lái)了巨大的支持和提升。


1、基于 GalaSports 體育游戲渲染生成巨量的合成數(shù)據(jù),在 NVIDIA 數(shù)據(jù)中心 GPU 上進(jìn)行加速訓(xùn)練。首先在有 GT 的合成數(shù)據(jù)上訓(xùn)練基礎(chǔ)網(wǎng)絡(luò),然后再在手工標(biāo)注的真實(shí)數(shù)據(jù)上進(jìn)行 finetune。


2、Arena4D 采用了 NVIDIA TensorRT 推理加速引擎,TensorRT 首先對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行量化處理,然后再優(yōu)化、合并算子,最后經(jīng)過(guò) Batch 化,推理處理速度較原來(lái)提升了 4-12 倍,能高效地處理多路攝像頭 4k 高清數(shù)據(jù),實(shí)時(shí)提取球員的 3D Pose 和外貌特征并進(jìn)行匹配計(jì)算。


3、將原有基于 CPU 運(yùn)行的數(shù)據(jù)拷貝,圖像格式轉(zhuǎn)換,圖像 crop/resize 等耗時(shí)較多的操作流水線(xiàn),利用 CUDA 進(jìn)行實(shí)現(xiàn),完全切換到 GPU 處理,比起 CPU 實(shí)現(xiàn)的方案,加速 50~100 倍。


4、針對(duì)體育場(chǎng)景中運(yùn)動(dòng)員速度快、運(yùn)動(dòng)幅度大、圖像中尺寸小的特點(diǎn),改進(jìn)了網(wǎng)絡(luò)結(jié)構(gòu)和算子,使其適合體育場(chǎng)這種稀疏變化,追蹤角色小的場(chǎng)景;提升了 MOT 算法,通過(guò)多個(gè)視圖的 fusion 網(wǎng)絡(luò)對(duì) 2D 追蹤結(jié)果進(jìn)行 finetune,實(shí)現(xiàn)多視圖在 3D 空間的追蹤。


圖1:整體流程

圖片來(lái)源及所屬:Galasports 望塵科技


5、針對(duì)神經(jīng)網(wǎng)絡(luò)流水線(xiàn)的計(jì)算延遲問(wèn)題,首先根據(jù)體育比賽的使用場(chǎng)景與相機(jī)視角對(duì)模型結(jié)構(gòu)進(jìn)行了優(yōu)化,根據(jù)不同體育類(lèi)型的相機(jī)機(jī)位和球場(chǎng)尺度,設(shè)計(jì)了專(zhuān)門(mén)針對(duì)特定比賽的識(shí)別網(wǎng)絡(luò),大大降低了網(wǎng)絡(luò)的復(fù)雜度;基于連續(xù)幀的姿態(tài)計(jì)算骨長(zhǎng)度和 BMI 等球員特征,在數(shù)據(jù)庫(kù)中進(jìn)行匹配提升識(shí)別準(zhǔn)確率;針對(duì)多相機(jī)從內(nèi)存到顯存大量數(shù)據(jù)拷貝 IObound 問(wèn)題,使用 CUDA 多流技術(shù)實(shí)現(xiàn)了內(nèi)存拷貝與數(shù)據(jù)處理并行化,降低了 overhead,4 路4k 相機(jī)數(shù)據(jù)的拷貝與轉(zhuǎn)碼從 50ms 減少到 30ms;然后使用量化工具對(duì)網(wǎng)絡(luò)進(jìn)行 fp16/int8(QAT) 量化加速,最后使用 NVIDIA TensorRT 針對(duì) NVIDIA 數(shù)據(jù)中心 GPU 編譯,在 NVIDIA 數(shù)據(jù)中心 GPU 上能達(dá)到最優(yōu)性能的模型。


圖2:計(jì)算延遲解決思路

圖片來(lái)源及所屬:Galasports 望塵科技


6、整個(gè)流水線(xiàn)經(jīng)過(guò) TensorRT 編譯運(yùn)行在 NVIDIA 數(shù)據(jù)中心 GPU 上,每路視頻信號(hào)由一張 GPU 進(jìn)行實(shí)時(shí)計(jì)算,最后在 CPU 中對(duì)多路計(jì)算結(jié)果降噪融合。最終,以足球場(chǎng)場(chǎng)景為例,追蹤目標(biāo)為 1 個(gè)足球 + 22 名球員 + 3 名教練的位置與骨骼,在一張 NVIDIA 數(shù)據(jù)中心 GPU 設(shè)備上我們實(shí)現(xiàn)了平均 50ms/幀的速度,在二張 NVIDIA 數(shù)據(jù)中心 GPU 設(shè)備上能達(dá)到平均 30ms/幀的速度,整個(gè)流水線(xiàn)比原型提升了 18 倍。


使用了 NVIDIA TensorRT 推理加速引擎NVIDIA 數(shù)據(jù)中心計(jì)算卡,Arena4D 整個(gè)流水線(xiàn)可實(shí)時(shí)運(yùn)行,進(jìn)一步提升了用戶(hù)使用體驗(yàn),為擴(kuò)展 AI 體育方向的其他業(yè)務(wù)、甚至是 XR 場(chǎng)景的加入打下了良好的基礎(chǔ)。


NVIDIA 助力望塵科技

打造新一代實(shí)時(shí) AI 體育全場(chǎng)景多維重構(gòu)引擎


Arena4D 通過(guò) NVIDIA TensorRT 等技術(shù),實(shí)現(xiàn)了多視圖在 3D 空間的追蹤、提升了識(shí)別骨長(zhǎng)度和 BMI 等球員特征的準(zhǔn)確率、完成了內(nèi)存拷貝與數(shù)據(jù)處理的并行化、改進(jìn)了網(wǎng)絡(luò)結(jié)構(gòu)和算子使其適合體育場(chǎng)的稀疏變化,最終實(shí)現(xiàn)全流程 GPU 加速,速度提升超過(guò) 50~100 倍。


AI 體育行業(yè)是最受關(guān)注的人工智能應(yīng)用領(lǐng)域之一,傳統(tǒng)的體育企業(yè)也開(kāi)始擁抱科技,紛紛引入人工智能產(chǎn)業(yè)。一個(gè)集技術(shù)、人才與場(chǎng)景優(yōu)勢(shì)的科技企業(yè)必須與一個(gè)優(yōu)秀的合作伙伴一起積極開(kāi)拓和長(zhǎng)期發(fā)展。NVIDIA 提供的 GPU 解決方案,解決了深度學(xué)習(xí)機(jī)器學(xué)習(xí)的技術(shù)難題,使得望塵科技在 AI 體育領(lǐng)域能夠持續(xù)不斷地創(chuàng)新產(chǎn)品,拓寬 AI 應(yīng)用場(chǎng)景,為觀眾和球迷提供新時(shí)代的數(shù)字化全新觀賽體驗(yàn)。


NVIDIA 初創(chuàng)加速計(jì)劃


望塵科技是 NVIDIA 初創(chuàng)加速計(jì)劃 (NVIDIA Inception) 會(huì)員企業(yè)。NVIDIA 初創(chuàng)加速計(jì)劃為免費(fèi)會(huì)員制、旨在培養(yǎng)顛覆行業(yè)格局的優(yōu)秀創(chuàng)業(yè)公司。該計(jì)劃聯(lián)合國(guó)內(nèi)外知名的風(fēng)投機(jī)構(gòu),創(chuàng)業(yè)孵化器,創(chuàng)業(yè)加速器,行業(yè)合作伙伴以及科技創(chuàng)業(yè)媒體等,打造創(chuàng)業(yè)加速生態(tài)系統(tǒng)。能夠提供產(chǎn)品折扣,技術(shù)支持,市場(chǎng)宣傳,融資對(duì)接,業(yè)務(wù)推薦等一系列服務(wù),加速創(chuàng)業(yè)公司的發(fā)展。


想獲得 NVIDIA 初創(chuàng)加速生態(tài)助力?掃描下方二維碼,僅需一分鐘填寫(xiě)意向申請(qǐng)表單,獲得快速聯(lián)系。



原文標(biāo)題:TensorRT極致推理加速,望塵科技打造新一代實(shí)時(shí)AI體育全場(chǎng)景多維重構(gòu)引擎

文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3953

    瀏覽量

    93820

原文標(biāo)題:TensorRT極致推理加速,望塵科技打造新一代實(shí)時(shí)AI體育全場(chǎng)景多維重構(gòu)引擎

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    信而泰×DeepSeek:AI推理引擎驅(qū)動(dòng)網(wǎng)絡(luò)智能診斷邁向 “自愈”時(shí)代

    模態(tài)的技術(shù)特性,DeepSeek正加速推動(dòng)AI在金融、政務(wù)、科研及網(wǎng)絡(luò)智能化等關(guān)鍵領(lǐng)域的深度應(yīng)用。 信而泰:AI推理引擎賦能網(wǎng)絡(luò)智能診斷新范
    發(fā)表于 07-16 15:29

    如何在魔搭社區(qū)使用TensorRT-LLM加速優(yōu)化Qwen3系列模型推理部署

    TensorRT-LLM 作為 NVIDIA 專(zhuān)為 LLM 推理部署加速優(yōu)化的開(kāi)源庫(kù),可幫助開(kāi)發(fā)者快速利用最新 LLM 完成應(yīng)用原型驗(yàn)證與產(chǎn)品部署。
    的頭像 發(fā)表于 07-04 14:38 ?679次閱讀

    PTR54L15系列低功耗無(wú)線(xiàn)多協(xié)議模組

    PTR54L15系列多協(xié)議無(wú)線(xiàn)模組,基于Nordic新一代nRF54L15平臺(tái)打造,以超低功耗、高性能和多協(xié)議支持為核心,為智能家居、工業(yè)自動(dòng)化、可穿戴設(shè)備等場(chǎng)景提供了站式解決方案。
    發(fā)表于 06-28 21:23

    廣和通發(fā)布新一代AI語(yǔ)音智能體FiboVista

    近日,2025火山引擎Force原動(dòng)力大會(huì)正式開(kāi)幕。廣和通發(fā)布新一代AI語(yǔ)音智能體FiboVista,并已率先應(yīng)用于車(chē)聯(lián)網(wǎng),成為智能駕駛的“用車(chē)伙伴”和“出行伴侶”。通過(guò)創(chuàng)新AI大模型
    的頭像 發(fā)表于 06-17 09:22 ?567次閱讀

    AI驅(qū)動(dòng)智慧交通:加速應(yīng)用場(chǎng)景落地

    智慧交通與人工智能的深度融合正在催生新一代交通生態(tài)系統(tǒng),這種融合不僅體現(xiàn)在技術(shù)層面的創(chuàng)新突破,更在于重構(gòu)了整個(gè)交通產(chǎn)業(yè)的運(yùn)行邏輯和價(jià)值鏈條。AI技術(shù)作為智慧交通的核心引擎,通過(guò)算法、算
    的頭像 發(fā)表于 06-06 14:12 ?223次閱讀

    高德聯(lián)合極氪推出新一代全域車(chē)道級(jí)導(dǎo)航

    近日,極氪007GT正式上市發(fā)布,并宣布將在業(yè)內(nèi)首搭基于高性能實(shí)時(shí)地圖渲染引擎構(gòu)建的新一代全域車(chē)道級(jí)導(dǎo)航,以全場(chǎng)景全要素3D高階渲染,帶來(lái)3A游戲般的驚艷視覺(jué)體驗(yàn)。
    的頭像 發(fā)表于 04-17 09:49 ?521次閱讀

    谷歌新一代 TPU 芯片 Ironwood:助力大規(guī)模思考與推理AI 模型新引擎?

    電子發(fā)燒友網(wǎng)報(bào)道(文 / 李彎彎)日前,谷歌在 Cloud Next 大會(huì)上,隆重推出了最新一代 TPU AI 加速芯片 ——Ironwood。據(jù)悉,該芯片預(yù)計(jì)于今年晚些時(shí)候面向 Google
    的頭像 發(fā)表于 04-12 00:57 ?2451次閱讀

    RAKsmart服務(wù)器如何重塑AI高并發(fā)算力格局

    AI大模型參數(shù)量突破萬(wàn)億級(jí)、實(shí)時(shí)推理需求激增的當(dāng)下,傳統(tǒng)服務(wù)器架構(gòu)的并發(fā)處理能力已逼近物理極限。RAKsmart通過(guò)“硬件重構(gòu)+軟件定義”的雙引擎
    的頭像 發(fā)表于 04-03 10:37 ?323次閱讀

    Banana Pi 發(fā)布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 計(jì)算與嵌入式開(kāi)發(fā)

    低功耗特性。搭載 Renesas 獨(dú)有的 DRP-AI 加速器,支持 15 Sparse TOPS的 AI 計(jì)算能力,使其在計(jì)算機(jī)視覺(jué)、邊緣 AI 及智能制造等
    發(fā)表于 03-19 17:54

    易控智駕推出新一代全場(chǎng)景智能巡檢產(chǎn)品“礦巡2.0”

    近日,在無(wú)人駕駛礦用車(chē)規(guī)模化應(yīng)用成果發(fā)布會(huì)上,易控智駕正式發(fā)布新一代全場(chǎng)景智能巡檢產(chǎn)品——“礦巡2.0”,助力礦山實(shí)現(xiàn)環(huán)境信息采集、安全隱患排查、設(shè)備狀態(tài)監(jiān)測(cè)等功能的自動(dòng)化,大幅提升巡檢效率和安全性。
    的頭像 發(fā)表于 03-13 11:24 ?563次閱讀

    中興通訊全場(chǎng)景AI終端亮相MWC 2025

    近日,中興通訊以“AI for All”為主題,攜全隊(duì)列多形態(tài)AI終端亮相MWC25巴塞羅那,展現(xiàn)AI驅(qū)動(dòng)的全場(chǎng)景智慧生態(tài)。眾多創(chuàng)新終端全球首發(fā),包括紅魔首款4K裸眼3D游戲本、第二
    的頭像 發(fā)表于 03-05 16:38 ?613次閱讀

    FPGA+AI王炸組合如何重塑未來(lái)世界:看看DeepSeek東方神秘力量如何預(yù)測(cè)......

    。? AI加速器的開(kāi)發(fā):FPGA被廣泛用于開(kāi)發(fā)專(zhuān)為AI算法優(yōu)化的加速器,例如深度學(xué)習(xí)推理加速器。
    發(fā)表于 03-03 11:21

    NVIDIA助力麗蟾科技打造AI訓(xùn)練與推理加速解決方案

    麗蟾科技通過(guò) Leaper 資源管理平臺(tái)集成 NVIDIA AI Enterprise,為企業(yè)和科研機(jī)構(gòu)提供了套高效、靈活的 AI 訓(xùn)練與推理加速
    的頭像 發(fā)表于 10-27 10:03 ?833次閱讀
    NVIDIA助力麗蟾科技<b class='flag-5'>打造</b><b class='flag-5'>AI</b>訓(xùn)練與<b class='flag-5'>推理</b><b class='flag-5'>加速</b>解決方案

    李開(kāi)復(fù):中國(guó)擅長(zhǎng)打造經(jīng)濟(jì)實(shí)惠的AI推理引擎

    10月22日上午,零一萬(wàn)物公司的創(chuàng)始人兼首席執(zhí)行官李開(kāi)復(fù)在與外媒的交流中透露,其公司旗下的Yi-Lightning(閃電模型)在推理成本上已實(shí)現(xiàn)了顯著優(yōu)勢(shì),比OpenAI的GPT-4o模型低了31倍。他強(qiáng)調(diào),中國(guó)擅長(zhǎng)打造經(jīng)濟(jì)實(shí)惠的AI
    的頭像 發(fā)表于 10-22 16:54 ?742次閱讀

    一代高功能新一代AI加速器(DRP-AI3):10x在高級(jí)AI系統(tǒng)高級(jí)AI中更快的嵌入處理

    電子發(fā)燒友網(wǎng)站提供《下一代高功能新一代AI加速器(DRP-AI3):10x在高級(jí)AI系統(tǒng)高級(jí)
    發(fā)表于 08-15 11:06 ?0次下載
    下<b class='flag-5'>一代</b>高功能<b class='flag-5'>新一代</b><b class='flag-5'>AI</b><b class='flag-5'>加速</b>器(DRP-<b class='flag-5'>AI</b>3):10x在高級(jí)<b class='flag-5'>AI</b>系統(tǒng)高級(jí)<b class='flag-5'>AI</b>中更快的嵌入處理