chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

TensorRT極致推理加速,望塵科技打造新一代實(shí)時(shí)AI體育全場(chǎng)景多維重構(gòu)引擎

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:未知 ? 2022-12-01 22:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

深圳望塵科技公司擁有國(guó)內(nèi)領(lǐng)先的 AI 視覺算法團(tuán)隊(duì)和實(shí)時(shí)渲染引擎,十年來一直專注于體育游戲與其相關(guān) AI 視覺技術(shù)的研發(fā),積累了巨量的球員角色數(shù)據(jù)庫(kù),不僅有所有在國(guó)際足聯(lián)注冊(cè)的 2 萬(wàn)名職業(yè)球員精確到厘米的球員體型、骨長(zhǎng)、BMI、體脂肌肉比等數(shù)據(jù),還有數(shù)千名頂級(jí)球員高精度的 3D 模型,幾乎全球所有主要球場(chǎng)的高精度模型。




基于這些高質(zhì)量結(jié)構(gòu)化的數(shù)據(jù),Arena4D 可將捕捉結(jié)果在實(shí)時(shí)渲染引擎中以接近照片級(jí)真實(shí)的質(zhì)量渲染,用完全自由的鏡頭特效和運(yùn)鏡方式實(shí)現(xiàn)前所未有的震撼體驗(yàn)。


Arena4D 空間追蹤識(shí)別及數(shù)據(jù)處理

面臨算力挑戰(zhàn)


  • 球員和球的運(yùn)動(dòng)速度快,姿態(tài)變化大,且衣服外貌相似性較大,難以使用行業(yè)通用的 MOT 算法進(jìn)行高質(zhì)量的追蹤和姿態(tài)識(shí)別。

  • 即使是 4k 圖像,球員和球在圖像中太小,追蹤困難。

  • 多臺(tái)高清攝像頭每幀圖像需上傳到顯卡進(jìn)行實(shí)時(shí)轉(zhuǎn)碼、降噪等前處理工作,數(shù)據(jù)吞吐量較大。

  • 基于神經(jīng)網(wǎng)絡(luò)的計(jì)算流水線,需要實(shí)時(shí)進(jìn)行多個(gè)視角、多個(gè)運(yùn)動(dòng)員的追蹤、識(shí)別、姿態(tài)估計(jì)與降噪計(jì)算。

  • 在多個(gè) AI 模型級(jí)聯(lián)計(jì)算流水線中,每個(gè) AI 模型之間的數(shù)據(jù)處理與拷貝占用了大量的時(shí)間。


NVIDIA AI 計(jì)算平臺(tái)為Arena4D

實(shí)現(xiàn)全流程GPU加速提供算力支持


基于以上挑戰(zhàn),望塵科技選擇了采用 NVIDIA AI 計(jì)算平臺(tái)來提供支持,使用后給研發(fā)和項(xiàng)目落地帶來了巨大的支持和提升。


1、基于 GalaSports 體育游戲渲染生成巨量的合成數(shù)據(jù),在 NVIDIA 數(shù)據(jù)中心 GPU 上進(jìn)行加速訓(xùn)練。首先在有 GT 的合成數(shù)據(jù)上訓(xùn)練基礎(chǔ)網(wǎng)絡(luò),然后再在手工標(biāo)注的真實(shí)數(shù)據(jù)上進(jìn)行 finetune。


2、Arena4D 采用了 NVIDIA TensorRT 推理加速引擎,TensorRT 首先對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行量化處理,然后再優(yōu)化、合并算子,最后經(jīng)過 Batch 化,推理處理速度較原來提升了 4-12 倍,能高效地處理多路攝像頭 4k 高清數(shù)據(jù),實(shí)時(shí)提取球員的 3D Pose 和外貌特征并進(jìn)行匹配計(jì)算。


3、將原有基于 CPU 運(yùn)行的數(shù)據(jù)拷貝,圖像格式轉(zhuǎn)換,圖像 crop/resize 等耗時(shí)較多的操作流水線,利用 CUDA 進(jìn)行實(shí)現(xiàn),完全切換到 GPU 處理,比起 CPU 實(shí)現(xiàn)的方案,加速 50~100 倍。


4、針對(duì)體育場(chǎng)景中運(yùn)動(dòng)員速度快、運(yùn)動(dòng)幅度大、圖像中尺寸小的特點(diǎn),改進(jìn)了網(wǎng)絡(luò)結(jié)構(gòu)和算子,使其適合體育場(chǎng)這種稀疏變化,追蹤角色小的場(chǎng)景;提升了 MOT 算法,通過多個(gè)視圖的 fusion 網(wǎng)絡(luò)對(duì) 2D 追蹤結(jié)果進(jìn)行 finetune,實(shí)現(xiàn)多視圖在 3D 空間的追蹤。


圖1:整體流程

圖片來源及所屬:Galasports 望塵科技


5、針對(duì)神經(jīng)網(wǎng)絡(luò)流水線的計(jì)算延遲問題,首先根據(jù)體育比賽的使用場(chǎng)景與相機(jī)視角對(duì)模型結(jié)構(gòu)進(jìn)行了優(yōu)化,根據(jù)不同體育類型的相機(jī)機(jī)位和球場(chǎng)尺度,設(shè)計(jì)了專門針對(duì)特定比賽的識(shí)別網(wǎng)絡(luò),大大降低了網(wǎng)絡(luò)的復(fù)雜度;基于連續(xù)幀的姿態(tài)計(jì)算骨長(zhǎng)度和 BMI 等球員特征,在數(shù)據(jù)庫(kù)中進(jìn)行匹配提升識(shí)別準(zhǔn)確率;針對(duì)多相機(jī)從內(nèi)存到顯存大量數(shù)據(jù)拷貝 IObound 問題,使用 CUDA 多流技術(shù)實(shí)現(xiàn)了內(nèi)存拷貝與數(shù)據(jù)處理并行化,降低了 overhead,4 路4k 相機(jī)數(shù)據(jù)的拷貝與轉(zhuǎn)碼從 50ms 減少到 30ms;然后使用量化工具對(duì)網(wǎng)絡(luò)進(jìn)行 fp16/int8(QAT) 量化加速,最后使用 NVIDIA TensorRT 針對(duì) NVIDIA 數(shù)據(jù)中心 GPU 編譯,在 NVIDIA 數(shù)據(jù)中心 GPU 上能達(dá)到最優(yōu)性能的模型。


圖2:計(jì)算延遲解決思路

圖片來源及所屬:Galasports 望塵科技


6、整個(gè)流水線經(jīng)過 TensorRT 編譯運(yùn)行在 NVIDIA 數(shù)據(jù)中心 GPU 上,每路視頻信號(hào)由一張 GPU 進(jìn)行實(shí)時(shí)計(jì)算,最后在 CPU 中對(duì)多路計(jì)算結(jié)果降噪融合。最終,以足球場(chǎng)場(chǎng)景為例,追蹤目標(biāo)為 1 個(gè)足球 + 22 名球員 + 3 名教練的位置與骨骼,在一張 NVIDIA 數(shù)據(jù)中心 GPU 設(shè)備上我們實(shí)現(xiàn)了平均 50ms/幀的速度,在二張 NVIDIA 數(shù)據(jù)中心 GPU 設(shè)備上能達(dá)到平均 30ms/幀的速度,整個(gè)流水線比原型提升了 18 倍。


使用了 NVIDIA TensorRT 推理加速引擎NVIDIA 數(shù)據(jù)中心計(jì)算卡,Arena4D 整個(gè)流水線可實(shí)時(shí)運(yùn)行,進(jìn)一步提升了用戶使用體驗(yàn),為擴(kuò)展 AI 體育方向的其他業(yè)務(wù)、甚至是 XR 場(chǎng)景的加入打下了良好的基礎(chǔ)。


NVIDIA 助力望塵科技

打造新一代實(shí)時(shí) AI 體育全場(chǎng)景多維重構(gòu)引擎


Arena4D 通過 NVIDIA TensorRT 等技術(shù),實(shí)現(xiàn)了多視圖在 3D 空間的追蹤、提升了識(shí)別骨長(zhǎng)度和 BMI 等球員特征的準(zhǔn)確率、完成了內(nèi)存拷貝與數(shù)據(jù)處理的并行化、改進(jìn)了網(wǎng)絡(luò)結(jié)構(gòu)和算子使其適合體育場(chǎng)的稀疏變化,最終實(shí)現(xiàn)全流程 GPU 加速,速度提升超過 50~100 倍。


AI 體育行業(yè)是最受關(guān)注的人工智能應(yīng)用領(lǐng)域之一,傳統(tǒng)的體育企業(yè)也開始擁抱科技,紛紛引入人工智能產(chǎn)業(yè)。一個(gè)集技術(shù)、人才與場(chǎng)景優(yōu)勢(shì)的科技企業(yè)必須與一個(gè)優(yōu)秀的合作伙伴一起積極開拓和長(zhǎng)期發(fā)展。NVIDIA 提供的 GPU 解決方案,解決了深度學(xué)習(xí)機(jī)器學(xué)習(xí)的技術(shù)難題,使得望塵科技在 AI 體育領(lǐng)域能夠持續(xù)不斷地創(chuàng)新產(chǎn)品,拓寬 AI 應(yīng)用場(chǎng)景,為觀眾和球迷提供新時(shí)代的數(shù)字化全新觀賽體驗(yàn)。


NVIDIA 初創(chuàng)加速計(jì)劃


望塵科技是 NVIDIA 初創(chuàng)加速計(jì)劃 (NVIDIA Inception) 會(huì)員企業(yè)。NVIDIA 初創(chuàng)加速計(jì)劃為免費(fèi)會(huì)員制、旨在培養(yǎng)顛覆行業(yè)格局的優(yōu)秀創(chuàng)業(yè)公司。該計(jì)劃聯(lián)合國(guó)內(nèi)外知名的風(fēng)投機(jī)構(gòu),創(chuàng)業(yè)孵化器,創(chuàng)業(yè)加速器,行業(yè)合作伙伴以及科技創(chuàng)業(yè)媒體等,打造創(chuàng)業(yè)加速生態(tài)系統(tǒng)。能夠提供產(chǎn)品折扣,技術(shù)支持,市場(chǎng)宣傳,融資對(duì)接,業(yè)務(wù)推薦等一系列服務(wù),加速創(chuàng)業(yè)公司的發(fā)展。


想獲得 NVIDIA 初創(chuàng)加速生態(tài)助力?掃描下方二維碼,僅需一分鐘填寫意向申請(qǐng)表單,獲得快速聯(lián)系。



原文標(biāo)題:TensorRT極致推理加速,望塵科技打造新一代實(shí)時(shí)AI體育全場(chǎng)景多維重構(gòu)引擎

文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4091

    瀏覽量

    99241

原文標(biāo)題:TensorRT極致推理加速,望塵科技打造新一代實(shí)時(shí)AI體育全場(chǎng)景多維重構(gòu)引擎

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    使用NORDIC AI的好處

    原始傳感器數(shù)據(jù),可顯著降低功耗、延長(zhǎng)電池壽命。[Edge AI 概述; Nordic Edge AI 技術(shù)頁(yè)] 降低云依賴與時(shí)延 直接在設(shè)備上做推理,很多決策可以“本地實(shí)時(shí)”完成,
    發(fā)表于 01-31 23:16

    曦望發(fā)布新一代推理GPU芯片,單位Token推理成本降低90%

    已突破萬(wàn)片。 ? 啟望S3是專為大模型推理打造的定制化GPGPU芯片。在典型推理場(chǎng)景下,它的整體性價(jià)比較上一代提升超10倍。在算力與存儲(chǔ)設(shè)計(jì)
    的頭像 發(fā)表于 01-28 17:38 ?9069次閱讀

    云巨頭算力戰(zhàn)升級(jí)!微軟新一代3nm AI推理芯片性能提升30%,落地?cái)?shù)據(jù)中心

    據(jù)外媒報(bào)道,微軟發(fā)布新一代人工智能芯片Maia 200,這款芯片有望成為英偉達(dá)旗艦處理器以及云服務(wù)競(jìng)爭(zhēng)對(duì)手亞馬遜、谷歌同類產(chǎn)品的替代選擇。微軟稱,這款芯片是為 AI 推理規(guī)?;渴?b class='flag-5'>打造
    的頭像 發(fā)表于 01-27 12:29 ?8005次閱讀
    云巨頭算力戰(zhàn)升級(jí)!微軟<b class='flag-5'>新一代</b>3nm <b class='flag-5'>AI</b><b class='flag-5'>推理</b>芯片性能提升30%,落地?cái)?shù)據(jù)中心

    算力密度翻倍!江原D20加速卡發(fā)布,卡雙芯重構(gòu)AI推理標(biāo)桿

    的關(guān)鍵技術(shù)瓶頸。 ? 在此背景下,江原科技推出采用自研AI芯片的AI加速卡江原D10,并在今年5月實(shí)現(xiàn)量產(chǎn)交付。在大算力AI芯片全流程國(guó)產(chǎn)化產(chǎn)業(yè)鏈實(shí)現(xiàn)首次突破后,11月11日,江原科技
    的頭像 發(fā)表于 11-14 08:21 ?1w次閱讀
    算力密度翻倍!江原D20<b class='flag-5'>加速</b>卡發(fā)布,<b class='flag-5'>一</b>卡雙芯<b class='flag-5'>重構(gòu)</b><b class='flag-5'>AI</b><b class='flag-5'>推理</b>標(biāo)桿

    NVIDIA TensorRT LLM 1.0推理框架正式上線

    TensorRT LLM 作為 NVIDIA 為大規(guī)模 LLM 推理打造推理框架,核心目標(biāo)是突破 NVIDIA 平臺(tái)上的推理性能瓶頸。為實(shí)
    的頭像 發(fā)表于 10-21 11:04 ?1198次閱讀

    【內(nèi)測(cè)活動(dòng)同步開啟】這么小?這么強(qiáng)?新一代大模型MCP開發(fā)板來啦!

    【內(nèi)測(cè)活動(dòng)同步開啟】這么???這么強(qiáng)?新一代大模型MCP開發(fā)板來啦! 聆思全新一代六合芯片「LS26系列」,搭載WIFI / BLE & BT / NPU,與「小聆AI」強(qiáng)強(qiáng)
    發(fā)表于 09-25 11:47

    積算科技上線赤兔推理引擎服務(wù),創(chuàng)新解鎖FP8大模型算力

    的模型輕量化部署方案。用戶通過遠(yuǎn)程算力平臺(tái)預(yù)置的模型鏡像與AI工具,僅需50%的GPU算力即可解鎖大模型推理、企業(yè)知識(shí)庫(kù)搭建、智能體開發(fā),加速大模型在智能問答、報(bào)告生成、客服助手、智能體等典型行業(yè)
    的頭像 發(fā)表于 07-30 21:44 ?931次閱讀

    信而泰×DeepSeek:AI推理引擎驅(qū)動(dòng)網(wǎng)絡(luò)智能診斷邁向 “自愈”時(shí)代

    模態(tài)的技術(shù)特性,DeepSeek正加速推動(dòng)AI在金融、政務(wù)、科研及網(wǎng)絡(luò)智能化等關(guān)鍵領(lǐng)域的深度應(yīng)用。 信而泰:AI推理引擎賦能網(wǎng)絡(luò)智能診斷新范
    發(fā)表于 07-16 15:29

    如何在魔搭社區(qū)使用TensorRT-LLM加速優(yōu)化Qwen3系列模型推理部署

    TensorRT-LLM 作為 NVIDIA 專為 LLM 推理部署加速優(yōu)化的開源庫(kù),可幫助開發(fā)者快速利用最新 LLM 完成應(yīng)用原型驗(yàn)證與產(chǎn)品部署。
    的頭像 發(fā)表于 07-04 14:38 ?2206次閱讀

    PTR54L15系列低功耗無(wú)線多協(xié)議模組

    PTR54L15系列多協(xié)議無(wú)線模組,基于Nordic新一代nRF54L15平臺(tái)打造,以超低功耗、高性能和多協(xié)議支持為核心,為智能家居、工業(yè)自動(dòng)化、可穿戴設(shè)備等場(chǎng)景提供了站式解決方案。
    發(fā)表于 06-28 21:23

    廣和通發(fā)布新一代AI語(yǔ)音智能體FiboVista

    近日,2025火山引擎Force原動(dòng)力大會(huì)正式開幕。廣和通發(fā)布新一代AI語(yǔ)音智能體FiboVista,并已率先應(yīng)用于車聯(lián)網(wǎng),成為智能駕駛的“用車伙伴”和“出行伴侶”。通過創(chuàng)新AI大模型
    的頭像 發(fā)表于 06-17 09:22 ?1275次閱讀

    高德聯(lián)合極氪推出新一代全域車道級(jí)導(dǎo)航

    近日,極氪007GT正式上市發(fā)布,并宣布將在業(yè)內(nèi)首搭基于高性能實(shí)時(shí)地圖渲染引擎構(gòu)建的新一代全域車道級(jí)導(dǎo)航,以全場(chǎng)景全要素3D高階渲染,帶來3A游戲般的驚艷視覺體驗(yàn)。
    的頭像 發(fā)表于 04-17 09:49 ?1107次閱讀

    谷歌新一代 TPU 芯片 Ironwood:助力大規(guī)模思考與推理AI 模型新引擎?

    電子發(fā)燒友網(wǎng)報(bào)道(文 / 李彎彎)日前,谷歌在 Cloud Next 大會(huì)上,隆重推出了最新一代 TPU AI 加速芯片 ——Ironwood。據(jù)悉,該芯片預(yù)計(jì)于今年晚些時(shí)候面向 Google
    的頭像 發(fā)表于 04-12 00:57 ?3757次閱讀

    RAKsmart服務(wù)器如何重塑AI高并發(fā)算力格局

    AI大模型參數(shù)量突破萬(wàn)億級(jí)、實(shí)時(shí)推理需求激增的當(dāng)下,傳統(tǒng)服務(wù)器架構(gòu)的并發(fā)處理能力已逼近物理極限。RAKsmart通過“硬件重構(gòu)+軟件定義”的雙引擎
    的頭像 發(fā)表于 04-03 10:37 ?921次閱讀

    易控智駕推出新一代全場(chǎng)景智能巡檢產(chǎn)品“礦巡2.0”

    近日,在無(wú)人駕駛礦用車規(guī)?;瘧?yīng)用成果發(fā)布會(huì)上,易控智駕正式發(fā)布新一代全場(chǎng)景智能巡檢產(chǎn)品——“礦巡2.0”,助力礦山實(shí)現(xiàn)環(huán)境信息采集、安全隱患排查、設(shè)備狀態(tài)監(jiān)測(cè)等功能的自動(dòng)化,大幅提升巡檢效率和安全性。
    的頭像 發(fā)表于 03-13 11:24 ?1050次閱讀