chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA SDK 3.0新硬件功能介紹

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-04-20 16:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NVIDIA 圖靈架構(gòu)引入了一種新的硬件功能,用于以非常高的性能計(jì)算一對(duì)圖像之間的光流。 NVIDIA 光流 SDK 公開了使用這種光流硬件(也稱為 NVOFA )加速應(yīng)用程序的 API 。我們很高興地宣布光流 SDK 3.0 的可用性具有以下新功能:

DirectX 12 光流 API

通過單個(gè) API 的前后向光流

全球流動(dòng)矢量

DirectX 12 光流 API

DirectX 12 是一個(gè)來自 Microsoft 的低級(jí)編程 API ,與它的前身 DirectX 11 相比,它減少了驅(qū)動(dòng)程序開銷。 DirectX 12 為開發(fā)人員提供了更大的靈活性和細(xì)粒度的控制。開發(fā)人員現(xiàn)在可以利用 DirectX 12 中的低級(jí)編程 API 并優(yōu)化其應(yīng)用程序,以提供比早期 DirectX 版本更好的性能—同時(shí),客戶端應(yīng)用程序本身必須負(fù)責(zé)資源管理、同步, DirectX 12 在游戲和其他圖形應(yīng)用程序中迅速發(fā)展。

光流 SDK 3.0 支持 DirectX 12 應(yīng)用程序使用 NVIDIA 光流引擎。計(jì)算出的光流可用于提高游戲和視頻中的幀速率,以獲得更平滑的體驗(yàn)或用于目標(biāo)跟蹤。為了提高幀速率, F rame R ate U p C onversion ( FRUC )技術(shù)通過在原始幀之間插入插值幀來使用。插值算法使用幀對(duì)之間的流來生成中間幀。

光流硬件的所有代支持 DirectX 12 光流接口。光流 SDK 包包含頭( S )、演示使用的示例應(yīng)用程序、可根據(jù)需要重新使用或修改的 C ++包裝類和文檔。用于訪問光流硬件的所有其他組件都包含在 NVIDIA 顯示驅(qū)動(dòng)程序中。 Windows 20H1 或更高版本的操作系統(tǒng)支持 DirectX 12 光流 API 。

除了顯式同步之外, directx12 光流 API 的設(shè)計(jì)與 SDK 中已有的其他接口( CUDA 和 DirectX 11 )非常接近, DirectX 12 光流 API 由初始化、流量估計(jì)和銷毀三個(gè)核心功能組成。

ypedef NV_OF_STATUS(NVOFAPI* PFNNVOFINIT) (NvOFHandle hOf, const NV_OF_INIT_PARAMS* initParams);

typedef NV_OF_STATUS(NVOFAPI* PFNNVOFEXECUTED3D12) (NvOFHandle hOf, const NV_OF_EXECUTE_INPUT_PARAMS_D3D12* executeInParams, NV_OF_EXECUTE_OUTPUT_PARAMS_D3D12* executeOutParams);

typedef NV_OF_STATUS(NVOFAPI* PFNNVOFDESTROY) (NvOFHandle hOf);

初始化和銷毀 API 在所有接口上都是相同的,但在 DirectX 12 和其他接口(即 DirectX 11 和 CUDA )之間執(zhí)行 API 是不同的。盡管在 DirectX 12 中傳遞給 executeapi 的大多數(shù)參數(shù)與其他兩個(gè)接口中的參數(shù)相同,但在功能上還是存在一些差異。 DirectX 11 和 CUDA 接口中的同步由操作系統(tǒng)運(yùn)行時(shí)和驅(qū)動(dòng)程序自動(dòng)處理。但是,在 DirectX 12 中,需要有關(guān)圍欄和圍欄值的附加信息作為執(zhí)行 API 的輸入?yún)?shù)。這些圍欄對(duì)象將用于同步 CPU ? GPU 和 GPU ? GPU 操作。有關(guān)詳細(xì)信息,請(qǐng)參閱光流 SDK 附帶的編程指南。

DirectX 12 中的緩沖區(qū)管理 API 接口也需要 fence 對(duì)象來進(jìn)行同步。

所有接口的光流輸出質(zhì)量相同。與其他兩個(gè)接口相比, DirectX 12 的性能應(yīng)該非常接近。

正反向光流

沒有一種光流算法能給出 100% 的準(zhǔn)確流量。在閉塞區(qū)域,流動(dòng)通常是扭曲的。有時(shí), NVOA 提供的成本也可能不代表流動(dòng)的真實(shí)可信度。通常采用的一個(gè)簡(jiǎn)單檢查是比較向前和向后流動(dòng)。如果正向流和反向流之間的歐氏距離超過閾值,則該流可以標(biāo)記為無效。

為了估計(jì)兩個(gè)方向上的流,客戶機(jī)必須調(diào)用 Execute API 兩次:一次調(diào)用輸入和引用圖像,第二次調(diào)用在反轉(zhuǎn)輸入和引用圖像之后。像這樣兩次調(diào)用 Optical Flow Execute API 可能會(huì)由于上下文切換、線程切換等開銷而導(dǎo)致性能不佳。 Optical Flow sdk3 。 0 公開了一個(gè)新的 API ,以便在單個(gè) Execute 調(diào)用中生成雙向流??梢酝ㄟ^在初始化中設(shè)置 NV_OF_INIT_PARAMS::predDirection to NV_OF_PRED_DIRECTION_BOTH 并在 NV_OF_EXECUTE_OUTPUT_PARAMS/NV_OF_EXECUTE_OUTPUT_PARAMS_D3D12::bwdOutputBuffer, NV_OF_EXECUTE_OUTPUT_PARAMS/NV_OF_EXECUTE_OUTPUT_PARAMS_D3D12::bwdOutputCostBuffer 。 中提供接收反向流和/或開銷所需的緩沖區(qū)來啟用此功能

一旦在兩個(gè)方向上生成流,客戶端應(yīng)用程序就可以比較兩個(gè)方向的流向量,根據(jù)適當(dāng)?shù)臉?biāo)準(zhǔn)(例如,向前和向后流向量之間的歐幾里德距離)丟棄不準(zhǔn)確的流向量,并使用孔填充算法來填充這些丟棄的流向量。

注意,由于一些優(yōu)化, FB 流的輸出質(zhì)量可能不同于單向流。

演示 FB flow API 編程和一致性檢查的示例代碼:

// Initialization of API
NV_OF_INIT_PARAMS initParams = { 0 };
...
initParams.predDirection = NV_OF_PRED_DIRECTION_BOTH;
...
NvOFAPI->nvOFInit(hNvOF, &initParams);
// Estimation of forward and backward flow
NV_OF_EXECUTE_INPUT_PARAMS executeInParams = { 0 };
...
NV_OF_EXECUTE_OUTPUT_PARAMS executeOutParams = { 0 };
...
executeOutParams.outputBuffer = forwardFlowBuffer;
executeOutParams.outputCostBuffer = forwardFlowCostBuffer;
executeOutParams.bwdOutputBuffer = backwardFlowBuffer;
executeOutParams.bwdOutputCostBuffer = backwardFlowCostBuffer;

NvOFAPI->nvOFExecute(hNvOF, &executeInparams, &executeOutParams)


// Invalidating flow vectors
for (int y = 0; y < height; y++) {
    for (int x = 0; x < width; x++) {
        // read forward flow vector
        float mvx = GetFlowX(forwardFlowBuffer, x, y);
        float mvy = GetFlowY(forwardFlowBuffer, x, y);

        // derive the corresponding position in the backward flow (assuming 1x1 grid size)
        // and read the backward flow vector
        int x2 = x + mvx;
        int y2 = y + mvy;
        if (x2 < 0 || x2 > width - 1 || y2 < 0 || y2 < height - 1)
        {
            SetFlowInvalid(forwardFlowBuffer, x, y);
            continue;
        }
        float mvx2 = -1 * GetFlowX(backwardFlowBuffer, x2, y2);
        float mvy2 = -1 * GetFlowY(backwardFlowBuffer, x2, y2);

        // mark flow vector as invalid if the distance is greater than a threshold
        if (((mvx - mvx2) * (mvx - mvx2) + (mvy - mvy2) * (mvy - mvy2)) > thresh) {
            SetFlowInvalid(forwardFlowBuffer, x, y);
        }
    }
}

全球流量估算

視頻序列或游戲中的全局流是由攝影機(jī)平移運(yùn)動(dòng)引起的。全局流估計(jì)是一個(gè)重要的工具,廣泛應(yīng)用于圖像分割、視頻拼接或基于運(yùn)動(dòng)的視頻分析應(yīng)用中。

全局流矢量也可以啟發(fā)式地用于計(jì)算背景運(yùn)動(dòng)。一旦估計(jì)出背景運(yùn)動(dòng),它就可以用來填充遮擋區(qū)域中的流矢量,也可以用來處理插值幀中扭曲像素的碰撞。

全局流量是基于發(fā)生頻率和其他一些啟發(fā)式算法,在前向流矢量上計(jì)算的。

為了能夠生成全局流,初始化 API 需要設(shè)置標(biāo)志 初始化參數(shù)的 NV \ u :: enableGlobalFlow ,并在 executeapi 中提供額外的緩沖區(qū) NV _ OF _ EXECUTE _ OUTPUT _ PARAMS / NV _ OF _ EXECUTE _ OUTPUT _ PARAMS _ D3D12 ::全局流緩沖區(qū) 。

關(guān)于作者

Konda Raju 是 NVIDIA 多媒體驅(qū)動(dòng)團(tuán)隊(duì)的高級(jí)系統(tǒng)軟件工程師。他從事 NVIDIA 光流驅(qū)動(dòng)器和應(yīng)用程序編程接口設(shè)計(jì)。此前,他致力于 NVIDIA 視頻驅(qū)動(dòng)程序和固件設(shè)計(jì)。他有技術(shù)碩士學(xué)位。印度理工學(xué)院坎普爾分校信息技術(shù)專業(yè)學(xué)位。

Sampurnananda Mishra 是 NVIDIA 負(fù)責(zé)多媒體驅(qū)動(dòng)程序的高級(jí)經(jīng)理。他研究過 NVIDIA GPU s 上支持的各種多媒體用例。他的興趣包括視頻編碼、計(jì)算機(jī)視覺、視頻安全、深度學(xué)習(xí)和系統(tǒng)軟件。他擁有印度 IIT 坎普爾電子工程碩士學(xué)位,主攻數(shù)字信號(hào)處理。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 接口
    +關(guān)注

    關(guān)注

    33

    文章

    9490

    瀏覽量

    156568
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5565

    瀏覽量

    109370
  • SDK
    SDK
    +關(guān)注

    關(guān)注

    3

    文章

    1098

    瀏覽量

    51476
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    超擎數(shù)智為您深度解析NVIDIA Quantum-X800 InfiniBand平臺(tái)

    NVIDIA
    專精特新
    發(fā)布于 :2026年01月08日 19:47:03

    NVIDIA推出Omniverse DSX Blueprint

    在華盛頓特區(qū) NVIDIA GTC 大會(huì)的主題演講中,NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛介紹NVIDIA Omniverse DSX,這是一個(gè)全面、開放的藍(lán)圖,用于設(shè)計(jì)和運(yùn)營(yíng)吉
    的頭像 發(fā)表于 11-03 15:08 ?748次閱讀

    Nordic無線開發(fā)---nRF Connect SDK 3.0更新版的安裝入門介紹

    2025.10.14更新: 增加了NCS v3.1.0和v3.1.1在中文Windows系統(tǒng)上編碼問題的解決方案 增加了說明,nrfutil sdk-manager以及解決了SDK在Windows
    發(fā)表于 10-29 20:40

    NVIDIA開源Audio2Face模型及SDK

    NVIDIA 現(xiàn)已開源 Audio2Face 模型與 SDK,讓所有游戲和 3D 應(yīng)用開發(fā)者都可以構(gòu)建并部署帶有先進(jìn)動(dòng)畫的高精度角色。NVIDIA 開源 Audio2Face 的訓(xùn)練框架,任何人都可以針對(duì)特定用例對(duì)現(xiàn)有模型進(jìn)行微
    的頭像 發(fā)表于 10-21 11:11 ?718次閱讀
    <b class='flag-5'>NVIDIA</b>開源Audio2Face模型及<b class='flag-5'>SDK</b>

    NVIDIA RAPIDS 25.06版本新增多項(xiàng)功能

    RAPIDS 是一套面向 Python 數(shù)據(jù)科學(xué)的 NVIDIA CUDA-X 庫,最新發(fā)布的 25.06 版本引入了多項(xiàng)亮眼新功能,其中包括 Polars GPU 流執(zhí)行引擎——這是一種面向圖
    的頭像 發(fā)表于 09-09 09:54 ?908次閱讀

    NVIDIA Omniverse Extension開發(fā)秘籍

    NVIDIA Omniverse 是一個(gè)模塊化平臺(tái),使用高級(jí) API 和微服務(wù)來構(gòu)建由 OpenUSD 和 NVIDIA RTX 提供支持的 3D 應(yīng)用。OpenUSD 功能強(qiáng)大的 3D 框架與
    的頭像 發(fā)表于 08-22 15:52 ?3584次閱讀
    <b class='flag-5'>NVIDIA</b> Omniverse Extension開發(fā)秘籍

    nRF Connect SDK Basic

    用戶在使用 nRF connect SDK 的時(shí)候經(jīng)常會(huì)操作的外設(shè)有GPIO,I2C,SPI,UART。我們就以 nRF connect SDK 2.7.0 中的例程代碼
    的頭像 發(fā)表于 08-20 10:41 ?719次閱讀
    nRF Connect <b class='flag-5'>SDK</b> Basic

    Nordic nRF5 SDK和softdevice介紹

    Connect SDK。一般來說,開發(fā)nRF51/52產(chǎn)品推薦使用nRF5 SDK,開發(fā)nRF91/nRF53等新產(chǎn)品推薦使用nRF connect SDK。本文將對(duì)nRF5 SDK
    的頭像 發(fā)表于 08-20 09:54 ?2837次閱讀
    Nordic nRF5 <b class='flag-5'>SDK</b>和softdevice<b class='flag-5'>介紹</b>

    NVIDIA Jetson + Isaac SDK 人形機(jī)器人方案全面解析

    NVIDIA Jetson + Isaac SDK 人形機(jī)器人方案全面解析 一、方案概述 Jetson 硬件平臺(tái) :提供 AI + GPU 運(yùn)算能力,配合多傳感器、視覺、傳動(dòng)控制體系 Isaac
    的頭像 發(fā)表于 07-30 16:12 ?2033次閱讀

    NVIDIA Jetson + Isaac SDK 在人形機(jī)器人領(lǐng)域的方案詳解

    NVIDIA Jetson + Isaac SDK 在人形機(jī)器人領(lǐng)域的 方案詳解 ,涵蓋芯片型號(hào)、軟件平臺(tái)、開發(fā)工具鏈、應(yīng)用場(chǎng)景與典型客戶等。 一、方案概述:Jetson + Isaac SDK
    的頭像 發(fā)表于 07-30 16:05 ?3412次閱讀

    NVIDIA DOCA 3.0版本的亮點(diǎn)解析

    NVIDIA DOCA 框架已發(fā)展成為新一代 AI 基礎(chǔ)設(shè)施的重要組成部分。從初始版本到備受期待的 NVIDIA DOCA 3.0 發(fā)布,每個(gè)版本都擴(kuò)展了 NVIDIA BlueFie
    的頭像 發(fā)表于 07-04 14:27 ?1108次閱讀
    <b class='flag-5'>NVIDIA</b> DOCA <b class='flag-5'>3.0</b>版本的亮點(diǎn)解析

    如何在Ubuntu上安裝NVIDIA顯卡驅(qū)動(dòng)?

    專有顯卡驅(qū)動(dòng)。本文將詳細(xì)介紹在Ubuntu系統(tǒng)上安裝NVIDIA顯卡驅(qū)動(dòng)的多種方法,幫助用戶根據(jù)自身情況選擇最適合的安裝方式。 二,硬件參數(shù) 平臺(tái):PX22_GPU CPU:I7-1165G7
    的頭像 發(fā)表于 05-07 16:05 ?2336次閱讀
    如何在Ubuntu上安裝<b class='flag-5'>NVIDIA</b>顯卡驅(qū)動(dòng)?

    USB 3.0工業(yè)采集卡功能與應(yīng)用詳解

    處理和分析。以下是其關(guān)鍵特點(diǎn)和應(yīng)用場(chǎng)景的詳細(xì)說明:核心功能與特點(diǎn)1.高速傳輸U(kuò)SB3.0理論帶寬為5Gbps(實(shí)際有效速率約400MB/s),適合高分辨率圖像、高
    的頭像 發(fā)表于 04-08 15:21 ?1048次閱讀
    USB <b class='flag-5'>3.0</b>工業(yè)采集卡<b class='flag-5'>功能</b>與應(yīng)用詳解

    NVIDIA實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)渲染技術(shù)的突破性增強(qiáng)功能

    近日,NVIDIA 宣布了 NVIDIA RTX 神經(jīng)網(wǎng)絡(luò)渲染技術(shù)的突破性增強(qiáng)功能。NVIDIA 與微軟合作,將在 4 月的 Microsoft DirectX 預(yù)覽版中增加神經(jīng)網(wǎng)絡(luò)著
    的頭像 發(fā)表于 04-07 11:33 ?1002次閱讀

    NVIDIA RTX 4500 Ada與NVIDIA RTX A5000的對(duì)比

    基于大眾所熟知的 NVIDIA Ada Lovelace 架構(gòu),NVIDIA RTX 4500 Ada Generation是一款介于 NVIDIA RTX 4000 Ada 和 NVIDIA
    的頭像 發(fā)表于 03-05 10:30 ?4327次閱讀