chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

圖靈設計NVENC單元的性能和質量

星星科技指導員 ? 來源:NVIDIA ? 作者:Roman Arzumanyan ? 2022-04-28 15:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

從開普勒開始的所有 NVIDIA GPUs 都支持完全加速的硬件視頻編碼; GPUs 從費米開始支持完全加速的硬件視頻解碼。最近發(fā)布的圖靈硬件提供了張量核心和更好的機器學習性能,但新的 GPU 還加入了新的多媒體功能,如改進的 NVENC 單元,以在視頻編解碼器中提供更好的壓縮和圖像質量。

讓我們更仔細地看一看圖靈設計的新的 NVENC 單元的性能和質量。

NVENC 性能測試設置

H.264 出現(xiàn)于 15 年前,已經成為一種無處不在的視頻編碼標準。它已經成為業(yè)界最重要和最廣泛的編解碼器。這些測試展示了 Tesla T4 與著名的開源編碼器 libx264 在兩種情況下的性能:

高質量模式,代表最常見的編碼方案與 VBR 控制和 B 幀啟用。

低延遲快速模式,適用于對延遲敏感的應用程序,如遠程游戲或視頻會議。

為此,測試計算機的配置如表 1 所示:

poYBAGJqRkWAMOQBAABkGfjAF4w897.png

我們使用了各種輸入視頻進行 RD 估計,如 basketball _ drive 、 bq _ terrace 、仙人掌、 crowd _ run 、 ducks _ take _ off 、 jokey 、和服,以及更多分辨率為 1280 × 720 、 1920 × 1080 和 3840 × 2160 的視頻。

績效和質量結果

平衡序列

圖 1 到圖 4 顯示, Tesla T4 在高質量模式下為 libx264 提供相同或稍好的視覺質量,如 Kimono、 BQ Terrace 和 Park Scene 。

poYBAGJqReqAeGu1AADRnbCAPGs298.png

pYYBAGJqRfOAJWLxAADBfsd4PzE341.png

與 libx264 相比, T4 顯示了更好的預測和過濾。

紅皮艇和仙人掌序列分別包含顯著的混沌運動和圓周運動。與 libx264 相比, NVENC 在這些包含復雜內部預測的場景中顯示出明顯的優(yōu)勢。

Tesla T4 NVENC 在低延遲模式下的性能很容易超過 libx264 。請注意 Tesla T4 如何在高分辨率下更有效,在相同的比特率下提供 1db 更好的視覺質量。

poYBAGJqRieAaoeBAADFobyJrNk315.png

圖靈 GPUs 配備了功能強大的 NVENC 視頻編碼單元,與 libx264 等復雜的軟件編碼器相比,它提供了更高的視頻壓縮效率,因為它結合了更高的性能和更低的能耗。理想的代碼轉換解決方案需要具有成本效益(美元/流)和節(jié)能(瓦/流)。讓我們看看在多個測試序列中平均的性能和功耗結果,如圖 13 和 14 所示。

poYBAGJqRbWAWNgLAAAr-zX6VSQ870.png

圖 13 。在高質量模式下以每秒 30 幀同時編碼的流數(shù)

poYBAGJqRbeAFAGrAAAsdAzr5H8030.png

圖 14 。在低延遲模式下以每秒 30 幀同時編碼的流數(shù)。

T4 以高質量模式同時編碼 22 個 720p 流。 GPU 還可以平均處理 10 個 1080p 的流和 2 到 3 個超高清( 2160p )分辨率的流。這相當于在相同的視覺質量級別上幾乎是 libx264 的兩倍。

在低延遲模式下運行顯示出 T4 更大的優(yōu)勢。它可以編碼 37 個 720p 分辨率的流, 17-18 個 1080p , 4-5 個超高清,性能比 libx264 高 2-2.7 倍,具有更高的視覺質量。您可以在圖 15 和圖 16 中看到每個流的瓦特數(shù)。

pYYBAGJqRb6AMc3bAAAvq-wAxCA408.png

圖 15 。高質量模式下平均每流功耗瓦特

poYBAGJqRcGAZk8xAAAvASLNIxE444.png

圖 16 。低延遲模式下平均每流功耗瓦特

Tesla 還顯示出很高的功率效率,在高質量模式下優(yōu)于 libx264 2-4x ,在低延遲模式下高達 5 倍,同時保持低負載。

結論

與前幾代相比, NVIDIA 的 Tesla T4 的編碼能力有了很大的提高。與 libx264 這樣的軟件編碼器相比,它在高質量模式下顯示出相同或更好的視覺質量,而在低延遲模式下則優(yōu)于它們。這相當于在功耗降低 2-5 倍時性能提高了一倍。

關于作者

Roman Arzumanyan擁有俄羅斯南部羅曼大學( Rostov-on-Don , 2012 )和羅曼大學應用數(shù)學碩士學位。之后,他在俄羅斯三星研發(fā)院( 2012-2015 )、英特爾公司( 2015-2017 )工作。目前,他在莫斯科擔任開發(fā)技術工程師。他的研究興趣包括視頻編碼、高性能和 GPGPU 。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5432

    瀏覽量

    108393
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5040

    瀏覽量

    133863
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    新品 | Unit Fingerprint2,高性能指紋識別傳感器單元

    UnitFingerprint2是一款高性能指紋識別傳感器單元,內部集成STM32核心主控與A-K323CP一體化指紋識別模組,采用半導體電容式傳感器,具備指紋采集、特征提取、注冊、比對、存儲、檢索
    的頭像 發(fā)表于 10-17 17:41 ?791次閱讀
    新品 | Unit Fingerprint2,高<b class='flag-5'>性能</b>指紋識別傳感器<b class='flag-5'>單元</b>

    電能質量在線監(jiān)測裝置的精度等級如何影響其性能和應用?

    電能質量在線監(jiān)測裝置的精度等級直接決定了其 性能上限 和 應用邊界 —— 等級越高,測量準確性、參數(shù)覆蓋范圍、環(huán)境適應性越強,但成本也越高;等級越低,性能越基礎,僅適配簡單場景。這種影響可從 “
    的頭像 發(fā)表于 10-15 17:31 ?306次閱讀

    NVMe高速傳輸之擺脫XDMA設計之六:性能監(jiān)測單元設計

    性能監(jiān)測單元負責監(jiān)測 NVMe over PCIe 邏輯加速引擎的運行狀態(tài)和統(tǒng)計信息, 包括復位后 運行時間信息、 NVMe 指令數(shù)量統(tǒng)計信息、 數(shù)據(jù)操作數(shù)量統(tǒng)計信息、 IOPS 性能統(tǒng)計 信息
    發(fā)表于 07-02 19:51

    NVMe IP高速傳輸卻不依賴XDMA設計之六:性能監(jiān)測單元設計

    性能監(jiān)測單元負責監(jiān)測 NVMe over PCIe 邏輯加速引擎的運行狀態(tài)和統(tǒng)計信息, 包括復位后 運行時間信息、 NVMe 指令數(shù)量統(tǒng)計信息、 數(shù)據(jù)操作數(shù)量統(tǒng)計信息、 IOPS 性能統(tǒng)計 信息、 指令延遲統(tǒng)計信息等。
    的頭像 發(fā)表于 07-02 19:49 ?316次閱讀
    NVMe IP高速傳輸卻不依賴XDMA設計之六:<b class='flag-5'>性能</b>監(jiān)測<b class='flag-5'>單元</b>設計

    如何評估CAN總線信號質量

    CAN總線網絡的性能在很大程度上取決于其信號質量。信號質量差可能導致通信錯誤,進而引發(fā)系統(tǒng)故障、效率降低甚至安全隱患。因此,評估和確保CAN總線信號質量是維護系統(tǒng)健康和可靠性的關鍵。
    發(fā)表于 06-07 08:46

    單元測試在嵌入式軟件中的關鍵作用及winAMS工具的卓越貢獻

    發(fā)現(xiàn)潛在缺陷,提升代碼質量。 ?核心作用解析? ?缺陷早期捕獲?:單元測試在代碼編寫階段即可執(zhí)行,幫助開發(fā)者在問題擴散前識別邏輯錯誤、邊界條件處理不當?shù)葐栴},降低后期修復成本。 ?代碼質量提升?:通過強制模塊化設計
    的頭像 發(fā)表于 04-11 14:31 ?621次閱讀

    小鵬圖靈AI芯片深度解讀

    和飛行汽車三大領域,成為小鵬AI生態(tài)的硬件基石。這一布局體現(xiàn)了小鵬從單一智能汽車制造商向“AI出行生態(tài)平臺”轉型的戰(zhàn)略野心,通過芯片級自研打破對英偉達等供應商的依賴,降低成本并提升技術自主性。 二、核心技術參數(shù)與架構創(chuàng)新 算力性能 圖靈芯片采
    的頭像 發(fā)表于 03-12 12:14 ?5209次閱讀
    小鵬<b class='flag-5'>圖靈</b>AI芯片深度解讀

    如何提高嵌入式代碼質量?

    嵌入式系統(tǒng)的發(fā)展已經深刻地影響了我們日常生活的方方面面,從智能家居到汽車控制系統(tǒng),再到醫(yī)療設備和工業(yè)自動化等領域,嵌入式系統(tǒng)無處不在。嵌入式軟件的質量直接關系到系統(tǒng)的安全性、穩(wěn)定性和性能。因此,提高
    發(fā)表于 01-15 10:48

    SMT來料質檢:確保電子生產質量的關鍵

    質量直接決定了最終產品的功能性和可靠性。 通過嚴格的來料檢驗,可以評估 元器件的電性能參數(shù)及其焊接端頭和引腳的可焊性,同時檢查PCB板的設計合理性和焊盤的可焊性 。這樣的前置質量管理措施有助于在早期發(fā)現(xiàn)
    發(fā)表于 01-07 16:16

    圓柱電池測試設備:確保電池性能質量的關鍵

    在新能源產業(yè)的快速發(fā)展背景下,圓柱電池作為重要的能量儲存裝置,其性能質量直接關系到電動汽車、儲能系統(tǒng)以及各種便攜式電子設備的性能表現(xiàn)和使用壽命。為了確保圓柱電池能夠在實際應用中發(fā)揮最佳效能,圓柱
    的頭像 發(fā)表于 01-06 17:22 ?636次閱讀

    嚴格的單元測試造就完美的軟件

    關鍵系統(tǒng)時,更是對軟件質量提出了極高的要求。而單元測試作為軟件開發(fā)過程中的核心環(huán)節(jié),其重要性不言而喻。 單元測試的作用 單元測試是指對軟件中的最小可測試
    的頭像 發(fā)表于 11-26 13:22 ?673次閱讀

    小鵬汽車:未來AI汽車將搭載至少3顆圖靈芯片

    近日,在2024小鵬AI科技日上,小鵬汽車宣布了其自主研發(fā)的圖靈AI芯片取得了重要進展。這款芯片擁有40核處理器,能夠本地運行高達30B參數(shù)的大模型,并集成了2個NPU以及面向神經網絡的特定領域架構,性能卓越。
    的頭像 發(fā)表于 11-12 18:05 ?1135次閱讀

    小鵬汽車圖靈芯片及L4自動駕駛新進展

    小鵬汽車CEO何小鵬近日介紹了公司自主研發(fā)的圖靈芯片。這款專為AI而生的芯片,配備了強大的40核處理器,能夠本地運行高達30B參數(shù)的大模型。此外,圖靈芯片還集成了2個NPU,并采用了面向神經網絡
    的頭像 發(fā)表于 11-08 11:01 ?1821次閱讀

    小鵬汽車2024 AI科技日:圖靈AI芯片進展公布,預計AI汽車市場將迎來巨變

    在11月6日下午的2024小鵬AI科技日上,小鵬汽車揭曉了其圖靈AI芯片的最新研發(fā)成果。小鵬汽車強調,這款圖靈芯片是專為AI應用而生,配備了40核處理器,能夠本地運行參數(shù)高達30B的大模型,同時集成了2個NPU以及針對神經網絡優(yōu)化的特定領域架構。
    的頭像 發(fā)表于 11-07 14:56 ?1751次閱讀

    小鵬汽車發(fā)布自主研發(fā)的“圖靈”AI智能駕駛輔助系統(tǒng)

    模型構建、AI算法優(yōu)化到AI芯片設計的全過程。這一全面自主的研發(fā)模式,確保了“圖靈”系統(tǒng)能夠在各個層面實現(xiàn)最佳的協(xié)同與性能發(fā)揮。 小鵬汽車首席執(zhí)行官何小鵬透露,預計到2025年,小鵬汽車的云端計算能力將達到驚人的10Eflops,
    的頭像 發(fā)表于 11-07 10:55 ?1538次閱讀