chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

分塊延遲渲染架構(gòu)能否在桌面領(lǐng)域立足?

穎脈Imgtec ? 2025-11-25 08:34 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Imagination的PowerVR GPU架構(gòu)始終是高效能的代名詞。我們的IP技術(shù)在移動(dòng)設(shè)備、消費(fèi)電子及其他嵌入式領(lǐng)域奠定了聲譽(yù),這些領(lǐng)域的SoC設(shè)計(jì)方案往往需要優(yōu)先考慮電池續(xù)航與芯片面積。

然而在桌面市場,顯卡所需的GPU IP要求則大不相同:

高性能:主流顯卡需達(dá)到20 TFLOPS算力與300GPixel/s渲染能力方能立足;高端游戲顯卡的性能標(biāo)準(zhǔn)更為嚴(yán)苛

先進(jìn)特性:超分辨率等AI增強(qiáng)功能漸成標(biāo)配,GPU更成為生成式AI革命的關(guān)鍵推動(dòng)力

軟件兼容:必須通過硬件級DirectX支持流暢運(yùn)行Windows平臺(tái)游戲

能效控制:即便在桌面領(lǐng)域,能效同樣至關(guān)重要,用戶期待低散熱、靜音運(yùn)行的設(shè)備。

近年來,Imagination通過增加主GPU核心內(nèi)處理單元數(shù)量,結(jié)合領(lǐng)先的多核擴(kuò)展技術(shù),已助力桌面領(lǐng)域客戶實(shí)現(xiàn)主流級性能目標(biāo)。

我們常被問及:在長期被即時(shí)渲染架構(gòu)(IMR)主導(dǎo)的桌面領(lǐng)域,分塊延遲渲染架構(gòu)(TBDR)是否真的能勝任?

答案是肯定的。事實(shí)上這兩種架構(gòu)風(fēng)格的差異并不如想象中巨大。接下來我們將深入解析其實(shí)現(xiàn)原理。


回歸基礎(chǔ):傳統(tǒng)3D渲染的簡化數(shù)據(jù)流

819688bc-c996-11f0-8ce9-92fbcf53809c.png

在3D圖形處理中,每個(gè)提交給渲染器的對象都會(huì)在下一個(gè)對象被處理之前立即完成變換、光柵化和著色。這正是“即時(shí)模式渲染(immediate mode rendering)”這一名稱的由來。

當(dāng)然,在3D場景中,遠(yuǎn)離攝像機(jī)的物體可能(完全或部分)被前景物體遮擋。如果在"紋理與著色"步驟之后才執(zhí)行深度測試,那些已經(jīng)處理過的像素片段很可能被更靠近攝像機(jī)的三角形/像素片段所"覆蓋重繪"。這會(huì)導(dǎo)致著色器執(zhí)行不必要的計(jì)算工作,同時(shí)引發(fā)大量冗余(且高功耗)的數(shù)據(jù)傳輸。所有顏色和深度數(shù)據(jù)都存儲(chǔ)在系統(tǒng)內(nèi)存中,處理顏色混合和深度緩沖區(qū)更新時(shí)頻繁的讀取/修改/寫入操作,將產(chǎn)生巨大的內(nèi)存帶寬開銷,或者需要配備超大容量的L2/L3緩存。

在芯片面積和功耗限制較少的設(shè)備上,這種程度的資源浪費(fèi)尚可接受,但對智能手機(jī)等資源受限的環(huán)境卻并不適用。這正是Imagination分塊延遲渲染技術(shù)展現(xiàn)價(jià)值的領(lǐng)域。


第一節(jié):桌面系統(tǒng)中的分塊渲染

認(rèn)識(shí)Imagination的分塊渲染技術(shù)

基于分塊延遲渲染(TBDR)架構(gòu)中的分塊處理發(fā)生在渲染管線早期,具體位于幾何處理階段。該階段通過處理頂點(diǎn)數(shù)據(jù),將整個(gè)場景劃分為若干稱為"圖塊"的獨(dú)立區(qū)域。這種分塊機(jī)制使得芯片內(nèi)緩存可以替代高成本的系統(tǒng)內(nèi)存往返數(shù)據(jù)傳輸。分塊技術(shù)還能優(yōu)化工作負(fù)載分配——由于每個(gè)圖塊相互獨(dú)立,可在不同核心或著色單元間并行處理。與傳統(tǒng)即時(shí)渲染(IMR)架構(gòu)按三角形處理的方式不同,這種方式可實(shí)現(xiàn)性能的線性擴(kuò)展。另一關(guān)鍵優(yōu)勢在于:每個(gè)圖塊的數(shù)據(jù)量極小,使得整個(gè)處理流程可完全在芯片內(nèi)完成,每個(gè)圖塊僅需執(zhí)行單次寫回操作。

Imagination GPU專屬分塊優(yōu)化技術(shù)

Imagination擁有三項(xiàng)降低內(nèi)存帶寬、實(shí)現(xiàn)極致功耗控制的核心分塊技術(shù):

1.精準(zhǔn)分塊(Perfect Tiling)

Imagination GPU將三角形精確歸類至對應(yīng)圖塊,確保計(jì)算資源僅用于必要區(qū)域。多數(shù)廠商采用邊界框(bounding boxes)方案,因數(shù)據(jù)過量提取可能導(dǎo)致工作量翻倍——而采用分層圖塊劃分的GPU情況甚至更糟。

2.精準(zhǔn)剔除(Perfect Culling)

我們擁有多項(xiàng)早期剔除技術(shù)專利,涵蓋微對象剔除、深度剔除等創(chuàng)新領(lǐng)域,以及傳統(tǒng)離屏剔除和背向三角形剔除等成熟方案。

3.幾何壓縮(Geometry Compression)

我們的GPU是唯一采用硬件級幾何壓縮技術(shù)的產(chǎn)品。該技術(shù)能在頂點(diǎn)數(shù)據(jù)(包括位置坐標(biāo)、法線向量、紋理坐標(biāo)等)存儲(chǔ)或傳輸前進(jìn)行壓縮,通過減小頂點(diǎn)緩沖區(qū)尺寸來降低內(nèi)存帶寬需求。GPU在頂點(diǎn)處理過程中實(shí)時(shí)執(zhí)行數(shù)據(jù)壓縮,從而實(shí)現(xiàn)內(nèi)部緩存的高效利用,減少外部內(nèi)存訪問頻次。

這些技術(shù)共同保障了即使在桌面級設(shè)備上,GPU也能在提供游戲及生產(chǎn)力應(yīng)用所需性能的同時(shí),保持卓越能效與低噪音運(yùn)行。

那么分塊渲染雖高效,其與桌面軟件的兼容性如何?主流桌面API(OpenGL與DirectX)及游戲引擎均已支持分塊渲染?;诜謮K延遲渲染的管線前端(在分塊處理階段之前)與經(jīng)典即時(shí)渲染架構(gòu)并無差異。值得注意的是,現(xiàn)代即時(shí)渲染架構(gòu)也已發(fā)展出自身的分塊方案:例如英偉達(dá)GPU配備分塊緩存(tiled caching)技術(shù),AMD GPU則提供"繪制流分檔光柵化器"(Draw Stream Binning Rasterizer)。

Imagination GPU與AMD/英偉達(dá)方案的核心區(qū)別在于:即時(shí)渲染架構(gòu)通過片上緩存(而非系統(tǒng)內(nèi)存)實(shí)現(xiàn)其"分塊"處理。但這并非桌面客戶的障礙——我們的GPU可配置為將分塊數(shù)據(jù)與幾何數(shù)據(jù)存儲(chǔ)于片上內(nèi)存(SRAM),從而降低延遲并減少外部DDR帶寬占用。未默認(rèn)采用此設(shè)計(jì)是因它會(huì)增加芯片面積,這對嵌入式細(xì)分市場的成本敏感型合作伙伴難以接受。

本質(zhì)上,分塊渲染器與即時(shí)渲染器已呈現(xiàn)技術(shù)融合:即時(shí)渲染器通過引入分塊機(jī)制提升能效與處理效率。因此,關(guān)于分塊渲染器軟件兼容性的挑戰(zhàn)已不復(fù)存在,相關(guān)歷史論斷實(shí)屬過時(shí)且具有誤導(dǎo)性。

Imagination 桌面級 GPU優(yōu)化方案

面向嵌入式市場的經(jīng)典Imagination GPU專注于面積效率,因?yàn)樵谇度胧绞袌?,GPU的芯片面積預(yù)算通常有限,也無法負(fù)擔(dān)支持幾何圖塊劃分所需的更大片上緩存。這與桌面市場不同,桌面市場普遍擁有巨大的緩存,例如AMD的Infinity Cache最高可達(dá)128MB。

在桌面市場使用Imagination GPU IP的客戶可以進(jìn)行以下調(diào)整,以適應(yīng)桌面環(huán)境:

允許將參數(shù)/圖塊緩沖區(qū)映射到任意內(nèi)存區(qū)域(而不僅限于系統(tǒng)內(nèi)存)。

將緩沖區(qū)限制為特定的、較小的尺寸。

啟用"智能參數(shù)管理"(SPM)功能,允許硬件刷新部分圖塊渲染數(shù)據(jù)以釋放片上參數(shù)存儲(chǔ)空間,代價(jià)是會(huì)降低隱藏面消除效率(例如已刷新的工作負(fù)載后續(xù)可能被其他物體遮擋)。

如有需要,可將數(shù)據(jù)溢出到系統(tǒng)內(nèi)存。


2節(jié):桌面端的延遲渲染

了解Imagination的延遲渲染

81a3e39a-c996-11f0-8ce9-92fbcf53809c.png

如前所述,即時(shí)渲染模式在處理場景對象時(shí),會(huì)立即進(jìn)行變換、光柵化和著色,而不會(huì)預(yù)先判斷哪些對象在屏幕上是可見的。

除了分塊技術(shù),Imagination GPU還采用延遲渲染方案。該技術(shù)在片段處理階段初期引入深度測試,主動(dòng)檢測并剔除被遮擋的三角形。完成此步驟后,渲染管線才會(huì)執(zhí)行紋理貼圖與著色計(jì)算。這種"按需渲染"的技術(shù)路徑有效降低了計(jì)算負(fù)載、內(nèi)存帶寬及功耗消耗。

其運(yùn)作流程如下:

提取每個(gè)圖塊,僅根據(jù)位置數(shù)據(jù)對變換后的幾何體進(jìn)行光柵化

隱藏面消除(HSR)階段通過片上緩沖區(qū)判定可見片段

片段處理階段負(fù)責(zé)獲取屬性與紋理數(shù)據(jù)

像素處理階段運(yùn)行像素著色器代碼,實(shí)施逐像素光照等著色技術(shù),所有混合操作均在片上圖塊內(nèi)存完成,避免片外讀寫

通過將片上緩沖區(qū)數(shù)據(jù)寫入內(nèi)存,逐塊完成最終3D幀渲染

延遲渲染與桌面軟件的兼容性如何?

延遲渲染對軟件完全透明,且完全符合現(xiàn)代API規(guī)范。采用延遲渲染方案不會(huì)造成任何功能限制,其影響僅體現(xiàn)在GPU內(nèi)部操作層面。

究其本質(zhì),延遲渲染實(shí)質(zhì)上是亂序深度計(jì)算的一種實(shí)現(xiàn)形式。英偉達(dá)與AMD采用的Early-Z技術(shù)正是同類方案,其他廠商類似的解決方案還包括前向像素消除(Forward Pixel Kill)、片段預(yù)渲染(Fragment Pre-Pass)等。因此亂序深度測試具有廣泛兼容性,完全不會(huì)與桌面API產(chǎn)生沖突。


結(jié)語:效率與性能的完美結(jié)合

正如本文所見,即時(shí)渲染模式與基于分塊的延遲渲染GPU的主要區(qū)別在于可見性測試的時(shí)機(jī)、顏色/深度數(shù)據(jù)的存儲(chǔ)位置以及對L2緩存的要求。在設(shè)計(jì)初衷上,基于分塊的延遲渲染GPU更側(cè)重于提升系統(tǒng)效率,減少芯片內(nèi)部的數(shù)據(jù)移動(dòng)。

但兩種渲染架構(gòu)的差異并不如許多人設(shè)想的那般懸殊?,F(xiàn)代即時(shí)渲染器已吸納分塊渲染與早期深度測試等技術(shù)來優(yōu)化工作負(fù)載分配與處理效率。與此同時(shí),Imagination的GPU IP具備充分靈活性,桌面市場客戶可根據(jù)實(shí)際需求進(jìn)行針對性調(diào)整。

這些架構(gòu)層面的相通之處,使得高性能分塊延遲渲染GPU成為現(xiàn)代桌面系統(tǒng)的理想選擇。無論是游戲娛樂、內(nèi)容創(chuàng)作還是AI增強(qiáng)應(yīng)用,Imagination GPU都為傳統(tǒng)即時(shí)渲染架構(gòu)提供了面向未來的替代方案。

了解更多關(guān)于適用于桌面領(lǐng)域的Imagination GPU系列產(chǎn)品信息,請?jiān)L問Imagination官方網(wǎng)站。

英文鏈接:https://blog.imaginationtech.com/does-tile-based-deferred-rendering-have-a-place-in-desktop

聲明:本文為原創(chuàng)文章,轉(zhuǎn)載需注明作者、出處及原文鏈接。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5090

    瀏覽量

    134385
  • 渲染
    +關(guān)注

    關(guān)注

    0

    文章

    79

    瀏覽量

    11347
  • imagination
    +關(guān)注

    關(guān)注

    1

    文章

    617

    瀏覽量

    63075
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    詳解ROMA中復(fù)雜圖表的渲染實(shí)現(xiàn)

    一、背景 ROMA承接很多復(fù)雜圖表的渲染需求,在京東金融APP內(nèi),特別是首頁首屏的圖表,對圖表渲染的及時(shí)性要求很高。近期業(yè)務(wù)反饋頻繁重啟時(shí),首頁的黃金走勢圖偶現(xiàn)渲染不出的問題,通過梳理圖表的
    的頭像 發(fā)表于 10-21 13:57 ?244次閱讀
    詳解ROMA中復(fù)雜圖表的<b class='flag-5'>渲染</b>實(shí)現(xiàn)

    延遲脈沖信號發(fā)生器激光觸發(fā)領(lǐng)域的應(yīng)用?

    激光技術(shù)飛速發(fā)展的當(dāng)下,高速延遲脈沖信號發(fā)生器作為激光系統(tǒng)中的關(guān)鍵部件,其重要性愈發(fā)凸顯。SYN5610型脈沖信號發(fā)生器憑借出色性能,激光觸發(fā)領(lǐng)域發(fā)揮著不可或缺的作用。
    的頭像 發(fā)表于 09-22 17:53 ?495次閱讀

    從 CPU 到 GPU,渲染技術(shù)如何重塑游戲、影視與設(shè)計(jì)?

    渲染技術(shù)是計(jì)算機(jī)圖形學(xué)的核心內(nèi)容之一,它是將三維場景轉(zhuǎn)換為二維圖像的過程。渲染技術(shù)一直不斷演進(jìn),從最初的CPU渲染到后來的GPU渲染,性能
    的頭像 發(fā)表于 09-01 12:16 ?640次閱讀
    從 CPU 到 GPU,<b class='flag-5'>渲染</b>技術(shù)如何重塑游戲、影視與設(shè)計(jì)?

    知乎開源“智能預(yù)渲染框架” 幾行代碼實(shí)現(xiàn)鴻蒙應(yīng)用頁面“秒開”

    近日,知乎Gitee平臺(tái)開源了其自研的鴻蒙“智能預(yù)渲染框架”,并將該框架的Har包上架到OpenHarmony三方庫中心倉。該框架在鴻蒙平臺(tái)首創(chuàng)“智能預(yù)渲染”技術(shù),旨在破解應(yīng)用復(fù)雜頁面加載緩慢
    的頭像 發(fā)表于 08-29 14:32 ?456次閱讀
    知乎開源“智能預(yù)<b class='flag-5'>渲染</b>框架” 幾行代碼實(shí)現(xiàn)鴻蒙應(yīng)用頁面“秒開”

    通道渲染:釋放渲染的全部潛能!通道渲染的作用、類型、技巧

    3D圖形創(chuàng)作中,渲染通道(RenderPasses)是一項(xiàng)至關(guān)重要的技術(shù),它通過將復(fù)雜的渲染圖像拆分為多個(gè)圖層,如陰影、光照、法線等,使藝術(shù)家能夠在后期制作中更精準(zhǔn)地控制和調(diào)整畫面。我們常常驚嘆于
    的頭像 發(fā)表于 07-15 14:22 ?435次閱讀
    通道<b class='flag-5'>渲染</b>:釋放<b class='flag-5'>渲染</b>的全部潛能!通道<b class='flag-5'>渲染</b>的作用、類型、技巧

    GPU架構(gòu)深度解析

    、游戲娛樂等領(lǐng)域。本文將深入探討GPU架構(gòu)的演變歷程、核心組件以及其不同應(yīng)用場景中的優(yōu)勢。1、GPU架構(gòu)的演變早期的GPU采用固定功能流水線架構(gòu)
    的頭像 發(fā)表于 05-30 10:36 ?1176次閱讀
    GPU<b class='flag-5'>架構(gòu)</b>深度解析

    明遠(yuǎn)智睿SSD2351核心板語音對講與HMI領(lǐng)域的創(chuàng)新應(yīng)用

    ,通過以太網(wǎng)傳輸至住戶室內(nèi)機(jī),整個(gè)過程延遲不超過0.5秒,實(shí)現(xiàn)了即時(shí)、流暢的語音對講體驗(yàn)。 HMI領(lǐng)域,SSD2351核心板同樣展現(xiàn)出卓越性能。DSI接口用于連接顯示屏,能夠輸出高質(zhì)量的圖像和視頻,為
    發(fā)表于 04-16 10:46

    CPU渲染、GPU渲染、XPU渲染詳細(xì)對比:哪個(gè)渲染最快,哪個(gè)效果最好?

    動(dòng)畫渲染動(dòng)畫3D渲染技術(shù)需要應(yīng)對復(fù)雜的計(jì)算任務(wù)和精細(xì)的圖像處理,作為渲染技術(shù)人員,選擇合適的渲染模式,會(huì)直接影響制作效率和成品質(zhì)量。主流的
    的頭像 發(fā)表于 04-15 09:28 ?1181次閱讀
    CPU<b class='flag-5'>渲染</b>、GPU<b class='flag-5'>渲染</b>、XPU<b class='flag-5'>渲染</b>詳細(xì)對比:哪個(gè)<b class='flag-5'>渲染</b>最快,哪個(gè)效果最好?

    2D圖形渲染緩慢怎么加快?

    我有一個(gè)圖形應(yīng)用程序,它似乎渲染屏幕的速度很慢。按下屏幕后,通常需要相當(dāng)長的時(shí)間來更新,大約 50 或 100 毫秒。 應(yīng)用程序啟動(dòng)時(shí),我看到一條錯(cuò)誤消息“GDK 無法創(chuàng)建 GL 上下文,回退
    發(fā)表于 04-02 06:46

    GPU渲染才是大勢所趨?CPU渲染與GPU渲染的現(xiàn)狀與未來

    3D建模和渲染領(lǐng)域,隨著技術(shù)的發(fā)展,CPU渲染和GPU渲染這兩種方法逐漸呈現(xiàn)出各自獨(dú)特的優(yōu)勢,并且
    的頭像 發(fā)表于 02-06 11:04 ?1214次閱讀
    GPU<b class='flag-5'>渲染</b>才是大勢所趨?CPU<b class='flag-5'>渲染</b>與GPU<b class='flag-5'>渲染</b>的現(xiàn)狀與未來

    英偉達(dá)帶來Reflex 2低延遲技術(shù)

    2025 年國際消費(fèi)電子展(CES 2025)上,英偉達(dá)不僅推出了備受矚目的 RTX 50 系列顯卡,還帶來了一項(xiàng)名為 Reflex 2 的低延遲技術(shù),引發(fā)行業(yè)廣泛關(guān)注。 Reflex 2 技術(shù)
    的頭像 發(fā)表于 02-05 15:15 ?2081次閱讀

    延遲、高效傳輸?shù)木W(wǎng)絡(luò)環(huán)境中,異地組網(wǎng)和內(nèi)網(wǎng)穿透哪種技術(shù)更勝一籌?

    現(xiàn)代企業(yè)網(wǎng)絡(luò)架構(gòu)中,異地組網(wǎng)和內(nèi)網(wǎng)穿透是兩種常見的網(wǎng)絡(luò)連接技術(shù),它們不同場景下發(fā)揮著重要作用。然而,追求低延遲、高效傳輸?shù)木W(wǎng)絡(luò)環(huán)境中,
    的頭像 發(fā)表于 01-07 10:52 ?1172次閱讀

    risc-v芯片在電機(jī)領(lǐng)域的應(yīng)用展望

    RISC-V作為一種開源的指令集架構(gòu),近年來芯片設(shè)計(jì)領(lǐng)域嶄露頭角,并逐漸電機(jī)控制領(lǐng)域展現(xiàn)出其獨(dú)特優(yōu)勢。隨著電機(jī)技術(shù)的不斷進(jìn)步和應(yīng)用需求的
    發(fā)表于 12-28 17:20

    圣誕特輯 |開源芯片系列講座第25期:RISC-V架構(gòu)高性能領(lǐng)域的進(jìn)展與挑戰(zhàn)

    鷺島論壇開源芯片系列講座第25期「RISC-V架構(gòu)高性能領(lǐng)域的進(jìn)展與挑戰(zhàn)」圣誕夜(周三)20:00精彩開播期待與您云相聚,共襄學(xué)術(shù)盛宴!|直播信息報(bào)告題目RISC-V架構(gòu)
    的頭像 發(fā)表于 12-24 08:03 ?1154次閱讀
    圣誕特輯 |開源芯片系列講座第25期:RISC-V<b class='flag-5'>架構(gòu)</b><b class='flag-5'>在</b>高性能<b class='flag-5'>領(lǐng)域</b>的進(jìn)展與挑戰(zhàn)

    直播預(yù)約 |開源芯片系列講座第25期:RISC-V架構(gòu)高性能領(lǐng)域的進(jìn)展與挑戰(zhàn)

    鷺島論壇開源芯片系列講座第25期「RISC-V架構(gòu)高性能領(lǐng)域的進(jìn)展與挑戰(zhàn)」12月25日(周三)20:00精彩開播期待與您云相聚,共襄學(xué)術(shù)盛宴!|直播信息報(bào)告題目RISC-V架構(gòu)
    的頭像 發(fā)表于 12-13 17:01 ?749次閱讀
    直播預(yù)約 |開源芯片系列講座第25期:RISC-V<b class='flag-5'>架構(gòu)</b><b class='flag-5'>在</b>高性能<b class='flag-5'>領(lǐng)域</b>的進(jìn)展與挑戰(zhàn)