對(duì)于每一代 GPU,Imagination 內(nèi)部的性能團(tuán)隊(duì)都會(huì)運(yùn)行廣泛的測(cè)試內(nèi)容,分析并理解不同類型的工作負(fù)載及其瓶頸。作為分析的一部分,數(shù)據(jù)顯示許多現(xiàn)代游戲在執(zhí)行后處理算法上花費(fèi)了越來越多的時(shí)間,以實(shí)現(xiàn)景深、光暈、模糊等效果。
大多數(shù)這些后處理過程都是以紋理采樣為主的過濾效果,它們對(duì)算術(shù)邏輯單元 (ALU) 的要求不高,但受限于紋理處理單元 (TPU) 的吞吐率。解決這個(gè)問題的一種方法是簡(jiǎn)單地改變 TPU 單元與 USC/ALU 比例。然而,我們的分析表明這并非一個(gè)好策略,原因有以下幾點(diǎn)。
首先,在常規(guī)渲染過程中,D系列 GPU 中 ALU 與 TPU 的比例已經(jīng)是最佳的,增加更多的 TPU 并不會(huì)帶來任何好處,因?yàn)楣ぷ髫?fù)載受限于 ALU。同時(shí),其他處理過程是 TPU 密集型的,同時(shí)也是帶寬密集型的,因此增強(qiáng) TPU 并不會(huì)有幫助,因?yàn)闆]有足夠的帶寬來滿足額外的 TPU 吞吐量,因此性能不會(huì)得到提升。
我們的團(tuán)隊(duì)發(fā)現(xiàn)后處理工作負(fù)載以及計(jì)算圖像處理工作負(fù)載具有以下特點(diǎn):
- 在一個(gè)區(qū)域內(nèi)進(jìn)行規(guī)則的處理/采樣,有大量的采樣點(diǎn)重復(fù)利用,這些采樣點(diǎn)命中紋理緩存;
- 對(duì)單一渲染目標(biāo)/紋理進(jìn)行2D采樣,不涉及層次細(xì)節(jié) (LOD) 和透視。
上述兩個(gè)特性促使我們?cè)?D系列 GPU 中實(shí)現(xiàn)了新的 TPU 模式,可以使性能翻倍,但僅當(dāng)硬件檢測(cè)到這些特性時(shí)才生效。第一個(gè)特性是重要的,因?yàn)槌R?guī)的采樣加上樣本重復(fù)利用率高(例如,移動(dòng)窗口濾波器)可以避免帶寬限制。第二個(gè)特性也是重要的,因?yàn)樗刮覀兡軌虮3种貜?fù)邏輯的數(shù)量較低,避免所有 TPU 邏輯均翻倍的前提下,提供峰值吞吐率翻倍的效果。
這種方法的結(jié)果是適度增加了TPU 的大小,但在策略生效的情況下性能翻倍,同時(shí)保持與總體特性相平衡。IMG D 系列 GPU 實(shí)現(xiàn)了真正的加速,并避免了 ALU 和/或帶寬瓶頸情況,這些情況下 TPU 已經(jīng)足夠快。這意味著對(duì)于某些類型的處理,DXT-48-1536 將有效地表現(xiàn)出等同 DXT-96-1536的性能,每時(shí)鐘處理雙倍數(shù)量的雙線性濾波紋理樣本,與前代 CXT-48-1536 相比則可提供兩倍的執(zhí)行速率。
作為示例,下圖顯示了一個(gè)典型的手機(jī)游戲及其渲染過程。頂部的條形圖從左邊開始,顯示了各種 Vulkan 渲染過程,其中包含幾個(gè)預(yù)處理過程,通常用于陰影貼圖,對(duì)深度測(cè)試單元造成很大壓力。渲染的第二階段是主場(chǎng)景,本例中是一個(gè) GBuffer 渲染過程和一個(gè)光照過程。我們可以看到,這是幀處理時(shí)間的主要部分,ALU和 TPU 的負(fù)載相對(duì)均衡;這通過紅色曲線(TPU 負(fù)載)和綠色曲線(ALU 負(fù)載)表示。我們可以看到,隨著時(shí)間的推移,兩者都顯示出平均利用率,這對(duì)于主場(chǎng)景來說是典型的,其中 ALU 和 TPU 工作的混合比例平衡。

最讓我們感興趣的渲染過程是最后一組,即后處理過程。通常,這是在之前的主渲染過程之上應(yīng)用光暈、模糊等許多 HDR 風(fēng)格后處理效果的地方。在這個(gè)區(qū)域值得注意的是,紅色的 TPU 曲線在很多情況下都升高,而綠色的 ALU 曲線卻非常低。這表明 TPU 單元造成了處理瓶頸——而這正是 2D 雙速率 TPU 設(shè)計(jì)要解決的問題。它為這些工作負(fù)載將 TPU 的速度翻倍,從而將渲染時(shí)間減少了一半,加快了幀渲染的速度。
-
gpu
+關(guān)注
關(guān)注
28文章
5203瀏覽量
135543 -
TPU
+關(guān)注
關(guān)注
0文章
170瀏覽量
21666 -
imagination
+關(guān)注
關(guān)注
1文章
621瀏覽量
63391
發(fā)布評(píng)論請(qǐng)先 登錄
TMAG511x系列2D雙通道高靈敏度霍爾效應(yīng)鎖存器技術(shù)解析
XS5018C:高性能2D/3D降噪ISP-TX 2K芯片電路圖資料
2D、2.5D與3D封裝技術(shù)的區(qū)別與應(yīng)用解析
淺談2D封裝,2.5D封裝,3D封裝各有什么區(qū)別?
MiniLED陣列檢測(cè)很慢很難?通用2D視覺方案巧妙解題,不愧為70%視覺檢測(cè)場(chǎng)景首選!
【Moldex3D丨技術(shù)技巧】運(yùn)用Moldex3D Studio進(jìn)行CoWos自動(dòng)網(wǎng)格建模
【CPKCOR-RA8D1】3、2D繪圖引擎(D/AVE)DRW
Imagination GPU 全面支持 Vulkan 1.4 和 Android 16
從 2D 到 3.5D 封裝演進(jìn)中焊材的應(yīng)用與發(fā)展
TechWiz LCD 2D應(yīng)用:不同結(jié)構(gòu)下的VT曲線
Techwiz LCD 2D應(yīng)用:二維LC透鏡建模分析
HT 可視化監(jiān)控頁面的 2D 與 3D 連線效果
Imagination D系列GPU:關(guān)于2D 雙速率紋理處理
評(píng)論