换着玩人妻A片,国产国语一级高清免费视频,日本一本品大道

Imagination「開(kāi)發(fā)者文檔」網(wǎng)站正式上線，涵蓋了從計(jì)算機(jī)圖形學(xué)基礎(chǔ)到如何充分發(fā)揮Imagination 高能效 PowerVR GPU 架構(gòu)優(yōu)勢(shì)的豐富內(nèi)容。網(wǎng)站中不僅增加了針對(duì)我們最新架構(gòu)代際和計(jì)算任務(wù)的開(kāi)發(fā)指南，還在現(xiàn)有的 PowerVR 入門(mén)、OpenGL ES與Vulkan教程，以及工具手冊(cè)等材料中補(bǔ)充了細(xì)節(jié)。

在最新更新的「開(kāi)發(fā)者文檔網(wǎng)站」中，新增了一個(gè)全新的章節(jié)，向開(kāi)發(fā)者展示如何在Imagination GPU上高效運(yùn)行計(jì)算任務(wù)并實(shí)現(xiàn)最佳性能。

GPU核心在運(yùn)行計(jì)算型工作負(fù)載時(shí)以高效著稱(chēng)——尤其是當(dāng)開(kāi)發(fā)者能夠針對(duì)設(shè)備進(jìn)行軟件優(yōu)化時(shí)。它們的設(shè)計(jì)初衷就是處理這類(lèi)工作負(fù)載：同一段代碼需要在大量線程上重復(fù)執(zhí)行，操作之間僅在輸入數(shù)據(jù)上有所不同，但依舊嚴(yán)格遵循相同的執(zhí)行步驟和指令序列。

雖然這種架構(gòu)和處理模型最初是為加速現(xiàn)代3D圖形而設(shè)計(jì)的，但它與當(dāng)今的AI模型高度契合，特別是在矩陣乘法和卷積等任務(wù)上展現(xiàn)出極高的執(zhí)行效率。

Imagination GPU架構(gòu)由高度可編程的核心組成，這些核心能夠高效并高性能地執(zhí)行通用計(jì)算任務(wù)。不同版本的底層架構(gòu)，其核心特性會(huì)有所差異。所有核心均支持OpenGL ES 3.2、OpenCL 3.0和Vulkan 1.4。

我們最新的「開(kāi)發(fā)者文檔」為開(kāi)發(fā)者提供了在基于Imagination架構(gòu)進(jìn)行開(kāi)發(fā)時(shí)做出正確決策所需的信息——無(wú)論其在API和編程語(yǔ)言方面偏好何種方式。結(jié)合我們提供的其他開(kāi)發(fā)資源（如計(jì)算庫(kù)和編譯器），開(kāi)發(fā)者便能夠?qū)崿F(xiàn)高資源利用率、快速性能以及優(yōu)異的能效表現(xiàn)。

以下是在Imagination PowerVR GPU上優(yōu)化計(jì)算性能的十大技巧。更多技巧與深入見(jiàn)解，請(qǐng)?jiān)L問(wèn)我們「開(kāi)發(fā)者文檔」中的Compute Development Recommendations（計(jì)算開(kāi)發(fā)推薦）章節(jié)。

1.為并行而設(shè)計(jì)

為了實(shí)現(xiàn)系統(tǒng)整體的最佳性能，任務(wù)需要同時(shí)在CPU和GPU核心上運(yùn)行。應(yīng)考慮哪些任務(wù)可以被表達(dá)為并行任務(wù)并在GPU上執(zhí)行，從而讓CPU有余力處理其他工作。

2.深入理解GPU架構(gòu)

Imagination GPU中的每個(gè)統(tǒng)一著色集群（USC）都能夠獨(dú)立執(zhí)行一個(gè)完整的工作組。請(qǐng)根據(jù)目標(biāo)GPU的能力來(lái)設(shè)計(jì)工作負(fù)載，以避免資源利用不足。

3.最小化工作組內(nèi)的分歧

避免使用導(dǎo)致工作組內(nèi)線程走不同執(zhí)行路徑的分支邏輯。分歧會(huì)降低SIMD的執(zhí)行效率。

4.優(yōu)化工作組大小

選擇與目標(biāo)PowerVR核心的原生線程分組相匹配的工作組大小，以確保完全占用并最大化并行執(zhí)行效率。理想值為：Rogue GPU為32，Volcanic GPU為128。

5.平衡內(nèi)核執(zhí)行時(shí)長(zhǎng)

過(guò)短的內(nèi)核會(huì)因啟動(dòng)開(kāi)銷(xiāo)過(guò)高而低效；過(guò)長(zhǎng)的內(nèi)核則可能造成瓶頸。為應(yīng)用找到合適的平衡點(diǎn)至關(guān)重要。

6.提供足夠的數(shù)據(jù)讓GPU保持運(yùn)轉(zhuǎn)

通常情況下，每個(gè)USC超過(guò)512個(gè)數(shù)據(jù)項(xiàng)的工作集能提供足夠的工作量來(lái)維持高利用率和高占用率，更多的數(shù)據(jù)項(xiàng)則能進(jìn)一步提升效率。

7.避免過(guò)度訪問(wèn)全局內(nèi)存

系統(tǒng)內(nèi)存資源有限，且需在所有資源之間共享。許多應(yīng)用的性能瓶頸正是由此引起，因此這是優(yōu)化的重點(diǎn)。應(yīng)采用緩存策略并盡量減少冗余的讀寫(xiě)操作。

8.將內(nèi)存訪問(wèn)集中化

盡可能將內(nèi)存訪問(wèn)操作集中安排，便于識(shí)別和優(yōu)化。通常在內(nèi)核開(kāi)頭進(jìn)行讀取、在結(jié)尾進(jìn)行寫(xiě)入，能獲得最佳效率。

9.謹(jǐn)慎插入本地內(nèi)存訪問(wèn)后的屏障

避免在訪問(wèn)本地或常量?jī)?nèi)存之后立即插入屏障——這樣會(huì)阻止編譯器在此期間重排指令，從而掩蓋延遲。

10.針對(duì)不同API特性進(jìn)行優(yōu)化

OpenCL：CPU與GPU共享的內(nèi)存對(duì)象應(yīng)使用CL-ALLOC-HOST-PTR標(biāo)志。

Vulkan：使用USAGE標(biāo)志來(lái)分配內(nèi)存；這需要同步機(jī)制，但要注意避免數(shù)據(jù)復(fù)制。

OpenGL ES Compute：緩沖區(qū)分配由驅(qū)動(dòng)半透明管理，并在分配時(shí)使用提示；當(dāng)數(shù)據(jù)頻繁變化時(shí)，應(yīng)優(yōu)先使用映射方案（glMapBufferRange），而非顯式上傳（glBufferSubData）。

如果您對(duì)在邊緣設(shè)備上運(yùn)行GPU計(jì)算任務(wù)感興趣，可以了解一下Imagination最新的E-Series架構(gòu)。這一新設(shè)計(jì)在GPU著色器中深度集成了AI加速器，可同時(shí)服務(wù)于圖形、計(jì)算及AI工作負(fù)載。

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

gpu

gpu

+關(guān)注

關(guān)注
28

文章
5150

瀏覽量
134748
AI

AI

+關(guān)注

關(guān)注
91

文章
39083

瀏覽量
299638
imagination

imagination

+關(guān)注

關(guān)注
1

文章
619

瀏覽量
63196

chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费

搜索歷史

在Imagination GPU上優(yōu)化計(jì)算任務(wù)的十大技巧