chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

從Shader編成入手了解GPU應(yīng)用方案

Dbwd_Imgtec ? 來源:未知 ? 作者:胡薇 ? 2018-05-17 09:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Graphics Processing Unit(GPU),即可編程圖形處理單元, 通常也稱之為可編程圖形硬件。

由于GPU有高并行結(jié)構(gòu)(highly parallel structure),所以GPU在處理圖形數(shù)據(jù)和復(fù)雜算法方面擁有比CPU更高的效率。圖 1 GPU VS CPU 展示了 GPU 和 CPU 在結(jié)構(gòu)上的差異,CPU 大部分面積為控制器寄存器,與之相比,GPU擁有更多的 ALU(Arithmetic Logic Unit,邏輯運(yùn)算單元)用于數(shù)據(jù)處理,而非數(shù)據(jù)高速緩存和流控制,這樣的結(jié)構(gòu)適合對(duì)密集型數(shù)據(jù)進(jìn)行并行處理。CPU 執(zhí)行計(jì)算任務(wù)時(shí),一個(gè)時(shí)刻只處理一個(gè)數(shù)據(jù),不存在真正意義上的并行,而 GPU 具有多個(gè)處理器核,在一個(gè)時(shí)刻可以并行處理多個(gè)數(shù)據(jù)。

GPU 采用流式并行計(jì)算模式,可對(duì)每個(gè)數(shù)據(jù)進(jìn)行獨(dú)立的并行計(jì)算,所謂“對(duì) 數(shù)據(jù)進(jìn)行獨(dú)立計(jì)算”,即,流內(nèi)任意元素的計(jì)算不依賴于其它同類型數(shù)據(jù),例如,計(jì)算一個(gè)頂點(diǎn)的世界位置坐標(biāo),不依賴于其他頂點(diǎn)的位置。而所謂“并行計(jì)算” 是指“多個(gè)數(shù)據(jù)可以同時(shí)被使用,多個(gè)數(shù)據(jù)并行運(yùn)算的時(shí)間和 1 個(gè)數(shù)據(jù)單獨(dú)執(zhí)行的時(shí)間是一樣的”。圖 2 中代碼目的是提取 2D 圖像上每個(gè)像素點(diǎn)的顏色值,在 CPU 上運(yùn)算的 C++代碼通過循環(huán)語句依次遍歷像素;而在 GPU 上,則只需要一條語句就足夠。

其一,object space coordinate 就是模型文件中的頂點(diǎn)值,這些值是在模型建模時(shí)得到的,例如,用 3DMAX 建 立一個(gè)球體模型并導(dǎo)出為.max 文件,這個(gè)文件中包含的數(shù)據(jù)就是 object space coordinate;其二,object space coordinate 與其他物體沒有任何參照關(guān)系,注意,這個(gè)概念非常重要,它是將 object space coordinate 和 world space coordinate 區(qū)分 開來的關(guān)鍵。無論在現(xiàn)實(shí)世界,還是在計(jì)算機(jī)的虛擬空間中,物體都必須和一個(gè)固定的坐標(biāo)原點(diǎn)進(jìn)行參照才能確定自己所在的位置,這是 world space coordinate 的實(shí)際意義所在。

從 object space coordinate 到 world space coordinate 的變換過程由一個(gè)四階矩陣控制,通常稱之為 world matrix。需要高度注意的是:頂點(diǎn)法向量在模型文件中屬于 object space,在 GPU 的 頂點(diǎn)程序中必須將法向量轉(zhuǎn)換到 world space 中才能使用,如同必須將頂點(diǎn)坐標(biāo)從 object space 轉(zhuǎn)換到 world space 中一樣,但兩者的轉(zhuǎn)換矩陣是不同的,準(zhǔn)確的說,法向量從 object space 到 world space 的轉(zhuǎn)換矩陣是 world matrix 的轉(zhuǎn)置矩陣的逆矩陣。

每個(gè)人都是從各自的視點(diǎn)出發(fā)觀察這個(gè)世界,無論是主觀世界還是客觀世界。同樣,在計(jì)算機(jī)中每次只能從唯一的視角出發(fā)渲染物體。在游戲中,都會(huì)提供視點(diǎn)漫游的功能,屏幕顯示的內(nèi)容隨著視點(diǎn)的變化而變化。這是因?yàn)?GPU 將 物體頂點(diǎn)坐標(biāo)從 world space 轉(zhuǎn)換到了 eye space。 所謂 eye space,即以 camera(視點(diǎn)或相機(jī))為原點(diǎn),由視線方向、視角和遠(yuǎn)近平面,共同組成一個(gè)梯形體的三維空間,稱之為 viewing frustum(視錐), 如圖 4 所示。近平面,是梯形體較小的矩形面,作為投影平面,遠(yuǎn)平面是梯形體 較大的矩形,在這個(gè)梯形體中的所有頂點(diǎn)數(shù)據(jù)是可見的,而超出這個(gè)梯形體之外的場景數(shù)據(jù),會(huì)被視點(diǎn)去除(Frustum Culling,也稱之為視錐裁剪)。

從視點(diǎn)坐標(biāo)空間到屏幕坐標(biāo)空間 (screen coordinate space)事實(shí)上是由三步組成:

1. 用透視變換矩陣把頂點(diǎn)從視錐體中變換到裁剪空間的 CVV 中;2. 在 CVV 進(jìn)行圖元裁剪;3. 屏幕映射:將經(jīng)過前述過程得到的坐標(biāo)映射到屏幕坐標(biāo)系上。

從物理結(jié)構(gòu)而言,寄存器是 cpu 或 gpu 內(nèi)部的存儲(chǔ)單元,即寄存器是嵌入在 cpu 或者 gpu 中的,而內(nèi)存則可以獨(dú)立存在;

從功能上而言,寄存器是有限存儲(chǔ) 容量的高速存儲(chǔ)部件,用來暫存指令、數(shù)據(jù)和位址。

Shader 編成是基于計(jì)算機(jī)圖形硬件的,這其中就包括 GPU 上的寄存器類型,glsl 和 hlsl 的著色虛擬機(jī)版本就是基于 GPU 的寄存器和指令集而區(qū)分的。

頂點(diǎn)著色器控制頂點(diǎn)坐標(biāo) 轉(zhuǎn)換過程;片段著色器控制像素顏色計(jì)算過程。這樣就區(qū)分出頂點(diǎn)著色程序和片 段著色程序的各自分工:Vertex program 負(fù)責(zé)頂點(diǎn)坐標(biāo)變換;Fragment program 負(fù)責(zé)像素顏色計(jì)算;前者的輸出是后者的輸入。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 寄存器
    +關(guān)注

    關(guān)注

    31

    文章

    5619

    瀏覽量

    130393
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5268

    瀏覽量

    136058

原文標(biāo)題:GPU學(xué)習(xí)筆記

文章出處:【微信號(hào):Imgtec,微信公眾號(hào):Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Visionfive 2 缺少文件img-gpu-powervr-bin-1.17.6210866.tar.gz怎么解決?

    -powervr/img-gpu-powervr-bin-1.17.6210866.tar.gz 我檢查了 buildroot,目錄和文件不存在。 我已經(jīng)在網(wǎng)上掃描了它,但谷歌找不到它。 有誰知道哪里可以得到這個(gè)副本?
    發(fā)表于 03-11 07:08

    GPU固件無法使用重新編譯的內(nèi)核加載怎么解決?

    \' loaded[ 1.545044] PVR_K:1: Shader binary image \'rgx.sh.36.50.54.182\' loaded[ 1.554679] [drm
    發(fā)表于 02-24 07:23

    FPGA+GPU異構(gòu)混合部署方案設(shè)計(jì)

    為滿足對(duì) “納秒級(jí)實(shí)時(shí)響應(yīng)” 與 “復(fù)雜數(shù)據(jù)深度運(yùn)算” 的雙重需求,“FPGA+GPU”異構(gòu)混合部署方案通過硬件功能精準(zhǔn)拆分與高速協(xié)同,突破單一硬件的性能瓶頸 ——FPGA聚焦低延遲實(shí)時(shí)交易鏈路,GPU承接高復(fù)雜度數(shù)據(jù)處理任務(wù),
    的頭像 發(fā)表于 01-13 15:20 ?479次閱讀

    汽車中的GPU是如何使用的?

    。我們GPU在汽車中的應(yīng)用場景及其具體需求出發(fā),深入探討了GPU對(duì)汽車行業(yè)發(fā)展的影響,并對(duì)未來趨勢提出了關(guān)鍵判斷。1、GPU計(jì)算在汽車中的應(yīng)用場景
    的頭像 發(fā)表于 12-03 14:45 ?9700次閱讀
    汽車中的<b class='flag-5'>GPU</b>是如何使用的?

    IGBT到底是什么?-名稱入手來帶您了解

    對(duì)于工作需要用到IGBT、但從未專業(yè)學(xué)習(xí)過IGBT的人來說, IGBT到底是什么、它為什么叫IGBT、它的核心關(guān)鍵詞是什么、要怎么理解它 等一系列問題并無法一次性在某個(gè)地方獲取到,都需要查閱大量的資料,學(xué)習(xí)大量的基礎(chǔ)才能有個(gè)初步的了解。 為了讓更多的人在更少的時(shí)間內(nèi)掌握IGBT,我將在
    的頭像 發(fā)表于 11-25 17:38 ?2607次閱讀
    IGBT到底是什么?-<b class='flag-5'>從</b>名稱<b class='flag-5'>入手</b>來帶您<b class='flag-5'>了解</b>

    如何看懂GPU架構(gòu)?一分鐘帶你了解GPU參數(shù)指標(biāo)

    分析GPU核心參數(shù)體系:算力、顯存大小、顯存帶寬、熱門架構(gòu)特性等關(guān)鍵指標(biāo),旨在幫您理解不同應(yīng)用場景下,如何選擇最合適的GPU算力解決方案。1、算力GPU執(zhí)行浮點(diǎn)運(yùn)算
    的頭像 發(fā)表于 10-09 09:28 ?1521次閱讀
    如何看懂<b class='flag-5'>GPU</b>架構(gòu)?一分鐘帶你<b class='flag-5'>了解</b><b class='flag-5'>GPU</b>參數(shù)指標(biāo)

    CPU 到 GPU,渲染技術(shù)如何重塑游戲、影視與設(shè)計(jì)?

    渲染技術(shù)是計(jì)算機(jī)圖形學(xué)的核心內(nèi)容之一,它是將三維場景轉(zhuǎn)換為二維圖像的過程。渲染技術(shù)一直在不斷演進(jìn),最初的CPU渲染到后來的GPU渲染,性能和質(zhì)量都有了顯著提升。CPU到GPU:技術(shù)
    的頭像 發(fā)表于 09-01 12:16 ?1112次閱讀
    <b class='flag-5'>從</b> CPU 到 <b class='flag-5'>GPU</b>,渲染技術(shù)如何重塑游戲、影視與設(shè)計(jì)?

    aicube的n卡gpu索引該如何添加?

    請(qǐng)問有人知道aicube怎樣才能讀取n卡的gpu索引呢,我已經(jīng)安裝了cuda和cudnn,在全局的py里添加了torch,能夠調(diào)用gpu,當(dāng)還是只能看到默認(rèn)的gpu0,顯示不了gpu1
    發(fā)表于 07-25 08:18

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】+NVlink技術(shù)應(yīng)用到原理

    自家GPU 提出的多卡算力互連技術(shù),是早期為了應(yīng)對(duì)深度學(xué)習(xí)對(duì)超高算力需求而單卡算力不足的局面的解決方案,當(dāng)然這都是官方用來吹牛的話術(shù)。我自己在2019年左右第一次接觸到多卡交火的GIY玩法(學(xué)生到
    發(fā)表于 06-18 19:31

    GPU架構(gòu)深度解析

    GPU架構(gòu)深度解析圖形處理到通用計(jì)算的進(jìn)化之路圖形處理單元(GPU),作為現(xiàn)代計(jì)算機(jī)中不可或缺的一部分,已經(jīng)最初的圖形渲染專用處理器,發(fā)展成為強(qiáng)大的并行計(jì)算引擎,廣泛應(yīng)用于人工智能
    的頭像 發(fā)表于 05-30 10:36 ?2017次閱讀
    <b class='flag-5'>GPU</b>架構(gòu)深度解析

    ARM Mali GPU 深度解讀

    設(shè)備 GPU 市場的核心力量。以下技術(shù)演進(jìn)、架構(gòu)特性、產(chǎn)品布局及生態(tài)戰(zhàn)略等維度展開分析: 一、架構(gòu)演進(jìn): Utgard 到 Valhall Mali GPU 的架構(gòu)迭代以 ? 北歐
    的頭像 發(fā)表于 05-29 10:12 ?4901次閱讀

    又一顆國產(chǎn)GPU芯片成功點(diǎn)亮!6nm制程,自研TrueGPU架構(gòu)

    GPU芯片G100采用6nm制程,基于自研的TrueGPU架構(gòu),這是全球首個(gè)融合高性能圖形渲染與AI推理能力的GPU架構(gòu)。其核心優(yōu)勢在于通過unified shader+tensor engine
    發(fā)表于 05-29 00:48 ?2791次閱讀

    Imagination與澎峰科技攜手推動(dòng)GPU+AI解決方案,共拓計(jì)算生態(tài)

    的深度融合展開合作。雙方將結(jié)合 Imagination 領(lǐng)先的 GPU IP 技術(shù)與澎峰科技在 AI 模型壓縮與性能優(yōu)化方面的軟硬協(xié)同能力,共同開拓面向 AI 行業(yè)應(yīng)用的計(jì)算解決方案,推動(dòng)國產(chǎn)計(jì)算生態(tài)
    發(fā)表于 05-21 09:40 ?1291次閱讀

    搭建算力中心,了解GPU 特性開始

    ABSTRACT摘要本文介紹如何搭建算力,并介紹A100、H100、H200和B200這些GPU的特性。JAEALOT2025年4月23日隨著人工智能、大數(shù)據(jù)和高性能計(jì)算(HPC)的快速發(fā)展,市場上
    的頭像 發(fā)表于 04-24 11:08 ?3716次閱讀
    搭建算力中心,<b class='flag-5'>從</b><b class='flag-5'>了解</b>的<b class='flag-5'>GPU</b> 特性開始