GPU一推出就包含了比CPU更多的處理單元,更大的帶寬,使得其在多媒體處理過程中能夠發(fā)揮更大的效能。例如:當(dāng)前最頂級的CPU只有4核或者6核,模擬出8個或者12個處理線程來進(jìn)行運(yùn)算,但是普通級別的GPU就包含了成百上千個處理單元,高端的甚至更多,這對于多媒體計(jì)算中大量的重復(fù)處理過程有著天生的優(yōu)勢。下圖展示了CPU和GPU架構(gòu)的對比。
從硬件設(shè)計(jì)上來講,CPU 由專為順序串行處理而優(yōu)化的幾個核心組成。另一方面,GPU 則由數(shù)以千計(jì)的更小、更高效的核心組成,這些核心專為同時(shí)處理多任務(wù)而設(shè)計(jì)。
通過上圖我們可以較為容易地理解串行運(yùn)算和并行運(yùn)算之間的區(qū)別。傳統(tǒng)的串行編寫軟件具備以下幾個特點(diǎn):要運(yùn)行在一個單一的具有單一中央處理器(CPU)的計(jì)算機(jī)上;一個問題分解成一系列離散的指令;指令必須一個接著一個執(zhí)行;只有一條指令可以在任何時(shí)刻執(zhí)行。而并行計(jì)算則改進(jìn)了很多重要細(xì)節(jié):要使用多個處理器運(yùn)行;一個問題可以分解成可同時(shí)解決的離散指令;每個部分進(jìn)一步細(xì)分為一系列指示;每個部分的問題可以同時(shí)在不同處理器上執(zhí)行。
舉個生活中的例子來說,你要點(diǎn)一份餐館的外賣,CPU型餐館用一輛大貨車送貨,每次可以拉很多外賣,但是送完一家才能到下一家送貨,每個人收到外賣的時(shí)間必然很長;而GPU型餐館用十輛小摩托車送貨,每輛車送出去的不多,但是并行處理的效率高,點(diǎn)餐之后收貨就會比大貨車快很多。
-
cpu
+關(guān)注
關(guān)注
68文章
11331瀏覽量
225907 -
gpu
+關(guān)注
關(guān)注
28文章
5272瀏覽量
136076
發(fā)布評論請先 登錄
RK3576 單板機(jī)嵌入式 Qt 界面與多屏異顯開發(fā)手冊(三)
RK3576 單板機(jī)嵌入式 Qt 界面與多屏異顯開發(fā)手冊(二)
RK3576 單板機(jī)嵌入式 Qt 界面與多屏異顯開發(fā)手冊(一)
筑基AI4S:摩爾線程全功能GPU加速中國生命科學(xué)自主生態(tài)
摩爾線程正式開源MuJoCo Warp MUSA
NVIDIA向Kubernetes社區(qū)捐贈動態(tài)資源分配GPU驅(qū)動程序
Oracle和NVIDIA合作加速向量搜索和企業(yè)數(shù)據(jù)處理
NVIDIA攜手全球工業(yè)軟件巨頭構(gòu)建AI智能體加速設(shè)計(jì)與工程開發(fā)流程
基于NVIDIA GPU加速端點(diǎn)使用千問3.5 VLM開發(fā)原生多模態(tài)智能體
RSoft GPU加速技術(shù)重塑光子元件設(shè)計(jì)效率革命
NVIDIA RTX PRO 5000 Blackwell GPU的深度評測
沐曦股份GPU加速技術(shù)助力藥物研發(fā)降本增效
FPGA和GPU加速的視覺SLAM系統(tǒng)中特征檢測器研究
NVIDIA與合作伙伴推動物理AI發(fā)展
使用NVIDIA GPU加速Apache Spark中Parquet數(shù)據(jù)掃描
gpu加速原理
評論