chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GPU如何加速人工智能或機(jī)器學(xué)習(xí)的計(jì)算速度

Dbwd_Imgtec ? 來源:cg ? 2019-01-08 15:01 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一、Why GPU

其實(shí)GPU計(jì)算比CPU并不是“效果好”,而是“速度快”。

計(jì)算就是計(jì)算,數(shù)學(xué)上都是一樣的,1+1用什么算都是2,CPU算神經(jīng)網(wǎng)絡(luò)也是可以的,算出來的神經(jīng)網(wǎng)絡(luò)放到實(shí)際應(yīng)用中效果也很好,只不過速度會(huì)很慢罷了。

GPU的起源

GPU全稱叫做graphics processing unit,圖形處理器,顧名思義就是處理圖形的。

電腦顯示器上顯示的圖像,在顯示在顯示器上之前,要經(jīng)過一些列處理,這個(gè)過程有個(gè)專有的名詞叫“渲染”。以前的計(jì)算機(jī)上沒有GPU,渲染就是CPU負(fù)責(zé)的。渲染是個(gè)什么操作呢,其實(shí)就是做了一系列圖形的計(jì)算,但這些計(jì)算往往非常耗時(shí),占用了CPU的一大部分時(shí)間。而CPU還要處理計(jì)算機(jī)器許多其他任務(wù)。因此就專門針對(duì)圖形處理的這些操作設(shè)計(jì)了一種處理器,也就是GPU。這樣CPU就可以從繁重的圖形計(jì)算中解脫出來。

由于GPU是專門為了渲染設(shè)計(jì)的,那么他也就只能做渲染的那些事情。

渲染這個(gè)過程具體來說就是幾何點(diǎn)位置和顏色的計(jì)算,這兩者的計(jì)算在數(shù)學(xué)上都是用四維向量和變換矩陣的乘法,因此GPU也就被設(shè)計(jì)為專門適合做類似運(yùn)算的專用處理器了。為什么說專用呢,因?yàn)楹芏嗍虑樗霾涣恕?/p>

CPU通用性強(qiáng),但是專用領(lǐng)域性能低。工程就是折衷,這項(xiàng)強(qiáng)了,別的就弱了。再后來游戲、3D設(shè)計(jì)對(duì)渲染的要求越來越高,GPU的性能越做越強(qiáng)。論純理論計(jì)算性能,要比CPU高出幾十上百倍。

人們就想了,既然GPU這么強(qiáng),那用GPU做計(jì)算是不是相比CPU速度能大大提升呢?于是就有了GPGPU(general purpose GPU,通用計(jì)算GPU)這個(gè)概念。但我們前面提到了,GPU是專門為了圖像渲染設(shè)計(jì)的,他只適用于那些操作。但幸運(yùn)的是有些操作和GPU本職能做的那些東西非常像,那就可以通過GPU提高速度,比如深度學(xué)習(xí)。

深度學(xué)習(xí)中一類成功應(yīng)用的技術(shù)叫做卷積神經(jīng)網(wǎng)絡(luò)CNN,這種網(wǎng)絡(luò)數(shù)學(xué)上就是許多卷積運(yùn)算和矩陣運(yùn)算的組合,而卷積運(yùn)算通過一定的數(shù)學(xué)手段也可以通過矩陣運(yùn)算完成。這些操作和GPU本來能做的那些圖形點(diǎn)的矩陣運(yùn)算是一樣的。因此深度學(xué)習(xí)就可以非常恰當(dāng)?shù)赜肎PU進(jìn)行加速了。

以前GPGPU(通用GPU)概念不是很火熱,GPU設(shè)計(jì)出來就是為了圖形渲染。想要利用GPU輔助計(jì)算,就要完全遵循GPU的硬件架構(gòu)。而現(xiàn)在GPGPU越來越流行,廠家在設(shè)計(jì)和生產(chǎn)GPU的時(shí)候也會(huì)照顧到計(jì)算領(lǐng)域的需求了。

二、GPGPU與GPU的區(qū)別

GPU的產(chǎn)生是為了解決圖形渲染效率的問題,但隨著技術(shù)進(jìn)步,GPU越來越強(qiáng)大,尤其是shader出現(xiàn)之后(這個(gè)允許我們?cè)贕PU上編程),GPU能做的事越來越多,不再局限于圖形領(lǐng)域,也就有人動(dòng)手將其能力擴(kuò)展到其他計(jì)算密集的領(lǐng)域,這就是GP(General Purpose)GPU。

三、為什么快

比如說你用美圖xx軟件,給一張圖片加上模糊效果的時(shí)候,CPU會(huì)這么做:

使用一個(gè)模糊濾鏡算子的小窗口,從圖片的左上角開始處理,并從左往右,再?gòu)淖笸疫M(jìn)行游走處理,直到整個(gè)圖片被處理完成。因?yàn)镃PU只有一個(gè)或者少數(shù)幾個(gè)核,所以執(zhí)行這種運(yùn)算的時(shí)候,只能老老實(shí)實(shí)從頭遍歷到最后。

但是有一些聰明的讀者會(huì)發(fā)現(xiàn),每個(gè)窗口在處理圖片的過程中,都是獨(dú)立的,相互沒有關(guān)系的。那么同時(shí)用幾個(gè)濾鏡窗口來處理是不是更快一些? 于是我們有了GPU, 一般的GPU都有幾百個(gè)核心,意味著,我們可以同時(shí)有好幾百個(gè)濾鏡窗口來處理這張圖片。

所以說,GPU起初的設(shè)計(jì)目標(biāo)就是為了處理這種圖形圖像的渲染工作,而這種工作的特性就是可以分布式、每個(gè)處理單元之間較為獨(dú)立,沒有太多的關(guān)聯(lián)。而一部分機(jī)器學(xué)習(xí)算法,比如遺傳算法,神經(jīng)網(wǎng)絡(luò)等,也具有這種分布式及局部獨(dú)立的特性(e.g.比如說一條神經(jīng)網(wǎng)絡(luò)中的鏈路跟另一條鏈路之間是同時(shí)進(jìn)行計(jì)算,而且相互之間沒有依賴的),這種情況下可以采用大量小核心同時(shí)運(yùn)算的方式來加快運(yùn)算速度。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5036

    瀏覽量

    133748
  • 人工智能
    +關(guān)注

    關(guān)注

    1811

    文章

    49504

    瀏覽量

    258260
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8528

    瀏覽量

    135874

原文標(biāo)題:為何GPU可以用于加速人工智能或者機(jī)器學(xué)習(xí)的計(jì)算速度?

文章出處:【微信號(hào):Imgtec,微信公眾號(hào):Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Lambda采用Supermicro NVIDIA Blackwell GPU服務(wù)器集群構(gòu)建人工智能工廠

    人工智能/機(jī)器學(xué)習(xí)、HPC、云、存儲(chǔ)和 5G/邊緣的整體 IT 解決方案提供商 Super Micro Computer, Inc. (SMCI)今天宣布,超級(jí)智能云提供商 Lambd
    的頭像 發(fā)表于 08-30 16:55 ?486次閱讀

    挖到寶了!人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器

    和生態(tài)體系帶到使用者身邊 ,讓我們?cè)诩夹g(shù)學(xué)習(xí)和使用上不再受制于人。 三、多模態(tài)實(shí)驗(yàn),解鎖AI全流程 它嵌入了2D視覺、深度視覺、機(jī)械手臂、語(yǔ)音識(shí)別、嵌入式傳感器等多種類AI模塊,涵蓋人工智能領(lǐng)域主要
    發(fā)表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器!

    和生態(tài)體系帶到使用者身邊 ,讓我們?cè)诩夹g(shù)學(xué)習(xí)和使用上不再受制于人。 三、多模態(tài)實(shí)驗(yàn),解鎖AI全流程 它嵌入了2D視覺、深度視覺、機(jī)械手臂、語(yǔ)音識(shí)別、嵌入式傳感器等多種類AI模塊,涵蓋人工智能領(lǐng)域主要
    發(fā)表于 08-07 14:23

    超小型Neuton機(jī)器學(xué)習(xí)模型, 在任何系統(tǒng)級(jí)芯片(SoC)上解鎖邊緣人工智能應(yīng)用.

    Neuton 是一家邊緣AI 公司,致力于讓機(jī)器 學(xué)習(xí)模型更易于使用。它創(chuàng)建的模型比競(jìng)爭(zhēng)對(duì)手的框架小10 倍,速度也快10 倍,甚至可以在最先進(jìn)的邊緣設(shè)備上進(jìn)行人工智能處理。在這篇博文
    發(fā)表于 07-31 11:38

    AI芯片:加速人工智能計(jì)算的專用硬件引擎

    人工智能(AI)的快速發(fā)展離不開高性能計(jì)算硬件的支持,而傳統(tǒng)CPU由于架構(gòu)限制,難以高效處理AI任務(wù)中的大規(guī)模并行計(jì)算需求。因此,專為AI優(yōu)化的芯片應(yīng)運(yùn)而生,成為推動(dòng)深度學(xué)習(xí)
    的頭像 發(fā)表于 07-09 15:59 ?569次閱讀

    最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門學(xué)習(xí)課程參考2025版(大模型篇)

    人工智能大模型重塑教育與社會(huì)發(fā)展的當(dāng)下,無論是探索未來職業(yè)方向,還是更新技術(shù)儲(chǔ)備,掌握大模型知識(shí)都已成為新時(shí)代的必修課。從職場(chǎng)上輔助工作的智能助手,到課堂用于學(xué)術(shù)研究的智能工具,大模型正在工作生活
    發(fā)表于 07-04 11:10

    人工智能機(jī)器學(xué)習(xí)以及Edge AI的概念與應(yīng)用

    人工智能相關(guān)各種技術(shù)的概念介紹,以及先進(jìn)的Edge AI(邊緣人工智能)的最新發(fā)展與相關(guān)應(yīng)用。 人工智能機(jī)器學(xué)習(xí)是現(xiàn)代科技的核心技術(shù)
    的頭像 發(fā)表于 01-25 17:37 ?1360次閱讀
    <b class='flag-5'>人工智能</b>和<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>以及Edge AI的概念與應(yīng)用

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】1.初步理解具身智能

    對(duì)人工智能、機(jī)器人技術(shù)和計(jì)算系統(tǒng)交叉領(lǐng)域感興趣的讀者來說不可或缺的書。這本書深入探討了具身智能這一結(jié)合物理機(jī)器人和
    發(fā)表于 12-28 21:12

    《CST Studio Suite 2024 GPU加速計(jì)算指南》

    許可證模型的加速令牌SIMULIA統(tǒng)一許可證模型的SimUnit令牌積分授權(quán)。 4. GPU計(jì)算的啟用 - 交互式模擬:通過
    發(fā)表于 12-16 14:25

    Banana Pi 攜手 ArmSoM 推出人工智能加速 RK3576 CM5 計(jì)算模塊

    機(jī)器學(xué)習(xí)人工智能 (ML 和 AI) 工作負(fù)載,以及 Arm Mali G52-MC3 圖形處理器和支持 H.264/H.265/MJPEG 編碼和 H.265/H.265/VP9/AVI1/AVS2
    發(fā)表于 12-11 18:38

    ASIC集成電路在人工智能中的應(yīng)用

    的性能和能效比。以下是對(duì)ASIC集成電路在人工智能中應(yīng)用的分析: 一、ASIC集成電路的優(yōu)勢(shì) 高性能 :ASIC針對(duì)特定應(yīng)用進(jìn)行優(yōu)化設(shè)計(jì),可以充分發(fā)揮硬件的并行處理能力,實(shí)現(xiàn)高性能計(jì)算。這使得ASIC在處理人工智能任務(wù)時(shí),如深度
    的頭像 發(fā)表于 11-20 16:03 ?2692次閱讀

    嵌入式和人工智能究竟是什么關(guān)系?

    學(xué)習(xí)和更新提供了可能,從而使人工智能應(yīng)用能夠不斷適應(yīng)和優(yōu)化。 總的來說,嵌入式系統(tǒng)在人工智能中的作用不容忽視。它不僅為人工智能硬件加速提供
    發(fā)表于 11-14 16:39

    GPU加速計(jì)算平臺(tái)是什么

    GPU加速計(jì)算平臺(tái),簡(jiǎn)而言之,是利用圖形處理器(GPU)的強(qiáng)大并行計(jì)算能力來加速科學(xué)
    的頭像 發(fā)表于 10-25 09:23 ?782次閱讀

    人工智能、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)存在什么區(qū)別

    人工智能指的是在某種程度上顯示出類似人類智能的設(shè)備。AI有很多技術(shù),但其中一個(gè)很大的子集是機(jī)器學(xué)習(xí)——讓算法從數(shù)據(jù)中學(xué)習(xí)。
    發(fā)表于 10-24 17:22 ?3326次閱讀
    <b class='flag-5'>人工智能</b>、<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>存在什么區(qū)別

    深度學(xué)習(xí)GPU加速效果如何

    圖形處理器(GPU)憑借其強(qiáng)大的并行計(jì)算能力,成為加速深度學(xué)習(xí)任務(wù)的理想選擇。
    的頭像 發(fā)表于 10-17 10:07 ?846次閱讀