chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

國產(chǎn)GPU繞不開的CUDA生態(tài)

jf_C6sANWk1 ? 來源:阿寶1990 ? 作者:阿寶1990 ? 2022-11-29 09:36 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

國內(nèi)GPU廠家或許嘗試,摸著英偉達(dá)過河。

近日,摩爾線程在北京發(fā)布多款軟硬件新品,包括新一代GPU“春曉”、面向個人電腦的消費級顯卡MTT S80和服務(wù)器計算卡MTT S3000、一體化計算設(shè)備“MCCX元計算一體機(jī)”,以及開發(fā)套件、數(shù)字人解決方案等。GPU“春曉”做為本次發(fā)布會的核心產(chǎn)品受到廣泛關(guān)注。

“春曉”是摩爾線程的第二顆GPU,也是摩爾線程首顆面相國內(nèi)消費級市場發(fā)售的GPU,它強(qiáng)調(diào)游戲、元宇宙與渲染用途,最重要的是,這個GPU支持英偉達(dá)CUDA生態(tài)。

其實經(jīng)常關(guān)注顯卡的同學(xué)總能從英偉達(dá)的發(fā)布會上聽到CUDA這個詞,例如最新的RTX3060有擁有多少顆CUDA核心,某某游戲首發(fā)即支持CUDA生態(tài)等。作為顯卡領(lǐng)域的高頻詞匯,很多人好奇CUDA到底是什么?為什么國產(chǎn)顯卡會用到英偉達(dá)的技術(shù)?本文將帶你了解即熟悉又陌生的CUDA。

CUDA是什么?

CUDA(Compute Unified Device Architecture,統(tǒng)一計算架構(gòu))是由英偉達(dá)所推出的一種集成技術(shù),是該公司對于GPGPU的正式名稱。通過這個技術(shù),用戶可利用NVIDIA的GPU進(jìn)行圖像處理之外的運算,CUDA也是首次可以利用GPU作為C-編譯器的開發(fā)環(huán)境。簡單來說,程序員平時如果不使用特定框架都是針對CPU進(jìn)行編程的,CUDA是全球最大GPU廠商英偉達(dá)推出的針對GPU的編程的架構(gòu)。

2006年,英偉達(dá)發(fā)布了CUDA,它提供了GPU編程的簡易接口,程序員可以基于CUDA編譯基于GPU的應(yīng)用程序,利用GPU的并行計算能力更高效的解決復(fù)雜計算難題。在CUDA發(fā)布之前,程序員需要到顯卡內(nèi)核并利用機(jī)器碼進(jìn)行編譯,編程過程相當(dāng)繁瑣也很困難。CUDA的發(fā)布,相當(dāng)于將較為復(fù)雜的底層代碼封裝成了一個個簡單接口,使用時直接調(diào)用,其在GPU編程領(lǐng)域的革命性不亞于C、Python、PHP等高等編程語言的發(fā)明。當(dāng)然,CUDA本身也是兼容C語言的,其本身就類似C語言,這可以幫助程序員更快速上手CUDA。現(xiàn)在主流的深度學(xué)習(xí)框架大多都基于CUDA進(jìn)行GPU加速運算。

7ca6dda0-6f82-11ed-8abf-dac502259ad0.png

CUDA工作流程 圖源:CSDN

從硬件角度看,英偉達(dá)會經(jīng)常宣傳自家顯卡擁有的CUDA Core數(shù)量。CUDA Core其實就是英偉達(dá)的流處理器,也就是FP32計算單元,同樣的結(jié)構(gòu)在AMD的GPU內(nèi)叫做SP。與CUDA Core相對的還有Tensor Core張量核心,從字面上就能看出該核心主要針對深度學(xué)習(xí)中的Tensor計算設(shè)計。Tensor計算就是混合精度計算,即在底層硬件算子層面用半精度(FP16)進(jìn)行輸入和輸出,使用全精度(FP32)進(jìn)行計算放置丟失過多精度的操作,這個底層硬件就是Tensor Core。CUDA 9.0引入了一個“warp矩陣函數(shù)” C++語言API,以便開發(fā)者可以使用GPU上的Tensor Core。

7cb9a84a-6f82-11ed-8abf-dac502259ad0.png

CUDA Core 圖源:知乎

CUDA與 GPGPU的概念一脈相承。GPU就是傳統(tǒng)意義上的顯卡與圖形加速卡。隨著人工智能產(chǎn)業(yè)爆炸式增長,導(dǎo)致計算復(fù)雜化和算力不足,CPU并行計算能力遠(yuǎn)不如GPU,使得GPU在通用計算領(lǐng)域逐漸領(lǐng)先,為了進(jìn)一步專注通用計算,GPGPU便應(yīng)運而生。GPGPU與CUDA之間關(guān)系十分密切。GPGPU其實是去掉了圖形顯示功能的GPU,它將全部能力都投入到通用計算上,CUDA的出現(xiàn)讓GPU真正實現(xiàn)更廣泛的通用計算。CUDA與GPGPU也直接推動了AI與深度學(xué)習(xí)的發(fā)展與產(chǎn)業(yè)革命。

為什么要兼容CUDA?

當(dāng)我們了解了CUDA是怎么回事,也就方便解釋為什么國產(chǎn)GPU需要兼容CUDA。

前文提到,目前世界上的主流深度學(xué)習(xí)架構(gòu)都在使用CUDA,其主要原因就是深度學(xué)習(xí)的重要載體—GPU市場已被英偉達(dá)占領(lǐng)大半。隨之而來的,就是市面上絕大部分GPU相關(guān)軟件都是用CUDA開發(fā),國產(chǎn)GPU兼容CUDA可以同時“繼承”英偉達(dá)打造好的軟件生態(tài),也有更多資料可供學(xué)習(xí),這對于蹣跚起步的國產(chǎn)GPU行業(yè)來說,減輕了不少開發(fā)難度,也降低了推廣壓力。

從開發(fā)角度分析。業(yè)內(nèi)GPU工程師稱目前GPU市場可以籠統(tǒng)的分成兩大塊,分別是計算和渲染。此前國內(nèi)GPU廠商通常專注與計算方面的研發(fā),也有少部分渲染產(chǎn)品問世,最近摩爾線程發(fā)布的GPU強(qiáng)調(diào)其具有強(qiáng)大的渲染能力。然而渲染賽道難度較大,其計算復(fù)雜度更高,除了通用計算,還包圖形渲染、前后端著色器配置、物體幾何屬性等需要處理。目前世界上標(biāo)準(zhǔn)API主要是CUDA與OpenCL,CUDA是英偉達(dá)系統(tǒng)架構(gòu),OpenCL則主要被AMD采用。采用標(biāo)準(zhǔn)化的API接口,無論是CUDA還是OpenCL,都可以極大減少開發(fā)渲染類GPU的前提投入,后期可以再做相應(yīng)的優(yōu)化,這樣可以降低與CUDA等 “地位”穩(wěn)固的GPU生態(tài)直接競爭的難度。

從市場推廣角度看。英偉達(dá)的CUDA生態(tài)已經(jīng)問世多年,與下游軟件、驅(qū)動廠家已經(jīng)有了深度合作。大部分廠家對于GPU生態(tài)的觀點,往往是不在乎GPU本身好與壞,而是關(guān)注GPU好不好用、能不能用。好不好用的評價較為主觀,但采用現(xiàn)成的英偉達(dá)CUDA接口進(jìn)行編程,可以規(guī)避大多數(shù)未知風(fēng)險,多數(shù)初創(chuàng)企業(yè)開發(fā)GPU軟件采用統(tǒng)一接口也能增加開發(fā)穩(wěn)定性,降低人才招聘難度。所以,構(gòu)建自己的GPU生態(tài)要慢慢起步,一味求快推廣自家生態(tài)只會把風(fēng)險轉(zhuǎn)嫁給更多下游開發(fā)者。

國產(chǎn)GPU要挑戰(zhàn)CUDA嗎?

CUDA本身涵蓋了多個技術(shù)領(lǐng)域,其開發(fā)與后續(xù)更新都與英偉達(dá)自家GPU高度綁定,即使全部開源,第三方廠家也難以完美移植到自家GPU上。從另一個角度看,英偉達(dá)在GPU領(lǐng)域的壟斷地位主要通過CUDA平臺上的軟件生態(tài)實現(xiàn)。國產(chǎn)GPU若想真正做到與英偉達(dá)一較高下,CUDA生態(tài)是繞不開的最終BOSS。

知乎用戶對英偉達(dá)GPU生態(tài)做出分析。國產(chǎn)GPU廠商若無法做到與英偉達(dá)的架構(gòu)、封裝技術(shù)、驅(qū)動優(yōu)化等都保持完全一致,CUDA生態(tài)就一定不會完美適配其他顯卡。做到完全移植,CUDA生態(tài)內(nèi)的各種庫以及套件等都需要做相應(yīng)調(diào)試,工作量太大。

此外,CUDA也并不是一成不變的。每隔一代GPU,CUDA架構(gòu)就會發(fā)生很大變化。每個驅(qū)動小版本推送,CUDA都會做出部分微調(diào)。國產(chǎn)GPU如果完全基于CUDA生態(tài)進(jìn)行開發(fā),那它的硬件更新將完全綁定英偉達(dá)的開發(fā)進(jìn)程,這樣就失去了主動性,且永遠(yuǎn)慢人一步。

不過內(nèi)開發(fā)者也不用悲觀。CUDA本質(zhì)是一個計算結(jié)構(gòu),甚至是一個理念,它并不需要英偉達(dá)的完全授權(quán)。我們可以參考英偉達(dá)的有力競爭者AMD。AMD的生態(tài)雖然基于開源生態(tài)OpenCL開發(fā),但AMD也制作了HIP的編程模式,與CUDA相比,其開發(fā)函數(shù)甚至可以進(jìn)行直接替換。如果說英偉達(dá)在GPU領(lǐng)域是摸著石頭過河的,那AMD就是摸著英偉達(dá)過河。國內(nèi)GPU廠家或許可以參考AMD發(fā)展模式,前期借鑒可以是后期創(chuàng)新的基礎(chǔ)。

寫在最后

CUDA作為英偉達(dá)壟斷GPU領(lǐng)域的關(guān)鍵力量,是國產(chǎn)廠商必須面對的挑戰(zhàn)。CUDA在誕生之初,為人們在深度學(xué)習(xí)與AI領(lǐng)域攻堅克難立下汗馬功勞,但如果它被用來鉗制新力量的發(fā)展,CUDA也將成為英偉達(dá)的馬奇諾防線。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5090

    瀏覽量

    134390
  • CUDA
    +關(guān)注

    關(guān)注

    0

    文章

    125

    瀏覽量

    14387
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4038

    瀏覽量

    97605

原文標(biāo)題:國產(chǎn)GPU繞不開的CUDA生態(tài)

文章出處:【微信號:阿寶1990,微信公眾號:阿寶1990】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    英偉達(dá)失守中國區(qū)!推理需求爆發(fā),國產(chǎn)GPU搶灘上市

    電子發(fā)燒友網(wǎng)報道(文/莫婷婷)近日,上海證券交易所公告顯示,沐曦集成電路(上海)股份有限公司(簡稱“沐曦”)將在10月24日迎來科創(chuàng)板上市委審議。這家成立于2020年的國產(chǎn)GPU新銳,估值已達(dá)210
    的頭像 發(fā)表于 10-22 09:09 ?7333次閱讀
    英偉達(dá)失守中國區(qū)!推理需求爆發(fā),<b class='flag-5'>國產(chǎn)</b><b class='flag-5'>GPU</b>搶灘上市

    RV生態(tài)又一里程碑:英偉達(dá)官宣CUDA將兼容RISC-V架構(gòu)!

    電子發(fā)燒友網(wǎng)報道(文/梁浩斌)英偉達(dá)生態(tài)護(hù)城河CUDA,從最初支持x86、Power?CPU架構(gòu),到2019年宣布支持Arm?CPU,不斷拓展在數(shù)據(jù)中心的應(yīng)用生態(tài)。 在2019年至今的六年
    的頭像 發(fā)表于 07-19 00:04 ?6114次閱讀
    RV<b class='flag-5'>生態(tài)</b>又一里程碑:英偉達(dá)官宣<b class='flag-5'>CUDA</b>將兼容RISC-V架構(gòu)!

    國產(chǎn)GPU再下一城,群起突圍英偉達(dá)+AMD

    上市。 ? 根據(jù)Jon Peddie Research的數(shù)據(jù),獨立GPU市場英偉達(dá)一家獨大,近年來持續(xù)維持超80%的市場份額,而AMD公司則占據(jù)剩余近20%的市場份額。自人工智能市場爆發(fā)式增長以來,英偉達(dá)憑借優(yōu)越的產(chǎn)品性能和完善的CUDA
    的頭像 發(fā)表于 07-07 08:59 ?6747次閱讀
    <b class='flag-5'>國產(chǎn)</b><b class='flag-5'>GPU</b>再下一城,群起突圍英偉達(dá)+AMD

    首款全國產(chǎn)訓(xùn)推一體AI芯片發(fā)布,兼容CUDA生態(tài)

    CUDA生態(tài)體系。該芯片支持從單機(jī)多卡到千卡級集群的靈活擴(kuò)展,能效比達(dá)3.41 TFLOPS/W——在同等功
    的頭像 發(fā)表于 11-30 07:20 ?7419次閱讀
    首款全<b class='flag-5'>國產(chǎn)</b>訓(xùn)推一體AI芯片發(fā)布,兼容<b class='flag-5'>CUDA</b><b class='flag-5'>生態(tài)</b>

    如何看懂GPU架構(gòu)?一分鐘帶你了解GPU參數(shù)指標(biāo)

    GPU架構(gòu)參數(shù)如CUDA核心數(shù)、顯存帶寬、TensorTFLOPS、互聯(lián)方式等,并非“冰冷的數(shù)字”,而是直接關(guān)系設(shè)備能否滿足需求、如何發(fā)揮最大價值、是否避免資源浪費等問題的核心要素。本篇文章將全面
    的頭像 發(fā)表于 10-09 09:28 ?546次閱讀
    如何看懂<b class='flag-5'>GPU</b>架構(gòu)?一分鐘帶你了解<b class='flag-5'>GPU</b>參數(shù)指標(biāo)

    國產(chǎn)領(lǐng)軍的全功能?GPU?“風(fēng)華3號”?重磅發(fā)布,多個第一賦能千行百業(yè)人工智能+

    2025年9月22日,國產(chǎn)GPU標(biāo)志性產(chǎn)品,芯動科技“風(fēng)華3號”全功能GPU新品發(fā)布。
    的頭像 發(fā)表于 09-25 10:17 ?895次閱讀
    <b class='flag-5'>國產(chǎn)</b>領(lǐng)軍的全功能?<b class='flag-5'>GPU</b>?“風(fēng)華3號”?重磅發(fā)布,多個第一賦能千行百業(yè)人工智能+

    aicube的n卡gpu索引該如何添加?

    請問有人知道aicube怎樣才能讀取n卡的gpu索引呢,我已經(jīng)安裝了cuda和cudnn,在全局的py里添加了torch,能夠調(diào)用gpu,當(dāng)還是只能看到默認(rèn)的gpu0,顯示不了
    發(fā)表于 07-25 08:18

    進(jìn)迭時空同構(gòu)融合RISC-V AI CPU的Triton算子編譯器實踐

    Pytorch已能做到100%替換CUDA,國內(nèi)也有智源研究院主導(dǎo)的FlagGems通用算子庫試圖構(gòu)建起不依賴CUDA的AI計算生態(tài),截至今日,F(xiàn)lagGems已進(jìn)入Pyto
    的頭像 發(fā)表于 07-15 09:04 ?1255次閱讀
    進(jìn)迭時空同構(gòu)融合RISC-V AI CPU的Triton算子編譯器實踐

    東芝硬盤亮相昱格國產(chǎn)化生態(tài)大會

    近日,東芝硬盤受邀參加了由昱格主辦的國產(chǎn)化生態(tài)大會,與行業(yè)專家、合作伙伴共同探討國產(chǎn)化生態(tài)發(fā)展的新趨勢、新機(jī)遇與新挑戰(zhàn) ,共筑數(shù)字化生態(tài)新未來。
    的頭像 發(fā)表于 06-09 18:10 ?1064次閱讀

    ARM Mali GPU 深度解讀

    ARM Mali GPU 深度解讀 ARM Mali 是 Arm 公司面向移動設(shè)備、嵌入式系統(tǒng)和基礎(chǔ)設(shè)施市場設(shè)計的圖形處理器(GPU)IP 核,憑借其異構(gòu)計算架構(gòu)、能效優(yōu)化和生態(tài)協(xié)同,成為全球移動
    的頭像 發(fā)表于 05-29 10:12 ?2918次閱讀

    Imagination與澎峰科技攜手推動GPU+AI解決方案,共拓計算生態(tài)

    的深度融合展開合作。雙方將結(jié)合 Imagination 領(lǐng)先的 GPU IP 技術(shù)與澎峰科技在 AI 模型壓縮與性能優(yōu)化方面的軟硬協(xié)同能力,共同開拓面向 AI 行業(yè)應(yīng)用的計算解決方案,推動國產(chǎn)計算生態(tài)
    發(fā)表于 05-21 09:40 ?1104次閱讀

    Imagination與澎峰科技攜手推動GPU+AI解決方案,共拓計算生態(tài)

    結(jié)合Imagination領(lǐng)先的GPUIP技術(shù)與澎峰科技在AI模型壓縮與性能優(yōu)化方面的軟硬協(xié)同能力,共同開拓面向AI行業(yè)應(yīng)用的計算解決方案,推動國產(chǎn)計算生態(tài)的繁榮
    的頭像 發(fā)表于 05-20 08:33 ?738次閱讀
    Imagination與澎峰科技攜手推動<b class='flag-5'>GPU</b>+AI解決方案,共拓計算<b class='flag-5'>生態(tài)</b>

    使用NVIDIA CUDA-X庫加速科學(xué)和工程發(fā)展

    NVIDIA GTC 全球 AI 大會上宣布,開發(fā)者現(xiàn)在可以通過 CUDA-X 與新一代超級芯片架構(gòu)的協(xié)同,實現(xiàn) CPU 和 GPU 資源間深度自動化整合與調(diào)度,相較于傳統(tǒng)加速計算架構(gòu),該技術(shù)可使計算工程工具運行速度提升至原來的 11 倍,計算規(guī)模增加至 5 倍。
    的頭像 發(fā)表于 03-25 15:11 ?1186次閱讀

    國產(chǎn)GPU獨角獸格蘭菲啟動IPO

    近日,國產(chǎn)GPU領(lǐng)域的又一獨角獸企業(yè)——格蘭菲智能科技股份有限公司宣布其上市輔導(dǎo)備案已獲得受理,輔導(dǎo)機(jī)構(gòu)為海通證券。這是繼燧原科技、壁仞科技和沐曦之后,上海在一年內(nèi)第四家進(jìn)行輔導(dǎo)備案的GPU企業(yè)。
    的頭像 發(fā)表于 02-12 17:07 ?920次閱讀

    《CST Studio Suite 2024 GPU加速計算指南》

    監(jiān)控/利用率、選擇可用GPU卡子集等內(nèi)容。 6. 故障排除:針對NVIDIA驅(qū)動安裝、多GPU設(shè)置、GPU模式、硬件識別、CUDA錯誤、TCC模式等問題給出了相應(yīng)的解決方法。
    發(fā)表于 12-16 14:25