chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

打破英偉達(dá)CUDA壁壘?AMD顯卡現(xiàn)在也能無(wú)縫適配CUDA了

Hobby觀察 ? 來(lái)源:電子發(fā)燒友 ? 作者:梁浩斌 ? 2024-07-19 00:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)一直以來(lái),圍繞CUDA打造的軟件生態(tài),是英偉達(dá)GPU領(lǐng)域最大的護(hù)城河,尤其是隨著目前AI領(lǐng)域的發(fā)展加速,市場(chǎng)火爆,英偉達(dá)GPU+CUDA的開(kāi)發(fā)生態(tài)則更加穩(wěn)固,AMD、英特爾等廠商雖然在努力追趕,但目前還未能看到有威脅英偉達(dá)地位的可能。

最近一家英國(guó)公司Spectral Compute推出了一款方案,可以為AMD的GPU原生編譯CUDA源代碼,目前正在RNDA2、RDNA3上進(jìn)行規(guī)模測(cè)試。這或許可以打破CUDA與英偉達(dá)GPU的生態(tài)壁壘?


SCALE編譯器

Spectral Compute據(jù)稱花了7年時(shí)間開(kāi)發(fā)SCALE,SCALE不依賴英偉達(dá)的代碼,而是通過(guò)一些開(kāi)源LLVM組件等,建立了其CUDA兼容的工具鏈,讓SCALE在多個(gè)平臺(tái)之間能高度兼容。

其實(shí)在以往也有一些其他GPU硬件兼容CUDA的方式,比如AMD支持的ZLUDA推出的開(kāi)源移植項(xiàng)目,通過(guò)重新編譯二進(jìn)制代碼,就能夠讓CUDA庫(kù)在AMD自家的ROCm上運(yùn)行,令A(yù)MD GPU適配CUDA生態(tài)。

但SCALE的特性在于,可以避免代碼移植的步驟,開(kāi)發(fā)人員可以使用單一版本的代碼庫(kù),因?yàn)镾CALE本身與CUDA的源代碼兼容,這大大提高了可用性。

Spectral Compute的CEO Michael Sondergaard表示:我們相信,只需要編寫一次代碼,就可以在任何硬件平臺(tái)上運(yùn)行它,對(duì)于CPU代碼來(lái)說(shuō),這已經(jīng)實(shí)現(xiàn)很多年了,那為什么GPU不行呢?我們著手通過(guò)彌合主流的CUDA編程語(yǔ)言和其他GPU硬件供應(yīng)商之間的兼容性差距,來(lái)直接解決這個(gè)問(wèn)題。

Michael 還提到:“應(yīng)該構(gòu)建一個(gè)圍繞GPU的開(kāi)源生態(tài)系統(tǒng),類似目前CPU所享有的生態(tài)環(huán)境,同時(shí)確保不同平臺(tái)間的互聯(lián)互通?!彼J(rèn)為,通過(guò)SCALE可以彌合CUDA與其他硬件供應(yīng)商之間的兼容性鴻溝,從而打破市場(chǎng)上存在的壁壘。

據(jù)介紹,SCALE是一種通用并行GPU工具包,其功能與英偉達(dá)的CUDA工具包相仿,它能夠在編譯CUDA代碼的同時(shí),為非英偉達(dá) GPU生成相應(yīng)的二進(jìn)制文件,這樣就徹底避免了對(duì)翻譯層的依賴。

目前,SCALE已經(jīng)在多種軟件中成功運(yùn)行,比如Blender、Llama-cpp、XGboost、FAISS、GOMC、STDGPU、Hashcat和NVIDIA Thrust等專業(yè)軟件,這些軟件已經(jīng)可以在RDNA2和RDNA3的AMD GPU上正常使用CUDA。

不過(guò)SCALE本身不是開(kāi)源的,但用戶可以通過(guò)免費(fèi)的軟件許可使用這個(gè)功能,這或許是為了規(guī)避英偉達(dá)針對(duì)CUDA兼容而出臺(tái)的EULA條款。

其他廠商兼容CUDA的努力

市場(chǎng)上其實(shí)并不缺乏CUDA的挑戰(zhàn)者,包括AMD的ROCm,開(kāi)放標(biāo)準(zhǔn)聯(lián)盟Khronos Group聯(lián)合旗下成員打造出的SYCL編程語(yǔ)言等,而英特爾也與SYCL深度綁定,希望打破CUDA的統(tǒng)治。

當(dāng)然,對(duì)于AMD和英特爾這樣的巨頭而言,他們有資本去嘗試構(gòu)建一個(gè)新的生態(tài),但對(duì)于更多的初創(chuàng)公司和中小規(guī)模公司而言,兼容就是成本最低的路線。

比如國(guó)內(nèi)的GPU初創(chuàng)公司摩爾線程,基于MUSA的統(tǒng)一架構(gòu)推出了多款GPU產(chǎn)品,并打造了軟件開(kāi)發(fā)平臺(tái),包括AI開(kāi)發(fā)平臺(tái)、MUSA SDK、MT Smart Media和MTVerse XR等。

而這套生態(tài)架構(gòu)可以充分兼容現(xiàn)有的軟件生態(tài),能借助MUSIFY工具實(shí)現(xiàn)代碼零成本遷移到MUSA平臺(tái),也包括對(duì)CUDA生態(tài)的兼容。

在2021年的時(shí)候,在一個(gè)名為Vortex的RISC-V GPU項(xiàng)目上,也實(shí)現(xiàn)了對(duì)CUDA軟件工具包的支持。

在這個(gè)項(xiàng)目中,研究人員設(shè)計(jì)并實(shí)現(xiàn)了一條流水線,旨在全面支持從CUDA到增強(qiáng)版RISC-V GPU架構(gòu)的代碼遷移。這條流水線以CUDA源代碼為起點(diǎn),目標(biāo)是在強(qiáng)化的RISC-V GPU架構(gòu)上直接運(yùn)行這些代碼。具體而言,流水線分為以下幾步:首先將CUDA源代碼轉(zhuǎn)換為NVVM中間表示(IR),接著把NVVM IR轉(zhuǎn)化為SPIR-V IR,隨后利用POCL將SPIR-V IR轉(zhuǎn)譯成針對(duì)RISC-V的二進(jìn)制文件,最終在增強(qiáng)后的RISC-V GPU上執(zhí)行這些二進(jìn)制文件。

寫在最后

盡管CUDA生態(tài)目前是英偉達(dá)GPU的最大優(yōu)勢(shì)之一,但從這些廠商的努力可以看到,其他GPU硬件也正在有越來(lái)越多的方法兼容CUDA,有機(jī)會(huì)從英偉達(dá)手中奪得一些市場(chǎng)份額。但AI領(lǐng)域的龍頭效應(yīng)越來(lái)越強(qiáng),能夠挑戰(zhàn)英偉達(dá)的GPU廠商可能機(jī)會(huì)越來(lái)越小了。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5707

    瀏覽量

    140395
  • 顯卡
    +關(guān)注

    關(guān)注

    17

    文章

    2523

    瀏覽量

    71714
  • CUDA
    +關(guān)注

    關(guān)注

    0

    文章

    128

    瀏覽量

    14545
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4115

    瀏覽量

    99603
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    堪稱史上最強(qiáng)推理芯片!英偉達(dá)發(fā)布 Rubin CPX,實(shí)現(xiàn)50倍ROI

    電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)近日,英偉達(dá)在AI infra峰會(huì)上發(fā)布專為大規(guī)模上下文推理設(shè)計(jì)的全新GPU系列Rubin CPX,性能堪稱炸裂! ? 英偉
    的頭像 發(fā)表于 09-11 08:25 ?1.1w次閱讀
    堪稱史上最強(qiáng)推理芯片!<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>發(fā)布 Rubin CPX,實(shí)現(xiàn)50倍ROI

    RV生態(tài)又一里程碑:英偉達(dá)官宣CUDA將兼容RISC-V架構(gòu)!

    Frans?Sijstermanns宣布一則重磅消息:英偉達(dá)要將CUDA移植到RISC-V架構(gòu)上。 ? 英偉
    的頭像 發(fā)表于 07-19 00:04 ?6807次閱讀
    RV生態(tài)又一里程碑:<b class='flag-5'>英偉</b>達(dá)官宣<b class='flag-5'>CUDA</b>將兼容RISC-V架構(gòu)!

    國(guó)產(chǎn)GPU再下一城,群起突圍英偉達(dá)+AMD

    上市。 ? 根據(jù)Jon Peddie Research的數(shù)據(jù),獨(dú)立GPU市場(chǎng)英偉達(dá)一家獨(dú)大,近年來(lái)持續(xù)維持超80%的市場(chǎng)份額,而AMD公司則占據(jù)剩余近20%的市場(chǎng)份額。自人工智能市場(chǎng)爆發(fā)式增長(zhǎng)以來(lái),
    的頭像 發(fā)表于 07-07 08:59 ?7518次閱讀
    國(guó)產(chǎn)GPU再下一城,群起突圍<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>+<b class='flag-5'>AMD</b>

    借助NVIDIA CUDA Tile IR后端推進(jìn)OpenAI Triton的GPU編程

    NVIDIA CUDA Tile 是基于 GPU 的編程模型,其設(shè)計(jì)目標(biāo)是為 NVIDIA Tensor Cores 提供可移植性,從而釋放 GPU 的極限性能。CUDA Tile 的一大優(yōu)勢(shì)是允許開(kāi)發(fā)者基于其構(gòu)建自定義的 DSL。
    的頭像 發(fā)表于 02-10 10:31 ?507次閱讀

    如何在NVIDIA CUDA Tile中編寫高性能矩陣乘法

    本博文是系列課程的一部分,旨在幫助開(kāi)發(fā)者學(xué)習(xí) NVIDIA CUDA Tile 編程,掌握構(gòu)建高性能 GPU 內(nèi)核的方法,并以矩陣乘法作為核心示例。
    的頭像 發(fā)表于 01-22 16:43 ?5276次閱讀
    如何在NVIDIA <b class='flag-5'>CUDA</b> Tile中編寫高性能矩陣乘法

    NVIDIA CUDA Tile的創(chuàng)新之處、工作原理以及使用方法

    NVIDIA CUDA 13.1 推出 NVIDIA CUDA Tile,這是自 2006 年 NVIDIA CUDA 平臺(tái)發(fā)明以來(lái),最大的一次技術(shù)進(jìn)步。這一令人振奮的創(chuàng)新引入了一套面向
    的頭像 發(fā)表于 12-24 10:17 ?632次閱讀
    NVIDIA <b class='flag-5'>CUDA</b> Tile的創(chuàng)新之處、工作原理以及使用方法

    在Python中借助NVIDIA CUDA Tile簡(jiǎn)化GPU編程

    NVIDIA CUDA 13.1 版本新增基于 Tile 的GPU 編程模式。它是自 CUDA 發(fā)明以來(lái) GPU 編程最核心的更新之一。借助 GPU tile kernels,可以用比 SIMT
    的頭像 發(fā)表于 12-13 10:12 ?1398次閱讀
    在Python中借助NVIDIA <b class='flag-5'>CUDA</b> Tile簡(jiǎn)化GPU編程

    NVIDIA CUDA 13.1版本的新增功能與改進(jìn)

    NVIDIA CUDA 13.1 是自 CUDA 二十年前發(fā)明以來(lái),規(guī)模最大、內(nèi)容最全面的一次更新。
    的頭像 發(fā)表于 12-13 10:08 ?2434次閱讀

    首款全國(guó)產(chǎn)訓(xùn)推一體AI芯片發(fā)布,兼容CUDA生態(tài)

    CUDA生態(tài)體系。該芯片支持從單機(jī)多卡到千卡級(jí)集群的靈活擴(kuò)展,效比達(dá)3.41 TFLOPS/W——在同等功
    的頭像 發(fā)表于 11-30 07:20 ?9747次閱讀
    首款全國(guó)產(chǎn)訓(xùn)推一體AI芯片發(fā)布,兼容<b class='flag-5'>CUDA</b>生態(tài)

    打破智能家居生態(tài)壁壘,樂(lè)鑫一站式Matter解決方案實(shí)現(xiàn)無(wú)縫互聯(lián)

    樂(lè)鑫科技作為CSA聯(lián)盟核心成員,提供一站式Matter解決方案,助力打破智能家居生態(tài)壁壘。方案覆蓋Wi-Fi、Thread等多種連接方式,支持ESP32全系列硬件平臺(tái),并配套提供ESP-Matter
    的頭像 發(fā)表于 11-06 15:19 ?1436次閱讀
    <b class='flag-5'>打破</b>智能家居生態(tài)<b class='flag-5'>壁壘</b>,樂(lè)鑫一站式Matter解決方案實(shí)現(xiàn)<b class='flag-5'>無(wú)縫</b>互聯(lián)

    打破智能家居壁壘,Matter協(xié)議引領(lǐng)無(wú)縫互聯(lián)新時(shí)代

    ,Matter旨在通過(guò)統(tǒng)一的“語(yǔ)言”打破智能家居生態(tài)壁壘。它建立在IP協(xié)議之上,可無(wú)縫兼容Wi-Fi、Thread與BLE(低功耗藍(lán)牙)等底層協(xié)議。在Matter生態(tài)中,BLE主要承擔(dān)
    的頭像 發(fā)表于 10-16 15:39 ?550次閱讀

    aicube的n卡gpu索引該如何添加?

    請(qǐng)問(wèn)有人知道aicube怎樣才能讀取n卡的gpu索引呢,我已經(jīng)安裝了cuda和cudnn,在全局的py里添加了torch,能夠調(diào)用gpu,當(dāng)還是只能看到默認(rèn)的gpu0,顯示不了gpu1,gpu0是集顯,訓(xùn)練速度太感人 你只有一塊英偉
    發(fā)表于 07-25 08:18

    讓太陽(yáng)逆變器“狂飆”的秘訣-耐達(dá)訊CAN轉(zhuǎn)EtherCAT網(wǎng)關(guān)

    導(dǎo)入ESI文件,組態(tài)比搭樂(lè)高還簡(jiǎn)單;未來(lái)兼容:支持TSN(時(shí)間敏感網(wǎng)絡(luò)),無(wú)縫對(duì)接智能電網(wǎng)。 總結(jié):耐達(dá)訊通信技術(shù)CAN轉(zhuǎn)EtherCAT網(wǎng)關(guān),堪稱新能源界的“協(xié)議外交官”。它用技術(shù)魔法打破
    發(fā)表于 07-18 15:22

    英偉達(dá)CUDA 已經(jīng)開(kāi)始移植到 RISC-V 架構(gòu)上

    ,著重介紹CUDA 移植到 RISC-V 架構(gòu)的相關(guān)工作和計(jì)劃,展現(xiàn)對(duì) RISC-V 架構(gòu)的高度重視與積極布局。 ? Frans Sijstermanns 首先回顧
    發(fā)表于 07-17 16:30 ?4005次閱讀