chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

打破英偉達CUDA壁壘?AMD顯卡現(xiàn)在也能無縫適配CUDA了

Hobby觀察 ? 來源:電子發(fā)燒友 ? 作者:梁浩斌 ? 2024-07-19 00:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文/梁浩斌)一直以來,圍繞CUDA打造的軟件生態(tài),是英偉達GPU領(lǐng)域最大的護城河,尤其是隨著目前AI領(lǐng)域的發(fā)展加速,市場火爆,英偉達GPU+CUDA的開發(fā)生態(tài)則更加穩(wěn)固,AMD英特爾等廠商雖然在努力追趕,但目前還未能看到有威脅英偉達地位的可能。

最近一家英國公司Spectral Compute推出了一款方案,可以為AMD的GPU原生編譯CUDA源代碼,目前正在RNDA2、RDNA3上進行規(guī)模測試。這或許可以打破CUDA與英偉達GPU的生態(tài)壁壘?


SCALE編譯器

Spectral Compute據(jù)稱花了7年時間開發(fā)SCALE,SCALE不依賴英偉達的代碼,而是通過一些開源LLVM組件等,建立了其CUDA兼容的工具鏈,讓SCALE在多個平臺之間能高度兼容。

其實在以往也有一些其他GPU硬件兼容CUDA的方式,比如AMD支持的ZLUDA推出的開源移植項目,通過重新編譯二進制代碼,就能夠讓CUDA庫在AMD自家的ROCm上運行,令A(yù)MD GPU適配CUDA生態(tài)。

但SCALE的特性在于,可以避免代碼移植的步驟,開發(fā)人員可以使用單一版本的代碼庫,因為SCALE本身與CUDA的源代碼兼容,這大大提高了可用性。

Spectral Compute的CEO Michael Sondergaard表示:我們相信,只需要編寫一次代碼,就可以在任何硬件平臺上運行它,對于CPU代碼來說,這已經(jīng)實現(xiàn)很多年了,那為什么GPU不行呢?我們著手通過彌合主流的CUDA編程語言和其他GPU硬件供應(yīng)商之間的兼容性差距,來直接解決這個問題。

Michael 還提到:“應(yīng)該構(gòu)建一個圍繞GPU的開源生態(tài)系統(tǒng),類似目前CPU所享有的生態(tài)環(huán)境,同時確保不同平臺間的互聯(lián)互通?!彼J為,通過SCALE可以彌合CUDA與其他硬件供應(yīng)商之間的兼容性鴻溝,從而打破市場上存在的壁壘。

據(jù)介紹,SCALE是一種通用并行GPU工具包,其功能與英偉達的CUDA工具包相仿,它能夠在編譯CUDA代碼的同時,為非英偉達 GPU生成相應(yīng)的二進制文件,這樣就徹底避免了對翻譯層的依賴。

目前,SCALE已經(jīng)在多種軟件中成功運行,比如Blender、Llama-cpp、XGboost、FAISS、GOMC、STDGPU、Hashcat和NVIDIA Thrust等專業(yè)軟件,這些軟件已經(jīng)可以在RDNA2和RDNA3的AMD GPU上正常使用CUDA。

不過SCALE本身不是開源的,但用戶可以通過免費的軟件許可使用這個功能,這或許是為了規(guī)避英偉達針對CUDA兼容而出臺的EULA條款。

其他廠商兼容CUDA的努力

市場上其實并不缺乏CUDA的挑戰(zhàn)者,包括AMD的ROCm,開放標準聯(lián)盟Khronos Group聯(lián)合旗下成員打造出的SYCL編程語言等,而英特爾也與SYCL深度綁定,希望打破CUDA的統(tǒng)治。

當(dāng)然,對于AMD和英特爾這樣的巨頭而言,他們有資本去嘗試構(gòu)建一個新的生態(tài),但對于更多的初創(chuàng)公司和中小規(guī)模公司而言,兼容就是成本最低的路線。

比如國內(nèi)的GPU初創(chuàng)公司摩爾線程,基于MUSA的統(tǒng)一架構(gòu)推出了多款GPU產(chǎn)品,并打造了軟件開發(fā)平臺,包括AI開發(fā)平臺、MUSA SDK、MT Smart Media和MTVerse XR等。

而這套生態(tài)架構(gòu)可以充分兼容現(xiàn)有的軟件生態(tài),能借助MUSIFY工具實現(xiàn)代碼零成本遷移到MUSA平臺,也包括對CUDA生態(tài)的兼容。

在2021年的時候,在一個名為Vortex的RISC-V GPU項目上,也實現(xiàn)了對CUDA軟件工具包的支持。

在這個項目中,研究人員設(shè)計并實現(xiàn)了一條流水線,旨在全面支持從CUDA到增強版RISC-V GPU架構(gòu)的代碼遷移。這條流水線以CUDA源代碼為起點,目標是在強化的RISC-V GPU架構(gòu)上直接運行這些代碼。具體而言,流水線分為以下幾步:首先將CUDA源代碼轉(zhuǎn)換為NVVM中間表示(IR),接著把NVVM IR轉(zhuǎn)化為SPIR-V IR,隨后利用POCL將SPIR-V IR轉(zhuǎn)譯成針對RISC-V的二進制文件,最終在增強后的RISC-V GPU上執(zhí)行這些二進制文件。

寫在最后

盡管CUDA生態(tài)目前是英偉達GPU的最大優(yōu)勢之一,但從這些廠商的努力可以看到,其他GPU硬件也正在有越來越多的方法兼容CUDA,有機會從英偉達手中奪得一些市場份額。但AI領(lǐng)域的龍頭效應(yīng)越來越強,能夠挑戰(zhàn)英偉達的GPU廠商可能機會越來越小了。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5684

    瀏覽量

    139976
  • 顯卡
    +關(guān)注

    關(guān)注

    16

    文章

    2520

    瀏覽量

    71509
  • CUDA
    +關(guān)注

    關(guān)注

    0

    文章

    127

    瀏覽量

    14475
  • 英偉達
    +關(guān)注

    關(guān)注

    23

    文章

    4087

    瀏覽量

    99194
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    RV生態(tài)又一里程碑:英偉達官宣CUDA將兼容RISC-V架構(gòu)!

    Frans?Sijstermanns宣布一則重磅消息:英偉要將CUDA移植到RISC-V架構(gòu)上。 ? 英偉
    的頭像 發(fā)表于 07-19 00:04 ?6595次閱讀
    RV生態(tài)又一里程碑:<b class='flag-5'>英偉</b>達官宣<b class='flag-5'>CUDA</b>將兼容RISC-V架構(gòu)!

    國產(chǎn)GPU再下一城,群起突圍英偉+AMD

    上市。 ? 根據(jù)Jon Peddie Research的數(shù)據(jù),獨立GPU市場英偉一家獨大,近年來持續(xù)維持超80%的市場份額,而AMD公司則占據(jù)剩余近20%的市場份額。自人工智能市場爆發(fā)式增長以來,
    的頭像 發(fā)表于 07-07 08:59 ?7259次閱讀
    國產(chǎn)GPU再下一城,群起突圍<b class='flag-5'>英偉</b><b class='flag-5'>達</b>+<b class='flag-5'>AMD</b>

    借助NVIDIA CUDA Tile IR后端推進OpenAI Triton的GPU編程

    NVIDIA CUDA Tile 是基于 GPU 的編程模型,其設(shè)計目標是為 NVIDIA Tensor Cores 提供可移植性,從而釋放 GPU 的極限性能。CUDA Tile 的一大優(yōu)勢是允許開發(fā)者基于其構(gòu)建自定義的 DSL。
    的頭像 發(fā)表于 02-10 10:31 ?245次閱讀

    如何在NVIDIA CUDA Tile中編寫高性能矩陣乘法

    本博文是系列課程的一部分,旨在幫助開發(fā)者學(xué)習(xí) NVIDIA CUDA Tile 編程,掌握構(gòu)建高性能 GPU 內(nèi)核的方法,并以矩陣乘法作為核心示例。
    的頭像 發(fā)表于 01-22 16:43 ?4833次閱讀
    如何在NVIDIA <b class='flag-5'>CUDA</b> Tile中編寫高性能矩陣乘法

    NVIDIA CUDA Tile的創(chuàng)新之處、工作原理以及使用方法

    NVIDIA CUDA 13.1 推出 NVIDIA CUDA Tile,這是自 2006 年 NVIDIA CUDA 平臺發(fā)明以來,最大的一次技術(shù)進步。這一令人振奮的創(chuàng)新引入了一套面向
    的頭像 發(fā)表于 12-24 10:17 ?474次閱讀
    NVIDIA <b class='flag-5'>CUDA</b> Tile的創(chuàng)新之處、工作原理以及使用方法

    在Python中借助NVIDIA CUDA Tile簡化GPU編程

    NVIDIA CUDA 13.1 版本新增基于 Tile 的GPU 編程模式。它是自 CUDA 發(fā)明以來 GPU 編程最核心的更新之一。借助 GPU tile kernels,可以用比 SIMT
    的頭像 發(fā)表于 12-13 10:12 ?1203次閱讀
    在Python中借助NVIDIA <b class='flag-5'>CUDA</b> Tile簡化GPU編程

    NVIDIA CUDA 13.1版本的新增功能與改進

    NVIDIA CUDA 13.1 是自 CUDA 二十年前發(fā)明以來,規(guī)模最大、內(nèi)容最全面的一次更新。
    的頭像 發(fā)表于 12-13 10:08 ?2209次閱讀

    打破智能家居生態(tài)壁壘,樂鑫一站式Matter解決方案實現(xiàn)無縫互聯(lián)

    樂鑫科技作為CSA聯(lián)盟核心成員,提供一站式Matter解決方案,助力打破智能家居生態(tài)壁壘。方案覆蓋Wi-Fi、Thread等多種連接方式,支持ESP32全系列硬件平臺,并配套提供ESP-Matter
    的頭像 發(fā)表于 11-06 15:19 ?1273次閱讀
    <b class='flag-5'>打破</b>智能家居生態(tài)<b class='flag-5'>壁壘</b>,樂鑫一站式Matter解決方案實現(xiàn)<b class='flag-5'>無縫</b>互聯(lián)

    aicube的n卡gpu索引該如何添加?

    請問有人知道aicube怎樣才能讀取n卡的gpu索引呢,我已經(jīng)安裝了cuda和cudnn,在全局的py里添加了torch,能夠調(diào)用gpu,當(dāng)還是只能看到默認的gpu0,顯示不了gpu1,gpu0是集顯,訓(xùn)練速度太感人 你只有一塊英偉
    發(fā)表于 07-25 08:18

    讓太陽逆變器“狂飆”的秘訣-耐訊CAN轉(zhuǎn)EtherCAT網(wǎng)關(guān)

    導(dǎo)入ESI文件,組態(tài)比搭樂高還簡單;未來兼容:支持TSN(時間敏感網(wǎng)絡(luò)),無縫對接智能電網(wǎng)。 總結(jié):耐訊通信技術(shù)CAN轉(zhuǎn)EtherCAT網(wǎng)關(guān),堪稱新能源界的“協(xié)議外交官”。它用技術(shù)魔法打破
    發(fā)表于 07-18 15:22

    英偉CUDA 已經(jīng)開始移植到 RISC-V 架構(gòu)上

    ,著重介紹CUDA 移植到 RISC-V 架構(gòu)的相關(guān)工作和計劃,展現(xiàn)對 RISC-V 架構(gòu)的高度重視與積極布局。 ? Frans Sijstermanns 首先回顧
    發(fā)表于 07-17 16:30 ?3959次閱讀

    突破工業(yè)接口壁壘!ARK(方舟微)DMZ42C10S讓PLC\\\"萬適配\\\"成為現(xiàn)實!

    突破工業(yè)接口壁壘!ARK(方舟微)DMZ42C10S讓PLC\"萬適配\"成為現(xiàn)實!
    發(fā)表于 03-27 15:20

    使用NVIDIA CUDA-X庫加速科學(xué)和工程發(fā)展

    NVIDIA GTC 全球 AI 大會上宣布,開發(fā)者現(xiàn)在可以通過 CUDA-X 與新一代超級芯片架構(gòu)的協(xié)同,實現(xiàn) CPU 和 GPU 資源間深度自動化整合與調(diào)度,相較于傳統(tǒng)加速計算架構(gòu),該技術(shù)可使計算工程工具運行速度提升至原來的 11 倍,計算規(guī)模增加至 5 倍。
    的頭像 發(fā)表于 03-25 15:11 ?1537次閱讀

    新思科技攜手英偉加速芯片設(shè)計,提升芯片電子設(shè)計自動化效率

    宣布在英偉 Grace Blackwell 平臺上實現(xiàn)高達 30 倍的預(yù)期性能提升,加速下一代半導(dǎo)體的電路仿真 ? 摘要: 在今年GTC主題演講中,新思科技作為生態(tài)系統(tǒng)的一部分,展示全棧EDA
    發(fā)表于 03-19 17:59 ?497次閱讀

    新思科技亮相英偉GTC 2025大會

    為了實現(xiàn)這一速度提升,新思科技在GTC全球AI大會上宣布,正在使用英偉 CUDA-X庫優(yōu)化其下一代半導(dǎo)體開發(fā)解決方案。公司還在擴大對英偉
    的頭像 發(fā)表于 03-19 17:53 ?1303次閱讀