chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

試圖打破CUDA統(tǒng)治的SYCL

E4Life ? 來(lái)源:電子發(fā)燒友原創(chuàng) ? 作者:Leland ? 2022-06-28 09:48 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

各式各樣的加速器在當(dāng)下的計(jì)算架構(gòu)中越來(lái)越普遍,HPC、數(shù)據(jù)中心等高端應(yīng)用開(kāi)始追求更高的峰值性能,用到了專(zhuān)業(yè)GPU、AI加速器,而手機(jī)嵌入式系統(tǒng)開(kāi)始追求更高的能效,也在其SoC、MCU中加入一定的嵌入式加速硬件。但與此同時(shí),這樣復(fù)雜的多廠商、多架構(gòu)和多硬件生態(tài),為編程帶來(lái)了巨大的難題。但CUDA作為只面向英偉達(dá)GPU的封閉軟件生態(tài),其熱度卻水漲船高。
?
提及各大編程語(yǔ)言的論文數(shù)量/ 谷歌學(xué)術(shù)

在軟件開(kāi)發(fā)中,一個(gè)開(kāi)放的標(biāo)準(zhǔn)層就是開(kāi)發(fā)者產(chǎn)品方案接口規(guī)范,同樣的,處理器開(kāi)發(fā)商們可以使用基于開(kāi)放標(biāo)準(zhǔn)層的底層軟件驅(qū)動(dòng)創(chuàng)造解決方案。如此一來(lái)軟件開(kāi)發(fā)者們無(wú)需捆綁在特定的硬件方案上,硬件開(kāi)發(fā)者的硬件不僅可以兼顧自己維護(hù)的軟件,還能支持到更多的軟件開(kāi)發(fā)人員。而且在普及之后,開(kāi)發(fā)人員的技能更加具有普適性,他們可以方便地使用自己熟悉的開(kāi)發(fā)工具。

對(duì)使用開(kāi)放標(biāo)準(zhǔn)的軟硬件公司來(lái)說(shuō),此舉可以加快產(chǎn)品上市時(shí)間,減少長(zhǎng)期維護(hù)工作,而且在軟件方案廠商日益劇增的當(dāng)下,業(yè)界已經(jīng)普遍接受了開(kāi)放標(biāo)準(zhǔn),就像RISC-V一樣,英特爾、AMD甚至是英偉達(dá)也都對(duì)開(kāi)放標(biāo)準(zhǔn)的定義做出了貢獻(xiàn),對(duì)于一些初創(chuàng)企業(yè)來(lái)說(shuō)就更是如此了。

SYCL出世

從市場(chǎng)反饋來(lái)看,開(kāi)發(fā)者的需求很明顯了,他們想要一個(gè)標(biāo)準(zhǔn)的編程模型,擁有標(biāo)準(zhǔn)運(yùn)算庫(kù)、對(duì)Pytorch、Tensorflow等AI框架的支持、性能分析工具,以及對(duì)多個(gè)廠商不同硬件架構(gòu)的支持,而這些需求匯聚在一起,使得開(kāi)放標(biāo)準(zhǔn)聯(lián)盟Khronos Group聯(lián)合旗下成員打造出了SYCL這一編程語(yǔ)言。

SYCL作為跨越CPU、GPU、FPGA和AI加速器等多種架構(gòu)的一致性編程語(yǔ)言,每個(gè)架構(gòu)能單獨(dú)或整合編程。SYCL編程語(yǔ)言與其API擴(kuò)展能用于不同的開(kāi)發(fā)用例,比如負(fù)載加速或異構(gòu)計(jì)算應(yīng)用,將現(xiàn)有的C、C++或其他加速器語(yǔ)言代碼轉(zhuǎn)換成SYCL代碼。
?
SYCL的支持情況/ Khronos Group
在不同廠商的支持下,SYCL的實(shí)施方式有多種,他們?cè)黾恿藢?duì)OpenCL以外不同加速API后端的支持,比如Codeplay的ComputeCpp、英特爾的DPC++、AMD的hipSYCL以及Xilinx的triSYCL等。

英特爾的SYCL之路

英特爾對(duì)于SYCL的重視可以說(shuō)顯而易見(jiàn)了,自從宣布轉(zhuǎn)向XPU+oneAPI的路線(xiàn)之后,英特爾就已經(jīng)與SYCL深度綁定了。不僅微軟、谷歌等巨頭宣布支持oneAPI,英特爾也和中科院計(jì)算所在內(nèi)的大型研究所、國(guó)家實(shí)驗(yàn)室和大學(xué)合作成立了oneAPI卓越中心,借助他們的oneAPI開(kāi)源代碼,進(jìn)一步擴(kuò)展oneAPI產(chǎn)品與規(guī)范。

oneAPI的核心則是其編程語(yǔ)言DPC++,英特爾的DPC++可以說(shuō)是SYCL的超集,不僅包含了SYCL標(biāo)準(zhǔn),還包含一些功能擴(kuò)展,比如統(tǒng)一共享內(nèi)存等,不過(guò)目前其中不少擴(kuò)展也已經(jīng)并入了SYCL新版規(guī)范中。

不過(guò)SYCL遠(yuǎn)不僅是為了方便英特爾建設(shè)其跨架構(gòu)的軟件生態(tài),而是為了打破CUDA的統(tǒng)治,打造一個(gè)更加開(kāi)放的軟硬件生態(tài),這點(diǎn)從英特爾在oneAPI的開(kāi)發(fā)動(dòng)向就能看出。

此前英特爾對(duì)于CUDA并沒(méi)有任何動(dòng)作,反倒是其競(jìng)爭(zhēng)對(duì)手AMD推出了HIP,幫助開(kāi)發(fā)者將CUDA代碼移植至AMD平臺(tái)上,畢竟AMD還得發(fā)展GPU生態(tài)。但隨著英特爾的硬件路線(xiàn)已經(jīng)不單單是CPU,而是CPU、GPU、FPGA、IPU和AI加速器的多硬件異構(gòu)生態(tài),這時(shí)候打造一個(gè)CUDA之外的軟件生態(tài)是提升其產(chǎn)品競(jìng)爭(zhēng)力的必經(jīng)之路了。

為了更好實(shí)現(xiàn)對(duì)CUDA代碼的移植,英特爾推出了DPC++兼容性工具(DPCT),目前版本的DPCT已經(jīng)可以將90%到95%的CUDA代碼轉(zhuǎn)換成SYCL。不過(guò)這只是一個(gè)理想范圍,具體數(shù)值還是取決于代碼對(duì)應(yīng)的工作負(fù)載。對(duì)于簡(jiǎn)單的CUDA程序來(lái)說(shuō),完成DPC++的移植只需要對(duì)CUDA源文件運(yùn)行這一轉(zhuǎn)換工具即可,相對(duì)復(fù)雜的CUDA程序還是需要一定的手動(dòng)編程優(yōu)化。

今年6月,英特爾公布消息,決定收購(gòu)Codeplay公司。要說(shuō)對(duì)SYCL的研究,除了英特爾以外,最深入的當(dāng)屬Codeplay了,畢竟就連SYCL工作組的主席也是來(lái)自Codeplay的杰出工程師MichaelWong。Codeplay不僅提供了多種處理器上SYCL的支持,也支持將CUDA代碼移植為SYCL,同時(shí)保證SYCL代碼在英偉達(dá)GPU上的繼續(xù)運(yùn)行,還能調(diào)用一些CUDA庫(kù)。

Codeplay的方案支持覆蓋英特爾、AMD、英偉達(dá)的處理器,而且他們也開(kāi)始了對(duì)汽車(chē)ADAS(瑞薩R-Car)、邊緣計(jì)算設(shè)備(ImaginationPowerVR)與RISC-V處理器(晶心科技NX27V)的支持開(kāi)發(fā)工作。后三者恰好是SYCL當(dāng)前未曾開(kāi)拓的市場(chǎng),但卻是英特爾正在發(fā)力的三大市場(chǎng),加上Codeplay本身在HPC、AI上的軟件開(kāi)發(fā)實(shí)力,如此看來(lái),英特爾收購(gòu)Codeplay完全符合其戰(zhàn)略目標(biāo)。

結(jié)語(yǔ)

盡管SYCL的構(gòu)想是好的,其發(fā)展路線(xiàn)也是傾向于開(kāi)發(fā)者,但這并不代表著就一定能取代CUDA的位置,畢竟SYCL其實(shí)也才誕生沒(méi)多久,與CUDA、OpenCL或OpenMP相比生態(tài)發(fā)展還沒(méi)有成熟。再者就是統(tǒng)一各種硬件的編程并沒(méi)有那么簡(jiǎn)單,正如英偉達(dá)CEO黃仁勛曾經(jīng)提出的質(zhì)疑:時(shí)間會(huì)揭曉一個(gè)編程方法是否能兼容七種不同的處理器,至少歷史上從未出現(xiàn)過(guò)。
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5652

    瀏覽量

    139074
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    10276

    瀏覽量

    179404
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4047

    瀏覽量

    97756
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    RV生態(tài)又一里程碑:英偉達(dá)官宣CUDA將兼容RISC-V架構(gòu)!

    電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)英偉達(dá)生態(tài)護(hù)城河CUDA,從最初支持x86、Power?CPU架構(gòu),到2019年宣布支持Arm?CPU,不斷拓展在數(shù)據(jù)中心的應(yīng)用生態(tài)。 在2019年至今的六年
    的頭像 發(fā)表于 07-19 00:04 ?6195次閱讀
    RV生態(tài)又一里程碑:英偉達(dá)官宣<b class='flag-5'>CUDA</b>將兼容RISC-V架構(gòu)!

    在Python中借助NVIDIA CUDA Tile簡(jiǎn)化GPU編程

    NVIDIA CUDA 13.1 版本新增了基于 Tile 的GPU 編程模式。它是自 CUDA 發(fā)明以來(lái) GPU 編程最核心的更新之一。借助 GPU tile kernels,可以用比 SIMT
    的頭像 發(fā)表于 12-13 10:12 ?539次閱讀
    在Python中借助NVIDIA <b class='flag-5'>CUDA</b> Tile簡(jiǎn)化GPU編程

    NVIDIA CUDA 13.1版本的新增功能與改進(jìn)

    NVIDIA CUDA 13.1 是自 CUDA 二十年前發(fā)明以來(lái),規(guī)模最大、內(nèi)容最全面的一次更新。
    的頭像 發(fā)表于 12-13 10:08 ?1544次閱讀

    首款全國(guó)產(chǎn)訓(xùn)推一體AI芯片發(fā)布,兼容CUDA生態(tài)

    CUDA生態(tài)體系。該芯片支持從單機(jī)多卡到千卡級(jí)集群的靈活擴(kuò)展,能效比達(dá)3.41 TFLOPS/W——在同等功
    的頭像 發(fā)表于 11-30 07:20 ?8992次閱讀
    首款全國(guó)產(chǎn)訓(xùn)推一體AI芯片發(fā)布,兼容<b class='flag-5'>CUDA</b>生態(tài)

    傳統(tǒng)格局將被打破?這款MEMS加速度計(jì)如何實(shí)現(xiàn)石英級(jí)精度

    在慣性測(cè)量領(lǐng)域,高精度加速度計(jì)的市場(chǎng)格局似乎早已固化:石英加速度計(jì)憑借其卓越的穩(wěn)定性長(zhǎng)期占據(jù)著高端應(yīng)用的統(tǒng)治地位。然而,這一格局正在被悄然打破。ER-MA-6 MEMS加速度計(jì)的出現(xiàn),以其驚人的性能指標(biāo)向傳統(tǒng)發(fā)起挑戰(zhàn),讓業(yè)界不禁發(fā)問(wèn):MEMS技術(shù)真的能夠達(dá)到石英級(jí)精度嗎?
    的頭像 發(fā)表于 09-26 14:59 ?618次閱讀
    傳統(tǒng)格局將被<b class='flag-5'>打破</b>?這款MEMS加速度計(jì)如何實(shí)現(xiàn)石英級(jí)精度

    比亞迪仰望U9工程測(cè)試車(chē)打破全球電車(chē)極速紀(jì)錄

    近日,仰望汽車(chē)宣布,仰望U9工程測(cè)試車(chē)在德國(guó)ATP測(cè)試場(chǎng)實(shí)現(xiàn)472.41km/h的最高時(shí)速成績(jī),打破全球電車(chē)極速紀(jì)錄,此舉是中國(guó)自主品牌首次在該領(lǐng)域問(wèn)鼎世界。
    的頭像 發(fā)表于 08-27 10:32 ?882次閱讀

    英偉達(dá):CUDA 已經(jīng)開(kāi)始移植到 RISC-V 架構(gòu)上

    ,著重介紹了將 CUDA 移植到 RISC-V 架構(gòu)的相關(guān)工作和計(jì)劃,展現(xiàn)了對(duì) RISC-V 架構(gòu)的高度重視與積極布局。 ? Frans Sijstermanns 首先回顧了英偉達(dá)與 RISC-V 之間
    發(fā)表于 07-17 16:30 ?3849次閱讀

    進(jìn)迭時(shí)空同構(gòu)融合RISC-V AI CPU的Triton算子編譯器實(shí)踐

    Pytorch已能做到100%替換CUDA,國(guó)內(nèi)也有智源研究院主導(dǎo)的FlagGems通用算子庫(kù)試圖構(gòu)建起不依賴(lài)CUDA的AI計(jì)算生態(tài),截至今日,F(xiàn)lagGems已進(jìn)入Pyto
    的頭像 發(fā)表于 07-15 09:04 ?1403次閱讀
    進(jìn)迭時(shí)空同構(gòu)融合RISC-V AI CPU的Triton算子編譯器實(shí)踐

    Profinet轉(zhuǎn)CanOpen網(wǎng)關(guān),打破協(xié)議壁壘的關(guān)鍵技術(shù)

    兩個(gè)使用不同方言的專(zhuān)家需要實(shí)時(shí)協(xié)作,此時(shí)開(kāi)疆智能Profinet轉(zhuǎn)CanOpen網(wǎng)關(guān)便成為打破技術(shù)壁壘的關(guān)鍵樞紐。
    的頭像 發(fā)表于 05-10 14:14 ?381次閱讀
    Profinet轉(zhuǎn)CanOpen網(wǎng)關(guān),<b class='flag-5'>打破</b>協(xié)議壁壘的關(guān)鍵技術(shù)

    半導(dǎo)體存儲(chǔ)器測(cè)試圖形技術(shù)解析

    在半導(dǎo)體存儲(chǔ)器測(cè)試中,測(cè)試圖形(Test Pattern)是檢測(cè)故障、驗(yàn)證可靠性的核心工具。根據(jù)測(cè)試序列長(zhǎng)度與存儲(chǔ)單元數(shù)N的關(guān)系,測(cè)試圖形可分為N型、N2型和N3/?型三大類(lèi)。
    的頭像 發(fā)表于 05-07 09:33 ?1105次閱讀
    半導(dǎo)體存儲(chǔ)器測(cè)<b class='flag-5'>試圖</b>形技術(shù)解析

    使用VirtualLab Fusion中分布式計(jì)算的AR波導(dǎo)測(cè)試圖像模擬

    | 摘要 在這個(gè)用例中,一個(gè)完整的FOV測(cè)試圖像(在x和y方向分別采樣101個(gè)角度,總共有10,201個(gè)角度)通過(guò)波導(dǎo)設(shè)備傳播。一個(gè)具有數(shù)百個(gè)嚴(yán)格光柵評(píng)估的基本模擬大約需要7秒。這導(dǎo)致整個(gè)圖像的估計(jì)
    發(fā)表于 04-10 08:48

    EAM 與 MES 深度融合:智能工廠的 &amp;quot;雙引擎&amp;quot; 如何打破生產(chǎn)瓶頸?

    中國(guó)制造業(yè)正經(jīng)歷數(shù)字化轉(zhuǎn)型陣痛,設(shè)備聯(lián)網(wǎng)率雖高但產(chǎn)能利用率低,導(dǎo)致設(shè)備維修記錄與生產(chǎn)排程數(shù)據(jù)割裂,隱性損失嚴(yán)重。企業(yè)需要進(jìn)行雙系統(tǒng)融合,打破虛實(shí)界限,構(gòu)建數(shù)字孿生體,實(shí)現(xiàn)設(shè)備綜合效率的提升。
    的頭像 發(fā)表于 04-01 10:13 ?573次閱讀
    EAM 與 MES 深度融合:智能工廠的 &amp;quot;雙引擎&amp;quot; 如何<b class='flag-5'>打破</b>生產(chǎn)瓶頸?

    使用NVIDIA CUDA-X庫(kù)加速科學(xué)和工程發(fā)展

    NVIDIA GTC 全球 AI 大會(huì)上宣布,開(kāi)發(fā)者現(xiàn)在可以通過(guò) CUDA-X 與新一代超級(jí)芯片架構(gòu)的協(xié)同,實(shí)現(xiàn) CPU 和 GPU 資源間深度自動(dòng)化整合與調(diào)度,相較于傳統(tǒng)加速計(jì)算架構(gòu),該技術(shù)可使計(jì)算工程工具運(yùn)行速度提升至原來(lái)的 11 倍,計(jì)算規(guī)模增加至 5 倍。
    的頭像 發(fā)表于 03-25 15:11 ?1233次閱讀

    DLPC230S-Q1固件燒錄進(jìn)去后,開(kāi)機(jī)畫(huà)面或者內(nèi)部測(cè)試圖會(huì)一直閃并且在在黑白顛倒,怎么解決?

    固件燒錄進(jìn)去后,開(kāi)機(jī)畫(huà)面或者內(nèi)部測(cè)試圖會(huì)一直閃并且在在黑白顛倒,比如第一張顯示棋盤(pán)格,第二張會(huì)將棋盤(pán)格中黑白顛倒去顯示。Spread Spectrum Enable 設(shè)置為 高和設(shè)置為低時(shí),閃爍的頻率不一樣;
    發(fā)表于 02-20 07:24

    DLPLCRC410EVM通電后,加載圖片,無(wú)論是全黑還是別的測(cè)試圖DMD總有一半畫(huà)面呈現(xiàn)豎條紋結(jié)構(gòu)背景,如何解決?

    通電后,加載圖片,無(wú)論是全黑還是別的測(cè)試圖,DMD總有一半畫(huà)面呈現(xiàn)豎條紋結(jié)構(gòu)背景。請(qǐng)問(wèn)該如何解決?
    發(fā)表于 02-17 07:45