電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))今年開年以來,相信大家已經(jīng)接受了一波各種國(guó)產(chǎn)GPU新品的消息轟炸了,尤其是GPGPU(通用圖形處理單元),比如天數(shù)智芯的天垓、壁仞科技的BR100系列等等,這也意味著在通用計(jì)算上,國(guó)內(nèi)GPU的硬件生態(tài)終于走上了快車道。
然而去年9月份,RISC-V向量擴(kuò)展(RVV)1.0的正式推出讓RISC-V開始在通用計(jì)算和AI領(lǐng)域有了更大發(fā)揮空間,比如GCC和LLVM這兩大著名編譯器都已經(jīng)支持RVV匯編等。RISC-V的GPU也開始因此冒頭,甚至不少都是開源的,比如去年的Vortex等。
清華“承影”GPU
今年的RISC-V中國(guó)峰會(huì)上,清華大學(xué)集成電路學(xué)院何虎副教授團(tuán)隊(duì)發(fā)布了采用Chisel語(yǔ)言基于RISC-V 的開源GPGPU實(shí)現(xiàn)方案,名為“承影”(Ventus),同時(shí)還給出了映射方案、指令集和微架構(gòu)的實(shí)現(xiàn)。
作為開始嶄露頭角的敏捷硬件設(shè)計(jì)語(yǔ)言,Chisel在RISC-V處理器的設(shè)計(jì)中變得愈發(fā)常見,另一開源RISC-V處理器,中科院的香山同樣采用了這一語(yǔ)言。這是因?yàn)槠溟_發(fā)效率高過傳統(tǒng)的Verilog,承影開發(fā)團(tuán)隊(duì)表示,利用Chisel高效參數(shù)化的特點(diǎn)可以生成不同規(guī)模的硬件單元,且應(yīng)用無需更改代碼仍能運(yùn)行。
承影選擇了將RISC-V向量擴(kuò)展與SIMT架構(gòu)結(jié)合的方式,RISC-V向量擴(kuò)展可以適應(yīng)不同規(guī)模而硬件,而無需進(jìn)行重新編譯。而單指令多線程的SIMT作為當(dāng)下幾乎所有GPU都選擇的架構(gòu),在編程靈活性上要更高一些。

承影的微架構(gòu) / 清華大學(xué)集成電路學(xué)院
承影開發(fā)團(tuán)隊(duì)的設(shè)想是,讓RVV GPGPU與RISC-V CPU充分結(jié)合,完成統(tǒng)一ISA下的SoC系統(tǒng),能讓編譯器在任務(wù)劃分和協(xié)同上探索更多可能。與此同時(shí),他們也想借助開源RISC-V、開源硬件來打造自主可控的SoC系統(tǒng)。
承影已經(jīng)在Xilinx VCU128 FPGA上完成了驗(yàn)證,他們開發(fā)了AXI驅(qū)動(dòng)程序,并用MicroBlaze作為Host進(jìn)行任務(wù)發(fā)射,用PL搭建“承影”GPGPU進(jìn)行計(jì)算,通過DDR共享內(nèi)存。按照4 warp 8 thread的配置可部署160個(gè)核心,核心頻率為100MHz,理論峰值算力為32Gflops,可同時(shí)駐留1280個(gè)線程。承影開發(fā)團(tuán)隊(duì)預(yù)計(jì)中芯國(guó)際40nm工藝下,頻率至少也能做到350MHz。
承影GPU不僅本身開源,也同樣受益于開源。在承影的Github界面可以看到,其CTA調(diào)度器是基于另一大開源GPU項(xiàng)目,MIAOW的超線程調(diào)度器,L2緩存設(shè)計(jì)和香山處理器一樣,參考了SiFive的Block InclusiveCache,乘法器和FPU也參考啟發(fā)自香山的設(shè)計(jì)。這也就是RISC-V的開源魅力,在設(shè)計(jì)過程中不僅可以汲取來自其他ISA過去的設(shè)計(jì)經(jīng)驗(yàn),也能讓整個(gè)開源社區(qū)參與到后續(xù)的開發(fā)完善工作中來。
根據(jù)承影開發(fā)團(tuán)隊(duì)的介紹,他們的后續(xù)工作包括工具鏈的開發(fā),比如調(diào)試和UVM驗(yàn)證工具、RVV自動(dòng)向量化工具,至于CUDA支持,他們打算走CUDA-LLVM-RVV這條路線。后續(xù)他們也計(jì)劃引入一些架構(gòu)上的改進(jìn),比如借鑒向量處理器的思路,以及現(xiàn)有GPGPU的架構(gòu)。內(nèi)存方面會(huì)考慮RVWMO與GPGPU的結(jié)合。他們也考慮加入圖形功能,Tensor core以及transformer等單元。當(dāng)然了,以上所說到的工作量都不少,還是需要開源社區(qū)的積極參與才能完成。
對(duì)RISC-V GPGPU未來的展望
盡管GPGPU作為通用計(jì)算的一種硬件形式,目前已經(jīng)在AI、HPC中開始普及,但要說GPU的各種角色定位中,效率最高、計(jì)算量最大、內(nèi)存占用最多的應(yīng)用之一還是圖形渲染。鑒于目前圖形渲染技術(shù)壁壘其實(shí)更高,RISC-V在這塊還有很長(zhǎng)的一段路要走。
天數(shù)智芯產(chǎn)品副總裁鄒翾也在會(huì)上指出,當(dāng)下AI與圖形在云端融合已經(jīng)成為必然的趨勢(shì),非GPU的架構(gòu)很難響應(yīng)兩者在云端融合的挑戰(zhàn),而通用GPU不是像英偉達(dá)一樣已經(jīng)具備圖形功能,就是可以追加圖形功能。
具體實(shí)現(xiàn)方式也各有不同,就拿佐治亞理工學(xué)院的開源RISC-V GPGPU Vortex為例,今年的Hot Chips 34上,他們就展示了如何將GPGPU上的一部分圖形硬件區(qū)塊在軟件上實(shí)現(xiàn),從而節(jié)省處理器面積。雖然他們?cè)诟鞣N3D Demo上驗(yàn)證出的平均幀數(shù)只有10fps左右,但對(duì)于在Intel Arria 10 FPGA上實(shí)現(xiàn)的一個(gè)8核128線程的GPGPU來說,已經(jīng)是不錯(cuò)的成績(jī)了。
至于軟件生態(tài)支持,建立一個(gè)像CUDA一樣流行的生態(tài)目前看來明顯不現(xiàn)實(shí),所以相關(guān)的移植工作依然被列為重心,比如上面提到的Vortex,就在開展相關(guān)的移植工作,將CUDA轉(zhuǎn)換成OpenCL。除了他們以外,還有不少公司也在開展相關(guān)的工作,比如被英特爾收購(gòu)的Codeplal,就在為RISC-V處理器開發(fā)對(duì)OpenCL與SYCL的支持,而他們也在開展CUDA移植SYCL相關(guān)開發(fā)工作。
賽昉科技也基于LLVM開發(fā)了RISC-V GPGPU編譯器,實(shí)現(xiàn)了CUDA程序到RISC-V GPGPU指令的生成,他們還開發(fā)了相應(yīng)的runtime庫(kù),實(shí)現(xiàn)了設(shè)備管理、內(nèi)核下發(fā)、數(shù)據(jù)傳輸?shù)纫幌盗泄δ堋Y悤P科技算法高級(jí)經(jīng)理夏品正在本屆RISC-V中國(guó)峰會(huì)上表示,基于這一套編譯器和runtime,一部分CUDA工程已經(jīng)可以運(yùn)行在RISC-V GPGPU上,并能通過功能測(cè)試。

VisionFive 2單板計(jì)算機(jī) / 賽昉科技
RISC-V GPU真正落地到產(chǎn)品上的還是太少了,就拿本屆中國(guó)峰會(huì)上發(fā)布的賽昉科技VisionFive 2單板計(jì)算機(jī)來說,相較于上一代昉·星光來說雖然增加了GPU,但依然還是用的Imagination的方案,同樣的還有RIOS Lab的PicoRio、YADRO的EL Construct T等。這樣的異構(gòu)設(shè)計(jì)并沒有問題,可RISC-V還在GPU上的投入還是不夠,要想繞過巨頭們積累的GPU專利,離真正打造一個(gè)完全基于該架構(gòu)下的SoC產(chǎn)品還有一定的距離。
然而去年9月份,RISC-V向量擴(kuò)展(RVV)1.0的正式推出讓RISC-V開始在通用計(jì)算和AI領(lǐng)域有了更大發(fā)揮空間,比如GCC和LLVM這兩大著名編譯器都已經(jīng)支持RVV匯編等。RISC-V的GPU也開始因此冒頭,甚至不少都是開源的,比如去年的Vortex等。
清華“承影”GPU
今年的RISC-V中國(guó)峰會(huì)上,清華大學(xué)集成電路學(xué)院何虎副教授團(tuán)隊(duì)發(fā)布了采用Chisel語(yǔ)言基于RISC-V 的開源GPGPU實(shí)現(xiàn)方案,名為“承影”(Ventus),同時(shí)還給出了映射方案、指令集和微架構(gòu)的實(shí)現(xiàn)。
作為開始嶄露頭角的敏捷硬件設(shè)計(jì)語(yǔ)言,Chisel在RISC-V處理器的設(shè)計(jì)中變得愈發(fā)常見,另一開源RISC-V處理器,中科院的香山同樣采用了這一語(yǔ)言。這是因?yàn)槠溟_發(fā)效率高過傳統(tǒng)的Verilog,承影開發(fā)團(tuán)隊(duì)表示,利用Chisel高效參數(shù)化的特點(diǎn)可以生成不同規(guī)模的硬件單元,且應(yīng)用無需更改代碼仍能運(yùn)行。
承影選擇了將RISC-V向量擴(kuò)展與SIMT架構(gòu)結(jié)合的方式,RISC-V向量擴(kuò)展可以適應(yīng)不同規(guī)模而硬件,而無需進(jìn)行重新編譯。而單指令多線程的SIMT作為當(dāng)下幾乎所有GPU都選擇的架構(gòu),在編程靈活性上要更高一些。

承影的微架構(gòu) / 清華大學(xué)集成電路學(xué)院
承影開發(fā)團(tuán)隊(duì)的設(shè)想是,讓RVV GPGPU與RISC-V CPU充分結(jié)合,完成統(tǒng)一ISA下的SoC系統(tǒng),能讓編譯器在任務(wù)劃分和協(xié)同上探索更多可能。與此同時(shí),他們也想借助開源RISC-V、開源硬件來打造自主可控的SoC系統(tǒng)。
承影已經(jīng)在Xilinx VCU128 FPGA上完成了驗(yàn)證,他們開發(fā)了AXI驅(qū)動(dòng)程序,并用MicroBlaze作為Host進(jìn)行任務(wù)發(fā)射,用PL搭建“承影”GPGPU進(jìn)行計(jì)算,通過DDR共享內(nèi)存。按照4 warp 8 thread的配置可部署160個(gè)核心,核心頻率為100MHz,理論峰值算力為32Gflops,可同時(shí)駐留1280個(gè)線程。承影開發(fā)團(tuán)隊(duì)預(yù)計(jì)中芯國(guó)際40nm工藝下,頻率至少也能做到350MHz。
承影GPU不僅本身開源,也同樣受益于開源。在承影的Github界面可以看到,其CTA調(diào)度器是基于另一大開源GPU項(xiàng)目,MIAOW的超線程調(diào)度器,L2緩存設(shè)計(jì)和香山處理器一樣,參考了SiFive的Block InclusiveCache,乘法器和FPU也參考啟發(fā)自香山的設(shè)計(jì)。這也就是RISC-V的開源魅力,在設(shè)計(jì)過程中不僅可以汲取來自其他ISA過去的設(shè)計(jì)經(jīng)驗(yàn),也能讓整個(gè)開源社區(qū)參與到后續(xù)的開發(fā)完善工作中來。
根據(jù)承影開發(fā)團(tuán)隊(duì)的介紹,他們的后續(xù)工作包括工具鏈的開發(fā),比如調(diào)試和UVM驗(yàn)證工具、RVV自動(dòng)向量化工具,至于CUDA支持,他們打算走CUDA-LLVM-RVV這條路線。后續(xù)他們也計(jì)劃引入一些架構(gòu)上的改進(jìn),比如借鑒向量處理器的思路,以及現(xiàn)有GPGPU的架構(gòu)。內(nèi)存方面會(huì)考慮RVWMO與GPGPU的結(jié)合。他們也考慮加入圖形功能,Tensor core以及transformer等單元。當(dāng)然了,以上所說到的工作量都不少,還是需要開源社區(qū)的積極參與才能完成。
對(duì)RISC-V GPGPU未來的展望
盡管GPGPU作為通用計(jì)算的一種硬件形式,目前已經(jīng)在AI、HPC中開始普及,但要說GPU的各種角色定位中,效率最高、計(jì)算量最大、內(nèi)存占用最多的應(yīng)用之一還是圖形渲染。鑒于目前圖形渲染技術(shù)壁壘其實(shí)更高,RISC-V在這塊還有很長(zhǎng)的一段路要走。
天數(shù)智芯產(chǎn)品副總裁鄒翾也在會(huì)上指出,當(dāng)下AI與圖形在云端融合已經(jīng)成為必然的趨勢(shì),非GPU的架構(gòu)很難響應(yīng)兩者在云端融合的挑戰(zhàn),而通用GPU不是像英偉達(dá)一樣已經(jīng)具備圖形功能,就是可以追加圖形功能。
具體實(shí)現(xiàn)方式也各有不同,就拿佐治亞理工學(xué)院的開源RISC-V GPGPU Vortex為例,今年的Hot Chips 34上,他們就展示了如何將GPGPU上的一部分圖形硬件區(qū)塊在軟件上實(shí)現(xiàn),從而節(jié)省處理器面積。雖然他們?cè)诟鞣N3D Demo上驗(yàn)證出的平均幀數(shù)只有10fps左右,但對(duì)于在Intel Arria 10 FPGA上實(shí)現(xiàn)的一個(gè)8核128線程的GPGPU來說,已經(jīng)是不錯(cuò)的成績(jī)了。
至于軟件生態(tài)支持,建立一個(gè)像CUDA一樣流行的生態(tài)目前看來明顯不現(xiàn)實(shí),所以相關(guān)的移植工作依然被列為重心,比如上面提到的Vortex,就在開展相關(guān)的移植工作,將CUDA轉(zhuǎn)換成OpenCL。除了他們以外,還有不少公司也在開展相關(guān)的工作,比如被英特爾收購(gòu)的Codeplal,就在為RISC-V處理器開發(fā)對(duì)OpenCL與SYCL的支持,而他們也在開展CUDA移植SYCL相關(guān)開發(fā)工作。
賽昉科技也基于LLVM開發(fā)了RISC-V GPGPU編譯器,實(shí)現(xiàn)了CUDA程序到RISC-V GPGPU指令的生成,他們還開發(fā)了相應(yīng)的runtime庫(kù),實(shí)現(xiàn)了設(shè)備管理、內(nèi)核下發(fā)、數(shù)據(jù)傳輸?shù)纫幌盗泄δ堋Y悤P科技算法高級(jí)經(jīng)理夏品正在本屆RISC-V中國(guó)峰會(huì)上表示,基于這一套編譯器和runtime,一部分CUDA工程已經(jīng)可以運(yùn)行在RISC-V GPGPU上,并能通過功能測(cè)試。

VisionFive 2單板計(jì)算機(jī) / 賽昉科技
RISC-V GPU真正落地到產(chǎn)品上的還是太少了,就拿本屆中國(guó)峰會(huì)上發(fā)布的賽昉科技VisionFive 2單板計(jì)算機(jī)來說,相較于上一代昉·星光來說雖然增加了GPU,但依然還是用的Imagination的方案,同樣的還有RIOS Lab的PicoRio、YADRO的EL Construct T等。這樣的異構(gòu)設(shè)計(jì)并沒有問題,可RISC-V還在GPU上的投入還是不夠,要想繞過巨頭們積累的GPU專利,離真正打造一個(gè)完全基于該架構(gòu)下的SoC產(chǎn)品還有一定的距離。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
-
gpu
+關(guān)注
關(guān)注
28文章
4949瀏覽量
131277 -
RISC-V
+關(guān)注
關(guān)注
46文章
2574瀏覽量
48855
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
熱點(diǎn)推薦
Imagination亮相2025RISC-V中國(guó)峰會(huì),GPU?與?RISC-V?協(xié)同賦能汽車智能化
架構(gòu)師章政分享了當(dāng)前RISC-V在圖形處理方面面臨的挑戰(zhàn),并介紹了Imagination在構(gòu)建開源GPU軟件棧上的新進(jìn)展;同時(shí),Imagination市場(chǎng)拓展資深經(jīng)理

FPGA與RISC-V淺談
RISC-V處理器的SoC數(shù)量在2024年約為20億顆,到2031年有望突破200億顆。 RISC-V的概念與優(yōu)勢(shì) RISC-V是一種全新的開源
發(fā)表于 04-11 13:53
?358次閱讀

SOPHGO RISC-V SoC Linux Kernel 社區(qū)郵件列表建立,歡迎加入開源社區(qū)為RISC-V生態(tài)完善添磚加瓦
SOPHGO RISC-V SoC Linux Kernel 社區(qū)郵件列表建立,歡迎加入開源社區(qū)為RISC-V生態(tài)完善添磚加瓦

關(guān)于RISC-V芯片的應(yīng)用學(xué)習(xí)總結(jié)
RISC-V芯片作為一種基于精簡(jiǎn)指令集計(jì)算(RISC)原則的開源指令集架構(gòu)(ISA)芯片,近年來在多個(gè)領(lǐng)域展現(xiàn)出了廣泛的應(yīng)用潛力和顯著優(yōu)勢(shì)。以下是對(duì)
發(fā)表于 01-29 08:38
國(guó)芯科技:已結(jié)束基于RISC-V架構(gòu)GPGPU研發(fā)
電子發(fā)燒友網(wǎng)報(bào)道(文/吳子鵬)近日,有投資者在互動(dòng)平臺(tái)向國(guó)芯科技提問:請(qǐng)問貴公司是否有GPU研發(fā)計(jì)劃? ? 對(duì)此,國(guó)芯科技回答稱,“公司與上海清華國(guó)際創(chuàng)新中心合作開展了基于開源RISC-V
《RISC-V能否復(fù)制Linux 的成功?》
的產(chǎn)品,Linux成為開源軟件發(fā)展的基石。
這種成功是否可以復(fù)制到開源硬件上呢?RISC-V這樣的指令集架構(gòu)(ISA)是否也可以像Linux內(nèi)核作為開源軟件的基礎(chǔ)
發(fā)表于 11-26 20:20
RISC-V,即將進(jìn)入應(yīng)用的爆發(fā)期
RISC-V是一種開放標(biāo)準(zhǔn)指令集架構(gòu) (ISA),最初由加州大學(xué)伯克利分校的研究人員于2010年開發(fā)。業(yè)界稱,這種開源特性為芯片設(shè)計(jì)者提供了極大的靈活性,可以根據(jù)具體需求定制AI加速器。
而AI
發(fā)表于 10-31 16:06
RISC-V近期市場(chǎng)情況調(diào)研
RISC-V是一種開源的指令集架構(gòu)(ISA),近年來在全球范圍內(nèi)迅速崛起,尤其在中國(guó),RISC-V的發(fā)展勢(shì)頭十分強(qiáng)勁。以下是目前RISC-V
RISC-V擁有巨大市場(chǎng)潛力的原因
旬發(fā)布了第三代“香山”開源高性能RISC-V處理器核,其性能水平已進(jìn)入全球第一梯隊(duì),可廣泛應(yīng)用于服務(wù)器芯片、AI芯片、GPU、DPU等高端芯片領(lǐng)域。
2、技術(shù)進(jìn)步:
發(fā)表于 09-30 14:20
加入全球 RISC-V Advocate 行列,共筑 RISC-V 的未來 !
加入RISC-VAdvocate行列!我們正在尋找來自世界各地的RISC-V愛好者,通過全球推廣和參與,成為支持RISC-V進(jìn)步的關(guān)鍵參與者。作為一名

risc-v的發(fā)展歷史
RISC-V的發(fā)展歷史可以追溯到2006年左右,當(dāng)時(shí)David Patterson和其他研究者開始探索創(chuàng)建一個(gè)開放和可擴(kuò)展的指令集架構(gòu)(ISA)。以下是RISC-V發(fā)展的主要里程碑:
一
發(fā)表于 07-29 17:20
rIsc-v的缺的是什么?
RISC-V作為一種開源的指令集架構(gòu)(ISA),自其誕生以來就受到廣泛關(guān)注和應(yīng)用,但它也存在一些不足之處。以下是RISC-V架構(gòu)目前存在的主
發(fā)表于 07-29 17:18
RISC-V在中國(guó)的發(fā)展機(jī)遇有哪些場(chǎng)景?
RISC-V在中國(guó)的發(fā)展機(jī)遇廣泛存在于多個(gè)場(chǎng)景,這主要得益于其開源、開放、簡(jiǎn)潔、靈活等特性,以及中國(guó)作為全球最大的數(shù)據(jù)大國(guó)和信息技術(shù)市場(chǎng)的重要地位。以下是一些RISC-V在中國(guó)的主要發(fā)
發(fā)表于 07-29 17:14
評(píng)論