向量擴展將定稿,RISC-V機器學(xué)習(xí)的崛起
RISC-V作為一個與x86和Arm相比仍算年輕的架構(gòu),自然需要不少擴展模塊來完善其指令集架構(gòu),尤其是對標(biāo)x86與Arm的SIMD指令集。然而SIMD指令集隨著時間的發(fā)展變得越來越臃腫,讓架構(gòu)變得愈發(fā)復(fù)雜,David Patterson也在幾年前的一篇文章中寫道,實現(xiàn)數(shù)據(jù)級并行性更優(yōu)雅的方式就是向量架構(gòu),RISC-V的向量擴展(RVV)也應(yīng)運而生。
在機器學(xué)習(xí)算法中,向量被廣泛用于處理數(shù)據(jù)集和數(shù)組。而RVV為基礎(chǔ)指令集新增了多個向量寄存器和向量指令,可以讓基于RISC-V架構(gòu)的處理器核心處理數(shù)組,與傳統(tǒng)的標(biāo)量運算一起來加速大數(shù)據(jù)集的指令運算。
RISC-V向量擴展指令于2018年推出,在經(jīng)過了多個版本的迭代后,終于在幾天前進(jìn)入了1.0 PB狀態(tài)。RVV工作組認(rèn)同了1.0版本的穩(wěn)定性,已經(jīng)可以在上游軟件項目中開發(fā)相關(guān)的工具鏈、功能模擬器與實現(xiàn)了。而前段時間的RISC-V論壇,也展示了RISC-V在向量與機器學(xué)習(xí)上的進(jìn)展。
RISC-V機器學(xué)習(xí)用于太空應(yīng)用
相信不少人都注意到近期逐漸增加的各項太空探索任務(wù),比如祝融號火星車與中國空間站建設(shè)等,這些任務(wù)中AI與機器學(xué)習(xí)的應(yīng)用也開始出現(xiàn)。然而將AI與機器學(xué)習(xí)加入太空任務(wù)依舊面臨著諸多挑戰(zhàn),比如已有的太空處理器已經(jīng)無法跟上AI與ML的計算需求,但現(xiàn)成的商用設(shè)備既無法滿足輻射要求,也沒有太空認(rèn)證的軟件棧支持。
來自加泰羅尼亞理工大學(xué)和巴塞羅那超算中心的兩位研究員Leonidas Kosmidis和Marc Solé Bonet給出了他們的創(chuàng)新方案,實現(xiàn)了在功率有限的RISC-V處理器上加速ML運算。與采用額外大面積向量寄存器文件的傳統(tǒng)方式不同,他們采用了一個開源的短SIMD模塊通過重復(fù)利用整數(shù)寄存器文件來減小面積。這一方案以2個未使用的RISC-V操作碼實現(xiàn)了17個高度可配置的定制指令,可以用于實現(xiàn)ML應(yīng)用中200多種組合運算。
他們成功將該模塊移植到了Cobham Gaisler開發(fā)的開源RISC-V太空處理器NOEL-V上,在最小的NOEL-V處理器的配置下進(jìn)行通用ML程序的測試,得出的結(jié)果相當(dāng)可觀。只需多用到25%的面積,就能實現(xiàn)3到7倍的性能提升,還不會影響到處理器的頻率。
兩位研究員也實現(xiàn)了Gaisler另一個太空處理器LEON3的版本,該處理器采用的是SPARC V8的架構(gòu)。未來他們還計劃引入TensorFlow和編譯器代碼生成等一系列軟件支持,并在歐洲航天局OPS-SAT實驗衛(wèi)星上的FPGA上進(jìn)行測試。
RISC-V向量處理器的真正挑戰(zhàn)
90年代可以說是DSP、CISC與DSP三家爭霸的狀態(tài),然而到了21世紀(jì),DSP已經(jīng)越來越難突破GHz,而高頻CPU中乘積累加運算單元的流行使得DSP在性能上敗下陣來。而RISC與CISC相比的優(yōu)勢在于其簡單化的特性,更容易實現(xiàn)高頻率。然而在向量處理器(VPU)上,必須要解決數(shù)據(jù)傳輸?shù)膯栴}。

傳統(tǒng)VPU在帶寬上的瓶頸 / 晶心科技
從數(shù)據(jù)傳輸?shù)牧鞒虂砜矗到y(tǒng)總線已經(jīng)被處理器占用處于繁忙狀態(tài),而所有數(shù)據(jù)都通過緩存走向總線,現(xiàn)在又多出了向量指令和向量數(shù)據(jù),致使總線到內(nèi)存的延遲增加,整體性能下降。因此,提高總線帶寬的同時保持高頻率,又不會增加額外的功耗也就成了一大設(shè)計挑戰(zhàn)。傳統(tǒng)的解決方案有預(yù)讀取和更大的獨立內(nèi)存與緩存等,但往往需要犧牲功耗和尺寸。
晶心科技為了解決這一挑戰(zhàn),推出了晶心自定義擴展(Andes Custom Extension,ACE),這一RISC-V擴展可以創(chuàng)造新的指令、新的協(xié)處理器和新的內(nèi)存位置。ACE引入了全新的Streaming Port,為外部硬件引擎創(chuàng)造了自定義數(shù)據(jù)接口和自定義數(shù)據(jù)內(nèi)存,以很小的功率代價解決了數(shù)據(jù)傳輸問題。除此之外,ACE還可以用于數(shù)據(jù)預(yù)處理與后處理,比如格式轉(zhuǎn)換等,進(jìn)一步提升VPU的性能,更好地控制和管理外部加速器。
結(jié)語
RISC-V在向量擴展與處理器上的進(jìn)展已經(jīng)相當(dāng)驚人,要知道蘋果在前段時間招募RISC-V開發(fā)者的工作描述中,不僅要求掌握RISC-V的開發(fā)知識,還要求了解Arm NEON SIMD微架構(gòu)的向量編程。隨著RVV的定稿,向量寄存器與指令也將全部確定下來,屆時相關(guān)的編譯器等工具鏈也能夠及時做到兼容。
RISC-V作為一個與x86和Arm相比仍算年輕的架構(gòu),自然需要不少擴展模塊來完善其指令集架構(gòu),尤其是對標(biāo)x86與Arm的SIMD指令集。然而SIMD指令集隨著時間的發(fā)展變得越來越臃腫,讓架構(gòu)變得愈發(fā)復(fù)雜,David Patterson也在幾年前的一篇文章中寫道,實現(xiàn)數(shù)據(jù)級并行性更優(yōu)雅的方式就是向量架構(gòu),RISC-V的向量擴展(RVV)也應(yīng)運而生。
在機器學(xué)習(xí)算法中,向量被廣泛用于處理數(shù)據(jù)集和數(shù)組。而RVV為基礎(chǔ)指令集新增了多個向量寄存器和向量指令,可以讓基于RISC-V架構(gòu)的處理器核心處理數(shù)組,與傳統(tǒng)的標(biāo)量運算一起來加速大數(shù)據(jù)集的指令運算。
RISC-V向量擴展指令于2018年推出,在經(jīng)過了多個版本的迭代后,終于在幾天前進(jìn)入了1.0 PB狀態(tài)。RVV工作組認(rèn)同了1.0版本的穩(wěn)定性,已經(jīng)可以在上游軟件項目中開發(fā)相關(guān)的工具鏈、功能模擬器與實現(xiàn)了。而前段時間的RISC-V論壇,也展示了RISC-V在向量與機器學(xué)習(xí)上的進(jìn)展。
RISC-V機器學(xué)習(xí)用于太空應(yīng)用
相信不少人都注意到近期逐漸增加的各項太空探索任務(wù),比如祝融號火星車與中國空間站建設(shè)等,這些任務(wù)中AI與機器學(xué)習(xí)的應(yīng)用也開始出現(xiàn)。然而將AI與機器學(xué)習(xí)加入太空任務(wù)依舊面臨著諸多挑戰(zhàn),比如已有的太空處理器已經(jīng)無法跟上AI與ML的計算需求,但現(xiàn)成的商用設(shè)備既無法滿足輻射要求,也沒有太空認(rèn)證的軟件棧支持。
來自加泰羅尼亞理工大學(xué)和巴塞羅那超算中心的兩位研究員Leonidas Kosmidis和Marc Solé Bonet給出了他們的創(chuàng)新方案,實現(xiàn)了在功率有限的RISC-V處理器上加速ML運算。與采用額外大面積向量寄存器文件的傳統(tǒng)方式不同,他們采用了一個開源的短SIMD模塊通過重復(fù)利用整數(shù)寄存器文件來減小面積。這一方案以2個未使用的RISC-V操作碼實現(xiàn)了17個高度可配置的定制指令,可以用于實現(xiàn)ML應(yīng)用中200多種組合運算。
他們成功將該模塊移植到了Cobham Gaisler開發(fā)的開源RISC-V太空處理器NOEL-V上,在最小的NOEL-V處理器的配置下進(jìn)行通用ML程序的測試,得出的結(jié)果相當(dāng)可觀。只需多用到25%的面積,就能實現(xiàn)3到7倍的性能提升,還不會影響到處理器的頻率。
兩位研究員也實現(xiàn)了Gaisler另一個太空處理器LEON3的版本,該處理器采用的是SPARC V8的架構(gòu)。未來他們還計劃引入TensorFlow和編譯器代碼生成等一系列軟件支持,并在歐洲航天局OPS-SAT實驗衛(wèi)星上的FPGA上進(jìn)行測試。
RISC-V向量處理器的真正挑戰(zhàn)
90年代可以說是DSP、CISC與DSP三家爭霸的狀態(tài),然而到了21世紀(jì),DSP已經(jīng)越來越難突破GHz,而高頻CPU中乘積累加運算單元的流行使得DSP在性能上敗下陣來。而RISC與CISC相比的優(yōu)勢在于其簡單化的特性,更容易實現(xiàn)高頻率。然而在向量處理器(VPU)上,必須要解決數(shù)據(jù)傳輸?shù)膯栴}。

傳統(tǒng)VPU在帶寬上的瓶頸 / 晶心科技
從數(shù)據(jù)傳輸?shù)牧鞒虂砜矗到y(tǒng)總線已經(jīng)被處理器占用處于繁忙狀態(tài),而所有數(shù)據(jù)都通過緩存走向總線,現(xiàn)在又多出了向量指令和向量數(shù)據(jù),致使總線到內(nèi)存的延遲增加,整體性能下降。因此,提高總線帶寬的同時保持高頻率,又不會增加額外的功耗也就成了一大設(shè)計挑戰(zhàn)。傳統(tǒng)的解決方案有預(yù)讀取和更大的獨立內(nèi)存與緩存等,但往往需要犧牲功耗和尺寸。
晶心科技為了解決這一挑戰(zhàn),推出了晶心自定義擴展(Andes Custom Extension,ACE),這一RISC-V擴展可以創(chuàng)造新的指令、新的協(xié)處理器和新的內(nèi)存位置。ACE引入了全新的Streaming Port,為外部硬件引擎創(chuàng)造了自定義數(shù)據(jù)接口和自定義數(shù)據(jù)內(nèi)存,以很小的功率代價解決了數(shù)據(jù)傳輸問題。除此之外,ACE還可以用于數(shù)據(jù)預(yù)處理與后處理,比如格式轉(zhuǎn)換等,進(jìn)一步提升VPU的性能,更好地控制和管理外部加速器。
結(jié)語
RISC-V在向量擴展與處理器上的進(jìn)展已經(jīng)相當(dāng)驚人,要知道蘋果在前段時間招募RISC-V開發(fā)者的工作描述中,不僅要求掌握RISC-V的開發(fā)知識,還要求了解Arm NEON SIMD微架構(gòu)的向量編程。隨著RVV的定稿,向量寄存器與指令也將全部確定下來,屆時相關(guān)的編譯器等工具鏈也能夠及時做到兼容。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
處理器
+關(guān)注
關(guān)注
68文章
20070瀏覽量
242925 -
ARM
+關(guān)注
關(guān)注
135文章
9455瀏覽量
385906 -
RISC-V
+關(guān)注
關(guān)注
47文章
2699瀏覽量
50915
發(fā)布評論請先 登錄
相關(guān)推薦
熱點推薦
RISC-V架構(gòu)下的編譯器自動向量化
進(jìn)迭時空專注于研發(fā)基于RISC-V的高性能新AICPU,對于充分發(fā)揮CPU核的性能而言,編譯器是不可或缺的一環(huán),而在AI時代,毫無疑問向量算力將發(fā)揮越來越重要的作用。進(jìn)迭時空非常重視RISC-V

大象機器人攜手進(jìn)迭時空推出 RISC-V 全棧開源六軸機械臂產(chǎn)品
全球80多個國家和地區(qū)。
近日,大象機器人聯(lián)合進(jìn)迭時空推出全球首款RISC-V全棧開源六軸機器臂“myCobot 280 RISC-V”,為開發(fā)者打造全新的
發(fā)表于 04-25 17:59
RISC-V生態(tài)崛起:政策落地與高性能芯片的崛起
領(lǐng)域的理想選擇。RISC-V生態(tài)崛起2025年,RISC-V生態(tài)迎來重大發(fā)展機遇。據(jù)路透社報道,中國計劃首次發(fā)布政策指導(dǎo),鼓勵在全國范圍內(nèi)使用開源RISC-V芯片,

關(guān)于RISC-V芯片的應(yīng)用學(xué)習(xí)總結(jié)
的核心優(yōu)勢在于其開源性、模塊化、低功耗、高性能以及可擴展性。這些特性使得RISC-V芯片在物聯(lián)網(wǎng)(IoT)、嵌入式系統(tǒng)、邊緣計算以及高性能計算等領(lǐng)域具有獨特競爭力。
在物聯(lián)網(wǎng)領(lǐng)域,RISC-V芯片的低功耗
發(fā)表于 01-29 08:38
RISC-V MCU技術(shù)
嘿,咱來聊聊RISC-V MCU技術(shù)哈。
這RISC-V MCU技術(shù)呢,簡單來說就是基于一個叫RISC-V的指令集架構(gòu)做出的微控制器技術(shù)。RISC-V這個啊,2010年的時候,是加州大
發(fā)表于 01-19 11:50
RISC-V 與 ARM 架構(gòu)的區(qū)別 RISC-V與機器學(xué)習(xí)的關(guān)系
在現(xiàn)代計算機架構(gòu)中,RISC-V和ARM是兩種流行的處理器架構(gòu)。它們各自具有獨特的特點和優(yōu)勢,適用于不同的應(yīng)用場景。 1. RISC-V架構(gòu) RISC-V(讀作“risk-five”)是一種開源
RISC-V指令集概述
RISC-V就是RISC的第五代指令集架構(gòu)。而RISC-V目標(biāo)就是“成為一種完全開放的指令集架構(gòu),可被任何學(xué)術(shù)機構(gòu)或商業(yè)組織自由使用”。
RISC-V指令集由“基本指令集 +
發(fā)表于 11-30 23:30
關(guān)于RISC-V學(xué)習(xí)路線圖推薦
RISC-V簡介 :
了解RISC-V的起源、特點、優(yōu)勢以及應(yīng)用場景。
RISC-V指令集 :
學(xué)習(xí)RISC-V的基本指令集,如RV32I
發(fā)表于 11-30 15:21
《RISC-V能否復(fù)制Linux 的成功?》
(IS A ),使其作為一個可長期使用的組件。ISA是處理器能讀懂的詞匯表,軟件使用該詞匯表來編寫。采用這種語言對軟件進(jìn)行編碼,可以告訴處理器應(yīng)該做什么。任何人都可以使用RISC-V ISA來完成設(shè)計擴展
發(fā)表于 11-26 20:20
什么是RISC-V?以及RISC-V和ARM、X86的區(qū)別
是開放的,任何人都可以使用它來開發(fā)處理器芯片和其他硬件,而無需支付任何許可或使用費用。RISC-V的設(shè)計簡單,易于擴展和自定義,可以在各種應(yīng)用場景和市場中使用。
什么是指令集架構(gòu)?
指令集架構(gòu)
發(fā)表于 11-16 16:14
希姆計算的RISC-V矩陣擴展開源項目已升級至0.5版本,支持向量+矩陣的實現(xiàn)
希姆計算的RISC-V矩陣擴展開源項目已升級至0.5版本-----支持向量+矩陣的實現(xiàn)范福杰博士&陳煒博士項目背景Background為了解決RISC-V在人工智能領(lǐng)域中指令碎片化

RISC-V筆記——基礎(chǔ)
1.前言RISC-V旨在支持廣泛的定制和專業(yè)化。RISC-V的ISA是由一個基本整型ISA和其它對基本ISA的可選擴展組成。每個整型ISA可以使用一個或多個可選的ISA擴展進(jìn)行

RISC-V的指令集位寬的幾點學(xué)習(xí)心得
在學(xué)習(xí)RISC-V指令集過程中,指令位寬大多是32位和64的,它并不像其它指令集,還有8位的古老指令集。這估計也是RISC-V能輕裝前行的原因之一吧。RISC-V的指令集并非僅限于32
發(fā)表于 10-31 22:05
RISC-V,即將進(jìn)入應(yīng)用的爆發(fā)期
計算機由控制整體的CPU(中央處理器)和加速器兩部分構(gòu)成。在AI計算中,功耗和效率是兩個關(guān)鍵因素。RISC-V架構(gòu)通過其簡潔的設(shè)計和定制化的擴展,可以實現(xiàn)高效的能量使用。該架構(gòu)能夠通過小型且高效的處理單元
發(fā)表于 10-31 16:06
RISC-V近期市場情況調(diào)研
RISC-V是一種開源的指令集架構(gòu)(ISA),近年來在全球范圍內(nèi)迅速崛起,尤其在中國,RISC-V的發(fā)展勢頭十分強勁。以下是目前RISC-V芯片的發(fā)展情況,以及中國在這一領(lǐng)域的主要公司
評論