chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

通用計(jì)算仍有差距,RISC-V可靠矢量處理彎道超車

E4Life ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚(yáng) ? 2022-10-20 03:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))對(duì)于高效的數(shù)據(jù)并行負(fù)載處理來(lái)說(shuō),矢量架構(gòu)的吸引力越來(lái)越大,主流ISA都開(kāi)始注意到這一點(diǎn)。就拿我們熟悉的前超算王者——日本的富岳來(lái)說(shuō),其處理器富士通A64FX就是基于Arm可伸縮矢量擴(kuò)展(SVE)的。

Arm也在隨后推出的Armv9架構(gòu)中提出了改良版的SVE2,并在其中加入了對(duì)NEON的兼容,SVE2在HPC之外的市場(chǎng)應(yīng)用中做出了指令優(yōu)化,甚至可以用于手機(jī)、汽車等智能設(shè)備中。

正是因?yàn)橛辛薙VE的存在,富岳才得以單靠通用處理器完成高性能的大數(shù)據(jù)運(yùn)算,而不是像其他主流超算一樣,還要靠堆積GPU、FPGAAI加速器等片外加速器才能實(shí)現(xiàn)可觀的性能,我國(guó)的神威太湖之光同樣運(yùn)用了這樣的矢量設(shè)計(jì)思路。但以上這些都是專有架構(gòu),微架構(gòu)不透明的同時(shí)也限制了開(kāi)源和定制化方案的出現(xiàn),而這些均可以在RISC-V上一一實(shí)現(xiàn)。

RISC-V矢量處理器的吸引力

RISC-V的矢量擴(kuò)展RVV自2015年提出以來(lái),已經(jīng)有了長(zhǎng)足的進(jìn)展,也有了正式的1.0版本規(guī)范。與傳統(tǒng)的SIMD指令相比,RVV提供動(dòng)態(tài)的矢量長(zhǎng)度修改,做到了更高的效率、更小的代碼體積和更簡(jiǎn)單的循環(huán)結(jié)束。我們近期已經(jīng)看到了不少RISC-V處理器被廣泛使用的新聞,比如谷歌選擇在其TPU上加入SiFive的X280處理器,其實(shí)看重的就是它在矢量處理上的優(yōu)勢(shì)。
CleanShot 2022-10-19 at 16.01.37@2x
SiFive矢量處理器 / SiFive
所以我們看到在SiFive的處理器產(chǎn)品中,像Performance P270和Intelligence X280都擁有優(yōu)秀的矢量處理能力,后者更是引入了一個(gè)512位矢量寄存器長(zhǎng)度的架構(gòu),在完全支持矢量擴(kuò)展標(biāo)準(zhǔn)的同時(shí),還支持動(dòng)態(tài)可變矢量長(zhǎng)度的運(yùn)算。SiFive也在其矢量擴(kuò)展上做出了改進(jìn),稱其為SiFive智能擴(kuò)展,與直接基于RV64GCV架構(gòu)的設(shè)計(jì)相比,X280的智能擴(kuò)展在INT8格式下的矩陣乘法運(yùn)算時(shí)可將執(zhí)行速度提高12倍。

而且這不僅僅造福的是數(shù)據(jù)中心,還有受制于功耗卻又需要高吞吐量和單線程性能的邊緣應(yīng)用,比如AR/VR數(shù)碼相機(jī)等等。SiFive同樣測(cè)試了可用于移動(dòng)端或嵌入式設(shè)備的輕量級(jí)神經(jīng)網(wǎng)絡(luò)MobileNet,相較基于RISC-V標(biāo)量的架構(gòu),SiFive智能擴(kuò)展可以將速度提升144倍。

同樣的還有晶心科技推出的RISC-V矢量處理器NX27V,該處理器采用了5級(jí)流水線的設(shè)計(jì),晶心為其設(shè)計(jì)了強(qiáng)大的矢量處理單元,擁有32個(gè)矢量寄存器,最高支持512位的矢量長(zhǎng)度,為了進(jìn)一步支持AI應(yīng)用,晶心還為其增加了BF16和INT4的數(shù)據(jù)格式支持。據(jù)正在打造可擴(kuò)展的高性能AI超算的初創(chuàng)公司Luminous Computing透露,他們打造的系統(tǒng)用到了數(shù)百個(gè)NX27V VPU核心,極大地提升了該系統(tǒng)的深度學(xué)習(xí)性能。

開(kāi)源RISC-V矢量處理器

RISC-V作為開(kāi)源架構(gòu)最棒的一點(diǎn)就在于,總是不缺香山處理器這樣優(yōu)秀的開(kāi)源方案。比如2019年推出的Ara就是一款高效矢量協(xié)處理器,用于輔助OpenHW的CVA6 RISC-V應(yīng)用處理器Ara,只不過(guò)Ara剛發(fā)布之際還是基于早期的RVV規(guī)范設(shè)計(jì)的。

來(lái)自蘇黎世聯(lián)邦理工學(xué)院(ETH)和華為蘇黎世研究中心的研究員們借助Ara的啟發(fā),基于RVV1.0發(fā)表了一個(gè)開(kāi)源的高效RISC-V矢量處理器設(shè)計(jì)。他們基于格芯的22FDX工藝進(jìn)行了吞吐量和PPA的驗(yàn)證,整個(gè)系統(tǒng)運(yùn)行頻率為1.34GH,在關(guān)鍵的矩陣乘法內(nèi)核下,F(xiàn)PU的利用率可以達(dá)到98%以上。

相較之下,SiFive的X280和另一個(gè)開(kāi)源矢量協(xié)處理器Vicuna宣稱的FPU利用率大于90%,伯克利的開(kāi)源方案Hwacha可以做到95%以上。為了展示從RVV擴(kuò)展這么多年以來(lái)的改進(jìn),他們也與基于RVV 0.5版下的設(shè)計(jì)做了對(duì)比,結(jié)果是在面積占用上有了15%的提升,吞吐量也有了6%的提升,雙精度計(jì)算效率也做到了37.1GFLOPS/W。

結(jié)語(yǔ)

AI時(shí)代下,矢量處理的應(yīng)用場(chǎng)景已經(jīng)遠(yuǎn)超我們的現(xiàn)象,包括深度學(xué)習(xí)、推薦系統(tǒng)、鍵值存儲(chǔ)和HPC等,都已經(jīng)廣泛利用了矢量計(jì)算。但如何做到高效高性能,才是未來(lái)所有ISA的努力方向,而RISC-V作為后來(lái)者,反而能在這上面找到彎道超車的機(jī)會(huì)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • RISC-V
    +關(guān)注

    關(guān)注

    47

    文章

    2700

    瀏覽量

    51028
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    奕斯偉計(jì)算亮相2025 RISC-V中國(guó)峰會(huì)

    國(guó)際交流合作。奕斯偉計(jì)算高級(jí)副總裁、首席技術(shù)官何寧博士在主論壇發(fā)表《產(chǎn)業(yè)賦能:RISC-V場(chǎng)景化方案創(chuàng)新與生態(tài)協(xié)同》主題演講,闡述了奕斯偉計(jì)算RISC-V場(chǎng)景化應(yīng)用與生態(tài)建設(shè)上的戰(zhàn)略
    的頭像 發(fā)表于 07-22 17:34 ?785次閱讀

    知合計(jì)算RISC-V架構(gòu)創(chuàng)新,阿基米德系列劍指高性能計(jì)算

    在2025 RISC-V中國(guó)峰會(huì)上,知合計(jì)算處理器設(shè)計(jì)總監(jiān)劉暢就高性能RISC-V處理器架構(gòu)探索與實(shí)踐進(jìn)行了精彩分享。 在以X86和ARM為
    的頭像 發(fā)表于 07-18 14:17 ?2071次閱讀
    知合<b class='flag-5'>計(jì)算</b>:<b class='flag-5'>RISC-V</b>架構(gòu)創(chuàng)新,阿基米德系列劍指高性能<b class='flag-5'>計(jì)算</b>

    FPGA與RISC-V淺談

    全球半導(dǎo)體產(chǎn)業(yè)競(jìng)爭(zhēng)格局正在經(jīng)歷深刻變革,物聯(lián)網(wǎng)、邊緣計(jì)算等新興技術(shù)的蓬勃發(fā)展,讓RISC-V憑借其開(kāi)源、精簡(jiǎn)以及模塊化的靈活優(yōu)勢(shì),日益成為業(yè)界焦點(diǎn),也為全球半導(dǎo)體產(chǎn)業(yè)注入新的活力與挑戰(zhàn)
    發(fā)表于 04-11 13:53 ?494次閱讀
    FPGA與<b class='flag-5'>RISC-V</b>淺談

    關(guān)于RISC-V芯片的應(yīng)用學(xué)習(xí)總結(jié)

    電子、醫(yī)療設(shè)備等領(lǐng)域,對(duì)處理器的可靠性、實(shí)時(shí)性和低功耗有較高要求。RISC-V芯片通過(guò)提供豐富的外設(shè)接口和高效的指令集,滿足了嵌入式系統(tǒng)的多樣化需求。同時(shí),其開(kāi)源特性降低了開(kāi)發(fā)成本,加速了產(chǎn)品上市時(shí)間
    發(fā)表于 01-29 08:38

    RISC-V MCU技術(shù)

    的研究團(tuán)隊(duì)弄出來(lái)的,目的就是想搞個(gè)新的、開(kāi)放的指令集架構(gòu),能跟上現(xiàn)代計(jì)算的需要。到了2015年,專門(mén)成立了個(gè)RISC-V基金會(huì),讓這個(gè)架構(gòu)更標(biāo)準(zhǔn),也更好地推廣開(kāi)了。這幾年啊,這個(gè)RISC-V的生態(tài)系統(tǒng)
    發(fā)表于 01-19 11:50

    構(gòu)建安全計(jì)算生態(tài) | RISC-V 安全機(jī)制的架構(gòu)設(shè)計(jì)

    玄鐵RISC-V軟硬件技術(shù)深度解讀系列,將從AI、高性能計(jì)算、安全和邊緣計(jì)算等多個(gè)方向,全面介紹玄鐵RISC-V軟硬件技術(shù)實(shí)現(xiàn)。本周我們將帶來(lái)RIS
    的頭像 發(fā)表于 01-10 17:53 ?2319次閱讀
    構(gòu)建安全<b class='flag-5'>計(jì)算</b>生態(tài) | <b class='flag-5'>RISC-V</b> 安全機(jī)制的架構(gòu)設(shè)計(jì)

    Imagination放棄RISC-V處理器內(nèi)核開(kāi)發(fā)

    電子發(fā)燒友網(wǎng)報(bào)道(文/吳子鵬)根據(jù)外媒的最新報(bào)道,半導(dǎo)體IP大廠Imagination Technology已經(jīng)停止了RISC-V處理器內(nèi)核的開(kāi)發(fā),轉(zhuǎn)而更加專注于其核心的GPU和AI產(chǎn)品
    的頭像 發(fā)表于 01-10 00:15 ?3059次閱讀

    risc-v芯片在電機(jī)領(lǐng)域的應(yīng)用展望

    具體應(yīng)用場(chǎng)景進(jìn)行靈活定制,從而實(shí)現(xiàn)更高效的控制算法和更優(yōu)化的性能表現(xiàn)。 此外,RISC-V芯片還支持多核架構(gòu),這使得電機(jī)控制系統(tǒng)能夠同時(shí)處理多個(gè)任務(wù),提高整體運(yùn)行效率。在電機(jī)驅(qū)動(dòng)方面,多核架構(gòu)能夠使得
    發(fā)表于 12-28 17:20

    RISC-V架構(gòu)及MRS開(kāi)發(fā)環(huán)境回顧

    Sherwani的預(yù)測(cè),5年后RISC-V指令的處理器就有可能進(jìn)軍服務(wù)器市場(chǎng)。 ③、RISC-V的應(yīng)用之三:存儲(chǔ)市場(chǎng) 硬盤(pán)本身并不需要像SSD那樣龐大的計(jì)算資源,但是由于新的磁記錄技
    發(fā)表于 12-16 23:08

    RISC-V 與 ARM 架構(gòu)的區(qū)別 RISC-V與機(jī)器學(xué)習(xí)的關(guān)系

    在現(xiàn)代計(jì)算機(jī)架構(gòu)中,RISC-V和ARM是兩種流行的處理器架構(gòu)。它們各自具有獨(dú)特的特點(diǎn)和優(yōu)勢(shì),適用于不同的應(yīng)用場(chǎng)景。 1. RISC-V架構(gòu) RIS
    的頭像 發(fā)表于 12-11 17:50 ?3991次閱讀

    關(guān)于RISC-V學(xué)習(xí)路線圖推薦

    一個(gè)號(hào)的RISC-V學(xué)習(xí)路線圖可以幫助學(xué)習(xí)者系統(tǒng)地掌握RISC-V架構(gòu)的相關(guān)知識(shí)。比如以下是一個(gè)較好的RISC-V學(xué)習(xí)路線圖: 一、基礎(chǔ)知識(shí)準(zhǔn)備 計(jì)算機(jī)體系結(jié)構(gòu)基礎(chǔ) : 了解
    發(fā)表于 11-30 15:21

    RISC-V能否復(fù)制Linux 的成功?》

    ,創(chuàng)建實(shí)現(xiàn)自有加速器算法的自定義異構(gòu)集群。RISC-V作為一種ISA,我們一開(kāi)始是在處理器內(nèi)核中采用吸引人的通用構(gòu)建塊,然后在此基礎(chǔ)上進(jìn)行構(gòu)建,同時(shí)還利用最好的商業(yè)工具增強(qiáng)使用者的信心。所以,IP
    發(fā)表于 11-26 20:20

    什么是RISC-V?以及RISC-V和ARM、X86的區(qū)別

    圖紙,處理器就是房子。 RISCRISC-V的區(qū)別 RISC全稱Reduced Instruction Set Computer,即精簡(jiǎn)指令計(jì)算
    發(fā)表于 11-16 16:14

    RISC-V,即將進(jìn)入應(yīng)用的爆發(fā)期

    計(jì)算機(jī)由控制整體的CPU(中央處理器)和加速器兩部分構(gòu)成。在AI計(jì)算中,功耗和效率是兩個(gè)關(guān)鍵因素。RISC-V架構(gòu)通過(guò)其簡(jiǎn)潔的設(shè)計(jì)和定制化的擴(kuò)展,可以實(shí)現(xiàn)高效的能量使用。該架構(gòu)能夠通過(guò)
    發(fā)表于 10-31 16:06

    RISC-V 工具鏈簡(jiǎn)介

    器性能是硬件+工具鏈的綜合能力體現(xiàn),單比較硬件頻率指標(biāo)沒(méi)有實(shí)際意義。調(diào)試高效性直接影響了開(kāi)發(fā)者分析解決問(wèn)題效率,也是決定了處理器能否開(kāi)發(fā)者接受、是否可以被廣泛應(yīng)用。 三、RISC-V 工具鏈的現(xiàn)狀 既然
    發(fā)表于 10-25 22:59