chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何區(qū)分RapidStream自動(dòng)分區(qū)算法

科技綠洲 ? 來(lái)源:SSDFans ? 作者:SSDFans ? 2022-05-25 10:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

FPGA的布局布線軟件向來(lái)跑得很慢。事實(shí)上,F(xiàn)PGA供應(yīng)商已經(jīng)花了很大的精力使其設(shè)計(jì)軟件在多核處理器上運(yùn)行得更快。

最近,在ACM的FPGA 2022會(huì)議上發(fā)表了一篇題為“RapidStream: FPGA HLS設(shè)計(jì)的并行物理實(shí)現(xiàn)”的論文,論文中描述了一種非常有趣的方法,通過(guò)FPGA設(shè)計(jì)軟件推動(dòng)HLS設(shè)計(jì)更快地運(yùn)行在多核處理器上。

這篇論文由UCLA、AMD-Xilinx、根特大學(xué)和康奈爾大學(xué)的研究團(tuán)隊(duì)撰寫(xiě),描述了RapidStream自動(dòng)分區(qū)算法,將數(shù)據(jù)流設(shè)計(jì)分割成多個(gè)“island”,在劃分的island之間插入“anchor regions”,然后通過(guò)anchor regions中的寄存器將每個(gè)island的信號(hào)連起來(lái)整合到整個(gè)設(shè)計(jì)中。

所有這些劃分和拼接背后的目的是將HLS設(shè)計(jì)分割成小塊,交付給現(xiàn)代服務(wù)器中的多個(gè)核心。這種策略已經(jīng)有悠久的歷史,現(xiàn)在被用于加速FPGA的開(kāi)發(fā)。

這個(gè)過(guò)程有三個(gè)主要的HLS級(jí)約束:

1、非重疊分區(qū)——并行化不同island的物理實(shí)現(xiàn);

2、流水線化的island間連接——每個(gè)island間連接都流水線化,以滿足時(shí)序要求;

3、直接連接——每個(gè)island只能與相鄰的island直接連接。當(dāng)并行化設(shè)計(jì)布局布線時(shí),這個(gè)約束是至關(guān)重要的。

(注意:這些約束與用于控制邏輯綜合的各種約束完全不同,它處于一個(gè)更高的層次。)

RapidStream的開(kāi)發(fā)者將數(shù)據(jù)流設(shè)計(jì)定義為一組并行處理元素(processing element,簡(jiǎn)稱(chēng)PE)和一組根據(jù)設(shè)計(jì)的數(shù)據(jù)流需求將PE連接起來(lái)的FIFO。PE內(nèi)部可以很復(fù)雜,但只能通過(guò)FIFO接口與其他PE進(jìn)行數(shù)據(jù)通信

如上所述,RapidStream將FPGA fabric劃分為兩種region:大小相同的region和在相鄰region之間以窄列和行放置的anchor region。有趣的是,RapidStream似乎是專(zhuān)門(mén)為AMD-Xilinx Virtex UltraScale+ FPGA構(gòu)建的,這是由FPGA chiplet(AMD-Xilinx語(yǔ)言中的超級(jí)邏輯區(qū)域,簡(jiǎn)稱(chēng)SLR)制成的2.5D器件。

poYBAGKNjhaAUxPIAAEoZSVbt0k599.png

這篇論文包含了幾個(gè)描述RapidStream工作性能的圖表。下圖顯示了在分區(qū)后,六種不同的數(shù)據(jù)流設(shè)計(jì)與沒(méi)有分區(qū)的流水線/非流水線版本時(shí)鐘速率的比較。

pYYBAGKNjh-AJRblAACQ8BvDUQM665.png

從上圖可以看出,RapidStream比所有非流水線版本的時(shí)鐘速率更高。這是意料之中的,因?yàn)榱魉€是FPGA時(shí)鐘速度改進(jìn)的核心。然而,六種情況中,有五種情況RapidStream的結(jié)果比相同設(shè)計(jì)的流水線RTL版本要好,這個(gè)結(jié)果要引起我們的注意。

下面是布局布線的時(shí)間結(jié)果對(duì)比:

poYBAGKNjiiANNsXAACO00o9gDE819.png

RapidStream的布局布線運(yùn)行時(shí)間比未分區(qū)設(shè)計(jì)的結(jié)果要好得多。這是因?yàn)镽apidStream可以將每個(gè)分區(qū)送給不同的處理器核心來(lái)布局布線。

雖然FPGA供應(yīng)商試圖讓布局布線算法在多核處理器上工作得更快,但RapidStream的開(kāi)發(fā)人員根據(jù)經(jīng)驗(yàn)發(fā)現(xiàn),如果FPGA設(shè)計(jì)沒(méi)有分區(qū),在超過(guò)兩個(gè)處理器核心上運(yùn)行AMD-Xilinx Vivado設(shè)計(jì)工具時(shí)并沒(méi)有太大改善。

如果有讀者正在用FPGA開(kāi)發(fā)HLS設(shè)計(jì)——特別是AMD-Xilinx FPGA,那么應(yīng)該會(huì)對(duì)RapidStream感興趣。更細(xì)節(jié)的內(nèi)容可以在GitHub上找到。

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1645

    文章

    22050

    瀏覽量

    618422
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7256

    瀏覽量

    91863
  • 多核處理器
    +關(guān)注

    關(guān)注

    0

    文章

    110

    瀏覽量

    20310
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    基于動(dòng)態(tài)區(qū)分矩陣的屬性約簡(jiǎn)算法

    在分析基于靜態(tài)區(qū)分矩陣的屬性約簡(jiǎn)算法基礎(chǔ)上,提出一種基于動(dòng)態(tài)區(qū)分矩陣的屬性約簡(jiǎn)算法。該算法采用2種不同的
    發(fā)表于 04-09 08:41 ?16次下載

    基于外極線分區(qū)的動(dòng)態(tài)立體匹配算法

    基于區(qū)域的立體匹配算法僅針對(duì)支撐窗內(nèi)的灰度信息定義匹配代價(jià)函數(shù),導(dǎo)致在弱(無(wú))紋理區(qū)域采用WTA優(yōu)化出現(xiàn)歧義性。該文在外極線分區(qū)的基礎(chǔ)上,改用區(qū)域作為匹配基元,針對(duì)歧
    發(fā)表于 04-11 08:37 ?21次下載

    最佳集水分區(qū)模擬之研究

    本研究是以南投縣水里溪集水區(qū)為研究對(duì)象,運(yùn)用集水分區(qū)分析法來(lái)進(jìn)行最佳集水分區(qū)之工作,以協(xié)助集水區(qū)管理策略的制定。為了提升集水區(qū)管理效率,必須進(jìn)行集水分區(qū)之工作,而
    發(fā)表于 04-10 12:15 ?30次下載

    一種多核混合分區(qū)調(diào)度算法設(shè)計(jì)與實(shí)現(xiàn)

    一種多核混合分區(qū)調(diào)度算法設(shè)計(jì)與實(shí)現(xiàn)_郝繼鋒
    發(fā)表于 01-07 19:00 ?1次下載

    一種基于能量均衡的分區(qū)成鏈路由算法

    一種基于能量均衡的分區(qū)成鏈路由算法_潘琢金
    發(fā)表于 01-07 19:08 ?0次下載

    基于分區(qū)連通性恢復(fù)算法DCRA

    針對(duì)現(xiàn)有算法恢復(fù)分區(qū)連通性存在容錯(cuò)性差的問(wèn)題,提出了分區(qū)雙連通性恢復(fù)算法DCRA。該算法旨在網(wǎng)絡(luò)中心區(qū)域構(gòu)建骨干多邊形,
    發(fā)表于 11-21 14:35 ?3次下載
    基于<b class='flag-5'>分區(qū)</b>連通性恢復(fù)<b class='flag-5'>算法</b>DCRA

    基于迭代填充的內(nèi)存計(jì)算框架分區(qū)映射算法

    針對(duì)內(nèi)存計(jì)算框架Spark在作業(yè)Shuffle階段一次分區(qū)產(chǎn)生的數(shù)據(jù)傾斜問(wèn)題,提出一種內(nèi)存計(jì)算框架的迭代填充分區(qū)映射算法(IFPM)。首先,分析Spark作業(yè)的執(zhí)行機(jī)制,建立作業(yè)效率模型和分區(qū)
    發(fā)表于 12-05 16:32 ?0次下載
    基于迭代填充的內(nèi)存計(jì)算框架<b class='flag-5'>分區(qū)</b>映射<b class='flag-5'>算法</b>

    基于場(chǎng)景分區(qū)的隨機(jī)潮流解析算法

    可再生能源在電力系統(tǒng)中的滲透率日益提高,隨機(jī)因素的波動(dòng)范圍逐漸增大,這對(duì)常規(guī)半不變量法的精度帶來(lái)了很大的挑戰(zhàn)。文中提出一種基于場(chǎng)景分區(qū)的隨機(jī)潮流新算法:首先,采用場(chǎng)景削減算法獲取系統(tǒng)典型運(yùn)行場(chǎng)景
    發(fā)表于 12-15 15:21 ?0次下載
    基于場(chǎng)景<b class='flag-5'>分區(qū)</b>的隨機(jī)潮流解析<b class='flag-5'>算法</b>

    基于區(qū)分對(duì)象集的啟發(fā)式屬性約簡(jiǎn)算法

    基于正域的屬性約簡(jiǎn)算法是利用下近似思想,僅考慮被正確區(qū)分樣本數(shù)的約簡(jiǎn)算法。借鑒上近似的思想,利用鄰域信息粒的概念定義了區(qū)分對(duì)象集,探討了其基本性質(zhì),并提出了基于
    發(fā)表于 01-05 11:28 ?0次下載

    Spark漸進(jìn)填充分區(qū)映射算法

    定義求解,設(shè)計(jì)了漸進(jìn)填充分區(qū)映射算法(PFPM,progressive filling partitioning and mapping algorithm),通過(guò)擴(kuò)展式分區(qū)和漸進(jìn)填充映射,建立適應(yīng)
    發(fā)表于 01-14 16:50 ?0次下載
    Spark漸進(jìn)填充<b class='flag-5'>分區(qū)</b>映射<b class='flag-5'>算法</b>

    硬盤(pán)為什么要分區(qū) 怎么分區(qū)

    磁盤(pán)的分區(qū) 裝過(guò)系統(tǒng)的人都知道必須要分區(qū)后才能安裝系統(tǒng),形象點(diǎn)的說(shuō)比如windows里C:,D:之類(lèi)的東西;如果你要問(wèn)硬盤(pán)為什么要分區(qū),我也說(shuō)不上來(lái)很?chē)?yán)格的原因,首先從使用習(xí)慣上來(lái)講,我們不希望數(shù)據(jù)雜亂無(wú)章堆積在一起。
    發(fā)表于 04-19 14:52 ?7938次閱讀
    硬盤(pán)為什么要<b class='flag-5'>分區(qū)</b> 怎么<b class='flag-5'>分區(qū)</b>

    HIGHT算法的積分攻擊

    對(duì)輕量級(jí)分組密碼算法HIGHT在積分攻擊方法下的安全性進(jìn)行了研究。首先糾正了現(xiàn)有研究成果在構(gòu)造區(qū)分器時(shí)的不當(dāng)之處,重新構(gòu)造了HIGHT算法的11輪積分區(qū)分器,并構(gòu)造了相應(yīng)高階積分?jǐn)U展下
    發(fā)表于 02-09 16:48 ?0次下載

    基于RC模型的多分區(qū)權(quán)值約簡(jiǎn)微博社區(qū)檢測(cè)算法

    傳統(tǒng)社區(qū)檢測(cè)算法直接引入第三方算法會(huì)降低計(jì)算效率。為此,基于RC模型,設(shè)計(jì)多分區(qū)權(quán)值約簡(jiǎn)有限區(qū)間限定算法進(jìn)行微博社區(qū)檢測(cè)。研究微博社區(qū)發(fā)現(xiàn)RC模型,分析參數(shù)加權(quán)約簡(jiǎn)曲線性質(zhì),借鑒凸優(yōu)
    發(fā)表于 11-16 18:06 ?16次下載
    基于RC模型的多<b class='flag-5'>分區(qū)</b>權(quán)值約簡(jiǎn)微博社區(qū)檢測(cè)<b class='flag-5'>算法</b>

    LICi算法抵抗積分攻擊的相關(guān)實(shí)驗(yàn)及分析

    為分析目前LiCi算法抵抗積分攻擊的能力,利用基于比特的可分性質(zhì),結(jié)合MILP搜索工具對(duì)LiCi算法的積分區(qū)分器進(jìn)行搜索。搜索得到最長(zhǎng)輪數(shù)積分區(qū)分器為12輪積
    發(fā)表于 03-30 14:05 ?18次下載
    LICi<b class='flag-5'>算法</b>抵抗積分攻擊的相關(guān)實(shí)驗(yàn)及分析

    基于向量分區(qū)和三維骨架化的CT圖像算法

    基于向量分區(qū)和三維骨架化的CT圖像算法
    發(fā)表于 06-25 15:19 ?22次下載