chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

淺析HLS的任務(wù)級(jí)并行性

FPGA技術(shù)驛站 ? 來(lái)源:FPGA技術(shù)驛站 ? 2023-07-27 09:21 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

HLS的任務(wù)級(jí)并行性(Task-level Parallelism)分為兩種:一種是控制驅(qū)動(dòng)型;一種是數(shù)據(jù)驅(qū)動(dòng)型。對(duì)于控制驅(qū)動(dòng)型,用戶要手工添加DATAFLOWpragma,工具會(huì)在該pragma指定的區(qū)域內(nèi)判別任務(wù)之間的并行性,生成各進(jìn)程之間的模塊級(jí)控制信號(hào)。對(duì)于數(shù)據(jù)驅(qū)動(dòng)型,用于需要明確指定可并行執(zhí)行的任務(wù)。

從描述手段來(lái)看,控制驅(qū)動(dòng)型本質(zhì)上是由工具判定各任務(wù)能否并行執(zhí)行。用戶在對(duì)各函數(shù)描述時(shí)只要遵守DATAFLOW的要求即可。例如:讀取輸入數(shù)據(jù)應(yīng)該位于DATAFLOW區(qū)域的起始位置,寫(xiě)入輸出數(shù)據(jù)應(yīng)位于該區(qū)域的終止位置。DATALOW區(qū)域內(nèi)的所有變量遵循“一次讀一次寫(xiě)”原則。除非使用hls::stream,否則不支持反饋支路。不支持在指定條件下才執(zhí)行函數(shù)。不支持for在指定條件下退出(使用break語(yǔ)句)。但控制驅(qū)動(dòng)型比較靈活,這是因?yàn)镈ATAFLOW的作用對(duì)象可以是for循環(huán)也可以是函數(shù)。

控制驅(qū)動(dòng)器適合于順序執(zhí)行的C函數(shù)??刂乞?qū)動(dòng)型模型帶來(lái)的好處包括:當(dāng)前函數(shù)在結(jié)束執(zhí)行之前后續(xù)函數(shù)可以開(kāi)始執(zhí)行;函數(shù)在結(jié)束執(zhí)行之前可以重新開(kāi)始執(zhí)行;兩個(gè)或更多順序函數(shù)可以同時(shí)開(kāi)始執(zhí)行。我們看一個(gè)例子。如下圖所示,頂層函數(shù)diamond調(diào)用了4各函數(shù)funcA~funcD。

557fca60-2c11-11ee-a368-dac502259ad0.png



在沒(méi)有添加DATAFLOW的情況下,工具能自動(dòng)探測(cè)出funcB和funcC的并行性,這可從Schedule視圖中看到,如下圖所示。

5592c2be-2c11-11ee-a368-dac502259ad0.png



添加DATAFLOW之后,對(duì)兩者性能進(jìn)行對(duì)比,如下圖所示(NO_TLP為沒(méi)有添加DATAFLOW的solution),從Latency角度看,兩者相當(dāng),但從interval角度看,DATAFLOW帶來(lái)的效果還是很明顯的。Interval從457降到了175。

55a328e8-2c11-11ee-a368-dac502259ad0.png



再看數(shù)據(jù)驅(qū)動(dòng)型。數(shù)據(jù)驅(qū)動(dòng)型要求任務(wù)之前以stream作為接口,允許反饋支路。用戶需要明確通過(guò)hls::task指定可并行執(zhí)行的任務(wù)。對(duì)于上述函數(shù),我們可以將其改造為數(shù)據(jù)驅(qū)動(dòng)型,如下圖所示。代碼第98行聲明了4個(gè)stream,第99行~第102行通過(guò)hls::task指定并行任務(wù)。

55b74472-2c11-11ee-a368-dac502259ad0.png



將三者放在一起對(duì)比,如下圖所示。可以看到數(shù)據(jù)驅(qū)動(dòng)型無(wú)論在性能還是資源上都獲得最佳表現(xiàn)。

55ccb1ae-2c11-11ee-a368-dac502259ad0.png

那么兩種類(lèi)型能否混合使用呢?答案是肯定的,但是有限制的,這源于兩者的自身特征??梢栽诳刂乞?qū)動(dòng)型中嵌入數(shù)據(jù)驅(qū)動(dòng)型,但反過(guò)來(lái)是不允許的。我們將上面的例子改造為控制驅(qū)動(dòng)型嵌入數(shù)據(jù)驅(qū)動(dòng)型的模式,如下圖所示。這里需要注意的是代碼第137行的DATAFLOWpragma,同時(shí)代碼第141行和第142行都設(shè)置了task,task接口為stream。此外也給出了Vitis HLS的Schedule視圖和Dataflow視圖。Dataflow視圖中也顯示了KPN。

55e44418-2c11-11ee-a368-dac502259ad0.png

5605458c-2c11-11ee-a368-dac502259ad0.png

5614649a-2c11-11ee-a368-dac502259ad0.png






審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 驅(qū)動(dòng)器
    +關(guān)注

    關(guān)注

    54

    文章

    8931

    瀏覽量

    152222
  • 控制驅(qū)動(dòng)器

    關(guān)注

    0

    文章

    3

    瀏覽量

    5807
  • HLS
    HLS
    +關(guān)注

    關(guān)注

    1

    文章

    133

    瀏覽量

    25350

原文標(biāo)題:再談HLS之任務(wù)級(jí)并行編程

文章出處:【微信號(hào):Lauren_FPGA,微信公眾號(hào):FPGA技術(shù)驛站】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    基于HLS任務(wù)級(jí)并行編程

    ? HLS任務(wù)級(jí)編程第一篇文章可看這里: HLS任務(wù)級(jí)并行
    的頭像 發(fā)表于 07-27 09:22 ?1801次閱讀
    基于<b class='flag-5'>HLS</b>之<b class='flag-5'>任務(wù)</b><b class='flag-5'>級(jí)</b><b class='flag-5'>并行</b>編程

    Python中的并行性和并發(fā)性分析

      在Python編程語(yǔ)言當(dāng)中,很多人對(duì)Python中的并行性和并發(fā)性不了解。今天我們將討論python中的并發(fā)和并行性www.zpedu.com。在這里,我們將研究Python的多線程,多處
    發(fā)表于 08-21 17:45

    阻止任務(wù)級(jí)別并行性的常見(jiàn)情況

    粗粒度并行優(yōu)化的任務(wù)級(jí)流水阻止任務(wù)級(jí)別并行性的常見(jiàn)情況
    發(fā)表于 03-09 06:58

    淺析java異步回調(diào)和同步回調(diào)

    CompletableFuture為什么它在依賴于不同的異類(lèi)異步執(zhí)行任務(wù)的交互的編程系統(tǒng)中如此有用?以及它如何補(bǔ)充fork / join樣式的并行性?
    發(fā)表于 10-19 07:13

    HLS-1Hin人工智能訓(xùn)練系統(tǒng)

    連接器)。外部以太網(wǎng)鏈路可以連接到任何交換層次結(jié)構(gòu)。Suchconfiguration可以進(jìn)行優(yōu)化,以大規(guī)模實(shí)現(xiàn)textra大型模型并行性,并可以輕松處理數(shù)據(jù)并行性或模型和數(shù)據(jù)并行性的組合。 GAUDI
    發(fā)表于 08-04 06:06

    算法隱含并行性的物理模型

    算法隱含并行性的物理模型:利用物理學(xué)原理對(duì)算法的隱含并行性進(jìn)行了分析,提出算法的不確定性和高熵態(tài)是隱含并行性出現(xiàn)的根源,但算法的隱含并行性會(huì)導(dǎo)致算法結(jié)果的不確定
    發(fā)表于 10-21 08:23 ?10次下載

    英特爾架構(gòu)中的多線程優(yōu)化和擴(kuò)展并行性的編程技術(shù)

    有效并行縮減和擴(kuò)展并行性的編程技術(shù)。
    的頭像 發(fā)表于 11-01 06:24 ?2759次閱讀

    矢量化數(shù)據(jù)并行性的程序方面的作用

    矢量化在加速具有算法固有的數(shù)據(jù)并行性的程序方面起著至關(guān)重要的作用。 英特爾C ++編譯器提供了顯式的矢量編程方法,以提高性能。
    的頭像 發(fā)表于 11-06 06:31 ?2671次閱讀

    有關(guān) Dataflow 指令的原理

    在本文中,我們將重點(diǎn)放在如何能夠在不需要特殊的庫(kù)或類(lèi)的情況下修改代碼風(fēng)格以實(shí)現(xiàn)C代碼實(shí)現(xiàn)并行性。Xilinx HLS 編譯器的顯著特征是能夠?qū)?b class='flag-5'>任務(wù)級(jí)別的并行性和流水線與可尋址的存儲(chǔ)器
    的頭像 發(fā)表于 02-09 10:34 ?1682次閱讀

    如何在不需要特殊庫(kù)或類(lèi)的情況下實(shí)現(xiàn)C代碼并行性?

    提取實(shí)現(xiàn)任務(wù)級(jí) (task_level) 的硬件并行算法是設(shè)計(jì)高效的HLS IP內(nèi)核的關(guān)鍵。 在本文中,我們將重點(diǎn)放在如何能夠在不需要特殊的庫(kù)或類(lèi)的情況下修改代碼風(fēng)格以實(shí)現(xiàn)C代碼實(shí)現(xiàn)
    的頭像 發(fā)表于 02-11 11:05 ?1714次閱讀
    如何在不需要特殊庫(kù)或類(lèi)的情況下實(shí)現(xiàn)C代碼<b class='flag-5'>并行性</b>?

    Dataflow | 粗粒度并行優(yōu)化的任務(wù)級(jí)流水

    在本文中,我們將重點(diǎn)放在如何能夠在不需要特殊的庫(kù)或類(lèi)的情況下修改代碼風(fēng)格以實(shí)現(xiàn)C代碼實(shí)現(xiàn)并行性。Xilinx HLS 編譯器的顯著特征是能夠?qū)?b class='flag-5'>任務(wù)級(jí)別的并行性和流水線與可尋址的存儲(chǔ)器
    發(fā)表于 03-02 06:19 ?12次下載
    Dataflow | 粗粒度<b class='flag-5'>并行</b>優(yōu)化的<b class='flag-5'>任務(wù)</b><b class='flag-5'>級(jí)</b>流水

    HPEC應(yīng)用子程序線程推測(cè)并行性實(shí)驗(yàn)分析

    推測(cè)的剖析機(jī)制及核心數(shù)據(jù)結(jié)構(gòu),選取HPEC中7個(gè)具有代表的程序,挖掘其子程序級(jí)的最大潛在并行性并結(jié)合線程粒度、并行覆蓋率、子程序調(diào)用次數(shù)、數(shù)據(jù)依賴及源碼,對(duì)程序的加速比進(jìn)行分析。實(shí)驗(yàn)
    發(fā)表于 03-30 13:52 ?8次下載
    HPEC應(yīng)用子程序線程推測(cè)<b class='flag-5'>并行性</b>實(shí)驗(yàn)分析

    通過(guò)利用現(xiàn)代處理器架構(gòu)的并行性提高SDR的性能

      MVR 通過(guò)利用現(xiàn)代處理器架構(gòu)提供的多維并行性來(lái)解決這個(gè)問(wèn)題,從而在不降低基于軟件的設(shè)備的積極優(yōu)勢(shì)的情況下推動(dòng)性能提升一個(gè)數(shù)量級(jí)。通過(guò)利用一種以便攜和可編程方式保持性能的方法,MVR 代表了下一代基帶設(shè)計(jì)的未來(lái)。
    的頭像 發(fā)表于 06-14 16:12 ?1442次閱讀
    通過(guò)利用現(xiàn)代處理器架構(gòu)的<b class='flag-5'>并行性</b>提高SDR的性能

    研討會(huì):如何利用最新Vitis HLS提高任務(wù)級(jí)并行性?

    當(dāng)前在 AI、無(wú)線、視頻/圖像處理、醫(yī)療和消費(fèi)領(lǐng)域使用的算法,復(fù)雜已顯著提升。 Vitis? 高層次綜合 (HLS) 可通過(guò)在選定的 AMD 器件上將 C/C++ 代碼綜合為可編程邏輯的 RTL
    的頭像 發(fā)表于 07-05 08:15 ?1044次閱讀
    研討會(huì):如何利用最新Vitis <b class='flag-5'>HLS</b>提高<b class='flag-5'>任務(wù)</b><b class='flag-5'>級(jí)</b><b class='flag-5'>并行性</b>?

    Vitis HLS:使用任務(wù)級(jí)并行性的高性能設(shè)計(jì)

    電子發(fā)燒友網(wǎng)站提供《Vitis HLS:使用任務(wù)級(jí)并行性的高性能設(shè)計(jì).pdf》資料免費(fèi)下載
    發(fā)表于 09-13 17:21 ?0次下載
    Vitis <b class='flag-5'>HLS</b>:使用<b class='flag-5'>任務(wù)</b><b class='flag-5'>級(jí)</b><b class='flag-5'>并行性</b>的高性能設(shè)計(jì)