chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

如何在不改變RTL代碼的情況下,優(yōu)化FPGA HLS設計

454398 ? 來源:賽靈思中文社區(qū) ? 作者:賽靈思中文社區(qū) ? 2020-12-20 11:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

用軟件從 C 轉化來的 RTL 代碼其實并不好理解。今天我們就來談談,如何在不改變 RTL 代碼的情況下,提升設計性能。

本項目所需應用與工具:賽靈思HLS、Plunify Cloud 以及 InTime。

前言
高層次的設計可以讓設計以更簡潔的方法捕捉,從而讓錯誤更少,調試更輕松。然而,這種方法最受詬病的是對性能的犧牲。在復雜的 FPGA 設計上實現(xiàn)高性能,往往需要手動優(yōu)化 RTL 代碼,這也意味著從 C 轉化得到 RTL 基本不可能。其實,使用 FPGA 工具設置來優(yōu)化設計可以最小限度地減少對性能的犧牲,這種方法是存在的。

高效地找到合適的FPGA工具設置
盡管工程師們知道 FPGA 工具的設置,但是這些設置往往并沒有充分利用。一般而言,工具設置只有在出現(xiàn)時序問題的時候才會派上用途。然而,對于已經(jīng)達到性能目標的設計來說,如果繼續(xù)調整工具設計,仍然有10%-50%的性能提升潛力。

真正的難點在于選擇正確的工具設置,畢竟各種 FPGA 工具一般都有有30-70個不同的布局布線設置,可選的設置組合實在是太多了。您可以寫腳本來運行不同的推薦指令/策略。市面上也有工具,來自動管理并運行設計探索。

另一個難點就是不充裕的計算能力。典型的嵌入式應用是在單臺電腦上設計的。運行多個編譯需要更多的計算能力,這就要求更多的時間。如果您可以(使用云計算)并行運行,周轉時間就會變短。

如何優(yōu)化高層次的設計 - “Sobel濾鏡”項目
這是一個用于視屏處理的參考設計,來自賽靈思的官網(wǎng) https://china.xilinx.com/support/documentation/application_notes/xapp890... 。該設計的功能是 Sobel 濾鏡,目標器件是擁有雙核Dual ARM? Cortex?-A9MPCore 的 FPGA。

我們使用賽靈思 HLS 來打開這個設計。

圖一:參考設計– Sobel濾鏡

圖一:參考設計– Sobel濾鏡

它的時鐘周期是5.00ns,也就是200MHz。從下圖的時序預估中可以看出,它離時序目標還差506ps(181MH1),也就是比目標速率還差10%。

圖二:當前時序結果

圖二:當前時序結果

導出成 RTL 項目
不需要改變 C++ 代碼,把設計輸出成一個RTL 的 Vivado 項目。在 “Solution”下面,選擇“Export RTL”。

圖三:從HLS輸出Vivado項目

圖三:從HLS輸出Vivado項目

它會在后臺執(zhí)行 Vivado,并生成一個項目文件(XPR)。它同時也會編譯設計,您應該在控制臺(Console)看到真實的時序細節(jié)。一旦完成,您可以在 /solution/impl/verilog/ 文件夾下找到項目文件。

圖四:Vivado 項目文件

圖四:Vivado 項目文件

找到這個 XPR 文件之后,您可以用 Vivado 打開它來驗證。您將看到生成好的 RTL 源文件。

圖五:從 HLS 生成的 RTL

圖五:從 HLS 生成的 RTL

時序優(yōu)化
下一步,是使用 InTime 設計探索工具,當然,您也可以自己寫腳本來嘗試 Vivado 工具中自帶的指令和策略。請申請 InTime 的免費試用在本地運行,也可以注冊一個 Plunify Cloud 云平臺的賬戶,試用所提供的免費云幣來在云端運行預置好的 FPGA 工具。

啟動 InTime 之后,打開項目文件。在選擇 Vivado 版本時,請使用“相同的”版本。例如,如果您使用2017.3 HLS,請選擇2017.3 Vivado。

選擇“Hot Start”配方(recipe)。此配方包含一系列更具以往其他設計的經(jīng)驗而推薦的策略。

圖六:選擇

圖六:選擇 "Hot Start" 配方

點擊“Start Recipe”來開始優(yōu)化。如果您在云端運行,您應該并行運行多個編譯來減少周轉時間。

優(yōu)化過程和結果
第一輪結束之后 (“Hot Start”配方),最好的結果是“hotstart_1”策略。然而,它仍然距離目標時序90ns。

我們在“HotStart_1”的結果上使用了第二個配方,叫做“Extra Opt Exploration”。這一輪將集中優(yōu)化關鍵的路徑。這是一次迭代優(yōu)化,并且只要仍有提升,就不斷地重復自己。如果達到時序目標或者不再提升的時候,它就會停止。

圖七:僅通過工具設置完成時序收斂

圖七:僅通過工具設置完成時序收斂

經(jīng)過兩輪優(yōu)化,總共15此編譯后,設計達到了目標時序,200MHz。而這一切完全沒有修改 RTL 源代碼。

讓性能更進一步
讓性能更進一步需要各方面的優(yōu)化 – 結構設計、代碼和工具。工具設置的探索可以克服高層次設計的性能犧牲,并且不會讓生產(chǎn)效率的好處減少。對于高層次設計的工程師來說,這是一種共贏。

編輯:hfy


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1645

    文章

    22050

    瀏覽量

    618550
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    何在Unified IDE中創(chuàng)建視覺庫HLS組件

    最近我們分享了開發(fā)者分享|AMD Vitis HLS 系列 1 - AMD Vivado IP 流程(Vitis 傳統(tǒng) IDE)和開發(fā)者分享|AMD Vitis HLS 系列 2:AMD
    的頭像 發(fā)表于 07-02 10:55 ?492次閱讀
    如<b class='flag-5'>何在</b>Unified IDE中創(chuàng)建視覺庫<b class='flag-5'>HLS</b>組件

    FX2LP如何在不更改硬件的情況下對其進行重新編程?

    我正在使用 FX2LP/ CY7C68013A-128AXC設備(定制板),我有一些問題需要您的幫助。 1如果我的 EEPROM 已經(jīng)有固件并且正在運行,如何在不更改硬件的情況下對其進行重新
    發(fā)表于 05-06 11:16

    Vivado HLS設計流程

    直接使用C、C++或 System C 來對 Xilinx 系列的 FPGA 進行編程,從而提高抽象的層級,大大減少了使用傳統(tǒng) RTL描述進行 FPGA 開發(fā)所需的時間。
    的頭像 發(fā)表于 04-16 10:43 ?739次閱讀
    Vivado <b class='flag-5'>HLS</b>設計流程

    LPC1227FBD48如何在沒有SDK的情況下配置FreeRTOS?

    我想在基于 LPC1227FBD48 系列的現(xiàn)有項目中使用 FreeRTOS,但我們沒有可用于控制器的 SDK。我們?nèi)?b class='flag-5'>何在沒有 SDK 的情況下配置 FreeRTOS。
    發(fā)表于 04-02 06:33

    LMX2595在不改變設定參數(shù)的情況下,能實現(xiàn)多寬范圍的倍頻?

    我想問一LMX2595在倍頻的過程中,在不改變設定參數(shù)的情況下,能實現(xiàn)多寬范圍的倍頻?
    發(fā)表于 12-12 07:05

    助力AIoT應用:在米爾FPGA開發(fā)板上實現(xiàn)Tiny YOLO V4

    、 使用 Vivado 綜合與部署 Verilog 到 米爾的ZU3EG FPGA開發(fā)板當 HLS 生成的 RTL 代碼準備就緒后,可以使用 Vivado 將模型部署到
    發(fā)表于 12-06 17:18

    請問ADS1292R如何在MCU休眠的情況下通過脫落檢測喚醒MCU?

    請問ADS1292R如何在MCU休眠的情況下通過脫落檢測喚醒MCU?
    發(fā)表于 11-28 08:03

    AIC3106如何在不改變BCLK和LRCLK的情況下,能夠調好?

    你好,請問:AIC3106現(xiàn)在配置為從設備、DAC采樣率為16K、數(shù)據(jù)寬度為32位?,F(xiàn)在主設備給的BCLK是2048K,LRCLK為16K,播放現(xiàn)在有問題,如何在不改變BCLK和LRCLK的情況下,能夠調好?
    發(fā)表于 10-28 07:06

    有沒有什么辦法在不改變電源和功率的情況下來解決TPA311XD2失真的問題?

    換了大電源之后就沒有失真了,有沒有什么辦法在不改變電源和功率的情況下來解決芯片失真的問題,謝謝?。?!
    發(fā)表于 10-25 08:34

    TAS5548如何在輸入信號改變情況下,讓38和39這兩個引腳輸出的PWM產(chǎn)生變化?

    請問如何調整,才能在輸入信號改變情況下,38和39這兩個引腳輸出的PWM產(chǎn)生變化?通過配置I2C可以調整這三個AD Mode, BD Mode and Ternary Mode模式,但是輸入
    發(fā)表于 10-17 08:01

    PCM1795如何在通電的情況下切換PCM模式和DSD模式?

    Ti工程師您好,項目上有用到PCM1795這枚芯片,因為它具有DSD解碼與PCM解碼功能,之前沒有使用過類似產(chǎn)品 有兩個問題請教下: 1、用MCU初始化PCM1795讓它能正常工作,至少需要配置哪幾個相關寄存器 2、如何在通電的情況下 切換PCM模式和DSD模式或者說
    發(fā)表于 09-29 06:00

    在不犧牲尺寸的情況下提高脈搏血氧儀溶液的性能

    電子發(fā)燒友網(wǎng)站提供《在不犧牲尺寸的情況下提高脈搏血氧儀溶液的性能.pdf》資料免費下載
    發(fā)表于 09-21 10:54 ?0次下載
    在不犧牲尺寸的<b class='flag-5'>情況下</b>提高脈搏血氧儀溶液的性能

    LM324用10V單電源,加入正弦波放大后飽和只有7.4V,如何在不改變10V電源的情況使之能放大成9V?

    LM324用10V單電源,加入正弦波放大后飽和只有7.4V,能有辦法在不改變10V電源的情況使之能放大成9V嗎
    發(fā)表于 09-12 06:26

    在不影響性能或占用空間的情況下隔離您的CAN系統(tǒng)

    電子發(fā)燒友網(wǎng)站提供《在不影響性能或占用空間的情況下隔離您的CAN系統(tǒng).pdf》資料免費下載
    發(fā)表于 08-29 10:49 ?0次下載
    在不影響性能或占用空間的<b class='flag-5'>情況下</b>隔離您的CAN系統(tǒng)

    優(yōu)化 FPGA HLS 設計

    優(yōu)化 FPGA HLS 設計 用工具用 C 生成 RTL代碼基本不可讀。以下是如何在
    發(fā)表于 08-16 19:56