chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

hash算法在FPGA中的實現(xiàn)(1)

CHANBAEK ? 來源: FPGA的現(xiàn)今未 ? 作者: FPGA的現(xiàn)今未 ? 2023-09-07 17:01 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

FPGA的設計中,尤其是在通信領域,經(jīng)常會遇到hash算法的實現(xiàn)。hash算法在FPGA的設計中,它主要包括2個部分,第一個就是如何選擇一個好的hash函數(shù),減少碰撞;第二個就是如何管理hash表。本文不討論hash算法本身,僅說明hash表的管理。

原理

先對齊本文中要說明的幾個概況,如下圖所示,hash函數(shù)的輸入稱為key,hash函數(shù)的輸出,稱為hash值,或者index。以上稱呼可能不標準,但是不影響對方案的理解即可。

圖片

hash算法的實現(xiàn)可以用一個很簡單的圖來表示,如下圖所示,對輸入的key做hash運算后,得到index,以index作為地址,把key值存入到其index對應的hash表中。同理,在查詢的時候,也是先對key計算hash值,然后查hash表,如果hash表無效,說明沒有命中,如果有效,則判斷hash表中的key和輸入的key是否相等,相等則為命中。

圖片

舉2個例子簡單說明下,假定key5,計算出index = 0,但是add0為空,所以key5沒有命中,或者說,hash表中沒有key5這個元素。假定key6,計算hash后得到index = 3,hash表addr3中有數(shù)據(jù),但是存放在addr3中的數(shù)據(jù)為key4,不等于key6,所以key6也沒有命中。

hash表構建

上圖hash表的示意圖其實已經(jīng)說明了一個簡單的hash表的構建,在FPGA內(nèi)部,常用BRAM來存放一個hash表,上圖所示hash表的深度為N,每個hash表中存放一個key。假如key的位寬為50個bit,hash后的index位寬為9bit。那么hash表就需要一個64bit*512表項,消耗1個M36K(以xilinx的資源為例)。

但是事情肯定沒有這么簡單,因為只要有hash的地方就有沖突。那么下一步就是要解決hash沖突的問題。

解決hash沖突最常見的方案就是hash鏈表,如下圖所示,key1、key5、key7具有相同的hash值,可以通過一個鏈表的形式將他們串聯(lián)在一起。這種方案在軟件是可能是非常好實現(xiàn)的,但是在FPGA里實現(xiàn)可能就比較難了,比如鏈表的最大深度為多少呢?每個hash桶的鏈表是單獨存放還是所有的存放在一起呢?

圖片

我們知道一個好的hash函數(shù),應該是要盡可能地減少沖突的。如果從算法上我們證明了,我們的沖突最多不超過4次,那就有更加簡單的方案來實現(xiàn)這個hash表了。

我們把hash表做一個改進,如下圖所示,我們每個hash桶中,不再是存放一個key,而是最多存放4個key,也就是不用鏈表來解決hash沖突問題。

圖片

這樣做的好處有2個,一個是沒有了對鏈表的處理,比較簡單,第二個就是處理速度快,一次讀操作就把具有相同hash值的所有key值全部讀出來進行比較。那這種方案在FPGA的ram中如何實現(xiàn)呢?還是以key的寬度為50bit,index的位寬為9bit為例。

一個桶的內(nèi)部結(jié)果如下圖所示,每個key還需要1bit指示是否有效,那么4個key需要514 = 204bit,用一個216bit512的BRAM即可,消耗2.5個M36K。

圖片

如果key的位寬非常大,比如是五元組,一共104bit,如果用上述的方案,那就是105*4 = 420bit,那就需要6個M36K來存放??梢姡琸ey的位寬越大,消耗的資源就越多。

hash表的優(yōu)化

如果我的設計,要的就是速度,對資源的消耗不是很關系,那用上述的結(jié)構即可,如果我的設計可以犧牲一點點性能,但是需要減少資源的消耗,怎么辦呢?

我們可以把hash桶的內(nèi)部結(jié)構修改下,由拼位寬改成拼深度,如下圖所示:

圖片

分別以50bit和104bit的key為例,對于50bit的key,需要的存儲為64bit5124,需要4個M36K。對于104bit的key,需要的存儲為108bit5124,需要6塊??此菩枰木彺娌]有減少,有的情況下甚至增加了。

如果hash值是8bit了,那情況就不一樣了。因為hash值為8bit和9bit的時候,BRAM的深度的增加,并沒有帶來額外的資源消耗,但是表項的寬度卻只有原來的一半,資源也就可以減少一半。比如原來hash表位 288bit256,需要消耗4個M36K,采用上述的優(yōu)化方案后,表項變成144512,只需要消耗2個M36K。

除了上述的對hash桶的改進外,有時候可以同時拼寬度和深度,如下圖所示:

圖片

總結(jié)

hash表的設計,需要兼顧資源和性能問題。主要的考慮點就是充分利用BRAM 的特性來實現(xiàn)資源和性能的平衡。

圖片

當然,hash表也可以不放在BRAM中,存放在DDR里,那就演變成另外一個話題,如何高效地讀寫DDR中的hash表了。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1654

    文章

    22273

    瀏覽量

    629916
  • 通信
    +關注

    關注

    18

    文章

    6312

    瀏覽量

    139525
  • 函數(shù)
    +關注

    關注

    3

    文章

    4405

    瀏覽量

    66795
  • Hash算法
    +關注

    關注

    0

    文章

    43

    瀏覽量

    7603
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    SM4算法實現(xiàn)分享(一)算法原理

    ,Xi、Yi、rki為字,i=0,1,2,…,31。則本算法的加密實現(xiàn)為: 本算法的解密實現(xiàn)與加密
    發(fā)表于 10-30 08:10

    復雜的軟件算法硬件IP核的實現(xiàn)

    Compiler)將算法編譯轉(zhuǎn)化為可綜合的 Verilog 文本,進而通過 FPGA 硬件上實現(xiàn)算法。
    發(fā)表于 10-30 07:02

    如何利用Verilog HDLFPGA實現(xiàn)SRAM的讀寫測試

    本篇將詳細介紹如何利用Verilog HDLFPGA實現(xiàn)SRAM的讀寫測試。SRAM是一種非易失性存儲器,具有高速讀取和寫入的特點。FPGA
    的頭像 發(fā)表于 10-22 17:21 ?3930次閱讀
    如何利用Verilog HDL<b class='flag-5'>在</b><b class='flag-5'>FPGA</b>上<b class='flag-5'>實現(xiàn)</b>SRAM的讀寫測試

    PathFinderFPGA的角色與缺陷

    自 1990 年代末以來,PathFinder 一直是 FPGA 布線(routing)階段的主力算法,為設計工具提供“能連通又不重疊”的路徑規(guī)劃方案。
    的頭像 發(fā)表于 10-15 10:44 ?285次閱讀
    PathFinder<b class='flag-5'>在</b><b class='flag-5'>FPGA</b><b class='flag-5'>中</b>的角色與缺陷

    25年11月上海FPGA算法實現(xiàn)與應用技術高級研修分享

    設計仿真能力。   深入學習數(shù)據(jù)流,不僅是算法FPGA&DSP設計者的需求,對于從事接口設計工作、軟件配置工作、系統(tǒng)測試工作,項目管理工作的同事,也同樣有非常重要的意義。實際工作
    發(fā)表于 10-11 11:55

    基于FPGA實現(xiàn)FOC算法之PWM模塊設計

    哈嘍,大家好,從今天開始正式帶領大家從零到一,FPGA平臺上實現(xiàn)FOC算法,整個算法的框架如下圖所示,如果大家對
    的頭像 發(fā)表于 07-17 15:21 ?3101次閱讀
    基于<b class='flag-5'>FPGA</b><b class='flag-5'>實現(xiàn)</b>FOC<b class='flag-5'>算法</b>之PWM模塊設計

    FPGA機器學習的具體應用

    ,越來越多地被應用于機器學習任務。本文將探討 FPGA 機器學習的應用,特別是加速神經(jīng)網(wǎng)絡推理、優(yōu)化
    的頭像 發(fā)表于 07-16 15:34 ?2608次閱讀

    基于Matlab與FPGA的雙邊濾波算法實現(xiàn)

    前面發(fā)過中值、均值、高斯濾波的文章,這些只考慮了位置,并沒有考慮相似度。那么雙邊濾波來了,既考慮了位置,有考慮了相似度,對邊緣的保持比前幾個好很多,當然實現(xiàn)上也是復雜很多。本文將從原理入手,采用Matlab與FPGA設計實現(xiàn)雙邊
    的頭像 發(fā)表于 07-10 11:28 ?4041次閱讀
    基于Matlab與<b class='flag-5'>FPGA</b>的雙邊濾波<b class='flag-5'>算法</b><b class='flag-5'>實現(xiàn)</b>

    基于FPGA的壓縮算法加速實現(xiàn)

    本設計,計劃實現(xiàn)對文件的壓縮及解壓,同時優(yōu)化壓縮中所涉及的信號處理和計算密集型功能,實現(xiàn)對其的加速處理。本設計的最終目標是證明充分并行化的硬件體系結(jié)構
    的頭像 發(fā)表于 07-10 11:09 ?2058次閱讀
    基于<b class='flag-5'>FPGA</b>的壓縮<b class='flag-5'>算法</b>加速<b class='flag-5'>實現(xiàn)</b>

    FPGA開發(fā)任務

    我想請人幫我開發(fā)一款基于FPGA的產(chǎn)品,把我寫好MATLAB代碼固化FPGA,實現(xiàn)算法加速和
    發(fā)表于 03-15 10:19

    PID控制算法的C語言實現(xiàn):PID算法原理

    工業(yè)應用 PID 及其衍生算法是應用最廣泛的算法之一,是當之無愧的萬能算法,如果能夠熟練掌握 PID
    發(fā)表于 02-26 15:24

    FPGA磁致伸縮位移傳感器的應用

    FPGA磁致伸縮位移傳感器中用于信號處理、數(shù)據(jù)采集等,其高并行處理、可編程性提升了傳感器速度、精度,支持復雜算法,實現(xiàn)實時控制,優(yōu)化系統(tǒng)響應,是傳感器高效、精準、智能化的核心。
    的頭像 發(fā)表于 02-17 14:48 ?681次閱讀

    FPGAAI方面有哪些應用

    提供了強有力的支持。 一、FPGA 深度學習的應用 深度學習是 AI 的重要分支,涉及海量的數(shù)據(jù)運算。FPGA 能夠針對深度學習算法
    的頭像 發(fā)表于 01-06 17:37 ?2067次閱讀

    FPGA 實時信號處理應用 FPGA圖像處理的優(yōu)勢

    優(yōu)勢之一是其并行處理能力。與傳統(tǒng)的CPU或GPU相比,FPGA可以同時執(zhí)行多個操作,這在圖像處理尤為重要,因為圖像處理通常涉及大量的并行數(shù)據(jù)流和復雜的算法。例如,進行圖像濾波或邊緣
    的頭像 發(fā)表于 12-02 10:01 ?2335次閱讀

    FPGA 人工智能的應用

    FPGA是一種可編程的半導體設備,它允許工程師在生產(chǎn)后重新配置硬件邏輯。與傳統(tǒng)的ASIC(應用特定集成電路)相比,FPGA具有更高的靈活性,可以根據(jù)不同的應用需求進行編程和重配置。這種靈活性使得FPGA成為
    的頭像 發(fā)表于 12-02 09:53 ?2973次閱讀