chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

隊列管理電路-上篇

jf_78858299 ? 來源:芯工阿文 ? 作者:芯工阿文 ? 2023-01-21 16:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在數(shù)字芯片設(shè)計中,幾乎所有模塊都會涉及到隊列管理。輸入輸出的管理、不同數(shù)據(jù)流的調(diào)度、亂序數(shù)據(jù)的重排序、不同模塊的同步處理、資源管理,等等,均會涉及到隊列管理邏輯。如何選擇合適的硬件邏輯,對模塊的微架構(gòu)有較大的影響,需要基于具體需求做綜合權(quán)衡后再做選擇。本文簡單羅列幾種隊列管理邏輯,均是個人曾經(jīng)實現(xiàn)過的。

1 最簡單的隊列-FIFO

First In First Out,用于輸入輸出之間的緩沖,吸收輸入側(cè)的突發(fā)流量。實現(xiàn)也比較簡單,深度固定的環(huán)形buffer,使用讀寫指針進(jìn)行管理。需要注意的是,讀寫指針的管理,F(xiàn)IFO為空和FIFO為滿,讀寫指針均是相等的,需使用另外的標(biāo)號進(jìn)行處理。也有其余的實現(xiàn)方式,比如移位寄存器。

圖片

使用SpinalHDL實現(xiàn)FIFO的代碼如下。輸入輸出的push/pop,使用了valid/ready握手的Stream接口;使用Mem定義環(huán)形buffer,pushPtr/popPtr分別對應(yīng)讀寫指針;特別關(guān)注risingOccupancy信號,push和pop沒有同時發(fā)生時,更新為push,該信號可用于標(biāo)記FIFO的空滿狀態(tài)。讀寫指針相等且該信號為低,表示FIFO為空;讀寫指針相等且該信號為高,表示FIFO為滿。

// spinal/lib/Stream.scala
val io = new Bundle {
val push = slave Stream (dataType)
val pop = master Stream (dataType)
val flush= in Bool() default(False)
val occupancy = out UInt (log2Up(depth + 1) bits)
val availability = out UInt (log2Up(depth + 1) bits)
}
val ram = Mem(dataType, depth)
val pushPtr = Counter(depth)
val popPtr = Counter(depth)
val ptrMatch = pushPtr === popPtr
val risingOccupancy = RegInit(False)
val pushing = io.push.fire
val popping = io.pop.fire
val empty = ptrMatch & !risingOccupancy
val full = ptrMatch & risingOccupancy

io.push.ready := !full
io.pop.valid := !empty & !(RegNext(popPtr.valueNext === pushPtr, False) & !full) //mem write to read propagation
io.pop.payload := ram.readSync(popPtr.valueNext)

when(pushing =/= popping) {
risingOccupancy := pushing
}
when(pushing) {
ram(pushPtr.value) := io.push.payload
pushPtr.increment()
}
when(popping) {
popPtr.increment()
}

2 共享Buffer的多隊列FIFO

考慮一個場景,輸入的請求需要分發(fā)至不同的輸出側(cè),下游存在反壓。簡單實現(xiàn),基于不同的輸出分別設(shè)置FIFO,但可能存在資源浪費,某些數(shù)據(jù)流場景FIFO的利用率不高,尤其是在數(shù)據(jù)位寬較大的場景。

共享Buffer的多隊列FIFO,每個隊列的FIFO還是按照簡單隊列進(jìn)行管理,基于每個隊列管理讀寫指針。但是,不再使用環(huán)形Buffer,每個buffer entry記錄其隊列號、隊列指針和Payload,如下圖所示。對于Payload位寬較小的場景,收益不大,若存在大位寬時,可有效提升Buffer的利用率。

圖片

將數(shù)據(jù)寫入Buffer時,先找一個Free Entry(Vliad為低),將該數(shù)據(jù)所屬的隊列號及其對應(yīng)的寫指針、Payload寫入到對應(yīng)的Entry內(nèi)。讀取Buffer時,則使用隊列號和讀指針進(jìn)行匹配,將命中的Entry內(nèi)容讀取出來。若讀寫指針?biāo)苊枋龅姆秶萣uffer深度大,則不需要額外的標(biāo)號記錄空滿狀態(tài)。存在的問題,若buffer深度較大或隊列數(shù)量較多,隊列號和指針匹配邏輯會占用較多的資源。

3 重力FIFO

類似于排隊,從隊頭開始尋找可輸出的Entry,調(diào)度輸出并留下空位,后面的Entry再往前排,新輸入的請求則放置在隊列尾。如圖所示,存在有效數(shù)據(jù)的Entry,其前面的Entry被調(diào)度后留下空位,該Entry就像受到重力作用往下掉,因此我也稱之為重力FIFO。

圖片

該結(jié)構(gòu)的問題,存在大量的移位,設(shè)想Payload位寬為32bit,深度為32,將近1kbit的寄存器在做移位處理,其功耗可想而知。但是對于一些具體場景,還是能夠帶來一些收益的,如隊列數(shù)量較大,甚至大于buffer深度;至于Payload位寬較大的場景,可考慮二次索引處理,Payload保存至另外的buffer,該結(jié)構(gòu)內(nèi)的Payload Entry則緩存其索引信息。

4 Bitmap排序

先來看一個結(jié)構(gòu),深度為8的隊列,每個Entry使用8bit緩存8個Entry的狀態(tài),若該狀態(tài)信號滿足觸發(fā)條件,如全為0,則調(diào)度該Entry內(nèi)容。

Bitmap排序就是使用了這一結(jié)構(gòu),在輸入請求進(jìn)入隊列后,檢查當(dāng)前隊列狀態(tài),存在關(guān)聯(lián)請求的Entry位置置位為1,否則為0。若存在請求輸出之后,所有Entry狀態(tài)的對應(yīng)位置均設(shè)為0。若某個Entry的狀態(tài)信號全為0,則請求調(diào)度輸出。其數(shù)據(jù)結(jié)構(gòu)如下圖所示,其中0/1僅作為狀態(tài)信號的示例,并非實際場景。

圖片

該結(jié)構(gòu)可以實現(xiàn)較為靈活的排序,隊列的數(shù)量幾乎不會受到限制,進(jìn)入隊列的請求,也可修改其Mask Bitmap,動態(tài)刷新其先后關(guān)系。與重力FIFO類似,無需額外的數(shù)據(jù)結(jié)構(gòu)保存其隊列關(guān)系,而是直接體現(xiàn)在原有結(jié)構(gòu)內(nèi)。存在的問題,隊列深度會受到面積限制,面積與深度的平方成正比;另外,在動態(tài)更新Mask Bitmap之后,某些實現(xiàn)可能無法保證先后關(guān)系。

面積問題可以考慮用分級處理。如需實現(xiàn)256深度的隊列,其Mask Bitmap需要65536個寄存器實現(xiàn)Mask Bitmap。分解為8個32深度的隊列,需要的寄存器數(shù)量為8192;分解為16個16深度的隊列,寄存器數(shù)量為4096。

5 小結(jié)

隊列管理電路還有一個比較常見的實現(xiàn),鏈表。在亂序數(shù)據(jù)的重排序、資源管理等等方面,通常會用鏈表實現(xiàn),與上幾個結(jié)構(gòu)相比,鏈表會復(fù)雜一些。該部分將在下篇描述。

除最簡單的FIFO之外,其余幾個都沒有代碼,如各位要有興趣,請留言,我可以再嘗試寫一些Spinal代碼實現(xiàn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片設(shè)計
    +關(guān)注

    關(guān)注

    15

    文章

    1147

    瀏覽量

    56617
  • 隊列管理
    +關(guān)注

    關(guān)注

    0

    文章

    5

    瀏覽量

    6383
  • 數(shù)字芯片
    +關(guān)注

    關(guān)注

    1

    文章

    120

    瀏覽量

    19046
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    NVME控制器之隊列管理模塊

    隊列管理模塊是整個NVMe Host控制器的核心模塊,該模塊實現(xiàn)了提交隊列與完成隊列管理,多隊列請求的仲裁判決等功能。
    發(fā)表于 05-03 20:19

    RDMA設(shè)計17:隊列管理模塊設(shè)計2

    。 (2)接收隊列 接收隊列由一個接收隊列管理單元組成。與發(fā)送隊列類似的是,接收隊列管理單元也由若干表單構(gòu)成,其中包括 RQ1 表單和用戶
    發(fā)表于 01-04 14:54

    RDMA設(shè)計18:隊列管理模塊設(shè)計3

    處理單元組成。完成條目解析單元中只設(shè)置了一個虛擬完成隊列,使用這樣的結(jié)構(gòu)設(shè)計原因有三。 一是當(dāng)完成條目狀態(tài)為正常完成時,只需要通知接受接收隊列管理單元釋放對應(yīng)的發(fā)送隊列資源即可。當(dāng)完成條目狀態(tài)異常
    發(fā)表于 01-05 09:04

    RDMA設(shè)計26:隊列管理模塊設(shè)計之接收隊列模塊詳細(xì)分析

    本文主要交流設(shè)計思路,在本博客已給出相關(guān)博文100多篇,希望對初學(xué)者有用。注意這里只是拋磚引玉,切莫認(rèn)為參考這就可以完成商用IP設(shè)計。 (2)接收隊列 接收隊列由一個接收隊列管理單元組成。與發(fā)送
    發(fā)表于 01-22 09:03

    主動隊列管理建模及最優(yōu)控制策略

    主動隊列管理建模及最優(yōu)控制策略針對主動隊列管理(AQM)研究中缺乏系統(tǒng)的理論分析的問題,引入最優(yōu)控制理論進(jìn)行分析,得到了主動隊列管理的數(shù)學(xué)模型,該模型包括兩個差分方程,分別描述隊列長度
    發(fā)表于 06-14 00:14

    FreeRTOS學(xué)習(xí)筆記(六)——隊列管理

    FreeRTOS學(xué)習(xí)筆記(六)——隊列管理
    發(fā)表于 09-28 14:07

    FreeRTOS學(xué)習(xí)筆記(六)——隊列管理

    FreeRTOS學(xué)習(xí)筆記(六)——隊列管理
    發(fā)表于 10-21 20:40

    Agilent TCP和隊列管理

    TCP和隊列管理
    發(fā)表于 10-31 09:08

    一種改進(jìn)的主動隊列管理算法

    主動隊列管理是實現(xiàn)網(wǎng)絡(luò)擁塞控制的重要技術(shù),但是多數(shù)主動隊列管理算法如隨機早期檢(RED)都存在對參數(shù)依賴性強的問題。針對RED算法中平均隊列長度不能完全反映網(wǎng)絡(luò)擁塞狀況的
    發(fā)表于 04-13 09:08 ?14次下載

    網(wǎng)絡(luò)中常用的隊列管理方法比較

    本文主要介紹了網(wǎng)絡(luò)中常用的兩種隊列管理方法:先進(jìn)先出(FIFO)和隨機提前檢測(RED),并且通過實驗比較了這兩種隊列管理方法在解決網(wǎng)絡(luò)擁塞控制方面的表現(xiàn),體現(xiàn)了研究
    發(fā)表于 05-25 11:24 ?9次下載

    主動隊列管理建模及最優(yōu)控制策略

    針對主動隊列管理(AQM)研究中缺乏系統(tǒng)的理論分析的問題,引入最優(yōu)控制理論進(jìn)行分析,得到了主動隊列管理的數(shù)學(xué)模型,該模型包括兩個差分方程,分別描述隊列長度和平均隊列
    發(fā)表于 05-25 21:44 ?17次下載

    一種基于速率的公平隊列管理算法

    針對主動隊列管理算法普遍存在的公平性問題,提出基于速率的公平隊列管理算法RFED。該算法根據(jù)分組的到達(dá)速率調(diào)節(jié)丟包率,將隊列的到達(dá)速率控制在鏈路的服務(wù)速率下,根據(jù)
    發(fā)表于 10-04 14:11 ?15次下載

    隊列管理電路-下篇

    前文聊了隊列管理的幾種典型電路,硬件邏輯簡單,代碼實現(xiàn)時容易操作。鏈表也是隊列管理的常用電路,相比前文的幾種結(jié)構(gòu),會稍微復(fù)雜一些。
    的頭像 發(fā)表于 01-21 17:11 ?1309次閱讀
    <b class='flag-5'>隊列管理</b><b class='flag-5'>電路</b>-下篇

    NVME控制器之隊列管理模塊

    隊列管理模塊是整個NVMe Host控制器的核心模塊,該模塊實現(xiàn)了提交隊列與完成隊列管理,多隊列請求的仲裁判決等功能。
    的頭像 發(fā)表于 05-03 15:32 ?512次閱讀
    NVME控制器之<b class='flag-5'>隊列管理</b>模塊

    RDMA設(shè)計24:隊列管理模塊設(shè)計

    隊列管理模塊采用管理與存儲分離的結(jié)構(gòu)進(jìn)行設(shè)計,由發(fā)送隊列存儲、發(fā)送隊列管理、接收隊列管理、完成條目解析、異常完成條目處理和 Round-Ro
    的頭像 發(fā)表于 01-20 11:45 ?990次閱讀
    RDMA設(shè)計24:<b class='flag-5'>隊列管理</b>模塊設(shè)計