以下文章來源于OpenFPGA,作者碎碎思
——來自 Shinshu University 的最新設(shè)計(jì)揭示低位寬算術(shù)硬件化的新途徑
原標(biāo)題:Hardware-Efficient Accurate 4-bit Multiplier for Xilinx 7 Series FPGAs
隨著 IoT、邊緣計(jì)算等應(yīng)用對低位寬、高并行、高效率算術(shù)運(yùn)算的需求攀升,基礎(chǔ)算術(shù)電路,如 4 位乘法,如何在 FPGA 上做到“資源最小化+速度極致”便成為一道新的挑戰(zhàn)。來自日本信州大學(xué)(Shinshu University)研究團(tuán)隊(duì)的最新設(shè)計(jì)中,一個(gè)專為 Xilinx 7 系列 FPGA 量身打造的 4 位乘法器使用了僅 11 個(gè) LUT + 2 個(gè) CARRY4 塊,關(guān)鍵路徑延遲達(dá)到 2.75 ns。這是一次令人印象深刻的工藝優(yōu)化實(shí)踐。
核心成果概括
設(shè)計(jì)使用了 Xilinx 7 系列 FPGA 的 LUT-和-CARRY4 硬件結(jié)構(gòu)。

只有 11 個(gè) LUT + 2 個(gè) CARRY4 模塊即可實(shí)現(xiàn)功能。

關(guān)鍵路徑延遲僅為 2.750 ns。
通過重組 LUT 內(nèi)邏輯函數(shù)、使用 LUT6_2 模式(5 輸入、2 輸出)優(yōu)化資源和速度。

專用于 Xilinx 7 系列,尚未驗(yàn)證其他 FPGA 架構(gòu)。
為什么值得關(guān)注?
低位寬算術(shù)仍然重要:即便是 4 位乘法,在很多應(yīng)用(如量化神經(jīng)網(wǎng)絡(luò)、圖像處理、加速器內(nèi)部更細(xì)粒度模塊)里都是性能瓶頸。資源與延遲的極致優(yōu)化能帶來更高并行度。
研究者還精心設(shè)計(jì)了 CARRY4 的集成方式。CARRY4 是 FPGA Slice 中專用于快速進(jìn)位計(jì)算的硬件結(jié)構(gòu),其延遲遠(yuǎn)低于使用 LUT 構(gòu)建的等效邏輯,因此能夠顯著加速運(yùn)算。設(shè)計(jì)通過利用相鄰 Slice 之間 CARRY4 的硬連線結(jié)構(gòu),實(shí)現(xiàn)了無瓶頸的長進(jìn)位鏈。
LUT + CARRY4 混合使用展示 FPGA 原語優(yōu)化潛力:研究利用 CARRY4 快速傳遞進(jìn)位鏈、使乘法結(jié)構(gòu)更緊湊。
資源 vs 延遲雙向優(yōu)化:減少 LUT 數(shù)量的同時(shí),還縮短了延遲,實(shí)屬少見。
可為各種低位算術(shù)構(gòu)件設(shè)計(jì)提供參考:包括加法器、累加器、量化乘法器、低精度加速模塊等。
設(shè)計(jì)關(guān)鍵技術(shù)細(xì)節(jié)
LUT6_2 模式:在 Xilinx 7 系列中,LUT6_2 提供 5 輸入 + 2 輸出的功能,研究正是利用這一結(jié)構(gòu)最大化邏輯密度。
CARRY4 模塊:專門用于進(jìn)位鏈,延遲低、資源優(yōu)勢明顯。關(guān)鍵路徑中將乘法中 “累加部分” 的進(jìn)位傳遞交給 CARRY4。
邏輯重組:將傳統(tǒng)乘法展開的邏輯組合優(yōu)化,減少 LUT 層級并合理安排路徑,使得關(guān)鍵路徑延遲縮短。
驗(yàn)證與測試:對所有輸入組合進(jìn)行窮舉仿真,確保功能正確。然后在 FPGA 上測量延遲/資源,與其它方案對比。

限制與思考
本設(shè)計(jì)專用于 Xilinx 7 系列,不保證直接遷移到其他系列或廠商 FPGA。
雖優(yōu)化效果顯著,但 4 位乘法的位寬較低,實(shí)際系統(tǒng)中還需考慮數(shù)據(jù)寬度、流水線結(jié)構(gòu)、并行度、資源共享等。
面向更高位寬(8 bit、16 bit)時(shí),邏輯復(fù)雜度、布線擁塞、時(shí)鐘域問題等挑戰(zhàn)明顯增加。
在實(shí)際產(chǎn)品中,除了邏輯與延遲,功耗、可靠性、可測試性、資源可重用性等也需考慮。
應(yīng)用建議
若你正在做 量化神經(jīng)網(wǎng)絡(luò)加速器(如 4 位/8 位乘加),該設(shè)計(jì)思想可用于內(nèi)核優(yōu)化。
在 FPGA 資源緊張的場景下(如低功耗、邊緣設(shè)備),可考慮借鑒 LUT+CARRY 優(yōu)化策略。
在教研/教學(xué)中,該設(shè)計(jì)是“低位寬算術(shù)優(yōu)化”的優(yōu)秀案例,可用于學(xué)生項(xiàng)目或課程設(shè)計(jì)。
如果你使用 Xilinx 7 系列 FPGA,可嘗試基于此設(shè)計(jì)搭建自己的低位乘法核,再擴(kuò)展到加法、累加器、矩陣乘法模塊。
文章鏈接
https://arxiv.org/abs/2510.21533

-
FPGA
+關(guān)注
關(guān)注
1659文章
22363瀏覽量
632915 -
Xilinx
+關(guān)注
關(guān)注
73文章
2195瀏覽量
130539 -
乘法器
+關(guān)注
關(guān)注
9文章
221瀏覽量
38651
原文標(biāo)題:硬件高效乘法器:4 位乘法在 Xilinx FPGA 上只用 11 個(gè) LUT,延遲僅 2.75 ns
文章出處:【微信號:HXSLH1010101010,微信公眾號:FPGA技術(shù)江湖】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
FPGA乘法器設(shè)計(jì)
FPGA乘法器軟核設(shè)計(jì)問題
4位二進(jìn)制乘法器電路
怎么設(shè)計(jì)基于FPGA的WALLACETREE乘法器?
乘法器的基本概念
基于IP核的乘法器設(shè)計(jì)
基于FPGA的WALLACE TREE乘法器設(shè)計(jì)
使用verilogHDL實(shí)現(xiàn)乘法器
乘法器原理_乘法器的作用
基于FPGA的16位乘法器的實(shí)現(xiàn)
FPGA常用運(yùn)算模塊-加減法器和乘法器
FPGA常用運(yùn)算模塊-復(fù)數(shù)乘法器
使用Xilinx 7系列FPGA的四位乘法器設(shè)計(jì)
評論