chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何將算法“翻譯”成Verilog?

ruikundianzi ? 來源:IP與SoC設(shè)計 ? 作者:IP與SoC設(shè)計 ? 2022-11-03 15:38 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

我是一名數(shù)字前端IP設(shè)計工程師,方向為通信芯片IP設(shè)計,我的主要工作就是“翻譯”算法代碼。

經(jīng)典的ASIC開發(fā)流程主要有:

以算法設(shè)計為主導(dǎo)

算法C代碼手工轉(zhuǎn)換為RTL

RTL與算法C代碼生成的測試向量對比進(jìn)行驗證

依賴FPGA做大量實時、現(xiàn)場測試

適合通信信號處理,音視頻處理或圖像處理等產(chǎn)品

我的工作主要就是將算法C代碼手工轉(zhuǎn)換為RTL,尤其是通信芯片的設(shè)計,算法主要是將浮點(diǎn)運(yùn)算近似成定點(diǎn)運(yùn)算,定點(diǎn)的精度決定了系統(tǒng)的性能,所以一種開發(fā)模式就是,用C平臺生成的case數(shù)據(jù)和RTL仿真的數(shù)據(jù)進(jìn)行對比,保證定點(diǎn)化后的仿真性能。

所以對于單個計算模塊的開發(fā)來說,可以說就是體力活了,算法的計算過程已經(jīng)擺在那里,單就是純翻譯。

然而再復(fù)雜的算法,在設(shè)計工程師的眼里,也就是一堆數(shù)學(xué)公式,算法設(shè)計者也應(yīng)該盡量做簡單的算法實現(xiàn),比如除法,求冪次方、開平方等復(fù)雜運(yùn)算到了設(shè)計工程師這里都已經(jīng)轉(zhuǎn)化成了簡單的乘法和加法運(yùn)算。更復(fù)雜的就是累加、累乘(我所能接觸到的)。

做芯片第一應(yīng)該關(guān)注的是芯片的PPA(Performance, Power, Area),如何設(shè)計的出更高性能的電路,占用更少的資源/面積,更低的功耗。這才是我們的專業(yè)知識。

通過學(xué)習(xí)算法代碼和文檔以及協(xié)議,了解算法的計算意圖。然后進(jìn)行數(shù)據(jù)通路的分析,整體的數(shù)據(jù)流走向。哪些需要計算的數(shù)據(jù)可以用寄存器存儲,哪些數(shù)據(jù)需要用RAM存儲。模塊的劃分可拆解,哪些計算單元是功能類似的,可以做成一個小IP,乘法器同時使用的最大數(shù)量,是否能在整個大模塊中分時復(fù)用。

算法的設(shè)計中沒有時序的概念,也沒有計算時間的長短。需要設(shè)計工程師去整理整個模塊的計算流水,流水線排的時間長,需要的計算邏輯就越少,反之,面積越大。面積與速度互換思想,貫穿始終。現(xiàn)成乘法器的數(shù)量有限,是否能加上幾個乘法器而獲得模塊整體運(yùn)算速度提高30%的收益,都需要去折中(Trade off)考慮。

排好計算流水,控制通路,一般都使用狀態(tài)機(jī)去做,當(dāng)然,狀態(tài)機(jī)怎么設(shè)計算法可不會教你。整個模塊與更高層模塊的交互,接口控制時序需要討論確定。數(shù)據(jù)通路可能還需要用到RAM/Regfile去緩存中間數(shù)據(jù)的結(jié)果,RAM/Regfile的讀寫地址控制也是常見設(shè)計。數(shù)據(jù)通路的運(yùn)算,是主要消耗資源的部分,所以一個好的詳細(xì)設(shè)計方案非常重要,同樣的設(shè)計,別人可以用比你小30%的面積和少30%的時間來實現(xiàn)。這可能就是設(shè)計工程師真正的價值體現(xiàn)之處。

對于通信算法中,矩陣運(yùn)算也是比較常見的,復(fù)雜矩陣的運(yùn)算是最耗費(fèi)資源的,矩陣運(yùn)算的拆解也需要很多技巧,比如矩陣的乘法是A的第一行乘以B的第一列,累加得到第一個元素,這部分的運(yùn)算電路可以復(fù)用流水起來做。一個矩陣需要拆解合并成數(shù)個小矩陣,想要保持并行,用寄存器存儲,就會消耗的資源多。存在RAM中就是串行流水做會消耗的時間長,所以這都需要在模塊架構(gòu)設(shè)計階段去計算處理時間和評估消耗資源、折中是否采取(Trade off)。

這種大型矩陣運(yùn)算動輒幾百上千bit的寄存器輸出,連線選擇運(yùn)算,可能會造成后端congestion問題,所以方案設(shè)計的重要性又體現(xiàn)出來了。組合邏輯的運(yùn)算,如果路徑過長,時序會出現(xiàn)問題,插寄存器的位置也非常重要,消耗的寄存器的數(shù)量也是不同的,甚至可以通過手動retimming,找個寄存器把打拍的位置換一下,消耗的資源還是相同的。

對于芯片的功耗前端能做的就是,去加一些時鐘門控,模塊不用時候可以關(guān)掉,組合邏輯計算單元不用的時候避免翻轉(zhuǎn),乘法器的使能信號的控制,避免無效翻轉(zhuǎn),數(shù)據(jù)通路寄存器帶著使能打拍,工具也會自動插時鐘門控,這些就和算法沒關(guān)系了。

至于算法,當(dāng)然不同領(lǐng)域的相關(guān)知識不同,雖然設(shè)計方法是完全類似的,但是在一個領(lǐng)域深扎,成為這個領(lǐng)域的專業(yè)的人,可以更好的理解算法到硬件的實現(xiàn)。

IP設(shè)計工程師經(jīng)常調(diào)侃自己是算法“翻譯官”,雖然也沒什么問題,但是自嘲歸自嘲,如果感興趣的話,還是應(yīng)該去想著如何更好的做好自己的設(shè)計,做好芯片。即使是“翻譯官”也是一個十分有價值的“翻譯官”。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4761

    瀏覽量

    97154
  • Verilog
    +關(guān)注

    關(guān)注

    30

    文章

    1370

    瀏覽量

    114154

原文標(biāo)題:如何將算法“翻譯”成Verilog?

文章出處:【微信號:IP與SoC設(shè)計,微信公眾號:IP與SoC設(shè)計】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    AES加解密算法邏輯實現(xiàn)及其在蜂鳥E203SoC上的應(yīng)用介紹

    這次分享我們會簡要介紹AES加解密算法的邏輯實現(xiàn),以及如何將AES算法做成硬件協(xié)處理器集成在蜂鳥E203 SoC上。 AES算法介紹 AES算法
    發(fā)表于 10-29 07:29

    如何將GCC項目導(dǎo)入NuEclipse?

    如何將GCC項目導(dǎo)入NuEclipse?
    發(fā)表于 09-01 07:04

    請問如何將ISP寫入Nuvoton 8051 MCU系列?

    如何將ISP寫入Nuvoton 8051 MCU系列?
    發(fā)表于 08-18 07:34

    如何將K230 image轉(zhuǎn)成jpg?

    如何將K230image轉(zhuǎn)成jpg,我想獲取圖片,傳回我自己的系統(tǒng) 你好,可以使用img.to_jpeg()來對其進(jìn)行壓縮。
    發(fā)表于 06-12 06:41

    技術(shù)分享 | 迅為RK3568開發(fā)板如何將 Linux 板卡虛擬U盤

    技術(shù)分享 | 迅為RK3568開發(fā)板如何將 Linux 板卡虛擬U盤
    的頭像 發(fā)表于 06-04 10:57 ?886次閱讀
    技術(shù)分享 | 迅為RK3568開發(fā)板<b class='flag-5'>如何將</b> Linux 板卡虛擬<b class='flag-5'>成</b>U盤

    如何將Linux安裝包快速轉(zhuǎn)成玲瓏包

    本篇將以 motrix 為例為大家展示如何將 Linux 安裝包快速轉(zhuǎn)成玲瓏包。
    的頭像 發(fā)表于 03-12 16:01 ?1264次閱讀
    <b class='flag-5'>如何將</b>Linux安裝包快速轉(zhuǎn)成玲瓏包

    如何將項目從IAR遷移到Embedded Studio

    本文描述如何將IAR EWARM項目遷移到SEGGER Embedded Studio(簡稱SES)中。
    的頭像 發(fā)表于 02-25 17:11 ?1069次閱讀
    <b class='flag-5'>如何將</b>項目從IAR遷移到Embedded Studio

    如何將RT-Thread移植到NXP MCUXPressoIDE上

    RT-Thread默認(rèn)支持的IDE只有IAR 和 Keil, 那如何將RT-Thread移植到NXP MCUXPressoIDE上呢?本文內(nèi)容比較簡單但稍有瑣碎,希望對有需要的小伙伴有所幫助。
    的頭像 發(fā)表于 02-13 10:37 ?2441次閱讀
    <b class='flag-5'>如何將</b>RT-Thread移植到NXP MCUXPressoIDE上

    如何將python文件導(dǎo)入到ROS系統(tǒng)中

    本文通過使用myCobot機(jī)械臂進(jìn)行QR碼視覺追蹤的實踐案例分析,介紹如何將 python 文件導(dǎo)入到 ROS 系統(tǒng)中。
    的頭像 發(fā)表于 02-11 11:08 ?1201次閱讀
    <b class='flag-5'>如何將</b>python文件導(dǎo)入到ROS系統(tǒng)中

    AI助力實時翻譯耳機(jī)

    是一種能夠?qū)崟r一種語言翻譯成另一種語言的耳機(jī)設(shè)備。它通常由一個耳機(jī)和一個配套的應(yīng)用程序組成,用戶可以通過應(yīng)用程序選擇需要翻譯的語言,并通過耳機(jī)聽到翻譯結(jié)果。 2 實時
    的頭像 發(fā)表于 01-24 11:14 ?3300次閱讀
    AI助力實時<b class='flag-5'>翻譯</b>耳機(jī)

    AN3408-如何將12位ADC用于力敏電阻

    電子發(fā)燒友網(wǎng)站提供《AN3408-如何將12位ADC用于力敏電阻.pdf》資料免費(fèi)下載
    發(fā)表于 01-21 14:38 ?0次下載
    AN3408-<b class='flag-5'>如何將</b>12位ADC用于力敏電阻

    請問ccs4.2如何將采集到的數(shù)據(jù)導(dǎo)出dat文件?

    ccs4.2如何將采集到的數(shù)據(jù)導(dǎo)出dat文件
    發(fā)表于 01-14 08:08

    Verilog 與 ASIC 設(shè)計的關(guān)系 Verilog 代碼優(yōu)化技巧

    Verilog與ASIC設(shè)計的關(guān)系 Verilog作為一種硬件描述語言(HDL),在ASIC設(shè)計中扮演著至關(guān)重要的角色。ASIC(Application Specific Integrated
    的頭像 發(fā)表于 12-17 09:52 ?1455次閱讀

    Verilog 測試平臺設(shè)計方法 Verilog FPGA開發(fā)指南

    Verilog測試平臺設(shè)計方法是Verilog FPGA開發(fā)中的重要環(huán)節(jié),它用于驗證Verilog設(shè)計的正確性和性能。以下是一個詳細(xì)的Verilog測試平臺設(shè)計方法及
    的頭像 發(fā)表于 12-17 09:50 ?1563次閱讀

    Verilog與VHDL的比較 Verilog HDL編程技巧

    Verilog 與 VHDL 比較 1. 語法和風(fēng)格 VerilogVerilog 的語法更接近于 C 語言,對于有 C 語言背景的工程師來說,學(xué)習(xí)曲線較平緩。它支持結(jié)構(gòu)化編程,代碼更直觀,易于
    的頭像 發(fā)表于 12-17 09:44 ?2697次閱讀