chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

FPGA與GPU類比一下就明白了

Q4MP_gh_c472c21 ? 來源:嵌入式AR ? 2019-12-03 15:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

FPGA 是一堆晶體管,你可以把它們連接(wire up)起來做出任何你想要的電路。它就像一個納米級面包板。使用 FPGA 就像芯片流片,但是你只需要買這一張芯片就可以搭建不一樣的設(shè)計(jì),作為交換,你需要付出一些效率上的代價。

從字面上講這種說法并不對,因?yàn)槟悴⒉恍枰剡B(rewire)FPGA,它實(shí)際上是一個通過路由網(wǎng)絡(luò)(routing network)連接的查找表 2D 網(wǎng)格,以及一些算術(shù)單元和內(nèi)存。FPGA 可以模擬任意電路,但它們實(shí)際上只是在模仿,就像軟件電路仿真器模擬電路一樣。這個答案不恰當(dāng)?shù)牡胤皆谟?,它過分簡化了人們實(shí)際使用 FPGA 的方式。接下來的兩個定義能更好地描述 FPGA。

電路模擬是 FPGA 的經(jīng)典主流用例,這也是 FPGA 最早出現(xiàn)的原因。FPGA 的關(guān)鍵在于硬件設(shè)計(jì)是用 HDL 形式編碼的,而且買一些便宜的硬件就可以得到和 ASIC 相同的效果。當(dāng)然,你不可能在 FPGA 和真正的芯片上使用完全相同的 Verilog 代碼,但至少它們的抽象范圍是一樣的。

這是與 ASIC 原型設(shè)計(jì)不同的一個用例。和電路仿真不同,計(jì)算加速是 FPGA 的新興用例。這也是微軟最近成功加速搜索和深度神經(jīng)網(wǎng)絡(luò)的原因。而且關(guān)鍵的是,計(jì)算實(shí)例并不依賴于 FPGA 和真正 ASIC 之間的關(guān)系:開發(fā)人員針對基于 FPGA 的加速編寫的 Verilog 代碼不需要與用來流片的 Verilog 代碼有任何的相似性。

這兩種實(shí)例在編程、編譯器和抽象方面存在巨大差異。我比較關(guān)注后者,我將其稱為「計(jì)算 FPGA 編程」(computaTIonal FPGA programming)。我的論點(diǎn)是,目前計(jì)算 FPGA 的編程方法都借鑒了傳統(tǒng)的電路仿真編程模型,這是不對的。如果你想開發(fā) ASIC 原型的話,Verilog 和 VHDL 都是正確的選擇。但如果目標(biāo)是計(jì)算的話,我們可以也應(yīng)該重新思考整個堆棧。
讓我們開門見山地說吧。FPGA 是一類很特殊的硬件,它用來高效執(zhí)行模擬電路描述的特殊軟件。FPGA 配置需要一些底層軟件——它是為了 ISA 編寫的程序。 這里可以用 GPU 做類比。 在深度學(xué)習(xí)區(qū)塊鏈盛行之前,有一段時間 GPU 是用來處理圖形的。在 21 世紀(jì)初,人們意識到他們在處理沒有圖形數(shù)據(jù)的計(jì)算密集型任務(wù)時,也會大量使用 GPU 作為加速器:GPU 設(shè)計(jì)師們已經(jīng)構(gòu)建了更通用的機(jī)器,3D 渲染只是其中一個應(yīng)用而已。
FPGA的定義以及和GPU的類比
計(jì)算 FPGA 遵循了相同的軌跡。我們的想法是要多多使用這一時興的硬件,當(dāng)然不是為了電路仿真,而是利用適合電路執(zhí)行的計(jì)算模式,用類比的形式來看 GPU 和 FPGA。
為了讓 GPU 發(fā)展成今天的數(shù)據(jù)并行加速器,人們不得不重新定義 GPU 輸入的概念。我們過去常常認(rèn)為 GPU 接受奇特的、強(qiáng)烈的、特定領(lǐng)域的視覺效果描述。我們實(shí)現(xiàn)了 GPU 執(zhí)行程序,從而解鎖了它們真正的潛力。這樣的實(shí)現(xiàn)讓 GPU 的目標(biāo)從單個應(yīng)用域發(fā)展為整個計(jì)算域。 我認(rèn)為計(jì)算 FPGA 正處于類似的轉(zhuǎn)變中,現(xiàn)在還沒有針對 FPGA 擅長的基本計(jì)算模式的簡潔描述。但它和潛在的不規(guī)則并行性、數(shù)據(jù)重用以及大多數(shù)靜態(tài)的數(shù)據(jù)流有關(guān)。 和 GPU 一樣,F(xiàn)PGA 也需要能夠體現(xiàn)這種計(jì)算模式的硬件抽象,Verilog 用于計(jì)算 FPGA 的問題在于它在低級硬件抽象中效果不好,在高級編程抽象中的效果也不好。讓我們通過反證法想象一下,如果用 RTL(寄存器傳輸級)取代這些角色會是什么樣。 甚至 RTL 專家可能也無法相信 Verilog 是可以高效開發(fā)主流 FPGA 的方式。它不會把編程邏輯推向主流。對于經(jīng)驗(yàn)豐富的硬件黑客來說,RTL 設(shè)計(jì)似乎是友好而熟悉的,但它與軟件語言之間的生產(chǎn)力差距是不可估量的。
事實(shí)上,對現(xiàn)在的計(jì)算 FPGA 來說,Verilog 實(shí)際上就是 ISA。主要的 FPGA 供應(yīng)商工具鏈會將 Verilog 作為輸入,而高級語言的編譯器則將 Verilog 作為輸出。供應(yīng)商一般會對比特流格式保密,因此 Verilog 在抽象層次結(jié)構(gòu)中會處于盡可能低的位置。
把 Verilog 當(dāng)做 ISA 的問題是它和硬件之間的距離太遠(yuǎn)了。RTL 和 FPGA 硬件之間的抽象差距是巨大的,從傳統(tǒng)角度講它至少要包含合成、技術(shù)映射以及布局布線——每一個都是復(fù)雜而緩慢的過程。因此,F(xiàn)PGA 上 RTL 編程的編譯/編輯/運(yùn)行周期需要數(shù)小時或數(shù)天,更糟糕的是,這是一個無法預(yù)測的過程,工具鏈的深層堆??赡軙谏w RTL 中的改變,這可能會影響設(shè)計(jì)性能和能源特性。
好的 ISA 應(yīng)該直接展示底層硬件未經(jīng)修飾的真實(shí)情況。像匯編語言一樣,它其實(shí)不需要很方便編程。但也像匯編語言一樣,它的編譯速度需要非???,而且結(jié)果可預(yù)測。如果想要構(gòu)建更高級的抽象和編譯器,就需要一個不會出現(xiàn)意外的低級目標(biāo)。而 RTL 不是這樣的目標(biāo)。
如果計(jì)算 FPGA 是特定類算法模式的加速器,那當(dāng)前的 FPGA 并不能理想地實(shí)現(xiàn)這一目標(biāo)。在這個游戲規(guī)則下能夠擊敗 FPGA 的新硬件類型,才可能帶來全新的抽象層次結(jié)構(gòu)。新的軟件棧應(yīng)該摒棄 FPGA 在電路仿真方面的遺留問題,以及 RTL 抽象。
-END-

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1645

    文章

    22046

    瀏覽量

    618275
  • 晶體管
    +關(guān)注

    關(guān)注

    77

    文章

    10019

    瀏覽量

    141619
  • 編譯器
    +關(guān)注

    關(guān)注

    1

    文章

    1662

    瀏覽量

    50205

原文標(biāo)題:FPGA難懂?與GPU類比一下就明白了

文章出處:【微信號:gh_c472c2199c88,微信公眾號:嵌入式微處理器】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    “碰一下”支付終端應(yīng)用在酒店:智能無卡入住與客房控制

    “碰一下”支付終端和“碰一下”支付機(jī)具今年已在各種餐飲零售門店推廣應(yīng)用。就連天波小編家附近的村口小超市也用上了“碰一下”支付終端。近日,鹵味龍頭企業(yè)絕味食品宣布,全國門店將接入“支付寶碰一下
    的頭像 發(fā)表于 07-04 09:57 ?163次閱讀
    “碰<b class='flag-5'>一下</b>”支付終端應(yīng)用在酒店:智能無卡入住與客房控制

    類比半導(dǎo)體推出全新第二代高邊開關(guān)芯片HD80012

    致力于提供高品質(zhì)汽車驅(qū)動芯片和高品質(zhì)工業(yè)模擬芯片供應(yīng)商上海類比半導(dǎo)體技術(shù)有限公司(稱“類比半導(dǎo)體”或“類比”)宣布推出全新第二代高邊開關(guān)芯片HD80012,單通道低內(nèi)阻1.2mΩ產(chǎn)品
    的頭像 發(fā)表于 07-02 15:19 ?343次閱讀
    <b class='flag-5'>類比</b>半導(dǎo)體推出全新第二代高邊開關(guān)芯片HD80012

    一下終端,讓自助售貨機(jī)秒變 “家里的冰箱”

    繼刷臉支付后,支付寶近日又推出了新的支付方式——碰一下支付。只需將手機(jī)輕輕靠近支付寶“碰一下”支付終端,即可完成支付,比以往要先解鎖手機(jī),調(diào)出APP的付款碼再支付的操作環(huán)節(jié)要便捷和省時許多?!芭?b class='flag-5'>一下
    的頭像 發(fā)表于 06-18 10:49 ?201次閱讀
    碰<b class='flag-5'>一下</b>終端,讓自助售貨機(jī)秒變 “家里的冰箱”

    可以手動構(gòu)建imx-gpu-viv嗎?

    在 debian 10 上使用 imx gpu 交叉編譯 Qt,以便它與我的應(yīng)用程序起工作。但是 imx-gpu-viv-6.4.3.p4.2.aarch64.bin(libGAL.so、libEGL.so
    發(fā)表于 03-28 06:35

    個過零檢測電路,但有部分電路沒看明白,有大神可以詳細(xì)解釋一下

    個過零檢測電路,但是沒明白粉色框部分有什么作用,有大神可以詳細(xì)解釋一下
    發(fā)表于 03-20 00:40

    fpga和cpu的區(qū)別 芯片是gpu還是CPU

    、FPGA與CPU的區(qū)別 FPGA(Field-Programmable Gate Array,現(xiàn)場可編程門陣列)和CPU(Central Processing Unit,中央處理器)是兩種不同類
    的頭像 發(fā)表于 02-01 14:57 ?1612次閱讀

    FPGA+GPU+CPU國產(chǎn)化人工智能平臺

    平臺采用國產(chǎn)化FPGA+GPU+CPU構(gòu)建嵌入式多核異構(gòu)智算終端,可形成FPGA+GPU、FPGA+CPU、CPU+FPGA等組合模式,形成低功耗、高可擴(kuò)展性的硬件系統(tǒng),結(jié)合使用場景靈
    的頭像 發(fā)表于 01-07 16:42 ?1080次閱讀
    <b class='flag-5'>FPGA+GPU</b>+CPU國產(chǎn)化人工智能平臺

    ASIC和GPU的原理和優(yōu)勢

    芯片”。 準(zhǔn)確來說,除了它倆,計(jì)算芯片還包括大家更熟悉的CPU,以及FPGA。 行業(yè)里,通常會把半導(dǎo)體芯片分為數(shù)字芯片和模擬芯片。其中,數(shù)字芯片的市場規(guī)模占比較大,達(dá)到70%左右。 數(shù)字芯片,還可以進(jìn)步細(xì)分,分為:邏輯芯片、存儲芯片以及微控制單元(MCU)。CPU、
    的頭像 發(fā)表于 01-06 13:58 ?1753次閱讀
    ASIC和<b class='flag-5'>GPU</b>的原理和優(yōu)勢

    “碰一下”支付背后的4G技術(shù)

    不知道你是否有留意,近期,在線下支付場景中,多了個支付寶“碰一下”支付的設(shè)備,只需要“解鎖手機(jī)—碰一下—確認(rèn)”即可完成支付,對比打開付款碼支付,步驟確實(shí)更加簡潔。
    的頭像 發(fā)表于 01-03 16:27 ?1874次閱讀

    支付寶發(fā)布新代AI視覺搜索“探一下

    支付寶近日正式推出了基于自研多模態(tài)大模型技術(shù)的新代AI視覺搜索產(chǎn)品——“探一下”。這創(chuàng)新產(chǎn)品的問世,標(biāo)志著支付寶在AI技術(shù)應(yīng)用領(lǐng)域邁出了重要步。 “探
    的頭像 發(fā)表于 12-31 10:49 ?560次閱讀

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--了解算力芯片GPU

    不同的線程束以執(zhí)行不同的指令。指令調(diào)度單元負(fù)責(zé)從指令緩存中取出著色器程序中的操作指令,并將其分配給每個CUDA核心執(zhí)行。 線程塊的設(shè)計(jì)為 GPU編程提供種高效、靈活和易用的方式來組織和管理并行線程
    發(fā)表于 11-03 12:55

    Achronix Speedster7t FPGAGPU解決方案的比較

    這篇針對大模型推理跟GPU對比分析,雖然以Llama2為例,也適用于最新的Llama3,模型的日新月易也更進(jìn)步說明硬件平臺的可編程可擴(kuò)展的重要性,FPGA是其中個不錯的選擇。
    的頭像 發(fā)表于 09-18 16:19 ?755次閱讀
    Achronix Speedster7t <b class='flag-5'>FPGA</b>與<b class='flag-5'>GPU</b>解決方案的比較

    ALINX FPGA+GPU異架構(gòu)視頻圖像處理開發(fā)平臺介紹

    Alinx 最新發(fā)布的新品 Z19-M 是款創(chuàng)新的 FPGA+GPU 異構(gòu)架構(gòu)視頻圖像處理開發(fā)平臺,它結(jié)合 AMD Zynq UltraScale+ MPSoC(FPGA)與 NV
    的頭像 發(fā)表于 08-29 14:43 ?2120次閱讀

    FPGA與MCU的應(yīng)用場景

    FPGA和MCU各有其獨(dú)特的優(yōu)勢和適用場景。以上都是官方的話術(shù),然后我來說一下我的理解: 高并行處理能力 它可以做到某個引腳和其他引腳相關(guān)聯(lián),某個引腳又和另外的引腳相關(guān)聯(lián),并且同時刻可以互相不影響
    發(fā)表于 07-29 15:45

    大模型發(fā)展,國產(chǎn)GPU的機(jī)會和挑戰(zhàn)

    電子發(fā)燒友網(wǎng)站提供《大模型發(fā)展,國產(chǎn)GPU的機(jī)會和挑戰(zhàn).pdf》資料免費(fèi)下載
    發(fā)表于 07-18 15:44 ?15次下載
    大模型發(fā)展<b class='flag-5'>下</b>,國產(chǎn)<b class='flag-5'>GPU</b>的機(jī)會和挑戰(zhàn)