chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

FPGA發(fā)明以來(lái)最偉大的技術(shù)ACAP解析

SSDFans ? 來(lái)源:網(wǎng)絡(luò)整理 ? 作者:工程師陳翠 ? 2018-10-05 09:04 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

今年3月份,賽靈思(Xilinx)歷史上第四位全球CEO Victor Peng 先生在北京正式宣布賽靈思將推出“自適應(yīng)計(jì)算加速平臺(tái)”ACAP。Victor 表示:“作為可以和CPU、GPUFPGA 相提并論、并且性能遠(yuǎn)超后二者的產(chǎn)品,ACAP可以覆蓋更加廣泛的應(yīng)用,幫助人們實(shí)現(xiàn)智能互聯(lián)并且驅(qū)動(dòng)自適應(yīng)的世界。”

ACAP采用臺(tái)積電7納米技術(shù),在機(jī)器學(xué)習(xí)的計(jì)算能力方面比16納米級(jí)提升20倍,在5G通信方面能夠支持4倍的帶寬,在性能功耗比方面具有優(yōu)越的表現(xiàn)。ACAP是賽靈思公司“Everest 行動(dòng)”(內(nèi)部稱為“珠穆朗瑪”行動(dòng))的重大成果?!癊verest 行動(dòng)”已經(jīng)歷經(jīng)四年,投資10億美元、動(dòng)用1500名工程師,無(wú)疑是一個(gè)重磅級(jí)新型產(chǎn)品??梢哉f(shuō),ACAP的問(wèn)世,對(duì)業(yè)界來(lái)說(shuō)是一項(xiàng)重大的技術(shù)顛覆,也是自賽靈思公司發(fā)明FPGA以來(lái)最卓著的工程成就。

圖1 ACAP架構(gòu)圖

上圖中的所有其他主要模塊都以某種形式在Xilinx 16nm Zynq、Virtex和Kintex UltraScale+系列中出現(xiàn)過(guò),并不需要詳細(xì)說(shuō)明。這些模塊包括Arm應(yīng)用和實(shí)時(shí)處理器、可編程邏輯、HBM(高帶寬存儲(chǔ)器),使用硅基板和2.5D組裝技術(shù)連接到Xilinx芯片上的堆疊式DRAM陣列、RFADCDAC以及高速SerDes端口。

但是那個(gè)紅色模塊仍是個(gè)謎。這是公司“七面紗之舞蹈”的一部分,它會(huì)慢慢揭開(kāi)Everest 和ACAP產(chǎn)品的細(xì)節(jié),從而在設(shè)計(jì)階段就引起公眾的興趣。(這種營(yíng)銷(xiāo)技巧的靈感來(lái)自于一個(gè)世紀(jì)前的著名作家和劇作家?jiàn)W斯卡·王爾德,目前這種技巧受到了高科技營(yíng)銷(xiāo)人員和真人秀明星的青睞。)

8月份在加利福尼亞州庫(kù)比蒂諾舉行的“Hot Chips 30”會(huì)議上,揭開(kāi)了一兩個(gè)隱藏著HW和SW可編程引擎的神秘的面紗被揭開(kāi)。在會(huì)議上,Xilinx集團(tuán)工程總監(jiān)Juanjo Noguera做了一份詳細(xì)報(bào)告,標(biāo)題為“HW/SW可編程引擎:Everest項(xiàng)目的特定架構(gòu)”。Noguera的演示介紹了許多額外的硬件細(xì)節(jié),同時(shí)保留了最有趣的細(xì)節(jié)。

Everest HW/SW可編程引擎是由粗粒度、軟件可編程的VLIW矢量處理器組成的平鋪陣列(tiled array),它們以多種硬件可編程的方式相互連接。Noguera認(rèn)為,VLIW矢量處理器可以處理各種定點(diǎn)和浮點(diǎn)數(shù)據(jù)類(lèi)型。HW/SW可編程引擎陣列出現(xiàn)在下圖的左上角,而具有互連方案的單個(gè)模塊細(xì)節(jié)位于圖中的右下角。

圖2 Xilinx HW/SW可編程引擎對(duì)Everest結(jié)構(gòu)的詳細(xì)說(shuō)明

在Everest設(shè)計(jì)中,HW/SW可編程引擎陣列與PS(處理器系統(tǒng))和PL(可編程邏輯)獨(dú)立通信。陣列中的每個(gè)塊的軟件可編程VLIW向量處理器和數(shù)據(jù)移動(dòng)器(DMA機(jī)器)組成。

陣列中有三種類(lèi)型的互連鏈路模塊。第一種類(lèi)型,由圖2中的紅色小箭頭表示,是使用NSEW(北、南、東、西)排列方法將每個(gè)模塊與其最近的四個(gè)鄰居鏈接起來(lái)的平行、雙向數(shù)據(jù)接口。此外,圖中顯示的綠色小箭頭指向的是單向級(jí)聯(lián)接口,允許一個(gè)瓦片將部分結(jié)果直接傳遞給其相鄰的右側(cè)鄰居。

這些短的、本地的點(diǎn)到點(diǎn)的連接讓人想起FPGA陣列中用于的短距離LUT-to-LUT通信的本地互連,其級(jí)聯(lián)接口類(lèi)似于DSP片之間的進(jìn)位接口。不過(guò)這并不是巧合,因?yàn)檫@些通信路徑在Xilinx設(shè)備中一直很常見(jiàn)。

對(duì)于平鋪陣列中較長(zhǎng)的通信路徑,HW/SW可編程引擎使用200G字節(jié)/秒的非阻塞、確定性NOC(片上網(wǎng)絡(luò))。NOC加上并行的本地互連,構(gòu)成了可編程引擎的“硬件可編程”性。

我們可以以多種方式連接向量處理塊,以實(shí)現(xiàn)不同的處理陣列。Noguera在他的演講中討論了五種類(lèi)似的結(jié)構(gòu)。圖3列出了這些示例:

圖3 Everest HW/SW可編程引擎處理配置示例

配置1是一個(gè)簡(jiǎn)單的一維單向數(shù)據(jù)流管道。每個(gè)處理塊處理傳入的數(shù)據(jù)流一部分,然后通過(guò)本地內(nèi)存緩沖區(qū)將結(jié)果傳遞到下一個(gè)塊。配置2是一個(gè)數(shù)據(jù)流圖,該數(shù)據(jù)流圖可以看成是數(shù)據(jù)流管道的多維版本。從本質(zhì)上講,它仍然是管道,不過(guò)是在多個(gè)維度上運(yùn)行的。配置3利用NOC將結(jié)果從一個(gè)處理塊同時(shí)多播到兩個(gè)或多個(gè)后續(xù)塊。配置4使用輸入和輸出存儲(chǔ)器緩沖區(qū)來(lái)匹配連接在NOC上的塊的差分處理速率。配置5可以使用級(jí)聯(lián)接口將中間結(jié)果從一個(gè)塊傳遞到下一個(gè)塊,而不消耗其他資源。

這只是五個(gè)配置示例。使用這種新的處理資源可以創(chuàng)造出更多的處理配置,而且還有一些智能自動(dòng)化的空間可以合成和優(yōu)化配置,以滿足高性能、高功率的目標(biāo)。當(dāng)然,這些互連方案也可以組合使用。

HW/SW可編程引擎的功能可以使用Everest的片上PL進(jìn)行擴(kuò)展,該P(yáng)L通過(guò)多個(gè)NOC節(jié)點(diǎn)和CDC時(shí)鐘域交叉)緩沖區(qū)連接到HW/SW可編程引擎的NOC上,如圖4所示。(顯然,該架構(gòu)需要CDC緩沖區(qū),因?yàn)镠W/SW可編程引擎和PL的時(shí)鐘速率不同,不過(guò)它的運(yùn)行速度應(yīng)該不會(huì)變慢。)

圖4 HW/SW可編程引擎的NOC通過(guò)多個(gè)NOC節(jié)點(diǎn)和時(shí)鐘域交叉緩沖區(qū)連接到設(shè)備的可編程邏輯。

如圖所示,Everest的HW/SW可編程引擎(圖中縮寫(xiě)“PE”)與其PL之間的互連總帶寬為T(mén)bytes/sec量級(jí)。這將導(dǎo)致許多系統(tǒng)架構(gòu)師不得不重新思考他們關(guān)于處理器體系結(jié)構(gòu)的假設(shè)。

我們可以使用連接的PL以多種方式增強(qiáng)HW/SW可編程引擎的能力。例如,可以使用PL的RAM陣列來(lái)增加向量處理塊對(duì)PL中的片上SRAM (BRAM和UltraRAM)塊的訪問(wèn)。也可以使用PL來(lái)實(shí)現(xiàn)硬件加速器,它可以比塊矢量引擎更快地執(zhí)行特定的計(jì)算。Noguera建議使用PL為tile創(chuàng)建“ISA擴(kuò)展”,但他沒(méi)有詳細(xì)說(shuō)明。

機(jī)器語(yǔ)言推理和5G無(wú)線信號(hào)處理的性能結(jié)果給人留下了深刻印象,如下圖5所示。

圖5 HW/SW可編程引擎相對(duì)于可編程邏輯實(shí)現(xiàn)的結(jié)果。

值得注意的是ML(機(jī)器語(yǔ)言)推理的20倍改進(jìn)。當(dāng)涉及到ML推理時(shí),F(xiàn)PGA已經(jīng)相當(dāng)快,因?yàn)橥评碛?jì)算涉及許多乘法和加法。FPGA中的數(shù)以千計(jì)的DSP片可以快速地執(zhí)行這些計(jì)算,但是HW/SW可編程引擎似乎更快。Noguera說(shuō),5G無(wú)線處理中的4倍改進(jìn)也很重要,因?yàn)檫@意味著珠穆朗瑪峰架構(gòu)可以達(dá)到2G./sec的傳輸速率。

在Noguera演講后的問(wèn)答環(huán)節(jié)中,聽(tīng)眾提出了一些詳細(xì)的問(wèn)題。第一個(gè)問(wèn)題是關(guān)于HW/SW可編程引擎的時(shí)鐘速率。Noguera的回答是,他還不能直接回答這個(gè)問(wèn)題,但是他試圖通過(guò)聲明引擎可以處理2G./sec的5G傳輸比特率來(lái)間接回答。他說(shuō),HW/SW可編程引擎處理器的工作頻率將是“千兆級(jí)”。

另一個(gè)問(wèn)題涉及HW/SW可編程引擎陣列中的模塊數(shù)量。答案是每個(gè)HW/SW可編程引擎中將有數(shù)十到數(shù)百個(gè)模塊,這取決于設(shè)備構(gòu)成。ACAP設(shè)備的HW/SW可編程引擎中有數(shù)百個(gè)矢量處理器,它們將被大規(guī)模并行化。這個(gè)范圍與所有FPGA供應(yīng)商(包括Xilinx)在廣泛的設(shè)備家族中將不同數(shù)量的資源放置到單個(gè)成員中的方式非常一致,并且它傳達(dá)了Xilinx開(kāi)發(fā)ACAP設(shè)備家族的意圖。

然而,第一款Everest設(shè)備還沒(méi)有出來(lái)。這一里程碑性的計(jì)劃將于今年晚些時(shí)候?qū)崿F(xiàn)。同時(shí),七個(gè)面紗的舞蹈還在繼續(xù)。Noguera承諾將在今年晚些時(shí)候在圣何塞、北京和法蘭克福舉行的Xilinx開(kāi)發(fā)者論壇上披露更多細(xì)節(jié)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1650

    文章

    22207

    瀏覽量

    626962

原文標(biāo)題:秒殺GPU:FPGA發(fā)明以來(lái)最偉大的技術(shù)詳解

文章出處:【微信號(hào):SSDFans,微信公眾號(hào):SSDFans】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    FPGAACAP,賽靈思再次超越自我

    賽靈思是FPGA發(fā)明者。深鑒科技提供的一個(gè)實(shí)際案例表明,賽靈思在支持非常廣泛的AI應(yīng)用.作為可以和CPU、GPU與FPGA 相提并論、并且性能遠(yuǎn)超后二者的產(chǎn)品,ACAP可以覆蓋更加廣
    發(fā)表于 05-30 09:14 ?4472次閱讀
    從<b class='flag-5'>FPGA</b>到<b class='flag-5'>ACAP</b>,賽靈思再次超越自我

    基于7nm工藝的FPGA加速芯片-ACAP

    引言 隨著人工智能和5G的興起,數(shù)據(jù)處理對(duì)芯片的算力和帶寬要求更高。為了布局未來(lái),助力人工智能和5G,賽靈思也推出了自己的FPGA加速芯片-ACAP。ACAP是一款基于7nm工藝,集成了通用
    的頭像 發(fā)表于 11-05 14:55 ?4288次閱讀

    ME結(jié)構(gòu)在FPGA加速芯片ACAP有何作用

    隨著人工智能和5G的興起,數(shù)據(jù)處理對(duì)芯片的算力和帶寬要求更高。為了布局未來(lái),助力人工智能和5G,賽靈思也推出了自己的FPGA加速芯片-ACAPACAP是一款基于7nm工藝,集成了通用處理器(PS
    發(fā)表于 07-07 09:17 ?2116次閱讀

    勇敢的芯板你玩轉(zhuǎn)Altera FPGA

    為各種應(yīng)用中定制芯片的替代品。也正是由于此項(xiàng)偉大發(fā)明,讓Freeman先生于2009年榮登美國(guó)發(fā)明家名人堂。而至于FPGA到底是什么,能夠干什么,又有什么過(guò)人之處?下面我們就把它和它
    發(fā)表于 09-19 21:52

    【AD新聞】賽靈思新CEO訪華繪藍(lán)圖,7nm ACAP平臺(tái)要讓CPU/GPU難企及

    廠商的數(shù)據(jù)中心中都會(huì)搭載賽靈思的技術(shù)與產(chǎn)品,讓開(kāi)發(fā)者可以直接通過(guò)云服務(wù)軟件接入賽靈思ACAP/FPGA的能力,不需要硬件開(kāi)發(fā)能力。 根據(jù)深鑒科技給出的數(shù)據(jù),賽靈思提供的高效FPGA加速
    發(fā)表于 03-23 14:31

    ACAP的主要架構(gòu)創(chuàng)新解析

    2019年“FPGA國(guó)際研討會(huì)”上,賽靈思發(fā)表了兩篇長(zhǎng)論文,詳細(xì)介紹了賽靈思“自適應(yīng)計(jì)算加速平臺(tái)”ACAP的系統(tǒng)架構(gòu)和技術(shù)細(xì)節(jié)。本文將對(duì)ACAP的主要架構(gòu)創(chuàng)新進(jìn)行深入解讀,讓各位先睹為
    發(fā)表于 11-27 07:30

    【年度精選】2020年度TOP10榜單——FPGA技術(shù)社區(qū)問(wèn)答

    fpga 矩陣按鍵的問(wèn)題,看似簡(jiǎn)單,但很多工程師都遇到過(guò)相似的問(wèn)題,也為大家提供答案,避免了再遇到類(lèi)似的問(wèn)題。6、 ACAP的主要架構(gòu)創(chuàng)新解析作者: hrt666回復(fù)數(shù):7推薦理由:這是一個(gè)關(guān)于
    發(fā)表于 01-15 16:36

    如何選擇Xilinx的FPGA產(chǎn)品

     Xilinx的FPGA、SoC、MPSoC、RFSoC和ACAP產(chǎn)品介紹使用Xilinx的FPGA、SoC和ACAP進(jìn)行設(shè)計(jì)和開(kāi)發(fā)
    發(fā)表于 01-22 06:38

    電子技術(shù)是誰(shuí)發(fā)明的?

    電子技術(shù)是誰(shuí)發(fā)明的呀?
    發(fā)表于 08-31 22:52

    晶體管發(fā)明

    晶體管發(fā)明史 晶體管—— 20 世紀(jì)在電子技術(shù)方面最偉大發(fā)明,推動(dòng)了信息革命,帶動(dòng)了產(chǎn)業(yè)革命,開(kāi)辟了億萬(wàn)個(gè)就業(yè)崗位,改變了人類(lèi)社會(huì)工作方式和生活方式,奠
    發(fā)表于 11-05 11:13 ?6786次閱讀

    洪天峰解析世界級(jí)企業(yè)偉大的真相

    人們總是崇尚偉大,但是當(dāng)他們真的看到偉大的面貌時(shí)卻卻步了。
    的頭像 發(fā)表于 04-25 09:53 ?4220次閱讀

    三張圖解析FPGA/ACAP在AI推理中的優(yōu)勢(shì)

    三張圖 在Xilinx官網(wǎng)找資料無(wú)意中在應(yīng)用AI推斷加速中看到了下面三張圖,頓覺(jué)眾里尋他千百度,驀然回首,那人卻在燈火闌珊處的意思了。三張圖非常通俗易懂的介紹了FPGA/ACAP這樣的體系結(jié)構(gòu)在AI
    的頭像 發(fā)表于 12-04 15:37 ?1756次閱讀

    二十世紀(jì)最偉大發(fā)明之一--半導(dǎo)體激光器

    來(lái)源:羅姆半導(dǎo)體社區(qū) 自1962年世界上第一臺(tái)半導(dǎo)體激光器發(fā)明問(wèn)世以來(lái),半導(dǎo)體激光器發(fā)生了巨大的變化,極大地推動(dòng)了其他科學(xué)技術(shù)的發(fā)展,被認(rèn)為是二十世紀(jì)人類(lèi)最偉大
    的頭像 發(fā)表于 12-05 16:28 ?4456次閱讀

    揭秘賽靈思計(jì)算平臺(tái)ACAP技術(shù)細(xì)節(jié)

    ? 在日前召開(kāi)的FPGA領(lǐng)域的學(xué)術(shù)頂會(huì)--2019年“FPGA國(guó)際研討會(huì)”上,賽靈思發(fā)表了兩篇長(zhǎng)論文,詳細(xì)介紹了賽靈思“自適應(yīng)計(jì)算加速平臺(tái)”ACAP的系統(tǒng)架構(gòu)和技術(shù)細(xì)節(jié)。本文將對(duì)
    的頭像 發(fā)表于 01-04 09:53 ?3923次閱讀
    揭秘賽靈思計(jì)算平臺(tái)<b class='flag-5'>ACAP</b><b class='flag-5'>技術(shù)</b>細(xì)節(jié)

    555定時(shí)器被稱為有史以來(lái)偉大的芯片之一

    如果你玩過(guò)電子電路,你大概率是知道 555 定時(shí)器集成電路的,據(jù)說(shuō)是世界上最暢銷(xiāo)的集成電路,已售出數(shù)十億。由模擬 IC 奇才 Hans Camenzind 設(shè)計(jì)的 555 被稱為有史以來(lái)偉大的芯片之一。
    的頭像 發(fā)表于 11-30 14:45 ?3012次閱讀