chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

FPGA與ASIC的完美結合 Achronix Speedster 7t系列詳解

旺材芯片 ? 來源:yxw ? 2019-06-13 11:06 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

提起FPGA,可能很多人第一時間都會想到FPGA大廠賽靈思Altera(已經(jīng)被英特爾收購),然而其實還有其他的一些非常有特色的FPGA廠商,比如基于FPGA的硬件加速器件和高性能嵌入式FPGA(eFPGA)半導體知識產(chǎn)權(IP)公司Achronix。

得益于近年來人工智能/機器學習的快速發(fā)展,新的算法不斷的出現(xiàn),這推動了可編程的FPGA市場的快速增長。根據(jù)市場調研公司SemicoResearch的預測,AI應用中FPGA的市場規(guī)模將在未來4年內(nèi)增長3倍,達到52億美元。

根據(jù)市場研究機構IP Nest近期發(fā)布的最新的IP市場分析報告顯示,Achronix是2018年全球增速最快的IP提供商,同比增長達到了250%,足見Achronix業(yè)務增長之迅速。

而為了進一步滿足人工智能/機器學習(AI/ML)和高帶寬數(shù)據(jù)加速應用日益增長的需求,今年5月,Achronix公司推出了創(chuàng)新性的、全新的FPGA系列產(chǎn)品——Speedster 7t系列。

全新架構:ASIC和FPGA的完美結合

我們都知道,對于AI加速來說,相較于我們常見的CPU、GPU等通用型芯片以及可編程的FPGA來說,ASIC芯片的計算能力和計算效率都直接根據(jù)特定的算法的需要進行定制的,所以其可以實現(xiàn)體積小、功耗低、高可靠性、保密性強、計算性能高、計算效率高等優(yōu)勢。所以,在其所針對的特定的應用領域,ASIC芯片的能效表現(xiàn)要遠超CPU、GPU等通用型芯片以及可編程的FPGA。

但是,正如我們前面所提及的是,目前AI算法仍然處在一個不斷的快速更新迭代的階段,數(shù)值精度的可選擇性也越來越多。同時隨著AI的應用場景快速發(fā)展演進,新的解決方案都要去應對在高性能、靈活和上市時間等方面的不同需求。

而AISC是針對特定的算法加速所設計的,這也使得其在靈活性上遠不如可通過編程快速適應新的軟件算法的FPGA。但是,F(xiàn)PGA在體積、能效、成本上卻又不如AISC。那么是否能夠有這樣一款產(chǎn)品,能夠很好的將FPGA和ASIC的優(yōu)點結合在一起呢?Achronix的Speedster 7t系列或許就是這樣一款產(chǎn)品。

Achronix稱,Speedster 7t系列是基于一種高度優(yōu)化的全新架構,以其所具有的如同ASIC一樣的性能、可簡化設計的FPGA靈活性和增強功能,從而遠遠超越傳統(tǒng)的FPGA解決方案。

▲Achronix CEORobert Blake

Achronix Semiconductor總裁兼首席執(zhí)行官Robert Blake表示:“Speedster7t是Achronix歷史上最令人激動的發(fā)布,代表了建立在四個架構代系的硬件和軟件開發(fā)基礎上的創(chuàng)新和積淀,以及與我們領先客戶之間的密切合作。Speedster7t是靈活的FPGA技術與ASIC核心效率的融合,從而提供了一個全新的‘FPGA+’芯片品類,它們可以將高性能技術的極限大大提升?!?/p>

Speedster7t FPGA系列詳解

根據(jù)Achronix的介紹來看,Speedster7t FPGA系列產(chǎn)品是專為高帶寬應用進行設計的,其具有一個革命性的全新二維片上網(wǎng)絡(2D NoC,Network on Chip),以及一個高密度全新機器學習處理器(MLP)模塊陣列。通過將FPGA的可編程性與ASIC的布線結構和計算引擎完美地結合在一起,Speedster7t系列產(chǎn)品創(chuàng)造了一類全新的“FPGA +”技術。

同時,Speedster7t系列產(chǎn)品還包括了高帶寬GDDR6接口、400G以太網(wǎng)端口和PCI Express Gen5等接口,所有這一切單元都互相連接以提供ASIC級帶寬,同時保留FPGA的完全可編程性。

而為了應對接收來自多個高速來源的大量數(shù)據(jù),同時還需要將那些數(shù)據(jù)分發(fā)到可編程片上算法性和處理性單元中,然后以盡可能低的延遲來提供那些結果,所以在制程工藝上,Speedster7t器件選擇了采用臺積電最新的7nm FinFET工藝制造。

全新機器學習處理器陣列

對于傳統(tǒng)的帶DSP模塊的FPGA來說,其所能夠提供的AI性能是相對有限的,因為使用DSP模塊只能提供不高效的數(shù)值精度支持,使用外部LUT和內(nèi)存構建AI/ML應用程序,需要消除額外邏輯編輯和內(nèi)存資源,性能也受FPGA布線限制。

相比之下,Speedster7t FPGA則采用了全新機器學習處理器(MLP)中大規(guī)模的可編程計算單元平行陣列,它們可提供業(yè)界最高的、基于FPGA的計算密度。MLP是高度可配置的、計算密集型的單元模塊,每個MAC單元支持最多32個乘法器,可驅動可變精度加法器/累加器,可支持4到24位的整點格式和高效的浮點模式,包括對TensorFlow的16位格式的支持,以及可使每個MLP的計算引擎加倍的增壓塊浮點格式的直接支持。

另外,每個MLP當中還緊密耦合了內(nèi)存區(qū)塊,包括72K bits的RAM和2K bits的寄存器。這種運算和存儲級鏈接,使得MLP在不需要使用FPGA布線資源的情況下,實現(xiàn)更復雜的AI算法。

此外,MLP還與嵌入式存儲器模塊緊密相鄰,通過消除傳統(tǒng)設計中與FPGA布線相關的延遲,來確保以750 MHz的最高性能將數(shù)據(jù)傳送到MLP。

這種高密度計算和高性能數(shù)據(jù)傳輸?shù)慕Y合使得處理器邏輯陣列能夠提供基于FPGA的最高可用計算能力以每秒萬億次運算數(shù)量為單位(TOPS,Tera-OperationsPer Second)。

超高吞吐量的內(nèi)存帶寬和接口

高性能計算和機器學習系統(tǒng)的關鍵之處是高片外存儲器帶寬,從而為多個數(shù)據(jù)流提供存儲源和緩沖。Speedster7t器件是唯一支持GDDR6存儲器的FPGA,該類存儲器是具有最高帶寬的外部存儲器件。每個GDDR6存儲控制器都能夠支持512 Gbps的帶寬,Speedster7t器件中有多達8個GDDR6控制器,可以支持4 Tbps的GDDR6累加帶寬,并且以很小的成本就可提供與基于HBM的FPGA等效存儲帶寬。

“美光(Micron)樂于攜手Achronix去實現(xiàn)全球第一個面向高帶寬存儲需求而直接加載了GDDR6的FPGA產(chǎn)品,”美光計算與聯(lián)網(wǎng)業(yè)務部營銷副總裁Mal Humphrey。“像這樣的創(chuàng)新的和可擴展的解決方案將推動人工智能領域內(nèi)的差異化,其中異構計算可選方案與高性能的存儲是加速獲得數(shù)據(jù)內(nèi)涵的必需部分?!?/p>

除了這種超高吞吐量的存儲帶寬,Speedster7t器件還包括業(yè)界最高性能的接口端口,以支持極高帶寬的數(shù)據(jù)流。Speedster7t器件擁有多達72個業(yè)界最高性能的SerDes,可以達到1到112 Gbps的速度。還有帶有前向糾錯(FEC)的硬件400G以太網(wǎng)MAC,支持4x 100G和8x 50G的配置,以及每個控制器有8個或16個通道的硬件PCI Express Gen5控制器。

“Achronix全新的Speedster7t FPGA系列產(chǎn)品是創(chuàng)新性芯片架構實現(xiàn)爆發(fā)的一個卓越案例,創(chuàng)造該架構的目的是直接面向AI應用處理大量的數(shù)據(jù),”Semico Research公司ASIC和SoC首席市場分析師Rich Wawrzyniak說道?!巴ㄟ^將數(shù)學函數(shù)、存儲器和可編程性整合到其機器學習處理器中,再結合交叉芯片、二維NoC結構,從而形成了消除瓶頸和確保整個器件中數(shù)據(jù)自由流動的絕佳方法。在AI / ML應用中,內(nèi)存帶寬就是一切,Achronix的Speedster7t在這一領域提供了令人印象深刻的性能指標。”

全新二維片上網(wǎng)絡:提供超高效率的數(shù)據(jù)移動

來自Speedster7t高速I/O和存儲器端口的數(shù)萬兆比特數(shù)據(jù)量非常的大,傳統(tǒng)的FPGA面向比特位的可編程互連邏輯陣列的路由容量已不能滿足需求,因此Speedster7t架構提供了一個可橫跨和垂直跨越FPGA邏輯陣列的創(chuàng)新性的、高帶寬的二維片上網(wǎng)絡(NOC)。

這個2D NOC可連接到所有FPGA的高速數(shù)據(jù)和存儲器接口。它們就像疊加在FPGA互連這個城市街道系統(tǒng)上的空中高速公路網(wǎng)絡一樣,Speedster7t的NoC支持片上處理引擎之間所需的高帶寬通信。NoC中的每一行或每一列都可作為兩個256位實現(xiàn),單向的、行業(yè)標準的AXI通道,工作頻率為2GHz,同時可為每個方向提供512 Gbps的數(shù)據(jù)流量。

通過在Speedster中實現(xiàn)專用2D NoC,極大地簡化了高速數(shù)據(jù)移動,并確保數(shù)據(jù)流可以輕松地定向到整個FPGA結構中的任何自定義處理引擎。最重要的是,NOC消除了傳統(tǒng)FPGA使用可編程路由和邏輯查找表資源在整個FPGA中移動數(shù)據(jù)流中出現(xiàn)的擁塞和性能瓶頸。這種高性能網(wǎng)絡不僅可以提高Speedster7t FPGA的總帶寬容量,還可以在降低功耗的同時提高有效LUT容量。

以400G以太網(wǎng)總線帶寬操作所需頻率為例,傳統(tǒng)FPGA的最佳方案是總線大小為1024 bits,但是需要的頻率要達到724MHz,這在傳統(tǒng)的FPGA中是不可能實現(xiàn)的。顯然,對于任何400G以太網(wǎng)總線帶寬,傳統(tǒng)的FPGA運行速度都不夠快。

相比之下,Speedster7t FPGA則可以通過2D NOC以四個256bits的總線以506MHz的工作頻率來實現(xiàn)。

針對安全性至上和硬件確保應用的安全防護功能

Speedster7t FPGA系列產(chǎn)品在面臨第三方攻擊的威脅時,可用最先進的比特流安全保護功能應對,它們具有的多層防御能力可保護比特流的保密性和完整性。密鑰是基于防篡改物理不可克隆技術(PUF)進行加密,比特流由256位的AES-GCM加密算法進行加密和驗證。為了防止來自旁側信道的攻擊,比特流被分段,每個數(shù)據(jù)段使用單獨導出的密鑰,且解密硬件采用差分功率分析(DPA)計數(shù)器措施。此外,2048位RSA公鑰認證協(xié)議被用來激活解密和認證硬件。用戶可以確信的是當他們加載其安全比特流時,它是預期的配置,這是因為它已通過RSA公鑰、AES-GCM私鑰和CRC校驗進行了身份驗證。

四款Speedster7t FPGA系列產(chǎn)品

Speedster7t FPGA系列目前共有4款產(chǎn)品,器件的大小范圍為從363K至2.6M 的6輸入查找表(LUT)。

在具體的性能指標方面,Achronix透露,Speedster7t FPGA系列種最強的7t1500,在其最高頻率750MHz,80%利用率,每個MLP區(qū)塊支持16×Int8運算的情況下,在ResNet-50訓練模型下,可以實現(xiàn)高達8600張/秒的圖像識別能力;而在Yolov2的算法之下,7t1500亦可實現(xiàn)1600張/秒的圖像識別能力。

據(jù)Achronix CEORobert Blake介紹,支持所有Achronix產(chǎn)品的ACE設計工具現(xiàn)已可提供,可支持包括Speedcore eFPGA和Speedchip?FPGA多晶粒封裝芯片(Chiplet)。第一批用于評估的Speedster7t FPGA系列器件和開發(fā)板將于2019年第四季度提供。

小結:

從前面的介紹,我們不難看出,Speedster 7t系列FPGA,主要是通過其全新二維片上網(wǎng)絡,以及高密度全新機器學習處理器模塊陣列,實現(xiàn)了將FPGA的可編程性與ASIC的布線結構和計算引擎完美地結合在一起。而這與去年賽靈思推出的全新的ACAP架構也有著異曲同工之處。

需要指出的是,Achronix是目前唯一一家既提供獨立FPGA芯片又提供Speedcore?嵌入式FPGA(eFPGA)半導體知識產(chǎn)權(IP)的公司。也就是說,芯片設計廠商可以通過購買授權的形式,將Achronix的Speedcore?嵌入式FPGA(eFPGA)的IP整合到自己的芯片設計當中,設計出符合自身需求的芯片。

而Achronix在Speedcore eFPGA IP中采用了與Speedster7t FPGA中使用的同一種技術,可支持從Speedster7t FPGA到ASIC的無縫轉換。這也意味著芯片設計廠商通過與Achronix合作,也可以獲得最新的Speedster7t FPGA系列的技術,并可將其轉換為ASIC。Achronix CEORobert Blake表示,該技術有望幫助客戶節(jié)省高達50%的功耗并降低90%的成本。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1645

    文章

    22050

    瀏覽量

    618531
  • 芯片
    +關注

    關注

    460

    文章

    52520

    瀏覽量

    440983
  • 半導體
    +關注

    關注

    335

    文章

    28918

    瀏覽量

    237996
  • asic
    +關注

    關注

    34

    文章

    1247

    瀏覽量

    122408
  • 人工智能
    +關注

    關注

    1807

    文章

    49028

    瀏覽量

    249551

原文標題:行業(yè) | FPGA與ASIC的完美結合,Achronix Speedster 7t系列詳解

文章出處:【微信號:wc_ysj,微信公眾號:旺材芯片】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    熱跳線片式電阻:高效散熱與電氣隔離的完美結合

    熱跳線片式電阻:高效散熱與電氣隔離的完美結合
    的頭像 發(fā)表于 01-02 15:02 ?689次閱讀

    【米爾-Xilinx XC7A100T FPGA開發(fā)板試用】測試一

    感謝米爾電子和電子發(fā)燒友提供的米爾-Xilinx XC7A100T FPGA開發(fā)板。 MYD-J7A100T用的 FPGA 為 XILINX 公司 ARTIX-
    發(fā)表于 12-08 08:48

    FPGAASIC的區(qū)別 FPGA性能優(yōu)化技巧

    FPGAASIC的區(qū)別 FPGA(現(xiàn)場可編程門陣列)和ASIC(專用集成電路)是兩種不同的集成電路技術,它們在多個方面存在顯著的區(qū)別: FPGA
    的頭像 發(fā)表于 12-02 09:51 ?1056次閱讀

    Achronix與BigCat Wireless建立戰(zhàn)略合作伙伴關系

    Speedster7t FPGA上的創(chuàng)新機器學習處理器(MLP)來滿足無線應用中先進的信號處理要求,以及支撐未來的6G標準。此次合作旨在通過基于Achronix FPGA
    的頭像 發(fā)表于 11-21 10:58 ?712次閱讀

    Achronix Speedcore eFPGA的特性和功能

    Speedcore嵌入式FPGA(embedded FPGA,eFPGA)知識產(chǎn)權(IP)產(chǎn)品是Achronix公司于2016年推出的顛覆性技術,并于當年開始向最終客戶交付,目前出貨量
    的頭像 發(fā)表于 11-15 14:28 ?1053次閱讀
    <b class='flag-5'>Achronix</b> Speedcore e<b class='flag-5'>FPGA</b>的特性和功能

    S7t-VG6 VectorPath加速卡的特性和功能

    S7t-VG6 VectorPath加速卡是Achronix公司聯(lián)合BittWare公司(Molex旗下的領先企業(yè)級FPGA加速器產(chǎn)品供應商)推出的一類全新的、面向高性能計算和數(shù)據(jù)加速應用的F
    的頭像 發(fā)表于 11-14 11:19 ?827次閱讀

    Xilinx 7系列FPGA PCIe Gen3的應用接口及特性

    Xilinx7系列FPGA集成了新一代PCI Express集成塊,支持8.0Gb/s數(shù)據(jù)速率的PCI Express 3.0。本文介紹了7系列
    的頭像 發(fā)表于 11-05 15:45 ?3190次閱讀
    Xilinx <b class='flag-5'>7</b><b class='flag-5'>系列</b><b class='flag-5'>FPGA</b> PCIe Gen3的應用接口及特性

    FPGAASIC在大模型推理加速中的應用

    隨著現(xiàn)在AI的快速發(fā)展,使用FPGAASIC進行推理加速的研究也越來越多,從目前的市場來說,有些公司已經(jīng)有了專門做推理的ASIC,像Groq的LPU,專門針對大語言模型的推理做了優(yōu)化,因此相比GPU這種通過計算平臺,功耗更低、
    的頭像 發(fā)表于 10-29 14:12 ?2035次閱讀
    <b class='flag-5'>FPGA</b>和<b class='flag-5'>ASIC</b>在大模型推理加速中的應用

    FPGAASIC的優(yōu)缺點比較

    FPGA(現(xiàn)場可編程門陣列)與ASIC(專用集成電路)是兩種不同的硬件實現(xiàn)方式,各自具有獨特的優(yōu)缺點。以下是對兩者優(yōu)缺點的比較: FPGA的優(yōu)點 可編程性強 :FPGA具有高度的可編程
    的頭像 發(fā)表于 10-25 09:24 ?1714次閱讀

    Achronix Speedster7t FPGA與GPU解決方案的比較

    這篇針對大模型推理跟GPU對比分析,雖然以Llama2為例,也適用于最新的Llama3,模型的日新月易也更進一步說明硬件平臺的可編程可擴展的重要性,FPGA是其中一個不錯的選擇。
    的頭像 發(fā)表于 09-18 16:19 ?757次閱讀
    <b class='flag-5'>Achronix</b> <b class='flag-5'>Speedster7t</b> <b class='flag-5'>FPGA</b>與GPU解決方案的比較

    Primemas選擇Achronix eFPGA技術用于Chiplet平臺

    高性能 FPGA 和嵌入式FPGA (eFPGA) IP 的領導者 Achronix Semiconductor Corporation 和使用Chiplet 技術開發(fā)創(chuàng)新 SoC H
    的頭像 發(fā)表于 09-18 16:16 ?955次閱讀

    基于Achronix Speedster7t FPGA器件的AI基準測試

    Achronix半導體公司推出了為AI優(yōu)化的Speedster7t系列FPGA芯片,該系列包含專門針對AI工作負載的強化計算引擎。隨著AI在
    的頭像 發(fā)表于 09-18 16:10 ?1070次閱讀
    基于<b class='flag-5'>Achronix</b> <b class='flag-5'>Speedster7t</b> <b class='flag-5'>FPGA</b>器件的AI基準測試

    ASIC IP核移植到FPGA上——更新概念并推動改變以完成充滿挑戰(zhàn)的任務!

    系列文章從數(shù)字芯片設計項目技術總監(jiān)的角度出發(fā),介紹了如何將芯片的產(chǎn)品定義與設計和驗證規(guī)劃進行結合,詳細講述了在FPGA上使用IP核來開發(fā)ASIC原型項目時,必須認真考慮的一些問題。文
    的頭像 發(fā)表于 08-10 17:13 ?1098次閱讀
    將<b class='flag-5'>ASIC</b> IP核移植到<b class='flag-5'>FPGA</b>上——更新概念并推動改變以完成充滿挑戰(zhàn)的任務!

    石英 CMOS 振蕩器 PD2520 系列 1 to 200 MHz :卓越性能與廣泛應用的完美結合

    石英 CMOS 振蕩器 PD2520 系列(1 to 200 MHz):卓越性能與廣泛應用的完美結合
    的頭像 發(fā)表于 08-07 14:10 ?644次閱讀
    石英 CMOS 振蕩器 PD2520 <b class='flag-5'>系列</b> 1 to 200 MHz :卓越性能與廣泛應用的<b class='flag-5'>完美</b><b class='flag-5'>結合</b>

    DS1008JN:精準與高效能的完美結合

    DS1008JN:精準與高效能的完美結合
    的頭像 發(fā)表于 07-24 14:55 ?666次閱讀