chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Achronix新一代嵌入式FPGA IP為AI/ML和網(wǎng)絡(luò)硬件加速應(yīng)用帶來更高性能

獨(dú)愛72H ? 來源:劉林華 ? 作者:電子發(fā)燒友 ? 2018-12-23 16:29 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2016年,Achronix推出的Speedcore成為首款向客戶出貨的嵌入式FPGA(eFPGA)IP,使客戶將FPGA功能集成到他們的SoC中成為可能。由于Speedcore IP是專為計(jì)算和網(wǎng)絡(luò)加速應(yīng)用而設(shè)計(jì)的,并基于Speedster22i FPGA系列相同的高性能架構(gòu),采用Speedcore作為硬件加速器的方案被廣泛應(yīng)用到數(shù)據(jù)中心通信基礎(chǔ)設(shè)施等領(lǐng)域。據(jù)了解,eFPGA IP授權(quán)業(yè)務(wù)在過去兩年間快速增長,2017年,已經(jīng)占到Achronix FPGA整體營收的20%,而2018年,憑借其顯著的功耗和成本優(yōu)勢(shì),eFPGA IP授權(quán)業(yè)務(wù)比重進(jìn)一步提高。

本月,Achronix宣布推出第四代嵌入式FPGA產(chǎn)品Speedcore Gen4 eFPGA IP。較前代產(chǎn)品,Speedcore Gen4將性能提高了60%、功耗降低了50%、芯片面積減少65%,同時(shí)保留了原有的Speedcore eFPGA IP的功能,即可將可編程硬件加速功能引入廣泛的計(jì)算、網(wǎng)絡(luò)和存儲(chǔ)應(yīng)用,實(shí)現(xiàn)接口協(xié)議橋接/轉(zhuǎn)換、算法加速和數(shù)據(jù)包處理。

圖:Speedcore 7t較前代產(chǎn)品性能顯著提升

據(jù)Achronix市場(chǎng)營銷副總裁Steve Mensor介紹,創(chuàng)新的架構(gòu)使這些性能提升成為可能。與上一代Speedcore產(chǎn)品相比,新的Speedcore Gen4架構(gòu)實(shí)現(xiàn)了多項(xiàng)創(chuàng)新,從而可將系統(tǒng)整體性能提高60%。其中查找表的所有方面都得到了增強(qiáng),以支持使用最少的資源來實(shí)現(xiàn)各種功能,從而可縮減面積和功耗并提高性能。其中的更改包括將ALU的大小加倍、將每個(gè)LUT的寄存器數(shù)量加倍、支持7位函數(shù)和一些8位函數(shù)、以及為移位寄存器提供的專用高速連接。

圖:Achronix市場(chǎng)營銷副總裁Steve Mensor

Speedcore Gen4的路由架構(gòu)也借由一種獨(dú)立的專用總線路由結(jié)構(gòu)得到了增強(qiáng)。此外,在該路由結(jié)構(gòu)中還有專用的總線多路復(fù)用器,可有效地創(chuàng)建分布式的、運(yùn)行時(shí)可配置的交換網(wǎng)絡(luò)。這為高帶寬和低延遲應(yīng)用提供了最佳的解決方案,并在業(yè)界首次實(shí)現(xiàn)了將網(wǎng)絡(luò)優(yōu)化應(yīng)用于FPGA互連。

圖:Speedcore Gen4架構(gòu)為高性能總線提供了專用路由

易用性也是eFPGA的特色之一,降低了客戶集成FPGA加速器的門檻。客戶通過定制其邏輯、RAMDSP資源需求,Achronix接下來就會(huì)為其配置滿足其需求的Speedcore IP,Speedcore查找表(LUT)、RAM單元模塊和DSP64單元模塊可以像樂高積木一樣進(jìn)行組合,以便為特定的應(yīng)用創(chuàng)建優(yōu)化的可編程功能。

根據(jù)艾瑞咨詢的數(shù)據(jù),2020年全球人工智能市場(chǎng)規(guī)模約1190億人民幣,未來10年,人工智能將會(huì)是一個(gè)2000億美元的市場(chǎng),空間非常巨大。

在人工智能領(lǐng)域,傳統(tǒng)的芯片計(jì)算架構(gòu)已無法支撐深度學(xué)習(xí)等大規(guī)模并行計(jì)算的需求,這就需要新的底層硬件來更好地儲(chǔ)備數(shù)據(jù)、加速計(jì)算過程。其中,F(xiàn)PGA等用于性能加速的硬件、神經(jīng)網(wǎng)絡(luò)芯片、傳感器與中間件,則是支撐人工智能的前提。新的Speedcore Gen4可謂最佳的人工智能/機(jī)器學(xué)習(xí)加速器。Achronix機(jī)器學(xué)習(xí)處理器(MLP)利用了人工智能/機(jī)器學(xué)習(xí)處理的特定屬性,并將這些應(yīng)用的性能提高了300%。這是通過多種架構(gòu)性創(chuàng)新來實(shí)現(xiàn)的,這些創(chuàng)新可以同時(shí)提高每個(gè)時(shí)鐘周期的性能和操作次數(shù)。

MLP是一個(gè)完整的人工智能/機(jī)器學(xué)習(xí)計(jì)算引擎,支持定點(diǎn)和多個(gè)浮點(diǎn)數(shù)格式和精度。每個(gè)機(jī)器學(xué)習(xí)處理器包括一個(gè)循環(huán)寄存器文件,它用來存儲(chǔ)重用的權(quán)重或數(shù)據(jù)。各個(gè)機(jī)器學(xué)習(xí)處理器與相鄰的機(jī)器學(xué)習(xí)處理器單元模塊和更大的存儲(chǔ)單元模塊緊密耦合,以提供最高的處理性能、每秒最高的操作次數(shù)和最低的功率分集。這些機(jī)器學(xué)習(xí)處理器支持各種定點(diǎn)和浮點(diǎn)格式,包括Bfloat16、16位、半精度、24位和單元塊浮點(diǎn)。用戶可以通過為其應(yīng)用選擇最佳精度來實(shí)現(xiàn)精度和性能的均衡。

為了補(bǔ)充機(jī)器學(xué)習(xí)處理器并提高人工智能/機(jī)器學(xué)習(xí)的計(jì)算密度,Speedcore Gen4查找表(LUT)可以實(shí)現(xiàn)比任何獨(dú)立FPGA芯片產(chǎn)品高出兩倍的乘法器。領(lǐng)先的獨(dú)立FPGA芯片在21個(gè)查找表可以中實(shí)現(xiàn)6x6乘法器,而Speedcore Gen4僅需在11個(gè)LUT中就可實(shí)現(xiàn)相同的功能,并可在1 GHz的速率上工作。

GSMA智庫發(fā)布的最新的全球物聯(lián)網(wǎng)市場(chǎng)報(bào)告顯示,包括連接、應(yīng)用、平臺(tái)與服務(wù),到2025年全球物聯(lián)網(wǎng)市場(chǎng)規(guī)模將達(dá)到1.1萬億美元。數(shù)十億物聯(lián)網(wǎng)設(shè)備的出現(xiàn),將給傳統(tǒng)網(wǎng)絡(luò)和計(jì)算基礎(chǔ)設(shè)施帶來壓力。固定和無線網(wǎng)絡(luò)帶寬的急劇增加,加上處理能力向邊緣等進(jìn)行重新分配。這種新的處理范式意味著每秒將有數(shù)十億到數(shù)萬億次的運(yùn)算。傳統(tǒng)云和企業(yè)數(shù)據(jù)中心計(jì)算資源和通信基礎(chǔ)設(shè)施無法跟上數(shù)據(jù)速率的指數(shù)級(jí)增長、快速變化的安全協(xié)議、以及許多新的網(wǎng)絡(luò)和連接要求。傳統(tǒng)的多核CPU和SoC無法在沒有輔助的情況下獨(dú)立滿足這些要求,因而它們需要硬件加速器,通常是可重新編程的硬件加速器,用來預(yù)處理和卸載計(jì)算,以便提高系統(tǒng)的整體計(jì)算性能。經(jīng)過優(yōu)化后的Speedcore Gen4 eFPGA已經(jīng)可以滿足這些應(yīng)用需求。

Steve Mensor告訴21IC記者,現(xiàn)有已量產(chǎn)的Speedcore架構(gòu),Achronix可在6周內(nèi)為客戶配置并提供Speedcore eFPGA IP和支持文件。而最新采用臺(tái)積電7nm工藝節(jié)點(diǎn)的Speedcore Gen4將于2019年上半年投入量產(chǎn),芯片設(shè)計(jì)企業(yè)現(xiàn)已可以聯(lián)系A(chǔ)chronix,以獲得支持其特定需求的Speedcore Gen4實(shí)例。此外Achronix還將于2019年下半年提供用于臺(tái)積電16nm和12nm工藝節(jié)點(diǎn)的Speedcore Gen4 eFPGA IP。據(jù)Steve Mensor預(yù)測(cè),憑借Speedcore Gen4 eFPGA的功耗和成本優(yōu)勢(shì),人工智能/機(jī)器學(xué)習(xí)和高數(shù)據(jù)帶寬應(yīng)用的爆炸式需求將推動(dòng)其在邊緣計(jì)算、5G、網(wǎng)絡(luò)加速和計(jì)算加速等領(lǐng)域被廣泛采納,2019年,eFPGA IP授權(quán)業(yè)務(wù)有望達(dá)到Achronix FPGA整體營收的50%甚至更多。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1660

    文章

    22412

    瀏覽量

    636402
  • 硬件加速
    +關(guān)注

    關(guān)注

    0

    文章

    33

    瀏覽量

    11430
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    FPGA硬件加速卡設(shè)計(jì)原理圖:1-基于Xilinx XCKU115的半高PCIe x8 硬件加速卡 PCIe半高 XCKU115-3-FLVF1924-E芯片

    FPGA硬件加速, PCIe半高卡, XCKU115, 光纖采集卡, 信號(hào)計(jì)算板, 硬件加速
    的頭像 發(fā)表于 02-12 09:52 ?393次閱讀
    <b class='flag-5'>FPGA</b><b class='flag-5'>硬件加速</b>卡設(shè)計(jì)原理圖:1-基于Xilinx XCKU115的半高PCIe x8 <b class='flag-5'>硬件加速</b>卡 PCIe半高 XCKU115-3-FLVF1924-E芯片

    文掌握瑞芯微RK系列NPU算子支持全景:覆蓋6大平臺(tái),新增硬件加速算子,嵌入式AI開發(fā)不踩坑

    嵌入式 AI 領(lǐng)域,瑞芯微(Rockchip)RK 系列 NPU 憑借低功耗、高兼容性的特性,廣泛應(yīng)用于智能監(jiān)控、邊緣計(jì)算、物聯(lián)網(wǎng)設(shè)備等場(chǎng)景。近期發(fā)布的《RKNN Compiler Support
    的頭像 發(fā)表于 02-06 16:33 ?1042次閱讀
    <b class='flag-5'>一</b>文掌握瑞芯微RK系列NPU算子支持全景:覆蓋6大平臺(tái),新增<b class='flag-5'>硬件加速</b>算子,<b class='flag-5'>嵌入式</b><b class='flag-5'>AI</b>開發(fā)不踩坑

    新品 | LLM-8850 Kit,高性能AI加速卡套件 DinMeter v1.1,1/32DIN標(biāo)準(zhǔn)嵌入式開發(fā)板

    LLM-8850KitLLM-8850Kit是款面向邊緣AI嵌入式計(jì)算場(chǎng)景的高性能AI加速
    的頭像 發(fā)表于 01-30 16:11 ?1047次閱讀
    新品 | LLM-8850 Kit,<b class='flag-5'>高性能</b><b class='flag-5'>AI</b><b class='flag-5'>加速</b>卡套件 DinMeter v1.1,1/32DIN標(biāo)準(zhǔn)<b class='flag-5'>嵌入式</b>開發(fā)板

    arm嵌入式主板優(yōu)缺點(diǎn)

    設(shè)備里面做控制、數(shù)據(jù)處理使用的CPU板。般作為工控主板使用。   ARM處理器是種16/32位的嵌入式RISC微處理器,具有低成本、高性能、低功耗的特點(diǎn)。ARM9系列微處理器具有
    發(fā)表于 01-08 07:08

    重磅合作!Quintauris 聯(lián)手 SiFive,加速 RISC-V 在嵌入式AI 領(lǐng)域落地

    據(jù)科技區(qū)角報(bào)道半導(dǎo)體解決方案提供商 Quintauris 最近宣布和 RISC-V 處理器 IP 領(lǐng)域的頭部廠商 SiFive 達(dá)成戰(zhàn)略合作,目標(biāo)直接瞄準(zhǔn)加速 RISC-V 在嵌入式、AI
    發(fā)表于 12-18 12:01

    嵌入式硬件設(shè)計(jì)解析

    、高可靠性的無線通信模塊;在人工智能應(yīng)用中,需要設(shè)計(jì)高性能、低功耗的神經(jīng)網(wǎng)絡(luò)加速器;在5G應(yīng)用中,需要設(shè)計(jì)高速、低延遲的數(shù)據(jù)處理電路等。 總之,嵌入式
    發(fā)表于 12-02 08:22

    嵌入式FPGA的區(qū)別

    ,嵌入式軟件開發(fā),主要與嵌入式cao作系統(tǒng)、應(yīng)用軟件等有關(guān)。第二是嵌入式硬件開發(fā),需要掌握硬件
    發(fā)表于 11-20 07:12

    嵌入式FPGA的區(qū)別

    ,FPGA憑借硬件并行處理能力,能夠?qū)崿F(xiàn)納秒級(jí)響應(yīng),遠(yuǎn)優(yōu)于微秒級(jí)的嵌入式系統(tǒng)。 功耗效率上,嵌入式系統(tǒng)針對(duì)特定應(yīng)用優(yōu)化后能效比很高,而FPGA
    發(fā)表于 11-19 06:55

    常用硬件加速的方法

    之前總結(jié)了些常用硬件加速方法 1)面積換速度:也就是串轉(zhuǎn)并運(yùn)算,可以多個(gè)模塊同時(shí)計(jì)算; 2)時(shí)間換空間:時(shí)序收斂下通過頻率提高性能,雖然面積可能稍微加大點(diǎn); 3)流水線操作:流水線以面積換
    發(fā)表于 10-29 06:20

    硬件加速模塊的時(shí)鐘設(shè)計(jì)

    硬件加速模塊的每層涉及到多位數(shù)定點(diǎn)數(shù)乘法的運(yùn)算需要調(diào)用dsp這個(gè)ip核,dsp處理數(shù)據(jù)的時(shí)鐘信號(hào)為clk_c,dsp輸出數(shù)據(jù)需要四個(gè)clk_c的時(shí)鐘周期。 clk_n : clk_n
    發(fā)表于 10-23 07:28

    新一代嵌入式開發(fā)平臺(tái) AMD嵌入式軟件和工具2025.1版現(xiàn)已推出

    AMD 2025.1 版嵌入式軟件和工具是面向新一代嵌入式系統(tǒng)開發(fā)而打造的綜合平臺(tái),全面加速概念構(gòu)想到部署落地。 2025.1 版嵌入式軟件
    的頭像 發(fā)表于 08-20 09:15 ?3986次閱讀

    AMD 2025.1版嵌入式軟件和工具的新增功能

    AMD 2025.1 版嵌入式軟件和工具是面向新一代嵌入式系統(tǒng)開發(fā)而打造的綜合平臺(tái),全面加速概念構(gòu)想到部署落地。
    的頭像 發(fā)表于 08-15 15:32 ?1274次閱讀

    適用于數(shù)據(jù)中心和AI時(shí)代的800G網(wǎng)絡(luò)

    持續(xù)優(yōu)化800G網(wǎng)絡(luò)解決方案,一代1.6T數(shù)據(jù)中心鋪平道路,助力數(shù)據(jù)中心迎接更高性能、更智能化的時(shí)代挑戰(zhàn)。 ? *文章來源于飛速(FS)社區(qū) ?
    發(fā)表于 03-25 17:35

    Banana Pi 發(fā)布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 計(jì)算與嵌入式開發(fā)

    RZ/V2N——近期在嵌入式世界2025上新發(fā)布, AI 計(jì)算、嵌入式系統(tǒng)及工自動(dòng)化提供強(qiáng)大支持。這款全新的計(jì)算平臺(tái)旨在滿足開發(fā)者和企業(yè)用戶對(duì)高性
    發(fā)表于 03-19 17:54

    嵌入式AI加速器DRP-AI 詳細(xì)介紹

    深度神經(jīng)網(wǎng)絡(luò)中使用的人工智能(AI)已經(jīng)IT領(lǐng)域提供了新的價(jià)值。雖然很多人期望用AI來實(shí)現(xiàn)嵌入式應(yīng)用,但
    的頭像 發(fā)表于 03-15 16:13 ?1807次閱讀
    <b class='flag-5'>嵌入式</b><b class='flag-5'>AI</b><b class='flag-5'>加速</b>器DRP-<b class='flag-5'>AI</b> 詳細(xì)介紹