chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

人工智能需求促進(jìn)FPGA市場(chǎng) 這一革新解決了應(yīng)用瓶頸

堅(jiān)白 ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:陸楠 ? 2019-05-23 14:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

過(guò)去幾年,FPGA的CAGR大約一直保持在8-10%左右,隨著該類(lèi)器件在AI應(yīng)用中的擴(kuò)張,未來(lái)5年其CAGR增長(zhǎng)將高達(dá)38.4%!根據(jù)市場(chǎng)調(diào)研公司Semico Research的預(yù)測(cè),人工智能應(yīng)用中FPGA的市場(chǎng)規(guī)模將在未來(lái)4年內(nèi)增長(zhǎng)3倍,達(dá)到52億美元。為了保持競(jìng)爭(zhēng)力,目前全球有25%的企業(yè)實(shí)施了人工智能/機(jī)器學(xué)習(xí)(AI/ML),而兩年內(nèi),這一比例將增長(zhǎng)到72%,以更好地獲得核心職能方面的商業(yè)洞察力。
企業(yè)AI/ML部署需求增長(zhǎng)趨勢(shì)
圖:企業(yè)AI/ML部署需求增長(zhǎng)趨勢(shì)
伴隨這一趨勢(shì),AI的算法在不斷演進(jìn),對(duì)數(shù)值精度的選擇要求也更加多元,高效算力、高效豐富的存儲(chǔ)緩存能力以及高效大帶寬的數(shù)據(jù)運(yùn)送能力,是AI/ML硬件解決方案所面臨的主要挑戰(zhàn)。系統(tǒng)開(kāi)發(fā)者會(huì)利用FPGA架構(gòu)去優(yōu)化功耗、性能和靈活性,并突破處理單元在效率上的瓶頸,包括計(jì)算引擎、內(nèi)存層次結(jié)構(gòu)和數(shù)據(jù)移動(dòng)。
算法和精度要求不同給處理帶來(lái)挑戰(zhàn)
圖:算法和精度要求不同給處理帶來(lái)挑戰(zhàn)
就AI的應(yīng)用而言,不同場(chǎng)景應(yīng)用對(duì)FPGA的需求不同。通常云計(jì)算中的應(yīng)用主要是需要FPGA在AI/ML和高帶寬數(shù)據(jù)加速上的能力,而在端側(cè)則需要在高靈活性的同時(shí)還要具有ASIC的性能。雖然,F(xiàn)PGA已經(jīng)大量應(yīng)用于泛AI領(lǐng)域,但它是否很好的滿足這兩個(gè)方面的需求,還是一個(gè)值得探討的話題。

重構(gòu)FPGA架構(gòu)

縱觀FPGA產(chǎn)品的演進(jìn)歷史(包括器件的產(chǎn)生),每一次大的迭代都是一種設(shè)計(jì)方法論的革新,從這個(gè)角度看,Achronix公司最近發(fā)布的Speedster7t針對(duì)上述兩個(gè)應(yīng)用場(chǎng)景上進(jìn)行的優(yōu)化都可以看做方法論上的革新。在開(kāi)發(fā)Speedster7t的過(guò)程中,Achronix的工程團(tuán)隊(duì)完全重新構(gòu)想了整個(gè)FPGA架構(gòu),以平衡片上處理、互連和外部輸入輸出接口,實(shí)現(xiàn)數(shù)據(jù)密集型應(yīng)用吞吐量的最大化,這些應(yīng)用場(chǎng)景可見(jiàn)于那些基于邊緣和基于服務(wù)器的AI/ML應(yīng)用、網(wǎng)絡(luò)處理和存儲(chǔ)。
“Speedster7t是我們歷史上最令人激動(dòng)的發(fā)布,代表了建立在四個(gè)架構(gòu)代系的硬件和軟件開(kāi)發(fā)基礎(chǔ)上的創(chuàng)新和積淀?!盇chronix公司董事長(zhǎng)兼首席執(zhí)行官Robert Blake介紹,“該器件采用TSMC的7nm FinFET工藝制造,專(zhuān)為ML和高帶寬網(wǎng)絡(luò)應(yīng)用進(jìn)行了優(yōu)化。”
具體而言,相較于目前的FPGA,Speedster7t革新之處在于設(shè)計(jì)了針對(duì)ML的處理器(MLP),以及一個(gè)可橫跨和垂直跨越FPGA邏輯陣列的高帶寬的二維片上網(wǎng)絡(luò)(NOC),二者結(jié)合既保留了FPGA的靈活性,又實(shí)現(xiàn)了ASIC的性能。

不占用FPGA布線的MLP單元

這個(gè)片內(nèi)的MLP是高度可配置的、計(jì)算密集型的單元模塊,可支持4到24位的整點(diǎn)格式和高效的浮點(diǎn)模式,包括對(duì)TensorFlow的16位格式的支持,以及可使每個(gè)MLP的計(jì)算引擎加倍的增壓塊浮點(diǎn)格式的直接支持。該MLP可以通過(guò)運(yùn)算和緩存級(jí)鏈實(shí)現(xiàn)更復(fù)雜的算法,而不需要使用FPGA布線資源。
“目前FPGA會(huì)使用DSP來(lái)進(jìn)行ML的處理,但其對(duì)數(shù)值精度的支持并不高效,并且需要消耗額外邏輯和存儲(chǔ)資源,其性能也受限于FPGA布線?!盉lake說(shuō),“DSP常用于無(wú)線數(shù)字濾波的處理,而Speedster7t中的MLP則在計(jì)算架構(gòu)、緩存(內(nèi)嵌)、可配置算法以及對(duì)整點(diǎn)和浮點(diǎn)的支持上提供了更好的AI/ML的計(jì)算性能和能效比?!?/div>
在FPGA中采用MLP比DSP更適用于AI/ML處理
圖:在FPGA中采用MLP(右)比DSP(左)更適用于AI/ML處理

二維片上網(wǎng)絡(luò)——NOC

NOC是在FPGA路由結(jié)構(gòu)上的另一個(gè)重要革新。這一設(shè)計(jì)主要針對(duì)FPGA的片上處理引擎之間所需的高帶寬通信。Speedster7t片上資源包括8個(gè)GDDR6控制器、72個(gè)業(yè)界SerDes(1到112 Gbps)、帶有前向糾錯(cuò)(FEC)的硬件400G以太網(wǎng)MAC(4x100G或8x50G的配置),以及硬件PCI Express Gen5控制器(每個(gè)控制器有8個(gè)或16個(gè)通道)。
這些高速I(mǎi)/O和存儲(chǔ)器端口的數(shù)萬(wàn)兆比特?cái)?shù)據(jù)很容易淹沒(méi)傳統(tǒng)FPGA面向比特位的可編程互連邏輯陣列的路由容量,而Speedster7t通過(guò)NOC把它們連接到所有FPGA的高速數(shù)據(jù)和存儲(chǔ)器接口。NOC和FPGA功能之間通過(guò)網(wǎng)絡(luò)接入點(diǎn)NAP連接,每個(gè)水平行和垂直列的交叉點(diǎn)都有NAP(主NAP和從NAP)。NoC中的每行/列都可同時(shí)為每個(gè)方向提供512Gbps的數(shù)據(jù)流量,其鏈路雙向運(yùn)行,最大的設(shè)備帶寬可以達(dá)到20Tbps。
“最重要的是,NOC消除了傳統(tǒng)FPGA使用可編程路由和邏輯查找表資源在整個(gè)FPGA中移動(dòng)數(shù)據(jù)流中出現(xiàn)的擁塞和性能瓶頸?!盉lake說(shuō),“這種高性能網(wǎng)絡(luò)不僅可以提高Speedster7t FPGA的總帶寬容量,還可以在降低功耗的同時(shí)提高有效LUT容量?!?/div>
圖:NOC是在FPGA路由結(jié)構(gòu)上的另一個(gè)重要革新
的確,NOC這一方法解決了GDDR6、400G以太網(wǎng)MAC這些片上資源海量數(shù)據(jù)傳輸?shù)膯?wèn)題。Speedster7t是目前市面唯一支持GDDR6存儲(chǔ)器的FPGA,可以支持4 Tbps的GDDR6累加帶寬,可以很小的成本提供與基于HBM的FPGA等效存儲(chǔ)帶寬。相較于HBM,GDDR6只需要一半的成本就可以滿足高存儲(chǔ)層次和帶寬的需求,并且,HBM是固化的塊,GDDR6則更靈活,用戶可以選擇不同容量和帶寬。
NOC也解決了傳統(tǒng)FPGA的運(yùn)行速度無(wú)法滿足任何400G以太網(wǎng)總線寬度要求的問(wèn)題,400G以太網(wǎng)的總線大小達(dá)1024bit,所需的最高頻率達(dá)到724 MHz,這在傳統(tǒng)FPGA中無(wú)法實(shí)現(xiàn),NOC由于消除了傳統(tǒng)設(shè)計(jì)中與FPGA布線相關(guān)的延遲,所以可以最高支持750 MHz的頻率,這滿足了MLP和嵌入式存儲(chǔ)器模、400G以太網(wǎng)MAC及高速SerDes之間的數(shù)據(jù)傳輸。
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1650

    文章

    22217

    瀏覽量

    627802
  • NoC
    NoC
    +關(guān)注

    關(guān)注

    0

    文章

    42

    瀏覽量

    12061
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    革新科研智造,引領(lǐng)材料未來(lái)——高通量智能科研制備工作站

    技術(shù)、智能硬件、測(cè)試儀器及自動(dòng)化實(shí)驗(yàn)平臺(tái),致力于為能源科學(xué)與材料科學(xué)提供領(lǐng)先的解決方案。 攜手共創(chuàng),以人工智能引領(lǐng)研發(fā)新紀(jì)元 善思創(chuàng)興始終致力于與行業(yè)伙伴緊密合作,通過(guò)推廣高通量智能實(shí)驗(yàn)平臺(tái)及AI模型
    發(fā)表于 09-27 14:17

    傲琪人工合成石墨片: 破解智能手機(jī)散熱困境的創(chuàng)新解決方案

    用戶提供更持久的產(chǎn)品使用周期。 傲琪人工合成石墨片代表智能手機(jī)散熱技術(shù)的次重要進(jìn)化。它不僅僅是
    發(fā)表于 09-13 14:06

    挖到寶!人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器

    ,技術(shù)自主可控 在如今這個(gè)科技競(jìng)爭(zhēng)激烈的時(shí)代,國(guó)產(chǎn)化硬件的重要性不言而喻。比鄰星人工智能綜合實(shí)驗(yàn)箱就做到了這一點(diǎn),采用國(guó)產(chǎn)化硬件,積極推進(jìn)全行業(yè)產(chǎn)業(yè)鏈上下游環(huán)節(jié)的國(guó)產(chǎn)化進(jìn)程,把國(guó)產(chǎn)自主可控的軟硬件平臺(tái)
    發(fā)表于 08-07 14:30

    挖到寶!比鄰星人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器!

    ,技術(shù)自主可控 在如今這個(gè)科技競(jìng)爭(zhēng)激烈的時(shí)代,國(guó)產(chǎn)化硬件的重要性不言而喻。比鄰星人工智能綜合實(shí)驗(yàn)箱就做到了這一點(diǎn),采用國(guó)產(chǎn)化硬件,積極推進(jìn)全行業(yè)產(chǎn)業(yè)鏈上下游環(huán)節(jié)的國(guó)產(chǎn)化進(jìn)程,把國(guó)產(chǎn)自主可控的軟硬件平臺(tái)
    發(fā)表于 08-07 14:23

    最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門(mén)學(xué)習(xí)課程參考2025版(大模型篇)

    人工智能大模型重塑教育與社會(huì)發(fā)展的當(dāng)下,無(wú)論是探索未來(lái)職業(yè)方向,還是更新技術(shù)儲(chǔ)備,掌握大模型知識(shí)都已成為新時(shí)代的必修課。從職場(chǎng)上輔助工作的智能助手,到課堂用于學(xué)術(shù)研究的智能工具,大模型正在工作生活
    發(fā)表于 07-04 11:10

    瑞蘇盈科FPGA賦能Lynx SAI50 MLSoC:邊緣人工智能FPGA性能的完美結(jié)合

    前言在科技飛速發(fā)展的當(dāng)下,邊緣人工智能FPGA性能的結(jié)合正引領(lǐng)著技術(shù)革新的新浪潮。這一融合不僅為眾多行業(yè)帶來(lái)了前所未有的機(jī)遇,更在諸多領(lǐng)域?qū)崿F(xiàn)
    的頭像 發(fā)表于 05-16 08:48 ?679次閱讀
    瑞蘇盈科<b class='flag-5'>FPGA</b>賦能Lynx SAI50 MLSoC:邊緣<b class='flag-5'>人工智能</b>與<b class='flag-5'>FPGA</b>性能的完美結(jié)合

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】+數(shù)據(jù)在具身人工智能中的價(jià)值

    嵌入式人工智能(EAI)將人工智能集成到機(jī)器人等物理實(shí)體中,使它們能夠感知、學(xué)習(xí)環(huán)境并與之動(dòng)態(tài)交互。這種能力使此類(lèi)機(jī)器人能夠在人類(lèi)社會(huì)中有效地提供商品及服務(wù)。 數(shù)據(jù)是種貨幣化工具 數(shù)據(jù)是互聯(lián)網(wǎng)
    發(fā)表于 12-24 00:33

    人工智能推理及神經(jīng)處理的未來(lái)

    人工智能行業(yè)所圍繞的是個(gè)受技術(shù)進(jìn)步、社會(huì)需求和監(jiān)管政策影響的動(dòng)態(tài)環(huán)境。機(jī)器學(xué)習(xí)、自然語(yǔ)言處理和計(jì)算機(jī)視覺(jué)方面的技術(shù)進(jìn)步,加速人工智能的發(fā)
    的頭像 發(fā)表于 12-23 11:18 ?793次閱讀
    <b class='flag-5'>人工智能</b>推理及神經(jīng)處理的未來(lái)

    卡諾模型為人工智能領(lǐng)域提供種全新的視角

    在探索人工智能如何更深層次滿足用戶需求、提升用戶體驗(yàn)的旅程中,卡諾模型(Kano Model)提供個(gè)極具價(jià)值的理論框架。這一模型不僅為產(chǎn)
    的頭像 發(fā)表于 12-11 10:17 ?839次閱讀

    FPGA人工智能中的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,FPGA(現(xiàn)場(chǎng)可編程門(mén)陣列)在AI領(lǐng)域扮演著越來(lái)越重要的角色。FPGA以其獨(dú)特的靈活性、低延遲和高能效等優(yōu)勢(shì),為AI應(yīng)用提供強(qiáng)大的硬件支持。 1.
    的頭像 發(fā)表于 12-02 09:53 ?2773次閱讀

    集成電路與人工智能結(jié)合

    集成電路,為人工智能算法提供強(qiáng)大的算力支持。 隨著人工智能技術(shù)的不斷發(fā)展,對(duì)存儲(chǔ)和計(jì)算能力的需求日益增長(zhǎng),而集成電路的快速發(fā)展正好滿足
    的頭像 發(fā)表于 11-19 10:05 ?2622次閱讀

    嵌入式和人工智能究竟是什么關(guān)系?

    嵌入式和人工智能究竟是什么關(guān)系? 嵌入式系統(tǒng)是種特殊的系統(tǒng),它通常被嵌入到其他設(shè)備或機(jī)器中,以實(shí)現(xiàn)特定功能。嵌入式系統(tǒng)具有非常強(qiáng)的適應(yīng)性和靈活性,能夠根據(jù)用戶需求進(jìn)行定制化設(shè)計(jì)。它廣泛應(yīng)用于各種
    發(fā)表于 11-14 16:39

    人工智能云計(jì)算大數(shù)據(jù)三者關(guān)系

    人工智能、云計(jì)算與大數(shù)據(jù)之間的關(guān)系是緊密相連、相互促進(jìn)的。大數(shù)據(jù)為人工智能提供豐富的訓(xùn)練資源和驗(yàn)證環(huán)境;云計(jì)算為大數(shù)據(jù)和人工智能提供
    的頭像 發(fā)表于 11-06 10:03 ?1360次閱讀

    豐田與NTT攜手打造人工智能平臺(tái)

    展開(kāi)深度合作。 根據(jù)計(jì)劃,豐田與NTT將對(duì)這一人工智能平臺(tái)進(jìn)行巨額投資。預(yù)計(jì)到2030年,雙方的投資總額將達(dá)到5000億日元。這一龐大的投資額度不僅彰顯豐田與NTT對(duì)人工智能技術(shù)的重
    的頭像 發(fā)表于 11-04 10:48 ?821次閱讀

    FPGA應(yīng)用于人工智能的趨勢(shì)

    FPGA(現(xiàn)場(chǎng)可編程門(mén)陣列)在人工智能領(lǐng)域的應(yīng)用趨勢(shì)日益顯著,主要?dú)w因于其高速、低功耗、靈活性和并行處理能力等獨(dú)特優(yōu)勢(shì)。以下是對(duì)FPGA應(yīng)用于人工智能趨勢(shì)的分析:
    的頭像 發(fā)表于 10-25 09:20 ?2630次閱讀