chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

人工智能應用中FPGA的市場規(guī)模將在未來4年內增長3倍,達到52億美元!

電子工程師 ? 來源:YXQ ? 2019-05-30 08:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

AI語音助手和AI圖像優(yōu)化是離我們最近的AI應用,然而這只是AI能力比較初級的體現(xiàn),未來,AI將會以目前難以想象的方式改變我們的生活。作為AI的重要推動力之一,不同類別的AI處理器正努力滿足AI的需求,但依舊不能滿足AI不斷迭代的算法的需求。圍繞AI芯片的創(chuàng)新因此也成為了熱點。

本周二,總部位于美國加利福尼亞州的Achronix為滿足AI和機器學習的需求,推出了一款融合ASIC核心效率的全新類別FPGA

到底是什么在推動AI芯片的創(chuàng)新?

AI發(fā)展的三大要素是算力、算法和數據,而這一輪AI熱潮的興起一個關鍵的原因就是深度神經網絡算法的流行。不過,由于AI還處于初級階段,深度學習算法不僅種類多樣,并且在不斷迭代。另外,數據的類型也十分多樣,包含了整型和浮點型,以及每種數據類型的不同精度,這對芯片的通用性提出了要求。

AI處理器的硬件挑戰(zhàn)

但是,芯片的通用也就意味著算力難以做到極致,并且,不同的數據類型和精度對處理器的性能的要求又不相同,想要同時滿足算力和通用性的要求,半導體制程的提升是最為直接的方法。過去30年,摩爾定律帶來了顯著的計算能力的提升,半導體制程從微米跨越到了納米級,如今的計算機處理速度也可以達到每秒千萬億次(1015 FLOPS)。

2018年,10nm和7nm的芯片已經開始量產,但CMOS器件的橫向尺寸接近幾納米,厚度只有幾個原子層,想要繼續(xù)靠工藝制程提升晶體管密度帶來處理性能的顯著提升,技術上難度越來越高,成本也讓越來越多的芯片公司望而卻步。

除了半導體工藝,當運算能力達到一定程度,訪問存儲器的速度無法跟上運算部件消耗數據的速度,再增加運算部件也無法得到充分利用,這個馮諾依曼架構的瓶頸(內存墻)也阻礙了AI芯片算力的提升。

顯然,不斷迭代的算法、不同AI模型的數據類型需求、與日俱增的數據量,都推動承載AI算法的AI芯片不斷創(chuàng)新。

FPGA如何與ASIC融合?

目前,CPUGPU、FPGA、ASIC都被認為是廣義上的AI芯片,從CPU到ASIC,芯片的通用性降低,但性能依次增強,其中,GPU憑借并行計算的優(yōu)勢成為了目前最成功的AI芯片。FPGA作為不少AI芯片公司ASIC芯片驗證的首選,也在AI芯片市場占據一定的地位,但成本是其在大規(guī)模應用中面臨的挑戰(zhàn)。

Achronix Semiconductor總裁兼首席執(zhí)行官Robert Blake

此時,如果有兼具ASIC的性能和FPGA靈活性的AI處理器,應該是一個非常有競爭力的產品,但需要解決多個挑戰(zhàn)。Achronix Semiconductor總裁兼首席執(zhí)行官Robert Blake接受雷鋒網在內的媒體采訪時表示:“最新發(fā)布的Achronix Speedster7t是靈活的FPGA技術與ASIC核心效率的融合,提供了一個全新的‘FPGA+’芯片品類,這代表了我們建立在四個架構代系的硬件和軟件開發(fā)基礎上的創(chuàng)新和積淀,以及與客戶之間的密切合作?!?/p>

Robert還指出,這款新產品他們在三年前就開始規(guī)劃,在規(guī)劃的過程中工程團隊完全重新構建了整個FPGA架構,要平衡片上處理、互連和外部輸入輸出接口(I/O),以實現(xiàn)數據密集型應用吞吐量的最大化,適合高帶寬需求的應用,比如邊緣和基于服務器的AI / ML、網絡處理和存儲。

架構改進讓FPGA更適合AI計算

要讓FPGA具備ASIC級別的性能,首先需要提升算力。正如前面所說,先進半導體工藝對處理器性能的提升非常關鍵,因此Speedster7t采用的是臺積電7nm FinFET工藝。我們知道7nm工藝的流片成本非常高昂,著是否意味著這款7nm的FPGA+只面向云端市場?Robert對雷鋒網表示,在高端應用市場,無論是AI的訓練還是推理,對性能和延遲要求都很高,需要7nm工藝。當然,除了云端,針對邊緣市場我們會有更小且成本更低的產品,滿足不用應用和不同市場的續(xù)期。

半導體工藝明確后,想讓FPGA適合深度學習的算法,還需要架構的改進。Robert表示,傳統(tǒng)的基于DSP的FPGA計算單元的設計DSP、LUTs、存儲單元是分立的,布線也限制了其性能,不僅不能高效地支持AI模型的不同數值精度,還要消耗額外邏輯的存儲資源。

“我們采用的方法是在傳統(tǒng)的架構上進行改進,設計出了MLP單元,采用陣列式乘累積計算架構,每個乘累加單元(MAC)支持最多32個乘法器,實現(xiàn)計算的可配置。同時,MLP單元集成分別針對浮點和整型數據的MAC,可支持4到24位的整點格式和高效的浮點模式。并且,計算單元與緩存單元緊密相領,可以實現(xiàn)更復雜的算法,并且不需要使用復雜的布線,確保以750 MHz的最高性能將數據傳送到MLP?!?Robert指出。

Robert表示,MLP的效率比傳統(tǒng)FPGA的性能提升了5倍,使這款FPGA能以每秒萬億次運算數量為單位(TOPS)。算法在不斷的改變,但底層的需求都是一樣的,他們希望建立一個很好的硬件底層,讓算法無論怎么改變,需求都可以被滿足。

用片上網絡解決數據挑戰(zhàn)

計算能力的提高可以通過增加MAC,但算力提升之后,能否解決數據傳輸的挑戰(zhàn)決定著AI處理器最終的性能。據介紹,Speedster7t器件是唯一支持GDDR6存儲器的FPGA,并且最多可以支持8個GDDR6控制器,可以支持4 Tbps的GDDR6累加帶寬,能夠以HBM一半的成本提供與HBM等效的存儲帶寬。

另外,Speedster7t還有72個高性能的SerDes,可以達到1到112 Gbps的速度,Robert強調已經經過硅片驗證過。還帶有前向糾錯(FEC)的硬件400G以太網MAC,支持4x 100G和8x 50G的配置,每個控制器有8個或16個通道的硬件PCI Express Gen5控制器。為了應對400G以太網數據的處理需求,Achronix采用的是將數據進行分割并行處理的方法。

但這些最先進和更大的帶寬只能解決芯片與外部數據的交換,芯片內部數據效率的提升才是關鍵。這就是Achronix這款新產品架構的另一大關鍵創(chuàng)新,高帶寬二維片上網絡(NOC)。Robert將架構中可橫跨和垂直跨越FPGA邏輯陣列的NOC比喻為城市街道系統(tǒng)上的高速公路網絡。NOC中的每一行或每一列都可作為兩個256位實現(xiàn),單向的、行業(yè)標準的AXI通道,工作頻率為2Ghz,同時可為每個方向提供512 Gbps的數據流量。

他進一步表示,專用二維 NOC極大地簡化了高速數據移動,確保數據流可以輕松地定向到整個FPGA結構中的任何自定義處理引擎。最重要的是,NOC消除了傳統(tǒng)FPGA使用可編程路由和邏輯查找表資源在整個FPGA中移動數據流中出現(xiàn)的擁塞和性能瓶頸。不僅可以提高Speedster7t FPGA的總帶寬容量,還可以在降低功耗的同時提高有效LUT容量。

除了硬件,AI時代軟硬件的重要性被更多地關注。據Robert透露,Achronix在軟件和硬件方面的投資相當,并且在公司創(chuàng)立的時候很大的優(yōu)勢就是軟件技術,這也是他們今天能做到高端配置的的重要原因。

但Robert也強調,底層的軟件非常重要,如果NOC軟件做不好,就很難實現(xiàn)真正的提升。目前針對Speedster7t我們的ACE設計工具現(xiàn)已可以提供支持,今年第三季度會發(fā)布將TensorFlow、Caffe2等框架AI模型轉換到其芯片里的工具。第一批用于評估的器件和開發(fā)板將于2019年第四季度提供。

另據了解,安全性方面,Speedster7t FPGA系列可用最先進的比特流安全保護功能應對。在產品的批量化支持方面,Achronix在Speedcore eFPGA IP中采用了與Speedster7t FPGA中使用的同一種技術,可支持從Speedster7t FPGA到ASIC的無縫轉換。并且,當使用Speedcore eFPGA IP將Speedster7t FPGA轉換為ASIC時,用戶有望節(jié)省高達50%的功耗并降低90%的成本。

哪種處理器會在AI競爭中勝出?

既然功耗和成本都能夠顯著降低,那是否意味著Achronix新推出的FPGA+將成為AI芯片的主流?Robert表示,CPU、GPU、FPGA、ASIC每一類芯片都有其技術長處,并且AI芯片的市場在增長,所有的芯片類型都會從中受益。僅看FPGA,根據市場調研公司Semico Research的預測,人工智能應用中FPGA的市場規(guī)模將在未來4年內增長3倍,達到52億美元。

但有觀點認為,隨著AI算法的成熟,未來市場需要的是最通用和最專用的AI處理器,F(xiàn)PGA將失去優(yōu)勢。對此,Robert表示,隨著AI的發(fā)展,芯片發(fā)生了一些變化,ASIC也需要一些可編程的能力,而我們現(xiàn)在也在FPGA當中增加了ASIC的屬性,因此未來FPGA和ASIC都可能不再是傳統(tǒng)定義。

更進一步,F(xiàn)PGA會在哪個市場體現(xiàn)出優(yōu)勢?Robert從他們產品的產品出發(fā)指出,F(xiàn)PGA器件方面主要是云、網絡加速以及機器學習,IP主要還是5G、汽車以及存儲。當然,還需要根據客戶的反饋和需求,推出性能和架構都最適合客戶的FPGA產品。

小結

隨著計算性能的不斷提升,內存墻的瓶頸越來越明顯,在這樣的情況下,架構的創(chuàng)新能夠體現(xiàn)的價值越來越明顯。當然,這需要具備前瞻性以及強大的技術研發(fā)能力,我們看到市場上有一些針對存儲進行的架構創(chuàng)新設計,包括存算一體、存儲優(yōu)先、可重組、可重構的架構等。

Achronix擅長于FPGA技術,經過多年的積累以及憑借對用戶需求的了解,選擇在保持FPGA靈活性的同時,專為AI性能進行優(yōu)化實現(xiàn)ASIC級,并且通過片上網絡解決數據的傳輸問題,從最重要的計算能力和數據傳輸兩方面進行創(chuàng)新,也是提升競爭力很好的選擇。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1813

    文章

    49747

    瀏覽量

    261609
  • FPGA芯片
    +關注

    關注

    3

    文章

    250

    瀏覽量

    40861

原文標題:動態(tài) | FPGA保持靈活性同時擁有ASIC級AI性能是可實現(xiàn)的嗎?

文章出處:【微信號:wc_ysj,微信公眾號:旺材芯片】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    把握FPGA增長浪潮:高增長垂直領域必然選擇

    全球 FPGA 市場正在進入一個加速發(fā)展階段。根據 MarketsandMarkets 的最新研究報告,全球 FPGA 市場規(guī)模預計將從 2025
    的頭像 發(fā)表于 11-30 16:10 ?1719次閱讀
    把握<b class='flag-5'>FPGA</b><b class='flag-5'>增長</b>浪潮:高<b class='flag-5'>增長</b>垂直領域必然選擇

    2025嵌入式行業(yè)現(xiàn)狀如何?

    2025嵌入式行業(yè)現(xiàn)狀如何? 一、市場規(guī)模增長趨勢1.1 全球市場概況總體規(guī)模:2025全球嵌入式系統(tǒng)
    發(fā)表于 08-25 11:34

    中國傳感器市場規(guī)模突破4000!工信部產業(yè)研究院最新數據出爐

    市場規(guī)模首次超過4000元——達4061.2元,同比增長11.4%。賽迪顧問預計,到2027,中國傳感器
    的頭像 發(fā)表于 06-14 17:37 ?1062次閱讀
    中國傳感器<b class='flag-5'>市場規(guī)模</b>突破4000<b class='flag-5'>億</b>!工信部產業(yè)研究院最新數據出爐

    研究顯示2035全球酒店服務機器人市場規(guī)模有望達125美元

    根據德勤研究的統(tǒng)計,伴隨著全球酒店業(yè)加快部署服務機器人以提升服務效率、優(yōu)化服務體驗,預計到2035酒店業(yè)服務機器人市場規(guī)模有往達到124.6美元
    的頭像 發(fā)表于 05-23 10:40 ?391次閱讀

    淺談 IPv6 行業(yè)市場規(guī)模增長趨勢

    ,IPv6市場規(guī)模將突破300美元。全球IPv6市場規(guī)模增長預測從區(qū)域
    的頭像 發(fā)表于 05-20 09:17 ?913次閱讀
    淺談 IPv6 行業(yè)<b class='flag-5'>市場規(guī)模</b>與<b class='flag-5'>增長</b>趨勢

    黃仁勛:人工智能將提高全球GDP 黃仁勛談中國AI市場未來規(guī)模可達500美元

    能夠提高全球GDP,可以幫助解決勞動力供應短缺的問題。 黃仁勛談中國AI市場未來規(guī)模 英偉達一直都在表達對中國市場的重視。在當地時間5月6日,英偉達CEO黃仁勛在接受媒體采訪時表示,中
    的頭像 發(fā)表于 05-07 14:05 ?866次閱讀

    FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預測......

    降低。這種趨勢使得更多AI開發(fā)者能夠利用FPGA進行硬件加速。 4.市場與產業(yè)的推動? 市場規(guī)模增長:隨著5G、AI和物聯(lián)網等新興技術的快速
    發(fā)表于 03-03 11:21

    Deepseek引發(fā)算力變革 《2025中國人工智能計算力發(fā)展評估報告》發(fā)布

    算力需求,中國智能算力增速高于預期。 2024,中國智能算力規(guī)模達725.3EFLOPS,同比增長74.1%,增幅是同期通用算力增幅(20
    的頭像 發(fā)表于 02-14 16:08 ?777次閱讀
    Deepseek引發(fā)算力變革 《2025<b class='flag-5'>中國人工智能</b>計算力發(fā)展評估報告》發(fā)布

    中國生成式AI軟件市場預計五年內增長超四

    市場調研機構Omdia近日發(fā)布了一份關于中國生成式人工智能(GenAI)軟件市場的報告。報告指出,經過近兩的快速發(fā)展,2024年中國Gen
    的頭像 發(fā)表于 02-08 15:35 ?790次閱讀

    TECHCET預測,半導體材料市場預計將在2028增長至840美元

    2028間的年均復合增長率(CAGR)將達到5.6%,并在2028突破840美元。 該公司
    的頭像 發(fā)表于 02-08 11:23 ?1095次閱讀
    TECHCET預測,半導體材料<b class='flag-5'>市場</b>預計<b class='flag-5'>將在</b>2028<b class='flag-5'>年</b><b class='flag-5'>增長</b>至840<b class='flag-5'>億</b><b class='flag-5'>美元</b>

    中國生成式AI軟件市場年內預計增長超四

    根據市場調研機構Omdia最新發(fā)布的報告,中國的生成式人工智能(AI)軟件市場在經歷了兩的快速發(fā)展后,已經取得了顯著的成果。數據顯示,2024
    的頭像 發(fā)表于 02-08 10:45 ?738次閱讀

    中國生成式AI軟件市場預計五年內大幅增長

    增長勢頭,也預示著未來市場的巨大潛力。 盡管當前GenAI技術仍處于發(fā)展的初級階段,但Omdia預計,其市場規(guī)模將在
    的頭像 發(fā)表于 02-07 14:35 ?820次閱讀

    2025TGV玻璃基板市場規(guī)模預計將達到1.7411美元

    據Global Growth Insights預測,通過玻璃VIA(TGV)基板2024年市場價值為1.2974美元,預計到2025達到
    的頭像 發(fā)表于 02-07 10:13 ?5507次閱讀
    2025<b class='flag-5'>年</b>TGV玻璃基板<b class='flag-5'>市場規(guī)模</b>預計將<b class='flag-5'>達到</b>1.7411<b class='flag-5'>億</b><b class='flag-5'>美元</b>

    MCU在車載系統(tǒng)的展望

    維護等功能,進一步提高駕駛安全性和舒適性。 市場增長前景 整體市場規(guī)模持續(xù)擴大 :在自動駕駛、電氣化和互聯(lián)技術進步的推動下,全球汽車微控制器MCU市場預計將持續(xù)
    發(fā)表于 01-17 12:11

    全球半導體市場規(guī)模預測

    近日,根據世界半導體貿易統(tǒng)計組織(WSTS)最新發(fā)布的市場預測報告,全球半導體市場未來幾年將保持穩(wěn)健增長態(tài)勢。 具體而言,預計2024
    的頭像 發(fā)表于 12-19 11:48 ?1542次閱讀