作者:張迎輝
賽靈思總裁及首席執(zhí)行官Victor Peng先生日前在北京舉行的賽靈思開發(fā)者大會(huì)上發(fā)布“打造靈活應(yīng)變、萬(wàn)物智能的世界”為題的主題演講” 并隆重推出面向人工智能和數(shù)據(jù)中心的兩款重磅產(chǎn)品-Versal 及 Alveo,展示了賽靈思人工智能加速及數(shù)據(jù)中心優(yōu)先戰(zhàn)略的強(qiáng)大執(zhí)行力和創(chuàng)新能力。
賽靈思總裁及首席執(zhí)行官Victor Peng先生在XDF2018北京站演講中闡述賽靈思的使命-打造靈活應(yīng)變、萬(wàn)物智能的世界。?
Xilinx本次發(fā)布的業(yè)界首款ACAP芯片VERSAL,采用了臺(tái)積電的7納米FinFET工藝,其異構(gòu)加速技術(shù)能夠?yàn)槿魏伍_發(fā)者,滿足任何創(chuàng)新應(yīng)用。Victor Peng介紹,Versal 產(chǎn)品組合基于 臺(tái)積電(TSMC)的 7 nm FinFET 工藝技術(shù),是第一個(gè)將軟件可編程性與特定領(lǐng)域硬件加速和靈活應(yīng)變能力相結(jié)合的平臺(tái),這對(duì)于跟上當(dāng)今快速的創(chuàng)新步伐至關(guān)重要。該產(chǎn)品組合包括 6 個(gè)系列的器件,其獨(dú)特架構(gòu)針對(duì)云端、網(wǎng)絡(luò)、無(wú)線通信乃至邊緣計(jì)算和端點(diǎn)等不同市場(chǎng)的眾多應(yīng)用提供了可擴(kuò)展性和 AI 推斷功能。 ?
該產(chǎn)品組合包括?Versal 基礎(chǔ)系列( Versal Prime),Versal 旗艦系列 (Versal Premium旗艦)系列和 HBM 系列,能針對(duì)要求最嚴(yán)格的應(yīng)用提供業(yè)界領(lǐng)先的性能、連接性、帶寬和集成功能。此外,該產(chǎn)品組合還包括 AI 核心系列(AI Core),AI 邊緣系列 ( AI Edge) 和 AI 射頻系列(AI RF),采用突破性的 AI 引擎。AI 引擎是一種新型硬件模塊,專為解決各種應(yīng)用低時(shí)延 AI 推斷的新需求而設(shè)計(jì),同時(shí)支持高級(jí) DSP 實(shí)現(xiàn)方案,滿足無(wú)線和雷達(dá)等應(yīng)用要求。它與?Versal 自適應(yīng)硬件引擎緊密結(jié)合,支持整體應(yīng)用加速,也就是說(shuō)軟硬件都能調(diào)節(jié),從而確保最高性能和效率。
?
Versal組合中率先亮相的是?Versal Prime 系列,跨多個(gè)市場(chǎng)提供廣泛的適用性,同時(shí)推出的還有 Versal AI Core 系列,相對(duì)于業(yè)界領(lǐng)先的 GPU,AI 推斷性能預(yù)計(jì)能提升 8 倍。
?
VERSAL AI 核心系列
Versal AI Core系列的產(chǎn)品參數(shù)
Versal AI 核心系列提供該系列最高計(jì)算性能和最低時(shí)延,實(shí)現(xiàn)突破性的 AI 推斷吞吐量和性能。該系列針對(duì)云端、網(wǎng)絡(luò)和自動(dòng)駕駛技術(shù)進(jìn)行了優(yōu)化,提供業(yè)界最廣泛的 AI 和工作負(fù)載加速功能。Versal AI 核心系列 有 5 款產(chǎn)品,提供 128 到 400 個(gè) AI 引擎。該系列包括雙核 Arm Cortex-A72 應(yīng)用處理器、雙核 Arm Cortex-R5 實(shí)時(shí)處理器、256KB 片上 ECC 存儲(chǔ)器、超過(guò) 1900 個(gè)專為高精度低時(shí)延浮點(diǎn)運(yùn)算而優(yōu)化的 DSP 引擎。此外,它還包括 190 多萬(wàn)個(gè)系統(tǒng)邏輯單元以及超過(guò) 130Mb 的 UltraRAM、高達(dá) 34Mb 的塊 RAM 和 28Mb 分布式 RAM 和 32Mb 新加速器 RAM 塊,任何引擎都能直接訪問(wèn),這也是 Versal AI 系列的獨(dú)特之處,而且都能支持定制存儲(chǔ)器架構(gòu)。該系列還包括 PCIe? Gen4 8 信道和 16 信道以及 CCIX 主機(jī)接口、功耗優(yōu)化型 32G SerDes、多達(dá) 4 個(gè)集成型 DDR4 存儲(chǔ)器控制器、多達(dá) 4 個(gè)多速率以太網(wǎng) MAC、650 個(gè)高性能 I/O(用于 MIPI D-PHY)、NAND、存儲(chǔ)級(jí)內(nèi)存接口和 LVDS、78 個(gè)多路復(fù)用 I/O(連接外部組件)和超過(guò) 40 個(gè) HD I/O(3.3V 接口)。以上所有器件均通過(guò)業(yè)界一流的片上網(wǎng)絡(luò) (NoC) 實(shí)現(xiàn)互聯(lián),具有多達(dá) 28 個(gè)主/從端口,以低時(shí)延提供每秒多 Tb 帶寬,而且提供高功率效率和原生軟件的可編程性。完整的產(chǎn)品列表現(xiàn)已發(fā)布。
?
VERSAL PRIME 系列
?
Versal Prime 系列經(jīng)過(guò)精心設(shè)計(jì),適用于多個(gè)市場(chǎng)的廣泛應(yīng)用,并針對(duì)各種工作負(fù)載的連接性和在線加速進(jìn)行了優(yōu)化。這款中端系列包括 9 款產(chǎn)品,每款產(chǎn)品都采用雙核 Arm Cortex-A72 應(yīng)用處理器、雙核 Arm Cortex-R5 實(shí)時(shí)處理器、256KB 片上存儲(chǔ)器(帶 ECC)、超過(guò) 4000 個(gè)專為低時(shí)延高精度浮點(diǎn)運(yùn)算優(yōu)化的 DSP 引擎。此外,它還包括 200 多萬(wàn)個(gè)系統(tǒng)邏輯單元,結(jié)合 200Mb 以上 UltraRAM、超過(guò) 90Mb 的塊 RAM 以及 30Mb 分布式 RAM,能支持定制存儲(chǔ)器架構(gòu)。該系列還包括?PCIe Gen4 8信道和 16 信道以及 CCIX 主機(jī)接口、功耗優(yōu)化型 32Gb 每秒的 SerDes 和主流 58Gb 每秒的 PAM4 SerDes、多達(dá) 6 個(gè)集成型 DDR4 存儲(chǔ)器控制器、多達(dá) 4 個(gè)多速率以太網(wǎng) MAC、700 個(gè)高性能 I/O(支持 MIPI D-PHY)、NAND、存儲(chǔ)級(jí)內(nèi)存接口和 LVDS、78 個(gè)多路復(fù)用 I/O(連接外部組件)和超過(guò) 40 個(gè) HD I/O(3.3V 接口)。以上均通過(guò)業(yè)界一流的片上網(wǎng)絡(luò) (NoC) 實(shí)現(xiàn)互聯(lián),具有多達(dá)?28 個(gè)主/從端口,以低時(shí)延提供每秒多 Tb 帶寬,而且提供高功率效率和原生的軟件可編程性。完整的產(chǎn)品列表現(xiàn)已發(fā)布。
?
賽靈思目前正通過(guò)早期試用計(jì)劃與多家關(guān)鍵客戶合作。Versal Prime 系列和 Versal AI Core 系列將于 2019 年下半年上市。
在演講過(guò)程中,賽靈思總裁及首席執(zhí)行官Victor Peng先生還為大家介紹全球最快的數(shù)據(jù)中心及AI加速器卡Alveo。據(jù)介紹,現(xiàn)場(chǎng)發(fā)布的Alveo U200 和 Alveo U250兩款產(chǎn)品采用了?Xilinx UltraScale+ FPGA芯片。
?
賽靈思軟件及IP產(chǎn)品執(zhí)行副總裁Salil Raje先生為大家?guī)?lái)AI加速的主題演講,激情描繪賽靈思靈活應(yīng)變的新型器件將如何加速當(dāng)今AI時(shí)代各種創(chuàng)新的整體應(yīng)用,擁抱所有的開發(fā)者。
賽靈思產(chǎn)品及技術(shù)營(yíng)銷高級(jí)總監(jiān)Kirk Saban為大家?guī)?lái)行業(yè)首款靈活應(yīng)變的ACAP自適應(yīng)計(jì)算加速平臺(tái)Versal,致力于為所有開發(fā)者、所有應(yīng)用開啟快速創(chuàng)新新時(shí)代。
?
多位賽靈思的FPGA合作伙伴們,也在現(xiàn)場(chǎng)演講介紹了基于FPGA的云計(jì)算服務(wù)技術(shù),以及基于賽靈思之前發(fā)布過(guò)的16納米的異構(gòu)FPGA UltraScale SoC的加速卡等產(chǎn)品。
XDF大會(huì)合作伙伴合影。從左至右 阿里巴巴異構(gòu)計(jì)算總監(jiān)項(xiàng)午,阿里云FPGA研發(fā)總監(jiān) 張振祥,浪潮集團(tuán)總裁 李金,賽靈思CEO Vcitor Peng,華為FPGA加速云服務(wù)技術(shù)負(fù)責(zé)人張小華。
?
賽靈思的現(xiàn)場(chǎng)合作伙伴如浪潮、華為現(xiàn)場(chǎng)發(fā)布了最新的加速卡,華為和阿里云都推出了FaaS云平臺(tái)。他們認(rèn)為,AI時(shí)代正在到來(lái),開發(fā)者們對(duì)于FPGA as a Service(FaaS)的業(yè)務(wù)需求不斷擴(kuò)大,F(xiàn)PGA加速卡市場(chǎng)成長(zhǎng)非??春?。阿里云FPGA異構(gòu)計(jì)算研發(fā)總監(jiān)張振祥表示,F(xiàn)aaS的價(jià)值不僅在于提升了效率,相比CPU的物聯(lián)網(wǎng)時(shí)序數(shù)據(jù)庫(kù)運(yùn)算提升了30倍,還為公司三年節(jié)省的TCO成本高達(dá)40%。
?
華為的FPGA加速云平臺(tái)深圳深鑒科技、睿視知覺(jué)、Alcon Computing、NGCODEC、CTACCEL等加速解決方案,開發(fā)者使用華為FPGA云平臺(tái),可以實(shí)現(xiàn)全棧加速解決方案。
XDF2018北京站展位現(xiàn)場(chǎng)演示的實(shí)時(shí)機(jī)器學(xué)習(xí)推斷演示-人臉識(shí)別、車輛識(shí)別等。
精彩問(wèn)答
?
會(huì)后賽靈思高管還接受了媒體記者的采訪。Victor Peng先生也回答了電子發(fā)燒友等媒體的現(xiàn)場(chǎng)提問(wèn)。
現(xiàn)在越來(lái)越多賽靈思的客戶,如華為、阿里也都在打造屬于自己的云端、數(shù)據(jù)中心和AI芯片,這對(duì)于賽思靈的產(chǎn)品策略有何影響?Victor表示,“產(chǎn)業(yè)還處于AI革命的早期,大家都在尋找不同的解決方案,這也為大家?guī)?lái)了很多的機(jī)遇。可能有一些領(lǐng)域是適用于固定功能的芯片(ASIC),但是我相信絕大多數(shù)還是需要使用像我們這樣靈活應(yīng)用的平臺(tái)作為解決方案。因此,我并不認(rèn)為ACAP或者Alveo產(chǎn)品會(huì)取代所有的GPU,但是肯定會(huì)越來(lái)越多采用靈活應(yīng)變的平臺(tái)?!?br />
?
對(duì)于為何目前好幾家廠商如華為、賽靈思等廠商的新AI芯片,都不約而同地選用采用7納米的工藝的原因,賽靈思軟件產(chǎn)品副總裁Ramine也回答了電子發(fā)燒友的記者的提問(wèn)?!安捎?納米是因?yàn)楝F(xiàn)在它是制程上是最先進(jìn)的技術(shù)手段,所以大家都會(huì)云想用最快的,而且性能最快高,功耗最小的,當(dāng)然,現(xiàn)在看成本也是最高的。另外想指出,傳統(tǒng)專用芯片來(lái)比,從設(shè)計(jì)到真正量產(chǎn)通常不少于兩年的周期,所以現(xiàn)在大家看到專用芯片設(shè)計(jì)都是兩年以前的時(shí)間節(jié)點(diǎn)。很多ASIC芯片的功能和架構(gòu)設(shè)計(jì)都是針對(duì)兩年以前的網(wǎng)絡(luò)來(lái)進(jìn)行設(shè)計(jì)。FPGA架構(gòu)就完全不一樣了,它從設(shè)計(jì)到使用完全符合最新的技術(shù)應(yīng)用的要求,也就是現(xiàn)在不管是移動(dòng)網(wǎng)絡(luò)還是什么樣的網(wǎng)絡(luò),幾年以前這個(gè)東西并不是特別流行,但是現(xiàn)在會(huì)比較多。如果用CPU、GPU,真正用它的性能,會(huì)發(fā)現(xiàn)和它表述有差別,因?yàn)楫?dāng)時(shí)設(shè)計(jì)規(guī)劃不適應(yīng)現(xiàn)在的需求。但是FPGA完全沒(méi)有這個(gè)問(wèn)題,在現(xiàn)在深度學(xué)習(xí)和機(jī)器學(xué)習(xí)非常流行的年代,可以適應(yīng)現(xiàn)在最好的狀態(tài),比較老的FPGA都可以支持最新的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的應(yīng)用,但是在這一點(diǎn)上ACAP是有比較長(zhǎng)的延遲,因?yàn)槭沁m用于兩年以前的網(wǎng)絡(luò)。”
?
在人工智能時(shí)代,嵌入式FPGA或者是SoC中集中FPGA的IP的做法(eFPGA),是否也能更好地在靈活性上滿足AI的需求??賽靈思軟件產(chǎn)品副總裁Ramine也回應(yīng)了電子發(fā)燒友記者的這個(gè)提問(wèn)。
?
賽靈思軟件產(chǎn)品副總裁Ramine首先指出,賽靈思的ACAP不是一個(gè)嵌入式的專用芯片,它是一個(gè)功能完善的完整芯片,芯片內(nèi)部的連接和通信非常容易,在數(shù)據(jù)傳輸方面效果就非常好。除此外,它內(nèi)部還有各種各樣不同的處理器,每個(gè)處理單元都是為了不同的工作負(fù)載來(lái)專門進(jìn)行優(yōu)化的,比如CPU,是專門做一些適合于CPU做的復(fù)雜算法的運(yùn)算。FPGA用于流媒體計(jì)算,還有新處理計(jì)算的引擎,比如AI、AI引擎是矢量處理器的陣列,主要處理現(xiàn)行計(jì)算的工作負(fù)載。幾乎每個(gè)處理計(jì)算單元都是為了不同的工作負(fù)載而重新優(yōu)化過(guò),然后進(jìn)行組合。也就是每個(gè)計(jì)算單元都是功能強(qiáng)大的獨(dú)立完整的節(jié)點(diǎn)。這樣一個(gè)完整的芯片,在不同的工作負(fù)載下都可以發(fā)揮非常好的效果。
?
其次,eFPGA僅僅是一個(gè)FPGA IP而已,也就是說(shuō)它在標(biāo)準(zhǔn)連接上,比如你想連接不同的應(yīng)用芯片的話,它沒(méi)有一個(gè)標(biāo)準(zhǔn)連接的模式。另外,它在內(nèi)存和IO可編程性上也時(shí)比較差。eFPGA在過(guò)去并不是特別成功,因?yàn)閑FPGA已經(jīng)存在了二十多年時(shí)間,但是到目前為止也沒(méi)有看到哪個(gè)公司真的是做EFPGA做的比較成功,所以現(xiàn)在市場(chǎng)不是很認(rèn)可。
另外,跟大家分享一條好消息!2018年12月4日,由電子發(fā)燒友網(wǎng)舉辦的“第5屆中國(guó)IoT(物聯(lián)網(wǎng))大會(huì)”將于深圳舉辦,如欲了解詳情可點(diǎn)擊標(biāo)題超鏈進(jìn)入大會(huì)專題通道。
評(píng)論