10月16日,XDF(賽靈思開發(fā)者大會)在北京國際飯店舉行。作為業(yè)界最權威、最具深度的FPGA交流大會之一,Xilinx把行業(yè)最頂尖的FPGA專家和企業(yè)匯聚一堂,集思廣益,分享和交流FPGA產(chǎn)品開發(fā)經(jīng)驗與應用方案。
Xilinx CEOVictor Peng 、華為IT智能計算業(yè)務副總裁張小華、阿里云FPGA異構計算研發(fā)總監(jiān)張振祥等業(yè)內(nèi)領袖出席。同時,在會上,賽靈思推出了業(yè)界首款自適應計算加速平臺Versal和加速器Alveo。
作為Xilinx在中國智能汽車電子領域唯一的Certified member,深圳市自行科技有限公司(簡稱:自行科技)受邀參加,公司聯(lián)合創(chuàng)始人兼CTO諶璟博士在現(xiàn)場分享了“基于FPGA的計算機視覺系統(tǒng)設計與開發(fā)”的主題演講。諶璟博士結(jié)合其多年的深度學習與FPGA開發(fā)經(jīng)驗,從性能、成本、開發(fā)難度等多個維度出發(fā),提出一套系統(tǒng)化的FPGA深度神經(jīng)網(wǎng)絡優(yōu)化流程。
圖:自行科技聯(lián)合創(chuàng)始人兼CTO諶璟博士做主題演講
諶博認為,CNN與FPGA的結(jié)合可以組合利用多種算法模塊,充分發(fā)揮FPGA在計算速度、功耗、成本等方面的優(yōu)勢,降低開發(fā)難度與周期,減少開發(fā)成本。但是CNN中存在大量冗余計算,因此如何在FPGA中實現(xiàn)CNN加速設計就尤為重要。
圖:諶璟博士演講獲得現(xiàn)場嘉賓觀眾好評
自行科技通過多年CNN與FPGA自主研發(fā)經(jīng)驗,開發(fā)出業(yè)內(nèi)領先性價比的FPGA加速設計方案。會中,她表示,F(xiàn)PGA加速設計需要算法工程師和FPGA工程師共同參與。
一方面,通過剪枝壓縮、權值壓縮等方法對網(wǎng)絡壓縮算法進行優(yōu)化,以減少網(wǎng)絡冗余計算,釋放可用資源。例如,我們可以僅僅將少數(shù)“重要”的卷積核量化為8bit權值,其余卷積核用1bit權值表示,構造混合精度網(wǎng)絡,在確保網(wǎng)絡檢測性能的基礎上大幅度提高計算效率。
另一方面,不同的FPGA架構需要適配對應的CNN網(wǎng)絡結(jié)構,因此需要有針對性地進行并行化和結(jié)構化設計,讓計算模塊得到充分利用,避免大量計算資源閑置。同時,在進行網(wǎng)絡設計時還要充分利用FPGA片內(nèi)資源,避免DSP計算資源與邏輯資源的浪費。
以SSD網(wǎng)絡為例,在不考慮其他操作帶來的時延(DDR時延、FSM狀態(tài)轉(zhuǎn)移時延~等)的情況下,Xilinx zynq7020在CNN計算幀率最高可達5.7fps;但是,自行科技通過權值壓縮、并行化設計等CNN網(wǎng)絡加速設計和算法優(yōu)化后,計算幀率提升了4-5倍,大大提高了芯片的運行效率。
最后,諶博總結(jié)到:“FPGA與CNN的結(jié)合具備廣泛的應用前景,但是在開發(fā)的過程中也需要我們不斷克服困難和挑戰(zhàn)。當前FPGA平臺技術與工具不斷迭代更新,這就需要我們時刻關注世界最前沿的技術。今天我非常高興在現(xiàn)場見證了業(yè)界首款自適應計算加速平臺Versal ACAP以及新一代FPGA加速器卡Alveo。這不僅可以加快公司軟硬件迭代創(chuàng)新進程,還為我們探索更優(yōu)秀的FPGA加速方案提供了思路。未來,隨著CNN的計算量不斷上升,數(shù)據(jù)吞吐量也會顯著增大,這就需要不斷提高FPGA片內(nèi)BRAM資源利用效率,深入研究CNN模型壓縮算法,優(yōu)化基于FPGA的CNN框架,這也需要行業(yè)共同的努力!”
目前,該方案已經(jīng)成功應用于公司的三大產(chǎn)品:前向ADAS系統(tǒng)、駕駛員監(jiān)控(DMS)系統(tǒng)和智能環(huán)視影像系統(tǒng),產(chǎn)品都已順利實現(xiàn)量產(chǎn)?;贔PGA平臺與CNN算法的深度結(jié)合,自行科技率先開發(fā)出國內(nèi)首款基于深度學習技術的駕駛員監(jiān)控(DMS)系統(tǒng),打造出業(yè)內(nèi)功能最全面、性價比最高的駕駛員監(jiān)控(DMS)系統(tǒng),成為國內(nèi)駕駛員監(jiān)控系統(tǒng)標桿企業(yè)。
除此之外,自行科技前向ADAS系統(tǒng)與智能環(huán)視影像系統(tǒng)以其可靠的目標檢測準確性和語義分割精度獲得國內(nèi)眾多傳統(tǒng)車廠(乘用車與商用車)、新能源和互聯(lián)網(wǎng)造車公司和Tier1汽車零部件供應商的高度認可。相信隨著FPGA開發(fā)技術的不斷成熟,CNN加速設計將獲得更廣泛的應用。
更多自行科技的 ADAS解決方案信息:www.autocruis.com
附:賽靈思發(fā)布7nm 自適應計算加速平臺Versal及新一代FPGA加速器Alveo
2018年10月16日,F(xiàn)PGA大廠賽靈思(Xilinx)在北京召開了一年一度的“Xilinx開發(fā)者大會 ”(XDF) 。在本次會議上,賽靈思發(fā)布了全球首款自適應計算加速平臺 (Adaptive Compute Acceleration Platform ,ACAP)芯片系列Versal。與此同時,賽靈思還針對云端和本地數(shù)據(jù)中心市場還發(fā)布了一款功能強大的加速器卡——Alveo。
-
加速器
+關注
關注
2文章
833瀏覽量
39577 -
賽靈思
+關注
關注
33文章
1797瀏覽量
132895 -
深度學習
+關注
關注
73文章
5586瀏覽量
123637
原文標題:自行科技CTO諶璟博士出席賽靈思開發(fā)者大會,推出FPGA CNN加速設計方案
文章出處:【微信號:zuosiqiche,微信公眾號:佐思汽車研究】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
Arm神經(jīng)技術是業(yè)界首創(chuàng)在 Arm GPU 上增添專用神經(jīng)加速器的技術,移動設備上實現(xiàn)PC級別的AI圖形性能
粒子加速器?——?科技前沿的核心裝置

Versal 600G DCMAC Subsystem LogiCORE IP產(chǎn)品指南

第二代AMD Versal Premium系列SoC滿足各種CXL應用需求

小型加速器中子源監(jiān)測系統(tǒng)解決方案

GPU加速計算平臺的優(yōu)勢
消息稱AMD Instinct MI400 AI加速器將配備8個計算芯片
AMD Versal自適應SoC器件Advanced Flow概覽(下)

新思科技推出業(yè)界首款連接大規(guī)模AI加速器集群的超以太網(wǎng)和UALink IP 解決方案
AMD Alveo媒體加速產(chǎn)品組合SDK 1.2.1發(fā)布

評論