面向TTA架構(gòu)ASIP設(shè)計(jì)的深度神經(jīng)網(wǎng)絡(luò)優(yōu)化論文免費(fèi)下載
資料介紹
近年來,依托電子芯片技術(shù)的發(fā)展,神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)被設(shè)計(jì)得更深更大,以應(yīng)對更加復(fù)雜和抽象的場景。隨之而來的問題是深府神經(jīng)網(wǎng)絡(luò)在訓(xùn)練和推理都依托大規(guī)模的浮點(diǎn)運(yùn)算實(shí)現(xiàn),對存儲資源的占用和設(shè)備功耗的需求產(chǎn)生了很高的需求?;趥鬏斢|發(fā)架構(gòu)(TransportTriggered Architecture,TTA)的專用指令集處理器(ApplicationSpecific Instruction Set Processor,ASIP)既能夠提供專用集成電路級別的高性能和低功耗,又能夠提供處理器級別的指令集靈活性,是解決該問題的途徑之一。
量化與加速是深度神經(jīng)網(wǎng)絡(luò)硬件實(shí)現(xiàn)時(shí)常用的兩項(xiàng)技術(shù),卷積神經(jīng)網(wǎng)絡(luò)是最有代表性和最通用的深度神經(jīng)網(wǎng)絡(luò)。本文的主要工作即圍繞這兩項(xiàng)技術(shù),進(jìn)行面向TTA架構(gòu)ASIP設(shè)計(jì)的卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)化,具體內(nèi)容包含以下兩個(gè)部分:
其一,本文針對基于TTA架構(gòu)的神經(jīng)網(wǎng)絡(luò)ASIP的需求,提出了一套端到端完整的8比特量化方案。該方案結(jié)合權(quán)重、激活值和梯度的各自特點(diǎn),為它們制定了相應(yīng)的量化策略,包括了對稱仿射的權(quán)重量化、帶動態(tài)上限的激活值量化、變精度的梯度量化以及一種近似的批量歸一化算法。在多數(shù)據(jù)集、多模型結(jié)構(gòu)的實(shí)驗(yàn)中,該方案都取得了與全精度網(wǎng)絡(luò)相當(dāng)?shù)木龋I(lǐng)先于部分當(dāng)下常用的量化方案。
其二,本文將查找表資源融入到卷積運(yùn)算中,提出了一種基于乘法結(jié)合律的卷積運(yùn)算的加速方案。該方案針對面向TTA架構(gòu)的量化卷積功能單元,提供了符合量化卷積特性的卷積核分塊、循環(huán)展開、數(shù)據(jù)交換規(guī)則,并展示了基于TTA架構(gòu)的神經(jīng)網(wǎng)絡(luò)加速器的整體結(jié)構(gòu)。對比傳統(tǒng)卷積方案,該方案緩解了有限的乘法器資源對于神經(jīng)網(wǎng)絡(luò)并行計(jì)算的限制,在并行度與計(jì)算能效比兩方面都有所提升。
本文中,量化方案是加速方案的基礎(chǔ),加速方案是量化方案的補(bǔ)充,二者共同構(gòu)成了本文的優(yōu)化工作,為基于TTA架構(gòu)的深度神經(jīng)網(wǎng)絡(luò)的ASIP實(shí)現(xiàn)提供了支持。
- 基于BP神經(jīng)網(wǎng)絡(luò)優(yōu)化的光伏發(fā)電預(yù)測模型 35次下載
- 基于神經(jīng)網(wǎng)絡(luò)的優(yōu)化計(jì)算實(shí)驗(yàn) 43次下載
- BP神經(jīng)網(wǎng)絡(luò)基本原理簡介 18次下載
- 3小時(shí)學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)課件下載 0次下載
- 深度神經(jīng)網(wǎng)絡(luò)模型的壓縮和優(yōu)化綜述 20次下載
- 綜述深度神經(jīng)網(wǎng)絡(luò)的解釋方法及發(fā)展趨勢 19次下載
- 一種基于多視圖架構(gòu)的深度卷積神經(jīng)網(wǎng)絡(luò)模型 5次下載
- 神經(jīng)網(wǎng)絡(luò)的方法學(xué)習(xí)課件免費(fèi)下載 17次下載
- 基于深度神經(jīng)網(wǎng)絡(luò)的文本分類分析 37次下載
- 神經(jīng)網(wǎng)絡(luò)與神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)課件免費(fèi)下載 7次下載
- 神經(jīng)網(wǎng)絡(luò)的基本概念學(xué)習(xí)課件免費(fèi)下載 5次下載
- 神經(jīng)網(wǎng)絡(luò)的復(fù)習(xí)資料免費(fèi)下載 1次下載
- BP神經(jīng)網(wǎng)絡(luò)的簡單MATLAB實(shí)例免費(fèi)下載 5次下載
- 快速了解神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)的教程資料免費(fèi)下載 33次下載
- 《神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)》中文版電子教材免費(fèi)下載 0次下載
- 殘差網(wǎng)絡(luò)是深度神經(jīng)網(wǎng)絡(luò)嗎 1151次閱讀
- 神經(jīng)網(wǎng)絡(luò)優(yōu)化器有哪些 657次閱讀
- 什么是神經(jīng)網(wǎng)絡(luò)加速器?它有哪些特點(diǎn)? 545次閱讀
- 簡單認(rèn)識深度神經(jīng)網(wǎng)絡(luò) 1118次閱讀
- 深度神經(jīng)網(wǎng)絡(luò)(DNN)架構(gòu)解析與優(yōu)化策略 2076次閱讀
- 深度神經(jīng)網(wǎng)絡(luò)概述及其應(yīng)用 1457次閱讀
- 深度神經(jīng)網(wǎng)絡(luò)與基本神經(jīng)網(wǎng)絡(luò)的區(qū)別 1006次閱讀
- 深度神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)方法 519次閱讀
- 神經(jīng)網(wǎng)絡(luò)優(yōu)化算法有哪些 607次閱讀
- 神經(jīng)網(wǎng)絡(luò)架構(gòu)有哪些 814次閱讀
- 如何訓(xùn)練和優(yōu)化神經(jīng)網(wǎng)絡(luò) 509次閱讀
- 詳解深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用 2241次閱讀
- 深度神經(jīng)網(wǎng)絡(luò)的實(shí)現(xiàn)機(jī)理與決策邏輯難以理解 2994次閱讀
- 斯坦福探索深度神經(jīng)網(wǎng)絡(luò)可解釋性 決策樹是關(guān)鍵 4401次閱讀
- NVIDIA深度神經(jīng)網(wǎng)絡(luò)加速庫cuDNN軟件安裝教程 2288次閱讀
下載排行
本周
- 1STM32開發(fā)板教程之STM32開發(fā)指南免費(fèi)下載
- 24.88 MB | 176次下載 | 3 積分
- 2EN60335-1安規(guī)標(biāo)準(zhǔn) 中文版本
- 1.86 MB | 52次下載 | 1 積分
- 3LT7406FJ N溝道增強(qiáng)型功率MOSFET規(guī)格書
- 1.38 MB | 2次下載 | 免費(fèi)
- 4STM32系列產(chǎn)品選型-中文
- 1.81 MB | 1次下載 | 免費(fèi)
- 5LTS6802FJCB N溝道增強(qiáng)型功率MOSFET規(guī)格書
- 1.00 MB | 1次下載 | 免費(fèi)
- 6運(yùn)算放大電路入門教程
- 0.70 MB | 1次下載 | 免費(fèi)
- 7米爾-瑞芯微RK3562核心板開發(fā)板,4核CPU,ARM中量級多面手
- 3.45 MB | 1次下載 | 免費(fèi)
- 8開源鴻蒙版真4K顯示器廣告機(jī)主板AIoT-6780SE彩頁
- 613.79 KB | 1次下載 | 免費(fèi)
本月
- 1STM32開發(fā)板教程之STM32開發(fā)指南免費(fèi)下載
- 24.88 MB | 176次下載 | 3 積分
- 2DeepSeek:從入門到精通
- 5.36 MB | 92次下載 | 1 積分
- 3EN60335-1安規(guī)標(biāo)準(zhǔn) 中文版本
- 1.86 MB | 52次下載 | 1 積分
- 4OAH0428最新規(guī)格書(中文)
- 2.52 MB | 27次下載 | 10 積分
- 5UHV系列雷電沖擊電壓發(fā)生器試驗(yàn)裝置詳細(xì)說明使用
- 1.07 MB | 17次下載 | 免費(fèi)
- 6Altium-常用3D封裝庫(Step)接插件篇
- 4.95 MB | 14次下載 | 免費(fèi)
- 7介紹一些常用的電子元器件
- 3.20 MB | 7次下載 | 免費(fèi)
- 8麻將機(jī)升降電路
- 0.12 MB | 6次下載 | 1 積分
總榜
- 1matlab軟件下載入口
- 未知 | 935124次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計(jì)
- 1.48MB | 420063次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233088次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191371次下載 | 10 積分
- 5十天學(xué)會AVR單片機(jī)與C語言視頻教程 下載
- 158M | 183336次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81583次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費(fèi)下載
- 0.02 MB | 73814次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65988次下載 | 10 積分
評論