chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

3個DNN的項目介紹

FPGA技術江湖 ? 來源:FPGA技術江湖 ? 作者:FPGA技術江湖 ? 2022-06-16 09:27 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

介紹

深度神經網絡 (DNN) 是一種人工神經網絡(ANN),在輸入層和輸出層之間具有多層。有不同類型的神經網絡,但它們基本由相同的組件組成:神經元、突觸、權重、偏差和函數。這些組件的功能類似于人類大腦,可以像任何其他 ML 算法一樣進行訓練。

3241cbd6-ed13-11ec-ba43-dac502259ad0.png

例如,經過訓練以識別狗品種的 DNN 將遍歷給定的圖像并計算圖像中的狗是某個品種的概率。用戶可以查看結果并選擇網絡應該顯示哪些概率(超過某個閾值等)并返回建議的標簽。每個數學操作都被認為是一個層,復雜的 DNN 有很多層,因此被稱為“深度”網絡。

324f329e-ed13-11ec-ba43-dac502259ad0.png

關于DNN、ANN、CNN區(qū)別,請看下圖:

326b7cf6-ed13-11ec-ba43-dac502259ad0.png

https://blog.csdn.net/lff1208/article/details/77717149

IBM_AccDNN

https://github.com/IBM/AccDNN

AccDNN(深度神經網絡加速器核心編譯器)又名;DNNBuilder

項目介紹

在這個項目中,我們提出了一種新穎的解決方案,可以自動將經過 Caffe 訓練的深度神經網絡轉換為 FPGA RTL 級別的實現(xiàn),無需任何編程工作,并為用戶的識別任務提供統(tǒng)一的 API

因此,沒有任何 FPGA 編程經驗的開發(fā)人員可以將他們的 FPGA 加速深度學習服務部署在數據中心或邊緣設備中,僅提供他們經過訓練的 Caffe 模型。該作品發(fā)表在 ICCAD'18 上,并獲得了前端最佳論文獎。了解更多設計細節(jié)。請參考我們的論文(https://docs.wixstatic.com/ugd/c50250_77e06b7f02b44eacb76c05e8fbe01e08.pdf)。

轉換過程

轉換包括三個階段:

首先對 Caffe 網絡文件進行解析,得到網絡結構。我們估計每一層的工作量以確定在 FPFA 資源約束下的并行度。

該網絡中定義的每一層通過在庫中實例化相應的神經層來生成一個定制的 Verilog 模塊。頂層模塊也是根據net文件中定義的層順序將這些自定義實例連接在一起生成的,并且在這個階段也生成了權重所需的片上內存。

綜合生成的源文件、布線和布局,生成可執(zhí)行的 FPGA 位文件。

327d5520-ed13-11ec-ba43-dac502259ad0.png

AccDNN 缺點

僅支持 Caffe 框架訓練的模型。

僅支持卷積層、最大池化層、全連接層和批量歸一化層。

Caffe .prototxt 中定義的網絡中卷積層和全連接層的總數應少于 15 層

DNN-Hardware-Accelerator

https://github.com/ryaanluke/DNN-Hardware-Accelerator

https://github.com/gwatcha/dnn_accelerator

介紹

在本實驗中,將以嵌入式 Nios II 系統(tǒng)為核心構建深度神經網絡加速器。在本項目中還將學習如何與片外 SDRAM 連接,以及如何使用 PLL 生成具有特定屬性的時鐘

由于整個系統(tǒng)比我們之前構建的系統(tǒng)更復雜,因此在將設計的所有部分連接在一起之前,編寫大量的測試單元并仔細調試將變得尤為重要。

深度神經網絡

我們將使用一種稱為多層感知器 (MLP) 的神經網絡對 MNIST 手寫數字數據集進行分類。也就是說,我們的 MLP 將以 28×28 像素的灰度圖像作為輸入,并確定該圖像對應的數字 (0..9)。

MLP 由幾個線性層組成,它們首先將前一層的輸出乘以權重矩陣,并為每個輸出添加一個恒定的“偏差”值,然后應用非線性激活函數來獲得當前層的輸出(稱為激活)。我們的 MLP 將有一個 784 像素的輸入(28×28 像素的圖像)、兩個 1000 個神經元的隱藏層和一個 10 個神經元的輸出層;具有最高值的輸出神經元將告訴我們網絡認為它看到了哪個數字。對于激活函數,我們將使用整流線性單元 (ReLU),它將所有負數映射到 0,將所有正數映射到自身。

在推理過程中,每一層計算a' = ReLU( W · a + b ),其中W是權重矩陣,a是前一層的激活向量,b是偏置向量,a'是當前層的激活向量。

不要被神經網絡等花哨的術語嚇倒——你實際上是在構建一個加速器來進行矩陣向量乘法。這里的大部分挑戰(zhàn)來自與片外 SDRAM 存儲器的交互以及正確處理諸如waitrequest和readdatavalid 之類的信號。

不需要知道這些網絡是如何訓練的,因為我們已經為您訓練了網絡并預先格式化了圖像(請參閱data文件夾的內容和測試輸入列表)。但是,如果好奇,可以查看scripts/train.py我們是如何訓練 MLP 的。

328a56a8-ed13-11ec-ba43-dac502259ad0.png

關于該項目的一些補充說明請查看下面的PDF:

https://github.com/ryaanluke/DNN-Hardware-Accelerator/blob/main/Deep%20Neural%20Networks%20on%20FPGA.pdf

DNN-accelerator-on-zynq

https://github.com/joycenerd/DNN-accelerator-on-zynq

https://github.com/karanam1997/Dnnweaver-Zed-board-/tree/master/DNNWeaver_original

https://github.com/anonsum/DNNWeaver_Simulations

設計要求:

329b95a8-ed13-11ec-ba43-dac502259ad0.png

整個系統(tǒng)框圖如下:

32adb51c-ed13-11ec-ba43-dac502259ad0.png

相關的設計文檔:

https://github.com/joycenerd/DNN-accelerator-on-zynq/blob/master/2019DD_lab12Finalv4.pdf

Handwritting-number-distinguishing-with-DNN-by-Nexys-4-DDR-in-Verilog-HDL

https://github.com/MaxMorning/Handwritting-number-distinguishing-with-DNN-by-Nexys-4-DDR-in-Verilog-HDL

用 Verilog HDL 實現(xiàn) DNN 區(qū)分手寫數字,在Nexys 4 DDR 上運行。

32bd3b18-ed13-11ec-ba43-dac502259ad0.png

總結

今天介紹了3個DNN的項目,主要是DNN復雜度較TPU或者CNN高了幾個臺階,所以用它來直接對FPGA進行移植難度很大,還是只建議對第一個IBM項目進行研究,其他在ZYNQ上進行數字識別適合實現(xiàn),其他都不怎么推薦。

關于DNN或者CNN也介紹了幾十個項目了,這些只適合學習研究,并不適合拿來商用,所以后臺噴我的小伙伴要求也不要太高,這些開源的項目能直接商用的少之又少,大部分項目只適合學習。還有一些項目是學生做的,所以你們也不必噴:說是拿一些學生做的項目能干什么,我這里只想說,這些項目至少能給您一些參考,什么事情總比從零開始好,或者讓你們了解一些同齡人在學校里在干什么,最后,這些項目您又看不上您開源幾個出來~

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4844

    瀏覽量

    108203
  • dnn
    dnn
    +關注

    關注

    0

    文章

    61

    瀏覽量

    9547

原文標題:?優(yōu)秀的 Verilog/FPGA開源項目- 深度神經網絡 (DNN)

文章出處:【微信號:HXSLH1010101010,微信公眾號:FPGA技術江湖】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    【地平線征程 5 域控試用】激光雷達數據獲取與 BPU 推理實現(xiàn)

    , packed_dnn_handle), **\"Failed to get model name list\"); 模型輸出的3D 框位置、朝向與真實場景不匹配,疑似坐標變換、點云對齊、后處理參數需要調整。
    發(fā)表于 04-20 21:31

    如何使用IAR編譯器或IAR項目編譯S32K3 MCAL項目

    本文使用S32K344結合RTD600來說明使用IAR編譯器編譯MCAL項目以及將MCAL直接導入IAR IDE項目 2. IAR Complier with S32K3 RTD MCAL
    發(fā)表于 04-14 08:46

    【米爾全志T153開發(fā)板評測】kws語音關鍵字識別測試

    前言 本文來移植一開源的kws語音關鍵子識別項目,在該開發(fā)板上跑來評估其性能。 項目見https://github.com/ARM-software/ML-KWS-for-MCU。 這里移植好
    發(fā)表于 03-18 00:08

    3DIC集成技術的種類介紹

    3D集成技術至少包含3DIC集成和3DIC封裝兩核心概念。顧名思義,兩者均采用垂直方向堆疊芯片的方式實現(xiàn)集成,但核心區(qū)別在于,3DIC集成
    的頭像 發(fā)表于 03-09 16:00 ?852次閱讀
    <b class='flag-5'>3</b>DIC集成技術的種類<b class='flag-5'>介紹</b>

    開源項目汽車CAN總線分析儀總體介紹

    在做車載、工業(yè)控制項目時,CAN 總線調試總遇到協(xié)議不兼容、數據抓不全的問題?
    的頭像 發(fā)表于 02-05 10:03 ?755次閱讀
    開源<b class='flag-5'>項目</b>汽車CAN總線分析儀總體<b class='flag-5'>介紹</b>

    項目看懂 STM32 全部外設

    很多剛接觸STM32的同學,常常被它龐雜的外設列表勸退。GPIO、USART、ADC、TIM、DMA、SPI、I2C……光看手冊目錄就已經頭暈。其實,只要你通過一完整的小項目,把這些外設串聯(lián)起來跑
    的頭像 發(fā)表于 01-09 19:04 ?980次閱讀
    一<b class='flag-5'>個</b>小<b class='flag-5'>項目</b>看懂 STM32 全部外設

    常見3D打印材料介紹及應用場景分析

    3D打印材料種類豐富,不同材料性能差異明顯。本文介紹PLA、ABS、PETG等常見3D打印材料的特點與應用場景,幫助讀者了解3D打印用什么材料更合適,為選材提供基礎參考。
    的頭像 發(fā)表于 12-29 14:52 ?951次閱讀
    常見<b class='flag-5'>3</b>D打印材料<b class='flag-5'>介紹</b>及應用場景分析

    VSCode + ESP-IDF環(huán)境下給ESP32-S3項目添加頭文件

    VSCode + ESP-IDF環(huán)境下給ESP32-S3項目添加頭文件
    的頭像 發(fā)表于 11-28 07:27 ?3240次閱讀

    開源項目!FourThirdsEye 開源 M4/3 相機模塊

    四分之三系統(tǒng) (Micro Four Thirds) 畫幅的 IMX294 圖像傳感器。本項目旨在為高級樹莓派項目提供一高質量、價格實惠且易于獲取的相機模塊。 FourThirdsEye 可拍攝 1070
    發(fā)表于 07-30 13:43

    42.5億,重慶半導體大動作,8集成電路領域頭部企業(yè)集中簽約,包含2傳感器項目

    7月28日,重慶集成電路再迎重要里程碑— — 西部科學城重慶高新區(qū)集成電路重點項目集中簽約儀式 在霧都賓館舉行,8集成電路領域頭部企業(yè)集中簽約,總投資42.5億元,為重慶集成電路全產業(yè)鏈注入強勁
    的頭像 發(fā)表于 07-29 18:38 ?2589次閱讀
    42.5億,重慶半導體大動作,8<b class='flag-5'>個</b>集成電路領域頭部企業(yè)集中簽約,包含2<b class='flag-5'>個</b>傳感器<b class='flag-5'>項目</b>

    Amazing Hand:一開源的3D打印仿真機械手項目

    “ ?本文介紹了一款名為 Amazing Hand 的開源仿人機械手項目。該項目旨在解決市面上機器人手普遍昂貴且表現(xiàn)力不足的問題,提供一低成本(低于200歐元)、輕量化(400克)且
    的頭像 發(fā)表于 07-21 11:22 ?6802次閱讀
    Amazing Hand:一<b class='flag-5'>個</b>開源的<b class='flag-5'>3</b>D打印仿真機械手<b class='flag-5'>項目</b>

    樹莓派項目實戰(zhàn):車牌識別系統(tǒng)開發(fā)全記錄!

    介紹項目的目標是設計一基于樹莓派微電腦的自動車牌識別系統(tǒng),用于控制停車場的道閘。為什么?我有一臺閑置的樹莓派,沒有參與任何項目,還有一臺攝像頭,以及一
    的頭像 發(fā)表于 06-11 17:22 ?1303次閱讀
    樹莓派<b class='flag-5'>項目</b>實戰(zhàn):車牌識別系統(tǒng)開發(fā)全記錄!

    嵌入式AI技術漫談 如何組建一AI項目開發(fā)小組

    我們來談一談如何組建一AI項目開發(fā)小組: 為什么要為嵌入式AI項目 組建一專門的開發(fā)小組 相對于以往成熟的項目開發(fā)體系,嵌入式AI
    的頭像 發(fā)表于 06-11 16:34 ?1588次閱讀

    Altera Agilex 3 FPGA和SoC產品介紹

    Altera 的 Agilex 3 FPGA 和 SoC 可在不影響性能的前提下顯著提高成本效益。其通過出色的 Hyperflex FPGA 架構、先進的收發(fā)器技術、更高的集成度和更強大的安全
    的頭像 發(fā)表于 06-03 16:40 ?1787次閱讀
    Altera Agilex <b class='flag-5'>3</b> FPGA和SoC產品<b class='flag-5'>介紹</b>

    泰科電子海上風電項目極速交付回顧

    此前,2025年3月24日,TE Connectivity(以下簡稱“TE”)收到一十萬火急的需求:位于南部海域的一海上風電項目距離并網僅剩7天時間,該
    的頭像 發(fā)表于 06-03 15:58 ?1267次閱讀