chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费

完善資料讓更多小伙伴認識你，還能領(lǐng)取20積分哦，立即完善>

3天內(nèi)不再提示

邁向更高效的圖像分類：解析DeiT模型的移植和適配

1. DeiT概述

1.1 項目簡介

Deit（Data-efficient image Transformers）是由Facebook與索邦大學(xué)的Matthieu Cord教授合作開發(fā)的圖像分類模型。作為一種基于Transformer架構(gòu)的深度學(xué)習(xí)模型，DeiT在保持高性能的同時，能夠大大提高數(shù)據(jù)效率，為圖像識別領(lǐng)域帶來了顛覆性的變化。

與傳統(tǒng)的CNN不同，DeiT模型采用了Transformer的自注意力機制，將圖像分割成若干個固定大小的塊，并對每個塊進行編碼，捕捉圖像中的長程依賴關(guān)系。

本文將為大家介紹如何將DeiT移植到算能BM1684X平臺上。

1.2 模型介紹

DeiT目前有3個版本的模型（tiny, small, base)，均由12個Attention結(jié)構(gòu)組成，模型區(qū)別在于輸入的header個數(shù)及embed_dim不同。

Attention結(jié)構(gòu)如下圖所示：

attention

不同版本的模型具體參數(shù)區(qū)別如下表：

version

2. 模型移植

以下部分介紹如何將DeiT移植到算能BM1684X平臺上。

2.1 模型trace

原始DeiT模型基于Pytorch框架訓(xùn)練及推理。算能TPU-MLIR工具鏈可以編譯通過jit trace過的靜態(tài)模型。

首先進行模型trace，命令如下，需要修改原推理代碼。

trace

2.2 模型編譯

以下介紹如何使用算能TPU-MLIR工具鏈將上一步trace過的模型編譯成可以在算能BM1684X上推理的bmodel。在模型移植過程中遇到一些算子邊界的處理問題，均已修復(fù)。

transformdeploy

2.3 精度測試

DeiT為分類模型，精度測試采用topk來進行。

精度測試及性能測試結(jié)果如下：

precision

3 小結(jié)

總體看移植過程相對順利，在解決了部分算子邊界問題之后可以成功編譯出bmodel。F32精度基本可與原始框架對齊。由于第一個Conv stride > 15，在進行F16/BF16轉(zhuǎn)換時遇到比對問題，這部分代碼目前仍在重構(gòu)，生成bmodel過程中這部分采用F32混精度處理。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

圖像

圖像

+關(guān)注

關(guān)注
2

文章
1094

瀏覽量
42010
模型

模型

+關(guān)注

關(guān)注
1

文章
3611

瀏覽量
51435
深度學(xué)習(xí)

深度學(xué)習(xí)

+關(guān)注

關(guān)注
73

文章
5586

瀏覽量
123647

算能開發(fā)者社區(qū)
企業(yè)號

72 內(nèi)容 11w+ 閱讀 6 粉絲

我要咨詢關(guān)注

Hot 探索ChatGLM2在算能BM1684X上INT8量化部署，加速大模型商業(yè)落地
Hot 重塑翻譯與識別技術(shù)：開源語音識別模型Whisper的編譯優(yōu)化與部署
New Qwen3-VL 4B/8B全面適配，BM1684X成邊緣最佳部署平臺！
New RISC-V HPC新標桿Sophon SG2044深度評估：支持RVV v1.0適配GCC 15.2，多核性能潛力巨大！

精選推薦
更多

文章

資料

帖子

芯佰微 | CBMG601 CMOS?單刀單擲模擬開關(guān)技術(shù)詳解

芯佰微電子
10小時前

458 閱讀

風洞懸浮球：基于RT-Thread與MCXA156的簡單控制實踐 | 技術(shù)集結(jié)

RT-Thread官方賬號
13小時前

480 閱讀

OPPO Find X9系列發(fā)布！天璣9500+2億哈蘇影像+3D超聲波指紋三大看點

章鷹觀察
11小時前

3056 閱讀

使用瑞薩RUHMI工具實現(xiàn)AI模型部署過程

瑞薩嵌入式小百科
15小時前

643 閱讀

基于瑞薩RA8M1 MCU的高性能語音控制應(yīng)用方案

瑞薩嵌入式小百科
15小時前

785 閱讀

服務(wù)業(yè)之質(zhì)量管理

回頭太晚
44

3積分

18下載

Android手機知識大全

lanlanw
849 KB

免費

432下載

Distributive服務(wù)健康檢測工具

李顏
0.08 MB

免費

0下載

Specter博客平臺

馬占云
0.08 MB

2積分

1下載

Milvus向量數(shù)據(jù)庫

李駿鵬
18.02 MB

2積分

1下載

labview中怎樣通過屬性來獲取VI中控件是否是接線端？

草原狼AAAAA
1天前

366 閱讀

AFE5805輸出引腳CW配置

jf_01582722
1天前

367 閱讀

圖騰柱PFC無法上升至400V，且電感電流為正弦波形，但是幅值極小

jf_58990233
1天前

417 閱讀

飛凌嵌入式ElfBoard-Vim編輯器之靜態(tài)鏈接和動態(tài)鏈接

jf_13411809
1天前

622 閱讀

【RA4M2-SENSOR】ADC、DAC 電壓輸入輸出

jf_57061047
1天前

613 閱讀

推薦企業(yè)號
更多

企業(yè)產(chǎn)品

資料

方案
更多