chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

TVM的編譯流程是什么

電子設(shè)計(jì) ? 來源:電子設(shè)計(jì) ? 作者:電子設(shè)計(jì) ? 2022-02-08 14:51 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:安平博,Xilinx高級(jí)工程師;來源:AI加速微信公眾號(hào)

Import:將tensorflow,onnx,pytorch等構(gòu)建的深度學(xué)習(xí)模型導(dǎo)入,轉(zhuǎn)化成TVM的中間層表示IR。

Lower:將高層IR表示轉(zhuǎn)化成低階TIR表示。

Codegen:內(nèi)存分配和硬件可執(zhí)行程序生成。

圖導(dǎo)入

通過一個(gè)tensorflow的reception網(wǎng)絡(luò)來熟悉編譯過程,其它深度學(xué)習(xí)框架也具有類似過程。從TVM官網(wǎng)可以下載tensorflow的編譯程序

https://tvm.apache.org/docs/tutorials/frontend/from_tensorflow.html#sphx...。主要代碼如下:

pIYBAGAJzXaALCrpAAFWLx2Lb50986.png

模型的輸入是一個(gè)后綴為pb的文件,它是神經(jīng)網(wǎng)絡(luò)模型圖的protobuf格式存儲(chǔ)文件。Pb是二進(jìn)制形式,pbtxt是文本形式。Import_graph_def函數(shù)是導(dǎo)入pb,graph是tensorflow的圖結(jié)構(gòu)。

From_tensorflow是將tensorflow的圖結(jié)構(gòu)轉(zhuǎn)化成TVM的IR。這個(gè)函數(shù)在文件relay/frontend/tensorflow.py中。函數(shù)的調(diào)用關(guān)系為:

From_tensorflow -> GraphProto.from_tensorflow -> self._get_relay_func。

在get_relay_func中會(huì)遍歷每個(gè)tensorflow的節(jié)點(diǎn),轉(zhuǎn)換成tvm的IR表示。重點(diǎn)關(guān)注_backtrack_construct函數(shù)。

o4YBAGAJzbSAK8pmAAB-23TNiAc840.png

繼續(xù)深入和算子轉(zhuǎn)化有關(guān)的函數(shù)調(diào)用為:_convert_operator -> convert_map。Convert_map中對應(yīng)了可支持tensorflow算子到tvm算子的轉(zhuǎn)換關(guān)系。

o4YBAGAJzf2AUd9qAAFas--JyZk610.png

完成了tensorflow到TVM算子轉(zhuǎn)化后,我們就得到了一個(gè)IRModule。我們可以利用tvm的可視化來打印出轉(zhuǎn)化后的圖:

pIYBAGAJzjyAKM_nAADUALHuUtg377.png

Main是主函數(shù)入口,在TVM中以函數(shù)形式反應(yīng)了tensorflow的圖結(jié)構(gòu)。函數(shù)的調(diào)用關(guān)系反應(yīng)了圖的依賴關(guān)系。

編譯

Python中主要代碼位于relay/build_module.py文件中,調(diào)用關(guān)系為build -> BuildModule -> build。在build中通過字典獲得了C++中的相應(yīng)函數(shù)。

pIYBAGAJznqAYLYUAABvCn74q78151.png

這里不明白如何通過self.mod[“build”]得到C++中函數(shù)的。_BuildModule()是C++中注冊到環(huán)境中的一個(gè)函數(shù)。在src/relay/backend/build_module.cc中,

pIYBAGAJzriAKFTzAACbMqgRaW0007.png

TVM_REGISTER_GLOBAL是將C++函數(shù)注冊到一個(gè)全局map中。當(dāng)python加載編譯好的動(dòng)態(tài)庫時(shí),會(huì)自動(dòng)查詢map中靜態(tài)注冊的函數(shù),并添加到python模塊當(dāng)中。

真正build操作位于RelayBuildModule類中,在其中有一個(gè)GetFunction函數(shù),會(huì)通過名字查詢要使用的函數(shù),打包成PackedFunc返回,這個(gè)函數(shù)可能和self.mod[“build”]有關(guān)。PackedFunc是TVM中提供的python的一個(gè)接口,任何函數(shù)都可以封裝成PackedFunc,并給python調(diào)用。更詳細(xì)介紹可看:https://hjchen2.github.io/2020/01/10/TVM-PackedFunc%E5%AE%9E%E7%8E%B0%E6...

繼續(xù)深入代碼,Build -> BuildRelay。這是編譯的主要代碼。其過程包括optimize,codgen。

o4YBAGAJzvmAY7f2AAE5GDTVjbI659.png

Optimize就是執(zhí)行一些優(yōu)化passes,這些passes包括常數(shù)折疊,算符融合等。之后會(huì)調(diào)用graph_codegen->Codegen。Codegen中實(shí)現(xiàn)了內(nèi)存分配和硬件代碼生成。

審核編輯:何安

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • TVM
    TVM
    +關(guān)注

    關(guān)注

    0

    文章

    19

    瀏覽量

    3880
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    創(chuàng)龍 瑞芯微 RK3588 國產(chǎn)2.4GHz八核 工業(yè)開發(fā)板—Qt工程編譯、GPU核心使用說明

    本文圍繞創(chuàng)龍科技研發(fā)的評(píng)估板,詳細(xì)說明 Qt 工程編譯與 GPU 核心使用方法。涵蓋基于命令行和 Qt Creator 工具的 Qt 工程編譯流程,包括交叉編譯工具鏈、Qt Versi
    的頭像 發(fā)表于 09-29 14:16 ?185次閱讀
    創(chuàng)龍 瑞芯微 RK3588 國產(chǎn)2.4GHz八核 工業(yè)開發(fā)板—Qt工程<b class='flag-5'>編譯</b>、GPU核心使用說明

    大規(guī)模硬件仿真系統(tǒng)的編譯挑戰(zhàn)

    引言隨著集成電路設(shè)計(jì)復(fù)雜度的不斷提升,硬件仿真系統(tǒng)在現(xiàn)代芯片設(shè)計(jì)流程中扮演著越來越重要的角色。基于FPGA(現(xiàn)場可編程門陣列)的商用硬件仿真系統(tǒng)因其靈活性、全自動(dòng)化、高性能和可重構(gòu)性,成為驗(yàn)證
    的頭像 發(fā)表于 03-31 16:11 ?1082次閱讀
    大規(guī)模硬件仿真系統(tǒng)的<b class='flag-5'>編譯</b>挑戰(zhàn)

    在 Windows 上編譯 KiCad

    “?Ethan 同學(xué)為我們分享了在 Windows 編譯 KiCad 的準(zhǔn)備工作、操作步驟及閉坑指南。以下是核心的操作視頻及 PPT,完整的直播視頻后續(xù)分享給大家!?” 流程概要 準(zhǔn)備工作 編譯器篇
    的頭像 發(fā)表于 03-28 11:23 ?673次閱讀
    在 Windows 上<b class='flag-5'>編譯</b> KiCad

    FPGA Verilog HDL語法之編譯預(yù)處理

    Verilog HDL語言和C語言一樣也提供了編譯預(yù)處理的功能?!?b class='flag-5'>編譯預(yù)處理”是Verilog HDL編譯系統(tǒng)的一個(gè)組成部分。Verilog HDL語言允許在程序中使用幾種特殊的命令(它們不是一般
    的頭像 發(fā)表于 03-27 13:30 ?900次閱讀
    FPGA Verilog HDL語法之<b class='flag-5'>編譯</b>預(yù)處理

    KiCad直播活動(dòng)(三):在 Windows上編譯KiCad 手把手教您編譯/構(gòu)建 KiCad 源碼

    親愛的 KiCad 粉們: 本周繼續(xù) KiCad 的直播活動(dòng),我們將在 3 月27 日周四晚 19:30 為您帶來 “在 Windows 上編譯 KiCad” 的專題!邀請了 KiCad Lead
    的頭像 發(fā)表于 03-24 11:14 ?1201次閱讀
    KiCad直播活動(dòng)(三):在 Windows上<b class='flag-5'>編譯</b>KiCad 手把手教您<b class='flag-5'>編譯</b>/構(gòu)建 KiCad 源碼

    MolunSmartHome蝦哥小智源碼編譯固件演示

    蝦哥小智Ai對話項(xiàng)目固件編譯演示
    的頭像 發(fā)表于 02-24 12:21 ?8686次閱讀
    MolunSmartHome蝦哥小智源碼<b class='flag-5'>編譯</b>固件演示

    Triton編譯器與GPU編程的結(jié)合應(yīng)用

    Triton編譯器簡介 Triton編譯器是一種針對并行計(jì)算優(yōu)化的編譯器,它能夠自動(dòng)將高級(jí)語言代碼轉(zhuǎn)換為針對特定硬件優(yōu)化的低級(jí)代碼。Triton編譯器的核心優(yōu)勢在于其能夠識(shí)別并行模式,
    的頭像 發(fā)表于 12-25 09:13 ?1144次閱讀

    Triton編譯器如何提升編程效率

    在現(xiàn)代軟件開發(fā)中,編譯器扮演著至關(guān)重要的角色。它們不僅將高級(jí)語言代碼轉(zhuǎn)換為機(jī)器可執(zhí)行的代碼,還通過各種優(yōu)化技術(shù)提升程序的性能。Triton 編譯器作為一種先進(jìn)的編譯器,通過多種方式提升編程效率,使得
    的頭像 發(fā)表于 12-25 09:12 ?1025次閱讀

    Triton編譯器在高性能計(jì)算中的應(yīng)用

    高性能計(jì)算(High-Performance Computing,HPC)是現(xiàn)代科學(xué)研究和工程計(jì)算中不可或缺的一部分。隨著計(jì)算需求的不斷增長,對計(jì)算資源的要求也越來越高。Triton編譯器作為一種
    的頭像 發(fā)表于 12-25 09:11 ?1309次閱讀

    Triton編譯器的優(yōu)化技巧

    在現(xiàn)代計(jì)算環(huán)境中,編譯器的性能對于軟件的運(yùn)行效率至關(guān)重要。Triton 編譯器作為一個(gè)先進(jìn)的編譯器框架,提供了一系列的優(yōu)化技術(shù),以確保生成的代碼既高效又適應(yīng)不同的硬件架構(gòu)。 1. 指令選擇
    的頭像 發(fā)表于 12-25 09:09 ?1512次閱讀

    Triton編譯器在機(jī)器學(xué)習(xí)中的應(yīng)用

    1. Triton編譯器概述 Triton編譯器是NVIDIA Triton推理服務(wù)平臺(tái)的一部分,它負(fù)責(zé)將深度學(xué)習(xí)模型轉(zhuǎn)換為優(yōu)化的格式,以便在NVIDIA GPU上高效運(yùn)行。Triton編譯器支持
    的頭像 發(fā)表于 12-24 18:13 ?1415次閱讀

    Triton編譯器與其他編譯器的比較

    Triton編譯器與其他編譯器的比較主要體現(xiàn)在以下幾個(gè)方面: 一、定位與目標(biāo) Triton編譯器 : 定位:專注于深度學(xué)習(xí)中最核心、最耗時(shí)的張量運(yùn)算的優(yōu)化。 目標(biāo):提供一個(gè)高度抽象、靈活、高效
    的頭像 發(fā)表于 12-24 17:25 ?1375次閱讀

    Triton編譯器功能介紹 Triton編譯器使用教程

    Triton 是一個(gè)開源的編譯器前端,它支持多種編程語言,包括 C、C++、Fortran 和 Ada。Triton 旨在提供一個(gè)可擴(kuò)展和可定制的編譯器框架,允許開發(fā)者添加新的編程語言特性和優(yōu)化技術(shù)
    的頭像 發(fā)表于 12-24 17:23 ?2306次閱讀

    soc開發(fā)流程常見問題及解決方案

    SOC(System on a Chip,系統(tǒng)級(jí)芯片)開發(fā)流程中常見問題及解決方案主要包括以下幾個(gè)方面: 一、環(huán)境問題 常見問題 : 開發(fā)環(huán)境配置復(fù)雜,新手難以快速上手。 依賴項(xiàng)缺失或版本不兼容
    的頭像 發(fā)表于 11-10 09:26 ?1919次閱讀

    瑞芯微RK3568開發(fā)板Linux編譯報(bào)錯(cuò)404怎么辦?觸覺智能教你輕松解決

    本文介紹瑞芯微RK3568主板/開發(fā)板SDK編譯流程編譯報(bào)錯(cuò)404的解決方法,使用觸覺智能EVB3568鴻蒙開發(fā)板演示,具有豐富的視頻輸入輸出接口(HDMI/eDP/MIPI/LVDS) 與多種高速接口(千兆網(wǎng)口/PCIe/S
    的頭像 發(fā)表于 11-05 11:02 ?1084次閱讀
    瑞芯微RK3568開發(fā)板Linux<b class='flag-5'>編譯</b>報(bào)錯(cuò)404怎么辦?觸覺智能教你輕松解決