chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用ROCm將PP-OCRv5模型部署在AMD顯卡上

jf_23871869 ? 來源:AVNET 李鑫杰 ? 作者:AVNET 李鑫杰 ? 2025-09-12 18:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:AVNET 李鑫杰

上文介紹了《一鍵搞定!PP-OCRv5模型轉(zhuǎn)ONNX格式全攻略》,本文將使用ROCm?在AMD? CPU、獨(dú)立顯卡、集成顯卡上優(yōu)化并部署飛槳PP-OCRv5模型。

一,ROCm? 工具套件簡(jiǎn)介

ROCm?(Radeon Open Compute)是 AMD 推出的開源軟件棧,旨在為 GPU 加速計(jì)算提供全面支持。它包含驅(qū)動(dòng)程序、編譯器、開發(fā)工具、庫(kù)函數(shù)和 API,覆蓋從底層內(nèi)核開發(fā)到上層應(yīng)用部署的完整開發(fā)流程,廣泛適用于高性能計(jì)算(HPC)、人工智能AI)和機(jī)器學(xué)習(xí)等領(lǐng)域。

ROCm? 特別針對(duì)生成式 AI 和 HPC 工作負(fù)載進(jìn)行了深度優(yōu)化,具備良好的生態(tài)系統(tǒng)兼容性和代碼可移植性,能夠幫助開發(fā)者快速將基于 CUDA 等平臺(tái)的現(xiàn)有項(xiàng)目遷移至 AMD 平臺(tái)。無論是以卷積神經(jīng)網(wǎng)絡(luò)(CNN)為核心的預(yù)測(cè)式 AI 模型(Predictive AI),還是以 Transformer 架構(gòu)為主的生成式 AI 模型(Generative AI),ROCm 均提供了高效的運(yùn)行支持。

此外,ROCm? 不僅支持 AMD Radeon 獨(dú)立顯卡(dGPU),還兼容集成在 AMD CPU 中的核顯(iGPU),使得開發(fā)者能夠在多樣化的硬件環(huán)境中靈活部署 AI 模型,實(shí)現(xiàn)本地化高效推理與訓(xùn)練

下表展示PP-OCRv5 Server版模型,經(jīng)過ROCm?優(yōu)化后,在AMD HX370上運(yùn)行的性能。性能測(cè)試代碼和的圖片來自于開源項(xiàng)目:

https://github.com/liebedir/PP-OCRv5-AMD-ROCm

二,搭建ROCm?開發(fā)環(huán)境

首先,請(qǐng)克隆PP-OCRv5_AMD-ROCm到本地

git clone https://github.com/liebedir/PP-OCRv5-AMD-ROCm
cd PP-OCRv5-AMD-ROCm

接著,安裝ROCm?:

wget 
https://repo.radeon.com/amdgpu-install/6.4.3/ubuntu/jammy/amdgpu-install_6.4.60403-1_all.deb

sudo apt install ./amdgpu-install_6.4.60403-1_all.deb

圖片

sudo apt update

圖片

sudo apt install "linux-headers-$(uname -r)" "linux-modules-extra-$(uname -r)"

圖片

sudo apt install amdgpu-dkms

圖片

圖片

sudo apt install python3-setuptools python3-wheel

圖片

sudo usermod -a -G render,video $LOGNAME # Add the current user to the render and video groups

圖片

sudo apt install rocm

圖片

然后,添加環(huán)境變量到~/.bashrc,該環(huán)境變量與核顯的架構(gòu)相關(guān),11.0.0適用于RDNA3架構(gòu)核顯,其他架構(gòu)請(qǐng)參考https://github.com/liebedir/PP-OCRv5-AMD-ROCm:

vi ~/.bashrcexport HSA_OVERRIDE_GFX_VERSION=11.0.0

最后,重啟計(jì)算機(jī)。

完成計(jì)算機(jī)重啟后,創(chuàng)建python虛擬環(huán)境并安裝onnxruntime-rocm

conda create -n ocr-rocm python==3.10
pip3 install onnxruntime-rocm -f https://repo.radeon.com/rocm/manylinux/rocm-rel-6.4.2/

接著,[下載PP-OCRv5模型并導(dǎo)出為onnx格式。]

至此,模型和環(huán)境準(zhǔn)備完成!

三,編寫PP-OCRv5推理程序

PP-OCRv5-AMD-ROCm項(xiàng)目已將推理程序編寫完成,各文件功能如下:

執(zhí)行演示程序main.py,并指定模型路徑和推理硬件設(shè)備

python main.py --image_dir images/paddleocr_structure.png  
--det_model_dir ../PP-OCRv5_server_det_infer/inference.onnx
--det_model_device GPU 
--rec_model_dir ../PP-OCRv5_server_rec_infer/inference.onnx
--rec_model_device GPU

運(yùn)行結(jié)果,如下圖所示:

四,總結(jié)

使用AMD 的開發(fā)者可以通過ROCm?軟件棧將PP-OCRv5模型部署到AMD的CPU、獨(dú)立顯卡或核顯硬件平臺(tái)上。

如果你有更好的文章,歡迎投稿!

稿件接收郵箱:nami.liu@pasuntech.com

更多精彩內(nèi)容請(qǐng)關(guān)注“ 算力魔方^?^ ”!

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AMD顯卡
    +關(guān)注

    關(guān)注

    0

    文章

    32

    瀏覽量

    11497
  • OCR
    OCR
    +關(guān)注

    關(guān)注

    0

    文章

    169

    瀏覽量

    16968
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    PP-OCRv5 MCP服務(wù)器海光主板的部署與實(shí)戰(zhàn)

    在當(dāng)今數(shù)字化快速發(fā)展的時(shí)代,OCR(光學(xué)字符識(shí)別)技術(shù)已經(jīng)成為從圖像中提取文本信息的重要工具。無論是自動(dòng)化辦公、智能文檔處理還是在內(nèi)容創(chuàng)作領(lǐng)域,OCR 技術(shù)的應(yīng)用都極大地提高了工作效率和準(zhǔn)確性
    的頭像 發(fā)表于 10-15 17:04 ?24次閱讀
    <b class='flag-5'>PP-OCRv5</b> MCP服務(wù)器<b class='flag-5'>在</b>海光主板的<b class='flag-5'>部署</b>與實(shí)戰(zhàn)

    Immich智能相冊(cè)樹莓派5的高效部署與優(yōu)化

    海外廣受歡迎的開源智能相冊(cè)項(xiàng)目Immich部署于樹莓派5,并通過搭載基于AX650N/AX8850的M.2算力卡,顯著提升了系統(tǒng)算力。借助該方案,我們高效
    的頭像 發(fā)表于 10-14 11:30 ?132次閱讀
    Immich智能相冊(cè)<b class='flag-5'>在</b>樹莓派<b class='flag-5'>5</b><b class='flag-5'>上</b>的高效<b class='flag-5'>部署</b>與優(yōu)化

    使用OpenVINOPP-OCRv5模型部署Intel顯卡

    是一個(gè)用于優(yōu)化和部署人工智能(AI)模型,提升AI推理性能的開源工具集合,不僅支持以卷積神經(jīng)網(wǎng)絡(luò)(CNN)為核心組件的預(yù)測(cè)式AI模型(Predictive AI),還支持以Transformer為核心組件的生成式AI
    的頭像 發(fā)表于 09-20 11:17 ?628次閱讀
    使用OpenVINO<b class='flag-5'>將</b><b class='flag-5'>PP-OCRv5</b><b class='flag-5'>模型</b><b class='flag-5'>部署</b><b class='flag-5'>在</b>Intel<b class='flag-5'>顯卡</b><b class='flag-5'>上</b>

    一鍵搞定!PP-OCRv5模型轉(zhuǎn)ONNX格式全攻略,解鎖多平臺(tái)無縫部署

    飛槳技術(shù)生態(tài)伙伴 算力魔方 | 引言:還在為OCR模型不同硬件部署而頭疼嗎?百度飛槳的PP-OCRv5重磅升級(jí),準(zhǔn)確率提升13%,且一
    的頭像 發(fā)表于 09-05 16:10 ?637次閱讀
    一鍵搞定!<b class='flag-5'>PP-OCRv5</b><b class='flag-5'>模型</b>轉(zhuǎn)ONNX格式全攻略,解鎖多平臺(tái)無縫<b class='flag-5'>部署</b>

    【EASY EAI Orin Nano開發(fā)板試用體驗(yàn)】PP-OCRV5文字識(shí)別實(shí)例搭建與移植

    【EASY EAI Orin Nano開發(fā)板試用體驗(yàn)】PP-OCRV5文字識(shí)別實(shí)例搭建與移植 PP-OCRV5PP-OCR新一代文字識(shí)別解決方案, 該方案聚焦于多場(chǎng)景、多文字類型的文字識(shí)別。
    發(fā)表于 08-18 16:57

    ROCm 6.2.4 成功移植至 SG2044: 大模型部署速率飆升,RISC-V + AI 新紀(jì)元!代碼已經(jīng)開源,一起來試試!

    AMD7900xtxonSOPHGOSG2044PCLT團(tuán)隊(duì)傾注心血,精心完成了ROCm軟件棧適配到SG2044獨(dú)特架構(gòu)的復(fù)雜工作。這包括:內(nèi)核級(jí)適配:確保ROCm驅(qū)動(dòng)程序和底層組
    的頭像 發(fā)表于 07-14 17:04 ?816次閱讀
    <b class='flag-5'>ROCm</b> 6.2.4 成功移植至 SG2044: 大<b class='flag-5'>模型</b><b class='flag-5'>部署</b>速率飆升,RISC-V + AI 新紀(jì)元!代碼已經(jīng)開源,一起來試試!

    基于算力魔方與PP-OCRv5的OpenVINO智能文檔識(shí)別方案

    )團(tuán)隊(duì)最新推出的PP-OCRv5模型精度和效率實(shí)現(xiàn)了顯著突破,結(jié)合Intel OpenVINO工具套件的硬件加速能力,能夠?yàn)楦黝愇臋n處理場(chǎng)景提供更強(qiáng)大的支持。 二,算力魔方簡(jiǎn)介 算
    的頭像 發(fā)表于 06-12 21:19 ?1139次閱讀
    基于算力魔方與<b class='flag-5'>PP-OCRv5</b>的OpenVINO智能文檔識(shí)別方案

    如何使用Docker部署模型

    隨著深度學(xué)習(xí)和大模型的快速發(fā)展,如何高效地部署這些模型成為了一個(gè)重要的挑戰(zhàn)。Docker 作為一種輕量級(jí)的容器化技術(shù),能夠模型及其依賴環(huán)境
    的頭像 發(fā)表于 05-24 16:39 ?657次閱讀

    使用OpenVINO優(yōu)化并部署飛槳PP-OCRv4模型

    算法,在此基礎(chǔ)打造產(chǎn)業(yè)級(jí)特色模型系列:PP-OCR、PP-Structure和PP-ChatOCR,打通了
    的頭像 發(fā)表于 04-03 18:07 ?1812次閱讀
    使用OpenVINO優(yōu)化并<b class='flag-5'>部署</b>飛槳<b class='flag-5'>PP-OCRv</b>4<b class='flag-5'>模型</b>

    DeepSeek昇騰模型部署的常見問題及解決方案

    開發(fā)者。 本文將為你詳細(xì)闡述昇騰DeepSeek模型部署的優(yōu)秀實(shí)踐。 昇騰DeepSeek模型部署的常見問題及解決方案見: DeepSeek
    的頭像 發(fā)表于 03-25 16:53 ?1569次閱讀
    DeepSeek<b class='flag-5'>在</b>昇騰<b class='flag-5'>上</b>的<b class='flag-5'>模型</b><b class='flag-5'>部署</b>的常見問題及解決方案

    如何在C#中部署飛槳PP-OCRv4模型

    《超4萬6千星的開源OCR黑馬登場(chǎng),PaddleOCR憑什么脫穎而出?》收到了讀者熱烈反響c,很多讀者提出:如何在C#中部署飛槳PP-OCRv4模型?本文從零開始詳細(xì)介紹整個(gè)過程。
    的頭像 發(fā)表于 02-17 10:58 ?2408次閱讀
    如何在C#中<b class='flag-5'>部署</b>飛槳<b class='flag-5'>PP-OCRv</b>4<b class='flag-5'>模型</b>

    【米爾RK3576開發(fā)板評(píng)測(cè)】+項(xiàng)目名稱百度飛槳PP-YOLOE

    的特殊算子,以使其能輕松地部署多種多樣的硬件。 二、激活Toolkit環(huán)境 進(jìn)入Toolkit conda 三、準(zhǔn)備模型 3.1、首先找到PPYOLOE的例程文件路徑,運(yùn)行命令下載
    發(fā)表于 02-15 17:14

    使用OpenVINO C# API輕松部署飛槳PP-OCRv4模型

    ?本文從零開始詳細(xì)介紹整個(gè)過程。 一,什么是PP-OCRv4模型? ? PP-OCRv4是 PaddleOCR工具庫(kù) 的PP-OCR系列模型
    的頭像 發(fā)表于 02-12 10:42 ?1833次閱讀
    使用OpenVINO C# API輕松<b class='flag-5'>部署</b>飛槳<b class='flag-5'>PP-OCRv</b>4<b class='flag-5'>模型</b>

    AI模型部署邊緣設(shè)備的奇妙之旅:目標(biāo)檢測(cè)模型

    以及邊緣計(jì)算能力的增強(qiáng),越來越多的目標(biāo)檢測(cè)應(yīng)用開始直接在靠近數(shù)據(jù)源的邊緣設(shè)備運(yùn)行。這不僅減少了數(shù)據(jù)傳輸延遲,保護(hù)了用戶隱私,同時(shí)也減輕了云端服務(wù)器的壓力。然而,邊緣端部署高效且準(zhǔn)確的目標(biāo)檢測(cè)
    發(fā)表于 12-19 14:33

    使用PyTorch英特爾獨(dú)立顯卡訓(xùn)練模型

    《PyTorch 2.5重磅更新:性能優(yōu)化+新特性》中的一個(gè)新特性就是:正式支持英特爾獨(dú)立顯卡訓(xùn)練模型!
    的頭像 發(fā)表于 11-01 14:21 ?2644次閱讀
    使用PyTorch<b class='flag-5'>在</b>英特爾獨(dú)立<b class='flag-5'>顯卡</b><b class='flag-5'>上</b>訓(xùn)練<b class='flag-5'>模型</b>