chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

用ROCm部署PP-StructureV3到AMD GPU上

jf_23871869 ? 來源:jf_23871869 ? 作者:jf_23871869 ? 2025-11-13 16:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:AVNET 李鑫杰

我們在上一篇文章中介紹了ROCm+PP-OCRv5,為實現在AMD計算平臺上完成復雜文檔的端到端智能解析,本文基于ROCm軟件棧,提供一套完整的PP-StructureV3模型部署方案。該方案是對前文PP-OCRv5部署實踐的深化與擴展。

一,RapidDoc系統概述

RapidDoc 是一個專精于文檔智能解析的輕量級開源框架,集成了以下核心功能模塊:

  • 光學字符識別(OCR)
  • 文檔版面分析
  • 數學公式識別
  • 表格結構還原
  • 閱讀順序恢復

該系統基于 MinerU 架構進行二次開發(fā),在保持高精度解析能力的同時,移除了視覺語言模型(VLM)模塊,專注于構建高效穩(wěn)定的端到端文檔解析流水線。即使在純 CPU 環(huán)境中,系統仍能保持流暢的推理性能。

本項目采用的核心模型均來自 PaddleOCR PP-StructureV3 模型系列,包括:

  • OCR 識別模塊
  • 版面分析模塊
  • 公式識別模塊
  • 閱讀順序模塊
  • 表格識別模型

所有模型均已完成 ONNX 格式轉換,其跨平臺特性為后續(xù)部署提供了良好基礎,這也是選擇 ROCm 進行適配的關鍵前提。

二,ROCm?工具套件簡介

ROCm(Radeon Open Compute)是 AMD 推出的開源 GPU 計算平臺,提供完整的軟件棧支持:

  • 底層驅動與運行時
  • 編譯器與工具鏈
  • 上層應用加速支持

平臺特性包括:

  • 支持 CNN(預測式 AI)與 Transformer(生成式 AI)主流架構
  • 兼容 AMD 獨立顯卡(Radeon Pro/RX 系列)及部分 APU 核顯
  • 針對高性能計算與大模型訓練優(yōu)化
  • 對推理場景提供良好支持

項目開源地址:

https://github.com/liebedir/RapidDoc-AMD-ROCm

三,搭建開發(fā)環(huán)境

在本地搭建開發(fā)環(huán)境步驟如下:

首先,克隆 PP-StructureV3-RapidDoc-AMD-ROCm 到本地:

git clone https://github.com/liebedir/RapidDoc-AMD-ROCm.gitcd RapidDoc-AMD-ROCm

接著,安裝 ROCm:

wget https://repo.radeon.com/amdgpu-install/6.4.3/ubuntu/jammy/amdgpu-install_6.4.60403-1_all.deb

圖片

sudo apt install ./amdgpu-install_6.4.60403-1_all.deb

圖片

sudo apt update

圖片

sudo apt install "linux-headers-$(uname -r)" "linux-modules-extra-$(uname -r)"

圖片

sudo apt install amdgpu-dkms

圖片

圖片

sudo apt install python3-setuptools python3-wheel

圖片

sudo usermod -a -G render,video $LOGNAME # Add the current user to the render and video groups

圖片

sudo apt install rocm

圖片

設置環(huán)境變量,編輯 ~/.bashrc。注意該變量與核顯架構相關,11.0.0 適用于 RDNA3 架構核顯,其他架構請參考 GitHub 項目 liebedir/PP-OCRv5-AMD-ROCm:

vi ~/.bashrcexport HSA_OVERRIDE_GFX_VERSION=11.0.0

圖片

完成后重啟計算機。

接下來安裝 Python 環(huán)境與 ROCm-onnxruntime:

conda create -n ocr-rocm python==3.10pip3 install onnxruntime-rocm -f https://repo.radeon.com/rocm/manylinux/rocm-rel-6.4.2/

圖片

安裝 PyTorch(請根據已安裝的 ROCm 版本選擇對應的 PyTorch 版本,向下兼容):

pip3 install torch torchvision --index-url https://download.pytorch.org/whl/rocm6.4

圖片

安裝其他依賴包:

pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple

至此,模型與環(huán)境已全部準備就緒!

四,編寫Demo推理程序

運行以下命令啟動推理演示:

python demo.py

運行過程及結果如下圖所示。默認使用的 Provider 為 MIGraphXExecutionProvider,這也是 AMD 未來主推的 onnxruntime Provider。你也可以通過修改 Provider_config.py 中的 self.default_provider = self.had_providers[1] 切換為 ROCmExecutionProvider:

圖片

測試結果如下:

圖片

圖片

四,總結

使用 AMD CPU 或 GPU 的用戶,可以借助 ROCm 軟件棧,將 RapidDoc——這一高速文檔解析系統——順利部署到 GPU 或核顯硬件平臺上。

如果你有更好的文章,歡迎投稿!

稿件接收郵箱:nami.liu@pasuntech.com

更多精彩內容請關注“ 算力魔方^?^ ”!

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • amd
    amd
    +關注

    關注

    25

    文章

    5639

    瀏覽量

    138817
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5069

    瀏覽量

    134191
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    AMD迎頭猛追Intel 全球首發(fā)7nm GPU很威風!

    `處理器大廠美商超微(AMD)日前發(fā)布全球首款7奈米制程資料中心繪圖處理器(GPU),為新世代人工智能(AI)、云端運算與高效能運算挹注動能。AMD Radeon Instinct MI60
    發(fā)表于 11-20 11:35

    如何在AMDGPU運行TensorFlow?

    ROCm 即 Radeon 開放生態(tài)系統 (Radeon Open Ecosystem),是我們在 Linux 上進行 GPU 計算的開源軟件基礎。而 TensorFlow 實現則使用了 MIOpen,這是一個適用于深度學習的高度優(yōu)化
    的頭像 發(fā)表于 10-04 08:59 ?2.5w次閱讀

    AMD同時推出Instinct MI100和Radeon ROCm 4.0

    4.0(ROCm 4.0)Linux版本。A MD認為MI100是世界最快的HPC GPU加速器,提供超過10TFLOPS的FP64計算能力。MI100額定峰值FP64性能為11.5 TFLOPS
    的頭像 發(fā)表于 11-17 14:53 ?1842次閱讀

    AMD推出Instinct MI100和Radeon ROCm4.0

    4.0(ROCm 4.0)Linux版本。AMD認為MI100是世界最快的HPC GPU加速器,提供超過10TFLOPS的FP64計算能力。MI100額定峰值FP64性能為11.5
    的頭像 發(fā)表于 11-17 15:27 ?2034次閱讀

    PyTorch 1.8發(fā)布,支持AMD ROCm

    1.8版本中,官方終于加入了對AMD ROCm的支持,可以方便的在原生環(huán)境下運行,不用去配置Docker了。 △AMD ROCm只支持Linux操作系統 1.8版本集合了自2020年1
    的頭像 發(fā)表于 03-08 10:50 ?3712次閱讀

    AMD發(fā)布基于CDNA 2架構的Instinct MI210 GPU

    基于AMD CDNA 2架構并由ROCm 5提供支持,AMD Instinct MI210 GPU幫助主流用戶加速洞察和發(fā)現。
    的頭像 發(fā)表于 03-26 09:53 ?2441次閱讀

    AMD RDNA 3/Navi 3X GPU升級

    但盡管如此,目前單節(jié)點跳轉本身無法提供50%的單位性能提升(RIP Dennard縮放)。因此,計劃對RDNA 3進行幾項架構改進。這包括AMD的下一代片無限緩存,以及AMD所說的優(yōu)
    的頭像 發(fā)表于 07-25 09:43 ?1406次閱讀

    Meta開發(fā)AITemplate,大幅簡化多GPU后端部署

    AITemplate 在 CNN、Transformer 和 Diffusion 模型都能提供接近硬件上限的 TensorCore (NVIDIA GPU) 和 MatrixCore (AMD
    的頭像 發(fā)表于 11-04 17:14 ?1458次閱讀

    GPU平臺生態(tài):英偉達CUDA和AMD ROCm對比分析

    設計架構提供了硬件的直接訪問接口,不必依賴圖形 API 映射,降低 GPGPU 開發(fā)者編譯難度,以此實現高粘性的開發(fā)者生態(tài)。目前主流的開發(fā)平臺還包括 AMD ROCm 以及 OpenCL。
    的頭像 發(fā)表于 06-06 14:36 ?3688次閱讀
    <b class='flag-5'>GPU</b>平臺生態(tài):英偉達CUDA和<b class='flag-5'>AMD</b> <b class='flag-5'>ROCm</b>對比分析

    AMD將于今年秋季在部分RDNA 3 GPU添加ROCm的支持

    ? AMD將于今年秋季在部分RDNA 3 GPU添加ROCm的支持 ? 人工智能是塑造下一代計算的決定性技術。近幾個月來,我們都看到了生成
    的頭像 發(fā)表于 07-25 15:40 ?1282次閱讀

    AMD 發(fā)布新的AMD ROCm 5.6開放軟件平臺

    ? ? ? ?? 近日,AMD 發(fā)布了新的 AMD ROCm 5.6 開放軟件平臺,AMD AI群組高級副總裁 Vamsi Boppana 在博客中重點介紹了
    的頭像 發(fā)表于 07-25 16:29 ?1490次閱讀

    AMD ROCm 6.1升級MIPOpen 3.1,引入AI參數預測模型

    在此期間,AMD 頻繁向GitHub公共倉庫推送有關 ROCm 6.1 的最新開發(fā)進展,透露出不久后有可能正式上線新版本的意圖。
    的頭像 發(fā)表于 02-29 14:33 ?1404次閱讀

    英偉達GPU壟斷局面下,開源能否成為顛覆市場的關鍵力量?

    開源是AMD AI軟硬件生態(tài)系統的一大賣點,雖然ROCm軟件自 2016 年推出以來一直是開源的,但是固件的開源也很重要,AMD GPU
    發(fā)表于 04-18 14:25 ?902次閱讀
    英偉達<b class='flag-5'>GPU</b>壟斷局面下,開源能否成為顛覆市場的關鍵力量?

    AMD發(fā)布ROCm更新,新增RX 8000系列GPU的Navi 44命名

    首款Navi 48芯片以Gfx1201之名現身,而Navi 44則以Gfx1200之名亮相。這兩款GPU的出現,至少暗示了AMD正在逐步完善RDNA 4 GPU的研發(fā)工作。
    的頭像 發(fā)表于 05-24 16:11 ?1061次閱讀

    AMD集成DeepSeek-V3模型至Instinct MI300X GPU

    AMD近日宣布了一項重要的技術進展,即將全新的DeepSeek-V3模型成功集成其旗艦級GPU產品——Instinct MI300X。這
    的頭像 發(fā)表于 02-05 13:58 ?728次閱讀