chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

DeepX OCR:以 DeepX NPU 加速 PaddleOCR 推理,在 ARM 與 x86 平臺交付可規(guī)?;母咝阅?OCR 能力

jf_23871869 ? 來源:jf_23871869 ? 作者:jf_23871869 ? 2026-01-22 21:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一、行業(yè)背景與核心挑戰(zhàn):OCR 規(guī)模化應用的關(guān)鍵瓶頸

**隨著文檔識別技術(shù)的不斷成熟,OCR 技術(shù)已從實驗性階段逐步走向?qū)嶋H業(yè)務(wù)場景,在政務(wù)、金融、制造、物流等多個行業(yè)中得到廣泛應用。然而,在規(guī)?;涞剡^程中,企業(yè)逐漸意識到:**制約 OCR 應用進一步擴展的核心因素,已不再是模型準確率本身,而是整體推理性能與部署成本。

具體來說,規(guī)模化 OCR 應用主要面臨以下幾方面挑戰(zhàn):

  • 吞吐量(FPS)不足 ,難以支撐高并發(fā)或多路輸入場景;
  • 推理時延偏高 ,影響實時性要求較高的業(yè)務(wù)流程;
  • 部署與算力成本受限 ,在邊緣設(shè)備與服務(wù)器環(huán)境中難以兼顧性能與成本。

尤其是在 邊緣計算(ARM 平臺)服務(wù)器端(x86 平臺) 并存的實際部署環(huán)境下,如何實現(xiàn)性能、精度與成本之間的平衡,已成為企業(yè)在 OCR 技術(shù)選型中的關(guān)鍵決策問題。

二、DeepX OCR 解決方案概述:以 DeepX NPU 加速為核心,PaddleOCR 為載體

DeepX OCR 是以 DeepX NPU 推理加速能力 為核心,以 PaddleOCR(PP?OCRv5)模型體系 為載體的聯(lián)合解決方案,面向?qū)?OCR 吞吐量、時延與成本高度敏感的實際生產(chǎn)場景。

在該方案中,PaddleOCR 提供成熟、穩(wěn)定、工程化程度較高的文本檢測與識別模型能力,而 DeepX NPU 則作為關(guān)鍵算力引擎,對 OCR 推理流程進行深度加速與優(yōu)化 ,從系統(tǒng)層面釋放模型在 ARM 與 x86 平臺上的性能潛力。

依托 DeepX NPU 的硬件級加速能力,DeepX OCR 在保證字符識別精度穩(wěn)定的前提下,顯著提升模型推理速度,并在 ARM 與 x86 平臺上實現(xiàn)一致、可擴展且可復現(xiàn)的性能表現(xiàn) ,為 OCR 的規(guī)?;渴鹋c長期演進提供堅實基礎(chǔ)。

核心優(yōu)勢與技術(shù)定位

  • DeepX NPU 推理加速 :圍繞 OCR 推理關(guān)鍵算子與執(zhí)行流程進行優(yōu)化,大幅提升吞吐能力并降低單次推理時延;
  • PaddleOCR(PP?OCRv5)模型體系 :模型成熟穩(wěn)定,具備良好的泛化能力與工程落地基礎(chǔ);
  • 跨平臺性能一致性 :在 ARM 邊緣平臺與 x86 服務(wù)器平臺上均可獲得穩(wěn)定、可預期的性能收益;
  • 性能數(shù)據(jù)可復現(xiàn) :提供標準化 Benchmark 測試流程,確保性能數(shù)據(jù)可核驗、可對比。

三、性能評測結(jié)果分析:ARM 與 x86 雙平臺表現(xiàn)

3.1 ARM 平臺性能表現(xiàn)

在 ARM 平臺(Rockchip aarch64)環(huán)境下,DeepX OCR 提供 MobileServer 兩種配置方案,適配不同業(yè)務(wù)對實時性與精度的需求。

Mobile 配置在邊緣設(shè)備上展現(xiàn)出更高的吞吐能力與更低的推理時延,適用于實時采集、多路輸入等場景;而 Server 配置則更側(cè)重字符識別精度,適合關(guān)鍵字段識別與高精度校驗類業(yè)務(wù)。

3.2 x86 平臺性能擴展能力

在 x86 平臺上,DeepX OCR 針對單卡、雙卡與三卡配置進行了系統(tǒng)性測試,以評估其多卡擴展能力。

Server 配置(精度優(yōu)先)

Mobile 配置(吞吐優(yōu)先)

在 x86 平臺上,隨著算力規(guī)模的持續(xù)擴展,整體吞吐能力(FPS)與推理時延表現(xiàn)出良好的線性提升特性,能夠有效支撐高并發(fā)、大規(guī)模 OCR 服務(wù)的穩(wěn)定部署與運行。Mobile 配置更強調(diào)吞吐能力,而 Server 配置則保持穩(wěn)定的高字符準確率,企業(yè)可根據(jù)具體業(yè)務(wù)需求進行靈活選擇。

四、動手實踐:從零搭建 DeepX OCR 本地推理環(huán)境

本節(jié)將引導您從零開始,在目標平臺(ARM 或 x86)上完成 DeepX OCR 的編譯、模型下載與本地推理驗證。整個流程設(shè)計為端到端可復現(xiàn),確保您能夠在自己的環(huán)境中獲得與官方 Benchmark 一致的推理體驗。

4.1 環(huán)境準備

第一步:克隆項目倉庫

# 克隆倉庫(包含 Git Submodules)
git clone --recursive https://github.com/Chris-godz/DEEPX-OCR.git
cd DEEPX-OCR

第二步:安裝系統(tǒng)依賴

# 安裝 FreeType 及相關(guān)依賴(用于多語言文本渲染)
sudo apt-get update
sudo apt-get install -y libfreetype6-dev libharfbuzz-dev libfmt-dev

4.2 編譯項目

DeepX OCR 采用 CMake 構(gòu)建系統(tǒng),支持 Release 和 Debug 兩種構(gòu)建模式

# 執(zhí)行編譯腳本(默認 Release 模式)
bash build.sh clean test

編譯腳本會自動:

  • 初始化并編譯 OpenCV(含 opencv_contrib 模塊)
  • 編譯 DeepX OCR 核心推理引擎
  • 生成測試可執(zhí)行文件

4.3 下載模型

DeepX OCR 提供ServerMobile兩套模型配置:

./setup.sh

模型將被部署到以下目錄:

engine/model_files/
├── server/ # Server 模型(高精度)
│ ├── *.dxnn # DeepX NPU 優(yōu)化模型
│ └── *.txt # 字典文件
└── mobile/ # Mobile 模型(高吞吐)
├── *.dxnn
└── *.txt

4.4 配置DXRT 運行時環(huán)境

DeepX NPU 推理需要配置運行時環(huán)境變量以優(yōu)化性能:

# 配置 DXRT 環(huán)境變量
source ./set_env.sh 1 2 1 3 2 4

環(huán)境變量說明:

4.5 運行推理測試

DeepX OCR 提供交互式測試菜單,可快速驗證各模塊功能:

# 啟動交互式測試菜單
./run.sh

4.6 執(zhí)行性能基準測試

# Run benchmark (Server model, 60 runs per image)
python3 benchmark/run_benchmark.py --model server --runs 60 
--images_dir test/twocode_images
# Run benchmark (Mobile model, 60 runs per image)
python3 benchmark/run_benchmark.py --model mobile --runs 60 
--images_dir test/twocode_images

推理完成后,結(jié)果將保存在 benchmark/ 目錄下,按模型類型分別存儲

benchmark/
├── results_server/ # Server 模型結(jié)果
│ ├── DXNN-OCR_benchmark_report.md # Benchmark 性能報告
│ └── image_*_result.json # 每張圖片的 OCR 結(jié)構(gòu)化結(jié)果
├── results_mobile/ # Mobile 模型結(jié)果
│ ├── DXNN-OCR_benchmark_report.md
│ └── image_*_result.json
├── vis_server/ # Server 模型可視化圖像
│ └── image_*.jpg # 帶檢測框的結(jié)果圖像
├── vis_mobile/ # Mobile 模型可視化圖像
│ └── image_*.jpg
└── benchmark_results.json # 匯總性能數(shù)據(jù)

所有結(jié)果將保存至benchmark/目錄,包含可視化圖像與結(jié)構(gòu)化 JSON 輸出。

五、OCR Server 部署:面向生產(chǎn)環(huán)境的高性能 HTTP 服務(wù)

DeepX OCR Server 基于Crow高性能 HTTP 框架構(gòu)建,支持并發(fā)請求處理、圖像與 PDF 文件輸入,可直接作為后端服務(wù)集成到業(yè)務(wù)系統(tǒng)中。

5.1 啟動****OCR Server

確保已完成第四章的編譯與環(huán)境配置后,執(zhí)行以下命令啟動服務(wù):

cd /home/deepx/Desktop/DEEPX-OCR/server
# 使用默認配置啟動(端口 8080,Server 模型)
./run_server.sh
# 或指定參數(shù)啟動
./run_server.sh -p 8080 -m server -t 4

** 命令行參數(shù) :**

示例:使用 Mobile 模型,端口 9090

./run_server.sh -p 9090 -m mobile

5.2 驗證服務(wù)狀態(tài)

在另一個終端窗口中執(zhí)行健康檢查:

curl http://localhost:8080/health

預期響應:

{"status":"healthy","service":"DeepX OCR Server","version":"1.0.0"}

5.3API 接口調(diào)用

POST /ocr - 圖像 OCR 識別

請求示例 (使用 curl):

# 生成圖像請求 JSON 文件
echo "{"file": "$(base64 -w 0 images/image_1.png)", "fileType": 1, "visualize": true}" > /tmp/image_request.json
# 發(fā)送請求(使用 @文件 方式,避免命令行參數(shù)過長)
curl -X POST http://localhost:8080/ocr 
-H "Content-Type: application/json" 
-H "Authorization: token deepx_token" 
-d @/tmp/image_request.json | python3 -m json.tool

** 請求參數(shù)說明 :**

POST /ocr - PDF OCR 識別

# 生成 PDF 請求 JSON 文件
echo "{"file": "$(base64 -w 0 server/pdf_file/test.pdf)", "fileType": 0, "pdfDpi": 150, "pdfMaxPages": 10, "visualize": true}" > /tmp/pdf_request.json
# 發(fā)送請求
curl -X POST http://localhost:8080/ocr 
-H "Content-Type: application/json" 
-H "Authorization: token deepx_token" 
-d @/tmp/pdf_request.json | python3 -m json.tool

5.4性能基準測試

DeepX OCR Server 提供完整的基準測試工具套件:

cd server/benchmark
# Image OCR 測試(4 并發(fā))
./run.sh --mode image -c 4
# PDF OCR 測試
./run.sh --mode pdf --dpi 150 --max-pages 10

測試結(jié)果輸出

server/benchmark/results/
├── API_benchmark_report.md # Image OCR 報告
└── PDF_benchmark_report.md # PDF OCR 報告

六、WebUI Demo 體驗:可視化交互,一鍵體驗加速效果

在性能評測與工程驗證之外,DeepX OCR 同時提供 WebUI Demo 作為配套的體驗與驗證服務(wù)。通過 WebUI,用戶可以從實際輸入出發(fā),直觀感受 DeepX NPU 加速下 PaddleOCR 的完整推理流程。

6.1 啟動 WebUI

前置條件

確保 OCR Server 已在后臺運行(參考第五章)。

安裝 Python 依賴

# 進入 WebUI 目錄
cd /home/deepx/Desktop/DEEPX-OCR/server/webui
# 創(chuàng)建 Python 虛擬環(huán)境
python3 -m venv venv
# 激活虛擬環(huán)境
source venv/bin/activate
# 安裝依賴
pip install --upgrade pip
pip install -r requirements.txt

啟動 WebUI 服務(wù)

# 確保虛擬環(huán)境已激活
source venv/bin/activate
# 啟動 WebUI(默認連接 localhost:8080 的 OCR Server)
python app.py

** 訪問 WebUI :**

在瀏覽器中打開:http://localhost:7860

6.2 功能體驗

圖像 OCR 識別

  1. 上傳圖像 :將圖像拖拽到 "

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    Lenovo推出Agentic AI和Lenovo xIQ平臺,全面加速企業(yè)AI部署,規(guī)模化交付全生命周期混合AI解決方案

    Lenovo xIQ ——一套旨在簡化、加速并實現(xiàn)企業(yè)級AI規(guī)?;?/b>運營的全新AI原生交付平臺。此次升級將Lenovo成熟的Hybrid AI Advantage?從基礎(chǔ)AI架構(gòu)拓展為
    的頭像 發(fā)表于 01-08 14:51 ?767次閱讀

    博世中階智能輔助駕駛方案實現(xiàn)規(guī)?;?/b>交付

    10月17日,博世中階智能輔助駕駛迎來批量交付的關(guān)鍵節(jié)點。今年上半年,該方案已獲得捷途、東風、北汽等五家車企的十余款車型定點。歷經(jīng)數(shù)月的開發(fā)調(diào)試與嚴苛測試,如今順利實現(xiàn)規(guī)?;?/b>交付,充分印證了博世
    的頭像 發(fā)表于 10-23 09:07 ?690次閱讀

    小語種OCR標注效率提升10+倍:PaddleOCR+ERNIE 4.5自動標注實戰(zhàn)解析

    摘要 :小語種OCR研發(fā)的核心瓶頸在于高質(zhì)量標注數(shù)據(jù)的稀缺與高昂成本。本文介紹一種創(chuàng)新的自動標注方案,利用 PaddleOCR 進行文本檢測與裁剪,并調(diào)用 ERNIE 4.5 大模型進行雙重預測
    的頭像 發(fā)表于 08-29 11:26 ?3443次閱讀
    小語種<b class='flag-5'>OCR</b>標注效率提升10+倍:<b class='flag-5'>PaddleOCR</b>+ERNIE 4.5自動標注實戰(zhàn)解析

    【嘉楠堪智K230開發(fā)板試用體驗】+OCR實現(xiàn)

    結(jié)果 pl.show_image()# 展示當前幀推理結(jié)果 gc.collect() 效果 效果如下所示,文本文檔中添加OCR測試字符,運行代碼,測試如下,正確識別。
    發(fā)表于 08-23 18:53

    【EASY EAI Orin Nano開發(fā)板試用體驗】PP-OCRV5文字識別實例搭建與移植

    用PP-OCRV5,首先就是要安裝PaddlePaddle 3.0(飛槳)和PaddleOCR 3.0(飛槳OCR大模型),這兩個軟件要通過Python進行安裝,這里為了省事,我直接在別的ARM64開發(fā)板(野火
    發(fā)表于 08-18 16:57

    睿海光電高效交付與廣泛兼容助力AI數(shù)據(jù)中心800G光模塊升級

    租戶環(huán)境提供推理服務(wù),需實現(xiàn)性能隔離與穩(wěn)定擴展。面對這一技術(shù)浪潮,深圳市睿海光電科技有限公司(簡稱“睿海光電”)憑借其創(chuàng)新的800G光模塊解決方案,交付速度比同行快2-3天的硬核實力
    發(fā)表于 08-13 19:01

    如何利用OCR技術(shù)實現(xiàn)高效集裝箱箱號識別?

    能夠?qū)崿F(xiàn)全天候、高精度的箱號自動識別。 1. 高清圖像采集:識別的基礎(chǔ) 傳統(tǒng)攝像設(shè)備受限于分辨率和環(huán)境光線,往往難以獲取清晰的箱號圖像?,F(xiàn)代OCR系統(tǒng)采用工業(yè)級高清相機,具備高動態(tài)范圍(HDR)和低照度增強能力,即使強光、雨霧
    的頭像 發(fā)表于 08-12 10:48 ?657次閱讀
    如何利用<b class='flag-5'>OCR</b>技術(shù)實現(xiàn)高效集裝箱箱號識別?

    “香山”實現(xiàn)業(yè)界首個開源芯片的產(chǎn)品級交付與首次規(guī)?;?/b>應用

    “香山”實現(xiàn)業(yè)界首個開源芯片的產(chǎn)品級交付與首次規(guī)?;?/b>應用開源高性能RISC-V處理器核“香山”產(chǎn)業(yè)落地取得里程碑式突破。7月16-19日,在上海舉辦的2025RISC-V中國峰會期間,北京開源芯片
    的頭像 發(fā)表于 08-01 18:16 ?1580次閱讀
    “香山”實現(xiàn)業(yè)界首個開源芯片的產(chǎn)品級<b class='flag-5'>交付</b>與首次<b class='flag-5'>規(guī)模化</b>應用

    端側(cè)OCR文字識別實現(xiàn) -- Core Vision Kit ##HarmonyOS SDK AI##

    制),我發(fā)送出去的base64是不全的。 總之,傳統(tǒng)方法做ocr流程上比較復雜,而原生鴻蒙開發(fā)提供了端側(cè)AI的能力,其中就包括了“Core Vision Kit(基礎(chǔ)視覺服務(wù))”,即與圖片識別相關(guān)的AI能力
    發(fā)表于 06-30 18:07

    OCR識別訓練完成后給的是空壓縮包,為什么?

    OCR識別 一共弄了26張圖片,都標注好了,點擊開始訓練,顯示訓練成功了,也將壓縮包發(fā)到郵箱了,下載下來后,壓縮包里面是空的 OCR圖片20幾張圖太少了。麻煩您多添加點,參考我們的ocr識別訓練數(shù)據(jù)集 請問訓練id是?
    發(fā)表于 05-28 06:46

    邊緣AI運算革新 DeepX DX-M1 AI加速卡結(jié)合Rockchip RK3588多路物體檢測解決方案

    DeepX 推出了一款革命性的產(chǎn)品 DeepX DX-M1 AI 推理加速卡 采用 PCIe Gen3 M.2 M-Key 接口,具備高達 25 TOPS 的卓越運算
    的頭像 發(fā)表于 05-06 14:15 ?1249次閱讀
    邊緣AI運算革新 <b class='flag-5'>DeepX</b> DX-M1 AI<b class='flag-5'>加速</b>卡結(jié)合Rockchip RK3588多路物體檢測解決方案

    使用MicroPython部署中的ocrrec_image.py推理得到的輸出結(jié)果很差,如何解決呢?

    使用在線平臺訓練OCR識別任務(wù),測試結(jié)果表現(xiàn)很好。 期待結(jié)果和實際結(jié)果 實際的推理結(jié)果很差,推理不出任何信息。
    發(fā)表于 04-29 06:54

    大模型預標注和自動標注OCR標注場景的應用

    OCR,即光學字符識別,簡單來說就是利用光學設(shè)備去捕獲圖像并識別文字,最終將圖片中的文字轉(zhuǎn)換為可編輯和搜索的文本。在數(shù)字化時代,OCR(光學字符識別)技術(shù)作為處理圖像中文字信息的關(guān)鍵手段,其標注
    的頭像 發(fā)表于 04-15 15:18 ?836次閱讀

    RK3588核心板邊緣AI計算中的顛覆性優(yōu)勢與場景落地

    推理任務(wù),需額外部署GPU加速卡,導致成本與功耗飆升。 擴展性受限:老舊接口(如USB 2.0、百兆網(wǎng)口)無法支持5G模組、高速存儲等現(xiàn)代外設(shè),升級困難。 開發(fā)周期長:BSP適配不完善,跨平臺AI
    發(fā)表于 04-15 10:48