曰本美女∴一区二区特级A级黄色大片, 国产亚洲精品美女久久久久久2025, 页岩实心砖-高密市宏伟建材有限公司, 午夜小视频在线观看欧美日韩手机在线,国产人妻奶水一区二区,国产玉足,妺妺窝人体色WWW网站孕妇,色综合天天综合网中文伊,成人在线麻豆网观看

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

RV1126 開發(fā)OCR文字識別算法組件

ljx2016 ? 來源:ljx2016 ? 作者:ljx2016 ? 2025-04-16 09:11 ? 次閱讀

1. OCR文字識別簡介

文字識別也是圖像領(lǐng)域一個常見問題。然而,對于自然場景圖像,首先要定位圖像中的文字位置,然后才能進(jìn)行文字的識別。所以一般包含兩個步驟:

文字檢測:解決的問題是哪里有文字,文字的范圍有多少。

文字識別:對定位好的文字區(qū)域進(jìn)行識別,主要解決的問題是每個文字是什么,將圖像中的文字區(qū)域進(jìn)轉(zhuǎn)化為字符信息。

我們的OCR算法是基于CTPN+CRNN設(shè)計的。CTPN是一種文字檢測算法,能有效的檢測出復(fù)雜場景的橫向分布的文字,是目前比較好的文字檢測算法。CRNN算法主要用于端到端地對不定長的文本序列進(jìn)行識別,不用先對單個文字進(jìn)行切割,而是將文本識別轉(zhuǎn)化為時序依賴的序列學(xué)習(xí)問題,就是基于圖像的序列識別。

基于EASY-EAI-Nano硬件主板的運行效率:

算法種類 模型大小 運行效率
文字檢測算法 2.79MB 227ms
文字識別算法 4.56MB 89ms

2. 快速上手

2.1 開發(fā)環(huán)境準(zhǔn)備

如果您初次閱讀此文檔,請閱讀《入門指南/開發(fā)環(huán)境準(zhǔn)備/Easy-Eai編譯環(huán)境準(zhǔn)備與更新》,并按照其相關(guān)的操作,進(jìn)行編譯環(huán)境的部署。

在PC端Ubuntu系統(tǒng)中執(zhí)行run腳本,進(jìn)入EASY-EAI編譯環(huán)境,具體如下所示。

cd ~/develop_environment ./run.sh

wKgZO2f_BEyAOsEAAACbrHAYX20186.png

2.2 源碼下載以及例程編譯

在EASY-EAI編譯環(huán)境下創(chuàng)建存放源碼倉庫的管理目錄:

cd /opt mkdir EASY-EAI-Toolkit cd EASY-EAI-Toolkit

通過git工具,在管理目錄內(nèi)克隆遠(yuǎn)程倉庫

git clone https://github.com/EASY-EAI/EASY-EAI-Toolkit-C-Demo.git

wKgZPGf_BE2AHbU7AADL06HcVzc386.png

注:

* 此處可能會因網(wǎng)絡(luò)原因造成卡頓,請耐心等待。

* 如果實在要在gitHub網(wǎng)頁上下載,也要把整個倉庫下載下來,不能單獨下載本實例對應(yīng)的目錄。

進(jìn)入到對應(yīng)的例程目錄執(zhí)行編譯操作,具體命令如下所示:

cd EASY-EAI-Toolkit-C-Demo/algorithm-ocr/ ./build.sh

注:

* 若build.sh腳本帶有cpres參數(shù),則會把Release/目錄下的所有資源都拷貝到開發(fā)板上。

* 若build.sh腳本不帶任何參數(shù),則僅會拷貝demo編譯出來的可執(zhí)行文件。

* 由于依賴庫部署在板卡上,因此交叉編譯過程中必須保持adb連接。

wKgZO2f_BE2ABJMwAAGE7T_LyXI914.png

2.3 模型部署

要完成算法Demo的執(zhí)行,需要先下載算法模型。

百度網(wǎng)盤鏈接為:https://pan.baidu.com/s/1w4tf1YolUCpcAFtyP3aJZQ (提取碼:6666 )。

wKgZPGf_BE2AW-E3AAASX4aXfzE122.png

同時需要把下載的OCR識別算法模型復(fù)制粘貼到Release/目錄:

wKgZO2f_BE2AS6QJAABsoqMXJ3w667.png

再通過下方命令將模型署到板卡中,如下所示。

cp Release/ /mnt/userdata/ -rf

2.4 例程運行

通過按鍵Ctrl+Shift+T創(chuàng)建一個新窗口,執(zhí)行adb shell命令,進(jìn)入板卡運行環(huán)境。

adb shell

wKgZPGf_BE6ABm0gAABc3DEXVxM480.png

進(jìn)入板卡后,定位到例程上傳的位置,如下所示:

cd /userdata/Release/

運行例程命令如下所示:

./test-ocr test.jpg

2.5 運行效果

test-ocr的Demo執(zhí)行效果如下所示:

wKgZO2f_BE6AALDhAAG-6Ctw4HY520.png

再開一個窗口,在PC端Ubuntu環(huán)境通過以下命令可以把圖片拉回來:

adb pull /userdata/Demo/result.jpg .

結(jié)果圖片如下所示:

wKgZPGf_BE6AVpjNAAEj4BcK8uY110.jpg

API的詳細(xì)說明,以及API的調(diào)用(本例程源碼),詳細(xì)信息見下方說明。

3. OCR文字識別API說明

3.1 引用方式

為方便客戶在本地工程中直接調(diào)用我們的EASY EAI api庫,此處列出工程中需要鏈接的庫以及頭文件等,方便用戶直接添加。

選項 描述
頭文件目錄 easyeai-api/algorithm_api/ocr
庫文件目錄 easyeai-api/algorithm_api/ocr
庫鏈接參數(shù) -lpthread -locr -lrknn_api

3.2 OCR檢測初始化函數(shù)

設(shè)置OCR檢測初始化函數(shù)原型如下所示。

int ocr_det_init(const char* model_path, rknn_app_context_t* app_ctx);

具體介紹如下所示。

函數(shù)名: ocr_det_init
頭文件 ocr.h
輸入?yún)?shù)
model_path:算法模型名字/路徑
app_ctx:算法模型句柄
返回值 成功返回:0
失敗返回:-1
注意事項

3.3 OCR檢測運行函數(shù)

設(shè)置OCR檢測運行原型如下所示。

int ocr_det_run(rknn_app_context_t* app_ctx, cv::Mat input_image, ocr_det_postprocess_params* params, ocr_det_result* out_result);

具體介紹如下所示。

函數(shù)名: ocr_det_run
頭文件 ocr.h
輸入?yún)?shù)
app_ctx:算法模型句柄
input_image:Cv::Mat輸入圖像
Params:ocr檢測算法參數(shù)
out_result:返回結(jié)果
返回值
成功返回:0
失敗返回:-1
注意事項

3.4 OCR檢測釋放函數(shù)

設(shè)置OCR檢測釋放原型如下所示。

int ocr_det_release(rknn_app_context_t* app_ctx);

具體介紹如下所示。

函數(shù)名: ocr_det_release
頭文件 ocr.h
輸入?yún)?shù) app_ctx:算法模型句柄
返回值 成功返回:0
失敗返回:-1
注意事項

3.5 OCR識別初始化函數(shù)

OCR識別初始化函數(shù)原型如下所示。

int ocr_rec_init(const char* model_path, rknn_app_context_t* app_ctx);

具體介紹如下所示。

函數(shù)名: ocr_rec_init
頭文件 ocr.h
輸入?yún)?shù)
model_path:算法模型名字/路徑
app_ctx:算法模型句柄
返回值
成功返回:0
失敗返回:-1
注意事項

3.6 OCR識別運行函數(shù)

OCR識別運行函數(shù)原型如下所示。

int ocr_rec_run(rknn_app_context_t* app_ctx, cv::Mat input_image, ocr_rec_result* out_result);

具體介紹如下所示。

函數(shù)名: ocr_rec_run
頭文件 ocr.h
輸入?yún)?shù)
app_ctx:算法模型句柄
input_image:輸入圖像
out_result:返回結(jié)果
返回值
成功返回:0
失敗返回:-1
注意事項

3.7 OCR識別釋放函數(shù)

OCR識別釋放函數(shù)原型如下所示。

int ocr_rec_release(rknn_app_context_t* app_ctx);

具體介紹如下所示。

函數(shù)名: ocr_rec_release
頭文件 ocr.h
輸入?yún)?shù) app_ctx:算法模型句柄
返回值 成功返回:0
失敗返回:-1
注意事項

4. OCR識別算法例程

例程目錄為Toolkit-C-Demo/ocr/test-ocr.cpp,操作流程如下。

wKgZO2f_BE6AR-wwAABFnLXCW4I978.png

參考例程如下所示。

#include #include #include #include"ocr.h" using namespace cv; using namespace std; #define INDENT " " #define THRESHOLD 0.3 // pixel score threshold #define BOX_THRESHOLD 0.9 // box score threshold #define USE_DILATION false // whether to do dilation, true or false #define DB_UNCLIP_RATIO 1.5 // unclip ratio for poly type int main(int argc, char **argv) { if (argc != 2) { printf("%s n", argv[0]); return -1; } /* 參數(shù)初始化 */ const char *img_path = argv[1]; Mat input_image, rgb_img; input_image = imread(img_path); if (input_image.empty()) { cout

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4687

    瀏覽量

    94445
  • 文字識別
    +關(guān)注

    關(guān)注

    0

    文章

    18

    瀏覽量

    8752
  • OCR
    OCR
    +關(guān)注

    關(guān)注

    0

    文章

    156

    瀏覽量

    16665
  • rv1126
    +關(guān)注

    關(guān)注

    0

    文章

    106

    瀏覽量

    3288
收藏 人收藏

    評論

    相關(guān)推薦
    熱點推薦

    基于RV1126開發(fā)板實現(xiàn)人臉檢測方案

    RV1126開發(fā)板上實現(xiàn)人臉檢測:在圖像中找出人臉,以及每張人臉的landmarks位置。 方案設(shè)計邏輯流程圖,方案代碼分為分為兩個業(yè)務(wù)流程,主體代碼負(fù)責(zé)抓取、合成圖像, 算法代碼負(fù)責(zé)人臉檢測功能。
    的頭像 發(fā)表于 04-21 17:59 ?240次閱讀
    基于<b class='flag-5'>RV1126</b><b class='flag-5'>開發(fā)</b>板實現(xiàn)人臉檢測方案

    基于RV1126開發(fā)板實現(xiàn)二維碼識別方案

    RV1126開發(fā)板上實現(xiàn)方案設(shè)計邏輯流程圖,方案代碼分為兩個業(yè)務(wù)流程,主體代碼負(fù)責(zé)抓取、合成圖像,算法代碼負(fù)責(zé)二維碼識別功能。
    的頭像 發(fā)表于 04-21 14:25 ?54次閱讀
    基于<b class='flag-5'>RV1126</b><b class='flag-5'>開發(fā)</b>板實現(xiàn)二維碼<b class='flag-5'>識別</b>方案

    基于RV1126開發(fā)板實現(xiàn)人臉識別方案

    RV1126上實現(xiàn)人臉識別:在圖像中找出人臉,并與數(shù)據(jù)庫進(jìn)行比對,得出該人臉對應(yīng)的身份信息。 方案設(shè)計邏輯流程圖,方案代碼分為分為三個業(yè)務(wù)流程,主體代碼負(fù)責(zé)抓取、合成圖像,算法代碼負(fù)責(zé)人臉
    的頭像 發(fā)表于 04-21 13:51 ?11次閱讀
    基于<b class='flag-5'>RV1126</b><b class='flag-5'>開發(fā)</b>板實現(xiàn)人臉<b class='flag-5'>識別</b>方案

    基于RV1126開發(fā)板實現(xiàn)人臉識別方案

    RV1126開發(fā)板上實現(xiàn)人臉識別:在圖像中找出人臉,并與數(shù)據(jù)庫進(jìn)行比對,得出該人臉對應(yīng)的身份信息。 方案設(shè)計邏輯流程圖,方案代碼分為分為三個業(yè)務(wù)流程,主體代碼負(fù)責(zé)抓取、合成圖像,
    的頭像 發(fā)表于 04-21 10:24 ?107次閱讀
    基于<b class='flag-5'>RV1126</b><b class='flag-5'>開發(fā)</b>板實現(xiàn)人臉<b class='flag-5'>識別</b>方案

    基于RV1126開發(fā)板實現(xiàn)駕駛員行為檢測方案

    RV1126開發(fā)板上實現(xiàn)駕駛員行為檢測:通過圖像識別出這幾種行為:打電話、抽煙、疲勞駕駛。
    的頭像 發(fā)表于 04-18 17:47 ?354次閱讀
    基于<b class='flag-5'>RV1126</b><b class='flag-5'>開發(fā)</b>板實現(xiàn)駕駛員行為檢測方案

    基于RV1126開發(fā)板實現(xiàn)人臉識別方案

    RV1126開發(fā)板實現(xiàn)人臉識別:在圖像中找出人臉,并與數(shù)據(jù)庫進(jìn)行比對,得出該人臉對應(yīng)的身份信息。 方案設(shè)計邏輯流程圖,方案代碼分為分為三個業(yè)務(wù)流程,主體代碼負(fù)責(zé)抓取、合成圖像,
    的頭像 發(fā)表于 04-18 16:55 ?83次閱讀
    基于<b class='flag-5'>RV1126</b><b class='flag-5'>開發(fā)</b>板實現(xiàn)人臉<b class='flag-5'>識別</b>方案

    基于RV1126開發(fā)板的resnet50訓(xùn)練部署教程

    本教程基于圖像分類算法ResNet50的訓(xùn)練和部署到EASY-EAI-Nano(RV1126)進(jìn)行說明
    的頭像 發(fā)表于 04-18 15:07 ?244次閱讀
    基于<b class='flag-5'>RV1126</b><b class='flag-5'>開發(fā)</b>板的resnet50訓(xùn)練部署教程

    基于RV1126開發(fā)板的按鍵測試方法與例程

    RV1126開發(fā)板的按鍵測試方法與例程詳細(xì)描述
    的頭像 發(fā)表于 04-15 17:03 ?190次閱讀
    基于<b class='flag-5'>RV1126</b><b class='flag-5'>開發(fā)</b>板的按鍵測試方法與例程

    基于RV1126開發(fā)板的人員檢測算法開發(fā)

    RV1126開發(fā)人員檢測AI算法組件
    的頭像 發(fā)表于 04-14 13:56 ?172次閱讀
    基于<b class='flag-5'>RV1126</b><b class='flag-5'>開發(fā)</b>板的人員檢測<b class='flag-5'>算法</b><b class='flag-5'>開發(fā)</b>

    基于RV1126開發(fā)板的人臉檢測算法開發(fā)

    RV1126開發(fā)人臉檢測算法組件
    的頭像 發(fā)表于 04-14 10:19 ?152次閱讀
    基于<b class='flag-5'>RV1126</b><b class='flag-5'>開發(fā)</b>板的人臉檢測<b class='flag-5'>算法</b><b class='flag-5'>開發(fā)</b>

    RV1126 實現(xiàn)人臉檢測方案

    基于RV1126開發(fā)板實現(xiàn)人臉檢測方案,充分體現(xiàn)了電子方面的實踐經(jīng)驗和目標(biāo)檢測技術(shù)。
    的頭像 發(fā)表于 04-14 09:25 ?98次閱讀
    <b class='flag-5'>RV1126</b> 實現(xiàn)人臉檢測方案

    基于RV1126開發(fā)板實現(xiàn)二維碼識別方案

    RV1126上實現(xiàn)二維碼識別方案
    的頭像 發(fā)表于 04-11 14:48 ?114次閱讀
    基于<b class='flag-5'>RV1126</b><b class='flag-5'>開發(fā)</b>板實現(xiàn)二維碼<b class='flag-5'>識別</b>方案

    RV1126 實現(xiàn)人臉識別門禁系統(tǒng)解決方案

    RV1126實現(xiàn)人臉識別門禁系統(tǒng)解決方案
    的頭像 發(fā)表于 04-10 15:17 ?222次閱讀
    <b class='flag-5'>RV1126</b> 實現(xiàn)人臉<b class='flag-5'>識別</b>門禁系統(tǒng)解決方案

    RV1126 實現(xiàn)簡單的UI開發(fā)示例

    RV1126上實現(xiàn)簡單的UI開發(fā)實例
    的頭像 發(fā)表于 04-09 16:08 ?193次閱讀
    <b class='flag-5'>RV1126</b> 實現(xiàn)簡單的UI<b class='flag-5'>開發(fā)</b>示例

    RV1126核心特性概述

    RV1126是一款集高性能與低功耗于一體的智能處理器,專為滿足現(xiàn)代嵌入式設(shè)備和應(yīng)用場景的需求而設(shè)計。其主要特性如下: 一、強大的處理器架構(gòu) RV1126搭載了四核ARM Cortex-A7處理器
    的頭像 發(fā)表于 02-08 16:56 ?1292次閱讀