chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

開源OCR 過程介紹

人工智能與大數(shù)據(jù)技術(shù) ? 來源:人工智能與大數(shù)據(jù)技術(shù) ? 作者:人工智能與大數(shù)據(jù) ? 2020-10-30 10:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

不久前,百度技術(shù)團隊在不久前,百度技術(shù)團隊在 GitHub 上正式開源了一款 OCR 神器,在發(fā)布后不久便多次沖上 GitHub Trending 榜單,引起了技術(shù)圈內(nèi)開發(fā)者的熱議,今天就跟大家好好介紹下這個項目。

眾所周知,OCR(Optical Character Recognition,光學字符識別) 技術(shù)已被廣泛應(yīng)用到我們生活中的方方面面,從印刷稿的文字識別、身份證電子化信息錄入,到傳統(tǒng)郵件自動分揀、汽車牌照識別等領(lǐng)域,都上正式開源了一款 OCR 神器,在發(fā)布后不久便多次沖上 GitHub Trending 榜單,引起了技術(shù)圈內(nèi)開發(fā)者的熱議,今天就跟大家好好介紹下這個項目。

眾所周知,OCR(Optical Character Recognition,光學字符識別) 技術(shù)已被廣泛應(yīng)用到我們生活中的方方面面,從印刷稿的文字識別、身份證電子化信息錄入,到傳統(tǒng)郵件自動分揀、汽車牌照識別等領(lǐng)域,都少不了 OCR 的身影。

在平時工作的時候,我也經(jīng)常會使用一些 OCR 軟件來掃描圖片并提取文字,而要替代人工完成一系列的文本分析,圖像識別操作,則必將使用到 AI 技術(shù)。

百度在 GitHub 上開源的 PaddleOCR 模型,大小僅有 8.6M,是目前圈內(nèi)為數(shù)不多,能支持中英文圖像、橫豎排排版識別的 AI 深度學習模型之一。

先看下 PaddleOCR 自今年年中開源以來,短短幾個月在 GitHub 上的表現(xiàn):

7 月,8.6M 超輕量模型發(fā)布,GitHub Trending 全球日榜榜單第一!

8 月,開源 CVPR2020 頂會 SOTA 算法,再上 GitHub 趨勢榜單!

9 月,GitHub Star 數(shù)量已超過 4.6K, 近期又帶來哪些重磅更新?

果然,看 9 月最新更新,PaddleOCR 再次誠意滿滿為大家?guī)碚娓韶?,直接看官方介紹:

01. 官方介紹

數(shù)量上,這次 PaddleOCR 一口氣發(fā)布了三個系列模型,滿足移動端、服務(wù)器端各種場景需求。而且,多語言也妥妥安排上了,全部訓練代碼和模型毫無保留開源。其中 3.5M 超輕量文字識別模型,堪稱目前業(yè)界開源的最輕量 OCR 模型了。質(zhì)量上,如此輕量的模型,效果有保障嗎?不看廣告,直接看療效。 先看幾個常見的通用場景識別效果:

3.5M 的模型能達到這個識別精度,絕對是良心之作了!傳送門 Github:https://github.com/PaddlePaddle/PaddleOCR論文下載鏈接:https://arxiv.org/abs/2009.09941

02. 快速體驗

PaddleOCR 的 3.5M 超輕量 OCR 模型1).PC 端快速嘗試:(打開網(wǎng)頁,選一張圖片,即可實時看到結(jié)果) https://www.paddlepaddle.org.cn/hub/scene/ocr

2). 手機端 App 安裝體驗PaddleOCR 在百度大腦 EasyEdge 上開放了文字識別 APP demo。 示例效果如下(可以在 github 首頁找到下載二維碼)

多個開源 repo 測試對比

簡單對比一下目前主流 OCR 方向開源 repo 的核心能力:

3). 從性能指標來看:

針對 OCR 實際應(yīng)用場景,包括合同,車牌,銘牌,火車票,化驗單,表格,證書,街景文字,名片,數(shù)碼顯示屏等,收集的 300 張圖像,每張圖平均有 17 個文本框,PaddleOCR 的 F1-Score 超過 0.5,這個性能已經(jīng)很不錯了。

4). 從功能完備來看:

預(yù)訓練模型大?。篹asyOCR 目前暫無超輕量模型,chineseocr_lite 最新的模型是 4.7M 左右,而 PaddleOCR 提供的 3.5M 無疑是目前業(yè)界已知最輕量的。

PIP 安裝:目前僅 PaddleOCR 和 easyOCR 支持。

自定義訓練:實際業(yè)務(wù)場景中,預(yù)訓練模型往往不能滿足需求,對于自定義訓練和模型 Finetuning,目前只有 PaddleOCR 支持。

部署方面:easyOCR 模型較大不適合端側(cè)部署,Chineseocr_lite 和 PaddleOCR 都具備端側(cè)部署能力。

開發(fā)者可以根據(jù)自己的實際需求,選擇適合自己的開源方案。 對于 PaddleOCR3.5MB 的超輕量模型,是如何做到的,repo 中也給出了解釋。

3.5M 超輕量模型應(yīng)用了一套超輕量 OCR 系統(tǒng) PP-OCR,主要由 DB 文本檢測、檢測框矯正和 CRNN 文本識別三部分組成。該系統(tǒng)從骨干網(wǎng)絡(luò)選擇和調(diào)整、預(yù)測頭部的設(shè)計、數(shù)據(jù)增強、學習率變換策略、正則化參數(shù)選擇、預(yù)訓練模型使用以及模型自動裁剪量化 8 個方面,采用 19 個有效策略,對各個模塊的模型進行效果調(diào)優(yōu)和瘦身。 其中,飛槳模型壓縮庫 PaddleSlim 為 PaddleOCR 超輕量化模型的實現(xiàn)提供了核心的技術(shù)支撐。從超輕量模型 8.1M 的壓縮到 3.5M,模型大小降低了 56.79%,其中檢測模型速度提升 21%,而且整體模型精度還有提升。

除了 3.5M 超輕量 OCR 模型,PaddleOCR 提供了多語言預(yù)訓練模型(英、德、法、韓、日),支持自定義訓練和豐富的部署方式。

責任編輯:PSY

原文標題:Github標星4.6K+!這個OCR開源項目,火了!

文章出處:【微信公眾號:人工智能與大數(shù)據(jù)技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 開源
    +關(guān)注

    關(guān)注

    3

    文章

    3880

    瀏覽量

    45225
  • OCR
    OCR
    +關(guān)注

    關(guān)注

    0

    文章

    169

    瀏覽量

    16975
  • GitHub
    +關(guān)注

    關(guān)注

    3

    文章

    483

    瀏覽量

    18259

原文標題:Github標星4.6K+!這個OCR開源項目,火了!

文章出處:【微信號:TheBigData1024,微信公眾號:人工智能與大數(shù)據(jù)技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    小語種OCR標注效率提升10+倍:PaddleOCR+ERNIE 4.5自動標注實戰(zhàn)解析

    摘要 :小語種OCR研發(fā)的核心瓶頸在于高質(zhì)量標注數(shù)據(jù)的稀缺與高昂成本。本文介紹一種創(chuàng)新的自動化標注方案,利用 PaddleOCR 進行文本檢測與裁剪,并調(diào)用 ERNIE 4.5 大模型進行雙重預(yù)測
    的頭像 發(fā)表于 08-29 11:26 ?3021次閱讀
    小語種<b class='flag-5'>OCR</b>標注效率提升10+倍:PaddleOCR+ERNIE 4.5自動標注實戰(zhàn)解析

    【嘉楠堪智K230開發(fā)板試用體驗】+OCR實現(xiàn)

    OCR OCR(Optical Character Recognition,光學字符識別)是一種將圖像中的文字內(nèi)容轉(zhuǎn)換為可編輯、可搜索文本的技術(shù)。其核心在于通過圖像預(yù)處理、字符分割、特征提取與模式
    發(fā)表于 08-23 18:53

    如何利用OCR技術(shù)實現(xiàn)高效集裝箱箱號識別?

    在現(xiàn)代物流和海關(guān)監(jiān)管領(lǐng)域,快速準確地識別集裝箱箱號是提升通關(guān)效率、降低運營成本的關(guān)鍵。OCR(光學字符識別)技術(shù)的應(yīng)用,為這一需求提供了智能化解決方案。通過結(jié)合高清成像設(shè)備和先進的算法,OCR技術(shù)
    的頭像 發(fā)表于 08-12 10:48 ?380次閱讀
    如何利用<b class='flag-5'>OCR</b>技術(shù)實現(xiàn)高效集裝箱箱號識別?

    ocr識別時數(shù)據(jù)集上傳壓縮包,上傳成功,但不顯示圖片,圖片數(shù)量仍顯示0,為什么?

    ocr識別時數(shù)據(jù)集上傳壓縮包,上傳成功,但不顯示圖片,圖片數(shù)量仍顯示0
    發(fā)表于 07-23 08:11

    端側(cè)OCR文字識別實現(xiàn) -- Core Vision Kit ##HarmonyOS SDK AI##

    ? 之前做小程序或者web的時候,對于OCR相關(guān)的功能,都是調(diào)用三方接口實現(xiàn)的,例如百度的ocr接口,整體的流程較為復(fù)雜,需要先通過后端代碼獲取百度的token,然后本地選擇圖片,圖片發(fā)送到服務(wù)器
    發(fā)表于 06-30 18:07

    明治案例 | 150個/分鐘!電阻【OCR識別】+【尺寸測量】一步到位

    真實案例——看明治傳感如何用一個視覺傳感器,同時搞定電阻的尺寸測量和OCR識別,讓質(zhì)檢效率翻倍,成本直降!場景需求希望在同一工位完成尺寸測量與OCR識別,減少設(shè)備占
    的頭像 發(fā)表于 06-10 07:33 ?430次閱讀
    明治案例 | 150個/分鐘!電阻【<b class='flag-5'>OCR</b>識別】+【尺寸測量】一步到位

    OCR識別訓練完成后給的是空壓縮包,為什么?

    OCR識別 一共弄了26張圖片,都標注好了,點擊開始訓練,顯示訓練成功了,也將壓縮包發(fā)到郵箱了,下載下來后,壓縮包里面是空的 OCR圖片20幾張圖太少了。麻煩您多添加點,參考我們的ocr識別訓練數(shù)據(jù)集 請問訓練id是?
    發(fā)表于 05-28 06:46

    大模型預(yù)標注和自動化標注在OCR標注場景的應(yīng)用

    OCR,即光學字符識別,簡單來說就是利用光學設(shè)備去捕獲圖像并識別文字,最終將圖片中的文字轉(zhuǎn)換為可編輯和可搜索的文本。在數(shù)字化時代,OCR(光學字符識別)技術(shù)作為處理圖像中文字信息的關(guān)鍵手段,其標注
    的頭像 發(fā)表于 04-15 15:18 ?621次閱讀

    如何在C#中部署飛槳PP-OCRv4模型

    《超4萬6千星的開源OCR黑馬登場,PaddleOCR憑什么脫穎而出?》收到了讀者熱烈反響c,很多讀者提出:如何在C#中部署飛槳PP-OCRv4模型?本文從零開始詳細介紹整個過程。
    的頭像 發(fā)表于 02-17 10:58 ?2424次閱讀
    如何在C#中部署飛槳PP-OCRv4模型

    訊維KVM坐席管理協(xié)作系統(tǒng):OCR功能及優(yōu)勢介紹

    框選識別的場景中。訊維首次將OCR智能文字識別功能加入全新KVM坐席管理協(xié)作系統(tǒng)中,解決手動記錄文字效率低下的問題,提供坐席人員的工作效率。 訊維分布式KVM坐席管理系統(tǒng)是一款集成了多種信息及圖形處理器技術(shù)的智能化設(shè)備,
    的頭像 發(fā)表于 01-22 10:02 ?733次閱讀

    如何在播放視頻過程中插入音頻

    ZDP14x0是一款基于開源GUI引擎的圖像顯示專用驅(qū)動芯片,可以通過串口或者SPI與其他芯片通信,且能播放視頻。本文將介紹如何在播放視頻過程中插入音頻。
    的頭像 發(fā)表于 12-26 11:13 ?1656次閱讀
    如何在播放視頻<b class='flag-5'>過程</b>中插入音頻

    使用ADS1211U的過程中,采樣值輸出一直為0XFFFFFF,為什么?

    最近在使用ADS1211U的過程中遇到些問題,一個問題是采樣值輸出一直為0XFFFFFF,有時候跟換一塊芯片就會好,有時候是一直是0;還有就是在CPU程序仿真的過程中會與非仿真狀態(tài)下產(chǎn)生數(shù)據(jù)
    發(fā)表于 12-25 06:22

    ElfBoard開源項目|車牌識別項目技術(shù)文檔

    車牌識別項目基于百度智能云平臺,旨在利用其強大的OCR服務(wù)實現(xiàn)車牌號碼的自動識別。選擇百度智能云的原因是其高效的API接口和穩(wěn)定的服務(wù)質(zhì)量,能夠幫助開發(fā)者快速實現(xiàn)車牌識別應(yīng)用。這個開源項目使用攝像頭
    的頭像 發(fā)表于 12-06 10:30 ?860次閱讀
    ElfBoard<b class='flag-5'>開源</b>項目|車牌識別項目技術(shù)文檔

    開源ISP(Infinite-ISP)介紹

    公開,都是給一堆函數(shù)自己調(diào)用調(diào)試。因為廠商將 ISP 算法視為保持市場競爭力的獨特秘訣。雖然之前介紹了很多開源ISP項目(優(yōu)秀的 Verilog/FPGA開源項目介紹(二十六)- IS
    的頭像 發(fā)表于 11-18 10:21 ?1660次閱讀
    <b class='flag-5'>開源</b>ISP(Infinite-ISP)<b class='flag-5'>介紹</b>