chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

OCR識別技術

新機器視覺 ? 來源:企通查 ? 作者:企通查 ? 2021-03-12 09:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在爬蟲對驗證碼進行破解時,經(jīng)常需要對圖片中的文字內(nèi)容進行識別,這時就需要用到OCR技術了,那么 OCR識別技術是如何實現(xiàn)對文字內(nèi)容“即拍即得”的呢?

OCR(Optical Character Recognition)即光學字符識別技術,實質(zhì)屬于計算機輸入技術。OCR通過利用光學技術與計算機技術對圖片、紙張、物體等處的文本內(nèi)容進行分析識別,并讀取轉(zhuǎn)換成計算機和人類都能理解接受的格式。

OCR主要可以分為手寫體識別和印刷體識別。

由于印刷體都是計算機自助生成再進行輸出,通常較為規(guī)律,因此較手寫體識別來說要更簡單。而手寫體由于往往會帶有個人特色,每個人的風格不盡相同,由于其千人千面的特性,手寫體識別也成了OCR界一直想攻克的難關。當然,除了手寫體與印刷體外,OCR也可以根據(jù)識別內(nèi)容來分類。例如按語言分類,要識別的內(nèi)容將可能包括漢語、英語、日語、法語等,而如果僅滿足國人需求,要識別的內(nèi)容就可能會包括漢字、英文字母、阿拉伯數(shù)字、標點符號等。

通常根據(jù)要識別的內(nèi)容不同,識別的難度也不同。比如僅識別阿拉伯數(shù)字,只需能識別出0-9,而英文字母則需要識別52個字符(僅考慮大小寫),而中文識別則會高達數(shù)千個,且由于漢字的結(jié)構(gòu)偏旁較為復雜,要將這些字符都準確識別出來會使難度系數(shù)直線上升。一個典型的OCR技術處理流程如下圖所示:

圖:來源于網(wǎng)絡

其中,圖像預處理通常為能使圖像中的文字更明顯便于識別,會對圖像的成像問題進行修正,通常是基于數(shù)字圖像處理和傳統(tǒng)機器學習等方法對圖像進行操作。

常見的圖像預處理包括幾何變換(透視、翻轉(zhuǎn)、旋轉(zhuǎn)、扭曲、拉直等)、畸變矯正、去模糊、銳化、圖像增強、光線矯正、灰度化、二值化等。其中,在對付驗證碼時常用的灰度化、二值化處理對于內(nèi)容較為簡單的文本信息有增強作用,但對復雜背景的內(nèi)容處理效果就會收效甚微。

文字檢測,顧名思義是對圖片中存在的文字內(nèi)容進行檢測,檢測內(nèi)容包括文本所在的位置、范圍、布局、數(shù)量等,通常也包括整體版面分析和文字行檢測等。部分OCR軟件為了保證檢測范圍的準確性,還會套用圖像檢測的方法,對圖像中的文本區(qū)域進行框選,并像下圖所示將框選與待識別區(qū)域交由令用戶進行校驗確認。

圖:某OCR軟件識別界面

文本檢測完成后,建立在其基礎之上的文本識別將會對選定的文本內(nèi)容進行識別,并將圖像中的字符轉(zhuǎn)化為可供人類和計算機識別的文本信息。文本信息主要需要解決的問題是每個字符是什么。

對于識別后輸出的文本通常需要再次核對驗證以確保其準確率,即文本校正,通常也被認為屬于文字檢測的環(huán)節(jié)。當識別的內(nèi)容是由詞庫中的詞匯構(gòu)成時就稱之為有詞典識別,反之則稱為無詞典識別。在整個處理流程過程中,對識別準確率影響最大的步驟就是文本檢測與文本識別。相比一般文本,通常對OCR技術的評測會從最終識別率、識別速度、版面理解正確率、版面還原滿意度4方面來作為依據(jù)。

OCR識別技術對于手寫體識別目前尚在發(fā)展階段,而對于印刷體識別的技術已經(jīng)發(fā)展的較為純熟。而且,對于印刷體識別的應用劃分可能遠比你我想象的更為細致。例如用于對人身份進行核查驗證的證件OCR識別、用于移動支付綁卡的銀行卡OCR識別、用于存儲管理名片的名片OCR識別、用于大量文字資料、檔案卷宗的錄入和處理的文檔OCR識別、用于銀行、金融、電信機構(gòu)的票據(jù)OCR識別、用于交通安全的車輛OCR識別等。

OCR技術的出現(xiàn)無疑提升了工作效率,也改變了我們的生活。

參考文獻:

https://www.sohu.com/a/233167039_205239

https://zhuanlan.zhihu.com/p/45376274

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • OCR
    OCR
    +關注

    關注

    0

    文章

    170

    瀏覽量

    17038

原文標題:文字識別界的“拍立得”——OCR識別技術

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    【嘉楠堪智K230開發(fā)板試用體驗】+OCR實現(xiàn)

    OCR OCR(Optical Character Recognition,光學字符識別)是一種將圖像中的文字內(nèi)容轉(zhuǎn)換為可編輯、可搜索文本的技術。其核心在于通過圖像預處理、字符分割、特
    發(fā)表于 08-23 18:53

    如何利用OCR技術實現(xiàn)高效集裝箱箱號識別

    在現(xiàn)代物流和海關監(jiān)管領域,快速準確地識別集裝箱箱號是提升通關效率、降低運營成本的關鍵。OCR(光學字符識別技術的應用,為這一需求提供了智能化解決方案。通過結(jié)合高清成像設備和先進的算法
    的頭像 發(fā)表于 08-12 10:48 ?531次閱讀
    如何利用<b class='flag-5'>OCR</b><b class='flag-5'>技術</b>實現(xiàn)高效集裝箱箱號<b class='flag-5'>識別</b>?

    ocr識別時數(shù)據(jù)集上傳壓縮包,上傳成功,但不顯示圖片,圖片數(shù)量仍顯示0,為什么?

    ocr識別時數(shù)據(jù)集上傳壓縮包,上傳成功,但不顯示圖片,圖片數(shù)量仍顯示0
    發(fā)表于 07-23 08:11

    端側(cè)OCR文字識別實現(xiàn) -- Core Vision Kit ##HarmonyOS SDK AI##

    獲取圖片url,把這個url和token再發(fā)給百度的ocr接口獲取識別數(shù)據(jù)……或者圖片轉(zhuǎn)base64以后把這個base64發(fā)給接口,然而鴻蒙這里,目前我也不知道啥原因(可能是發(fā)送請求的數(shù)據(jù)長度有限
    發(fā)表于 06-30 18:07

    OCR技術如何實現(xiàn)鐵路集裝箱號的自動識別?

    在鐵路物流運輸中,集裝箱號的快速準確識別是提升效率的關鍵環(huán)節(jié)。通過先進的OCR(光學字符識別技術,結(jié)合計算機視覺與深度學習方法,可以實現(xiàn)鐵路集裝箱號的高效、可靠
    的頭像 發(fā)表于 06-13 10:32 ?389次閱讀

    OCR技術vs傳統(tǒng)識別:哪種更適合火車集裝箱識別?

    在鐵路物流領域,集裝箱箱號識別是提升運輸效率的關鍵環(huán)節(jié)。隨著計算機視覺技術的發(fā)展,OCR識別與傳統(tǒng)識別
    的頭像 發(fā)表于 06-11 10:54 ?429次閱讀

    明治案例 | 150個/分鐘!電阻【OCR識別】+【尺寸測量】一步到位

    真實案例——看明治傳感如何用一個視覺傳感器,同時搞定電阻的尺寸測量和OCR識別,讓質(zhì)檢效率翻倍,成本直降!場景需求希望在同一工位完成尺寸測量與OCR識別,減少設備占
    的頭像 發(fā)表于 06-10 07:33 ?549次閱讀
    明治案例 | 150個/分鐘!電阻【<b class='flag-5'>OCR</b><b class='flag-5'>識別</b>】+【尺寸測量】一步到位

    OCR識別訓練完成后給的是空壓縮包,為什么?

    OCR識別 一共弄了26張圖片,都標注好了,點擊開始訓練,顯示訓練成功了,也將壓縮包發(fā)到郵箱了,下載下來后,壓縮包里面是空的 OCR圖片20幾張圖太少了。麻煩您多添加點,參考我們的ocr
    發(fā)表于 05-28 06:46

    rfid技術是如何應用在集裝箱自動識別的呢?

    在現(xiàn)代集裝箱物流管理中,快速、準確地識別集裝箱號碼是提升港口、堆場和海關運作效率的關鍵。隨著技術的發(fā)展,RFID(射頻識別技術OCR視覺
    的頭像 發(fā)表于 04-18 10:13 ?627次閱讀
    rfid<b class='flag-5'>技術</b>是如何應用在集裝箱自動<b class='flag-5'>識別</b>的呢?

    大模型預標注和自動化標注在OCR標注場景的應用

    OCR,即光學字符識別,簡單來說就是利用光學設備去捕獲圖像并識別文字,最終將圖片中的文字轉(zhuǎn)換為可編輯和可搜索的文本。在數(shù)字化時代,OCR(光學字符
    的頭像 發(fā)表于 04-15 15:18 ?705次閱讀

    手持終端集裝箱識別系統(tǒng)的圖像識別技術

    在港口、碼頭、物流園區(qū)等場景中,集裝箱的高效管理一直是行業(yè)智能化升級的核心需求?;谙冗M的OCR(光學字符識別)與AI技術,手持終端集裝箱識別系統(tǒng)實現(xiàn)了從大型設備到移動終端的全場景箱號
    的頭像 發(fā)表于 04-03 10:49 ?534次閱讀

    阿普奇視覺控制器AK7在OCR識別場景中的應用

    在實際工業(yè)生產(chǎn)中,OCR(光學字符識別技術的應用逐漸普及,在食品包裝、新能源、汽車制造、3C電子等領域幫助企業(yè)完成產(chǎn)品編碼、生產(chǎn)日期、批號等字符信息自動識別,對于避免因出現(xiàn)瑕疵、錯漏
    的頭像 發(fā)表于 03-20 11:44 ?471次閱讀
    阿普奇視覺控制器AK7在<b class='flag-5'>OCR</b><b class='flag-5'>識別</b>場景中的應用

    漢王科技CES展示創(chuàng)新技術,共觸未來智能交互

    獨特的磁容觸控技術,為用戶帶來了更加流暢、精準的交互體驗。同時,漢王科技還推出了Penstar海外電紙本品牌,展示了其在電子紙技術領域的最新成果。 此外,漢王科技還帶來了數(shù)字簽批、手寫&OCR
    的頭像 發(fā)表于 01-08 15:08 ?919次閱讀

    ElfBoard開源項目|車牌識別項目技術文檔

    車牌識別項目基于百度智能云平臺,旨在利用其強大的OCR服務實現(xiàn)車牌號碼的自動識別。選擇百度智能云的原因是其高效的API接口和穩(wěn)定的服務質(zhì)量,能夠幫助開發(fā)者快速實現(xiàn)車牌識別應用。這個開源
    的頭像 發(fā)表于 12-06 10:30 ?931次閱讀
    ElfBoard開源項目|車牌<b class='flag-5'>識別</b>項目<b class='flag-5'>技術</b>文檔