chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

OCR識(shí)別技術(shù)

新機(jī)器視覺 ? 來源:企通查 ? 作者:企通查 ? 2021-03-12 09:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在爬蟲對(duì)驗(yàn)證碼進(jìn)行破解時(shí),經(jīng)常需要對(duì)圖片中的文字內(nèi)容進(jìn)行識(shí)別,這時(shí)就需要用到OCR技術(shù)了,那么 OCR識(shí)別技術(shù)是如何實(shí)現(xiàn)對(duì)文字內(nèi)容“即拍即得”的呢?

OCR(Optical Character Recognition)即光學(xué)字符識(shí)別技術(shù),實(shí)質(zhì)屬于計(jì)算機(jī)輸入技術(shù)。OCR通過利用光學(xué)技術(shù)與計(jì)算機(jī)技術(shù)對(duì)圖片、紙張、物體等處的文本內(nèi)容進(jìn)行分析識(shí)別,并讀取轉(zhuǎn)換成計(jì)算機(jī)和人類都能理解接受的格式。

OCR主要可以分為手寫體識(shí)別和印刷體識(shí)別。

由于印刷體都是計(jì)算機(jī)自助生成再進(jìn)行輸出,通常較為規(guī)律,因此較手寫體識(shí)別來說要更簡(jiǎn)單。而手寫體由于往往會(huì)帶有個(gè)人特色,每個(gè)人的風(fēng)格不盡相同,由于其千人千面的特性,手寫體識(shí)別也成了OCR界一直想攻克的難關(guān)。當(dāng)然,除了手寫體與印刷體外,OCR也可以根據(jù)識(shí)別內(nèi)容來分類。例如按語言分類,要識(shí)別的內(nèi)容將可能包括漢語、英語、日語、法語等,而如果僅滿足國(guó)人需求,要識(shí)別的內(nèi)容就可能會(huì)包括漢字、英文字母、阿拉伯?dāng)?shù)字、標(biāo)點(diǎn)符號(hào)等。

通常根據(jù)要識(shí)別的內(nèi)容不同,識(shí)別的難度也不同。比如僅識(shí)別阿拉伯?dāng)?shù)字,只需能識(shí)別出0-9,而英文字母則需要識(shí)別52個(gè)字符(僅考慮大小寫),而中文識(shí)別則會(huì)高達(dá)數(shù)千個(gè),且由于漢字的結(jié)構(gòu)偏旁較為復(fù)雜,要將這些字符都準(zhǔn)確識(shí)別出來會(huì)使難度系數(shù)直線上升。一個(gè)典型的OCR技術(shù)處理流程如下圖所示:

圖:來源于網(wǎng)絡(luò)

其中,圖像預(yù)處理通常為能使圖像中的文字更明顯便于識(shí)別,會(huì)對(duì)圖像的成像問題進(jìn)行修正,通常是基于數(shù)字圖像處理和傳統(tǒng)機(jī)器學(xué)習(xí)等方法對(duì)圖像進(jìn)行操作。

常見的圖像預(yù)處理包括幾何變換(透視、翻轉(zhuǎn)、旋轉(zhuǎn)、扭曲、拉直等)、畸變矯正、去模糊、銳化、圖像增強(qiáng)、光線矯正、灰度化、二值化等。其中,在對(duì)付驗(yàn)證碼時(shí)常用的灰度化、二值化處理對(duì)于內(nèi)容較為簡(jiǎn)單的文本信息有增強(qiáng)作用,但對(duì)復(fù)雜背景的內(nèi)容處理效果就會(huì)收效甚微。

文字檢測(cè),顧名思義是對(duì)圖片中存在的文字內(nèi)容進(jìn)行檢測(cè),檢測(cè)內(nèi)容包括文本所在的位置、范圍、布局、數(shù)量等,通常也包括整體版面分析和文字行檢測(cè)等。部分OCR軟件為了保證檢測(cè)范圍的準(zhǔn)確性,還會(huì)套用圖像檢測(cè)的方法,對(duì)圖像中的文本區(qū)域進(jìn)行框選,并像下圖所示將框選與待識(shí)別區(qū)域交由令用戶進(jìn)行校驗(yàn)確認(rèn)。

圖:某OCR軟件識(shí)別界面

文本檢測(cè)完成后,建立在其基礎(chǔ)之上的文本識(shí)別將會(huì)對(duì)選定的文本內(nèi)容進(jìn)行識(shí)別,并將圖像中的字符轉(zhuǎn)化為可供人類和計(jì)算機(jī)識(shí)別的文本信息。文本信息主要需要解決的問題是每個(gè)字符是什么。

對(duì)于識(shí)別后輸出的文本通常需要再次核對(duì)驗(yàn)證以確保其準(zhǔn)確率,即文本校正,通常也被認(rèn)為屬于文字檢測(cè)的環(huán)節(jié)。當(dāng)識(shí)別的內(nèi)容是由詞庫中的詞匯構(gòu)成時(shí)就稱之為有詞典識(shí)別,反之則稱為無詞典識(shí)別。在整個(gè)處理流程過程中,對(duì)識(shí)別準(zhǔn)確率影響最大的步驟就是文本檢測(cè)與文本識(shí)別。相比一般文本,通常對(duì)OCR技術(shù)的評(píng)測(cè)會(huì)從最終識(shí)別率、識(shí)別速度、版面理解正確率、版面還原滿意度4方面來作為依據(jù)。

OCR識(shí)別技術(shù)對(duì)于手寫體識(shí)別目前尚在發(fā)展階段,而對(duì)于印刷體識(shí)別的技術(shù)已經(jīng)發(fā)展的較為純熟。而且,對(duì)于印刷體識(shí)別的應(yīng)用劃分可能遠(yuǎn)比你我想象的更為細(xì)致。例如用于對(duì)人身份進(jìn)行核查驗(yàn)證的證件OCR識(shí)別、用于移動(dòng)支付綁卡的銀行卡OCR識(shí)別、用于存儲(chǔ)管理名片的名片OCR識(shí)別、用于大量文字資料、檔案卷宗的錄入和處理的文檔OCR識(shí)別、用于銀行、金融、電信機(jī)構(gòu)的票據(jù)OCR識(shí)別、用于交通安全的車輛OCR識(shí)別等。

OCR技術(shù)的出現(xiàn)無疑提升了工作效率,也改變了我們的生活。

參考文獻(xiàn):

https://www.sohu.com/a/233167039_205239

https://zhuanlan.zhihu.com/p/45376274

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • OCR
    OCR
    +關(guān)注

    關(guān)注

    0

    文章

    161

    瀏覽量

    16794

原文標(biāo)題:文字識(shí)別界的“拍立得”——OCR識(shí)別技術(shù)

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    端側(cè)OCR文字識(shí)別實(shí)現(xiàn) -- Core Vision Kit ##HarmonyOS SDK AI##

    獲取圖片url,把這個(gè)url和token再發(fā)給百度的ocr接口獲取識(shí)別數(shù)據(jù)……或者圖片轉(zhuǎn)base64以后把這個(gè)base64發(fā)給接口,然而鴻蒙這里,目前我也不知道啥原因(可能是發(fā)送請(qǐng)求的數(shù)據(jù)長(zhǎng)度有限
    發(fā)表于 06-30 18:07

    OCR技術(shù)如何實(shí)現(xiàn)鐵路集裝箱號(hào)的自動(dòng)識(shí)別

    在鐵路物流運(yùn)輸中,集裝箱號(hào)的快速準(zhǔn)確識(shí)別是提升效率的關(guān)鍵環(huán)節(jié)。通過先進(jìn)的OCR(光學(xué)字符識(shí)別技術(shù),結(jié)合計(jì)算機(jī)視覺與深度學(xué)習(xí)方法,可以實(shí)現(xiàn)鐵路集裝箱號(hào)的高效、可靠
    的頭像 發(fā)表于 06-13 10:32 ?199次閱讀

    OCR技術(shù)vs傳統(tǒng)識(shí)別:哪種更適合火車集裝箱識(shí)別

    在鐵路物流領(lǐng)域,集裝箱箱號(hào)識(shí)別是提升運(yùn)輸效率的關(guān)鍵環(huán)節(jié)。隨著計(jì)算機(jī)視覺技術(shù)的發(fā)展,OCR識(shí)別與傳統(tǒng)識(shí)別
    的頭像 發(fā)表于 06-11 10:54 ?216次閱讀

    明治案例 | 150個(gè)/分鐘!電阻【OCR識(shí)別】+【尺寸測(cè)量】一步到位

    真實(shí)案例——看明治傳感如何用一個(gè)視覺傳感器,同時(shí)搞定電阻的尺寸測(cè)量和OCR識(shí)別,讓質(zhì)檢效率翻倍,成本直降!場(chǎng)景需求希望在同一工位完成尺寸測(cè)量與OCR識(shí)別,減少設(shè)備占
    的頭像 發(fā)表于 06-10 07:33 ?231次閱讀
    明治案例 | 150個(gè)/分鐘!電阻【<b class='flag-5'>OCR</b><b class='flag-5'>識(shí)別</b>】+【尺寸測(cè)量】一步到位

    OCR識(shí)別訓(xùn)練完成后給的是空壓縮包,為什么?

    OCR識(shí)別 一共弄了26張圖片,都標(biāo)注好了,點(diǎn)擊開始訓(xùn)練,顯示訓(xùn)練成功了,也將壓縮包發(fā)到郵箱了,下載下來后,壓縮包里面是空的 OCR圖片20幾張圖太少了。麻煩您多添加點(diǎn),參考我們的ocr
    發(fā)表于 05-28 06:46

    大模型預(yù)標(biāo)注和自動(dòng)化標(biāo)注在OCR標(biāo)注場(chǎng)景的應(yīng)用

    OCR,即光學(xué)字符識(shí)別,簡(jiǎn)單來說就是利用光學(xué)設(shè)備去捕獲圖像并識(shí)別文字,最終將圖片中的文字轉(zhuǎn)換為可編輯和可搜索的文本。在數(shù)字化時(shí)代,OCR(光學(xué)字符識(shí)
    的頭像 發(fā)表于 04-15 15:18 ?376次閱讀

    阿普奇視覺控制器AK7在OCR識(shí)別場(chǎng)景中的應(yīng)用

    在實(shí)際工業(yè)生產(chǎn)中,OCR(光學(xué)字符識(shí)別技術(shù)的應(yīng)用逐漸普及,在食品包裝、新能源、汽車制造、3C電子等領(lǐng)域幫助企業(yè)完成產(chǎn)品編碼、生產(chǎn)日期、批號(hào)等字符信息自動(dòng)識(shí)別,對(duì)于避免因出現(xiàn)瑕疵、錯(cuò)漏
    的頭像 發(fā)表于 03-20 11:44 ?229次閱讀
    阿普奇視覺控制器AK7在<b class='flag-5'>OCR</b><b class='flag-5'>識(shí)別</b>場(chǎng)景中的應(yīng)用

    漢王科技CES展示創(chuàng)新技術(shù),共觸未來智能交互

    獨(dú)特的磁容觸控技術(shù),為用戶帶來了更加流暢、精準(zhǔn)的交互體驗(yàn)。同時(shí),漢王科技還推出了Penstar海外電紙本品牌,展示了其在電子紙技術(shù)領(lǐng)域的最新成果。 此外,漢王科技還帶來了數(shù)字簽批、手寫&OCR
    的頭像 發(fā)表于 01-08 15:08 ?657次閱讀

    ElfBoard開源項(xiàng)目|車牌識(shí)別項(xiàng)目技術(shù)文檔

    車牌識(shí)別項(xiàng)目基于百度智能云平臺(tái),旨在利用其強(qiáng)大的OCR服務(wù)實(shí)現(xiàn)車牌號(hào)碼的自動(dòng)識(shí)別。選擇百度智能云的原因是其高效的API接口和穩(wěn)定的服務(wù)質(zhì)量,能夠幫助開發(fā)者快速實(shí)現(xiàn)車牌識(shí)別應(yīng)用。這個(gè)開源
    的頭像 發(fā)表于 12-06 10:30 ?655次閱讀
    ElfBoard開源項(xiàng)目|車牌<b class='flag-5'>識(shí)別</b>項(xiàng)目<b class='flag-5'>技術(shù)</b>文檔

    明治案例 | 【OCR識(shí)別+條碼讀取】一步到位,印刷品質(zhì)的智能守護(hù)者

    在某大型印刷企業(yè)的生產(chǎn)線上,印刷機(jī)需要完成大量的條碼印刷任務(wù)。為了確保條碼的準(zhǔn)確性和可讀性,需要在設(shè)備上安裝傳感器進(jìn)行條碼印刷的讀碼和OCR識(shí)別檢測(cè)。1、傳感器需要準(zhǔn)確識(shí)別條碼中的信息,并將其與預(yù)設(shè)
    的頭像 發(fā)表于 10-22 08:02 ?750次閱讀
    明治案例 | 【<b class='flag-5'>OCR</b><b class='flag-5'>識(shí)別</b>+條碼讀取】一步到位,印刷品質(zhì)的智能守護(hù)者

    光學(xué)字符識(shí)別是什么的一種技術(shù)

    光學(xué)字符識(shí)別(Optical Character Recognition,簡(jiǎn)稱OCR)是一種將文本資料轉(zhuǎn)換為計(jì)算機(jī)可編輯和可搜索的數(shù)據(jù)格式的技術(shù)。這項(xiàng)技術(shù)廣泛應(yīng)用于文檔掃描、數(shù)據(jù)錄入、
    的頭像 發(fā)表于 09-10 15:48 ?1128次閱讀

    光學(xué)識(shí)別技術(shù)的工作原理是什么?

    光學(xué)識(shí)別技術(shù)(Optical Character Recognition,簡(jiǎn)稱OCR)是一種將圖像中的文字信息轉(zhuǎn)換成可編輯和可搜索的文本數(shù)據(jù)的技術(shù)。它廣泛應(yīng)用于文檔掃描、數(shù)據(jù)錄入、自動(dòng)
    的頭像 發(fā)表于 09-10 15:46 ?1386次閱讀

    光學(xué)識(shí)別字符是自動(dòng)識(shí)別技術(shù)

    光學(xué)識(shí)別字符(Optical Character Recognition,簡(jiǎn)稱OCR)是一種自動(dòng)識(shí)別技術(shù),它能夠?qū)⒏鞣N類型文檔(如掃描的紙質(zhì)文檔、PDF文件或數(shù)字相機(jī)拍攝的圖片)中的文
    的頭像 發(fā)表于 09-10 15:43 ?833次閱讀

    明治案例 | PE編織袋【大視野】【OCR識(shí)別

    OCR識(shí)別技術(shù)OCR識(shí)別技術(shù)在工業(yè)生產(chǎn)中扮演著至關(guān)重要的角色。它利用先進(jìn)的圖像處理
    的頭像 發(fā)表于 08-13 08:25 ?777次閱讀
    明治案例 | PE編織袋【大視野】【<b class='flag-5'>OCR</b><b class='flag-5'>識(shí)別</b>】