OCR簡稱Optical Character Recognition,它是指對于紙上的打印的文字字符進行識別,將識別結(jié)果以文本方式存儲在計算機器中。根據(jù)識別的字符類型通常可分為印刷體識別和手寫體識別兩大類。
字符識別原理:通過對特征點形狀的提取,分離器分離字符,然后進行文本的輸出。
我們以手寫字體為例進行講解,識別的步驟如下:
1.打開機器視覺軟件。
2.采集圖像。點擊軟件界面“工具箱”-->“圖像處理”-->“采集圖像”,將采集圖像工具拖至流程欄,如圖一所示。采集圖像的方式有文件、目錄、相機三種方式,我們選擇“文件”下采集,如圖二所示。在電腦的文件夾中,選擇格式為JPG或BMP格式的圖片。
圖一
圖二
3.字符識別工具添加。添加“字符讀取”和“字符集合”工具至流程欄,如圖三所示
字符讀?。河糜谧x取字符文本,需要將標準的字符錄入字符集合中。
字符集合:配合“字符讀取”工具使用,用于存儲字庫模板。
圖三
4.選擇輸入圖像。點擊流程欄的“字符讀取”,選擇輸入的圖像為“Task.1采集圖像”。如圖四所示。
圖四
5.設置檢測區(qū)域。在區(qū)域設置中,選擇矩形方框,拖動到檢測的字符區(qū)域,如圖五所示。
圖五
6.銜接“字符集合”,參數(shù)設置。進行分割參數(shù)設置(閾值、字符極性、字符寬度、字符 高度)和識別參數(shù)設置(最小分數(shù)設置)。如圖六所示。
圖六
通過調(diào)整參數(shù)來達到將字符逐個分割,如圖七所示。
圖七
7.學習字符。如圖八所示,選擇單個學習或全部學習,如圖久所示,將圖像中的字符逐個輸入在學習字符的對話框內(nèi),然后“執(zhí)行”。
圖八
圖九
8.結(jié)果顯示。將“系統(tǒng)工具”下的“數(shù)據(jù)顯示”,將拖至流程欄,點擊“數(shù)據(jù)顯示”,添加數(shù)據(jù)文本為“字符讀取”的文本,點擊確定。
圖十
最終的識別結(jié)果如下圖所示。
以上為手寫字符識別的全部過程,由于手寫字體具有隨機性、自由化程度高,識別起來比印刷字符困難,因此需要大量的學習才能達到快速正確的識別。
總結(jié):
字符識別流程如下圖所示

-
分離器
+關注
關注
1文章
84瀏覽量
16555 -
機器視覺
+關注
關注
163文章
4729瀏覽量
125026
原文標題:機器視覺知識--手寫字體竟然是這樣識別的?
文章出處:【微信號:GKB1508,微信公眾號:工控幫】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
基于矢量特征編碼的手寫字符識別技術
基于流形學習與SVM的手寫字符識別方法
多樣變換的手寫驗證碼自動識別算法
基于機器視覺識別的交通燈控制系統(tǒng)
一種改進的仿射傳播聚類的手寫字符識別
手寫識別系統(tǒng)研究
探索OpenVINO? 手寫字符使用方法
微軟發(fā)布Windows版OneNote應用AI手寫矯正功能
基于LockAI視覺識別模塊:手寫數(shù)字識別

機器視覺知識--手寫字體是怎么識別的?
評論