將掃描的PDF轉(zhuǎn)換為可搜索的文檔
快速精確的基于神經(jīng)網(wǎng)絡(luò)的引擎
糾正低質(zhì)量掃描
120多種語言
.Net2.0+、.Net5、標(biāo)準(zhǔn)、核心
將掃描的PDF轉(zhuǎn)換為可搜索的PDF
4行代碼,僅此而已

多虧了簡單的API,您可以使用幾行代碼將掃描的PDF 轉(zhuǎn)換為可搜索的文檔。
順便說一句,不僅僅是PDF。將JPEG、多頁TIFF 或 PNG轉(zhuǎn)換為可搜索的 PDF到您的應(yīng)用程序現(xiàn)在只需幾分鐘,而不是幾小時或幾天。
閱讀 120多種語言的多種圖像格式
Tesseract.NET SDK 可以準(zhǔn)確識別120多種語言的文本,支持多語言文本,并且可以通過訓(xùn)練使用以前未知的語言。支持的標(biāo)準(zhǔn)包括英語、法語、意大利語、德語、西班牙語、阿拉伯語、中文、希伯來語、日語、俄語、泰語等。


正確的低質(zhì)量掃描
例如,去歪斜輸入過濾器會自動旋轉(zhuǎn)圖像,因此它是正確的向上和正交的。如果頁面過于傾斜,則Tesseract的線分割質(zhì)量會顯著降低,這會嚴(yán)重影響OCR 的質(zhì)量。


Patagames OCR SDK 內(nèi)置的用于增強(qiáng)OCR性能的輸入過濾器包括:二值化、對比度和對比度標(biāo)準(zhǔn)化、去偏斜、增強(qiáng)分辨率、腐蝕和擴(kuò)張、膨脹和放氣、反轉(zhuǎn)、移除邊框、旋轉(zhuǎn)、ToGray和白色背景。
為您的.Net 應(yīng)用程序配備OCR 功能的最佳方式
雖然Tesseract 無疑是迄今為止最好的OCR 庫,但Tesseract.NET SDK是為您的應(yīng)用程序配備文本識別功能的最佳方式之一。
Tesseract.Net SDK 結(jié)合了易于部署、卓越的識別精度、快速OCR 和各種輸出選項(包括PDF、HOCR、UNLV和純文本),提供靈活簡單的API 以及許多高級和低級文本識別程序。
多虧了簡單的API,您可以用幾行代碼將給定的圖像轉(zhuǎn)換為可搜索的文本。如果您需要更詳細(xì)地了解文本的組成部分,Tesseract.NETSDK API 提供了許多類來檢索單個字母、單詞、段落甚至字體參數(shù)。
審核編輯 :李倩
-
PDF
+關(guān)注
關(guān)注
1文章
177瀏覽量
36274 -
代碼
+關(guān)注
關(guān)注
30文章
4971瀏覽量
74044 -
應(yīng)用程序
+關(guān)注
關(guān)注
38文章
3344瀏覽量
60295
原文標(biāo)題:Patagames:正方體.NetSDKC# OCR 庫
文章出處:【微信號:哲想軟件,微信公眾號:哲想軟件】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
深入解析 SCANSTA111:增強(qiáng)型掃描橋多分支可尋址 IEEE 1149.1(JTAG)端口芯片
pdf轉(zhuǎn)換成word文檔格式亂了
pdf如何轉(zhuǎn)換成pptx
pdf轉(zhuǎn)換ppt怎么轉(zhuǎn)換
還在用PDF文檔查資料?飛凌嵌入式「產(chǎn)品在線文檔」讓您的開發(fā)效率狂飆
這么地道的ADC資料被我找到了?400頁原創(chuàng)pdf原理到應(yīng)用全覆蓋!
如何通過VCOM將4個CAN FD消息轉(zhuǎn)換為SLCAN?
【HarmonyOS 5】鴻蒙應(yīng)用實(shí)現(xiàn)發(fā)票掃描、文檔掃描輸出PDF圖片或者表格的功能
將掃描的PDF轉(zhuǎn)換為可搜索的PDF
評論