資料介紹
軟件簡介
由 TensorFlow 2 和 PyTorch 提供支持,任何人都可以無縫訪問光學(xué)字符識別
獲取預(yù)訓(xùn)練模型
使用兩階段方法在 docTR 中實現(xiàn)端到端 OCR:文本檢測(定位單詞),然后文本識別(識別單詞中的所有字符)。因此,可以從可用實現(xiàn)列表中選擇用于文本檢測的架構(gòu)和用于文本識別的架構(gòu)。
from doctr.models import ocr_predictor model = ocr_predictor(det_arch='db_resnet50', reco_arch='crnn_vgg16_bn', pretrained=True)
讀取文件
可以從 PDF 或圖像解釋文檔:
from doctr.io import DocumentFile # PDF pdf_doc = DocumentFile.from_pdf("path/to/your/doc.pdf").as_images() # Image single_img_doc = DocumentFile.from_images("path/to/your/img.jpg") # Webpage webpage_doc = DocumentFile.from_url("https://www.yoursite.com").as_images() # Multiple page images multi_img_doc = DocumentFile.from_images(["path/to/page1.jpg", "path/to/page2.jpg"])
以默認(rèn)的預(yù)訓(xùn)練模型為例:
from doctr.io import DocumentFile from doctr.models import ocr_predictor model = ocr_predictor(pretrained=True) # PDF doc = DocumentFile.from_pdf("path/to/your/doc.pdf").as_images() # Analyze result = model(doc)
安裝
安裝 docTR 需要 Python 3.6(或更高版本)和?pip。
由于使用了?weasyprint,如果沒有運行在 Linux 系統(tǒng)之上,將需要額外的依賴項。
對于 macOS 用戶,可以按如下方式安裝它們:
brew install cairo pango gdk-pixbuf libffi
對于 Windows 用戶,這些依賴項包含在 GTK 中。
最新版本
pip install python-doctr
- 樹洞OCR文字識別跨平臺的OCR小工具
- 基于LSTM的表示學(xué)習(xí)-文本分類模型 18次下載
- 基于主題分布優(yōu)化的模糊文本分類方法 5次下載
- 基于殘差連接的改進(jìn)端到端文本識別網(wǎng)絡(luò)結(jié)構(gòu) 6次下載
- 基于LSTM的流式文檔結(jié)構(gòu)識別方法 7次下載
- 膠囊網(wǎng)絡(luò)在短文本多種意圖識別的應(yīng)用及研究 10次下載
- 基于BP神經(jīng)網(wǎng)絡(luò)分類器的垃圾文本過濾模型 43次下載
- 基于神經(jīng)網(wǎng)絡(luò)的中文文本蘊(yùn)含識別模型 7次下載
- 新型中文旅游文本命名實體識別設(shè)計方案 24次下載
- 使用數(shù)字識別和AI實現(xiàn)OCR的資料合集 20次下載
- OCR文字識別視覺檢測系統(tǒng)應(yīng)用程序免費下載 25次下載
- API-Shop-OCR-營業(yè)執(zhí)照識別API接口Python調(diào)用示例代碼說明 6次下載
- 基于文本分類計數(shù)識別平臺設(shè)計(JAVA實現(xiàn)) 11次下載
- 串口屏技術(shù)文檔—文本限值提示如何修改為英文 14次下載
- 免費版文字識別系統(tǒng) TH-OCR SDK11.0 0次下載
- 光學(xué)識別字符是自動識別技術(shù)嗎 511次閱讀
- 光學(xué)識別的過程包含哪些 450次閱讀
- 基于OpenVINO+OpenCV的OCR處理流程化實現(xiàn) 779次閱讀
- 可以提取圖像文本的5大Python庫 3028次閱讀
- Tesseract的進(jìn)階用法和最佳實踐 1378次閱讀
- OCR實戰(zhàn)教程 1034次閱讀
- 如何將PP-OCRv3英文識別模型部署在Corstone-300虛擬硬件平臺上 2520次閱讀
- OCR算法能較好識別水平排布的常規(guī)文本 1383次閱讀
- 如何使用Python開發(fā)截圖識別OCR的小工具 3565次閱讀
- 如何實現(xiàn)自動識別并提取圖片中的文本內(nèi)容 1.5w次閱讀
- ocr技術(shù)是什么?新能源充電樁應(yīng)用車牌識別ocr技術(shù) 2652次閱讀
- Facebook研究人員提出了一個大規(guī)模圖像文本提取和識別系統(tǒng)——Rosetta 3369次閱讀
- 如何使用EAST文本檢測器在自然場景下檢測文本 1.1w次閱讀
- 服務(wù)器端發(fā)票識別api接口 2686次閱讀
- 基于FPGA異構(gòu)加速的OCR識別技術(shù)解析 3019次閱讀
下載排行
本周
- 1NS1081/NS1081S/NS1081Q USB 3.0閃存數(shù)據(jù)手冊
- 0.40 MB | 4次下載 | 2 積分
- 2光伏并網(wǎng)逆變器原理
- 7.31 MB | 3次下載 | 2 積分
- 3T20電烙鐵原理圖資料
- 0.27 MB | 2次下載 | 免費
- 4PL83081 雙路恒流同步降壓轉(zhuǎn)換器技術(shù)手冊
- 3.34 MB | 1次下載 | 免費
- 5PL88052 4.8V至60V輸入,5A,同步降壓轉(zhuǎn)換器技術(shù)手冊
- 3.36 MB | 1次下載 | 免費
- 6LX8201微孔霧化驅(qū)動芯片電路圖資料
- 0.15 MB | 1次下載 | 免費
- 7PC6200_7V直流電機(jī)驅(qū)動器技術(shù)手冊
- 0.47 MB | 次下載 | 免費
- 8恒溫晶體振蕩器(OCXO)FOC-2D:20.6×20.6mm在通信基站和測試設(shè)備中的應(yīng)用參數(shù)規(guī)格
- 485.75 KB | 次下載 | 免費
本月
- 1如何看懂電子電路圖
- 12.88 MB | 329次下載 | 免費
- 2RK3588數(shù)據(jù)手冊
- 2.24 MB | 14次下載 | 免費
- 3PC5502負(fù)載均流控制電路數(shù)據(jù)手冊
- 1.63 MB | 12次下載 | 免費
- 4STM32F10x參考手冊資料
- 13.64 MB | 12次下載 | 1 積分
- 5OAH0428 V1.0英文規(guī)格書
- 5.86 MB | 8次下載 | 免費
- 6NS1081/NS1081S/NS1081Q USB 3.0閃存數(shù)據(jù)手冊
- 0.40 MB | 4次下載 | 2 積分
- 7PID控制算法學(xué)習(xí)筆記資料
- 3.43 MB | 3次下載 | 2 積分
- 8光伏并網(wǎng)逆變器原理
- 7.31 MB | 3次下載 | 2 積分
總榜
- 1matlab軟件下載入口
- 未知 | 935132次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計
- 1.48MB | 420064次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233089次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費下載
- 340992 | 191415次下載 | 10 積分
- 5十天學(xué)會AVR單片機(jī)與C語言視頻教程 下載
- 158M | 183349次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81599次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費下載
- 0.02 MB | 73818次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65990次下載 | 10 積分
評論