在线视频无码中文字幕,特别污的喷水自慰网站

1 月 29 日，百度正式發(fā)布并開(kāi)源新一代文檔解析模型 PaddleOCR-VL-1.5。該模型以?xún)H 0.9B 參數(shù)的輕量架構(gòu)，在全球權(quán)威文檔解析評(píng)測(cè)榜單 OmniDocBench V1.5 中取得全球綜合性能第一成績(jī)，整體精度達(dá)到 94.5%，超過(guò) Gemini-3-Pro、DeepSeek-OCR2、Qwen3-VL-235B-A22B、GPT-5.2 等模型。

值得關(guān)注的是，PaddleOCR-VL-1.5 全球首次實(shí)現(xiàn) OCR 模型的“異形框定位”能力，使機(jī)器能夠精準(zhǔn)識(shí)別傾斜、彎折、拍照畸變等非規(guī)則文檔形態(tài)，首次讓“歪文檔”實(shí)現(xiàn)穩(wěn)定、可規(guī)?；馕?。該技術(shù)解決了傳統(tǒng) OCR 模型在移動(dòng)拍照、掃描件變形、復(fù)雜光照等真實(shí)場(chǎng)景中因文檔形變導(dǎo)致的識(shí)別失敗問(wèn)題，可廣泛應(yīng)用于金融票據(jù)處理、檔案數(shù)字化、政務(wù)文檔流轉(zhuǎn)等場(chǎng)景。

PaddleOCR-VL-1.5 基于文心大模型進(jìn)行開(kāi)發(fā)，在 OmniDocBench V1.5 多個(gè)關(guān)鍵指標(biāo)上取得領(lǐng)先表現(xiàn)。其中，表格結(jié)構(gòu)理解(92.8 分)和閱讀順序預(yù)測(cè)(95.8 分)兩項(xiàng)核心指標(biāo)上均位列第一，分別領(lǐng)先 Gemini-3-Pro、DeepSeek-OCR 等主流模型 2–5 分不等。在文檔閱讀順序預(yù)測(cè)任務(wù)中，其版面邏輯解析錯(cuò)誤率僅為同類(lèi)其他模型約一半。這表明，PaddleOCR-VL-1.5 在復(fù)雜文檔結(jié)構(gòu)還原與版面邏輯理解方面具備更高穩(wěn)定性，在合同、財(cái)報(bào)等高復(fù)雜度業(yè)務(wù)場(chǎng)景中擁有更高可用性。

2025 年 10 月 16 日，百度首次發(fā)布并開(kāi)源 PaddleOCR-VL 模型，在 OmniDocBench V1.5 榜單中取得全球 SOTA 成績(jī)，并連續(xù)五天登頂 HuggingFace 全球模型總趨勢(shì)榜與 ModelScope 全球模型總趨勢(shì)榜雙榜第一。

相比于上代，在功能層面，PaddleOCR-VL-1.5 進(jìn)一步集成印章識(shí)別、文本檢測(cè)與識(shí)別等任務(wù)能力，關(guān)鍵指標(biāo)持續(xù)領(lǐng)跑;同時(shí)針對(duì)特殊場(chǎng)景與多語(yǔ)種識(shí)別進(jìn)行系統(tǒng)優(yōu)化，在生僻字、古籍文獻(xiàn)、多語(yǔ)種表格、下劃線與復(fù)選框等復(fù)雜結(jié)構(gòu)識(shí)別方面顯著提升，并新增對(duì)藏語(yǔ)、孟加拉語(yǔ)等語(yǔ)種的支持。模型還支持跨頁(yè)表格自動(dòng)合并與跨頁(yè)段落標(biāo)題識(shí)別，有效解決長(zhǎng)文檔解析中的結(jié)構(gòu)斷裂問(wèn)題。

近半年來(lái)，全球主流模型廠商密集布局 OCR 領(lǐng)域。1 月 27 日，深度求索發(fā)布新一代 OCR 模型 DeepSeek-OCR-2，引入“因果流查詢(xún)”機(jī)制，并將語(yǔ)言模型融入視覺(jué)編碼，在 OmniDocBench V1.5 中實(shí)現(xiàn) 91.09% 精度。與此同時(shí)，Mistral AI、字節(jié)跳動(dòng)、騰訊等企業(yè)也相繼推出新一代 OCR 模型，行業(yè)競(jìng)爭(zhēng)持續(xù)加劇。

業(yè)內(nèi)分析認(rèn)為，隨著大模型加速進(jìn)入金融、政務(wù)、制造等高復(fù)雜度業(yè)務(wù)流程，文檔解析能力正從“能用”走向“穩(wěn)定可規(guī)?；涞亍?。PaddleOCR-VL-1.5 在精度、復(fù)雜場(chǎng)景適應(yīng)性與工程化能力上的系統(tǒng)突破，有望進(jìn)一步降低產(chǎn)業(yè)應(yīng)用門(mén)檻，推動(dòng) OCR 技術(shù)在真實(shí)生產(chǎn)環(huán)境中的深度落地。

目前，PaddleOCR-VL-1.5 已全面開(kāi)源，開(kāi)發(fā)者可通過(guò) GitHub、Hugging Face 獲取，并在 PaddleOCR 官網(wǎng)進(jìn)行在線體驗(yàn)或通過(guò)百度智能云千帆平臺(tái)調(diào)用 API 接口。

在線使用/API：

https://www.paddleocr.com

開(kāi)源項(xiàng)目地址

https://github.com/PaddlePaddle/PaddleOCR

模型下載地址：

https://huggingface.co/PaddlePaddle/PaddleOCR-VL-1.5

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

百度

百度

+關(guān)注

關(guān)注
9

文章
2389

瀏覽量
95235
開(kāi)源

開(kāi)源

+關(guān)注

關(guān)注
3

文章
4368

瀏覽量
46463
模型

模型

+關(guān)注

關(guān)注
1

文章
3831

瀏覽量
52285

原文標(biāo)題：性能超越DeepSeek-OCR2，百度發(fā)布并開(kāi)源新一代SOTA OCR模型

文章出處：【微信號(hào)：OSC開(kāi)源社區(qū)，微信公眾號(hào)：OSC開(kāi)源社區(qū)】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费

搜索歷史

百度正式發(fā)布并開(kāi)源新一代文檔解析模型PaddleOCR-VL-1.5

評(píng)論