chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

百度正式發(fā)布并開(kāi)源新一代文檔解析模型PaddleOCR-VL-1.5

OSC開(kāi)源社區(qū) ? 來(lái)源:OSC開(kāi)源社區(qū) ? 2026-01-30 10:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1 月 29 日,百度正式發(fā)布并開(kāi)源新一代文檔解析模型 PaddleOCR-VL-1.5。該模型以?xún)H 0.9B 參數(shù)的輕量架構(gòu),在全球權(quán)威文檔解析評(píng)測(cè)榜單 OmniDocBench V1.5 中取得全球綜合性能第一成績(jī),整體精度達(dá)到 94.5%,超過(guò) Gemini-3-Pro、DeepSeek-OCR2、Qwen3-VL-235B-A22B、GPT-5.2 等模型。

值得關(guān)注的是,PaddleOCR-VL-1.5 全球首次實(shí)現(xiàn) OCR 模型的“異形框定位”能力,使機(jī)器能夠精準(zhǔn)識(shí)別傾斜、彎折、拍照畸變等非規(guī)則文檔形態(tài),首次讓“歪文檔”實(shí)現(xiàn)穩(wěn)定、可規(guī)?;馕?。該技術(shù)解決了傳統(tǒng) OCR 模型在移動(dòng)拍照、掃描件變形、復(fù)雜光照等真實(shí)場(chǎng)景中因文檔形變導(dǎo)致的識(shí)別失敗問(wèn)題,可廣泛應(yīng)用于金融票據(jù)處理、檔案數(shù)字化、政務(wù)文檔流轉(zhuǎn)等場(chǎng)景。

PaddleOCR-VL-1.5 基于文心大模型進(jìn)行開(kāi)發(fā),在 OmniDocBench V1.5 多個(gè)關(guān)鍵指標(biāo)上取得領(lǐng)先表現(xiàn)。其中,表格結(jié)構(gòu)理解(92.8 分)和閱讀順序預(yù)測(cè)(95.8 分)兩項(xiàng)核心指標(biāo)上均位列第一,分別領(lǐng)先 Gemini-3-Pro、DeepSeek-OCR 等主流模型 2–5 分不等。在文檔閱讀順序預(yù)測(cè)任務(wù)中,其版面邏輯解析錯(cuò)誤率僅為同類(lèi)其他模型約一半。這表明,PaddleOCR-VL-1.5 在復(fù)雜文檔結(jié)構(gòu)還原與版面邏輯理解方面具備更高穩(wěn)定性,在合同、財(cái)報(bào)等高復(fù)雜度業(yè)務(wù)場(chǎng)景中擁有更高可用性。

2025 年 10 月 16 日,百度首次發(fā)布并開(kāi)源 PaddleOCR-VL 模型,在 OmniDocBench V1.5 榜單中取得全球 SOTA 成績(jī),并連續(xù)五天登頂 HuggingFace 全球模型總趨勢(shì)榜與 ModelScope 全球模型總趨勢(shì)榜雙榜第一。

相比于上代,在功能層面,PaddleOCR-VL-1.5 進(jìn)一步集成印章識(shí)別、文本檢測(cè)與識(shí)別等任務(wù)能力,關(guān)鍵指標(biāo)持續(xù)領(lǐng)跑;同時(shí)針對(duì)特殊場(chǎng)景與多語(yǔ)種識(shí)別進(jìn)行系統(tǒng)優(yōu)化,在生僻字、古籍文獻(xiàn)、多語(yǔ)種表格、下劃線與復(fù)選框等復(fù)雜結(jié)構(gòu)識(shí)別方面顯著提升,并新增對(duì)藏語(yǔ)、孟加拉語(yǔ)等語(yǔ)種的支持。模型還支持跨頁(yè)表格自動(dòng)合并與跨頁(yè)段落標(biāo)題識(shí)別,有效解決長(zhǎng)文檔解析中的結(jié)構(gòu)斷裂問(wèn)題。

近半年來(lái),全球主流模型廠商密集布局 OCR 領(lǐng)域。1 月 27 日,深度求索發(fā)布新一代 OCR 模型 DeepSeek-OCR-2,引入“因果流查詢(xún)”機(jī)制,并將語(yǔ)言模型融入視覺(jué)編碼,在 OmniDocBench V1.5 中實(shí)現(xiàn) 91.09% 精度。與此同時(shí),Mistral AI、字節(jié)跳動(dòng)、騰訊等企業(yè)也相繼推出新一代 OCR 模型,行業(yè)競(jìng)爭(zhēng)持續(xù)加劇。

業(yè)內(nèi)分析認(rèn)為,隨著大模型加速進(jìn)入金融、政務(wù)、制造等高復(fù)雜度業(yè)務(wù)流程,文檔解析能力正從“能用”走向“穩(wěn)定可規(guī)?;涞亍?。PaddleOCR-VL-1.5 在精度、復(fù)雜場(chǎng)景適應(yīng)性與工程化能力上的系統(tǒng)突破,有望進(jìn)一步降低產(chǎn)業(yè)應(yīng)用門(mén)檻,推動(dòng) OCR 技術(shù)在真實(shí)生產(chǎn)環(huán)境中的深度落地。

目前,PaddleOCR-VL-1.5 已全面開(kāi)源,開(kāi)發(fā)者可通過(guò) GitHub、Hugging Face 獲取,并在 PaddleOCR 官網(wǎng)進(jìn)行在線體驗(yàn)或通過(guò)百度智能云千帆平臺(tái)調(diào)用 API 接口。

在線使用/API:

https://www.paddleocr.com

開(kāi)源項(xiàng)目地址

https://github.com/PaddlePaddle/PaddleOCR

模型下載地址:

https://huggingface.co/PaddlePaddle/PaddleOCR-VL-1.5

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 百度
    +關(guān)注

    關(guān)注

    9

    文章

    2389

    瀏覽量

    95235
  • 開(kāi)源
    +關(guān)注

    關(guān)注

    3

    文章

    4368

    瀏覽量

    46463
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3831

    瀏覽量

    52285

原文標(biāo)題:性能超越DeepSeek-OCR2,百度發(fā)布并開(kāi)源新一代SOTA OCR模型

文章出處:【微信號(hào):OSC開(kāi)源社區(qū),微信公眾號(hào):OSC開(kāi)源社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    海光DCU Day0適配百度文心ERNIE-Image文生圖模型

      今天,百度文心大模型團(tuán)隊(duì)發(fā)布ERNIE-Image文生圖模型,海光DCU同步完成Day0適配與深度調(diào)優(yōu)。全球開(kāi)發(fā)者、科研機(jī)構(gòu)和企業(yè)現(xiàn)可免費(fèi)在光合開(kāi)發(fā)者社區(qū)下載
    的頭像 發(fā)表于 04-15 15:47 ?273次閱讀

    瀚博半導(dǎo)體宣布深度參與百度飛槳黑客松生態(tài)活動(dòng)

    近日,瀚博半導(dǎo)體正式宣布深度參與百度飛槳主辦的黑客松生態(tài)活動(dòng)。面向全球開(kāi)發(fā)者開(kāi)放旗下載天系列加速卡開(kāi)發(fā)環(huán)境,支持部署百度文心ERNIE-4.5 系列開(kāi)源模型與PP-OCRv4
    的頭像 發(fā)表于 04-11 09:41 ?695次閱讀

    百度地圖與NIMO眼鏡達(dá)成深度合作

    近日,百度地圖與NIMO眼鏡達(dá)成深度合作,將百度地圖全棧導(dǎo)航能力以輕量化、低功耗、極簡(jiǎn)交互的方式落地智能眼鏡場(chǎng)景,為騎行、步行、日常通勤用戶提供抬頭即見(jiàn)、安全隨行的新一代導(dǎo)航體驗(yàn)。
    的頭像 發(fā)表于 04-09 10:00 ?335次閱讀

    百度文心衍生模型PaddleOCR登頂GitHub Star OCR全球第

    3月30日,百度文心衍生模型PaddleOCR在GitHub上的Star數(shù)突破73.3K,超越谷歌Tesseract OCR,成為全球Star數(shù)最高的OCR項(xiàng)目。
    的頭像 發(fā)表于 03-31 11:40 ?472次閱讀

    智譜AI正式上線開(kāi)源新一代模型GLM-5

    智譜AI正式上線開(kāi)源新一代模型GLM-5。作為面向復(fù)雜系統(tǒng)工程與長(zhǎng)程Agent任務(wù)打造的新一代模型
    的頭像 發(fā)表于 02-12 14:40 ?992次閱讀

    沐曦曦云C500/C550 GPU產(chǎn)品適配PaddleOCR-VL-1.5模型

    PaddleOCR-VL 系列的全新迭代版本PaddleOCR-VL-1.5今天正式上線,沐曦曦云C500/C550 Day 0 適配PaddleOCR-VL-1.5模型,助力
    的頭像 發(fā)表于 01-30 10:19 ?1405次閱讀
    沐曦曦云C500/C550 GPU產(chǎn)品適配<b class='flag-5'>PaddleOCR-VL-1.5</b><b class='flag-5'>模型</b>

    百度文心大模型5.0正式版上線

    今天,在百度文心Moment大會(huì)現(xiàn)場(chǎng),文心大模型5.0正式版上線。
    的頭像 發(fā)表于 01-23 16:48 ?1518次閱讀

    使用 Docker 鍵部署 PaddleOCR-VL: 新手保姆級(jí)教程

    → 拉起 PaddleOCR-VL 服務(wù) → 本機(jī)用 HTTP 調(diào)用 /layout-parsing 接口跑通文檔解析,PaddleOCR-
    的頭像 發(fā)表于 12-18 18:26 ?6851次閱讀
    使用 Docker <b class='flag-5'>一</b>鍵部署 <b class='flag-5'>PaddleOCR-VL</b>: 新手保姆級(jí)教程

    商湯科技正式發(fā)布開(kāi)源全新多模態(tài)模型架構(gòu)NEO

    商湯科技正式發(fā)布開(kāi)源了與南洋理工大學(xué)S-Lab合作研發(fā)的全新多模態(tài)模型架構(gòu) —— NEO,為日日新SenseNova 多模態(tài)模型奠定了
    的頭像 發(fā)表于 12-08 11:19 ?1191次閱讀
    商湯科技正式<b class='flag-5'>發(fā)布</b><b class='flag-5'>并</b><b class='flag-5'>開(kāi)源</b>全新多模態(tài)<b class='flag-5'>模型</b>架構(gòu)NEO

    新一代AtomGit平臺(tái)暨人工智能開(kāi)源社區(qū)發(fā)布

    、數(shù)據(jù)集及異構(gòu)算力資源,共同打造中立、開(kāi)放、公益的新一代開(kāi)源+人工智能”體化基礎(chǔ)設(shè)施平臺(tái)——AtomGit,正式發(fā)布人工智能開(kāi)源社區(qū)。
    的頭像 發(fā)表于 10-30 09:46 ?788次閱讀

    寧暢與與百度文心大模型展開(kāi)深度技術(shù)合作

    近日,百度正式開(kāi)源文心大模型4.5系列模型。作為文心開(kāi)源合作伙伴,寧暢在模型
    的頭像 發(fā)表于 07-07 16:26 ?1038次閱讀

    65%央企大模型落地首選百度智能云

    今天,很榮幸地分享個(gè)好消息,百度智能云已牽手65%的央企,共同推進(jìn)大模型產(chǎn)業(yè)落地。得益于全棧的AI能力,百度聯(lián)合眾多央國(guó)企伙伴,針對(duì)各類(lèi)不同業(yè)務(wù)場(chǎng)景,打造了
    的頭像 發(fā)表于 06-11 15:44 ?1042次閱讀

    百度地圖重磅發(fā)布地圖AI開(kāi)放平臺(tái)

    近日,在WGDC25全球時(shí)空智能大會(huì)上,百度地圖重磅發(fā)布地圖AI開(kāi)放平臺(tái)。百度地圖深耕20年的數(shù)據(jù)能力、引擎能力與AI技術(shù)全面開(kāi)放,向開(kāi)發(fā)者深度開(kāi)放四大核心能力和五大場(chǎng)景解決方案。
    的頭像 發(fā)表于 05-26 11:26 ?2051次閱讀

    百度文心大模型X1 Turbo獲得信通院當(dāng)前大模型最高評(píng)級(jí)證書(shū)

    百度在520居然還領(lǐng)了個(gè)證?是它, 信通院當(dāng)前大模型最高評(píng)級(jí)證書(shū) ! 在5月20日的百度AI Day 上,中國(guó)信通院公布了大模型推理能力評(píng)估結(jié)果——
    的頭像 發(fā)表于 05-21 18:19 ?1421次閱讀
    <b class='flag-5'>百度</b>文心大<b class='flag-5'>模型</b>X1 Turbo獲得信通院當(dāng)前大<b class='flag-5'>模型</b>最高評(píng)級(jí)證書(shū)

    百度發(fā)布2025年Q1財(cái)報(bào) 蘿卜快跑季度全球訂單超140萬(wàn)

    今天5月21日,百度發(fā)布了2025年Q1業(yè)績(jī)。?百度在2025年季度總營(yíng)收達(dá)到325億元,百度核心收入255億元,同比增長(zhǎng)7%。歸屬
    的頭像 發(fā)表于 05-21 18:17 ?2966次閱讀
    <b class='flag-5'>百度</b><b class='flag-5'>發(fā)布</b>2025年Q1財(cái)報(bào) 蘿卜快跑<b class='flag-5'>一</b>季度全球訂單超140萬(wàn)