chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

如何在dify中搭建OCR智能體

perfxlab ? 來源:澎峰科技 ? 2025-06-27 14:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

OCR 智能體應用背景

企業(yè)在日常運營中面臨合同、票據(jù)、手寫筆記等多種文檔的處理需求,這些文檔常以圖片或掃描件形式存在,文字提取困難,嚴重制約數(shù)字化管理效率。

為解決上述問題,本文介紹一套簡單高效的解決方案:通過 dify 工作流快速搭建 OCR 智能體,進行文字識別。

先來看一下搭建好的工作流使用流程:用戶上傳待識別的圖片或文檔,工作流會調(diào)用本地部署的 OCR 服務完成識別工作,并將提取的內(nèi)容轉換成 Markdown 文檔。

OCR 智能體搭建流程

step1:本地部署 dify

因為我們要通過工作流的方式使用 OCR 服務,因此需要現(xiàn)在本地完成 dify 的部署,部署流程相對簡單,直接參考 dify 官方文檔(https://github.com/langgenius/dify)即可,推薦使用 docker 進行部署。

step2:在 dify 插件市場中,安裝澎峰科技“OCR 識別服務”插件

本文中介紹的 OCR 工具,我們已發(fā)布到 dify 的插件市場,源代碼可在 github 項目主頁(https://github.com/PerfXLab/dify-plugin-ocr-service)找到,要在 dify 中使用該工具,只需在插件市場中搜索“OCR”并安裝該插件即可:

step3:在 dify 中搭建工作流,并引入 OCR 工具

1.在 dify 中“創(chuàng)建空白應用”,選擇“工作流”

2.對工作流進行編排:

開始節(jié)點中加入“file”字段

“OCR 轉 Markdown 工具”節(jié)點中填入相關信息

其中,“上傳文件”中填入“開始”節(jié)點輸出的內(nèi)容,OCR 接口地址填入本地搭建的 OCR 服務,OCR 服務本地搭建將在下一步驟中介紹- “結束”節(jié)點中填入上一節(jié)點輸出的文件

step4:在本地搭建 OCR 服務

目前 OCR 任務主流實現(xiàn)方案有兩種:使用傳統(tǒng)卷積神經(jīng)網(wǎng)絡模型或多模態(tài)大模型進行處理,前者識別速度快、消耗資源少,而后者識別精度和魯棒性更好,但對算力要求較高。本文介紹一種基于卷積神經(jīng)網(wǎng)絡的方案,利用第三方工具快速在本地運行。

搭建流程:

1.安裝第三方OCR服務:pip install marker-pdf[full]

2.安裝API服務:pip install -U uvicorn fastapi python-multipart

3.啟動OCR服務:marker_server --host 0.0.0.0 --port 8001

完成上述操作后,即可使用 dify 工作流進行 OCR 識別服務。

私有化部署方案:澎峰科技大模型一體機

前述方案采用的輕量化模型,優(yōu)勢在于資源消耗低,在 CPU 環(huán)境下即可流暢運行。然而,對于金融、法律等領域中,部分文檔的識別精準度和版面還原度有更高要求的場景,采用多模態(tài)大模型進行處理會是更優(yōu)選擇。多模態(tài)大模型雖然能帶來更高的識別精度與魯棒性,但其對算力資源的要求也相應更高。

為滿足企業(yè)對高性能、數(shù)據(jù)私有化的需求,澎峰科技推出DeepFusion 系列 AI 一體機,為企業(yè)智能化轉型提供一站式本地化部署解決方案。

該方案深度融合了業(yè)界領先的 DeepSeek、Qwen 等系列大模型,確保企業(yè)數(shù)據(jù)在本地處理,安全無虞,完美適配復雜的辦公自動化、數(shù)據(jù)分析與智能客服等場景。

旗艦性能,應對復雜需求:目前已發(fā)布的 DeepFusion DF110、DF210 一體機,支持部署 DeepSeek 滿血版、Qwen3-235B 等尖端大模型,推理性能強勁,能夠從容應對最復雜的辦公需求。

高性價比,賦能中小企業(yè):我們深知,高效的AI應用同樣可以在中小規(guī)模模型上實現(xiàn)。為此,澎峰科技推出了 DeepFusion DF50 一體機。該機型針對 30B 及以下規(guī)模的高效模型進行了深度推理優(yōu)化,實現(xiàn)了卓越性能與高性價比的平衡,旨在助力更多中小企業(yè)輕松實現(xiàn) AI 轉型。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 智能體
    +關注

    關注

    1

    文章

    382

    瀏覽量

    11515
  • OCR
    OCR
    +關注

    關注

    0

    文章

    170

    瀏覽量

    17036
  • 澎峰科技
    +關注

    關注

    0

    文章

    77

    瀏覽量

    3578

原文標題:使用澎峰科技OCR識別服務插件,在dify中搭建OCR智能體

文章出處:【微信號:perfxlab,微信公眾號:perfxlab】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    智能設計模式和智能框架,你會了么?

    一、新聞 先播放一條最新新聞,通義團隊官宣開源了兩個智能 Alias-Agent 和 Data-Juicer Agent 。 Alias-Agent 提供了RaAct,Planner
    的頭像 發(fā)表于 11-12 16:30 ?1012次閱讀
    多<b class='flag-5'>智能</b><b class='flag-5'>體</b>設計模式和<b class='flag-5'>智能</b><b class='flag-5'>體</b>框架,你會了么?

    手把手教你用聆思CSK6大模型開發(fā)板接入Dify智能進行語音交互

    Dify 是一個開源的LLM(大語言模型)應用開發(fā)平臺,其定位是打造以可視化和低代碼/零代碼為核心的一站式AI應用開發(fā)解決方案。它融合了后端即服務與LLMOps的理念,支持快速構建、部署和管理基于大語言模型的應用程序。
    的頭像 發(fā)表于 11-02 09:36 ?1557次閱讀
    手把手教你用聆思CSK6大模型開發(fā)板接入<b class='flag-5'>Dify</b><b class='flag-5'>智能</b><b class='flag-5'>體</b>進行語音交互

    【EASY EAI Orin Nano開發(fā)板試用體驗】PP-OCRV5文字識別實例搭建與移植

    【EASY EAI Orin Nano開發(fā)板試用體驗】PP-OCRV5文字識別實例搭建與移植 PP-OCRV5是PP-OCR新一代文字識別解決方案, 該方案聚焦于多場景、多文字類型的文字識別。在
    發(fā)表于 08-18 16:57

    從大模型到智能:企業(yè)級智能如何搭建

    企業(yè)智能的構建是一個系統(tǒng)工程,需要從戰(zhàn)略規(guī)劃、技術選型到組織變革的全方位設計。古河云科技將從理論框架出發(fā),系統(tǒng)闡述企業(yè)構建專屬智能的完整路徑。 一、
    的頭像 發(fā)表于 07-21 15:46 ?666次閱讀
    從大模型到<b class='flag-5'>智能</b><b class='flag-5'>體</b>:企業(yè)級<b class='flag-5'>智能</b><b class='flag-5'>體</b>如何<b class='flag-5'>搭建</b>

    軟國際入選中國信通院AI Agent智能產(chǎn)業(yè)圖譜1.0

    ”四大核心維度,全面描繪了產(chǎn)業(yè)鏈關鍵環(huán)節(jié)與代表力量。軟國際憑借在智能平臺和醫(yī)療行業(yè)智能的領先實踐,成功入選首批代表企業(yè)陣營,并成為少數(shù)
    的頭像 發(fā)表于 07-14 14:55 ?1191次閱讀

    深演智能正式發(fā)布 DeepAgent Neo 智能平臺,全力助力企業(yè)決策 AI 落地應用

    妝、奢侈品、保健與醫(yī)藥、汽車等領域的200余位營銷高管及合作伙伴齊聚一堂,圍繞“AI 智能何在企業(yè)落地”的主題進行深度探討,深演智能在此次會議上重磅發(fā)布了旗下最新AI
    的頭像 發(fā)表于 07-01 17:30 ?419次閱讀
    深演<b class='flag-5'>智能</b>正式發(fā)布 DeepAgent Neo <b class='flag-5'>智能</b><b class='flag-5'>體</b>平臺,全力助力企業(yè)決策 AI 落地應用

    端側OCR文字識別實現(xiàn) -- Core Vision Kit ##HarmonyOS SDK AI##

    在開發(fā)的時候,是完全沒有辦法確定到時候?qū)嶋H操作,到底是不是正向的。 另外還有一點要注意的,就是在完成以后,要釋放OCR服務,這一點在textRecognition的文檔里有提及,對于釋放這一步
    發(fā)表于 06-30 18:07

    何在MATLAB構建智能語音助手

    具身智能是一種將智能與物理實體深度融合的人工智能形態(tài),強調(diào)智能行為既依賴智能自身算力,更離不開
    的頭像 發(fā)表于 06-30 14:30 ?2782次閱讀
    如<b class='flag-5'>何在</b>MATLAB<b class='flag-5'>中</b>構建<b class='flag-5'>智能</b>語音助手

    告別“人工智障”:工業(yè)AI智能的進化三定律

    文章主要講述了工業(yè)AI智能在工業(yè)生產(chǎn)中的應用,如智能在焊接、生產(chǎn)過程的自動化,以及如何通過AI智能
    的頭像 發(fā)表于 06-09 10:47 ?483次閱讀
    告別“人工智障”:工業(yè)AI<b class='flag-5'>智能</b><b class='flag-5'>體</b>的進化三定律

    Dify攜手亞馬遜云科技加速全球企業(yè)生成式AI應用規(guī)?;涞?/a>

    簡單易用的AI應用開發(fā)平臺Dify通過深度集成亞馬遜云科技的生成式AI技術與云服務,在保障性能、合規(guī)與全球交付的基礎上,顯著降低企業(yè)在生成式AI應用開發(fā)的技術門檻和部署成本。此外,依托亞馬遜云
    的頭像 發(fā)表于 06-07 16:00 ?649次閱讀

    OCR識別訓練完成后給的是空壓縮包,為什么?

    OCR識別 一共弄了26張圖片,都標注好了,點擊開始訓練,顯示訓練成功了,也將壓縮包發(fā)到郵箱了,下載下來后,壓縮包里面是空的 OCR圖片20幾張圖太少了。麻煩您多添加點,參考我們的ocr識別訓練數(shù)據(jù)集 請問訓練id是?
    發(fā)表于 05-28 06:46

    手把手教你Coze智能搭建,讓智能設備秒變天氣預報小助手

    ?今天,就跟著我們一起,從0到1搭建一個專屬的天氣預報Coze小助手吧!搭建視頻1、登陸Coze官網(wǎng)訪問Coze官網(wǎng)有兩種便捷方式:一是在搜索引擎輸入“扣子”,然
    的頭像 發(fā)表于 04-07 18:06 ?4052次閱讀
    手把手教你Coze<b class='flag-5'>智能</b><b class='flag-5'>體</b><b class='flag-5'>搭建</b>,讓<b class='flag-5'>智能</b>設備秒變天氣預報小助手

    學習智能開發(fā)

    智能是大模型的應用落地,正在學習,這本書太及時了,非常想看看。
    發(fā)表于 03-27 15:48

    阿普奇視覺控制器AK7在OCR識別場景的應用

    影響產(chǎn)品口碑有著重要作用。隨著一些復雜字符組合出現(xiàn),印刷工藝調(diào)整,字符印刷材質(zhì)變更,為了保證字符識別的準確率,行業(yè)內(nèi)采用更多新的機器視覺技術以完成對產(chǎn)品字符高精度、高效率、高穩(wěn)定的實時檢測。 在最新的OCR檢測技術應用
    的頭像 發(fā)表于 03-20 11:44 ?469次閱讀
    阿普奇視覺控制器AK7在<b class='flag-5'>OCR</b>識別場景<b class='flag-5'>中</b>的應用