chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何讓文本識(shí)別更加智能,數(shù)據(jù)堂獲取這些OCR轉(zhuǎn)寫(xiě)數(shù)據(jù)

火花 ? 來(lái)源:大眾新聞 ? 作者:火花 ? 2020-09-17 11:34 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近年來(lái),學(xué)生黨們擁有了一款新的學(xué)習(xí)神器——拍照搜題。當(dāng)遇到不會(huì)做的題目時(shí),只需要對(duì)著題目拍照,手機(jī)中就會(huì)出現(xiàn)這道題目的詳細(xì)解答思路和答案。“拍照搜題”背后的黑科技就是光學(xué)字符識(shí)別技術(shù),即OCR。OCR是指電子設(shè)備,例如掃描儀或相機(jī)檢查紙上打印的字符,通過(guò)檢測(cè)暗、亮的模式確定其形狀,然后用字符識(shí)別的方法將形狀翻譯成計(jì)算機(jī)文字的過(guò)程。

OCR的應(yīng)用領(lǐng)域十分廣泛。最早為我們熟知的“哪里不會(huì)點(diǎn)哪里”的點(diǎn)讀機(jī)就應(yīng)用了OCR。點(diǎn)讀機(jī)的點(diǎn)讀筆中裝有一個(gè)掃描文字的攝像頭,當(dāng)點(diǎn)讀筆接觸到書(shū)本后,便可將文字內(nèi)容識(shí)別和提取。作為常用的一款辦公軟件,掃描全能王可以實(shí)現(xiàn)“圖片轉(zhuǎn)文字”的功能。軟件可以識(shí)別各種文件類(lèi)型中的文字信息,這是非常典型的OCR技術(shù)的應(yīng)用。

目前,文本識(shí)別分為以下幾類(lèi):

· 通用文字識(shí)別:一般是指如PDF等不規(guī)則文檔類(lèi)的識(shí)別。

·卡證識(shí)別:包括身份證、銀行卡、營(yíng)業(yè)執(zhí)照、名片、護(hù)照、港澳通行證、戶口本、駕駛證、行駛證等等。

· 票據(jù)識(shí)別:包括增值稅發(fā)票、定額發(fā)票、火車(chē)票、出租車(chē)票、行程單、保單、銀行單據(jù)等等。

· 其他:如車(chē)牌、車(chē)輛合格證、印章檢測(cè)等等。

隨著分類(lèi)的不斷拓展,OCR技術(shù)的應(yīng)用場(chǎng)景也越來(lái)越廣泛,以下是幾個(gè)應(yīng)用較為成熟的領(lǐng)域:

· 遠(yuǎn)程身份認(rèn)證:結(jié)合OCR和人臉識(shí)別技術(shù),實(shí)現(xiàn)用戶證件信息的自動(dòng)錄入,并完成用戶身份驗(yàn)證。應(yīng)用于金融保險(xiǎn)、社保、O2O等行業(yè),有效控制業(yè)務(wù)風(fēng)險(xiǎn)。

· 內(nèi)容審核與監(jiān)管:自動(dòng)識(shí)別圖片、視頻中的文字內(nèi)容,及時(shí)發(fā)現(xiàn)涉黃、涉暴、政治敏感、惡意廣告等不合規(guī)內(nèi)容,規(guī)避業(yè)務(wù)風(fēng)險(xiǎn),大幅節(jié)約人工審核成本。

· 紙質(zhì)文檔票據(jù)電子化:通過(guò)OCR實(shí)現(xiàn)紙質(zhì)文檔資料、票據(jù)、表格的自動(dòng)識(shí)別和錄入,減少人工錄入成本,提高輸入效率。

針對(duì)上述的場(chǎng)景,基于深度學(xué)習(xí)的技術(shù)而言,訓(xùn)練數(shù)據(jù)的數(shù)量很大程度上影響了技術(shù)效果。數(shù)據(jù)堂作為深耕于AI數(shù)據(jù)領(lǐng)域近10年的人工智能數(shù)據(jù)服務(wù)提供商,一直致力于為全球人工智能企業(yè)提供專(zhuān)業(yè)的數(shù)據(jù)服務(wù)。依托自身的數(shù)據(jù)優(yōu)勢(shì)以及豐富的數(shù)據(jù)處理經(jīng)驗(yàn),數(shù)據(jù)堂推出了系列OCR標(biāo)注及轉(zhuǎn)寫(xiě)數(shù)據(jù),為相關(guān)技術(shù)應(yīng)更廣泛的落地提供助力。

數(shù)據(jù)涵蓋8種語(yǔ)言、多種場(chǎng)景、不同拍攝角度、不同拍攝距離、不同光照條件。在標(biāo)注方面,標(biāo)注行級(jí)文本的四邊形框,行級(jí)文本轉(zhuǎn)寫(xiě)。四邊形框頂點(diǎn)偏差不超過(guò)五個(gè)像素為正確檢測(cè),檢測(cè)框精度不低于95%,文本轉(zhuǎn)寫(xiě)精度不低于95%,該數(shù)據(jù)可用于多國(guó)語(yǔ)言O(shè)CR任務(wù)。

數(shù)據(jù)涵蓋12種語(yǔ)言(6種亞洲語(yǔ)、6種歐洲語(yǔ)),包括商店牌匾、站牌、海報(bào)、車(chē)票、路標(biāo)、漫畫(huà)、井蓋畫(huà)、提示語(yǔ)、警示語(yǔ)、包裝說(shuō)明、菜單、建筑物標(biāo)志等多種自然場(chǎng)景。在標(biāo)注方面,標(biāo)注行級(jí)文本的四邊形框,行級(jí)文本轉(zhuǎn)寫(xiě),四邊形框頂點(diǎn)偏差不超過(guò)五個(gè)像素為正確檢測(cè),檢測(cè)框精度不低于97%,文本轉(zhuǎn)寫(xiě)精度不低于97%。

數(shù)據(jù)包括自然場(chǎng)景圖片2,056張,互聯(lián)網(wǎng)圖像1,103張,文本圖像347張。在標(biāo)注方面,行級(jí)內(nèi)容用行級(jí)四邊形框標(biāo)注、行級(jí)內(nèi)容轉(zhuǎn)寫(xiě);豎列內(nèi)容用豎列四邊形框標(biāo)注、豎列內(nèi)容轉(zhuǎn)寫(xiě)。數(shù)據(jù)可用于多場(chǎng)景下的印地語(yǔ)識(shí)別、印地語(yǔ)拍照翻譯等任務(wù)。

數(shù)據(jù)包括自然場(chǎng)景圖片258張,互聯(lián)網(wǎng)圖像2,553張,文本圖像2,184張。在標(biāo)注方面,行級(jí)內(nèi)容用行級(jí)四邊形框標(biāo)注、行級(jí)內(nèi)容轉(zhuǎn)寫(xiě);豎列內(nèi)容用豎列四邊形框標(biāo)注、豎列內(nèi)容轉(zhuǎn)寫(xiě)。數(shù)據(jù)可用于多種場(chǎng)景下的越南語(yǔ)識(shí)別、越南語(yǔ)拍照翻譯等任務(wù)。

相比物體檢測(cè)識(shí)別,OCR由于包含傾斜文本框、低分辨率文字和文本版面多樣化的情況,因此OCR數(shù)據(jù)標(biāo)注具有特殊性,標(biāo)注成本更高。數(shù)據(jù)堂的數(shù)加加Pro標(biāo)注平臺(tái)支持私有化部署,能夠幫助企業(yè)快速、安全的對(duì)人工智能數(shù)據(jù)進(jìn)行標(biāo)注,為企業(yè)提供更專(zhuān)業(yè)、更安全的數(shù)據(jù)基礎(chǔ)設(shè)施。

fqj

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 智能識(shí)別
    +關(guān)注

    關(guān)注

    0

    文章

    210

    瀏覽量

    18927
  • OCR
    OCR
    +關(guān)注

    關(guān)注

    0

    文章

    169

    瀏覽量

    16994
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    labview怎么讀取UTF-16 LE 文本數(shù)據(jù)

    各位大佬 請(qǐng)問(wèn)labview怎么讀取UTF-16 LE 文本數(shù)據(jù) 直接讀數(shù)據(jù)出來(lái)會(huì)有空格 但是空格無(wú)法刪除,請(qǐng)問(wèn)怎么獲取UTF-16 LE格式數(shù)據(jù)
    發(fā)表于 10-10 11:23

    訊飛實(shí)時(shí)語(yǔ)音轉(zhuǎn)寫(xiě)大模型上線

    從全球協(xié)作,到國(guó)際交流,再到知識(shí)普惠,實(shí)時(shí)語(yǔ)音轉(zhuǎn)寫(xiě)已經(jīng)成為信息傳遞的重要工具。它跨越時(shí)空的交流更順暢,內(nèi)容的獲取更高效。
    的頭像 發(fā)表于 09-26 16:08 ?371次閱讀

    小語(yǔ)種OCR標(biāo)注效率提升10+倍:PaddleOCR+ERNIE 4.5自動(dòng)標(biāo)注實(shí)戰(zhàn)解析

    摘要 :小語(yǔ)種OCR研發(fā)的核心瓶頸在于高質(zhì)量標(biāo)注數(shù)據(jù)的稀缺與高昂成本。本文介紹一種創(chuàng)新的自動(dòng)化標(biāo)注方案,利用 PaddleOCR 進(jìn)行文本檢測(cè)與裁剪,并調(diào)用 ERNIE 4.5 大模型進(jìn)行雙重預(yù)測(cè)
    的頭像 發(fā)表于 08-29 11:26 ?3096次閱讀
    小語(yǔ)種<b class='flag-5'>OCR</b>標(biāo)注效率提升10+倍:PaddleOCR+ERNIE 4.5自動(dòng)標(biāo)注實(shí)戰(zhàn)解析

    如何利用OCR技術(shù)實(shí)現(xiàn)高效集裝箱箱號(hào)識(shí)別

    在現(xiàn)代物流和海關(guān)監(jiān)管領(lǐng)域,快速準(zhǔn)確地識(shí)別集裝箱箱號(hào)是提升通關(guān)效率、降低運(yùn)營(yíng)成本的關(guān)鍵。OCR(光學(xué)字符識(shí)別)技術(shù)的應(yīng)用,為這一需求提供了智能化解決方案。通過(guò)結(jié)合高清成像設(shè)備和先進(jìn)的算法
    的頭像 發(fā)表于 08-12 10:48 ?396次閱讀
    如何利用<b class='flag-5'>OCR</b>技術(shù)實(shí)現(xiàn)高效集裝箱箱號(hào)<b class='flag-5'>識(shí)別</b>?

    ocr識(shí)別時(shí)數(shù)據(jù)集上傳壓縮包,上傳成功,但不顯示圖片,圖片數(shù)量仍顯示0,為什么?

    ocr識(shí)別時(shí)數(shù)據(jù)集上傳壓縮包,上傳成功,但不顯示圖片,圖片數(shù)量仍顯示0
    發(fā)表于 07-23 08:11

    端側(cè)OCR文字識(shí)別實(shí)現(xiàn) -- Core Vision Kit ##HarmonyOS SDK AI##

    獲取圖片url,把這個(gè)url和token再發(fā)給百度的ocr接口獲取識(shí)別數(shù)據(jù)……或者圖片轉(zhuǎn)base64以后把這個(gè)base64發(fā)給接口,然而鴻蒙這里,目前我也不知道啥原因(可能是發(fā)送請(qǐng)求的
    發(fā)表于 06-30 18:07

    明治案例 | 150個(gè)/分鐘!電阻【OCR識(shí)別】+【尺寸測(cè)量】一步到位

    真實(shí)案例——看明治傳感如何用一個(gè)視覺(jué)傳感器,同時(shí)搞定電阻的尺寸測(cè)量和OCR識(shí)別質(zhì)檢效率翻倍,成本直降!場(chǎng)景需求希望在同一工位完成尺寸測(cè)量與OCR
    的頭像 發(fā)表于 06-10 07:33 ?449次閱讀
    明治案例 | 150個(gè)/分鐘!電阻【<b class='flag-5'>OCR</b><b class='flag-5'>識(shí)別</b>】+【尺寸測(cè)量】一步到位

    OCR識(shí)別訓(xùn)練完成后給的是空壓縮包,為什么?

    OCR識(shí)別 一共弄了26張圖片,都標(biāo)注好了,點(diǎn)擊開(kāi)始訓(xùn)練,顯示訓(xùn)練成功了,也將壓縮包發(fā)到郵箱了,下載下來(lái)后,壓縮包里面是空的 OCR圖片20幾張圖太少了。麻煩您多添加點(diǎn),參考我們的ocr
    發(fā)表于 05-28 06:46

    大模型預(yù)標(biāo)注和自動(dòng)化標(biāo)注在OCR標(biāo)注場(chǎng)景的應(yīng)用

    OCR,即光學(xué)字符識(shí)別,簡(jiǎn)單來(lái)說(shuō)就是利用光學(xué)設(shè)備去捕獲圖像并識(shí)別文字,最終將圖片中的文字轉(zhuǎn)換為可編輯和可搜索的文本。在數(shù)字化時(shí)代,OCR(光
    的頭像 發(fā)表于 04-15 15:18 ?637次閱讀

    把樹(shù)莓派打造成識(shí)別文本的“神器”!

    在許多項(xiàng)目中,RaspberryPi被用作監(jiān)控?cái)z像頭或執(zhí)行機(jī)器學(xué)習(xí)任務(wù)。在這些場(chǎng)景中,圖像中經(jīng)常包含應(yīng)用程序感興趣的文本信息。我們希望提取這些信息并將其轉(zhuǎn)換,以便通過(guò)程序分析文本
    的頭像 發(fā)表于 03-25 09:30 ?659次閱讀
    把樹(shù)莓派打造成<b class='flag-5'>識(shí)別</b><b class='flag-5'>文本</b>的“神器”!

    爬蟲(chóng)數(shù)據(jù)獲取實(shí)戰(zhàn)指南:從入門(mén)到高效采集

    高效又合規(guī)地獲取數(shù)據(jù)?本文將為你拆解完整流程,并推薦一款助力數(shù)據(jù)采集的“黃金搭檔”——IPIDEA全球代理,你的數(shù)據(jù)
    的頭像 發(fā)表于 03-24 14:08 ?1063次閱讀

    如何使用自然語(yǔ)言處理分析文本數(shù)據(jù)

    使用自然語(yǔ)言處理(NLP)分析文本數(shù)據(jù)是一個(gè)復(fù)雜但系統(tǒng)的過(guò)程,涉及多個(gè)步驟和技術(shù)。以下是一個(gè)基本的流程,幫助你理解如何使用NLP來(lái)分析文本數(shù)據(jù): 1. 數(shù)據(jù)收集 收集文本數(shù)據(jù) :從各種
    的頭像 發(fā)表于 12-05 15:27 ?2153次閱讀

    訊維智能語(yǔ)音轉(zhuǎn)寫(xiě)系統(tǒng):開(kāi)啟智能會(huì)議記錄新篇章!

    隨著人工智能技術(shù)的飛速發(fā)展,智能語(yǔ)音轉(zhuǎn)寫(xiě)系統(tǒng)逐漸走進(jìn)我們的日常生活和工作之中,成為提升工作效率、優(yōu)化信息處理的重要工具。訊維智能語(yǔ)音轉(zhuǎn)寫(xiě)系統(tǒng)
    的頭像 發(fā)表于 11-15 15:41 ?1845次閱讀
    訊維<b class='flag-5'>智能</b>語(yǔ)音<b class='flag-5'>轉(zhuǎn)寫(xiě)</b>系統(tǒng):開(kāi)啟<b class='flag-5'>智能</b>會(huì)議記錄新篇章!

    訊維智能語(yǔ)音轉(zhuǎn)寫(xiě)系統(tǒng)核心優(yōu)勢(shì)大解析!

    憑借其高精度識(shí)別、實(shí)時(shí)轉(zhuǎn)寫(xiě)、智能糾錯(cuò)以及多語(yǔ)種支持等核心優(yōu)勢(shì),正在深刻改變著會(huì)議記錄、教育培訓(xùn)、采訪報(bào)道和法律取證等多個(gè)領(lǐng)域的工作方式,成為提升工作效率和優(yōu)化信息處理的重要工具。下面我們來(lái)整理下訊維
    的頭像 發(fā)表于 11-15 15:24 ?1369次閱讀
    訊維<b class='flag-5'>智能</b>語(yǔ)音<b class='flag-5'>轉(zhuǎn)寫(xiě)</b>系統(tǒng)核心優(yōu)勢(shì)大解析!