chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一款工具,借助深度學(xué)習(xí)模型可以一鍵摳去漫畫中的文字

m3Fp_almosthuma ? 來源:機(jī)器之心 ? 2020-01-27 11:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

漫畫摳圖是漢化組翻譯中必不可少而又工作量很大的一項(xiàng)工作,主要內(nèi)容是將漫畫中的文字摳去,以便替換成另一種語(yǔ)言?,F(xiàn)在,這項(xiàng)工作可以自動(dòng)化地完成了,一位韓國(guó)的開發(fā)者開源了一款工具,借助深度學(xué)習(xí)模型可以一鍵摳去漫畫中的文字,連背景圖中的文字都可以被摳去,效果十分驚人。

很多人都喜歡看日本漫畫,不少作品已經(jīng)成為很多人心中的童年回憶。但是對(duì)于漫畫的翻譯人員來說,他們需要去除原有漫畫的對(duì)話框和背景文字,并將其替換為讀者使用的語(yǔ)言。由于一本漫畫可能有數(shù)萬(wàn)個(gè)對(duì)話框和對(duì)話,因此工作量是很大的。

現(xiàn)在,摳圖的工作人員可以基本上解放他們的雙手了。只要你有 TensorFlow,就可以快速實(shí)現(xiàn)一鍵摳圖,將漫畫圖像中的所有文字一鍵去除。

SickZil-Machine,一鍵摳圖

SickZil 是韓文中的作者提供了一個(gè)視頻,用于展示這一工具的效果。

作者同時(shí)提供了自動(dòng)工具摳圖的案例。

對(duì)話框中的文字可以被完全消除。

有時(shí)候會(huì)有些文字消除不干凈的情況,但基本不影響畫面(漫畫右上角標(biāo)題符號(hào))。同時(shí),背景中被去掉文字后,背景畫面可以被自動(dòng)補(bǔ)全,基本不改變畫面效果(畫面右上角背景文字)。

從視頻中可以看出,這一工具非常的方便。只需要選擇待處理的漫畫,然后運(yùn)行工具即可。如果有一些畫面被誤去除,或者有一些去除不干凈的情況下,用戶可以手動(dòng)修改需要被去除的文字。

那么,這一工具背后是什么技術(shù)呢?

技術(shù)

模型架構(gòu)

據(jù)項(xiàng)目作者介紹,這一工具背后使用了兩個(gè)模型,第一個(gè)是 Seg Net,用于檢測(cè)漫畫中的問題。另一個(gè)則是 Compl Net,用于處理漫畫圖像,去除文字并補(bǔ)全缺失的圖像部分。

Seg Net 使用的是 U-NET。這是一種編碼器-解碼器架構(gòu)。編碼器逐漸減少池化層的空間維度,解碼器逐步修復(fù)物體的細(xì)節(jié)和空間維度。

U-Net 的架構(gòu),將輸入圖像逐步池化后進(jìn)行上采樣,從而還原圖像細(xì)節(jié)。

而 Compl Net 使用的是 deepfill v2,這是一個(gè)用于對(duì)任意被 mask 的圖像進(jìn)行修復(fù)的模型,可以適應(yīng)各種 mask 的方式(塊狀遮蓋或線條遮蓋都可以)。deepfill 是 Adobe 等機(jī)構(gòu)提出一系列圖像修復(fù)工具,機(jī)器之心也曾用過 deepfill v1,但是效果似乎沒有論文展示的那么好。

目前 deepfill v2 并沒有官方開源,但 GitHub 上有其他開發(fā)者復(fù)現(xiàn)。

deepfill v2 的模型架構(gòu),可以進(jìn)行圖像修復(fù)。

有了這兩大神器,基本上可以實(shí)現(xiàn)漫畫文字的檢測(cè)識(shí)別和去除文本后的圖像補(bǔ)全。

數(shù)據(jù)集和訓(xùn)練

有了模型還不夠,很多讀者想知道,整個(gè)系統(tǒng)是怎樣訓(xùn)練的。

在 Seg Net 上,作者使用了原始的漫畫圖像和文本內(nèi)容遮蓋數(shù)據(jù),用于覆蓋原始漫畫中所有的文字部分。在 Compl Net 上,模型的輸入為被移除了文字的漫畫圖像。模型使用了 285 個(gè)圖像-遮蓋對(duì)和 31500 張漫畫圖像,其中有將近 12000 張漫畫是有文字的,因此訓(xùn)練的數(shù)據(jù)比較平衡。

安裝和使用

作者沒有透露訓(xùn)練模型的相關(guān)參數(shù),但是提供了開發(fā)者需要準(zhǔn)備的硬件配置。 對(duì)于開發(fā)者而言,運(yùn)行代碼需要準(zhǔn)備 NVIDIA 驅(qū)動(dòng) 410.x,CUDA 10.0,CUDNN >= 7.4.1,TensorFlow 需要大于 1.13 版本。

配置代碼步驟如下:

首先克隆相關(guān)代碼:git clone https://github.com/KUR-creative/SickZil-Machine.git; cd SickZil-Machine

下載 zip 文件,地址:https://github.com/KUR-creative/SickZil-Machine/releases。

解壓并復(fù)制文件:SickZil-Machine-0.1.1-pre0-win64-cpu-eng/resource/cnet 和 SickZil-Machine-0.1.1-pre0-win64-cpu-eng/resource/snet 到文件目錄:SickZil-Machine/resource.

進(jìn)入目錄并安裝:pip install -r requirements.txt

運(yùn)行主程序:cd src; python main.py

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3645

    瀏覽量

    51685
  • 代碼
    +關(guān)注

    關(guān)注

    30

    文章

    4940

    瀏覽量

    73080
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5589

    瀏覽量

    123883

原文標(biāo)題:漫畫漢化組福音:深度學(xué)習(xí)工具一鍵摳圖

文章出處:【微信號(hào):almosthuman2014,微信公眾號(hào):機(jī)器之心】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    借助電商 API,多平臺(tái)客戶評(píng)價(jià)一鍵抓取

    出錯(cuò)。借助電商平臺(tái)的 API(Application Programming Interface),我們可以實(shí)現(xiàn)一鍵抓取多平臺(tái)客戶評(píng)價(jià),高效自動(dòng)化這過程。本文將
    的頭像 發(fā)表于 08-11 14:49 ?568次閱讀

    告別多設(shè)備!揭秘QM系列閃測(cè)儀如何一鍵搞定多元檢測(cè)

    QM 系列一鍵閃測(cè)儀作為方案核心,搭載雙視野雙遠(yuǎn)心鏡頭與 2000 萬(wàn)像素 CMOS 傳感器,測(cè)量精度可達(dá) ±1μm。其內(nèi)置的 AI 深度學(xué)習(xí)系統(tǒng)經(jīng)過海量工業(yè)樣本訓(xùn)練,能一鍵識(shí)別 50
    的頭像 發(fā)表于 08-11 13:43 ?830次閱讀
    告別多設(shè)備!揭秘QM系列閃測(cè)儀如何<b class='flag-5'>一鍵</b>搞定多元檢測(cè)

    HarmonyOS應(yīng)用一鍵置灰指南

    一鍵置灰通常應(yīng)用于如下場(chǎng)景 1. 重大悼念活動(dòng): 在國(guó)家發(fā)生重大災(zāi)難、事故或舉行悼念日等特殊時(shí)期,為了表達(dá)對(duì)逝者的尊重和哀悼,許多 APP 會(huì)將界面置灰。例如,在些地震、空難等災(zāi)難事件發(fā)生后,以及
    的頭像 發(fā)表于 06-27 00:08 ?365次閱讀

    U盤一鍵制作

    在電腦維修中啟動(dòng)盤很重要,靠譜的u盤一鍵啟動(dòng)制作方法
    發(fā)表于 05-06 16:10 ?44次下載

    Profinet邂逅ModbusRTU:印刷廠有網(wǎng)關(guān)“一鍵打通”通信鏈路

    Profinet邂逅ModbusRTU:印刷廠有網(wǎng)關(guān)“一鍵打通”通信鏈路
    的頭像 發(fā)表于 04-08 17:11 ?418次閱讀
    Profinet邂逅ModbusRTU:印刷廠有網(wǎng)關(guān)“<b class='flag-5'>一鍵</b>打通”通信鏈路

    三一挖掘機(jī)一鍵啟動(dòng)開關(guān)易壞的原因及更換注意事項(xiàng)

    關(guān):安裝完成后,先不要急于啟動(dòng)車輛,而是先測(cè)試新開關(guān)是否正常工作,確保切正常后再啟動(dòng)車輛。結(jié)論三一挖掘機(jī)的一鍵啟動(dòng)開關(guān)雖然設(shè)計(jì)精良,但在實(shí)際使用中仍可能出現(xiàn)易壞的問題。更換移動(dòng)管家一鍵啟動(dòng)開關(guān)時(shí),需要注意安全、使用適當(dāng)?shù)?/div>
    發(fā)表于 03-12 09:29

    為什么開關(guān)柜人機(jī)交互裝置集成一鍵順控,可以替代開關(guān)柜操顯裝置

    蜀瑞創(chuàng)新科普:開關(guān)柜人機(jī)交互裝置集成一鍵順控在功能集成與簡(jiǎn)化操作、智能化與遠(yuǎn)程監(jiān)控以及可靠性與安全性等方面均表現(xiàn)出顯著優(yōu)勢(shì)。這些優(yōu)勢(shì)使得集成一鍵順控的人機(jī)交互裝置能夠替代傳統(tǒng)的開關(guān)柜智能操作裝置,成為現(xiàn)代智能電網(wǎng)發(fā)展的重要組成部分。
    的頭像 發(fā)表于 03-07 10:21 ?1065次閱讀
    為什么開關(guān)柜人機(jī)交互裝置集成<b class='flag-5'>一鍵</b>順控,<b class='flag-5'>可以</b>替代開關(guān)柜操顯裝置

    在OpenVINO?工具套件的深度學(xué)習(xí)工作臺(tái)中無法導(dǎo)出INT8模型怎么解決?

    無法在 OpenVINO? 工具套件的深度學(xué)習(xí) (DL) 工作臺(tái)中導(dǎo)出 INT8 模型
    發(fā)表于 03-06 07:54

    兩輪車PKE無鑰匙進(jìn)入PKG一鍵啟動(dòng)系統(tǒng)設(shè)計(jì)

    兩輪車無鑰匙進(jìn)入PKE 一鍵啟動(dòng)系統(tǒng)PKG
    的頭像 發(fā)表于 03-04 10:20 ?810次閱讀
    兩輪車PKE無鑰匙進(jìn)入PKG<b class='flag-5'>一鍵</b>啟動(dòng)系統(tǒng)設(shè)計(jì)

    LoRa無線一鍵報(bào)警安防建設(shè)方案

    險(xiǎn)情,不論是老人,還是小孩都可以一鍵緊急呼救,聯(lián)動(dòng)智能網(wǎng)關(guān)、手機(jī)APP等其他報(bào)警設(shè)備進(jìn)行緊急求救。方案背景:?近年來,醫(yī)患關(guān)系日趨緊張,患方辱罵、傷害、毆打醫(yī)務(wù)人員
    的頭像 發(fā)表于 02-28 14:41 ?1001次閱讀
    LoRa無線<b class='flag-5'>一鍵</b>報(bào)警安防建設(shè)方案

    開關(guān)柜一鍵順控在一鍵停電、一鍵送電中的作用

    蜀瑞創(chuàng)新為大家科普,開關(guān)柜一鍵順控技術(shù)在一鍵停電和一鍵送電中發(fā)揮了快速響應(yīng)、減少人為錯(cuò)誤、提高安全性、簡(jiǎn)化操作流程、降低操作風(fēng)險(xiǎn)、提高送電成功率等綜合優(yōu)勢(shì),對(duì)于提升電力系統(tǒng)的運(yùn)行效率、安全性以及自動(dòng)化水平具有重要意義。
    的頭像 發(fā)表于 02-27 09:13 ?1226次閱讀

    如何保障10KV開關(guān)柜的一鍵順控技術(shù)的安全性?

    通過上述綜合性的安全措施,蜀瑞創(chuàng)新開關(guān)柜一鍵順控方案可以顯著提升10KV開關(guān)柜一鍵順控技術(shù)的安全水平,確保其在實(shí)際應(yīng)用中的穩(wěn)定性和可靠性。同時(shí),隨著技術(shù)的發(fā)展,還需要不斷評(píng)估和改進(jìn)現(xiàn)有的安全措施,以應(yīng)對(duì)新的挑戰(zhàn)。
    的頭像 發(fā)表于 01-16 09:09 ?847次閱讀
    如何保障10KV開關(guān)柜的<b class='flag-5'>一鍵</b>順控技術(shù)的安全性?

    石油行業(yè)中,開關(guān)柜一鍵順控的作用

    蜀瑞創(chuàng)新為大家科普:在石油行業(yè)中,開關(guān)柜的一鍵順控技術(shù)可以顯著提高操作的安全性、效率和可靠性。一鍵順控指的是通過個(gè)簡(jiǎn)單的操作指令(如按下按鈕或點(diǎn)擊屏幕上的圖標(biāo)),自動(dòng)執(zhí)行
    的頭像 發(fā)表于 12-26 09:37 ?946次閱讀
    石油行業(yè)中,開關(guān)柜<b class='flag-5'>一鍵</b>順控的作用

    一款支持USB攝像頭輸入錄像的高清錄播機(jī)

    春源麗影4KR-05高清錄像機(jī),不僅支持HDMI輸入進(jìn)行4K高清錄制,還支持USB高清攝像頭輸入錄制!不僅可以錄制4K高清音視頻,還可以一鍵切為單獨(dú)錄音,可以錄制無損MP3音頻。支持
    的頭像 發(fā)表于 12-24 16:01 ?1737次閱讀
    <b class='flag-5'>一款</b>支持USB攝像頭輸入錄像的高清錄播機(jī)

    谷歌發(fā)布“深度研究”AI工具,利用Gemini模型進(jìn)行網(wǎng)絡(luò)信息檢索

    據(jù)外媒最新報(bào)道,谷歌近期發(fā)布了一款名為“深度研究”的先進(jìn)AI工具。這款工具借助其內(nèi)部的Gemini大型語(yǔ)言
    的頭像 發(fā)表于 12-16 09:35 ?1015次閱讀