chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一款工具,借助深度學(xué)習(xí)模型可以一鍵摳去漫畫中的文字

m3Fp_almosthuma ? 來源:機(jī)器之心 ? 2020-01-27 11:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

漫畫摳圖是漢化組翻譯中必不可少而又工作量很大的一項(xiàng)工作,主要內(nèi)容是將漫畫中的文字摳去,以便替換成另一種語言?,F(xiàn)在,這項(xiàng)工作可以自動(dòng)化地完成了,一位韓國(guó)的開發(fā)者開源了一款工具,借助深度學(xué)習(xí)模型可以一鍵摳去漫畫中的文字,連背景圖中的文字都可以被摳去,效果十分驚人。

很多人都喜歡看日本漫畫,不少作品已經(jīng)成為很多人心中的童年回憶。但是對(duì)于漫畫的翻譯人員來說,他們需要去除原有漫畫的對(duì)話框和背景文字,并將其替換為讀者使用的語言。由于一本漫畫可能有數(shù)萬個(gè)對(duì)話框和對(duì)話,因此工作量是很大的。

現(xiàn)在,摳圖的工作人員可以基本上解放他們的雙手了。只要你有 TensorFlow,就可以快速實(shí)現(xiàn)一鍵摳圖,將漫畫圖像中的所有文字一鍵去除。

SickZil-Machine,一鍵摳圖

SickZil 是韓文中的作者提供了一個(gè)視頻,用于展示這一工具的效果。

作者同時(shí)提供了自動(dòng)工具摳圖的案例。

對(duì)話框中的文字可以被完全消除。

有時(shí)候會(huì)有些文字消除不干凈的情況,但基本不影響畫面(漫畫右上角標(biāo)題符號(hào))。同時(shí),背景中被去掉文字后,背景畫面可以被自動(dòng)補(bǔ)全,基本不改變畫面效果(畫面右上角背景文字)。

從視頻中可以看出,這一工具非常的方便。只需要選擇待處理的漫畫,然后運(yùn)行工具即可。如果有一些畫面被誤去除,或者有一些去除不干凈的情況下,用戶可以手動(dòng)修改需要被去除的文字。

那么,這一工具背后是什么技術(shù)呢?

技術(shù)

模型架構(gòu)

據(jù)項(xiàng)目作者介紹,這一工具背后使用了兩個(gè)模型,第一個(gè)是 Seg Net,用于檢測(cè)漫畫中的問題。另一個(gè)則是 Compl Net,用于處理漫畫圖像,去除文字并補(bǔ)全缺失的圖像部分。

Seg Net 使用的是 U-NET。這是一種編碼器-解碼器架構(gòu)。編碼器逐漸減少池化層的空間維度,解碼器逐步修復(fù)物體的細(xì)節(jié)和空間維度。

U-Net 的架構(gòu),將輸入圖像逐步池化后進(jìn)行上采樣,從而還原圖像細(xì)節(jié)。

而 Compl Net 使用的是 deepfill v2,這是一個(gè)用于對(duì)任意被 mask 的圖像進(jìn)行修復(fù)的模型,可以適應(yīng)各種 mask 的方式(塊狀遮蓋或線條遮蓋都可以)。deepfill 是 Adobe 等機(jī)構(gòu)提出一系列圖像修復(fù)工具,機(jī)器之心也曾用過 deepfill v1,但是效果似乎沒有論文展示的那么好。

目前 deepfill v2 并沒有官方開源,但 GitHub 上有其他開發(fā)者復(fù)現(xiàn)。

deepfill v2 的模型架構(gòu),可以進(jìn)行圖像修復(fù)。

有了這兩大神器,基本上可以實(shí)現(xiàn)漫畫文字的檢測(cè)識(shí)別和去除文本后的圖像補(bǔ)全。

數(shù)據(jù)集和訓(xùn)練

有了模型還不夠,很多讀者想知道,整個(gè)系統(tǒng)是怎樣訓(xùn)練的。

在 Seg Net 上,作者使用了原始的漫畫圖像和文本內(nèi)容遮蓋數(shù)據(jù),用于覆蓋原始漫畫中所有的文字部分。在 Compl Net 上,模型的輸入為被移除了文字的漫畫圖像。模型使用了 285 個(gè)圖像-遮蓋對(duì)和 31500 張漫畫圖像,其中有將近 12000 張漫畫是有文字的,因此訓(xùn)練的數(shù)據(jù)比較平衡。

安裝和使用

作者沒有透露訓(xùn)練模型的相關(guān)參數(shù),但是提供了開發(fā)者需要準(zhǔn)備的硬件配置。 對(duì)于開發(fā)者而言,運(yùn)行代碼需要準(zhǔn)備 NVIDIA 驅(qū)動(dòng) 410.x,CUDA 10.0,CUDNN >= 7.4.1,TensorFlow 需要大于 1.13 版本。

配置代碼步驟如下:

首先克隆相關(guān)代碼:git clone https://github.com/KUR-creative/SickZil-Machine.git; cd SickZil-Machine

下載 zip 文件,地址:https://github.com/KUR-creative/SickZil-Machine/releases。

解壓并復(fù)制文件:SickZil-Machine-0.1.1-pre0-win64-cpu-eng/resource/cnet 和 SickZil-Machine-0.1.1-pre0-win64-cpu-eng/resource/snet 到文件目錄:SickZil-Machine/resource.

進(jìn)入目錄并安裝:pip install -r requirements.txt

運(yùn)行主程序:cd src; python main.py

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3609

    瀏覽量

    51420
  • 代碼
    +關(guān)注

    關(guān)注

    30

    文章

    4922

    瀏覽量

    72217
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5586

    瀏覽量

    123631

原文標(biāo)題:漫畫漢化組福音:深度學(xué)習(xí)工具一鍵摳圖

文章出處:【微信號(hào):almosthuman2014,微信公眾號(hào):機(jī)器之心】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    借助電商 API,多平臺(tái)客戶評(píng)價(jià)一鍵抓取

    出錯(cuò)。借助電商平臺(tái)的 API(Application Programming Interface),我們可以實(shí)現(xiàn)一鍵抓取多平臺(tái)客戶評(píng)價(jià),高效自動(dòng)化這過程。本文將
    的頭像 發(fā)表于 08-11 14:49 ?471次閱讀

    告別多設(shè)備!揭秘QM系列閃測(cè)儀如何一鍵搞定多元檢測(cè)

    QM 系列一鍵閃測(cè)儀作為方案核心,搭載雙視野雙遠(yuǎn)心鏡頭與 2000 萬像素 CMOS 傳感器,測(cè)量精度可達(dá) ±1μm。其內(nèi)置的 AI 深度學(xué)習(xí)系統(tǒng)經(jīng)過海量工業(yè)樣本訓(xùn)練,能一鍵識(shí)別 50
    的頭像 發(fā)表于 08-11 13:43 ?742次閱讀
    告別多設(shè)備!揭秘QM系列閃測(cè)儀如何<b class='flag-5'>一鍵</b>搞定多元檢測(cè)

    U盤一鍵制作

    在電腦維修中啟動(dòng)盤很重要,靠譜的u盤一鍵啟動(dòng)制作方法
    發(fā)表于 05-06 16:10 ?44次下載

    三一挖掘機(jī)一鍵啟動(dòng)開關(guān)易壞的原因及更換注意事項(xiàng)

    關(guān):安裝完成后,先不要急于啟動(dòng)車輛,而是先測(cè)試新開關(guān)是否正常工作,確保切正常后再啟動(dòng)車輛。結(jié)論三一挖掘機(jī)的一鍵啟動(dòng)開關(guān)雖然設(shè)計(jì)精良,但在實(shí)際使用中仍可能出現(xiàn)易壞的問題。更換移動(dòng)管家一鍵啟動(dòng)開關(guān)時(shí),需要注意安全、使用適當(dāng)?shù)?/div>
    發(fā)表于 03-12 09:29

    在OpenVINO?工具套件的深度學(xué)習(xí)工作臺(tái)中無法導(dǎo)出INT8模型怎么解決?

    無法在 OpenVINO? 工具套件的深度學(xué)習(xí) (DL) 工作臺(tái)中導(dǎo)出 INT8 模型
    發(fā)表于 03-06 07:54

    LoRa無線一鍵報(bào)警安防建設(shè)方案

    險(xiǎn)情,不論是老人,還是小孩都可以一鍵緊急呼救,聯(lián)動(dòng)智能網(wǎng)關(guān)、手機(jī)APP等其他報(bào)警設(shè)備進(jìn)行緊急求救。方案背景:?近年來,醫(yī)患關(guān)系日趨緊張,患方辱罵、傷害、毆打醫(yī)務(wù)人員
    的頭像 發(fā)表于 02-28 14:41 ?861次閱讀
    LoRa無線<b class='flag-5'>一鍵</b>報(bào)警安防建設(shè)方案

    開關(guān)柜一鍵順控在一鍵停電、一鍵送電中的作用

    蜀瑞創(chuàng)新為大家科普,開關(guān)柜一鍵順控技術(shù)在一鍵停電和一鍵送電中發(fā)揮了快速響應(yīng)、減少人為錯(cuò)誤、提高安全性、簡(jiǎn)化操作流程、降低操作風(fēng)險(xiǎn)、提高送電成功率等綜合優(yōu)勢(shì),對(duì)于提升電力系統(tǒng)的運(yùn)行效率、安全性以及自動(dòng)化水平具有重要意義。
    的頭像 發(fā)表于 02-27 09:13 ?1052次閱讀

    一款支持USB攝像頭輸入錄像的高清錄播機(jī)

    春源麗影4KR-05高清錄像機(jī),不僅支持HDMI輸入進(jìn)行4K高清錄制,還支持USB高清攝像頭輸入錄制!不僅可以錄制4K高清音視頻,還可以一鍵切為單獨(dú)錄音,可以錄制無損MP3音頻。支持
    的頭像 發(fā)表于 12-24 16:01 ?1620次閱讀
    <b class='flag-5'>一款</b>支持USB攝像頭輸入錄像的高清錄播機(jī)

    谷歌發(fā)布“深度研究”AI工具,利用Gemini模型進(jìn)行網(wǎng)絡(luò)信息檢索

    據(jù)外媒最新報(bào)道,谷歌近期發(fā)布了一款名為“深度研究”的先進(jìn)AI工具。這款工具借助其內(nèi)部的Gemini大型語言
    的頭像 發(fā)表于 12-16 09:35 ?927次閱讀

    開關(guān)柜一鍵順控在化工領(lǐng)域的應(yīng)用

    蜀瑞創(chuàng)新為大家分享:在化工生產(chǎn)線中,電氣控制系統(tǒng)是保障生產(chǎn)順利進(jìn)行的關(guān)鍵。一鍵順控技術(shù)可以應(yīng)用于生產(chǎn)線上的電氣控制,實(shí)現(xiàn)設(shè)備的自動(dòng)啟停、順序控制等功能,提高生產(chǎn)線的自動(dòng)化水平和生產(chǎn)效率。通過一鍵順控操作,
    的頭像 發(fā)表于 11-29 10:50 ?785次閱讀

    在中壓開關(guān)柜上使用微機(jī)五防鎖是否可以實(shí)現(xiàn)一鍵順控

    蜀瑞創(chuàng)新為大家科普:雖然微機(jī)五防鎖是實(shí)現(xiàn)“一鍵順控”的重要組成部分之,但它本身并不能單獨(dú)完成整個(gè)過程。需要結(jié)合其他自動(dòng)化控制技術(shù)和設(shè)備,以及合適的軟件平臺(tái)來實(shí)現(xiàn)真正的“一鍵順控”。
    的頭像 發(fā)表于 11-06 11:58 ?1048次閱讀
    在中壓開關(guān)柜上使用微機(jī)五防鎖是否<b class='flag-5'>可以</b>實(shí)現(xiàn)<b class='flag-5'>一鍵</b>順控

    人機(jī)界面在開關(guān)柜一鍵順控中起到什么作用?

    人機(jī)界面在一鍵順控系統(tǒng)中發(fā)揮著操作指令輸入、狀態(tài)顯示與反饋、參數(shù)設(shè)置與配置以及提升操作便利性和安全性等重要作用。它是實(shí)現(xiàn)一鍵順控功能不可或缺的關(guān)鍵組成部分。蜀瑞創(chuàng)新專注智能開關(guān)柜一鍵順控
    的頭像 發(fā)表于 11-05 10:02 ?847次閱讀
    人機(jī)界面在開關(guān)柜<b class='flag-5'>一鍵</b>順控中起到什么作用?

    FPGA加速深度學(xué)習(xí)模型的案例

    FPGA(現(xiàn)場(chǎng)可編程門陣列)加速深度學(xué)習(xí)模型是當(dāng)前硬件加速領(lǐng)域的個(gè)熱門研究方向。以下是些FPGA加速
    的頭像 發(fā)表于 10-25 09:22 ?1526次閱讀

    AI大模型深度學(xué)習(xí)的關(guān)系

    AI大模型深度學(xué)習(xí)之間存在著密不可分的關(guān)系,它們互為促進(jìn),相輔相成。以下是對(duì)兩者關(guān)系的介紹: 深度
    的頭像 發(fā)表于 10-23 15:25 ?3377次閱讀

    10KV開關(guān)柜一鍵順控和110KV變電站一鍵順控哪些地方不同

    蜀瑞創(chuàng)新為大家科普:10KV開關(guān)柜一鍵順控和110KV變電站一鍵順控在多個(gè)方面存在不同,這些差異主要體現(xiàn)在應(yīng)用范圍、功能側(cè)重、控制對(duì)象以及系統(tǒng)復(fù)雜性等方面。
    的頭像 發(fā)表于 10-16 10:29 ?1328次閱讀
    10KV開關(guān)柜<b class='flag-5'>一鍵</b>順控和110KV變電站<b class='flag-5'>一鍵</b>順控哪些地方不同