chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一個在GitHub上一個開源的鑒黃圖像數(shù)據(jù)集

電子工程師 ? 來源:lq ? 2019-02-18 09:53 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

前方高能預(yù)警,非戰(zhàn)斗人士請火速撤離……

今天給大家介紹一個在 GitHub 上一個開源的鑒黃圖像數(shù)據(jù)集,它擁有 158萬的數(shù)據(jù)量,叫做 NSFW data source URLs,目前該項目已收獲 918 star 了。

項目地址:

https://github.com/EBazarov/nsfw_data_source_urls

在 raw_data 文件夾里,可以找到不同的 .txt 格式的文檔,每個文檔都含有一組 URL,以下是關(guān)于該數(shù)據(jù)集的一些統(tǒng)計信息:

159個 不同的類別

158.9331 萬個 URL

下載并清洗后大約有 500GB,或者說有 130 萬張 NSFW 圖像

以下為項目中圖片截圖示例:

注意事項:

1. 建議下載后清洗下數(shù)據(jù)集,例如:

刪除重復(fù)圖片

移動被禁止/刪除掉的圖片(它們有一個特殊的圖像占位符)

找出損壞的數(shù)據(jù)并將其刪除

2. 注意噪聲,一些資源提供了 NSFW 和中性圖像的高度混合數(shù)據(jù)。

3. 該庫還可以幫助檢索 NSFW 圖像,針對中性圖像沒有專用的 URL。

值得一提的是,在該項目之前還有一個類似的開源項目 nsfw_data_scrapper,里面有 22 萬張圖像,同樣也可以用來檢測或訓(xùn)練鑒黃系統(tǒng)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1240

    瀏覽量

    26261
  • GitHub
    +關(guān)注

    關(guān)注

    3

    文章

    489

    瀏覽量

    18758

原文標題:上班時間請勿打開,158萬張鑒黃圖片數(shù)據(jù)集來嘍~

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    三項舉措齊發(fā),開源數(shù)據(jù)生態(tài)建設(shè)按下“加速鍵”

    ? ? ?人工智能的浪潮下,數(shù)據(jù)已成為驅(qū)動產(chǎn)業(yè)創(chuàng)新的核心生產(chǎn)要素,而開源數(shù)據(jù)更是AI研發(fā)、模型訓(xùn)練與場景落地的關(guān)鍵基石。為破解數(shù)據(jù)孤島、標
    的頭像 發(fā)表于 04-15 17:35 ?32次閱讀
    三項舉措齊發(fā),<b class='flag-5'>開源</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>集</b>生態(tài)建設(shè)按下“加速鍵”

    三項舉措齊發(fā)推進人工智開源數(shù)據(jù)生態(tài)建設(shè)

    人工智能的浪潮下,數(shù)據(jù)已成為驅(qū)動產(chǎn)業(yè)創(chuàng)新的核心生產(chǎn)要素,而開源數(shù)據(jù)更是AI研發(fā)、模型訓(xùn)練與場景落地的關(guān)鍵基石。為破解數(shù)據(jù)孤島、標準不
    的頭像 發(fā)表于 03-19 14:06 ?343次閱讀

    2026開放原子園區(qū)行上海站開源數(shù)據(jù)專場圓滿落幕

    3月16日,開放原子園區(qū)行(上海站)開源數(shù)據(jù)專場活動在上海市徐匯區(qū)順利舉辦。本次活動以激活數(shù)據(jù)價值、共筑開源生態(tài)為核心,聚焦人工智能
    的頭像 發(fā)表于 03-18 09:15 ?702次閱讀

    仁勛新年第場演講提了DeepSeek 仁勛:機器人領(lǐng)域迎來ChatGPT時刻

    我們來看看英偉達首席執(zhí)行官仁勛CES 2026上發(fā)表的主題演講。 仁勛新年第場演講提了DeepSeek? 在當?shù)貢r間1月5日仁勛
    的頭像 發(fā)表于 01-06 11:23 ?6163次閱讀

    開放原子開源基金會發(fā)布2025中國高校開源育人案例

    11月21日,2025開放原子開發(fā)者大會開幕式上,開放原子開源基金會正式發(fā)布《2025中國高校開源育人案例》(簡稱“《案例》”),涵蓋
    的頭像 發(fā)表于 11-25 17:30 ?935次閱讀

    創(chuàng)建Library工程

    創(chuàng)建Library工程 首先選中 File -&gt; New -&gt; C/C++ Project,彈出的框中,選擇Static Library
    發(fā)表于 10-20 09:30

    Made with KiCad(138):AnyShake Explorer開源、專業(yè)級的地震監(jiān)測系統(tǒng)

    “? AnyShake Explorer 是開源、專業(yè)級的地震監(jiān)測系統(tǒng)。“黑箱”、價格高昂的系統(tǒng)已成常態(tài)的領(lǐng)域,Explorer
    的頭像 發(fā)表于 08-11 11:19 ?2192次閱讀
    Made with KiCad(138):AnyShake Explorer<b class='flag-5'>一</b>款<b class='flag-5'>開源</b>、專業(yè)級的地震監(jiān)測系統(tǒng)

    開源項目!FourThirdsEye 開源 M4/3 相機模塊

    FourThirdsEye 是開源相機板,專為樹莓派5 (Raspberry Pi 5) 和樹莓派計算模塊4 (Raspberry Pi Compute Module 4) 設(shè)計,采用微型
    發(fā)表于 07-30 13:43

    開放原子開源基金會發(fā)布150余開源項目應(yīng)用案例

    近日,2025開放原子開源生態(tài)大會開幕式上,開放原子開源基金會發(fā)布了150余開源項目應(yīng)用案例,涵蓋中國南方電網(wǎng)、中國移動、京東集團、安貞
    的頭像 發(fā)表于 07-28 17:10 ?1280次閱讀

    Amazing Hand:開源的3D打印仿真機械手項目

    “ ?本文介紹了款名為 Amazing Hand 的開源仿人機械手項目。該項目旨在解決市面上機器人手普遍昂貴且表現(xiàn)力不足的問題,提供低成本(低于200歐元)、輕量化(400克)且
    的頭像 發(fā)表于 07-21 11:22 ?6701次閱讀
    Amazing Hand:<b class='flag-5'>一</b><b class='flag-5'>個</b><b class='flag-5'>開源</b>的3D打印仿真機械手項目

    Made with KiCad(135):Echo - 開源的音樂播放器

    “? Echo 是開源硬件平臺,專為音樂播放器設(shè)計。該項目的目標是開發(fā)款基于開源軟件并采用開源
    的頭像 發(fā)表于 07-16 11:17 ?3354次閱讀
    Made with KiCad(135):Echo - <b class='flag-5'>開源</b>的音樂播放器

    微軟開源GitHub Copilot Chat,AI編程迎來新突破

    GitHub Copilot + vscode的組合我已經(jīng)用了很久,我的代碼開發(fā)效率完全提升了level。幫我代碼提示,代碼不全,注釋理解生成代碼等等,這些我是我經(jīng)常用到的功能。
    的頭像 發(fā)表于 07-02 09:34 ?1417次閱讀
    微軟<b class='flag-5'>開源</b><b class='flag-5'>GitHub</b> Copilot Chat,AI編程迎來新突破

    樹莓派復(fù)古游戲,你會選哪一個?

    復(fù)古游戲與樹莓派單板計算機的組合十分常見。樹莓派項目列表中,幾乎都會包含至少復(fù)古游戲項目。復(fù)古游戲發(fā)行版讓樹莓派上開啟復(fù)古游戲之旅變得輕而易舉,其中Batocera和Retro
    的頭像 發(fā)表于 06-16 16:56 ?1353次閱讀
    樹莓派復(fù)古游戲,你會選哪<b class='flag-5'>一個</b>?

    請問如何在同一個FX3上實現(xiàn)兩GPIF接口?

    我們按照 AN75779 應(yīng)用說明 FX3 上成功實現(xiàn)了自定義圖像傳感器接口。 現(xiàn)在我們想添加另一個 GPIF 接口,這將允許同一個 FX3 設(shè)備從 FPGA 接收
    發(fā)表于 05-13 06:35

    啟用了同一個攝像頭的3vicap通道和3venc通道遇到的疑問求解

    填充新數(shù)據(jù)。以下是兩種優(yōu)化的解決方案: 啟動獨立線程,實時讀取編碼后的數(shù)據(jù),提取所需內(nèi)容并丟棄無用數(shù)據(jù),以確保緩沖區(qū)始終保持最新狀態(tài)。
    發(fā)表于 04-28 06:16