chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

百度推智能數(shù)據(jù)服務(wù)平臺EasyData,具有高級智能數(shù)據(jù)清洗功能

如意 ? 來源:51cto ? 作者:佚名 ? 2020-09-07 10:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在進(jìn)行AI模型開發(fā)時,數(shù)據(jù)的數(shù)量與質(zhì)量直接影響模型效果。在實地數(shù)據(jù)采集之后,企業(yè)往往需要從大量數(shù)據(jù)中篩選出符合訓(xùn)練要求的相關(guān)數(shù)據(jù),剔除質(zhì)量差或不相關(guān)的數(shù)據(jù),這個步驟被稱為數(shù)據(jù)清洗。

通常來講,在清洗數(shù)據(jù)時主要會清理掉對訓(xùn)練任務(wù)沒有用途的數(shù)據(jù),例如在訓(xùn)練工廠工人佩戴安全帽識別模型時,希望在視頻抽幀后的大量圖片中僅保留有工人出現(xiàn)的圖片進(jìn)行標(biāo)注訓(xùn)練。在這一步驟上,傳統(tǒng)做法是進(jìn)行人工篩選,人力投入較多且容易發(fā)生遺漏;隨著人工智能發(fā)展,目前許多平臺,如百度大腦AI開放平臺,已經(jīng)提供人臉檢測、人體檢測的通用接口,用戶可以先調(diào)用接口處理數(shù)據(jù),篩選出采集到人像的數(shù)據(jù),再進(jìn)入到具體的檢測識別步驟。那么,是否有一個集成了各項數(shù)據(jù)處理能力,盡量減少人工干預(yù),能夠自動完成視頻數(shù)據(jù)采集、抽幀、數(shù)據(jù)清洗、智能標(biāo)注,從而高效提取高質(zhì)量訓(xùn)練數(shù)據(jù)的解決方案呢?

關(guān)注到有越來越多的用戶對數(shù)據(jù)處理有強(qiáng)烈需求,今年4月,百度全新推出智能數(shù)據(jù)服務(wù)平臺EasyData,集數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)標(biāo)注等功能于一身,完成上述數(shù)據(jù)處理工作之后,可以在EasyDL平臺進(jìn)行模型訓(xùn)練、模型部署。

針對數(shù)據(jù)清洗這一具體功能,EasyData目前上線了去相似、去模糊、旋轉(zhuǎn)、裁剪和鏡像這5種基礎(chǔ)的數(shù)據(jù)清洗功能。那么除了常規(guī)能力之外,EasyData還有什么業(yè)內(nèi)獨家的終極秘技?

從應(yīng)用出發(fā),高級清洗功能讓數(shù)據(jù)處理事半功倍

在園區(qū)智能管理等場景下,需要監(jiān)測工廠園區(qū)、林區(qū)中是否有人闖入,或檢查工人是否佩戴安全帽。為了滿足此類場景下的圖片清洗需求,EasyData上線了高級清洗功能,將無人臉、無人體出現(xiàn)的數(shù)據(jù)進(jìn)行過濾。EasyData聯(lián)動百度大腦AI開放平臺提供的前沿技術(shù)能力,用戶僅需在百度智能云上開通相應(yīng)的服務(wù)(人臉檢測和人體檢測都可以免費試用),就可以通過簡單的配置,在EasyData平臺上直接使用這些功能進(jìn)行自動數(shù)據(jù)清洗。

1、過濾無人臉圖片

如果以前沒有用過百度智能云的人臉檢測服務(wù),第一次使用高級清洗的功能會提示“申請免費試用”,點擊鏈接會進(jìn)入百度智能云人臉檢測的頁面,按照提示,開通服務(wù)后,再回到EasyData的頁面就可以正常使用了。

和基礎(chǔ)的數(shù)據(jù)清洗服務(wù)一樣,過濾無人臉圖片也是以數(shù)據(jù)集為單位的。在數(shù)據(jù)清洗頁面選擇過濾無人臉圖片,點擊保存,提交任務(wù)就可以進(jìn)行清洗。如果勾選了“保留標(biāo)簽”,那么不僅會把沒有人臉的圖片過濾,還會將人臉畫框同步至清洗后的數(shù)據(jù)集。

例如下圖,清洗前的數(shù)據(jù)集除了人臉圖片,還有一些風(fēng)景照、車輛等其他物體的照片,人臉過濾會把這些沒有人臉的圖片過濾,保留下來包含人臉的圖片,包括戴口罩、被遮擋的人臉也可以識別出來。

過濾無人體圖片同樣會用到百度智能云的人體檢測能力,在使用之前需要在百度智能云上開通相應(yīng)的服務(wù)。過濾無人體圖片會用到兩個接口,人體檢測和屬性分析(https://ai.baidu.com/tech/body/attr)和人像分割(https://ai.baidu.com/tech/body/seg)。數(shù)據(jù)集模板為圖像分類和物體檢測的數(shù)據(jù)集會調(diào)用人體檢測和屬性分析接口,數(shù)據(jù)集模板為圖像分割的數(shù)據(jù)集會調(diào)用人像分割接口。百度智能云上的人像分割接口返回的是人像圖片對應(yīng)的二值圖片(人像為1,背景為0),在后端會執(zhí)行相應(yīng)的標(biāo)簽轉(zhuǎn)換,返回的二值圖片轉(zhuǎn)換成對應(yīng)的標(biāo)簽。

關(guān)注廣泛需求,提供多種基礎(chǔ)數(shù)據(jù)清洗功能

1、去相似圖片

用攝像頭自動采集圖片的時候,由于長時間在同一個場景下,即使做了抽幀處理,還是會有大量的相似圖片。大量的相似圖片,數(shù)據(jù)價值低,而且占用了大量的存儲空間,而人工篩選,耗時費力,容易出錯。EasyData平臺推出的去相似圖片利用圖片的相似檢索特征,計算圖片的兩兩相關(guān)性,可以自動地判斷相似圖片、保留不相似的圖片,具體操作也十分簡便。

如下圖所示,去相似前的數(shù)據(jù)集里有8張圖片,根據(jù)圖片的相似度,圖片可以分成3類。清洗完成后的數(shù)據(jù)集中有3張圖片,分別是清洗前的3類圖片中的一張。

2、去模糊圖片

相機(jī)抖動、物體快速移動都會造成拍出來的圖片不清晰、產(chǎn)生低質(zhì)圖片。通過人工挑選的方法去除模糊圖片缺乏統(tǒng)一的標(biāo)準(zhǔn),容易漏刪或多刪。利用EasyData的去模糊圖片,可以輕易地去除模糊圖片。

以示例圖片為例,清洗前有5張圖片,畫質(zhì)不一,清洗后保留下來兩張高質(zhì)量的圖片。此外,如果用戶認(rèn)為有部分模糊圖片沒有去除,或者高質(zhì)量的圖片沒有保留下來,可以考慮調(diào)整清晰度的分值,重新清洗。

對于普通清洗,可以在一個清洗任務(wù)中提交多個清洗操作,例如同時勾選去相似、去模糊功能,即可同時去除相似和模糊的圖片。

目前的數(shù)據(jù)清洗服務(wù)所能支持的最大數(shù)據(jù)集大小是5萬張圖片?;贓asyData平臺的大數(shù)據(jù)處理平臺,對于基礎(chǔ)清洗服務(wù),2萬張圖片的數(shù)據(jù)集,僅需1小時可以完成清洗;5萬張圖片的數(shù)據(jù)集,只需2小時即可完成清洗。對于高級清洗服務(wù)來說,清洗效率也可以通過配置QPS靈活調(diào)整清洗效率,更方便快捷。

考慮到智能園區(qū)管理等場景中,有對視頻進(jìn)行截幀、自動上傳的需求,EasyData平臺也免費提供SDK,供用戶進(jìn)行下載,可以將SDK接入業(yè)務(wù)現(xiàn)場的數(shù)據(jù)采集終端,在平臺設(shè)置截幀時間與間隔,自動將原始視頻數(shù)據(jù)截為圖片數(shù)據(jù)并上傳至EasyData平臺進(jìn)行后續(xù)處理。

EasyData是百度大腦推出的業(yè)內(nèi)首個提供軟硬一體、端云協(xié)同的智能數(shù)據(jù)采集與處理平臺,支持圖片、文本、音頻和視頻四類數(shù)據(jù)的處理,其中圖片數(shù)據(jù)支持了采集、清洗、標(biāo)注一站式處理,覆蓋模型開發(fā)中的各類數(shù)據(jù)管理需求。EasyData處理后的數(shù)據(jù)可直接應(yīng)用于EasyDL模型訓(xùn)練,通過EasyDL預(yù)訓(xùn)練模型和自動遷移學(xué)習(xí)機(jī)制,高效開發(fā)AI模型。
責(zé)編AJX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35164

    瀏覽量

    280021
  • 百度
    +關(guān)注

    關(guān)注

    9

    文章

    2335

    瀏覽量

    92240
  • 人臉識別
    +關(guān)注

    關(guān)注

    77

    文章

    4089

    瀏覽量

    84305
  • 數(shù)據(jù)分析
    +關(guān)注

    關(guān)注

    2

    文章

    1473

    瀏覽量

    35043
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    百度地圖重磅發(fā)布地圖AI開放平臺

    近日,在WGDC25全球時空智能大會上,百度地圖重磅發(fā)布地圖AI開放平臺。百度地圖深耕20年的數(shù)據(jù)能力、引擎能力與AI技術(shù)全面開放,向開發(fā)者
    的頭像 發(fā)表于 05-26 11:26 ?580次閱讀

    百度地圖在汽車智能化領(lǐng)域的應(yīng)用實踐

    進(jìn)一步加速,智駕是絕對的競爭焦點。百度地圖基于覆蓋全國的車道級地圖數(shù)據(jù)(簡稱LD),經(jīng)多家頭部車企實踐,在提升智駕安全性和效率上具有顯著價值。百度地圖LD是真正為全民智駕而生!”
    的頭像 發(fā)表于 04-03 15:02 ?1620次閱讀

    百度智能云四款大模型應(yīng)用接入DeepSeek

    近日,百度智能云旗下四款重量級大模型應(yīng)用產(chǎn)品——客悅、曦靈、一見、甄知,正式迎來了全新升級,接入了先進(jìn)的DeepSeek模型。這一重要更新,標(biāo)志著百度智能云在為企業(yè)
    的頭像 發(fā)表于 02-10 18:00 ?822次閱讀

    百度云與阿里云上線DeepSeek模型部署服務(wù)

    和DeepSeek-V3模型已正式入駐其千帆平臺,并推出了極具吸引力的低價方案及限時兩周的免費試用服務(wù)。這一舉措旨在讓更多的用戶能夠體驗到AI技術(shù)的魅力,同時也為百度智能云在AI領(lǐng)域的
    的頭像 發(fā)表于 02-05 15:40 ?872次閱讀

    百度智能云點亮昆侖芯三代萬卡集群

    近日,百度智能云宣布成功點亮昆侖芯三代萬卡集群,這一成就不僅在國內(nèi)尚屬首次,也標(biāo)志著百度在人工智能算力領(lǐng)域取得了重大突破。據(jù)了解,百度
    的頭像 發(fā)表于 02-05 14:58 ?667次閱讀

    安科瑞如何打造基于“APP電表”的能源數(shù)據(jù)服務(wù)平臺

    安科瑞APP電表安裝之后,可通過手機(jī)掃碼便捷地實現(xiàn)產(chǎn)品接入平臺,無需關(guān)注調(diào)試和平臺運作過程,并可自主選擇平臺功能,獲得到相應(yīng)的數(shù)據(jù)服務(wù), 更
    的頭像 發(fā)表于 01-22 13:21 ?431次閱讀
    安科瑞如何打造基于“APP電表”的能源<b class='flag-5'>數(shù)據(jù)服務(wù)</b><b class='flag-5'>平臺</b>

    AI數(shù)據(jù)服務(wù)智能駕駛訓(xùn)練中的應(yīng)用實例

    標(biāo)貝科技深耕AI數(shù)據(jù)服務(wù)多年,在無人駕駛、自動駕駛等智能駕駛領(lǐng)域擁有豐富的合作案例。多次采用點云標(biāo)注以及3D&2D融合等標(biāo)注方式為智能駕駛領(lǐng)域客戶提供環(huán)境感知、決策策劃、車道線標(biāo)注、障礙物監(jiān)測、道路標(biāo)志牌標(biāo)注等標(biāo)注
    的頭像 發(fā)表于 12-24 15:14 ?831次閱讀

    ElfBoard開源項目|百度智能平臺的人臉識別項目

    百度智能平臺的人臉識別項目,旨在利用其強(qiáng)大的人臉識別服務(wù)實現(xiàn)自動人臉識別。選擇百度智能云的原因
    的頭像 發(fā)表于 12-24 10:54 ?1278次閱讀
    ElfBoard開源項目|<b class='flag-5'>百度</b><b class='flag-5'>智能</b>云<b class='flag-5'>平臺</b>的人臉識別項目

    百度文心智能平臺榮登中國互聯(lián)網(wǎng)創(chuàng)新發(fā)展典型案例

    近日,在2024年世界互聯(lián)網(wǎng)大會烏鎮(zhèn)峰會上,備受矚目的“2024年中國互聯(lián)網(wǎng)企業(yè)創(chuàng)新發(fā)展十大典型案例”正式發(fā)布,百度文心智能平臺憑借其卓越表現(xiàn)成功入選。
    的頭像 發(fā)表于 11-22 11:28 ?1051次閱讀

    百度將發(fā)布AI智能眼鏡

    近日,有知情人士透露,百度旗下的人工智能品牌小計劃在即將舉行的百度世界大會上推出一款全新的AI智能眼鏡。這款眼鏡將內(nèi)置先進(jìn)的人工
    的頭像 發(fā)表于 11-11 14:50 ?928次閱讀

    百度智能云榮獲A級工業(yè)互聯(lián)網(wǎng)“雙跨”平臺企業(yè)

    的是,百度智能云在本次評價中表現(xiàn)突出,榮獲A級工業(yè)互聯(lián)網(wǎng)“雙跨”平臺企業(yè)稱號。這不僅是對百度智能云在工業(yè)互聯(lián)網(wǎng)領(lǐng)域技術(shù)實力和創(chuàng)新能力的高度認(rèn)
    的頭像 發(fā)表于 11-11 13:53 ?663次閱讀

    工業(yè)智能網(wǎng)關(guān)快速接入百度天工IOT平臺配置操作

    工業(yè)智能網(wǎng)關(guān)快速接入第三方云平臺的解決方案,快速實現(xiàn)PLC、儀器儀表、工業(yè)機(jī)器人、傳感器、數(shù)控機(jī)床、傳感器等設(shè)備接入IOT云平臺,例如百度云、阿里云、華為云等。工業(yè)
    的頭像 發(fā)表于 10-30 17:20 ?706次閱讀
    工業(yè)<b class='flag-5'>智能</b>網(wǎng)關(guān)快速接入<b class='flag-5'>百度</b>天工IOT<b class='flag-5'>平臺</b>配置操作

    百度智能云發(fā)布千帆大模型平臺3.0

    2024年百度云智大會上,百度智能云震撼發(fā)布千帆大模型平臺3.0,標(biāo)志著其在AI領(lǐng)域又一里程碑式的進(jìn)步。新版平臺不僅實現(xiàn)了全面升級,更交出了
    的頭像 發(fā)表于 09-26 14:51 ?813次閱讀

    百度舸AI計算平臺4.0震撼發(fā)布

    在2024年百度云智大會的璀璨舞臺上,百度智能云重磅推出了舸AI異構(gòu)計算平臺的全新力作——4.0版本。此次升級,標(biāo)志著
    的頭像 發(fā)表于 09-26 14:46 ?894次閱讀

    百度聯(lián)合英偉達(dá)舉辦全球規(guī)模最大智能體大賽

    近日,科技巨頭百度宣布了一項激動人心的合作計劃:將與英偉達(dá)聯(lián)合舉辦“百度搜索·文心智能體創(chuàng)新大賽”。此次大賽聚焦于“智能體應(yīng)用”的創(chuàng)新與發(fā)展,旨在攜手廣大開發(fā)者,在文心
    的頭像 發(fā)表于 09-02 15:43 ?564次閱讀