chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

facebook AI研究院又發(fā)布了一個大規(guī)模的詞匯實例分割數(shù)據(jù)集

nlfO_thejiangme ? 來源:lq ? 2019-10-01 16:26 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

聚焦于關(guān)鍵科學(xué)問題的數(shù)據(jù)不斷促進著目標檢測領(lǐng)域的技術(shù)進步,使得目標檢測的性能從簡單的圖像擴展到了復(fù)雜的場景,從邊框標注拓展到了語義分割掩膜。

近日來自facebook AI研究院的研究人員們又發(fā)布了一個大規(guī)模的詞匯實例分割數(shù)據(jù)集(Large Vocabulary Instance Segmentation,LVIS ),包含了164k圖像,并針對超過1000類物體進行了約200萬個高質(zhì)量的實例分割標注。由于數(shù)據(jù)集中包含自然圖像中的物體分布天然具有長尾屬性,LVIS數(shù)據(jù)集將促進深度學(xué)習(xí)在圖像分割領(lǐng)域的進一步發(fā)展。

目標檢測是計算機視覺領(lǐng)域的重要任務(wù),適用性強、用途廣泛、發(fā)展迅速,近年來在數(shù)據(jù)集、基準算法和檢測能力上都得到了大幅度提升,并衍生出一系列新的能力,包括圖像分割、三維表示和三維目標檢測等內(nèi)容。

目前針對目標檢測算法的嚴格測評只在少量的分類上進行(例如20類/80類),那么在真實環(huán)境中有大規(guī)模類別的物體或者出現(xiàn)了罕見的物體時該如何處理?這就為科學(xué)家們提出了新的問題。

圖像中目標類別的長尾效應(yīng)是不可避免的,標注更多的數(shù)據(jù)集雖然可以有效地發(fā)現(xiàn)先前未見或罕見的類別,但有效地從小樣本中學(xué)習(xí)至今還是機器學(xué)習(xí)與計算機視覺領(lǐng)域一個重要的開放問題,也使得這一領(lǐng)域成為科學(xué)界與工業(yè)界研究最為活躍的領(lǐng)域。但要深入的對這一領(lǐng)域進行研究,一個高質(zhì)量的數(shù)據(jù)集和基準必不可少!

FAIR的研究人員針對這一研究方向設(shè)計并收集了稱為LVIS的針對于大規(guī)模詞匯實例分割的數(shù)據(jù)集,這一數(shù)據(jù)集包含了164k圖像,超過1000類數(shù)據(jù),約兩百萬個標注。

值得一提的是,這個數(shù)據(jù)集的收集流程沒有預(yù)先確定的類別(沒有類別先驗),首先收集圖像然后根據(jù)圖像中目標的自然分布來進行標注。大量的人工標注代替了機器的自動化標注使得圖像中自然存在的長尾分布可以被有效識別。

COCO和ADE20K數(shù)據(jù)集

研究人員設(shè)計了一個有效的眾包標注流程,可以在高質(zhì)量標注的前提下獲取大規(guī)模的數(shù)據(jù)集。對于目標檢測和實例分割來說,標注的質(zhì)量對于算法十分重要。類似COCO這樣相對較粗的標注限制了算法對于mask預(yù)測質(zhì)量的提升。與COCO和ADE20K相比,LVIS數(shù)據(jù)的標注mask具有更大的重疊面積和更好的邊緣連續(xù)性。

在構(gòu)建數(shù)據(jù)集的過程中,研究人員采用了評價優(yōu)先的設(shè)計原則。這意味著研究人員首先確定了對算法性能進行評價的方法,并基于這一方法來進行數(shù)據(jù)集的收集和構(gòu)建,以滿足評測方法的需求。研究人員提出的測評基準使用了類似coco風(fēng)格的的實例分割和AP計算方法。

但針對自然圖像中較為長尾的數(shù)據(jù)集,需要解決兩個不可避免的問題:

1)在類別龐大的情況下,如果某個目標擁有多個標簽,該如何公平的評測檢測器的性能?

2)針對164k圖像超過一千個類別的標注任務(wù),如何設(shè)計合適的標注流程來減少工作量?

解決這些問題的關(guān)鍵在于構(gòu)建聯(lián)合數(shù)據(jù)集:通過多個小數(shù)據(jù)集聯(lián)合構(gòu)建大規(guī)模的完整數(shù)據(jù)集,而每一個子數(shù)據(jù)集則類似于只聚焦于某個單一類別的傳統(tǒng)數(shù)據(jù)集。在標注過程中,每一個小數(shù)據(jù)集將集中標注某一個特定的類別,將圖中某個特定類別的所有目標窮盡(exhaustive )標注。

對于完整的大數(shù)據(jù)集來說,構(gòu)成的子數(shù)據(jù)集間可能會有重疊,單一目標可能會有多個標簽。此外由于在每個小數(shù)據(jù)集中進行了針對一類物體的窮盡標注,在完整的聯(lián)合數(shù)據(jù)集中就無需對所有的類別進行窮盡標注,這樣的方法極大地減小了標注的工作量。

更為關(guān)鍵的是,在測試評價時算法并不知道每張圖片組成的標記類別,它將對所有的標記類別一視同仁地進行處理,這將對聯(lián)合數(shù)據(jù)集內(nèi)的各個數(shù)據(jù)集提供公平的測評。

LVIS數(shù)據(jù)集針對的是實例分割任務(wù),這一任務(wù)的主要目標是在給定分類已知固定類別的情況下,算法可以針對一張事先未見過的圖像進行處理,并輸出圖像中出現(xiàn)的每一個實例及其對應(yīng)的分類和置信度分數(shù)。通過算法生成的一系列輸出,可以計算出掩膜的平均精度mAP。

但在算法的測評中,研究人員將面臨著一系列問題。隨著分類數(shù)目的增加,實例的標簽不可避免的將會出現(xiàn)重疊和混淆:部分視覺概念的重合、父子分類關(guān)系的的界定和同義詞的識別等等。如果沒有有效的方法處理這些問題,測評的方法將會產(chǎn)生很大的不公平性。

例如很多玩具都不是鹿,大多數(shù)鹿都是不是玩具,但是一只玩具鹿同時是玩具也是一只鹿,這時目標檢測算法很有可能得到錯誤的標記。再比如,一輛車的標記是交通工具vehicle,算法如果輸入了car那么就會被判定為錯誤。

這些問題的發(fā)生主要來源于GT標注缺失了一個或者多個描述目標的標簽。如果算法預(yù)測到了某個標簽但是沒有在GT中標注過就會得到錯誤的懲罰。但對于這個新的數(shù)據(jù)集來說,每一個物體的標簽都被窮盡且正確的標注,上面的問題就可以迎刃而解。

數(shù)據(jù)集標注流程

數(shù)據(jù)集的標注流程分為了六個主要的步驟包括目標定點、窮盡標記、實例分割和驗證、窮盡標注驗證、負例標簽等。

目標定點中標注者被要求將圖像中輸入不同類別的實例進行標記,這個階段將迭代進行,使得標注者可以不斷從圖像中發(fā)掘出自然場景下目標的長尾信息。隨后再針對第一階段標記的每一個類別,將進行徹底的實例標記,找出每一類別包含的所有實例。在圖中可以看到標記者又標記出了更多的書。

在第三和第四階段,分別對前面標記的實例進行實例分割標注和驗真,重復(fù)進行直到準確率超過99%通過驗證。第五階段將進行窮盡標注驗證檢測,檢查是否所有的實例都被分割和標注類別,如果有就將缺失標注實例的類別篩選出來進行補充標注。最后一步的負例標簽將用來驗證類別子類的標簽沒有出現(xiàn)在圖像中。更詳細的標注細節(jié)請參看論文的第三部分。

探索數(shù)據(jù)集

下面讓我們來探索一下數(shù)據(jù)集,下圖中可以看到每張圖像里對于某一類圖像都進行了完善地標注,小的、被遮掩的難以辨認的,目標實例都被標注了出來。比如第一行最后一列的車牌標注和第三行最后一列的相機標注,盡管很小但也別明確地畫出掩膜。這些目標對于圖像的抽象和理解十分重要。

下圖中各類實例也別分別標注出來了:

子數(shù)據(jù)集中,每個實例都被窮盡標注。例如對于飛機這個分類,下圖展示了每張圖片中所有的飛機,無論是飛機的一部分還是完整的飛機都被標注了出來。

還有這些誘人的水果,都被一個個挑了出來。就拿菠蘿來說吧,無論是商店里的完整菠蘿還是沙拉里的菠蘿,就連披薩里的菠蘿丁也被標記出來了。

還有更多好玩的的數(shù)據(jù)集和詳細的分類信息,請參看數(shù)據(jù)集網(wǎng)站:

https://www.lvisdataset.org

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1096

    瀏覽量

    42325
  • Facebook
    +關(guān)注

    關(guān)注

    3

    文章

    1432

    瀏覽量

    58889
  • 計算機視覺
    +關(guān)注

    關(guān)注

    9

    文章

    1715

    瀏覽量

    47622
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1236

    瀏覽量

    26187

原文標題:FAIR提出大規(guī)模細粒度詞匯級標記數(shù)據(jù)集LVIS,有效識別長尾分布

文章出處:【微信號:thejiangmen,微信公眾號:將門創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    全球首個最大規(guī)模跨本體視觸覺多模態(tài)數(shù)據(jù)白虎-VTouch發(fā)布

    具身智能走向真實世界規(guī)模化應(yīng)用,離不開可復(fù)現(xiàn)、可擴展、可協(xié)同演進的數(shù)據(jù)基礎(chǔ)設(shè)施。圍繞真實物理交互能力構(gòu)建這核心工程目標,1月26日,國家地方共建人形機器人創(chuàng)新中心聯(lián)合上海緯鈦科技有限公司正式
    的頭像 發(fā)表于 01-29 14:41 ?457次閱讀

    誠邁科技攜手應(yīng)急管理大學(xué)、中鐵十九局共建智慧應(yīng)急科技創(chuàng)新研究院

    1月25日,由誠邁科技、應(yīng)急管理大學(xué)、中鐵十九局共同組建的智慧應(yīng)急科技創(chuàng)新研究院(以下簡稱“研究院”)在應(yīng)急管理大學(xué)南校區(qū)正式啟動。應(yīng)急管理大學(xué)黨委書記趙峰華,中鐵十九局黨委常委、副總經(jīng)理趙琦,誠邁
    的頭像 發(fā)表于 01-27 11:51 ?457次閱讀
    誠邁科技攜手應(yīng)急管理大學(xué)、中鐵十九局共建智慧應(yīng)急科技創(chuàng)新<b class='flag-5'>研究院</b>

    燧原科技榮獲2025年超大規(guī)模智算集群創(chuàng)新應(yīng)用實踐成果

    近日,中國信息通信研究院(以下簡稱“中國信通”)成功召開2025AI云產(chǎn)業(yè)發(fā)展大會。中國通信標準化協(xié)會理事長聞庫、中國信通副院長王志勤出席會議并致辭。中國工程
    的頭像 發(fā)表于 12-29 09:59 ?364次閱讀
    燧原科技榮獲2025年超<b class='flag-5'>大規(guī)模</b>智算集群創(chuàng)新應(yīng)用實踐成果

    纖納光電獲得2025年度浙江省企業(yè)研究院認定

    近日,浙江省經(jīng)濟和信息化廳發(fā)布2025年度擬認定省企業(yè)研究院名單。經(jīng)企業(yè)申報、縣級審查、市級推薦、專家評審等程序,纖納光電建設(shè)的“浙江省纖納新能源鈣鈦礦技術(shù)企業(yè)研究院”成功入選。
    的頭像 發(fā)表于 12-16 17:31 ?1263次閱讀

    廣電計量與長沙三大研究院達成戰(zhàn)略合作

    11月26-27日,廣電計量與長沙北斗產(chǎn)業(yè)安全技術(shù)研究院集團股份有限公司(簡稱“長沙北斗研究院”)、長沙量子測量產(chǎn)業(yè)技術(shù)研究院有限公司(簡稱“長沙量子研究院”)、湖南大學(xué)長沙半導(dǎo)體技術(shù)
    的頭像 發(fā)表于 12-04 14:36 ?510次閱讀

    簡儀科技攜手國科大杭州高等研究院成功舉辦人工智能專題講座

    11月22日下午,簡儀科技在國科大杭州高等研究院成功舉辦了"AI+AI:人工智能輔助數(shù)據(jù)采集編程"專題講座。本次活動由簡儀科技副總經(jīng)理邵暉博士主講,市場和院校生態(tài)經(jīng)理吳珂玶共同參與,為高校學(xué)子帶來了
    的頭像 發(fā)表于 11-27 10:09 ?530次閱讀
    簡儀科技攜手國科大杭州高等<b class='flag-5'>研究院</b>成功舉辦人工智能專題講座

    廣電計量攜手南山研究院打造大健康產(chǎn)業(yè)新生態(tài)

    10月19日, “南山研究院南海四周年系列活動”在廣東省南山醫(yī)藥創(chuàng)新研究院(簡稱“南山研究院”)成功舉辦。期間,南山研究院與廣電計量等多家單位聯(lián)合共建的華南醫(yī)學(xué)健康功效循證評價中心正式
    的頭像 發(fā)表于 10-23 17:42 ?1115次閱讀

    華為聯(lián)合中國移動研究院發(fā)布“算力路由AI推理及視聯(lián)網(wǎng)應(yīng)用樣板”

    2025年8月20日;在第九屆未來網(wǎng)絡(luò)發(fā)展大會期間,華為聯(lián)合中國移動研究院發(fā)布“算力路由AI推理及視聯(lián)網(wǎng)應(yīng)用樣板”,標志著算力網(wǎng)絡(luò)在商用探索中邁出關(guān)鍵步。 算力路由作為算力網(wǎng)絡(luò)的重要
    的頭像 發(fā)表于 08-25 19:23 ?1183次閱讀

    京東方首個材料研究院項目開工

    2025年8月20日,BOE(京東方)材料研究院項目開工儀式在山東省煙臺市黃渤海新區(qū)八角片區(qū)成功舉辦。
    的頭像 發(fā)表于 08-22 09:12 ?1279次閱讀

    AI Cube如何導(dǎo)入數(shù)據(jù)?

    我從在線平臺標注完并且下載數(shù)據(jù),也按照ai cube的要求修改了文件夾名稱,但是導(dǎo)入提示 不知道是什么原因,我該怎么辦? 以下是我修改后的文件夾目錄
    發(fā)表于 08-11 08:12

    今日看點丨亞馬遜上海AI研究院解散;索尼擬出售以色列芯片部門

    ? ? ? 1、 亞馬遜上海AI研究院解散! 據(jù)報道,AWS亞馬遜云科技上海AI研究院的首席應(yīng)用科學(xué)家王敏捷發(fā)朋友圈稱,他們收到通知,AWS亞馬遜云科技上海
    發(fā)表于 07-24 09:42 ?1417次閱讀
    今日看點丨亞馬遜上海<b class='flag-5'>AI</b><b class='flag-5'>研究院</b>解散;索尼擬出售以色列芯片部門

    中國傳感器市場規(guī)模突破4000億!工信部產(chǎn)業(yè)研究院最新數(shù)據(jù)出爐

    ? ? 近期,工信部直屬產(chǎn)業(yè)研究機構(gòu)賽迪研究院發(fā)布最新的中國傳感器產(chǎn)業(yè)市場數(shù)據(jù),較具有參考性。本文僅做相關(guān)核心數(shù)據(jù)分享,報告原文請于賽迪顧
    的頭像 發(fā)表于 06-14 17:37 ?1591次閱讀
    中國傳感器市場<b class='flag-5'>規(guī)模</b>突破4000億!工信部產(chǎn)業(yè)<b class='flag-5'>研究院</b>最新<b class='flag-5'>數(shù)據(jù)</b>出爐

    導(dǎo)遠科技與清華大學(xué)無錫應(yīng)用技術(shù)研究院達成合作

    近日,導(dǎo)遠科技與清華大學(xué)無錫應(yīng)用技術(shù)研究院(以下簡稱:研究院)達成合作。導(dǎo)遠科技將提供高精度定位產(chǎn)品及解決方案,以支持研究院在L4級自動駕駛和人形機器人領(lǐng)域的技術(shù)研發(fā)及轉(zhuǎn)化落地。
    的頭像 發(fā)表于 06-12 16:34 ?1019次閱讀

    IBM如何基于SAP平臺和數(shù)據(jù)推動生成式AI的成功應(yīng)用

    “近日,IBM 商業(yè)價值研究院(IBV)與 SAP 研究洞察中心聯(lián)合開展大規(guī)模調(diào)研,覆蓋全球 1200余位全球企業(yè)高管,其中 200位
    的頭像 發(fā)表于 04-17 10:20 ?988次閱讀

    國家管網(wǎng)集團研究院選購我司HS-TH-3500炭黑含量測試儀

    近期,國家管網(wǎng)集團研究院經(jīng)過多方調(diào)研與嚴格測試評估,最終選定我司的HS-TH-3500炭黑含量測試儀。這選擇絕非偶然,而是基于我司產(chǎn)品卓越的性能。?上海和晟H
    的頭像 發(fā)表于 03-26 09:15 ?707次閱讀
    國家管網(wǎng)集團<b class='flag-5'>研究院</b>選購我司HS-TH-3500炭黑含量測試儀