計(jì)算機(jī)視覺(jué)使計(jì)算機(jī)能夠理解圖像和視頻的內(nèi)容。計(jì)算機(jī)視覺(jué)的目標(biāo)是使人類視覺(jué)系統(tǒng)可以實(shí)現(xiàn)任務(wù)自動(dòng)化。
計(jì)算機(jī)視覺(jué)任務(wù)包括圖像采集、圖像處理和圖像分析。圖像數(shù)據(jù)可以采用不同的形式,例如視頻序列,從多個(gè)角度的不同的攝像機(jī)查看圖像或來(lái)自醫(yī)療掃描儀的多維數(shù)據(jù)。
用于計(jì)算機(jī)視覺(jué)訓(xùn)練的圖像數(shù)據(jù)集
Labelme:麻省理工學(xué)院計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(CSAIL)創(chuàng)建的大型數(shù)據(jù)集,包含187,240張圖像、62,197條帶注釋的圖像和658,992張帶標(biāo)簽的對(duì)象。
樂(lè)高積木:通過(guò)文件夾和使用Blender渲染的計(jì)算機(jī)對(duì)大約16700種樂(lè)高積木進(jìn)行分類的大約12,700張圖像。
ImageNet:用于新算法的實(shí)際圖像數(shù)據(jù)集。根據(jù)WordNet層次結(jié)構(gòu)進(jìn)行組織,其中層次結(jié)構(gòu)的每個(gè)節(jié)點(diǎn)都以成千上萬(wàn)的圖像進(jìn)行描繪。
LSUN:具有許多輔助任務(wù)的場(chǎng)景理解(房間布局估計(jì)、顯著性預(yù)測(cè)等)
MS COCO:COCO是包含200,000多個(gè)標(biāo)記圖像的大規(guī)模對(duì)象檢測(cè)、分割和字幕數(shù)據(jù)集。它可以用于對(duì)象分割,上下文識(shí)別以及許多其他用例。
哥倫比亞大學(xué)圖像庫(kù):COIL100是一個(gè)數(shù)據(jù)集,其中包含360個(gè)旋轉(zhuǎn)角度中每個(gè)角度成像的100個(gè)不同對(duì)象。
視覺(jué)基因組:視覺(jué)基因組是一個(gè)數(shù)據(jù)集和知識(shí)庫(kù),旨在將結(jié)構(gòu)化圖像概念與語(yǔ)言聯(lián)系起來(lái)。該數(shù)據(jù)庫(kù)具有詳細(xì)的視覺(jué)知識(shí)庫(kù),并帶有108,077張圖像的字幕。
Google的開(kāi)放圖像:“Creative Commons”下900萬(wàn)個(gè)URL的圖像集合,這些URL已用6000多個(gè)類別的標(biāo)簽進(jìn)行了注釋。
來(lái)自“打開(kāi)圖像”數(shù)據(jù)集的帶注釋的圖像。
左:Kevin Krejci的《鬼拱門(mén)》。右:J B制造的銀制廚房用具。兩個(gè)圖像均在CC BY 2.0許可下使用。
Youtube-8M:帶有標(biāo)簽的大規(guī)模數(shù)據(jù)集,由數(shù)百萬(wàn)個(gè)YouTube視頻ID組成,帶有超過(guò)3,800多個(gè)視覺(jué)實(shí)體的注釋。
帶標(biāo)簽的野外面孔:13,000個(gè)帶標(biāo)簽的人臉圖像,用于開(kāi)發(fā)涉及面部識(shí)別的應(yīng)用程序。
斯坦福犬類數(shù)據(jù)集:包含20,580張圖像和120種不同的犬種類別,每個(gè)類別約有150張圖像。
地點(diǎn):以場(chǎng)景為中心的數(shù)據(jù)庫(kù),其中包含205個(gè)場(chǎng)景類別和250萬(wàn)個(gè)帶有類別標(biāo)簽的圖像。
CelebFaces:具有超過(guò)200,000張名人圖像的人臉數(shù)據(jù)集,每個(gè)圖像帶有40個(gè)屬性注釋。
花卉:在英國(guó)常見(jiàn)的花朵圖像數(shù)據(jù)集,包含102個(gè)不同類別。每個(gè)花類由40至258張圖像組成,這些圖像具有不同的姿勢(shì)和光線變化。
植物圖像分析:涵蓋超過(guò)一百萬(wàn)張植物圖像的數(shù)據(jù)集??梢詮?1種植物中選擇。
家庭對(duì)象:一個(gè)數(shù)據(jù)集,其中包含來(lái)自家庭的隨機(jī)對(duì)象,大部分來(lái)自廚房、浴室和客廳,這些對(duì)象分為訓(xùn)練和測(cè)試數(shù)據(jù)集。
CIFAR-10:包含60,000張32×32彩色圖像的大型圖像數(shù)據(jù)集,分為10類。數(shù)據(jù)集分為五個(gè)訓(xùn)練批次和一個(gè)測(cè)試批次,每個(gè)批次包含10,000張圖像。
CompCars:包含163種車(chē)型,包含1,716種車(chē)型,每種車(chē)型都標(biāo)有五個(gè)屬性,包括最大速度、排量、門(mén)數(shù)、座位數(shù)和汽車(chē)類型。
室內(nèi)場(chǎng)景識(shí)別:非常具體的數(shù)據(jù)集,非常有用,因?yàn)榇蠖鄶?shù)場(chǎng)景識(shí)別模型在“外部”效果更好。包含67個(gè)室內(nèi)類別,共15620張圖像。
VisualQA:VQA是一個(gè)數(shù)據(jù)集,包含有關(guān)265,016張圖像的開(kāi)放式問(wèn)題。這些問(wèn)題需要對(duì)視覺(jué)和語(yǔ)言的理解。對(duì)于每個(gè)圖像,至少有3個(gè)問(wèn)題,每個(gè)問(wèn)題10個(gè)答案。
原文標(biāo)題:機(jī)器學(xué)習(xí)和計(jì)算機(jī)視覺(jué)的前20個(gè)圖像數(shù)據(jù)集
文章出處:【微信公眾號(hào):新機(jī)器視覺(jué)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
責(zé)任編輯:haq
-
機(jī)器視覺(jué)
+關(guān)注
關(guān)注
163文章
4593瀏覽量
122840 -
人工智能
+關(guān)注
關(guān)注
1806文章
48987瀏覽量
249081 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8501瀏覽量
134543
原文標(biāo)題:機(jī)器學(xué)習(xí)和計(jì)算機(jī)視覺(jué)的前20個(gè)圖像數(shù)據(jù)集
文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺(jué)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
工業(yè)相機(jī)圖像采集卡:機(jī)器視覺(jué)的核心樞紐

Arm KleidiCV與OpenCV集成助力移動(dòng)端計(jì)算機(jī)視覺(jué)性能優(yōu)化
【小白入門(mén)必看】一文讀懂深度學(xué)習(xí)計(jì)算機(jī)視覺(jué)技術(shù)及學(xué)習(xí)路線

計(jì)算機(jī)接口位于什么之間
ARMxy嵌入式計(jì)算機(jī)在機(jī)器視覺(jué)中的卓越表現(xiàn)

計(jì)算機(jī)存儲(chǔ)系統(tǒng)的構(gòu)成
圖像采集卡:增強(qiáng)視覺(jué)數(shù)據(jù)采集

計(jì)算機(jī)視覺(jué)有哪些優(yōu)缺點(diǎn)
圖像處理器與計(jì)算機(jī)視覺(jué)有什么關(guān)系和區(qū)別
計(jì)算機(jī)視覺(jué)中的圖像融合

評(píng)論