chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

100多萬個(gè)視頻短片數(shù)據(jù)集來啦!

電子工程師 ? 來源:lp ? 2019-03-15 09:52 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

想象一下,如果我們必須向外星人解釋地球上發(fā)生的所有行為。我們可以為他們提供非小說類書籍或BBC紀(jì)錄片。我們可以嘗試口頭解釋什么是電臀舞。但是,實(shí)際上,沒有什么能比三秒鐘的視頻短片更好地傳達(dá)出這一行為的含義。

Falling Asleep(入睡,來自GIPHY網(wǎng)站)

感謝麻省理工學(xué)院和IBM的研究人員,我們現(xiàn)在有了一個(gè)做了清晰的標(biāo)簽標(biāo)記的數(shù)據(jù)集,其中包含有100多萬個(gè)視頻短片。這個(gè)數(shù)據(jù)集名為“Moments in Time”,已經(jīng)收集了地球上發(fā)生的數(shù)百種常見行為,有鮮花綻放的美麗時(shí)刻,也有令人尷尬的被絆倒和嘴啃泥場(chǎng)景。

Tripping(絆倒,來自GIPHY網(wǎng)站)

然而,Moments in Time的創(chuàng)建并不是為了提供一系列GIF動(dòng)畫,而是為人工智能系統(tǒng)識(shí)別和理解視頻中的行為和事件打下基礎(chǔ)。迄今為止,大量標(biāo)記過的圖像數(shù)據(jù)集,如用于物體識(shí)別的ImageNet和用于場(chǎng)景識(shí)別的Places,在開發(fā)更準(zhǔn)確的圖像分類和理解模型中發(fā)揮了重要作用。

“視頻理解尤其是視頻中的行為識(shí)別,與圖像理解的情況是不同的?!盡IT-IBM沃森人工智能實(shí)驗(yàn)室的首席研究員、創(chuàng)建Moments in Time的主管研究員Dan Gutfreund說。“雖然用標(biāo)簽標(biāo)記了行為的視頻數(shù)據(jù)集在Moments in Time之前就已經(jīng)存在,但它們比圖像數(shù)據(jù)集要小好幾個(gè)數(shù)量級(jí)。此外,它們是以人為中心的,有時(shí)還是針對(duì)特定領(lǐng)域的(比如體育)?!?/p>

因此,Gutfreund及其同事們力圖開發(fā)一個(gè)分類系統(tǒng),該系統(tǒng)可以涵蓋最常見的行為(不管這些行為是由人類、動(dòng)物還是物體完成的,也不管它們是在什么環(huán)境下完成的)。他們首先列出了來自VerbNet的4500個(gè)最常用的動(dòng)詞(VerbNet是由語言學(xué)家開發(fā)和使用的一個(gè)動(dòng)詞知識(shí)庫)。

他們將動(dòng)詞解析成語義相關(guān)的詞簇,然后從每個(gè)詞簇中選擇最常見的動(dòng)詞。結(jié)果顯示英語是很冗余的一種語言。例如,洗浴、淋浴、沐浴、皂洗、洗發(fā)、修指甲、保濕和用牙線——這些都可以簡(jiǎn)單地歸入“梳洗打扮”的范疇。在對(duì)動(dòng)詞進(jìn)行了細(xì)致的整合之后,研究團(tuán)隊(duì)確定了339個(gè)用做Moments in Time基礎(chǔ)的關(guān)鍵動(dòng)詞。

Grooming(梳洗打扮,來自GIPHY網(wǎng)站)

但是,當(dāng)對(duì)視頻本身進(jìn)行分類時(shí),會(huì)遇到一系列獨(dú)特的挑戰(zhàn)。例如,描述某個(gè)東西正在“打開”(opening),那可能是一個(gè)人正在打開一扇門,也可能是一朵花正在綻放,甚至可能是一只卡通狗正在張開嘴。更重要的是,相同幀反向播放,實(shí)際上可以描述不同的行為(“關(guān)閉”,closing),這意味著捕捉視頻的時(shí)間線對(duì)于理解視頻和將其正確分類是至關(guān)重要的。

Opening(打開,來自GIPHY網(wǎng)站)

研究人員從網(wǎng)上挑選了與這339個(gè)動(dòng)詞相關(guān)的視頻,將每個(gè)視頻的時(shí)長(zhǎng)縮短到3秒。這些視頻短片被發(fā)送到眾包平臺(tái)Amazon Mechanical Turk上,該平臺(tái)上的用戶幫助對(duì)100多萬個(gè)視頻短片進(jìn)行分類(他們只需點(diǎn)擊“是”或“否”來確認(rèn)每個(gè)視頻短片中是否發(fā)生了指定的行為即可)。

每個(gè)標(biāo)簽都經(jīng)過幾個(gè)用戶的驗(yàn)證。關(guān)于該數(shù)據(jù)集如何創(chuàng)建的詳細(xì)信息,發(fā)表在了2月25日的IEEE Transactions on Pattern Analysis and Machine Intelligence上,文章標(biāo)題為“Moments in Time Dataset: one million videos for event understanding”。

麻省理工學(xué)院計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(CSAIL)的Mathew Monfort是該項(xiàng)目的首席研究員,他指出,一些分類,比如“Walking”(步行)或“Cooking”(烹飪),是很簡(jiǎn)單的,而另一些則不然?!癙laying Music”(演奏/播放音樂)可以是一個(gè)樂隊(duì)在舞臺(tái)上演奏,也可以是一個(gè)人在用收音機(jī)聽音樂。Monfort說:“具有這種視覺和聽覺多義性的類目的識(shí)別,對(duì)于當(dāng)前的機(jī)器學(xué)習(xí)模型來說是非常具有挑戰(zhàn)性的。”

Playing Music(演奏/播放音樂,來自GIPHY網(wǎng)站)

在該數(shù)據(jù)集的下一版本中,該團(tuán)隊(duì)計(jì)劃使用相同的視頻集合,并標(biāo)記出每個(gè)視頻中發(fā)生的多個(gè)行為?!爱?dāng)我們考慮視頻的本質(zhì)時(shí),很明顯需要更多的信息來恰當(dāng)?shù)孛枋鲆粋€(gè)事件,而用一個(gè)行為標(biāo)簽來訓(xùn)練和評(píng)估模型是不完整的。”Monfort說?!皩⒍鄠€(gè)標(biāo)簽納入數(shù)據(jù)集應(yīng)該可以顯著改善模型訓(xùn)練,同時(shí)也為不同行為之間的關(guān)系問題以及如何對(duì)它們進(jìn)行推理打開了大門?!?/p>

很快,更復(fù)雜的視頻可以通過機(jī)器學(xué)習(xí)算法分類,輕松自如。

不久之后,機(jī)器學(xué)習(xí)算法可能可以毫不費(fèi)力地對(duì)更復(fù)雜的視頻加以分類。

機(jī)器學(xué)習(xí)(Machine Learning,來自GIPHY網(wǎng)站)

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50091

    瀏覽量

    265226
  • 圖像分類
    +關(guān)注

    關(guān)注

    0

    文章

    96

    瀏覽量

    12487
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1236

    瀏覽量

    26187

原文標(biāo)題:100多萬個(gè)視頻短片數(shù)據(jù)集來啦!

文章出處:【微信號(hào):rgznai100,微信公眾號(hào):rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    全球首個(gè)最大規(guī)??绫倔w視觸覺模態(tài)數(shù)據(jù)白虎-VTouch發(fā)布

    全球首個(gè)最大規(guī)模跨本體視觸覺模態(tài)數(shù)據(jù)——白虎-VTouch(Vision-Based Tactile Sensor),總規(guī)模超過60,000分鐘。
    的頭像 發(fā)表于 01-29 14:41 ?457次閱讀

    小鵬汽車迎來第100臺(tái)整車正式下線

    11月21日,小鵬汽車迎來第100臺(tái)整車正式下線。小鵬汽車在廣州工廠舉行了第100臺(tái)下線暨首批X9超級(jí)增程車主交付,數(shù)百家海內(nèi)外媒體和X9超級(jí)增程首批車主共同見證了這一里程碑時(shí)刻。
    的頭像 發(fā)表于 11-25 10:00 ?486次閱讀

    NVIDIA推出多語種語音AI開放數(shù)據(jù)與模型

    新發(fā)布的 Granary 數(shù)據(jù)包含約 100 小時(shí)音頻,可用于訓(xùn)練高精度、高吞吐量的 AI 音頻轉(zhuǎn)錄與翻譯模型。
    的頭像 發(fā)表于 09-23 15:34 ?954次閱讀

    AI Cube如何導(dǎo)入數(shù)據(jù)

    我從在線平臺(tái)標(biāo)注完并且下載了數(shù)據(jù),也按照ai cube的要求修改了文件夾名稱,但是導(dǎo)入提示 不知道是什么原因,我該怎么辦? 以下是我修改后的文件夾目錄
    發(fā)表于 08-11 08:12

    吉時(shí)利KEITHLEY DMM7510數(shù)字用表吉時(shí)利DMM7510七位半用表

    DMM7510 高精度、高分辨率數(shù)字用表 (DMM)、圖形觸摸屏顯示器和高速、高分辨率數(shù)字化器于一身,是第一款圖形采樣用表。其具有 pA 靈敏度和 1M 個(gè)樣點(diǎn)/秒的采樣率,能
    發(fā)表于 07-24 11:01

    云訓(xùn)練平臺(tái)數(shù)據(jù)過大無法下載數(shù)據(jù)至本地怎么解決?

    起因是現(xiàn)在平臺(tái)限制了圖片數(shù)量,想要本地訓(xùn)練下載數(shù)據(jù)時(shí)發(fā)現(xiàn)只會(huì)跳出網(wǎng)絡(luò)異常的錯(cuò)誤,請(qǐng)問這有什么解決辦法?
    發(fā)表于 07-22 06:03

    張飛FOC磁場(chǎng)定向控制有感、無感電機(jī)驅(qū)動(dòng)視頻課程及STM32開發(fā)套件(共257)

    套餐三1)乘風(fēng)篇-有感FOC視頻課程x1套(共124);2)揚(yáng)帆起航派開發(fā)板x1塊;3)燒錄器x1個(gè);4)直流無刷電機(jī)x1個(gè);5)全套開源資料1x1套;¥498起
    的頭像 發(fā)表于 07-01 08:07 ?1232次閱讀
    張飛FOC磁場(chǎng)定向控制有感、無感電機(jī)驅(qū)動(dòng)<b class='flag-5'>視頻</b>課程及STM32開發(fā)套件(共257<b class='flag-5'>集</b>)

    使用AICube導(dǎo)入數(shù)據(jù)點(diǎn)創(chuàng)建后提示數(shù)據(jù)不合法怎么處理?

    重現(xiàn)步驟 data目錄下 labels.txt只有英文 **錯(cuò)誤日志** 但是使用示例的數(shù)據(jù)可以完成訓(xùn)練并部署
    發(fā)表于 06-24 06:07

    數(shù)據(jù)下載失敗的原因?

    數(shù)據(jù)下載失敗什么原因太大了嗎,小的可以下載,想把大的下載去本地訓(xùn)練報(bào)錯(cuò)網(wǎng)絡(luò)錯(cuò)誤 大的數(shù)據(jù)多大?數(shù)據(jù)量有多少?
    發(fā)表于 06-18 07:04

    Analog Devices Inc. ADTF3175 100像素飛行時(shí)間模塊數(shù)據(jù)手冊(cè)

    Analog Devices ADTF3175 100像素飛行時(shí)間模塊基于ADSD3100(一款100像素CMOS間接飛行時(shí)間 (ITF) 成像器,設(shè)計(jì)用于高分辨率3D深度傳感和視
    的頭像 發(fā)表于 06-16 11:02 ?807次閱讀
    Analog Devices Inc. ADTF3175 <b class='flag-5'>100</b><b class='flag-5'>萬</b>像素飛行時(shí)間模塊<b class='flag-5'>數(shù)據(jù)</b>手冊(cè)

    4K、模態(tài)、長(zhǎng)視頻:AI視頻生成的下一個(gè)戰(zhàn)場(chǎng),誰在領(lǐng)跑?

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎) 6月11日,豆包App上線視頻生成模型豆包Seedance 1.0 pro。這是字節(jié)跳動(dòng)最新視頻模型,支持文字與圖片輸入,可生成鏡頭無縫切換的1080P高品質(zhì)
    的頭像 發(fā)表于 06-16 00:13 ?7276次閱讀

    正點(diǎn)原子Linux系列全新視頻教程來啦!手把手教你MP257開發(fā)板,讓您輕松入門!

    正點(diǎn)原子Linux系列全新視頻教程來啦!手把手教你MP257開發(fā)板,讓您輕松入門! 一、視頻觀看 正點(diǎn)原子手把手教你學(xué)STM32MP257-第1期:https://www.bilibili.com/video/BV1UtEiz
    發(fā)表于 05-16 10:42

    OpenHarmony應(yīng)用開發(fā)精品課程第七期來啦

    OpenHarmony應(yīng)用開發(fā)精品課程第七期來啦
    的頭像 發(fā)表于 04-15 14:15 ?698次閱讀
    OpenHarmony應(yīng)用開發(fā)精品課程第七期<b class='flag-5'>來啦</b>

    正點(diǎn)原子ND1核輻射檢測(cè)儀支持檢測(cè)x,γ,β射線的輻射強(qiáng)度,高靈敏度J321蓋革-米勒計(jì)數(shù)管,支持約100個(gè)輻射值記錄!

    ;高靈敏J321大蓋革管,準(zhǔn)確可靠;ND1支持約100個(gè)輻射值記錄,U盤數(shù)據(jù)導(dǎo)出,方便分析;支持手持感應(yīng)功能,方便好用;報(bào)警方式與閾值可調(diào),不錯(cuò)過危險(xiǎn)警告;支持倒計(jì)時(shí)功能,3D感應(yīng),
    發(fā)表于 04-15 11:09

    請(qǐng)問NanoEdge AI數(shù)據(jù)該如何構(gòu)建?

    我想用NanoEdge來識(shí)別異常的聲音,但我目前沒有辦法生成模型,我感覺可能是數(shù)據(jù)的問題,請(qǐng)問我該怎么構(gòu)建數(shù)據(jù)?或者生成模型失敗還會(huì)有哪些原因?
    發(fā)表于 03-10 08:20