chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Google AI發(fā)數(shù)據(jù)集論文、辦挑戰(zhàn)賽卻拒絕開(kāi)放數(shù)據(jù)集?

電子工程師 ? 來(lái)源:lq ? 2019-01-18 14:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,有網(wǎng)友在 reddit 上提出 Google AI 拒絕公開(kāi) Conceptual Captions 數(shù)據(jù)集(相關(guān)論文發(fā)表在 ACL 2018 上),谷歌除了發(fā)表相關(guān)論文以外還舉辦了使用該數(shù)據(jù)集的挑戰(zhàn)賽(比賽結(jié)果在 2018 年 NeurIPS 會(huì)議上公布)。這引發(fā)了網(wǎng)友對(duì)這種做法是對(duì)是錯(cuò)、學(xué)術(shù)會(huì)議同行評(píng)審是否應(yīng)該把論文復(fù)現(xiàn)作為重要考量因素等的激烈討論。

原帖主要內(nèi)容是:

谷歌曾在 ACL 2018 上發(fā)表了一篇數(shù)據(jù)集論文《Conceptual Captions: A Cleaned, Hypernymed, Image Alt-text Dataset For Automatic Image Captioning》,該數(shù)據(jù)集 Conceptual Captions 共有大約 330 萬(wàn)張圖像。但他發(fā)現(xiàn)了幾個(gè)問(wèn)題:

谷歌拒絕共享預(yù)訓(xùn)練模型,這使得基準(zhǔn)測(cè)試變得異常艱難:

https://github.com/google-research-datasets/conceptual-captions/issues/3;

拒絕共享與每張圖像相關(guān)的 Alt 文本(諷刺的是這篇論文的標(biāo)題中恰好有 Alt-text 一詞):

https://github.com/google-research-datasets/conceptual-captions/issues/6;

拒絕共享圖像/鏡像鏈接(盡管我認(rèn)為這關(guān)乎法律問(wèn)題,但僅有該數(shù)據(jù)集的幾百?gòu)垐D像,社區(qū)很難對(duì)比不同模型):

https://github.com/google-research-datasets/conceptual-captions/issues/1

發(fā)帖人表示對(duì)此很難過(guò)。他希望社區(qū)意識(shí)到數(shù)據(jù)集論文是一項(xiàng)重大責(zé)任,如果存在阻擋數(shù)據(jù)集共享的法律問(wèn)題,那么可以基于私人數(shù)據(jù)發(fā)表論文,但是基于同樣的模型或整個(gè)數(shù)據(jù)集舉辦挑戰(zhàn)賽的行為不太好。

此帖發(fā)出后,引發(fā)了網(wǎng)友的大量討論。有網(wǎng)友認(rèn)為谷歌這么做沒(méi)什么問(wèn)題,他們的任務(wù)是分享研究、把研究成果作為自己的優(yōu)勢(shì),而不是相反。但評(píng)論中更多的是對(duì)這種行為的反對(duì)。

反對(duì)此類(lèi)行為

網(wǎng)友_michaelx99 表示:

DeepMind 發(fā)表的好幾篇論文也是僅依靠論文本身完全無(wú)法復(fù)現(xiàn)。這讓我意識(shí)到發(fā)表在 arXiv 或企業(yè)網(wǎng)站上的「論文」并不是真正的發(fā)表,其主要目標(biāo)是表明該企業(yè)已經(jīng)具備了某種能力。我并不是說(shuō)所有大企業(yè)在線發(fā)表的論文都這樣,但其中一些確實(shí)如此。

ModernShoe 表示:

我曾聽(tīng)吳恩達(dá)談?wù)撋虡I(yè)如何利用 AI 盈利。他說(shuō)企業(yè)應(yīng)該保護(hù)訓(xùn)練/測(cè)試數(shù)據(jù)集,而不是保護(hù)某個(gè)算法?;蛟S這與數(shù)據(jù)集論文不公布數(shù)據(jù)集有某種關(guān)系?

網(wǎng)友 epic:

這種行為不利于科學(xué)和機(jī)器學(xué)習(xí)的發(fā)展。雖然我們理解谷歌不發(fā)布數(shù)據(jù)集的原因,但這種行為仍然是不好的。尤其是數(shù)據(jù)集論文,在沒(méi)有數(shù)據(jù)的情況下復(fù)現(xiàn)研究及其困難。有能力的組織和人們應(yīng)該作為表率來(lái)引領(lǐng)社區(qū),而不是相反。

網(wǎng)友SkinnyJoshPeck:

這是對(duì)機(jī)器學(xué)習(xí)和機(jī)器學(xué)習(xí)專(zhuān)家的海量需求的后果嗎?我在一家大企業(yè)工作,與機(jī)器學(xué)習(xí)科學(xué)家接觸較多,他們當(dāng)中一些人缺乏對(duì)科學(xué)方法的基本尊重,這令我非常驚訝。我認(rèn)為這并非技巧的缺乏(一些研究已經(jīng)發(fā)表),而是不明白「可觀的結(jié)果未必是準(zhǔn)確、有效的」。

我的大學(xué)專(zhuān)業(yè)是數(shù)學(xué),而且專(zhuān)門(mén)學(xué)習(xí)了代數(shù)。我了解表示論和代數(shù)幾何,因此我知道大多數(shù)模型和技術(shù)的底層數(shù)學(xué)基礎(chǔ),這些讓我對(duì)這些專(zhuān)家能夠坐在現(xiàn)在的崗位上感到驚訝。

復(fù)現(xiàn)性

網(wǎng)友GoAwayStupidAI:

復(fù)現(xiàn)性是科學(xué)的重要標(biāo)志。沒(méi)有相關(guān)數(shù)據(jù)、結(jié)果無(wú)法復(fù)現(xiàn)的研究都是垃圾。

網(wǎng)友kemfic:

論文就應(yīng)該是可復(fù)現(xiàn)的。如果不能,那么期刊就不應(yīng)該接收它們。

網(wǎng)友duckbill_principate:

讓我覺(jué)得困擾的不是共不共享模型、代碼或者數(shù)據(jù)集的問(wèn)題,而是在這種事情發(fā)生的時(shí)候論文仍然被接收了。這某種程度上是同行評(píng)審的失敗,其責(zé)任則屬于我們每一個(gè)審稿人,因?yàn)檫@樣的論文往往是基于信任或權(quán)威而被接收的(我們知道盡管有雙盲評(píng)審,但我們不難推斷出某些論文一般會(huì)來(lái)自哪個(gè)研究組)。這更像是廣告而不是科學(xué)。

網(wǎng)友duckbill_principate:

在我實(shí)現(xiàn)的 20 多篇論文中,5 篇存在部分或完全影響研究結(jié)果驗(yàn)證的錯(cuò)誤/bug。而這些論文都是頂會(huì)上經(jīng)過(guò)同行評(píng)審的論文。

我認(rèn)為這是學(xué)術(shù)丑聞。

有些案例中問(wèn)題被揪出來(lái),作者進(jìn)行了修改。但即使是在這種比較好的場(chǎng)景中,修改數(shù)字后的論文(可能使用了全新的超參數(shù)搜索!)靜悄悄地出現(xiàn)在 arXiv 上,而發(fā)表在會(huì)議上的論文并沒(méi)有修改,更不會(huì)被撤回。為什么?大家都知道原因,也熟悉那些辯護(hù)理由:「盡管我們的結(jié)果不如預(yù)想中的好,但我們認(rèn)為這項(xiàng)技術(shù)非常棒,非常有前途……」不管是從數(shù)學(xué)角度,還是從沒(méi)有所謂的「當(dāng)前最優(yōu)結(jié)果」的論文不該被接收的角度,這種說(shuō)法都非常糟糕。

網(wǎng)友 habanero_ass_fire 認(rèn)為:

OpenImages 的圖片是從網(wǎng)上獲得的,其他幾個(gè)比較知名的數(shù)據(jù)集也是如此。就法律意義上來(lái)看,圖片的作者擁有版權(quán),因此論文作者是不能共享這些圖片的。另外,無(wú)效的鏈接在現(xiàn)實(shí)中經(jīng)常發(fā)生。因此我對(duì)這種沒(méi)有公開(kāi)數(shù)據(jù)集的行為沒(méi)有意見(jiàn),只要他們能夠分享一個(gè)預(yù)訓(xùn)練模型即可;如果你可以依照論文訓(xùn)練出自己模型,即使沒(méi)有預(yù)訓(xùn)練模型也不會(huì)讓論文無(wú)效。

但這立刻遭到網(wǎng)友 duckbill_principate 的反駁:

如果你能夠訓(xùn)練出一個(gè)模型精確復(fù)現(xiàn),那沒(méi)問(wèn)題。但如果你曾試圖復(fù)現(xiàn)論文時(shí)就會(huì)明白,實(shí)際情況往往是,即使那些發(fā)布了自己代碼且提供定義清晰且可用的數(shù)據(jù)集的論文,復(fù)現(xiàn)的結(jié)果也往往是不可預(yù)測(cè)的。他們是公布了自己的代碼和參數(shù),但卻可能沒(méi)有說(shuō)明自己的訓(xùn)練過(guò)程;他們公布了訓(xùn)練代碼,但卻可能遺漏了部分自定義庫(kù);他們使用了公共數(shù)據(jù)集,但卻沒(méi)有明確說(shuō)明他們對(duì)這些數(shù)據(jù)集做了什么樣的預(yù)處理;他們公布了代碼、數(shù)據(jù)集,甚至也對(duì)此做了大量且詳盡的說(shuō)明,但卻可能遺漏一些非常關(guān)鍵的內(nèi)容,等等不一而足。

事實(shí)是,如果沒(méi)有預(yù)訓(xùn)練模型,或者沒(méi)有對(duì)訓(xùn)練過(guò)程的完整描述,談復(fù)現(xiàn)性就是一個(gè)笑話。

正如網(wǎng)友所說(shuō),在沒(méi)有數(shù)據(jù)的情況下復(fù)現(xiàn)研究及其困難,尤其是數(shù)據(jù)集論文。

關(guān)于研究復(fù)現(xiàn)的討論由來(lái)已久,前段時(shí)間在某篇 CVPR 論文復(fù)現(xiàn)出現(xiàn)問(wèn)題時(shí),大家更是對(duì)頂會(huì)/期刊論文復(fù)現(xiàn)性進(jìn)行了大量討論。不少人認(rèn)為論文復(fù)現(xiàn)也應(yīng)該作為同行評(píng)審中的重要部分。有網(wǎng)友表示「總體而言,論文評(píng)審過(guò)程不包含復(fù)現(xiàn)實(shí)驗(yàn)結(jié)果。評(píng)審者不得不在很大程度上依靠作者的誠(chéng)信」、「同行評(píng)審?fù)ǔ8P(guān)心論文中描述的方法。潛在的解決辦法是要求作者提交現(xiàn)成的實(shí)現(xiàn)(如通過(guò) docker)。然而,在哪里運(yùn)行仍然是一個(gè)問(wèn)題。也許 AWS 資源等可以從提交費(fèi)用中提取,供評(píng)審人員重新運(yùn)行模型。然后,問(wèn)題是確保評(píng)審人員不會(huì)「濫用」資源進(jìn)行他們自己的實(shí)驗(yàn)等。在任何情況下,「通過(guò)計(jì)算的方法」進(jìn)行 DL 論文評(píng)審都很棘手」。

學(xué)術(shù)會(huì)議對(duì)研究復(fù)現(xiàn)也很重視。2017 年,ICML「機(jī)器學(xué)習(xí)復(fù)現(xiàn) Workshop」就對(duì)這一問(wèn)題進(jìn)行過(guò)討論;2018 年,ICLR 舉辦了復(fù)現(xiàn)挑戰(zhàn)賽,旨在保證接收論文公布的結(jié)果是可靠的、可復(fù)現(xiàn)的。此外,為了鼓勵(lì)可復(fù)現(xiàn)性和高質(zhì)量論文的提交,ICML 2019 在論文提交上做出了一些重要改變,如鼓勵(lì)提交的論文附帶代碼,結(jié)果的可復(fù)現(xiàn)性和代碼的易用性將作為論文接收和進(jìn)一步?jīng)Q策的考慮因素。KDD 2019 的征稿通知中也表明:今年會(huì)議采取雙盲評(píng)審制度,論文接收結(jié)果公布之前投稿者不得將論文發(fā)布于 arXiv 等開(kāi)放性平臺(tái)上。更重要的是,只有在論文中公開(kāi)研究代碼和數(shù)據(jù)的論文才有資格競(jìng)選「最佳論文獎(jiǎng)」。

科學(xué)研究的復(fù)現(xiàn)性非常重要,機(jī)器學(xué)習(xí)社區(qū)一貫重視開(kāi)放性、復(fù)現(xiàn)性,而這需要社區(qū)人們的維護(hù)。上述學(xué)術(shù)會(huì)議的變化無(wú)疑將促進(jìn)研究復(fù)現(xiàn)性,鼓勵(lì)研究人員更加審慎地對(duì)待自己的研究、更加開(kāi)放地共享研究的具體細(xì)節(jié)。那么具備強(qiáng)悍研究能力和開(kāi)發(fā)能力的大型企業(yè)會(huì)不會(huì)做好表率呢?

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Google
    +關(guān)注

    關(guān)注

    5

    文章

    1789

    瀏覽量

    59010
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6231

    瀏覽量

    108116
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1224

    瀏覽量

    25445

原文標(biāo)題:Google AI發(fā)數(shù)據(jù)集論文、辦挑戰(zhàn)賽卻拒絕開(kāi)放數(shù)據(jù)集?結(jié)果被懟了……

文章出處:【微信號(hào):aicapital,微信公眾號(hào):全球人工智能】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Denodo全新AI SDK認(rèn)證發(fā)布,攜手大學(xué)挑戰(zhàn)賽共筑快速AI應(yīng)用開(kāi)發(fā)新生態(tài)

    ,Denodo學(xué)術(shù)計(jì)劃2025年度大學(xué)挑戰(zhàn)賽數(shù)據(jù)與人工智能驅(qū)動(dòng)現(xiàn)實(shí)影響力”正式啟動(dòng),誠(chéng)邀全球高校學(xué)子通過(guò)創(chuàng)新實(shí)踐,展示數(shù)據(jù)管理與AI技能,推動(dòng)社會(huì)變革。 自2024年11月Denod
    的頭像 發(fā)表于 06-24 13:36 ?187次閱讀

    使用AICube導(dǎo)入數(shù)據(jù)點(diǎn)創(chuàng)建后提示數(shù)據(jù)不合法怎么處理?

    重現(xiàn)步驟 data目錄下 labels.txt只有英文 **錯(cuò)誤日志** 但是使用示例的數(shù)據(jù)可以完成訓(xùn)練并部署
    發(fā)表于 06-24 06:07

    數(shù)據(jù)下載失敗的原因?

    數(shù)據(jù)下載失敗什么原因太大了嗎,小的可以下載,想把大的下載去本地訓(xùn)練報(bào)錯(cuò)網(wǎng)絡(luò)錯(cuò)誤 大的數(shù)據(jù)多大?數(shù)據(jù)量有多少?
    發(fā)表于 06-18 07:04

    NVIDIA推出開(kāi)源物理AI數(shù)據(jù)

    標(biāo)準(zhǔn)化合成數(shù)據(jù)的初始版本預(yù)計(jì)將成為世界上最大的此類(lèi)數(shù)據(jù),目前已作為開(kāi)源版本提供給機(jī)器人開(kāi)發(fā)人員。
    的頭像 發(fā)表于 03-24 17:52 ?613次閱讀

    請(qǐng)問(wèn)NanoEdge AI數(shù)據(jù)該如何構(gòu)建?

    我想用NanoEdge來(lái)識(shí)別異常的聲音,但我目前沒(méi)有辦法生成模型,我感覺(jué)可能是數(shù)據(jù)的問(wèn)題,請(qǐng)問(wèn)我該怎么構(gòu)建數(shù)據(jù)?或者生成模型失敗還會(huì)有哪些原因?
    發(fā)表于 03-10 08:20

    平頭哥半導(dǎo)體亮相AICAS 2025挑戰(zhàn)賽技術(shù)研討會(huì)

    近日,歷時(shí)兩個(gè)多月,600余支參賽隊(duì)伍激烈角逐,AICAS 2025全球技術(shù)挑戰(zhàn)賽初賽階段賽程已順利結(jié)束,中技術(shù)研討于2月22日在杭州圓滿召開(kāi)。本次研討會(huì)作為AICAS全球技術(shù)挑戰(zhàn)賽的重要環(huán)節(jié),在初賽和復(fù)賽之間架起橋梁,為參賽
    的頭像 發(fā)表于 02-25 11:23 ?709次閱讀

    微軟AI開(kāi)發(fā)者挑戰(zhàn)賽即將開(kāi)啟

    人工智能,正在重塑世界。2 月 5 日至 4 月 23 日,加入我們,共赴一場(chǎng)聚焦 AI 技術(shù)的開(kāi)發(fā)者挑戰(zhàn)賽!在這里,創(chuàng)意、技術(shù)和無(wú)限可能將碰撞出耀眼火花。無(wú)論你是開(kāi)發(fā)新秀還是經(jīng)驗(yàn)豐富的技術(shù)專(zhuān)家,這場(chǎng)由微軟 Azure 驅(qū)動(dòng)的在線競(jìng)賽,將為你打開(kāi)一扇通往未來(lái)的大門(mén)。
    的頭像 發(fā)表于 02-12 16:18 ?444次閱讀

    EDA精英挑戰(zhàn)賽果公布!思爾芯“戰(zhàn)隊(duì)”薪火相承斬獲“麒麟杯”

    2024中國(guó)研究生創(chuàng)芯大賽·EDA精英挑戰(zhàn)賽12月7-8日,2024中國(guó)研究生創(chuàng)芯大賽·EDA精英挑戰(zhàn)賽(原“集成電路EDA設(shè)計(jì)精英挑戰(zhàn)賽”)總決賽及頒獎(jiǎng)典禮在南京成功舉辦。此次大賽,思爾芯作為核心
    的頭像 發(fā)表于 12-11 01:03 ?937次閱讀
    EDA精英<b class='flag-5'>挑戰(zhàn)賽</b><b class='flag-5'>賽</b>果公布!思爾芯“戰(zhàn)隊(duì)”薪火相承斬獲“麒麟杯”

    2024年ICPC與華為挑戰(zhàn)賽冠軍杯圓滿落幕

    近日,2024年ICPC&華為挑戰(zhàn)賽冠軍杯在深圳圓滿落幕。該活動(dòng)由華為和ICPC聯(lián)合舉辦,匯聚全球頂尖的編程人才,共同探討和解決具有挑戰(zhàn)性的工業(yè)界真實(shí)問(wèn)題,并對(duì)未來(lái)技術(shù)發(fā)展趨勢(shì)及關(guān)鍵挑戰(zhàn)展開(kāi)討論。今年的
    的頭像 發(fā)表于 10-27 16:00 ?1376次閱讀

    PI助力aCentauri車(chē)隊(duì)在太陽(yáng)能車(chē)挑戰(zhàn)賽中大放異彩

    在2023年10月,Power Integrations (PI) 為當(dāng)時(shí)舉行的普利司通世界太陽(yáng)能車(chē)挑戰(zhàn)賽提供了先進(jìn)的技術(shù)和支持。
    的頭像 發(fā)表于 10-27 14:08 ?710次閱讀
    PI助力aCentauri車(chē)隊(duì)在太陽(yáng)能車(chē)<b class='flag-5'>挑戰(zhàn)賽</b>中大放異彩

    50萬(wàn)獎(jiǎng)金池!開(kāi)放原子大賽——第二屆OpenHarmony創(chuàng)新應(yīng)用挑戰(zhàn)賽正式啟動(dòng)

    第二屆OpenHarmony創(chuàng)新應(yīng)用挑戰(zhàn)賽作為開(kāi)放原子大賽旗下的重要項(xiàng),聚焦 OpenHarmony應(yīng)用開(kāi)發(fā),致力提升開(kāi)發(fā)者的動(dòng)手實(shí)踐能力與開(kāi)發(fā)創(chuàng)新應(yīng)用的能力。 項(xiàng)要求開(kāi)發(fā)者
    發(fā)表于 10-24 15:40

    NVIDIA為AI城市挑戰(zhàn)賽構(gòu)建合成數(shù)據(jù)

    在一年一度的 AI 城市挑戰(zhàn)賽中,來(lái)自世界各地的數(shù)百支參賽隊(duì)伍在 NVIDIA Omniverse 生成的基于物理學(xué)的數(shù)據(jù)上測(cè)試了他們的 AI
    的頭像 發(fā)表于 09-09 10:04 ?887次閱讀

    AI4Science黑客松光子計(jì)算挑戰(zhàn)賽成功舉辦

    經(jīng)過(guò)數(shù)月角逐,第二屆AI4Science黑客松競(jìng)賽日前落下帷幕。在曦智科技主持的光子計(jì)算挑戰(zhàn)賽中,參賽選手何自強(qiáng)和來(lái)自東北大學(xué)的參賽隊(duì)伍T(mén)he Power of Light獲得完優(yōu)勝獎(jiǎng)。
    的頭像 發(fā)表于 08-07 09:58 ?1011次閱讀

    思爾芯題正式發(fā)布,邀你共戰(zhàn)EDA精英挑戰(zhàn)賽!

    題發(fā)布COMPETITIONRELEASE2024中國(guó)研究生創(chuàng)芯大賽·EDA精英挑戰(zhàn)賽(原“集成電路EDA設(shè)計(jì)精英挑戰(zhàn)賽”)現(xiàn)已正式拉開(kāi)帷幕。作為核心出題企業(yè)之一思爾芯(S2C),已經(jīng)為你們準(zhǔn)備了
    的頭像 發(fā)表于 08-03 08:24 ?1110次閱讀
    思爾芯<b class='flag-5'>賽</b>題正式發(fā)布,邀你共戰(zhàn)EDA精英<b class='flag-5'>挑戰(zhàn)賽</b>!