chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Kaggle創(chuàng)始人Goldbloom:我們是這樣做數(shù)據(jù)科學(xué)競賽的

電子工程師 ? 來源:lq ? 2019-01-23 15:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

不管是初學(xué)者還是大魔王,只要浸潤過數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)界,那么對于Kaggle一定不陌生。各路英豪在這個(gè)平臺上實(shí)戰(zhàn)練習(xí)、膜拜大神、打怪升級,用某個(gè)媒體人的一句話,“簡而言之,Kaggle 是玩數(shù)據(jù)、機(jī)器學(xué)習(xí)的開發(fā)者們展示功力、揚(yáng)名立萬的江湖。”

為什么有這么多的數(shù)據(jù)科學(xué)家會在Kaggle花這么多的時(shí)間?kaggle最著名的就是競賽了,那么具體的競賽怎么做呢?

1 月 19 日,作為Kaggle的由聯(lián)合創(chuàng)始人、首席執(zhí)行官Anthony Goldbloom在“全球新興科技峰會”中,回答了這兩個(gè)問題。

以下Anthony Goldbloom的最新演講,文摘菌做了有刪改的整理~

Kaggle聚集了大量的機(jī)器學(xué)習(xí)的專家以及大數(shù)據(jù)的專家最,截止到目前為止,差不多是有250萬人了,在演講的最開始,首先介紹一下我們在kaggle的工作。然后給大家說一下我們在kaggle學(xué)到的一些經(jīng)驗(yàn)。

具體的競賽怎么做

在Kaggle里面,我們做好幾項(xiàng)不同的工作,分別是:競賽、電腦的數(shù)據(jù)環(huán)境以及數(shù)據(jù)組的共享空間。

我們具體的競賽怎么做呢?首先就是有公司會在我們的網(wǎng)站上面提出一個(gè)問題,解決這個(gè)問題會有獎(jiǎng)金。

有一些獎(jiǎng)金還是非常高的。例如上圖,第一個(gè)是美國國土安全部,他們希望用算法能夠幫助識別是否有人攜帶了武器,或者是攜帶其他的一些禁帶品,他們希望這個(gè)算法更加的精準(zhǔn)一些。這非常重要,因?yàn)檫^篩率如果太低,就意味著效率會變的非常的低。所以,他們是希望能夠增加效率。

第二個(gè)是Zillow,Zillow其實(shí)就是在它的網(wǎng)站上面可以輸入自己地址,然后根據(jù)房子里面有多少的臥室,多大的房間,有多少個(gè)浴室等估算房子價(jià)值。

Zillow那個(gè)競賽,一開始他們可能和實(shí)際的房價(jià)是差了20%,然后呢,他們慢慢的調(diào)了一下算法,越來越接近正常價(jià)格。

更好的算法能夠幫助他們找到正常的價(jià)格。為了解決這個(gè)問題,他們愿意提供超過100萬美元做獎(jiǎng)金。

其他的競賽項(xiàng)目,獎(jiǎng)金就沒有這么多了,但是大家可以看得出來,越來越多的公司非常重視AI以及這樣的算法。

還有衛(wèi)星圖像的競賽,還有關(guān)于森林大火或者是森林減少率的圖像分析的大賽。

所以說,在kaggle里有各種各樣的問題,包括不同的行業(yè)、不同的方面,這里面非常有意思的一點(diǎn),就是所有的問題,都可以用差不多的方法來進(jìn)行解決。當(dāng)我們有兩個(gè)數(shù)據(jù)集的時(shí)候,一個(gè)是訓(xùn)練集,一個(gè)是測試集,兩者是完全不同的。訓(xùn)練集可以看到結(jié)果,測試集看不到結(jié)果。

測試組將采用類似的數(shù)據(jù),這樣的測試組可以幫助我們看一下算法是不是能夠達(dá)到我們的預(yù)期值。對比不同的算法結(jié)果,我們也會把不同結(jié)果的對比進(jìn)行公開。

對比提升算法準(zhǔn)確率

所以說大家可以看到,大家如果能夠把自己的結(jié)果進(jìn)行對比的話,會有更多的激勵(lì),會把自己的算法調(diào)整的更好。

之前給大家說到的Zillow,一開始的準(zhǔn)確率還差15%,最后準(zhǔn)確率只差了5%。是不是5%就沒有辦法突破了,或者我們需要調(diào)整一些技術(shù)來彌補(bǔ)這5%。然后公司就會推出相關(guān)的競賽,找到到底是什么原因,有沒有辦法突破最后的界限。

現(xiàn)在很多的公司也非??粗谹I,一方面幫助他們解決問題,另一方面幫助他們找到人才。我們每半年都會有競賽,我們和airbnb、Facebook聯(lián)合組織相關(guān)的競賽,幫他們找到相關(guān)的人才。

所以說,分享和學(xué)習(xí)是非常重要的,比如說你在競賽里面的排名是15名。通過公開你可以知道第一名到底怎么做的以及第一名用采用的技術(shù)。有了這些,你在下次競賽的時(shí)候就可以學(xué)習(xí)第一名所使用的技術(shù)了。

因?yàn)檫@里面有很多不同的人,這些人有可能是讀AI的博士,或者有其他的一些業(yè)余選手。但不管是什么人,他都可以在這上面展示自己。

現(xiàn)在中國已經(jīng)在社區(qū)里面規(guī)模排到第三了,第一是美國,第二大是印度。我們可以看到,有很多非常出色的競爭者都來自于中國。

Kaggle競賽解決實(shí)際問題

為什么人們會競賽,為什么公司會在kaggle網(wǎng)站上面放一些問題?

首先,競賽非常重要,雖然說所有的網(wǎng)站都是深度學(xué)習(xí),深度學(xué)習(xí)其實(shí)是在整個(gè)AI當(dāng)中所使用的是比較小的數(shù)據(jù)組。

但對于這些問題來講,那些小的數(shù)據(jù)組能解決的問題,傳統(tǒng)的工具也可以幫助我們解決。但不管怎樣,我們一開始必須要從不同的方面進(jìn)行數(shù)據(jù)的探索,比如說我們會用數(shù)據(jù)繪制圖標(biāo),所以說我們可以非常深入的了解數(shù)據(jù)。

在競賽里面,人們第二步就是假設(shè),數(shù)據(jù)之間的假設(shè),例如在預(yù)測車銷量的競賽中,最主要的是用算法預(yù)測哪一個(gè)車可能會賣的更好。

其中有一個(gè)非常重要的因素是顏色,我們有兩類:常規(guī)顏色以及非常規(guī)顏色。非常規(guī)顏色的車會比較好賣,因?yàn)楦鶕?jù)這個(gè)假設(shè)買二手車的人可能會更喜歡一些比較另類的車,并且更愛保養(yǎng)。

通過這樣的一種算法,我們也會進(jìn)行頭腦風(fēng)暴,可以幫助我們更好的搜集不同方式或者不同方向的數(shù)據(jù)。

另外,我們進(jìn)行調(diào)參,我們在進(jìn)行數(shù)據(jù)的設(shè)計(jì)之后,再次把數(shù)據(jù)放在一個(gè)數(shù)據(jù)庫當(dāng)中,再進(jìn)行分類、調(diào)參和模型融合。

其實(shí),技術(shù)也是非常重要的,所謂的深度學(xué)習(xí),也是競賽者經(jīng)常使用的技術(shù)。例如在圖像的識別當(dāng)中,經(jīng)常使用的卷積神經(jīng)網(wǎng)絡(luò)技術(shù),比如說衛(wèi)星圖像還有醫(yī)學(xué)圖像、自動(dòng)駕駛也經(jīng)常使用。

遷移學(xué)習(xí)解決小樣本問題

即便說是數(shù)據(jù)庫比較小的,但是我們做的還是非常的好,就是因?yàn)槲覀冇兴^的遷移學(xué)習(xí),也就是說我們可以把一系列的學(xué)習(xí)成果轉(zhuǎn)移到其他更大范圍的規(guī)模上。

這個(gè)學(xué)習(xí)的結(jié)果得到了轉(zhuǎn)移之后,我們在進(jìn)行一些調(diào)參,即便是有一些比較小的原始的數(shù)據(jù)組,比如說對于醫(yī)學(xué)的圖像,最后這個(gè)建立的模型也還是非常準(zhǔn)確的,也可以幫助我們進(jìn)行更好的應(yīng)用。

另外,我們發(fā)現(xiàn)深度學(xué)習(xí)在其他的領(lǐng)域也做的更好,比如說現(xiàn)在我們的神經(jīng)網(wǎng)絡(luò)做的非常得的好,比如利用卷積神經(jīng)網(wǎng)絡(luò)分析醫(yī)療圖像,我們也是讓競賽者推斷這個(gè)圖片,去推斷這個(gè)人是不是有癲癇或者是有相關(guān)的一些病癥。

另外還有就是文本,因?yàn)槲谋居行蛄校粋€(gè)字之后又是一個(gè)字,所以說這也可通過神經(jīng)網(wǎng)絡(luò)進(jìn)行分析,所以說,我們在很多的問題解決方面,要判斷有哪些技術(shù)是可以應(yīng)用的,哪些技術(shù)是比較擅長的。

Kaggle競賽中最重要的特征

特征一:我們發(fā)現(xiàn)我們的這些競賽者都是非常有創(chuàng)造性的一群主體,競賽中有一些問題是需要對特征進(jìn)行相關(guān)的工程設(shè)計(jì),所以說,在我們進(jìn)行神經(jīng)學(xué)習(xí)的時(shí)候,需要一些小辦法來尋求幫助,判斷看這個(gè)方法是不是管用,這個(gè)方法是不是能夠提高效率,從而能夠幫助我們把整體的效率提升。

特征二:我們競賽者都是非常的重視如何對自己的模型進(jìn)行測試的,大家建模之后會進(jìn)行測試,然后在進(jìn)行調(diào)參,進(jìn)行改進(jìn)......

在模型訓(xùn)練完成之后,進(jìn)入測試階段,做法是把用過的數(shù)據(jù)全部“扔掉”。然后用新的數(shù)據(jù)進(jìn)行檢驗(yàn),也就是說我們要保證我們的算法不單單只是在原始數(shù)據(jù)上面可以做出準(zhǔn)確的預(yù)測,而且在全新的數(shù)據(jù)面也可以做同樣的結(jié)果。所以說,我們在進(jìn)行模型的測試的時(shí)候,整體的過程是非常嚴(yán)苛的。

特征三:大家的編程能力非常棒。版本的控制是非常重要的,其實(shí)對版本的控制就能夠意味著我們可以知道哪些版本更高效,哪些不能夠奏效,其實(shí)在軟件的這個(gè)領(lǐng)域當(dāng)中,很多的數(shù)據(jù)科學(xué)家以及機(jī)器學(xué)習(xí)的專家都會使用各種辦法來進(jìn)行管理,所以說他們就會知道自己在代碼在每個(gè)版本之間會有不同。

而且這也是非常重要的一個(gè)信息,讓他們知道到底哪個(gè)版本是能夠非常好的運(yùn)作,哪些不太好。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1094

    瀏覽量

    41275
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8503

    瀏覽量

    134635
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5561

    瀏覽量

    122800

原文標(biāo)題:Kaggle創(chuàng)始人Goldbloom:我們是這樣做數(shù)據(jù)科學(xué)競賽的

文章出處:【微信號:BigDataDigest,微信公眾號:大數(shù)據(jù)文摘】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    星通時(shí)頻創(chuàng)始人出席2025高新技術(shù)企業(yè)高質(zhì)量發(fā)展論壇

    7月5日,2025高新技術(shù)企業(yè)高質(zhì)量發(fā)展論壇在廣州成功舉辦。星通時(shí)頻創(chuàng)始人陸建兵先生作為嘉賓出席,并以"中小企業(yè)創(chuàng)新突圍之道"為主題發(fā)表觀點(diǎn)。陸建兵先生結(jié)合星通時(shí)頻22年的發(fā)展
    的頭像 發(fā)表于 07-14 17:11 ?346次閱讀
    星通時(shí)頻<b class='flag-5'>創(chuàng)始人</b>出席2025高新技術(shù)企業(yè)高質(zhì)量發(fā)展論壇

    守極致之心 堅(jiān)信念之本,神眸助力教育公益:神眸創(chuàng)始人楊作興為母校遂寧中學(xué)設(shè)立專項(xiàng)獎(jiǎng)助學(xué)金

    2025年6月28日,神眸品牌創(chuàng)始人、杭州研極微電子有限公司董事長、清華大學(xué)楊作興博士,與神眸品牌合伙、明智云科技創(chuàng)始人許明,以遂寧中學(xué)高91級、高2000級杰出校友身份重返母校。與四川省遂寧中學(xué)
    的頭像 發(fā)表于 07-01 16:10 ?302次閱讀
    守極致之心 堅(jiān)信念之本,神眸助力教育公益:神眸<b class='flag-5'>創(chuàng)始人</b>楊作興為母校遂寧中學(xué)設(shè)立專項(xiàng)獎(jiǎng)助學(xué)金

    恭賀 | 晟鵬創(chuàng)始人成會明院士當(dāng)選歐洲科學(xué)院院士!

    創(chuàng)始人成會明院士當(dāng)選歐洲科學(xué)院院士(ForeignMemberofAcademiaEuropaea)。歐洲科學(xué)院由英國皇家學(xué)會和法國、德國、意大利、荷蘭、瑞典等
    的頭像 發(fā)表于 06-24 06:33 ?289次閱讀
    恭賀 | 晟鵬<b class='flag-5'>創(chuàng)始人</b>成會明院士當(dāng)選歐洲<b class='flag-5'>科學(xué)</b>院院士!

    知存科技創(chuàng)始人向北大、清華、協(xié)和醫(yī)學(xué)院捐贈880萬激勵(lì)創(chuàng)新

    科技聯(lián)合創(chuàng)始人及首席科學(xué)家 郭昕婕(右) 作為先進(jìn)存內(nèi)計(jì)算芯片產(chǎn)業(yè)領(lǐng)軍人物,北京大學(xué)是王紹迪與郭昕婕博士的學(xué)術(shù)起點(diǎn),清華大學(xué)、北京協(xié)和醫(yī)學(xué)院在未來科技領(lǐng)域和人才培養(yǎng)上都給國家做出了重大貢獻(xiàn)。近年來,集成電路產(chǎn)業(yè)逐漸成為國家
    的頭像 發(fā)表于 05-06 17:35 ?751次閱讀
    知存科技<b class='flag-5'>創(chuàng)始人</b>向北大、清華、協(xié)和醫(yī)學(xué)院捐贈880萬激勵(lì)創(chuàng)新

    DeepSeek創(chuàng)始人梁文鋒入選《時(shí)代》最具影響力100

    據(jù)外媒報(bào)道,美國《時(shí)代》周刊2025年全球100最具影響力人物正式公布了榜單。根據(jù)榜單數(shù)據(jù)顯示,DeepSeek創(chuàng)始人梁文鋒上榜?!稌r(shí)代》周刊這樣描述;DeepSeek于今年1月發(fā)布的生成式AI
    的頭像 發(fā)表于 04-19 11:21 ?632次閱讀

    魔視智能虞正華榮膺2024福布斯中國顛覆力創(chuàng)始人

    近日,首屆GBRC全球化創(chuàng)始人峰會暨2024福布斯中國新時(shí)代顛覆力創(chuàng)始人評選頒獎(jiǎng)典禮在上海外灘瑞吉酒店隆重舉行。虞正華博士受邀出席頒獎(jiǎng)典禮現(xiàn)場,榮膺福布斯中國頒發(fā)的“新時(shí)代顛覆力創(chuàng)始人”獎(jiǎng)項(xiàng),與百名企業(yè)家共同見證這一榮耀時(shí)刻。
    的頭像 發(fā)表于 04-12 09:29 ?691次閱讀

    士模微電子創(chuàng)始人入選2025 IEEE Fellow

    近日,清華大學(xué)電子系長聘教授、士模微電子創(chuàng)始人孫楠博士入選2025年IEEEFellow。孫楠清華大學(xué)電子系長聘教授士模微電子創(chuàng)始人入選理由
    的頭像 發(fā)表于 02-24 10:21 ?1354次閱讀
    士模微電子<b class='flag-5'>創(chuàng)始人</b>入選2025 IEEE Fellow

    DeepSeek創(chuàng)始人梁文峰身家或超黃仁勛

    近日,AI企業(yè)DeepSeek備受矚目,其創(chuàng)始人梁文峰的身家或有望躋身全球富豪榜。據(jù)對多位初創(chuàng)公司創(chuàng)始人及AI專家的深入調(diào)研,DeepSeek的估值區(qū)間被大膽預(yù)估在10億美元至驚人的1500億美元
    的頭像 發(fā)表于 02-12 11:33 ?1113次閱讀

    DeepSeek創(chuàng)始人的60條思考

    摘要:在整個(gè)2025年春節(jié)期間,DeepSeek熱度持續(xù)攀升,超預(yù)期的產(chǎn)品體驗(yàn)帶來了口碑裂變。DeepSeek創(chuàng)始人梁文鋒的公開報(bào)道并不多。但在DeepSeek火爆之前,他曾于2023和2024年
    的頭像 發(fā)表于 02-09 15:50 ?707次閱讀
    DeepSeek<b class='flag-5'>創(chuàng)始人</b>的60條思考

    DeepMind創(chuàng)始人預(yù)計(jì)年內(nèi)有AI設(shè)計(jì)藥物進(jìn)入臨床試驗(yàn)

    近日,英國人工智能公司DeepMind的創(chuàng)始人兼首席執(zhí)行官德米斯·哈薩比斯(Demis Hassabis)透露,預(yù)計(jì)在今年年底前,將有人工智能(AI)設(shè)計(jì)的藥物進(jìn)入臨床試驗(yàn)階段。
    的頭像 發(fā)表于 01-24 15:46 ?2207次閱讀

    博泰車聯(lián)網(wǎng)創(chuàng)始人應(yīng)臻愷分享創(chuàng)業(yè)歷程

    。上海市五一勞動(dòng)獎(jiǎng)?wù)芦@得者、博泰車聯(lián)網(wǎng)創(chuàng)始人兼董事長應(yīng)臻愷(應(yīng)宜倫),在直播課上分享了他在車聯(lián)網(wǎng)領(lǐng)域的創(chuàng)業(yè)歷程。
    的頭像 發(fā)表于 12-31 10:53 ?1038次閱讀

    新思科技創(chuàng)始人榮獲2024年羅伯特-諾伊斯獎(jiǎng)

    作為半導(dǎo)體行業(yè)公認(rèn)的行業(yè)領(lǐng)導(dǎo)者和遠(yuǎn)見卓識者,新思科技創(chuàng)始人兼執(zhí)行主席Aart de Geus博士被授予半導(dǎo)體行業(yè)最高榮譽(yù)羅伯特-諾伊斯獎(jiǎng)(Robert N. Noyce Award)。
    的頭像 發(fā)表于 11-27 11:43 ?643次閱讀

    貿(mào)澤電子對FIRST創(chuàng)始人兼發(fā)明家Dean Kamen進(jìn)行視頻專訪

    ? (For Inspiration and Recognition of Science and Technology) 創(chuàng)始人Dean Kamen的視頻專訪。這家非營利機(jī)構(gòu)致力于通過機(jī)器實(shí)踐項(xiàng)目,推動(dòng)
    發(fā)表于 09-12 17:44 ?323次閱讀

    新思科技創(chuàng)始人Aart de Geus博士獲半導(dǎo)體行業(yè)最高榮譽(yù)羅伯特-諾伊斯獎(jiǎng)

    華盛頓州, 2024 年 8 月 12 日 – 近日,新思科技(Synopsys, Inc.,納斯達(dá)克股票代碼:SNPS)創(chuàng)始人兼執(zhí)行主席Aart de Geus博士獲得2024年半導(dǎo)體行業(yè)最高榮譽(yù)
    發(fā)表于 08-12 13:38 ?608次閱讀

    耐能聯(lián)合創(chuàng)始人喜獲首屆亞裔美國先鋒獎(jiǎng)?wù)?/a>

    ? 7月27日,于斯坦福大學(xué)的紀(jì)念禮堂現(xiàn)場(Stanford Memorial Auditorium),耐能聯(lián)合創(chuàng)始人張懋中教授因其卓越的貢獻(xiàn)獲授2024首屆亞裔美國先鋒獎(jiǎng)?wù)?Asian
    的頭像 發(fā)表于 07-31 10:30 ?750次閱讀