現(xiàn)在,不了解一些機(jī)器學(xué)習(xí)技能,可能都會(huì)覺(jué)得自己有些out了。但過(guò)去苦于沒(méi)有數(shù)據(jù)、沒(méi)有GPU,沒(méi)有算法,很多感興趣的朋友就望而卻步了。今天就不同了,開(kāi)放的數(shù)據(jù)比比皆是,算力也逐漸強(qiáng)大,還有數(shù)不清的線上課程資料。如果你想開(kāi)啟機(jī)器學(xué)習(xí)的大門(mén),就和我們一起來(lái)看看這份豐富的資源清單吧!我們將從數(shù)據(jù)、算力、算法和在線教育等四個(gè)方面,為你進(jìn)入機(jī)器學(xué)習(xí)的大門(mén)掃清障礙,大步向前!
數(shù)據(jù)
數(shù)據(jù)是算法的養(yǎng)料,可以說(shuō)這一波深度學(xué)習(xí)的革命就來(lái)源于豐富的數(shù)據(jù)給予的充足養(yǎng)分,才滋養(yǎng)了人工智能再一次的蓬勃發(fā)展!
數(shù)據(jù)集嘛,圖像、文本、語(yǔ)音,你想要的應(yīng)該都能找到。包括圖像領(lǐng)域著名的ImageNet,kitti等數(shù)據(jù)集
也包括推薦系統(tǒng)方面的IMDb和Million Song
還包括自然語(yǔ)言處理方面的MS MARCO datasets等等著名的數(shù)據(jù)。
Github上的小伙伴已經(jīng)為我們準(zhǔn)備好了一份數(shù)據(jù)大餐,如果你想要數(shù)據(jù)可以到這里盡情下載,除了深度學(xué)習(xí)數(shù)據(jù)外,還包括經(jīng)濟(jì)、醫(yī)學(xué)、農(nóng)業(yè)等等各個(gè)行業(yè)的豐富數(shù)據(jù),總有一款適合你的興趣。
https://github.com/awesomedata/awesome-public-datasets
如果這還嫌不夠,Kaggle還有一些令人驚喜的優(yōu)質(zhì)數(shù)據(jù)集。
https://www.kaggle.com/datasets
這里有著名的鳶尾花數(shù)據(jù)集
也有精彩大片的數(shù)據(jù)集
還有可愛(ài)的小蘑菇,讓機(jī)器學(xué)習(xí)看看能不能吃:
甚至還有美國(guó)大選的數(shù)據(jù)集:
無(wú)論是使用公開(kāi)的數(shù)據(jù)集,還是通過(guò)Python從web上抓取數(shù)據(jù),現(xiàn)在每個(gè)人都可以有機(jī)會(huì)訪問(wèn)高質(zhì)量的數(shù)據(jù)集。當(dāng)然,大型科技公司會(huì)把數(shù)據(jù)私有化以便從中挖掘出最大的價(jià)值,但卻還有很多人不斷的努力為世界創(chuàng)造出更多開(kāi)放的優(yōu)質(zhì)數(shù)據(jù),讓初學(xué)者、工程師和數(shù)據(jù)科學(xué)家們都能利用這些數(shù)據(jù)訓(xùn)練模型、開(kāi)啟機(jī)器學(xué)習(xí)的大門(mén)。
計(jì)算
有了數(shù)據(jù)后要找地方進(jìn)行計(jì)算也是個(gè)頭疼的問(wèn)題。雖然對(duì)于普通的機(jī)器學(xué)習(xí)問(wèn)題來(lái)說(shuō),你的筆記本就能夠搞定,但是對(duì)于深度學(xué)習(xí)任務(wù)或者大數(shù)據(jù)量的數(shù)據(jù)集,小本本的算力就捉襟見(jiàn)肘了。這時(shí)候,似乎只有眼饞別人實(shí)驗(yàn)室的GPU了。神經(jīng)網(wǎng)絡(luò)需要使用大規(guī)模并行計(jì)算,GPU非常適合這個(gè)工作。不幸的是,GPU還是比較貴的。
如果你的筆記本有可以使用的顯卡,那就十分愉快啦。如果沒(méi)有的話,可以考慮入手一塊1050之類(lèi)的入門(mén)版GPU來(lái)開(kāi)啟你的加速之旅,或者也可以通過(guò)亞馬遜、谷歌、微軟以及國(guó)內(nèi)各家云服務(wù)廠商提供的GPU實(shí)例來(lái)進(jìn)行計(jì)算,一頓飯錢(qián)就可以跑好長(zhǎng)時(shí)間了。
當(dāng)然,還有免費(fèi)的午餐,谷歌的Colab和kaggle的kernel中,你可以申請(qǐng)開(kāi)啟GPU來(lái)運(yùn)行自己的算法處理數(shù)據(jù)。更為方便的是,它們都是基于notebook的格式,使得程序的編寫(xiě)變得更加直觀方便。
另外各大高校內(nèi)一般都設(shè)有計(jì)算中心,校內(nèi)價(jià)格也十分便宜,對(duì)于學(xué)生來(lái)說(shuō)是一個(gè)不錯(cuò)的選擇。
算法
有人說(shuō),算法是一種充滿價(jià)值的商品,一個(gè)優(yōu)秀的算法可能價(jià)值連城。幸運(yùn)的是,機(jī)器學(xué)習(xí)領(lǐng)域已經(jīng)建立了開(kāi)源共享的良好文化。無(wú)論是在NIPS還是ICLR會(huì)議上,研究人員非常樂(lè)意分享他們成果。像Github和reddit一樣的社區(qū)在源源不斷地交流、碰撞出各種新思想和新方法,這里的代碼可以作為你學(xué)習(xí)和研究的起點(diǎn)。
對(duì)于學(xué)術(shù)型的小伙伴來(lái)說(shuō),如果想跟上最新的研究,可以到Arxiv閱讀最新的論文,幾乎覆蓋了全球范圍內(nèi)各個(gè)研究團(tuán)隊(duì)的最新研究結(jié)果。
教育
有了代碼,也有了數(shù)據(jù),有了計(jì)算能力,現(xiàn)在只需要學(xué)習(xí)如何使用它們。你可以從coursera上開(kāi)始你的機(jī)器學(xué)習(xí)入門(mén)之旅,有包括吳恩達(dá)在內(nèi)的名師指路,學(xué)習(xí)一定會(huì)有個(gè)好的開(kāi)始。同時(shí)也可以在網(wǎng)站上找到各種優(yōu)秀的機(jī)器學(xué)習(xí)入門(mén)書(shū)籍,深入學(xué)習(xí)后你會(huì)發(fā)現(xiàn)無(wú)窮的魅力!
同時(shí)網(wǎng)上豐富的視頻教程也能讓你學(xué)習(xí)到無(wú)數(shù)的實(shí)踐、思想和機(jī)器學(xué)習(xí)的無(wú)數(shù)技巧~
是不是有點(diǎn)小激動(dòng)呢?這是一個(gè)不可思議的時(shí)代。在這個(gè)飛速變化的時(shí)代里,機(jī)器學(xué)習(xí)可以幫助我們以另一種我們不擅長(zhǎng)的方式理解這個(gè)世界。它可以幫助我們比以往更有效地創(chuàng)造和發(fā)現(xiàn)無(wú)數(shù)的新事物。現(xiàn)在我們獲得了這種神力了,聰明的你一定會(huì)善加利用的!
-
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8553瀏覽量
136954 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1236瀏覽量
26197 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5599瀏覽量
124398
原文標(biāo)題:掃盲貼 | 再也沒(méi)有借口不學(xué)機(jī)器學(xué)習(xí)了!全方位資源消滅你不學(xué)習(xí)的接口
文章出處:【微信號(hào):thejiangmen,微信公眾號(hào):將門(mén)創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
IDM大廠MEMS向前,臺(tái)廠進(jìn)入障礙
新技術(shù):激光蝕刻超級(jí)毛細(xì)為液冷計(jì)算機(jī)研發(fā)掃清障礙
機(jī)器學(xué)習(xí)進(jìn)入游戲的過(guò)程的探討
中國(guó)工業(yè)機(jī)器人革命正大步向前
為工業(yè)級(jí)Linux應(yīng)用掃清障礙 瑞薩電子給出新方案
華為首款折疊屏手機(jī)MateX入網(wǎng) 搭載華為首款7nm5G芯片巴龍5000
歐司朗宣布撤銷(xiāo)與AMS現(xiàn)有的中止條約 為AMS發(fā)起公開(kāi)收購(gòu)要約掃清了障礙
5G發(fā)展將掃清應(yīng)用障礙,推動(dòng)AR/VR市場(chǎng)的成熟和發(fā)展
機(jī)器人進(jìn)行電纜管道清障工作,用時(shí)19分鐘
簡(jiǎn)要地學(xué)習(xí)x86硬件體系,為閱讀linux0.12內(nèi)核源碼掃清障礙
為進(jìn)入機(jī)器學(xué)習(xí)的大門(mén)掃清障礙,大步向前!
評(píng)論