在過(guò)去的幾年里,機(jī)器學(xué)習(xí)的優(yōu)異表現(xiàn)使得它在各領(lǐng)域都突飛猛進(jìn)的發(fā)展。由于有充足的資金支持,激動(dòng)人心和妙趣橫生的科技產(chǎn)出,廣闊的成長(zhǎng)空間,越來(lái)越多的人開(kāi)始涉足學(xué)習(xí)機(jī)器學(xué)習(xí)相關(guān)的知識(shí)?,F(xiàn)在比較主流的獲取相關(guān)知識(shí)的方式是學(xué)校和在線課程。但機(jī)器學(xué)習(xí)的算法最后會(huì)用在真實(shí)世界的商業(yè)問(wèn)題中,并成為為客戶創(chuàng)造價(jià)值的工具。機(jī)器學(xué)習(xí)模型的算法精度,可解釋性,速度和存儲(chǔ)能力以及最后可創(chuàng)造出的價(jià)值都需要考慮在內(nèi)。
本文我們將要談?wù)勊膫€(gè)無(wú)法從學(xué)校或各種線上平臺(tái)學(xué)習(xí)到的機(jī)器學(xué)習(xí)技巧,這些技巧有助于機(jī)器學(xué)習(xí)算法應(yīng)用于真實(shí)的世界中,創(chuàng)造實(shí)際價(jià)值。希望這篇文章能帶給你一些實(shí)踐中的啟發(fā)和價(jià)值。
銜接機(jī)器學(xué)習(xí)算法與商業(yè)目標(biāo)
包括機(jī)器學(xué)習(xí)在內(nèi)的軟件行業(yè)中,我們都需要注意將理論技能和商業(yè)目標(biāo)聯(lián)系起來(lái)。如果想成為領(lǐng)域內(nèi)的專家,這兩方面的知識(shí)都是必不可少的。
在教室里我們能學(xué)到很多理論技能方面的知識(shí):如何編寫(xiě)Python程序,機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)的算法,技術(shù)報(bào)告的撰寫(xiě)等等,這些零碎的知識(shí)點(diǎn)往往與商業(yè)領(lǐng)域孤立脫離。當(dāng)你需要在該領(lǐng)域內(nèi)實(shí)際工作時(shí),你工作的每一個(gè)細(xì)節(jié)問(wèn)題均與實(shí)際的商業(yè)相聯(lián)系。為什么你的領(lǐng)導(dǎo)要你優(yōu)化現(xiàn)在系統(tǒng)的精度?因?yàn)楦玫木纫馕吨嗟膬r(jià)值,更好的產(chǎn)品,從而意味著更多的客戶和收入!
為了對(duì)問(wèn)題有更好更深入的理解,我們需要抓住關(guān)鍵、聚焦重點(diǎn)。 當(dāng)你在行業(yè)內(nèi)有聲望時(shí),你也許有機(jī)會(huì)將商業(yè)目標(biāo)轉(zhuǎn)變?yōu)榧夹g(shù)目標(biāo),為了完成這項(xiàng)工作,科技手段是不可或缺的途徑。當(dāng)創(chuàng)造實(shí)際價(jià)值時(shí),一定要注意將科技與商業(yè)聯(lián)系思考。一定要記住理論與實(shí)際相結(jié)合是我們?nèi)〉贸晒Φ挠辛ΡWC!
模型選擇
在學(xué)校中,我們學(xué)到了各種各樣的機(jī)器學(xué)習(xí)模型:線性回歸模型,支持向量機(jī),神經(jīng)網(wǎng)絡(luò)...好像有成百上千種那么多!那么問(wèn)題來(lái)了,我們?cè)撚媚姆N?你也許之前用過(guò)他們種的許多種:碰巧編寫(xiě)過(guò)某幾種算法或是從TensorFlow和Scikit Learn這樣的庫(kù)中調(diào)用過(guò)。你想過(guò)為什么要選擇這種算法嗎?現(xiàn)在深度學(xué)習(xí)算法十分流行,我們可以直接默認(rèn)使用這種算法嗎?
正如科技和工程中的本質(zhì)特征一樣:所有的方法都需要權(quán)衡利弊。在實(shí)際應(yīng)用的過(guò)程中,需要仔細(xì)權(quán)衡每種算法是否適用于該種模型。在機(jī)器學(xué)習(xí)領(lǐng)域里“沒(méi)有免費(fèi)的午餐”。即:沒(méi)有一種機(jī)器學(xué)習(xí)算法是萬(wàn)能的,可適用于全部的問(wèn)題。不同種類機(jī)器學(xué)習(xí)算法的表現(xiàn)強(qiáng)烈的依賴于數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)量。除非我們使用算法來(lái)檢驗(yàn)結(jié)果,不然無(wú)法事先判別判別模型有效性。

一種算法并不永遠(yuǎn)比另外一種好用,每種機(jī)器學(xué)習(xí)的算法均有其特點(diǎn),可以用來(lái)快速選擇和協(xié)調(diào)各種參數(shù)。比如:神經(jīng)網(wǎng)絡(luò)(和深度學(xué)習(xí))一般準(zhǔn)確性較高但是可解釋性較差。當(dāng)你需要確切的知道結(jié)果的來(lái)源時(shí),就不適宜選擇這種方法;但是如果你只關(guān)心最后的輸出結(jié)果,那么這種方法就非常適合!而對(duì)于某些商業(yè)問(wèn)題來(lái)說(shuō),從最簡(jiǎn)單的模型開(kāi)始是一個(gè)不錯(cuò)的選擇。在工程實(shí)踐中,往往都是先開(kāi)發(fā)出一個(gè)最簡(jiǎn)單的可用模型而后再逐漸優(yōu)化的。一開(kāi)始就使用復(fù)雜的模型想要覆蓋所有的情況,會(huì)讓你的工作陷入很多的困難中去。
模型部署
機(jī)器學(xué)習(xí)教育過(guò)程中通常傾向于深入學(xué)習(xí)機(jī)器學(xué)習(xí)算法,教導(dǎo)我們從技術(shù)層面上理解他們的運(yùn)作方式。一旦你的模型被完全訓(xùn)練,將用某些數(shù)據(jù)集來(lái)標(biāo)記模型的有效性。一旦模型被驗(yàn)證可以很好的完成任務(wù),全套的軟件產(chǎn)品將被進(jìn)行部署。
站在更高的層面來(lái)理解部署的含義:將算法插入到已有的系統(tǒng)中去。模型的功能在于當(dāng)給出輸入時(shí)能做出某種對(duì)于系統(tǒng)的有效預(yù)測(cè),因此,從系統(tǒng)層面理解整個(gè)軟件是十分必要的。
在學(xué)校中所學(xué)的是技術(shù)層面的知識(shí)基石,在商業(yè)中應(yīng)用和發(fā)現(xiàn)產(chǎn)品的價(jià)值是最終目標(biāo),將軟件系統(tǒng)中各個(gè)部分有機(jī)的結(jié)合起來(lái)是處于中間的必經(jīng)步驟。我們需要明白系統(tǒng)的架構(gòu),不同區(qū)域之間的連接,然后你才能從宏觀層面上把握模型在系統(tǒng)中所處的地位和發(fā)揮的作用。在這樣的基礎(chǔ)上銜接系統(tǒng)中不同模塊的功能、揚(yáng)長(zhǎng)避短才能發(fā)揮出模型最大的效用。
投入與產(chǎn)出的平衡
當(dāng)在學(xué)?;蛘咴谠诰€課程的學(xué)習(xí)中,我們有充分的時(shí)間進(jìn)行實(shí)驗(yàn)。我們甚至可以一直做研究,發(fā)現(xiàn)最新最好的算法。但是在現(xiàn)實(shí)生活中,這樣卻不是最有效的方式。商業(yè)講究在有效的時(shí)間和資源內(nèi)將利益最大化,不可能花一整天都額時(shí)間來(lái)驗(yàn)證手邊所有的方法中哪一種是最好的方法。我們需要找到最有效的途徑來(lái)決定最優(yōu)的方法。
我們需要花最少的錢(qián)取得最大的效果,也許有一種新的優(yōu)秀的回歸算法,但是它在技術(shù)上既不成熟,還可能在實(shí)施過(guò)程中消耗大量的時(shí)間。這個(gè)時(shí)候,與其花費(fèi)大量的時(shí)間修改算法,不如通過(guò)輸入更多的數(shù)據(jù)來(lái)訓(xùn)練現(xiàn)有的模型。你的算法是否比原來(lái)的算法更加精確并不是關(guān)鍵,通過(guò)各種各樣的手段,更加快速的達(dá)到結(jié)果優(yōu)化的目的才是關(guān)鍵。
在學(xué)校中的慣用思維是從單方面著眼解決問(wèn)題,在工作中卻需要從各方面權(quán)衡,找到最高效的方法并應(yīng)用。機(jī)器學(xué)習(xí)和所有其他的軟件簡(jiǎn)而言之都是一系列工具,花最少的錢(qián)取得最大的效果意味著如何最好的利用這些工具來(lái)解決工作中的問(wèn)題。目標(biāo)導(dǎo)向的實(shí)際工作意味著解決問(wèn)題才是關(guān)鍵。
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4825瀏覽量
106731 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8540瀏覽量
136205 -
數(shù)據(jù)科學(xué)
+關(guān)注
關(guān)注
0文章
168瀏覽量
10741
原文標(biāo)題:紙上得來(lái)終覺(jué)淺:四個(gè)你可能無(wú)法從書(shū)本中學(xué)習(xí)到的機(jī)器學(xué)習(xí)技巧
文章出處:【微信號(hào):thejiangmen,微信公眾號(hào):將門(mén)創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
楊強(qiáng)教授:從機(jī)器學(xué)習(xí)到遷移學(xué)習(xí)
【下載】《機(jī)器學(xué)習(xí)》+《機(jī)器學(xué)習(xí)實(shí)戰(zhàn)》
什么是機(jī)器學(xué)習(xí)? 機(jī)器學(xué)習(xí)基礎(chǔ)入門(mén)
單片機(jī)學(xué)習(xí)的四個(gè)階段
Spark機(jī)器學(xué)習(xí)庫(kù)的各種機(jī)器學(xué)習(xí)算法
從零到python機(jī)器學(xué)習(xí)大神的7個(gè)步驟
根據(jù)學(xué)習(xí)經(jīng)驗(yàn)以及教學(xué)經(jīng)驗(yàn)總結(jié)出學(xué)習(xí)單片機(jī)的4個(gè)步驟
從數(shù)據(jù)、算力、算法、教學(xué)總結(jié)機(jī)器學(xué)習(xí)的民主化
從四個(gè)經(jīng)典角度看機(jī)器學(xué)習(xí)的本質(zhì)
通過(guò)Python就能讀懂機(jī)器學(xué)習(xí)

談?wù)勊膫€(gè)無(wú)法從學(xué)?;蚋鞣N線上平臺(tái)學(xué)習(xí)到的機(jī)器學(xué)習(xí)技巧
評(píng)論