chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

你了解人工智能?機器學(xué)習?深度學(xué)習?真的了解了?

人工智能實訓(xùn)營 ? 2018-07-26 15:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群


有三個詞,這兩年出現(xiàn)的頻率越來越高:人工智能AI),機器學(xué)習(ML),深度學(xué)習(DL),到底他們哥仨是什么關(guān)系?今天小編化繁為簡,用幾張圖帶你迅速看明白。關(guān)系如圖,從提出概念的時間上來看也很清楚:

人工智能AI模擬人腦,辨認哪個是蘋果,哪個是橙子。

機器學(xué)習ML:根據(jù)特征在水果攤買橙子,隨著見過的橙子和其他水果越來越多,辨別橙子的能力越來越強,不會再把香蕉當橙子。

機器學(xué)習強調(diào)“學(xué)習”而不是程序本身,通過復(fù)雜的算法來分析大量的數(shù)據(jù),識別數(shù)據(jù)中的模式,并做出一個預(yù)測--不需要特定的代碼。在樣本的數(shù)量不斷增加的同時,自我糾正完善“學(xué)習目的”,可以從自身的錯誤中學(xué)習,提高識別能力。

深度學(xué)習DL:超市里有3種蘋果和5種橙子,通過數(shù)據(jù)分析比對,把超市里的品種和數(shù)據(jù)建立聯(lián)系,通過水果的顏色、形狀、大小、成熟時間和產(chǎn)地等信息,分辨普通橙子和血橙,從而選擇購買用戶需要的橙子品種。

1、機器學(xué)習簡史

哲學(xué)上的三大終極問題:是誰?從哪來?到哪去?用在任何地方都是有意義的。

——尼古拉斯·沃布吉·道格拉斯·碩德

雖然人工智能并不是最近幾年才興起的,但在它一直作為科幻元素出現(xiàn)在大眾視野中。自從AlphaGo戰(zhàn)勝李世石之后,人工智能突然間成了坊間談資,仿佛人類已經(jīng)造出了超越人類智慧的機器。而人工智能的核心技術(shù)機器學(xué)習及其子領(lǐng)域深度學(xué)習一時間成了人們的掌上明珠。面對這個從天而降的“怪物”,樂觀者有之,悲觀者亦有之。但追溯歷史,我們會發(fā)現(xiàn)機器學(xué)習的技術(shù)爆發(fā)有其歷史必然性,屬于技術(shù)發(fā)展的必然產(chǎn)物。而理清機器學(xué)習的發(fā)展脈絡(luò)有助于我們整體把握機器學(xué)習,或者人工智能的技術(shù)框架,有助于從“道”的層面理解這一技術(shù)領(lǐng)域。這一節(jié)就先從三大究極哲學(xué)問題中的后兩個——從哪來、到哪去入手,整體把握機器學(xué)習,而后再從“術(shù)”的角度深入學(xué)習,解決是誰的問題。(本來想加個縱時間軸,無奈查了半天沒找到方法,如果有人知道,求分享)



圖一 機器學(xué)習發(fā)展史(圖片來源:Brief History of Machine Learning)


1.1 誕生并奠定基礎(chǔ)時期

1949, Hebb, Hebbian Learning theory

赫布于1949年基于神經(jīng)心理的提出了一種學(xué)習方式,該方法被稱之為赫布學(xué)習理論。大致描述為:

假設(shè)反射活動的持續(xù)性或反復(fù)性會導(dǎo)致細胞的持續(xù)性變化并增加其穩(wěn)定性,當一個神經(jīng)元A能持續(xù)或反復(fù)激發(fā)神經(jīng)元B時,其中一個或兩個神經(jīng)元的生長或代謝過程都會變化。

Let us assume that the persistence or repetition of a reverberatory activity (or “trace”) tends to induce lasting cellular changes that add to its stability.… When an axon of cell A is near enough to excite a cell B and repeatedly or persistently takes part in firing it, some growth process or metabolic change takes place in one or both cells such that A’s efficiency, as one of the cells firing B, is increased

從人工神經(jīng)元或人工神經(jīng)網(wǎng)絡(luò)角度來看,該學(xué)習理論簡單地解釋了循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)中結(jié)點之間的相關(guān)性關(guān)系(權(quán)重),即:當兩個節(jié)點同時發(fā)生變化(無論是positive還是negative),那么節(jié)點之間有很強的正相關(guān)性(positive weight);如果兩者變化相反,那么說明有負相關(guān)性(negative weight)。

1950, Alan Turing, The Turing test

圖二 圖靈測試(圖片來源:維基百科)

1950年,阿蘭·圖靈創(chuàng)造了圖靈測試來判定計算機是否智能。圖靈測試認為,如果一臺機器能夠與人類展開對話(通過電傳設(shè)備)而不能被辨別出其機器身份,那么稱這臺機器具有智能。這一簡化使得圖靈能夠令人信服地說明“思考的機器”是可能的。

2014年6月8日,一個叫做尤金·古斯特曼的聊天機器人成功讓人類相信它是一個13歲的男孩,成為有史以來首臺通過圖靈測試的計算機。這被認為是人工智能發(fā)展的一個里程碑事件。

1952, Arthur Samuel, “Machine Learning”

圖三 塞繆爾(圖片來源:Brief History of Machine Learning)

1952,IBM科學(xué)家亞瑟·塞繆爾開發(fā)了一個跳棋程序。該程序能夠通過觀察當前位置,并學(xué)習一個隱含的模型,從而為后續(xù)動作提供更好的指導(dǎo)。塞繆爾發(fā)現(xiàn),伴隨著該游戲程序運行時間的增加,其可以實現(xiàn)越來越好的后續(xù)指導(dǎo)。通過這個程序,塞繆爾駁倒了普羅維登斯提出的機器無法超越人類,像人類一樣寫代碼和學(xué)習的模式。他創(chuàng)造了“機器學(xué)習”這一術(shù)語,并將它定義為:

可以提供計算機能力而無需顯式編程的研究領(lǐng)域

a field of study that gives computer the ability without being explicitly programmed.

1957, Rosenblatt, Perceptron

640?wx_fmt=jpeg

圖四 感知機線性分類器(圖片來源:維基百科)

1957年,羅森·布拉特基于神經(jīng)感知科學(xué)背景提出了第二模型,非常的類似于今天的機器學(xué)習模型。這在當時是一個非常令人興奮的發(fā)現(xiàn),它比赫布的想法更適用。基于這個模型羅森·布拉特設(shè)計出了第一個計算機神經(jīng)網(wǎng)絡(luò)——感知機(the perceptron),它模擬了人腦的運作方式。羅森·布拉特對感知機的定義如下:

感知機旨在說明一般智能系統(tǒng)的一些基本屬性,它不會因為個別特例或通常不知道的東西所束縛住,也不會因為那些個別生物有機體的情況而陷入混亂。

The perceptron is designed to illustrate some of the fundamental properties of intelligent systems in general, without becoming too deeply enmeshed in the special, and frequently unknown, conditions which hold for particular biological organisms.

3年后,維德羅首次使用Delta學(xué)習規(guī)則(即最小二乘法)用于感知器的訓(xùn)練步驟,創(chuàng)造了一個良好的線性分類器。

1967年,The nearest neighbor algorithm

640?wx_fmt=jpeg

圖五 kNN算法(圖片來源:維基百科)

1967年,最近鄰算法(The nearest neighbor algorithm)出現(xiàn),使計算機可以進行簡單的模式識別。kNN算法的核心思想是如果一個樣本在特征空間中的k個最相鄰的樣本中的大多數(shù)屬于某一個類別,則該樣本也屬于這個類別,并具有這個類別上樣本的特性。這就是所謂的“少數(shù)聽從多數(shù)”原則。

1969, Minsky, XOR problem

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

圖六 XOR問題,數(shù)據(jù)線性不可分

1969年馬文·明斯基提出了著名的XOR問題,指出感知機在線性不可分的數(shù)據(jù)分布上是失效的。此后神經(jīng)網(wǎng)絡(luò)的研究者進入了寒冬,直到 1980 年才再一次復(fù)蘇。

1.2 停滯不前的瓶頸時期

從60年代中到70年代末,機器學(xué)習的發(fā)展步伐幾乎處于停滯狀態(tài)。無論是理論研究還是計算機硬件限制,使得整個人工智能領(lǐng)域的發(fā)展都遇到了很大的瓶頸。雖然這個時期溫斯頓(Winston)的結(jié)構(gòu)學(xué)習系統(tǒng)和海斯·羅思(Hayes Roth)等的基于邏輯的歸納學(xué)習系統(tǒng)取得較大的進展,但只能學(xué)習單一概念,而且未能投入實際應(yīng)用。而神經(jīng)網(wǎng)絡(luò)學(xué)習機因理論缺陷也未能達到預(yù)期效果而轉(zhuǎn)入低潮。

1.3 希望之光重新點亮

1981, Werbos, Multi-Layer Perceptron (MLP)

640?wx_fmt=jpeg

圖七 多層感知機(或者人工神經(jīng)網(wǎng)絡(luò))

偉博斯在1981年的神經(jīng)網(wǎng)絡(luò)反向傳播(BP)算法中具體提出多層感知機模型。雖然BP算法早在1970年就已經(jīng)以“自動微分的反向模型(reverse mode of automatic differentiation)”為名提出來了,但直到此時才真正發(fā)揮效用,并且直到今天BP算法仍然是神經(jīng)網(wǎng)絡(luò)架構(gòu)的關(guān)鍵因素。有了這些新思想,神經(jīng)網(wǎng)絡(luò)的研究又加快了。

在1985-1986年,神經(jīng)網(wǎng)絡(luò)研究人員(魯梅爾哈特,辛頓,威廉姆斯-赫,尼爾森)相繼提出了使用BP算法訓(xùn)練的多參數(shù)線性規(guī)劃(MLP)的理念,成為后來深度學(xué)習的基石。

1986, Quinlan, Decision Trees

640?wx_fmt=jpeg

圖八 決策樹(圖片來源:維基百科)

在另一個譜系中,昆蘭于1986年提出了一種非常出名的機器學(xué)習算法,我們稱之為“決策樹”,更具體的說是ID3算法。這是另一個主流機器學(xué)習算法的突破點。此外ID3算法也被發(fā)布成為了一款軟件,它能以簡單的規(guī)劃和明確的推論找到更多的現(xiàn)實案例,而這一點正好和神經(jīng)網(wǎng)絡(luò)黑箱模型相反。

決策樹是一個預(yù)測模型,他代表的是對象屬性與對象值之間的一種映射關(guān)系。樹中每個節(jié)點表示某個對象,而每個分叉路徑則代表的某個可能的屬性值,而每個葉結(jié)點則對應(yīng)從根節(jié)點到該葉節(jié)點所經(jīng)歷的路徑所表示的對象的值。決策樹僅有單一輸出,若欲有復(fù)數(shù)輸出,可以建立獨立的決策樹以處理不同輸出。數(shù)據(jù)挖掘中決策樹是一種經(jīng)常要用到的技術(shù),可以用于分析數(shù)據(jù),同樣也可以用來作預(yù)測。

在ID3算法提出來以后,研究社區(qū)已經(jīng)探索了許多不同的選擇或改進(如ID4、回歸樹、CART算法等),這些算法仍然活躍在機器學(xué)習領(lǐng)域中。

1.4 現(xiàn)代機器學(xué)習的成型時期

1990, Schapire, Boosting

640?wx_fmt=jpeg

圖九 Boosting算法(圖片來源:百度百科)

1990年, Schapire最先構(gòu)造出一種多項式級的算法,這就是最初的Boosting算法。一年后 ,Freund提出了一種效率更高的Boosting算法。但是,這兩種算法存在共同的實踐上的缺陷,那就是都要求事先知道弱學(xué)習算法學(xué)習正確的下限。

1995年,F(xiàn)reund和schapire改進了Boosting算法,提出了 AdaBoost (Adaptive Boosting)算法,該算法效率和Freund于1991年提出的 Boosting算法幾乎相同,但不需要任何關(guān)于弱學(xué)習器的先驗知識,因而更容易應(yīng)用到實際問題當中。

Boosting方法是一種用來提高弱分類算法準確度的方法,這種方法通過構(gòu)造一個預(yù)測函數(shù)系列,然后以一定的方式將他們組合成一個預(yù)測函數(shù)。他是一種框架算法,主要是通過對樣本集的操作獲得樣本子集,然后用弱分類算法在樣本子集上訓(xùn)練生成一系列的基分類器。

1995, Vapnik and Cortes, Support Vector Machines (SVM)

640?wx_fmt=jpeg

圖十 支持向量機(圖片來源:維基百科)

支持向量機的出現(xiàn)是機器學(xué)習領(lǐng)域的另一大重要突破,該算法具有非常強大的理論地位和實證結(jié)果。那一段時間機器學(xué)習研究也分為NN和SVM兩派。然而,在2000年左右提出了帶核函數(shù)的支持向量機后。SVM在許多以前由NN占據(jù)的任務(wù)中獲得了更好的效果。此外,SVM相對于NN還能利用所有關(guān)于凸優(yōu)化、泛化邊際理論和核函數(shù)的深厚知識。因此SVM可以從不同的學(xué)科中大力推動理論和實踐的改進。

而神經(jīng)網(wǎng)絡(luò)遭受到又一個質(zhì)疑,通過Hochreiter等人1991年和Hochreiter等人在2001年的研究表明在應(yīng)用BP算法學(xué)習時,NN神經(jīng)元飽和后會出現(xiàn)梯度損失(gradient loss)的情況。簡單地說,在一定數(shù)量的epochs訓(xùn)練后,NN會產(chǎn)生過擬合現(xiàn)象,因此這一時期NN與SVM相比處于劣勢。

2001, Breiman, Random Forests(RF)

決策樹模型由布雷曼博士在2001年提出,它是通過集成學(xué)習的思想將多棵樹集成的一種算法,它的基本單元是決策樹,而它的本質(zhì)屬于機器學(xué)習的一大分支——集成學(xué)習(Ensemble Learning)方法。隨機森林的名稱中有兩個關(guān)鍵詞,一個是“隨機”,一個就是“森林”?!吧帧蔽覀兒芎美斫猓豢媒凶鰳?,那么成百上千棵就可以叫做森林了,這樣的比喻還是很貼切的,其實這也是隨機森林的主要思想—集成思想的體現(xiàn)。

其實從直觀角度來解釋,每棵決策樹都是一個分類器(假設(shè)現(xiàn)在針對的是分類問題),那么對于一個輸入樣本,N棵樹會有N個分類結(jié)果。而隨機森林集成了所有的分類投票結(jié)果,將投票次數(shù)最多的類別指定為最終的輸出,這就是一種最簡單的 Bagging 思想。

1.5 爆發(fā)時期

2006, Hinton, Deep Learning

在機器學(xué)習發(fā)展分為兩個部分,淺層學(xué)習(Shallow Learning)和深度學(xué)習(Deep Learning)。淺層學(xué)習起源上世紀20年代人工神經(jīng)網(wǎng)絡(luò)的反向傳播算法的發(fā)明,使得基于統(tǒng)計的機器學(xué)習算法大行其道,雖然這時候的人工神經(jīng)網(wǎng)絡(luò)算法也被稱為多層感知機,但由于多層網(wǎng)絡(luò)訓(xùn)練困難,通常都是只有一層隱含層的淺層模型。

神經(jīng)網(wǎng)絡(luò)研究領(lǐng)域領(lǐng)軍者Hinton在2006年提出了神經(jīng)網(wǎng)絡(luò)Deep Learning算法,使神經(jīng)網(wǎng)絡(luò)的能力大大提高,向支持向量機發(fā)出挑戰(zhàn)。 2006年,機器學(xué)習領(lǐng)域的泰斗Hinton和他的學(xué)生Salakhutdinov在頂尖學(xué)術(shù)刊物《Scince》上發(fā)表了一篇文章,開啟了深度學(xué)習在學(xué)術(shù)界和工業(yè)界的浪潮。

這篇文章有兩個主要的訊息:1)很多隱層的人工神經(jīng)網(wǎng)絡(luò)具有優(yōu)異的特征學(xué)習能力,學(xué)習得到的特征對數(shù)據(jù)有更本質(zhì)的刻劃,從而有利于可視化或分類;2)深度神經(jīng)網(wǎng)絡(luò)在訓(xùn)練上的難度,可以通過“逐層初始化”( layer-wise pre-training)來有效克服,在這篇文章中,逐層初始化是通過無監(jiān)督學(xué)習實現(xiàn)的。

2015年,為紀念人工智能概念提出60周年,LeCun、Bengio和Hinton推出了深度學(xué)習的聯(lián)合綜述。

深度學(xué)習可以讓那些擁有多個處理層的計算模型來學(xué)習具有多層次抽象的數(shù)據(jù)的表示。這些方法在許多方面都帶來了顯著的改善,包括最先進的語音識別、視覺對象識別、對象檢測和許多其它領(lǐng)域,例如藥物發(fā)現(xiàn)和基因組學(xué)等。深度學(xué)習能夠發(fā)現(xiàn)大數(shù)據(jù)中的復(fù)雜結(jié)構(gòu)。它是利用BP算法來完成這個發(fā)現(xiàn)過程的。BP算法能夠指導(dǎo)機器如何從前一層獲取誤差而改變本層的內(nèi)部參數(shù),這些內(nèi)部參數(shù)可以用于計算表示。深度卷積網(wǎng)絡(luò)在處理圖像、視頻、語音和音頻方面帶來了突破,而遞歸網(wǎng)絡(luò)在處理序列數(shù)據(jù),比如文本和語音方面表現(xiàn)出了閃亮的一面。

當前統(tǒng)計學(xué)習領(lǐng)域最熱門方法主要有deep learning和SVM(supportvector machine),它們是統(tǒng)計學(xué)習的代表方法??梢哉J為神經(jīng)網(wǎng)絡(luò)與支持向量機都源自于感知機。

神經(jīng)網(wǎng)絡(luò)與支持向量機一直處于“競爭”關(guān)系。SVM應(yīng)用核函數(shù)的展開定理,無需知道非線性映射的顯式表達式;由于是在高維特征空間中建立線性學(xué)習機,所以與線性模型相比,不但幾乎不增加計算的復(fù)雜性,而且在某種程度上避免了“維數(shù)災(zāi)難”。而早先的神經(jīng)網(wǎng)絡(luò)算法比較容易過訓(xùn)練,大量的經(jīng)驗參數(shù)需要設(shè)置;訓(xùn)練速度比較慢,在層次比較少(小于等于3)的情況下效果并不比其它方法更優(yōu)。

神經(jīng)網(wǎng)絡(luò)模型貌似能夠?qū)崿F(xiàn)更加艱難的任務(wù),如目標識別、語音識別、自然語言處理等。但是,應(yīng)該注意的是,這絕對不意味著其他機器學(xué)習方法的終結(jié)。盡管深度學(xué)習的成功案例迅速增長,但是對這些模型的訓(xùn)練成本是相當高的,調(diào)整外部參數(shù)也是很麻煩。同時,SVM的簡單性促使其仍然最為廣泛使用的機器學(xué)習方式。

1.6 啟示與未來的發(fā)展

人工智能機器學(xué)習是誕生于20世紀中葉的一門年輕的學(xué)科,它對人類的生產(chǎn)、生活方式產(chǎn)生了重大的影響,也引發(fā)了激烈的哲學(xué)爭論。但總的來說,機器學(xué)習的發(fā)展與其他一般事物的發(fā)展并無太大區(qū)別,同樣可以用哲學(xué)的發(fā)展的眼光來看待。

機器學(xué)習的發(fā)展并不是一帆風順的,也經(jīng)歷了螺旋式上升的過程,成就與坎坷并存。其中大量的研究學(xué)者的成果才有了今天人工智能的空前繁榮,是量變到質(zhì)變的過程,也是內(nèi)因和外因的共同結(jié)果。

機器學(xué)習的發(fā)展詮釋了多學(xué)科交叉的重要性和必要性。然而這種交叉不是簡單地彼此知道幾個名詞或概念就可以的,是需要真正的融會貫通:

  • 統(tǒng)計學(xué)家弗萊德曼早期從事物理學(xué)研究,他是優(yōu)化算法大師,而且他的編程能力同樣令人贊嘆;

  • 喬丹教授既是一流的計算機學(xué)家,又是一流的統(tǒng)計學(xué)家,而他的博士專業(yè)為心理學(xué),他能夠承擔起建立統(tǒng)計機器學(xué)習的重任;

  • 辛頓教授是世界最著名的認知心理學(xué)家和計算機科學(xué)家。雖然他很早就成就斐然,在學(xué)術(shù)界聲名鵲起,但他依然始終活躍在一線,自己寫代碼。他提出的許多想法簡單、可行又非常有效,被稱為偉大的思想家。正是由于他的睿智和身體力行,深度學(xué)習技術(shù)迎來了革命性的突破。

深度學(xué)習的成功不是源自腦科學(xué)或認知科學(xué)的進展,而是因為大數(shù)據(jù)的驅(qū)動和計算能力的極大提升。可以說機器學(xué)習是由學(xué)術(shù)界、工業(yè)界、創(chuàng)業(yè)界(或競賽界)等合力造就的。學(xué)術(shù)界是引擎,工業(yè)界是驅(qū)動,創(chuàng)業(yè)界是活力和未來。學(xué)術(shù)界和工業(yè)界應(yīng)該有各自的職責和分工。學(xué)術(shù)界的職責在于建立和發(fā)展機器學(xué)習學(xué)科,培養(yǎng)機器學(xué)習領(lǐng)域的專門人才;而大項目、大工程更應(yīng)該由市場來驅(qū)動,由工業(yè)界來實施和完成。

對于機器學(xué)習的發(fā)展前途,中科院數(shù)學(xué)與系統(tǒng)科學(xué)研究院陸汝鈴老師在為南京大學(xué)周志華老師的《機器學(xué)習》一書作序時提出了六大問題,我覺得這些問題也許正是影響機器學(xué)習未來發(fā)展方向的基本問題,因此我摘錄其中五個在此(有兩個問題屬于同一個主題,合并之):

  • 問題一:在人工智能發(fā)展早期,機器學(xué)習的技術(shù)內(nèi)涵幾乎全部是符號學(xué)習,可是從二十世紀九十年代開始,統(tǒng)計機器學(xué)習有一匹黑馬橫空出世,迅速壓倒并取代了符號學(xué)習的地位。人們可能會問,符號學(xué)習是否被徹底忽略了?他還能成為機器學(xué)習的研究對象嗎?它是否能繼續(xù)在統(tǒng)計學(xué)習的陰影里茍延殘喘?

第一種觀點:退出歷史舞臺——沒有人抱有這種想法。

第二種觀點:統(tǒng)計學(xué)習和符號學(xué)習結(jié)合起來——王玨教授認為,現(xiàn)在機器學(xué)習已經(jīng)到了一個轉(zhuǎn)折點,統(tǒng)計學(xué)習要想進入一個更高級的形式,就應(yīng)該和知識相結(jié)合,否則就會停留于現(xiàn)狀而止步不前。

第三種觀點:符號學(xué)習還有翻身之日——Chandrasekaran教授認為機器學(xué)習并不會回到“河西”,而是隨著技術(shù)的進步逐漸轉(zhuǎn)向基本的認知科學(xué)。

  • 問題二:統(tǒng)計機器學(xué)習的算法都是基于樣本數(shù)據(jù)獨立同分布的假設(shè),但自然界現(xiàn)象千變?nèi)f化,哪里有那么多獨立同分布?那么“獨立同分布”條件對于機器學(xué)習來說是必需的嗎?獨立同分布的不存在一定是不可逾越的障礙嗎?

遷移學(xué)習也許會給問題的解決帶來一絲曙光?

  • 問題三:近年來出現(xiàn)了一些新的動向,比如深度學(xué)習。但他們真的代表機器學(xué)習新的方向嗎?

包括周志華老師在內(nèi)的一些學(xué)者認為深度學(xué)習掀起的熱潮大過它本身的貢獻,在理論和技術(shù)上并沒有太多的創(chuàng)新,只不過硬件技術(shù)的革命使得人們能采用原來復(fù)雜度很高的算法,從而得到更精細的結(jié)果。

  • 問題四:機器學(xué)習研究出現(xiàn)以來,我們看到的主要是從符號方法到統(tǒng)計方法的演變,用到的數(shù)學(xué)主要是概率統(tǒng)計。但是今天數(shù)學(xué)之大,就像大海,難道只有統(tǒng)計方法適合于在機器學(xué)習方面的應(yīng)用?

目前流行學(xué)習已經(jīng)“有點意思了”,但數(shù)學(xué)理論的介入程度遠遠不夠,有待更多數(shù)學(xué)家參與,開辟新的模式、理論和方法。

  • 問題五:大數(shù)據(jù)時代的出現(xiàn),有沒有給機器學(xué)習帶來本質(zhì)性的影響?

大數(shù)據(jù)時代給機器學(xué)習帶來了前所未有的機遇,但是同樣的統(tǒng)計、采樣方法相較以前有什么本質(zhì)不同嗎?又從量變過渡到質(zhì)變嗎?數(shù)理統(tǒng)計方法有沒有發(fā)生質(zhì)的變化?大數(shù)據(jù)時代正在呼吁什么樣的機器學(xué)習方法?哪些方法又是大數(shù)據(jù)研究的驅(qū)動而產(chǎn)生的呢?

2、機器學(xué)習基本概念

權(quán)威定義:

Arthur samuel: 在不直接針對問題進行編程的情況下,賦予計算機學(xué)習能力的一個研究領(lǐng)域。

Tom Mitchell: 對于某類任務(wù)T和性能度量P,如果計算機程序在T上以P衡量的性能隨著經(jīng)驗E而自我完善,那么就稱這個計算機程序從經(jīng)驗E學(xué)習。

其實隨著學(xué)習的深入,慢慢會發(fā)現(xiàn)機器學(xué)習越來越難定義,因為涉及到的領(lǐng)域很廣,應(yīng)用也很廣,現(xiàn)在基本成為計算機相關(guān)專業(yè)的標配,但是在實際的操作過程中,又慢慢會發(fā)現(xiàn)其實機器學(xué)習也是很簡單的一件事,我們最的大部分事情其實就是兩件事情,一個是分類,一個是回歸。比如房價的預(yù)測、股價的預(yù)測等是回歸問題,情感判別、信用卡是否發(fā)放等則是屬于分類?,F(xiàn)實的情況 一般是給我們一堆數(shù)據(jù),我們根據(jù)專業(yè)知識和一些經(jīng)驗提取最能表達數(shù)據(jù)的特征,然后我們再用算法去建模,等有未知數(shù)據(jù)過來的時候我們就能夠預(yù)測到這個是屬于哪個類別或者說預(yù)測到是一個什么值以便作出下一步的決策。比如說人臉識別系統(tǒng),目的是作為一個驗證系統(tǒng),可能是一個權(quán)限管理,如果是系統(tǒng)中的人則有權(quán)限否則沒有權(quán)限,首先給到我們的數(shù)據(jù)是一堆人臉的照片,第一步要做的事情是對數(shù)據(jù)進行預(yù)處理,然后是提取人臉特征,最后選擇算法比如說SVM或者RF等等,算法的最終選擇設(shè)計到評價標準,這個后面具體講,這樣我們就建立了一個人臉識別的模型,當系統(tǒng)輸入一張人臉,我們就能夠知道他是不是在系統(tǒng)之中。機器學(xué)習的整個流程不過就這幾步,最后不過就是參數(shù)尋優(yōu),包括現(xiàn)在如火如荼的機器學(xué)習。

當我們判斷是否要使機器學(xué)習時,可以看看是不是以下的場景

  1. 人類不能手動編程;

  2. 人類不能很好的定義這個問題的解決方案是什么;

  3. 人類不能做i到的需要極度快速決策的系統(tǒng);

  4. 大規(guī)模個性化服務(wù)系統(tǒng);

3、機器學(xué)習分類

3.1、監(jiān)督式學(xué)習 Supervised Learning

在監(jiān)督式學(xué)習下,每組訓(xùn)練數(shù)據(jù)都有一個標識值或結(jié)果值,如客戶流失對應(yīng)1,不流失對應(yīng)0。在建立預(yù)測模型的時候,監(jiān)督式學(xué)習建立一個學(xué)習過程,將預(yù)測的結(jié)果與訓(xùn)練數(shù)據(jù)的實際結(jié)果進行比較,不斷的調(diào)整預(yù)測模型,直到模型的預(yù)測結(jié)果達到一個預(yù)期的準確率。

分類 Classification

  1. K最近鄰 K-Nearest Neighbor (KNN)

  2. 樸素貝葉斯 Naive Bayes

  3. 決策樹 Decision Tree:C4.5、分類回歸樹 Classification And Regression Tree (CART)

  4. 支持向量機器 Support Vector Machine (SVM)

回歸 Regression

  1. 線性回歸 linear regression

  2. 局部加權(quán)回歸 Locally weighted regression

  3. 邏輯回歸 logistic Regression

  4. 逐步回歸 stepwise regression

  5. 多元自適應(yīng)回歸樣條法 multivariate adaptive regression splines

  6. 局部散點平滑估計 Locally estimated scatter plot smoothing ( LOESS )

  7. 嶺回歸 Ridge Regression

  8. Least Absolute Shrinkage and Selection Operator ( LASSO )

  9. 彈性網(wǎng)絡(luò) Elastic Net

  10. 多項式回歸 Polynomial Regression

排序 Rank

  1. 單文檔分類 Pointwise:McRank

  2. 文檔對方法(Pairwise):Ranking SVM、RankNet、Frank、RankBoost

  3. 文檔列表方法(Listwise):AdaRank、SoftRank、LambdaMART

匹配學(xué)習

  1. 人工神經(jīng)網(wǎng)絡(luò):感知神經(jīng)網(wǎng)絡(luò) Perception Neural Network、反向傳遞 Back Propagation、Hopfield網(wǎng)絡(luò)、自組織映射 Self-Organizing Map ( SOM )、學(xué)習矢量量化 Learning Vector Quantization ( LVQ )

3.2 半監(jiān)督學(xué)習

在半監(jiān)督學(xué)習方式下,訓(xùn)練數(shù)據(jù)有部分被標識,部分沒有被標識,這種模型首先需要學(xué)習數(shù)據(jù)的內(nèi)在結(jié)構(gòu),以便合理的組織數(shù)據(jù)來進行預(yù)測。算法上,包括一些對常用監(jiān)督式學(xué)習算法的延伸,這些算法首先試圖對未標識數(shù)據(jù)進行建模,在此基礎(chǔ)上再對標識的數(shù)據(jù)進行預(yù)測。如深度學(xué)習:

深度學(xué)習 Deep Learning

深度學(xué)習是 監(jiān)督學(xué)習的匹配學(xué)習中人工神經(jīng)網(wǎng)絡(luò)延伸出來發(fā)展出來的。

  1. 受限波爾茲曼機 Restricted Boltzmann Machine ( RBM )

  2. 深度信念網(wǎng)絡(luò) Deep Belief Networks ( DBN )

  3. 卷積網(wǎng)絡(luò) Convolutional Network

  4. 棧式自編碼 Stacked Auto-encoders

3.3 無監(jiān)督學(xué)習 Unsupervised Learning

在非監(jiān)督式學(xué)習中,數(shù)據(jù)并不被特別標識,學(xué)習模型是為了推斷出數(shù)據(jù)的一些內(nèi)在結(jié)構(gòu)。

聚類 Cluster

  1. K均值 k-means

  2. 最大期望算法 Expectation Maximization ( EM )

  3. 降維方法 Dimensionality Reduction:主成分分析Principal Component Analysis ( PCA )、偏最小二乘回歸 Partial Least Squares Regression ( PLS )、Sammon映射 Sammon Mapping、多維尺度分析 Multidimensional Scaling ( MDS )、投影尋蹤 Projection Pursuit、RD

關(guān)聯(lián)規(guī)則 Association Rule

  1. Apriori

  2. Eclat

3.4 增強學(xué)習 Reinforcement Learning

在之前的討論中,我們總是給定一個樣本x,然后給或者不給標識值或結(jié)果值(給了就是監(jiān)督式學(xué)習,不給就是無監(jiān)督式學(xué)習)。之后對樣本進行擬合、分類、聚類或者降維等操作。然而對于很多序列決策或者控制問題,很難有這么規(guī)則的樣本。比如,四足機器人的控制問題,剛開始都不知道應(yīng)該讓其動那條腿,在移動過程中,也不知道怎么讓機器人自動找到合適的前進方向。

增強學(xué)習要解決的是這樣的問題:一個能感知環(huán)境的自治agent,怎樣通過學(xué)習選擇能達到其目標的最優(yōu)動作。這個很具有普遍性的問題應(yīng)用于學(xué)習控制移動機器人,在工廠中學(xué)習最優(yōu)操作工序以及學(xué)習棋類對弈等。當agent在其環(huán)境中做出每個動作時,施教者會提供獎勵或懲罰信息,以表示結(jié)果狀態(tài)的正確與否。例如,在訓(xùn)練agent進行棋類對弈時,施教者可在游戲勝利時給出正回報,而在游戲失敗時給出負回報,其他時候為零回報。agent的任務(wù)就是從這個非直接的,有延遲的回報中學(xué)習,以便后續(xù)的動作產(chǎn)生最大的累積效應(yīng)。

  1. Q-Learning

  2. 時間差學(xué)習 Temporal difference learning

3.5 其他

集成算法

集成算法用一些相對較弱的學(xué)習模型獨立地就同樣的樣本進行訓(xùn)練,然后把結(jié)果整合起來進行整體預(yù)測。

  1. Boosting

  2. Bootstrapped Aggregation ( Bagging )

  3. AdaBoost

  4. 堆疊泛化 Stacked Generalization

  5. 梯度推進機 Gradient Boosting Machine ( GBM )

  6. 隨機森林 Random Forest




聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1812

    文章

    49520

    瀏覽量

    258912
  • 機器學(xué)習
    +關(guān)注

    關(guān)注

    66

    文章

    8530

    瀏覽量

    135965
  • 深度學(xué)習
    +關(guān)注

    關(guān)注

    73

    文章

    5586

    瀏覽量

    123717
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    挖到寶了!人工智能綜合實驗箱,高校新工科的寶藏神器

    應(yīng)用場景。從數(shù)據(jù)采集,到模型推理,都能完整且自如地參與,輕松解鎖人工智能全流程實訓(xùn),讓深度體驗AI技術(shù)的魅力 。 四、九門課程全覆蓋,滿足多元學(xué)習需求 對于高校教學(xué)或者技術(shù)
    發(fā)表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實驗箱,高校新工科的寶藏神器!

    應(yīng)用場景。從數(shù)據(jù)采集,到模型推理,都能完整且自如地參與,輕松解鎖人工智能全流程實訓(xùn),讓深度體驗AI技術(shù)的魅力 。 四、九門課程全覆蓋,滿足多元學(xué)習需求 對于高校教學(xué)或者技術(shù)
    發(fā)表于 08-07 14:23

    超小型Neuton機器學(xué)習模型, 在任何系統(tǒng)級芯片(SoC)上解鎖邊緣人工智能應(yīng)用.

    Neuton 是一家邊緣AI 公司,致力于讓機器 學(xué)習模型更易于使用。它創(chuàng)建的模型比競爭對手的框架小10 倍,速度也快10 倍,甚至可以在最先進的邊緣設(shè)備上進行人工智能處理。在這篇博文中,我們將介紹
    發(fā)表于 07-31 11:38

    最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門學(xué)習課程參考2025版(大模型篇)

    人工智能大模型重塑教育與社會發(fā)展的當下,無論是探索未來職業(yè)方向,還是更新技術(shù)儲備,掌握大模型知識都已成為新時代的必修課。從職場上輔助工作的智能助手,到課堂用于學(xué)術(shù)研究的智能工具,大模型正在工作生活
    發(fā)表于 07-04 11:10

    SLAMTEC Aurora:把深度學(xué)習“卷”進機器人日常

    人工智能機器人技術(shù)飛速發(fā)展的今天,深度學(xué)習與SLAM(同步定位與地圖構(gòu)建)技術(shù)的結(jié)合,正引領(lǐng)著智能
    的頭像 發(fā)表于 02-19 15:49 ?632次閱讀

    軍事應(yīng)用中深度學(xué)習的挑戰(zhàn)與機遇

    人工智能尤其是深度學(xué)習技術(shù)的最新進展,加速了不同應(yīng)用領(lǐng)域的創(chuàng)新與發(fā)展。深度學(xué)習技術(shù)的發(fā)展深刻影響了軍事發(fā)展趨勢,導(dǎo)致戰(zhàn)爭形式和模式發(fā)生重大變
    的頭像 發(fā)表于 02-14 11:15 ?724次閱讀

    數(shù)學(xué)專業(yè)轉(zhuǎn)人工智能方向:考研/就業(yè)前景分析及大學(xué)四年學(xué)習路徑全揭秘

    隨著AI技術(shù)的不斷進步,專業(yè)人才的需求也日益增長。數(shù)學(xué)作為AI的基石,為機器學(xué)習深度學(xué)習、數(shù)據(jù)分析等提供了理論基礎(chǔ)和工具,因此越來越多的數(shù)學(xué)專業(yè)學(xué)生開始考慮在
    的頭像 發(fā)表于 02-07 11:14 ?1528次閱讀
    數(shù)學(xué)專業(yè)轉(zhuǎn)<b class='flag-5'>人工智能</b>方向:考研/就業(yè)前景分析及大學(xué)四年<b class='flag-5'>學(xué)習</b>路徑全揭秘

    人工智能機器學(xué)習以及Edge AI的概念與應(yīng)用

    人工智能相關(guān)各種技術(shù)的概念介紹,以及先進的Edge AI(邊緣人工智能)的最新發(fā)展與相關(guān)應(yīng)用。 人工智能機器學(xué)習是現(xiàn)代科技的核心技術(shù)
    的頭像 發(fā)表于 01-25 17:37 ?1378次閱讀
    <b class='flag-5'>人工智能</b>和<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習</b>以及Edge AI的概念與應(yīng)用

    【「具身智能機器人系統(tǒng)」閱讀體驗】+數(shù)據(jù)在具身人工智能中的價值

    嵌入式人工智能(EAI)將人工智能集成到機器人等物理實體中,使它們能夠感知、學(xué)習環(huán)境并與之動態(tài)交互。這種能力使此類機器人能夠在人類社會中有效
    發(fā)表于 12-24 00:33

    如何在低功耗MCU上實現(xiàn)人工智能機器學(xué)習

    人工智能 (AI) 和機器學(xué)習 (ML) 的技術(shù)不僅正在快速發(fā)展,還逐漸被創(chuàng)新性地應(yīng)用于低功耗的微控制器 (MCU) 中,從而實現(xiàn)邊緣AI/ML的解決方案。
    的頭像 發(fā)表于 12-17 16:06 ?1156次閱讀

    人工智能工程師高頻面試題匯總——機器學(xué)習

    隨著人工智能技術(shù)的突飛猛進,AI工程師成為了眾多求職者夢寐以求的職業(yè)。想要拿下這份工作,面試的時候得展示出不僅技術(shù)過硬,還得能解決問題。所以,提前準備一些面試常問的問題,比如機器學(xué)習
    的頭像 發(fā)表于 12-04 17:00 ?2016次閱讀
    <b class='flag-5'>人工智能</b>工程師高頻面試題匯總——<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習</b>篇

    嵌入式和人工智能究竟是什么關(guān)系?

    、連接主義和深度學(xué)習等不同的階段。目前,人工智能已經(jīng)廣泛應(yīng)用于各種領(lǐng)域,如自然語言處理、計算機視覺、智能推薦等。 嵌入式系統(tǒng)和人工智能在許
    發(fā)表于 11-14 16:39

    NPU在深度學(xué)習中的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習作為其核心驅(qū)動力之一,已經(jīng)在眾多領(lǐng)域展現(xiàn)出了巨大的潛力和價值。NPU(Neural Processing Unit,神經(jīng)網(wǎng)絡(luò)處理單元)是專門為深度
    的頭像 發(fā)表于 11-14 15:17 ?2579次閱讀

    具身智能機器學(xué)習的關(guān)系

    具身智能(Embodied Intelligence)和機器學(xué)習(Machine Learning)是人工智能領(lǐng)域的兩個重要概念,它們之間存在著密切的關(guān)系。 1. 具身
    的頭像 發(fā)表于 10-27 10:33 ?1408次閱讀

    人工智能、機器學(xué)習深度學(xué)習存在什么區(qū)別

    人工智能指的是在某種程度上顯示出類似人類智能的設(shè)備。AI有很多技術(shù),但其中一個很大的子集是機器學(xué)習——讓算法從數(shù)據(jù)中學(xué)習
    發(fā)表于 10-24 17:22 ?3360次閱讀
    <b class='flag-5'>人工智能</b>、<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習</b>和<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習</b>存在什么區(qū)別