chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

從四個經(jīng)典角度看機器學習的本質(zhì)

DPVg_AI_era ? 來源:cc ? 2019-02-13 09:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

何謂“機器學習”,學界尚未有統(tǒng)一的定義。本文摘取Tom Mitchell、Christopher M. Bishop、去年出版的《深度學習》和側(cè)重實戰(zhàn)的《數(shù)據(jù)挖掘》,總結(jié)了四種機器學習主流定義。更好地研究“機器學習”,并繼續(xù)擴展和完善它的定義,也有助于我們理解機器學習的本質(zhì)。

你或許已經(jīng)讀過許多關(guān)于機器學習的深度和和半深度的文章,并探討了機器學習與眾多其他主題的關(guān)系。在討論如此復(fù)雜的概念時,回到最初的一些共同參考資料總是一個好主意;問題是,對于機器學習這樣的主題,存在無數(shù)這樣的參考資料。

所以我想,為什么不研究一下這些參考點呢?

這是一篇不那么嚴肅的帖子,旨在探討機器學習的本質(zhì)。

話不多說,作為一個看似屬于語義學的練習,讓我們來探索一下關(guān)于機器學習的定義。

Tom Mitchell:根據(jù)優(yōu)化過程抽象定義機器學習

第一個定義,是我個人最喜歡的,來自著名的計算機科學家、機器學習研究者,卡內(nèi)基梅隆大學的 Tom Mitchell 教授。

對于某類任務(wù) T 和性能度量 P,如果一個計算機程序在 T 上以 P 衡量的性能隨著經(jīng)驗 E 而自我完善,那么我們稱這個計算機程序在從經(jīng)驗 E 中學習。[1]

Mitchell 的這個定義在機器學習領(lǐng)域是眾所周知的,并且經(jīng)受了時間的考驗。這句話首次出現(xiàn)在他 1997 年出版的Machine Learning一書中。

這句話對我個人產(chǎn)生了很大的影響,多年來我多次提到它,并在碩士論文中引用了這個定義。在 Goodfellow, Bengio & Courville 最近出版的權(quán)威著作《深度學習》(Deep Learning) 的第 5 章中,這段引文也占據(jù)了突出位置,成為該書對學習算法的解釋的出發(fā)點。

下圖是 Mitchell 定義的圖示:

圖 1:The Mitchell Paradigm

“花書”《深度學習》:論計算在機器學習中的重要性

說到 Goodfellow、Bengio 和 Courville,就不得不提他們合著的《深度學習》,這本書對機器學習是這樣定義的:

機器學習本質(zhì)上屬于應(yīng)用統(tǒng)計學,更多地關(guān)注如何用計算機統(tǒng)計地估計復(fù)雜函數(shù),不太關(guān)注為這些函數(shù)提供置信區(qū)間。[2]

Mitchell 對機器學習的定義在應(yīng)用中不再適用;它側(cè)重于優(yōu)化過程的具體組成部分,這些組成部分通常與機器學習有關(guān),但它沒有規(guī)定應(yīng)該如何在實踐中接近它。

《深度學習》中對機器學習的定義在本質(zhì)上要規(guī)范得多,它指出計算能力得到了利用 (實際上強調(diào)了對計算能力的使用),而傳統(tǒng)的統(tǒng)計概念置信區(qū)間則不再強調(diào)。

實戰(zhàn)數(shù)據(jù)挖掘:“學習”必須是有意地去學習

在我看來,另一個特別值得注意的關(guān)于機器學習的定義來自 Witten, Frank & Hall 所著的《數(shù)據(jù)挖掘:實用機器學習工具與技術(shù)》,這是我第一本完整閱讀了的關(guān)于這個主題的書。

《數(shù)據(jù)挖掘》這本書很少涉及數(shù)學,但有很多實用性的解釋。對于剛進入機器學習領(lǐng)域的人,“數(shù)據(jù)挖掘” 很長一段時間是我的首選推薦。

作者對機器學習最初定義有點零散,他們試圖在機器學習和數(shù)據(jù)挖掘的背景中將學習、性能和知識這些概念編織在一起。但其中一些語句值得注意:

我們感興趣的是在新的情況下得到性能的改進,或至少有性能改進的潛力。

當系統(tǒng)以一種使它們在未來表現(xiàn)更好的方式改變自己的行為時,它們就會學習。

學習意味著思考和目標。學習必須是有意地去學習。

經(jīng)驗表明,在機器學習和數(shù)據(jù)挖掘的許多應(yīng)用中,所獲得的顯式知識結(jié)構(gòu)、結(jié)構(gòu)描述,至少與在新實例中表現(xiàn)良好的能力同等重要。人們經(jīng)常使用數(shù)據(jù)挖掘來獲取知識,而不僅僅是用來預(yù)測。

“數(shù)據(jù)挖掘”這個術(shù)語被用作機器學習的補充術(shù)語。上面引用的語句出自這本書的第三版,出版于 2011 年,當時數(shù)據(jù)挖掘這個詞比現(xiàn)在更有吸引力;即使不說是引用自數(shù)據(jù)挖掘的書,上面所寫的內(nèi)容對機器學習本身也適用。

Witten, Frank & Hall 為機器學習的定義提供了一個不同的角度:Mitchell 專注于優(yōu)化過程的特定組成部分,Goodfellow, Bengio & Courville 傾向于一種更規(guī)范的定義,并強調(diào)計算能力的相對重要性,這個定義則嘗試側(cè)重 “l(fā)earning” 的哪些方面在機器學習過程中是類似和重要的。

上面引用的語句還提供了一個重要的點,兼具實用性和哲學性,即最后一段,指出獲得知識和使用這些知識的能力都是機器學習的重要方面。

Christopher Bishop:從算法的角度定義

最后,讓我們來看 Christopher Bishop 在《模式識別和機器學習》一書中對機器學習的定義。值得注意的是,Bishop 沒有開門見山地定義這個術(shù)語,但是很好地隱式地提供了以算法為中心的機器學習的定義 (在一個數(shù)字分類任務(wù)中討論到):

機器學習算法的結(jié)果表示為一個函數(shù) y (x),它以一個新的數(shù)字的圖像 x 作為為輸入,產(chǎn)生向量 y,與 target vector 的形式相同。

函數(shù) y (x) 的精確形式是在訓(xùn)練階段(trainingphase) 確定的,也稱為學習階段 (learningphase),以訓(xùn)練數(shù)據(jù)為基礎(chǔ)。

一旦模型被訓(xùn)練出來,就可以用來判斷新的數(shù)字圖像 (新樣本) 對應(yīng)的標簽,這些新樣本的集合被稱為測試集。

正確分類與訓(xùn)練集不同的新樣本的能力叫做泛化(generalization)。在實際應(yīng)用中,輸入向量的可變性使得訓(xùn)練數(shù)據(jù)只能包含所有可能輸入向量的很小一部分,因此泛化是模式識別的一個中心目標。[4]

首先,除了我們討論的機器學習是有監(jiān)督學習,而不是無監(jiān)督學習或強化學習 (或其他形式的機器學習) 外,上面的引用對 “模式識別” 沒有更多的解釋。

其次,也是更重要的一點,這是唯一對機器學習所需步驟逐步處理的定義,無論這些步驟在這個例子中可能多么簡短。

同樣有趣的是,隨后的頁面,以及 Bishop 的書一半的篇幅概述了許多額外的機器學習概念,并將它們很好地結(jié)合在一起,提供了具有可讀性的介紹,而不至于陷入數(shù)學的困境 (書中的其余部分解釋了數(shù)學)。

這樣,我們已經(jīng)有四種方法來定義機器學習:一種是根據(jù)它的優(yōu)化過程,抽象地定義它機器學習;第二種更有規(guī)范性,并指出計算在機器學習中的重要性;第三定義側(cè)重于“學習”的哪些方面在機器學習過程中是類似的和重要的;最后一個定義從算法的角度概述了機器學習。

這些定義都不是不正確,但都不完整。探討先驅(qū)者和受人尊敬的研究人員所認為的 “機器學習”,將擴展我們自己對機器學習的定義。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器學習
    +關(guān)注

    關(guān)注

    66

    文章

    8530

    瀏覽量

    135970
  • 深度學習
    +關(guān)注

    關(guān)注

    73

    文章

    5586

    瀏覽量

    123723

原文標題:機器學習的本質(zhì)是什么?

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    用于 GSM/ GPRS (824-915 MHz) (1710-1910 MHz) 的 Tx-Rx 頻前端模塊,帶四個線性 TRx 開關(guān)端口 skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()用于 GSM/ GPRS (824-915 MHz) (1710-1910 MHz) 的 Tx-Rx 頻前端模塊,帶四個線性 TRx 開關(guān)端口相關(guān)產(chǎn)品參數(shù)、數(shù)據(jù)手冊,更有
    發(fā)表于 05-28 18:33
    用于 GSM/ GPRS (824-915 MHz) (1710-1910 MHz) 的 Tx-Rx <b class='flag-5'>四</b>頻前端模塊,帶<b class='flag-5'>四個</b>線性 TRx 開關(guān)端口 skyworksinc

    用于 GSM/GPRS (824-915 MHz) (1710-1910 MHz) 的 Tx-Rx 頻前端模塊,帶四個線性 TRx 開關(guān)端口 skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()用于 GSM/GPRS (824-915 MHz) (1710-1910 MHz) 的 Tx-Rx 頻前端模塊,帶四個線性 TRx 開關(guān)端口相關(guān)產(chǎn)品參數(shù)、數(shù)據(jù)手冊,更有
    發(fā)表于 05-28 18:33
    用于 GSM/GPRS (824-915 MHz) (1710-1910 MHz) 的 Tx-Rx <b class='flag-5'>四</b>頻前端模塊,帶<b class='flag-5'>四個</b>線性 TRx 開關(guān)端口 skyworksinc

    用于頻 GSM / GPRS / EDGE 的 Tx-Rx FEM,具有四個線性 TRx 開關(guān)端口和雙頻 TD-SCDMA skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()用于頻 GSM / GPRS / EDGE 的 Tx-Rx FEM,具有四個線性 TRx 開關(guān)端口和雙頻 TD-SCDMA相關(guān)產(chǎn)品參數(shù)、數(shù)據(jù)手冊,更有用于頻 GSM
    發(fā)表于 05-28 18:31
    用于<b class='flag-5'>四</b>頻 GSM / GPRS / EDGE 的 Tx-Rx FEM,具有<b class='flag-5'>四個</b>線性 TRx 開關(guān)端口和雙頻 TD-SCDMA skyworksinc

    四個方面深入剖析富捷電阻的優(yōu)勢

    理成本的電阻產(chǎn)品系列,為電子行業(yè)提供了一可靠的選擇。本文將從產(chǎn)品結(jié)構(gòu)、同業(yè)對比、成本分析以及品質(zhì)保障四個方面深入剖析富捷電阻的優(yōu)勢,展現(xiàn)其如何在激烈的市場競爭中脫穎而出。
    的頭像 發(fā)表于 05-09 10:47 ?715次閱讀
    <b class='flag-5'>從</b><b class='flag-5'>四個</b>方面深入剖析富捷電阻的優(yōu)勢

    ADS1211獲取四個通道全部數(shù)據(jù)的最短時間是多少?

    pdf沒看出什么門道,想問下這款A(yù)DC四個差分通道同步采樣,獲取四個通道全部數(shù)據(jù)的最短時間是多少!
    發(fā)表于 02-10 07:24

    Apple Watch Series 10全天候顯示秒數(shù)功能支持表盤增至四個

    近日,蘋果在 watchOS 11.3 系統(tǒng)更新中,為 Apple Watch Series 10 帶來驚喜升級,其全天候顯示秒數(shù)功能支持表盤增至四個,新增的 Unity Rhythm 表盤
    的頭像 發(fā)表于 02-05 13:48 ?2371次閱讀

    模數(shù)轉(zhuǎn)換電路的四個過程

    模數(shù)轉(zhuǎn)換(Analog-to-Digital Conversion,簡稱ADC)是將模擬信號轉(zhuǎn)換為數(shù)字信號的關(guān)鍵過程,廣泛應(yīng)用于通信、數(shù)據(jù)采集、信號處理等領(lǐng)域。模數(shù)轉(zhuǎn)換電路的設(shè)計與實現(xiàn)涉及多個關(guān)鍵步驟,通??梢苑譃?b class='flag-5'>四個主要過程:采樣、保持、量化和編碼。本文將詳細分析這四個
    的頭像 發(fā)表于 02-03 16:12 ?2018次閱讀

    請問DAC3484四個通道能否獨立使用?

    請問,DAC3484 四個通道能否獨立使用?即當把DAC的NCO頻率設(shè)置為fs/2時,IQ兩通道是否就可以獨立了?
    發(fā)表于 01-23 07:35

    請問AD9852四個輸出口有什么差別?

    AD9852四個輸出口有什么差別?是不是IOUT1是余弦輸出,IOUT2是DAC控制輸出,需要設(shè)置DAC控制寄存器?
    發(fā)表于 01-16 06:59

    【「具身智能機器人系統(tǒng)」閱讀體驗】2.具身智能機器人的基礎(chǔ)模塊

    具身智能機器人的基礎(chǔ)模塊,這個是本書的第二部分內(nèi)容,主要分為四個部分:機器人計算系統(tǒng),自主機器人的感知系統(tǒng),自主機器人的定位系統(tǒng),自主
    發(fā)表于 01-04 19:22

    市場角度解讀機器人核心關(guān)鍵技術(shù)

    我記得在2017年左右的時間,大家交流的時候,專家一般都是機器人的發(fā)展史說起,而且占據(jù)了比較多的內(nèi)容。最近這幾年大家交流的時候,專家一般都是講人形機器人或者
    的頭像 發(fā)表于 12-25 15:20 ?1054次閱讀
    <b class='flag-5'>從</b>市場<b class='flag-5'>角度</b>解讀<b class='flag-5'>機器</b>人核心關(guān)鍵技術(shù)

    市場角度機器人的基本解讀

    自人工智能機器人發(fā)展至今,幾乎都是學術(shù)方面對機器人進行定義詮釋?,F(xiàn)今機器人市場化發(fā)展程度已逐步進入多領(lǐng)域不同場景的融合應(yīng)用,對實際市場已經(jīng)可以發(fā)揮一定的使用價值。為更快的增強
    的頭像 發(fā)表于 12-07 01:06 ?741次閱讀
    <b class='flag-5'>從</b>市場<b class='flag-5'>角度</b>對<b class='flag-5'>機器</b>人的基本解讀

    智譜推出四個全新端側(cè)模型 攜英特爾按下AI普及加速鍵

    隨著AI的發(fā)展,端側(cè)AI模型越來越受到廣大客戶及廠商的關(guān)注,業(yè)界領(lǐng)先的大模型公司智譜于近日推出了四個全新的端側(cè)模型,加速AI前沿技術(shù)路徑與創(chuàng)新應(yīng)用場景探索,推動AI大模型普惠化發(fā)展。 四個模型中
    的頭像 發(fā)表于 12-02 17:13 ?779次閱讀
    智譜推出<b class='flag-5'>四個</b>全新端側(cè)模型 攜英特爾按下AI普及加速鍵

    請問DAC3484的四個通道可以獨立使用嗎?如何實現(xiàn)?

    請問DAC3484的四個通道可以獨立使用嗎?如何實現(xiàn)?謝謝
    發(fā)表于 11-22 07:14

    人工智能、機器學習和深度學習存在什么區(qū)別

    人工智能指的是在某種程度上顯示出類似人類智能的設(shè)備。AI有很多技術(shù),但其中一很大的子集是機器學習——讓算法數(shù)據(jù)中學習
    發(fā)表于 10-24 17:22 ?3363次閱讀
    人工智能、<b class='flag-5'>機器</b><b class='flag-5'>學習</b>和深度<b class='flag-5'>學習</b>存在什么區(qū)別