chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機器學(xué)習(xí)新手基礎(chǔ):十大算法導(dǎo)覽

新機器視覺 ? 來源:新機器視覺 ? 作者:王抒偉 ? 2020-11-27 10:00 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

機器學(xué)習(xí)中,有一個稱為“ No Free Lunch ”的定理。簡單來說,與監(jiān)督學(xué)習(xí)特別相關(guān)的這個定理,它指出沒有萬能算法,就是用一個算法能很好地解決每個問題。

例如,不能說神經(jīng)網(wǎng)絡(luò)總是比決策樹更好,反之亦然。有許多因素在起作用,例如數(shù)據(jù)集的大小和結(jié)構(gòu)。

那么,如果我遇到一個問題,首先應(yīng)該嘗試多種不同的算法來解決問題,同時使用保留的“測試集”數(shù)據(jù)評估績效并選擇最優(yōu)的那個算法,然后GitHub 搜索最優(yōu)代碼修改哈哈哈哈。

當(dāng)然,如果需要打掃房屋,可以使用吸塵器、掃帚或拖把。你不會用鏟子吧?
所以嘗試的算法必須適合要解決的問題,這才是選擇正確的機器學(xué)習(xí)任務(wù)的來源。

基礎(chǔ)

有一個通用原則是所有用于預(yù)測建模的受監(jiān)督機器學(xué)習(xí)算法的基礎(chǔ)。

機器學(xué)習(xí)算法被描述為學(xué)習(xí)目標(biāo)函數(shù)(f),該函數(shù)最好將輸入變量(X)映射到輸出變量(Y):Y = f(X)

這是一個簡單的學(xué)習(xí)任務(wù),我們想在給定新的輸入變量(X)的情況下,對(Y)進行預(yù)測。但是不知道函數(shù)(f)。

機器學(xué)習(xí)的最常見類型是學(xué)習(xí)映射Y = f(X)可以對新X預(yù)測到Y(jié),目標(biāo)是盡可能進行最準(zhǔn)確的預(yù)測。

對于初入機器學(xué)習(xí)領(lǐng)域,沒有機器學(xué)習(xí)基礎(chǔ)知識的新手,我會對常用的十大機器學(xué)習(xí)算法做簡單介紹。

1.線性回歸

線性回歸可能是統(tǒng)計和機器學(xué)習(xí)中最著名和最易理解的算法之一。

主要與最小化模型的誤差或做出盡可能準(zhǔn)確的預(yù)測有關(guān),但以可解釋性為代價。我們將從許多不同領(lǐng)域(包括統(tǒng)計數(shù)據(jù))中學(xué)習(xí)。

線性回歸的表示法是一個方程,該方程通過找到稱為系數(shù)(B),來描述輸入變量(x)與輸出變量(y)之間關(guān)系的線。

例如:y = B0 + B1 * x 臥槽,這不是一次函數(shù)嗎?哈哈

給定輸入x,我們將預(yù)測y,線性回歸學(xué)習(xí)算法的目標(biāo)是找到系數(shù)B0和B1的值, 例如用于普通最小二乘法和梯度下降優(yōu)化的線性代數(shù)解。

2.LOGISTIC回歸

邏輯回歸是機器學(xué)習(xí)從統(tǒng)計領(lǐng)域“借”的另一種技術(shù)。它是二分類問題(具有兩個類值的問題)的首選方法。

Logistic回歸類似于線性回歸,因為目標(biāo)是找到權(quán)重每個輸入變量的系數(shù)的值。與線性回歸不同,輸出的預(yù)測使用稱為對數(shù)函數(shù)的非線性函數(shù)進行變換。

邏輯函數(shù)看起來像一個大S,它將任何值轉(zhuǎn)換為0到1的范圍。因為我們可以將規(guī)則應(yīng)用于邏輯函數(shù)的輸出為0和1(例如,如果IF小于0.5,則輸出1)并預(yù)測類別值。

與線性回歸一樣,當(dāng)去除與輸出變量無關(guān)的屬性以及相關(guān)的屬性時,邏輯回歸的效果更好。這是一個快速學(xué)習(xí)二進制分類問題并有效的模型

3.線性判別分析

Logistic回歸是傳統(tǒng)上僅限于兩類分類問題的分類算法。如果是多分類,則線性判別分析算法(LDA)就是很重要的算法了。

LDA的表示非常簡單,它由數(shù)據(jù)的統(tǒng)計屬性組成,這些屬性是針對每個類別計算的。對于單個輸入變量,這包括:

每個類別的平均值。

計算所有類別的方差

通過為每個類別計算一個區(qū)分值并為具有最大值的類別進行預(yù)測來進行預(yù)測。
該算法的前提是:數(shù)據(jù)具有高斯分布(鐘形曲線),因此最好在操作之前從數(shù)據(jù)中刪除異常值。

4.分類和回歸樹

決策樹是用于預(yù)測建模機器學(xué)習(xí)的重要算法類型。
決策樹模型的表示形式是二叉樹。這是來自算法和數(shù)據(jù)結(jié)構(gòu)的二叉樹,沒有什么花哨的。每個節(jié)點代表一個輸入變量(x)和該變量的分割點(假設(shè)變量是數(shù)字)。

樹的葉節(jié)點包含用于進行預(yù)測的輸出變量(y)。通過遍歷樹的拆分直到到達葉節(jié)點并在該葉節(jié)點輸出類值來進行預(yù)測。

樹學(xué)習(xí)速度很快,做出預(yù)測的速度也非???。它們對于許多問題通常也很準(zhǔn)確,不需要為數(shù)據(jù)做任何特殊預(yù)處理。

5-樸素貝葉斯

樸素貝葉斯(Naive Bayes)是一種簡單但功能強大的預(yù)測建模算法。

該模型由兩種類型的概率組成,可以直接從您的訓(xùn)練數(shù)據(jù)中計算出:
1)每個類別的概率;
2)給定每個x值的每個類別的條件概率。

開始計算,概率模型可用于使用貝葉斯定理對新數(shù)據(jù)進行預(yù)測。當(dāng)你的數(shù)據(jù)是實值時,通常會假設(shè)一個高斯分布(鐘形曲線),以便可以輕松地估計這些概率。

樸素貝葉斯之所以被稱為樸素,是因為它假定每個輸入變量都是獨立的。這是一個很強的假設(shè),對于真實數(shù)據(jù)來說是不現(xiàn)實的,盡管如此,該技術(shù)對于大量復(fù)雜問題非常有效。

6 - K近鄰

KNN算法非常簡單且非常有效。KNN的模型表示是整個訓(xùn)練數(shù)據(jù)集。簡單吧?

通過搜索整個訓(xùn)練集中的K個最相似實例并匯總這K個實例的輸出變量,可以對新數(shù)據(jù)點進行預(yù)測。
對于回歸問題,這可能是平均輸出變量,對于分類問題,這可能是最常見的類別值。

訣竅在于如何確定數(shù)據(jù)實例之間的相似性。如果您的屬性都具有相同的比例(例如,都是距離數(shù)據(jù)),最簡單的方法是使用歐幾里得距離,您可以根據(jù)每個輸入變量之間的差異直接計算一個數(shù)字。

KNN可能需要大量內(nèi)存或空間來存儲所有數(shù)據(jù),因為它把所有數(shù)據(jù)都遍歷了。您還可以隨著時間的訓(xùn)練數(shù)據(jù),以保持預(yù)測的準(zhǔn)確性。

距離或緊密度的概念可能會分解為非常高的維度(許多輸入變量),這可能會對問題的算法性能產(chǎn)生負面影響。所以對于數(shù)據(jù)的輸入就至關(guān)重要。

7- 矢量化學(xué)習(xí)

K最近的缺點是需要整個訓(xùn)練數(shù)據(jù)集。學(xué)習(xí)向量量化算法(簡稱LVQ)是一種人工神經(jīng)網(wǎng)絡(luò)算法,可讓選擇要需要的訓(xùn)練實例數(shù)量。

LVQ的表示形式是向量的集合。這些是在最開始開始時隨機選擇的,適用于在學(xué)習(xí)算法的多次迭代中最好地總結(jié)訓(xùn)練數(shù)據(jù)集。
學(xué)習(xí)之后,可以像使用K近鄰一樣,使用數(shù)據(jù)進行預(yù)測。通過計算每個向量與新數(shù)據(jù)實例之間的距離,可以找到最相似的數(shù)據(jù)向量(最佳匹配的向量)。然后返回最佳匹配的類值作為預(yù)測。記得數(shù)據(jù)歸一化,獲得的效果更好。

8-支持向量機

支持向量機可能是最受歡迎的機器學(xué)習(xí)算法之一。

超平面是分割輸入變量空間的線。
在SVM中,選擇一個超平面以按類別(類別0或類別1)最好地分隔輸入變量空間中的點。
在二維圖中,您可以將其可視化為一條線,并假設(shè)所有輸入點都可以被這條線完全隔開。SVM學(xué)習(xí)算法找到超平面對類進行最佳分離的系數(shù)。

超平面和最近的數(shù)據(jù)點之間的距離稱為邊距??梢詫⑦@兩個類別分開的最佳或最佳超平面是邊距最大的線。
僅這些點與定義超平面和分類器的構(gòu)造有關(guān)。這些點稱為支持向量。
在實踐中,使用優(yōu)化算法來找到使余量最大化的系數(shù)的值。

SVM可能是功能最強大的即用型分類器之一,使用頻率很高。

9-BAGGING和隨機森林

隨機森林是最流行,功能最強大的機器學(xué)習(xí)算法之一。這是一種稱為Bootstrap聚類或BAGGING的集成機器學(xué)習(xí)算法。

您需要對數(shù)據(jù)進行大量采樣,計算平均值,然后對所有平均值取平均值,以便更好地估算真實平均值。

在bagging中,使用相同的方法,但用于估計整個統(tǒng)計模型(最常見的是決策樹)。獲取訓(xùn)練數(shù)據(jù)的多個樣本,然后為每個數(shù)據(jù)樣本構(gòu)建模型。當(dāng)你需要對新數(shù)據(jù)進行預(yù)測時,每個模型都將進行預(yù)測,并對預(yù)測取平均值以對真實輸出值進行更好的估計。

隨機森林是對這種方法的一種調(diào)整,在該方法中將創(chuàng)建決策樹,不是選擇最佳的拆分點。

因此,為每個數(shù)據(jù)樣本創(chuàng)建的模型與原先的模型相比,差異更大。將他們的預(yù)測結(jié)合起來可以更好地估計真實的基礎(chǔ)輸出值。

10-BOOSTING和ADABOOST

Boosting是一種集成技術(shù),嘗試從多個弱分類器創(chuàng)建強分類器。這是通過從訓(xùn)練數(shù)據(jù)構(gòu)建模型,然后創(chuàng)建第二個模型來嘗試糾正第一個模型中的錯誤來完成的。添加模型,直到完美預(yù)測訓(xùn)練集或添加最大數(shù)量的模型為止。

AdaBoost是為二進制分類開發(fā)的第一個真正成功的增強算法。這是了解增強的最佳起點?,F(xiàn)代的增強方法基于AdaBoost,最著名的是隨機梯度增強機.

具體細節(jié)可以看這個視頻.

AdaBoost與決策樹一起使用。
創(chuàng)建第一棵樹后,將在每個訓(xùn)練實例上使用該樹的性能來加權(quán)要創(chuàng)建的下一棵樹應(yīng)注意每個訓(xùn)練實例的關(guān)注程度。
難以預(yù)測的訓(xùn)練數(shù)據(jù)的權(quán)重更高,而易于預(yù)測的實例的權(quán)重更低。依次創(chuàng)建模型,每個模型都會更新訓(xùn)練實例上的權(quán)重,這些權(quán)重會影響序列中下一棵樹執(zhí)行的學(xué)習(xí)。構(gòu)建完所有樹之后,對新數(shù)據(jù)進行預(yù)測,并根據(jù)訓(xùn)練數(shù)據(jù)的準(zhǔn)確性對每棵樹的性能進行加權(quán)。

由于該算法在糾正錯誤方面投入了很多精力,因此刪除異常值和數(shù)據(jù)去噪非常重要。

責(zé)任編輯:xj

原文標(biāo)題:機器學(xué)習(xí)新手的十大算法導(dǎo)覽

文章出處:【微信公眾號:新機器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4708

    瀏覽量

    95255
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    66

    文章

    8500

    瀏覽量

    134502

原文標(biāo)題:機器學(xué)習(xí)新手的十大算法導(dǎo)覽

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    中國移動攜手海格通信打造北斗通導(dǎo)融合芯片

    近日,中國移動投資公司發(fā)布“中國移動產(chǎn)投協(xié)同十大標(biāo)桿案例”,與海格通信(股票代碼:002465)攜手打造的北斗通導(dǎo)融合芯片項目位列十大標(biāo)桿之一,備受市場矚目。
    的頭像 發(fā)表于 07-01 17:11 ?461次閱讀

    十大鮮為人知卻功能強大的機器學(xué)習(xí)模型

    本文轉(zhuǎn)自:QuantML當(dāng)我們談?wù)?b class='flag-5'>機器學(xué)習(xí)時,線性回歸、決策樹和神經(jīng)網(wǎng)絡(luò)這些常見的算法往往占據(jù)了主導(dǎo)地位。然而,除了這些眾所周知的模型之外,還存在一些鮮為人知但功能強大的算法,它們能夠
    的頭像 發(fā)表于 04-02 14:10 ?504次閱讀
    <b class='flag-5'>十大</b>鮮為人知卻功能強大的<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>模型

    請問STM32部署機器學(xué)習(xí)算法硬件至少要使用哪個系列的芯片?

    STM32部署機器學(xué)習(xí)算法硬件至少要使用哪個系列的芯片?
    發(fā)表于 03-13 07:34

    機器學(xué)習(xí)模型市場前景如何

    當(dāng)今,隨著算法的不斷優(yōu)化、數(shù)據(jù)量的爆炸式增長以及計算能力的飛速提升,機器學(xué)習(xí)模型的市場前景愈發(fā)廣闊。下面,AI部落小編將探討機器學(xué)習(xí)模型市場
    的頭像 發(fā)表于 02-13 09:39 ?356次閱讀

    年度電解槽十大品牌+年度制氫十大供應(yīng)商,穩(wěn)石氫能榮獲兩大獎項!

    此前,2024年10月16日,由國能網(wǎng)與國能能源研究院聯(lián)合舉辦的第九屆新能源行業(yè)品牌盛典(GPBC)圓滿召開,穩(wěn)石氫能榮獲2024年度·氫能行業(yè)品牌榜“年度電解槽十大品牌”與“年度制氫十大供應(yīng)商”兩大獎項!
    的頭像 發(fā)表于 01-24 14:53 ?727次閱讀

    華為發(fā)布2025智能光伏十大趨勢

    華為數(shù)字能源以“融合創(chuàng)新,智構(gòu)未來,加速光伏成為主力能源”為主題,舉辦2025智能光伏十大趨勢發(fā)布會。華為數(shù)字能源智能光伏產(chǎn)品線總裁周濤發(fā)布了智能光伏十大趨勢和重磅白皮書,為光儲產(chǎn)業(yè)的高質(zhì)量發(fā)展提供前瞻性支持。
    的頭像 發(fā)表于 01-06 17:12 ?870次閱讀

    華為云 Flexus X 實例部署安裝 Jupyter Notebook,學(xué)習(xí) AI,機器學(xué)習(xí)算法

    前言 由于本人最近在學(xué)習(xí)一些機器算法,AI 算法的知識,需要搭建一個學(xué)習(xí)環(huán)境,所以就在最近購買的華為云 Flexus X 實例上安裝了
    的頭像 發(fā)表于 01-02 13:43 ?520次閱讀
    華為云 Flexus X 實例部署安裝 Jupyter Notebook,<b class='flag-5'>學(xué)習(xí)</b> AI,<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>算法</b>

    傳統(tǒng)機器學(xué)習(xí)方法和應(yīng)用指導(dǎo)

    在上一篇文章中,我們介紹了機器學(xué)習(xí)的關(guān)鍵概念術(shù)語。在本文中,我們會介紹傳統(tǒng)機器學(xué)習(xí)的基礎(chǔ)知識和多種算法特征,供各位老師選擇。 01 傳統(tǒng)
    的頭像 發(fā)表于 12-30 09:16 ?1154次閱讀
    傳統(tǒng)<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>方法和應(yīng)用指導(dǎo)

    NPU與機器學(xué)習(xí)算法的關(guān)系

    在人工智能領(lǐng)域,機器學(xué)習(xí)算法是實現(xiàn)智能系統(tǒng)的核心。隨著數(shù)據(jù)量的激增和算法復(fù)雜度的提升,對計算資源的需求也在不斷增長。NPU作為一種專門為深度學(xué)習(xí)
    的頭像 發(fā)表于 11-15 09:19 ?1181次閱讀

    全國5G新基建智慧燈桿建設(shè)十大代表性案例

    全國5G新基建智慧燈桿建設(shè)十大代表性案例
    的頭像 發(fā)表于 11-07 12:50 ?1272次閱讀
    全國5G新基建智慧燈桿建設(shè)<b class='flag-5'>十大</b>代表性案例

    知存科技WTM2101芯片助力導(dǎo)行業(yè)AI新體驗

    知存科技WTM2101憑借顛覆性的存內(nèi)計算架構(gòu),能夠在極低功耗和延時下運行智能語音、智能健康監(jiān)測算法,已經(jīng)率先落地AR眼鏡、藍牙耳機等領(lǐng)域?qū)崿F(xiàn)百萬級終端應(yīng)用。近日,WTM2101被創(chuàng)新應(yīng)用于某語音導(dǎo)領(lǐng)導(dǎo)品牌旗下的導(dǎo)游講解器發(fā)射
    的頭像 發(fā)表于 11-06 15:27 ?919次閱讀

    選擇精科睿進行 PCBA 代工代料有以下十大理由

    選擇精科睿進行 PCBA 代工代料有以下十大理由:
    的頭像 發(fā)表于 11-06 10:21 ?501次閱讀

    人工智能、機器學(xué)習(xí)和深度學(xué)習(xí)存在什么區(qū)別

    人工智能指的是在某種程度上顯示出類似人類智能的設(shè)備。AI有很多技術(shù),但其中一個很大的子集是機器學(xué)習(xí)——讓算法從數(shù)據(jù)中學(xué)習(xí)。
    發(fā)表于 10-24 17:22 ?2948次閱讀
    人工智能、<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>存在什么區(qū)別

    LIBS結(jié)合機器學(xué)習(xí)算法的江西名優(yōu)春茶采收期鑒別

    以廬山云霧茶和狗牯腦茶的明前茶、雨前茶為對象,研究激光誘導(dǎo)擊穿光譜結(jié)合機器學(xué)習(xí)的茶葉鑒別方法。將茶葉茶,水?dāng)?shù)據(jù)融合可有效鑒別春茶采收期,且數(shù)據(jù)融合后表現(xiàn)出更好的穩(wěn)定性和魯棒性,LIBS結(jié)合機器
    的頭像 發(fā)表于 10-22 18:05 ?634次閱讀
    LIBS結(jié)合<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>算法</b>的江西名優(yōu)春茶采收期鑒別

    中國信通院發(fā)布“2024云計算十大關(guān)鍵詞”

    7月23日,由中國通信標(biāo)準(zhǔn)化協(xié)會主辦,中國信息通信研究院(簡稱“中國信通院”)承辦的“2024可信云大會”在京召開。大會上,中國信通院正式發(fā)布“2024云計算十大關(guān)鍵詞”,中國信通院云計算與大數(shù)
    的頭像 發(fā)表于 08-02 08:28 ?1064次閱讀
    中國信通院發(fā)布“2024云計算<b class='flag-5'>十大</b>關(guān)鍵詞”