?

首頁: 電子電路圖,電子技術(shù)資料網(wǎng)站首頁

電子資料下載: 電子資料下載頻道 -- 為電子工程師提供激發(fā)創(chuàng)新靈感的新方案、新的參考設(shè)計、新的設(shè)計構(gòu)想等可下載的電子資料！

電子技術(shù)應(yīng)用: 電子技術(shù)應(yīng)用頻道 -- 為電子工程師提供電子產(chǎn)品設(shè)計所需的技術(shù)分析、設(shè)計技巧、設(shè)計工具、測試工具等技術(shù)文章！

電子元器件: 專業(yè)的電子元器件平臺 -- 及時發(fā)布大量最新IC、分立器件、模組等電子元器件產(chǎn)品信息！

電子電路圖: 電路圖頻道 -- 提供電子電路圖,原理圖,汽車電路圖,手機(jī)電路圖,功放電路圖,電源電路圖等電路圖紙

電子技術(shù)論壇: 構(gòu)建電子工程師交流的平臺 -- 在交流中進(jìn)一步學(xué)習(xí)設(shè)計技巧、規(guī)劃技術(shù)人生、提升自我價值！

源碼下載: 源碼下載頻道; uCOS編程 C/C++語言編程 Symbian編程 Linux/uClinux/Unix編程 Windows編程 matlab源程序 php源碼下載 asp.net源碼下載 java源碼下載匯編編程驅(qū)動程序單片機(jī)編程數(shù)值算法/人工智能

您的位置：電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

R語言機(jī)器學(xué)習(xí)算法的性能分析比較

大?。?/span>0.6 MB 人氣： 2017-10-12 需要積分：1

推薦 + 挑錯 + 收藏(0) + 用戶評論（0）

前往下載地址

分享到:

標(biāo)簽：機(jī)器學(xué)習(xí)(129859)

你如何有效地計算出不同機(jī)器學(xué)習(xí)算法的估計準(zhǔn)確性？在這篇文章中，你將會學(xué)到8種技術(shù)，用來比較R語言機(jī)器學(xué)習(xí)算法。你可以使用這些技術(shù)來選擇最精準(zhǔn)的模型，并能夠給出統(tǒng)計意義方面的評價，以及相比其它算法的絕對優(yōu)勢。
　　選擇最好的機(jī)器學(xué)習(xí)模型
　　你如何根據(jù)需求選擇最好的模型？
　　在你進(jìn)行機(jī)器學(xué)習(xí)項目的時候，往往會有許多良好模型可供選擇。每個模型都有不同的性能特點(diǎn)。
　　使用重采樣方法，如交叉驗證，就可以得到每個模型在未知數(shù)據(jù)上精準(zhǔn)度的估計。你需要利用這些估計從你創(chuàng)建的一系列模型中選擇一到兩個最好的模型。
　　仔細(xì)比較機(jī)器學(xué)習(xí)模型
　　當(dāng)你有了新數(shù)據(jù)集，使用多種不同的圖形技術(shù)可視化數(shù)據(jù)是個好主意，你可以從不同角度來觀察數(shù)據(jù)。
　　這種想法也可以用于模型選擇。你應(yīng)該使用不同的方法來進(jìn)行估計機(jī)器學(xué)習(xí)算法的準(zhǔn)確率，依此來選擇一到兩個模型。
　　你可以使用不同的可視化方法來顯示平均準(zhǔn)確率、方差和模型精度分布的其他性質(zhì)。
　　比較并選擇R語言的機(jī)器學(xué)習(xí)模型
　　在本節(jié)中，你將會學(xué)到如何客觀地比較R語言機(jī)器學(xué)習(xí)模型。
　　通過本節(jié)中的案例研究，你將為皮馬印第安人糖尿病數(shù)據(jù)集創(chuàng)建一些機(jī)器學(xué)習(xí)模型。然后你將會使用一系列不同的可視化技術(shù)來比較這些模型的估計準(zhǔn)確率。
　　本案例研究分為三個部分：
　　準(zhǔn)備數(shù)據(jù)集：加載庫文件和數(shù)據(jù)集，準(zhǔn)備訓(xùn)練模型。訓(xùn)練模型：在數(shù)據(jù)集上訓(xùn)練標(biāo)準(zhǔn)機(jī)器學(xué)習(xí)模型，準(zhǔn)備進(jìn)行評估。比較模型：使用8種不同的技術(shù)比較訓(xùn)練得到的模型。
　　準(zhǔn)備數(shù)據(jù)集
　　本研究案例中使用的數(shù)據(jù)集是皮馬印第安人糖尿病數(shù)據(jù)集，可在UCI機(jī)器學(xué)習(xí)庫中獲取。也可在R中的mlbench包中獲取。
　　這是一個二元分類問題，預(yù)測患者在五年之內(nèi)糖尿病是否會發(fā)作。入?yún)⑹菙?shù)值型，描述了女性患者的醫(yī)療信息。
　　現(xiàn)在來加載庫文件和數(shù)據(jù)集。
　　# load librarieslibrary（mlbench） library（caret） # load the datasetdata（PimaIndiansDiabetes）
　　訓(xùn)練模型
　　在本節(jié)中，我們將會訓(xùn)練在下一節(jié)中將要比較的5個機(jī)器學(xué)習(xí)模型。
　　我們將使用重復(fù)交叉驗證，folds為10，repeats為3，這是比較模型的常用標(biāo)準(zhǔn)配置。評估指標(biāo)是精度和kappa，因為它們很容易解釋。
　　根據(jù)算法的代表性和學(xué)習(xí)風(fēng)格方式進(jìn)行半隨機(jī)選擇。它們有：
　　分類和回歸樹線性判別分析使用徑向基函數(shù)的支持向量機(jī)K-近鄰隨機(jī)森林
　　訓(xùn)練完模型之后，將它們添加到一個list中，然后調(diào)用resamples（）函數(shù)。此函數(shù)可以檢查模型是可比較的，并且模型都使用同樣的訓(xùn)練方案（訓(xùn)練控制配置）。這個對象包含每個待評估算法每次折疊和重復(fù)的評估指標(biāo)。

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

下載地址

不能下載？請通知我們