裸体丰满少妇做受V,av一区二区三区免费无线

Scikit-learn是使用最廣泛的Python 機(jī)器學(xué)習(xí)庫之一。它有標(biāo)準(zhǔn)化和簡單的接口，用于數(shù)據(jù)預(yù)處理和模型訓(xùn)練、優(yōu)化以及評估。

這個(gè)項(xiàng)目最初是由David Cournapeau 開發(fā)的Google Summer of Code 項(xiàng)目，并于2010年首次公開發(fā)布。自創(chuàng)建以來，該庫已經(jīng)發(fā)展成為一個(gè)豐富的生態(tài)系統(tǒng)，用于開發(fā)機(jī)器學(xué)習(xí)模型。隨著時(shí)間的推移，該項(xiàng)目開發(fā)了許多方便的功能，以增強(qiáng)其易用性。在本文中，我將介紹你可能不知道的10個(gè)關(guān)于Scikit-learn最有用的特性。

1. 內(nèi)置數(shù)據(jù)集

Scikit-learn API內(nèi)置了各種toy和real-world數(shù)據(jù)集[1]。這些可以便捷地通過一行代碼訪問，如果你正在學(xué)習(xí)或只是想快速嘗試新功能，這會(huì)非常有用。

你還可以使用make_regression()、make_blobs()和make_classification()生成合成數(shù)據(jù)集。所有加載實(shí)用程序都提供了返回已拆分為X（特征）和y（目標(biāo)）的數(shù)據(jù)選項(xiàng)，以便它們可以直接用于訓(xùn)練模型。

2. 獲取公開數(shù)據(jù)集

如果你想直接通過Scikit-learn訪問更多的公共可用數(shù)據(jù)集，請了解，有一個(gè)方便的函數(shù)datasets.fetch_openml，可以讓您直接從openml.org網(wǎng)站[2]獲取數(shù)據(jù)。這個(gè)網(wǎng)站包含超過21000個(gè)不同的數(shù)據(jù)集，可以用于機(jī)器學(xué)習(xí)項(xiàng)目。

3. 內(nèi)置分類器來訓(xùn)練baseline

在為項(xiàng)目開發(fā)機(jī)器學(xué)習(xí)模型時(shí)，首先創(chuàng)建一個(gè)baseline模型是非常有必要的。這個(gè)模型在本質(zhì)上應(yīng)該是一個(gè)“dummy”模型，比如一個(gè)總是預(yù)測最頻繁出現(xiàn)的類的模型。這就提供了一個(gè)基準(zhǔn)，用來對你的“智能”模型進(jìn)行基準(zhǔn)測試，這樣你就可以確保它的性能比隨機(jī)結(jié)果更好。

Scikit learn包括用于分類任務(wù)的DummyClassifier() 和用于基于回歸問題的 DummyRegressor()。

4. 內(nèi)置繪圖api

Scikit learn有一個(gè)內(nèi)置的繪圖API，允許你在不導(dǎo)入任何其他庫的情況下可視化模型性能。包括以下繪圖：部分相關(guān)圖、混淆矩陣、精確召回曲線和ROC曲線。

5. 內(nèi)置特征選擇方法

提高模型性能的一種技術(shù)是只使用最好的特征集或通過刪除冗余特征來訓(xùn)練模型。這個(gè)過程稱為特征選擇。

Scikit learn有許多函數(shù)來執(zhí)行特征選擇。一個(gè)示例為 SelectPercentile()，該方法根據(jù)所選的統(tǒng)計(jì)方法選擇性能最好的X百分位特征進(jìn)行評分。

6. 機(jī)器學(xué)習(xí)pipeline

除了為機(jī)器學(xué)習(xí)提供廣泛的算法外，Scikit learn還具有一系列用于「預(yù)處理」和「轉(zhuǎn)換數(shù)據(jù)」的功能。為了促進(jìn)機(jī)器學(xué)習(xí)工作流程的再現(xiàn)性和簡單性，Scikit learn創(chuàng)建了管道（pipeline），允許將大量預(yù)處理步驟與模型訓(xùn)練階段鏈接在一起。

管道將工作流中的所有步驟存儲(chǔ)為單個(gè)實(shí)體，可以通過「fit」和「predict」方法調(diào)用該實(shí)體。在管道對象上調(diào)用fit方法時(shí)，預(yù)處理步驟和模型訓(xùn)練將自動(dòng)執(zhí)行。

7. ColumnTransformer

在許多數(shù)據(jù)集中，你將擁有不同類型的特征，需要應(yīng)用不同的預(yù)處理步驟。例如，可能有分類數(shù)據(jù)和連續(xù)數(shù)據(jù)的混合，你可能希望通過one-hot編碼將分類數(shù)據(jù)轉(zhuǎn)換為數(shù)字，并縮放數(shù)字變量。

Scikit-learn管道有一個(gè)名為ColumnTransformer的函數(shù)，它允許你通過索引或指定列名來輕松指定要對哪些列應(yīng)用最適當(dāng)?shù)念A(yù)處理。

8. 管道的HTML形式

管道通常會(huì)變得非常復(fù)雜，尤其是在處理真實(shí)世界的數(shù)據(jù)時(shí)。因此，scikit-learn提供了一種方法來輸出管道中步驟的HTML圖表[3]，非常方便。

9. 可視化樹模型

plot_tree() 函數(shù)允許你創(chuàng)建決策樹模型中的步驟圖。

10. 豐富的第三方擴(kuò)展

許多第三方庫可以更好地?cái)U(kuò)展scikit-learn的特性。舉個(gè)栗子，category-encoders庫，它為分類特性提供了更大范圍的預(yù)處理方法，以及ELI5包以實(shí)現(xiàn)更大的模型可解釋性。這兩個(gè)包也可以直接在Scikit-learn管道中使用。

本文參考資料

[1]toy和real-world數(shù)據(jù)集: https://scikit-learn.org/stable/datasets/index.html

[2]openml.org網(wǎng)站: https://www.openml.org/home

[3]HTML圖表: https://scikit-learn.org/stable/modules/compose.html#visualizing-composite-estimators

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

機(jī)器學(xué)習(xí)

機(jī)器學(xué)習(xí)

+關(guān)注

關(guān)注
66

文章
8541

瀏覽量
136209
python

python

+關(guān)注

關(guān)注
57

文章
4856

瀏覽量
89531

原文標(biāo)題：關(guān)于Scikit-Learn你（也許）不知道的10件事

文章出處：【微信號：zenRRan，微信公眾號：深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费

搜索歷史

Python機(jī)器學(xué)習(xí)庫談Scikit-learn技術(shù)

評論