99re在线观看精品免费,激情都市国产

決策樹是聽上去比較厲害且又相對簡單的算法，但在實現(xiàn)它的過程中可能會對編程本身有更深的理解、尤其是對遞歸的利用

我個人的習(xí)慣是先說明最終能干什么、然后再來說怎么實現(xiàn)，這樣也能避免一些不必要的信息篩選。所以，這一部分主要用于讓已經(jīng)知道一定的基礎(chǔ)知識的童鞋知道最后能走多遠(yuǎn)，如果是想從頭開始學(xué)的話可以無視這一章直接看第一章

ID3 和 C4.5（可以控制最大深度），CART 可能會在假期實現(xiàn)

可視化；比如在比較著名的蘑菇數(shù)據(jù)集上的最終結(jié)果為（隨機(jī) 5000 個訓(xùn)練）：正確率 100%（大概挺正常的……）。其中，每個 Node 最后那個括號里面，箭頭前面是特征取值，箭頭后面或者是類別、或者是下一個選取的特征的維度

運用 cv2 的話可以畫出比較傳統(tǒng)的決策樹的可視化圖，效果大致如下：

其中紅色數(shù)字標(biāo)注了該 Node 選擇了數(shù)據(jù)的哪個維度，綠色字母表示該 Node 所屬的類別，白色字母代表著對應(yīng)數(shù)據(jù)維度特征的取值

比如說如果樣本的第 4 維（從 0 開始計數(shù)）是 a、l 的話就判為類別 e，是 c、f、m、p、s、y 的話就判為類別 p，是 n 的話就再看樣本的第 7 維、以此類推

雖說我這個決策樹暫時不支持連續(xù)型特征，但相對應(yīng)的它有一個好處：你不用把離散型數(shù)據(jù)處理成數(shù)值形式、而可以直接把它輸入模型來訓(xùn)練。據(jù)我所知，scikit-learn 的 DecisionTreeClassifier 還不支持這一點（自豪臉）（然而人家比你快 1~2 倍）。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴