資料介紹
針對異常檢測中異常數(shù)據(jù)與正常數(shù)據(jù)的比例嚴(yán)重不平衡導(dǎo)致決策樹性能下降的問題,提出了C4.5決策樹的三種改進(jìn)方法一C4.5 +δ、均勻分布熵( UDE)和改進(jìn)分布熵函數(shù)(IDEF)。首先,推導(dǎo)了C4.5算法中屬性選擇準(zhǔn)則會傾向于選擇偏斜劃分的屬性;然后,分析了偏斜劃分使得異常(少數(shù)類)檢測精度下降的原因;其次,分別通過引入緩和因子、均勻分布熵或替換分布熵函數(shù)改進(jìn)了C4.5算法的屬性選擇準(zhǔn)則一 信息增益率;最后,利用WEKA平臺和NSL-KDD數(shù)據(jù)集對改進(jìn)的決策樹進(jìn)行驗(yàn)證。實(shí)驗(yàn)結(jié)果表明,三種改進(jìn)方法均能提高異常檢測精度。其中,相比于C4.5,C4.5 +7、UDE和IDEF算法在KDDTest-21數(shù)據(jù)集上的少數(shù)類檢測精度(靈敏度)分別提高了3.16、3. 02和3.12個百分點(diǎn),均優(yōu)于采用Renyi熵和Tallis熵作為分裂準(zhǔn)則的方法。此外,利用三種改進(jìn)的決策樹檢測工業(yè)控制系統(tǒng)中的異常,不僅可以提高異常的查全率還能減小誤報(bào)率。
異常檢測是指從某個系統(tǒng)的日常數(shù)據(jù)中識別非預(yù)期模式,即異常數(shù)據(jù)。異常通常由惡意行為或違規(guī)操作引發(fā),因此異常檢測技術(shù)廣泛應(yīng)用于網(wǎng)絡(luò)安全、故障檢測等領(lǐng)域。

異常檢測可以視為一-種特殊的分類問題,即分離目標(biāo)數(shù)據(jù)集中的正常數(shù)據(jù)與異常數(shù)據(jù)。因此,絕大多數(shù)基于機(jī)器學(xué)習(xí)的分類方法,如神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、決策樹等,都可以應(yīng)用于異常檢測。然而異常檢測面臨數(shù)據(jù)不平衡問題,即目標(biāo)數(shù)據(jù)集中異常數(shù)據(jù)與正常數(shù)據(jù)的分布是不平衡的,其中異常數(shù)據(jù)一。般遠(yuǎn)遠(yuǎn)少于正常數(shù)據(jù)。數(shù)據(jù)不平衡問題在醫(yī)療診斷、信用卡詐騙檢測,銀行風(fēng)險(xiǎn)管控、系統(tǒng)故障檢測等應(yīng)用中十分常見。在傳統(tǒng)分類問題中,整體準(zhǔn)確度由不同類別的準(zhǔn)確度加權(quán)組成,因此多數(shù)類的準(zhǔn)確度對整體準(zhǔn)確度的影響要遠(yuǎn)大于少數(shù)類。在傳統(tǒng)方法中,分類器會傾向于保證多數(shù)類的準(zhǔn)確度而犧牲少數(shù)類的準(zhǔn)確度,導(dǎo)致少數(shù)類的漏報(bào)率較高。然而在很多異常檢測的現(xiàn)實(shí)應(yīng)用中將異常(少數(shù)類)誤判為正常(多數(shù)類)的代價要遠(yuǎn)遠(yuǎn)高于相反的情況,因此需要盡可能地檢測出異常,降低漏報(bào)率。例如,在癌癥的診斷中,將癌癥(少數(shù)類)患者誤診為健康(多數(shù)類)的危害要遠(yuǎn)大于將非癌癥患者誤診為癌癥的危害,所以要保證檢測結(jié)果為陽性時盡可能地覆蓋真正的癌癥患者。
- 決策樹引擎解決方案
- 基于遺傳優(yōu)化決策樹的建筑能耗預(yù)測模型 6次下載
- 基于非均衡數(shù)據(jù)分類的猶豫模糊決策樹 5次下載
- 面向二分類不平衡數(shù)據(jù)的XGBoost改進(jìn)方法 4次下載
- 利用采樣安全系數(shù)的多類不平衡過采樣算法 8次下載
- 針對電網(wǎng)不平衡與諧波的鎖相環(huán)改進(jìn)設(shè)計(jì) 5次下載
- 基于文化算法的符號網(wǎng)絡(luò)全局不平衡度計(jì)算方法 0次下載
- 決策樹的介紹 0次下載
- 基于決策樹學(xué)習(xí)的智能機(jī)器人控制方法 15次下載
- 改進(jìn)決策樹算法的應(yīng)用研究
- 電子稱重儀表決策樹建模研究 24次下載
- 基于決策樹與相異度的離群數(shù)據(jù)挖掘方法
- 基于屬性相似度的決策樹算法
- 一個基于粗集的決策樹規(guī)則提取算法
- 決策樹技術(shù)在汽車銷售中的應(yīng)用
- 決策樹:技術(shù)全解與案例實(shí)戰(zhàn) 1423次閱讀
- 使用無功補(bǔ)償裝置調(diào)整不平衡電流的基本原理 1910次閱讀
- 如何判斷三相不平衡? 2784次閱讀
- 機(jī)器學(xué)習(xí)之決策樹生成詳解 1.9w次閱讀
- 如何理解矢量測量中“平衡”與“不平衡 2825次閱讀
- 三相不平衡有哪些處理方法 2.1w次閱讀
- 三相電壓不平衡產(chǎn)生原因_三相電壓不平衡的治理措施 2.5w次閱讀
- 教你如何處理不平衡數(shù)據(jù)集 4877次閱讀
- 決策樹和隨機(jī)森林模型 8019次閱讀
- 什么是決策樹?決策樹算法思考總結(jié) 1.1w次閱讀
- 基于決策樹算法的電能表故障預(yù)測方法 1775次閱讀
- 決策樹的原理和決策樹構(gòu)建的準(zhǔn)備工作,機(jī)器學(xué)習(xí)決策樹的原理 6073次閱讀
- 數(shù)據(jù)挖掘算法:決策樹算法如何學(xué)習(xí)及分裂剪枝 5814次閱讀
- 三相電流不平衡度計(jì)算公式_三相電流不平衡度標(biāo)準(zhǔn)及應(yīng)用 7.5w次閱讀
- 機(jī)器學(xué)習(xí):決策樹--python 1626次閱讀
下載排行
本周
- 1珈港科技JC100安全芯片簡介
- 466.19 KB | 1次下載 | 免費(fèi)
- 2068 HJJF-1000K 三相 無高低檔 說明書
- 462.90 KB | 次下載 | 免費(fèi)
- 3三坐標(biāo)深腔掃描技術(shù)解決汽車穩(wěn)定桿機(jī)殼斜齒同軸度檢測難題
- 349.13 KB | 次下載 | 免費(fèi)
- 4高性能三坐標(biāo)測量系統(tǒng)全面覆蓋半導(dǎo)體設(shè)備各類核心部件的檢測需求
- 583.31 KB | 次下載 | 免費(fèi)
- 5RY1228AD10 雙降壓2通道電源管理單元(PMU)數(shù)據(jù)手冊
- 0.52 MB | 次下載 | 免費(fèi)
- 6LN1179系列 30V 低功耗 500mA CMOS 電壓穩(wěn)壓器數(shù)據(jù)手冊
- 1.29 MB | 次下載 | 免費(fèi)
- 7Zynq-7000 SoC與7系列設(shè)備內(nèi)存接口解決方案數(shù)據(jù)手冊
- 17.53 MB | 次下載 | 10 積分
- 8FII-PRA006/010使用說明
- 10.93 MB | 次下載 | 10 積分
本月
- 1常用電子元器件集錦
- 1.72 MB | 24496次下載 | 免費(fèi)
- 2三相逆變主電路的原理圖和PCB資料合集免費(fèi)下載
- 27.35 MB | 113次下載 | 1 積分
- 3蘋果iphone 11電路原理圖
- 4.98 MB | 19次下載 | 5 積分
- 4PC2456高壓浪涌抑制器控制器數(shù)據(jù)手冊
- 3.03 MB | 14次下載 | 免費(fèi)
- 5PC2464具理想二極管的浪涌抑制控制器數(shù)據(jù)手冊
- 4.42 MB | 9次下載 | 免費(fèi)
- 6ssd1306單片 CMOS OLED/PLED 驅(qū)動芯片中文手冊
- 1.66 MB | 8次下載 | 1 積分
- 7PC2466高電壓浪涌抑制器數(shù)據(jù)手冊
- 3.37 MB | 8次下載 | 免費(fèi)
- 8EMC電路設(shè)計(jì)工程師必備的EMC基礎(chǔ)
- 0.42 MB | 7次下載 | 2 積分
總榜
- 1matlab軟件下載入口
- 未知 | 935132次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計(jì)
- 1.48MB | 420064次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233089次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191401次下載 | 10 積分
- 5十天學(xué)會AVR單片機(jī)與C語言視頻教程 下載
- 158M | 183345次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81593次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費(fèi)下載
- 0.02 MB | 73816次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65990次下載 | 10 積分
電子發(fā)燒友App






創(chuàng)作
發(fā)文章
發(fā)帖
提問
發(fā)資料
發(fā)視頻
上傳資料賺積分
評論