資料介紹
在數(shù)據(jù)挖掘領(lǐng)域中,通常以分類精度作為分類算法效果的評估標(biāo)準(zhǔn)。這一標(biāo)準(zhǔn)是建立在假設(shè)任意一實例被誤分類為任意類時都具備同樣代價的基礎(chǔ)上的。當(dāng)此假設(shè)不成立時,直接使用傳統(tǒng)分類方法就無法取得良好的分類和預(yù)測效果。針對這一問題,通過改進(jìn)編解碼方法以及在適應(yīng)度函數(shù)中集成樣本的不同誤分類代價,提出了一種基于基因表達(dá)式程序設(shè)計的代價敏感分類算法(CSC-GEP),并在三個UCI數(shù)據(jù)集上對該算法進(jìn)行了測試,實驗結(jié)果表明CSC-GEP是一種有效的代價敏感分類算法。
關(guān) 鍵 詞 分類; 代價敏感; 誤分類代價; 基因表達(dá)式程序設(shè)計
In data mining reseach, the classification algorithms generally pursue more highly accuracy. It is based on the assumption that all misclassifications have the same cost. However, the assumption is not correct in the real world, so that the normal classification algorithms do not perform well. By improving the encode/decode methods and taking different misclassification cost into account, this paper concerns a new cost-sensitive algorithm called CSC-GEP based on Gene Expression Programming (GEP). The experimental results show that the new algorithm is effective.
Key words classification; cost-sensitive; cost of misclassification; gene expression programming
在數(shù)據(jù)挖掘中,分類的任務(wù)通常是建立一個期望誤分類數(shù)量最小的分類器,比較典型的例子如C4.5的決策樹算法,在傳統(tǒng)上都是基于分類錯誤具有相同的代價的假定上的。而在現(xiàn)實中,不同的分類錯誤通常會導(dǎo)致不同的代價。以UCI數(shù)據(jù)集中的Heart disease數(shù)據(jù)集為例,錯誤地將健康的人分類為患病的代價僅僅是使健康的人接受更多的檢查,但如果將患病的人分類為健康,則有可能延誤病人的治療。很明顯,第二種錯誤分類會令使用者付出遠(yuǎn)比第一種錯誤分類更大的代價。仍以Heart disease數(shù)據(jù)集為例,在這一數(shù)據(jù)集上建立分類器的目的是為了檢測出患病的就診者。對某一特定疾病而言,可能存在的情況是全部就診者中僅有極少數(shù)是患病者,則在最糟糕的情況下,使用傳統(tǒng)分類方法產(chǎn)生的分類器只需要犧牲全部患病者的實例作為誤分類即可獲得一個在傳統(tǒng)意義上的高精度分類結(jié)果。但此時這個分類器也就喪失了存在的意義。因此在處理誤分類代價不統(tǒng)一的數(shù)據(jù)集時,單純地以分類精度作為分類器的評估標(biāo)準(zhǔn)就變得不恰當(dāng)了。一種合理的解決方法是以代價敏感(Cost Sensitive Classification,CSC)的分類取代精度敏感的分類。
本文通過在GEP的適應(yīng)度函數(shù)中加入代價矩陣,提出了基于基因表達(dá)式編程的代價敏感分類算法CSC-GEP。通過在UCI數(shù)據(jù)集中的Heart disease數(shù)據(jù)集、Sick數(shù)據(jù)集和Credit數(shù)據(jù)集上的分類算法與傳統(tǒng)算法進(jìn)行實驗對比,結(jié)果證明CSC-GEP是一種有效的代價敏感分類算法。
- 緩存敏感的多屬性不等值連接操作算法 5次下載
- 計算二類代價矩陣的通用計算公式 8次下載
- 基于機器人操作系統(tǒng)的代價地圖自適應(yīng)膨脹半徑算法 6次下載
- 基于約束關(guān)鍵路徑的代價優(yōu)化調(diào)度算法 2次下載
- 基于直方圖條件熵的水聲數(shù)據(jù)分類算法 9次下載
- 一種基于BERT模型的社交電商文本分類算法 8次下載
- 最大化AUC關(guān)系的PU分類應(yīng)用及相關(guān)算法 12次下載
- 集成WL-CNN和SL-Bi-LSTM的旅游問句文本分類算法 6次下載
- 結(jié)合BERT模型的中文文本分類算法 6次下載
- 如何使用跨尺度代價聚合實現(xiàn)改進(jìn)立體匹配算法 10次下載
- 如何使用直方圖條件熵實現(xiàn)水聲數(shù)據(jù)分類的算法 22次下載
- 如何使用多線性分類器擬合實現(xiàn)攻擊模擬算法 2次下載
- 新的基于代價敏感集成學(xué)習(xí)的非平衡數(shù)據(jù)集分類方法NIBoost 12次下載
- 分類規(guī)則挖掘算法綜述
- 代價敏感支持向量機在垃圾郵件過濾中的應(yīng)用
- 什么是濕度敏感等級 MSL (Moisture Sentivity levels)? 2427次閱讀
- 基于Python實現(xiàn)隨機森林算法 1232次閱讀
- 邊緣計算計算卸載與資源分配聯(lián)合優(yōu)化算法 1275次閱讀
- 常見排序算法分類 934次閱讀
- 實現(xiàn)敏感薄膜的高性能化的主要途徑 608次閱讀
- 采用DSP芯片實現(xiàn)星敏感器運算電路系統(tǒng)的應(yīng)用方案 5647次閱讀
- 機器學(xué)習(xí)算法的技巧分享 4299次閱讀
- 詳解機器學(xué)習(xí)分類算法KNN 6172次閱讀
- 圖像分類的5種技術(shù),總結(jié)并歸納算法、實現(xiàn)方式,并進(jìn)行實驗驗證 7.4w次閱讀
- 基于System Generator中實現(xiàn)算法的FPGA設(shè)計方案詳解 1766次閱讀
- 解決二分類問題的算法——AdaBoost算法 1.1w次閱讀
- 基于FPGA的Cordic算法實現(xiàn)的設(shè)計與驗證 2810次閱讀
- 貝葉斯分類算法及其實現(xiàn) 7453次閱讀
- 學(xué)習(xí)KNN算法的基本原理,并用Python實現(xiàn)該算法以及闡述其應(yīng)用價值 5966次閱讀
- 詳細(xì)解析scikit-learn進(jìn)行文本分類 4760次閱讀
下載排行
本周
- 1DC電源插座圖紙
- 0.67 MB | 2次下載 | 免費
- 2AN158 GD32VW553 Wi-Fi開發(fā)指南
- 1.51MB | 2次下載 | 免費
- 3AN148 GD32VW553射頻硬件開發(fā)指南
- 2.07MB | 1次下載 | 免費
- 4AN111-LTC3219用戶指南
- 84.32KB | 次下載 | 免費
- 5AN153-用于電源系統(tǒng)管理的Linduino
- 1.38MB | 次下載 | 免費
- 6AN-283: Σ-Δ型ADC和DAC[中文版]
- 677.86KB | 次下載 | 免費
- 7SM2018E 支持可控硅調(diào)光線性恒流控制芯片
- 402.24 KB | 次下載 | 免費
- 8AN-1308: 電流檢測放大器共模階躍響應(yīng)
- 545.42KB | 次下載 | 免費
本月
- 1ADI高性能電源管理解決方案
- 2.43 MB | 450次下載 | 免費
- 2免費開源CC3D飛控資料(電路圖&PCB源文件、BOM、
- 5.67 MB | 138次下載 | 1 積分
- 3基于STM32單片機智能手環(huán)心率計步器體溫顯示設(shè)計
- 0.10 MB | 130次下載 | 免費
- 4使用單片機實現(xiàn)七人表決器的程序和仿真資料免費下載
- 2.96 MB | 44次下載 | 免費
- 53314A函數(shù)發(fā)生器維修手冊
- 16.30 MB | 31次下載 | 免費
- 6美的電磁爐維修手冊大全
- 1.56 MB | 24次下載 | 5 積分
- 7如何正確測試電源的紋波
- 0.36 MB | 17次下載 | 免費
- 8感應(yīng)筆電路圖
- 0.06 MB | 10次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935121次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計
- 1.48MB | 420062次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233088次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費下載
- 340992 | 191367次下載 | 10 積分
- 5十天學(xué)會AVR單片機與C語言視頻教程 下載
- 158M | 183335次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81581次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費下載
- 0.02 MB | 73810次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65988次下載 | 10 積分
電子發(fā)燒友App






創(chuàng)作
發(fā)文章
發(fā)帖
提問
發(fā)資料
發(fā)視頻
上傳資料賺積分
評論