資料介紹
聚類分析是將研究對(duì)象分為相對(duì)同質(zhì)的群組的統(tǒng)計(jì)分析技術(shù),聚類分析的核心就是發(fā)現(xiàn)有用的對(duì)象簇。K-means聚類算法由于具有出色的速度和良好的可擴(kuò)展性,一直備受廣大學(xué)者的關(guān)注。然而,傳統(tǒng)的K-means算法,未考慮各個(gè)屬性對(duì)于最終聚類結(jié)果的影響差異性,這使得聚類的精度有一定的影響。針對(duì)上述問題,本文提出一種改進(jìn)的特征加權(quán)算法。改進(jìn)算法通過采用信息熵和ReliefF特征選擇算法對(duì)特征進(jìn)行加權(quán)選擇,修正聚類對(duì)象間的距離函數(shù),使算法達(dá)到更準(zhǔn)確更高效的聚類效果。仿真實(shí)驗(yàn)結(jié)果表明,與傳統(tǒng)的K-means算法相比,改進(jìn)后的算法聚類結(jié)果穩(wěn)定,聚類的精度有明顯提升。
數(shù)據(jù)挖掘是目前人工智能和數(shù)據(jù)庫(kù)領(lǐng)域研究的熱點(diǎn)問題,指從大量的數(shù)據(jù)中提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過程。聚類分析現(xiàn)在已經(jīng)成為數(shù)據(jù)挖掘領(lǐng)域中一個(gè)非常重要的研究方向。MacQueen 提出的K-means 算法是聚類分析中最常用的方法之一。它采用距離作為相似性的評(píng)價(jià)指標(biāo),即認(rèn)為兩個(gè)對(duì)象的距離越近,其相似度就越大。該算法認(rèn)為簇是由距離靠近的對(duì)象組成的,因此把得到緊湊且獨(dú)立的簇作為最終目標(biāo)。K-means 算法假設(shè)樣本的每個(gè)特征對(duì)最終聚類的貢獻(xiàn)程度一樣,但在實(shí)際情況中某些特征在聚類的過程中起到很大的作用,而某些特征的作用卻很小,甚至對(duì)聚類過程沒有影響。
?
針對(duì)傳統(tǒng)K-means 算法的這一問題,學(xué)者們進(jìn)行了大量研究,研究表明:通過對(duì)特征賦予不同的特征權(quán)值,能夠有效解決上述問題并提高聚類性能。目前,計(jì)算特征權(quán)重的算法有很多種:等人提出一種結(jié)合限制數(shù)據(jù)的特征權(quán)值量化函數(shù),該函數(shù)通過用戶指定的限制數(shù)據(jù)進(jìn)行特征權(quán)值量化并對(duì)不同的限制數(shù)據(jù)賦予不同的置信度,解決了限制數(shù)據(jù)分布不均勻和限制數(shù)據(jù)中可能包含不一致性的問題;LiJie 等人提出將針對(duì)分類問題的ReliefF 算法應(yīng)用于聚類問題,通過ReliefF 算法計(jì)算特征權(quán)重值,并對(duì)各維特征進(jìn)行加權(quán),提高聚類的性能;Meng Qian 等人提出通過梯度下降技術(shù)最小化特征評(píng)估函數(shù)FLearning (w)為每個(gè)特征分配權(quán)重并進(jìn)行加權(quán),該算法采用遺傳算法和模擬退火算法的優(yōu)點(diǎn),減弱冗余特征的影響,解決了容易陷入局部最優(yōu)解的問題。Songtao Shang 等人提出一種改進(jìn)的基尼指數(shù)算法計(jì)算特征權(quán)重,該算法克服了原始Gini 的缺點(diǎn),將條件概率與后驗(yàn)概率結(jié)合,抑制訓(xùn)練集不平衡時(shí)的影響。利用信息論中的信息熵計(jì)算特征權(quán)重并對(duì)各位特征加權(quán),有效的解決了特征對(duì)聚類的影響。
綜上所述,為了提高傳統(tǒng)K-means 算法的聚類精度,國(guó)內(nèi)外學(xué)者對(duì)K-means 算法進(jìn)行了大量改進(jìn)探索研究,并取得了一些階段性的成果。本文擬研究傳統(tǒng)K-means 算法在聚類過程中聚類對(duì)象的每個(gè)特征對(duì)聚類結(jié)果的貢獻(xiàn)度,使貢獻(xiàn)程度大的特征優(yōu)先利用,理論上講可以有效提升K-means 算法聚類的準(zhǔn)確率和精度。因此,本文提出將熵值法和ReliefF 特征選擇算法有機(jī)融合,通過采用信息熵和ReliefF 特征選擇算法對(duì)特征進(jìn)行加權(quán)選擇,修正聚類對(duì)象間的距離函數(shù),使算法達(dá)到更準(zhǔn)確更高效的聚類效果。實(shí)驗(yàn)結(jié)果表明,改進(jìn)后的算法聚類結(jié)果穩(wěn)定,且具有較高的準(zhǔn)確率,達(dá)到預(yù)期目的。
- 基于特征和實(shí)例遷移的加權(quán)多任務(wù)聚類算法 3次下載
- 集成簇內(nèi)和簇間距離的加權(quán)k-means聚類方法 1次下載
- 針對(duì)高維稀疏數(shù)據(jù)的可重疊子空間K-Means聚類算法 13次下載
- 基于距離和密度的并行二分K-means算法 17次下載
- 一種改進(jìn)的聚類聯(lián)合相似度推薦算法 10次下載
- 如何使用多維網(wǎng)格空間進(jìn)行改進(jìn)K-means聚類算法資料概述 1次下載
- 基于改進(jìn)k-means算法的MANET異常檢測(cè)方法 0次下載
- 基于聚類集成技術(shù)的在線特征選擇 0次下載
- 基于改進(jìn)K_means聚類的欠定盲分離算法_柴文標(biāo) 0次下載
- 特征加權(quán)和優(yōu)化劃分的模糊C均值聚類算法 0次下載
- 混合細(xì)菌覓食和粒子群的k_means聚類算法 0次下載
- 基于最小生成樹的層次K_means聚類算法 5次下載
- K-means+聚類算法研究綜述
- 改進(jìn)的k-means聚類算法在供電企業(yè)CRM中的應(yīng)用
- 一種增強(qiáng)的K-means聚類算法在入侵檢測(cè)中的應(yīng)用
- 基于K-means聚類算法的圖像分割 2258次閱讀
- 如何在 Python 中安裝和使用頂級(jí)聚類算法 613次閱讀
- 10種頂流聚類算法Python實(shí)現(xiàn)(附完整代碼) 1617次閱讀
- 基于距離的聚類算法K-means的設(shè)計(jì)實(shí)現(xiàn) 2348次閱讀
- 基本的k-means算法流程 1.9w次閱讀
- PLC常用基本環(huán)節(jié)梯形圖和詳細(xì)文字說明詳細(xì)資料概述 1w次閱讀
- K-Means算法的簡(jiǎn)單介紹 4934次閱讀
- 人工智能機(jī)器學(xué)習(xí)之K近鄰算法(KNN) 2882次閱讀
- Python無(wú)監(jiān)督學(xué)習(xí)的幾種聚類算法包括K-Means聚類,分層聚類等詳細(xì)概述 3w次閱讀
- 一種基于MapReduce模型的并行化k-medoids聚類算法 5377次閱讀
- 基于密度DBSCAN的聚類算法 2.1w次閱讀
- k means聚類算法實(shí)例 1.5w次閱讀
- K-means的優(yōu)缺點(diǎn)及改進(jìn) 3.2w次閱讀
- k-means算法原理解析 8362次閱讀
- 關(guān)聯(lián)規(guī)則挖掘——Apriori算法的基本原理以及改進(jìn) 9439次閱讀
下載排行
本周
- 1PID控制算法學(xué)習(xí)筆記資料
- 3.43 MB | 3次下載 | 2 積分
- 2匯聯(lián)芯橋代理_HL817_USB3.1 HUB控制器 提供樣品與設(shè)計(jì)資料
- 1.05 MB | 1次下載 | 免費(fèi)
- 3VLI威鋒代理-VL103-擴(kuò)展塢PD3.0協(xié)議芯片,typeCPD充電輸出DP信號(hào) 替代VL102
- 1.18 MB | 1次下載 | 免費(fèi)
- 4一種抗輻射加固檢錯(cuò)糾錯(cuò)電路的設(shè)計(jì)
- 0.32 MB | 次下載 | 2 積分
- 5NVS800校驗(yàn)手操器操作說明書
- 0.54 MB | 次下載 | 免費(fèi)
- 6瑞芯微代理 RK628F Datasheet V1 HDMI轉(zhuǎn)MIPI/LVDS 視頻橋接芯片
- 1.29 MB | 次下載 | 免費(fèi)
- 78232A/8232B中文數(shù)據(jù)手冊(cè)
- 0.57 MB | 次下載 | 2 積分
- 8SW5099規(guī)格書
- 1.37 MB | 次下載 | 1 積分
本月
- 1如何看懂電子電路圖
- 12.88 MB | 272次下載 | 免費(fèi)
- 2PC5502負(fù)載均流控制電路數(shù)據(jù)手冊(cè)
- 1.63 MB | 12次下載 | 免費(fèi)
- 3RK3588數(shù)據(jù)手冊(cè)
- 2.24 MB | 12次下載 | 免費(fèi)
- 4ESP32開發(fā)板元件資料
- 0.03 MB | 8次下載 | 免費(fèi)
- 5OAH0428 V1.0英文規(guī)格書
- 5.86 MB | 8次下載 | 免費(fèi)
- 6PC1032 5.5V_3A高效率同步降壓轉(zhuǎn)換器數(shù)據(jù)手冊(cè)
- 0.76 MB | 3次下載 | 免費(fèi)
- 7臺(tái)達(dá)變頻器VFD-M使用手冊(cè)
- 2.51 MB | 3次下載 | 免費(fèi)
- 8PID控制算法學(xué)習(xí)筆記資料
- 3.43 MB | 3次下載 | 2 積分
總榜
- 1matlab軟件下載入口
- 未知 | 935132次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計(jì)
- 1.48MB | 420064次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233089次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191414次下載 | 10 積分
- 5十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
- 158M | 183349次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81599次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費(fèi)下載
- 0.02 MB | 73818次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65990次下載 | 10 積分
評(píng)論