資料介紹
聚類分析是數(shù)據(jù)挖掘領(lǐng)域中一種非常有用的技術(shù),它用于從大量數(shù)據(jù)中尋找隱含的數(shù)據(jù)分布模式,主要有分割法、層次法、密度法、網(wǎng)格法和模型法等。該文主要討論數(shù)據(jù)挖掘中一種基于密度和網(wǎng)格的聚類分析算法及其在客戶關(guān)系管理中的應(yīng)用。該算法具有較高的聚類效率而且容易實(shí)現(xiàn),可以發(fā)現(xiàn)任意形狀的聚類,時(shí)間復(fù)雜度低,聚類精度高,適用于數(shù)據(jù)的批量更新。該文還提出增量式聚類技術(shù),它不僅能夠利用前期聚類的結(jié)果,充分提高聚類分析的效率,而且可以降低維護(hù)知識(shí)庫所帶來的巨大開銷。實(shí)驗(yàn)證明了算法的有效性。
關(guān) 鍵 詞 聚類分析; 客戶關(guān)系管理; 數(shù)據(jù)挖掘; 密度; 網(wǎng)格
Clustering analysis is a very useful tool in the domain of data mining for searching distributing mode from a great deal of data. Its main algorithms are partition-based algorithm, hierarchy-based algorithm, density-based algorithm, grid-based algorithm, and model-based algorithm. The paper mainly discusses a clustering algorithm based on density and grid in data mining, which has high clustering efficiency and low time complexity. It is efficient and effective for multi-density and uniformity density data sets with noise and suitable for batch update. After that an incremental clustering technique is presented. This technique not only makes best use of the former clustering results and improves the efficiency of clustering analysis, but also brings to the reduction of enormous expenditure on knowledge base maintenance. At last an application of the algorithm in Customer Relationship Management (CRM) is gien.
Key words clustering analysis; customer relationship management; data mining; density; grid
聚類分析是數(shù)據(jù)挖掘領(lǐng)域研究的重要課題[1],其基本思想是:按照數(shù)據(jù)的相似性和差異性,將數(shù)據(jù)劃分為若干組,同組的數(shù)據(jù)盡量相似,不同組的數(shù)據(jù)盡量相異[2-3]。迄今為止,人們已經(jīng)提出了許多聚類算法,主要有分割法、層次法、密度法、網(wǎng)格法和模型法等[4-6]?;诰W(wǎng)格和密度的聚類算法由于易于增量實(shí)現(xiàn)和高維數(shù)據(jù)挖掘而被廣泛地應(yīng)用于聚類算法中?;诰W(wǎng)格的方法在聚類過程中將網(wǎng)格中的點(diǎn)作為一個(gè)整體處理,而不是考慮單元中的每一個(gè)點(diǎn),基于這一特性,該方法在所有的聚類方法中效率最高。其優(yōu)點(diǎn)是聚類的結(jié)果與輸入數(shù)據(jù)的順序無關(guān),算法的時(shí)間復(fù)雜度是數(shù)據(jù)點(diǎn)個(gè)數(shù)的線性函數(shù),速度快、可擴(kuò)展性好,能識(shí)別不同形狀的聚類。
本文給出一種基于密度和網(wǎng)格的聚類算法,它是一個(gè)基于密度的算法,既保留了基于網(wǎng)格算法運(yùn)行速度快的特點(diǎn),又通過細(xì)化技術(shù)彌補(bǔ)了該類算法精度不好的弱點(diǎn)。
1 算法分析
在基于密度的算法中,一個(gè)聚類就是一個(gè)比周圍區(qū)域有更高數(shù)據(jù)點(diǎn)密度的區(qū)域[7]。為識(shí)別數(shù)據(jù)點(diǎn)的密度,將數(shù)據(jù)空間進(jìn)行劃分并找出每個(gè)單元中數(shù)據(jù)點(diǎn)的數(shù)目。為使計(jì)算點(diǎn)的密度的方法簡單一些,將數(shù)據(jù)空間分割成網(wǎng)格狀,把數(shù)據(jù)空間中的每一維劃分成相同的區(qū)間數(shù),每一個(gè)單元具有相同的“體積”[8-9]。單元中點(diǎn)的密度的計(jì)算可以轉(zhuǎn)換成簡單的點(diǎn)計(jì)數(shù),然后把落到某個(gè)單元中的點(diǎn)的個(gè)數(shù)作為該單元的密度。這時(shí)可以指定一個(gè)閾值r,當(dāng)某單元格中點(diǎn)的個(gè)數(shù)大于該閾值時(shí),就稱該單元格是密集的,聚類也就是所有相鄰近的密集單元格的集合。
掃碼添加小助手
加入工程師交流群
- 基于群組和密度的大規(guī)模軌跡聚類算法 2次下載
- 基于網(wǎng)格多密度聚類的古建筑圖像特征匹配方法 3次下載
- 一種基于自然最近鄰的密度峰值聚類算法 12次下載
- 基于MapReduce和加權(quán)網(wǎng)絡(luò)信息熵的DBWGIE-MR算法 11次下載
- 一種自適應(yīng)的關(guān)聯(lián)融合聚類算法 13次下載
- 一種改進(jìn)的聚類聯(lián)合相似度推薦算法 10次下載
- 可檢測出租車載客的軌跡聚類算法 13次下載
- 如何使用拉普拉斯中心性和密度峰值進(jìn)行無參數(shù)聚類算法的研究 12次下載
- 如何融合密度峰值進(jìn)行高斯混合模型聚類算法概述 2次下載
- 如何使用多維網(wǎng)格空間進(jìn)行改進(jìn)K-means聚類算法資料概述 1次下載
- 聚類算法及聚類融合算法研究 33次下載
- 基于網(wǎng)格的多密度聚類算法
- 基于網(wǎng)格的帶有參考參數(shù)的聚類算法
- 基于模糊聚類思想的網(wǎng)格獨(dú)立任務(wù)調(diào)度算法
- 基于不均勻密度的自動(dòng)聚類算法
- 聚類分析中的機(jī)器學(xué)習(xí)與統(tǒng)計(jì)方法綜述(二) 2.4k次閱讀
- 如何在 Python 中安裝和使用頂級(jí)聚類算法 1.2k次閱讀
- 代碼實(shí)現(xiàn)密度聚類DBSCAN 1.5k次閱讀
- 10種頂流聚類算法Python實(shí)現(xiàn)(附完整代碼) 2.5k次閱讀
- CCM和CRM的圖騰柱PFC哪個(gè)效率更高? 5.5k次閱讀
- 機(jī)器學(xué)習(xí)技術(shù)在圖像處理中的應(yīng)用 3.1k次閱讀
- 10種聚類介紹和Python代碼 7.1k次閱讀
- 基于距離的聚類算法K-means的設(shè)計(jì)實(shí)現(xiàn) 3k次閱讀
- 淺析四類機(jī)器學(xué)習(xí)在自動(dòng)駕駛中的應(yīng)用 6.2k次閱讀
- Python無監(jiān)督學(xué)習(xí)的幾種聚類算法包括K-Means聚類,分層聚類等詳細(xì)概述 3.2w次閱讀
- 機(jī)器學(xué)習(xí)中五種常用的聚類算法 3.9w次閱讀
- 淺談Matlab中的聚類分析 Matlab聚類程序的設(shè)計(jì) 7.7k次閱讀
- 一種基于MapReduce模型的并行化k-medoids聚類算法 6k次閱讀
- 基于密度DBSCAN的聚類算法 2.3w次閱讀
- k means聚類算法實(shí)例 1.6w次閱讀
下載排行
本周
- 1MDD品牌三極管MMBT3906數(shù)據(jù)手冊
- 2.33 MB | 次下載 | 免費(fèi)
- 2MDD品牌三極管S9012數(shù)據(jù)手冊
- 2.62 MB | 次下載 | 免費(fèi)
- 3聯(lián)想flex2-14D/15D說明書
- 4.92 MB | 次下載 | 免費(fèi)
- 4收音環(huán)繞擴(kuò)音機(jī) AVR-1507手冊
- 2.50 MB | 次下載 | 免費(fèi)
- 524Pin Type-C連接器設(shè)計(jì)報(bào)告
- 1.06 MB | 次下載 | 免費(fèi)
- 6新一代網(wǎng)絡(luò)可視化(NPB 2.0)
- 3.40 MB | 次下載 | 免費(fèi)
- 7MS1000TA 超聲波測量模擬前端芯片技術(shù)手冊
- 0.60 MB | 次下載 | 免費(fèi)
- 8MS1022高精度時(shí)間測量(TDC)電路數(shù)據(jù)手冊
- 1.81 MB | 次下載 | 免費(fèi)
本月
- 1愛華AIWA HS-J202維修手冊
- 3.34 MB | 37次下載 | 免費(fèi)
- 2PC5502負(fù)載均流控制電路數(shù)據(jù)手冊
- 1.63 MB | 23次下載 | 免費(fèi)
- 3NB-IoT芯片廠商的資料說明
- 0.31 MB | 22次下載 | 1 積分
- 4H110主板CPU PWM芯片ISL95858HRZ-T核心供電電路圖資料
- 0.63 MB | 6次下載 | 1 積分
- 5UWB653Pro USB口測距通信定位模塊規(guī)格書
- 838.47 KB | 5次下載 | 免費(fèi)
- 6技嘉H110主板IT8628E_BX IO電路圖資料
- 2.61 MB | 4次下載 | 1 積分
- 7蘇泊爾DCL6907(即CHK-S007)單芯片電磁爐原理圖資料
- 0.04 MB | 4次下載 | 1 積分
- 8100W準(zhǔn)諧振反激式恒流電源電路圖資料
- 0.09 MB | 2次下載 | 1 積分
總榜
- 1matlab軟件下載入口
- 未知 | 935137次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計(jì)
- 1.48MB | 420064次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233089次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191439次下載 | 10 積分
- 5十天學(xué)會(huì)AVR單片機(jī)與C語言視頻教程 下載
- 158M | 183353次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81602次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費(fèi)下載
- 0.02 MB | 73822次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65991次下載 | 10 積分
電子發(fā)燒友App





創(chuàng)作
發(fā)文章
發(fā)帖
提問
發(fā)資料
發(fā)視頻
上傳資料賺積分
評(píng)論