基于密度的分布式聚類方法
大?。?/span>2.17 MB 人氣: 2017-12-25 需要積分:1
聚類是數(shù)據(jù)挖掘領域中的一種重要的數(shù)據(jù)分析方法.它根據(jù)數(shù)據(jù)間的相似度,將無標注數(shù)據(jù)劃分為若干聚簇.CSDP是一種基于密度的聚類算法,當數(shù)據(jù)量較大或數(shù)據(jù)維數(shù)較高時,聚類的效率相對較低.為了提高聚類算法的效率,提出了一種基于密度的分布式聚類方法MRCSDP,利用MapReduce框架對實驗數(shù)據(jù)進行聚類.該方法定義了獨立計算單元和獨立計算塊的概念,首先,將數(shù)據(jù)拆分為若干數(shù)據(jù)塊,構建獨立計算單元和獨立計算塊,在集群中分配獨立計算塊的任務:然后進行分布式計算,得到數(shù)據(jù)塊的局部密度,將局部密度合并得到全局密度,根據(jù)全局密度計算中心值,由全局密度和中心值得到每個數(shù)據(jù)塊中候選聚簇中心:最后,從候選聚簇中心選舉出最終的聚簇中心.MRCSDP在充分降低時間復雜度的基礎上得到較好的聚類效果.實驗結果表明,分布式環(huán)境下的聚類方法MRCSDP相對于CSDP更能快速、有效地處理大規(guī)模數(shù)據(jù)。并使各節(jié)點負載均衡.
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%
下載地址
基于密度的分布式聚類方法下載
相關電子資料下載
- 隆基全球分布式研發(fā)中心揭牌 265
- 故障排查小能手:輸電線路分布式故障定位裝置大解析 63
- 安富利推出6.6KW高功率密度雙向DC-DC解決方案 111
- 浪潮信息推出基于新一代分布式存儲平臺AS13000G7的AIGC存儲解決方案 816
- 黑龍江電力高性能WDS分布式存儲系統(tǒng)解決方案 62
- 雷拓科技云廣播助力江西省蘆溪縣新圖書館打造沉浸式觀展體驗! 97
- 高精度與高功率密度齊頭并進,解鎖數(shù)據(jù)中心測試的未來藍圖 833
- 分布式光纖測溫系統(tǒng)DTS 143
- 天合光能致力于加強全球綠色轉型協(xié)作 239
- 安科瑞防孤島保護裝置AM5SE-IS 在布式光伏監(jiān)控系統(tǒng)中的應用 93