基于Hash改進(jìn)的k-means算法并行化設(shè)計
大?。?/span>0.51 MB 人氣: 2017-11-24 需要積分:0
標(biāo)簽:Hash(13143)K-means(11240)
為了解決kmeans算法在Hadoop平臺下處理海量高維數(shù)據(jù)時聚類效果差,以及已有的改進(jìn)算法不利于并行化等問題,提出了一種基于Hash改進(jìn)的并行化方案。將海量高維的數(shù)據(jù)映射到一個壓縮的標(biāo)識空間,進(jìn)而挖掘其聚類關(guān)系,選取初始聚類中心,避免了傳統(tǒng)k-means算法對隨機選取初始聚類中心的敏感性,減少了k-means算法的迭代次數(shù)。又結(jié)合MapReduce框架將算法整體并行化,并通過Partition、Combine等機制加強了并行化程度和執(zhí)行效率。實驗表明,該算法不僅提高了聚類的準(zhǔn)確率和穩(wěn)定性,同時具有良好的處理速度。
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%
下載地址
基于Hash改進(jìn)的k-means算法并行化設(shè)計下載
相關(guān)電子資料下載
- IBM將收購軟件公司HashiCorp 249
- OpenHarmony語言基礎(chǔ)類庫【@ohos.util.HashSet (非線性容器HashSet)】 182
- OpenHarmony語言基礎(chǔ)類庫【@ohos.util.HashMap (非線性容器HashMap)】 666
- IBM收購HashiCorp拓展AI驅(qū)動云軟件產(chǎn)品 438
- IBM已同意收購HashiCorp 估值64億美元 344
- GeminiDB 新特性:讓 Redis 廣告頻控愛不釋手的 exHASH 914
- Redis官方搜索引擎來了,性能炸裂! 1149
- HarmonyOS 非線性容器特性及使用場景 251
- 如何使用Python PySNMP模塊獲取設(shè)備指標(biāo)呢? 1103
- Mysql索引是什么東西?索引有哪些特性?索引是如何工作的? 593