曰本美女∴一区二区特级A级黄色大片, 国产亚洲精品美女久久久久久2025, 页岩实心砖-高密市宏伟建材有限公司, 午夜小视频在线观看欧美日韩手机在线,国产人妻奶水一区二区,国产玉足,妺妺窝人体色WWW网站孕妇,色综合天天综合网中文伊,成人在线麻豆网观看

您好,歡迎來電子發(fā)燒友網(wǎng)! ,新用戶?[免費注冊]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

基于Spark的BIRCH算法并行化的設(shè)計與實現(xiàn)

大小:1.03 MB 人氣: 2017-11-23 需要積分:1

  在分布式計算和內(nèi)存為王的時代,Spark作為基于內(nèi)存計算的分布式框架技術(shù)得到了前所未有的關(guān)注與應(yīng)用。著重研究BIRCH算法在Spark上并行化的設(shè)計和實現(xiàn),經(jīng)過理論性能分析得到并行化過程中時間消耗較多的Spark轉(zhuǎn)化操作,同時根據(jù)并行化BIRCH算法的有向無環(huán)圖DAG,減少shuf_fle和磁盤讀寫頻率,以期達(dá)到性能優(yōu)化。最后,將并行化后的BIRCH算法分別與單機(jī)的BIRCH算法和MLlib中的KMeans聚類算法做了性能對比實驗。實驗結(jié)果表明,通過Spark對BIRCH算法并行化,其聚類質(zhì)量沒有明顯的損失,并且獲得了比較理想的運行時間和加速比。

基于Spark的BIRCH算法并行化的設(shè)計與實現(xiàn)

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

      發(fā)表評論

      用戶評論
      評價:好評中評差評

      發(fā)表評論,獲取積分! 請遵守相關(guān)規(guī)定!

      ?