不確定數(shù)據(jù)頻繁閉項(xiàng)集挖掘算法
推薦 + 挑錯(cuò) + 收藏(0) + 用戶(hù)評(píng)論(0)
由于不確定數(shù)據(jù)的向下封閉屬性,挖掘全部頻繁項(xiàng)集的方法會(huì)得到一個(gè)指數(shù)級(jí)的結(jié)果。為獲得一個(gè)較小的合適的結(jié)果集,研究了在不確定數(shù)據(jù)上挖掘頻繁閉項(xiàng)集,并提出了一種新的頻繁閉項(xiàng)集挖掘算法-NA-PFCIM。該算法將項(xiàng)集挖掘過(guò)程看作一個(gè)概率分布函數(shù),考慮到基于正態(tài)分布模型的方法提取的頻繁項(xiàng)集精確度較高,而且支持大型數(shù)據(jù)庫(kù),采用了正態(tài)分布模型提取頻繁項(xiàng)集。同時(shí),為了減少搜索空間以及避免冗余計(jì)算,利用基于深度優(yōu)先搜索的策略來(lái)獲得所有的概率頻繁閉項(xiàng)集。該算法還設(shè)計(jì)了兩個(gè)剪枝策略:超集修剪和子集修剪。最后,在常用的數(shù)據(jù)集( T1014DIOOK、Accidents、Mushroom、Chess)上,將提出的NA-PFCIM算法和基于泊松分布的A-PFCIM算法進(jìn)行比較。實(shí)驗(yàn)結(jié)果表明,NA-PFCIM算法能夠減少所要擴(kuò)展的項(xiàng)集,同時(shí)減少項(xiàng)集頻繁概率的計(jì)算,其性能優(yōu)于對(duì)比算法。
?
非常好我支持^.^
(0) 0%
不好我反對(duì)
(0) 0%