一種自動(dòng)三支決策聚類算法
推薦 + 挑錯(cuò) + 收藏(0) + 用戶評(píng)論(0)
k-means算法自提出50多年來(lái),在聚類分析中得到了廣泛應(yīng)用,但是,k-means算法存在一個(gè)突出的問(wèn)題,即需要預(yù)先設(shè)定聚類數(shù)目。所以,本文針對(duì)如何自動(dòng)獲取k-means的聚類數(shù)目進(jìn)行了研究。為了確定聚類數(shù)目,許多學(xué)者從聚類有效性指數(shù)方面進(jìn)行了研究,該類成果大多數(shù)都結(jié)合了類內(nèi)緊湊性和類間分離性這兩個(gè)因素。一般說(shuō)來(lái),這些方法用類中對(duì)象和類中心距離的平均值及其變形來(lái)衡量類內(nèi)緊湊性,用類中心之間的距離來(lái)衡量類間分離性。它們較少考慮類中對(duì)象數(shù)目的多少以及對(duì)象的分布情況,因此在某些情況下不能很好地度量類間的分離情況。本文從類內(nèi)緊湊性和考慮近鄰的類間分離性出發(fā),定義新的分離性指數(shù),并設(shè)計(jì)了新的有效性指數(shù)。
另一方面,k-means算法得到的結(jié)果實(shí)際上是一種二支決策結(jié)果,只考慮了對(duì)象與類的兩種關(guān)系,即:對(duì)象要么屬于一個(gè)類要么不屬于一個(gè)類。這種聚類結(jié)果沒(méi)有反映某些應(yīng)用背景下的對(duì)象與類的不確定性關(guān)系,即對(duì)象可能屬于某個(gè)類。因此,本文提出了三支決策聚類,來(lái)進(jìn)一步表示對(duì)象與類的不確定性關(guān)系?;谌Q策聚類的思想,筆者相繼在基于密度的重疊聚類、不完備數(shù)據(jù)秉類、重疊區(qū)域細(xì)分、增量重疊聚類等方面進(jìn)行了一些研究工作。
因此,本文引入三支決策思想,提出一種基于k-means算法框架的自動(dòng)三支決策聚類方法,該方法擴(kuò)展了k-means算法使之適用于不確定性聚類,并能夠自動(dòng)地得到聚類數(shù)目。
?
非常好我支持^.^
(0) 0%
不好我反對(duì)
(0) 0%