曰本美女∴一区二区特级A级黄色大片, 国产亚洲精品美女久久久久久2025, 页岩实心砖-高密市宏伟建材有限公司, 午夜小视频在线观看欧美日韩手机在线,国产人妻奶水一区二区,国产玉足,妺妺窝人体色WWW网站孕妇,色综合天天综合网中文伊,成人在线麻豆网观看

您好,歡迎來電子發(fā)燒友網(wǎng)! ,新用戶?[免費(fèi)注冊(cè)]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

基于R-Grams文本相似度計(jì)算方法的文本聚類方法

大?。?/span>0.76 MB 人氣: 2017-12-29 需要積分:1

  針對(duì)傳統(tǒng)文本聚類中存在著聚類準(zhǔn)確率和召回率難以平衡等問題,提出了一種基于R-Grams文本相似度計(jì)算方法的文本聚類方法。該方法首先通過將待聚類文檔降序排列,其次采用R-C rams文本相似度算法計(jì)算文本之間的相似度并根據(jù)相似度實(shí)現(xiàn)各聚類標(biāo)志文檔的確定并完成初始聚類,最后通過對(duì)初始聚類結(jié)果進(jìn)行聚類合并完成最終聚類。實(shí)驗(yàn)結(jié)果表明:聚類結(jié)果可以通過聚類閾值靈活調(diào)整以適應(yīng)不同的需求,最佳聚類閾值為15左右。隨著聚類閾值的增大,各聚類準(zhǔn)確率增大,召回率呈現(xiàn)先增后降的趨勢(shì)。此外,該聚類方法避免了大量的分詞、特征提取等繁瑣處理,實(shí)現(xiàn)簡(jiǎn)單。
?

非常好我支持^.^

(0) 0%

不好我反對(duì)

(0) 0%

      發(fā)表評(píng)論

      用戶評(píng)論
      評(píng)價(jià):好評(píng)中評(píng)差評(píng)

      發(fā)表評(píng)論,獲取積分! 請(qǐng)遵守相關(guān)規(guī)定!

      ?