基于中心向量的多級分類KNN算法研究
大?。?/span>0.55 MB 人氣: 2017-11-17 需要積分:0
針對KNN算法在中文文本分類時的兩個不足:訓(xùn)練樣本分布不均,分類時計算開銷大的問題,在已有改進算法的基礎(chǔ)上進行了更深入的研究,提出多級分類KNN算法。算法首先引入基于密度的思想對訓(xùn)練樣本進行調(diào)整,通過樣本裁減技術(shù)使樣本分布更趨于理想的均勻狀態(tài),同時計算各類別的類中心向量。在保證類中心向量準確性的前提條件下,使分類階段的復(fù)雜計算提前到分類器的訓(xùn)練過程中。最后一級選用合適的m值(預(yù)選類別個數(shù)),根據(jù)最近鄰思想對待分類文本進行所屬類別判定。實驗結(jié)果表明,該算法在不損失分類精度的情況下,不僅降低了計算復(fù)雜度,而且顯著提高了分類速度。
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%
下載地址
基于中心向量的多級分類KNN算法研究下載
相關(guān)電子資料下載
- 大模型卷價格,向量數(shù)據(jù)庫“卷”什么? 1556
- 開源芯片系列講座第20期:基于RISC-V向量擴展的開源GPGPU軟硬件設(shè)計 140
- 應(yīng)用于MEMS執(zhí)行器的8英寸硅晶圓上的KNN無鉛技術(shù)介紹 345
- 如何利用一些小技巧實現(xiàn)SVM的增量式訓(xùn)練 321
- 深度解析機器學(xué)習(xí)各大模型原理 1144
- 泛林集團宣布推出全球首款面向量產(chǎn)的脈沖激光沉積(PLD)機臺 715
- 搭載英偉達GPU,全球領(lǐng)先的向量數(shù)據(jù)庫公司Zilliz發(fā)布Milvus2.4向量數(shù)據(jù)庫 285
- 飛騰信息技術(shù)有限公司:復(fù)數(shù)向量卷積處理技術(shù)及設(shè)備 183
- Zilliz攜手大模型生態(tài)企業(yè)玩轉(zhuǎn)GDC 2024,向量數(shù)據(jù)庫和RAG成行業(yè)焦點 214
- 與NVIDIA深度參與GTC,向量數(shù)據(jù)庫大廠Zilliz與全球頂尖開發(fā)者共迎AI變革時刻 215