基于分布特征遷移加權(quán)算法
推薦 + 挑錯(cuò) + 收藏(0) + 用戶評(píng)論(0)
傳統(tǒng)機(jī)器學(xué)習(xí)面臨一個(gè)難題,即當(dāng)訓(xùn)練數(shù)據(jù)與測(cè)試數(shù)據(jù)不再服從相同分布時(shí),由訓(xùn)練集得到的分類器無(wú)法對(duì)測(cè)試集文本準(zhǔn)確分類。針對(duì)該問(wèn)題,根據(jù)遷移學(xué)習(xí)原理,在源領(lǐng)域和目標(biāo)領(lǐng)域的交集特征中,依據(jù)改進(jìn)的特征分布相似度進(jìn)行特征加權(quán);在非交集特征中,引入語(yǔ)義近似度和新提出的逆文本類別指數(shù)( TF-ICF),對(duì)特征在源領(lǐng)域內(nèi)進(jìn)行加權(quán)計(jì)算,充分利用大量已標(biāo)記的源領(lǐng)域數(shù)據(jù)和少量已標(biāo)記的目標(biāo)領(lǐng)域數(shù)據(jù)獲得所需特征,以便快速構(gòu)建分類器。在文本數(shù)據(jù)集20 Newsgroups和非文本數(shù)據(jù)集UCI中的實(shí)驗(yàn)結(jié)果表明,基于分布和逆文本類別指數(shù)的特征遷移加權(quán)算法能夠在保證精度的前提下對(duì)特征快速遷移并加權(quán)。
非常好我支持^.^
(0) 0%
不好我反對(duì)
(0) 0%