如何使用詞向量和卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行垃圾短信識(shí)別的方法介紹
資料介紹
對(duì)垃圾短信進(jìn)行過濾識(shí)別研究具有重要的社會(huì)價(jià)值和時(shí)代背景意義。針對(duì)傳統(tǒng)的人工設(shè)計(jì)短信特征選擇方法中存在數(shù)據(jù)稀疏、特征信息共現(xiàn)不足和特征提取困難的問題,提出一種基于詞向量和卷積神經(jīng)網(wǎng)絡(luò)( CNN)的垃圾短信識(shí)別方法。首先,使用word2vec的skip-gram模型根據(jù)維基中文語料庫訓(xùn)練出短信數(shù)據(jù)集中每個(gè)詞的詞向量,并將每條短信中各個(gè)詞組所對(duì)應(yīng)的詞向量組成表示短信的二維特征矩陣;然后,把特征矩陣作為卷積神經(jīng)網(wǎng)絡(luò)的輸入,通過卷積層的不同尺度卷積核提取多尺度短信特征,以及利用l-max pooling池化策略得到局部最優(yōu)特征;最后,將局部最優(yōu)特征組成融合特征向量放入softmax分類器中得出分類結(jié)果。在10萬條短信數(shù)據(jù)上進(jìn)行的實(shí)驗(yàn)結(jié)果表明,在特征提取方式相同的情況下,基于卷積神經(jīng)網(wǎng)絡(luò)模型的識(shí)別準(zhǔn)確率能夠達(dá)到99.5%,比傳統(tǒng)的機(jī)器學(xué)習(xí)模型提高了2. 4%~5.1%,且各模型的識(shí)別準(zhǔn)確率均保持在94%以上。
近年來,隨著通信技術(shù)的不斷進(jìn)步,我國使用手機(jī)的用戶數(shù)量日益增多,短信成為一種方便的信息傳遞渠道。然而,短信在使人們的日常生活變得更加方便的同時(shí),垃圾短信的泛濫也越來越嚴(yán)重,嚴(yán)重干擾了人們的生活,成為了危害社會(huì)公共安全的一大公害。360互聯(lián)網(wǎng)安全中心于2017年2月發(fā)布的《2016年中國互聯(lián)網(wǎng)安全報(bào)告》顯示,360手機(jī)衛(wèi)士在2016年內(nèi)為全國手機(jī)用戶共攔截約173.5億條垃圾短信。絕大多數(shù)垃圾短信的內(nèi)容都是廣告推銷或者影響社會(huì)穩(wěn)定團(tuán)結(jié)的謠言、詐騙等。工業(yè)和信息化部于2015年6月頒布施行的《通信短信息服務(wù)管理規(guī)定》,其中規(guī)定任何短信服務(wù)提供商和短信內(nèi)容發(fā)送者在未經(jīng)用戶同意的情況下,都不得向用戶發(fā)送商業(yè)性的信息。因此垃圾短信成為當(dāng)前一個(gè)重要的社會(huì)問題,有效識(shí)別垃圾短信對(duì)維護(hù)國家安全、社會(huì)穩(wěn)定和人們正常生活具有重要的時(shí)代背景意義。
- 基于卷積神經(jīng)網(wǎng)絡(luò)的雷達(dá)目標(biāo)檢測(cè)方法綜述 62次下載
- 基于域適應(yīng)的卷積神經(jīng)網(wǎng)絡(luò)人臉識(shí)別結(jié)構(gòu) 7次下載
- 基于剪枝與量化的卷積神經(jīng)網(wǎng)絡(luò)壓縮算法 6次下載
- 用于微表情識(shí)別的三維卷積神經(jīng)網(wǎng)絡(luò)進(jìn)化方法 10次下載
- 緊湊的卷積神經(jīng)網(wǎng)絡(luò)模型研究綜述 9次下載
- 神經(jīng)網(wǎng)絡(luò)到卷積神經(jīng)網(wǎng)絡(luò)的原理 7次下載
- 基于迭代膨脹卷積神經(jīng)網(wǎng)絡(luò)與ATT的實(shí)體名識(shí)別方法 6次下載
- 如何使用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行人臉圖像質(zhì)量評(píng)價(jià)的資料說明 6次下載
- 面向“邊緣”應(yīng)用的卷積神經(jīng)網(wǎng)絡(luò)如何進(jìn)行量化與壓縮詳細(xì)方法 4次下載
- 如何使用基于卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行草地植物識(shí)別的詳細(xì)方法概述 12次下載
- 如何使用混合卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行入侵檢測(cè)模型的設(shè)計(jì) 19次下載
- 卷積神經(jīng)網(wǎng)絡(luò)的權(quán)值反向傳播機(jī)制和MATLAB的實(shí)現(xiàn)方法 14次下載
- 基于聯(lián)合層特征的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行車標(biāo)識(shí)別 0次下載
- 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像標(biāo)注模型 4次下載
- 卷積神經(jīng)網(wǎng)絡(luò)的振動(dòng)信號(hào)模態(tài)參數(shù)識(shí)別 5次下載
- 卷積神經(jīng)網(wǎng)絡(luò)共包括哪些層級(jí) 1454次閱讀
- 全卷積神經(jīng)網(wǎng)絡(luò)的工作原理和應(yīng)用 1234次閱讀
- 卷積神經(jīng)網(wǎng)絡(luò)的壓縮方法 399次閱讀
- BP神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)的關(guān)系 1676次閱讀
- 卷積神經(jīng)網(wǎng)絡(luò)在人臉識(shí)別中的應(yīng)用 820次閱讀
- 卷積神經(jīng)網(wǎng)絡(luò)的卷積操作 1557次閱讀
- 卷積神經(jīng)網(wǎng)絡(luò)與循環(huán)神經(jīng)網(wǎng)絡(luò)的區(qū)別 3579次閱讀
- 卷積神經(jīng)網(wǎng)絡(luò)的基本概念和工作原理 3957次閱讀
- 卷積神經(jīng)網(wǎng)絡(luò)在語音識(shí)別中的應(yīng)用 945次閱讀
- 卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu) 515次閱讀
- 神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別中的應(yīng)用 741次閱讀
- 基于卷積神經(jīng)網(wǎng)絡(luò)的垃圾圖像分類算法 1128次閱讀
- 詳解卷積神經(jīng)網(wǎng)絡(luò)卷積過程 1.8w次閱讀
- 卷積神經(jīng)網(wǎng)絡(luò)CNN架構(gòu)分析-LeNet 2769次閱讀
- 【科普】卷積神經(jīng)網(wǎng)絡(luò)(CNN)基礎(chǔ)介紹 1.1w次閱讀
下載排行
本周
- 1貼片三極管上的印字與真實(shí)名稱的對(duì)照表詳細(xì)說明
- 0.50 MB | 87次下載 | 1 積分
- 2802.11_Wireless_Networks
- 4.17 MB | 12次下載 | 免費(fèi)
- 33D AD庫文件
- 16.96 MB | 2次下載 | 免費(fèi)
- 4BDR6121G直流電機(jī)驅(qū)動(dòng)芯片中文手冊(cè)
- 0.54 MB | 1次下載 | 免費(fèi)
- 5ANT8817 1%3.5W/3.7V,同步自適應(yīng)升壓,超長續(xù)航,H類防破音單聲道音頻功放中文手冊(cè)
- 1.11 MB | 1次下載 | 免費(fèi)
- 610K-100K B3950-B3435NTC熱敏電阻快速查詢對(duì)照表
- 0.10 MB | 1次下載 | 1 積分
- 7ANT8825S內(nèi)置同步升壓,防破音,AB/D類雙模立體聲音頻功放中文手冊(cè)
- 1.29 MB | 次下載 | 免費(fèi)
- 8ANT3270 2×75W/2×38W+75W,免電感,低EMI,D類音頻功率放大器中文手冊(cè)
- 1.33 MB | 次下載 | 免費(fèi)
本月
- 1AI智能眼鏡產(chǎn)業(yè)鏈分析
- 4.43 MB | 311次下載 | 免費(fèi)
- 2蘇泊爾電磁爐線路的電路原理圖資料合集
- 2.02 MB | 286次下載 | 5 積分
- 3長虹液晶電視R-HS310B-5HF01的電源板電路原理圖
- 0.46 MB | 87次下載 | 5 積分
- 4貼片三極管上的印字與真實(shí)名稱的對(duì)照表詳細(xì)說明
- 0.50 MB | 87次下載 | 1 積分
- 5U盤一鍵制作
- 23.84 MB | 41次下載 | 免費(fèi)
- 6AO4803A雙P通道增強(qiáng)型場效應(yīng)晶體管的數(shù)據(jù)手冊(cè)
- 0.11 MB | 28次下載 | 2 積分
- 7長虹液晶彩電LS29機(jī)芯的技術(shù)資料說明
- 3.42 MB | 16次下載 | 2 積分
- 8802.11_Wireless_Networks
- 4.17 MB | 12次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935127次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計(jì)
- 1.48MB | 420064次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233089次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191387次下載 | 10 積分
- 5十天學(xué)會(huì)AVR單片機(jī)與C語言視頻教程 下載
- 158M | 183342次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81586次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費(fèi)下載
- 0.02 MB | 73815次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65988次下載 | 10 積分
評(píng)論