chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

基于機器學習方法的網(wǎng)絡流量解析

電子設計 ? 來源: 信息安全與通信保密雜志 ? 作者:Cismag ? 2021-01-16 10:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著大眾網(wǎng)絡安全意識的穩(wěn)步提升,對于數(shù)據(jù)保護的意識也愈加強烈。根據(jù)Google的報告,2019年10月,Chrome加載網(wǎng)頁中啟用加密的比例已經(jīng)達到了95%。對于特定類型的流量,加密甚至已成為法律的強制性要求,加密在保護隱私的同時也給網(wǎng)絡安全帶來了新的隱患。攻擊者將加密作為隱藏活動的工具,加密流量給攻擊者隱藏其命令與控制活動提供了可乘之機。在面臨日益嚴重的網(wǎng)絡安全威脅和攻擊時,需要提出有效的識別方法。實現(xiàn)加密流量精細化管理,保障計算機和終端設備安全運行,維護健康綠色的網(wǎng)絡環(huán)境。

01、相關(guān)研究

當前對于加密網(wǎng)絡流識別的研究主要集中在機器學習相關(guān)的方法上。使用機器學習方法對網(wǎng)絡流量進行解析時,按使用的機器學習算法不同可以分為傳統(tǒng)機器學習算法(淺層學習)和深度學習。傳統(tǒng)機器學習算法對加密網(wǎng)絡流量解析主要存在兩個問題:一個是需要對待分類的報文人工設計一個可以普遍反映流量特征的特征集;另一個就是傳統(tǒng)機器學習方法有很大的局限性,例如對復雜函數(shù)難以表示、容易陷入局部最優(yōu)解等。

由于以上兩個原因,導致傳統(tǒng)機器學習方法對加密網(wǎng)絡流量解析的準確率不是很高。隨著計算方法的發(fā)展和計算能力的提高,深度學習的引入可以有效解決機器學習設計特征的問題。深度學習通過特征學習和分層特征提取的方法來替代手工獲取特征。深度神經(jīng)網(wǎng)絡擁有很高的擬合能力,可以逼近許多復雜的函數(shù),不易陷入局部最優(yōu)解。解決了傳統(tǒng)機器學習在加密網(wǎng)絡流量解析時存在的兩個關(guān)鍵問題。

深度學習是基于表示學習的眾多機器學習算法中的一員。目前使用最多的深度學習方法包括DBN(Deep Belief Nets)、CNN(Convolutional Neural Networks)、深度自編碼器(AutoEncoder,AE)和循環(huán)神經(jīng)網(wǎng)絡(Recurrent Neural Network,RNN)以及基于RNN的長短期記憶網(wǎng)絡(Long Short-Term Memory,LSTM),近年來這些方法被廣泛地應用在加密流量解析中,并取得了不錯的成果。王偉等人提出一種基于CNN的異常流量檢測方法,該方法利用CNN特征學習能力,準確地對流量的特征進行提取,將提取到的特征用于流量分類并取得了良好的結(jié)果,最終將該模型用于異常流量檢測。

J.Ran等人提出了一種將三維卷積神經(jīng)網(wǎng)絡應用于無線網(wǎng)絡流量分類的方法,實驗結(jié)果表明該方法優(yōu)于一維和二維卷積神經(jīng)網(wǎng)絡。Jain研究了由不同優(yōu)化器訓練的卷積神經(jīng)網(wǎng)絡對協(xié)議識別的影響,實驗結(jié)果表明,隨機梯度下降(Stochastic Gradient Descent,SGD)優(yōu)化器產(chǎn)生的識別效果最好。陳雪嬌等利用卷積神經(jīng)網(wǎng)絡的識別準確率高和自主進行特征選擇的優(yōu)勢,將其應用于加密流量的識別,測試結(jié)果表明該方法優(yōu)于DPI方法。

王勇等設計了基于LeNet-5深度卷積神經(jīng)網(wǎng)絡的分類方法,通過不斷調(diào)整參數(shù)產(chǎn)生最優(yōu)分類模型,測試結(jié)果表明該方法優(yōu)于主成分分析、稀疏隨機映射等方法。Wu,Kehe等人將網(wǎng)絡流量數(shù)據(jù)的121個流統(tǒng)計特征作為數(shù)據(jù)集,并對比了一維和二維CNN網(wǎng)絡、CNN網(wǎng)絡與傳統(tǒng)機器學習算法、CNN網(wǎng)絡與RNN網(wǎng)絡的分類準確性與計算量。

J.Ren等提出了一種針對無線通信網(wǎng)絡的協(xié)議識別方法,首先利用一維卷積神經(jīng)網(wǎng)絡進行自動化的特征提取,然后基于SVM對應用層協(xié)議進行分類。H.Lim等提出了使用深度學習的基于數(shù)據(jù)包的網(wǎng)絡流量分類,該方法提取網(wǎng)絡會話中的前幾個數(shù)據(jù)包處理成等長的向量,然后利用CNN和ResNet進行訓練,進行流量分類。

在以往的基于深度學習的加密網(wǎng)絡流量解析研究中,數(shù)據(jù)預處理都是只針對原始的網(wǎng)絡流量數(shù)據(jù)進行變換處理,而忽略了數(shù)據(jù)包在傳輸過程中的時間特征。因此,在本研究中,將對加密網(wǎng)絡流量中的原始報文數(shù)據(jù)及數(shù)據(jù)包傳輸時間間隔進行綜合預處理,并采用CNN網(wǎng)絡模型進行實驗驗證。

02、基于CNN的加密網(wǎng)絡流量識別方法

本節(jié)將從流量采集、數(shù)據(jù)預處理、加密網(wǎng)絡流量識別模型等環(huán)節(jié)詳細介紹本文提出的基于深度學習的加密網(wǎng)絡流量解析方法。

2.1流量采集

為了獲得更加接近實際使用場景下的網(wǎng)絡流量,我們在手機終端安裝了代理軟件,采集日常真實使用環(huán)境下的應用網(wǎng)絡流量,并按照應用名稱分別保存為不同的文件,共計14類,16.81GB。

2.2數(shù)據(jù)預處理

采集的網(wǎng)絡流量存儲為Pcap格式的文件,該格式的文件除了流量數(shù)據(jù)外,還有該文件協(xié)議額外添加的其他信息,而這些信息有可能干擾分類結(jié)果。因此需要對該文件的格式進行解析,提取出有用的數(shù)據(jù)部分。

2.2.1 Pcap格式介紹

Pcap文件格式如圖1所示,最開始的24個字節(jié)為文件頭(Global Header),后面是抓取的包頭(Packet Header)和包數(shù)據(jù)(Packet Data)。此處的包頭為Pcap文件格式的固定部分,描述了后面緊跟著的包數(shù)據(jù)的捕獲時間、捕獲長度等信息,原始網(wǎng)絡數(shù)據(jù)流量中不包含此部分信息。包數(shù)據(jù)為數(shù)據(jù)鏈路層到應用層的所有數(shù)據(jù),包括每一層的包頭。

pIYBAGACTh6Aei2rAADBvd9MFp8545.png

圖1 Pcap文件格式

圖2描述了Global Header的具體內(nèi)容以及每部分的長度。

pIYBAGACTiqAXDYuAACqwph4_3g468.png

圖2 Global Header格式

每個字段的含義如下:

(1)Magic:4Byte,標記文件開始,并用來識別文件自己和字節(jié)順序。0xa1b2c3d4用來表示按照原來的順序讀取,0xd4c3b2a1表示下面的字節(jié)都要交換順序讀取??紤]到計算機內(nèi)存的存儲結(jié)構(gòu),一般會采用0xd4c3b2a1,即所有字節(jié)都需要交換順序讀取。

(2)Major:2Byte,當前文件主要的版本號。

(3)Minor:2Byte,當前文件次要的版本號。

(4)ThisZone:4Byte,當?shù)氐臉藴蕰r間。

(5)SigFigs:4Byte,時間戳的精度。

(6)SnapLen:4Byte,最大的存儲長度。

(7)LinkType:4Byte,數(shù)據(jù)鏈路類型。

圖3描述了Packet Header的具體內(nèi)容以及每部分的長度。

o4YBAGACTjSAXvB5AABJcOYl-qY574.png

圖3 Packet Header格式

每個字段的含義如下:

(1)Timestamp:捕獲時間的高位,單位為秒。

(2)Timestamp:捕獲時間的低位,單位為微秒。

(3)Caplen:當前數(shù)據(jù)區(qū)的長度,單位為字節(jié)。

(4)Len:離線數(shù)據(jù)長度,網(wǎng)絡中實際數(shù)據(jù)幀的長度。

2.2.2預處理方法

通過圖3對Pcap文件格式的介紹,我們發(fā)現(xiàn),Pcap文件中除了原始流量數(shù)據(jù)之外還有Global Header和Packet Header這兩部分原始數(shù)據(jù)流量中不存在的部分。因此,在接下來的數(shù)據(jù)處理環(huán)節(jié)中,我們將剔除這部分數(shù)據(jù)或者對這部分數(shù)據(jù)進行轉(zhuǎn)換。預處理流程如下:

首先對采集到的Pcap文件按協(xié)議進行過濾,提取出經(jīng)過加密的網(wǎng)絡流量,然后對提取出的流量按五元組進行劃分。劃分出來的每一個文件將在后續(xù)流程中轉(zhuǎn)化為一張圖片。對劃分出來的每一個Pcap文件做如下處理。

pIYBAGACTkCAAe1GAAAkw772-IM540.png

圖4每種應用的對應的圖片數(shù)量

設最后返回的字節(jié)數(shù)組為A,需要的長度為LEN。

(1)首先忽略前24個字節(jié)。

(2)然后讀取16個字節(jié)的Packet Header,將其中的時間轉(zhuǎn)換為整數(shù),利用其中的捕獲長度讀取Packet data,忽略掉數(shù)據(jù)鏈路層和網(wǎng)絡層的包頭,將傳輸層的包頭和payload加入字節(jié)數(shù)組A。

(3)如果不是第一個數(shù)據(jù)包,則利用本數(shù)據(jù)包的捕獲時間減去上一個數(shù)據(jù)包的捕獲時間,得到時間差Δt,利用本數(shù)據(jù)包的捕獲長度L除以Δt,向上取整得到N,向字節(jié)數(shù)組A中加入N個0xFF字節(jié)。

(4)重復(2)(3)直到文件尾,或者A的長度大于等于LEN。

(5)若讀取到文件尾之前,A的長度大于等于LEN,則截斷到LEN返回;若讀到文件尾,A的長度仍小于LEN,則在末尾填充0x00直到長度為LEN。

(6)將A數(shù)組轉(zhuǎn)化為長、寬相同的單通道灰度圖片。

最終將生成好的圖片存儲為TFRecoder格式,以便于后面的實驗驗證。預處理后每種應用得到的圖片數(shù)目如圖4所示。

2.3加密網(wǎng)絡流量識別模型

本文采用了二維CNN模型進行流量分類,為了對比不同輸入對實驗結(jié)果的影響,分別嘗試了圖片長寬為32、40、48、56、64,其中當長寬為32時效果最佳。下面介紹本文最終采用的CNN模型。

在卷積神經(jīng)網(wǎng)絡中,大尺寸的卷積核可以帶來更大的感受視野,獲取更多的信息,但也會產(chǎn)生更多的參數(shù),從而增加網(wǎng)絡的復雜度。為了減少模型的參數(shù),本文采用兩個連續(xù)的3*3卷積層來代替單個的5*5卷積層,可以在保持感受視野范圍的同時減少參數(shù)量。卷積層的Padding方式使用SAME方式,激活函數(shù)使用RELU,每一層的參數(shù)如表1所示。

表1網(wǎng)絡模型參數(shù)

pIYBAGACTkyAKlSiAALRpyBusf0091.png

03、實驗與結(jié)果分析

為了對上述加密網(wǎng)絡流量識別模型進行驗證,采用TensorFlow深度學習框架,在NVIDIA TESLA K80上進行了實驗驗證。

3.1評價指標

本文采用準確率(accuracy)、精準率(precision)、召回率(recall)和F1-Measure值(以下簡稱F1值)四個評價指標來對實驗結(jié)果進行評估,其中準確率是對整體的評價指標,精準率和召回率是用來對某種類別流量識別的評價指標,而F1值是對于精準率和召回率兩個指標的綜合評估。為了計算這四個指標,需要引入TP、FP、FN、TN四個參數(shù),每個參數(shù)的意義如表2混淆矩陣所示。

表2混淆矩陣

pIYBAGACTlWANVwoAAC2XWcxB9Q388.png

每個指標的計算方法如公式(1)~(4)所示。

o4YBAGACTl6AKbd_AADBQiz5XkI683.png

3.2實驗結(jié)果

將處理好的數(shù)據(jù)按4:1的比例分為訓練集和測試集,由于采集的數(shù)據(jù)不均衡,因此在訓練時對訓練數(shù)據(jù)采用過采樣的方法來縮小數(shù)據(jù)量之間的差異。采用了Adam優(yōu)化器和動態(tài)學習率來提高模型的訓練速度。最終訓練好的模型在測試集上的結(jié)果如表3所示。

表3測試集結(jié)果

pIYBAGACTnGAPV6GAALeNuKgDtk627.png

為了驗證在預處理階段引入時間間隔對模型準確率的影響,還做了一組對比實驗。對比實驗在預處理階段不對時間間隔做特殊處理,直接舍棄該字段,最終結(jié)果如表4所示??梢钥闯觯脮r間間隔可以有效提高分類結(jié)果的準確率。

表4不同預處理方式對應的實驗結(jié)果

o4YBAGACTn2AS6FXAADGq1L_1jU277.png

04、結(jié)語

本文提出了一種基于深度學習的加密網(wǎng)絡流量識別方法,該方法對采集到的流量進行預處理,利用傳輸層數(shù)據(jù)及數(shù)據(jù)包之間的時間間隔,將時間間隔轉(zhuǎn)換為二進制數(shù)據(jù)中的特殊值,然后將解析后的數(shù)據(jù)轉(zhuǎn)換為灰度圖片,采用卷積神經(jīng)網(wǎng)絡對采集到的14類應用的加密流量進行分類,最終識別準確率為96.22%,可以滿足實際應用。后續(xù)研究將關(guān)注流量類型的甄別,即對每種應用流量中不同類型的流量進行識別,如視頻流量、文本流量、圖片流量等,進一步挖掘用戶行為。
編輯:hfy

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡

    關(guān)注

    42

    文章

    4831

    瀏覽量

    107259
  • 網(wǎng)絡安全
    +關(guān)注

    關(guān)注

    11

    文章

    3478

    瀏覽量

    63221
  • 機器學習
    +關(guān)注

    關(guān)注

    66

    文章

    8546

    瀏覽量

    136534
  • 深度學習
    +關(guān)注

    關(guān)注

    73

    文章

    5594

    瀏覽量

    124153
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    如何在機器視覺中部署深度學習神經(jīng)網(wǎng)絡

    圖 1:基于深度學習的目標檢測可定位已訓練的目標類別,并通過矩形框(邊界框)對其進行標識。 在討論人工智能(AI)或深度學習時,經(jīng)常會出現(xiàn)“神經(jīng)網(wǎng)絡”、“黑箱”、“標注”等術(shù)語。這些概念對非專業(yè)
    的頭像 發(fā)表于 09-10 17:38 ?812次閱讀
    如何在<b class='flag-5'>機器</b>視覺中部署深度<b class='flag-5'>學習</b>神經(jīng)<b class='flag-5'>網(wǎng)絡</b>

    OT網(wǎng)絡流量分析的突破口:IOTA助力安全與效率雙提升

    重點速覽面對復雜的OT網(wǎng)絡環(huán)境,傳統(tǒng)的數(shù)據(jù)采集與分析工具往往難以滿足高效性和精準性的需求。ProfitapIOTA提供了一種智能化的解決方案,使企業(yè)能夠更快速、更準確地進行流量分析與故障診斷。本文
    的頭像 發(fā)表于 08-08 18:12 ?845次閱讀
    OT<b class='flag-5'>網(wǎng)絡流量</b>分析的突破口:IOTA助力安全與效率雙提升

    渦街流量計RS485轉(zhuǎn)PROFINET網(wǎng)關(guān)參數(shù)配置全解析

    在工業(yè)自動化領域,渦街流量計因其高精度和穩(wěn)定性成為液體流量測量的重要工具。然而,如何將其采集的數(shù)據(jù)無縫集成到以PROFINET為主的工業(yè)網(wǎng)絡中,往往需要借助RS485轉(zhuǎn)PROFINET網(wǎng)關(guān)的橋梁作用
    的頭像 發(fā)表于 07-31 15:58 ?710次閱讀
    渦街<b class='flag-5'>流量</b>計RS485轉(zhuǎn)PROFINET網(wǎng)關(guān)參數(shù)配置全<b class='flag-5'>解析</b>

    DPI技術(shù)賦能:開啟智能流量分析新紀元

    隨著企業(yè)數(shù)字化轉(zhuǎn)型的深入,網(wǎng)絡流量復雜度與安全威脅呈現(xiàn)爆炸式增長。傳統(tǒng)防火墻與入侵檢測系統(tǒng)面對加密流量和高級威脅顯得力不從心,關(guān)鍵業(yè)務響應延遲激增,未知惡意流量滲透導致數(shù)據(jù)泄露風險高,運維團隊在安全
    的頭像 發(fā)表于 07-28 11:05 ?1410次閱讀
    DPI技術(shù)賦能:開啟智能<b class='flag-5'>流量</b>分析新紀元

    ARM入門學習方法分享

    。 以下是一些入門學習方法的分享: 一、 理解基本概念:首先,了解ARM是什么以及它的基本概念是很重要的。ARM(Advanced RISC Machines)指的是一種精簡指令集計算機(RISC
    發(fā)表于 07-23 10:21

    信而泰×DeepSeek:AI推理引擎驅(qū)動網(wǎng)絡智能診斷邁向 “自愈”時代

    網(wǎng)絡智能診斷平臺。通過對私有化網(wǎng)絡數(shù)據(jù)的定向訓練,信而泰打造了高性能、高可靠性的網(wǎng)絡診斷模型,顯著提升了AI輔助診斷的精準度與實用性。該方案實現(xiàn)了網(wǎng)絡
    發(fā)表于 07-16 15:29

    完整教程:如何在樹莓派上配置防火墻?

    引言防火墻是任何網(wǎng)絡包括樹莓派網(wǎng)絡中必不可少的工具。本質(zhì)上,防火墻是內(nèi)部網(wǎng)絡(如樹莓派網(wǎng)絡)與其他外部網(wǎng)絡(如互聯(lián)網(wǎng))之間的安全屏障。其主要
    的頭像 發(fā)表于 07-07 16:30 ?973次閱讀
    完整教程:如何在樹莓派上配置防火墻?

    第一章 W55MH32 高性能以太網(wǎng)單片機的學習方法概述

    本章介紹W55MH32的學習方法,建議先了解硬件資源,按基礎篇、入門篇循序漸進學習。參考兩份手冊,提供例程資料,還給出官網(wǎng)、github 等學習資料查找渠道。讓我們一起踏上W55MH32高性能以太網(wǎng)單片機的
    的頭像 發(fā)表于 05-26 09:07 ?727次閱讀
    第一章 W55MH32 高性能以太網(wǎng)單片機的<b class='flag-5'>學習方法</b>概述

    曙光網(wǎng)絡發(fā)布網(wǎng)絡流量回溯分析平臺SUNA

    AI時代,日益復雜的網(wǎng)絡環(huán)境正給運維帶來嚴峻挑戰(zhàn)。業(yè)務系統(tǒng)卡頓、異常流量難溯源、故障定位如大海撈針等問題頻發(fā),傳統(tǒng)運維手段已難應對海量數(shù)據(jù)洪流的需求。
    的頭像 發(fā)表于 05-22 14:28 ?916次閱讀

    使用MATLAB進行無監(jiān)督學習

    無監(jiān)督學習是一種根據(jù)未標注數(shù)據(jù)進行推斷的機器學習方法。無監(jiān)督學習旨在識別數(shù)據(jù)中隱藏的模式和關(guān)系,無需任何監(jiān)督或關(guān)于結(jié)果的先驗知識。
    的頭像 發(fā)表于 05-16 14:48 ?1329次閱讀
    使用MATLAB進行無監(jiān)督<b class='flag-5'>學習</b>

    一種無刷直流電機霍耳信號與定子繞組關(guān)系自學習方法

    的關(guān)系。提出了一種無刷直流電機霍耳信號與定子繞組關(guān)系自學習方法,該方法通過不同的繞組通電組合將電機轉(zhuǎn)子依次轉(zhuǎn)到6個不同的位置并記錄對應的霍耳信號,然后得出霍耳信號與定子繞組的對應關(guān)系。所提出的方法快速
    發(fā)表于 03-25 15:15

    高效流量復制匯聚,構(gòu)建自主可控的網(wǎng)絡安全環(huán)境

    隨著大數(shù)據(jù)監(jiān)測、流量分析以及網(wǎng)絡安全監(jiān)管等核心業(yè)務需求的日益增長,網(wǎng)絡環(huán)境對高性能、高可靠性的流量監(jiān)控和分析提出了更高的要求。流量復制匯聚平
    的頭像 發(fā)表于 03-10 14:29 ?864次閱讀
    高效<b class='flag-5'>流量</b>復制匯聚,構(gòu)建自主可控的<b class='flag-5'>網(wǎng)絡</b>安全環(huán)境

    DeepSeek與Kimi揭示o1秘密,思維鏈學習方法顯成效

    據(jù)消息,OpenAI近日發(fā)布了一項重要研究報告。報告指出,DeepSeek和Kimi兩家機構(gòu)通過獨立研究,成功利用思維鏈學習方法,在數(shù)學解題與編程挑戰(zhàn)中顯著提升了模型的綜合表現(xiàn)。 Kimi的研究員
    的頭像 發(fā)表于 02-18 15:13 ?795次閱讀

    如何優(yōu)化BP神經(jīng)網(wǎng)絡學習

    優(yōu)化BP神經(jīng)網(wǎng)絡學習率是提高模型訓練效率和性能的關(guān)鍵步驟。以下是一些優(yōu)化BP神經(jīng)網(wǎng)絡學習率的方法: 一、理解
    的頭像 發(fā)表于 02-12 15:51 ?1596次閱讀

    BP神經(jīng)網(wǎng)絡與深度學習的關(guān)系

    ),是一種多層前饋神經(jīng)網(wǎng)絡,它通過反向傳播算法進行訓練。BP神經(jīng)網(wǎng)絡由輸入層、一個或多個隱藏層和輸出層組成,通過逐層遞減的方式調(diào)整網(wǎng)絡權(quán)重,目的是最小化網(wǎng)絡的輸出誤差。 二、深度
    的頭像 發(fā)表于 02-12 15:15 ?1611次閱讀