公務員期刊網(wǎng) 論文中心 正文

基于數(shù)據(jù)挖掘的網(wǎng)絡異常檢測技術

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了基于數(shù)據(jù)挖掘的網(wǎng)絡異常檢測技術范文,希望能給你帶來靈感和參考,敬請閱讀。

基于數(shù)據(jù)挖掘的網(wǎng)絡異常檢測技術

1網(wǎng)絡異常檢測技術概述

如今,我們已經(jīng)處于網(wǎng)絡時代,生活的方方面面都離不開網(wǎng)絡,而且網(wǎng)絡的穩(wěn)定與否直接影響著人們生活質量的高低。在日常生活中,由于受到外界因素的影響以及網(wǎng)絡本身的問題,常常會出現(xiàn)網(wǎng)絡異常的情況,為了解決這一問題,保證用戶上網(wǎng)的流暢性,需要針對發(fā)生異常的網(wǎng)絡進行檢測,這種技術就是網(wǎng)絡異常檢測技術。網(wǎng)絡異常這種情況在生活中較為常見,但是產(chǎn)生的原因卻十分復雜,一旦找不到問題的原因,就會造成網(wǎng)絡大范圍的崩潰,進而影響人們的工作和生活。

2基于數(shù)據(jù)挖掘網(wǎng)絡異常檢測技術

數(shù)據(jù)挖掘就是人們常說的知識發(fā)現(xiàn),通過對海量的、雜亂無章的、不清晰的并且隨機性很大的數(shù)據(jù)進行挖掘,找到其中蘊含的有規(guī)律并且有價值和能夠理解應用的知識,這一過程就是數(shù)據(jù)挖掘。它主要是借助分析工具找到數(shù)據(jù)和模型之間的關心,之后進行預測,并將數(shù)據(jù)回歸到真實變量。在網(wǎng)絡異常檢測技術中應用數(shù)據(jù)挖掘技術,能夠從海量數(shù)據(jù)中找到需要的信息,并且根據(jù)數(shù)據(jù)信息建立模型,從而對入侵行為和正常操作進行分類了,數(shù)據(jù)挖掘的方法有兩種:一種是分類分析,一種是聚分析。分類分析需要找到數(shù)據(jù)之間的依賴關系,并且進行預判斷,這一過程需要興趣度的介入,也就是對規(guī)則的可行性和適用性進行衡量,確保滿足最小閾值,之后建立一個數(shù)據(jù)映射分類模型,從而輸出離散類別。分類的效果與數(shù)據(jù)的特點息息相關,有的數(shù)據(jù)噪聲較大,有的數(shù)據(jù)缺失不全,有的數(shù)據(jù)密集分布,有的數(shù)據(jù)字段離散,所以還需要具體情況具體分析。聚類分析是通過反復的分區(qū)從而找到解決辦法,它的輸出是各個不同類型的數(shù)據(jù),也就是先對數(shù)據(jù)進行初始歸類,之后去粗取精進行合并,最后使得對象之間能夠彼此聯(lián)系,歸于一類。值得一提的是,通過對數(shù)據(jù)和對象之間的距離進行聚類,能夠消除數(shù)據(jù)的噪聲,完成不同形狀的聚類,也可以對數(shù)據(jù)的空間分布進行劃分,形成網(wǎng)格單元,對數(shù)據(jù)分布情況進行更直觀的判斷。

3基于機器學習方法的網(wǎng)絡異常檢測技術

機器學習指的是根據(jù)人類學習的情況,對機器進行研究,使得機器掌握學習的能力,從而獲取新的知識,并通過一系列的模擬學習,讓機器能夠自主解決問題。機器學習是人工智能的最新成果,由環(huán)境、執(zhí)行和數(shù)據(jù)庫構成,首先環(huán)境為機器學習系統(tǒng)提供信息,之后機器學習系統(tǒng)對這些信息進行識別,和數(shù)據(jù)庫進行對比,最后加以執(zhí)行,網(wǎng)絡異常檢測技術應用機器學習方法主要有兩種情況:監(jiān)督學習和無監(jiān)督學習。監(jiān)督學習指的是通過之前的異常情況和數(shù)據(jù)分析進行練習和研究,找到一個固定的模板,從而對輸入信息進行檢測,根據(jù)檢測結果進行判斷,對異常情況進行分類。這種方法需要研究人員熟悉網(wǎng)絡異常的特征,并且能夠準確區(qū)分數(shù)據(jù),從而使得機器學習系統(tǒng)能夠檢測出不同類型的異常,同時,如果是新型的異常,系統(tǒng)也能夠檢測出來。下面介紹一些檢測的方法:第一種,KNN算法,這種算法是比較簡單的機器學習方法,并且能夠對異常行為直接進行計算,并根據(jù)最近的K個樣本找到相似的類型,尤其是在動態(tài)網(wǎng)絡中,應用比較成熟。但是樣本需要均勻分布,如果測量不準確就可能出現(xiàn)一定的誤差,所以也可以結合其他算法同時使用。第二種,決策樹法,這種方法和流程圖比較像,每個節(jié)點代表者檢測的屬性,每個分支則是檢測結果,每片葉子就是異常的類型。在檢測過程中通過對沒有標記的數(shù)據(jù)進行分類,由上到下測試,之后選擇合理的分支和節(jié)點,最后在葉片上判斷類型。但是隨著網(wǎng)絡數(shù)據(jù)的不斷增多,需要對內存資源進行優(yōu)化,從而提高系統(tǒng)檢測的精準性。無監(jiān)督學習不需要對異常情況做標記,只需要根據(jù)目前的網(wǎng)絡進行建模,這樣極大地減少了工作量,同時能夠將數(shù)據(jù)聚集情況進行分類,之后由研究者進行判斷,雖然準確度不如監(jiān)督學習的高,但是操作便捷,簡單易行,它的檢測方法如下:第一種,Apriori方法,這種算法能夠第一時間檢測到網(wǎng)絡的異常,并且直接鎖定攻擊來源,主要是找到滿足設定的頻集,之后根據(jù)頻集的相關規(guī)則,對數(shù)據(jù)進行保留處理,之后生成動態(tài)的檢測規(guī)則,提高系統(tǒng)的穩(wěn)定性。第二種,EM方法,在對網(wǎng)絡異常進行檢測時,數(shù)據(jù)可能會有缺失或者是處于隱性狀態(tài),所以需要根據(jù)檢測對象的屬性對其權重進行分配,找到屬性期望,之后根據(jù)似然估計進行計算,從而實現(xiàn)交替循環(huán)。

4結論

綜上所述,網(wǎng)絡異常直接影響著用戶的信息安全,所以需要認真做好網(wǎng)絡異常的檢測工作,通過創(chuàng)新和應用相關的檢測技術,在最快的時間內找到產(chǎn)生的問題的原因,從而加以解決,滿足人們使用網(wǎng)絡的需求。

參考文獻

[1]黃煜坤.網(wǎng)絡安全異常檢測技術探究[J].電子測試,2015(05):40-42+45.

[2]廖國輝,劉嘉勇.基于數(shù)據(jù)挖掘和機器學習的惡意代碼檢測方法[J].信息安全研究,2016,2(01):74-79.

作者:秦振凱 單位桂林電子科技大學海洋信息工程學院