公務員期刊網(wǎng) 論文中心 正文

機器學習多元異構網(wǎng)絡數(shù)據(jù)安全淺析

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了機器學習多元異構網(wǎng)絡數(shù)據(jù)安全淺析范文,希望能給你帶來靈感和參考,敬請閱讀。

機器學習多元異構網(wǎng)絡數(shù)據(jù)安全淺析

摘要:為了減少多元異構網(wǎng)絡數(shù)據(jù)安全傳輸時延,設計一個基于機器學習多元異構網(wǎng)絡數(shù)據(jù)安全傳輸技術。通過選擇數(shù)據(jù)源與數(shù)據(jù)屬性的重要性定義,對多元異構網(wǎng)絡數(shù)據(jù)預處理,并建立多徑并行傳輸架構,在此基礎上,采用機器學習方法進行有效帶寬估計與參數(shù)濾波處理,最后進行帶寬調度與信道安全協(xié)議體系建立,從而完成基于機器學習的多元異構網(wǎng)絡數(shù)據(jù)安全傳輸。實驗結果表明,此次研究的基于機器學習的多元異構網(wǎng)絡數(shù)據(jù)安全傳輸有效減少了數(shù)據(jù)傳輸時延,并減少了數(shù)據(jù)傳輸中斷情況與數(shù)據(jù)丟包率,滿足數(shù)據(jù)傳輸技術的設計需求。

關鍵詞:機器學習;多元異構網(wǎng)絡;數(shù)據(jù)安全傳輸;網(wǎng)絡數(shù)據(jù)預處理;并行傳輸構架

1引言

當前,通信技術發(fā)展迅速,多種網(wǎng)絡特點明顯,并經(jīng)過多年的改革創(chuàng)新,使無線接入技術的傳輸速率逐漸逼近極限。在這種背景下,為滿足多種業(yè)務需求,需要進行多網(wǎng)寫作。但是,傳統(tǒng)的寫作機制在網(wǎng)絡傳輸資源使用上,不能同時、高效的使用,不能有效保證高效傳輸業(yè)務,并且會增加傳輸中的能耗問題,從而導致傳輸過程中發(fā)生干擾問題。因此,很多學者開展了關于多元網(wǎng)絡數(shù)據(jù)傳輸方法的研究。文獻[1]中,石玲玲,李敬兆研究了異構網(wǎng)絡中安全數(shù)據(jù)傳輸機制,該機制主要采用一種基于優(yōu)化的AES-GCM認證加密算法和基于SHA的數(shù)字簽名算法相結合的安全數(shù)據(jù)傳輸機制進行數(shù)據(jù)的傳輸;文獻[2]中,周靜,陳琛研究了基于異構網(wǎng)的一種數(shù)據(jù)安全模型,該模型預先對數(shù)據(jù)加密處理,然后建立安全傳輸信道進行了數(shù)據(jù)的傳輸。上述兩種方法能夠獲得一定的效果,但是還存在一定的不足。針對上述的不足,為此本文將機器學習方法應用到多元異構網(wǎng)絡數(shù)據(jù)安全傳輸中,以解決目前存在的問題。實驗結果表明,此次研究的多元異構網(wǎng)絡數(shù)據(jù)安全傳輸技術有效解決了目前存在的問題,具備一定的實際應用意義。

2多元異構網(wǎng)絡數(shù)據(jù)預處理

在多元異構網(wǎng)絡數(shù)據(jù)安全傳輸中,有很多數(shù)據(jù)是沒有用的,為此需要從多元網(wǎng)絡數(shù)據(jù)中選取相關的數(shù)據(jù)源進行傳輸,從而提高數(shù)據(jù)傳輸?shù)臏蚀_率與效率。在有效數(shù)據(jù)源選擇過程中,采用重要性衡量數(shù)據(jù)屬性之間的關系[3-4],捕獲關聯(lián)性較強的數(shù)據(jù),其計算表達式如下所示:(1)公式(1)中,T表示所有數(shù)據(jù)源的綜合表數(shù),(i,j)表示示例源類間的相關性。根據(jù)對數(shù)據(jù)源重要性的判斷,可以選擇關聯(lián)程度最高的數(shù)據(jù)表集合,減少不相關表。在上述重要數(shù)據(jù)源選擇完成后,分析數(shù)據(jù)屬性,由于一個數(shù)據(jù)源是有一組數(shù)據(jù)屬性組成的,通過這些屬性特征能夠反映出待傳輸數(shù)據(jù)的基本信息。主要通過數(shù)據(jù)元組的相關性進行衡量,分析元組數(shù)據(jù)出現(xiàn)的次數(shù),即通過元組數(shù)據(jù)密度進行定義,數(shù)據(jù)元組密度圖如圖1所示。圖1中,ε表示指定鄰域的半徑。按照這種思路,對上述數(shù)據(jù)集中的每個元組數(shù)據(jù)進行權重的分配[5-7],它的表達式如下:(2)公式(2)中,w(C)表示屬性權重,w(tk)表示核心元組的數(shù)目,δ表示異常值,w(tb)表示邊的元組數(shù)目。

3多徑并行傳輸架構

在上述預處理完成后,建立多徑并行傳輸架構,主要內容如下:預先對流量分割,通信流分割是發(fā)送端用來將大型數(shù)據(jù)塊分割成不同大小或相同大小的數(shù)據(jù)單元[8],其大小由通信流分割的粒度決定,主要分為以下幾類:第一,在分組級業(yè)務分割中,分組是數(shù)據(jù)流的最小構成單元,因此,分割方法粒度最小,且分組概率相互獨立,可以發(fā)送到發(fā)送端;第二,流層面的流量分割[9],將特定目標地址封裝在包頭部,然后將具有相同目標地址的包聚合為數(shù)據(jù)流,這些不同的數(shù)據(jù)流彼此獨立,并通過唯一的流標識符加以區(qū)別。利用流級分割技術可以有效地解決數(shù)據(jù)失真對多徑傳輸?shù)挠绊慬10]。第三,子流層面的流量分割,同一目的地頭部的數(shù)據(jù)流被分成多個子流,所有子流中的包都有相同的目的地地址,在一定程度上解決了流分割算法中的負載不平衡問題。多徑并行傳輸架構如圖2所示。除此之外,在帶寬聚合體系結構中,調度算法是決定業(yè)務傳輸方式和業(yè)務子流調度次序[11],確保業(yè)務子流有序到達接收端的核心,接下來我們將討論數(shù)據(jù)調度。

4帶寬調度方案制定

對于多元異構網(wǎng)絡的數(shù)據(jù)傳輸,當某個路徑的帶寬達到一定值時,網(wǎng)絡的帶寬會不斷增加,傳輸性能會相對穩(wěn)定。為提高吞吐量,分配過多帶寬會降低頻譜利用率,從而導致頻譜資源的浪費。在當前頻譜資源日益緊張的情況下,對多徑并行傳輸中各路帶寬進行調度和管理,不僅能保證多徑并行傳輸?shù)膫鬏斝阅?,而且能有效地利用資源。為此進行處理,實現(xiàn)的主要步驟如下:第一,采用機器學習方法進行有效帶寬估計,合理地估計每個子流可充分利用的無線帶寬資源,以及以較少的帶寬資源達到高吞吐率的要求,是帶寬調度算法的關鍵。為此采用耦合擁塞控制算法,對各個子流聯(lián)合控制,其表達式如下:(3)公式(3)中,MSS表示報文最大長度的常數(shù),由協(xié)議設置,RTTi、PLRi分別表示子流所處路徑的往返延遲和丟包率。第二,參數(shù)濾波處理,因為無線信道的多樣性和時變特性,鏈路參數(shù)和路徑有效帶寬都會發(fā)生動態(tài)變化,且存在誤差。為去除誤差,對網(wǎng)絡參數(shù)進行卡爾曼濾波器濾波,以獲得精確的估計值??柭鼮V波是一種離散時間遞推估計算法,通過對當前時刻的差分遞推,根據(jù)當前狀態(tài)的測量值、最后時刻的狀態(tài)以及預測誤差,計算出更精確的當前時刻狀態(tài)作為輸出。研究離散控制系統(tǒng)時,采用線性隨機微分方程如下:(4)公式(4)中,xk、xk-1分別代表k時刻與k-1時刻的狀態(tài)參數(shù),Ak、Bk分別代表系統(tǒng)參數(shù),在多模型系統(tǒng)中為矩陣,分別表示狀態(tài)轉移矩陣和輸入矩陣,uk表示控制的輸入?yún)?shù),wk表示計算時的噪聲。第三,帶寬調度,假設一多徑連接C包含n條子流,每個子流都彼此獨立,每條子流占用一個路徑進行數(shù)據(jù)傳輸,下面是它的調度過程如圖3所示。依據(jù)上述過程對帶寬調度,最后建立信道安全協(xié)議,以保證多元異構數(shù)據(jù)安全傳輸。安全協(xié)議由SSL協(xié)議、規(guī)則建立協(xié)議、隧道信息協(xié)議等構成。其中,SSL協(xié)議主要包括認證算法和加密算法兩大部分,所有服務器端的數(shù)據(jù)包都將通過SSL協(xié)議進行加密,以保證消息通信的安全性,規(guī)則建立協(xié)議包括連接信息和消息識別,記錄表匹配成功生成socket,轉發(fā)布保證數(shù)據(jù)信息在VPN技術通道上的轉發(fā)和應用。采用OpenVPN編程是實現(xiàn)隧道消息協(xié)議的主要方法??蛻舳税l(fā)送請求命令消息,以建立與服務器的連接。通過連接后,服務器根據(jù)SSL協(xié)議將經(jīng)過加密驗證的數(shù)據(jù)信息寫入隧道信息數(shù)據(jù)區(qū),實現(xiàn)與客戶端的數(shù)據(jù)交換和傳輸。信道安全協(xié)議結構如圖4所示。在數(shù)據(jù)傳輸過程中,按照上述信道安全協(xié)議進行傳輸,以此完成基于機器學習的多元異構網(wǎng)絡數(shù)據(jù)安全傳輸。

5實驗對比

為了驗證所設計的基于機器學習的多元異構網(wǎng)絡數(shù)據(jù)安全傳輸技術的有效性,進行實驗分析,并將文獻[1]的異構網(wǎng)絡中安全數(shù)據(jù)傳輸機制、文獻[2]的基于異構網(wǎng)的一種數(shù)據(jù)安全模型做對比,對比三種系統(tǒng)的有效性。此次實驗中的實驗數(shù)據(jù)集如表1所示。通過上述采集的實驗數(shù)據(jù)能夠看出,實驗選取的數(shù)據(jù)是越來越多的,從而更好的驗證三種方法的有效性,主要對比三種方法的傳輸時延、數(shù)據(jù)傳輸中斷情況以及鏈路丟包率,具體內容如下所示。

5.1傳輸時延對比

分別對比三種方法的傳輸時延,其對比結果如圖5所示。通過分析圖5發(fā)現(xiàn),在谷歌公開數(shù)據(jù)集傳輸上,三種方法傳輸時延均較小,隨著傳輸數(shù)據(jù)量的增加三種方法的數(shù)據(jù)傳輸時延都有所增加,但經(jīng)過對比能夠發(fā)現(xiàn),此次研究的基于機器學習的多元異構網(wǎng)絡數(shù)據(jù)安全傳輸技術傳輸時延最小,少于傳統(tǒng)的兩種方法。

5.2數(shù)據(jù)傳輸中斷情況對比

分別對比應用三種傳輸技術后,數(shù)據(jù)傳輸中斷情況,其對比結果如圖6所示。通過圖6能夠發(fā)現(xiàn),此次研究的傳輸技術發(fā)生數(shù)據(jù)傳輸中斷情況最少,在幾次實驗中均少于傳統(tǒng)兩種傳輸技術。

5.3鏈路丟包率對比

分別采用此次研究的基于機器學習的多元異構網(wǎng)絡數(shù)據(jù)安全傳輸技術與傳統(tǒng)兩種傳輸技術進行數(shù)據(jù)傳輸,三種方法的丟包率對比結果如圖7所示。通過分析圖7能夠發(fā)現(xiàn),傳統(tǒng)的異構網(wǎng)絡中安全數(shù)據(jù)傳輸機制的鏈路丟包率最高,高于基于異構網(wǎng)的一種數(shù)據(jù)安全模型與此次研究的傳輸技術。綜上所述,此次研究的基于機器學習的多元異構網(wǎng)絡數(shù)據(jù)安全傳輸技術較傳統(tǒng)兩種傳輸技術傳輸時延少,丟包率少。其原因在于該研傳輸技術預先對多元異構網(wǎng)絡數(shù)據(jù)進行了預處理,并制定帶寬調度方案,建立了安全傳輸協(xié)議,從而提高了多元異構網(wǎng)絡數(shù)據(jù)安全傳輸效果。

6結束語

本文設計了一個基于機器學習的多元異構網(wǎng)絡數(shù)據(jù)安全傳輸技術,并通過實驗驗證此次研究技術的有效性。該技術能夠提高數(shù)據(jù)傳輸?shù)男?,還能夠減少數(shù)據(jù)傳輸丟包率,實際應用意義較強。但由于研究時間的限制,此次研究的多元異構網(wǎng)絡數(shù)據(jù)安全傳輸技術還存在一定的不足,為此在后續(xù)研究中,還需要進一步優(yōu)化。

作者:方國強 吳雪霽 包森成 單位:中國移動通信集團浙江有限公司