計算機網絡入侵節點選擇算法研究
時間:2022-09-04 02:43:59
導語:計算機網絡入侵節點選擇算法研究一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。
摘要:為解決傳統計算機網絡入侵節點選擇算法存在選擇準確性差,工作效率低的問題,本文提出研究基于點群聚類的計算機網絡入侵節點選擇算法。該算法首先進行入侵節點數據收集,對獲取到的數據進行清洗、歸約、轉換等處理。利用點群聚類中的K-means算法識別入侵節點,實現了計算機網絡入侵節點選擇。仿真結果表明:通過本文算法對計算機網絡入侵節點進行選擇的綜合性能TotalScore值較高,用時較短,證明本算法能在更短的時間內實現網絡入侵節點選擇,更利于預防非法節點入侵,保護網絡安全。
關鍵詞:點群聚類;計算機網絡;入侵節點;選擇算法
在當今信息化時代,人們對信息的獲取需求越來越大,多數領域需要借助計算機信息網絡通信技術進行數據挖掘、傳輸、交互等。在這樣的背景下,信息傳輸方式也隨之發生重大改變,從最初的單根導線、雙絞線、同軸電纜等發展到了現在的光纖激光網絡[1]。光纖網絡具有自組網和廣分布等特點,導致光纖網絡節點被入侵的發生率逐年上漲。光纖網絡節點入侵不僅造成通信中斷,還會造成信息泄露,給社會各方面造成嚴重影響。在這種背景下,對計算機光纖網絡入侵節點進行選擇具有重要的現實意義[2]。目前,對光纖網絡入侵節點選擇的研究很多,相關研究人員提出了許多選擇算法。文獻[3]提出H-C4.5-NB網絡節點入侵檢測方法。該方法通過計算網絡入侵節點出現的概率,進行網絡數據類別的劃分,并由C4.5和NB概率加權和的形式給出最終的決策結果。該方法有效提高了對網絡入侵數據的分析,但該方法對網絡入侵數據的處理不完善。文獻[4]提出基于模糊關聯規則挖掘的網絡入侵檢測算法。該方法通過收集網絡數據,分析網絡入侵行為特征,采用模糊關聯規則算法對入侵數據挖掘等,完成了網絡入侵數據的檢測。但該方法對入侵數據檢測的效率未過多考慮。針對上述方法存在的問題,文中將點群聚類算法應用其中,提出基于點群聚類的計算機網絡入侵節點選擇算法。該算法是通過比較樣本中各節點數據之間的性質,將性質相近數據進行聚類等,實現異常節點辨別。實驗結果表明:文中基于點群聚類的計算機網絡入侵節點選擇算法在入侵節點選擇上效率更高。
1網絡入侵節點選擇算法研究
防火墻等傳統靜態防御很難應對層出不窮的入侵,本文設計入侵檢測算法模型。其中,事件產生器用于獲取入侵節點數據,主要包括網絡數據包、系統日志、用戶活動行為數據等;事件處理器對收集到的原數據進行標準化處理;事件分析器對這些數據進行分析,找出其中存在入侵特征的數據;響應單元根據結果選擇相應的處理措施,如告警或通知、終止進程、切斷連接等;事件數據庫負責儲存數據,包括收集到的原始數據、處理后的數據等[6]。文中基于點群聚類的計算機網絡入侵節點選擇算法,基本流程如圖1所示。1.1入侵節點數據獲取。入侵節點選擇的第一步是從計算機網絡系統中選擇若干個節點數據信息,有效獲取數據。由于原始數據信息無法支撐結果識別,通過分析原始網絡數據信息的不一致性,確認入侵數據的特征類型[7]。按照數據不同類型特征,入侵節點數據收集方法選擇基于系統日志的數據收集和基于網絡的數據收集。1)基于系統日志的數據收集在計算機網絡運行中,用戶活動情況和行為數據都會被記錄,將用戶數據通過日志的形式記錄在計算機系統中,因此通過系統日志進行數據收集[8]。2)基于網絡的數據包采集用戶數據節點存在于計算機網絡傳輸數據包中,這些數據包中可能包含入侵者傳輸的病毒等危險信息,因此需要對數據包進行截取[9]。本文數據包截取方法不影響數據包中數據的傳輸,對其僅起到探視作用[10]。當數據包中含有異常數據信息時,會立即被發現,此時才會進行異常數據的截取。1.2入侵節點數據處理。獲取的入侵節點數據不能直接用于入侵識別中,需要進行清洗、歸約、轉換等,之后導入到事件數據庫當中。1)數據清洗獲取的入侵節點數據中可能存在不一致性、重復、不完整、錯誤、違反業務規則等問題,為保證數據質量,將存在問題的數據信息進行清理[11]。清洗方法如表1所示。2020年第17期2)數據歸約數據樣本數量過大,會增加計算量,降低分析準確性,需要進行歸約[12],在盡可能保持數據原貌的基礎上,盡量縮減數據規模。本文主要通過主成分分析方法進行數據歸約,首先將數據標準化處理,消除量綱;然后判斷KMO值是否可以進行主成分分析處理;再計算相關系數矩陣、特征值、相應的貢獻率、累計貢獻率以及載荷矩陣;最后給出主成分表達式,得出主成分。3)數據轉換不同的數據有不同的表示形式,為了能夠適用于查詢和分析,需要將其轉換為另一種表現形式[13]。本文數據轉換的方式是先將數據進行平滑處理,去除數據中存在的噪聲,合并處理之后的數據,之后對數據泛化處理,構建數據特征屬性。1.3入侵節點識別基于上述步驟,利用點群聚類算法進行入侵節點識別,實現入侵節點選擇。點群聚類是隸屬于數據挖掘領域的分支,其以相似性為基礎,通過計算樣本數據與特征屬性值之間相似性程度,判斷樣本所屬類別[14],基本工作流程如圖2所示。在點群聚類分析當中,分析數據相似度度量是關鍵。相似度度量通過計算維空間中的距離實現[15],距離越小相似性越高,反之,則越低。文中相似性度量的計算方法通過求取Minkowski距離實現。設m為樣本空間的維數,對于任意樣本對象N=[N]1,N2,...,Nm與Q=[Q]1,Q2,...,Qm之間的距離為:L(N),Q=æèçöø∑÷i=1mN||i-Qij1j(j>0)(1)當j=1時,曼哈頓距離為:L1(N,Q)=∑i=1mN||i-Qi(2)當j=2時,歐氏距離為:L2(N,Q)=∑i=1mN||i-Qi2(3)當j=∞時,切比雪夫距離為:L3(N,Q)=max1≤i≤mN||i-Qi(4)劃分類型、層次分解類型以及基于密度類型等都屬于點群聚類劃分類型,本文選擇劃分類型中K-means算法進行入侵節點識別。通過分析存在入侵節點的數據集,選取k個數據為最開始的入侵節點數據樣本,之后通過計算初始聚類數據之間的相似性,根據相似性數據特征對其相鄰的類進行歸類處理,計算出歸類后的聚類均值,更新聚類中心。重復上述步驟,直到滿足收斂條件為止[16]。由于每次聚類結果存在差異,并且選擇的聚類中心點存在隨機性,易導致聚類過程中對全局數據未進行調整和優化,獲取的初始聚類中心點易導致處理后的數據不穩定,存在其他入侵數據等。為此,本文在K-means算法的基礎上進行改進,具體流程如圖3所示。
2算法性能測試分析
文中以基于點群聚類的計算機網絡入侵節點選擇算法為實驗項,與文獻[3]算法、文獻[4]算法和文獻[5]算法進行實驗對比。2.1測試環境。模擬SNORT的部署方式,搭建小型局域網作為本章仿真實驗的測試環境,如圖4所示。2.2實驗數據。實驗數據為KDDCUP99網絡數據集,是哥倫比亞大學實驗室從1998年MITLL的IDS數據集中整理得到,是最具權威性的網絡安全審計數據集。具體數據如表2所示。2.3測試指標。本文實驗測試以TotalScore的最終結果為指標,通過式(7)進行計算:TotalScore=TPR∙(1-FPR)TPR+(1-FPR)-T1100-T21000000(5)式中,TPR為檢測率;FPR為誤檢率;T1為算法測試時間;T2為算法訓練時間。2.4測試結果實驗結果如表。3所示。從表3中可以看出,利用本文算法進行計算機網絡入侵節點選擇,最終得到測試指標TotalScore值為2.36,本文算法的誤檢率為4.36%,而文獻[3]、文獻[4]以及文獻[5]入侵節點選擇算法得到的TotalScore值分別為1.52、1.36和1.45,誤檢率為12.45%、15.21%和11.20%。3種算法的TotalScore值低于本文算法,誤檢率高于本文算法,證明本文算法能夠對網絡入侵節點數據進行準確分析。
3結束語
面對嚴峻的計算機網絡環境,網絡安全問題成為當今關注的焦點。當前計算機網絡入侵節點選擇算法無法對網絡入侵數據進行有效分析和處理。本文提出基于點群聚類的選擇算法,該算法有效截取網絡節點異常數據等,解決了傳統算法無法準確分析異常網絡節點數據的問題。該算法性能較好,具有一定的可行性。
作者:于府平 單位:煙臺汽車工程職業學院
- 上一篇:計算機人工智能識別技術應用思考
- 下一篇:計算機信息系統雷電防御技術探索