


下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于改进FCM的网络异常流量检测获奖科研报告摘要:针对正常上网所产生的网络流量远远大于攻击、入侵等非正常手段产生的异常流量的特点,通过对传统FCM算法进行改进,引入新的聚类中心矩阵计算方法来计算落入平均半径范围内的流量数据的对象数量,根据该数量更新聚类中心矩阵,对流量数据进行聚类,并识别出网络异常流量。对改进FCM算法、传统FCM、HCM的效果进行比较分析发现,改进FCM虽然处理时间较HCM长,但对噪声抑制较好,错分率较低。
关键词:FCM;流量检测;聚类
随着网络带宽逐渐增加、存储介质的容量逐渐增大、服务器计算能力逐渐增强,促使了数据产生的成本越来越低,从而造成网络数据急剧膨胀。如何快速、准确对网络流量进行识别和分类是网络入侵检测中亟待解决的问题。基于模糊集的FCM算法作为一种无监督的分类方法[1],表现了样本与样本之间的联系,建立了数据样本对类别的不确定性描述,已广泛应用于机器学习、数据挖掘、图像分割、海量数据分析等领域[2]。在网络流量检测中,往往基于以下假设,即网络正常流量的数量远远大于异常流量,异常流量在数据中将会呈现出比较特殊的性质,FCM能通过识别正常类别比例来确定异常的类别。
1传统FCM算法描述
设有待分类的样本集为,n是样本集合中的元素个数,q是特征空间维数。将样本集X划分为c类,然后将n个样本分别属于c个类的隶属度矩阵记为,其中表示第k个样本属于第i个类别的隶属度,应
满足:
在目标函数中,样本与类别的聚类距离度量的一般表达式为:
M为阶的对称正定矩阵。聚类的准则为取的极小值。
为阶矩阵,表示聚类中心矩阵
为第i类的聚类中心
2改进FCM获取初始聚类中心和聚类中心矩阵
对于给定的数据集,定义为欧式距离,在聚类初期,不断更新数据对象间的平均距离Mean_d,若以点为中心,Mean_d为半径范围内落入的数据对象越多,表明该对象作为聚类中心的可能越大。计算出每个数据对象以Mean_d为半径,落入该区间的数据对象数目,将区间內数据对象数目最多的一个对象作为初始聚类点,对于任意如果
3异常判定
在聚类中心矩阵生成后,对每个聚类中心Mean_d范围内的数据对象数量进行判断,依据经验,在网络访问所产生的流量中,正常流量的数量是远远大于异常流量,那么正常流量聚类所产生的类所包含的数据对象数目应远远大于异常流量所聚成的对象的数目。因此可以对聚类中心矩阵中每类的数据对象数目进行简单排序,聚类中心中所含数据对象远远少于正常值的即为异常流量。
4结果与结论
为验证算法有效性,利用matlab2018a对数据进行仿真,运行环境为win10,Intel®Core™i7-8750H,CPU@2.4Ghz,RAM16GB。从HTTPDATASETCSIC数据集中,按4:1的比例对正常流量数据和异常流量数据进行分别抽样,随机抽取一万条记录进行数据清洗和规范化,并通过数据规约对数据进行降维采样,尽量保持原有数据集的有关特性,减少需要处理的数据量,最终形成五组HTTPDATASETCSIC的六维子集。将改进后的P_FCM算法与传统FCM、HCM算法进行性能比较,模糊权重指数为2。分别对数据样本进行聚类,聚类结果如表4.1所示
比较三种算法对数据样本集的聚类结果,三种算法聚类效果比较接近,本文算法的运行时间大于FCM算法和HCM算法,但准确率高于FCM和HCM,由于HCM是硬划分的聚类分析技
术,聚类时间较低,算法效果不及基于模糊划分的FCM和本文算法。
对数据集添加5%的噪声,比较三种算法对噪声的抑制能力,添加噪声后的数据样本聚类结果如表4.2所示。
因传统FCM对初始数据敏感[3,4],对于含噪数据的识别效果不佳,迭代次数增加后算法处理时间迅速增加,错分率有所上升。HCM算法运行速度快,但错分率较高。本文算法聚类中心矩阵是通过多次迭代生成的,在对噪声的抑制上比传统FCM和HCM表现好。
通过理论分析和实验发
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年家庭教育指导师考试试题及答案
- 2025年女性健康与发展课程考试试题及答案
- 一级建造师试题及答案
- 木材生产加工合同协议书
- 中国创意家居饰品市场深度调查报告
- 山东省日照市2024-2025学年高一下学期期中考试数学模拟试卷(解析)
- 瘢痕妊娠介入治疗
- 2025年软件定义存储项目发展计划
- 矿难救援卫星电话通信保障服务合同
- 大数据分析驱动的电商仓储物流托管合同
- 八年级物理下册《十一、十二章》阶段测试卷及答案(人教版)
- 纺织服装概论知到章节答案智慧树2023年西安工程大学
- 公司反舞弊及举报制度模版
- 货物验收单表格模板
- 丹东地方方言
- 罗斯公司理财Chap003全英文题库及答案
- 世界屋脊上的明珠布达拉宫课件
- 2023年江苏省泰州市泰兴市经济开发区(滨江镇)印桥社区工作人员考试模拟题及答案
- 中国国防及军队建设的成就
- 外国文学史第二版马工程课件 第六章 19世纪文学(上)
- chap02 机器视觉中的图像采集技术
评论
0/150
提交评论