下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、一种基于BP 神经网络的离散化方法摘要:随着人工智能和数据挖掘技术的深化开展,大数据逐步进入人们的视野,在大数据的处理过程中,离散化处理是一个必不可少的环节。本文通过在BP神经网络的学习过程中引入动量学习法,进一步完善了BP神经网络在学习方面的局限性,降低了BP神经网络的训练误差,在此根底上提出了一种基于BP神经网络的离散化方法,实现了对连续属性的离散化处理。算法分析和实验证明,本算法是实在可行的。关键词:离散化;BP神经网络;连续属性;动量学习法Abstract: With the further development of artificial intelligence and data
2、 mining technology, big data gradually into view, in the process large data, discrete processing is an essential link . In this paper, in the learning process by introducing the momentum BP neural network learning method to improve the stability and accuracy of BP neural network , reducing the learn
3、ing error BP neural network , and on this basis, proposes a BP neural network discretization method to achieve a discrete handling of continuous attributes . Algorithm analysis and experiments show that the algorithm is feasible.Key words: Discrete; BP neural network; continuous attributes; Momentum
4、 Learning在当今大数据时代,我们会面临着各种各样的数据,包括离散化的数据和连续性的数据,在众多的算法中,有许多关于数据离散化的例子1-4,在这些现有的方法中,各有千秋,有的处理连续性数据效果不好,有些算法即使能处理连续型数据,但挖掘和学习的效果没有处理离散型数据有用和有效。对我们日常生活和应用中的实际例子分析发现,对我们有用的数据除了连续性的,更多存在的是连续型属性的数据。这样的话,对数据进展离散化处理显得异常重要,离散化处理的效果好坏,效率上下,直接关系到数据处理和分析的最终结果5-6。1 离散化问题的描绘离散化就是采取各种方法将连续的区间划分为小的区间,并将这连续的小区间与离散的值
5、关联起来。离散化的问题本质是:决定选择多少个分割点和确定分割点位置。连续属性离散化的方法有大概有以下几种:1无监视和有监视。在离散化过程中使用类信息的方法是有监视的,而不使用类信息的方法。2全局和局部。全局离散化指使用整个样本空间进展离散化,而局部离散化指在样本空间的一个区域内进展离散化。3动态离散化和静态离散化。动态的离散化方法就是在建立分类模型的同时对连续属性进展离散化,而静态离散化方法就是在进展分类之前完成离散化处理。2 BP神经网络BP神经网络是一种多层前向型神经网络,其神经元的传递是S型函数,输出紧为0-1.的连续量,它可以实现从输入到输出的任意非线性映射。由于权位的调整采用反向传播
6、学习算法,因此,人们就就将此算法称为向后传播算法,简称BP算法。日前,在神经网络的已有的应用理论中,BP神经网络的应用占了绝对优势,也说明了BP神经网络的应用广泛性和优势,以及有不可限量的应用前景和开展空间。BP神经网络模型是一个三层网络,它的拓扑构造可被划分为:输入层、输出层,隐含层。其中,输入层与输出层具有更重要的意义,因此有些文献和算法中把BP神经网络看成有输入层和输出层组成的两层网络构造。3 基于BP神经网络的离散化方法1对BP神经网络的参数进展初始化。首先创立网络构造,并根据实际情况确定BP神经网络中的输入层,隐含层和输出层的节点数、连接权值和训练误差值等初值,最后给定学习速率和神经
7、元鼓励函数。2隐含层输出计算。3输出层输出计算。4计算训练误差?jl=dqj-xljfslj,输出层?jl=fsljk=1nl+1?l+1wl+1kj,隐含层和输入层5修正权值和阈值wl+1jik+1=wljik+?jlxl-1i+wljik-wljik-1 l+1jk+1=ljk+?jl+ljk-ljk-16判断是否到达训练误差要求,假设到达要求,就进展下一步,假设达不到要求否那么,转到第2步,重新对BP网络进展训练和学习。7利用附加动量法规那么对BP神经网络进展训练,为了抑制BP神经网络的缺点,在BP算法中参加动量项不仅可以微调权值的修正量,也可以有效的减少BP神经网络在训练和学习过程中的
8、缺陷。另外在修改训练参数和连接权值的同时,还可以使用顺序方式训练网络。顺序方式训练网络要比批处理方式更快,特别是在训练样本集很大,而且具有重复样本时,顺序方式的这一优点更为突出。8利用训练后的BP神经网络进展离散化处理利用BP神经网络的分类功能,对训练样本数据进展处理,根据处理结果对连续数据进展离散化处理,综合整理后就得到了离散化后的属性表。利用BP神经网络的新建一个网络,经过训练之后为了测试一下我们提出的算法的效果,我们可以对此算法进展一次实验,我们利用仿真函数sim可以看到的聚类结果是:Yc =6544465 3这样我们就得到了离散化后的属性表。连续属性离散化之后我们需要验证一下离散化的结
9、果是否对属性表的一致性产生了影响,所以我们再次利用LVQ神经网络来检验,如今训练样本为P=34 2 2 2 43 2;34 2 3 2 2 43经过训练得到的聚类结果是:Yc =55 1 5 1 1 55我们发现得到的结果和实际情况相符合。4 小结对于连续属性离散化问题,我们在BP神经网络的学习过程中,对网络的训练做了一些改进,引入了动量学习法,改善了BP神经网络的性能,最后通过Mantis仿真实验证明了该算法对于处理离散化问题的有效性。参考文献:4 谢振华,商琳,李宁,等.粗糙集在神经网络中应用技术的研究J.计算机应用研究, 2022, 219:71- 74.6 刘业政,焦宁.连续特征离散化算法比较研究J.计算机应用研究,2022,249.8 HUAN LIU, RARHAD HUSSAIN, CHEW LIM TAN, MANORANJAN DASH, 2002. Discretization: An Enabling Technique. Data Mining and Knowledge Discovery,6,393-423,2002. 2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 美食城设计招投标文件范本
- 体育课程任课教师聘用合同
- 乡村物流园区招标实施细则
- 劳动合同试用期管理要点
- 桥梁加固工程围挡施工合约
- 美容美发四人股约
- 燃气业收款政策
- 产业基地建造师聘用合同
- 人力资源规划与配置策略
- 智能农场监控系统布线合同
- 国开2024年秋《教育心理学》形成性考核1-4答案
- 市政道路及设施零星养护服务技术方案(技术标)
- 《中国心力衰竭诊断和治疗指南2024》解读(总)
- VTE评估及护理预防
- 七年级数学上册 期中考试卷(沪科安徽版)
- 乳头溢液的诊断及处理ppt课件
- 虎牌电饭煲中文使用说明书
- 《相信自己,我是最棒的》主题班会说课稿
- 人像摄影布光PPT优秀课件
- 餐饮合同范本
- 暗黑3夺魂之镰物品名称中英文对照
评论
0/150
提交评论