版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
负责人:郝林倩01目录数据挖掘的主要方式数据挖掘的主要方式1数据挖掘的主要方式数据挖掘的主要方式包括:神经网络方法、遗传算法、决策树方法、粗集方法、覆盖正例排斥反例方法以及统计分析方法。数据挖掘的主要方式神经网络由于本身良好的鲁棒性、自组织自适应性、并行处理、分布存储和高度容错等特性非常适合解决数据挖掘的问题,因此近年来越来越受到人们的关注。典型的神经网络模型主要分3大类:以感知机、BP反向传播模型、函数型网络为代表的,用于分类、预测和模式识别的前馈式神经网络模型;以Hopfield的离散模型和连续模型为代表的,分别用于联想记忆和优化计算的反馈式神经网络模型;以ART模型、Koholon模型为代表的,用于聚类的自组织映射方法。神经网络方法的缺点是"黑箱"性,人们难以理解网络的学习和决策过程。神经网络方法数据挖掘的主要方式遗传算法是一种基于生物自然选择与遗传机理的随机搜索算法,是一种仿生全局优化方法。遗传算法具有的隐含并行性、易于和其它模型结合等性质使得它在数据挖掘中被加以应用。遗传算法数据挖掘的主要方式决策树是一种常用于预测模型的算法,它通过将大量数据有目的分类,从中找到一些有价值的,潜在的信息。它的主要优点是描述简单,分类速度快,特别适合大规模的数据处理。决策树方法数据挖掘的主要方式粗集理论是一种研究不精确、不确定知识的数学工具。粗集方法有几个优点:不需要给出额外信息;简化输入信息的表达空间;算法简单,易于操作。粗集处理的对象是类似二维关系表的信息表。粗集方法数据挖掘的主要方式它是利用覆盖所有正例、排斥所有反例的思想来寻找规则。首先在正例集合中任选一个种子,到反例集合中逐个比较。与字段取值构成的选择子相容则舍去,相反则保留。按此思想循环所有正例种子,将得到正例的规则(选择子的合取式)。覆盖正例排斥反例方法数据挖掘的主要方式在数据库字段项之间存在两种关系:函数关系(能用函数公式表示的确定性关系)和相关关系(不能用函数公式表示,但仍是相关确定性关系),对它们的分析可采用统计学方法,即利用统计学原理对数据库中的信息进行分析。可进行常用统计(求大量数据中的最大值、最小值、总和、平均值等)、回归分析(用回归方程来表示变量间的数量关系)、相关分析(用相关系数来度量变量间的相关
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 甘肃省高台一中2021-2022学年物理高一第二学期期末学业水平测试试题含解析
- 山东省枣庄市峄城区、山亭区2025届六年级数学第一学期期末联考试题含解析
- 山南地区浪卡子县2024-2025学年六年级数学第一学期期末监测模拟试题含解析
- 杜郎口中学2021-2022学年高一物理第二学期期末教学质量检测模拟试题含解析
- 北京市西城区第三十一中学2021-2022学年物理高一第二学期期末达标测试试题含解析
- 医疗器械使用及维护手册
- 医学研究与临床实践作业指导书
- 农业生产服务创新与市场化改革指导意见
- 农业环保工作实施方案
- 四年级英语下册 Unit 5 My clothes Part A第三课时教案1 人教PEP
- 鹰潭市余江区乡镇街道社区行政村统计表
- 地铁是怎样建成少儿科普版共21张课件
- 2022年屯昌县工会系统招聘考试题库及答案解析
- 中长跑体育-完整版课件
- 高中心理健康 心流:一个让你学习成瘾的秘密 课程设计
- 医院急诊科群体性食物中毒应急演练方案
- (三大构成)平面构成PPT
- 宠物营养与食品
- 幼儿园中班数学排序排一排最新ppt
- 建筑企业如何实现转型升级发展
- 外宾登记专业培训及公安上传相关注意事项
评论
0/150
提交评论