版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
(**大学经管学院**班河北石家庄摘要:数据挖掘能为决策者提供重要的,极有价值的信息或知识,越来越多的大中型公司开始运用数据挖掘来分析公司的数据来辅助决策支持,市场方略制订等。本文重要从技GeneraldescriptionofDataminingtechnologyand ManagementandInformationSystemL082classesShijiazhuang050000)Pickto:dataminingcanprovideimportantdecisionmakers,extremelyvaluableinformationorknowledge,moreandmorelargeandmedium-sizedenterprisestartedusingdataminingtoanalyzecompanydatatoassistdecisionsupport,marketstrategyformulation,etc.ThisarticlemainlyfromthetechnologyandapplicationofdataminingintwoaspectsofsyntheticallyexpoundedandKeywords:datamining;Associationrules;Classificationandforecast;Datawarehouse;Decisionsupportsystem能够广泛使用,并且迫切需要将这些数据转换成有用的信息和知识。获取的信息和知识能够广泛用于多个应用,涉及商务管理,生产控制,市场分析,工程设计和科学探索等。公司存在大量数据,且迫切需要将这些数据转换成有用的信息和知识。获取的信息和知识能够广泛用于多个应用,涉及商务管理,生产控制,市场分析,工程设计和科学探索(1)人工智能、模式识别和机器学习的搜索算法、建模技术和学习理论。数据挖掘也快速地接纳了来自其它领域需要是发明之母。数据采集和和存储技术的进步造成庞大的数据库日益增多,并的思想,这些领域涉及最优化、进化计算、信息论、信号解决、可视化和信索引和查询解决支持。源于高性能(并行)计算的技术在解决海量数据集方面经常是重要数据挖掘是从大量的数据中提取隐含在其中的,人们事先不懂得的,但又是潜在的有用数据挖掘能为决策者提供重要的,极有价值的信息或知识,越来越多的大中型公司开始运用数据挖掘来分析公司的数据来辅助决策从而提高竞争力.数据挖掘系统运用的技术越多,得出的成果精确性就越高。因素很简朴,对于某一种重要的数据挖掘技术有:关联规则是应用最为广泛的一种数据挖掘办法,重要目的是为了发现数据中的有关联这种关联发现能够协助零售商制订营销方略.30%~40%的人同时也为自己买某些数据关联是数据库中存在的一类重要的可被发现的知识。若两个或多个变量的取值之间存在某种规律性,就称为关联。关联可分为简朴关联、时序关联、因果关联。关联分析的目的是找出数据库中隐藏的关联网。有时并不懂得数据库中数据的关联函数,即使懂得也是不拟定的,因此关联分析生成的规则带有可信度。关联规则挖掘发现大量数据中项集之间有趣的关联或有关联系。grwal193集间的关联规则问题,后来诸多的研究人员对关联规则的挖掘问题进行了大量的研究。他们的工作涉及对原有的算法进行优化,如引入随机采样、并行的思想等,以提高算法挖掘近来几年已被业界所广泛研究。关联规则研究有下列三种趋势:3神经网络办法是在模拟生物神经系统的构造和功效而建立起来的,现在,已经出现了多个网络模型和学习算法,重要用于分类,优化,模式识别,预测和控制等领域。在数据挖掘领域,重要采用前向神经网络提取分类规则。基于神经网络的数据分类普通含有较小产生初始群体,计算个体的适应度,再进行染色体的复制,交叉,变异等操作,重复这个过程,直到找到最佳或较佳个体为止。在数据挖掘中,往往把数据挖掘任务体现为一种搜索问题,使用遗传算法的强大搜索能力找到最优解。可视化技术就是为人们参加知识挖掘的过程提供方便,采用某些较直观的办法协助理解数据库中的数据和挖掘后产生的规则。可视化挖掘技术涉及:①数据可视化由于先进的科学仪器和观察仪器的使用,在科学和工程中产生了大量的数据,这为数据挖掘在科学研究中的应用发明了条件. 在卫生保健业上数据挖掘业得到了广泛的应用,以电子格式储存病人的统计,以及医学信息系统的发展产生了大量能够在线运用的临床数据,用数据挖掘的办法从这些数据中提取出来的规律和信息能够辅助医生做出决策.目的是拟定发现任务的操作对象,即目的数据,它是根据顾客的需要从原始数据中抽取的一组数据. 重要目的是消减数据维数,即从初始特性中找出真正有用的特性,以减少数据挖掘时的系统开销。首先要明确挖掘的任务和目的,如数据总结,分类,聚类,关联规则发现,或序列模式发现等,拟定任务后就要决定采用什么样的算法.另外,如果KDD是面对顾客的,可能要对发现的模式进行可视化,或转换为顾客易懂关联分析(association聚类分析分类预测时序模式(time-series偏差分析王建会;王建会;王洪伟;申展;胡运发; 一种实用高效的文本分类算法[J].计算机研究与发展01期秦进;陈笑蓉;汪维家;陆汝占 文本分类中的特性抽取[J].计算机应用02赵晨 过程控制中的数据挖掘技术研究及其智能控制方略探讨[D].
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论