数据挖掘方法论(SEMMA)_第1页
数据挖掘方法论(SEMMA)_第2页
数据挖掘方法论(SEMMA)_第3页
数据挖掘方法论(SEMMA)_第4页
数据挖掘方法论(SEMMA)_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Explore 数据特征探索、分析和予处理Modify 问题明确化、数据调整和技术选择Model 模型的研发、知识的发现Assess 模型和知识的综合解释和评价 样本的精选,不仅能减少数据处理量,节省系统资源,而且能通过数据的筛选,使你想要它 反映的规律性更加凸现出来。 “规律性”,再依此去指导工作,则很可能是在进行误导。若你是从正在运行着的系统中进 质量,慎之又慎!从巨大的企业数据母体中取出哪些数据作为样本数据呢?这要依你所要达到的目标来区分 采用不同的办法:如果你是要进行过程的观察、控制,这时你可进行随机取样,然后根据样 本数据对企业或其中某个过程的状况作出估计。 SAS 不仅支持这一取样

2、过程,而且可对所 取出的样本数据进行各种例行的检验。若你想通过数据挖掘得出企业或其某个过程的全面规 利用它支持你进行决策才是真正有效的,并能使企业进一步获得技术、经济效益。Explore数据特征探索、分析和予处理前面所叙述的数据取样,多少是带着人们对如何达到数据挖掘目的的先验的认识进行操作 区分成怎样一些类别这都是要首先探索的内容。 它们不仅能做各种不同类型统计分析显示,而且可做多维、动态、甚至旋转的显示。Model模型的研发、知识的发现 清多因素相互影响的,十分复杂的关系。 但是,这种复杂的关系不可能一下子建立起来。一 情况。这些探索、分析,并没有一成不变操作规律性;相反,是要有耐心的反复的

3、试探,仔 种 情况,应当说,你的数据挖掘已挖到了有效的矿脉。 杂运算过程和编制结果展现程序的烦恼和对你思维的干扰。这就使你数据分析过程集聚于你 过程,提高了你的思维能力。Modify问题明确化、数据调整和技术选择 进行有效的数据挖掘操作。 据挖掘的各个阶段中,数据挖掘的产品都要使所使用的数据和所将建立模型处于十分易于调 整、修改和变动的状态,这才能保证数据挖掘有效的进行。 合或者生成一些新的变量,以体现对状态的有效的描述。 SAS 对数据强有力的存取、管理 和操作的能力保证了对数据的调整、修改和变动的可能性。若使用了 SAS 的数据仓库产品 技术时就更进一步保证了有效、方便的进行这些操作。 段

4、就更加清晰、明确了。这一步是数据挖掘工作的核心环节。虽然数据挖掘模型化工作涉及了非常广阔的技术领域, 但对 SAS 研究所来说并不是一件新鲜事。自从SAS 问世以来,就一直是统计模型市场领域 的领头羊,而且年年提供新产品,并以这些产品体现业界技术的最新发展。 你的数据结构和内容也有了充分的适应性。 SAS 在这时也向你提供了充分的可选择的技术 经元网络;决策树等。在你的数据挖掘中使用哪一种方法,用 SAS 软件包中什么方法来实现,这主要取决于你的 数据集的特征和你要实现的目标。实际上这种选择也不一定是唯一的。好在 SAS 软件运行 效率十分高,你不妨多试几种方法,从实践中选出最适合于你的方法。

5、 ASSESS出一个最好的模型 出来,另外就是要对模型进行针对业务的解释和应用。若能从模型中得出一个直接的结论当然很好。但更多的时候会得出对目标问题多侧面的描 往往是要你在所付出的代价和达到预期目标的可靠性的平衡上作出选择。假如在你的数据挖 化,以利你综合抉择。 软件提供给你的许多检验参数外,评价的办法之一是直接使用你原来建立模型的样板数据来 在这一步应得到较好的评价。这说明你确实从这批数据样本中挖掘出了符合实际的规律性。 进行反思了。若这一步也得到了肯定的结果时,那你的数据挖掘应得到很好的评价了。 of nbeusedaspartofanyiterativedataminingmethodology e volume reduces the processing time required to get crucial business information. If general e Modify your data by creating, selecting, and transforming the variables to focus the model r yo o

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论