文章共享SPSS Clementine 数据挖掘入门_第1页
文章共享SPSS Clementine 数据挖掘入门_第2页
文章共享SPSS Clementine 数据挖掘入门_第3页
文章共享SPSS Clementine 数据挖掘入门_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

本文格式为Word版,下载可任意编辑——文章共享SPSSClementine数据挖掘入门SPSSClementine数据挖掘入门

SPSSClementine是Spss公司收购ISL获得的数据挖掘工具。在Gartner的客户数据挖掘工具评估中,仅有两家厂商被列为领导者:SAS和SPSS。SAS获得了最高abilitytoexecute评分,代表着SAS在市场执行、推广、认知方面有最正确表现;而SPSS获得了最高的completenessofvision,说明SPSS在技术创新方面遥遥领先。

客户端基本界面

SPSSClementine(在此简称clementine)在安装好后会自动启用服务,服务端的管理需要使用SPSSPredictiveEnterpriseManager,在服务端clementine没有繁杂的管理工具,一般的数据挖掘人员通过客户端完成所有工作。下面就是clementine客户端的界面。

一看到上面这个界面,我相信只要是使用过SSIS+SSAS部署数据挖掘模型的,应当已经明白了六、七分。是否以跃跃欲试了呢,别急,精彩的还在后面^_’项目区

顾名思义,是对项目的管理,提供了两种视图。其中CRISP-DM(CrossIndustryStandardProcessforDataMining,数据挖掘跨行业标准流程)是由SPSS、DaimlerChrysler(戴姆勒克莱斯勒,汽车公司)、NCR(就是那个拥有Teradata的公司)共同提出的。Clementine里通过组织CRISP-DM的六个步骤完成项目。在项目中可以参与流、节点、输出、模型等。工具栏

工具栏总包括了ETL、数据分析、挖掘模型工具,工具可以参与到数据流设计区中,跟SSIS中的数据流十分相像。Clementine中有6类工具。源工具(Sources)

相当SSIS数据流中的源组件啦,clementine支持的数据源有数据库、平面文件、Excel、维度数据、SAS数据、用户输入等。

记录操作(RecordOps)和字段操作(FieldOps)

相当于SSIS数据流的转换组件,RecordOps是对数据行转换,FieldOps是对列转换,有些类型SSIS的异步输出转换和同步输出转换(关于SSIS异步和同步输出的概念,详见拙作:http://./esestt/archive/2023/06/03/769411.html)。图形(Graphs)用于数据可视化分析。输出(Output)

Clementine的输出不仅仅是ETL过程中的load过程,它的输出包括了对数据的统计分析报告输出。

※在

ver11,Output中的ETL数据目的工具被分到了Export的工具栏中。

模型(Model)

Clementine中包括了丰富的数据挖掘模型。

数据流设计区

这个没什么好说的,看图就知道了,有向的箭头指明白数据的流向。Clementine项目中可以有多个数据流设计区,就像在PhotoShop中可以同时开启多个设计图一样。

譬如说,我这里有两个数据流:Stream1和Stream2。通过在管理区的Streams栏中点击切

换不同的数量流。管理区

管理区包括Streams、Outputs、Models三栏。Streams上面已经说过了,是管理数据流的。Outputs

不要跟工具栏中的输出搞混,这里的Outputs是图形、输出这类工具产生的分析结果。例如,下面的数据源连接到矩阵、数据审查、直方图工具,在执行数据流后,这个工具产生了三个输出。在管理区的Outputs栏中双击这些输出,可看到输出的图形或报表。

Models

经过训练的模型会出现在这一栏中,这就像是真表(TruthTable)的概念那样,训练过的模型可以参与的数据流中用于预计和打分。另外,模型还可以导出为支持PMML协议的XML文件,但是PMML没有给定所有模型的规范,好多厂商都在PMML的基础上对模型内容进

行了扩展,Clementine除了可以导出扩展的SPSSSmartScore,还可以导出标准的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论