SPSS Modeler培训(1)_第1页
SPSS Modeler培训(1)_第2页
SPSS Modeler培训(1)_第3页
SPSS Modeler培训(1)_第4页
SPSS Modeler培训(1)_第5页
已阅读5页,还剩110页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、SPSS Modeler培训培训(1)2培训内容培训内容 第一章第一章 SPSS Modeler简介第二章第二章 读取数据文件第三章第三章 数据质量第四章第四章 数据处理第五章第五章 寻找数据之间的关系第六章第六章 复杂数据处理3第一章第一章 SPSS Modeler数据数据挖掘简介挖掘简介内容:数据挖掘概念和技术简介介绍CRISP-DM (跨行业数据挖掘标准流程)介绍数据挖掘环境介绍基本操作数据挖掘定义:用已验证的方法从大量数据中发掘出可采取行动的内在知识,从而改善企业运营。已验证的方法数据知识改善运营数据挖掘技术:预测与分类聚类关联性分析序列分析异常监测时间序列分析知识知识数据数据数据运营

2、数据挖掘4关联可能一起发生的事件关联分析51 主页2 电子商店3 结帐确定事件发生的序列序列相关分析61 2 3 基于事物的属性进行自动归类聚类分析7教育程度非大学毕业大学毕业收入高收入低收入对将来发生的事情进行预测预测与分类8从正常群体中筛选出行为异常的个体异常分析9基于事物发展的延续性和随机性预测事物未来的发展时间序列分析1011CRISP-DM 过程模型过程模型跨行业数据挖掘标准过程(CRISPDM)定位是面向行业、工具导向、面向应用适用于大型工业和商业实践的一般标准六个阶段:商业理解数据理解数据准备建模模型评估结果发布12CRISP-DM商业理解商业理解13预测应用相关的时间窗定义预测

3、应用相关的时间窗定义初始期:初始期:用于计算用户价值(当前ARPU值),确定适合客户维系活动的客户群体。用于评估客户未来一年内的客户价值以及客户价值增长的可能性用于描述流失客户历史通话行为特征及产品消费特征观察期:观察期:用于构造流失预测模型分析指标的时间区域用于构造固定期限合同客户是否重新续约的时间区域用于构造客户流失类型预测模型模型分析指标的时间区域预测期:预测期:客户流失状态出现的时间区域客户不再选择固定期限续约状态出现的时间区域客户维系相关数据挖掘模型观测客户行为的时间窗14数据挖掘项目实施过程数据挖掘项目实施过程客户价值评估举例客户价值评估举例业务目标业务目标是否只关注客户未来价值是

4、否成长而不考虑客户未来的价值等级?客户价值等级如何划分?分析目标范围分析目标范围分析的范围是所有的客户还是部分产品的客户?时间窗时间窗预估多长时间段以后的客户价值?客户价值等级定义是以多长时间段的价值为参考依据?业务分析思路假设业务分析思路假设哪些因素能决定客户未来的价值成长可能性?客户年龄、职业、最近一年的累积话费增长率、同龄人中的价值等级等数据挖掘目标细化数据挖掘目标细化是否针对客户未来变成其它任意等级的可能性进行评估?是否需要把预付费客户和后付费客户分开?15CRISP-DM数据理解数据理解16数据挖掘项目实施过程数据挖掘项目实施过程客户价值评估举例客户价值评估举例数据字典描述数据字典描

5、述业务假设验证业务假设验证主要业务假设参考因素和分析目标的关联程度如何? 业务假设不成立业务假设不成立 业务假设成立业务假设成立数据质量分析数据质量分析关注的因素数据质量如何?缺失率是否严重?17CRISP-DM数据准备数据准备18数据挖掘项目实施过程数据挖掘项目实施过程商铺价值成长性评估举商铺价值成长性评估举例例缺失值填补缺失值填补客户年收入数据缺失,补入一定范围内的随机数?还是常值?还是建立另一个预测模型通过其它客户年收入来填补客户年收入缺失值?清理异常数据清理异常数据哪些客户由于特殊情况客户年收入填写失真?哪些客户年收入数据有问题?派生衍生变量派生衍生变量最近3个月的交易量转换成交易量增

6、长百分比;开户日期转换成开户时长等19CRISP-DM建立模型建立模型20精确营销分析中涉及的算法概述精确营销分析中涉及的算法概述 通过有监督的学习算法在历史营销数据的基础上进行学习,获取客户当前属性和通过有监督的学习算法在历史营销数据的基础上进行学习,获取客户当前属性和近期行为特征和客户未来行为发展趋势之间互相影响的数量关系,从而根据客户现有近期行为特征和客户未来行为发展趋势之间互相影响的数量关系,从而根据客户现有属性及行为对客户将来行为趋势作出一定的判断。属性及行为对客户将来行为趋势作出一定的判断。 通常,我们用连续性数值或定性分类数值作为描述客户行为趋势的主要方式。通常,我们用连续性数值

7、或定性分类数值作为描述客户行为趋势的主要方式。而用定性值描述客户未来一段时间内的行为趋势是这类分析中最常见的方法。如:客而用定性值描述客户未来一段时间内的行为趋势是这类分析中最常见的方法。如:客户未来价值的评估,客户流失标志等。户未来价值的评估,客户流失标志等。 不同类型目标值适用的算法:不同类型目标值适用的算法:连续型目标值连续型目标值 决策树、线性回归、广义回归、神经网络、支持向量机分类定性目标值分类定性目标值 决策树、 决策列表、神经网络、广义回归、逻辑回归、判别式、支持向量机、贝叶斯网络、Cox回归是否允许使用黑盒算法是否允许使用黑盒算法 神经网络、支持向量机属于黑盒算法21 不同数据

8、模型结果比较不同数据模型结果比较l分析之初很难清晰定义哪种算法拟合效果最好分析之初很难清晰定义哪种算法拟合效果最好l准确性不是衡量不同模型效果的唯一标准准确性不是衡量不同模型效果的唯一标准l需要多角度去评估模型的效果(准确性、查全率、需要多角度去评估模型的效果(准确性、查全率、纯度、提升度等)纯度、提升度等)22CRISP-DM模型评估模型评估23数据挖掘项目实施过程数据挖掘项目实施过程客户价值评估举例客户价值评估举例参考因素的业务正确性参考因素的业务正确性例如:用作评估客户未来价值成长可能性的参考因素(客户持有产品数)是当前最新数据还是在预测时间周期前的历史数据?业务行动业务行动对未来贡献可

9、能提高的客户采取哪些政策倾斜?哪些客户是需要采取营销资源倾斜的?24CRISP-DM结果发布结果发布25数据挖掘项目实施过程数据挖掘项目实施过程客户价值评估举例客户价值评估举例26 SPSS Modeler 简介简介内容熟悉 SPSS Modeler 中的工具和面板介绍可视化编程的思想目的初步了解 SPSS Modeler 的功能27SPSS Modeler用户用户界面界面数据流区域工具栏 菜单栏 选项板区节点数据流,输出和模型管理器项目窗口28可视化编程可视化编程节点一个图标代表在 SPSS Modeler 中进行的一个操作工作流一系列连接在一起的节点选项板包含一系列不同功能的图标29选项板

10、选项板源节点用来将数据读入 SPSS Modeler 中记录选项节点在记录上进行操作一条记录是一种“情形”或一“行”数据字段选项节点在字段上进行操作一个字段是一个变量图形节点在建模之前和之后用来可视化数据建模节点代表有效建模算法注意:建模算法产生生成的模型30增加一个节点增加一个节点在选项板上双击节点,自动放置节点到数据流区域注意:它会自动地连接到“中心”节点将节点从选项板拖放到数据流区域中在选项板上点击一个节点,然后在数据流区域中点击一下未选未选择择选择选择当节点在选项板中被选中后,会变成淡蓝色31编辑一个节点编辑一个节点在节点上右击,展开一个节点点击 “编辑”在菜单上还可以选择连接、断开连

11、接、重命名、注释、复制、删除、载入、保存等操作32连接节点连接节点使用鼠标中键来连接节点在数据流区域上,把一个节点连接到另一个上,可以通过鼠标中间键点击和拖放来完成(如果您的鼠标没有中间键,可以通过按住“Alt”键来模拟这个过程)通过双击来连接节点双击选项板上的节点,自动把新节点连接到数据流区域中的“中心”节点上使用鼠标中键使用鼠标中键未选中的节点(灰白色)未选中的节点(灰白色)被选中的节点被选中的节点(淡蓝色)(淡蓝色)33删除节点之间的连接删除节点之间的连接在连接箭头的头部按住鼠标右键选择“删除连接”34关于连接节点:关于连接节点:源节点源节点源节点是连接到初始数据源的节点源节点只能发送数

12、据不能连接到一个源节点35关于连接节点:关于连接节点:终端节点终端节点终端节点是生成输出、图形、表格和模型的节点不能从终端节点连接到任何节点36注释流和节点注释流和节点传递重要的信息在流中标明注释添加流用途的小结,方便其他程序应用37SPSS Modeler 客户端和服务器端客户端和服务器端SPSS Modeler 可以运行在 客户端和服务器端两种模式下默认的模式是客户端在菜单 “工具” 中选择 “服务器登录”注意 SPSS Modeler 客户端和服务器端版本必须匹配38帮助菜单帮助菜单帮助主题CRISP-DM 帮助教程软件使用辅助选项帮助键盘代替鼠标操作 这是什么39第二章第二章 读取数据

13、文件读取数据文件内容SPSS Modeler 中可以读取的数据格式读取文本数据文件读取 Statistics 数据文件使用 ODBC 读取数据库查看数据SPSS Modeler 中的数据类型和字段方向保存 SPSS Modeler 数据流目的介绍数据读入 SPSS Modeler 的一些方法40SPSS Modeler 中读取数据格式中读取数据格式文本文件Statistics 数据文件ODBC 兼容的数据库SAS 数据文件用户输入文件41文本文件文本文件自由字段文本文件是包含分隔符(逗号、制表符、空格或一些其它字符)的数据文件,可以使用变项文件节点读取数据如果数据是列界定的(字段未被分隔,但是

14、始于相同的位置并有固定长度),应该使用固定文本文件导入固定文件节点读取文件SmallSampleComma.txtSmallSampleFixed.txt42读取自由字段文本文件读取自由字段文本文件添加变量文件节点到数据流区域编辑节点指向文件 SmallSampleComma.txt通过选择“类型”条目检查结果43读取固定字段文本文件读取固定字段文本文件移动一个固定文件节点到数据流区域编辑这个节点指向文件 SmallSampleFixed.txt构造 4 个新字段,列出变量名和字段长度44读取读取Statistics数据数据文件文件添加 Statistics 文件节点到数据流区域编辑节点,指向

15、文件 SmallSample.savStatistics 数据文件有特殊的“标签”:变量标签描述字段数值标签附上解释数值的编码45数据库节点数据库节点使用数据库节点前必须配置 ODBC 驱动去指定数据库的位置“控制面板-管理工具” 选择 ODBC选择 “添加” 备注备注:SPSS专用专用ODBC可从可从http:/ driver1DB2 UDB for Windows/UNIX version 9.1, 9.5SPSS OEM 5.3 DB2 Wire Protocol *1 1SQL Server 2000SQL Server ODBC driver version 2000.85.1117

16、.000 for Windows 32-bit and 2000.86.1830.00 for Windows 64-bit SPSS OEM 5.3 SQL Server Wire Protocol *11SQL Server 2005SQL Native Client driver version 2005.90.3042.00 SPSS OEM 5.3 SQL Server Wire Protocol *11SQL Server 2008SPSS OEM 5.3 SQL Server Wire Protocol *11Oracle 10G (10.2), 11g (11.0)SPSS O

17、EM 5.3 Oracle Wire Protocol *11Teradata V2R6, V12 Teradata ODBC driver version 12.00.00.00 2Netezza Performance Server 4.0 Netezza ODBC Driver version 4.05.00.7731*22DB2/400 V5R4, V6R1SPSS OEM 5.3 DB2 Wire Protocol *1 2Sybase IQ 12.7 Sybase IQ ODBC driver version 9.00.02.10232HP Neoview 2.0HP ODBC 2

18、.0 version 0 on WindowsHP Neoview ODBC Driver R2.3.2 on HP-UX3MySQL AB Enterprise Edition 5.0, 5.1SPSS OEM 5.3 MySQL Wire Protocol *1SPSS Modeler 13 新增功能新增功能支持数据库支持数据库的等级的等级47添加添加 ODBC 数据源数据源选择合适的 ODBC 驱动,该驱动应该匹配数据库的名称和版本数据源 Holidays数据库文件custandhol.mdb 48使用数据库节点使用数据库节点添加并编辑数据库节点:选择数据库节点连接数

19、据源选择“添加新的数据库连接”在数据源列表中选择需要连接的数据源,点击连接选择需要读取的表格49定义字段类型定义字段类型类型节点指定字段的一系列重要属性指定字段类型、方向和缺失值SPSS Modeler 可以自动设置变量类型,用户也可以强制指定类型为建立模型,指定字段的方向指定缺失值以及如何处理缺失值变量值检查保证字段值满足一定的设置50定义字段类型定义字段类型字段类型帮助您理解正在使用的数据,是一些数据准备和所有建模程序所必需的字段类型:连续型 用于描述数值,如0-100 或者0.75-1.25 内的连续值一个连续值可以是整数、实数或日期/时间离散型用于当一个具体值的精确数量未知时描述字符串

20、,一旦数据被读取,其类型就会是标记、集合或者无类型集合型 用于描述带有多个具体值的数据(黄、绿、蓝)标记型 用于只取两个具体值的数据(真、假)无类型 用于不符合上述任一种类型的数据或者含有太多元素的集合类型数据51字段实例化字段实例化在读取值前数据称为未实例化,字段设置为连续或离散型通过读取值后数据完全实例化,字段的取值和类型都是可知的通过类型节点或数据源节点上的类型条目可以指定数据类型52字段实例化字段实例化何时在源节点实例化数据集不太大不打算以后在流中增加字段刷新数据源刷新类型节点何时在类型节点实例化数据集较大,而且流在类型节点前就过滤了子集数据在流中被过滤数据在流中被合并或追加在处理过程

21、中导出新的数据字段53字段类型字段类型用变项文件节点读取SmallSampleComma.txt字段实例化将ID字段的类型修改为无类型54字段方向字段方向输入:输入或者预测字段输出:输出或者被预测字段字段两者:既是输入又是输出,只在关联规则中用到无:建模过程中不使用该字段分区:将数据拆分为训练、测试(验证)部分分割:为每个不同的值建立不同的模型字段方向设置只有在建模时才起作用55第三章第三章 数据质量数据质量内容缺失数据定义介绍数据审核节点目的熟悉SPSS Modeler 中的一些用来发现数据的准确性、完整性和数据整体分布的方法56缺失数据类型缺失数据类型系统缺失值,也被称作 nulls,这些

22、值在数据库中被留为空格,而且在类型节点上它们并不被明确设置为“缺失”系统缺失值在 SPSS Modeler中显示为 $null$用户自定义缺失值,也被称作空白 blanks,这些值在类型节点上被明确地定义为缺失确定为空白的数据值被标记为特殊对待,而且在大多数计算中被剔除57定义定义缺失值缺失值在类型条目对话框中:右击菜单中选中“全选”再右击选中设置“缺失”选择“开”类型条目选中 Children 字段“缺失”选项定义空白缺失值 99类型再次读取值58数据审核数据审核打开数据流:数据审核.str使用制表节点输出表格:共有 4117 条记录使用数据审核节点连接类型节点执行数据审核节点输出检查结果5

23、9输出检查结果输出检查结果点击小图看完整的分布图或直方图60第四章第四章 数据处理介绍数据处理介绍内容介绍选择节点处理记录介绍几个字段处理节点:过滤、导出、重新分类、设为标志介绍如何自动生成节点目的学会使用SPSS Modeler中 一些可用的数据处理技术,并使用这些技术清洗和精炼数据61数据处理技术数据处理技术CLEM( Clementine Language for Expression Manipulation )是一种功能强大的语言,用来分析操作 SPSS Modeler 中使用的数据用在导出、选择、过滤、平衡等节点这些函数可以导出新的值、根据条件选择记录、比较和评估数据、插入数据注意

24、:为了将错误减少到最小,当使用注意:为了将错误减少到最小,当使用 CLEM时经常需要为字段名加上单引号时经常需要为字段名加上单引号62表达式构造器表达式构造器尽量不要手动输入CLEM 表达式63选择节点选择节点打开数据流:数据处理.str使用选择节点连接类型节点选择符合条件“INCOME 20000”的记录选择模式“包含”使用分布节点分别连接类型节点和选择节点生成字段 RISK 的分布比较选择前后的分布64过滤节点过滤节点使用过滤节点连接类型节点改变字段名 STORECAR 为 STORECARDS 移除字段 ID使用制表节点输出表格查看结果65导出节点导出节点使用导出节点连接过滤节点导出新字

25、段导出节点四种形式:导出规则导出标记导出集合导出条件66自动生成导出节点自动生成导出节点使用直方图节点连接最后一个导出节点直方图节点中选择字段INCOME 生成直方图自动生成导出节点或选择节点67重新分类节点重新分类节点使用重新分类节点连接最后一个导出节点选择单一模式重分类 Risk 字段为新字段 RISKCATbad loss,bad profit 新值badgood risk 新值 good使用制表节点输出表格通过表格比较两个字段68设为标记节点设为标记节点打开数据流:设为标志.str为标志节点用于根据为一个或多个集合字段定义的分类值导出标志字段。 69第五章第五章 寻找数据之间的关系寻找

26、数据之间的关系内容介绍网络图节点和矩阵节点研究符号字段之间关系使用相关系数来研究数值字段之间关系使用Statistics输出节点连接Syntax 处理更加复杂的关系 目的探索一些在SPSS Modeler中研究字段之间关系的途径70在数据中寻找关系在数据中寻找关系数据审核节点使用目标字段层叠矩阵节点生成符号数据交叉列联表网络图节点可视化表现符号数据之间的关系统计量节点计算数值字段之间的相关系数散点图节点和直方图节点可视化表现数值数据(交叠符号字段)Statistics输出节点实现更加复杂的关系呈现71矩阵节点:关联两个符号字段矩阵节点:关联两个符号字段打开数据流:关系输出.str使用矩阵节点连

27、接类型节点生成列联表RISK 是否随 GENDER 改变行 RISK,列 GENDERRISK 是否随 HOWPAID 改变改变列为 HOWPAID选择行百分比注意在输出矩阵的显示条目,用户可以直接选择用何种汇总方式生成列联表72网络图节点:可视化表现符号字段网络图节点:可视化表现符号字段使用网络图节点连接类型节点MARITAL,MORTGAGE 和 RISK 之间是否表现出关联选择字段 MARITAL,MORTGAGE 和 RISK线段值为绝对数值连接规模连续变化只显示大于 300 的连接400 以下为弱连接,600 以上为强连接输出网络图73网络图修改网络图修改使用滑动控制丢弃 450 以

28、下的连接使用控制条目设置:1000 以下为弱连接,1500 以上为强连接右击与 y 没有连接的点(divsepwid)选择隐藏点击强连接(married 和 y,bad profit 和 y)自动生成导出节点(选择后连接变成红色)74统计量节点:数值字段之间的相关性统计量节点:数值字段之间的相关性使用统计量节点连接类型节点计算相关系数检查相关字段:选择所有连续型字段(ID 除外)相关性设定:定义相关强度标签75散点图节点散点图节点使用散点图节点连接类型节点X 字段 = NUMCARDSY 字段 = LOANS交叠 = RISK选项条目中:散开使用全部数据76直方图节点直方图节点使用直方图节点连

29、接类型节点字段= INCOME交叠= RISK选项条目中:指定范围 30000 到 5000077Statistics输出输出节点节点打开:Statistics输出.str使用 Statistics 输出节点,可以调用 Statistics 过程来分析 SPSS Modeler 数据。用此节点,必须在计算机上安装并许可使用 Statistics。 78第六章第六章 复杂数据处理技术复杂数据处理技术内容合并多个数据源数据抽取样本,选择和缓存数据处理缺失数据处理日期处理时序数据文件操作79合并多个数据源数据内容:使用追加节点串联包含相似字段的记录集的文件使用合并节点把不同数据源的信息加入到现有数据

30、源使用超级节点简化数据流区域的内容数据:accounts97.txt, accounts98.sav, customer.dat80追加文件追加文件使用变量文件节点读入文件accounts97.txt确定选中“从文件读取字段名”使用Statistics文件节点读入文件accounts98.sav使用追加节点连接两个数据源节点使用制表节点分别输出表格81合并文件合并文件使用变量文件节点读入文件customer.dat确认选中从文件读取字段名分隔符选中制表符,取消逗号分隔符使用合并节点连接变量文件节点和追加节点选中按照关键字段包括匹配和不匹配记录使用制表节点输出表格82合并方法合并方法按照顺序合并

31、数据:如每一输入的第n 个记录被合并生成第n 个输出记录。只要任一记录缺少匹配的输入记录,则不会生成任何输出记录。按照关键字段合并数据:如果某一关键字段值不止一次的出现,则返回所有可能的组合。只包括匹配记录(内部合并)包括匹配和不匹配记录(完全外部合并)包括匹配和选中的不匹配记录(部分全外部合并)包括第一个数据集中且不与其它数据集匹配的记录(反向合并)合并相同的关键字段:每个输出字段都有不同的字段名83超级节点简化数据流超级节点简化数据流超级节点在流中用星型图标表示,图标的明暗程度表示超级节点的类型和流的方向(流向或者流出)总共有三种类型的超级节点: 源超级节点 过程超级节点 终端超级节点84

32、超级节点超级节点规则两个选中的节点之间必须有路径通过。一个完整的流不能压缩为一个超级节点。要压缩的部分流不能包括分叉路径(每个分叉路径包含终端节点除外)。操作创建超级节点编辑超级节点保存超级节点85抽取样本,选择和缓存数据抽取样本,选择和缓存数据内容:使用抽样和选择节点抽取样本使用分割节点分割数据为训练和测试样本使用缓存数据加速数据处理目的:介绍一系列对数据进行预处理的方法86使用抽样节点抽取样本使用抽样节点抽取样本使用抽样节点连接变量文件节点设定抽样节点选项包括样本random值为60设定随机种子数54321使用制表节点输出表格87使用导出、选择节点抽取样本使用导出、选择节点抽取样本使用导出

33、节点连接变量文件节点导出字段flag规则random0 (2) 使用分布节点连接导出节点选择字段flag输出分布图使用选择节点连接导出节点条件flag=0 88使用使用分区节点分区节点分割样本分割样本使用分区节点连接数据文件节点选择分成两部分:训练与测试设定随机种子123456使用分布节点连接分区节点选择字段分区输出分布图89数据缓存数据缓存为了最优化的执行,用户可以对任何没有结束的节点建立一个缓存。当对一个节点建立一个缓存的时候,缓存区会被下一次执行数据流时要通过节点的数据所填满。以后数据就从该缓存区中读取而不是从数据源中读取。缓存的主要作用:避免预处理过程的重复,提高速度冻结样本,例如导出

34、和分区节点中使用随机函数选择样本90使用使用缓存缓存启用缓存带有缓冲区的节点能够以一个小的文件图标被显示在右上角。当数据在节点处被缓存时,这个文件图标是绿色的。刷新缓存保存缓存以Statistics文件的形式来保存一个缓存区的内容读取缓存可以通过Statistics文件节点在流中读入可以恢复到最初生成缓存的节点91处理缺失数据处理缺失数据内容:使用审核节点产生过滤和选择节点包含和排除具有缺失数据的字段和记录使用填充节点删除空白使用类型节点自动检查空白处理缺失数据的建议目的:这一章引入一系列方法处理缺失数据数据:数据文件SmallSampleMissing.txt92使用审核节点使用审核节点提高

35、数据质量提高数据质量使用可变文件节点读入数据SmallSampleMissing.txt 确定选中“读取字段名”使用类型节点连接变量文件节点CHILDREN值99设定空白使用制表节点输出表格使用审核节点93生成选择节点和过滤节点生成选择节点和过滤节点审核节点产生菜单生成选择节点和过滤节点,插入类型节点和制表节点之间使用制表节点输出表格生成选择节点选择带有至少一个缺失值的记录生成过滤节点过滤带有缺失值的字段94数据流和输出数据流和输出95使用填充节点移除空白使用填充节点移除空白三个填充节点插入类型节点和制表节点之间字段CHILDREN替换为0字段INCOME替换为23407 字段SEX 替换为“

36、unknown”使用制表节点输出表格使用审核节点填充96自动检查缺失和超出边界的值自动检查缺失和超出边界的值类型节点包含一种自动检查过程,自动检查数据是否符合当前的类型和边界设置。检查过程会忽略空白自动检查设置:无,无效,强制,丢弃,警告,中止强制设置选项97处理缺失数据的建议处理缺失数据的建议使用生成的选择节点丢弃有问题的记录使用生成的过滤节点丢弃有问题的字段使用填充节点填充值使用自动检查强制或丢弃不合规定的值可以用预测模型(例如神经网络)导出的值填充缺失值98处理日期处理日期内容:介绍如何设定流中的日期格式介绍日期函数处理涉及日期字段的计算介绍如何使用导出节点的多重模式目的:这一章我们介绍在SPSS Modeler中如何处理日期字段数据:fulldata.txt,MultDate.txt99在在SPSS Modeler中中指定日期格式指定日期格式100计算时间长度计算时间长度使用变量

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论