SPSS数据的预处理_第1页
SPSS数据的预处理_第2页
SPSS数据的预处理_第3页
SPSS数据的预处理_第4页
SPSS数据的预处理_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章第三章 SPSSSPSS数据的预处理数据的预处理本章主要内容本章主要内容n1.数据文件的合并数据文件的合并n2.数据的排序数据的排序n3.数据的排秩数据的排秩n4.变量计算变量计算n5.数据选取数据选取n6.变量重编码变量重编码n7.加权加权n8.数据拆分数据拆分命令命令功能功能对变量操作的命令对变量操作的命令Define Variables定义与编辑变量属性定义与编辑变量属性Define Dates定义与编辑日期变量或日定义与编辑日期变量或日期时间变量期时间变量Templates定义与修改一个变量模板定义与修改一个变量模板Insert Variables插入变量插入变量对个案操作的命令

2、对个案操作的命令Insert Case插入个案插入个案Go to Case定位到指定的个案定位到指定的个案DataData菜单的各项命令菜单的各项命令对文件操作的命令对文件操作的命令Sort Cases按选定的变量对个案排序按选定的变量对个案排序Transpose对数据文件的转置对数据文件的转置Merge Files合并数据文件合并数据文件Aggregate对数据进行分类汇总对数据进行分类汇总进行分析前的处理命令进行分析前的处理命令Split File数据折分数据折分Select Cases数据选取数据选取Weight Cases数据加权数据加权DataData菜单的各项命令菜单的各项命令Tr

3、ansformTransform菜单的各项命令菜单的各项命令Compute变量计算变量计算Random Number Seed设定伪随机函数的随机种子设定伪随机函数的随机种子Count计数计数Recode重编码重编码Categorize Variables连续性变量自动分组连续性变量自动分组Rank cases数据排秩数据排秩Automatic RecordCreate Time Series生成时间序列变量生成时间序列变量Replace Missing Values缺省值替代缺省值替代一、数据文件合并一、数据文件合并n合并数据文件是指将外部数据中的个案合并数据文件是指将外部数据中的个案或变量

4、合并到当前的数据文件中去。或变量合并到当前的数据文件中去。n合并数据文件包括两种方式:合并数据文件包括两种方式:n从外部数据文件从外部数据文件增加个案增加个案到当前数据文到当前数据文件中。件中。纵向合并或称追加个案。纵向合并或称追加个案。n从外部数据文件从外部数据文件增加变量增加变量到当前数据文到当前数据文件中。件中。横向合并。横向合并。纵纵 向向 合合 并并n首先打开一个数据文件。首先打开一个数据文件。n按按Data Merge Files Add Cases顺序逐一单击鼠标,打开:顺序逐一单击鼠标,打开:Read File对话框对话框,依据需要选择文,依据需要选择文件,然后进入件,然后进入

5、Add Cases From对对话框话框,选择相应的选项或做适当的,选择相应的选项或做适当的修改即可。修改即可。纵纵 向向 合合 并并纵纵 向向 合合 并并横横 向向 合合 并并n横向合并有两种方式:横向合并有两种方式:n从一个指定的外部数据文件中取得一个或从一个指定的外部数据文件中取得一个或几个变量的数据(包括变量名称)增加到几个变量的数据(包括变量名称)增加到 当前工作数据文件中,实际上相当于两个当前工作数据文件中,实际上相当于两个数据文件的横向合并。数据文件的横向合并。n按关键变量合并,即要求两个数据文件必按关键变量合并,即要求两个数据文件必须有一个共同的关键变量,而且这两个文须有一个共

6、同的关键变量,而且这两个文件中的关键变量还存在一定数量的相同值件中的关键变量还存在一定数量的相同值的个案。的个案。横向合并的具体操作横向合并的具体操作n首先打开一个数据文件。首先打开一个数据文件。n按按Data Merge Files Add Variables顺序逐一单击鼠标,打开顺序逐一单击鼠标,打开Add Variables :Read File对话框,对话框,依据需要选择相应的选项或做适当依据需要选择相应的选项或做适当的修改即可。的修改即可。横向合并横向合并二、数据的排序二、数据的排序n首先在数据窗中建立或读入一首先在数据窗中建立或读入一个数据文件。个数据文件。n按按Data Sort

7、 Cases顺序逐一顺序逐一单击鼠标键,打开单击鼠标键,打开Sort Cases个个案排序对话框。案排序对话框。n依据需要进行选择,然后单击依据需要进行选择,然后单击OK按纽即可。按纽即可。数据的排序数据的排序在左边的在左边的源变量框源变量框中中选择排序变量进入选择排序变量进入Sort by框框。如果选择。如果选择2个以上的变量,个案个以上的变量,个案的排序结果与排序变的排序结果与排序变量在量在Sort by框中的顺框中的顺序有关。列于首位的序有关。列于首位的为第一排序变量。为第一排序变量。在在Sort Order 栏栏内选择排序内选择排序方式方式升序升序与降序与降序三、数据的排秩三、数据的排

8、秩n运用运用Transform 命令实现。求得的秩在数命令实现。求得的秩在数据窗中建立一个新变量来保存。据窗中建立一个新变量来保存。n具体操作方法:具体操作方法:n按按Transform Rank Cases顺序逐一单顺序逐一单击鼠标键,打开击鼠标键,打开Rank Cases对话框。对话框。n依据需要进行选择,然后单击依据需要进行选择,然后单击OK按纽即按纽即可。新生成的秩变量的名称以原变量名称可。新生成的秩变量的名称以原变量名称前加字母前加字母“R”的形式出现在数据文件中。的形式出现在数据文件中。变量值排秩变量值排秩变量值排秩的选项说明变量值排秩的选项说明n在在Assign rank 1 t

9、o 栏中可选择秩的排列方式。栏中可选择秩的排列方式。n如选择一个或多个分组变量进入如选择一个或多个分组变量进入By栏,系统将按栏,系统将按By变量分组排秩。变量分组排秩。n当所选择的变量具有相同值时称为当所选择的变量具有相同值时称为Tie(结),其结),其秩次的决定原则可以在秩次的决定原则可以在Rank Cases:Ties对话框对话框中指定。中指定。n在在Rank Type中可以选择获得秩次的其他方法。中可以选择获得秩次的其他方法。nDisplay summary Tables 复选项为默认选择,复选项为默认选择,表示要在输出结果窗中显示新变量的名称、标签、表示要在输出结果窗中显示新变量的名

10、称、标签、秩类型等总结性信息。秩类型等总结性信息。四、变量计算四、变量计算n利用菜单利用菜单“Transform”下的下的“Compute”命令实现数据的变换和计算命令实现数据的变换和计算n利用菜单利用菜单“Transform”下的下的“Compute”命令,可以完成以下工作:命令,可以完成以下工作:n1.计算数值或字符型变量的值计算数值或字符型变量的值n2.创建新的变量或取代已存在的变量,对创建新的变量或取代已存在的变量,对于新的变量,依然可以定义于新的变量,依然可以定义n3.可以利用已建立的函数进行变量的计算可以利用已建立的函数进行变量的计算和转换和转换创建新的变量创建新的变量创建新的变量

11、对话框创建新的变量对话框五、数据选取五、数据选取n目的:选择需要进行分析的个案目的:选择需要进行分析的个案n方法:方法:n1.按指定条件选取(按指定条件选取(If condition is satisfied)n2.随机选取(随机选取(Random sample of cases)n3.选取某一区域内的个案(选取某一区域内的个案(Based on time or case range)n4.通过过滤变量选取(通过过滤变量选取(Use filter variable)六、变量重编码六、变量重编码重编码的步骤及两种方式重编码的步骤及两种方式:(1)Into Same Variables ;(;(2

12、) Into Different Variables.重编码的应用重编码的应用n定距层次的变量,希望输出频次分布表定距层次的变量,希望输出频次分布表时,常常需要进行分组,这时可以利用时,常常需要进行分组,这时可以利用重编码。重编码。n当采用量表来进行测量,而量表中变量当采用量表来进行测量,而量表中变量取值有正反两种方向的设置,需要转化取值有正反两种方向的设置,需要转化为同一方向时,常常需要重编码。为同一方向时,常常需要重编码。第一种方式重编码第一种方式重编码If Case 对话框对话框n用于设置变量重编码的条件Old and New Values对话框对话框n设置旧设置旧变量转变量转变为新变为

13、新变量的变量的对应方对应方式式第二种方式重编码第二种方式重编码n第二种重编码方式需第二种重编码方式需要在要在Output Values中定义新变中定义新变量的变量名与变量标量的变量名与变量标签。签。n第二种重编码方式中第二种重编码方式中 If 和和 Old and New Values按钮展开的按钮展开的对话框形式与结构、对话框形式与结构、内容是一样的。内容是一样的。七、对变量加权处理七、对变量加权处理n在计算的过程中需要利用变量对在计算的过程中需要利用变量对数据进行加权处理时采用。数据进行加权处理时采用。n加权处理的具体方法:加权处理的具体方法:n按按DataWeight Cases,打开,

14、打开Weight Cases对话框,依据需要对话框,依据需要进行适当的选择即可。进行适当的选择即可。对变量进行加权处理对变量进行加权处理对个案加权处理对个案加权处理n在选择加权变量时应注意:在选择加权变量时应注意:n加权变量中含有零、负数或缺省值的个加权变量中含有零、负数或缺省值的个案将被排除在分析之外。案将被排除在分析之外。n分数值有效。分数值有效。n一旦对数据进行了加权处理,那么在以一旦对数据进行了加权处理,那么在以后的分析中加权处理一直有效,直到关后的分析中加权处理一直有效,直到关闭加权处理过程或选择其他的加权变量闭加权处理过程或选择其他的加权变量进行加权处理。进行加权处理。八、数据拆分

15、八、数据拆分n在进行数据处理时经常要对数据文件中在进行数据处理时经常要对数据文件中的变量进行分组分析,如分性别的平均的变量进行分组分析,如分性别的平均分数。进行分析之前必须对分数。进行分析之前必须对 数据文件进数据文件进行拆分。行拆分。n拆分分件并不是将一个数据文件分为两拆分分件并不是将一个数据文件分为两个或几个独立的数据文件,而是在同一个或几个独立的数据文件,而是在同一个数据文件中按某个条件分组。这种拆个数据文件中按某个条件分组。这种拆分在以后的运算中一直有效直到取消或分在以后的运算中一直有效直到取消或更改拆分变量。更改拆分变量。拆分数据文件的具体操作拆分数据文件的具体操作n读取一个数据文件。读取一个数据文件。n按按Data Split Files顺序逐一单击顺序逐一单击鼠标,打开鼠标,打开Split Files对话框对话框。n根据对数据的具体需要选择相应的根据对数据的具体需要选择相应的选项。选项。n按按Ok完成。完成。拆分数据文件拆分数据文件其他处理方法: 计数nTransformcount (横向计数,对满足条件或落在某些区间内的变量进行计数,产生新的变量)n计数区间(6种选择-注意缺失值如何统计)n思考1:有多少人认为今后两年内收入会增加?n思考2:假如对某班级学生6门课程有三门优以上的同学进行统计。分类汇总n操作:Dataaggregaten按哪个

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论