SPSS数据处理第二讲_第1页
SPSS数据处理第二讲_第2页
SPSS数据处理第二讲_第3页
SPSS数据处理第二讲_第4页
SPSS数据处理第二讲_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、罗伟罗伟广西师范学院教育科学学院广西师范学院教育科学学院 Email:Email:TelelPSS数据处理数据处理第二讲第二讲 SPSS数据的预处理数据的预处理收集到的数据资料在进入正式统计分析之前,收集到的数据资料在进入正式统计分析之前,首先要做必要的首先要做必要的预处理预处理,以,以修正、剔除修正、剔除部分部分不合格数据不合格数据,转换部分数据;抽取部分样本,转换部分数据;抽取部分样本参与分析;选取部分变量参与分析等。参与分析;选取部分变量参与分析等。本次课的教学目标本次课的教学目标熟练掌握以下技术:熟练掌握以下技术:数据的排序;数据的排

2、序;SPSSSPSS文件数据的纵向与横向合并;文件数据的纵向与横向合并;变量计算;变量计算;数据选取;数据选取;分类汇总;分类汇总;数据分组;数据分组;数据转置与加权处理;数据转置与加权处理;1、数据的排序、数据的排序数据排序的作用数据排序的作用便于数据浏览,了解数据取值状况,缺失值数量便于数据浏览,了解数据取值状况,缺失值数量多少等;多少等;快捷找到最大值、最小值,计算出全距,初步了快捷找到最大值、最小值,计算出全距,初步了解数据离散程度;解数据离散程度;快捷发现异常值。快捷发现异常值。数据的排序数据的排序单值排序与多重排序单值排序与多重排序单值排序:排序变量只有一个单值排序:排序变量只有一

3、个多重排序:排序变量有多个多重排序:排序变量有多个 多重排序时,数据首先按主排序变量值的大多重排序时,数据首先按主排序变量值的大小次序排序,然后对那些具有相同主排序变量值小次序排序,然后对那些具有相同主排序变量值的数据,再按照第二排序变量值的次序排序,依的数据,再按照第二排序变量值的次序排序,依此类推。此类推。数据的排序数据的排序数据排序的基本操作数据排序的基本操作Data-Sort Cases说明:说明:1 1,数据排序是整行数据排序,而不是只对某列,数据排序是整行数据排序,而不是只对某列变量排序变量排序2 2,多重排序中指定排序变量的次序很关键,可,多重排序中指定排序变量的次序很关键,可以

4、在按某个变量值升序的同时,再按其他变量值以在按某个变量值升序的同时,再按其他变量值的降序排列。的降序排列。3 3,数据排序后,原有排列次序必然被打乱,注,数据排序后,原有排列次序必然被打乱,注意保留数据原始排列顺序。意保留数据原始排列顺序。练习时间练习时间 ,可练习数可练习数a2-2,a2-2,其他数据其他数据亦可。亦可。2、SPSS数据文件的合并数据文件的合并纵向合并:纵向合并:Data-Merge File-Add Cases 为为方便方便SPSSSPSS数据文件的纵向合并,不同数据数据文件的纵向合并,不同数据文件中数据含义相同的数据项,最好起相同文件中数据含义相同的数据项,最好起相同的变

5、量名,且数据类型也最好相同,这样将的变量名,且数据类型也最好相同,这样将大大简化操作过程中的参数的选择,利于大大简化操作过程中的参数的选择,利于SPSSSPSS对变量的自动匹配。含义不同的数据项对变量的自动匹配。含义不同的数据项其变量名最好不要同名,否则会给数据合并其变量名最好不要同名,否则会给数据合并过程带来许多麻烦。过程带来许多麻烦。SPSS数据文件的合并数据文件的合并横向合并横向合并Data-Merge File-Add VariablesData-Merge File-Add Variables注意:第一,两个数据必须至少有一个名称相同的变量,该变量是两个数据文件横向拼接的依据,称为关

6、键变量,如职工号、商品代号等。第二,两个数据文件都必须事先按照关键变量进行升序排序第三,为方便SPSS数据文件的横向合并,不同数据文件中数据含义不相同的数据项,变量名不应相同。横向合并横向合并Both files provide cases指合并后的数据由原来指合并后的数据由原来两个数据文件共同提供两个数据文件共同提供,即由原来两个数据文件中的即由原来两个数据文件中的个案共同组成合并后的数据文件个案共同组成合并后的数据文件;External file is keyed table指在数据编辑窗口数指在数据编辑窗口数据基础上,将第二个数据文件中的其他变量合并进据基础上,将第二个数据文件中的其他变

7、量合并进来来,即合并后数据文件中的个案仅是当前数据编辑窗即合并后数据文件中的个案仅是当前数据编辑窗口中的个案口中的个案;Working data file is keyed table指在第二个数据指在第二个数据文件基础上文件基础上,将数据编辑窗口中的其他变量合并进来将数据编辑窗口中的其他变量合并进来,即合并后数据文件中的个案仅是第二个数据文件中即合并后数据文件中的个案仅是第二个数据文件中的个案的个案.练习时间 ,练习,练习a2-1a2-1和和a2-2a2-23、变量计算、变量计算数据转换处理数据转换处理转换数据的原有分布转换数据的原有分布SPSS变量计算是在原有数据的基础上,根变量计算是在原

8、有数据的基础上,根据用户给出的据用户给出的SPSS算术表达式以及函数,算术表达式以及函数,对所有个案或满足条件的部分个案,计算产对所有个案或满足条件的部分个案,计算产生一系列新变量。生一系列新变量。变量计算算术表达式算术表达式由常量、变量、算术运算符(由常量、变量、算术运算符(+、/、)、圆括号、函数等组成的式子)、圆括号、函数等组成的式子如:如:“平均成绩平均成绩”(语文(语文+数学)数学)/2变量计算变量计算条件表达式:条件表达式: 简单条件表达式:由关系运算符(、简单条件表达式:由关系运算符(、)、常量、变量以及算术表达式等组成的式子。)、常量、变量以及算术表达式等组成的式子。如:如:n

9、l 35 表示年龄大于表示年龄大于35岁。岁。 复合条件表达式:复合条件表达式: 又称逻辑表达式,是由逻辑运算符(又称逻辑表达式,是由逻辑运算符(&或或and; | 或或or;或或not )、圆括号和简单条件表达式等组成的式子。)、圆括号和简单条件表达式等组成的式子。 如:(如:(nl 35)and not (zc 3) 表示年龄小于等于表示年龄小于等于35岁并且职称不低于岁并且职称不低于3。变量计算SPSS函数函数变量计算的基本操作变量计算的基本操作Transform-Compute如果用户希望对符合一定条件的个案进行变如果用户希望对符合一定条件的个案进行变量计算,则单击量计算,则单

10、击 if按钮,选择按钮,选择“Include if case satisfies condition”应用举例应用举例“平均成绩平均成绩”(语文(语文+数学)数学)/2“平均成绩平均成绩”(语文(语文+数学)数学)/2 if 年龄年龄=16练习时间1 1、以、以“nvp”为变量名计算为变量名计算“性别性别” 为为“女女”的学生的的学生的“平均成绩平均成绩”。2 2、计算性别为、计算性别为“男男”并且并且“年龄年龄”为为1616岁以岁以上的同学的平均成绩。上的同学的平均成绩。4、数据选取、数据选取数据选取:数据选取:根据分析的需要,从已收集到的大批量数据(总体)根据分析的需要,从已收集到的大批量

11、数据(总体)中按照一定的规则抽取部分数据(样本)参与分析中按照一定的规则抽取部分数据(样本)参与分析的过程,通常也称为样本抽样。的过程,通常也称为样本抽样。可以提高数据分析效率可以提高数据分析效率可以把抽取的数据用于建模,剩余的数据用于检验可以把抽取的数据用于建模,剩余的数据用于检验模型模型一旦数据被选取后,后面的分析操作只针对选出的一旦数据被选取后,后面的分析操作只针对选出的数据进行,直到用户取消这种选取为止。数据进行,直到用户取消这种选取为止。数据选取数据选取Data-select cases数据选取数据选取的基本方式数据选取的基本方式1,按指定条件选取。,按指定条件选取。If condi

12、tion is satistiedUnselected cases are Filtered deleted2,随机抽样:,随机抽样:Random sample of cases近似抽样近似抽样Approximately _%of all cases精确抽样精确抽样Exactly_cases from the first _ cases3、选取某一区域内的样本、选取某一区域内的样本Based on time or case range4、通过过滤器选取样本、通过过滤器选取样本Use filter variable要求制定一个变量作为过滤变量。变量值为要求制定一个变量作为过滤变量。变量值为非非0

13、或非系统缺失值的个案将被选中。或非系统缺失值的个案将被选中。数据选取练习练习一:把练习一:把a3中中 “ 性别为女性性别为女性” 个案数据选个案数据选取出来。取出来。练习二:把练习二:把“语文成绩语文成绩80分以上分以上” 个案数据选个案数据选取出来。取出来。练习三:把练习三:把“年龄是年龄是16岁岁”个案数据选取出来。个案数据选取出来。5、分类汇总、分类汇总分类汇总:分类汇总:按照某分类进行汇总计算。按照某分类进行汇总计算。SPSS实现分类汇总涉及两个主要方面实现分类汇总涉及两个主要方面按照哪个变量进行分类按照哪个变量进行分类对哪个变量进行汇总,并指定对汇总变量计对哪个变量进行汇总,并指定对

14、汇总变量计算哪些统计量。算哪些统计量。分类汇总分类汇总基本操作分类汇总基本操作Data-Aggregate多重分类汇总多重分类汇总应用举例应用举例将将a3中年龄作为分组变量,计算语文、数学中年龄作为分组变量,计算语文、数学的均值。的均值。分类汇总练习将将a3中性别作为分组变量,计算语文、数学中性别作为分组变量,计算语文、数学的均值。的均值。6、数据分组、数据分组数据分组:数据分组:根据统计研究的需要,将数据按照某种标准根据统计研究的需要,将数据按照某种标准重新划分为不同的组别。重新划分为不同的组别。1)组距分组)组距分组2)分位数分组)分位数分组数据分组数据分组1)组距分组:)组距分组:Tra

15、nsform- Recorde确定分组数的经验公式:确定分组数的经验公式:K=1+(lgn/lg2)作为实际中的参考作为实际中的参考(1)指定分组变量)指定分组变量(2)定义分组区间:)定义分组区间:不重不漏不重不漏(3)指定存放分组结果的变量)指定存放分组结果的变量7、数据转置、数据转置数据转置数据转置Data - Transpose应选择一个取值唯一的变量(如职工号)作应选择一个取值唯一的变量(如职工号)作为标记变量并放到为标记变量并放到Name Variable框中。框中。例:把例:把“a3-1”文档中的数据转置。文档中的数据转置。练习将其他数据转置。将其他数据转置。3.7 数据加权数据加权计算某天菜市场蔬菜销售的平均价格,不可计算某天菜市场蔬菜销售的平均价格,不可以用各种蔬菜销售价格的平均值,还应该考以用各种蔬菜销售价格的平均值,还应该考虑每种蔬菜的销售量。虑每种蔬菜的销售量。加权处理:加权处理:Data-Weight Cases一旦指定加权,以后分析中加权一直有效直一旦指定加权,以后分析中加权一直有效直到取消加权为止。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论