spss初中级第三章数据预处理_第1页
spss初中级第三章数据预处理_第2页
spss初中级第三章数据预处理_第3页
spss初中级第三章数据预处理_第4页
spss初中级第三章数据预处理_第5页
已阅读5页,还剩91页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章 SPSS数据的预处理数据的排序变量计算数据选取计数分类汇总数据分组数据预处理的其他功能第一节数据的排序数据排序的目的数据排序的基本操作数据排序的应用举例数据排序的目的SPSS数据排序是将数据编辑窗口按照某个或多个指定变量的变量值升序或降序重新排列。排序目的便于数据的浏览,了解数据的取值状况、缺失值数量等快捷找到数据的最大值和最小值快捷发现数据的异常值数据排序的基本操作(以职工数据.sav为例)菜单数据排序个案以职称主排序变量升序、工资收入第二排序变量升序为排序依据数据排序应用举例(居民储蓄调查数据.sav)练习把年人均消费支出和教育.sav中的数据按照年人均可支配收入为主排序变量进行降序排列,教育支出为第二排序变量进行降序排列。第二节变量计算变量计算的目的SPSS算术表达式条件表达式函数变量计算的基本操作变量计算的目的数据的转换处理对数据的原有分布状态进行转换SPSS变量计算后会得到一系列新变量,需注意:变量计算针对所有个案的,每条个案都有自己的计算结果。变量计算的结果应保存到一个指定变量中,该变量的数据类型与计算结果的数据类型要一致。SPSS算术表达式由常量、变量、算术运算符、圆括号、函数等组成的式子条件表达式简单条件表达式由关系运算符、常量、变量以及算术表达式等组成的式子复合条件表达式由逻辑运算符号、圆括号和简单条件表达式等组成的式子。函数算术函数统计函数分布函数逻辑函数字符函数日期函数缺失值函数其他函数变量计算的基本操作(以职工数据.sav为例)菜单【转换】【计算变量】第三节数据选取数据选取:即为样本抽样。目的:提高数据分析效率检验模型的需要按指定条件抽样随机抽样选取某一区域内的样本通过过滤变量选取样本SPSS中四种抽样方法四种抽样方法菜单【数据】【选择个案】按指定条件抽样随机抽样基于时间或个案全距通过过滤变量选取样本第四节计数SPSS计数是指对所有个案或满足其条件的部分个案,计算若干个变量中有几个变量的值落在特定的区间内,并将计数结果存入一个新变量中的过程。关键步骤指定哪些变量参与计数,计数的结果存入哪个变量中。指定计数区间单个变量值系统缺失值系统缺失值或用户缺失值

给定最大值和最小值的区间小于等于某指定值的区间

大于等于某指定值的区间计数区间计数的基本操作以居民储蓄调查数据(存款).sav为例菜单【转换】

【对个案内的值计数】以学生成绩.sav为例对两门课中成绩在优良以上(分数大于等于80分)的计数第五节分类汇总分类汇总是按照某分类进行的汇总计算。SPSS实现分类汇总需要明确:按照哪个变量进行分类对哪个变量进行汇总,并指定对哪些统计量进行计算分类汇总的基本操作菜单【数据】 【分类汇总】指定分类变量指定汇总变量单击函数按钮获得指定分类结果保存到何处单击变量名与标签得到若要保存各分类组的个案数分类汇总后的结果练习将数据文件商品房购买意向调查模拟数据.sav进行分类汇总。要求按照居住类型对月住房开销进行分类汇总。并计算其均值和标准差,保存各分类组的个案数,将保存结果选择为:创建只包含汇总变量的新数据集。第六节数据分组数据分组就是根据统计研究的需要,将数据按照某种标准重新划分为不同的组别。分组目的对数值型数据进行整理和粗略把握数据分布情况在数据分组基础上对数据进行频数分析实现数据的离散化处理SPSS的数据分组方法单变量值分组组距分组分位数分组单变量值分组SPSS单变量值分组是把每一个变量值作为一组,这种分组方法通常只适合于离散变量且变量值较少的情况。基本操作菜单【转换】【自动重新编码】以职工数据.sav为例将分组变量基本工资(sr)选择到右边的框中在新名称后输入存放分组结果的变量名在重新编码的起点中选择是最低值进行还是最高值进行最低值表示升序,最高值表示降序组距分组组距分组是将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。在连续变量或变量值较多的情况下适用。分组关键分组数目的确定组数K=1+lgn/lg2 n为数据个数组距的确定

组距=(max-min)/k指定分组变量定义分组区间指定存放分组结果的变量SPSS分组操作应注意:基本操作一:【转换】【重新编码为相同变量】以职工数据.sav为例把分组变量基本工资(sr)选到数字变量中单击旧值和新值得到定义分组区间先指定区间范围,再在“值”中添加对应的分组基本操作二、菜单转换重新编码为不同变量将分组变量基本工资(sr)选入数字变量定义输出变量先指定区间范围,再在“值”中添加对应的分组练习现有数据集学生成绩.sav,要求对学生的数学成绩进行分组,分为5组,依次为:不及格(60分以下)、及格(60~70)、中(70~80)、良(80~90)、优(90分以上),且要求输出变量为math1,标签为

“分组后的数学成绩”。Spss的分位数分组各组的下限值和上限值有分位数决定,且分位数中的个案数大致相当。关键:分组数目,相应的分位数的确定分位数:是将全部数据按升序排序后并等分成n份后相应分位点上的变量值。基本操作:【转换】—【可视离散化】【要离散的变量】命名离散的变量上端点,采用“上组限不在内”的原则选择【基于已扫描个案的等百分位】确定【分割点数量】点【生成分割点】和【生成标签】Eg:职工数据按工资收入按四分位数进行分组。第七节数据预处理的其他功能数据转置加权处理数据拆分SPSS变量集数据转置(行列互换)以年人均消费支出和教育.Sav为例把变量和名称变量分别选入对应位置标记变量加权处理数据拆分以数据加工(职工数据).sav为例SPSS数据文件的合并

当数据量较多时经常会把一份大的数据分成几个小的部分,有几个录入员分别录入,以期加快数据录入速度,但一份完整的数据被分别存储在几个数据文件中,如果要分析这份数据就必须首先将若干个小的数据文件合并起来。要实现两个或多个

SPSS数据文件的合并,应首先将其中的某个数据文件读入数据编辑窗口中,然后依次与其他数据文件合并。合并的方式有两种:纵向合并和横向合并。纵向合并数据文件从外部数据文件中增加个案到当前数据文件中,称为纵向合并,相互合并的数据文件应该有相同的变量。步骤:打开一个数据文件;菜单:【数据】+【合并文件】+【增加个案】注意:有变量的Pair(配对)问题,新的活动数据集中的变量框中显示的变量名是两个数据文件中都有的变量名,非成对变量框中的变量名是两个文件中的不同变量名,其中变量名后面的*表示该变量是当前数据编辑窗口中的变量,+表示该变量是待合并文件中的变量。如果希望在合并后的数据文件中看出个案的来源,可以选择将个案来源表示为项将自动生成一个变量名为

source01取值0或1的变量。横向合并数据文件从外部数据文件增加变量到当前数据文件,称为横向合并,横向合并文件时要注意以下三个问题:1、相互合并的数据文件必须至少有一个名称相同的变量,该变量是两文件横向合作的依据,称为关键变量;2、两个数据文件都必须先按关键变量进行升序排列;3、不同数据文件中数据含义不相同的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论