第3章变量级别的数据管理_第1页
第3章变量级别的数据管理_第2页
第3章变量级别的数据管理_第3页
第3章变量级别的数据管理_第4页
第3章变量级别的数据管理_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第3章变量级别的数据管理3.1变量赋值3.2已有变量的分组合并3.3连续性变量的离散化3.4变量的自动重编码与数值移动3.5转换菜单中的其他功能数据管理针对同一个研究目的,往往要从不同的侧面对数据进行研究,采取多种统计方法进行分析,而不同的统计方法对数据文件结构的要求不尽相同,这就需要对数据文件结构进行重新调整或转换,以便适合于响应的统计方法使用在SPSS中,数据、文件的管理功能主要集中在“转换”和“数据”两个菜单中。转换——实现变量级别的数据管理,主要与变量数值的转换有关数据

——实现文件级别的数据管理,如文件合并、拆分等3.1变量赋值变量赋值:在原有数据的基础上,根据用户要求,使用SPSS算数表达式及函数,对所有记录或满足SPSS条件表达式的某些记录进行四则运算,并将结果存入一个用户指定的变量中。该指定变量可以是一个新变量,也可以是一个已经存在的变量变量赋值是极为常用的操作,大致可占数据管理操作的一半以上3.1.1常用基本概念在变量转换过程中,应根据实际需要,指出要按照什么方法进行变量转换,这里的方法一般以SPSS算数表达式的形式给出1.算数表达式SPSS算数表达式(NumericExpression)是由常量、SPSS变量名、SPSS算术运算符、圆括号等组成的式子,参与运算的数据类型和最终结果均为数值型,字符型、日期型变量和常量则要先进行函数转换然后才能参与运算算术表达式中的运算符由+、-、*、/、**(乘方)构成,运算顺序以及括号的使用均遵循四则运算法则3.1.1常用基本概念根据函数功能和处理对象的不同,可以将SPSS函数分成8类,分别是算术函数、统计函数、分布函数、逻辑函数、字符串函数、日期时间函数、缺失值函数和其他函数2.函数函数的具体书写形式:函数名(参数),这里,函数名是系统已经规定好的。圆括号中的参数有时是一个,也可以是多个;参数的类型有时是常量(字符型常量应用单引号括起来),也可以是变量名或SPSS的算术表达式。此外,函数中如果有多个参数,各参数之间要用单字符逗号“,”隔开3.1.1常用基本概念3.条件表达式与逻辑表达式通过SPSS的算数表达式和函数对所有记录进行计算时会得到一个结果,如果仅希望对部分记录进行计算,则应当利用SPSS的条件表达式指定对哪些记录进行计算。根据实际需要构造条件表达式之后,SPSS将对条件表达式进行计算得到一个逻辑常量(真或非真),然后从所有记录中自动挑出满足该条件的记录,然后再对它们进行计算处理在SPSS中条件表达式常用的关系运算符由以下几种:<><=>==~=(不等于,NE)除了条件表达式外,在SPSS中还会使用到逻辑表达式,其作用和赋值类型均类似于条件表达式,只是会用到以下3个逻辑运算符:&|~,分别表示AND、OR、NOT3.1.2“计算变量”对话框3.1.2“计算变量”对话框“目标变量”文本框:用于输入需要赋值的变量,在输入变量后,下方的“类型与标签”按钮就会变黑,可以在这里对变量进行具体的定义,但在大多数情况下都是不需要的“候选变量列表”:位于“目标变量”文本框下方“数字表达式”文本框:用于给目标变量赋值“软键盘”“函数列表”:分为“函数组”列表框、“函数和特殊变量”和函数解释文字文本框

“如果”:用于对个案筛选条件进行设定,默认选中“包括所有个案”单选按钮,入股需要进行个案筛选,则可以更改为“如果个案满足条件则包括”,然后再下方的表达式文本框中输入相应筛选条件即可3.1.3案例:年龄变量的分组例3.1:CCSS项目中的受访者年龄为18-64岁,分析时将其分为18-34、35-54、55-64三组。为了便于使用,年龄变量S3被重新赋值后将会保存为新变量TS3,其取值1、2、3分别代表上述3种情况3.2已有变量值得分组合并在数据分析中,将连续变量转变为等级变量,或者将分类变量不同的变量等级进行合并是常见的工作,通过变量重编码可以很好地完成这一类任务“重新编码为相同变量”:对原始变量进行直接重编码,替换原数值“重新编码为不同变量”:根据原始变量的取值生成一个新变量来记录重编码结果上述两个过程除了输出目标不同之外,其余功能非常类似3.2.1对连续性变量进行分组合并转换重新编码为不同变量3.2.1对连续性变量进行分组合并转换重新编码为不同变量3.3连续性变量的离散化可视离散化过程最优离散化过程3.3.1可视离散化过程可视离散化过程:用于在可视界面下将连续变量进行分段,在该过程中可以使用百分位数、标准差范围或者等间距方式将连续性变量划分为若干组段,并采用图形化操作方式,非常直观例3.2:将S3年龄变量分为10组,要求等间距3.3.1可视离散化过程3.3.1可视离散化过程3.3.2最优离散化过程最优离散化过程:当模型中的因变量为分类变量时,在分析中往往会对自变量进行离散化(分类化),此时就可以使用该过程。若最终目标是生成预测模型,则“最优离散化”的效果一般会优于可视离散化例3.3利用S3变量对S4学历进行预测建模,要求基于对S3进行最优离散化3.4变量的自动重编码与数值移动3.4.1变

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论