




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第2章 数据文件的建立与操作,1.数据文件的建立 2.数据的编辑 3.数据文件的操作 4.变量级别的数据管理,1.数据文件的建立,建立SPSS数据文件是利用SPSS进行数据管理和统计分析的首要工作。用于分析的数据资料有两种,一种是原始资料,需要将它们录入进SPSS软件,建立数据文件;另一种是己经被录入为其他数据格式的资料,需要将其内容导入到SPSS中。,1.1 数据文件的特点 1.2 定义变量 1.3 录入数据 1.4 外部数据的导入,1.1 数据文件的特点,SPSS数据文件是一种有结构的数据文件,它由数据结构和数据内容两部分组成,其中结构部分用于定义数据类型、宽度、缺失值等,而内容才是我们具
2、体要分析的数据。 SPSS数据文件的扩展名是.sav,对每个变量及相关属性的描述就是SPSS 数据文件的结构,数据,变量名,因此SPSS中建立数据文件的步骤包括两项工作: 定义数据文件结构(定义变量) 录入SPSS数据,属性,变量,1.2 定义变量,可以使用File菜单中的New命令来建立一个数据文件,也可以在启动SPSS时选择Type in data选项输入新的数据文件。 在数据编辑窗口(SPSS Data Editor)中点击左下端的Variable View标签变量窗口。,在Variable View中,定义变量的属性。 SPSS中的变量有十个属性: 变量名(Name)变量类型(Type
3、) 变量宽度(Width)小数点的位数(Decimals) 变量名标签(Label)变量值标签(Values) 缺失值(Missing)列的显示宽度(Columns) 对齐方式(Align)测(计)量尺度(Measure) 要定义一个变量时,至少要定义变量名和变量类型。,变量名(Name),变量名是变量参与分析的唯一标志,定义变量结构时首先应给出每个变量的变量名。否则,系统默认为var00001、var00002、var00003等。为变量命名要遵循一定的规则。 长度少于64个字符(32个汉字),可以用汉字 要唯一,不区别大小写字符,将FAN与fan看作同一个变量 尽量见名识义 不符合规则系统
4、会给出提示,变量类型(Type) (包括Width与Decimals),SPSS的变量类型(Type)共有3种:数值型、字符型和日期型。数值型变量按不同的要求共分为标准型、逗号型、圆点型、科学计数型、美元型和自定义货币型,系统默认的为标准数值型变量(Numerical)。 单击变量视图(Variable View)中的Type选项组,选项组中右侧会出现省略号按钮,单击该按钮,会弹出Variable Type(变量类型)对话框。,变量长度的系统默认值可以由主菜单的Edit中的Option中的Data窗口重新设置,字符数超过8个字符的字符型变量称为长字符型变量,等于或少于8个字符的称为短字符型变量
5、。 字符型变量不能参与运算,系统将同一字母的大、小写认为是两个不同的字符。,自定义货币型(Custom currency) SPSS提供5种自定义数值变量的类型。对应的自定义类型,系统自动命名为CCA、CCB、CCC、CCD、CCE型,系统默认为逗号数值型,如123456.78显示为123,456.78。 可以由主菜单的Edit中的Option中的Currency窗口定义常用的数值型变量。,例如,要定义人民币的输入格式,则在Prefix文本框中输入“¥”,在Suffix文本框中输入“元”,则在数据编辑窗口定义为CCA类型的数据中,输入1234,数据显示为“¥1,234元”。,测(计)量尺度(M
6、easure),统计数据是对客观现象计量的结果,按照对事物计量的精确程度,可将所采用的计量尺度由低级向高级分为:定类尺度、定序尺度、定距尺度、定比尺度。 Norminal 定类尺度是对事物的类别或属性的一种测度,按照事物的某种属性对其进行分类或分组。定类变量的特点是其值仅代表了事物的类别和属性,仅能测度类别差异,不能比较各类之间的大小,所以各类之间没有顺序或等级。 在SPSS中,能使用定类尺度的数据可以是数值型,也可以是字符型变量。必须符合穷尽和互斥的原则。穷尽的原则就是指每个个体都必须能归为一个类别,互斥的原则是指每个个体都只能归为一个类别。 相应变量为定类变量或(无序)分类变量。,Ordi
7、nal 定序尺度是对事物之间等级或顺序差别的一种测度。 定序尺度的特点是可以测度类别差,还可以测度次序差,但是定序尺度无法测出数据之间的准确差值,所以其计量结果只能排序,不能进行算术四则运算。 对定类尺度的变量只能计算频数和频率量。定序变量除可以计算频率之外,还可以计算累计频率。 相应变量为定序变量或有序分类变量。,Interval 定距尺度是对事物类别或次序之间间距的测度。定距变量的特点是其不仅能将事物区分为不同类型并进行排序,而且可准确指出类别之间的差距是多少。 测量结果往往表现为数值,所以计量结果可以进行加减运算。 Scale 定比尺度是能够测算两个测度值之间比值的一种计量尺度,它的测量
8、结果同定距变量一样也表现为数值,其与定距变量的差别在于有一固定的绝对“零点”,而定距变量则没有,定距变量中的“0” 并不表示“没有”,仅仅是一个测量值,而定比变量中的“0” 就真正表示“没有”。 定比变量是测量尺度的最高水平,它除了具有其他三种测量尺度的全部特点外,还具有可计算两个测度值之间比值的特点,因此它可进行加、减、乘、除运算,而定距变量只可进行加减运算。,由于定距尺度与定比尺度在绝大多数统计分析中没有本质上的差别,在SPSS中就将其合并为一类,统称为“Scale”测量尺度(间隔尺度)。 相应变量为间隔变量或连续性变量。 在这4种测量尺度之间,按照信息量的高低,可将高层次测量尺度的测量结
9、果转换为低层测量尺度的测量结果,但这样会损失一部分信息。不能将低层次的测量尺度转换为高层次测量尺度的结果,这样可能会引入错误的信息。 当输入的是数字时,系统默认的是Scale,当输入的是字符串时,系统默认的是Nominal。,变量名标签(Label)与变量值标签(Values),变量名标签(Label) 变量名标签是对变量名附加的解释说明,增加结果数据的可读性。由于早期版本的变量名不能超过八个字符,有时不能清楚地表达变量的含义,这时要靠变量名标签来对变量名加以解释。如果变量名有标签,系统在输出时以标签代替变量名输出。 变量值标签(Value) 是对变量的具体数值所代表的意义的标注。 大多数变量
10、值都是以符号或数字来表示的。但对于定类变量和定序变量,用数字或符号不能够很明确地表现出变量值的意义时,可以用变量值标签来说明它们所代表的实际意义。,定义完变量值标签后,在SPSS主窗口中,在菜单栏中选择View|Value Labels命令,则在SPSS主窗口中经过变量值标签定义的数值型变量显示为所定义的变量值。,缺失值(Missing),Missing项是一个重要而且容易被忽视的选项,它用于定义变量缺失值。 缺失值Missing,即错误的数据,对于没有测量到的和测量、记录、录入错的数值,在SPSS中可以处理成缺失值。 SPSS中缺失值有用户自定义缺失值和系统缺失值两大类。对于字符型变量,系统
11、默认的缺失值为空格。对数值型变量,系统默认的缺失值为一个圆点“.”。 用户可以自己定义缺失值。 例如对于性别变量正常值为1和2,但在录入时,0、3等是容易被录入的错误值。将其定义为缺失值后,系统将认为它们是非法值,在统计时会被剔除。,1.3 录入数据,定义了变量的各种属性后,回到Data View视图中,就可以直接在表中录入数据。在录入数据过程中可以点击Save或Save as作为数据文件保存。 按变量输入数据 按观测量输入数据 输入带有变量值标签的数据,1.4 外部数据的导入,为了在统计分析过程中能有效的利用其它软件产生的数据,SPSS软件编辑窗口除可以使用*.sav扩展名数据文件,还可以直
12、接打开和保存其它类型的数据文件。 读取Excel格式的文件 读取文本格式的文件,读取Excel格式的文件,以SPSS自带的文件demo.xIs为例,来看SPSS如何直接读取这个文件,该文件位于SPSS目录下的Tutorialsample_files子目录中。,读取文本格式的文件,以SPSS自带的文件demo.txt为例,来看SPSS如何直接读取这个文件,该文件位于SPSS目录下的Tutorialsample_files子目录中。,2.数据的编辑,查看变量信息 可以在数据编辑器窗口中选择Variable View视区浏览变量信息,也可以通过SPSS菜单栏中Utilities菜单中的Variabl
13、es命令来查看变量信息 查看文件信息 通过File菜单中的Display Data File Information命令来实现 SPSS数据的定位 插入与删除变量 插入与删除观测量 数据的剪切、复制和粘贴 撤销操作,3.数据文件的操作,数据文件的打开与保存 数据排序 数据文件的分解 数据文件的合并 数据文件的转置,3.1 数据排序,使用右键菜单 菜单栏中选择Data|Sort Cases命令,3.2 数据文件的分解,拆分数据文件的观测量,观测量按某种条件进行分组;(有些统计命令本身具有分组的功能,有些则需要在这里定义分组,再进行某种统计)。,3.3 数据文件的合并,有时分析数据文件时会需要将几
14、个数据文件合并在一起分析,数据文件共有两种合并方式:横向合并和纵向合并。其中,横向合并是指从外部文件中增加变量到当前数据文件,而纵向合并是指从外部数据文件中增加观测量到当前数据文件中。,增加变量(横向合并) 横向合并是将一个SPSS数据文件的内容接到数据编辑窗口中当前数据的右边。 横向合并应遵循三个条件 两个数据文件必须至少有一个变量名相同的公共变量,这个变量是两个数据文件横向对应合并的依据,称为关键变量。如学号、贵宾卡号等,关键变量可以是多个。 两个数据文件都必须事先按关键变量进行升序排列。 为方便SPSS 数据文件的合并,在不同数据文件中,数据含义不相同的列,变量名不应取相同的名称。,通过
15、一个例子理解数据文件的横向合并。 【例】将数据transform3.sav中的变量添加到transform.sav中。 在菜单栏中选择Data|Merge Files|Add Variables命令,增加个案(纵向合并) 纵向合并是在两个具有相同变量的数据文件中,将其中一个数据文件的个案追加到当前数据文件的个案中,形成新的数据文件。 纵向合并应遵循两个条件 两个待合并的SPSS数据文件,其内容合并是有实际意义的。 为方便SPSS数据文件的合并,在不同数据文件中,数据含义相同的列,最好起相同的名字,变量类型和变量长度也要尽量相同。,通过一个例子理解数据文件的横向合并。 【例】将数据transfo
16、rm2.sav中的记录添加到transform.sav中。 在菜单栏中选择Data|Merge Files|Add Cases命令,3.4 数据文件的转置,数据的转置(Transpose)可将数据文件行(个案)、列(变量)互换,类似于矩阵转置。从菜单栏中选择Data|Transpose(转置)命令。,4.变量级别的数据管理,4.1 计算新变量 4.2 对变量值进行分组合并,4.1 计算新变量,计算新变量的功能就是在原有SPSS数据文件的基础之上,根据用户的要求,使用SPSS算术表达式及函数,对所有记录或满足SPSS条件表达式的记录,计算出一个新结果,并将结果存入一个用户指定的变量中。 【例】数
17、据transform.sav是某年级学生的数学、英语、语文三门课程的成绩,现在需要统计英语成绩在60分以上的学生的语文和数学的平均成绩。 在菜单栏中选择Transform|Compute命令,4.2 对变量值进行分组合并,数据分析中,将连续变量转换为分类变量,或者将分类变量不同的变量等级进行合并是常见的工作。而Recode过程可以很好地完成这一类任务。Recode into Same Variable 是对原始变量的取值进行修改;而Recode into Different Variable是根据原始变量的取值生成一个新变量来表示分组情况。但为了保存原始信息的完整性,一般选后者。 对连续变量进
18、行分组 分类变量类别的合并,对连续变量进行分组,在SPSS中可以将连续变量转换为离散(定类或定序)变量,按照某种一一对应的关系生成新变量值,可以将新值赋给原变量,也可以生成一个新变量。Recode(包括 Into Same Variables及Recode Into Different Variables)过程和Visual Bander过程都可以完成这一任务,但前者更为简单和常用。 【例】在transform.sav中生成新变量grade,当英语成绩小于60时取值为“不及格”,大于等于60且小于70为“及格”,大于等于70且小于80为“良好”,大于等于80为“优秀”。 在菜单栏中选择Transform | Recode Int
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 装修合同清洁要求详解
- 旅游经济学试题含参考答案
- 植物学习题含答案
- 建筑工程劳务分包合同协议
- 营销管理岗职业规划
- 电子支付业务合作合同
- 蔬菜供应标准合同书
- 离婚子女抚养合同范本
- 房地产买卖合同法律问题分析与研究
- 机织运动服装的人体工学优化设计考核试卷
- 2024慢性鼻窦炎诊断和治疗指南解读课件
- 2025年xx村公益性项目购买材料询价会议记录
- 2024年H13-531云计算HCIE认证考试题库及答案
- DLDS-1214F电气装置技术方案(世赛KNX版)
- (完整)3.1辅助角公式及应用的公开课比赛课件
- 2024年贵阳丘成桐少年班选拔试题
- 2025年江苏省运河宿迁港产业园招聘20人历年高频重点模拟试卷提升(共500题附带答案详解)
- 抗日英雄人物杨靖宇介绍
- AI驱动的可持续能源发展
- 水泥厂电工培训课件
- 电力系统中电磁环境监测系统的设计与实施
评论
0/150
提交评论