统计分析与Spss应用第二章(数据与数据文件)_第1页
统计分析与Spss应用第二章(数据与数据文件)_第2页
统计分析与Spss应用第二章(数据与数据文件)_第3页
统计分析与Spss应用第二章(数据与数据文件)_第4页
统计分析与Spss应用第二章(数据与数据文件)_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二章 SPSS数据与数据文件 2.1 数据的来源与分类数据是数据分析的关键之一,数据通常和我们研究的对象联系在一起。个体就是一组数据描述的对象;变量就是一个个体的任意特征。将数据按照不同的标准进行分类,有助于对数据来源和用途及其分析方法的深入理解和研究。2.1.1观测数据与试验数据观测数据:是爱自然的未被控制的条件下观测到的数据,如社会商品零售额,消费价格指数,降雨量等。抽样调查、普查都是重要的观测研究,得到的数据是观测数据。试验数据:是在人工干预和操纵下产生的数据,这种数据通常来自于科学和技术试验。 将数据分为观测数据和实验数据是基于观测的对象是在自然的还是在可控的实验条件下产生的。他们是

2、数据最根本的两个来源。对这两种类型的数据要通过建立文件才能使用SPSS进行分析。2.1.2一手数据与二手数据一手数据:针对特定的研究问题,通过专门收集、调查或试验取得的数据称为一手数据。(要通过建立文件才能使用SPSS进行分析)二手数据:由各种媒体、机构发布的数据,如证券市场行情、物价指数、利率、国民生产总值等,对于数据分析人员来说,可以根据研究的问题,从这些数据中加以选择,这样间接得到的数据称为二手数据。(要通过外部文件引入才能使用SPSS进行分析)一手数据和二手数据是根据数据分析人员获取数据的方式是直接还是间接的来划分的。2.1.3时间序列数据与横截面数据这是计量经济学中的数据分类方法。时

3、间序列数据是对同一研究对象按时间顺序收集得到的数据,如国内生产总值、失业率等。这类数据是按照一定的时间间隔如每日、每周、每月、每季、每年收集的;横截面数据是指在同一时点上不同研究对象的数据的集合,如2007年沪深股市上市公司中期业绩。由这两类数据衍生出合并数据,合并数据中既有时间序列数据又有横截面数据。时间序列数据和横截面数据是数据沿时间与个体两个维度上的视图。2.2 数据文件的建立建立数据文件步骤:1、定义变量:定义变量名、指定变量类型、宽度、小数位数、定义变量标签、变量值标签。2、数据录入与编辑3、保存数据文件数据标识数据类型数据标识数据类型SPSS(*.sav) SPSS 数据文件(6.

4、012.0 版)SPSS/PC+(*.sys) SPSS 4.0 版数据文件Systat(*.syd) *.syd 格式的Systat 数据文件Systat(*.sys) *.sys 格式的Systat 数据文件SPSS Portable(*.por) SPSS 便携格式的数据文件EXCEL(*.xls) EXCEL 数据文件(从5.0 版2000 版)Lotus(*.w*) Lotus 数据文件SYLK(*.slk) SYLK 数据文件dBase(*.dbf) dBase 系列数据文件(从dBaseIIIV)SAS Long File Name(*.sas7bdat) SAS 78 版长文件

5、名类型数据文件SAS Short File Name(*.sd7) SAS 78 版短文件名类型数据文件SAS v6 for Windows(*.sd2) SAS 6 版(for Windows)数据文件SAS v6 for UNIX(*.ssd01) SAS 6 版(for UNIX)数据文件SAS Transport(*.xpt) SAS 便携格式的数据文件Text(*.txt) 纯文本格式的数据文件data(*.dat) 纯文本格式的数据文件 简单数据定义和输入实例简单数据定义和输入实例欲比较A公司与B公司普通员工的收入(月薪)有无差距,随机调查了各五人,数据如下: A公司:2000,3

6、000,4000,3000,4500 B公司:3000,3000,3500,4000,5000请建立数据文件,并进行分析。2.2 .1 数据类型1. 常量与变量(1) SPSS 常量 (a)数值型常量 数值型常量就是程序在SPSS 语句中的数字,一般使用两种书写方式,一种是普通书写方式例如26 、38.4 等;另一种书写方式是科学记数法,用于表示特别大或特别小的数字例如1.23E18 、2.56E-16 等。(b) 字符串常量 字符串常量是被单引号或双引号括起来的一串字符,如果字符串中带有字符“ ”,则该字符串常量必须使用双引号括起来例如 :“BOY S BOOK ”(2)SPSS 变量设计(

7、a) 为变量命名应该遵循以下几个原则 SPSS 变量的变量名由字符组成。首字母是字母,其后可为字母或数字或除“?、!、*” 以外的字符,但应该注意不能以连接线“-”和圆点“. ” 作为变量名的最后一个字符。变量名不能与SPSS 保留字相同,SPSS 的保留字有ALL AND BY EQ GE GTLE LT NE NOT OR TO WITH系统不区分变量名中的大小写字符例如ABC 和abc 被认为是同一个变量变量设计的基本原则不同观察对象的数据不能在同一条记录中出现每一个测量指标/影响因素只能占据一列的位置,即同一个指标的测量数值都应当录入到同一个变量中去最终的数据集应当能够包含原始数据的所

8、有信息可以出现违反这些原则的例外情况,如重复测量数据(b) 变量类型与默认长度 SPSS 变量有三种基本类型:数值型、字符型、日期型。定义时有以下可选的数据类型:Numeric(标准数值型) Comma(带逗点的数值型) Dot(逗点作小数点的数值型)ScientificNotation(科学记数法) Date(日期型) Dollar(带有美元符号的数值型) CustomCurrency(自定义型) String(字符型)(c)变量标签和变量值标签变量变量变量标签变量标签变量值变量值变量值标签变量值标签Gender性别性别f男男m女女Height身高身高1=1.80m返回(d) 变量的格式变量

9、值标签是对变量的可能的取值所附加的进一步说明对分类变量往往要定义其取值标签当然变量值标签也是一个可选择的属性可以定义也可以不定义 例如: 变量 值 值标签 Sex f Female m Male格格 式式总长总长度度小数位小数位数数格格 式式总长总长度度小数位小数位数数$# #30# # #.# 51#,# # #60#,# # # . # #82e)变量度量(Measurement)在统计学上按照对事物描述的精确尺度,将所采用的测量尺度从低级到高级分为4个层次:定类尺度、定序尺度、定距尺度(interval measurement)和定比尺度。下面是SPSS可以定义的变量测量尺度类型scal

10、e: 定距数据Ordinal:定序数据Nominal:定类数据2 操作符与表达式(1) 算术运算符与算术表达式(2) 比较算符与比较表达式(3) 逻辑运算符与逻辑表达式数学运算操作符 关系运算符 逻辑运算符+ 加 (GT) :大于 | Or :或* 乘 =(GE) : 大于等于* * 幂 = EQ 等于( ) 括号 = NT 不等于输入数据之前首先要定义变量定义变量即要定义变量名、变量类型、变量长度(小数位数)、变量标签(或值标签)和变量的格式(显示宽度对齐方式缺失值标记等)(1) 对一般文件的变量定义(2) 调查问卷中开放题的变量定义(3)调查问卷中简单单选题变量定义(值标签)(4)调查问卷

11、中对多选题变量定义(a.多重二分法 b.多重分类法)2.2.2 变量的定义Data View和Variable View返回定义变量的普通方法返回定义变量类型返回定义值标签返回定义用户缺失值返回列格式、对齐、测度方式返回定类尺度(Nominal ):对事物的类别或属性的一种测度,可按某属性对其分类或分组定序尺度(ordinal ):对事物之间等级或顺序差别的一种测度,可以比较优劣或排序定比尺度(scale):能够测算两个测度值之间比值的一种计量尺度,表现为数值2.2.3 数据录入与编辑数据输入方法数据输入方法1按变量输入数据2按观测量输入数据(case)概率事件观测量(Cases) 在数据编辑

12、器的二维表格中每行都是数据文件的一个记录,在统计学中称作一个概率事件。在SPSS 的菜单中或帮助信息中用Cases 这个单词表示,每个Cases 是由各变量的一定的值组成,是一个事件或者说是对一个被观测对象的各种特征的实测值组成。因此相对应变量来说可以称之为观测量单元格中的数据即是某个观测量中的一个值,因此可以称之为变量值,也可以称之为某个观测值,在Help 信息中往往使用Case 这个单词。(1)对一般文件的数据录入a按变量输入数据b按观测量输入数据(case)(2) 调查问卷中开放题的数据录入a按变量输入数据b按观测量输入数据(case)(3)调查问卷中简单单选题数据录入a.直接录入 b.

13、字符代码+值标签 c.数值代码+值标签(4)调查问卷中对多选题数据录入a.多重二分法 b.多重分类法2.2.4 数据文件的保存1、 文件类型SPSS(*.sav) (6.0以上)SPSS(*.sys) (4.0版)SPSS Portable (*.por) Tab-delimited (*.dat) Fixed ASCII (*.dat) Excel (*.xls)1-2-3 Rel 3.0 (*.wk3)1-2-3 Rel 2.0 (*.wkl) 1-2-3 Rel 1.0 (*.wks)SYLK (*.slk) dBASEIV(*.dbf) dBASEIII(*.DBF) dBASEII(

14、*.dbf)2、保存数据文件、保存数据文件 在数据编辑器中定义变量输入修改数据形成一个可供SPSS 分析的数据文件,使用Edit 菜单项中的各种功能可以对数据文件进行编辑处理。 如果将数据文件存盘磁盘数据文件的扩展名为SAV ,利用菜单项File 的Data或Save As 功能展开的对话框指定存储路径位置和磁盘文件名,将数据窗中的数据保存为.sav格式的数据文件或者其他的数据文件如数据库文件等。2.2.5 数据编辑数据编辑器1.数据编辑器的组成(1) 窗口标题栏(2) 窗口状态栏(3) 数据输入栏(4) 数据显示区2 数据编辑器的功能概述 (1) 变量与观测量的编辑功能 (2) 数据编辑功能

15、已输入数据的修改1 在一个区域中修改数据2 恢复删除或修改前的数据 数据的剪切复制与粘贴 (1) 选择变量 (2) 选择观测量 (3) 选择属于某个变量的若干个连续的单元格 (4) 选择属于某个观测量的若干个连续的单元格 变量观测量的插入与删除1 插入一个变量2 删除一个变量3 插入一个观测量4 删除一个观测量 恢复删除或修改前的数据如果对本次的修改与删除不满想恢复操作前的状态,只要使用鼠标单击系统菜单中的Edit 展开下拉菜单选择第一项Undo 鼠标单击之即可2.3其他格式数据文件的导入直接打开(如excel文件)使用数据库查询打开使用导入向导导入文本文件2.3.1 Excel文件读入步骤:

16、1, file-open-data 弹出文件操作对话框2,通过查找范围查找要转换文件所在路径3,选择要打开文件类型:exel(*.xls)4,找到要转换的文件选定,按“打开”按钮弹出一个对话框5,保留默认选项,选择“ok”6,将读入的文件保存file-save,选择正确路径,根据要求命名保存即可。2.3.2使用导入向导导入文本文件1,选择菜单File=Read Text Data,系统就会弹出Open File对话框,文件类型自动跳到了Text (*.txt)。选中要读入的文件,打开2,does your file match a preddfined format 选择 “no”,选下一步3

17、,how are your variables arranged 一般选择Delitmited are variable names included at the top of your file,根据御览窗口可以看到第一行是变量还是数据,一般选择:yes ,然后选择“下一步”4,The first cases of data begins on which默认:2(因为第一行一般是变量名)How are your cases represented?一般选择:each lineHow many cases you want to import通常选择:all选好后选择“下一步”5,whic

18、h delimiters appear between variables?变量间用的哪种分隔符,一般系统会自己有判断,选择默认的即可What is the text qualifier数据中采用的是什么文本限定符,一般选择“none”默认,但如果有,应该指定。都选择好后按“下一步”6,specifications for variables selected in the data preview:定义在数据御览窗口所选择的变量。默认,选下一步7,默认,选“完成”8,将读入的文件按要求保存2.3.3使用数据库查询打开数据库文件选择菜单File=Open Database=New Query,系统会弹出数据库向导的第一

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论