spss数据文件的建立与整理

上传人：1*** IP属地：湖北上传时间：2021-10-22 格式：PPT 页数：136 大小：1.58MB 积分：30 举报 版权申诉

已阅读5页，还剩131页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、Statistical Program for Social Sciences第二章数据文件的建立与整理第一节第一节重点介绍重点介绍spss软件及其数据文件的软件及其数据文件的建立建立第二节第二节数据文件的整理数据文件的整理第三节第三节简单介绍简单介绍Minitab软件及其数据文软件及其数据文件的建立件的建立学习目标 1. 熟悉熟悉SPSS统计软件中数据文件的建立统计软件中数据文件的建立一一. 数据的审核与筛选数据的审核与筛选二二. 数据的排序数据的排序数据的审核、筛选与排序1. 数据的审核发现数据中的错误2. 数据的筛选找出符合条件的数据3. 数据排序发现数据的基本特征升序和降

2、序数据的审核（原始数据）审核的内容审核的内容1. 完整性审核检查应调查的单位或个体是否有遗漏所有的调查项目或指标是否填写齐全2. 准确性审核检查数据是否真实反映客观实际情况，内容是否符合实际检查数据是否有错误，计算是否正确等数据的审核（第二手数据）1. 适用性审核弄清楚数据的来源、数据的口径以及有关的背景材料确定这些数据是否符合自己分析研究的需要2. 时效性审核应尽可能使用最新的统计数据3. 确认是否必要做进一步的加工整理数据的筛选1.对审核过程中发现的错误应尽可能予以纠正2.当发现数据中的错误不能予以纠正，或者有些数据不符合调查的要求而又无法弥补时，需要对数据进行筛选3.数据筛选的内容包括

3、：将某些不符合要求的数据或有明显错误的数据予以剔除将符合某种特定条件的数据筛选出来，而不符合特定条件的数据予以剔出引例：某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如下, 问该地急性克山病患者与健康人的血磷值是否不同？患者: 0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11健康人: 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87具体工作流程如下：建立数据文件数据的加工整理统计分析解释分析结果定义数据文件的结构录入修改保存数据统

4、计软件参与的主要是:数据输入数据输入数据分析数据分析数据输出数据输出 2.2 SPSS数据文件的建立一一. SPSS软件简介软件简介二二. SPSS数据文件的建立数据文件的建立1 简介简介SPSS是Statistical Program for Social Sciences 的简称，即社会科学统计程序，由美国SPSS公司1970年代推出，迄今已有近30年的历史。是国际著名三大社会科学统计软件包之一（SAS、SPSS、Statis）。我们现在使用的是SPSS for Windows 12.0版。SPSS For Windows的概述 SPSS For Windows的特点 SPSS For W

5、indows对环境的要求 SPSS For Windows的软件安装 SPSS For Windows的启动与退出 1.1 SPSS For Windows的特点操作界面极为友好，输出结果美观漂亮多种实用分析方法，强大的图形处理能力操作简便，易于学习、易于使用与其他软件有数据转换接口(ODBC)1.2 SPSS For Windows对环境的要求对硬件环境的要求; 16M以上内存; 30以上自由空间对软件环境的要求 ; Windows95.98.2000; 关于spss的汉化1.3 SPSS For Windows的软件安装开机启动windows 把spss的安装光盘放入光驱双击setu

6、p文件同意版权声明next 选择安装目录填写用户名、单位名和系列号选择安装类型安装完成1.4 SPSS For Windows的启动与退出 SPSS For Windows系统的启动 SPSS For Windows系统的退出 1.1.1 进入进入SPSS的界面的界面1.1.2 定义变量定义变量1.1.3 输入数据输入数据1.1.4 保存数据保存数据1.1.1 进入进入SPSS的界面的界面数据视图：数据视图：用于查看、录入和修改数据用于查看、录入和修改数据变量视图变量视图：用来定义和修改变量的定义用来定义和修改变量的定义请将鼠标在上图中的各处停留，很快就会弹出相应部位的名称请将鼠标在

7、上图中的各处停留，很快就会弹出相应部位的名称。小贴士：小贴士：对数据表界面操作不熟悉的朋友可先学习一下对数据表界面操作不熟悉的朋友可先学习一下EXCEL的操的操作（因为它的帮助是中文的）。作（因为它的帮助是中文的）。 1.1.1 进入进入SPSS的界面的界面1.1.2 定义变量定义变量1.1.3 输入数据输入数据1.1.4 保存数据保存数据1.1.2 定义变量定义变量在在Variable View 对话框中对变量进行定义，变量对话框中对变量进行定义，变量的定义要符合规则，对不同数据的变量类型要合的定义要符合规则，对不同数据的变量类型要合乎定义，如单击乎定义，如单击“Type”按钮可以实现变量

8、类型的按钮可以实现变量类型的定义等。定义等。单击单击Variable View按钮后按钮后该资料是定量资料，设计为成组设计，因此我们需要建立两个变量，一该资料是定量资料，设计为成组设计，因此我们需要建立两个变量，一个变量代表血磷值，习惯上取名为个变量代表血磷值，习惯上取名为X，另一个变量代表观察对象是健康，另一个变量代表观察对象是健康人还是克山病人，习惯上取名为人还是克山病人，习惯上取名为GROUP。在在Variable View 对话框中第一个变量定义为对话框中第一个变量定义为group，Type为为Numeric ，并在，并在Lable处注明处注明1为患者，为患者，2为为健康人；第二个变

9、量定义为健康人；第二个变量定义为X， Type为为Numeric，Width为为8，Decimals为为2等等。等等。变量标签就在变量标签就在Label框中直接输入，变量值标签则在它右侧的框中直接输入，变量值标签则在它右侧的Value框定义。以框定义。以group为例，单击为例，单击Value框右半部的省略号，会弹出变量值标签对话框如下：框右半部的省略号，会弹出变量值标签对话框如下：上部的两个文本框分别为变量值输入框和变量值标签输入框，分别在其中输入上部的两个文本框分别为变量值输入框和变量值标签输入框，分别在其中输入“1”和和“克山克山病患者病患者”，此时下方的，此时下方的Add钮变黑，单击

10、它，该变量值标签就会被加入下方的标签框内。与钮变黑，单击它，该变量值标签就会被加入下方的标签框内。与此类似定义变量值此类似定义变量值“2”为为“健康人健康人”，最后按，最后按OK，变量值标签就设置完成。此时你做任何分，变量值标签就设置完成。此时你做任何分析，在结果中都有相应的标签出现。如果你现在就想看效果，切换回析，在结果中都有相应的标签出现。如果你现在就想看效果，切换回Data View界面，然后选界面，然后选择菜单择菜单View=Value Labels，怎么样，看到了吗？，怎么样，看到了吗？值标签定义方法值标签定义方法缺失值缺失值单击单击missing框右侧的省略号，会弹出缺失值对话框

11、如下：框右侧的省略号，会弹出缺失值对话框如下：界面上有一列三个单选钮，默认值为最上方的界面上有一列三个单选钮，默认值为最上方的“无缺失值无缺失值”；第二项为；第二项为“不连续缺失值不连续缺失值”，最多可以定义最多可以定义3个值；最后一项为个值；最后一项为“缺失值范围加可选的一个缺失值缺失值范围加可选的一个缺失值”，文如其意，不用我多，文如其意，不用我多解释了吧。解释了吧。缺失值定义方法缺失值定义方法数据表达常量常量类型常量类型数值型普通书写方式例如26 38.4 科学记数法用于表示特大或特小的数字如1.23E18 2.56E-16 字符型被单引号或双引号括起来的一串字符如：book “Im

12、 a boy” 日期型 SPSS 变量名由不多于8 个字符组成首字母是可为字母或数字或除?-!和*以外的字符注意不能以下划线_和园点“.”作为变量名的最后一个字符变量名不能与SPSS 保留字相同,SPSS 的保留字有ALL AND BY EQ GE GT LE LT NE NOT OR TO WITH 不区分变量名的大小写,如ABC 和abc 被认为是同一个变量数据表达Spss变量（变量命名原则）数据表达Spss变量(变量类型与默认长度）三种基本类型：数值型、字符型、日期类型长度小数显示方式输入显示Numeric8.2标准格式，圆点表示小数点38.4238.42Comma8.2圆点做小数

13、点，逗点做三位分割符1,343,438.11,343,438.1Dot8.2逗点做小数点，圆点做三位分割符34.3434E23.434,34Scietific8.2科学计数法457.8E4457.8E4Date8.2格式非常多Dollar8.2前缀为$，以逗点为分割符$12343$12343Cus currency 8.2String8.2一串字符串BelieveBelieve数据表达Spss变量（标签、值标签和格式）l 变量标签Variable Labels例如：变量名变量标签 W weight或体重 H Height或身高l 值标签Value Labels例如变量值值标签 Sex

14、 f Female m Malel 变量格式显示宽度对齐方式缺失值（Missing Value) SPSS数据的基本组织方式数据的基本组织方式在原始数据的组织方式中，数据编辑窗口中的一行称为一个个案（Case），数据编辑窗口中的一列称为一个变量，每个变量都有一个名字。居民储蓄调查问卷性别职业年龄 1、请问您的收入是（） A 1000以内 B 10002000 C 20005000 D 5000以上。一份关于居民储蓄的调查问卷原始数据组织形式性别职业年龄收入11124A22333B. SPSS数据的基本组织方式数据的基本组织方式在频数数据的组织方式中，数据编辑窗口中的一行为变量的一

15、个分组（Case），数据编辑窗口中的一列仍为一个变量，代表某个问题及频数。频数数据举例年龄段职称35岁以下（1）3649岁（2）5060岁（3）60岁以上教授015835副教授102022讲师201010频数数据组织形式职称年龄段人数1101215。。录入下面录入下面10名学生成绩调查表名学生成绩调查表变量标签学号性别年龄数学物理化学英文变量名IDA1A2A3A4A5A6类型长度F4.0String F4.0F4.0F4.0F4.0F4.011女228290887722女189181768233男207876905644女208582缺考7555女21缺考67826466男不清688654

16、6977男187693807888女198488725299男18566486801010女2488719476转化为学生成绩的调查表编码转化为学生成绩的调查表编码将个人的学号（姓名）作为地址码用数字表示，该变量相应由字符型变为数字型，将个人的学号（姓名）作为地址码用数字表示，该变量相应由字符型变为数字型，性别编码为男性为性别编码为男性为M M，女性为，女性为F F，对于未答、缺失、缺考、情况不清的编码，使用，对于未答、缺失、缺考、情况不清的编码，使用不可能出现的码表示。如字符变量用不可能出现的码表示。如字符变量用U U码、数据变量用码、数据变量用-9-9表示，编码后的结果如下表示，编码后的结

17、果如下图学生成绩的调查表编码所示：图学生成绩的调查表编码所示： IDA1A2A3A4A5A61F2282908877220787690564F208582-9755F21-96782646M-968865469719848872529M185664868010F2488719476 问卷调查数据处理实例步骤：1、问题分类2、建立变量3、输入数据4、验收2 进入进入SPSS之前的准备工作之前的准备工作2-1-1数据资料的形式：矩阵式数据:数据要求每一横行为一个个案（Case,即一份调查数据），纵列按变量排列，一列是一个变量（问卷中的一道问题）

18、，从而形成矩阵格式。2-1数据资料的形式及编码编码编码录入录入2-1-2 编码的概念: 根据一定的规则将研究资料转换为可进行统计分析的数码资料的过程。问题问题025：您认为打工的外地人对北京市的社会秩：您认为打工的外地人对北京市的社会秩序是否有影响？（单选）序是否有影响？（单选）1有很大影响 2有较大影响 3没有影响 4不好说 4编码答案2-1-3编码的步骤：1)确定变量；变量：变量：用来反映文意概念的量化形式。在统计中往往指最小的分析单位。编码就是对变量进行编码。变量由两个部分构成：变量名变量名和变量值变量值。要注意区分何为变量，何为变量值。在调查问卷中还要注意区分问问题题和变量变量。问题问

19、题009：您有几个儿子？几个女儿？：您有几个儿子？几个女儿？ 1儿子_人 2女儿_人 23问题变量1变量2变量1的值变量2的值2）制作编码表直接过录直接过录0-1编码编码变量名变量名: 一个数据文件中一个数据文件中,一个变量只能有一个唯一名称。一个变量只能有一个唯一名称。码位：某一变量在码位：某一变量在数据文件中占据的栏位数据文件中占据的栏位码数：码数：某一变量由几位数组成。某一变量由几位数组成。该变量是数值型（该变量是数值型（Numeric）如定距、定比，如定距、定比，还是字串型（还是字串型（String），如定类、定序。），如定类、定序。前者在统计中可以做高级运算，后者则不可以。前者在统计

20、中可以做高级运算，后者则不可以。不适于被访人回答的问题的编码。不适于被访人回答的问题的编码。一般采用一般采用7，97，997等。等。被访人回答不知道时的编码。被访人回答不知道时的编码。一般采用一般采用8，98，998等。等。被访人拒绝回答某变量时的编码。被访人拒绝回答某变量时的编码。一般采用一般采用9，99，999等。等。问卷中出现漏答时的处理编码。问卷中出现漏答时的处理编码。一般采用一般采用9，99，999等。等。问题问题 001：您的性别：您的性别：1男2女问题问题 002：您目前的婚姻状况：您目前的婚姻状况（单选）：（单选）：1未婚2已婚3离婚后未再婚4离婚后再婚5丧偶后未再婚6丧偶

21、后再婚7未婚同居23问问题题0 1 1 ：您您家家中中是是否否有有下下列列物物品品：（可可多多选选）1 电话2 传真机3 有线电视4 卫星电视5 大哥大6 B P 机100011不好进行后续的数据分析！将多选项问题进行分解！l 多选项二分法l 多选项分类法将多选项问题中每个答案设为一个SPSS变量，每个变量只有0或1两个取值，分别表示选择了该答案和不选择该答案。应估计多选项问题最多可能出现的答案个数；然后为每个答案设置为一个SPSS变量，变量取值为多选项问题中的可选答案。你家中是否有下列物品：（1）电话（2）传真机（3）有线电视（4

22、）卫星电视（5）大哥大（6）BP机对应设置6个SPSS变量，其取值为1或0，其中1表示报考，0表示不报考。SPSS变量名变量名标签变量值V1有电话吗？0/1V2有传真机吗？0/1V3有有线电视吗？0/1V4有卫星电视吗？0/1V5有大哥大吗？0/1V6有BP机吗？0/1假设问卷调查中出现的最多答案个数为4，则可设置4个SPSS变量，分别表示答案一、答案二、答案三，答案四，变量取值为06，其中0代表此答案未选，其余对应6个可选答案。SPSS变量名变量名标签变量值V1答案一0/1/2/3/4/5/6V2答案二0/1/2/3/4/5/6V3答案三0/1/2/3/4/5/6V4答案四0/1/2/3/

23、4/5/6如选择了电话（1），大哥大（5），BP机（6），则V1,V2,V3,V4依次取值为1，5，6，0某地区高三学生的高考志愿调查中，为分析学生填报志愿的倾向性，设计了这样一道问题。按照你的志愿，请按顺序依次选择你打算报考的三所大学：（1）北京大学（2）清华大学（3）南京大学（4）南京理工大学（5）东南大学（6）南京师范大学对应设置6个SPSS变量，其取值为1或0，其中1表示报考，0表示不报考。SPSS变量名变量名标签变量值V1报考北京大学吗？0/1V2报考清华大学吗？0/1V3报考南京大学吗？0/1V4报考南京理工大学吗？0/1V5报考东南大学吗？0/1V6报考南京师范大学吗？0

24、/1由于问卷要求被调查者选择三个答案，所以可设置3个SPSS变量，分别表示志愿一、志愿二、志愿三，变量取值为16，依次对应6所大学。SPSS变量名变量名标签变量值V1志愿一1/2/3/4/5/6V2志愿二1/2/3/4/5/6V3志愿三1/2/3/4/5/6两种方法选择依据便于分析是否丢失信息案例1中，无论采用哪种分解方法都会存在一定的问题。但从避免信息丢失方面考虑，第一种方式要优于第二种，因为第二种方式会导致较多的缺失数据。多选项二分法优点：优点：能很方便地分析出各个学校的考生报考情况。缺点：缺点：不便于分析考生在各个志愿中的报考学校情况。多选项分类法优点：优点：能很方便地分析出考生在各

25、个志愿中的报考学校情况。缺点：缺点：但不便于分析各个学校的考生报考情况。小贴士：小贴士：1.1.1 进入进入SPSS的界面的界面1.1.2 定义变量定义变量1.1.3 输入数据输入数据1.1.4 保存数据保存数据1.1.3 输入数据输入数据直接在第一行第一列直接在第一行第一列group下方用键盘键入下方用键盘键入1，第，第一行第二列一行第二列X 下方用键盘键入下方用键盘键入0.84，其余依次键其余依次键入，从第入，从第12行开始为健康人，因此行开始为健康人，因此group 应取为应取为2，最终该数据集应该有最终该数据集应该有24条记录。条记录。数据录入方法直接敲就是了！按行输入数据（按Ta

26、b键）按列输入数据（按Enter键）录入带有变量值标签的数据（通过下拉按钮完成）数据的录入数据的录入但在此之前应首先通过选择菜单：但在此之前应首先通过选择菜单：view =Value Labels，打开变量值标，打开变量值标签的显示开关，如果它前面显示一个签的显示开关，如果它前面显示一个，则表示变量值标签的显示开关已经，则表示变量值标签的显示开关已经打开，变量值标签将显示在数据编辑窗口中；反之，则表示开关尚未打开，打开，变量值标签将显示在数据编辑窗口中；反之，则表示开关尚未打开，不显示变量值标签只显示变量值。不显示变量值标签只显示变量值。应当说明的是，在值标签显示开关打开的状态下，虽然屏

27、幕显示的是标签，但实应当说明的是，在值标签显示开关打开的状态下，虽然屏幕显示的是标签，但实际内部存储的仍是变量值。际内部存储的仍是变量值。1.1.1 进入进入SPSS的界面的界面1.1.2 定义变量定义变量1.1.3 输入数据输入数据1.1.4 保存数据保存数据1.1.4 保存数据保存数据单击保存类型列表框，可以看到单击保存类型列表框，可以看到SPSS所支持的各种数据类型，有所支持的各种数据类型，有DBF、FoxPro、EXCEL、ACCESS等，这里我们仍然将其存为等，这里我们仍然将其存为SPSS自己的自己的数据格式（数据格式（*.sav文件）。在文件名框内键入文件）。在文件名框内键入Li1

28、_1并回车，可以看到数并回车，可以看到数据管理窗口左上角由据管理窗口左上角由Untitled变为了现在的变量名变为了现在的变量名Li1_1。选择菜单File=Save，由于该数据从来没有被保存过，所以弹出Save as对话框如下：根据居民储蓄调查问卷，设计SPSS变量，并定义SPSS数据的结构，并选取部分填答好的问卷，建立居民储蓄调查数据文件。题目可选答案1.您认为现在买东西合算还是存钱合算？（1）买东西合算（2）存钱合算2.您今年的收入比去年增加了还是减少了？（1）增加（2）基本不变（3）减少3.预计未来一两年中您的收入？（1）增加（2）基本不变（3）减少4.您的月收入水平属于？

29、（1）800元以下（2）8001500元（3）15005000 （4）5000元以上5.您本次存（取）款的金额是多少？（）元6.您本次存（取）款的种类？（1）三年以上定期（2)三年以下定期（3）活期（4）定活两便（5）有奖储蓄（6）个人通知存款（7）活期工资账户（8）各类信用卡题目可选答案7.存（取）款的目的（可多选）？（1）买高档消费品（2)结婚用（3）正常生活零用（4）做生意（5）购买农业生产资料（6）买证券及单位集资（7）买房或建房（8）支付孩子教育费（9）养老金（10）防止意外事故（11）得利息8.您认为现在的物价水平？（1）过高，难以接受（2）偏高，可

30、以接受（3）正常9.您对近期市场物价趋势的看法？（1）会迅速上升（2）基本稳定（3）会略有下降10.若物价上升幅度较大，您准备？（1）提款购物（2）购买其它证券（3）继续存款11.如果目前利率维持不变，您准备？（1）继续存款（2）提款购物（3）购买其它证券12.您手中一部分现金不存入银行的原因？（1）日常生活用钱（2)生意周转金（3）便于随时购买中意商品（4）购买国库券、债券、股票等题目可选答案13.您的户口属于？（1）城镇户口（2)农村户口14.您的工作单位或职业是？（1）国家机关（2）商业服务业（3）文科卫行业（4）公交建筑业（5）经营性公司（6）学校（7）一般农户（

31、8）种粮棉专业户（9）种果菜专业户（10）工商运输个体户（11）退休人员（12）金融机构（13）现役军人15.您的年龄是？（1）20岁以下（2）2035岁（3）3550岁（4）50岁以上直接读入其他格式的数据文件使用文本向导读入文本文件选择菜单选择菜单File=Open=Data或直接单击快捷工具栏上的或直接单击快捷工具栏上的按钮，系按钮，系统就会弹出统就会弹出Open File对话框对话框：1、直接打开、直接打开选择数据文件类型，并输入数据文件名即可。其次中间还有一个选择数据文件类型，并输入数据文件名即可。其次中间还有一个“Paste”按钮，该按钮在按钮，该按钮在SPSS的大多数对

32、话框中都存在，是用于自动生成的大多数对话框中都存在，是用于自动生成SPSS程序的。程序的。2、使用文本导入向导读入文本文件使用文本导入向导读入文本文件选择菜单选择菜单File=Read Text Data，系统就会弹出，系统就会弹出Open File对话框：对话框：对！和前面的情况完全一样，只是文件类型自动跳到了对！和前面的情况完全一样，只是文件类型自动跳到了Text (*.txt)。实际上，该功。实际上，该功能在能在SPSS中已被整合到了中已被整合到了Open File对话框中之所以在菜单上保留该条目有两个原对话框中之所以在菜单上保留该条目有两个原因：因：1. 读入纯文本的情况非常普遍，放

33、在这里更加醒目；读入纯文本的情况非常普遍，放在这里更加醒目；2. 为了和为了和SPSS老版本的老版本的使用上保持兼容。使用上保持兼容。 2.1.3.3 使用文本导入向导读入文本文件使用文本导入向导读入文本文件例例2.1 现有一数据文件以纯文本的形式存为现有一数据文件以纯文本的形式存为“e:work经济管理统计分析软经济管理统计分析软件件SPSSDATALi1_1.txt”，且第一行为变量名，请将其读入，且第一行为变量名，请将其读入SPSS。解：在解：在Open File对话框选中相应的文件名并单击对话框选中相应的文件名并单击“确定确定”，系统会自动启，系统会自动启动文本导入向导对话框如下：动文

34、本导入向导对话框如下：2.1.3.3 使用文本导入向导读入文本文件使用文本导入向导读入文本文件可以看到该向导共分可以看到该向导共分6步，这是第一步。中部为一对单选按钮，问题为步，这是第一步。中部为一对单选按钮，问题为“你的文本你的文本文件和预定义格式相一致吗？文件和预定义格式相一致吗？”，下方为按预定义格式读入的数据文件的预览。显，下方为按预定义格式读入的数据文件的预览。显然，然，SPSS的预定义格式并没有正确识别该文件。因此选择的预定义格式并没有正确识别该文件。因此选择“No”并单击并单击“下一步下一步”，系统弹出向导的下一个对话框如下：系统弹出向导的下一个对话框如下：2.1.3.3 使用文

35、本导入向导读入文本文件使用文本导入向导读入文本文件最上方的问题是最上方的问题是“你的变量是如何排列的？你的变量是如何排列的？”，下面的选项分别为，下面的选项分别为Delimite（用某（用某种字符区分）和种字符区分）和Fixed Width（固定宽度），一般都是（固定宽度），一般都是Delimite，第二个问题是，第二个问题是“变变量名包括在文件最前面了吗？量名包括在文件最前面了吗？”，我们当然选，我们当然选“Yes”,单击单击“下一步下一步”，系统弹出，系统弹出第三个对话框：第三个对话框：2.1.3.3 使用文本导入向导读入文本文件使用文本导入向导读入文本文件最上方的句子意为最上方的句子意为

36、“第一条记录从第几行开始？第一条记录从第几行开始？”，右侧可以输入行数。由于我们所用的数，右侧可以输入行数。由于我们所用的数据据第一行为变量名，因此这里输入第一行为变量名，因此这里输入2。下面的问题是。下面的问题是“你的记录是怎样存储在文件中的？你的记录是怎样存储在文件中的？”。可以是可以是“每一行代表一条记录每一行代表一条记录”，或者，或者“每每*个变量代表一条记录个变量代表一条记录”，数据一般都是第一种，数据一般都是第一种情况。下一个问题是情况。下一个问题是“你想导入多少条记录？你想导入多少条记录？”，可以是，可以是“所有记录所有记录”、“前前*条条”或或“随随机导入机导入*%的记录的记

37、录”。一般也选前者。单击。一般也选前者。单击“下一步下一步”，第四个对话框如下：，第四个对话框如下：2.1.3.3 使用文本导入向导读入文本文件使用文本导入向导读入文本文件最上方的问题为最上方的问题为“变量间用的是哪种分隔符？变量间用的是哪种分隔符？”，可选的有，可选的有Tab键、空格、逗号、键、空格、逗号、分号或自行定义的其他符号。本数据采用的是空格，可见系统已经自动识别并选择分号或自行定义的其他符号。本数据采用的是空格，可见系统已经自动识别并选择了空格，而下方的数据预览窗口显示出了正确的数据读入情况。单击了空格，而下方的数据预览窗口显示出了正确的数据读入情况。单击“下一步下一步”，第五个对

38、话框如下：第五个对话框如下：2.1.3.3 使用文本导入向导读入文本文件使用文本导入向导读入文本文件上方的提示为上方的提示为“定义在数据预览窗口中所选择的变量。定义在数据预览窗口中所选择的变量。”。顾名思义，在这个对话。顾名思义，在这个对话框中你可以在数据预览窗口中选择某一列变量，然后更改其变量名和类型。当然，框中你可以在数据预览窗口中选择某一列变量，然后更改其变量名和类型。当然，在这里我们不用这样做，直接单击在这里我们不用这样做，直接单击“下一步下一步”，系统弹出文本导入向导的最后一个，系统弹出文本导入向导的最后一个对话框如下：对话框如下：2.1.3.3 使用文本导入向导读入文本文件使用文本

39、导入向导读入文本文件最上面的问题为最上面的问题为“你愿意保存这次的文件（读入）格式设置以备下次使用吗？你愿意保存这次的文件（读入）格式设置以备下次使用吗？”，第二个问题为第二个问题为“你是否愿意将以上操作粘贴为你是否愿意将以上操作粘贴为SPSS语句？语句？”，一般这两个问题我，一般这两个问题我们都可以不管。单击们都可以不管。单击“完成完成”，系统最终成功的读入了，系统最终成功的读入了Li1_1.txt。3、读取读取EXCEL文件文件现在现在SPSS10.0以上的版本读取以上的版本读取EXCEL数据和读取数据和读取SPSS的数据并无太大差异。的数据并无太大差异。选择菜单选择菜单File=Ope

40、n=Data或直接单击快捷工具栏上的或直接单击快捷工具栏上的按钮，系按钮，系统就会弹出统就会弹出Open File对话框对话框：3、读取读取EXCEL文件文件输入文件名，选择文件类型为输入文件名，选择文件类型为EXCEL(.xls），），然后单击打开按然后单击打开按钮：钮：3、读取读取EXCEL文件文件在显示的对话框中单击在显示的对话框中单击OK按钮按钮：事实上，事实上，SPSS11.0以上版本在出现最终数据文件之前还会跳出一个以上版本在出现最终数据文件之前还会跳出一个output1 SPSS Viewer输出窗口，可以保存，也可以不保存。输出窗口，可以保存，也可以不保存。SPSS数据的

41、编辑主要包括对数据的定位、增加、删除、修改和复制等工作。SPSS数据的定位数据的定位自动定位1、按个案号码自动定位选择菜单Data=Go to case2、按变量值自动定位选择菜单Edit=Find 人工定位：适用于数据量较少的情形；（略）自动定位：按用户给出的定位条件自动寻找满足条件的第一个数据单元，适用于数据量多的情形。SPSS数据个案的插入和删除数据个案的插入和删除1、插入一个个案选择菜单Data=Insert case2、删除一个个案单击鼠标左键，选中待删除的个案，然后单击鼠标右键，从弹出菜单中选择Cut选项SPSS数据的移动、复制和删除数据的移动、复制和删除定义源数据块

42、：将鼠标移到到源数据块的左上角单元上，并拖动鼠标至源数据块的右下角单元上；单击鼠标右键：如果要清除数据块内容，则选Clear选项；如复制，选Copy；如移动，选Cut；指定目标单元：将鼠标移到目标单元的左上角，然后单击右键，选择Paste选项。SPSS能够将数据保存成多种格式的数据文件，常见的有SPSS格式文件、Excel、dbf和文本格式文件。优点缺点SPSS文件可以被SPSS软件直接读取，且能够将SPSS数据的结构和数据两部分全部完整保存下来无法被其它软件读取，通用性差Excel文件Dbf格式文件文本文件可以被相应软件直接读取。其中保存为Excel文件时，会将各变量的变量名写入Exce

43、l工作表的第一行上，且一个个案为一行；保存为Dbf文件时，会将变量名和相应的数据类型转成数据库文件的字段名和字段类型，且一个个案为一条记录；保存为文本文件时，第一种，固定格式，依据每个变量显示的宽度，将变量值数据以空格左补齐对齐；第二种以Tab键作为各数据之间的分隔符，第一行是变量名，第二行以后是数据，一个个案为一行；仅保存SPSS数据编辑窗口中的变量值，而不保存变量的其它属性。读入居民储蓄调查数据.xls文件和居民储蓄调查数据.Dat文件SPSS的运行步骤如下:录入数据定义数据整理数据统计数据察看结果 2.2 数据文件的整理数据文件的整理在在SPSS中，数据文件的编辑、整理等功能被集中在了中

44、，数据文件的编辑、整理等功能被集中在了Data和和Transform两个菜单项中，这两个菜单的内容如下所示：两个菜单项中，这两个菜单的内容如下所示：Data菜单项Transform菜单项 1. 【Sort Cases对话框对话框】 2. 【Transepose对话框对话框】2.2.1 用于数据管理的菜单项用于数据管理的菜单项Data 菜单项菜单项 3. 【Merge Files对话框对话框】 4. 【Aggregate对话框对话框】 5. 【Split File对话框对话框】 6. 【Select Cases对话框对话框】 7. 【Weight Cases对话框对话框】 8. 【Data菜单中

45、的其余对话框菜单中的其余对话框】例例2.5 对数据集对数据集li1_1.sav按按group升序，升序，x降序的次序排列。降序的次序排列。【 Sort Cases 对话框对话框】解：选择菜单解：选择菜单Data=Sort Cases，系统弹出，系统弹出Sort Cases对话框：对话框：该对话框并不复杂，其中比较特殊的是下方的该对话框并不复杂，其中比较特殊的是下方的Sort Order单选钮，有升序单选钮，有升序和降序两种选择。请注意，该单选钮是和上方的和降序两种选择。请注意，该单选钮是和上方的Sort By框一起使用的框一起使用的.请注意：请注意：group和和x后面分别跟着后面分别跟着As

46、cending和和Descending，表明前者是按，表明前者是按升序、后者按降序排列；由于升序、后者按降序排列；由于Group在前，因此排序时以在前，因此排序时以Group优先。优先。数据排序步骤：Data=sort case1、数据文件：数据加工（职工数据）.sav 按照年龄排序；按照基本工资排序；先后按年龄和基本工资排序。2、数据文件：学生成绩调查表.sav 按照年龄排序；找出数学成绩最高分和物理成绩最低分。【 Merge Files 对话框对话框】合并数据文件合并的方式增加观测量到当前数据（纵向合并）增加变量到当前数据文件（横向合并）l 纵向合并数据文件纵向合并数据文件选择

47、菜单选择菜单Data=Merge File = Add Cases，然后输入一个已存在于磁盘上的需进，然后输入一个已存在于磁盘上的需进行纵向合并处理的行纵向合并处理的SPSS数据文件名。弹出对话框如下：数据文件名。弹出对话框如下：【 Merge Files 对话框对话框】l 纵向合并数据文件纵向合并数据文件u Variables in New Working Data File 框中显示的变量名是两个数据文件中的同名变量，框中显示的变量名是两个数据文件中的同名变量，SPSS默认它们有相同的数据含义，并将它们作为合并后新数据文件中的变量；默认它们有相同的数据含义，并将它们作为合并后新数据文件中

48、的变量；u Unpaired Variables框中显示的变量名是两个数据文件中的不同名变量，变量名后面的框中显示的变量名是两个数据文件中的不同名变量，变量名后面的表示该变量是当前数据编辑窗口的变量，表示该变量是当前数据编辑窗口的变量，+表示该变量是欲插入数据文件中变量；表示该变量是欲插入数据文件中变量；u 选选Indicate case source as variable 项，可在合并后数据文件中将自动生成一个名为项，可在合并后数据文件中将自动生成一个名为source01 的变量，取值为的变量，取值为0代表个案来自第一份数据文件，取值为代表个案来自第一份数据文件，取值为1代表个案来自第二份

49、数据代表个案来自第二份数据文件；文件；l 横向合并数据文件横向合并数据文件选择菜单选择菜单Data=Merge File = Add Variables，然后输入一个已存在于磁盘上的，然后输入一个已存在于磁盘上的需进行横向合并处理的需进行横向合并处理的SPSS数据文件名。弹出对话框如下：数据文件名。弹出对话框如下：利用职工数据文件演示数据文件的纵向合并和横向合并。用于对数据进行分类汇总，所谓分类汇总就是按指定的分类变量对观测值用于对数据进行分类汇总，所谓分类汇总就是按指定的分类变量对观测值进行分组，对每组记录的各变量值求指定的描述统计量，结果可以存入新进行分组，对每组记录的各变量值求指定的描

50、述统计量，结果可以存入新数据文件，也可以替换当前数据文件。数据文件，也可以替换当前数据文件。选择菜单选择菜单Data= Aggregate, 系统弹出系统弹出Aggregate窗口：窗口：【 Aggregate 对话框对话框】上图中各个零件的含义如下：上图中各个零件的含义如下： Break Variables框：用于选择分组变量；框：用于选择分组变量； Aggregate Variables框：用于选择被汇总的变量；框：用于选择被汇总的变量； Name&Label钮：用于定义新产生的汇总变量的名称和标签；钮：用于定义新产生的汇总变量的名称和标签； Function钮：用于定义汇总函数，共有三组

51、函数，以最常用的第一组为例，可选的函数钮：用于定义汇总函数，共有三组函数，以最常用的第一组为例，可选的函数有均数、同组的第一个观测值、最后一个观测值、同组记录数、标准差、最小值、和、最有均数、同组的第一个观测值、最后一个观测值、同组记录数、标准差、最小值、和、最大值共大值共8个；个；其他不再一一介绍。其他不再一一介绍。例例2.6 计算计算Li1_1.sav中两组的血磷值标准差。中两组的血磷值标准差。【 Aggregate 对话框对话框】解：该题完全可以用更简单的方法完成，这里只是演示一下汇总对话框的解：该题完全可以用更简单的方法完成，这里只是演示一下汇总对话框的用法。用法。1. Break

52、Variables框：框：Group 2. Aggregate Variables框：框：x 3. Function钮：钮：(Standard deviation单选钮：单选钮：Continue钮钮) 4. Add aggregated variables to working data file 单选钮：选中单选钮：选中 5. OK1、利用居民储蓄调查数据，分析城镇储户和农村储户的一次平均存（取）款金额是否有显著的差异（计算各自的均值和标准差）。2、利用学生成绩调查表数据，分析数学、物理、化学、英文各科成绩的平均成绩和标准方差。【 Select Cases 对话框对话框】很多时候我们不需要分

53、析全部的数据，而是按某种要求分析其中的一部分很多时候我们不需要分析全部的数据，而是按某种要求分析其中的一部分（比如只分析男性的身高、只对前（比如只分析男性的身高、只对前200个数据进行分析以了解大概情况），个数据进行分析以了解大概情况），这时使用这时使用Select Cases对话框可以大大简化工作。对话框可以大大简化工作。该对话框界面如下所示：该对话框界面如下所示：【 Select Cases 对话框对话框】l All cases单选钮：和下面的单选钮：和下面的4个单选钮为一组，选中它则分析所个单选钮为一组，选中它则分析所有的记录；有的记录；l If condition is satis

54、fied单选钮：只分析满足条件的记录；单选钮：只分析满足条件的记录；l If按钮：和按钮：和If单选钮一起使用，单击后弹出单选钮一起使用，单击后弹出If对话框；对话框；l Random sample of cases单选钮：从原数据中随机抽样；单选钮：从原数据中随机抽样；l Sample按钮：和按钮：和Random单选钮一起使用，可以设定按百分比抽取记录，单选钮一起使用，可以设定按百分比抽取记录，或者精确设定从前若干个记录中抽取多少个记录；或者精确设定从前若干个记录中抽取多少个记录；l Based on time or case range单选钮：基于记录序号来选择记录；单选钮：基于记录序号来

55、选择记录；l Range按钮：和按钮：和Based单选钮一起使用，用于输入记录序号范围；单选钮一起使用，用于输入记录序号范围；l Use filter variable单选钮：使用筛选指示变量来选择记录，必需在下面选入单选钮：使用筛选指示变量来选择记录，必需在下面选入一个筛选指示变量，该变量取值为非一个筛选指示变量，该变量取值为非0的记录将被选中，进入以后的分析；的记录将被选中，进入以后的分析；l Filtered单选钮：和下面的单选钮：和下面的Deleted单选钮为一组，表示未被选中的记录只单选钮为一组，表示未被选中的记录只是被隔离，这些记录的记录号会被加上斜杠以示区别；是被隔离，这些记录的

56、记录号会被加上斜杠以示区别；l Deleted单选钮：未被选中的记录将被删除，一般不要使用。单选钮：未被选中的记录将被删除，一般不要使用。当对数据集做出筛选后，所做的筛选将在以后的分析中一直有效，直到再次改变选择条件为当对数据集做出筛选后，所做的筛选将在以后的分析中一直有效，直到再次改变选择条件为止。同时在多数情况下，系统会自动产生一个名为止。同时在多数情况下，系统会自动产生一个名为filter_$的筛选指示变量，被选中的记录该的筛选指示变量，被选中的记录该变量取值为变量取值为1，反之则为，反之则为0。利用居民储蓄调查数据，根据不同的分析要求采用不同的数据选取方法抽样：l 如果只希望分析城镇储

57、户的情况，则可以通过数据选择功能采用指定条件的抽样方法进行抽样；l 如果只希望对其中的70%的数据进行分析，可通过数据选择功能采用随机抽样中的近似抽样方法进行抽样。 1. 【Sort Cases对话框对话框】 2. 【Transepose对话框对话框】2.2.1 用于数据管理的菜单项用于数据管理的菜单项 3. 【Merge Files对话框对话框】 4. 【Aggregate对话框对话框】 5. 【Split File对话框对话框】 6. 【Select Cases对话框对话框】 7. 【Weight Cases对话框对话框】 8. 【Data菜单中的其余对话框菜单中的其余对话框】【 Tran

58、sepose对话框对话框】该对话框用于对数据进行行列转置，可以在原数据文件中该对话框用于对数据进行行列转置，可以在原数据文件中指定一个变量记录转置后的变量名。原变量名则自动保存指定一个变量记录转置后的变量名。原变量名则自动保存在系统产生的名为在系统产生的名为case_lbl的字符变量中。的字符变量中。该对话框也非常简单，左侧为候选变量框；右上方为该对话框也非常简单，左侧为候选变量框；右上方为Variable框，用于选框，用于选入需要转置的变量，一般应选入除名称变量外的所有其他变量，如果有变入需要转置的变量，一般应选入除名称变量外的所有其他变量，如果有变量未选入，则转置时会被自动丢弃；右下方为量

59、未选入，则转置时会被自动丢弃；右下方为Name Variable框，用于指框，用于指定原数据文件中记录转置后变量名的字符变量，但不是必需的，此时系统定原数据文件中记录转置后变量名的字符变量，但不是必需的，此时系统会将新变量自动按会将新变量自动按var001、var002.的顺序命名。的顺序命名。【 Split File 对话框对话框】用于将数据文件分组进行处理，该对话框我们在第一章时已经使用过了，用于将数据文件分组进行处理，该对话框我们在第一章时已经使用过了，这里再介绍一下各个对话框元素的用途：这里再介绍一下各个对话框元素的用途：l Analyze all cases单选框：和下面的两个单选框

60、为一组，选中单选框：和下面的两个单选框为一组，选中本框不拆分文件；本框不拆分文件；l Compare groups单选框：按所选变量拆分文件，各组分析结单选框：按所选变量拆分文件，各组分析结果紧挨在一起便于相互比较；果紧挨在一起便于相互比较；l Organize output by groups单选框：按所选变量拆分文件，各单选框：按所选变量拆分文件，各组分析结果单独放置；组分析结果单独放置；l Groups based on框：用于选择拆分数据文件的变量；框：用于选择拆分数据文件的变量；l Sort the file by grouping variables单选框：将数据按所用的拆单选框：

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

spss数据文件的建立与整理

文档简介

温馨提示

最新文档

评论

spss数据文件的建立与整理

文档简介

温馨提示

最新文档

评论

相关文档