![第二章 数据文件的建立和管理_第1页](http://file2.renrendoc.com/fileroot_temp3/2021-7/4/e427a176-cd1d-424b-8a18-86f68a58ba36/e427a176-cd1d-424b-8a18-86f68a58ba361.gif)
![第二章 数据文件的建立和管理_第2页](http://file2.renrendoc.com/fileroot_temp3/2021-7/4/e427a176-cd1d-424b-8a18-86f68a58ba36/e427a176-cd1d-424b-8a18-86f68a58ba362.gif)
![第二章 数据文件的建立和管理_第3页](http://file2.renrendoc.com/fileroot_temp3/2021-7/4/e427a176-cd1d-424b-8a18-86f68a58ba36/e427a176-cd1d-424b-8a18-86f68a58ba363.gif)
![第二章 数据文件的建立和管理_第4页](http://file2.renrendoc.com/fileroot_temp3/2021-7/4/e427a176-cd1d-424b-8a18-86f68a58ba36/e427a176-cd1d-424b-8a18-86f68a58ba364.gif)
![第二章 数据文件的建立和管理_第5页](http://file2.renrendoc.com/fileroot_temp3/2021-7/4/e427a176-cd1d-424b-8a18-86f68a58ba36/e427a176-cd1d-424b-8a18-86f68a58ba365.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2021-7-41 第二章第二章 数据文件的建立和管理数据文件的建立和管理 2021-7-42 本章主要内容本章主要内容 第一节 SPSS数据文件 第二节 SPSS数据的结构和定义方法 第三节 SPSS数据的录入和编辑 第四节 SPSS数据的保存 第五节 读取其他格式的数据文件 第六节 SPSS数据文件的合并 2021-7-43 第一节 SPSS数据文件 1、 SPSS数据文件的特点: SPSS数据文件有 别于其他文件,是一个有特殊格式的文件,它 是一种有结构的数据文件,它由数据结构和内 容两部分组成,其中,数据结构记录数据变量 的名称、类型、变量宽度、小数位数、变量名 标签、变量值标签、缺失
2、值、显示宽度、对齐 方式和度量尺度等必要信息,内容才是那些待 分析的具体数据。 基于上述特点,建立SPSS数据文件时应完成两 项任务,即描述数据的结构和录入编辑数据。 2021-7-44 数据编辑窗口中的一行称为一个个案或记 录(Case),所有个案组成SPSS数据文件 的内容。数据编辑窗口的一列称为一个变 量(Variable),每个变量都有一个名字, 称为变量名,它是访问和分析SPSS每个变 量的唯一标志。 SPSS数据文件的结构就是 对每个变量及相关特征的描述。 2、SPSS数据的组织方式 (1)原始数据的组织方式 2021-7-45 (2)频数数据的组织方式 例: 职职 称称 年龄段年
3、龄段 35岁以下岁以下 (1) 3649岁岁 (2) 50岁以上岁以上 (3) 教授(教授(1)0158 副教授(副教授(2)10202 讲师(讲师(3)20101 助教(助教(4)3520 2021-7-46 频数数据的组织方式 职称年龄段人数 110 1215 138 2110 2220 232 3120 3210 331 4135 422 430 2021-7-47 第二节 SPSS数据的结构和定义方法 SPSS数据的结构是对SPSS每列变量及其 相关属性的描述,主要包括变量名、数 据类型、变量宽度、小数位数、变量名 标签、变量值标签、显示宽度、缺失值、 对齐方式、度量尺度等信息。 20
4、21-7-48 变量名(Variable name) 变量名是变量访问和分析的唯一标志。在定义SPSS 数据结构时应首先给出每列变量的变量名。变量的命 名规则如下: 1. 应以英文字母或汉字开头,后面可跟除了!、?、* 之外的字母或数字,下划线、圆点不能作为变量名的 最后一个字符。SPSS允许用汉字作为变量名。 2.变量名的字符个数最好不多于8个;变量名不区分大小 写字母。 3. SPSS有默认的变量名,以字母“VAR”开头,后面补足 5位数字,如VAR00001,VAR00002等。变量名不能与 SPSS内部特有的具有特定含义的保留字同名,如ALL, BY,AND,NOT,OR等。 4.变量
5、名最好与其代表的数据含义相对应,每个变量名必 须具有唯一性。 2021-7-49 数据类型(Type) 数据类型是指每个变量取值的类型。SPSS 中有三种基本数据类型:数值型、字符型和日 期型。 数值型数值型 (1)标准型(Numeric) (2)科学记数法型(Scientific Notation) (3)逗号型(Comma) (4)圆点型(Dot) (5)美元符号型(Dollar) (6)用户自定义型(Custom Currency) 字符型(字符型(String) 日期型(日期型(Date) 数据类型表数据类型表 SPSS变量变量 类型类型 系统默系统默 认长度认长度 小数小数 位数位数
6、 输入方式输入方式显示方式显示方式范例范例 输入输入显示显示 Numeric82标准格式或科学标准格式或科学 记数法记数法 标准格式数值变量圆标准格式数值变量圆 点表示小数点的数值点表示小数点的数值 38.4238.42 Comma82带逗点的数值或带逗点的数值或 科学记数法科学记数法 圆点做小数点,逗点圆点做小数点,逗点 做三位分割符的数值做三位分割符的数值 1,343,438.11,343,438.1 Dot82带圆点的数值或带圆点的数值或 科学记数法科学记数法 逗点做小数点,圆点逗点做小数点,圆点 做三位分割符的数值做三位分割符的数值 34,3434E23.434,34 Scietifi
7、c notation 82科学记数法科学记数法 或标准格式或标准格式 科学记数法科学记数法457.8E4457.8E4 Date日期格式非常多日期格式非常多显示格式非常多显示格式非常多 Dollar82可带可带$或不带或不带$输输 入或科学记数法入或科学记数法 有效数值前带有效数值前带$以逗以逗 点为分割符点为分割符 $12343$12343 Custom Currency String8无无一串字符串一串字符串一串字符串一串字符串BelieveBelieve 2021-7-411 数值型数值型 数值型是SPSS最常用的数据类型,通常 由阿拉伯数字和其它特殊符号等组成。 其中的标准型(nume
8、ric)是SPSS默认的 数据类型,默认的显示宽度为8位,包括 正负符号位、小数点和小数位在内,小 数位默认为2位。如果数据的实际宽度大 于8位,spss将自动按照科学计数法显示, 数据的显示并不影响数据的存储,也不 影响数据的计算。 2021-7-412 字符型字符型 字符型也是SPSS较常用的数据类型, 由一个字符串组成。如职工号码、姓名、 地址等变量都可以定义为字符型数据。 字符型数据的默认显示宽度为8个字符, 不能够进行算术运算,并区分大小写字 母。字符型数据在SPSS命令处理过程中 应用一对双引号括起来,但在输入数据 时不应输入双引号,否则双引号将会作 为字符型数据的一部分。 202
9、1-7-413 日期型日期型 日期型数据用来表示日期或者时间, 如生日、成立日期等变量可以定义为日 期型数据。显示格式:dd-mmm-yyyy; mm/dd/yyyy等等。 2021-7-414 变量宽度(Width)、列宽度(Columns) 每种类型的变量都有自己的变量宽 度、小数位和显示宽度,其中变量宽度 是变量允许的最大字符位数,列宽度是 数据编辑窗口中显示每列的字符位数。 通常这两个宽度是一致的。 2021-7-415 变量名标签(Variable label) 变量名标签是对变量名含义的进一 步解释说明,它可以增强变量名的可视 性和统计分析结果的可读性。变量名标 签可用中文,总长度
10、可达120个字符,但 在统计分析结果的显示中一般不能显示 如此长的变量名标签信息。 2021-7-416 变量值标签(Value label) 变量值标签是对变量取值含义的解释说 明信息,对于品质型数据尤为重要,比如1 代表男性,2代表女性,它不但明确了数据 的含义,也增强了最后统计分析结果的可读 性,变量值标签可以用中文。 2021-7-417 缺失数据(Missing values) 数据中存在明显错误或明显不合理的数据或漏 填数据项时统计学上称为不完全数据或缺失数据。 数据中如果存在缺失数据,分析时通常不能直接采 用,要进行说明。SPSS中说明缺失数据的方法是 指定用户缺失值。这样,sp
11、ss在分析时,就能够将 这些缺失值与正常的数据区分开来,并依据用户指 定的缺失值处理策略对其进行处理或分析。Spss还 有一类默认的缺失值,称为系统缺失值,数值及日 期型变量用圆点表示,字符型变量用空表示。 2021-7-418 SPSS中说明缺失数据的基本方法是指 定用户缺失值。用户缺失值可以是: G对字符型或数值型变量,用户缺失值可以 是1至3个特定的离散值(Discrete missing values); G对一个数值型变量,用户缺失值可以在一 个连续的闭区间内并同时再附加一个区间 以外的离散值(Range plus one optional discrete)。 2021-7-419
12、 SPSS用户缺失值定义窗口 2021-7-420 变量对齐格式(Align) 定义显示对齐方式,对齐方式分为 右对齐、左对齐和中间对齐。系统中, 数值型变量默认为右对齐,字符型变量 默认为左对齐。 2021-7-421 计量尺度(Measure) 统计学依据数据的计量尺度将数据划 分为三大类,即数值型数据(Scale),如 身高、体重;顺序型数据(Ordinal),如职 称、职务、对某事物的赞同程度;分类型数 据(Nominal),如民族、宗教信仰、性别、 党派。数值型数据通常用数字表示;顺序型 数据具有内在固有大小或高低顺序,但它又 不同于数值型数据,一般用非数字表示;分 类型数据没有内在
13、固有大小或高低顺序,一 般用非数字表示。 2021-7-422 SPSSSPSS中变量定义的操作中变量定义的操作 单击单击Variable View 进入:进入: 单击单击, 定义定义 变量变量 名名 单击,定义单击,定义 变量类型变量类型 定义变量标签定义变量标签 变量值变量值 标签标签 定义计量尺度定义计量尺度 定义变定义变 量宽度量宽度 定义定义 对齐对齐 方式方式 定义变量类定义变量类 型对话框型对话框 定义变量值定义变量值 标签对话框标签对话框 定义变量缺省定义变量缺省 值对话框值对话框 2021-7-423 通常建立SPSS数据文件时应首先定义数据 的结构部分,然后再输入数据,但实
14、际应 用中,边录入、边分析、边修改数据结构 的情况也是常见的。数据的结构定义完成 之后,可以在Variable View卡片中浏览,也 可以通过菜单选项Utilities/Variable来实现。 2021-7-424 02-1 SPSS数据文件的建立举例 根据居民储蓄调查数据,建立SPSS格式 的数据文件。 2021-7-425 第三节 SPSS数据的录入与编辑 1.录入 定义好SPSS数据结构后,可将具体的数 据输入到SPSS中,最终形成SPSS数据文件。 SPSS数据的录入操作在数据编辑窗口中的 Data View卡片中实现。其操作方法与Excel 基本类似,也是以电子表格的方式进行录入
15、。 录入带有变量值标签的数据时,可以在下拉 按钮中的值标签列表中选择一个输入。 2021-7-426 2.SPSS数据的编辑 数据必须输入正确才能保证正确的分析 结果。但很难一次输入正确,所以就需要进 行修改,一般包括数据的定位、插入、删除、 修改、复制等。 2021-7-427 (1) SPSS数据的定位 数据的定位目的是将当前数据单元定位 到某个特定的单元中。有两种定位方式: 1)按个案号码定位:EditGo to Case 将当前单元格定位在任何单元格中,选择菜 单EditGo to Case ,出现如下对话框, 输入欲定位的个案号码并确认。 输入要寻找观输入要寻找观 测量序号测量序号
16、2021-7-428 2)按变量值定位: EditFind 将当前单元定位在某变量列的任何一个个案上 选择菜单 EditFind ,出现如下对话框 输入定位变量值并确认 于是, SPSS自动对指定的变量进行搜索,并将当 前单元定位于定位变量值相等的第一个个案上。 2021-7-429 (2) 插入和删除一个个案 插入一个个案,即在数据编辑窗口的 某个个案前插入一个新个案:将当前数据单 元确定在一个个案上,选择菜单 Edit Insert Case(或工具栏插入个案图标按钮) 删除一个个案,在欲删除的个案号码上 单击鼠标左键,于是待删除的个案数据全部 反向显示;单击鼠标右键,从弹出菜单中选 择c
17、ut选项。 2021-7-430 (3)插入和删除一个变量 插入一个变量,即在数据编辑窗口的 某个变量前插入一个新变量:将当前数据单 元确定在一个变量上,选择菜单 Edit Insert Variable 删除一个变量,在欲删除的变量名上单 击鼠标左键,于是待删除的数据全部反向显 示;单击鼠标右键,从弹出菜单中选择cut 选项。 2021-7-431 (4)数据的移动、复制和删除 数据的移动、复制和删除:与一般的 应用程序相同 选择操作对象(变量、个案、若干连续单元等) 剪切:Edit Cut(Ctrl+X) 复制:Edit Copy(Ctrl+C) 粘贴:Edit Paste(Ctrl+V)
18、 恢复删除或修改前数据 Edit Undo (或工具栏Undo图标按钮) 2021-7-432 插入变量与删插入变量与删 除变量除变量 插入个案与插入个案与 删除个案删除个案 数据的剪数据的剪 切、粘贴切、粘贴 与复制与复制 1.插入变量插入变量 在添加处单击 Var,单击右鼠 标键出现右侧 对话框, 单击 Insert Variables 2.删除变量删除变量 1.插入个案插入个案 在添加处单击 观测量,单击 右鼠标键出现 右侧对话框, 单 击Insert Case 2.删除个案删除个案 剪切剪切复制复制 粘贴粘贴 若想恢复,打开若想恢复,打开EditUndo 2021-7-433 SPSS
19、支持的数据格式 1、SPSS文件格式,扩展名为.sav 2、Excel格式文件,扩展名为.xls 3、dbf格式文件,扩展名为.dbf 4、文本格式文件,扩展名为.dat 第四节 SPSS数据的保存 2021-7-434 将数据保存为SPSS数据文件或其他格式的数 据文件的基本操作是: nFileSave, 对于新的:提示文件名和类型; 对于旧的,覆盖原来的,不再提问; nFileSave As,另存一个数据文件,也有格式 (类型)问题; nVariable按钮允许用户指定保存哪些变量,不保 存哪些变量,变量名前画叉的变量将被保存到 磁盘中。 n将数据保存为Excel文件格式时,Write v
20、ariables names to spreadsheet选项呈可用状态,它的作 用是指定是否将SPSS变量名写入Excel工作表的 第一行上。 2021-7-435 第五节 读取其他格式的数据文件 SPSS能够直接读取其他格式的数据 文件,并将其保存为SPSS格式的数据。 1.直接读取其他格式的数据文件:(1)选 择菜单File Open Data;(2)选择 数据文件的类型,并输入数据文件名。 2.使用数据库查询打开 利用通用数据库ODBC接口读取数据文件 在9.0及以前版本中非常重要 3.使用文本向导读入文本文件:选择菜单 File Read Text Data 2021-7-436 直
21、接打开直接打开 SPSS可以直接读入许多格式的数据文件,其中就包括EXCEL各个版 本的数据文件。选择菜单FileOpenData或直接单击快捷工具 栏上的Open File按钮,系统就会弹出Open File对话框,单击“文 件类型”列表框,在里面能看到直接打开的数据文件格式,分别是: 2021-7-437 注:注:读入Excel文件时,SPSS默认将 Excel工作表中的全部数据读到SPSS数据 编辑窗口,但也可以指定仅读取工作表中 某个区域内的数据(如A5:B10)。工作 表上的一行数据为SPSS中的一个个案。 如果Excel工作表文件第一行或指定 读取区域内的第一行存储了变量名信息,
22、则应选择Read variable names项,即以第 一行的文字信息作为SPSS的变量名,否则 不选。 2021-7-438 使用数据库查询打开 SPSS可以直接打开许多类型的数据文件,但这并不是说它可 以打开所有类型的数据文件,比如FoxPro 3.0以上版本的*.dbf 文件就不能直接打开。为此,SPSS还提供了另一个适用范围更 广、较为专业的数据接口数据库查询。 实际上,SPSS在这里使用的是一种叫ODBC(Open Database Capture)的数据接口,该接口被大多数数据库软件和办公软件 (如MS Office)支持,通过它,应用程序可以直接访问以结构 化查询语言(SQL)
23、做为数据访问标准的数据库管理系统。 选择菜单File Open Database New Query,系统会弹出数 据库向导的第一个窗口,其中会列出你使用的机器上已安装的 所有数据库驱动程序,选中所需的数据源,然后单击下一步, 向导会一步一步的提示你如何做,直至将数据读入SPSS。 2021-7-439 使用文本导入向导读入文本文件 选择菜单FileRead Text Data,系统就会弹出 Open File对话框,和前面的情况完全一样,只是 文件类型自动跳到了Text (*.txt)。实际上,该功能 在SPSS中已被整合到了Open File对话框中之所以 在菜单上保留该条目的原因是读入纯
24、文本的情况 非常普遍,放在这里更加醒目。 02-2举例:创建一个以纯文本的形式保存的数据 文件,且第一行为变量名,请将其读入SPSS。 在 File Read Text Data对话框选中相应的文件 名并单击“确定”,系统会自动启动文本导入向 导对话框如下: 2021-7-440 Spss是否已经正确的识 别和分割了数据项 2021-7-441 数据间如何分割 数据文件的第一行上是否有变量名 2021-7-442 数据部分从文本文件的第几行开始 个案数据在文本文件中是如何安排的 2021-7-443 指定文本文件的分割符号字符型数据表示方法 2021-7-444 2021-7-445 2021-7-446 第六节 SPSS数据文件的合并 当数据量较多时经常会把一份大的数据分成几 个小的部分,有几个录入员分别录入,以期加快数 据录入速度,但一份完整的数据被分别存储在几个 数据文件中,如果要分析这份数据就必须首先将若 干个小的数据文件合并起来。要实现两个或多个 SPSS数据文件的合并,应首先将其中的某个数据 文件读入数据编辑窗口中,然后依次与
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年南京地铁运营有限责任公司秋季招聘笔试参考题库附带答案详解
- 《第二单元 创建高级动画 第7课 遮罩动画 简单的遮罩动画》教学设计教学反思-2023-2024学年初中信息技术人教版八年级上册
- 2024年度湖南省国家保安员资格考试提升训练试卷A卷附答案
- 2025至2031年中国湿法综合过滤消烟除尘器行业投资前景及策略咨询研究报告
- 2025至2031年中国热饮柜行业投资前景及策略咨询研究报告
- 2025年低压型多防区周界安防报警主机项目可行性研究报告
- 初中音乐合唱课《踏雪寻梅》情境化教学设计与运用
- 商业空间中的生态交互设计研究
- 拉康理论视角下李商隐无题诗研究
- 基于混合现实的机械臂远程控制技术研究
- 2024年航空职业技能鉴定考试-航空乘务员考试近5年真题附答案
- 2021上海春考作文题解析及范文(怎样做与成为什么样人)
- 医疗器械采购投标方案(技术方案)
- 教育培训行业抖音号运营推广策划方案课件
- 2024-2030年全球及中国水杨酸行业市场现状供需分析及市场深度研究发展前景及规划可行性分析研究报告
- 山东省德州市德城区2023-2024学年八年级下学期期末考试数学试卷(含答案)
- 人教版八年级历史下册教材插图
- 医院运营管理案例-北大国际医院-利用精益管理提升患者体验
- 职业技术学院《酒店财务管理》课程标准
- 【苏教版信息科技】三年级下册8.1《认识自主可控》教案
- 2024-2030年中国润滑油行业发展趋势与投资战略研究报告
评论
0/150
提交评论