[法学]SPSS数据的录入课件_第1页
[法学]SPSS数据的录入课件_第2页
[法学]SPSS数据的录入课件_第3页
[法学]SPSS数据的录入课件_第4页
[法学]SPSS数据的录入课件_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第一讲数据输入学习目的 学会常用数据的录入方法 掌握资料录入前的工作本章主要内容一 录入数据 录入单选数据 录入多选数据二 统计分析前的准备工作,包括: 资料的审查 资料编码一 录入单选数据变量/指标名称变量/指标类型变量/指标的显示方式录入数据2022/7/20SPSS11.0变量定义项目SPSS11.0中变量定义的一共有10个项目:变量名(name)、变量类型(type)、变量长度(width)、小数位数(decimals)、变量标签(label)、变量值标签(values)、缺省值(missing)、变量显示宽度(columns)、变量对齐方式(align)、变量测量尺度(measure

2、)。注意区分变量的标签(Variable Labels)与变量值的标签(Value Labels)。2022/7/20定义变量步骤:首先启动SPSS,进入 SPSS 的主画面 - 数据编辑窗口激活定义变量对话框定义变量名定义变量类型定义变量标签和变量值标签定义变量的显示格式 2022/7/20定义变量名 定义变量名应遵循如下原则: (1)变量名最长不超过8个字符(4个汉字)。 (2)首字符必须是英文字母或汉字,不能以下划线“”或圆点“.”结尾。 (3) 变量名不能使用SPSS的保留字。SPSS的保留字有:ALL、AND、BY、OR、NOT、EQ、GE、GT、LE、LT、NE、TO、WIIH等。

3、 (4)变量名中不能有空格或某些特殊符号,如!、?和等。 (5)系统中不区分变量名中的大小写字符。例如WANG与wang被认为是同一变量。定义变量标签(Variable Label) 定义标签是对该变量名所表示的数据项内涵的进一步说明。由于变量名最多只能由8个字符组成,8个字符不足以表示该变量的内涵。而变量标签最多可由256个字符组成。在统计分析过程的输出中会在变量名对应的位置显示该变量的标签,有助于理解输出结果。变量标签为可选项(option),可以定义,也可以不定义。2022/7/20定义变量取值标签(Value label) 每个变量名对应一个数据项,每个变量取不同的值,表示数据项中的不

4、同信息。有时为了更好理解统计分析过程中的输出结果,要给变量的取值(简称变量值)赋以标签。那么在输出结果的相应位置上就会出现该标签,使读者一目了然。并不是所有变量值都要取标签,一般来说离散变量才给变量值定义标签。2022/7/20例如:变量名 变量值 变量取值(标签)Gender 1 男2 女赠送精美图标1、字体安装与设置如果您对PPT模板中的字体风格不满意,可进行批量替换,一次性更改各页面字体。在“开始”选项卡中,点击“替换”按钮右侧箭头,选择“替换字体”。(如下图)在图“替换”下拉列表中选择要更改字体。(如下图)在“替换为”下拉列表中选择替换字体。点击“替换”按钮,完成。122、替换模板中的

5、图片模板中的图片展示页面,您可以根据需要替换这些图片,下面介绍两种替换方法。方法一:更改图片选中模版中的图片(有些图片与其他对象进行了组合,选择时一定要选中图片 本身,而不是组合)。单击鼠标右键,选择“更改图片”,选择要替换的图片。(如下图)注意:为防止替换图片发生变形,请使用与原图长宽比例相同的图片。12定义变量类型变量类型种类(见下表):Numeric“ 标准数值型变量,系统默认Comma 带逗点的数值型变量:千进位用逗号分隔, 小数与整数间用圆点分隔“Dot” 圆点数值型变量:千进位用圆点分隔,小数与整数间用逗号分隔“Scientific notation” 科学计数法“Date” 日期

6、型变量“Dollar” 带美元符号的数值型变量“Custom currency” 自定义变量String 字符型变量2022/7/20变量的类型SPSS变量类型系统默认长度小数位数输入方式显示方式范例输入显示Numeric82标准格式或科学记数法标准格式数值变量原点表示小数点的数值38.4238.42Comma82带逗点的数值或科学记数法原点做小数点,逗点做三位分割符的数值1,343,438.11,343,438.1Dot82带圆点的数值或科学记数法逗点做小数点,原点做三位分割符的数值34,3434E23.434,34Scietific notation82科学记数法标准格式或科学记数法457

7、.8E4457.8E4Date日期格式非常多显示格式非常多Dollar82可带$或不带$输入或科学记数法有效数值前带$以逗点为分割符$12343$12343Custom CurrencyString8无一串字符串一串字符串believebelieve 概率事件(观测量):在数据编辑器的二维表中, 每列为一个变量,每行记录 一次观测(Case)一次观测的值 输入数据数据编辑器录入数据定义缺省值2022/7/20数据录入 数据录入的一般方式:(1)按变量输入数据(2)按观察序号输入数据(3)按全屏幕任意单元格输入数据 2022/7/20保存数据单击保存类型列表框,可以看到SPSS所支持的各种数据类

8、型,有DBF、FoxPro、EXCEL、ACCESS等,这里我们仍然将其存为SPSS自己的数据格式(*.sav文件)。在文件名框内键入变量名并回车,可以看到数据管理窗口左上角由Untitled变为了现在的新变量名。 SPSS for Windows提供两种数据保存方式:1.保存为SPSS for Windows数据文件中2.保存为其他格式的数据文件SPSS的文件类型数据文件:扩展名为.sav结果文件:扩展名为.spo图形文件:扩展名为.cht命令文件:扩展名为.spsSPSS11.0中变量定义的操作单击Variable View 进入;单击,定义变量名单击,定义变量类型定义变量标签变量标签值定

9、义测度层次定义变量宽度定义对齐方式 定义变量类型对话框 定义变量标签值对话框定义变量定义缺省值对话框定义数值长度和小数点位数2022/7/20资料审查资料编码一、统计分析前的准备工作2022/7/20资料审查主要考察三个方面:资料的完整性资料的统一性资料的合格性2022/7/20资料的完整性 包括资料总体上的完整性和每份资料的完整性。资料总体的完整性主要考虑问卷发放的数量、回收率等。每份资料的完整性主要看问卷的填答情况,是否是有效问卷。2022/7/20资料的统一性审查检查所有问卷、报表填答的方法是否统一。检查统一指标的数值所使用的量度单位是否统一,不同的表格对同一指标所使用的计算方法是否统一

10、。对于统计资料,尤其要注意:指标的定义和分析的标准是否与自己的研究分类相一致;审查指标总体范围是否一致2022/7/20资料的合格性审查审查提供资料者的身份是否符合规定的调查对象的身份。审查所提供的资料是否符合填答的要求。审查所提供的资料是否正确。通常有三种方法:判断检验:依据已知情况来判断是否真实正确。逻辑检验:从资料的逻辑关系来检验是否正确。计算检验:通过各种数字的运算来检验是否正确。2022/7/20编码几个基本概念编码变量与取值变量标签与取值标签2022/7/20几个基本概念编码:将文字资料转化为数字形式的过程。编码的过程实质上就是确定变量、变量取值以及选择的过程2022/7/20变量

11、与变量取值变量:变量是概念的一种类型,是概念的具体化。概念是对研究范围内同一类现象的概括性表述。概念、变量、陈述、形式共同构成了理论。例如,公民这一概念,具体化为一个国家的所有公民后,就成为了变量。变量反映了概念的可变动性,说明了现象在规模、重量、密度、速度等方面的变化。(袁方)反映对象某一特性的指标。例如,性别、年龄等变量取值:是变量所有可供选择的范围。例如性别的取值范围是男、女,那么;年龄的取值范围是0-100岁(当然有长寿的)。变量标签(label)与取值标签(value label) 标签:标签是对物体的说明,是对物体信息的描述。例如,中药箱子里的标签是提醒医生药的具体地点;商品标签则

12、说明了商品的产地、质量、品牌等信息。 变量标签是对变量的说明。例如gender=“性别” 取值标签是对取值的说明。例如1=男,2=女。比如:您的性别:(1)男 (2)女变量变量的取值选择为 2这种情况被称为预先编码编码就是确定变量、变量取值和变量取值标签(选择)又比如:您认为打工的外地人对太原市的社会秩序是否有影响?(单选) 1有很大影响 2有较大影响 3没有影响 4不好说 4编码选择这种情况被称为边缘编码再比如:您有几个儿子?几个女儿? 1儿子_人 2女儿_人 23问题变量1变量2变量1的值变量2的值2022/7/20还比如:请将您的父母的学历写在下面的横线上。 父亲:中学 母亲: 小学 编

13、码步骤是:(1)编码:将学历按照“未上过学”=1,“小学”=2,“中学”=3依次列出(2)各变量为“父亲学历、母亲学历”,取值为“未上过学,小学,中学,”(3)输入问卷时,按照编码中的“小学”=2,“中学=3”输入“父亲学历 3”,“母亲学历 2”即可。这种情况称为事后编码,要尽量少用。附带说明:关于无回答与不适用的编码无回答:建议采用“99”/”9”/”999”等作为无回答的编码不适用:采用“98”/998”等作为编码2022/7/20几种常见的编码方式封闭性问卷单项选择题多项选择题多项排序选择题固定选择项不固定选择项开放性问卷2022/7/2021变量变量2022/7/20有6个选项,故应

14、设6个变量,运用0-1编码方法编码,即:1,0,1,0,1,1。此外,多选还有另外一种编码方法,即直接编码输入法,编码为1,3,5,6, , 。(此处“ ”表示无回答,我们建议使用“99”)1 3 5 62022/7/203 1 6问题012:您择业中考虑的主要因素有(依据重要性大小排列,限选三项)1 经济收入 2 专业对口 3 发展前途 4 地理区位5 个人爱好 6 风险大小7 劳动强度 8 社会福利9 社会地位 10 其他 因为是依据重要性大小排列,限选三项,故应设三个变量,编码依次为3,1,6。2022/7/20例如:择业中考虑的主要因素(依据重要性先后排列)1、经济收入 2、专业对口

15、3、发展前途 4、地理区位5、个人爱好 6、风险大小7、劳动强度 8、社会福利9、其他3 1 6 4 7 8 5因为是依据重要性排列,不限制选项,故应设九个变量,编码依次为:3,1,6,4,7,8,5,99,99。(利用99表示未回答或者空)2022/7/20择业中考虑的主要因素(多选)1、经济收入 2、专业对口 3、发展前途 4、地理区位5、个人爱好 6、风险大小7、劳动强度 8、社会福利9、其他编码应为:1,0,1,1,1,0,1,1,0。或1,3,4,5,7,8,0,0,0。(此处用0表示未选择)应该设置9个变量,2022/7/20开放性问卷的处理方法对回答进行分类。一般首先随机抽取一部

16、分问卷,了解回答的情况,依据回答对问卷进行分类,主要考虑语气强弱、观点确定等方面。建立回答类别与对应的数量关系,进行编码。2022/7/20课堂作业1某班学生人数 ,试建立数据。男生女生合计20-21岁1292122-23岁8624合 计20152022/7/20课堂作业2某农村人口的受教育程度。未上过学小学初中高中青年282025中年515126老年126412022/7/20课堂作业3将以下数据录入计算机。1.某单位52名职工的年龄6966626060575654535352525049484848474747464646454544444342424241414140403939383737373535352222212121232

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论