《定量分析工具SPSS》PPT课件.ppt_第1页
《定量分析工具SPSS》PPT课件.ppt_第2页
《定量分析工具SPSS》PPT课件.ppt_第3页
《定量分析工具SPSS》PPT课件.ppt_第4页
《定量分析工具SPSS》PPT课件.ppt_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、,第二讲 定量分析工具SPSS,简介,一、什么是SPSS,SPSS(Statistics Package for Social Science)是一种运行在Windows系统下最适用于社会科学的统计软件包。 SPSS软件从1968年由美国斯坦福大学开发使用至今,已经拥有全球数以万计的用户,成为世界上应用最广泛的专业统计软件之一。,该软件包集数据整理、分析过程、结果输出等功能为一体,采用窗口操作界面,统计分析方法涵盖面广,用户操作使用方便,输出数据表格图文并貌,并且随着它的功能不断完善,统计分析方法不断充实,大大提高了统计分析工作的效率。,SPSS 统计分析过程包括描述性统计、均值比较、一般线性

2、模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类; 每类中又分好几个统计过程,如均值比较; 每个过程中又允许用户选择不同的方法及参数。,二、SPSS系统运行的环境要求,SPSS10.0以上版本软件包可以工作在两种模式下,单机模式和作为网络系统的用户界面模式。 SPSS软件包可以运行在微软公司的Windows 98、Windows ME、Windows 2000和Windows XP操作系统之下。 由于统计分析软件的数据量比较大,所以系统运行需要大于16M以上空间。,1、启动Windows后,把SPSS系统安装软盘(或光盘)插入软驱(或光驱),

3、并找到SPSS的安装程序的可执行文件Setup.exe。 2、双击 Setup.exe 文件,安装程序向导将给出每一步操作的提示。在出现Welcome窗口后,选择Next进入下一步。 3、安装程序显示Software License Agreement对话框时,选择Yes接受显示的协议条款。,三、SPSS软件包的安装,4、选择把SPSS 安装到哪个文件夹(目录),默认文件夹为程序文件目录下的SPSS 目录(如“C:Program FilesSPSS”)。如果要改变安装目录,按Browse选择新的目录。然后单击Next按钮。 5、在User Information窗口中输入Name(姓名)、Or

4、ganization(组织单位)、Serial Number(产品序列号) ,然后单击Next按钮。,6、根据需要选择安装类型:Typical(典型安装)、 Compact(最小安装)、Custom(定制安装) 。这里假设要进行定制安装,所以选择Custom。按Next进入下一步。 7、选择要安装的部件。 8、根据授权情况选择个人安装或共享安装。 9、输入许可证号,单击Next。 10、单击Finish按钮,结束SPSS 安装过程。,四、SPSS的运行方式,SPSS提供了3种基本运行方式:完全窗口菜单方式,程序运行方式、混合运行方式。 程序运行方式和混合运行方式是使用者从特殊的分析需要出发,编

5、写自己的SPSS命令程序,通过语句直接运行。,本课程只介绍完全窗口菜单管理方式,这种操作方式简单明了,除数据输入工作需要键盘外,大部分的操作命令、统计分析方法的实现是通过菜单、图标按钮、对话框来完成的。 非常适用于一般的统计分析人员和一般统计方法的应用者。,五、SPSS软件包的启动,单击Windows 的开始按钮(如图所示),在程序菜单项SPSS for Windows中找到SPSS 11.5 for Windows并单击。,Run the tutorial:运行操作指南; Type in data:输入数据选项,建立新的数据集时可选择此项; Run an existing query:运行一

6、个已经存在的数据文件选项; Create new query using Database Wizard:用数据库处理工具建立新文件;,Open an existing date source:打开一个已经存在的数据文件; Open another type of file:打开其他类型的文件。 Dont show this dialog in the future:是一复选对话框,选中该复选项后,下次启动SPSS时将不会显示对话框,直接显示数据编辑窗口。,六、SPSS的主界面与数据输入,File:文件管理菜单,有关文件的调入、存储、显示和打印等; Edit:编辑菜单,有关文本内容的选择、拷贝

7、、剪贴、寻找和替换等; View:“视图”菜单,显示或隐藏状态行、工具栏、网络线、值标签和改变字体。,七、数据编辑窗口的主菜单,Data:数据管理菜单,有关数据变量定义、数据格式选定、观察对象的选择、排序、加权、数据文件的转换、连接、汇总等; Transform:数据转换处理菜单,有关数值的计算、重新赋值、缺失值替代等;,Analyze:统计菜单,有关一系列统计方法的应用; Graphs:作图菜单,有关统计图的制作; Utilities:用户选项菜单,有关命令解释、字体选择、文件信息、定义输出标题、窗口设计等;,Windows:窗口管理菜单,有关窗口的排列、选择、显示等; Help:求助菜单,

8、有关帮助文件的调用、查寻、显示等。,八、SPSS操作的基本步骤,录入数据,1、定义数据,(1)定义变量类型,变量名(name); 变量类型(type); 变量长度(width); 小数位数(decimals); 变量标签(label); 变量值标签(values); 缺省值(missing); 变量显示宽度(columns); 变量对齐方式(align); 变量测量尺度(measure)。,(2)定义变量值标签,变量标签(Variable Labels): 为进一步描述变量所表示的意义,特别是当变量名不能充分描述变量所表述的意义时。 变量值标签 (Value Labels): 为进一步说明变量

9、的可能取值,它可以定义,也可不定义。 如,变量取值为:grade1、 grade2、 grade3、 grade4,其表示年级,则变量标签为年级,而变量值标签对应变量取值为:本科一年级、本科二年级、本科三年级、本科四年级。,按间隙(gaps)划分,根据一个变量紧挨着的两个观测值之间是否有空隙(缺口),可以把变量分为两类:离散型变量(discrete variable)和连续型变量(continuous variable)。 如果一个变量的观测值之间有空隙,该变量称为离散型变量,否则称为连续型变量。 例如,性别、企业数目、分组情况等为离散型变量;身高、体重、血压、GDP 等为连续型变量。,(3)

10、变量(Variable)的分类,按作用划分,根据一个变量在分析时的作用,可以分为因变量(dependent variable)或自变量(independent variable)。 如果一个变量由其他变量来描述,该变量称为因变量或反应变量(response variable);如果一个变量与其他变量一起用于描述因变量,该变量称为自变量或预测变量(predictor variable)。 例如,在分析家庭收入、性别等因素对消费支出的影响时,收入变量和性别变量是自变量,消费支出变量是因变量。,根据测量尺度划分,定类变量 又称为名义(nominal)变量。这是一种测量精确度最低、最粗略的基于“质”因

11、素的变量,它的取值只代表观测对象的不同类别,例如“性别”变量、“职业”变量等都是定类变量。定类变量的取值称为定类数据或名义数据。,定类数据的其同特点是用不多的名称来加以表达,并由被研究变量每一组出现的次数及其总计数所组成,这种数据是枚举性的,由计数而得。 因而,定类数据中同一组内各单位是等价的,同时若更换各不同组的符号并不会改变数据原有的基本信息。因此,最常用来综合定类数据的统计量是频数、比率或百分比等。,定序变量 又称为有序(ordinal)变量、顺序变量,它的取值的大小能够表示观测对象的某种顺序关系(等级、方位或大小等),也是基于“质”因素的变量。 例如,“最高学历”变量的取值是:1小学及

12、以下、2初中、3高中、中专、技校、4大学专科、5大学本科、6研究生以上。由小到大的取值能够代表学历由低到高。,定序变量的取值称为定序数据或有序数据。适合于定序数据的数学关系是“大于”和“小于”关系。 定序数据中,同一组内各单位是等价的,相邻组之间的单位是不等价的,它们存在“大于”或“小于”的关系。进行保序变换,则不改变数据原有的基本信息即等级顺序。 最适合用于综合定序数据取值的集中趋势的统计量是中位数。,定距变量 又称为间隔(interval)变量,它的取值之间可以比较大小,可以用加减法计算出差异的大小。例如,“年龄”变量,其取值60 与20 相比,表示60 岁比20 岁大,并且可以计算出大4

13、0 岁(60-20)。 定距变量的取值称为定距数据或间隔数据。定距数据是一些真实的数值,具有公共的、不变的测定单位,可以进行加减乘除运算。,定距数据的基本特点是两个相同间隔的数值的差异相等,例如,年龄的60 岁与50 岁之差等于40 岁与30 岁之差。 对于定距数据,不仅可以规定“等价关系”以及“大于关系”和“小于关系”,而且也可以规定任意两个相同间隔的比值或差值。 如果将每个数值分别乘以一个正的常数再加上一个常数,即进行正线性变换,并不影响定距数据原有的基本信息。 因此,常用的统计量如均值、标准差、相关系数等都可直接用于定距数据。,定比变量 又称为比率(ratio)变量,它与定距变量意义相近

14、,细微差别在于定距变量中的“0”值只表示某一取值,不表示“没有”。 例如,人的身高就是一个定比变量,如果身高值为“0”米,则表示这个人不存在。而定比变量的“0”值表示“没有”。,而在测定温度的摄氏表中,0度并不表示没有温度,因为还有在零点以下的温度。 定比变量的取值称为定比数据或比率数据。定比数据也同样可进行算术运算和线性变换等。 通常对定距变量和定比变量不需再加以区别,两者统称为定距变量或间隔变量。,小结,一般地,定类变量和定序变量用于描述定性数据,属于定性变量;而定距变量和定比变量用于描述定量数据,属于定量变量。 一个变量在不同分析中可当作不同尺度的变量。例如,“年龄”在某些分析中(如回归

15、分析)当作定距变量,而在另外一些分析中(如方差分析)可通过分组作为定类变量处理。,另外,较高尺度的变量包含了较低尺度变量的性质。定序变量包含了定类变量的所有特征,定距变量同时包含了定序变量和定类变量的特征。这种性质允许在分析数据时把一些较高尺度变量作为较低尺度变量处理。 例如,定距变量可当作定类变量或定序变量看待,而定序变量可作为定序变量分析。,以上通过三种不同方法对变量进行分类。这些分类是可以重叠的。一个变量可能是离散型变量、自变量、定类变量(如“最高学历”),也可能是连续型变量、因变量、定距变量(如“血压”)。 定类变量必须是离散变量,而定距变量和定序变量可以是离散变量或连续变量;连续变量

16、必须是定序变量或定距变量。例如,变量“性别”是离散变量又是定类变量;变量“年龄”可当作定距变量、连续变量,也可以作为定类变量、离散变量。,2、录入数据,八、SPSS主菜单功能的简单操作,(一)File主菜单,数据暂存,切换服务器,(二)Edit,撤销上一步操作,恢复上一步操作,粘贴变量,(三)View(窗口外观控制),字体,用竖线作刻度标志,变量值标签,变量,(四)Data,1、定义和编辑变量、观测量,Define Variable Properties :定义变量属性; Copy Data Properties : 由外部文件和工作文件拷贝数据变量和属性; Define Dates:定义或编

17、辑日期变量格式; Insert Variable:在数据编辑窗口插入一个变量; Insert Case :在数据编辑窗口插入一个观测量; Goto Case:光标跳转到某一指定观测量。,(1)对变量的编辑,插入一个新变量 数据窗口单击DataInsert Variable,在光标所在位置的前一列插入一个新的变量,变量名字和属性可以在Variable View窗口中定义。,(2)观察值的编辑,插入一个新观测量 (Case) 在数据窗口主菜单上单击DateInsert Cases命令,在光标所在位置的前上一行插入一行新的观测个体,输入新的观测数据。,(3)查找指定的观测量(数据),查找指定的观测数

18、据的命令是Go to Case。 在数据窗口单击DateGo to Case,弹出一个对话框,如图所示:输入要找的观测量的序号后,点OK按钮,数据表中光标就会指到选定的观测量个体。,2、变量数据变换的命令,Sort Cases:对观测量进行排序; Transpose:对观测量进行转置; Restructure:对现有的观测量进行重新构造,形成新格式的数据文件; Merge File:把外部数据合并到工作文件中; Aggregate:对数据进行分类或不分类汇总,产生新文件或代替工作文件。 Identify Duplicate Cases:标识重复观测量; Orthogonal Design: 进

19、行正交设计。,(1)观测数据排序,给观测量数据排序的命令是Sort Cases。 在数据窗口单击DateSort Cases,打开Sort Cases对话框,从对话框左侧的变量列表中选择排序变量,点击右箭头按钮加入Sort by框中,然后在Sort Order栏中选择排序顺序: Ascending:个体按照选定的排序变量值由小到大的升序排列; Descending:个体按照选定的排序变量值降序排列。,注意1:观测个体,排序变量可以是一个或多个,当选择多个排序变量时,首先按第一个变量值排序,然后在第一个变量取值相同的那些个体中再按第二个变量值排序,依次类推。 注意2:在排序的时候,观测个体整行的

20、值一同变到新位置,而不是只有排序变量那一列变动。但数据表中左边框上的序号并不随着变动,因此,为了保留原始数据的信息,最好自己定义一个变量来记录观测个体的序号。,(2)数据分类汇总(数据分组汇总),用户可以根据需要对数据按指定的变量的数值进行归类分组汇总。以某数据库两个班的学生成绩为例,如果按照性别对数学成绩进行汇总,可以使用分类汇总命令实现。 具体操作如下:,1.指定分类变量和汇总变量。 打开数据库,在数据窗口单击DateAggregate命令,打开Aggregate Date对话框。如图所示:,2. 在变量名列表框中选择分类变量”性别”进入Break Variable(s)。 3. 在变量名

21、列表框中选择汇总变量”Math”进入Aggregate Variable(s)。 4. 单击Function按纽,打开Aggregate Date:Function对话框,,在此对话框中可以选择平均值、数据和、标准差的形式,特别值形式,百分数形式、频数形式等其中之一的方法进行分类汇总。选择分类汇总的函数形式后返回Aggregate Date对话框中。,5. 单击Name&Label按纽,可以重新指定结果文件中的变量名并加入变量标签。SPSS默认的结果文件中的变量名为原变量名最后加上1. 6.最后单击OK,可得相应的数据文件。,3、观察量数据整理的命令,Split File 拆分数据文件的观测量

22、,观测量进行条件分组; Select Cases 选择观测量; Weight Cases 对观测量进行加权处理。 通过选择上述命令,可以实现对数据的整理编辑。,(1)在数据中选取子集,如果需要从数据文件中选取一部分数据,可以在数据编辑窗口单击Data Select Case,打开Select Case对话框,在该对话框的Select栏中选择挑选数据子集的方式: All case:选择所有数据; If condition is satisfied: 按指定条件选择数据。Random Sample of cases:对观察值进行随机抽样。,单击If按纽,打开Select Case:If对话框,如图

23、所示,先选择变量,然后定义条件。,对观察值进行随机抽样。单击Random Sample of cases 按纽,打开Select Case:Random sample对话框。如图所示。,在Sample Size栏中有两种选择方式,一种是大概抽样(Approximately),即键入抽样比例后由系统随机抽样;另一种是精确抽样((Exactly),要求输入从第几个观察值起抽取多少数据。,(五)Transform,Compute:计算产生新变量,SPSS提供了10类100多个函数,通过该菜单可以用表达式产生一个新变量; Random Number Seed :创建随机数种子变量; Create Ti

24、mes Series:创建时间序列变量;,1、 通过基本变量创建各种新变量,(1)计算产生新变量,对于已存在的数据变量,根据需要进行计算生成新变量的命令是Compute。 在数据窗口单击Transform Compute,打开Compute Variable对话框,如图所示。,在对话框左上方Target Variable栏中,键入即将生成的新变量的名称,并单击Type & Lable按纽确定变量标签及数据类型。,整数函数,反正切函数,2、 创建各种参数变量,Count:创建一个计数变量,用于统计计数; Recode :对变量值重新编码; Rank Cases:为观测量排秩,求得的秩在数据窗口作

25、为一个新变量保存; Categorize Variables:建立新的分组变量,使数据分成若干个组; Automatic Recode:对变量值自动编码,产生一个连续的变量值编码; Replace Missing Values:创建替代缺失值变量;,在数据窗口单击TransformCount,打开Count Occurrence of Value within Cases对话框,如图所示:,先在Target Variable中指定一个变量(可以是已经存在的变量或新变量),并定义变量标签,然后指定要统计的变量加到Numeric Variables框中,再单击Define Values按纽,打开V

26、alue to Count对话框。,Value:输入某个值为清点对象; System-missing:以系统的缺失值为清点对象; System-or user missing:以系统或用户指定的缺失值为清点对象;,Range:指定数值的计数区域:其中包括: ( )through( )在框内指定下限和上限 lowest through( ): 在框内只指定上限; ( )highest through: 在框内只指定下限。,图中给出的是计算达到优良标准,即学生达到80分以上的人数。确定了计数数值后,单击Add,使选择结果进入Values to count 框内。单击Continue按纽,返回主对话框中。,变量分组(编码),对变量数据的重新分组(编码),是指给每个变量值重新赋予一个码来描述他们的某些属性。码数相同的即为一组。 比如,可以对年龄重新分组,19岁及以下年龄赋予一个编码1,20-29岁的年龄码赋予2,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论