SPSS统计软件与应用

上传人：7*** IP属地：湖北上传时间：2022-05-04 格式：PPT 页数：270 大小：11MB 积分：28 举报 版权申诉

已阅读5页，还剩265页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、SPSS统计软件与应用河南大学教育科学学院心理系杜岸政电子邮箱：课程内容oSPSS基本界面简介o数据文件的建立o数据文件的初步整理o统计图表的制作与编辑o数据资料的描述统计过程o假设检验之T检验过程o实验设计与方程分析过程o相关与回归分析过程o数据资料的非参数检验过程o调查量表与问卷的信效度分析过程o其它多变量分析方法简介课程要求与考试o遵守时间，积极练习，掌握基本操作步骤。o掌握统计方法的适用条件和结果解释。o积极参与调查实践，能够实际处理调查数据。o考试形式拟采用上机操作考试。参考资料o邓铸、朱小红：心理统计学与spss应用，华东师范大学出版社 2009.o张奇：SPSS for Wi

2、ndows 在心理学与教育学中的应用，北京大学出版社，2009。o金志成、何艳茹：心理实验设计及其数据处理，广东高等教育出版社，2002.o王保进：多变量分析统计软件与数据分析，北京大学出版社，2007.1.SPSS基本界面简介o1.1spss的发展历史60年代，美国斯坦福大学三位研究生开发。70年代，在美国芝加哥成立SPSS公司。80年代，推出适用于微型计算机的SPSS版本90年代，推出适合于windows视窗的版本2000以后至今，版本发展为18.0版，o1.2Spss的应用优势（1）界面友好，界面类似于微软公司的excel电子表格。（2）除一些复杂专业功能外，基本实现了对话框操作

3、，学习容易。（3）功能强大，可以实现绝大部分的数据处理工作。（4）结果输出详细，层次清晰，界面友好，便于分析。o1.3spss应用应注意的问题（1）明确数据分析目的（2）明确数据编码规则，正确建立数据文件（3）审核数据资料，保证数据的真实、可靠与完整（4）明确各种统计方法的作用及适用条件（5）选择多种方法对数据做探索性分析（6）明确数据分析输出结果的阅读方法，读懂结果o1.4spss18.0的安装与启动（1）解压并运行setup文件夹下的setup.exe。（2）在第一安装界面请选择单个用户证书安装（即默认那个）。（3）在安装较后的一个界面，请把右下角的“在线注册”前面那个勾去掉。（4）先

4、暂使用试用安装和试用KEY 。（5）请别急着要运行spss程序（6）复制EQX文件夹里面的全部内容，并粘贴到安装文件夹例如C:Program FilesSPSSIncPASWStatistics18文件夹下，确认全部替换即可。（8）启动：开始程序SPSS INCpasw statistics 18。o1.5spss的基本窗口（1）Spss文件系统有五种类型构成：数据文件、语法文件、输出文件、草稿输出文件、脚本程序编辑文件，每种文件在各自的窗口中通过菜单和快捷按钮实现各自功能。（2）最常用的三种窗口是：数据窗口（data)、输出窗口(output)、语法窗口(syntax)1.5.1数据窗

5、口（data editor）（1）功能：对数据文件进行定义、录入、修改、管理等基本操作。（2）窗口组成：标题栏、菜单栏、工具栏、二维表格、状态栏（3）spss各统计分析功能是针对当前数据窗口中文件进行的，数据文件的扩展名是：.sav1.5.2结果输出窗口（output）（1）输出窗口在启动后并不现实在屏幕上，但以下两种情况可以打开： A：调用相关过程分析后自动激活，若分析成功则呈现分析结果，若不成功则给出相关错误信息。 B:文件新建输出（2）输出窗口可以打开的文件类型：*.spo；*.sps；*.sbs（3）输出窗口的组成标题栏分析结果文本栏工具栏输出导航栏菜单栏1.5.3语法窗口（

6、syntax)（1）功能：编辑、显示及运行spss程序（2）文件类型：*.sps；*.sbs（3）组成部分（见下页图）o1.6spss的对话框 Spss的对话框为复杂的统计分析工作提供了人机对话平台，对话框中一般有单选项、多选项、参数设置及语句组成。对话框所设置的内容大多是统计分析过程的适用条件及分析目的下的统计量设置。1.6.1文件操作对话框o功能：打开文件或导入数据文件时适用可把打开文件以语句形式显示于语句窗口1.6.2统计分析过程对话框o功能：选择参与分析的变量、对统计量进行选择和参数设置等。o对话框有层级之分，但每种统计方法的对话框层级数及内容不同o对话框的构成：变量呈现窗、按钮、选项

7、、参数设置栏等。1.7spss系统运行方式o完全窗口菜单运行方式 n操作简单，易于掌握，我们使用此法o程序运行方式n在语句窗口(Syntax) 中直接编写程序后运行n可重复运行n适合于多任务、批处理o混合运行管理方式(以上两种方法的结合)n在菜单中选择-Paste到语句窗口生成程序-Run n可使程序得以保存，后用时避免再设置，提高效率。1.8配置中文界面o初装为英文界面，如果熟悉英文则无需修改。o配置中文界面：Editoroptionsgeneral.作业与练习o在自己的电脑上安装spss软件o了解spss的界面构成o熟悉对话框的功能与运用o通过options配置spss软件的界面显示2.数

8、据文件的建立在心理学研究中的数据文件主要来源于观察记录、测量调查及实验研究。建立数据文件的基本步骤如下： A.对数据编码 B.根据数据收集时的设计明确数据录入格式 C.选择合适的数据录入方法与途径 D.对数据文件进行审查，以保证数据录入与目的及分析需要一致 2.1调查数据的编码2.1.1编码时的几个概念o个案（case）o变量、变量名、变量名标签o变量类型及变量值o变量值的栏位设置一个编码方案变量（标签）变量名栏位姓名 xm 编号 id 1-4年龄 nl 5-6性别 xb 7专业 zy 8项目1 v1 9项目1 v2 10项目1 v3 11项目1 v4 12项目1 v5 13项目1 v6

9、 14项目1 v7 15项目1 v8 16项目1 v9 17项目1 v10 182.2数据的录入方式o直接录入。适合于数据不太多的时候，该种录入方式方便，直观，易于掌握，我们将常用。o程序录入方式。程序录入是spss提供的标准录入方法，适合于数据较多时，但需要了解程序中的录入规则，掌握较难。o其他数据格式导入方式。Spss可以实现和其它数据处理软件件的数据交换。由软件提供的向导完成数据交换。2.2.1数据窗口直接输入方式o熟悉数据窗口中的两个重要按钮：数据视图和变量视图。o对变量进行名称、类型、长度、标签小数点位等进行设置o录入数据，在值与标签之间进行转换o保存数据到指定文件夹（1）熟悉数据视

10、图和变量视图按钮（2）变量设置o变量的默认设置变量为数值型（numeric) 小数点2位(decimals) 变量名宽度8字符(width) 数字右对齐(right) 变量为连续型(scale) 其余自定义（3）定义变量名与宽度o变量视窗类型（4）定义变量标签o变量视窗值（5）定义用户缺失值o变量视窗缺失值A无缺失值(系统默认）B离散缺失值（最多定义3个）C连续缺失值或多于3个的离散缺失值（输入上下限定义，但不能包含合法值）演示：假想5名被试在SAS上的得分2.2.2语句窗口录入方式o数据的语法窗口录入有固定格式和自由格式两种，固定格式变量间没有分割符，每个变量的数据列实现定义好，是固定的。

11、自由格式有分割符隔开o在程序窗口中录入数据注意两点：首先是注意录入采用固定格式还是自由格式录入。注意编码中的栏位确定o编码中要注意缺失值的设置（1）定义文件变量属性o个案（case）：一个个案不超过78个字符，若超过则分两行或以上来输入数据。两行数据代表一个个案DATA LIST RECORDS=2/ /o变量（variable）：一般情况下问卷中的每个问题做一个变量处理。o变量名（label）：变量名一般不能以数字开头，另外，变量名不能使用spss保留的关键词，例如and、or等。o变量值（value）：在问卷变量值是问卷的答案（数据）固定格式的程序录入DATA LIST RECORD=1/

12、id 1-2 age 3-4 sex 5 major 6-7 v1 8 v2 9 v3 10 v4 11 v5 12 v6 13 v7 14 v8 15 v9 16 v10 17.BEGIN DATA.0119101123443211202202022314243124031810313214342130419204432414123405181033421321434END DATA.VALUE LABEL sex 1男2女.MISSING VALUES age(00),sex(0),major(00).DATA LIST RECORD=2/id 1-2 age 3-4 sex 5 majo

13、r 6-7 v1 8 v2 9 v3 10 v4 11 v5 12/v6 1 v7 2 v8 3 v9 4 v10 5.BEGIN DATA.0119101123443211202202022314243124031810313214342130419204432414123405181033421321434END DATA.VALUE LABEL sex 1男2女.MISSING VALUES age(00),sex(0),major(00).自由格式的程序录入DATA LIST FREE/id age sex major v1 v2 v3 v4 v5 v6 v7 v8 v9 v10.BE

14、GIN DATA.01,19,1,01,1,2,3,4,4,3,2,1,1,202,20,2,02,2,3,1,4,2,4,3,1,2,403,18,1,03,1,3,2,1,4,3,4,2,1,304,19,2,04,4,3,2,4,1,4,1,2,3,405,18,1,03,3,4,2,1,3,2,1,4,3,4END DATA.VALUE LABEL sex 1男2女.MISSING VALUES age(00),sex(0),major(00).DATA LIST FREE/id age sex major v1 v2 v3 v4 v5 v6 v7 v8 v9 v10.BEGIN DA

15、TA.01,19,1,01,1,2,3,4,43,2,1,1,202,20,2,02,2,3,1,4,24,3,1,2,403,18,1,03,1,3,2,1,43,4,2,1,304,19,2,04,4,3,2,4,14,1,2,3,405,18,1,03,3,4,2,1,32,1,4,3,4END DATA.VALUE LABELS sex 1男2女.MISSING VALUES age(00),sex(0),major(00).2.2.3 ASC码数据文件的导入spss 这里所讲的ASC码数据文件是指录入记事本中的数据文件，其扩展名为.txt。转换时依据输入的格式，把文件分为固定格式和自

16、由格式两种，spss提供了两种格式的导入向导，以引导完成数据转入工作。固定格式的.txt文件固定格式A 0119101123443211202202022314243124031810313214342130419204432414123405181033421321434固定格式B01 19 1 01 1 2 3 4 4 3 2 1 1 202 20 2 02 2 3 1 4 2 4 3 1 2 403 18 1 03 1 3 2 1 4 3 4 2 1 304 19 2 04 4 3 2 4 1 4 1 2 3 405 18 1 03 3 4 2 1 3 2 1 4 3 4自由格式数据导

17、入过程o文件打开文本数据，出现文件打开对话框，制定文本文件，打开数据导入向导。o选择固定宽度和否自由格式的txt文件转入固定格式A01 19 1 01 1 2 3 4 4 3 2 1 1 2 02 20 2 02 2 3 1 4 2 4 3 1 2 4 03 18 1 03 1 3 2 1 4 3 4 2 1 3 04 19 2 04 4 3 2 4 1 4 1 2 3 4 05 18 1 03 3 4 2 1 3 2 1 4 3 4固定格式B01,19,1,01,1,2,3,4,4,3,2,1,1,202,20,2,02,2,3,1,4,2,4,3,1,2,403,18,1,03,1,3,

18、2,1,4,3,4,2,1,304,19,2,04,4,3,2,4,1,4,1,2,3,405,18,1,03,3,4,2,1,3,2,1,4,3,4o自由格式的文本文件转入，其基本过程与固定格式相当，只是其中的若干对话框中的选项有所不同罢了。注：多响应变量的编码o概念：多响应变量就是在调查或测量中被试可以做出多个选择的变量，也就是多选题o多响应变量的分类及其编码（1）二分法及其编码（2）分类法及其编码二分法及其编码o一般您在晚饭后做什么？A看电视B睡觉、C散步D打牌E其他变量名标签编码方案V101 看电视 1,0V102 睡觉 1,0V103 散步 1,0V104 打牌 1,0V105

19、其他 1,0分类法及其编码o一般您在晚饭后做什么？A看电视、B睡觉、C散步、D打牌、E看书、F其他（选三个，并按经常性大小排列）变量名标签编码方案V101 第一选择 1,2,3,4,5,6V102 第二选择 1,2,3,4,5,6V103 第三选择 1,2,3,4,5,6作业与练习o什么是数据编码，编码的作用是什么？oSpss数据录入方式有哪些？各有什么特点？o设计一个调查问卷，对问卷进行编码，采用多种方式把数据录入spss.3.数据资料的初步整理3.1数据资料初步整理的意义（1）对数据进行补充、修正、删除等工作，以保证数据的准确、完整。（2）对数据视窗的结构进行操作，以满足个性化需求。（

20、3）对数据进行排序、加权、选择、合并等工作以满足分析要求（4）对数据进行转换或再计算，以保证分析条件及目的的实现。3.2数据的编辑（Edit)o插入变量（insert variable)o插入个案（insert case)o查找替换（fide & replace)o转至个案（go to case )o转向变量（go to variable )o变量的删除、复制和移动（cut、copy 等）演示：假想5名被试在SAS上的得分o以spss自带的数据（焦虑）进行演示3.2视图菜单（view)o状态栏：表示软件运行是否正常，另外，用于说明数据是否处于加权、拆分等状态。o工具栏：常用的一些命令呈

21、现在工具栏，便于快捷操作，相当于点击菜单及右键鼠标的相应功能。o字体：修改字体、大小等o网格线：在数据或变量编辑视窗中显示或隐去网格线o变量值标签：值与标签之间的相互转化数据编辑窗口结果输出窗口o展开/叠盖输出导航（expand/collapse）o显示/隐藏输出结果（show/hide)o标题大小（outline size）o标题字体（outline font）3.3数据处理（data) 数据处理主要完成有关数据的合并，拆分，加权、选择、建立日期变量、行列转化及定义变量属性等。3.3.1定义日期型变量当前有没有变量与定义的日期型变量名相同，若有则替代之3.3.2排序个案o排序的作用：（1）排

22、序是数据整理的一个重要方法（2）排序可以迅速发现异常值和输入错误（3）缺失值排在最小值的前面，便于发现缺失值（4）排序为进一步统计分析提供基础3.3.4数据的转置o功能。转置过程可以实现数据文件的行列转换，实际上就是变量转化为个案，而个案转化为变量o一般情况下，运用转置过程时要选中所有变量，或者除名称变量外的所有变量，如果某些变量不选将被自动舍去o一般情况下，行列转换后需重新对变量进行命名3.3.5合并文件（merge files）o增加个案程序（1）从外部文件中获取个案数据，以增加到当前工作数据文件中，一般情况下，两个文件应具有相同的变量。（2）若变量不同可以人为强迫不同变量配对，但要求

23、有相同的数据类型（3）可强行加入，不过会出现很多缺失值。o增加变量（1）横向合并数据，增加多个变量（2）增加变量一般要求有一个关键变量，并按关键变量把的取值把数据合并为一个观察量（3）关键变量通常以id号为依据3.3.6拆分文件（split file)（1）功能：按指定变量，把文件分组处理。或者说是按指定变量把文件劈成几部分。（2）文件拆分过程是一个预处理过程，它本身只是把文件区分开来，并不能得到拆分后的描述统计量（3）一旦拆分，调用其他过程时均在拆分基础上进行。（4）三种拆分情况：不拆分，系统默认拆分后调用其他过程，分析结果放在一起比较拆分后调用其他过程，分析结果分开呈现（5）选入多

24、个变量进行拆分，系统将按这些变量的水平组合进行拆分。3.3.7选择个案(select file)（1）功能：根据分析需要和目的，按照一定标准选择文件中的部分数据进行分析。比如选择男性数据，选择前200个数据等。（2）关键：分析数据产生的条件（3）注意select cases过程也是一个预处理过程，一旦选择了某些数据，再调用其他程序分析时，只分析选中数据。3.3.8数据的加权(weight case)o（1）功能：使用指定变量对其他变量进行加权，该过程适用于计算加权描述统计，列联分析，卡方检验等。o（2）该过程同样是预处理过程，一旦加权将始终有效，除非取消加权o（3）加权与否取决于分析需要3.3

25、.9数据的分类汇总o（1）功能：根据指定变量进行分组，在分组后计算各组各变量的描述统计量。o（2）分类汇总的关键是确定一个或多个分组变量3.3.10数据的重组（1）功能：实现数据的宽型和长型之间的转换，以满足分析要求（2）重复测量设计要求宽型，而完全随机设计则大多要求长型（3）转换的重点在于明确那种方式向那种方式的转变，还要明确ID变量和重复测量变量用变量操作文件夹中的anxiety.sav和anxiety2.sav进行演示并解释结果宽转长长转宽行列转化选入要重组的变量重组后的id号指示数据应归为的变量3.4数据转换（tranform)o对数据进行四则运算,产生新变量。o对数据进行重新编码，建

26、立新的分类变量。o给数据赋予等级，由等距以上数据转化为等级数据o其它一些功能，如确实值替换，生成随机数据表等3.4.1计算变量（compute variable) (1)利用函数和四则运算建立转换公式，通过转换公式产生新变量，以满足数据分析需要（2）可以设定条件，只对符合条件的变量数据进行转值变换（3）在问卷分析中经常用来合成个案总分等新变量名称及类型标签设置编制计算公式，以产生新变量，公式中可以有函数、数学运算、关系运算和逻辑运算等数学运算关系运算逻辑运算函数说明框设定条件，以便确定哪些数据参与转化各种函数o表达式形成规则（1）字符串必须用单引号或双引号引住，若字符串中有了单引号，则必须用双

27、引号引住。（2）若调用函数，则自变量必须放在函数后的括号中（3）每个关系表达式必须单独定义，表达式间若用符号隔开，必须用英文字符3.4.2满足某一条件的个案计数（count）o功能：标示变量中某个值或取值区间中出现的的数据，具体为用1标定指定数据，用0表示未指定的数据。。o注意：对同时满足两个或两个以上条件的变量取值进行count过程会得出错误结论，如要进行需要与其他过程结合使用用变量操作文件夹中的anxiety.sav和anxiety2.sav进行演示并解释结果3.4.3重新编码(recode)o按照要求给变量重新赋值，赋值后的变量可以替换原变量也可以作为一个新变量存在，多用于由数值数据转

28、化为分类数据o注意：赋值要遵循统一的标准o重新编码有三种：自动编码、自定义编码、可视编码用变量操作文件夹中的anxiety.sav和anxiety2.sav进行演示并解释结果3.4.4个案排秩o实现数据由等距数据向顺序数据转化。o排秩的目的是采用非参数检验方法或计算等级相关等o排秩的过程中应该注意重复数据的处理规则o计算相关时注意两个变量或多个变量排秩的统一性思考与练习题1、编辑、视图、数据及转换菜单下各有哪些子菜单，功能是什么？2、请根据你调查后建立的数据文件，依据本节所学内容，为自己提出问题，并解答之。3、根据要求完成数据处理工作，掌握操作技巧。o请根据表格中的数据完成以下任务（1）依前1

29、0名学生的多血质和粘液质数据建立文件1（2）依后10名学生的多血质和粘液质数据建立文件2（3）依20名学生的胆汁质和抑郁质数据建立文件3（4）合并文件1、2保存为文件4，合并文件3、4建立建立文件5（5）选取多血质大于10的学生组成个案子集（6）产生一个计数变量以便清点四项得分均在5分以上的人数（7）产生一个分组变量，以粘液质得分为基础把学生分为三组（8）以产生的分组变量为基础，对学生的四种气质得分进行分类汇总（9）计算每个个案的四项得分总和（10）根据合成总分大小为每个个案赋予等级。4.统计图形的制作与编辑o统计图概述o常见的统计图制作过程o统计图的编辑过程4.1统计图概述作为统计描述的

30、重要方法之一，统计图以其简单、直观的优点备受青睐。它通过点的位置、线段升直条的长短或面积大小来表现事物的数量关系，使用统计图代替冗长的文字叙述，往往可以大大提升统计报告的可读性，使得客户为之赏心悦目，达到事半功倍的效果。因此，掌握如何绘制图形精美、种类得当的统计图显得极为重要。oSpss提供的统计图种类（1）常见统计图：包括条形图、线图、圆形图等（2）交互统计图：主要满足一些特殊要求，或者追求图形的完美（3）统计地图：用于商业领域，在特定的地图中标出有关指标，以便分析者把握全局o制作统计图时要注意的问题（1）统计图可以制作成二维图（2-D coordinate)、三维图（3-D coordin

31、ate)和三维效果图（3-D Effect)（2）数据与图形对应，数据类型会影响图形的制作4.2常见统计图形的制作4.2.1条形图、线图和面积图的制作（1）条形图：以调的长短或高低代表数据大小的图形，适用于离散性数据，用于类别间比较。（2）线图：以线的变化与走势表示数据大小及数据之间的关系，适用于离散、连续数据，主要用于趋势分析（3）面积图：用线段下阴影部分的面积代表数据间关系，也叫结构曲线图4.2.1.1条形图的制作图形类别图形数据代表个案组摘要条形图用变量操作文件夹中的anxiety.sav和anxiety2.sav进行演示并解释结果o变量模式条形图o复式条形图（个案组摘要）o复式条形图（

32、多个变量）o设置面板的条形图o设置面板的条形图具有层级含义，其层的划分可以按下面三种方式进行：（1）按行生成面板（2）按列生成面板（3）按分类变量行列交叉来生成面板，即嵌套模式4.2.1.2线图：（1）功能：用线的走势来描述变量的发展变化及水平状况（2）线图类似于条图，线图也有三种（3）每种又有三种情况4.2.1.3面积图面积图同线图和条图一致，做法基本相同，所不同的是面积图用面积块来表示变量的水平与发转趋势。4.2.2圆形图的制作o功能：直观描述部分与整体之间的比例关系。o饼图的做法同条图4.2.3直方图的制作o用于表示连续性数据的次数分布情况，类似于茎叶图。o可以是分组次数后绘制，也可以

33、是单个取值的次数分布以变量编辑文件夹中的数据anxiety.sav来演示过程及解释4.2.4其它统计图的制作o高低图（1）至少有两个分类变量，一个做为分类轴，另一个作为闭合变量（2）高低图反映了数据的变化范围，具体讲就是给出了分类后的全距 o箱式图（1）可以用来反映数据的分布状况（2）可以用来分析异常值是否存在（3）箱图有简单可以反映各类别数据分布的整体走势（4）简单箱图还可以在不同类别间进行比较（5）复式箱图至少有两个分类变量以定义分类轴和聚集o误差条形图（1）置信区间的图形化表示（2）有简单与复式误差图两种（3）复式图至少有两个分类变量o散点图（1）用于相关分析时变量间关系判定（2）散点图

34、在制作时的数据类型一般要求连续型4.3统计图的后期编辑o认识SPSS制作图形的结构文本、线条、数字、图形o图形编辑的内容（1）文本位置、字体、色彩、添加、修改和删除。（2）线条粗细、色彩、添加、删除（3）数字的大小、色彩、位置、添加或删除等（4）图形的大小、色彩、位置、删加、转换等（5）3D图形的景深、视图角度等（注：图形的编辑以实用、直观为导向）o图形编辑窗口的构成及主要功能（1）打开图形编辑窗口。途径有二：其一是在输出窗口中选中要编辑的图形，双击即可；其二是在输出窗口中依次点击编辑-编辑内容-在单独窗口中打开（2）图形编辑窗口由菜单、工具栏及图形区域构成o改变图形构成（1）转换图形，

35、比如由条形图转换为线图（2）图形中增删值标签（3）增删标题、注释（4）隐藏或显示某些图形构成部分，比如：派生轴、图例、线图标记点几分离饼图之一块（5）纵横坐标轴转换，使图形由竖型变为横排o图形大小与修饰（1）图形大小的修改 A.选中图形拖拽 B.编辑窗口中点击编辑菜单-属性，在属性对话框中进行精确设置（见图1）（2）填充与边框（见图2）（3）修饰文字：选中要修饰的文字，双击可打开对话框（见图3）o坐标轴的修饰（1）坐标轴标签、位置设定（2）坐标轴样式，包括颜色线条粗细等（3）分类轴特性（4）刻度轴特性分类轴刻度轴o其他设置（1）参照线设置（2）注释设置（3）立体图形景深设置（4）图形的辅助部分

36、加入，比如加入误差条形图等思考与练习题o依据实际或模拟数据制作各种统计图o编辑制作的统计图，掌握编辑特色与要顶o解释各种统计图的使用意义o根据你的调查结果，用适当的统计图来呈现分析结果，并解释其意义5.数据资料的描述统计过程o频数分布分析o各种统计量的意义与计算o数据资料的探索性分析过程及意义o数据分布的正态性图形化分析5.1频数分布分析o变量频数的描述方法（1）制作次数分布表（频数、百分比） A.以表格形式呈现各个数据的次数分布情况，包括个案数、占总个案的百分比，有效百分比。 B.如果要制作分组表，则需要先重新赋值后再做。（2）计算分位值（百分位数） A.四分位点值的计算（三个四分位点） B

37、.指定分位数的数量（指定5个百分位） C.直接指定一个百分位数（比如30）（3）计算峰度和偏度峰度（峰度（Kurtosis) : 峰度是描述某变量所有取值的分布形态陡缓程度峰度是描述某变量所有取值的分布形态陡缓程度的统计量，而峰度对陡缓程度的度量是与正态分布进行比较的结果的统计量，而峰度对陡缓程度的度量是与正态分布进行比较的结果。如果峰度等于如果峰度等于 0 ，其数据分布的陡缓程度与正态分布相同，其数据分布的陡缓程度与正态分布相同；峰度大；峰度大于于0，其数据分布比正态分布更陡峭；峰度小于，其数据分布比正态分布更陡峭；峰度小于0，其数据分布比正，其数据分布比正态分布更平坦态分布更平坦。

38、偏度（偏度（Skewness) 是描述数据分布对称性的统计量是描述数据分布对称性的统计量，而且也是与，而且也是与正态分布的对称性相比较而得到的。如果分布的偏度等于正态分布的对称性相比较而得到的。如果分布的偏度等于 0 ，则其，则其数据分布的对称性与正态分布相同数据分布的对称性与正态分布相同；如果偏度大于；如果偏度大于 0，则其分布为，则其分布为正偏或右偏；如果偏度小于正偏或右偏；如果偏度小于0，则为负偏或左偏。，则为负偏或左偏。（3）制作次数分布图（条形图、饼图、直方图） A.条形图与饼图适合于离散性数据。 B.直方图适合于连续型数据。o频数分布分析过程（1）程序：分析-描述统计-频数（2

39、）选择一个或多个变量放进变量框中（3）选中右下角显示频数表格（4）点击统计量、图表、格式依次进行设置5.2各种统计量的意义与计算o各种描述统计量（1）集中趋势（平均数、中数、众数）（2）离散趋势（标准差、标准误、方差、四分差、全距）（3）分布形态量（峰度、偏度等）（4）计算变量取值的标准分数o分析过程（1）分析-描述统计-描述（2）选择要描述的一个或多个变量（3）选中标准分数保存为变量（4）点击选项按钮，做二级对话框设置5.3数据资料的探索性分析过程o探索性分析的作用（1）发现并对异常值作出处理（2）判断数据分布的大致形态（3）在按分类变量把连续变量分组后来判断方差是否齐性o探索性分析对数据的

40、要求（1）因子变量为分类变量（2）因变量要求是连续性变量o探索性分析的过程（1）分析-描述统计-探索（2）计算常见统计量，在主对话框统计量按钮内设置（3）绘制统计图（箱图、茎叶图、p-p图、Q-Q图）（4）方差齐性检验（levene检验）6.假设检验中的T检验o分类之下各组统计量的计算o单样本T检验（平均数显著性检验）o独立样本T检验（平均数差异的检验）o配对样本T检验（平均数差异的检验，相关样本）o单因素方差分析（适合于分组两类以上）6.1分组后的各组统计量计算o均值过程（1）均值过程：分析-比较均值-均值（2）均值过程的作用：按分类变量分组后计算各组的描述统计量6.2单样本T检验o单样本T

41、检验的含义（1）只有一个样本，一个未知总体（2）目的在于判断该样本是否来自于某一总体o单样本T检验的分析过程（1）调用程序：分析-比较均值-单样本T检验（2）选择检验变量进入检验变量框（3）设置检验值（4）点击选项做区间估计和特殊值设置6.3独立样本T检验o独立样本T检验含义（1）双样本（由分组变量定义）（2）双总体（总体信息未知）（3）样本之间是独立关系（在数据录入上采用长型格式）（4）通过样本差异判断总体体是否有差异o分析过程（1）分析-比较均值-独立样本T检验（2）选择已分类变量放入分组变量框，并定义组（3）选择连续变量放入检验变量框（4）点击选项按钮来设置区间估计o输出结果（1）方差齐

42、性检验结果（2）T检验结果（差值、t值机显著性水平）（3）区间估计结果（默认为95%）6.4配对样本T检验o配对检验的意义（1）双样本（按宽型格式录入）（2）双总体其参数未知（3）样本配对或一组两次测量结果o分析过程（1）分析-比较均值-配对样本T检验（2）选择连续变量放入成对变量框（4）点击选项按钮来设置区间估计o输出结果（1）数据成对差异（2）区间估计结果（默认为95%）（3）T检验结果（差值、t值机显著性水平）6.5单因素方差分析o单因素方差分析的含义（1）一个分类变量作为因子变量（因子变量的分组数至少三个）（2）检验的变量要求是连续变量（3）要求各组所代表总体的方差齐性（3）分析的目

43、的在于了解多组之间在均值上的差异状况o单因素方差分析过程（1）程序：分析-比较均值-单因素anova（2）选择一个分类变量进入分组变量框（3）选择一个或多个连续变量进入因变量框（4）在选项按钮中设置方差齐性检验（5）在两两比较按钮中设置比较方法（LSD、 N-K法）o结果输出7.实验设计与方差分析o方差分析的基础知识o实验设计分类o完全随机多因素方差分析的spss实现过程o随机区组多因素方差分析的spss实现过程7.1方差分析的理论知识7.1.1多因素方差分析的功能（1）现实世界中变量之间的关系是错综复杂的，比如研究身高的影响因素，可以发现身高与性别有关，同时还与营养、年龄、遗传等有关系。这些

44、因素与因变量的关系都需要考察。（2）这里仅讨论有多个自变量存在，而只有一个因变量情况。（3）可以分析各自变量的主效应。（4）可以分析变量间的交互作用。（5）可以控制一些因素对其中的某一个或某些自变量进行主效应分析，此为协方差分析。（1）因素（factor）：一般指自变量，即对因变量有影响的变量（2）水平（level）：因素的不同取值水平（3）单元（cell）：因素的水平组合（4）元素（elements）：最小的测量单位（5）主效应：因素单独起的作用大小（6）交互效应：两个或两个因素共同起的作用大小7.1.2 方差分析中的常用术语7.1.3 方差分析的适用条件（1）变异独立性假设（2）方差齐性假

45、设（3）变量数据总体正态性假设7.1.4实验设计分类o完全随机设计使用随机方法分配被试给各个实验处理，一组被试只接受其中一种实验处理或处理组合，被试间设计的一种。总变异=因素一主效应+因素二主效应+一阶交互效应+二阶交互效应+误差效应o随机区组设计它是通过区组技术来控制无关变异的。首先无关变量将被试分成若干个同质的区组，然后将每个区组的被试随机分配给各个处理组。这种试验设计的方差分析可以将无关变异从总变异中分离出去，减少了误差变异，从而提高了处理效应的F检验的精度。总变异=区组效应+因素一主效应+因素二主效应+一阶交互效应+二阶交互效应+误差效应o拉丁方设计拉丁方设计是区组设计思想的

46、扩展，在拉丁设计时，涉及到两个区组变量，一个自变量。拉丁方设计把两个区组效应从误差项中分离出来。总变异=区组变量1效应+区组变量2效应+自变量效应+误差效应7.1.5一般线性模型的构成o单变量（因变量只有一个，用的最为广泛）o多变量（因变量有多个）o重复度量（重复测量设计中的数据分析专用程序）o方差分量估计（多层线性模型的前身）7.2完全随机设计的方差分析7.2.1单因素完全随机（1）使用类型：一个自变量，自变量有两个或两个以上水平，因变量只有一个（2）被试分配被试分配例：一个研究要探讨文章的生字密度对学生阅读理解的影响。研究假设是：阅读理解成绩随着文章中生字密度的增加而下降。A1A2A3A

47、436435752464245338987567698871213121135315680oSPSS实现过程（1）程序：分析-比较均值-anova;分析-一般线性模型-单变量（2）把连续变量选入因变量框（3）把自变量（分类变量）选入固定变量框（4）做模型的设置A AN NO OV VA A阅读理解分数190.125363.37522.533.00078.750282.813268.87531Between GroupsWithin GroupsTotalSum ofSquaresdfMean SquareFSig.T Te es st t o of f H Ho om mo og ge en

48、ne ei it ty y o of f V Va ar ri ia an nc ce es s阅读理解分数3.235328.037LeveneStatisticdf1df2Sig.7.2.2双因素完全随机设计（1）适用条件研究中有两个自变量（被试间变量），一个有p个水平，另一个有q个水平。随机分配被试，每个被试接受一个实验处理的结合。（2）被试分配a1b1a1b2a1b3a2b1a2b2a2b3S11S21S31S41S12S22S32S42S13S23S33S43S14S24S34S44S15S25S35S45S16S26S36S46 一个研究要探讨文章的生字密度及熟悉度对学生阅读理解的

49、影响。数据如下：a1b1a1b2a1b3a2b1a2b2a2b33643464257524533898712131211T Te es st ts s o of f B Be et tw we ee en n- -S Su ub bj je ec ct ts s E Ef ff fe ec ct ts sDependent Variable: 阅读理解分数218.333a543.66723.463.000888.1671888.167477.224.00080.667180.66743.343.00081.083240.54221.784.00056.583228.29215.201.0003

50、3.500181.8611140.00024251.83323SourceCorrected ModelInterceptABA * BErrorTotalCorrected TotalType III Sumof SquaresdfMean SquareFSig.R Squared = .867 (Adjusted R Squared = .830)a. 7.2.3三因素完全随机设计的方差分析（1）适用条件研究中有三个自变量，它们都是被试间变量，分别有p个水平、q个水平、r个水平。随机分配被试，每个被试只接受一种处理水平的结合。（2）被试分配a1b1c1a1b1c2a1b2c1a1b2c2

51、a2b1c1a2b1c2a2b2c1a2b2c2S11S12S13S14S12S22S32S42S13S23S33S43S14S24S34S44S15S25S35S45S16S26S36S46S17S27S37S47S18S28S38S48例一研究者想对影响学生阅读理解的因素做更深入的探讨,实验设计中可以包含更多的因素。如探讨生字密度(A)、文章类型(B)和文章的句子长度(C)对阅读理解的影响。数据如下a1b1c1a1b1c2a1b2c1a1b2c2a2b1c1a2b1c2a2b2c1a2b2c2364357524642453389875676988712131211Tests of Bet

52、ween-Subjects EffectsTests of Between-Subjects EffectsDependent Variable: 阅读理解分数231.375a733.05421.154.0001275.12511275.125816.080.000153.1251153.12598.000.00012.500112.5008.000.0093.12513.1252.000.17024.500124.50015.680.0011.12511.125.720.40512.500112.5008.000.00924.500124.50015.680.00137.500241.563

53、1544.00032268.87531SourceCorrected ModelInterceptA（生字密度）B（文章类型）C（句子长度）A * BA * CB * CA * B * CErrorTotalCorrected TotalType III Sumof SquaresdfMean SquareFSig.R Squared = .861 (Adjusted R Squared = .820)a. 7.3区组设计的方差分析7.3.1单因素随机区组设计（1）一个自变量（包含两个以上水平）,一个区组变量（包含两个以上区组）,自变量与无关变量没有交互作用。（2）设计样式A 1A 2A

54、 3A 4区组 1S 1 1S 1 2S 1 3S 1 4区组 2S 2 1S 2 2S 2 3S 2 4区组 3S 3 1S 3 2S 3 3S 3 4区组 4S 4 1S 4 2S 4 3S 4 4oSpsss实现过程（1）程序：分析-一般线性模型-单变量（2）把连续变量放入因变量框（3）把区组和自变量都放入固定变量框（4）设置模型，使区组与自变量无交互作用o例生字密度对阅读理解的影响，按智力水平把被试分成8个区组，数据如下：A1A2A3A4BL1BL2BL3BL4BL5BL6BL7BL83643575246424533898756769887121312112429241926

55、31272235315680202T Te es st ts s o of f B Be et tw we ee en n- -S Su ub bj je ec ct ts s E Ef ff fe ec ct ts sDependent Variable: 阅读理解分数216.000a1021.6008.579.0001275.12511275.125506.433.000190.125363.37525.170.00025.87573.6961.468.23252.875212.5181544.00032268.87531SourceCorrected ModelInterceptA(生字

56、密度)BL(智力)ErrorTotalCorrected TotalType III Sumof SquaresdfMean SquareFSig.R Squared = .803 (Adjusted R Squared = .710)a. 7.3.2两因素随机区组设计（1）研究中有两个自变量A（p个水平）、B（q个水平），还有一个区组变量（分n个区组）；区组变量与自变量之间没有交互作用（2）设计样式a1b1a1b2a1b3a2b1a2b2a2b3区组1区组2区组3区组4区组5S11S21S31S41S51S12S22S32S42S52S13S23S33S43S53S14S24S34S44S5

57、4S15S25S35S45S55S16S26S36S46S56例生字密度文章类型对阅读理解的影响，按智力水平把被试分成4个区组，数据如下：a1b1a1b2a1b3a2b1a2b2a2b3区组1区组2区组3区组46343644275525433988713121211T Te es st ts s o of f B Be et tw we ee en n- -S Su ub bj je ec ct ts s E Ef ff fe ec ct ts sDependent Variable: 阅读理解分数245.500a830.68772.681.000888.1671888.167 2103.5

58、53.00080.667180.667191.053.00081.083240.54296.020.00027.16739.05621.447.00056.583228.29267.007.0006.33315.4221140.00024251.83323SourceCorrected ModelInterceptAB区组A * BErrorTotalCorrected TotalType III Sumof SquaresdfMean SquareFSig.R Squared = .975 (Adjusted R Squared = .961)a. 7.3.3拉丁方设计有一个p个水平的自变

59、量，两个p个水平的无关变量，其中一个无关变量被分配给p行，另一个被分配给p列；自变量与两个无关变量之间无交互作用。C1C2C3C4B1A1S1S2A2S9S10A3S17S18A4S25S26B2A2S3S4A3S11S12A4S19S20A1S27S28B3A3S5S6A4S13S14A1S21S22A2S29S30B4A4S7S8A1S15S16A2S23S24A3S31S32C 1C 2C 3C 4B 1A 134A 223A 365A 498B 2A 287A 332A 443A 176B 3A 389A 41213A 156A 264B 4A 454A 187A 21211A 375

60、一研究者研究生字密度对学生阅读的影响，首先按智商和年级把被试进行了分组，研究数据如下：变异来源平方和自由度均方F 值A(生字密度)B(班级)C(实验时间)残差单元内误差190.12556.1251.37510.25011.000P-1=3P-1=3P-1=3(p-1)(p-2)=6p2(n-1)=1663.37518.7080.4581.7080.68892.11*27.19*0.672.48合计268.875 np2-1=317.4单因素重复测量设计（1）适用条件适用条件一个自变量有p个水平。被试接受所有的处理水平时，前面的对后面的没有影响。即没有学习、记忆效应。（2）设计样式设计样式a1a2a

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

SPSS统计软件与应用

文档简介

温馨提示

最新文档

评论

SPSS统计软件与应用

文档简介

温馨提示

最新文档

评论

相关文档