SPSSbase110教学系统研PPT课件_第1页
SPSSbase110教学系统研PPT课件_第2页
SPSSbase110教学系统研PPT课件_第3页
SPSSbase110教学系统研PPT课件_第4页
SPSSbase110教学系统研PPT课件_第5页
已阅读5页,还剩276页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、心理学常用统计资料的分析工具,统计资料的分析工具:SPSS,SPSS 是 Statistics Package for Social Science的缩写,其统计分析功能强大,为国际上最著名和使用最广泛的统计分析软件。我们在教学中把握这样的指导思想:先从整体上了解SPSS的结构框架和基本过程;熟练地掌握心理学研究中最为常用的一些描述性统计分析过程(包括常用统计图表的制作)、平均数差异检验、相关分析和因子分析、常用非参数检验等 。 教学中,更多的是从心理学研究实例及设计模式出发,介绍切实可用的资料分析方法和步骤。,SPSS最初是由斯坦福大学的三名大学生于1968年开发的统计分析系统,并于1975

2、年基于该系统成立了SPSS公司。公司不断地对软件进行升级,先后出现近20个版本。 公司在90年代连续收购多家同类公司后由原来单一统计产品的开发与销售向企业 (金融、电信)、教育科研及政府机构提供全面信息统计决策服务,成为走在最新流行的“数据仓库”和“数据挖掘”领域前沿的公司,最近其英文全称改为Statistics Product and Service Solutions。,返回,SPSS软件操作的三个基本窗口,第 一 章 数 据 文 件 的 建 立 与 编 辑,第 二 章 描 述 性 统 计 分 析 过 程,第 四 章 T 检 验 的 适 应 条 件 与 分 析 过 程,第 五 章 因 素

3、型 实 验 设 计 及 方 差 分 析 过 程,第 六 章 相 关 性 研 究 及 其 分 析 过 程,第 三 章 常 用 统 计 分 析 图 的 制 作 与 编 辑,第 七 章 回 归 分 析 及 回 归 方 程 的 建 立,第 九 章 因 子 分 析,引 言,第 八 章 聚 类 分 析,第 十 章 非 参 数 检 验,Bai et al. Neurology, 2011,Figure and Table,Zhong et al. Epilepsy Res., 2011,T TEST,CC,引言,统计学 (Statistics):,The science and art of dealing

4、 with variation in data through collection, classifcation and analysis in such a way as to obtain reliable results (J.M. Last) 通过收集、分类和分析,处理数据变异性的科学与艺术,旨在取得可靠的结果。,The discipline concerned with the treatment of numerical data derived from groups of individuals (P. Armitage). 关于处理数据的科学,为什么学习统计学 (Stati

5、stics):,1,心理研究需要统计学 2,更新心理学知识的需要 3,处理自身工作和研究的数据,事物的运动变化是多因素作用的结果,其中有些因素的变化有确定性,其影响也有确定性,使事物运动表现出必然趋势;有些因素的变化是随机的,其影响也是随机的,使事物运动变化有不确定性。一定条件下,对事物作观察时会出现多种可能的结果,这种现象叫随机现象或随机事件。 随机事件的发生也是必然与偶然的统一,必然性叫“规律”,偶然性恰恰要掩盖这个“规律”。如果对事物影响的不确定性因素及其作用增大,就必须对其进行较长期、较多次的观察和统计,才能从其随机变化中发现“规律”,故叫“统计规律”。,一、 统计规律与统计方法,当事

6、物变化的偶然性达到一定程度,个案研究就不能帮助我们把握全局和整体,须对事物进行多次观察和统计,或对一类事物的“大量”个案进行观察和统计,了解事物的运动变化中各种状态发生的相对次数,这些相对次数反映了事物各种状态出现的可能性,叫概率。从这些概率中我们就可以发现事物运动的规律,即“统计规律”。 根据事物运动的概率 (probability) 描述或推断事物运动规律的方法就叫概率论(probability theory),也叫统计学 (statistics)。概率论或统计学属于数学,将其应用到某一具体研究领域时,就形成了应用统计学。“心理统计学”就属于应用统计学,它可以帮助我们从能观察和测量得到的人

7、们的心理 (mind) 或行为 (behavior)推断出人的心理活动规律。,发现“统计规律”需要“统计方法”,二、统计学分析的对象,统计学分析的对象是数字化资料,而这些数字化资料是采用某些手段测量得到的事物的属性值或特征值,即变量值。因事物所受影响因素的复杂性和随机性,测量中常常存在偏差。要想认清事物的特征及其规律,必须分析误差及其规律,从某种意义上说,统计学是分析误差规律的科学,而且主要是分析随机误差规律的科学。所以,在统计学中,对测量对象的特征、规律进行任何描述和推断的过程中,几乎都是依赖于对测量误差的估计与分析。,显然,统计学是关于随机事件变量值的分析问题。变量的本质与变化方式不同、采

8、用的测量工具不同,测量得到的数据性质也不同,统计学就以不同方式对数据进行分析。 根据来源分,数据有“计数的”和“测量的”两大类。 根据量化水平和变量本身变化的属性分,变量包括:称名变量、顺序变量、等距变量、比例变量。四类变量在反映事物变化的信息量上是不同的,即测量水平不同。,变量还可以划分为两大类:离散变量与连续变量。一般,类别变量、顺序变量的数据是离散的,等距变量、比例变量是连续的。 离散变量:取值是孤立、间断的,可能的取值数目有限; 连续变量:其可能的取值是可以连续变化的,即在任何两个取值之间都还包含有无穷多种可能的取值。,三、 心理统计学的基本内容,如果依据其功能,统计学包括三大方面的内

9、容: (1)描述性统计:研究如何整理、简缩数据,包括使用统计图表或统计量数概括数据的分布特征; (2)推断统计:研究如何由对局部的观察结果去把握或估计总体的真实情况,包括参数估计和假设检验两方面; (3)实验设计:研究如何抽取被试和配置被试、如何控制实验条件、如何获取和分析数据等。,四、总体和样本,1. 总体、个案和样本,2. 总体参数与样本统计量,不管是总体还是样本,都有对其描述的一系列特征。如果对总体中每一个体的特征进行测量,就可得到一个或多个特征值,这些值叫总体参数(parameter);如果对样本中每一个体进行测量,也会得到一个或多个特征值,这些特征值叫统计量(statistic)。,

10、总体(population):某一观测目标包括的所有对象; 个体、个案(case):总体中每一独立的观测对象或观测值; 样本(sample):来自总体的拟作为总体代表的部分观测对象。,直接对总体的参数进行测量,在许多时候是不可能的,而常常能做的是测量样本的统计量,然后由样本统计量了解总体。但是,抽样过程存在许多偶然性的影响因素,这些偶然因素却必然会带来样本与总体之间的偏差,即抽样误差。,研究对象的总体包括大量个体,个体数用N 表示;用来作为总体代表的样本包含较少的个体,个体数用n 表示。从总体中抽取少数个体组成样本的过程叫做抽样(sampling)。 统计量与参数的差异量叫抽样误差(sampl

11、ing error) 。,第一,简单随机抽样; 第二,等距抽样:又称为系统抽样; 第三,分层抽样和按比例分层随机抽样; 第四,整群随机抽样; 第五,便利抽样。,3. 实用的抽样方法,第一章 数据文件的建立与编辑,数据文件是SPSS分析过程的基本对象,它要根据具体研究的性质和模式、统计分析的目标和手段,将研究过程中的被试因素、控制的或操纵的变量、记录的关于被试的心理或行为的观察资料即因变量三方面的信息按照特定的格式录制成数据文件,变量的记录方式尽可能数字化。 数据文件都是由列变量( 准自变量或机体变量、控制变量、观测变量)与个案行组成的数据矩阵,就是说,数据表中每一列反映一个变量(variabl

12、e)的值,每一行反映一个案(case)的特征或各种观测值 。变量排列中,一般将控制或分组变量排在左(层次越高越靠左),它反映个案的固有特征或接受观测、实验处理的条件。,一. 数据录入方式,自由(free)格式句法(syntax)方式,固定(fixed)格式句法(syntax)方式,数据表格操作方式,其他系统数据转入方式,数据文件形成后还可根据需要进行多种编辑和变换,自由格式句法方式输入数据举例,为了考察简单反应时间的通道效应,某心理学工作者抽取男大学生20名,再随机分成相等的两组参加,分别参加光刺激、声刺激反应时间的测试,得到表1-1所示的结果。,首先分析这一研究模式中,有多少不同的变量参与分

13、析:一个刺激变量,包括两个水平,可以用S 表示;一个反应变量,包括20个被试的观测值,可以用RT表示。然后调用SPSS的句法文件窗口,编写可运行语句。,DATA LIST FREE/S RT. BEGIN DATA. 1 180 1 165 1 178 1 200 1 203 1 189 1 190 1 186 1 170 1 200 2 165 2 142 2 150 2 180 2 185 2 153 2 190 2 137 2 162 2 130 END DATA.,在 SPSS句法文件窗口中写入如左边所示的语句并运行即可得到该研究统计分析所需要的数据文件。,程序及其运行演示,返回,固定

14、格式句法方式输入数据举例,还使用刚才的实例,我们改用固定格式的句法文件完成数据录入:打开句法文件窗口、书写固定格式数据输入程序。,DATA LIST FIXED/S 1 RT 2-4. BEGIN DATA. 1180 1165 1178 1200 1203 1189 1190 1186 1170 1200 2165 2142 2150 2180 2185 2153 2190 2137 2162 2130 END DATA.,在 SPSS句法文件窗口中写入如左边所示的语句并运行即可得到该研究统计分析所需要的数据文件。,程序及其运行演示,返回,固定格式输入数据的便利之处,在大量本、多变量问卷调查

15、中,采用固定格式建立数据文件要比其他方式更便利,它可以节省很多次的击键操作。,举例:某研究者想探明江苏省不同地区、不同学校层次等不同生活境遇下中小学教师的心理健康状况,以及影响这些教师心理健康的主要因素,于是对 548 名中小学教师进行了问卷调查。剔除无效问卷后,其调查涉及到538个人的198个变量,如果采用固定格式建立数据文件要比采用自由格式建立数据文件时少击打105,986次空格键。,过程演示,返回,直接在SPSS的数据文件窗口中键入变量和数据,打开 SPSS 的数据文件 窗口,点击 Variable View 设置变量,点击 Data View 键入数据,保存文件 程序运行演示,返回,6

16、. 变量定义应注意的问题,1 变量名必须以字母、汉字或字符开头, 其他字符可以是任何字母、数字或“_”、$等符号,但是一般使用英文字母和数字;,2 变量名总长不能超过八个字节,最后一个字符不能用句号;,3 变量名中不能使用空白字符或其他特殊字符(如!、?等);,4 变量名的字母不分大小写、一个文件中不能用相同名称定义两个变量;,5 SPSS 系统使用的一些逻辑关系的关键字和命令关键字都不能作为变量名 ,如ALL、AND、NOT、WITH、TO、BY、GT、GE、LT、LE、EQ、NE、OR等13个不能作变量名;ANOVA、CORR等也不能作变量名。,6 如果变量的输入值包含字符或汉字,则必须将

17、变量的输入值类型设置为String,否则无法在其变量下边输入字符或汉字。,二、 数据文件的编辑与变换,示例1:将一被试选择反应时数据(红:415;绿:430;:蓝438; 黄:462)加到数据文件中,并排在第8位置,将原第10位被试 的数据删除。并查找RT3为480的数据。 选中第8行DataInsert Case Editfind 演示,数据文件的扩展与减缩: 增加或减少个案 (case)数(增加或减少行数)、增加或减少 变量数(增加或减少列数)、合并两个或两个以上的文件、 选择个案子集、进行分类汇总等。,二、 数据文件的编辑与变换,示例3:将示例2中形成的文件1和文件2合并(纵向合并)、

18、文件3和文件4合并(横向合并), 形成原来的完整的数 据文件。 DataMerge FilesAdd Cases/ Add Variables 演示,示例2:对上述操作后的数据文件按照“性别”进行分组 DataSplit FileCompare groups 演示,2. 选取个案子集: 根据分析需要选择部分个案进行分析 : 点击DATA菜单选择Select Cases命令,弹出 Select Cases对话框并选择适当的方式。 演示,3. 数据分类汇总: 可根据指定变量的数值对测量数据进行归类汇总。如 一大样本调查研究的数据文件中包括来自不同地区、 不同班级、不同性别的学生的一系列测量值。要把

19、不同 地区的测量情况分别进行统计分析,则需要进行分类 汇总处理,即得到各类别下个案观测值的平均值。 演示,Data,Aggregate,Break Variable,Aggregate Variable,菜单操作法,三、变量的操作,选列操作法,增加变量,变量标签法,1. 增加和删除变量,删除变量,1. 根据已有变量产生新变量,在数据统计中,有时需要通过数据转换来体现变量间的真实关系 , 这就要对已有变量进行算术的、函数的、逻辑的处理以生成新变量 , 这一般可以通过 “Transform”菜单的Compute项打开的对话框完成, 或者通过句法文件窗口直接编写compute语句来完成。,实例分析:

20、某公司为招聘中层干部,聘请心理测量专家帮助其组织了对应聘人员的综合测评。专家设计的测评项目包括:记忆力 X1 、注意力X2、思维力X3、决策力X4、组织协调力 X5、专业知识和技能 X6、计算机操作技能 X7、一般性文化知识 X8、道德品质 X9、心理健康水平 X10 。各项目均以百分制记分,然后前 5项分别按 1、1、2、3、3的权重整合得到能力分数(百分制记分); 6、7、8三项分别按5、2、3的权重整合得知识技能分数(百分制记分)。最后以能力、知识技能、道德品质、心理健康水平四个方面的得分决定哪些人进入复试。这样的资料如何处理?,过程演示,2. 缺失值的替代,在统计工作中,对于缺失值,可

21、以采取多种手段进行科学替代。 TransformReplace Missing ValueNew Variable(存在缺失值的一个或者多个变量)Name and Method (Name: 自定义替代缺失值后的新变量) Series mean: 该变量所有非缺失值的均数做代替 Mean of nearby points Median of nearby points (演示),3. 产生计数变量,在统计工作中,有时需要进行一些计数工作,比如在学生期末考试结束后,想要统计哪些学生各门功课均为80分以上的、哪些学生是只有一门功课低于80分的,哪些学生是两门功课低于80分的,等等。我们以前述的招聘

22、测试数据表为例,形成一个计数变量,以统计出哪些应聘者是决策力、组织协调力、道德品质、心理健康水平得分均在70分以上的。 TransformCountTarget VariableTarget LabelNumeric VariableDefine Values(Value:固定值;Range1: 区间; Range2:小于等于n的区间; Range3:大于等于n的区间)If (演示),4. 变量的重新赋值,这一变量操作非常有用,它既可以修正原有变量的一些数字,也可以生成一个新的变量,还可以形成一个分组变量。 TransformRecodeInto Same Variables(对变量自身重新赋

23、值)/ Into Different Variables(赋值到其他变量或者新生成的变量)Numeric VariableIfOld and New Values 我们以下列任务为示例:,例 1:某企业实行按劳付酬工资制,但为保障工人生活 水平不低于全市最低保障线,规定不足于500元的发放 工资500元。 演示,例 2 :在心理和教育研究中,常根据某测试分数将被试 分组,使连续变量变成离散的组别变量,比如根据智商 分数将被试分成智力低下者、智力中下者、智力中等者、 智力中上者、智力优秀者五个组别,并用 1、2、3、4、5 代替 ,对应于69 分以下者、 7089分者、90109分者、 1101

24、29分者、130分以上者。 演示,复习与思考(练习)题,数据表见下页,返回目录,转到第二章练习题,5. 思考题:心理学中常见的研究模式有哪些?其数据文件的模式大概是什么样子?(构想一些研究过程,构造对应的数据文件),(1)单因素-单/多因变量的完全随机实验设计; (2)单因素-单/多因变量的重复实验设计; (3)多因素-单/多因变量的重复实验设计; (4)多因素混合实验设计; (5)来自多个被试群的被试在同样/不同条件下均接受同一问卷的调查或测量; (6)来自多个被试群的被试在同样/不同条件下均接受多个问卷的调查或测量; (7)学校教育中常见的考试成绩表、社会政治经济状况分析中常见人口信息调查

25、数据库; ,所谓描述性统计分析,就是对一组数据的各种特征进行分析,以便于描述测量样本的各种特征及其所代表的总体的特征。描述性统计分析的项目很多,常用的如平均数、标准差、中位数、频数分布、正态或偏态程度等等。这些分析是复杂统计分析的基础。,平均数、标准误,中位数、众数、全距,标准差、方差,四分位、十分位、百分位数,频数分布、峰度、偏度,标准分数及其线性转换,探索分析,交叉列联表分析,第二章 描述性统计分析过程,1. 平均数、标准误,返回本章首页,基本的描述性统计量,中位数、众数、全距,返回本章首页,标准差、方差,返回本章首页,严格地讲,在方差和标准差的计算中,分母应取n-1,因为数据变异的自由度

26、是n-1。但在大样本情况下,使用n和n-1差别不大。,实例演示,四分位、十分位、百分位数,返回本章首页,4分位数实例演示1,例3,一项心理学研究测量职业经理人的智商。被试为某城市的职业经理人,共100名。测量工具采用韦克斯勒成人智力量表(WAIS)。研究的目的在于了解这一团体的平均智商以及智商的分布情况(例如D?P95四分位?)。 演示,返回本章首页,例2,40个院系学生5门课考试成绩,求总分的D6. 演示,频数分布、峰度、偏度,频数 (Frequency) 就是一个变量的各个观测值出现的次数。比如某班语文考试的成绩,可以统计出各分数值的人数。,峰度(Kurtosis) : 是描述某变量所有取

27、值的分布形态陡缓程度的统计量,而峰度对陡缓程度的度量是与正态分布进行比较的结果。如果峰度等于 0 ,其数据分布的陡缓程度与正态分布相同 ;峰度大于 0,其数据分布比正态分布更陡峭;峰度小于0,其数据分布比正态分布更平坦。,返回本章首页,偏度( Skewness ) 是描述数据分布对称性的统计量 ,而且也是与正态分布的对称性相比较而得到的。如果分布的偏度等于0 ,则其数据分布的对称性与正态分布相同 ;如果偏度大于0,则其分布为正偏或右偏,即在峰的右边有大的偏差值,使右边出现一个拖得较远的尾巴;如果偏度小于 0,则为负偏或左偏,即在峰的左边有大的偏差值,使左边出现一个拖得较远的尾巴。,返回本章首页

28、,实例演示,标准分数及其线性转换,z分数:从平均数为,标准差为的总体中抽取一观测值,该观测值的z分数是其距离总体平均值的标准差数。标准分数反映的是一观测值与其他分数相比的相对位置。比如z 分数为 1.5 ,则其比平均数大 1.5 个标准差。在实际应用中 ,为了避免小数的不便,可以对标准分数进行线性转换: T10z50 比如某人在艾森克人格问卷的测量中 ,其精神质得分比同年龄人的平均成绩高2.0个标准差,则其换算后的标准分数为 70 分 ;如果另一人的测试分数正好等于平均数,则其标准分数为50。,返回本章首页,实例演示,探索分析,探索分析是对一组或多组数据的总体分布特征进行分析,以考察其中有无奇

29、异值、极大或极小值等;考察各组数据或全部数据是不是正态或接近于正态分布;探索多组数据之间的方差是否齐性,以确定是否可以采用某种统计分析技术对数据进行检验等等。我们这里介绍: 1. 用直方图反映数据的分布直观形式; 2. 用箱图 (或叫框图)反映数据的集中趋势和奇异值; 3. 用Levene检验考察多组间方差是否齐性; 4. 用Q-Q概率图检验数据是否正态分布或接近正态分布。,返回本章首页,1. 用直方图直观地反映数据的总体分布,调 用 数 据 文 件 并 得 到 直 方 图,返回本章首页,直方图:是一种频数分布图, 它反映处在某一观测值范围内的个案数。图中每个直方条下部的中点坐标是该观测值范围

30、的中点、直方条的宽度代表该观测值范围、直方条的高度代表该观测值范围内的个案数或人数比例。,2. 用箱图 (或叫框图)反映数据的集中趋势和特异值,调用数据文件并得到箱图,返回本章首页,批注 : 箱图可以直观地反映一组观测值的集中趋势、离散趋势、不正常观测值(奇异值和极值,均可被排除后重新分析)。左图中箱图的高度代表了25 位数到 75 位数的距离;箱图中的粗线代表中位数;箱图上下中央的垂直线叫触须线,触须线的上下截止线分别对应于观测值的最大值和最小值;用 O标记的是奇异值(与框边距离超出框高1.5倍)、用*标记的为极大值或极小值(与框边距离超出框高3倍) 。,3. 用Levene检验方差是否齐性

31、,方差齐性检验是统计分析中的一种常见过程,它是从样本方差以至样本各自所代表的总体方差是否相同而判断两个样本同质性(homogeneity) 的方法。简单地说,方差齐性检验就是检验各个方差是否存在显著性差异。一般采用Levene方法:先将各组观测值均转换为离差绝对值,然后对各组离差绝对值进行方差分析,如果方差分析的结果中p 0.05,则认为方差齐性(即方差具有相同性);方差分析的结果中p0.05,则认为方差不齐性(即方差具有不同质性)。,方差齐性检验举例与spss过程演示,返回本章首页,4. 用Q-Q概率图检验数据是否正态分布,可以用正态概率Q-Q图和离散正态概率Q-Q 图检验观测值的分布是否是

32、或接近于正态分布。正态概率图是由观测值与按正态分布的预期值作出来的散点图 ,如果实际值为正态分布 ,则其与预期值具有线性对应关系,散点图回归一条斜线,该斜线是正态分布的标准线,散点图组成的回归线越接近于标准线,表示实际观测数据越接近正态分布;如果以观测值、其与正态分布期望值的离差值做散点图,则当散点近似随机地落在过原点的中间横线周围时,数据分布接近于正态分布。,正态概率图(Normal Q-Q Plot)的SPSS过程 离散正态概率图(Detrended Normal Q-Q Plot)的SPSS过程,返回本章首页,返回本章首页,描述性统计,是心理学研究、教育研究中资料分析的基本内容和进一步分

33、析的基础。常用的除上述介绍之外,还包括交叉列联表分析,我们将交叉列联表的分析转入非参数检验部分讨论。 本章要求熟练掌握的内容包括:平均数、标准差、中位数、众数、频数分布、标准分数 (Z)及其线性转换、峰度计算、偏度计算、奇异值和极值检测、方差齐性检验等方面的SPSS过程;准确理解直方图和箱图的各种特征及其所代表的含义。,返回本章首页,本章练习题及数据表,练习题,转到第三章练习题,第三章 常用统计分析图的制作与编辑,统计图是用点的位置、线段的升降、直条的长短或面积的大小等方法来表达统计资料的内容。它可以把统计资料所反映的变化趋势、数量多少、分布状态和相互关系等情况形象直观地表现出来,以便于读者阅

34、读、比较和分析。 这里介绍可以通过SPSS 的Graphs 图形菜单中所包含的各种图形制作功能,直接将统计资料绘制成各种统计图形。,条形图,线图,面积图,圆图,高低图,箱图,误差条形图,散点图,直方图,例,文本阅读,例,Bai et al. Neurology, 2011,Figure and Table,SigmaStat-SigmaPlot,Origin,Matlab,Office,TM,一、条 形 图,条形图(Bar Charts)是利用宽度相同的条形的长短或高低来表现统计数据大小或变动情况的统计图。这是社会事业发展及经济、教育心理学研究中最为常用的统计图形。它包括三种形式 :简单条形图

35、、复式条形图和分段条形图。,返回本章首页,返回本章首页,返回本章首页,返回本章首页,返回本章首页,返回本章首页,返回本章首页,返回本章首页,返回本章首页,返回本章首页,返回本章首页,在实际统计分析中,简单条形图和复式条形图都被频繁使用,二者的区别在于信息量的大小。与简单条形图相比,复式条形图加载了一个个案的分组变量。如用简单条形图可以比较男生和女生某一学科测查成绩,那么使用复式条形图可比较不同院系男生和女生一个学科的测查成绩,或比较男生和女生各科成绩的院系差异。,演示各种类型条形图的制作过程,返回本章首页,在制作复式条形图时,用第一层次的分类变量来定义横轴上的各群,即“define clust

36、er”;然后第二层次的分类变量用来定义“群”内各条。比如作各院系男女生数学成绩比较的条形图,则院系为第一层分类变量、性别为第二层分类变量;作男女生各院系数学成绩比较的条形图,则正好相反。,实例解决:一研究生在毕业论文中得到下表所示的研究结果。但是这一结果表达的方式不能直观地看到学校之间、年级之间的变化趋势,所以想改用条形图来表达。你如何制作这一条形图呢?,初中生考试焦虑状况的学校、年级间比较,返回本章首页,二、线图,线图(Line Charts ) 又称曲线图或折线图,是用线段升降说明变动的统计图,常被用来表现变量在时间上的变化趋势、现象的分配情况和现象间的依存关系。 更多情况下 ,线图的横坐

37、标代表时间变量或控制变量的不同水平 ,纵坐标则反映不同时间或不同控制变量水平上的 某一观测量或几个观测量 。如不同年龄儿童某一心理品质发展水平 、不同年份工业品产量、不同动机强度下的学习效果、不同预备时间下的 简单反应时间等都可以用线图直观显示。,返回本章首页,返回本章首页,返回本章首页,返回本章首页,制作各种线图的过程演示,返回本章首页,三、圆图,圆图(Pie Charts) 又称饼图,是以整个圆的面积代表被研究现象的总体,按各组成部分占总体比重的大小把圆面积分割成若干扇形,用以表示现象的部分对总体的比例关系。 圆图一般有三种类型 :(1) 个案分组的圆图,即研究对象被分成多组,各组个案数可

38、以组成圆图,各组观测值总量也可以组成圆图 ;(2)单个变量的圆图 ,即圆图中单个扇形的面积代表了其对观测总量的贡献大小,如各工业品产值对工业总产值的贡献 ;(3)单个个案的圆图 ,即一个扇形代表一个个案观测值与个案观测值总和相比的份额。,制作圆图的SPSS过程演示,误差条形图,误差条形图( Error Bar Charts) 是一种用于描述数据总体离散的统计图 。主要用于表示均值的置信区间、标准差或标准误等统计量,可以反映个案的离散性。 具体地说,可以反映以下信息(1)单个变量分成若干组后各组均值与离散性;(2)多个变量各自的总体均值与离散性 ;(3)两个控制变量条件下以复式误 差条形图反映个

39、案分组后各组某变量的均值与离散性 ;(4)一个控制变量条件下以复式误差条形图反映多个变量在各组的均值与离散性。,SPSS过程演示,散点图,散点图( Scatterplots ) 又称为散布图或相关图,是一种以点的分布反映变量之间相关情况的统计图。根据散点图中各点分布走向和密集程度,可以大致判断变量之间的共变关系的类型。,散点图一般包括四种类型,即简单散点图、重叠散点图、矩阵散点图和三维散点图,我们要求掌握的主要是简单散点图的SPSS实现过程。,以散点图判断学生中文成绩与科技知识有无共变关系,还可以通过散点图判断变量间相关的性质,即线性相关或非线性相关等。如学习动机与学习效果的关系。,综合练习题

40、,1. 构造一个包含30名学生(男15、女15)英语、物理考试成绩的数据文件,然后完成以下操作: (1)计算英语、物理考试的总体平均值、标准差、标准误、峰度、偏度;用直方图显示其分布状态; (2)用箱图检查其有无极大值、奇异值; (3)检验男生和女生英语、物理考试成绩是否方差齐性; (4)用条形图比较男生和女生的两科成绩; (5)用误差条形图反映男生和女生两科成绩的均值和离散性; (6)用散点图估计两科成绩的相关关系。,2. 构造一个包含30个人的心理健康测试成绩的数据文件,然后大致以5位数、20位数、80位数、95位数为分界点,将被试分成心理健康水平不同的5个组,再分别用条形图、圆图(饼图)

41、反映各组被试数或被试百分数。,3. 下表是心理旋转实验得到的数据资料,请在一个坐标系中用曲线表示不同实验条件下得到的刺激字母倾斜角度与被试反应时间的关系。,过程演示,转到第四章练习题,第四章 T检验的适应条件与分析过程,一、推断性统计分析的基本逻辑,1. 随机事件,所谓随机事件,就是事件的发生具有不确定性,或者说其发生服从于完全的机遇机制,即随机性,比如测量中各种随机因素导致的误差大小具有随机性,但在测量样本较大时,误差总平均等于 0 ,随机误差值的频数分布为正态分布。,描述随机事件的有效方法就是概率和概率分布。如,对于大的总体来说,我们无法测定其中每一个体的智商,但可以根据其正态分布预测各种

42、智商发生的概率,因为平均数及其附近的值发生概率高,远离平均数的值发生概率较低,当其与平均数的距离达到 1.96个标准差以上时,其发生概率小于 5,即 P0.05,就被称为“小概率事件”。 通俗地讲,小概率事件就是“不大可能”发生的事件。心理学中,通常以发生概率小于0.05或0.01为标准来界定之。,2. 推断性统计分析的逻辑基础是:抽样误差,研究一个总体,不可能对总体作完全的测量,只能采取抽样测量的方法,但样本测量的结果与总体相比总会出现偏差。我们虽然无法预见或确定每一样本所出现的偏差的大小,但却可以知道偏差越大,发生的概率越小。偏离程度达到一定值时,该样本就成为一种小概率事件了。,当我们对一

43、样本进行测量,得到其平均数、标准差 ,那么如何判断该样本是否能代表某一总体的水平呢?我们可以先作出一个假设:先假设这一样本就来自于相应总体,那就可以按抽样误差的分布规律来评估其发生概率,如样本测量的平均值与总体平均值相比,差距较大,以至于发生的概率 小于0.05 ,它就成了“小概率事件”,意味着这一推断的前提成立的可能性不大(避免2类错误)。结论就是:该样本来自这一总体的可能性很小,它不是该总体的代表性样本,或者就说:它与这一总体的差异显著。,假设检验,3. 两个样本平均数差异性检验的逻辑,从一个总体中随机抽取 n 个个体组成样本,则有许多种可能的抽取结果,因此可以得到许多个样本平均数,样本平

44、均数的大小变化又是一个随机事件,两个样本平均数的差异量也是一个随机事件。样本平均数差异量的分布中心为0,然后,差异量越大,越远离0差异,其发生的概率就越小。当差异量达到一定值时,它就也是一个小概率事件了。,当要检验两个样本测量得到的平均数是否存在显著差异时,可以先假定它们是来自于同一总体,应该能代表同一总体,然后以此为前提考察这两个样本平均数差异量发生的概率。如果差异量足够大,其发生概率小于0.05,我们就说其是小概率事件,成为“可能性很小” 的事件,这就意味着假设前提成为 “可能性很小”的,即二者来自于同一总体的 “可能性很小” ,进而推断 :这两个样本很可能来自于两个不同总体,分别代表两个

45、不同的总体 ,存在显著性差异。反之 ,就不能说两个样本有显著性差异了。,二、 t值和t值分布,统计学家长期的研究发现,从正态分布的总体中抽取样本时,样本平均数的分布也是一个正态分布,样本平均数的差异量的分布也是正态分布,其分布特征可以用Z分数来描述。但是,在实际计算标准分数时,需要首先知道总体的标准差,然后计算抽样分布的标准误。如果总体标准差未知,也就只能使用样本标准差作为它的估计值了,以这一估计值计算的标准误就是一个波动值了。这时,计算的“标准分数”就不再标准,因此不能使用Z分数来描述其分布特征,而是要用t分数来描述其分布特征。,t 分布是一个均值为零左右对称的丘形分布,其峰度低于标准正态分

46、布,尾部高于标准正态分布,而且T 分布的峰度变化与自由度有关。自由度越大其分布越接近于正态分布,所以在大样本检验中可以使用Z检验代替t检验。 根据统计学研究,样本平均数与总体平均数的差异值符合自由度为某一确定值的T分布,自由度的确定则与样本容量有关 ;两个样本平均数的差异值也符合自由度为某一确定值的T分布 ,自由度的确定则与两个样本的容量及样本的相关关系有关。 我们可以将t分布与Z分布进行对照。,三、不同条件下的t值及t分布自由度的计算,1.样本与总体的差异性比较,示例1:某一20人的样本,其身高平均为1.35米,标准差为0.26米,试问该样本是来自于平均身高为1.50米的总体吗? 或者:给出

47、样本所有个案的观测值,然后检验该样本是否与某一总体平均值存在显著性差异。,四、差异性t检验,1.单样本的差异性t检验 (1)适合的条件:已知单样本中每一个案的观测值和总体平均数; (2)检验假设:该样本有别于这个总体,是与该总体有根本区别的另一总体中的一个样本; (3)虚无假设或叫零假设:该样本是与该总体没有根本区别的一个样本,它可被看作是来自这一总体的一个代表性样本; (4)检验逻辑:根据t分布规律,推断虚无假设成立的概率,即伴随概率的大小。当虚无假设成立的概率小于0.05时,则拒绝虚无假设,认为该样本与这个总体存在显著性差异,反之则认为该样本与这个总体没有显著性差异。,单样本t检验过程演示

48、,单样本t检验例子,2. 独立样本间平均数的比较,独立样本平均数的比较一般出现在两种情况下:一种情况是,两个样本各来自于不同的总体,参加同样的测量,比较两个样本各自测量的平均数以判断两个样本以至两个不同总体之间是否存在某种差异性,如比较男生样本和女生样本的平均记忆力水平、场依存性分数等;另一情况是来自于同一总体的两个样本,分别在不同条件下进行同样的测量,然后比较两个样本测量的平均值的差异性,以判断不同条件对测量结果的影响。在这样的两种情况下,两个样本都是独立的,没有关联性,所以叫做独立样本t检验。,2.两个独立样本的差异性t检验 (1)适合条件:两个独立的对等组接受不同的实验处理,即在不同的条

49、件下接受观测,得到两组独立的数据(存在一个分组的自变量);来自两个不同总体的样本在相同条件下接受观测,得到两组独立的数据(存在一个分组的准自变量); (2)检验假设:两组数据的平均数存在差异,它们来自于两个有根本区别的不同数据总体; (3)虚无假设:两组数据不存在根本差异,它们是来自于同一数据总体的两个代表性样本; (4)检验的逻辑:检验在虚无假设的前提下,两个数据样本出现研究中已经观测到的差异量发生的概率,即伴随概率。如果伴随概率小于0.05,则可拒绝虚无假设,否则接受虚无假设。,独立样本平均数差异 t检验,一般包括 :进行样本间的方差齐性检验、计算 t和df值、进行统计推断。在SPSS 过

50、程中,自动给出方差齐性和方差不齐性的两个结果,同时进行方差齐性检验。研究者根据方差齐性与否选择相应的 t和 df值,并进行统计推断。 这一分析的SPSS操作过程如下:,独立样本t检验的过程的演示,独立样本t检验例子,3. 配对或相关样本间平均数的差异比较,根据某种预测成绩对被试进行配对分组得到两个样本,分别进行不同控制条件下的观测,得到的两组数据就具有一定关联性;或者一组被试参加了不同条件下的观测,得到的两组数据也具有关联性,这种测量被称为重复测量。象这样两种情况下得到的数据必然是一一对应的 ,可能存在相关 ,差异的 t检验如下列操作程序。,配对样本t检验过程的演示,3.1两个相关样本的差异性

51、t检验 (1)适合条件:同一个样本在两种不同条件下接受观测,得到两组相关的数据(这里不存在分组变量);两个匹配的对等组接受不同的实验处理,即在不同的条件下接受观测(这时:一个被试组可看作为另一被试组的复制品,即看作一个被试组在两种条件下接受观测,也“没有分组变量”),得到两组相关的数据; (2)检验假设:两组数据的平均数存在差异,它们来自于两个有根本区别的不同数据总体,因为它们的数据是在不同条件下测定的; (3)虚无假设:两组数据不存在根本差异,虽然它们来自于不同的测试条件,但这两种不同的测试条件不会引起数据的差异,所以两组数据仍然可看作是同一总体的两个代表性数据样本; (4)检验的逻辑:检验

52、在虚无假设的前提下,两个数据样本出现研究中已经观测到的差异量的发生概率,即伴随概率。如果伴随概率小于0.05,则可拒绝虚无假设,否则接受虚无假设。,复习与t检验的实例练习,某教师欲进行一项数学教学试验,以考验某种新的教学方法是否更有利于学生成绩的提高,于是从全校 500 名初二学生中抽取了20名学生参加实验班。结果期末数学考试成绩如下,这与全年级学生数学平均为82分相比有无显著差异?你认为其教学试验可以得到什么结论 ? 实验班数学考试成绩为:95 87 80 85 79 80 88 82 75 81 76 90 93 80 90 89 85 93 85 75 根据简单反应时间对20名被试进行配

53、对分组,然后各自参加不同条件下的汉字识别实验,记录的反应时间和正确率如下表所示,请分析实验条件的不同是否造成了被试汉字识别速度与正确性的显著差异。,3. 从某学校初一(1)班和初一(2)抽取男生和女生各5名参加语数外三门课程竞赛,成绩如下表,请分析各科成绩有无班级差异和性别差异?,转到14章综合测试题,阶段小结与练习,一、数据文件的建立、编辑与转换,1.变量确定与定义 (1)必须的变量数所有分组变量的个数每一被试接受的观测项目数。其中分组变量包括自变量和准自变量; (2)变量尽量使用英文字母和数字组合,需要时加上标签(Label)和变量值注解; (3)变量值尽量不使用字符型变量,即使是称名变量

54、,也尽量使用数字型变量; (4)谨记:通常情况下,数据文件的行数是与观测的个案数相同的。,2.产生新变量 (1)利用Compute命令产生新变量; (2)利用Recode命令产生新变量:依据连续测量的变量得到分组变量或离散变量;将一分组变量的若干变量值合并得到分组数较少的分组变量; (3)利用Categorize命令进行自动分组,产生一个分组变量; (4)产生计数变量、标准分数变量、汇总变量等; (5)利用Weight cases定义加权变量(补充说明)。,3.数据文件的转换 (1)选择个案子集(Select cases)构成新文件; (2)利用Sort cases对个案重新进行排序; (3)

55、利用Merge files可以进行文件合并; (4)利用Transpose可以对数据表中的行列进行互换。,二、基本的描述性统计分析,1.利用Descriptive可以得到的常用描述性分析结果:平均数、数据总和、标准差、方差、标准误、全距、最大值、最小值、标准分数、偏度和峰度等; 2.利用Frequencies可以得到:平均数、中位数、众数、数据总和、频数分布表、标准差、方差、标准误、全距、最大值、最小值、标准分数、偏度、峰度、百分位数、四分位数等; 3.利用Explore可以得到上述描述性统计量外,还可以进行极值与奇异值的甄别、分数分布的正态性检验、分组数据的方差齐性检验等。,三、常用统计图形

56、的制作与编辑,(1)常用的统计图包括:条形图(Bar)、直方图(Histogram)、线图(Line)、箱图(Boxplot)、饼图(Pie)、误差条形图(Error-bar)、散点图(scatter); (2)图形编辑内容主要包括:颜色、标题编辑、文字编辑、条形图的三维效果、线条粗细及线条型式等; (3)图形选择的依据是所要展示的信息的性质及信息量; (4)作图前要先有格式正确的数据文件,然后正确地设置各对应坐标变量的性质。,四、差异性t检验,1.单样本的差异性t检验 (1)适合的条件:已知单样本中每一个案的观测值和总体平均数; (2)检验假设:该样本有别于这个总体,是与该总体有根本区别的另

57、一总体中的一个样本; (3)虚无假设或叫零假设:该样本是与该总体没有根本区别的一个样本,它可被看作是来自这一总体的一个代表性样本; (4)检验逻辑:根据t分布规律,推断虚无假设成立的概率,即伴随概率的大小。当虚无假设成立的概率小于0.05时,则拒绝虚无假设,认为该样本与这个总体存在显著性差异,反之则认为该样本与这个总体没有显著性差异。,2.两个独立样本的差异性t检验 (1)适合条件:两个独立的对等组接受不同的实验处理,即在不同的条件下接受观测,得到两组独立的数据(存在一个分组的自变量);来自两个不同总体的样本在相同条件下接受观测,得到两组独立的数据(存在一个分组的准自变量); (2)检验假设:

58、两组数据的平均数存在差异,它们来自于两个有根本区别的不同数据总体; (3)虚无假设:两组数据不存在根本差异,它们是来自于同一数据总体的两个代表性样本; (4)检验的逻辑:检验在虚无假设的前提下,两个数据样本出现研究中已经观测到的差异量发生的概率,即伴随概率。如果伴随概率小于0.05,则可拒绝虚无假设,否则接受虚无假设。,3.两个相关样本的差异性t检验 (1)适合条件:同一个样本在两种不同条件下接受观测,得到两组相关的数据(这里不存在分组变量);两个匹配的对等组接受不同的实验处理,即在不同的条件下接受观测(这时:一个被试组可看作为另一被试组的复制品,即看作一个被试组在两种条件下接受观测,也“没有

59、分组变量”),得到两组相关的数据; (2)检验假设:两组数据的平均数存在差异,它们来自于两个有根本区别的不同数据总体,因为它们的数据是在不同条件下测定的; (3)虚无假设:两组数据不存在根本差异,虽然它们来自于不同的测试条件,但这两种不同的测试条件不会引起数据的差异,所以两组数据仍然可看作是同一总体的两个代表性数据样本; (4)检验的逻辑:检验在虚无假设的前提下,两个数据样本出现研究中已经观测到的差异量的发生概率,即伴随概率。如果伴随概率小于0.05,则可拒绝虚无假设,否则接受虚无假设。,复习题,第一第四章练习与检测题,第一第四章各章习题补充解释,第五章 方差分析,方差分析(Analysis

60、of Variance, 简称ANOVA)是因素型实验研究数据分析的核心方法,这是由其基本的研究逻辑决定的。因素型实验研究会得到多组数据,而这些数据必然存在变异。数据变异的原因是多方面的,一般包括:自变量或准自变量的水平间差异、被试差异、测量误差、其他额外变量的变化等。因素型实验的目的就是考察自变量或准自变量变化是否引起了因变量数据足够大的改变,以至于可以认为其不同水平间因变量的差异性并非误差因素造成,而且这种评估是与误差因素引起数据的变化量相比较而完成的。数据变异可以通过离差平方和或方差来反映,所以关于数据变异的分析叫方差分析。,想一想:可否用T检验?,每做一次比较 犯第一类错误的概率=0.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论