统计心理-第十章-卡方检验-PPT课件_第1页
统计心理-第十章-卡方检验-PPT课件_第2页
统计心理-第十章-卡方检验-PPT课件_第3页
统计心理-第十章-卡方检验-PPT课件_第4页
统计心理-第十章-卡方检验-PPT课件_第5页
已阅读5页,还剩51页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 第十章 单因素因果关系研究自变量数据类型因变量数据类型统计方法连续连续连续连续类别(2水平)平均数差异检验(t, Z)点二列相关,二列相关类别(3水平)方差分析(F检验)多列相关类别类别积差相关一元回归 第十章 心理学研究中,有时研究变量是按一定的性质划分为不同类别,然后统计各类别中的人数或个数,即需要用到计数资料。例如,将人按照性别划分为“男”、“女”;将学习成绩划分为“优”、“良”、“中”、“差”四个等级等,然后对各类别分别有多少、占多大比例等问题进行分析。 对这些计数资料的统计分析,不能用前几章的统计方法,则需要使用本章所介绍的 。应用 分析计数数据时,对计数数据总体的分布形态不作任何

2、假设,因此 被视为是非参数检验方法的一种。第一节 检验 概述一、 和 检验的意义 方法能处理一个因素两项或多项分类的实际观察频数与理论频数分布是否相一致问题,或者说有无显著差异问题。 所谓实际频数简称实计数或实际数,是指在实验或调查中得到的计数资料,又称为观察频数。 理论次数是指根据概率原理、某种理论、某种理论次数分布或经验次数分布计算出来的次数,又称为期望次数。第一节 检验 概述第一节 检验 概述第一节 检验 概述第一节 检验 概述第一节 检验 概述第一节 检验 概述第二节 配合度检验一、配合度检验的意义 配合度检验是应用 检验方法的一种,主要用于检验实际观测次数与某理论次数是否有差别的情况

3、。它适用一个因素多项分类的计数资料,所以又称做单因素分类 检验或单向表的 检验。第二节 配合度检验一、配合度检验的意义 进行配合度检验,应当注意自由度的确定和理论次数的计算。1. 配合度检验自由度确定与下列两个因素有关: 一是实验或调查中分类的项数; 二是计算理论次数时,用到的统计量的个数。 自由度=资料分类数目计算理论次数时所用的统计量个数2. 理论次数的计算,一般是根据某种理论,按一定的概率通过样本即观测次数计算。通常用到无差假说、正态分布、二项分布等理论模型。二、无差假说的检验无差假说是指各项分类的次数没有差异,即假设各项分类之间的机会均等,或概率相等。因此,理论次数完全按概率相等的条件

4、计算,其公式为:例8 随机抽取60名学生,问他们高中要不要文理分科,回答赞成的39人,反对的21人,问对分科的意见有无显著差异?解:例9 大学某系54位老年教师中,健康状况属于好的有15人,中等的有23人,差的有16人,问该校老年教师中三种健康状况的人数是否一样?解:三、频数分布是否符合正态性的 检验 检验还可以检验某些实得次数是否合乎正态分布。不过,在计算时,要注意把正态分布的概率,转换为理论次数的数值。即要用正态分布的概率乘以总次数得出理论次数的分配。例10 对50名学生进行操行评定,分优、良、中、差四等,评定的结果是:优7人,良22人,中18人,差3人,试检验其分布的形式是否合乎正态分布

5、?例10 的计算:概率P优良中差合计解:正态分布的基线上四等份,每等份=(3+3)/4=1.5例10 的计算:概率P优73.53.53.5良2221.50.50.01中0.431821.5-3.50.57差0.0733.5-0.50.07合计50504.15解:正态分布的基线上四等份,每等份=(3+3)/4=1.5例10的计算(续)由上表得:四、连续变量分布的拟合度检验理论次数:自由度:例11 表12-5所列资料是552名中学生的身高次数分。问这些学生的身高是否符合正态分布?例11解:表12-5 理论曲线的配合度检验身高分组组中值XC实际次数离差Z分数查表Y169-166-163-160-15

6、7-154-151-148-145-142-139-例11解:表12-5 理论曲线的配合度检验身高分组组中值XC实际次数离差Z分数查表Y169-166-163-160-157-154-151-148-145-142-139-17016716416115815515214914614314027225711012411280258415.3812.389.386.383.380.38-2.62-5.62-8.62-11.62-14.623.032.441.851.260.67.07-0.52-1.11-1.70-2.29-2.880.004.00203.0720.1840.3187.3979.3

7、484.2154.0940.0289.0067.00237.01201.04260.10888.18858.23544.20615.12746.05562.01710.00396172460104130114703192.167.150.471.277.0351.4291.161例11 解(续)如果两端的组中的理论次数均有小于5的,则需要将相邻的理论次数合并至大于5。本题共分11组,两端均有理论次数小于5,上端二组合并为一组,下端二组合并为一组,然后将实际次数也相应合并之后,再求 值,本题由上面解得: 。df=9-3=6,查 值表得:因为3.9030.05,差异不显著。故这552名中学生的身高

8、分布符合正态分布。五、两项分类且某类理论次数小于5的校正当只有两项分类(自由度为1)并且某项的理论次数小于5时,若用 检验,就要运用耶茨(Yates)连续性校正法,即在每一组实际频数与理论频数差数的绝对值平方之前,各减去0.5,用公式表示: 例12 有一学校共评出10名优秀学生班干部,其中男生3名,女生7名,问优秀学生班干部是否存在男女性别差异?解:假设无性别差异,则p=q=0.5,那么男女应各有5人,这时需要使用耶茨校正公式。例13 历年优秀学生干部中男女比例为2:8,今年优秀学生干部中有3个男生,7个女生,问今年的优秀干部比率与往年是否有显著差异?第三节 独立性检验独立性检验也是 检验的又

9、一重要应用,它主要用于两个或两个以上因素多项分类的计数资料分析。如果想研究两个(或两个以上因素)之间是否具有独立性或有无关联,就要用 检验独立性检验。如果两个因素是独立的,即无关联,就意味着当其中一个因素变化时,另一个因素的变化是在取样误差的范围之内;反之,如果两个因素是非独立,即有关联或称有交互作用存在,当其中的一个自变量(因素)变化时,另一个因素的变化就超过了取样误差的范围。一、独立性检验的一般问题 检验主要研究两个因素或两个以上因素多项分类的计数资料的独立性问题。如果两个因素中的一个因素有R类,另一个因素有C类,这种表称之为RC表,即二维列联表。特殊的列联表是22表。因素若是多于两个,这

10、种表称为多维表,多维列联表的分析较为复杂,本节从略,这里仅介绍二维列联表的 检验。一、独立性检验的一般问题二维列联表的独立性检验的一般步骤:建立假设:H0:二因素之间是独立的或无关联;H1:二因素之间是有关联的或者说差异显著。(一般多用文字表述而很少用统计符号)计算理论次数:确定自由度:计算统计量:具体方法下面逐一介绍之。统计决断二、22列联表(四格表)独立性检验独立样本四格表的 检验:四格表独立样本,即从总体中随机取样,然后按两个因素对个体进行分类,将观测结果分别填入四个格内,便得到独立样本四格表,当各格的理论次数 时,可用基本公式(12-11),即:例14 今随机抽取90人,按男女不同性别

11、和学生学习水平两个因素进行分类,结果如下表所示,问男女学生学业水平有无显著 差异?或问性别与学业之间有无关联?中等以上中等以下合 计男23(a)17(b)40(a+b)女28(c)22(d)50(c+d)合计51(a+c)39(b+d)90(a+b+c+d=N)例14的计算解:二、22列联表(四格表)独立性检验相关样本四格表的 检验:相关样本比率差异的显著性检验公式:当df=1时,式中:b、c是四格表中分类项目不同的格内数字故相关样本四格表 检验公式为:例15 124个学生1000公尺长跑,训练一个月后前后两次测验达标情况如下表,问一个月的训练是否有显著性效果 第二次测验达标未达标第一次测验达

12、标61(a)19(b)未达标33(c)11(d)例15计算解:建立假设:H0:一个月长跑训练无显著效果; H1:一个月长跑训练有显著效果计算检验统计量:统计决断:查表得:因为3.770.05,接受H0,差异不显著。故一个月长跑训练无显著效果。(三)四格表 的校正当四格表中任一格的理论次数小于5时,用亚茨连续性校正公式:对于独立样本四格表:对于相关样本四格表:例16某校将参加课外阅读活动的15名学生与未参加课外阅读活动的15名学生,根据各方面条件基本相同的原则进行配对,测得他们的阅读理解能力如下表,问课外阅读活动对提高阅读理解能力是否有良好的作用。参加课外阅读活动良非良未参加课外阅读活动良3(a

13、)1 (b)非良9 (c)2 (d)例16的计算解:建立假设:H0:课外活动对阅读理解能力的提高没有什么作用;H1:课外活动对阅读理解能力的提高有良好作用。计算检验统计量:统计决断:查表得:因为4.903.84,所以P0.05,拒绝H0,而接受H1,差异显著。故课外活动对阅读理解能力的提高有良好作用。(四)四格表的费舍精确概率检验方法在理论次数小于5时,除可以用使用 校正公式外,还可以采用费舍(Fisher)精确概率检验法。费舍精确概率检验法的基本原理是:在边缘次数固定的情况下,观测数据的精确概率分布为超几何分布。如果两个变量是独立的,当边缘次数保持不变时,各格内的实计数a,b,c,d。任何一

14、特定排列概率p是:四格表的费舍精确概率检验方法在边缘次数不变的情况下,用公式(12-18)计算出各格内实计数排列的概率,以及实计数最小的那一格的数字依次变化至零时, 所有排列的概率和。然后将概率和与显著性水平相比较,若p,则说明超过了独立性样本各格实计数的取样范围,就可以推论说,两样本独立的假设不成立,可说两样本之间存在相关。下面以表12-9的数据来说明四格表的费舍(Fisher)精确概率检验法。(四)四格表的费舍精确概率检验方法P=p0+p1+p2+5276247 6 (A) 6176157 6 (B)7076067 6 (C)四格表的费舍精确概率检验方法概率和为:三、 列联表独立性检验上述

15、四格表检验是 列联表独立性检验的一个特例,一般情况下是 列联表的独立性检验。其目的是判断两种分类特征是否有依存关系。例17 家庭经济状况属于上、中、下的高三毕业生,对于是否愿意报考师范院校有三种不同的态度(愿意、不愿意、未定),其人数分布如下表。问学生是否愿意报考师范院校与家庭经济状况有无关系?家庭经济状况对报考师范院校的态度总和愿意不愿意未定上18(20.53)27(19.43)10(15.03)55中20(22.03)19(20.85)20(16.13)59下18(13.44)7(12.72)11(9.84)36总和565341150例17的计算解:建立假设:H0:学生是否愿意报考师范院校

16、与家庭经济状况没有关系; H1:学生是否愿意报考师范院校与家庭经济状况有关系计算检验统计量:例17的计算(续)统计决断:df=(R-1)(C-1)=(3-1)(3-1)=4,查表得:四、品质相关(一)四分相关1.适用资料两因素本身都是连续的正态变量人为划分两种不同类别这类四格表大都用于同一个被试样本中,分别调查四个不同因素两项分类的情况。(相关四格表) A 非Aa+bc+d B 非Babcd a+c b+d2.计算公式皮尔逊余弦法:或:(书上有误)例18 下表所列数据是调查378名学生两科测验成绩,设两科成绩分布为正态,只是人为地将其按一定标准划分为及格、不及格两类。求两科成绩的关联程度。物理成绩A总和及格不及格数学成绩B及格a=125b=68193不及格c=85d=100185 总和210168378例18的计算解:(二) 相关1.适用条件除四分相关之外的四格表资料2.计算公式:或:例19 有研究者想了解不同性别的学生对某项教育措施的评价态度,调

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论