第十二章卡方检验_第1页
第十二章卡方检验_第2页
第十二章卡方检验_第3页
第十二章卡方检验_第4页
第十二章卡方检验_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十二章卡方检验第一页,共四十八页,编辑于2023年,星期五本章考研知识点(2011)

1.拟合度检验

2.独立性检验第二页,共四十八页,编辑于2023年,星期五第一节2检验概述第二节配合度检验第三节独立性检验第四节同质性检验与数据合并第五节相关源分析第三页,共四十八页,编辑于2023年,星期五第一节2检验概述一、2检验的意义二、2检验的基本公式三、2检验的类型四、2检验所隐含的假设五、期望次数的计算六、应用2检验应注意抽样设计第四页,共四十八页,编辑于2023年,星期五一、2检验的意义1.2检验方法是能同时检验一个因素两项或多项分类的实际观察频数与某理论次数分布是否一致的问题,或者说是否有显著性差异的问题。实际观察频数(Observedfrequencies):指实验或调查中的计数数据;理论次数(theoreticalfrequencies):根据概率原理或某种理论计算出来的次数,亦称期望次数(expectedfrequencies)。第五页,共四十八页,编辑于2023年,星期五2.2检验还能用于检验两个或两个以上因素的多项分类之间是否有关联或是否具有独立性的问题。故2检验又可称为独立性检验。3.2检验又称列联表分析或交叉表分析,因为其数据大多以列联表或交叉表呈现。4.2检验还称百分比检验,因为其单元格的数据是百分比。第六页,共四十八页,编辑于2023年,星期五二、2检验的基本公式即实计次数与理论次数的差的平方和除以理论次数是与2分布非常近似的次数分布。式中k为组数,f0为实际观察数(实计数),fe为理论次数。该公式是根据皮尔逊的配合度的理论公式推导而来,该分布属于近似卡方分布,近似程度随自由度而变化。第七页,共四十八页,编辑于2023年,星期五三、2检验的类型配合度检验:检验一个因素多项分类的实际观察数与某理论次数是否一致的问题。当对连续数据的正态检验时,亦称正态吻合性检验独立性检验:检验两个或两个以上因素的多项分类之间是否有关联或是否具有独立性的问题。同质性检验:检验不同的总体在某一变量上的反应是否有差异。无差异则表明两总体同质;有差异则表明两总体异质。第八页,共四十八页,编辑于2023年,星期五四、2检验所隐含的假设1.不同的分类应具有独立性;2.观测数据相互独立;3.期望次数应尽量大;有些认为应大于5,有些认为应大于10;当理论次数过小时,应尽量避免使用2检验。第九页,共四十八页,编辑于2023年,星期五五、期望次数的计算期望次数:无差假设成立时的数值或者使某一理论假设成立时的数值。如:男女的性别比的期望值为:1:1;调查时的同意与不同意的期望值为:1:1;调查时的同意与不同意与不置可否的期望值为:1:1:1;正态分布的期望值与正态分布的概率相同。第十页,共四十八页,编辑于2023年,星期五运用2检验时,其理论次数不得小于5.单元格的个案数过少时的处理方法:(1)合并到相邻性质相近的单元格(2)增加样本容量(3)去除过少的个案类别(4)使用校正公式当期望次数小于10大于5时,用Yates’校正公式;期望次数小于5利用Fisher精确概率检验法;当单元格内内容涉及到重复测量时用McNemar检验。第十一页,共四十八页,编辑于2023年,星期五六、应用2检验应注意抽样设计

统计分析在依据样本的信息对总体进行推论时,最根本的一个环节是确保样本的代表性和对实验的良好的控制。在心理与教育研究中,所收集到的数据有些是属于定性的。获得这些数据的方式是通过调查访问和问卷,所收集到的数据仅仅是回顾性研究,多数情况下难于对被试进行控制。又由于各种限制可能会遇到有严重缺陷的样本,所以一定要注意取样的代表性尽量避免出现有偏样本,在进行统计推论时要特别小心。第十二页,共四十八页,编辑于2023年,星期五第二节配合度检验配合度检验(goodnessoffittest

):主要用于实际观测次数与某理论观察次数是否存在显著性差异的分析。它适用于一个因素分为多个水平(分类)的计数数据。一、配合度检验的基本步骤(1)建立假设:H0:f0-fe=0或f0=feH1:f0-fe0或f0fe(2)确定自由度:k为分类数或组数计算理论次数只用了总数时:df=k-1计算理论次数用到总数、平均数好标准差时:df=k-3第十三页,共四十八页,编辑于2023年,星期五(3)理论次数的计算:根据概率和经验计算(4)计算2值(5)作出推断注意:

2检验的概率是双侧概率,当计算的2>2.05或2.01时拒绝0假设。第十四页,共四十八页,编辑于2023年,星期五二、配合度检验的应用1.与常规有无差异的配合度检验例题10-1(P302)10-210-4第十五页,共四十八页,编辑于2023年,星期五2.与正态分布有无差异的配合度检验(1)非连续变量的配合度检验理论次数的计算步骤:假设6个标准差包括了全体,每个等级所占的标准差为:6σ÷k(k为等级数);依据各等级所占的标准差,查正态分布表,即得各个等级所占的概率;(例题10-3P303)第十六页,共四十八页,编辑于2023年,星期五(2)连续变量分布的假设检验对于连续随机变量分布的假设检验,其关键步骤是:计算理论次数(fe)与确定自由度(df)。计算理论次数是根据所选理论分布函数,按实际分布的统计量带入函数式计算各分组区间的理论频率,然后乘以总数即为各分组区间的理论次数。确定自由度是将分组的数目减去计算理论次数时所用统计量的数目。第十七页,共四十八页,编辑于2023年,星期五关于本书(P306)例题的说明(1)为了计算理论次数必须根据正态曲线下某一组别所占的概率,然后用概率乘以总数(P×N)才能求得各组的理论次数。(2)计算步骤是:确定组上限,计算离差,利用公式(Z=X-X/S)求出标准分数,根据标准分数求概率,用概率乘以总数得理论次数。(3)自由度df=11-3(是因为求理论次数时用到了总数、标准差和平均数这三个约束条件)第十八页,共四十八页,编辑于2023年,星期五(1)(2)(3)(4)(5)(6)(7)(8)?第十九页,共四十八页,编辑于2023年,星期五3.比率或百分数的配合度检验(例题10-6P307)第二十页,共四十八页,编辑于2023年,星期五三、二项分类的配合度检验与比率显著性检验的一致性第二十一页,共四十八页,编辑于2023年,星期五四、2的连续性校正1.当期望次数小于5时,用二项分布的概率计算(计算较为繁琐)第二十二页,共四十八页,编辑于2023年,星期五2.Yates校正公式(计算简单)根据卡方值和自由度查表求概率第二十三页,共四十八页,编辑于2023年,星期五第三节独立性检验一、概念独立性检验主要是检验指两个或两个以上因素多项分类的计数资料是独立还是相关的问题。其零假设为:两项或多项分类是独立无关的(分类无显著性差异)研究假设为:两项或多项分类是有关联的(分类存在显著性差异)独立性检验一般的数据资料采用2*2或2*k,及R*C的表格形式呈现。第二十四页,共四十八页,编辑于2023年,星期五二、独立性检验的一般步骤1.提出假设零假设:两项或多项分类是独立无关的(分类无显著性差异)研究假设:两项或多项分类是有关联的(分类存在显著性差异)2.计算理论次数第二十五页,共四十八页,编辑于2023年,星期五3.确定自由度df=(R-1)(C-1)4.选择检验方法第二十六页,共四十八页,编辑于2023年,星期五5.结果与解释通过比较两个卡方值的大小作出决断χ2值与P值的对应关系,通过查附表12χ2α,υ界值表得到,详见教材474页。计算得到的查表得到的第二十七页,共四十八页,编辑于2023年,星期五三、四格表(2×2列联表)的独立性检验(一)独立样本的四格表的2检验1.有三种计算方法(例题10-10P316)因素B边缘小计因素BB1B2A1aba+bA2cdc+d边缘小计a+cb+dN=a+b+c+d第二十八页,共四十八页,编辑于2023年,星期五方法一根据概率计算的方法和乘法定理可以算出a、b、c、d四格的理论次数fa=(a+b)(a+c)/Nfb=(a+b)(b+d)/Nfc=(a+c)(c+d)/Nfd=(c+d)(b+d)/N确定自由度df=(2-1)*(2-1)=1,因为计算理论次数涉及总数第二十九页,共四十八页,编辑于2023年,星期五方法二直接用实计数计算卡方值方法三第三十页,共四十八页,编辑于2023年,星期五2.校正公式:当有一格的理论次数小于5且n>40时。

第三十一页,共四十八页,编辑于2023年,星期五(二)相关四格表的2检验1一般计算公式为:2校正公式为:第三十二页,共四十八页,编辑于2023年,星期五(三)四格表的Fisher精确概率检验法在期望次数小于5时,可采用Fisher精确概率检验法。当独立的四格表的边缘次数固定时,观察数据的精确概率分布为超几何分布,各格内的实计数abcd任一特定排列的概率为:第三十三页,共四十八页,编辑于2023年,星期五四、R×C列联表的2检验(1)理清R×C列联表的数据结构因素B因素AB1B2…BC小计A1A2f0i(fei)fyi…AR小计fxi第三十四页,共四十八页,编辑于2023年,星期五(2)理论次数计算公式为:(3)确定自由度df=(r-1)(k-1)(4)计算2值其导出公式为:(5)比较大小,推论或解释第三十五页,共四十八页,编辑于2023年,星期五第四节同质性检验与数据合并一、概念同质性检验是指分析几种因素之间是否存在实质性的差异,或者判断几次重复实验的结果是否同质。其目的在于判明数据资料是相互关联还是彼此独立;是对几个样本数据在同一变量上的分布检验,从而对几个样本数据是否同质做出决断。第三十六页,共四十八页,编辑于2023年,星期五二、单因素分类数据的同质性检验检验步骤(1)计算各样本组的2值和自由度;(2)累加各样本组的2值,并计算累加自由度;(3)计算总数据表的2值和自由度;(4)计算异质性2值:即各样本组的累加2值与总的2值之差;(5)查表判断2值差是否显著。第三十七页,共四十八页,编辑于2023年,星期五各样本组2值合并数据的2值123异质2值12.99-0.2=12.794第三十八页,共四十八页,编辑于2023年,星期五二、列联表形式的同质性检验列联表其实是由多个四格表组成其检验步骤为(P325):(1)计算各样本组的2值与自由度(2)累加各样本组的2值和自由度(3)使用校正公式计算合并数据的2值和自由度(4)做出推断第三十九页,共四十八页,编辑于2023年,星期五三、计数数据的合并方法在心理与教育研究中经常会遇到内容相同的二格表,四格表或

R×C表,即因素内容、分类项目都相同的计数资料,这些资料有的是来自不同的研究者,有的是同一个研究者不同或相同时期的研究,在调查或实验之前并未考虑数据合并问题,而是在搜集到数据之后,才想合并它们,如何将这些数据合并?当同质性检验的结果表明各类数据同质,就可将它们合并处理。第四十页,共四十八页,编辑于2023年,星期五(一)两格表与四格表的数据合并方法1.简单合并法将所有的数据合并到同一个两格表或四格表中,然后计算2量,并进行假设检验。条件是:

①各分表某特征的相应比率接近。②各分表

(小样本

)的2量都未达显著水平

,即分表小样本齐性。合并后会达到显著性水平第四十一页,共四十八页,编辑于2023年,星期五2.2相加法将各分量表的2值相加,查df=k-1(k为样本数)2表,确定显著性水平。缺点:反应不灵敏,没有考虑各量表的比率方向,分辨力较差。3.相加法应用条件:(1)各样本容量相差不超过2倍;(2)表中各相应比率在0.2-0.8间。隐含的假设是:在各比率相同的条件下任一四格表的卡方值渐近服从均数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论