第十 章 卡方检验_第1页
第十 章 卡方检验_第2页
第十 章 卡方检验_第3页
第十 章 卡方检验_第4页
第十 章 卡方检验_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十章卡方检验卡方分布就是对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验,即根据样本的频数分布来推断总体的分布。不同于回归分析以及t检验和方差分析(三者都属于参数统计),它属于自由分布的非参数检验(非参数统计)。它可以处理一个因素分为多种类别或多种因素各有多种类别的资料。凡是可以应用比率进行检验的资料,都可以用卡方检验。卡方检验是用途很广的一种假设检验方法。例如,它包括两个或多个样本率及构成比之间的差别有无统计意义的推断,分类变量配对设计下的卡方检验以及频数分布的拟合优度检验等。在社会统计学中应用最多的用于分类变量之间拟合优度和独立性检验的χ²检验。χ²检验可以判断变量之间是否相关,但,不能判断相关程度为多大。φ系数,克拉默V系数。它们用于判断变量之间相关程度的大小,但是这两个系数的应用也有其局限性。卡方统计量χ²可以用于变量之间的拟合优度检验和独立性检验,测定两个分类变量之间的相关程度。χ²统计量表达式为:其中,f0是观察值,fe是期望值。χ²统计量是平方和的加总,因而,χ²≥0。χ²值的大小与变量的个数有关,即观察值和期望值配对数越多,χ²值越大,因而,χ²统计量的分布与自由度有关。χ²统计量描述的是观察值与期望值之间的接近程度,两个越接近,越小,χ²越小。反之,越大,χ²越大。举例说明某车间有甲,乙,丙三个技工进行生产,上周甲,乙,丙三个人产量分别占总量的58%,33%和9%,丙进行学习,想提高技术。一周后三人产量共生产了270件产品,其中甲,乙,丙三人分别生产150

件,85件和35件。请判断丙学习后三人产量占的比例是否发生了变化。在这个例子中,假定三人产量所占比例没有变化,那么甲,乙,丙三人产量期望值分别为:

通过差卡方分布表得到χ²0.05(2)=5.99>χ²

=5.1783,所以认为丙学习后三人产量所占比例没有发生变化。自由度=k-1=3-1=20χ²α(2)=5.99

α=0.05

χ²=5.1783

卡方检验的概念(一)卡方检验:多个总体的比较从总体的不同类别中抽取元素构成样本,样本包含总体中各个类别的元素,对不同类别的目标量之间是否存在显著性差异进行的检验称为拟合优度检验。拟合优度检验是χ²检验中重要的一部分,可以同时对多个总体进行比较。在χ²检验中,如果χ²>χ²α(k-1),则拒绝虚无假设。χ²α(k-1)为给定值,其中(k-1)是自由度。自由度是可以自由变动的变量个数,在列联表中,自由度=(R-1)×(C-1)。例如,从某学校社会学,经济学,文学,信息学四个专业中随机抽取420名学生针对学校宿舍管理改革的态度进行调查。调查结果如下表所示,以α=0.05的显著性水平检验四个专业的学生对宿舍管理改革的看法是否存在差异。首先,我们假设四个专业的学生之间不存在差异,即四个专业的学生赞成改革的比例是一致的,即均为

自由度=(R-1)×(C-1)=(2-1)×(4-1)=3α=0.05,查表得:χ²α(3)=7.815由于χ²<χ²α(3),所以我们不能拒绝虚无假设,即认为四个专业的学生对宿舍管理改革的赞成是一致的,调查数据中的差异是由于抽样的随机性造成的。0χ²α(3)=7.815

α=0.05

χ²=2.3293

(二)适用场合:分类变量之间的关系χ²检验用于分类变量之间关系的检验,可以判断不同类别的目标量之间是否存在显著差异。χ²检验主要用来检验频数问题,即检验各类实际观察的频数是否显著不同于假设的期望频数。同时,χ²检验还可用于判断两个分类变量之间是否存在联系;这时称χ²检验为对立性检验。如果连个分类变量之间没有关系,则称二者相互独立。独立性检验例如,我们分析阅读习惯于学历是否有关。随机抽取254人进行调查,调查结果如下表:在这个例子中,我们假设阅读习惯于学历没有关系,即二者是相互独立的,故有:Ho:阅读习惯与学历没有关系

Ha:阅读习惯与学历有关系我们需要利用χ²检验来进行独立性检验,这时候需要计算χ²统计量,而χ²统计量是根据观察值和期望值计算得出来的。因而,首先,我们需要计算期望值。根据列联表中任一单元格频数的期望值公式来求期望值:其中,RT是给定单元格所在行的合计;CT是给定单元格所在列的合计;n为观察值的总个数,即样本容量。

例如:所以:取α=0.05,自由度为(R-1)×(C-1)=9,查表得χ²0.05(9)=16.919。χ²>χ²0.05(9),因而拒绝虚无假设,即阅读习惯与学历之间存在依赖关系,阅读习惯受学历的影响。0χ²α(9)=16.919

α=0.05

χ²=30.4556基于卡方的两变量关系测量χ²统计量可以对分类变量之间的相关性进行统计检验,判断变量之间是相互独立还是相互依赖。但,χ²统计量不能说明相互依赖的相关程度。对于两个变量之间相关程度的测定,我们需要依靠相关系数。φ系数克拉默V系数φ系数的定义与计算φ相关系数用于描述2×2列联表中数据的相关程度。

2×2列联表

φ相关系数的计算公式为:φ相关系数主要应用于2×2列联表,其绝对值不超过1;ad与bc的差值反映变量间相关程度的强弱;差值越大,φ越大,相关程度越高;当ad=bc时,φ=0,表明变量X与变量Y之间相互独立;φ的符号没有实际意义,|φ|=1只能表示变量X与变量Y完全相关;当b=0,c=0时,φ=1,变量X与变量Y完全相关;当a=0,d=0时,φ=-1,变量X与变量Y完全相关;当列联表中行数R或列数C大于2时,φ系数随着R或C的变大而增大,而且没有上限。克拉默V系数φ系数没有上限,克拉默(Gramer)以φ系数为基础提出了V相关系数。其计算公式为:其中,min[(R-1),(C-1)]表示取(R-1)和(C-1)中较小的一个;V的取值范围0~1;当V=0,两个变量相互独立;当V=1,两个变量完全相关;如果列联表中有一个为二维,即R=2或者C=

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论