八、卡方检验课件_第1页
八、卡方检验课件_第2页
八、卡方检验课件_第3页
八、卡方检验课件_第4页
八、卡方检验课件_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

` 卡方检验8_八、卡方检验卡方检验基础拟合问题-单个样本率与总体率的比较相关问题-两个样本率或构成比的比较两分类变量间关联程度的度量一致性检验与配对卡方检验分层卡方检验小结

内容提要8_八、卡方检验

2检验是以2分布为基础的一种假设检验方法,主要用于分类变量,根据样本数据推断总体的分布与期望分布是否有显著差异,或推断两个分类变量是否相关或相互独立。其原假设为:

H0:观察频数与期望频数没有差别卡方检验基础8_八、卡方检验

首先假设H0成立,计算出2值,它表示观察值与理论值之间的偏离程度。根据2分布,2统计量以及自由度可以确定在H0成立的情况下获得当前统计量及更极端情况的概率P。如果P很小,说明观察值和理论值偏离程度太大,应当拒绝原假设,表示比较资料之间有显著性差异;否则就不能拒绝原假设,尚不能认为样本所代表的实际情况与理论假设有差别。卡方检验基础

2检验的基本思想8_八、卡方检验

2值的计算:由英国统计学家KarlPearson首次提出,故被称为Pearson

2。卡方检验基础8_八、卡方检验

当n比较大时,

2统计量近似服从k-1个自由度的2分布。在自由度固定时,每个2值与一个概率值(P值)相对应,此概率值即为在H0成立的前提下,出现这样一个样本或偏离假设总体更远的样本的概率。如果P值小于或等于显著性水准,则拒绝H0,接受H1,即观察频数与期望频数不一致。如果P值大于显著性水准,则不拒绝H0,认为观察频数与期望频数无显著性差异。P值越小,说明H0假设正确的可能性越小;P值越大,说明H0假设正确的可能性越大。卡方检验基础-卡方分布8_八、卡方检验卡方检验基础

利用单样本均值比较的t检验,可以检验样本所在总体的均值与已知值是否存在显著性差异,即样本均值与已知值的差异,是由于样本所在总体的均值和已知值确实有差别,还是由于随机抽样引起的差异。这是针对连续性变量而言,如果是分类变量,就不能使用进行均值比较的t检验,而应该使用进行率比较的卡方检验。8_八、卡方检验

检验某个连续变量的分布是否与某种理论分布一致,如是否符合正态分布,Possion分布等检验某个分类变量各类的出现概率是否等于指定概率检验两个分类变量是否相互独立,如吸烟是否与呼吸道疾病有关检验控制某种或某几种分类变量因素的作用之后,另两个分类变量是否独立,如上例控制年龄、性别之后,吸烟是否与呼吸道疾病有关检验两种方法的结果是否一致,如两种诊断方法对同一批人进行诊断,其诊断结果是否一致卡方检验基础-用途8_八、卡方检验

例1某公司经营多年,形成了一套成熟的企业文化和管理体系,例如根据多年的运营经验,经理层、监察员、办事员三种职务类别的比例大约在15:5:80为宜,这样运行效率最高。两年前公司原管理层集体退居二线,新任管理层上任后对公司进行了较大的变动,有员工担心这是否已经导致了职务类别比例的失调,影响到公司的高效运行。目前三种职务的人数比为84:27:363,如何用数据分析来解决此类问题呢?(数据见employeedata.sav)拟合问题-样本率与已知总体率的比较8_八、卡方检验拟合问题-样本率与已知总体率的比较

这是一个样本构成比与已知总体构成比进行比较的统计学问题,可以用卡方检验来解决。8_八、卡方检验拟合问题-样本率与已知总体率的比较

注意,此处数值的排列顺序和数据文件中各类别的排列顺序应当相同,因为他们存在一一对应的关系。8_八、卡方检验拟合问题-样本率与已知总体率的比较分析结果

给出了样本中三个职务级别的观察频数、期望频数以及残差。8_八、卡方检验拟合问题-样本率与已知总体率的比较分析结果

此为单样本

2检验的结果,

2值为3.492,P=0.174,故可认为观察频数和期望频数没有显著差别。8_八、卡方检验

注意:

本例使用的数据是原始数据,一个案例代表一个员工的情况。但如果数据是频数格式,即每一行代表一个水平,另外用一个频数变量代表该水平的频数。此时在分析时要首先告诉SPSS具体哪一个变量是频数变量。如何实现呢?利用数据准备中的WeightCases即可。拟合问题-样本率与已知总体率的比较8_八、卡方检验

例2某妇女联合会向工会提出质疑,认为该公司在对女性员工的职位安排上存在歧视,因为该公司216名女性雇员中,只有10人为经理,其余206名为办事员;而258名男性雇员中,74名为经理。但是工会说,男女间职位类别比例的差异,只是一个随机误差,并不是真的存在性别歧视。哪种说法才是正确的呢?(数据见employeedata.sav)相关问题-两个率或构成比的比较8_八、卡方检验相关问题-两个率或构成比的比较

这是一个比较两个性别的职位构成比是否相同的统计学问题,要用Descriptive中的Crosstabs实现,与单个率的比较不同。8_八、卡方检验相关问题-两个率或构成比的比较

分别指定行列变量到Row(s)和Columns中。8_八、卡方检验相关问题-两个率或构成比的比较8_八、卡方检验相关问题-两个率或构成比的比较8_八、卡方检验相关问题-两个率或构成比的比较分析结果

可见,性别和职位不独立,女性更容易成为办事员,而男性更容易得到经理和监察员的职位。8_八、卡方检验相关问题-两个率或构成比的比较

需要注意的是,卡方检验仅仅告知使用者各类别的构成和分布是否相同,本例中的职务是无序分类变量,监察员和办事员不能比较大小顺序,因此可以进行卡方检验。如果为有序分类变量的话,则卡方检验并不合适,而应用秩和检验。8_八、卡方检验连续性校正

2检验:

仅适用于四格表资料,在n>40,所有期望频数均大于1,只有1/5单元格的期望频数大于1小于5时;Fisher精确概率法:

在样本含量<40或有格子的期望频数<1的列联表,应该采用该法;似然比

2检验:

当n>40,最小期望频数>5时,结论与Pearson

2基本一致;相关问题-两个率或构成比的比较

几种卡方检验的比较:8_八、卡方检验两分类变量间关联程度的度量

卡方检验可以从定性的角度说明两个变量是否存在关联,当拒绝原假设时,在统计上有把握认为两个变量存在相关。但接下来的问题是,如果两变量之间存在相关性,它们之间的关联程度有多大?针对不同的变量类型,在SPSS中可以计算各种各样的相关指标,而且Crosstabs过程也对此提供了完整的支持,此处只涉及两分类变量间关联程度的指标,更系统的相关程度指标见相关与回归一章。8_八、卡方检验两分类变量间关联程度的度量相对危险度RR:是一个概率的比值,指试验组人群反应阳性概率与对照组人群反应阳性概率的比值。数值为1,表明试验因素与反应阳性无关联;小于1时,表明试验因素导致反应阳性的发生率降低;大于1时,表明试验因素导致反应阳性的发生率增加。优势比OR:是一个比值的比,是反应阳性人群中试验因素有无的比例与反应阴性人群中试验因素有无的比例之比。当关注的事件发生概率比较小时(<0.1),优势比可作为相对危险度的近似。8_八、卡方检验两分类变量间关联程度的度量

例3

某公司实行数据库营销,其杂志销售部每个月向数据库中的人们发送征订邮件,但是回应率极低。经研究发现,报纸订阅(News)和邮件回应Response有相关性,该部门经理想了解报纸订阅回应者回邮件的概率是非订阅者的几倍。数据文件见demo.sav。8_八、卡方检验两分类变量间关联程度的度量8_八、卡方检验两分类变量间关联程度的度量

分别指定行列变量到Row(s)和Columns中。8_八、卡方检验选中可得到RR值两分类变量间关联程度的度量8_八、卡方检验两分类变量间关联程度的度量分析结果

这就是两变量的四格表。8_八、卡方检验两分类变量间关联程度的度量分析结果

结果显示,报纸订阅者对于邮件的回应概率是非报纸订阅者的1.668倍,或者说无回应的概率是非报纸订阅者的0.94倍。而OR值为1.774。8_八、卡方检验在Pearson卡方检验中,对行变量和列变量的相关性作检验,其中行变量和列变量是一个事物的两个不同属性。在实际中,还有一种列联表,其行变量和列变量反映的是一个事物的同一属性的相同水平,只是对该属性各水平的区分方法不同。其特征是:行的数目和列的数目总是相同的。如果希望检验这两种区分同一属性的方法给出的结果是否一致,则不应当使用Pearson

2检验,而应该采用Kappa一致性检验对两种方法一致程度进行评价。一致性检验8_八、卡方检验

一般认为,当Kappa≥0.75时,表明两者一致性较好;

0.75>Kappa≥0.4时,表明一致性一般;

Kappa<0.4时,表明两者一致性较差。一致性检验8_八、卡方检验

例4某实验室分别用乳胶凝集法和免疫荧光法对58名可疑系统性红斑狼疮患者血清中抗核抗体进行测定,结果见下表,问两种方法的检测结果有无差别?(数据见McNemar.sav)免疫荧光法

乳胶凝集法

合计+

-+111223

-23335

合计134558两种方法的检测结果配对卡方检验8_八、卡方检验不能忘记哦!配对卡方检验8_八、卡方检验在此选入频数变量即可进行下一步的分析。配对卡方检验8_八、卡方检验配对卡方检验8_八、卡方检验配对卡方检验选中可进行配对卡方检验8_八、卡方检验配对卡方检验分析结果8_八、卡方检验配对卡方检验分析结果

如果在statistics子对话框中勾选上Kappa复选框,则有以下结果:8_八、卡方检验

注意:

Kappa检验会利用列联表的全部信息,而McNemar检验只会利用非主对角线单元格上的信息。因此,对于一致性较好,即绝大多数数据都在主对角线的大样本列联表,McNemar检验可能会失去实用价值。配对卡方检验8_八、卡方检验

例5

某零售连锁店对3家分店的客户满意度进行了调查,现希望分析寻求帮助和性别之间有无联系。(数据见cmh.sav)分层卡方检验8_八、卡方检验分层卡方检验选入分层变量store8_八、卡方检验分层卡方检验进行分层卡方检验8_八、卡方检验分层卡方检验

首先给出的是层间差异的检验,结果显示,不同分店间,gender与contact的联系是相同的。分析结果8_八、卡方检验分层卡方检验

分层卡方检验结果,即考虑了分层因素的影响以后,对gender与contact的检验结果,共给出CMH

2检验和MH

2检验两种结果,前者是后者的改进,可见P值均小于0.05,即可认为性别与求助有关。分析结果8_八、卡方检验分层卡方检验

结果显示,ORMH

值为0.636,表明去除了不同分店的混杂效应以后,和女性相比,男性顾客寻求帮助的优势比为0.636,或者说更不容易寻求帮助。分析结果8_八、卡方检验1.卡方检验是以

2分布为基础的一种常用假设检验方法,常用作计数资料的显著性检验。其基本思想是:首先假设观察频数与期望频数没有差别。而统计量

2值表示观察值与理论值之间的偏离程度。当n比较大时,2统计量近似服从k-1个自由度的2分布。在自由度固定时,每个2值与一个概率值相对应,此概率即为在H0假设成立的前提下,出现这样一个样本或更大差别样本的概率。如果P值小于或等于显著性水准,则应拒绝H0,接受H1。小结8_八、卡方检验2.关联程度的测量:卡方检验从定性的角度分析是否存在相关,而各种关联指标从定量的角度分析相关的程度大小。不同的指标适合不同类型的变量。RR值是一个概率的比值,是指试验组人群反应阳性概率与对照组人群反应概率的比值。用于反映试验因素与反应阳性的关联程度。OR值是比值的比。是反应阳性人群中试验因素有无的比例与反应阴性人群中试验因素有无的比例之比。在下列两个条件均满足时,可用于估计RR值:①所关注的事件发生概率比较小(<0.1),②所设计的研究是病例对照研究。小结8_八、卡方检验3.Kap

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论