八应用统计学卡方检验 课件_第1页
八应用统计学卡方检验 课件_第2页
八应用统计学卡方检验 课件_第3页
八应用统计学卡方检验 课件_第4页
八应用统计学卡方检验 课件_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

` 卡方检验八应用统计学卡方检验卡方检验基础四格表卡方检验配对卡方检验与一致性检验两分类变量间关联程度的度量分层卡方检验小结

内容提要八应用统计学卡方检验

2检验是以2分布为基础的一种假设检验方法,主要用于分类变量,根据样本数据推断总体的分布与期望分布是否有显著差异,或推断两个分类变量是否相关或相互独立。其原假设为:

H0:观察频数与期望频数没有差别卡方检验基础八应用统计学卡方检验

首先假设H0成立,计算出2值,它表示观察值与理论值之间的偏离程度。根据2分布,2统计量以及自由度可以确定在H0成立的情况下获得当前统计量及更极端情况的概率P。如果P很小,说明观察值和理论值偏离程度太大,应当拒绝原假设,表示比较资料之间有显著性差异;否则就不能拒绝原假设,尚不能认为样本所代表的实际情况与理论假设有差别。卡方检验基础

2检验的基本思想八应用统计学卡方检验

2值的计算:由英国统计学家KarlPearson首次提出,故被称为Pearson

2。卡方检验基础八应用统计学卡方检验

当n比较大时,

2统计量近似服从k-1个自由度的2分布。在自由度固定时,每个2值与一个概率值(P值)相对应,此概率值即为在H0成立的前提下,出现这样一个样本或偏离假设总体更远的样本的概率。如果P值小于或等于显著性水准,则拒绝H0,接受H1,即观察频数与期望频数不一致。如果P值大于显著性水准,则不拒绝H0,认为观察频数与期望频数无显著性差异。P值越小,说明H0假设正确的可能性越小;P值越大,说明H0假设正确的可能性越大。卡方检验基础-卡方分布八应用统计学卡方检验

检验某个连续变量的分布是否与某种理论分布一致,如是否符合正态分布,Possion分布等检验某个分类变量各类的出现概率是否等于指定概率检验两个分类变量是否相互独立,如吸烟是否与呼吸道疾病有关检验控制某种或某几种分类变量因素的作用之后,另两个分类变量是否独立,如上例控制年龄、性别之后,吸烟是否与呼吸道疾病有关检验两种方法的结果是否一致,如两种诊断方法对同一批人进行诊断,其诊断结果是否一致卡方检验基础-用途八应用统计学卡方检验

例1某种药物加化疗与单用某种药物治疗的两种处理方法,观察对某种癌症的疗效,结果见下表。(数据见cancer.sav)四格表卡方检验

处理

疗效

合计

有效

无效

药物加化疗421355

单用药物48351

合计9016106两种治疗方法的疗效比较八应用统计学卡方检验首先建立数据文件,如下。四格表卡方检验八应用统计学卡方检验

注意:由于上表给出的不是原始数据,而是频数表数据,应该进行预处理。四格表卡方检验八应用统计学卡方检验四格表卡方检验八应用统计学卡方检验四格表卡方检验八应用统计学卡方检验四格表卡方检验八应用统计学卡方检验四格表卡方检验八应用统计学卡方检验四格表卡方检验八应用统计学卡方检验结果分析

表示药物加化疗与单用药物治疗某种癌症的疗效比较的行×列表,除了观察值以外,还有期望值。四格表卡方检验八应用统计学卡方检验结果分析

此为四格表

2检验的结果,

2=6.508,P=0.011,差异有显著性意义,即药物加化疗与单用药物治疗癌症的疗效有显著性差异。四格表卡方检验八应用统计学卡方检验连续性校正

2检验:

仅适用于四格表资料,在n>40,所有期望频数均大于1,只有1/5单元格的期望频数大于1小于5时;Fisher精确概率法:

在样本含量<40或有格子的期望频数<1的列联表,应该采用该法;似然比

2检验:

当n>40,最小期望频数>5时,结论与Pearson

2基本一致;

几种卡方检验的比较:四格表卡方检验八应用统计学卡方检验配对卡方检验

在Pearson卡方检验中,对行列变量的相关性作了检验,其中的行列变量是一个事物的两个不同属性。实际应用中,还有一种列联表,其中的行列变量反映的是一个事物的同一属性。例如把每一份标本分为两份,分别用两种方法进行化验,比较两种化验方法的结果是否有本质不同;或分别采用甲、乙两种方法对同一批病人进行检查,比较此两种方法的结果是否有本质不同,此时要用配对卡方检验。八应用统计学卡方检验配对卡方检验配对卡方检验公式:若b+c>40,则用公式:若b+c≤40,则用公式:八应用统计学卡方检验

例2某实验室分别用乳胶凝集法和免疫荧光法对58名可疑系统性红斑狼疮患者血清中抗核抗体进行测定,结果见下表,问两种方法的检测结果有无差别?(数据见McNemar.sav)免疫荧光法

乳胶凝集法

合计+

-+111223

-23335

合计134558两种方法的检测结果配对卡方检验八应用统计学卡方检验首先建立数据文件,如下。配对卡方检验八应用统计学卡方检验配对卡方检验

同理,由于是频数表数据,应该先用weightcases进行预处理。不能忘记哦!八应用统计学卡方检验在此选入频数变量即可进行下一步的分析。配对卡方检验八应用统计学卡方检验配对卡方检验八应用统计学卡方检验配对卡方检验八应用统计学卡方检验配对卡方检验选中进行配对卡方检验八应用统计学卡方检验配对卡方检验结果分析八应用统计学卡方检验在Pearson卡方检验中,对行变量和列变量的相关性作检验,其中行变量和列变量是一个事物的两个不同属性。在实际中,还有一种列联表,其行变量和列变量反映的是一个事物的同一属性的相同水平,只是对该属性各水平的区分方法不同。其特征是:行的数目和列的数目总是相同的。如果希望检验这两种区分同一属性的方法给出的结果是否一致,则不应当使用Pearson

2检验,而应该采用Kappa一致性检验对两种方法一致程度进行评价。一致性检验八应用统计学卡方检验结果分析

如果在crosstab过程的

statistics子对话框中勾选上Kappa复选框,则有以下结果:一致性检验八应用统计学卡方检验

一般认为,当Kappa≥0.75时,表明两者一致性较好;

0.75>Kappa≥0.4时,表明一致性一般;

Kappa<0.4时,表明两者一致性较差。一致性检验八应用统计学卡方检验

注意:

Kappa检验会利用列联表的全部信息,而McNemar检验只会利用非主对角线单元格上的信息。因此,对于一致性较好,即绝大多数数据都在主对角线的大样本列联表,McNemar检验可能会失去实用价值。一致性检验八应用统计学卡方检验两分类变量间关联程度的度量

2检验可以从定性的角度说明两个变量是否存在关联,当拒绝原假设时,在统计上有把握认为两个变量存在相关。但接下来的问题是,如果两变量之间存在相关性,它们之间的关联程度有多大?针对不同的变量类型,在SPSS中可以计算各种各样的相关指标,而且Crosstabs过程也对此提供了完整的支持,此处只涉及两分类变量间关联程度的指标,更系统的相关程度指标见相关与回归一章。八应用统计学卡方检验两分类变量间关联程度的度量相对危险度RR:是一个概率的比值,指试验组人群反应阳性概率与对照组人群反应阳性概率的比值。数值为1,表明试验因素与反应阳性无关联;小于1时,表明试验因素导致反应阳性的发生率降低;大于1时,表明试验因素导致反应阳性的发生率增加。优势比OR:是一个比值的比,是反应阳性人群中试验因素有无的比例与反应阴性人群中试验因素有无的比例之比。当关注的事件发生概率比较小时(<0.1),优势比可作为相对危险度的近似。八应用统计学卡方检验两分类变量间关联程度的度量

例3

某次食物中毒,现想通过调查发现,吃某海产品(food)和食物中毒发生(poison)是否具有相关性,以及吃了某食物的人是没吃海产品的人的几倍。数据文件见poison.sav。八应用统计学卡方检验两分类变量间关联程度的度量八应用统计学卡方检验两分类变量间关联程度的度量

分别指定行列变量到Row(s)和Columns中。八应用统计学卡方检验选中可得到RR值两分类变量间关联程度的度量八应用统计学卡方检验两分类变量间关联程度的度量结果分析

这就是两变量的四格表。八应用统计学卡方检验两分类变量间关联程度的度量结果分析

这是卡方检验的结果,说明吃食物与食物中毒相关。八应用统计学卡方检验两分类变量间关联程度的度量结果分析

结果显示,OR=3.00,说明吃了该食物者发生食物中毒的可能性是没有吃该食物者的3.00倍?八应用统计学卡方检验

例4

某研究人员对3家医院的卫生服务情况进行了调查,现希望分析寻求就诊和性别之间有无联系。(数据见cmh.sav)分层卡方检验八应用统计学卡方检验分层卡方检验选入分层变量center八应用统计学卡方检验分层卡方检验进行分层卡方检验八应用统计学卡方检验分层卡方检验

首先给出的是层间差异的检验,结果显示,不同中心间,性别与就诊的联系是相同的。结果分析八应用统计学卡方检验分层卡方检验

分层卡方检验结果,即考虑了分层因素的影响以后,对性别与就诊的检验结果,共给出CMH

2检验和MH

2检验两种结果,前者是后者的改进,可见P值均小于0.05,即可认为性别与就诊有关。结果分析八应用统计学卡方检验分层卡方检验

结果显示,ORMH

值为0.636,表明去除了不同中心的混杂效应以后,和女性相比,男性顾客寻求就诊的优势比为0.636,或者说更不容易寻求就诊。结果分析八应用统计学卡方检验

1.卡方检验是以

2分布为基础的一种常用假设检验方法,常用作计数资料的显著性检验。其基本思想是:首先假设观察频数与期望频数没有差别。而统计量

2值表示观察值与理论值之间的偏离程度。当n比较大时,2统计量近似服从k-1个自由度的2分布。在自由度固定时,每个2值与一个概率值相对应,此概率即为在H0假设成立的前提下,出现这样一个样本或更大差别样本的概率。如果P值小于或等于显著性水准,则应拒绝H0,接受H1。小结八应用统计学卡方检验

2.关联程度的测量:卡方检验从定性的角度分析是否存在相关,而各种关联指标从定量的角度分析相关的程度大小。不同的指标适合不同类型的变量。RR值是一个概率的比值,是指试验组人群反应阳性概率与对照组人群反应概率的比值。用于反映试验因素与反应阳性的关联程度。OR值是比值的比。是反应阳性人群中试验因素有无的比例与反应阴性人群中试验因素有无的比例之比。在下列两个条件均满足时,可用于估计RR值:①所关注的事件发生概率比较小(<0.1),②所设计的研究是病例对照研究。小结八应用统计学卡方检验

3.Kappa一致性检验对

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论