临床医学-卡方检验_第1页
临床医学-卡方检验_第2页
临床医学-卡方检验_第3页
临床医学-卡方检验_第4页
临床医学-卡方检验_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十章检验

检验对于计数资料来讲是一种用途非常广泛的假设检验方法,可用于两组或多组样本率的比较,两组或多组构成比的比较,以及拟合优度检验等。第一节2

2表检验

一、两个独立样本率检验

(一)两个独立样本率资料的四格表形式

例10-1某医生用A、B两种药物治疗急性下呼吸道感染,A药治疗74例,有效68例,B药治疗63例,有效52例,结果见表10-1。问两种药的有效率是否有差别?

两组人群A药

74例有效68例

B药

63例有效52例把该资料整理成表格的形式,即成分组有效无效合计有效率(%)A药

6867491.89B药

52116382.54合计1201713787.59

表10-2四格表资料的基本形式处理组

有效事件发生数

无效事件发生数合计甲aba+b乙cdc+d合计a+cb+dn(二)检验的基本思想

检验统计量值的计算公式:式中A

为实际频数,分别记为A11,A12,A21,A22;

T

为理论频数,分别记为T11,T12,T21,T22

A药74例,理论上应该有

74

120/137=64.82例为有效;

B药63例,理论上应该有

63

120/137=55.18

例为有效。

理论频数的计算公式为:

式中TRC为第R行第C列格子的理论数,

nR为第R行的行合计数,

nC为第C列的列合计数,n

为总例数。

若无效假设H0成立,则实际频数A与理论频数T的差值不应该很大,出现大的值的概率P很小,如果值较大,则有理由拒绝H0

;反之,则不拒绝H0

。根据资料计算的值越大,就越有理由拒绝H0

。可见,检验统计量反映了实际频数和理论频数的相差情况。

例10-1中四个格子的理论数用上式计算结果:

T11=74

120/137=64.82

T12=72

17/137=9.18

T21=63

120/137=55.18

T22=63

17/137=7.82(三)检验假设

1.检验的步骤

2.四格表资料检验的专用计算公式四格表资料的专用公式:

式中a、b、c、d分别为四格表中的四个实际频数,

n为总例数。

3.

检验的连续性校正问题

检验的校正公式:

一般原则是:

①当n≥40且所有T≥5时,用检验的理论公式(9-1)或专用公式(9-9);若所得的P≈α,改用Fisher确切概率法。

②当n≥40但有1≤T<5时,用检验的校正公式(9-10)或(9-11)。

③当n<40或T<1时,用Fisher确切概率法.二、交叉分类2×2表的关联性分析

例10-3

为观察婴儿腹泻是否与喂养方式有关,某医院儿科随机收集了消化不良的婴儿82例,若把该院儿科所有消化不良的患儿视为一个总体的话,则该82例患儿可看作是一份随机样本。对每个个体分别观察腹泻与否和喂养方式两种属性,结果见表10-3。试分析两种属性的关联性。表10-3是关于两个变量的一份随机样本,要检验的是腹泻与否和喂养方式两个变量之间的相关性。

喂养方式腹泻合计有无人工301040母乳172542合计473582检验步骤如下:(1)建立假设,确定检验水准H0:两种属性之间互相独立,H1:两种属性之间有关联,检验水准

=0.05(2)计算检验统计量

2值按式(10-4)

=9.98(3)确定概率P值和判断结果自由度ν=(2-1)(2-1)=1查

2界值表,

20.005(1)=7.88,

2>

20.005(1),P<0.005,按

=0.05的水准,拒绝H0,接受H1,可认为婴儿腹泻与喂养方式之间存在关联性。关于两个分类变量关联的程度,可用Pearson列联系数(contingencycoefficient),其计算公式为式(10-7)Pearson列联系数r=

本例Pearson列联系数为r=0.33,可看出,婴儿腹泻与喂养方式之间虽然有关联性,但列联系数值仅为0.33。

三、两个相关样本率比较的检验

(配对四格表资料的检验)

对于计数资料,配对研究的设计包括:

①同一批样品用两种不同的方法处理;

②试验对象根据配对条件配成对子,同一对子内的两个个体分别接受不同的处理。实验流程

总体配对样本分组实验实验对照RRR…………配对设计资料整理成四格表形式:甲处理乙处理合计+-+aba+b-cdc+d合计a+cb+dn两个相关样本率比较检验统计量的计算公式:

b+c≥40

b+c<40

例10-4用两种不同的方法对53例肺癌患者进行诊断,收集得表10-4的资料,问两种方法的检测结果有无差别?

甲法乙法合计+-+25(a)2(b)27-11(c)15(d)26合计361753四、配对四格表资料的关联性分析

例10-5仍用例10-4数据,问两种方法的检测结果有无联系?

检验步骤如下:(1)建立假设,确定检验水准,H0:两种方法的结果无相关,H1:两种方法的结果有相关,检验水准公

=0.05(2)计算检验统计量

2值

按公式(10-4)=15.37(3)确定概率P值和判断结果自由度ν=(2-1)(2-1)=1,查

2界值表,

20.05(1)=3.84,

2>

20.05(1),P<0.05,按

=0.05的水准,拒绝H0,接受H1,可认为两种方法的结果存在关联性。进一步计算Pearson列联系数,代入公式(10-7),本例Pearson列联系数为=0.47式中,

2为配对四格表资料的

2值,n为样本含量。关于Pearson列联系数是否为零的检验等价于Pearson

2检验。

五、

R

C表检验

R

C表检验,又称作行

列表检验,适用于多个率的比较,两个及多个构成比的比较以及双向无序分类资料的关联性检验等。一、计算检验统计量的公式:

v=(行数-1)(列数-1)式中n为总例数,A为每个格子里的实际频数,nR

,nC分别为与A值相应的行和列合计的例数。例10-6多个样本率的比较3

2表例10-7两组构成比的比较2

4表例10-8民族与血型分布相关分析3

4表六、多个样本率的两两比较进行多个率的比较时,往往并不满足于总的情况的统计学结论,而是需要得出两两率之间有无差异的统计学结论。对经过行×列表

2检验有统计学意义的资料,进一步做两两比较时,不能再用原来的检验水准

=0.05作为是否拒绝无效假设的标准,因为重复多次的假设检验,将增大犯第一类错误的概率,必须对检验水准进行调整,常用的调整方法为Bonferroni法。对个样本两两比较,会增加第一类错误的概率。为保证犯第一类错误的概率总和不超过,每次比较的第一类错误概率按下公式调整:七、R

C表检验的注意事项1.对行×列表资料进行

2检验时,要求不能有1/5以上的格子理论频数小于5,或者不能有任意一个格子的理论频数小于1,否则易导致分析的偏性。出现这些情况时可采取以下措施:①在可能的情况下再增加样本含量;②从专业上如果允许,可将太小的理论频数所在的行或列的实际频数与性质相近的邻行或邻列中的实际频数合并;③删去理论频数太小的行和列;④也可改用双向无序R×C表的直接计算概率法(可用SAS软件实现)。2.行×列表资料经

2检验后,如假设检验的结果是拒绝无效假设,只能认为各总体率或构成比之间总的来说有差别,但并不是说它们彼此之间都有差别,如例10-7的检验结果为拒绝了H0,仅能说明甲、乙两城市各种空气质量类别所占的比例不同,不能说明全不相同。如果想进一步了解彼此之间的差别,需将行×列表分割,再进行

2检验(详见本章第四节)。3.关于单向有序行列表,在比较各处理组的效应有无差别时,应该用秩和检验或Ridit分析。

2检验只能说明各处理组结构是否均衡而不能检验效应是否有差别。因为行×列表资料的

2检验与分类变量的顺序无关,所以当有序变量的R

C表资料中的分类顺序固定不变时,无论将任何两行(或两列)频数互换,所得

2值不会改变,其结论相同。如两药临床疗效比较,疗效分为痊愈、显效、进步和无效四个等级,

2检验得到差别有统计意义的结果时,并不能说明哪种药的疗效更好。因为,如果对其中的两列不同疗效的数值进行调换,

2值不会有变化,但秩和统计量有变化。4.对两个反应属性的分类变量,若有一份随机样本,可根据交叉分类计数所得的列联表作关联性分析。当两个属性变量的水平数均大于2时,所构造出来的行×列表称为R×C列联表(contingencytable),简称为R×C表。分析R×C前,必须考察表中有序变量的个数,尤其要注意指标分组变量是否为有序变量。R×C表的分类及统计分析方法的选择:R×C表可分为单向有序、双向无序、双向有序属性相同和双向有序属性不同四类。(1)单向有序R×C表有两种形式。一种是R×C表中的实验分组变量(如药物浓度)是有序的,而指标分组变量(如染色体损伤的类型)是无序的。其研究目的通常是分析不同药物浓度各种染色体损伤的类型的构成情况,此种单向有序R×C表资料可用行×列表资料的

2检验进行分析。另一种情况是R×C表中的实验分组变量(如治疗方式)为无序的,而指标分组变量(如疗效按等级分组)是有序的。其研究目的为比较不同疗法的疗效,此种单向有序R×C表资料的统计处理,应选用秩和检验进行分析。(2)双向无序R×C表R×C表中两个分类变量皆为无序分类变量。对于该类资料:①若研究目的为多个样本率(或构成比)的比较,可以用行×列表资料的

2检验进行分析,注意:若理论频数小于5的格子数超过总格子数的1/5时,则不适合用

2检验,此时需用双向无序R×C表的Fisher精确检验;②若研究目的为分析两个分类变量之间有无关联性以及关系的密切程度时,可用行×列表资料的

2检验以及Pearson列联系数进行分析。(3)双向有序属性相同的R×C表R×C表中两个分类变量皆为有序分类变量且属性相同。如某资料中,用两种方法对相同的一批样品进行检测。实际上是2×2配对设计的扩展,即水平数≥3的诊断试验配伍设计,如用两种检测方法同时对同一批样品的测定结果。其研究目的通常是分析两种检测方法测定结果的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论