医学统计学第七章卡方检验课件_第1页
医学统计学第七章卡方检验课件_第2页
医学统计学第七章卡方检验课件_第3页
医学统计学第七章卡方检验课件_第4页
医学统计学第七章卡方检验课件_第5页
已阅读5页,还剩193页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

检验

Chi-SquareTest

第七章1105检验

Chi-SquareTest第七章1105ContenttestoffourfolddatatestofpairedfourfolddataFisherprobabilitiesinfourfolddatatestofR×CtableMultiplecomparisonofsampleratestestofgoodnessoffit2105Contenttestoffourfoldda31053105

目的:推断两个总体率或构成比之间有无差别多个总体率或构成比之间有无差别多个样本率的多重比较两个分类变量之间有无关联性频数分布拟合优度的检验。

检验统计量:应用:计数资料4105

目的:4105第一节四格表资料的检验

5105第一节四格表资料的检验

5105目的:推断两个总体率(构成比)是否有差别(和u检验等价)要求:两样本的两分类个体数排列成四格表资料6105目的:推断两个总体率(构成比)是6105

(1)

分布是一种连续型分布:按分布的密度函数可给出自由度=1,2,3,……的一簇分布曲线(图7-1)。(2)分布的一个基本性质是可加性:如果两个独立的随机变量X1和X2分别服从自由度ν1和ν2的分布,即,那么它们的和(X1+X2)服从自由度(ν1+ν2)的分布,即~。

一、检验的基本思想

1.分布7105(1)分布是一种连续型分布:按分布的密度函数可81058105

2.检验的基本思想

例7-1

某院欲比较异梨醇口服液(试验组)和氢氯噻嗪+地塞米松(对照组)降低颅内压的疗效。将200例颅内压增高症患者随机分为两组,结果见表7-1。问两组降低颅内压的总体有效率有无差别?91052.检验的基本思想例7-1某院欲比较表7-1两组降低颅内压有效率的比较

10105表7-1两组降低颅内压有效率的比较10105本例资料经整理成图7-2形式,即有两个处理组,每个处理组的例数由发生数和未发生数两部分组成。表内有四个基本数据,其余数据均由此四个数据推算出来的,故称四格表资料。11105本例资料经整理成图7-2形式,即有两图7-2四格表资料的基本形式

12105图7-2四格表资料的基本形式12105基本思想:可通过检验的基本公式来理解。式中,A为实际频数(actualfrequency),

T为理论频数(theoreticalfrequency)。13105基本思想:可通过检验的基本公式来理解。式中,A为理论频数由下式求得:式中,TRC为第R行C列的理论频数

nR为相应的行合计

nC为相应的列合计14105理论频数由下式求得:式中,TRC为第R行C列的理论频数理论频数是根据检验假设,且用合并率来估计而定的。如上例,无效假设是试验组与对照组降低颅内压的总体有效率相等,均等于合计的有效率87%。那么理论上,试验组的104例颅内压增高症患者中有效者应为104(174/200)=90.48,无效者为104(26/200)=13.52;同理,对照组的96例颅内压增高症患者中有效者应为96(174/200)=83.52,无效者为96(26/200)=12.48。

15105理论频数是根据检验假设,且用

检验统计量值反映了实际频数与理论频数的吻合程度。若检验假设H0:π1=π2成立,四个格子的实际频数A与理论频数T相差不应该很大,即统计量不应该很大。如果值很大,即相对应的P值很小,若,则反过来推断A与T相差太大,超出了抽样误差允许的范围,从而怀疑H0的正确性,继而拒绝H0,接受其对立假设H1,即π1≠π2。16105检验统计量值反映了实际频由公式(7-1)还可以看出:值的大小还取决于个数的多少(严格地说是自由度ν的大小)。由于各皆是正值,故自由度ν愈大,值也会愈大;所以只有考虑了自由度ν的影响,值才能正确地反映实际频数A和理论频数T的吻合程度。检验的自由度取决于可以自由取值的格子数目,而不是样本含量n。四格表资料只有两行两列,=1,即在周边合计数固定的情况下,4个基本数据当中只有一个可以自由取值。17105由公式(7-1)还可以看出:值(1)建立检验假设,确定检验水平。H0:π1=π2即试验组与对照组降低颅内压的总体有效率相等H1:π1≠π2

即试验组与对照组降低颅内压的总体有效率不相等α=0.05。3.假设检验步骤18105(1)建立检验假设,确定检验水平。3.假设检验步骤181(2)求检验统计量值19105(2)求检验统计量值191052010520105二、四格表资料检验的专用公式21105二、四格表资料检验的专用公式21105

分布是一连续型分布,而四格表资料属离散型分布,由此计算得的统计量的抽样分布亦呈离散性质。为改善统计量分布的连续性,则需行连续性校正。22105 分布是一连续型分布,而四格表三、四格表资料检验的校正公式

23105三、四格表资料检验的校正公式23105四格表资料检验公式选择条件:

,专用公式;,校正公式;,直接计算概率。

连续性校正仅用于的四格表资料,当时,一般不作校正。

24105四格表资料检验公式选择条件:

例7-2某医师欲比较胞磷胆碱与神经节苷酯治疗脑血管疾病的疗效,将78例脑血管疾病患者随机分为两组,结果见表7-2。问两种药物治疗脑血管疾病的有效率是否相等?25105例7-2某医师欲比较胞磷胆表7-2两种药物治疗脑血管疾病有效率的比较26105表7-2两种药物治疗脑血管疾病有效率的比较26105

本例,故用四格表资料检验的校正公式

,查界值表得。按

检验水准不拒绝,尚不能认为两种药物治疗脑血管疾病的有效率不等。

27105本例

本资料若不校正时,结论与之相反。28105本资料若不校正时,28105第二节配对四格表资料的检验29105第二节配对四格表资料的检验29105与计量资料推断两总体均数是否有差别有成组设计和配对设计一样,计数资料推断两个总体率(构成比)是否有差别也有成组设计和配对设计,即四格表资料和配对四格表资料。30105与计量资料推断两总体均数是否有差别有成组设计和配对设计

例7-3

某实验室分别用乳胶凝集法和免疫荧光法对58名可疑系统红斑狼疮患者血清中抗核抗体进行测定,结果见表7-3。问两种方法的检测结果有无差别?31105例7-3某实验室分别用乳胶凝集

表7-3两种方法的检测结果

32105表7-3两种方法的检测结果32105上述配对设计实验中,就每个对子而言,两种处理的结果不外乎有四种可能:①两种检测方法皆为阳性数(a);②两种检测方法皆为阴性数(d);③免疫荧光法为阳性,乳胶凝集法为阴性数(b);④乳胶凝集法为阳性,免疫荧光法为阴性数(c)。33105上述配对设计实验中,就每个对子而言,两种处理其中,a,d为两法观察结果一致的两种情况,

b,c为两法观察结果不一致的两种情况。检验统计量为34105其中,a,d为两法观察结果一致的两种情况,

注意:

本法一般用于样本含量不太大的资料。因为它仅考虑了两法结果不一致的两种情况(b,c),而未考虑样本含量n和两法结果一致的两种情况(a,d)。所以,当n很大且a与d的数值很大(即两法的一致率较高),b与c的数值相对较小时,即便是检验结果有统计学意义,其实际意义往往也不大。35105注意:本法一般用于样本含检验步骤:36105检验步骤:36105第三节

四格表资料的Fisher确切概率法37105第三节四格表资料的Fisher确切概率法37105条件:理论依据:超几何分布(非检验的范畴)38105条件:38105

例7-4某医师为研究乙肝免疫球蛋白预防胎儿宫内感染HBV的效果,将33例HBsAg阳性孕妇随机分为预防注射组和非预防组,结果见表7-4。问两组新生儿的HBV总体感染率有无差别?

39105例7-4某医师为研究乙肝免表7-4两组新生儿HBV感染率的比较

40105表7-4两组新生儿HBV感染率的比较40105一、基本思想

在四格表周边合计数固定不变的条件下,计算表内4个实际频数变动时的各种组合之概率;再按检验假设用单侧或双侧的累计概率,依据所取的检验水准做出推断。

41105一、基本思想在四格表周边合计数固定

1.各组合概率Pi的计算

在四格表周边合计数不变的条件下,表内4个实际频数a,b,c,d变动的组合数共有“周边合计中最小数+1”个。如例7-4,表内4个实际频数变动的组合数共有9+1=10个,依次为:421051.各组合概率Pi的计算在四格表周边合计数不变的条件下各组合的概率Pi服从超几何分布,其和为1。计算公式为!为阶乘符号43105各组合的概率Pi服从超几何分布,其和为1。计算公式为!为阶乘

2.累计概率的计算(单、双侧检验不同)

441052.累计概率的计算(单、双侧检验不同)

4410545105451054610546105二、检验步骤()47105二、检验步骤()44810548105表7-5例7-4的Fisher确切概率法计算表

49105表7-5例7-4的Fisher确切概率法计算表49

例7-5某单位研究胆囊腺癌、腺瘤的P53基因表达,对同期手术切除的胆囊腺癌、腺瘤标本各10份,用免疫组化法检测P53基因,资料见表7-6。问胆囊腺癌和胆囊腺瘤的P53基因表达阳性率有无差别?50105例7-5某单位研究胆囊腺癌、腺瘤的P表7-6胆囊腺癌与胆囊腺瘤P53基因表达阳性率的比较

51105表7-6胆囊腺癌与胆囊腺瘤P53基因表达阳性率的比较

本例a+b+c+d=10,由表7-7可看出,四格表内各种组合以i=4和i=5的组合为中心呈对称分布。

表7-7例7-5的Fisher确切概率法计算表

*为现有样本52105本例a+b+c+d=10,由表7-7可看出,(1)计算现有样本的D*和P*及各组合下四格表的Di。本例D*=50,P*=0.02708978。(2)计算满足Di≥50条件的各组合下四格表的概率Pi。(3)计算同时满足Di≥50和Pi≤P*条件的四格表的累计概率。本例为P7和P8,(4)计算双侧累计概率P。

P>0.05,按α=0.05检验水准不拒绝H0,尚不能认为胆囊腺癌与胆囊腺瘤的P53基因表达阳性率不等。53105(1)计算现有样本的D*和P*及各组合下四格表的Di。531注意:54105注意:54105第四节行×列表资料的检验

55105第四节行×列表资料的检验55105行×列表资料①

多个样本率比较时,有R行2列,称为R×2表;②

两个样本的构成比比较时,有2行C列,称2×C表;③

多个样本的构成比比较,以及双向无序分类资料关联性检验时,有行列,称为R×C表。56105行×列表资料①

多个样本率比较时,有R行2列,称为R×2表检验统计量57105检验统计量57105一、多个样本率的比较58105一、多个样本率的比较58105

例7-6某医师研究物理疗法、药物治疗和外用膏药三种疗法治疗周围性面神经麻痹的疗效,资料见表7-8。问三种疗法的有效率有无差别?表7-8三种疗法有效率的比较59105例7-6某医师研究物理疗法、药物治疗和外检验步骤:60105检验步骤:60105二、样本构成比的比较61105二、样本构成比的比较61105

例7-7某医师在研究血管紧张素I转化酶(ACE)基因I/D多态(分3型)与2型糖尿病肾病(DN)的关系时,将249例2型糖尿病患者按有无糖尿病肾病分为两组,资料见表7-9。问两组2型糖尿病患者的ACE基因型总体分布有无差别?表7-9DN组与无DN组2型糖尿病患者ACE基因型分布的比较

62105例7-7某医师在研究血管紧张素I转化酶(检验步骤63105检验步骤63105三、双向无序分类资料的关联性检验

表中两个分类变量皆为无序分类变量的行列表资料,又称为双向无序表资料。

64105三、双向无序分类资料的关联性检验

注意:双向无序分类资料为两个或多个样本,做差别检验(例7-7);若为单样本,做关联性检验。

65105注意:双向无序分类资料为两个或多个样本,例7-8测得某地5801人的ABO血型和MN血型结果如表7-10,问两种血型系统之间是否有关联?

表7-10某地5801人的血型

(单样本,做关联性检验)66105例7-8测得某地5801人的ABO血型和MN血型结果如表7-10资料,可用行×列表资料检验来推断两个分类变量之间有无关系(或关联);若有关系,可计算Pearson列联系数C进一步分析关系的密切程度:列联系数C取值范围在0~1之间。0表示完全独立;1表示完全相关;愈接近于0,关系愈不密切;愈接近于1,关系愈密切。

67105表7-10资料,可用行×列表资料检验步骤68105检验步骤68105由于列联系数C=0.1883,数值较小,故认为两种血型系统间虽然有关联性,但关系不太密切。69105由于列联系数C=0.1883,数值较小,故认为两种血型系统间四、行×列表资料检验的注意事项70105四、行×列表资料检验的701051.行列表中的各格T≥1,并且1≤T<5的格子数不宜超过1/5格子总数,否则可能产生偏性。处理方法有三种:增大样本含量以达到增大理论频数的目的,属首选方法,只是有些研究无法增大样本含量,如同一批号试剂已用完等。711051.行列表中的各格T≥1,并且1≤T<5的格子数不宜超过1/根据专业知识,删去理论频数太小的行或列,或将理论频数太小的行或列与性质相近的邻行或邻列合并。这样做会损失信息及损害样本的随机性。注意:不同年龄组可以合并,但不同血型就不能合并。改用双向无序R×C表的Fisher确切概率法(可用SAS软件实现)。72105根据专业知识,删去理论频数太小的行或列,或将理论频数太小的行73105731057410574105第五节多个样本率间的多重比较75105第五节751057610576105分割法

77105分割法77105一、基本思想因分析目的不同,k个样本率两两比较的次数不同,故重新规定的检验水准的估计方法亦不同。通常有两种情况:78105一、基本思想因分析目的不同,k个样本率两两比较的次数不同,故

791057910580105801058110581105二、多个实验组间的两两比较82105二、多个实验组间的两两比较82105

例7-9

对例7-6中表7-8的资料进行两两比较,以推断是否任两种疗法治疗周围性面神经麻痹的有效率均有差别?83105例7-9对例7-6中表7-检验步骤本例为3个实验组间的两两比较

84105检验步骤本例为3个实验组间的两两比较84105表7-12三种疗法有效率的两两比较

85105表7-12三种疗法有效率的两两比较851058610586105三、各实验组与同一个对照组的比较87105三、各实验组与同一个对照组的比较87105例7-10以表7-8资料中的药物治疗组为对照组,物理疗法组与外用膏药组为试验组,试分析两试验组与对照组的总体有效率有无差别?本例为各实验组与同一对照组的比较88105例7-10以表7-8资料中的药89105891059010590105第七节频数分布拟合优度的检验

91105第七节频数分布拟合优度的检验91105

医学研究实践中,常需推断某现象频数分布是否符合某一理论分布。如正态性检验就是推断某资料是否符合正态分布的一种检验方法,但只适用于正态分布。

Pearson值能反映实际频数和理论频数的吻合程度,故检验可用于推断频数分布的拟合优度,且应用广泛。如正态分布,二项分布,Poisson分布,负二项分布等。

92105医学研究实践中,常需推断某现象频数

例7-12观察某克山病区克山病患者的空间分布情况,调查者将该地区划分为279个取样单位,统计各取样单位历年累计病例数,资料见表7-15的第(1)、(2)栏,问此资料是否服从Poisson分布?

93105例7-12观察某克山病区克山病患表7-15Poisson分布的拟合与检验

*:X≥8的概率:

94105表7-15Poisson分布的拟合与检验*:X≥951059510596105961059710597105练习题P156一、最佳选择题全做三、计算分析题第3、5、7、10题98105练习题98105谢谢大家!99105谢谢大家!99105检验

Chi-SquareTest

第七章100105检验

Chi-SquareTest第七章1105ContenttestoffourfolddatatestofpairedfourfolddataFisherprobabilitiesinfourfolddatatestofR×CtableMultiplecomparisonofsampleratestestofgoodnessoffit101105Contenttestoffourfoldda1021053105

目的:推断两个总体率或构成比之间有无差别多个总体率或构成比之间有无差别多个样本率的多重比较两个分类变量之间有无关联性频数分布拟合优度的检验。

检验统计量:应用:计数资料103105

目的:4105第一节四格表资料的检验

104105第一节四格表资料的检验

5105目的:推断两个总体率(构成比)是否有差别(和u检验等价)要求:两样本的两分类个体数排列成四格表资料105105目的:推断两个总体率(构成比)是6105

(1)

分布是一种连续型分布:按分布的密度函数可给出自由度=1,2,3,……的一簇分布曲线(图7-1)。(2)分布的一个基本性质是可加性:如果两个独立的随机变量X1和X2分别服从自由度ν1和ν2的分布,即,那么它们的和(X1+X2)服从自由度(ν1+ν2)的分布,即~。

一、检验的基本思想

1.分布106105(1)分布是一种连续型分布:按分布的密度函数可1071058105

2.检验的基本思想

例7-1

某院欲比较异梨醇口服液(试验组)和氢氯噻嗪+地塞米松(对照组)降低颅内压的疗效。将200例颅内压增高症患者随机分为两组,结果见表7-1。问两组降低颅内压的总体有效率有无差别?1081052.检验的基本思想例7-1某院欲比较表7-1两组降低颅内压有效率的比较

109105表7-1两组降低颅内压有效率的比较10105本例资料经整理成图7-2形式,即有两个处理组,每个处理组的例数由发生数和未发生数两部分组成。表内有四个基本数据,其余数据均由此四个数据推算出来的,故称四格表资料。110105本例资料经整理成图7-2形式,即有两图7-2四格表资料的基本形式

111105图7-2四格表资料的基本形式12105基本思想:可通过检验的基本公式来理解。式中,A为实际频数(actualfrequency),

T为理论频数(theoreticalfrequency)。112105基本思想:可通过检验的基本公式来理解。式中,A为理论频数由下式求得:式中,TRC为第R行C列的理论频数

nR为相应的行合计

nC为相应的列合计113105理论频数由下式求得:式中,TRC为第R行C列的理论频数理论频数是根据检验假设,且用合并率来估计而定的。如上例,无效假设是试验组与对照组降低颅内压的总体有效率相等,均等于合计的有效率87%。那么理论上,试验组的104例颅内压增高症患者中有效者应为104(174/200)=90.48,无效者为104(26/200)=13.52;同理,对照组的96例颅内压增高症患者中有效者应为96(174/200)=83.52,无效者为96(26/200)=12.48。

114105理论频数是根据检验假设,且用

检验统计量值反映了实际频数与理论频数的吻合程度。若检验假设H0:π1=π2成立,四个格子的实际频数A与理论频数T相差不应该很大,即统计量不应该很大。如果值很大,即相对应的P值很小,若,则反过来推断A与T相差太大,超出了抽样误差允许的范围,从而怀疑H0的正确性,继而拒绝H0,接受其对立假设H1,即π1≠π2。115105检验统计量值反映了实际频由公式(7-1)还可以看出:值的大小还取决于个数的多少(严格地说是自由度ν的大小)。由于各皆是正值,故自由度ν愈大,值也会愈大;所以只有考虑了自由度ν的影响,值才能正确地反映实际频数A和理论频数T的吻合程度。检验的自由度取决于可以自由取值的格子数目,而不是样本含量n。四格表资料只有两行两列,=1,即在周边合计数固定的情况下,4个基本数据当中只有一个可以自由取值。116105由公式(7-1)还可以看出:值(1)建立检验假设,确定检验水平。H0:π1=π2即试验组与对照组降低颅内压的总体有效率相等H1:π1≠π2

即试验组与对照组降低颅内压的总体有效率不相等α=0.05。3.假设检验步骤117105(1)建立检验假设,确定检验水平。3.假设检验步骤181(2)求检验统计量值118105(2)求检验统计量值1910511910520105二、四格表资料检验的专用公式120105二、四格表资料检验的专用公式21105

分布是一连续型分布,而四格表资料属离散型分布,由此计算得的统计量的抽样分布亦呈离散性质。为改善统计量分布的连续性,则需行连续性校正。121105 分布是一连续型分布,而四格表三、四格表资料检验的校正公式

122105三、四格表资料检验的校正公式23105四格表资料检验公式选择条件:

,专用公式;,校正公式;,直接计算概率。

连续性校正仅用于的四格表资料,当时,一般不作校正。

123105四格表资料检验公式选择条件:

例7-2某医师欲比较胞磷胆碱与神经节苷酯治疗脑血管疾病的疗效,将78例脑血管疾病患者随机分为两组,结果见表7-2。问两种药物治疗脑血管疾病的有效率是否相等?124105例7-2某医师欲比较胞磷胆表7-2两种药物治疗脑血管疾病有效率的比较125105表7-2两种药物治疗脑血管疾病有效率的比较26105

本例,故用四格表资料检验的校正公式

,查界值表得。按

检验水准不拒绝,尚不能认为两种药物治疗脑血管疾病的有效率不等。

126105本例

本资料若不校正时,结论与之相反。127105本资料若不校正时,28105第二节配对四格表资料的检验128105第二节配对四格表资料的检验29105与计量资料推断两总体均数是否有差别有成组设计和配对设计一样,计数资料推断两个总体率(构成比)是否有差别也有成组设计和配对设计,即四格表资料和配对四格表资料。129105与计量资料推断两总体均数是否有差别有成组设计和配对设计

例7-3

某实验室分别用乳胶凝集法和免疫荧光法对58名可疑系统红斑狼疮患者血清中抗核抗体进行测定,结果见表7-3。问两种方法的检测结果有无差别?130105例7-3某实验室分别用乳胶凝集

表7-3两种方法的检测结果

131105表7-3两种方法的检测结果32105上述配对设计实验中,就每个对子而言,两种处理的结果不外乎有四种可能:①两种检测方法皆为阳性数(a);②两种检测方法皆为阴性数(d);③免疫荧光法为阳性,乳胶凝集法为阴性数(b);④乳胶凝集法为阳性,免疫荧光法为阴性数(c)。132105上述配对设计实验中,就每个对子而言,两种处理其中,a,d为两法观察结果一致的两种情况,

b,c为两法观察结果不一致的两种情况。检验统计量为133105其中,a,d为两法观察结果一致的两种情况,

注意:

本法一般用于样本含量不太大的资料。因为它仅考虑了两法结果不一致的两种情况(b,c),而未考虑样本含量n和两法结果一致的两种情况(a,d)。所以,当n很大且a与d的数值很大(即两法的一致率较高),b与c的数值相对较小时,即便是检验结果有统计学意义,其实际意义往往也不大。134105注意:本法一般用于样本含检验步骤:135105检验步骤:36105第三节

四格表资料的Fisher确切概率法136105第三节四格表资料的Fisher确切概率法37105条件:理论依据:超几何分布(非检验的范畴)137105条件:38105

例7-4某医师为研究乙肝免疫球蛋白预防胎儿宫内感染HBV的效果,将33例HBsAg阳性孕妇随机分为预防注射组和非预防组,结果见表7-4。问两组新生儿的HBV总体感染率有无差别?

138105例7-4某医师为研究乙肝免表7-4两组新生儿HBV感染率的比较

139105表7-4两组新生儿HBV感染率的比较40105一、基本思想

在四格表周边合计数固定不变的条件下,计算表内4个实际频数变动时的各种组合之概率;再按检验假设用单侧或双侧的累计概率,依据所取的检验水准做出推断。

140105一、基本思想在四格表周边合计数固定

1.各组合概率Pi的计算

在四格表周边合计数不变的条件下,表内4个实际频数a,b,c,d变动的组合数共有“周边合计中最小数+1”个。如例7-4,表内4个实际频数变动的组合数共有9+1=10个,依次为:1411051.各组合概率Pi的计算在四格表周边合计数不变的条件下各组合的概率Pi服从超几何分布,其和为1。计算公式为!为阶乘符号142105各组合的概率Pi服从超几何分布,其和为1。计算公式为!为阶乘

2.累计概率的计算(单、双侧检验不同)

1431052.累计概率的计算(单、双侧检验不同)

441051441054510514510546105二、检验步骤()146105二、检验步骤()414710548105表7-5例7-4的Fisher确切概率法计算表

148105表7-5例7-4的Fisher确切概率法计算表49

例7-5某单位研究胆囊腺癌、腺瘤的P53基因表达,对同期手术切除的胆囊腺癌、腺瘤标本各10份,用免疫组化法检测P53基因,资料见表7-6。问胆囊腺癌和胆囊腺瘤的P53基因表达阳性率有无差别?149105例7-5某单位研究胆囊腺癌、腺瘤的P表7-6胆囊腺癌与胆囊腺瘤P53基因表达阳性率的比较

150105表7-6胆囊腺癌与胆囊腺瘤P53基因表达阳性率的比较

本例a+b+c+d=10,由表7-7可看出,四格表内各种组合以i=4和i=5的组合为中心呈对称分布。

表7-7例7-5的Fisher确切概率法计算表

*为现有样本151105本例a+b+c+d=10,由表7-7可看出,(1)计算现有样本的D*和P*及各组合下四格表的Di。本例D*=50,P*=0.02708978。(2)计算满足Di≥50条件的各组合下四格表的概率Pi。(3)计算同时满足Di≥50和Pi≤P*条件的四格表的累计概率。本例为P7和P8,(4)计算双侧累计概率P。

P>0.05,按α=0.05检验水准不拒绝H0,尚不能认为胆囊腺癌与胆囊腺瘤的P53基因表达阳性率不等。152105(1)计算现有样本的D*和P*及各组合下四格表的Di。531注意:153105注意:54105第四节行×列表资料的检验

154105第四节行×列表资料的检验55105行×列表资料①

多个样本率比较时,有R行2列,称为R×2表;②

两个样本的构成比比较时,有2行C列,称2×C表;③

多个样本的构成比比较,以及双向无序分类资料关联性检验时,有行列,称为R×C表。155105行×列表资料①

多个样本率比较时,有R行2列,称为R×2表检验统计量156105检验统计量57105一、多个样本率的比较157105一、多个样本率的比较58105

例7-6某医师研究物理疗法、药物治疗和外用膏药三种疗法治疗周围性面神经麻痹的疗效,资料见表7-8。问三种疗法的有效率有无差别?表7-8三种疗法有效率的比较158105例7-6某医师研究物理疗法、药物治疗和外检验步骤:159105检验步骤:60105二、样本构成比的比较160105二、样本构成比的比较61105

例7-7某医师在研究血管紧张素I转化酶(ACE)基因I/D多态(分3型)与2型糖尿病肾病(DN)的关系时,将249例2型糖尿病患者按有无糖尿病肾病分为两组,资料见表7-9。问两组2型糖尿病患者的ACE基因型总体分布有无差别?表7-9DN组与无DN组2型糖尿病患者ACE基因型分布的比较

161105例7-7某医师在研究血管紧张素I转化酶(检验步骤162105检验步骤63105三、双向无序分类资料的关联性检验

表中两个分类变量皆为无序分类变量的行列表资料,又称为双向无序表资料。

163105三、双向无序分类资料的关联性检验

注意:双向无序分类资料为两个或多个样本,做差别检验(例7-7);若为单样本,做关联性检验。

164105注意:双向无序分类资料为两个或多个样本,例7-8测得某地5801人的ABO血型和MN血型结果如表7-10,问两种血型系统之间是否有关联?

表7-10某地5801人的血型

(单样本,做关联性检验)165105例7-8测得某地5801人的ABO血型和MN血型结果如表7-10资料,可用行×列表资料检验来推断两个分类变量之间有无关系(或关联);若有关系,可计算Pearson列联系数C进一步分析关系的密切程度:列联系数C取值范围在0~1之间。0表示完全独立;1表示完全相关;愈接近于0,关系愈不密切;愈接近于1,关系愈密切。

166105表7-10资料,可用行×列表资料检验步骤167105检验步骤68105由于列联系数C=

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论