第十章 卡方检验_第1页
第十章 卡方检验_第2页
第十章 卡方检验_第3页
第十章 卡方检验_第4页
第十章 卡方检验_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十章卡方检验第1页,共44页,2023年,2月20日,星期三

本章教学目的:推断:两个总体率或构成比之间有无差别多个总体率或构成比之间有无差别两个分类变量之间有无关联性频数分布拟合优度的检验

第2页,共44页,2023年,2月20日,星期三

检验的基本思想第3页,共44页,2023年,2月20日,星期三四格表资料的基本形式

第4页,共44页,2023年,2月20日,星期三基本思想:可通过检验的基本公式来理解。式中,A为实际频数(actualfrequency),

T为理论频数(theoreticalfrequency)。第5页,共44页,2023年,2月20日,星期三

检验统计量值反映了实际频数与理论频数的吻合程度。若检验假设H0:π1=π2成立,四个格子的实际频数A与理论频数T相差不应该很大,即统计量不应该很大。如果值很大,即相对应的P值很小,若,则反过来推断A与T相差太大,超出了抽样误差允许的范围,从而怀疑H0的正确性,继而拒绝H0,接受其对立假设H1,即π1≠π2。第6页,共44页,2023年,2月20日,星期三

由公式还可以看出:值的大小还取决于个数的多少(严格地说是自由度ν的大小)。由于各皆是正值,故自由度ν愈大,值也会愈大;所以只有考虑了自由度ν的影响,值才能正确地反映实际频数A和理论频数T的吻合程度。检验的自由度取决于可以自由取值的格子数目,而不是样本含量n。四格表资料只有两行两列,=1,即在周边合计数固定的情况下,4个基本数据当中只有一个可以自由取值。第7页,共44页,2023年,2月20日,星期三样本率与总体率比较

例:全国高血压病调查结果:城市人口高血压病患病率19.6%;某调查获得有高血压病家族史者358人,其中高血压病者127人(P=35.47%)问:有高血压病家族史者患病率是否高于一般人群?第8页,共44页,2023年,2月20日,星期三+-合计实际(A)127231358理论(T)70.168287.832358Chi-Square=57.252第9页,共44页,2023年,2月20日,星期三第一节2×2表检验

第10页,共44页,2023年,2月20日,星期三目的:推断两个总体率(构成比)是否有差别(和u检验等价)资料:两样本的两分类个体数排列成四格表资料第11页,共44页,2023年,2月20日,星期三四格表资料检验的专用公式第12页,共44页,2023年,2月20日,星期三

分布是一连续型分布,而四格表资料属离散型分布,由此计算得的统计量的抽样分布亦呈离散性质。为改善统计量分布的连续性,则进行连续性校正。第13页,共44页,2023年,2月20日,星期三四格表资料检验公式选择条件:

,不校正的理论或专用公式;,校正公式,直接计算概率。

连续性校正仅用于的四格表资料,当时,一般不作校正。

第14页,共44页,2023年,2月20日,星期三四格表资料检验的校正公式

第15页,共44页,2023年,2月20日,星期三

P151:例10-1

第16页,共44页,2023年,2月20日,星期三第17页,共44页,2023年,2月20日,星期三第18页,共44页,2023年,2月20日,星期三P153:例10-2第19页,共44页,2023年,2月20日,星期三第20页,共44页,2023年,2月20日,星期三第21页,共44页,2023年,2月20日,星期三两相关样本率检验(McNemar检验)

配对四格表资料的检验第22页,共44页,2023年,2月20日,星期三

P155:例10-4:第23页,共44页,2023年,2月20日,星期三检验统计量为第24页,共44页,2023年,2月20日,星期三注意:

本法一般用于样本含量不太大的资料。因为它仅考虑了两法结果不一致的两种情况(b,c),而未考虑样本含量n和两法结果一致的两种情况(a,d)。所以,当n很大且a与d的数值很大(即两法的一致率较高),b与c的数值相对较小时,即便是检验结果有统计学意义,其实际意义往往也不大。第25页,共44页,2023年,2月20日,星期三第二节R×C表检验

第26页,共44页,2023年,2月20日,星期三行×列表资料①

多个样本率比较时,有R行2列,称为R×2表;②

两个样本的构成比比较时,有2行C列,称2×C表;③

多个样本的构成比比较,以及双向无序分类资料关联性检验时,有行列,称为R×C表。第27页,共44页,2023年,2月20日,星期三检验统计量第28页,共44页,2023年,2月20日,星期三多个样本率的比较

P156:例10-6第29页,共44页,2023年,2月20日,星期三第30页,共44页,2023年,2月20日,星期三两组构成比的比较P157:例10-7第31页,共44页,2023年,2月20日,星期三多个样本率间的多重比较Bonferroni法基本思想:为保证犯第I类错误的概率总和不超过ALPHA,调整每一两两比较的检验水准P159:例10-9第32页,共44页,2023年,2月20日,星期三R×C表检验的条件第33页,共44页,2023年,2月20日,星期三1.行列表中的各格T≥1,并且1≤T<5的格子数不宜超过1/5格子总数,否则可能产生偏性。处理方法有三种:

增大样本含量以达到增大理论频数的目的,属首选方法,只是有些研究无法增大样本含量第34页,共44页,2023年,2月20日,星期三根据专业知识,删去理论频数太小的行或列,或将理论频数太小的行或列与性质相近的邻行或邻列合并。这样做会损失信息及损害样本的随机性。注意:不同年龄组可以合并,但不同血型就不能合并。改用双向无序R×C表的Fisher确切概率法(可用SAS软件实现)。第35页,共44页,2023年,2月20日,星期三关联性分析2

×2表的关联P154:例10-3第36页,共44页,2023年,2月20日,星期三第37页,共44页,2023年,2月20日,星期三关联性分析配对四格表的关联P156:例10-5第38页,共44页,2023年,2月20日,星期三第39页,共44页,2023年,2月20日,星期三关联性分析行×列表的关联P157:例10-8第40页,共44页,2023年,2月20日,星期三第41页,共44页,2023年,2月20日,星期三R×C表资料Chi-Square检验

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论