农林牧渔6杨永利无序分类资料的统计推断44课件_第1页
农林牧渔6杨永利无序分类资料的统计推断44课件_第2页
农林牧渔6杨永利无序分类资料的统计推断44课件_第3页
农林牧渔6杨永利无序分类资料的统计推断44课件_第4页
农林牧渔6杨永利无序分类资料的统计推断44课件_第5页
已阅读5页,还剩66页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

无序分类资料的统计分析第一节χ2分布和拟合优度检验

第二节四格表资料的χ2检验第三节行×列表资料的χ2检验

【教学内容】【教学目的和要求】①了解四格表的概念及四格表中4个基本数据的含义;了解配对四格表的概念以及配对四格表与一般四格表在设计上的不同。②熟悉χ2检验的基本思想。③掌握四格表资料χ2检验的基本公式及各公式的适用条件;配对四格表检验的基本公式及各公式的适用条件;掌握四格表的确切概率法的适用条件。第一节卡方分布和拟和优度检验χ2分布是一种连续型随机变量的概率分布如果Z服从标准正态分布,那么Z2服从自由度为1的χ2分布设有k个相互独立的标准正态分布随机变量Z1,Z2,……Zν,Z12+Z22+

……+Zν2服从自由度为ν的χ2分布一、χ2分布(chi-squaredistribution)3.847.8112.59P=0.05的临界值二、拟和优度检验概念:根据样本的频率分布检验其总体分布是否等于某给定的理论分布或检验一个因素多项分类的实际观察数与某理论频数是否有差别。步骤:建立假设,确定检验水准确定p值计算检验统计量作推断结论不拒绝H0拒绝H0,接受H1P≤αP>α公式理论频数实际频数根据某地区的血型普查结果可知,该地区人群中血型为O的占30%,血型为A的占25%,血型为B的占35%,血型为AB的占10%。研究者在邻近该地区的一个山区人群中进行一个血型的流行病调查,在该山区人群中随机抽样调查了200人,检测这些对象的血型,问该山区人群与这个地区人群的血型分布是否一致?1.建立检验假设,确定检验水准H0

:该山区人群与这个地区人群的血型分布是一致的H1

:该山区人群与这个地区人群的血型分布不一致α=0.052.求出H0为真时各组的理论频数3.计算χ2统计量及自由度

ν=4-1=3表8Χ2界值表(部分)第二节四格表资料的χ2检验例1在某山区小学随机抽取男生80人,其中肺吸虫感染23人;随机抽取女生85人,其中肺吸虫感染13人。问该山区小学男生和女生的肺吸虫感染率有无差别?

[典型案例]abcd23571372资料类型:四格表资料(定性资料)设计类型:两样本率的比较,目的是推断两样本所来自的总体率是否相等,即π1=π2

。分析方法:两样本率比较χ2检验[案例分析]一、χ2检验的基本思想abcd23571372图2x2分布的临界值示意图二、四格表资料的χ2检验的基本步骤H0:π1=π2H1:π1≠π2α=0.05n=165>40,最小理论值为T11=(80×36)/165=17.45>5表10Χ2界值表(部分)

υ=1,查附表10,χ2界值表得:P<0.05。按α=0.05水准拒绝H0,接受H1,可认为该山区小学男生和女生的肺吸虫感染率不等,男生高于女生。对例1用四格表专用公式计算。式中a,b,c,d分别为四格表的四个实际数,总例数n=a+b+c+d。根据专用公式求χ2值结果与基本公式相同[电脑实验]数据录入例1此步骤的目的是对频数进行加权SPSS运算过程SPSS运算过程SPSS结果输出[统计报告]

χ2=4.374,P=0.036。说明男女生感染率不同,男性高于女性。(2)n≥40且1<T<5时,需计算校正值。

(3)T<1或n<40或A=0时,需改用四格表资料的确切概率法。例2某医师用甲、乙两疗法治疗小儿单纯性消化不良,结果如表4。试比较两种疗法结果有无差别?练习题某医院用内科疗法治疗一般胃溃疡患者80例,治愈63例,治愈率为78.8%;治疗65岁以上胃溃疡患者99例,治愈31例,治愈率为31.3%。试将上述资料整理成四格表,并比较内科疗法对2组胃溃疡病人的治愈率有无不同?

υ=1,查附表10,χ2界值表得:P<0.05。按α=0.05水准拒绝H0,接受H1,可认为内科疗法对2组胃溃疡病人的治愈率不同。一般胃溃疡病人的治愈率高于老年胃溃疡病人。

配对数据:对按一定条件配成对的n对研究对象分别使用两种不同的处理方法,或者对n个研究对象在两个时间点上使用两种不同的处理方法所得到的观察数据。B+-A+ab-cd

配对四格表IdAB1++2+-……j-+……n--原始数据例如,两个医生分别检查n个病人,检验的结果如下:问题:两个医生的检验结果一致吗?2.H0:两种试剂无联系

H1:两种试剂有联系

α=0.05P=0.027,说明两种试剂的检测结果有联系。第三节行列表资料的χ2检验表10Χ2界值表(部分)R×C表χ2检验的应用注意事项

1.对R×C表,不易有1/5以上格子的理论频数小于5或有一个格子的理论频数小于1。 出现某些格子中理论频数过小时怎么办?(1)增大样本含量(最好!)(2)删去该格所在的行或列(丢失信息!)(3)根据专业知识将该格所在行或列与别的行或列合并。(丢失信息!甚至出假象)

删除丙组乙丙合并

2.多组比较时,若效应有强弱的等级,如+,++,+++,最好采用后面的非参数检验方法。χ2检验只能反映其构成比有无差异,不能比较效应的平均水平。

表8观察组与对照组的疗效比较组别数例4的两两比较小结在选用χ2检验时,一定要考虑其对总例数和理论频数的要求。多个独立样本的χ2检验,结论为拒绝检验假设时,只认为总体率或构成比之间总的来说有差别,若要了解差别的具体情况,要进一步做卡方分割。对于成组分类数据的

2×2表:

n

≥40且所有T≥5

n≥40但有1<T<5

n<40或有T<1四格表资料的方法选择

对于配对分类数据的

2×2表

b+c>40

b+c≤40

四格表资料的方法选择行列表资料的χ2检验1由两样本率的差别推断两总体率的差别,若

P〈0.05,则

A.

两样本率相差很大

B.

两总体率相差很大

C.两样本率差别有统计意义

D.两总体率相差有统计意义

2四格表资料中的实际数与理论数分别用A与T表示,其基本公式与专用公式求的条件为

A.A≥5B.T≥5C.A≥5且T≥5

D.A≥5且n≥40E.T≥5且n≥40

3三个样本率比较得到,可以为

A.三个总体率不同或不全相同

B.三个总体率都不相同

C.三个样本率都不相同

D.三个样本率不同或不全相同

E.三个总体率中有两个不同

【案例讨论】某单位调查了4类人员的乙型肝炎表面抗体(HbsAb)的阳性率,想比较3种病人与健康人

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论