第十讲1非参数检验卡方检验_第1页
第十讲1非参数检验卡方检验_第2页
第十讲1非参数检验卡方检验_第3页
第十讲1非参数检验卡方检验_第4页
第十讲1非参数检验卡方检验_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1卡方检验

(chi-squaretest)

分类数据组间比较的假设检验计数资料组间的比较2

本讲主要内容第一节卡方检验的基本思想第二节独立四格表资料的χ2检验*第三节配对四格表资料的χ2检验*第四节行×列表资料的χ2检验*第五节多个样本率间的多重比较第六节卡方检验总结3

目的:推断两个总体率或构成比之间有无差别多个总体率或构成比之间有无差别多个样本率间的多重比较两个分类变量之间有无关联性频数分布拟合优度的检验。检验统计量:资料类型:计数资料理论基础:卡方分布4第一节检验的基本思想51.χ2分布1875年F.Helmet提出χ2统计量,设Xi为来自正态总体的连续型变量。χ2分布是一个连续型变量的分布,分布的参数为自由度(ν)。63.847.8112.59P=0.05的临界值χ2分布的概率密度函数曲线7χ2分布的界值在υ=1,卡方分布界值为标准正态分布界值的平方。8K.Pearson的χ2统计量1900年K.Pearson提出下述公式,在n≥40时下式值与χ2分布近似,在理论频数>5,近似程度较好。A:实际频数,表中实际发生的阳性或阴性频数;T:理论频数,按某H0假设计算理论上的阳性或阴性频数TRC,第R行第C列的理论频数;nR,相应行的合计,nC,相应列的合计,n,总例数9表7-1两组疗法降低颅内压有效率(%)疗法有效人数无效人数合计有效率试验组99(90.48)5(13.52)10495.2对照组75(83.52)21(12.48)9678.1合计

1742620087.0注:括号内为理论频数(T)T11=174*104/200=90.48假设:H0:1=2=c=87.00

(两组总体有效率相等)H1:12(两组总体有效率不等)

假定两组有效率均为87%10Class n HypothesizedObservedExpected=T试验组104有效概率π=0.8799 90.48

无效概率π1=0.13513.52对照组96有效概率π=0.87 75 83.52

无效概率π1=0.132112.48Χ2检验是考察实际频数与假设理论频数是否一致的统计量。11Pearson检验计算与步骤1.建立假设:H0:1=2=c(两组总体率相等)H1:12(两组总体率不等)2.=0.053.计算统计量4.确定概率(P)和自由度(ν)自由度(ν)=(行数-1)×(列数-1)本例ν=(2-1)×(2-1)=112

与比较,得到p值5.结论:在=0.05水准上,p<0.01,拒绝H0,两样本率差别有统计意义,可认为试验组对降低颅内压有效率高于对照组。本例13第二节独立四格表资料检验

(两组样本率间差别检验)14两组(不配对)样本率的比较

1)四格表形式组别阳性数阴性数合计率%甲组aba+b=n1a/n1乙组cdc+d=n2c/n2合计a+cb+dn2)四格表不配对资料检验的专用公式二者结果等价各组样本例数是固定的省去求理论频数15表7-1两组降低颅内压有效率比较疗法有效人数无效数合计试验组99(a)5(b)104(a+b)对照组75(c)21(d)96(c+d)合计174(a+c)26(b+d)200(N)163)四格表资料检验的校正公式计数资料中的实际频数是分类资料,计算的统计量是离散型分布,一般近似于连续型分布。在自由度大于1,各格的理论频数均大于5时,这种近似很好;当自由度为1,有任何格子理论频数小于5而大于1,且n>40时,这种近似较差。而分布是一连续型分布。因此需要进行连续性校正。美国统计学家F.Yates提出了用|A-T|-0.5计算连续性校正法。17四格表资料检验公式选择条件:

,不校正的理论或专用公式;

,校正公式;,用Fisher确切概率法

连续性校正仅用于的四格表资料,当时,一般不作校正。

18表7-2两药物治疗脑血管病有效率比较组别有效数无效数合计有效率%甲药4665288.46乙药1882669.23合计64147882.05校正公式不校正χ2=4.350.025<p<0.050.05<P<0.1

结果不同19SPSS输入格式组别Freq2效果甲药46阳性甲药6阴性乙药18阳性乙药8阴性20SPSS过程DataWeightCasesWeightCasesby录入的数据是经过整理后的频数表数据,分析前需要告诉系统freq变量代表的是频数,否则得不到预期的结果。将频数变量freq2送入FrequencyVariableok21AnalyzeCrosstabsDescriptiveStatisticsSPSS过程22Rows:group1Colums:效果列变量行变量Statistics23Chi-squareokNominal无序分类变量Ordinal有序分类变量2*2配对卡方检验只适合方表,吻合程度检验2*2表,计算相对危险度OR估计值卡方检验,产生多种结果计算相关系数24SPSS输出结果25SPSS输出结果不校正校正a说明对2*2表格计算了连续性校正卡方b说明1个单元格的理论频数小于5,最小理论频数为4.67皮尔逊卡方检验结果:x2=4.353,p=0.037Fisher卡方检验结果:p=0.058n=78,T<5选校正公式结果26练习在甲乙两个污水排放口分别取样检验COD超标情况,结果见表,排污口超标次数未超标次数合计甲4(5.22)26(24.78)30乙4(2.78)12(13.22)16合计838461)确定检验假设和检验水准2)计算理论频数,见表中括号里数字3)使用校正公式计算卡方统计量,为0.344)查临界值表,得p>0.05,超标率无统计学意义。27练习结果28第三节配对设计两个样本率的χ2检验(McNemer检验)用途常用于比较两种检验方法或两种培养基的阳性率是否有差别。特点:对同一观察对象分别用两种方法处理,观察其阳性与阴性结果。资料整理为配对四格表形式.29配对设计资料的四格表及公式例表7-3两种方法的检测结果

免疫乳胶法荧光法+-合计+11(a)12(b)23(a+b)-2(c)33(d)35(c+d)合计13(a+c)45(b+d)58(N)例7-3:某实验室采用两种方法对58名可疑红斑狼疮患者的血清抗体进行测定,问:两方法测定结果阳性检出率是否有差别?各观察单位分别用两种方法处理,然后观察两种处理方法的某两分类变量的计数结果30例:配对计数资料的比较1.建立检验的假设H0:b=c

(两法总体阳性率相等)H1:bc

(两法总体阳性率不等)2.=0.053.计算χ2

统计量(McNemer检验

)条件:(b+c)<40条件:(b+c)≥40314.确定自由度(ν)和χ2值的概率P

ν=(行数-1)(列数-1)本例:ν=1本例χ2=5.79>3.84,P<0.055.结论:在α=0.05水准,拒绝H0,P<0.05认为两方法的检测率不同,乳胶法的阳性检测率22.41%低于免疫检测率39.66%。当n很大,a与d数值很大,统计意义不大32荧光法乳胶法频数2阳性阳性11阳性阴性12阴性阳性2阴性阴性33SPSS数据要求33SPSS过程DataWeightCasesWeightCasesby将频数2变量送入FrequencyVariableokAnalyzeDescriptiveStatisticsCrosstabsRows:荧光法Colums:乳胶法StatisticsMcMemarok34McNemar检验结果McNemar利用二项分布原理计算双侧精确概率,p=0.013,差异具有统计学意义。35第四节行×列表的χ2检验当比较组行或列分类数>2,称为行×列表。其基本数据有以下三种情况:1.多组(独立样本)样本率差别有无统计意义?2.两组(独立样本)的构成比(分布)有无统计意义?3.两个分类变量分布是否独立(有关联)?36行×列表的χ2检验公式自由度=(行数-1)×(列数-1)等价37表7-8三组疗法有效率的比较疗法有效无效合计有效率%物理组199720696.6药物组1641818290.1外用组1182614481.9合计4815153290.4一、多组样本率的比较H0:1=2=3=90.4(三组总体有效率相等)H1:三组总体率不全等38表7-8三组疗法有效率的计算A为表中的实际频数自由度=(行数-1)(列数-1)=(3-1)(2-1)=239SPSS过程DataWeightCasesWeightCasesby将频数变量送入FrequencyVariableokAnalyzeDescriptiveStatisticsCrosstabsRows:group1Colums:效果StatisticsChi-squareok40Group1效果频数物理组阳性199物理组阴性7药物组阳性164药物组阴性18外用组阳性118外用组阴性26SPSS输入和输出注意weigtcases结论:在α=0.05水准,拒绝H0,P<0.01,认为三组疗法有效率不等或不全等.注意:此结果不能得到各两两组比较的结论.41二、两组和多组构成比的比较

表7-9两组Ⅱ型糖尿病患者ACE基因分布比较

ACE基因类型糖尿病DDIDII合计有肾病42(37.8)48(43.3)21(18.9)111无肾病30(21.7)75(52.2)36(26.1)141合计72(28.9)123(48.2)57(22.9)252括号内为行的构成比问:两组糖尿病人在ACE基因类型分布上有无差别?H0:两组总体各基因构成相等,均等于合计构成比H1:两组总体构成分布不相等42输入格式和过程肾病有无基因类型构成比有肾病DD42有肾病ID48有肾病二21无肾病DD30无肾病ID75无肾病二36操作过程同前43SPSS输出结果结论:在α=0.05水准,拒绝H0,P=0.015,认为两组糖尿病病人在ACE基因类型分布上有差别,有肾病糖尿病者DD基因比例多于无肾病.

44三、R×C表数据的注意事项1.多个样本率比较的χ2检验,当拒绝H0时,不能得出任何两组间都有差别,需要进行多个样本率的多重比较。目前尚无公认的两两比较的方法.2.R×C表各格的理论频数不应小于1,且1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论