硕士研究生医学统计学之 秩和检验_第1页
硕士研究生医学统计学之 秩和检验_第2页
硕士研究生医学统计学之 秩和检验_第3页
硕士研究生医学统计学之 秩和检验_第4页
硕士研究生医学统计学之 秩和检验_第5页
已阅读5页,还剩80页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、秩转换的非参数检验 参数检验:总体分布为的数学形式,对其总体参数做假设检验。 非参数检验:是针对参数检验而言的,不依赖于总体分布的一种假设检验方法,它直接对总体分布进行假设,不受总体分布的限制,适用范围广,而且简便易学。 非参数检验一般不直接用样本观察值作分析,统计量的计算基于原数据在整个样本中按大小所占位次。由于丢弃了观察值的具体数值,而只保存其大小次序的信息,凡适合参数检验的资料,应首选参数检验。但不清楚是否适合参数检验的资料,那么应采用非参数检验;尤其对于难以确定分布又出现少量异常值的小样本数据,非参数检验在剔除这些数据前后所得结论显示出其较好的稳健性。非参数检验的适用范围: 计量资料不

2、满足正态或方差齐性条件 对于分布不知是否正态的小样本资料 对于一端或两端无确定数值的资料 等级资料进行等级强度差异的比较 秩转换的非参数检验,首先将观察值从小到大,或者等级从弱到强转换为秩次后,再计算统计量。这种检验对总体分布的形状差异不敏感,只对总体分布的位置差异敏感。 非参数检验的方法很多,有符号检验、游程检验、等级相关分析、秩和检验等。秩转换的非参数检验秩和检验是在非参数检验中占有重要地位且检验成效高的一种方法。第一节 配对样本比较的Wilcoxon符号秩检验 Wilcoxon符号秩检验可用于1.配对样本差值的中位数与0的比较2.单个样本中位数和的一个总体中位数比较。一、配对样本差值的中

3、位数与0的比较 比较目的是推断配对样本差值得总体中位数是否为0,也可以说是推断配对的两个相关样本所来自的两个总体中位数是否相等。例8-1 对12份血清分别用原方法检测时间20分钟和新方法检测时间10分钟测谷-丙转氨酶,结果见表8-1的(2)、(3)栏。问两法所得结果有无差异?表8-1 12份血清用原法和新法测血清谷-丙转氨酶的比较编号 原法新法差值正秩负秩 1 60 76 16 8 2142152 10 5 3195243 4811 4 80 82 2 1.5 5242240 -2 1.5 6220220 0 7190205 15 7 8 25 38 13 6 9198243 45 910 3

4、8 44 6 411236190-46101295100 5 3合计-54.5 11.5 本例为配对实验设计,对其差值进行正态性检验:W,P,不满足正态性的条件,使用符号秩检验。1。 建立假设并确定检验水准 H0:差值的总体中位数为0,Md=0 H1:差值的总体中位数不为0,Md0 2。计算统计量T 省略所有差值为0的对子,令余下的有效对子数为n本例n=11 对剩余的差值的绝对值从小到大编秩,并根据差值的正负号标上符号。编秩时遇到绝对值相同时取平均秩次。 分别求正负秩次之和,用T+和T-表示,并任选正秩和或负秩和作为统计量值。本例T=T-3. 确定P值,作出统计推断 查表法:n50查界值表,假

5、设T在上下界值范围内,P大于表中上方对应的概率水平;假设T等于上侧界值或下侧界值,P近似等于表中上方对应的概率水平;假设T不在上下界值范围内,P小于表中上方对应的概率水平。本例n=11,T=T-,查界值表:0.0550超出界值表的范围时,可以使用正态近似法作u检验。tj为第j个相同秩次的个数 如:相同秩中有2个,5个8,3个14,那么t1=2,t3=5,t3=3例 配比照较甲、乙两种方法治疗扁平足效果,记录如下,问两种疗法是否有差异?两种疗法的治疗结果病例号12345678910111213甲好好好好差中好好中差好差中乙差差好中中差中差中差好好差配对的等级资料 符号秩和检验假设用于配对等级资料

6、,那么应先将等级从弱到强赋值,然后再进行符号秩和检验。但对于等级资料,相同秩次多,小样本的检验结果会存在偏差,最好为大样本。两种疗法的治疗结果病例号12345678910111213甲好好好好差中好好中差好差中赋值3333123321312乙差差好中中差中差中差好好差赋值1132212121331差值2201-1112000-21秩次7.57.53-3337.5-7.531。 建立假设并确定检验水准 H0:差值的总体中位数为0,Md=0 H1:差值的总体中位数不为0,Md0 2。计算统计量TT+=34.5 T-=10.5 T=10.5 3. 确定P值,作出统计推断n=9,T=T-,查界值表:P

7、 按的水准,不拒绝H0,还不能认为两法治疗扁平足效果不同。二、单样本中位数与总体中位数的比较 比较目的是推断样本来自的总体中位数M和某个的总体中位数M0是否相等。即推断样本各变量值和M0差值的总体中位数是否为0。例8-2 某地正常人尿氟含量的中位数为 。今在该地某厂随机抽取12名工人,测得尿氟含量见表8-2第1栏。问该厂工人的尿氟含量是否高于当地正常人的尿氟含量? 对工人尿氟含量进行正态性检验得W,P,不满足正态性的条件,使用符号秩和检验。表8-2 12名工人的尿氟含量mol/L与比较尿 氟 含 量(1)45.30正 秩负 秩44.21-1.091.545.30 046.39 1.09 1.5

8、49.47 4.17 351.05 5.75 453.16 7.86 553.26 7.96 654.37 9.07 757.1611.85 867.3722.07 971.0525.751087.3742.0711合 计64.51.51。 建立假设并确定检验水准 H0:该厂工人尿氟含量的总体中位数为 H1:该厂工人尿氟含量的总体中位数大于 2。计算统计量TT+=64.5 T-=1.5 T=1.5 3。 确定P值,作出统计推断n=11,T=T-,查界值表:P 按的水准,拒绝H0,接受H1,可以认为该厂工人尿氟含量高于当地正常人。第二节 两个独立样本比较的Wilcoxon秩和检验 两组独立样本比

9、较的秩和检验(Wilcoxon秩和检验),目的是推断计量资料或等级资料的两个独立样本代表的两个总体分布是否有差异。 理论上H0为两总体分布相同,即两样本来自同一总体;H1为两总体分布不同。由于秩和检验对两总体分布形状的差异不敏感,对位置相同、形状不同但类似的两总体分布,推断不出两总体分布(形状)有差异,故在实际应用中,H0可写作两总体分布位置相同,也可简化为两总体中位数相等。例8-3 对10例肺癌病人和12例矽肺0期工人用X光片测量肺门横径右侧距RD值cm,结果见表8-5。问肺癌病人的RD值是否高于矽肺0期工人的RD值? 肺癌病人矽肺0期工人RD值秩RD值秩2.78 13.23 2.53.23

10、 2.53.50 44.20 74.04 54.87 144.15 65.12 174.28 86.21 184.34 97.18 194.47 108.05 204.64 118.56 214.75 129.60 224.82 134.95 155.10 16n1=10T1=141.5n2=12T1=111.5表8-5 肺癌病人和矽肺0期工人的RD值cm比较 1。 建立假设并确定检验水准 H0:肺癌病人和矽肺0期工人RD值的总体分布位置相同 H1:肺癌病人的RD值高于矽肺0期工人的RD值 分析:本例两样本资料经正态性检验,W1,P1,W2,P2;经方差齐性检验,F,P,推断的两总体方差不等,

11、使用Wilcoxon检验 2。计算统计量T 把两样本数据混合小到大编秩,遇到数据相同的取平均秩次 分别求两样本秩次之和,用T1和T2表示样本含量小的为T1,选择T1作为统计量值T。假设样本含量相等,任取一个秩和作为TT1或T2。 本例:n1=10, T1, n2=12,T2=111.5 所以:T=T1=141.5 3. 确定P值,作出统计推断 查表法:当n110以及n2-n110时,可以查界值表确定概率值。查界值表,假设T在上下界值范围内,P大于表中上方对应的概率水平;假设T等于上侧界值或下侧界值,P近似等于表中上方对应的概率水平;假设T不在上下界值范围内,P小于表中上方对应的概率水平。 按的

12、水准,拒绝H0,接受H1,可以认为肺癌病人的RD值高于矽肺工人的RD值。本例n1=10,n2-n1=2,T,查界值表: 0.02510或者n2-n110时,可使用正态近似法作u检验。tj为第j个相同秩次的个数表8-6 吸烟工人和不吸烟工人的HbCO(%)含量比较含 量吸烟工人不吸烟工人合计秩范围平均秩秩 和吸烟工人不吸烟工人很低 1 2 313 2 2 4低 823 3143419 152 437中1611 27356148 768 528偏高10 4 14627568.5 685 274高合 计 4 0 4767977.5 310 03940 7919171243二、频数表资料和等级资料的两

13、样本比较例8-4 39名吸烟工人和40名不吸烟工人的碳氧血红蛋白HbCO(%)含量见表8-6。问吸烟工人的HbCO(%)含量是否高于不吸烟工人的HbCO(%)含量? 1。 建立假设并确定检验水准 H0:吸烟工人和不吸烟工人的HbCO含量总体分布位置相同 H1:吸烟工人的HbCO含量高于不吸烟工人的HbCO含量 2。计算统计量T 先确定各等级的合计人数、秩次范围和平均秩次。 分别求两样本秩次之和, 本例:n1=39, T1=1917, n2=40,T2=1243 所以:T=1917 3. 确定P值,作出统计推断超出界值表的范围,使用正态近似法作u检验。 本例:n1=39, n2=40,N=79,

14、T=1917 t1=3, t2=31, t3=27, t4=14, t5=4查u界值表u,P 按的水准,拒绝H0,接受H1,可以认为吸烟工人的的HbCO含量高于不吸烟工人。三、Mann-Whitney U 检验 两独立样本比较还常用Mann-Whitney U 检验(Mann-Whitney U test)。检验统计量U值为:把第一个样本的n1(n1n2)个变量值的每个变量值,与第二个样本的n2个变量值逐个比较,小于记1,相等记0.5,(大于记0),求其和。肺癌病人矽肺0期工人RD值计分RD值2.78 123.23 3.23 11.53.50 4.20 84.04 4.87 24.15 5.1

15、2 04.28 6.21 04.34 7.18 04.47 8.05 04.64 8.56 04.75 9.60 04.82 4.95 5.10 合计33.5表8-5 肺癌病人和矽肺0期工人的RD值cm比较 当n1和n2小时,如n1+n230,有专门的U界值表;当n1和n2大时,用正态近似法作u检验确定概率P值。 对同一资料Wilcoxon秩和检验的结果与Mann-Whitney U 检验结果等价,且uU=uT。第三节 完全随机设计多个样本比较的Kruskal-Wallis H检验一、多个独立样本比较的Kruskal-Wallis H检验 Kruskal-Wallis H检验用于推断计量资料或

16、等级资料的多个独立的样本所来自的多个总体分布是否有差异。 在理论上讲,检验假设H0应为多个总体分布相同,即多个样本来自同一总体。但由于H检验对总体分布的形状差异不敏感,而对总体分布的位置敏感,所以实际应用中H0可以写作多个总体分布的位置相同例8-5 用三种药物杀灭钉螺,每批用200只活钉螺,用药后清点每批钉螺的死亡数、再计算死亡率%,结果见表8-9。问三种药物杀灭钉螺的效果有无差异? 一原始数据的多个样本比较甲药乙药丙药死亡率秩死亡率秩死亡率秩32.5 1016.0 46.5 135.5 1120.5 69.0 240.5 1322.5 712.5 346.0 1429.0 918.0 549

17、.0 1536.0 1224.0 8Ri633819ni 5 5 5表8-9 三种药物杀灭钉螺的死亡率%比较分析:本例资料为百分率资料,不知道是否符合正态分布,而且样本含量很小,保守起见选择Kruskal-Wallis H检验 1。 建立假设并确定检验水准 H0:三种药物杀灭钉螺的死亡率的总体分布位置相同 H1:三种药物杀灭钉螺的死亡率的总体分布位置不全相同 2。计算统计量H 把各个样本数据混合小到大编秩,遇到数据相同的取平均秩次 分别求各样本秩次之和,用Ri表示。 计算统计量Hni为第i个样本的样本容量; 为第i个样本的秩和N=ni 当出现相同秩次时,算得H值偏小,应进行校正,求校正HC值。

18、 本例:n1=n2=n3=5,N=15,R1=63,R2=38,R3=19tj为第j个相同秩次的个数3. 确定P值,作出统计推断 查表法:当样本个数g=3以及每个样本例数ni5时,可以查界值表确定概率值。本例:g=3,n1=n2=n3=5查界值表:H,P 按的水准,拒绝H0,接受H1,可以认为三种药物杀灭钉螺的效果不全相同。 当g3或有样本容量ni5,那么H或HC近似服从=g-1的2分布,可以查2界值表确定概率值。例8-6 比较小白鼠接种三种不同菌型伤寒杆菌9D、11C和DSC1后存活日数,结果见表8-10。问小白鼠接种三种不同菌型伤寒杆菌的存活日数有无差异? 9D11CDSC1存活日数秩存活

19、日数秩存活日数秩22 5 10.5 3 4.522 5 10.5 5 10.522 6 15.5 6 15.53 4.5 6 15.5 6 15.547 6 15.5 6 15.547 721 72147 824 7215 10.510 26.5 925721123010 26.572111 28.511 28.5Ri84169 212ni10911 8.40 18.78 19.27表8-10 小白鼠接种三种不同菌型伤寒杆菌的存活日数比较分析:本例资料为时间资料,一般生存日数资料为非正态分布,W1=0.871,P1,W2=0.853,P2,W3,P3,选择Kruskal-Wallis H检验

20、1。 建立假设并确定检验水准 H0:接种三种不同菌型伤寒杆菌的存活日数总体分布位置相同 H1:接种三种不同菌型伤寒杆菌的存活日数总体分布位置不全相同 2。计算统计量H 把各个样本数据混合小到大编秩,遇到数据相同的取平均秩次 分别求各样本秩次之和,用Ri表示。 计算统计量H 所以:0.005P 按的水准,拒绝H0,接受H1,可以认为小白鼠接种三种不同菌型的伤寒杆菌的存活日数不全相同。3. 确定P值,作出统计推断本例全部样本容量均大于5,HC近似服从=g-1=3-1=2的2分布,可以查2界值表确定概率值。二频数表资料和等级资料的多个样本比较例8-7 四种疾病患者痰液内嗜酸性白细胞的检查结果见表8-

21、11。问四种疾病患者痰液内的嗜酸性白细胞有无差异? 表8-11 四种疾病患者痰液内的嗜酸性白细胞比较白细胞支气管扩张肺水肿肺癌病毒性呼吸道感染合计秩范围平均秩-0353111116+257519123021+9533203150 40.5+6220105160 55.5Ri739.5436.5 409.5 244.5 ni17.015171160 43.50 29.10 24.09 22.23 1。 建立假设并确定检验水准 H0:四种疾病患者的痰液内嗜酸性粒细胞总体分布位置相同 H1:四种疾病患者的痰液内嗜酸性粒细胞总体分布位置不全相同 2。计算统计量H 先确定各等级的合计人数、秩次范围和平均

22、秩次。 分别求各样本秩次之和:Ri 计算统计量H3. 确定P值,作出统计推断 所以:P=g-1=4-1=3 按的水准,拒绝H0,接受H1,可以认为四种疾病患者的痰液内嗜酸性粒细胞总体分布位置不全相同。二、多个独立样本两两比较 K-W H检验拒绝H0,接受H1,认为多个总体分布位置不全相同,需要进一步推断那两个总体分布不同。其中:(一)、Nemenyi法检验例8-8 对例8-6资料作三个样本间的两两比较1 建立假设并确定检验水准 H0:任两比照组的总体分布位置相等 H1:任两比照组的总体分布位置不等 本例:0.025P0.01P0.99P2 计算统计量23. 确定P值,作出统计推断=g-1=3-1=2 接种9D与11C比较,按的水准,拒绝H0,接受H1,可以认为两组小白鼠存活日数不同;接种9D与DSC1比较,按的水准,拒绝H0,接受H1,可以认为两组小白鼠存活日数不同;接种11C与DSC1比较,按的水准,不拒绝H0,还不能认为两组小白鼠存活日数不同。(二)、bonfferoni调整法 改变检验水准后,使用Wilcoxon秩和检验,对任意两样本进行两两比较。 要使屡次比较后犯型错误的累计概率保持不变或至少不超过原水准,那么每次两两比较的检验水准可利用bonfferoni不等式确定

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论