第十章 基于秩次的非参数检验.ppt_第1页
第十章 基于秩次的非参数检验.ppt_第2页
第十章 基于秩次的非参数检验.ppt_第3页
第十章 基于秩次的非参数检验.ppt_第4页
第十章 基于秩次的非参数检验.ppt_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、非参数检验最大的缺点:检验效能较低,实际上根据国外的一项研究,有些方法的检验效能大约在参数检验方法的95%左右,并非低得不能接受。,第十章基于秩次的非参数检验,主要内容:,1、配对设计资料的符号秩和检验 2、单样本和配对设计资料的符号秩和检验 3、两组独立样本比较的秩和检验 4、多组独立样本比较的秩和检验,参数统计: 如t检验、方差分析 统计推断方法 非参数统计:如秩和检验、Ridit分析,通常适用于下列资料:,1.总体分布为偏态或分布形式未知的计量资料(尤其是n 30的情况下); 2.总体分布不对称且无法转化为正态分布的资料; 3.对比组间方差不齐,又无适当变换方法达到方差齐性的资料; 4.

2、等级资料; 5.个别数据偏大或数据的某一端无确定的数据(俗称开口资料)。如“ 0.08mg”,只有一个下限或上限,而没有一个具体的数值。,因此:,非参数检验:对总体分布不做严格假 定,又称任意分布检验, 它直接 对总体分布位置、 分布形状进行比较。 优点:它不受总体分布的限制,适用范围 广。,基于秩次的非参数检验,目的:推断一个总体表达分布位置的中位数M和已知M0、两个或多个总体的分布是否有差别。 基本步骤:先将数值变量从小到大,或等级从弱到强转换成秩后,再计算检验统计量。 特点:假设检验的结果对总体分布的形状差别不敏感,只对总体分布的位置差别敏感。,第一节单样本和配对设计资料的符号秩和检验,

3、Wilcoxon于1945年提出的符号秩和检验,亦称符号秩和检验,可用以推断: 总体中位数是否等于某个指定值 配对样本差值的总体中位数是否为0,一、单样本资料的符号秩和检验,适用条件: Wilcoxon符号秩和检验常用于不满足 t检验条件的单样本定量变量资料的比较。 目的: 推断样本中位数与已知总体中位数(常为标准值或大量观察的稳定值)是否相等。,例10-1 已知某地正常人尿铅含量的中位数为2.50mol/L。今在该地随机抽取16名工人,测定尿铅含量见表10-1第(1)栏。问该厂工人的尿铅含量是否高于当地正常人?,表10-1 某厂16名工人与当地正常人的尿铅含量(mol/L)比较,108,28

4、,对做正态性检验得 0.8091, 0.0036,不满足单样本t检验条件,故选用Wilcoxon符号秩和检验。,1:建立检验假设,确定检验水准 :差值的总体中位数等于0,即该厂工人的 尿铅含量与正常人相同 :差值的总体中位数大于0,即该厂工人的 尿铅含量高于正常人 单侧 0.05,2.计算检验统计量T值 (1)求差值: (2)编秩: 依差值的绝对值由小到大编秩。遇差值为0,舍去不计,n随之减少。当差值绝对值相等,若符号不同,求平均秩次;若符号相同,可顺次编秩,也可求平均秩次。并将各秩次冠以原差值的正、负号。 (3)分别求正、负秩和: 分别求正秩和与负秩和,正秩和记为 ,负秩和记为 。 本例,

5、108, 28。 由于 n(n+1)/2,检验计算是否正确。,查表法(5n50) 查配对设计用的T界值表(附表9),A:若检验统计量T值在上、下界值范围内,其P值大于相应的概率水平; B:若T值在上下界值上或范围外,则P值小于相应的概率水平。 C:若T值恰好等于界值,其P值等于(一般是近似等于)相应概率水平。,3.确定 值,做出推断 (1)查表法 当 50时,根据n和T查界值表(附表9,配对比较的符号秩和检验用)。 查表时,自左侧找到n,用所得统计量值与相邻一栏的界值相比较,若T值在上、下界值范围内,其 值大于上方相应的概率; 若T值恰好等于界值,其 值等于(一般是近似等于)上方相应概率; 若

6、T值在上、下界值范围外,其 值小于相应概率,此时右移一栏,再做比较,直至较好地估计P值。 本例,由 n16,T28或T108查附表9得单侧0.01 P0.025。按照 0.05水准,拒绝 ,接受 ,故可认为该厂工人尿铅含量高于当地正常人。,(2)正态近似法,随着 的增大,分布逐渐逼近均数为 ,方差为 的正态分布。当时,近似程度较满意。故可由式(10-1)计算标准正态统计量: (10-1) 式中0.5为连续性校正数,因为 值是连续的,而 值却不连续。,排序时,出现相同秩次的现象称为相持(tie)。当相持的情形较多时(如个体数超过25),用式(10-1)计算的值偏小,可按式(10-2)计算校正的统

7、计量,经校正后, 适当增大, 值相应减小。 式中(j=1,2,)为第个相同秩次(即平均秩次)的个数,假定有2个差值为“1.5”,3个差值为“6”,5差值为个“13”,则 2, 3, 5,故有 若无相同秩次,则,一、配对设计资料的符号秩和检验,基本思想:若两组处理的效应相同,则每对差值的总体分布是以0为中心的对称分布,这时差值Md0。 说明若H0成立,则样本的正负秩和应相近,同时T值也不能太大或太小,即不能超出界值表中按 水准所列的界值范围,否则拒绝H0。,例10-2,对11份工业污水测定氟离子浓度(mg/L),每份水样同时采用电极法及分光光度法测定,结果见表10-2的第(2)、(3)栏。问就总

8、体而言,这两种方法的测定结果有无差别?,差值,本例为定量变量配对设计的小样本资料,其配对差值经正态性检验得 0.4561, 0.0001,即差值不服从正态分布;故不宜选用配对 检验。 现用Wilcoxon符号秩和检验。,Wilcoxon符号秩和检验的基本步骤:,1 建立检验假设,确定检验水准 H0:差值的总体中位数等于零,即Md=0 H1:差值的总体中位数不等于零,即Md 0 a 0 05 2.计算检验统计量T值 (1 ) 求差值d: (2)编秩:按差值的绝对值由小到大编秩,编秩时,差值为0,舍去不计;若差值的绝对值相等,称为相持,这时取平均秩次,并按差值的正负给秩次加上正负号。 (3)分别求

9、正、负秩和并确定统计量T 分别求出正、负差值秩次之和,分别以T+和T-表示。,3.确定 值,做出推断,注意:由附表9可知,当n5时,配对符号秩和检验不能得出双侧有统计学意义的概率,故n必须大于5。 由n10,T=11.5或T=43.5查附表9,得双侧0.10。按照 0.05水准不拒绝 ,故据此资料尚不能认为两法测定结果有差别。,在配对样本中,由于随机误差的存在,各对差值的产生不可避免,假定两种处理的效应相同,则差值的总体分布为对称分布,并且差值的总体中位数为0。若此假设成立,样本差值的正秩和与负秩和应相差不大,均接近 ;当正负秩和相差悬殊,超出抽样误差可解释的范围时,则有理由怀疑该假设,从而拒

10、绝 。,第二节两组独立样本比较的秩和检验,一、定量变量两组独立样本的秩和检验,目的:推断连续型变量资料或有序变量资料的两独立样本所来自的两个总体分布是否有差别。,Wilcoxon秩和检验的基本思想,假设两总体分布相同,两样本可认为是从同一总体中抽取的随机样本;将二者混合后由小到大编秩,然后分别计算两样本组的平均秩和 与 ,两者应大致相等,其差别是由于随机抽样引起; 如果按上述方法计算的两样本平均秩和差别差别很大,我们就有理由认为H0不成立。,例10-3,用两种药物杀灭钉螺,每批用200300只活钉螺,用药后清点钉螺的死亡数,并计算死亡率(%),结果见表10-3。问两种药物杀死钉螺的效果有无差别

11、?,该资料为百分率数据,不服从正态分布,现采用Wilcoxon秩和检验。,检验步骤,1.建立检验假设,确定检验水准 :两种药物杀灭钉螺死亡率的总体中位数相等 :两种药物杀灭钉螺死亡率的总体中位数不相等 0.05,2.计算检验统计量 值,(1)编秩: 将两组数据由小到大统一编秩(为便于编秩可先将两组数据分别由小到大排序) 编秩时如遇有相同数据,取平均秩次。 例如:本例中两组均有32.5,应编秩次为5和6,取平均秩次(56)255。 (2)求各组秩和 并确定统计量 T:两组秩次分别相加,其对应的秩和分别为 71.5和 33.5。,(3)确定检验统计量 T值 若两组例数相等,则任取一组的秩和为统计量

12、。若两组例数不等,则以样本例数较小者对应的秩和为统计量。 3确定P值和作出推断结论 (1)查表法 当 ,且 时,查界值表(附表10,两样本比较的秩和检验用)。 先找到与相交处所对应的4行界值,将检验统计量T值与T界值逐行相比。若T值在界值范围内,其P值大于相应概率;若T值恰好等于界值,其P值等于(一般是近似等于)相应概率;若T值在界值范围外,其P值小于相应概率,此时下移一行,再做比较,直至较好地估计P值。 本例,由n17,n2-n1=0,T=71.5或T33.5查附表10,得双侧0.01P0.02。按照0.05水准,拒绝H0,可以认为两种药物杀灭钉螺的效果有差别。,(2)正态近似法 当 或 时

13、,超出附表10的可查范围,根据中心极限定理,这时的T分布已接近均数为 ,方差 为的正态分布,故可由式(10-3)计算Z值,按标准正态分布确定值并做出推断结论。,式中0.5为连续性校正数,因为,值是连续的,而,T 值却不连续。,(2)若相持较多(如超过25%),则用下式进行校正:,为第j次相持的相同秩次的个数,若无相同秩次,则,故,二、有序分类变量资料的秩和检验,例10-4,某医科大学营养教研室为了解居民体内核黄素营养状况,于某年夏冬两个季节收集成年居民口服5mg核黄素后4小时的负荷尿,测定体内核黄素含量,结果见表10-4第(1)、(2)、(3)栏,试比较该地居民夏冬两个季节体内核黄素含量有无差

14、别?,*核黄素营养状况评价标准:缺乏为400g,不足为4001000g,适宜为1000g,1建立检验假设,确定检验水准 H0:夏冬两个季节居民体内核黄素含量的总体中位 数相等 H1:夏冬两个季节居民体内核黄素含量的总体中位 数不相等 0.05 2计算检验统计量值 (1)编秩 将两组数据按等级顺序由小到大统一编秩。 先计算各等级合计数,见表10-4第(4)栏;并确定各等级秩次范围,见第(5)栏;求出各等级的平均秩次,见第(6)栏。,检验步骤,(2)求各组秩和 各等级的平均秩次分别乘以各组各等级的例数,再求和即得到各组秩和。 (3)确定统计量值 TT12036。,3.确定P值,做出推断,查t界值表

15、得P0.001.按照=0.05水准,拒绝H0,接受H1, 故可认为夏冬两季节居民体内核黄素含量有差别,第三节 多组独立样本比较的秩和检验,完全随机设计,完全随机设计是采用完全随机化的分组方法,将全部试验对象分配到k个处理组,各组分别接受不同的处理,试验结束后比较各组均数之间的差别有无统计学意义,推论处理因素的效应。,例 如,某医生为了研究一种降血脂药的临床疗效,按统一纳入标准选择120名患者,采用完全随机设计方法将患者等分为4组进行双盲试验。问如何分组?,具体步骤,将120名高血脂患者从1开始到120编号,从随机数字表中(P456 附表15)的任一行任一列开始,依次读取二位数作为作为一个随机数

16、录于编号下(第二行),然后将全部随机数从小到大编序号(数据相同的按先后顺序编序号),将每个随机数对应的序号记在第三行;规定序号130为甲组,序号3160为乙组,序号6190为丙组,序号91120为丁组。,多组独立样本比较的秩和检验是由Kruskal和Wallis在Wilcoxon两样本秩和检验的基础上扩展而来,又称Kruskal-Wallis H 检验,用于推断定量变量或有序分类变量的多个总体分布有无差别。,完全随机设计多组样本比较的非参数方法又称为KW检验或H检验。 检验的目的:推断多组样本分别代表的总体分布是否不同。 适用条件:既可应用于观察指标是连续型变量值但不满足方差分析条件的情形,也

17、可应用于观察指标是有序变量的情形。,一、定量变量多组独立样本的秩和检验,例105,某医院用3种不同方法治疗15例胰腺癌患者,每种方法各治疗5例。治疗后生存月数见表10-5第(1)、(3)、(5)栏,问这3种方法对胰腺癌患者的疗效有无差别?,这是定量变量多组独立样本的比较,应首选单因素方差分析。但是据经验,生存月数通常不服从正态分布,不满足方差分析的条件,现用Kruskal-Wallis H 秩和检验。,检验步骤,1.建立检验假设,确定检验水准 H0:3种方法治疗后患者生存月数的总体中位数相等 H1:3种方法治疗后患者生存月数的总体中位数不全相等 0.05 2.计算检验统计量H值。 (1)编秩

18、编秩方法同例10-3。 将三组数据由小到大统一编秩,遇相同数值在同一组内,可顺次编秩;当相同数值出现在不同组时,则必须求平均秩次。见表105第(2)、(4)、(6)栏。如本例,三组数值中有两个“3“,分别在甲法组与乙法组,本应编秩次为2和3,现各取平均秩次为(2+3)/2=2.5。,(2)求各组秩和 将表10-5各组秩次相加即得,下标表示组序()。本例34,60,26。 (3)计算检验统计量值 按式10-5计算H值。,当相持出现较多时,由式(105)求得值偏小,可按式(10-6)进行校正得值。,3.确定P值,做出推断 (1)查H界值表(附表11,三样本比较的秩和检验用) 当组数K3,且各组例数

19、 时,可查界值表得到P值。 本例K3,且各组例数均为5,由H界值表查得临界值5.78,P0.05。按照0.05水准,拒绝H0,接受H1,故可认为3种方法治疗后胰腺癌患者的生存月数有差别。,(2)查 界值表(附表8) 当组数或各组例数超出H界值表时,由于H0成立时H值近似地服从 的 分布,此时可由 界值表得到P值。,二、有序变量多组独立样本的秩和检验,例106,某医院用3种方法治疗慢性喉炎,结果见表6第(1)(4)栏,问这3种方法的疗效是否有差别?,1.建立检验假设,确定检验水准,H0:3种方法疗效的总体分布位置相同 H1:3种方法疗效的总体分布位置不全相同 0.05,2.计算检验统计量H值,(

20、1)编秩 编秩方法同两组等级资料例10-4。各等级合计、秩次范围、平均秩次的计算结果,见表10-6第(5)(7)栏。 (2)求各组秩和 各组各等级的频数与平均秩次的乘积之和。 R1 =32.524+96.526+183.572+358.5186=83182 R2 =32.520+96.516+183.524+358.532=18070 R3 =32.520+96.522+183.514+358.522=13229 (3)计算检验统计量值,3.确定P值,做出推断,本例K3,各组例数均大于5,可由 查 界值表,得 。按照0.05水准,拒绝H0,接受H1,故可认为3种方法治疗慢性喉炎的效果有的差别。

21、,三、多个独立样本间的多重比较,经多个独立样本比较的Kruskal-Wallis 秩和检验,当结论为拒绝H0时,只能得出各总体分布的位置不全相同的结论。要回答哪两个总体分布位置相同,哪两个总体分布位置不同,还要进一步做两两比较。两两比较的方法很多,下面介绍扩展的检验法。统计量值计算公式如下:,式中 、 为两对比组的平均秩次;、为两对比组的样本含量;K为处理组数, ; H为Kruskal-Wallis 秩和检验中的统计量H或Hc值;式中分母为 的标准误。 方法步骤见例10-7。,例10-7 对例10-6资料做三个样本间的两两比较。 1.建立检验假设,确定检验水准 :第i组与第j组疗效的总体分布位

22、置相同 :第i组与第j组疗效的总体分布位置不相同 0.05,2.计算检验统计量t值,(1)求各组平均秩次 甲组: 乙组: 丙组:,(2)列出两两比较计算表,求得t值。,表中第(5)栏为按公式(10-7)计算的t值。本例N478,K3,Hc51.41,则甲组与乙组比较的t值为:,3.确定P值,做出推断,根据表10-7第(5)栏中的t值,以 查t界值表,得P值,见表10-7第(6)栏。按照0.05水准,甲组与乙组、甲组与丙组比较,均拒绝H0;而乙组与丙组比较不拒绝H0 ,故可认为3种方法治疗慢性喉炎疗效的差别主要存在于甲法与其他两法之间,而乙法与丙法间的疗效尚不能认为有差别。,SPSS非参数统计分

23、析,1.配对设计资料的符号秩和检验,数据文件:例10-2 2个反应变量分别为“电极法组”和“分光光度法组” 过程: Analyze Nonparametric Tests 2 Related Samples Test Pair(s)List:电极法组-分光光度法组” Test Type :Wilcoxon,2 两独立样本比较的秩和检验,数据文件:例10-3 数据格式:1个分组变量group,1个反应变量r1值 过程: Analyze Nonparametric Tests 2 Independent Samples Test Variable List: r1值 Grouping variables:group Test Type: Mann-Whitney U,3 两组有序变量资料的秩和检验,数据文件:例10-4 数据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论