版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、郑大公卫统计教研室平智广第十章 基于秩次的非参数检验7/23/20221参数统计(parametric statistics)是以样本来自某已知分布总体(如正态分布、t分布、F分布等)为假设基础,对总体参数(如总体均数、总体方差等)进行估计或检验的方法。7/23/20222 在实践中常遇到以下一些资料,如需比较患者和正常人的血铁蛋白、血铅值、不同药物的溶解时间、实验鼠发癌后的生存日数、护理效果评分等,这类资料:资料的总体分布类型未知;或某些变量可能无法精确测量: 疼痛程度 无、轻度、中度、重度 疾病治疗结果 控制、显效、有效、无效 。7/23/20223非参数统计(nonparametric
2、statistics)是一种不依赖于总体分布类型,不考虑被研究对象为何种分布以及分布是否已知的统计推断方法,此类方法通常不涉及研究对象的参数。这时统计推断是比较分布而不是参数。7/23/20224非参数统计的基本思想一组数据的最基本信息是次序,将数值按大小次序排队,每个数值在整个数据中所占的位置和次序,称为秩(rank)。在一定的假设下,这些秩及其统计量的分布是可以求出来的,且与原来的总体分布无关,可进行所需要的统计推断。7/23/20225非参数统计方法的优缺点 优点:适用范围广:对变量的类型和分布无特殊要求。对数据要求不严:对某些指标不便准确测定,只能以严重程度,优劣等级,先后次序等作记录
3、的资料也可应用。对样本量无严格要求。缺点:对于符合参数检验的资料如果用非参数检验,由于没有充分利用资料提供的信息,故检验效能低于参数检验,若要使检验效能相同,往往需要更大的样本含量。7/23/20226应用范围: 对于计量资料:不满足正态和方差齐性条件的小样本资料;分布不明的小样本资料;一端或两端是不确定数值(如或某一数值)的资料。对于等级资料:若选行列表资料的c2检验,只能推断构成比差别,而选秩转换的非参数检验,可推断等级强度差别。7/23/20227Wilcoxon于1945年提出的符号秩和检验(Wilcoxon singned-rank test),亦称符号秩检验,可用以推断总体中位数是
4、否等于某已知数值,也可推断配对样本差值的总体中位数是否为0。第一节 单样本和配对设计资料的符号秩和检验7/23/20228一、单样本资料的符号秩和检验Wilcoxon符号秩和检验常用于不满足t检验条件的单样本定量资料的比较。其目的是推断样本中位数与已知总体中位数是否相等。例1:已知某地正常人尿铅含量的中位数为2.50mmol/L。今在该地随机抽取16名工人,测得尿铅含量,问该厂工人的尿铅含量是否高于当地正常人?7/23/20229表1 16名工人与当地正常人到尿铅含量(mol/L)测定结果尿铅含量(X)尿铅含量(X)0.623.130.783.272.133.542.484.382.544.3
5、82.685.052.736.083.0111.277/23/202210尿铅含量的直方图7/23/2022111.建立检验假设,确定检验水准H0:差值的总体中位数等于0,即该厂工人的尿铅含量与正常人相同H1:差值的总体中位数大于0,即该厂工人的尿铅含量高于正常人 a=0.057/23/2022122.计算检验统计量T值(1)求差值(2)编秩差值为0 / 差值的绝对值相同(3)分别求正、负秩和(4)确定检验统计量:任意取T+或T-7/23/202213表2 16名工人与当地正常人到尿铅含量(mol/L)测定结果尿铅含量(X)差值(d)秩次尿铅含量(X)差值(d)秩次0.621.88123.13
6、0.6370.781.72103.270.7782.130.3753.541.0492.480.0214.381.88122.540.0424.381.88122.680.1835.052.55142.730.2346.083.58153.010.51611.278.77167/23/202214编秩:将差值按绝对值大小从小到大编秩,并按差值的正负给秩次加上正负号。若差值的绝对值相等,则取其平均秩次,如差值的绝对值为1.88的有3个,它们的位次是11、12、13,取平均秩次为(11+12+13)/3=12。编秩时如遇差值为0,则舍去不计。 7/23/2022153. 确定P值,并做出推断结论(
7、1)查表法5n50,判断原则:内大外小本例,n=16,T=28或T=108 ,查用T界值表,得0.01P50时)超出附表9范围,可用正态近似法作u检验。 7/23/202217若多次出现相持现象(如超过25%),求得的Z值偏小,应计算校正的统计量值Zc。 式中tj为第j (j=1,2)个相同秩次的个数。如有2个差值的绝对值为2.5,则t1=2;有3个差值均为5,则t2=3。于是, (23-2)+(33-3) 7/23/202218二、配对设计资料的符号秩和检验目的是推断配对样本差值的总体中位数是否与0有差别,即两个总体中位数是否有差别。例2:对11份工业污水测定氟离子浓度(mg/L),每份水样
8、同时采用电极法及分光光度法测定,结果见表。问就总体而言,这两种方法的测定结果有无差别?7/23/202219表3 两法测定11份工业污水中氟离子浓度结果样品号氟离子浓度(mg/L)差值 d秩次-1电极法(2)分光光度法(3)-4-5110.58.81.74221.618.82.89314.913.51.43430.227.62.6858.49.10.71.567.770.71.5716.414.71.75819.517.22.36912715528.0101018.716.32.47119.59.507/23/202220本例配对样本差值经正态性检验,推断得总体不服从正态分布,现用Wilcox
9、on符号秩检验。建立检验假设,确定检验水准H0:差值的总体中位数等于0H1:差值的总体中位数不等于0 a=0.052. 求检验统计量T值 (1) 求差值(2) 编秩 (3) 求秩和(4) 确定统计量7/23/2022213. 确定P值,作出推断查表法 5n 50,查T界值表(附表9)任取正秩和或负秩和为T,本例为T=11.5或T=43.5 。P0.10,按照a=0.05水准不拒绝H0 ,尚不能认为两法测定结果有差别。7/23/202222第二节 两组独立样本比较的秩和检验 理论上零假设H0为两总体分布相同,即两样本来自同一总体;其对立假设H1为两总体分布不同。秩和检验对两总体分布形状的差别不敏
10、感,对位置相同、形状不同但类似的两总体分布,推断不出两总体分布形状是否有差别,故H1不能为两总体分布不同,而是两总体分布位置不同,简化为两总体的中位数相等。7/23/202223一、定量变量两组独立样本的秩和检验例3:用两种药物杀灭钉螺,每批用200300只钉螺,用药后清点钉螺的死亡数,并计算死亡率(%),问两种药物杀灭钉螺的效果有无差别?7/23/202224甲药乙药死亡率(%)秩次死亡率(%)秩次32.55.516.0135.5722.5240.51026.0340.51028.5449.01232.55.549.51338.0851.51440.510n1=7T1=71.5n2=7T2=
11、33.5表4 两种药物杀灭钉螺死亡率(%)的比较7/23/202225建立检验假设,确定检验水准H0:两种药物杀灭钉螺死亡率的总体中位数相等H1:两种药物杀灭钉螺死亡率的总体中位数不相等 a=0.057/23/2022262.计算检验统计量T值(1) 编秩 把两样本数据混合从小到大编秩,同组/不同组;(2) 求各组秩和 以样本例数小者为n1,其秩和为T1,(3) 确定检验统计量T值: 若n1n2,则T=T1; 若两样本例数相等,可任取一样本的秩和 本例n1=n2,可取T=T1=71.5或T=T2=33.5 。7/23/202227甲药乙药死亡率(%)秩次死亡率(%)秩次32.55.516.01
12、35.5722.5240.51026.0340.51028.5449.01232.55.549.51338.0851.51440.510n1=7T1=71.5n2=7T2=33.5表4 两种药物杀灭钉螺死亡率(%)的比较7/23/2022283.确定P值,作出推断(1)查表法 查T界值表(成组设计用)n1=7,n2-n1=0,T=71.5或T=33.50.01P10或 n2-n1107/23/202230二、有序分类变量两组独立样本的秩和检验例4:某医科大学营养教研室为了解居民体内核黄素营养状况,于某年夏冬两个季节收集成年居民口服5mg核黄素后4小时的负荷尿,测定体内核黄素含量,试比较该地居民
13、夏冬两个季节体内核黄素含量有无差别?表5 某地居民夏冬两个季节体内核黄素营养状况比较核黄素营养状况例数合计秩次范围平均秩次夏季冬季缺乏10223213216.5不足141832336448.5适宜16420658474.5合计404484 7/23/202231建立检验假设,确定检验水准H0:夏冬两个季节居民体内核黄素含量的总体中位数相等H1:夏冬两个季节居民体内核黄素含量的总体中位数不相等 a=0.052. 计算检验统计量T值(1) 编秩:先确定各等级的合计、秩范围和平均秩(2) 求各组秩和(3) 确定检验统计量T值T1=16.510+48.514+74.516=2036T2=16.522+
14、48.518+74.54=1534T=T1=20367/23/2022323.确定P值,作出推断 本例n1=40,超出T界值表可查范围,用正态近似法。两独立样本的非参检验:Mann-Whitney U检验(SPSS)和Wilcoxon秩和检验是等价的。7/23/202233第三节 多组独立样本比较的秩和检验一、定量变量多组独立样本的秩和检验二、有序变量多组独立样本的秩和检验三、多个独立样本间的多重比较Kruskal-Wallis H检验7/23/202234一、定量变量多组独立样本的秩和检验例5:某医院用3种不同方法治疗15例胰腺癌患者,每种方法各治疗5例。治疗后生存月数见表,问这3种方法对胰
15、腺癌患者的疗效有无差别?表6 3种方法治疗胰腺癌患者的生存月数比较甲法乙法丙法生存月数秩次生存月数秩次生存月数秩次32.566214491232.577.5101355810121477.58101315810Ri346026ni5557/23/202235建立检验假设,确定检验水准H0:3种方法治疗后患者生存月数的中位数相等H1:3种方法治疗后患者生存月数的中位数不全相等 a=0.052.计算检验统计量H值(1) 编秩三组统一编秩,相同数据同一组,可顺次编秩;在不同组,求平均秩次。(2) 求各组秩和7/23/202236(3) 确定检验统计量H值:若相持较多(如超过25%),应计算校正值7/
16、23/2022373确定P值,做出推断(1)当组数k =3,ni5,可查附表11中的界值,H的临界值等于5.78,P0.05,拒绝H0,接受H1,故可认为3种方法治疗后胰腺癌患者的生存月数有差别。(2)当不满足条件(1)时,近似地服从自由度为k-1的c2分布,可查附表8的c2界值表得到P值。Kruskal-Wallis H检验的基本思想类似于单因素方差分析。相当于将秩次看做原始数据进行比较。7/23/202238二、有序变量多组独立样本的秩和检验例6:某医院用3种方法治疗慢性喉炎,结果见表7。问这3种方法的疗效是否有差别? 表7 3种方法治疗慢性喉炎的疗效比较疗效等级例数秩次范围平均秩次甲法乙
17、法丙法合计无效 2420206416432.5好转261622646512896.5显效722414110129238183.5治愈1863222240239478358.5合计30892784787/23/2022391. 建立检验假设,确定检验水准H0:3种方法疗效的总体分布位置相同H1:3种方法疗效的总体分布位置不全相同 a=0.052. 计算检验统计量H值(1) 编秩:先计算各等级的合计,再确定秩次范围及平均秩次。(2) 求各组秩和 如本例.7/23/202240疗效等级例数秩次范围平均秩次甲法乙法丙法合计无效2420206416432.5好转261622646512896.5显效72
18、2414110129238183.5治愈1863222240239478358.5合计3089278478表7 3种方法治疗慢性喉炎的疗效比较7/23/202241(3) 计算检验统计量H由于相持较多,故需校正。7/23/2022423确定P值并做出推断结论 k=3,各组例数均大于5,近似服从n=k-1=2的2分布。查2界值表,得P15或g15时,超出附表12的范围,可用c2近似法,按下式计算c2值。7/23/202252当各区组间相同的秩次较多时,须进行校正:式中t为各区组内第j个具有相同秩次的个数,n为配伍组数,g为处理组数。由于C1,故校正的c2对应的P值减小。在下列情况下校正的意义较大
19、:相同数据的个数在各配伍组中所占比重较大时;所得P值在检验水准附近时。7/23/202253(三) F近似法:当区组个数较多时,还可近似用秩转换的F检验1. 对每个区组数据由小到大分别编秩次,相同数据取平均秩次,得到每个数据的秩次Tng2. 计算各处理组的秩和Tg。3. 计算所有秩次的平方和A A=T2ij,或者A=ng(g+1)(2g+1)/64. 计算各处理组秩次平方和的均值B:B= (T2)ij5. 计算F值:6. 确定P值:以n1=g-1,n2=(g-1)(n-1)查方差分析用F界值表。7/23/202254二、随机区组多个样本两两比较的检验 (一) M检验后的两两比较当经过多个相关样
20、本比较的Friedman M检验拒绝H0,接受H1,认为多个总体分布位置不全相同时,若要进一步推断是哪两两总体分布位置不同,可用q检验。 7/23/202255(二) F检验后的两两比较计算处理组秩和Ti;计算各对比组秩和的差值绝对值|TA-TB|;计算在a检验水准下的界值Ca;确定概率P值:若|TA-TB|Ca,则Pa ;|TA-TB|a 。7/23/202256 小 结非参数检验在假设检验中不对参数作明确的推断,也不涉及样本取自何种分布的总体。它的适用范围较广。当资料适用参数检验方法时,用非参常会损失部分信息,降低检验效能。秩和检验是通过对数据依小到大排列秩次,求秩和来进行假设检验的方法,
21、可用于两独立样本比较、配对资料比较、多个独立样本比较、随机配伍组比较等。7/23/202257正确应用秩和检验方法 秩和检验既能分析定量变量资料,又能分析有序变量或等级变量资料,实际中要注意其应用条件。对于定量变量资料,如果符合参数检验方法的前提条件,要用参数统计方法,在不符合参数统计方法条件时,用秩和检验;对有序变量或等级变量资料,如果是疗效检验,用秩和检验,不用c2检验。7/23/202258已知总体分布类型,对未知参数进行统计推断依赖于特定分布类型,比较的是参数 参数检验 (parametric test)非参数检验(nonparametric test)对总体的分布类型不作严格要求 不
22、受分布类型的影响,比较的是总体分布位置 优点:方法简便、易学易用,易于推广使用、应用范围广;可用于参数检验难以处理的资料(如等级资料,或含数值“50mg”等 )缺点:方法比较粗糙,对于符合参数检验条件者,采用非参数检验会损失部分信息,其检验效能较低;样本含量较大时,两者结论常相同SummaryWilcoxon符号秩检验:单样本资料、配对设计两样本比 较 (T / Z值)Wilcoxon秩和检验:两组独立样本比较(T/ Z值)Kruskal-Wallis秩和检验:完全随机设计的多组样本比较 (H / c2 值)多个独立样本间的两两比较(t检验/ c2 值)Friedman秩和检验:随机区组设计资
23、料的多样本比较 (M / c2 值)7/23/202260不同研究设计和数据类型的数据分析方法选择 变量类型研究设计类型两组比较实验前后比较两组以上比较随机区组设计 数值变量 t检验配对t检验方差分析方差分析 分类变量 c2检验配对c2检验c2检验 有序变量Mann-Whitney秩和检验Wilcoxon符号秩和检验Kruskal-WallisH检验Friedman M检验c2检验F检验7/23/202261了解:不同设计类型的秩和检验和相应t检验的功效有何不同。熟悉:非参数统计的概念;不同设计类型的秩和检验方法。掌握:不同设计类型的秩和检验的实施方法及其应用条件。 教学要求7/23/202262练习7/23/202263单项选择:1以下检验方法除 外,其余均属非参数方法。A. t检验B. H检验C. M检验D. c2检验E. 符号秩和检验2两小样本定量资料比较的假设检验,首先应考虑 。A. 用t检验B. 用秩和检验 C. 资料符合t检验还是秩和检验的条件
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 地板酒类经销合同书
- 厂区配电工程施工合同
- 加工生产企业临时工劳动合同
- 云南省取用水领域信用评价评分表
- 把社区工作做深做细做到位
- 时尚设计师品牌与网红明星合作的营销策略研究
- 2024年其他零售服务项目资金申请报告代可行性研究报告
- 阳光心态成就幸福人生国旗下讲话稿范文(31篇)
- 植树节校园活动策划方案十五篇
- 购车指标转让协议(3篇)
- 采购、仓库流程图2课件
- 被执行人生活费申请书范文
- 第七单元“艺术之美”(主题阅读)六年级语文上册阅读理解(统编版)
- 肉牛养殖投资计划书
- 耐火砖砌筑方案
- 《作文写作与文化修养培养与发展》
- 污水处理厂安全生产培训资料课件
- 摄影测量专业职业生涯规划书
- 老年健康与医养结合服务管理
- 全国优质课一等奖人教版八年级生物上册《真菌》公开课课件(内嵌视频)
- 部编版一到六年级(12册)日积月累汇总
评论
0/150
提交评论