




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第九章基于秩次的非参数检验第九章基于秩次的非参数检验StatisticalInferencePointestimationParameterEstimationHypothesisTestParameterEstimationIntervalestimationReview——StatisticalInferenceNonparametricTestParametricTestt-TestZ-TestAnovaHypothesisTestNonparametricTest2GeheParametricTestStatisticalPointParameterEs15
40nT2检验校正2检验确切概率法四格表资料的假设检验n≥40,且T≥5n≥40,且1≤T<5n<40,或T<1应用条件:或R.A.Fisher(1934)15前面学习了连续型资料假设检验方法(t检验、方差分析):配对t检验、单样本t检验、两独立样本t检验、方差分析
如果各样本所来自总体的分布不清、已知不服从正态分布或经变量转换后仍不服从正态分布时,如何进行检验呢?
★需要一种不依赖于总体分布类型的检验方法,非参数检验方法-Nonparametrictest
。问题的提出:前面学习了连续型资料假设检验方法(t检验、方差分析):问题的掌握参数统计、非参数统计的概念;掌握非参数统计法的优缺点、适用范围;掌握各秩和检验的编秩原则与判断方法。了解秩和检验方法与参数检验方法的检验效能的差别。学习目标掌握参数统计、非参数统计的概念;学习目标主要内容第一节参数检验与非参数检验第二节单样本及配对设计资料的符号秩和检验第三节两独立样本比较的秩和检验第四节完全随机设计多组比较的秩和检验第五节多组相关样本资料比较的秩和检验主要内容第一节参数检验与非参数检验第一节
、参数检验与非参数检验
1、参数统计(parametrictest
)对于总体分布类型已知的资料,用相应于参数的统计量来估计参数所在范围或推断参数有无差别的统计方法。如t检验,F检验,Z检验等
2、非参数检验(nonparametrictest)对总体分布类型不作要求,而对总体的分布或分布位置进行检验。亦称任意分布检验(Distribution-freetest)。第一节、参数检验与非参数检验已知总体分布类型,对未知参数(μ、π)进行统计推断依赖于特定分布类型,比较的是参数
参数统计(parametricstatistics)
非参数统计(nonparametricstatistics)对总体的分布类型不作任何要求
不受总体参数的影响,比较分布或分布位置
适用范围广;可用于任何类型资料(等级资料,或“>50mg”)稳健性强,方法简单。非参数统计方法的优缺点统计量有明确的理论依据,有严格的使用条件已知总体分布类型,对未知参数(μ、π)进行统计推断依赖于特定非参数检验的缺点其检验效能较低仅是参数统计的95%。利用资料信息不充分。对于符合参数统计分析条件者,采用非参数统计分析。10、15、20秩和=620、50、80秩和=6非参数检验的缺点其检验效能较低仅是参数统计的95%。利用资料非参数统计方法具体适用范围
1、计量非正态资料2、极度偏态、分布类型不易确定的资料;3、等级分组资料;4、初筛的资料;※符合参数统计条件的首先应用参数统计方法※不符合参数统计条件的,经变量变化后符合参数统计条件了,应用参数统计方法
若不符合参数统计条件的,应用非参数统计方法.非参数统计方法具体适用范围第二节单样本和配对设计资料的符号秩和检验
(Wilcoxonsignedranktest)
适用资料
1、单样本资料2、配对的计量非正态资料第二节单样本和配对设计资料的符号秩和检验
一、单样本资料的符号秩和检验Wilcoxonsignedranktest一、单样本资料的符号秩和检验WilcoxonsignedFrankWilcoxon(1892-1965)FrankWilcoxon(1892-1965)尿铅含量xi差值di秩次尿铅含量xi差值d秩次0.62-1.88-12113.130.6370.782-1.72-103.270.7782.13-0.37-53.541.0492.48-0.02-14.381.8812122.540.0424.381.8812132.680.1835.052.55142.730.2346.083.58153.010.51611.278.7716表1某厂16名工人与当地正常人的尿铅含量比较例1已知某地正常人尿铅含量中位数为2.5μmol/L尿铅含量xi差值di秩次尿铅含量xi差值d秩次0.62-1.资料分析:对上表中的这些差值进行正态性检验,P≤0.05,因此不满足t检验关于样本来自正态分布的条件。该资料应该用非参数统计方法,在此选用Wilcoxon符号秩和检验。
秩次是将数值变量值从小到大,或等级变量值从弱到强所排列的序号
资料分析:基本思想求d将|d|按大小编秩求出正、负秩和如果两组结果相同H0正负d个数应相差不多正秩和与负秩和相差不大差数的总体中位数为0,即服从以0为中心的对称分布。基本思想求d将|d|按大小编秩求出正、负秩和如果两组结果相同1.检验假设,确定检验水准H0:差值的总体中位数等于零,即该工厂工人的尿铅含量与正常人相同H1:差值的总体中位数大于零,即该工厂工人的尿铅含量高于正常人α=0.05检验过程:
1.检验假设,确定检验水准检验过程:2、计算统计量(1)求差值di=xi-2.5(2)编秩:按差值的绝对值由小到大编秩,并按差值的正负给秩次加上正负号(a)编秩时,若差值为0,舍去不计,n-1;(b)若差值的绝对值相等,称为相持(tie),这时取平均秩次;(c)求秩和并确定统计量T分别求出正、负差值秩次之和,T+和T-.双侧时,以绝对值较小者为T值,即T=min(T+,T-);单侧检验时,任取T+或T-为统计量T2、计算统计量TLTUTTT≤TL或T≥TU,则P≤α,有统计学意义。认为两总体的分布不相同。TL<T<TU,则P>α,无统计学意义。认为两总体的分布相同。T3、确定P值和作出推断结论。(1)查表法,T界值表附表9(查P423),判断标准:“内大外等小”。内大:即若T在上下界值范围内,则P值大于相应的概率;外等小:若T在上下界值范围外(或等于界值),则P值小于(或等于)相应的概率.TLTUTTT≤TL或T≥TU,则P≤α,有统计学意义本例中,T0.05(16)=35-101,本例T=28在T0.05范围外,P<0.05,按所定检验水准,拒绝H0,认为该工厂工人尿氟含量高于当地正常人。
(2)正态近似法(n>50时)这时可利用秩和分布的正态近似法作出判断。已知H0成立时,近似地有本例中,T0.05(16)=35-101,本例T=28当相同差值较多(>25%)时,应进行校正式中tj为第j次相持所含相同秩次的个数。正态近似法:n>50时采用假定有2个差值为1.5,3个差值为6,5个差值为3,则有式中tj为第j次相持所含相同秩次的个数。正态近似法:n>50二、配对设计资料符号秩和检验(Wilcoxon配对法)
二、配对设计资料符号秩和检验(Wilcoxon配对法)
一、适用资料
自身对照、异体配对的计量非正态资料例2某医院检验科试用新旧两种方法检测谷-丙转氨酶,新方法的检测时间由20分钟缩短为10分钟。用两种方法检测同一份血清,结果见表1第(2)、(3)栏,问两法测得结果有无差别?一、适用资料
自身对照、异体配对的计量非正态资料表2两种方法测定血清谷-丙转氨酶(nmol/s/L)样品号旧法新法差值正差值秩次负差值秩次(1)(2)(3)(4)=(2)-(3)(5)(6)16080-2082142152-105.5632422402148090-105.5553850-1276212243-3197220227-74895100-52.5392362003610103843-52.52表2两种方法测定血清谷-丙转氨酶(nmol/s/L)样品二、检验步骤
1、建立假设H0:差值总体中位数Md=0H1:差值总体中位数Md≠
0
α=0.05
二、检验步骤
2、计算统计量T:(1)求差值(2)编秩编秩原则
①依差值绝对值大小,从小到大依次编秩,并冠以“+”或“-”号;②若差值相等,符号不同,求平均秩,再冠以+、-号;③若差值为零,去掉,对子数相应减少。(3)正负秩次分别求和,以T+和T-表示(4)双侧时,以绝对值较小者为T值,即T=min(T+,T-);单侧检验时,任取T+或T-为统计量。2、计算统计量T:3、确定P值,做出结论
(1)查表法:5≤n≤50时,查T界值表(p423)T0.05(10)=8-47,本例T=11,在T0.05范围内,,所以P>0.05,按所定检验水准,不拒绝H0,故尚不能认为两种方法测定血清中谷-丙转氨酶含量有差别。(2)正态近似法:n>50时3、确定P值,做出结论第三节完全随机设计两样本的秩和检验(Wilcoxon两样本比较法)适用资料:两定量非正态资料或两组有序分类(等级)资料。第三节完全随机设计两样本的秩和检验一、定量变量两组独立样本的秩和检验一、定量变量两组独立样本的秩和检验基本思想任一组秩和不应太大或太小假定H0成立
与平均理论秩和N(N+1)/4应相差不大混合编秩
分别计算两组的秩和
基本思想任一组秩和不应太大或太小假定H0成立与平均理论秩Wilcoxon秩和检验的基本思想总结假设两总体分布相同,两样本可认为是从同一总体中抽取的随机样本,将两样本混合后由小到大编秩,分别计算两组的秩和,两组的秩和应大小相等,若两组的秩和相差很大,我们就认为无效假设不成立。Wilcoxon秩和检验的基本思想总结假设两总体分布相同例3:两种药物杀灭钉螺,每批用200-300只活钉螺,用药后清点钉螺的死亡数,并计算死亡率(%),结果先表3,试比较两种药物杀灭钉螺的效果有无差别?例3:两种药物杀灭钉螺,每批用200-300只活钉螺,用药表3两种药物杀灭钉螺死亡率比较甲药乙药死亡率%秩次死亡率%秩次32.55.516.0135.5722.5240.51026.0340.51028.5449.01232.55.549.51338.0851.51440.510n1=7T1=71.5n2=7T2=33.5表3两种药物杀灭钉螺死亡率比较甲药乙药死亡率%秩次死亡率%秩和检验的基本思想14102311131214155678916秩和检验的基本思想141023111312141556789二、检验步骤1、建立假设H0:两种药物杀灭钉螺死亡率的总体中位数相等M1=M2H1:两种药物杀灭钉螺死亡率的总体中位数不相等M1≠M2α=0.05二、检验步骤2、计算统计量编秩原则(1)两组数据混合按升序编秩(2)如有相同数据在不同组时,求平均秩次。(3)两组数据分别求秩和(4)统计量的确定:n1≠n2,以n小者的秩和为统计量T
n1=n2,则以任一组秩和为统计量T
T1=71.5,T2=33.52、计算统计量3、确定P值,做出结论
(1)查表法:n1<=10,n2-n1<=10时(2)正态近似法:n1>10,n2-n1>10时
相同秩次较多时,计算出的Z值偏小,应进行校正3、确定P值,做出结论相同秩次较多时,计算出的Z值偏小,
本例n1=10,n2-n1=0查T表附表10,双侧P=0.05时,T界值范围是36—69,T0.01界值范围是32-73,而今统计量T=33.5,在T0.01界值范围外,故P<0.01。按α=0.05,拒绝H0,接受H1,可认为两种药物杀灭钉螺死亡率的总体死亡率不相等第九章基于秩次的非参数检验课件二、两独立样本比较的Mann-WhiteyU检验两独立样本比较还常用Mann-WhitneyU检验(Mann-WhitneyUtest)。检验统计量U定义为:两个样本分别排序后,把第一个样本的n1(n1≤n2)个变量中的每个值,与第二个样本的n2个变量值逐个比较,小于记1,相等记0.5,大于记0,求其和。当n1和n2小时,如n1+n2≤30,有专门的U界值表;二、两独立样本比较的Mann-WhiteyU检验两独当n1和n2大时,用正态近似法作检验。当n1和n2大时,用正态近似法作检验。三、有序变量两组独立样本的秩和检验两组等级资料的比较三、有序变量两组独立样本的秩和检验例4用某药治疗不同病情(单纯型和合并症型)的老年慢性支气管炎病人,疗效见表4第(2)、(3)栏,问该药对两种病情的疗效有无差别?例4用某药治疗不同病情(单纯型和合并症型)的老年慢性支气表4某药对支气管炎两种病情疗效的秩和检验疗效(1)单纯型(2)合并症型(3)合计(4)秩次范围(5)平均秩次(6)单纯型秩和(7)合并症型秩和(8)控制65421071~1075435102268显效18624108~131119.52151717有效302353132~18415847403634无效131124185~208196.52554.52161.5合计n2=126n1=82208T2=12955.5T1=8780.5表4某药对支气管炎两种病情疗效的秩和检验疗效单纯型合并症分析:以上数据为等级资料检验步骤、假设、定统计量方法、与两组资料的比较基本相同,只是编秩方法略有差别:(1)两组资料按等级求合计,定秩次范围(2)各等级求平均秩次与小组秩和(3)两组资料分别求秩和(4)判断方法同两组资料的比较方法。分析:检验步骤
1、建立假设
H0:两种病情病人的疗效总体分布位置相同H1:两种病情病人的疗效总体分布位置不同
α=0.05
2、计算统计量各组段的平均秩次分别与相应组段的例数相乘,得秩和。T1=8780.5T2=12955.5
检验步骤本例n1=82,
>10,用正态近似法:因本例相同秩次很多(超过25%),须按下式校正:C为校正数,tj为第j个相同秩次的个数。本例n1=82,>10,用正态近似法:第九章基于秩次的非参数检验课件3、确定P值,做出结论:查附表1,Z界值表(或查t界值表自由度为∞),Z0.05/2=1.96,故P>0.05。按α=0.05的检验水准,不拒绝H0,两种病情病人的疗效差异无统计学意义,尚不能认为该药对两种病情的疗效有差别。3、确定P值,做出结论:
第四节多组独立样本比较的秩和检验
(Kruskal-Wallis法)
WilliamKruskal
(1919-2005)W.AllenWallis
(1912-1998)第四节多组独立样本比较的秩和检验
(Kruskal-W
不满足方差分析条件的完全随机设计多组资料比较,采用Kruskal-Wallis(Kruskal-Wallis-H)秩和检验,相当于方差分析的非参数分析方法。此法的基本思想:如果各组处理效应相同,混合编秩号后,各组的秩和应近似相等。不满足方差分析条件的完全随机设计多组资料比较,采用Krus适用资料多组连续变量非正态分布资料多组有序(等级分组)资料。各组资料例数可以相等,也可以不等。适用资料多组连续变量非正态分布资料一、多组独立样本比较的Kruskal-WallisH检验一、多组独立样本比较的Kruskal-WallisH检验例5某医院用三种不同方法治疗15例肝癌患者,每种方法各治疗5例。治疗后生存月数见表5第(1)、(3)、(5)栏,问这三种方法对肝癌患者的疗效有无差别?例5某医院用三种不同方法治疗15例肝癌患者,每种方法各治疗5表5三种方法治疗肝癌患者的生存月数比较表5三种方法治疗肝癌患者的生存月数比较检验步骤1、建立假设H0:三种方法疗效的总体分布位置相同H1:三种方法疗效的总体分布位置不全相同α=0.052、计算统计量
(1)编秩◆各组资料混合按升序编秩
◆相同数据在不同组时,求平均秩次(2)各组分别求秩和检验步骤(3)计算统计量本例对H的校正:
当各样本相同秩次较多时(如超过25%),按上式计算的H值偏小,应对其进行校正。
Hc=H/C
tj为相同秩次的个数(3)计算统计量对H的校正:tj为相同秩次的个数3、确定P值,作出推断结论(1)若组数k=3,且每组例数ni≤5时,查H界值表,判断:H越大,P越小。(2)若K>3,各ni>5,查附表8,P4822界值表。此时,H近似服从υ=k-1的2分布,判断:H越大,P越小。本例中,各组例数均=5,H近似服从H分布,查得H界值为5.78,得P<0.05。按α=0.05水准拒绝H0,接受H1,可认为三种方法疗效的生存月数有差别。3、确定P值,作出推断结论例6某研究者欲研究A、B两种菌对小鼠巨噬细胞吞噬功能的激活作用,将59只小鼠随机分为三组,其中一组为生理盐水对照组,用常规巨噬细胞吞噬功能的监测方法,获得三组的吞噬率(%),结果见表6,试比较不同实验条件下小鼠巨噬细胞的吞噬率有无差别?例6某研究者欲研究A、B两种菌对小鼠巨噬细胞吞噬功能表6不同菌种对小鼠巨噬细胞的吞噬率(%)A菌组(1)B菌组(2)对照组(3)吞噬率秩次吞噬率秩次吞噬率秩次46145217471556215318325572254195823592455204916612660254411643162282436533622818165336228378653363304512.56736.569403786736.570413786736.571452546736.5714519268397145378714572494512.5714588543787145905571459256Ri924701145ni241916表6不同菌种对小鼠巨噬细胞的吞噬率(%)A菌组(1)B菌二、检验步骤1、建立假设H0:三组吞噬细胞总体分布相同H1:三组吞噬细胞总体分布不全相同α=0.052、计算统计量
(1)编秩
各组资料混合按升序编秩相同数据在不同组时,求平均秩次(2)各组分别求秩和二、检验步骤(3)计算统计量
本例(3)计算统计量对H的校正:当各样本相同秩次较多时(如超过25%),按上式计算的H值偏小,应对其进行校正。
Hc=H/C
tj为相同秩次的个数对H的校正:3、确定P值,作出推断结论
(1)若组数k=3,且每组例数ni≤5时,查H界值表,判断H越大,P越小。(2)若K>3,各ni>5,查2界值表此时,H近似服从υ=k-1的2分布,判断H越大,P越小。本例中,各组例数均>5,H近似服从2分布,υ=k-1=3-1=2,查2界值表,得P<0.005。按α=0.05水准拒绝H0,接受H1,三组菌种对小鼠巨噬细胞的吞噬率差别有统计意义,可以认为不同菌种对小鼠巨噬细胞的吞噬率的作用不同。3、确定P值,作出推断结论Thankyou!Thankyou!二、有序变量多组独立样本的秩和检验
多组等级资料的比较二、有序变量多组独立样本的秩和检验
多组等级资料的比较方法:(1)按不同等级分组,定秩次范围(2)各等级求平均秩次与小组秩和(3)多组资料分别求秩和(4)判断方法同多组资料的比较方法方法:(1)按不同等级分组,定秩次范围五种病人阴道涂片按巴氏细胞学分级的检查结果,见表7第(1)~(6)栏,问五种病人的细胞学分级有无程度上的差别?五种病人阴道涂片按巴氏细胞学分级的检查结果,见表7第(1)~表7五种病人阴道涂片的细胞学分级比较巴氏分级(1)慢性炎症(2)轻度增生(3)重度增生(4)原位癌(5)浸润癌(6)合计(7)秩次范围(8)平均秩次(9)Ⅰ2119000401~4020.5Ⅱ4441305241~9266.5Ⅲ00611314893~140116.5Ⅳ023154262141~202171.5Ⅴ000217798203~300251.5ni25255050150300-
-
Ri696.5998.53940933530180-
-
-
平均Ri27.939.978.8186.7201.2-
-
-
表7五种病人阴道涂片的细胞学分级比较巴氏分级慢性炎症(21.建立假设,确定检验水准H0:五种病人细胞学分级的总体分布位置相同H1:五个总体的位置不同或不全相同
α=0.051.建立假设,确定检验水准2.计算检验统计量H值(1)编秩:在编秩时,先按组段计算各等级的合计人数,由此确定各组段秩次范围,然后计算出各组段的平均秩次。相同等级的个体属于相持(2)求秩和:以各组段的平均秩次分别与各等级例数相乘,再求和得到。
2.计算检验统计量H值(3)计算检验统计量H值
每个等级的人数表示相持的个数,相持过多,需计算Hc值(3)计算检验统计量H值3.确定P值,做出推断结论k=3,各组n>5,由v=3-2=1查χ2界值P<0.005,拒绝H0,认为3种方法疗法治疗慢性咽炎的效果有差别3.确定P值,做出推断结论三、多个样本间的多重比较(Nemenyi法)三、多个样本间的多重比较(Nemenyi法)
当P≤α时,拒绝H0,接受H1,认为各总体分布不同或不全相同,需要做两两比较,以推断哪两个总体分布不同完全随机设计多个样本间的多重比较方法以上例资料为例比较步骤如下:1、建立假设,确定检验水准H0:任两个总体分布相同H1:任两个总体的分布不同α=0.052、求统计量t当P≤α时,拒绝H0,接受H1,认为各总体分布不同或不全其中分别为两对比组的平均秩次,ni,nj为对比组的样本含量,k为处理组数,N为各组样本量之和,分母为的标准误(1)求各组的平均秩和甲组乙组丙组其中分别为两对比组的平均秩次,ni,nj为对比组(2)列出两两比较表表三组样本秩和的两两比较对比组(1)ni(2)nj(3)(4)t(4)P(5)甲组与乙组3089273.664.742<0.001甲组与丙组30878100.476.062<0.001乙组与丙组927826.811.3220.1<p<0.23、确定p值,做出推断以v=总例数-处理组数,查t界值表,做出推断本例v=478-3=475查t界值表,得p如上表
甲组与乙组疗效有差别,乙组与丙组疗效无差别(2)列出两两比较表对比组ninjtP甲第九章基于秩次的非参数检验课件
小结
1.非参数检验在假设检验中不对参数作明确的推断,也不涉及样本取自何种分布的总体。它的适用范围较广。常用的非参方法较为简便。易于理解掌握。当资料适用参数检验方法时,用非参常会损失部分信息,降低检验效能。2.秩和检验是通过对数据依小到大排列秩次,求秩和来进行假设检验的方法,可用于两独立样本比较、配对资料比较、多个独立样本比较、随机配伍组比较等。小结1.非参数检验在假设检Thankyou!Thankyou!第九章基于秩次的非参数检验第九章基于秩次的非参数检验StatisticalInferencePointestimationParameterEstimationHypothesisTestParameterEstimationIntervalestimationReview——StatisticalInferenceNonparametricTestParametricTestt-TestZ-TestAnovaHypothesisTestNonparametricTest2GeheParametricTestStatisticalPointParameterEs15
40nT2检验校正2检验确切概率法四格表资料的假设检验n≥40,且T≥5n≥40,且1≤T<5n<40,或T<1应用条件:或R.A.Fisher(1934)15前面学习了连续型资料假设检验方法(t检验、方差分析):配对t检验、单样本t检验、两独立样本t检验、方差分析
如果各样本所来自总体的分布不清、已知不服从正态分布或经变量转换后仍不服从正态分布时,如何进行检验呢?
★需要一种不依赖于总体分布类型的检验方法,非参数检验方法-Nonparametrictest
。问题的提出:前面学习了连续型资料假设检验方法(t检验、方差分析):问题的掌握参数统计、非参数统计的概念;掌握非参数统计法的优缺点、适用范围;掌握各秩和检验的编秩原则与判断方法。了解秩和检验方法与参数检验方法的检验效能的差别。学习目标掌握参数统计、非参数统计的概念;学习目标主要内容第一节参数检验与非参数检验第二节单样本及配对设计资料的符号秩和检验第三节两独立样本比较的秩和检验第四节完全随机设计多组比较的秩和检验第五节多组相关样本资料比较的秩和检验主要内容第一节参数检验与非参数检验第一节
、参数检验与非参数检验
1、参数统计(parametrictest
)对于总体分布类型已知的资料,用相应于参数的统计量来估计参数所在范围或推断参数有无差别的统计方法。如t检验,F检验,Z检验等
2、非参数检验(nonparametrictest)对总体分布类型不作要求,而对总体的分布或分布位置进行检验。亦称任意分布检验(Distribution-freetest)。第一节、参数检验与非参数检验已知总体分布类型,对未知参数(μ、π)进行统计推断依赖于特定分布类型,比较的是参数
参数统计(parametricstatistics)
非参数统计(nonparametricstatistics)对总体的分布类型不作任何要求
不受总体参数的影响,比较分布或分布位置
适用范围广;可用于任何类型资料(等级资料,或“>50mg”)稳健性强,方法简单。非参数统计方法的优缺点统计量有明确的理论依据,有严格的使用条件已知总体分布类型,对未知参数(μ、π)进行统计推断依赖于特定非参数检验的缺点其检验效能较低仅是参数统计的95%。利用资料信息不充分。对于符合参数统计分析条件者,采用非参数统计分析。10、15、20秩和=620、50、80秩和=6非参数检验的缺点其检验效能较低仅是参数统计的95%。利用资料非参数统计方法具体适用范围
1、计量非正态资料2、极度偏态、分布类型不易确定的资料;3、等级分组资料;4、初筛的资料;※符合参数统计条件的首先应用参数统计方法※不符合参数统计条件的,经变量变化后符合参数统计条件了,应用参数统计方法
若不符合参数统计条件的,应用非参数统计方法.非参数统计方法具体适用范围第二节单样本和配对设计资料的符号秩和检验
(Wilcoxonsignedranktest)
适用资料
1、单样本资料2、配对的计量非正态资料第二节单样本和配对设计资料的符号秩和检验
一、单样本资料的符号秩和检验Wilcoxonsignedranktest一、单样本资料的符号秩和检验WilcoxonsignedFrankWilcoxon(1892-1965)FrankWilcoxon(1892-1965)尿铅含量xi差值di秩次尿铅含量xi差值d秩次0.62-1.88-12113.130.6370.782-1.72-103.270.7782.13-0.37-53.541.0492.48-0.02-14.381.8812122.540.0424.381.8812132.680.1835.052.55142.730.2346.083.58153.010.51611.278.7716表1某厂16名工人与当地正常人的尿铅含量比较例1已知某地正常人尿铅含量中位数为2.5μmol/L尿铅含量xi差值di秩次尿铅含量xi差值d秩次0.62-1.资料分析:对上表中的这些差值进行正态性检验,P≤0.05,因此不满足t检验关于样本来自正态分布的条件。该资料应该用非参数统计方法,在此选用Wilcoxon符号秩和检验。
秩次是将数值变量值从小到大,或等级变量值从弱到强所排列的序号
资料分析:基本思想求d将|d|按大小编秩求出正、负秩和如果两组结果相同H0正负d个数应相差不多正秩和与负秩和相差不大差数的总体中位数为0,即服从以0为中心的对称分布。基本思想求d将|d|按大小编秩求出正、负秩和如果两组结果相同1.检验假设,确定检验水准H0:差值的总体中位数等于零,即该工厂工人的尿铅含量与正常人相同H1:差值的总体中位数大于零,即该工厂工人的尿铅含量高于正常人α=0.05检验过程:
1.检验假设,确定检验水准检验过程:2、计算统计量(1)求差值di=xi-2.5(2)编秩:按差值的绝对值由小到大编秩,并按差值的正负给秩次加上正负号(a)编秩时,若差值为0,舍去不计,n-1;(b)若差值的绝对值相等,称为相持(tie),这时取平均秩次;(c)求秩和并确定统计量T分别求出正、负差值秩次之和,T+和T-.双侧时,以绝对值较小者为T值,即T=min(T+,T-);单侧检验时,任取T+或T-为统计量T2、计算统计量TLTUTTT≤TL或T≥TU,则P≤α,有统计学意义。认为两总体的分布不相同。TL<T<TU,则P>α,无统计学意义。认为两总体的分布相同。T3、确定P值和作出推断结论。(1)查表法,T界值表附表9(查P423),判断标准:“内大外等小”。内大:即若T在上下界值范围内,则P值大于相应的概率;外等小:若T在上下界值范围外(或等于界值),则P值小于(或等于)相应的概率.TLTUTTT≤TL或T≥TU,则P≤α,有统计学意义本例中,T0.05(16)=35-101,本例T=28在T0.05范围外,P<0.05,按所定检验水准,拒绝H0,认为该工厂工人尿氟含量高于当地正常人。
(2)正态近似法(n>50时)这时可利用秩和分布的正态近似法作出判断。已知H0成立时,近似地有本例中,T0.05(16)=35-101,本例T=28当相同差值较多(>25%)时,应进行校正式中tj为第j次相持所含相同秩次的个数。正态近似法:n>50时采用假定有2个差值为1.5,3个差值为6,5个差值为3,则有式中tj为第j次相持所含相同秩次的个数。正态近似法:n>50二、配对设计资料符号秩和检验(Wilcoxon配对法)
二、配对设计资料符号秩和检验(Wilcoxon配对法)
一、适用资料
自身对照、异体配对的计量非正态资料例2某医院检验科试用新旧两种方法检测谷-丙转氨酶,新方法的检测时间由20分钟缩短为10分钟。用两种方法检测同一份血清,结果见表1第(2)、(3)栏,问两法测得结果有无差别?一、适用资料
自身对照、异体配对的计量非正态资料表2两种方法测定血清谷-丙转氨酶(nmol/s/L)样品号旧法新法差值正差值秩次负差值秩次(1)(2)(3)(4)=(2)-(3)(5)(6)16080-2082142152-105.5632422402148090-105.5553850-1276212243-3197220227-74895100-52.5392362003610103843-52.52表2两种方法测定血清谷-丙转氨酶(nmol/s/L)样品二、检验步骤
1、建立假设H0:差值总体中位数Md=0H1:差值总体中位数Md≠
0
α=0.05
二、检验步骤
2、计算统计量T:(1)求差值(2)编秩编秩原则
①依差值绝对值大小,从小到大依次编秩,并冠以“+”或“-”号;②若差值相等,符号不同,求平均秩,再冠以+、-号;③若差值为零,去掉,对子数相应减少。(3)正负秩次分别求和,以T+和T-表示(4)双侧时,以绝对值较小者为T值,即T=min(T+,T-);单侧检验时,任取T+或T-为统计量。2、计算统计量T:3、确定P值,做出结论
(1)查表法:5≤n≤50时,查T界值表(p423)T0.05(10)=8-47,本例T=11,在T0.05范围内,,所以P>0.05,按所定检验水准,不拒绝H0,故尚不能认为两种方法测定血清中谷-丙转氨酶含量有差别。(2)正态近似法:n>50时3、确定P值,做出结论第三节完全随机设计两样本的秩和检验(Wilcoxon两样本比较法)适用资料:两定量非正态资料或两组有序分类(等级)资料。第三节完全随机设计两样本的秩和检验一、定量变量两组独立样本的秩和检验一、定量变量两组独立样本的秩和检验基本思想任一组秩和不应太大或太小假定H0成立
与平均理论秩和N(N+1)/4应相差不大混合编秩
分别计算两组的秩和
基本思想任一组秩和不应太大或太小假定H0成立与平均理论秩Wilcoxon秩和检验的基本思想总结假设两总体分布相同,两样本可认为是从同一总体中抽取的随机样本,将两样本混合后由小到大编秩,分别计算两组的秩和,两组的秩和应大小相等,若两组的秩和相差很大,我们就认为无效假设不成立。Wilcoxon秩和检验的基本思想总结假设两总体分布相同例3:两种药物杀灭钉螺,每批用200-300只活钉螺,用药后清点钉螺的死亡数,并计算死亡率(%),结果先表3,试比较两种药物杀灭钉螺的效果有无差别?例3:两种药物杀灭钉螺,每批用200-300只活钉螺,用药表3两种药物杀灭钉螺死亡率比较甲药乙药死亡率%秩次死亡率%秩次32.55.516.0135.5722.5240.51026.0340.51028.5449.01232.55.549.51338.0851.51440.510n1=7T1=71.5n2=7T2=33.5表3两种药物杀灭钉螺死亡率比较甲药乙药死亡率%秩次死亡率%秩和检验的基本思想14102311131214155678916秩和检验的基本思想141023111312141556789二、检验步骤1、建立假设H0:两种药物杀灭钉螺死亡率的总体中位数相等M1=M2H1:两种药物杀灭钉螺死亡率的总体中位数不相等M1≠M2α=0.05二、检验步骤2、计算统计量编秩原则(1)两组数据混合按升序编秩(2)如有相同数据在不同组时,求平均秩次。(3)两组数据分别求秩和(4)统计量的确定:n1≠n2,以n小者的秩和为统计量T
n1=n2,则以任一组秩和为统计量T
T1=71.5,T2=33.52、计算统计量3、确定P值,做出结论
(1)查表法:n1<=10,n2-n1<=10时(2)正态近似法:n1>10,n2-n1>10时
相同秩次较多时,计算出的Z值偏小,应进行校正3、确定P值,做出结论相同秩次较多时,计算出的Z值偏小,
本例n1=10,n2-n1=0查T表附表10,双侧P=0.05时,T界值范围是36—69,T0.01界值范围是32-73,而今统计量T=33.5,在T0.01界值范围外,故P<0.01。按α=0.05,拒绝H0,接受H1,可认为两种药物杀灭钉螺死亡率的总体死亡率不相等第九章基于秩次的非参数检验课件二、两独立样本比较的Mann-WhiteyU检验两独立样本比较还常用Mann-WhitneyU检验(Mann-WhitneyUtest)。检验统计量U定义为:两个样本分别排序后,把第一个样本的n1(n1≤n2)个变量中的每个值,与第二个样本的n2个变量值逐个比较,小于记1,相等记0.5,大于记0,求其和。当n1和n2小时,如n1+n2≤30,有专门的U界值表;二、两独立样本比较的Mann-WhiteyU检验两独当n1和n2大时,用正态近似法作检验。当n1和n2大时,用正态近似法作检验。三、有序变量两组独立样本的秩和检验两组等级资料的比较三、有序变量两组独立样本的秩和检验例4用某药治疗不同病情(单纯型和合并症型)的老年慢性支气管炎病人,疗效见表4第(2)、(3)栏,问该药对两种病情的疗效有无差别?例4用某药治疗不同病情(单纯型和合并症型)的老年慢性支气表4某药对支气管炎两种病情疗效的秩和检验疗效(1)单纯型(2)合并症型(3)合计(4)秩次范围(5)平均秩次(6)单纯型秩和(7)合并症型秩和(8)控制65421071~1075435102268显效18624108~131119.52151717有效302353132~18415847403634无效131124185~208196.52554.52161.5合计n2=126n1=82208T2=12955.5T1=8780.5表4某药对支气管炎两种病情疗效的秩和检验疗效单纯型合并症分析:以上数据为等级资料检验步骤、假设、定统计量方法、与两组资料的比较基本相同,只是编秩方法略有差别:(1)两组资料按等级求合计,定秩次范围(2)各等级求平均秩次与小组秩和(3)两组资料分别求秩和(4)判断方法同两组资料的比较方法。分析:检验步骤
1、建立假设
H0:两种病情病人的疗效总体分布位置相同H1:两种病情病人的疗效总体分布位置不同
α=0.05
2、计算统计量各组段的平均秩次分别与相应组段的例数相乘,得秩和。T1=8780.5T2=12955.5
检验步骤本例n1=82,
>10,用正态近似法:因本例相同秩次很多(超过25%),须按下式校正:C为校正数,tj为第j个相同秩次的个数。本例n1=82,>10,用正态近似法:第九章基于秩次的非参数检验课件3、确定P值,做出结论:查附表1,Z界值表(或查t界值表自由度为∞),Z0.05/2=1.96,故P>0.05。按α=0.05的检验水准,不拒绝H0,两种病情病人的疗效差异无统计学意义,尚不能认为该药对两种病情的疗效有差别。3、确定P值,做出结论:
第四节多组独立样本比较的秩和检验
(Kruskal-Wallis法)
WilliamKruskal
(1919-2005)W.AllenWallis
(1912-1998)第四节多组独立样本比较的秩和检验
(Kruskal-W
不满足方差分析条件的完全随机设计多组资料比较,采用Kruskal-Wallis(Kruskal-Wallis-H)秩和检验,相当于方差分析的非参数分析方法。此法的基本思想:如果各组处理效应相同,混合编秩号后,各组的秩和应近似相等。不满足方差分析条件的完全随机设计多组资料比较,采用Krus适用资料多组连续变量非正态分布资料多组有序(等级分组)资料。各组资料例数可以相等,也可以不等。适用资料多组连续变量非正态分布资料一、多组独立样本比较的Kruskal-WallisH检验一、多组独立样本比较的Kruskal-WallisH检验例5某医院用三种不同方法治疗15例肝癌患者,每种方法各治疗5例。治疗后生存月数见表5第(1)、(3)、(5)栏,问这三种方法对肝癌患者的疗效有无差别?例5某医院用三种不同方法治疗15例肝癌患者,每种方法各治疗5表5三种方法治疗肝癌患者的生存月数比较表5三种方法治疗肝癌患者的生存月数比较检验步骤1、建立假设H0:三种方法疗效的总体分布位置相同H1:三种方法疗效的总体分布位置不全相同α=0.052、计算统计量
(1)编秩◆各组资料混合按升序编秩
◆相同数据在不同组时,求平均秩次(2)各组分别求秩和检验步骤(3)计算统计量本例对H的校正:
当各样本相同秩次较多时(如超过25%),按上式计算的H值偏小,应对其进行校正。
Hc=H/C
tj为相同秩次的个数(3)计算统计量对H的校正:tj为相同秩次的个数3、确定P值,作出推断结论(1)若组数k=3,且每组例数ni≤5时,查H界值表,判断:H越大,P越小。(2)若K>3,各ni>5,查附表8,P4822界值表。此时,H近似服从υ=k-1的2分布,判断:H越大,P越小。本例中,各组例数均=5,H近似服从H分布,查得H界值为5.78,得P<0.05。按α=0.05水准拒绝H0,接受H1,可认为三种方法疗效的生存月数有差别。3、确定P值,作出推断结论例6某研究者欲研究A、B两种菌对小鼠巨噬细胞吞噬功能的激活作用,将59只小鼠随机分为三组,其中一组为生理盐水对照组,用常规巨噬细胞吞噬功能的监测方法,获得三组的吞噬率(%),结果见表6,试比较不同实验条件下小鼠巨噬细胞的吞噬率有无差别?例6某研究者欲研究A、B两种菌对小鼠巨噬细胞吞噬功能表6不同菌种对小鼠巨噬细胞的吞噬率(%)A菌组(1)B菌组(2)对照组(3)吞噬率秩次吞噬率秩次吞噬率秩次46145217471556215318325572254195823592455204916612660254411643162282436533622818165336228378653363304512.56736.569403786736.570413786736.571452546736.5714519268397145378714572494512.5714588543787145905571459256Ri924701145ni241916表6不同菌种对小鼠巨噬细胞的吞噬率(%)A菌组(1)B菌二、检验步骤1、建立假设H0:三组吞噬细胞总体分布相同H1:三组吞噬细胞总体分布不全相同α=0.052、计算统计量
(1)编秩
各组资料混合按升序编秩相同数据在不同组时,求平均秩次(2)各组分别求秩和二、检验步骤(3)计算统计量
本例(3)计算统计量对H的校正:当各样本相同秩次较多时(如超过25%),按上式计算的H值偏小,应对其进行校正。
Hc=H/C
tj为相同秩次的个数对H的校正:3、确定P值,作出推断
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度建筑工人劳动合同(附创新技术培训内容)
- 二零二五年度国际酒店餐饮业劳务供应协议
- 二零二五年度生活垃圾清运与环保技术研发应用合同
- 电子商务平台代运营服务协议
- 采购合同辣椒采购合同
- 音乐课本中的歌曲背后的故事征文
- 专业保洁服务合作协议
- 简爱人物形象塑造分析:世界名著导读课程教案
- 人力资源招聘与培训流程说明
- 企业绿色信用修复服务协议
- 2024入赘协议书范本
- 2024届江苏省苏北七市(南通)高三二模考试英语试题读后续写思路分析My best examination 讲义
- 2024年益阳医学高等专科学校单招职业技能测试题库及答案解析
- 《新能源发电技术第2版》 课件全套 朱永强 第1-10章 能源概述- 分布式发电与能源互补
- 【音乐】缤纷舞曲-青年友谊圆舞曲课件 2023-2024学年人音版初中音乐七年级上册
- DB-T29-260-2019天津市建筑物移动通信基础设施建设标准
- 水利工程施工方案(完整版)
- DB11-T 1200-2023 超长大体积混凝土结构跳仓法技术规程
- 2024年内蒙古化工职业学院高职单招(英语/数学/语文)笔试历年参考题库含答案解析
- 城市智慧交通管理系统
- 青少年人工智能技术水平测试一级04
评论
0/150
提交评论