第九章 基于秩次的非参数检验课件_第1页
第九章 基于秩次的非参数检验课件_第2页
第九章 基于秩次的非参数检验课件_第3页
第九章 基于秩次的非参数检验课件_第4页
第九章 基于秩次的非参数检验课件_第5页
已阅读5页,还剩72页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第九章基于秩次的非参数检验第九章基于秩次的非参数检验StatisticalInferencePointestimationParameterEstimationHypothesisTestParameterEstimationIntervalestimationReview——StatisticalInferenceNonparametricTestParametricTestt-TestZ-TestAnovaHypothesisTestNonparametricTest

2GeheParametricTest第九章基于秩次的非参数检验15

40nT

2检验校正

2检验确切概率法四格表资料的假设检验n≥40,且T≥5n≥40,且1≤T<5n<40,或T<1应用条件:或R.A.Fisher(1934)第九章基于秩次的非参数检验前面学习了连续型资料假设检验方法(t检验、方差分析):配对t检验、单样本t检验、两独立样本t检验、方差分析

如果各样本所来自总体的分布不清、已知不服从正态分布或经变量转换后仍不服从正态分布时,如何进行检验呢?

★需要一种不依赖于总体分布类型的检验方法,非参数检验方法-Nonparametrictest

。问题的提出:第九章基于秩次的非参数检验掌握参数统计、非参数统计的概念;掌握非参数统计法的优缺点、适用范围;掌握各秩和检验的编秩原则与判断方法。了解秩和检验方法与参数检验方法的检验效能的差别。学习目标第九章基于秩次的非参数检验主要内容第一节参数检验与非参数检验第二节单样本及配对设计资料的符号秩和检验第三节两独立样本比较的秩和检验第四节完全随机设计多组比较的秩和检验第五节多组相关样本资料比较的秩和检验第九章基于秩次的非参数检验第一节

、参数检验与非参数检验

1、参数统计(parametrictest

)对于总体分布类型已知的资料,用相应于参数的统计量来估计参数所在范围或推断参数有无差别的统计方法。如t检验,F检验,Z检验等

2、非参数检验(nonparametrictest)对总体分布类型不作要求,而对总体的分布或分布位置进行检验。亦称任意分布检验(Distribution-freetest)。第九章基于秩次的非参数检验已知总体分布类型,对未知参数(μ、π)进行统计推断依赖于特定分布类型,比较的是参数

参数统计(parametricstatistics)

非参数统计(nonparametricstatistics)对总体的分布类型不作任何要求

不受总体参数的影响,比较分布或分布位置

适用范围广;可用于任何类型资料(等级资料,或“>50mg”)稳健性强,方法简单。非参数统计方法的优缺点统计量有明确的理论依据,有严格的使用条件第九章基于秩次的非参数检验非参数检验的缺点其检验效能较低仅是参数统计的95%。利用资料信息不充分。对于符合参数统计分析条件者,采用非参数统计分析。10、15、20秩和=620、50、80秩和=6第九章基于秩次的非参数检验非参数统计方法具体适用范围

1、计量非正态资料

2、极度偏态、分布类型不易确定的资料;

3、等级分组资料;

4、初筛的资料;※符合参数统计条件的首先应用参数统计方法※不符合参数统计条件的,经变量变化后符合参数统计条件了,应用参数统计方法

若不符合参数统计条件的,应用非参数统计方法.第九章基于秩次的非参数检验第二节单样本和配对设计资料的符号秩和检验

(Wilcoxonsignedranktest)

适用资料

1、单样本资料

2、配对的计量非正态资料第九章基于秩次的非参数检验一、单样本资料的符号秩和检验Wilcoxonsignedranktest第九章基于秩次的非参数检验FrankWilcoxon(1892-1965)第九章基于秩次的非参数检验尿铅含量xi差值di秩次尿铅含量xi差值d秩次0.62-1.88-12113.130.6370.782-1.72-103.270.7782.13-0.37-53.541.0492.48-0.02-14.381.8812122.540.0424.381.8812132.680.1835.052.55142.730.2346.083.58153.010.51611.278.7716表1某厂16名工人与当地正常人的尿铅含量比较例1已知某地正常人尿铅含量中位数为2.5μmol/L第九章基于秩次的非参数检验资料分析:对上表中的这些差值进行正态性检验,P≤0.05,因此不满足t检验关于样本来自正态分布的条件。该资料应该用非参数统计方法,在此选用Wilcoxon符号秩和检验。

秩次是将数值变量值从小到大,或等级变量值从弱到强所排列的序号

第九章基于秩次的非参数检验基本思想求d将|d|按大小编秩求出正、负秩和如果两组结果相同H0正负d个数应相差不多正秩和与负秩和相差不大差数的总体中位数为0,即服从以0为中心的对称分布。第九章基于秩次的非参数检验1.检验假设,确定检验水准H0:差值的总体中位数等于零,即该工厂工人的尿铅含量与正常人相同H1:差值的总体中位数大于零,即该工厂工人的尿铅含量高于正常人α=0.05检验过程:

第九章基于秩次的非参数检验2、计算统计量(1)求差值di=xi-2.5(2)编秩:按差值的绝对值由小到大编秩,并按差值的正负给秩次加上正负号(a)编秩时,若差值为0,舍去不计,n-1;(b)若差值的绝对值相等,称为相持(tie),这时取平均秩次;(c)求秩和并确定统计量T分别求出正、负差值秩次之和,T+和T-.双侧时,以绝对值较小者为T值,即T=min(T+,T-);单侧检验时,任取T+或T-为统计量T第九章基于秩次的非参数检验TLTUTTT≤TL

或T≥TU,则P≤α,有统计学意义。认为两总体的分布不相同。TL<T<TU,则P>α,无统计学意义。认为两总体的分布相同。T3、确定P值和作出推断结论。(1)查表法,T界值表附表9(查P423),判断标准:“内大外等小”。内大:即若T在上下界值范围内,则P值大于相应的概率;外等小:若T在上下界值范围外(或等于界值),则P值小于(或等于)相应的概率.第九章基于秩次的非参数检验本例中,T0.05(16)=35-101,本例T=28在T0.05范围外,P<0.05,按所定检验水准,拒绝H0,认为该工厂工人尿氟含量高于当地正常人。

(2)正态近似法(n>50时)这时可利用秩和分布的正态近似法作出判断。已知H0成立时,近似地有第九章基于秩次的非参数检验当相同差值较多(>25%)时,应进行校正式中tj为第j次相持所含相同秩次的个数。正态近似法:n>50时采用假定有2个差值为1.5,3个差值为6,5个差值为3,则有第九章基于秩次的非参数检验二、配对设计资料符号秩和检验(Wilcoxon配对法)

第九章基于秩次的非参数检验一、适用资料

自身对照、异体配对的计量非正态资料例2某医院检验科试用新旧两种方法检测谷-丙转氨酶,新方法的检测时间由20分钟缩短为10分钟。用两种方法检测同一份血清,结果见表1第(2)、(3)栏,问两法测得结果有无差别?表2两种方法测定血清谷-丙转氨酶(nmol/s/L)样品号旧法新法差值正差值秩次负差值秩次(1)(2)(3)(4)=(2)-(3)(5)(6)16080-2082142152-105.5632422402148090-105.5553850-1276212243-3197220227-74895100-52.5392362003610103843-52.52第九章基于秩次的非参数检验二、检验步骤

1、建立假设

H0:差值总体中位数Md=0H1:差值总体中位数Md≠

0

α=0.05

第九章基于秩次的非参数检验

2、计算统计量T:(1)求差值(2)编秩编秩原则

①依差值绝对值大小,从小到大依次编秩,并冠以“+”或“-”

号;②若差值相等,符号不同,求平均秩,再冠以+、-号;③若差值为零,去掉,对子数相应减少。(3)正负秩次分别求和,以T+和T-表示(4)双侧时,以绝对值较小者为T值,即T=min(T+,T-);单侧检验时,任取T+或T-为统计量。第九章基于秩次的非参数检验3、确定P值,做出结论

(1)查表法:5≤n≤50时,查T界值表(p423)T0.05(10)=8-47,本例T=11,在T0.05范围内,,所以P>0.05,按所定检验水准,不拒绝H0,故尚不能认为两种方法测定血清中谷-丙转氨酶含量有差别。(2)正态近似法:n>50时第九章基于秩次的非参数检验第三节完全随机设计两样本的秩和检验(Wilcoxon两样本比较法)适用资料:两定量非正态资料或两组有序分类(等级)资料。第九章基于秩次的非参数检验一、定量变量两组独立样本的秩和检验第九章基于秩次的非参数检验基本思想任一组秩和不应太大或太小假定H0成立

与平均理论秩和N(N+1)/4应相差不大混合编秩

分别计算两组的秩和

第九章基于秩次的非参数检验Wilcoxon秩和检验的基本思想总结

假设两总体分布相同,两样本可认为是从同一总体中抽取的随机样本,将两样本混合后由小到大编秩,分别计算两组的秩和,两组的秩和应大小相等,若两组的秩和相差很大,我们就认为无效假设不成立。第九章基于秩次的非参数检验

例3:两种药物杀灭钉螺,每批用200-300只活钉螺,用药后清点钉螺的死亡数,并计算死亡率(%),结果先表3,试比较两种药物杀灭钉螺的效果有无差别?第九章基于秩次的非参数检验表3两种药物杀灭钉螺死亡率比较甲药乙药死亡率%秩次死亡率%秩次32.55.516.0135.5722.5240.51026.0340.51028.5449.01232.55.549.51338.0851.51440.510n1=7T1=71.5n2=7T2=33.5第九章基于秩次的非参数检验秩和检验的基本思想14102311131214155678916第九章基于秩次的非参数检验二、检验步骤1、建立假设

H0:两种药物杀灭钉螺死亡率的总体中位数相等M1=M2H1:两种药物杀灭钉螺死亡率的总体中位数不相等M1≠M2α=0.05第九章基于秩次的非参数检验2、计算统计量编秩原则(1)两组数据混合按升序编秩(2)如有相同数据在不同组时,求平均秩次。(3)两组数据分别求秩和(4)统计量的确定:

n1≠n2,以n小者的秩和为统计量T

n1=n2,则以任一组秩和为统计量T

T1=71.5,T2=33.5第九章基于秩次的非参数检验3、确定P值,做出结论

(1)查表法:n1<=10,n2-n1<=10时(2)正态近似法:n1>10,n2-n1>10时

相同秩次较多时,计算出的Z值偏小,应进行校正第九章基于秩次的非参数检验

本例n1=10,n2-n1=0查T表附表10,双侧P=0.05时,T界值范围是36—69,T0.01界值范围是32-73,而今统计量T=33.5,在T0.01界值范围外,故P<0.01。按α=0.05,拒绝H0,接受H1,可认为两种药物杀灭钉螺死亡率的总体死亡率不相等第九章基于秩次的非参数检验二、两独立样本比较的Mann-WhiteyU检验

两独立样本比较还常用Mann-WhitneyU

检验(Mann-WhitneyUtest)。检验统计量U定义为:两个样本分别排序后,把第一个样本的n1(n1≤n2)个变量中的每个值,与第二个样本的n2个变量值逐个比较,小于记1,相等记0.5,大于记0,求其和。当n1和n2小时,如n1+n2≤30,有专门的U界值表;第九章基于秩次的非参数检验当n1和n2大时,用正态近似法作检验。第九章基于秩次的非参数检验三、有序变量两组独立样本的秩和检验两组等级资料的比较第九章基于秩次的非参数检验例4

用某药治疗不同病情(单纯型和合并症型)的老年慢性支气管炎病人,疗效见表4第(2)、(3)栏,问该药对两种病情的疗效有无差别?第九章基于秩次的非参数检验表4某药对支气管炎两种病情疗效的秩和检验疗效(1)单纯型(2)合并症型(3)合计(4)秩次范围(5)平均秩次(6)单纯型秩和(7)合并症型秩和(8)控制65421071~1075435102268显效18624108~131119.52151717有效302353132~18415847403634无效131124185~208196.52554.52161.5合计n2=126n1=82208T2=12955.5T1=8780.5第九章基于秩次的非参数检验分析:以上数据为等级资料检验步骤、假设、定统计量方法、与两组资料的比较基本相同,只是编秩方法略有差别:(1)两组资料按等级求合计,定秩次范围(2)各等级求平均秩次与小组秩和(3)两组资料分别求秩和(4)判断方法同两组资料的比较方法。第九章基于秩次的非参数检验检验步骤

1、建立假设

H0:两种病情病人的疗效总体分布位置相同

H1:两种病情病人的疗效总体分布位置不同

α=0.05

2、计算统计量各组段的平均秩次分别与相应组段的例数相乘,得秩和。T1=8780.5T2=12955.5

本例n1=82,

>10,用正态近似法:因本例相同秩次很多(超过25%),须按下式校正:C为校正数,tj为第j个相同秩次的个数。第九章基于秩次的非参数检验第九章基于秩次的非参数检验3、确定P值,做出结论:查附表1,Z界值表(或查t界值表自由度为∞)

,Z0.05/2=1.96,故P>0.05。按α=0.05的检验水准,不拒绝H0,两种病情病人的疗效差异无统计学意义,尚不能认为该药对两种病情的疗效有差别。第九章基于秩次的非参数检验

第四节多组独立样本比较的秩和检验

(Kruskal-Wallis法)

WilliamKruskal

(1919-2005)W.AllenWallis

(1912-1998)第九章基于秩次的非参数检验

不满足方差分析条件的完全随机设计多组资料比较,采用Kruskal-Wallis(Kruskal-Wallis-H)秩和检验,相当于方差分析的非参数分析方法。此法的基本思想:如果各组处理效应相同,混合编秩号后,各组的秩和应近似相等。第九章基于秩次的非参数检验适用资料

多组连续变量非正态分布资料多组有序(等级分组)资料。各组资料例数可以相等,也可以不等。第九章基于秩次的非参数检验一、多组独立样本比较的Kruskal-WallisH检验第九章基于秩次的非参数检验例5某医院用三种不同方法治疗15例肝癌患者,每种方法各治疗5例。治疗后生存月数见表5第(1)、(3)、(5)栏,问这三种方法对肝癌患者的疗效有无差别?第九章基于秩次的非参数检验表5三种方法治疗肝癌患者的生存月数比较第九章基于秩次的非参数检验检验步骤1、建立假设

H0:三种方法疗效的总体分布位置相同

H1:三种方法疗效的总体分布位置不全相同

α=0.052、计算统计量

(1)编秩◆各组资料混合按升序编秩

◆相同数据在不同组时,求平均秩次(2)各组分别求秩和第九章基于秩次的非参数检验(3)计算统计量本例对H的校正:

当各样本相同秩次较多时(如超过25%),按上式计算的H值偏小,应对其进行校正。

Hc=H/C

tj为相同秩次的个数第九章基于秩次的非参数检验3、确定P值,作出推断结论(1)若组数k=3,且每组例数ni≤5时,查H界值表,判断:H越大,P越小。(2)若K>3,各ni>5,查附表8,P482

2界值表。此时,H近似服从υ=k-1的

2分布,判断:H越大,P越小。本例中,各组例数均=5,H近似服从H分布,查得H界值为5.78,得P<0.05。按α=0.05水准拒绝H0,接受H1,可认为三种方法疗效的生存月数有差别。第九章基于秩次的非参数检验

例6某研究者欲研究A、B两种菌对小鼠巨噬细胞吞噬功能的激活作用,将59只小鼠随机分为三组,其中一组为生理盐水对照组,用常规巨噬细胞吞噬功能的监测方法,获得三组的吞噬率(%),结果见表6,试比较不同实验条件下小鼠巨噬细胞的吞噬率有无差别?表6不同菌种对小鼠巨噬细胞的吞噬率(%)A菌组(1)B菌组(2)对照组(3)吞噬率秩次吞噬率秩次吞噬率秩次46145217471556215318325572254195823592455204916612660254411643162282436533622818165336228378653363304512.56736.569403786736.570413786736.571452546736.5714519268397145378714572494512.5714588543787145905571459256Ri924701145ni241916第九章基于秩次的非参数检验二、检验步骤1、建立假设

H0:三组吞噬细胞总体分布相同

H1:三组吞噬细胞总体分布不全相同

α=0.052、计算统计量

(1)编秩

各组资料混合按升序编秩相同数据在不同组时,求平均秩次(2)各组分别求秩和第九章基于秩次的非参数检验(3)计算统计量

本例对H的校正:

当各样本相同秩次较多时(如超过25%),按上式计算的H值偏小,应对其进行校正。

Hc=H/C

tj为相同秩次的个数第九章基于秩次的非参数检验3、确定P值,作出推断结论

(1)若组数k=3,且每组例数ni≤5时,查H界值表,判断H越大,P越小。(2)若K>3,各ni>5,查

2界值表此时,H近似服从υ=k-1的

2分布,判断H越大,P越小。本例中,各组例数均>5,H近似服从

2分布,υ=k-1=3-1=2,查

2界值表,得P<0.005。按α=0.05水准拒绝H0,接受H1,三组菌种对小鼠巨噬细胞的吞噬率差别有统计意义,可以认为不同菌种对小鼠巨噬细胞的吞噬率的作用不同。第九章基于秩次的非参数检验Thankyou!第九章基于秩次的非参数检验二、有序变量多组独立样本的秩和检验

多组等级资料的比较第九章基于秩次的非参数检验方法:(1)按不同等级分组,定秩次范围(2)各等级求平均秩次与小组秩和(3)多组资料分别求秩和(4)判断方法同多组资料的比较方法第九章基于秩次的非参数检验五种病人阴道涂片按巴氏细胞学分级的检查结果,见表7第(1)~(6)栏,问五种病人的细胞学分级有无程度上的差别?第九章基于秩次的非参数检验表7五种病人阴道涂片的细胞学分级比较巴氏分级(1)慢性炎症(2)轻度增生(3)重度增生(4)原位癌(5)浸润癌(6)合计(7)秩次范围(8)平均秩次(9)Ⅰ2119000401~4020.5Ⅱ4441305241~9266.5Ⅲ00611314893~140116.5Ⅳ023154262141~202171.5Ⅴ000217798203~300251.5ni25255050150300-

-

Ri696.5998.53940933530180-

-

-

平均Ri27.939.978.8186.7201.2-

-

-

第九章基于秩次的非参数检验1.建立假设,确定检验水准

H0:五种病人细胞学分级的总体分布位置相同

H1:五个总体的位置不同或不全相同

α=0.05第九章基于秩次的非参数检验2.计算检验统计量H值(1)编秩:在编秩时,先按组段计算各等级的合计人数,由此确定各组段秩次范围,然后计算出各组段的平均秩次。相同等级的个体属于相持(2)求秩和:以各组段的平均秩次分别与各等级例数相乘,再求和得到。

第九章基于秩次的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论