非参数检验方法_第1页
非参数检验方法_第2页
非参数检验方法_第3页
非参数检验方法_第4页
非参数检验方法_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

非参数检验方法第1页,共42页,2023年,2月20日,星期四主要内容:第一节配对资料的符号秩和检验第二节两样本比较的秩和检验第三节多个样本比较的秩和检验第2页,共42页,2023年,2月20日,星期四由样本统计量推断未知总体参数。这时,对总体参数μ、π进行估计或假设检验称为参数检验。分布:要求总体分布已知,如:计量资料——正态分布;计数资料——二项分布、POISSON分布等。1.参数检验(parametrictest)

以特定的总体分布为前提,对总体参数进行估计或假设检验的一类检验方法。基本概念第3页,共42页,2023年,2月20日,星期四2.非参数检验(nonparametrictest)

可以不考虑总体的参数和总体的分布类型,而对总体的分布或分布位置进行检验。样本所来自的总体分布,难以用某种函数形式来表达,还有一些资料的总体分布的函数式是未知的,只知道总体分布是连续型的或离散型的,解决这类问题需要一种不依赖总体分布的具体形式的统计方法。第4页,共42页,2023年,2月20日,星期四3.常用的非参数检验方法有:符号检验、秩和检验、等级相关检验及Radit分析等。秩和检验(ranksumtest):用秩号代替原始数据后,所得某些秩号之和,称为秩和,用秩和进行假设检验即为秩和检验。第5页,共42页,2023年,2月20日,星期四“秩”即按数据大小排定的次序号,又称秩号。编秩就是将观察值按顺序由小到大排列,所得某些秩次号之和,即按某种顺序排列的序号之和,称为秩和。设有以下两组数据:A组4.76.42.63.25.2B组1.72.63.62.33.7A组2.63.24.75.26.4B组1.72.32.63.63.7秩次12345678910举例:第6页,共42页,2023年,2月20日,星期四适用情况1.总体分布为偏态或分布形式未知的计量资料;2.等级资料;3.个别数据偏大或数据的某一端无确定的数值;4.各组离散程度相差悬殊,即各总体方差不齐。第7页,共42页,2023年,2月20日,星期四优点:应用范围广,方法简便。缺点:检验效率低。犯第二类错误的可能性大于参数检验法。优缺点对于适合参数统计的资料或经变量变换后适合于参数统计的资料,最好还是用参数检验。第8页,共42页,2023年,2月20日,星期四第一节配对资料的符号秩和检验配对资料的符号秩和检验(Wilcoxonsignedranktest)是配对设计的非参数检验。第9页,共42页,2023年,2月20日,星期四例9.1临床某医生研究白癜风病人的白介素IL-6水平(u/ml)在白癍部位与正常部位有无差异,调查的资料如下表:病人号白癍部位正常部位d=正常-白癍秩次140.0388.5748.546297.1380.00-17.13-3380.32123.7243.404425.3239.0313.712519.6124.374.761614.5092.7578.258749.63121.5771.947844.5689.7645.205合计T+=33T-=3表9-1白癜风病人的不同部位白介素IL-6指标(u/ml)第10页,共42页,2023年,2月20日,星期四一、一般步骤1、建立假设检验,确定检验水准H0:差值总体中位数为0;H1:差值总体中位数不为0;α=0.05一般步骤和基本思想第11页,共42页,2023年,2月20日,星期四2、计算统计量(1)按差值的绝对值自小到大排秩次,并保留原差数的正负号;(2)差数的绝对值相等,但符号相反时,取平均秩次;(3)差数为零时,弃之,总的对子数相应减少;(4)将正负秩次分别相加,得到T+和T-,并以绝对值较小者作为统计量T值。第12页,共42页,2023年,2月20日,星期四3、查表,确定P值范围n≤25时,查配对资料符号秩和检验用T界值表,T在界值内时,P>α。当T在界值时或以外时,P值一般都小于对应的概率值。第13页,共42页,2023年,2月20日,星期四n>25时,近似正态分布用u检验,公式为:第14页,共42页,2023年,2月20日,星期四当相同秩次较多时(>25%),采用校正公式:其中ti为相同秩次的个数第15页,共42页,2023年,2月20日,星期四二、基本思想如果H0成立,即差值总体的中位数为0,则理论上样本的正负秩和应相等,即T值应为总秩和n(n+1)/2的一半,即T=n(n+1)/4。由于存在抽样误差,T应该接近n(n+1)/4,T越小,T与n(n+1)/4的差距越大,相应的P值就越小。当P≤α时,拒绝H0。第16页,共42页,2023年,2月20日,星期四1、建立假设检验,确定检验水准H0:差值总体中位数为0;H1:差值总体中位数不为0;α=0.05。2、计算统计量T=min(T+,T-)=T-=3第17页,共42页,2023年,2月20日,星期四3、查表及结论n=8,界值表T0.05(8)=3~33,T=3恰好落在界点上,所以P≤0.05,按α=0.05水准,拒绝H0,可认为白癍部位与正常部位的白介素IL-6有差异。第18页,共42页,2023年,2月20日,星期四例9.2对28名患有轻度牙周疾病的成年人,指导他们实行良好的口腔卫生习惯,6个月后,牙周情况好转程度依高到低给予分数+3,+2,+1;牙周情况变差程度依次给予分数-1,-2,-3;没有变化给予0分。6个月后6个月前变化对应的分数人数..+34..+25..+16..05..-14..-22..-32表9-2实行良好口腔卫生习惯6个月后牙周情况的变化程度第19页,共42页,2023年,2月20日,星期四1、建立假设检验H0:差值总体中位数为0;H1:差值总体中位数不为0;α=0.05。2、计算统计量d秩次范围平均秩次负秩和正秩和-+总146101~105.52233225711~1714.02870324618~2320.54182合计T-=91T+=185表9-3正负秩和计算表第20页,共42页,2023年,2月20日,星期四3、查表与结论查T界值,T0.05(23)=73~203T=min(T+,T-)=T-=91>73,P>0.05,按α=0.05水准,不拒绝H0,即对28名有轻度牙周疾病的成年人,指导他们实行良好的口腔卫生习惯,6个月后,牙周情况尚无显著好转。查u值表,u0.05=1.96,u<u0.05,P>0.05,按α=0.05水准,接受H0。两种方法结果相同。第21页,共42页,2023年,2月20日,星期四第二节两样本比较的秩和检验一、一般步骤1、建立假设检验及确定显著水准H0:两总体分布相同;H1:两总体分布不同;α=0.05。第22页,共42页,2023年,2月20日,星期四2、计算统计量(1)编秩号两样本观察值从小到大混合编秩,属于不同组的相同观察值取原秩次的平均秩次。(2)求秩和,确定统计量Tn1和n2为两样本含量,N=n1+n2。分别计算秩次T1和T2,取样本含量小的n的秩和T为统计量T值。当n1=n2,取任意T值。第23页,共42页,2023年,2月20日,星期四3、确定P值当n小<10,n大-n小≤10时,查附表9的T界值表。T值在表中范围外(包括端点时),P值小于表中对应的概率值,T值在表中范围内,P值大于表中对应的概率值。当n大和n小超过T界值表的范围时,可按近似正态,用u检验:当秩次较多时,用校正公式:第24页,共42页,2023年,2月20日,星期四二、基本思想在H0成立的条件下,n1样本的秩和T应该接近平均秩和n1(N+1)/2(N为处理组的总例数)。如果二者的偏离程度超出了给定范围,表示得到样本统计量T的概率很小(P<α),则有理由拒绝H0。第25页,共42页,2023年,2月20日,星期四无淋巴细胞转移有淋巴细胞转移时间秩次时间秩次124.5512510822711124.52912.5124.53817124.542191774620218462124956232912.5602430143415361640184822n1=10T1=162n2=14T2=138表9-4两组患者生存时间(月)例9.3对无淋巴细胞转移与有淋巴细胞转移的胃癌患者,观察其生存时间,问两组患者的生存时间是否不同?第26页,共42页,2023年,2月20日,星期四2、计算统计量1、建立假设检验及确定检验水准H0:两组生存时间总体分布相同;H1:两组生存时间总体分布不相同;α=0.05。将两样本24个数据由小到大统一编秩。两组例数各为10、14,取较小者为n1=10,T1=162,故统计量T=T1=162。第27页,共42页,2023年,2月20日,星期四3、查表与结论n2-n1=4,按α=0.05,查T值表(附表9)得范围91~159。T=162>159,所以P<0.05,拒绝H0,即两组患者的平均生存时间不同。第28页,共42页,2023年,2月20日,星期四嗜酸性粒细胞数组别-++++++合计健康人51816544病人11103024合计1628195例9.444例健康人与24例慢性气管炎病人痰液嗜酸性粒细胞数的测量值(×1016/L),问健康人与慢性气管炎病人痰液嗜酸性粒细胞数有无显著性差别?表9-5-1两组人痰嗜酸性粒细胞比较能否用卡方检验?第29页,共42页,2023年,2月20日,星期四嗜酸性粒细胞数例数例数较小组的秩和健康人病人范围平均秩次-5111-168.593.5+181017-4430.5305.0++16345-6354.0162.0+++5064-6866.00.0合计4424T1=560.5表9-5-2两组人痰嗜酸性粒细胞的秩和计算第30页,共42页,2023年,2月20日,星期四1、建立假设检验及确定检验水准H0:两组总体分布相同;H1

:两组总体分布不相同;α=0.05。第31页,共42页,2023年,2月20日,星期四2、计算统计量由于u0.05=1.96,u>u0.05,P<0.05,有统计学意义,所以拒绝H0,接受H1,可认为两总体分布不同。3、确定P值,作出统计推断第32页,共42页,2023年,2月20日,星期四1.计量资料的多个样本比较

2.等级资料的多个样本比较应用情况第三节多个样本比较的秩和检验第33页,共42页,2023年,2月20日,星期四基本思想和步骤(一)基本思想:如果各组来自同一总体,即H0成立时,对各组观测值混合编秩次后,各组的平均秩和应近似相等;否则拒绝H0,可以推断数据的总体分布不同。(二)步骤1、建立假设检验H0:各抽样总体分布相同H1:各抽样总体的分布不同或不全相同α=0.052、计算统计量(1)编秩次,将各组数据从小到大统一编秩次,如不同组有相同数值,应取平均秩次。(2)求秩和,分别计算各组的Ti。(3)计算统计量:第34页,共42页,2023年,2月20日,星期四当相同秩次较多时(尤其为等级资料),采用校正的HC计算公式:H或HC近似服从自由度ν=k-1的χ2分布。按χ2的界值表确定P的范围。第35页,共42页,2023年,2月20日,星期四例9.5研究白血病时,测定四组鼠脾DNA的含量,结果见下表,试分析各组DNA含量有无差别?正常脾患自发性白血病脾患移植白血病的脾(甲组)患移植白血病的脾(乙组)含量秩次含量秩次含量秩次含量秩次12.31810.889.319.5213.22211.61310.33.510.33.513.72612.31811.11110.5515.22812.72111.71410.5615.82913.52311.71510.5716.93013.52412.01610.9917.33114.82712.31811.01017.43212.42011.51213.625n1=8T1=216n2=7T2=134n3=9T3=123.5n4=8T4=54.5表9-6各组鼠脾DNA含量(mg)的秩和计算第36页,共42页,2023年,2月20日,星期四1、建立假设检验确定检验水准H0:四组鼠脾DNA含量的总体分布相同;H1:四组鼠脾DNA含量的总体的分布不同或不全相同;α=0.05。2、计算统计量3、查表及结论现k=4,υ=k-1=4-1=3查卡方界值表χ20.05(3)=7.81,P<0.05按α=0.05水准,拒绝H0,接受H1,故可认为四组DNA含量有差别。第37页,共42页,2023年,2月20日,星期四例9.6霍乱菌苗不同途径免疫21天后血清抗体滴度水平测定结果,问各组间的血清抗体滴度水平之间差异是否有统计学意义?抗体滴度气雾组皮下注射组累计秩次范围平均秩次秩和80亿100亿80亿100亿皮下1:1024281-84.591891:201571239-3120300140201:401012133532-66494905886371:805792167-87773855396931:160125888-9591.591.5

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论