秩转换非参数检验_第1页
秩转换非参数检验_第2页
秩转换非参数检验_第3页
秩转换非参数检验_第4页
秩转换非参数检验_第5页
已阅读5页,还剩77页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第八章第八章秩转换的非参数检验秩转换的非参数检验 (Nonparametric Test)主要内容第一节 配对样本资料的Wilcoxon符号秩检验第二节 两个独立样本比较的Wilcoxon秩和检验第三节 完全随机设计多个样本比较的Kruskal- Wallis H检验第四节 随机区组设计多个样本的Friedman M检验参数检验参数检验n参数检验方法:参数检验方法:t 检验,方差分析;检验,方差分析;n总体分布假定:各组样本所来自的总体为总体分布假定:各组样本所来自的总体为正态分布(已知的分布形式)正态分布(已知的分布形式),各组样本所各组样本所来自的总体方差齐性。来自的总体方差齐性。非参数检

2、验非参数检验n定义:不依赖于总体的分布类型,对样本定义:不依赖于总体的分布类型,对样本所来自总体的分布不作严格假定的统计推所来自总体的分布不作严格假定的统计推断方法,称为非参数检验(断方法,称为非参数检验(nonparametric test)。直接对总体分布做假设检验。)。直接对总体分布做假设检验。 又称为任意分布检验(又称为任意分布检验(distribution-free test)。)。2, 注意:注意:如果已知其计量资料满足(或近如果已知其计量资料满足(或近似满足)似满足) 检验或检验或 检验条件,当然选检验条件,当然选 检验或检验或 检验,因为这时若选秩转换的检验,因为这时若选秩转换

3、的非参数检验,会降低检验效能。非参数检验,会降低检验效能。ttFF 非参数检验是一类统计学方法的总称,非参数检验是一类统计学方法的总称,基于秩转换(基于秩转换(rank transformation)的)的非参数检验只是其中的一种。非参数检验只是其中的一种。秩转换的非参数检验秩转换的非参数检验n秩次(秩次(rank):某种测量值按照从小到大):某种测量值按照从小到大的顺序排序后,每一测量值所对应的序号。的顺序排序后,每一测量值所对应的序号。n秩转换:将某一变量值从小到大排序后,秩转换:将某一变量值从小到大排序后,获得每一变量值的秩次,并用此秩次代替获得每一变量值的秩次,并用此秩次代替原有变量值

4、的过程。原有变量值的过程。秩转换的非参数检验秩转换的非参数检验 秩和检验的方法秩和检验的方法-秩转换秩转换秩和检验的基本计算步骤:1.将数据(x)按大小转化为秩次(i),用秩次的大小反映变量值的大小。2.对各组”秩次”求和,称为秩和(T =i)。3.对各组秩和(T)做检验的方法称为秩和检验。 例例: 秩转换的基本方法秩转换的基本方法 将两组比较原始数据(X)混合按大小编秩,如x相同取平均秩, 分别对各组的秩求和(T).甲组(x) 3 5 10 20 22 秩和秩号 (i) 1 3 5 7 8 T1=24乙组(x) 4 9 15 25 35秩号(i) 2 4 6 9 10 T2=31 21, 2

5、/ ) 1(nnNNNT总秩和总秩和T=10(10+1)/2=55例例: 两组比较的等级数据编秩两组比较的等级数据编秩 A组 : 、 +、 +、 +、 + 秩(i) : 1 2 4.5 4.5 4.5 8.5秩和 : TA25 (组间相同,求平均秩) B组 : +、+、+、+、+、+ 秩(i) :4.5 8.5 8.5 8.5 11 12 秩和 : TB53 (组内相同,不影响求秩和)总秩和总秩和 : TA+TB=12(12+1)/2=78秩次:在一定程度上反映了原始数据大小(等级)的信息。秩和:反映了一组数据在分布上的范围位置。平均秩次:反映一组数据平均水平 A组平均秩次=23.5/6=3.

6、92 B组平均秩次=54.5/6=9.08A组组(x) 3, 5, 7, 9 11 14 (i) 1 2 3 4 5 8.5 T=23.5B组组(x) 12 13 14 16 20 22 (i) 6 7 8.5 10 11 12 T=54.5非参数检验的应用场合非参数检验的应用场合n计量资料计量资料:不满足参数检验的条件,且无适当的变量变不满足参数检验的条件,且无适当的变量变换方法解决此问题时;换方法解决此问题时;分布类型无法获知的小样本计量资料;分布类型无法获知的小样本计量资料;一端或两端存在不确定数值(如一端或两端存在不确定数值(如1000IU)的计量资料;的计量资料;n等级资料等级资料:

7、比较各组间等级强度的差别。比较各组间等级强度的差别。非参数检验的优缺点:优点: 适用范围广 对数据要求不严 方法简便、易于理解和掌握缺点: 损失信息、检验效能低符合条件符合条件首选参数检验首选参数检验不符合条件不符合条件非参数检验非参数检验第一节第一节 配对样本比较的配对样本比较的Wilcoxon符号秩检验符号秩检验Wilcoxon符号秩检验简介符号秩检验简介符号秩检验由符号秩检验由Wilcoxon于于1945年提出;年提出;应用:应用:n配对样本差值的中位数与配对样本差值的中位数与0比较;比较;n单个样本中位数与总体中位数(给定值)单个样本中位数与总体中位数(给定值)的比较。的比较。符号秩检

8、验的基本思想符号秩检验的基本思想n在在H0成立(两配对样本差值的总体中位数成立(两配对样本差值的总体中位数为为0)的条件下,两配对样本的差值的正负)的条件下,两配对样本的差值的正负及其绝对值的相对大小是随机的;及其绝对值的相对大小是随机的;n在此情况下,正秩和与负秩和之间应当相在此情况下,正秩和与负秩和之间应当相近,差别不会太大;近,差别不会太大;n如果正秩和与负秩和之间相差足够大,则如果正秩和与负秩和之间相差足够大,则可认为可认为H0成立的可能性很小,从而加以拒成立的可能性很小,从而加以拒绝。绝。配对样本差值的中位数与配对样本差值的中位数与0 0比较比较 配对设计两组处理效应的比较一配对设计

9、两组处理效应的比较一般采用配对般采用配对t t 检验,如果差数严重检验,如果差数严重偏离正态分布,可采用偏离正态分布,可采用Wilcoxon符符号秩检验。号秩检验。例例8-1:两种方法测量:两种方法测量12份血清份血清ALT测量结果测量结果编号编号(1)原法原法(2)新法新法(3)差值差值d(4)=(3)-(2)16076162142152103195243484808225242240-2622022007190205158253813919824345103844611236190-4612951005合计合计例例8-1:两种方法测量:两种方法测量12份血清份血清ALT测量结果测量结果编号

10、编号(1)原法原法(2)新法新法(3)差值差值d(4)=(3)-(2)正秩正秩(5)负秩负秩(6)160761682142152105319524348114808221.55242240-21.56220220071902051578253813691982434591038446411236190-4610129510053合计合计54.511.5 例例8-1分析结果分析结果取负秩和为取负秩和为T,则,则T=11.5;查查T界值表得界值表得0.05P25时,T分布近似正态分布可用正态近似法作u检验:|(1)/4| 0.5(1)(21)/24TTTTn nun nn相同秩次较多时的校正值:3

11、|(1)/4| 0.5(1)(21)/24()/48ciiTn nun nntt注意注意:仍为非参数检验2.2.配对设计等级资料的符号秩检验配对设计等级资料的符号秩检验1. 把等级从弱到强转换成秩,如某指标的检测结果把等级从弱到强转换成秩,如某指标的检测结果为为-,+,+,+,可转化为相应的秩次,可转化为相应的秩次1,2,3,4;2. 求各对秩次的差值,省略所有差值为求各对秩次的差值,省略所有差值为0的对子数,的对子数,令余下的有效对子数为令余下的有效对子数为n;3. 按按n个差值编正秩与负秩,求正秩和与负秩和个差值编正秩与负秩,求正秩和与负秩和 注意:由于等级资料相同秩多,此时小样本的检注意

12、:由于等级资料相同秩多,此时小样本的检验结果会存在偏性,最好用大样本。验结果会存在偏性,最好用大样本。3. 单个样本中位数和指定的单个样本中位数和指定的总体中位数比较总体中位数比较例例8-2:12名工人尿氟含量与名工人尿氟含量与45.3比较比较尿氟含量尿氟含量(1)(1)- 45.3(2)正秩正秩(3)负秩负秩(4)44.21-1.091.545.30046.391.091.549.474.17351.055.75453.167.86553.267.96654.379.07757.1611.86867.3722.07971.0525.751087.3742.0711合计合计64.51.5假设检

13、验过程假设检验过程u与配对资料符号秩检验基本相同。与配对资料符号秩检验基本相同。u此处先计算每一测量值与给定的值的差数;此处先计算每一测量值与给定的值的差数;u然后对此差数进行秩转换,进行与配对资料符然后对此差数进行秩转换,进行与配对资料符号秩检验完全相同的操作过程。号秩检验完全相同的操作过程。u此例得此例得T=1.5,查表得,查表得P0.005;u拒绝拒绝H0,认为该厂工人的尿氟含量高于当地正,认为该厂工人的尿氟含量高于当地正常人的水平。常人的水平。第二节第二节 两个独立样本比较的两个独立样本比较的 Wilcoxon秩和检验秩和检验Wilcoxon秩和检验秩和检验nWilcoxon秩和检验(

14、秩和检验(rank sum test)用于)用于推断计量资料或等级资料的两个独立样本推断计量资料或等级资料的两个独立样本所来自总体的分布位置是否有差别。所来自总体的分布位置是否有差别。n对分布的形状不加考虑,因此应注意分布对分布的形状不加考虑,因此应注意分布位置和分布(包括位置和形状)的区别。位置和分布(包括位置和形状)的区别。n分布形状相同或类似的两个总体分布位置分布形状相同或类似的两个总体分布位置比较,可以简化地理解为两总体中位数的比较,可以简化地理解为两总体中位数的比较。比较。1. 1. 计量资料两样本比较计量资料两样本比较例例8-3 两类肺病患者两类肺病患者RD值比较值比较肺癌病人肺癌

15、病人矽肺矽肺0期工人期工人RD值值秩次秩次RD值值秩次秩次2.7813.232.53.232.53.5044.2074.0454.87144.1565.12174.2886.21184.3497.18194.47108.05204.64118.56214.75129.60224.82134.95155.1016n1=10T1=141.5n2=12T2=111.5(1)建立检验假设,确定检验水准)建立检验假设,确定检验水准H0:两组患者:两组患者RD值总体分布位置相同值总体分布位置相同H1:肺癌病人:肺癌病人RD值高于矽肺值高于矽肺0期工人期工人RD值值=0.05(2)混合编秩,求统计量)混合编

16、秩,求统计量Tu将两样本数据混合,从小到大排序;将两样本数据混合,从小到大排序;u对混合数据进行秩转换,获得每一观察值对应对混合数据进行秩转换,获得每一观察值对应的秩次;的秩次;u观察值相等者取平均秩次;观察值相等者取平均秩次;u分别计算两样本的秩和;分别计算两样本的秩和;u取样本量较小者为取样本量较小者为n1,其秩和作为统计量,其秩和作为统计量T;u两样本量相等者任取其中一个作为统计量两样本量相等者任取其中一个作为统计量T(通常取秩和较小者)。(通常取秩和较小者)。 若若H0成立,成立,T值应接近值应接近 ,若,若T值严重偏离值严重偏离 ,则提示,则提示H0可能是不正确的。小样本时,可能是不

17、正确的。小样本时,查查T界值表。界值表。N N) )/ /2 2( (1 1n n0 02 21 12 21 12 21 1n nn n) ), ,R R, ,m mi in n( (R Rn nn n , ,T T较较小小例例数数组组的的秩秩和和)n ,nmin(nnnN21021N N) )/ /2 2( (1 1n n0 0较小例数组的平均秩和为:较小例数组的平均秩和为:N N) )/ /2 2( (1 1n n0 0(3)确定)确定P值,作出结论值,作出结论若若n110且且n2-n110,可通过查阅,可通过查阅T界值表界值表(附表(附表10)确定)确定P值;值;若两样本量不满足上述条件

18、,则可采用正若两样本量不满足上述条件,则可采用正态近似法作态近似法作u检验,按公式(检验,按公式(8-2)计算)计算u值。值。正态近似法正态近似法)NN)tt (jj3311 12 21 1) )( (N Nn nn n| |1 1) )/ /2 2( (N Nn nT T| |u u2 21 11 1例例8-3分析结果分析结果本例本例n1=10, n2-n1=2,T=T1=141.5,满足查,满足查T界值表的条件;界值表的条件;查表得查表得单侧单侧0.025P0.05;拒绝拒绝H0 ,认为肺癌病人的,认为肺癌病人的RD值高于矽肺值高于矽肺0期病人的期病人的RD值。值。2. 等级资料两样本比较

19、等级资料两样本比较例例8-4 吸烟和不吸烟工人吸烟和不吸烟工人HbCO含量比较含量比较含量含量吸烟吸烟不吸烟不吸烟合计合计秩范围秩范围平均秩平均秩秩和秩和(1)(2)(3)(4)(5)(6)吸烟吸烟(7)=(2)(6)不吸烟不吸烟(8)= (3)(6)很低很低12313224低低8233143419152437中中161127356148768528偏高偏高10414627568.5685274高高404767977.53100合计合计39(n1) 40(n2)791917(T1)1243(T2)(1)建立检验假设,确定检验水准)建立检验假设,确定检验水准H0:两组工人:两组工人HbCO含量总

20、体分布位置相同含量总体分布位置相同H1:吸烟工人:吸烟工人HbCO含量高于不吸烟工人含量高于不吸烟工人=0.05(2)混合编秩,求统计量)混合编秩,求统计量Tu确定各等级的合计人数;确定各等级的合计人数;u根据各等级的合计人数确定其秩次范围和平根据各等级的合计人数确定其秩次范围和平均秩;均秩;u分别计算两样本的秩和;分别计算两样本的秩和;u取样本量较小者为取样本量较小者为n1,其秩和(,其秩和(T1)作为统计)作为统计量量T;u根据公式(根据公式(8-2)计算)计算u值,执行值,执行u检验过程。检验过程。例例8-4分析结果分析结果本例本例n1=39, n2=40,T=T1=1917;计算得计算

21、得u=3.7023,查表得单侧,查表得单侧P5或或g3时时,则,则H或或Hc近似服从近似服从=g-1的的卡方分布,可通过卡方分布,可通过查阅卡方界值表确定查阅卡方界值表确定P值值。例例8-5分析结果分析结果本例本例n1=n2=n3=5,N=15,满足查,满足查H界值表的条件;界值表的条件;计算得计算得H=9.74,查表得双侧,查表得双侧P3,通过查卡方界值表(附表,通过查卡方界值表(附表8)确)确定定P值;值;例例8-7分析结果分析结果本例计算得本例计算得H=14.28,Hc =15.52,查卡方界,查卡方界值表得双侧值表得双侧P0.005;拒绝拒绝H0 ,认为四种疾病患者痰液内噬酸粒,认为四

22、种疾病患者痰液内噬酸粒细胞有差别。细胞有差别。秩和检验的两两比较方法有:1、Nemenyi法检验2、扩展的t检验3、q检验几种方法理论上仍存在争议,故几种方法理论上仍存在争议,故SASSAS、SPSSSPSS等软件没有提供这方面的分析等软件没有提供这方面的分析3. 多个独立样本两两比较的多个独立样本两两比较的Nemenyi检验检验Nemenyi检验方法简介检验方法简介n类似于多组样本比较方差分析的情形,当类似于多组样本比较方差分析的情形,当经过多个独立样本比较的经过多个独立样本比较的Kruskal-Wallis H检验拒绝检验拒绝H0之后,可进一步进行组间两两之后,可进一步进行组间两两比较;比

23、较;nNemenyi检验即为执行此类统计学比较的方检验即为执行此类统计学比较的方法之一。法之一。例例8-8 小白鼠接种三种伤寒菌的存活日小白鼠接种三种伤寒菌的存活日数数9D11CDSC1存活日数存活日数秩次秩次存活日数存活日数秩次秩次存活日数存活日数秩次秩次22510.534.522510.5510.522615.5615.534.5615.5615.5Ri84169212ni10911Ri8.4018.7819.27三组样本所来自的总体分布位置比较三组样本所来自的总体分布位置比较n三组样本所来自的总体分布位置比较的操作过程三组样本所来自的总体分布位置比较的操作过程与例与例8-5完全相同;完全

24、相同;n本例得本例得Hc=9.97,P0.01,拒绝,拒绝H0;n认为接种三种伤寒杆菌的存活日数有差别;认为接种三种伤寒杆菌的存活日数有差别;n为进一步观察不同伤寒杆菌之间的差别,可进一为进一步观察不同伤寒杆菌之间的差别,可进一步进行三组间的两两比较。步进行三组间的两两比较。任意两组间分布位置的比较任意两组间分布位置的比较n计算各组的平均秩和,根据公式(计算各组的平均秩和,根据公式(8-6)计)计算任意两组之间比较的卡方值;算任意两组之间比较的卡方值;n自由度取组数减一,即自由度取组数减一,即=g-1;n查表确定相应的查表确定相应的P值,进行统计推断。值,进行统计推断。例例8-8分析结果分析结

25、果n ,0.025P0.05n ,0.01P0.025n ,0.99P15或处理组数或处理组数g15时,则通过公式时,则通过公式(8-8)进行近似卡方检验,确定)进行近似卡方检验,确定P值。值。实际上当实际上当g4,或者,或者g=4且且n5,或者,或者g=3且且n9 ,即可采用近似卡方检验方法。即可采用近似卡方检验方法。例例8-98-9分析结果分析结果本例计算得本例计算得M=199.5,查,查M界值表得双侧界值表得双侧P0.05;拒绝拒绝H0 ,认为四种频率声音刺激的反应率,认为四种频率声音刺激的反应率有差别。有差别。2. 多个相关样本两两比较的多个相关样本两两比较的q检验检验q检验方法简介检验方法简介n当经过多个相关样本比较的当经过多个相关样本比较的Friedman M检验拒绝检验拒绝H0之后,可进一步执行组间两之后,可进一步执行组间两两比较的操作;两比较的操作;nq检验可用以执行多个相关样本的两两比检验可用以执行多个相关样本的两两比较过程。较过程。q检验方法操作过程检验方法操作过程n操作过程类似于方差分析组间两两比较的操作过程类似于方差分析组间两两比较的SNK-q检验;检验;n任意两组间比较的任意两组间比较的q值通过公式(值通过公式(8-9)和公式)和公式(8-10)计算;)计算;n自由度自由度=(n-1)(g-1),样本跨度,样本跨度a是

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论