第6章-假设检验之-秩和检验_第1页
第6章-假设检验之-秩和检验_第2页
第6章-假设检验之-秩和检验_第3页
第6章-假设检验之-秩和检验_第4页
第6章-假设检验之-秩和检验_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第6章假设检验之秩和检验秩和检验非参数统计计数资料计量资料t检验F检验u检验参数统计参数统计(parametricstatistics)前面学习的统计方法如t检验和方差分析,都有一定的适用条件,即要求样本来自正态总体,并且方差齐性(HomogeneityofVariance)

;并对总体分布的参数(如总体均数)进行估计和检验。正态分布有几个参数?μ1σ1μ2σ2隐含假设是方差相等(齐性)分析目的:对总体参数(μ或π)进行估计或检验。分布:要求总体分布已知,如:连续性资料——正态分布计数资料——二项分布、Poisson分布等统计量:有明确的理论依据(t分布、u分布)有严格的适用条件,如:正态分布Normal总体方差齐EqualVariance数据间相互独立Independent参数检验的特点条件不满足时——采用非参数统计的方法。

对总体分布不做严格假定,也不对总体参数进行统计推断,而是直接对总体分布的位置进行假设检验。由于这类方法不受总体参数的限制,故称非参数检验,又称任意分布检验(distribution-freetest)。非参数统计(nonparametricstatistics)又称秩转换的非参数检验或秩和检验(Ranksumtest)FrankWilcoxon,(1892-1965)FrankWilcoxon,是英国生物化学家、统计学家。Wilcoxon利用统计学方法研究植物病理学。一生共发表论文70余篇。他首次引入了两样本非参数检验方法。两个著名的非参数方法:Wilcoxonsigned-ranktest、Wilcoxonrank-sumtest就是以他的名字命名的。实际工作中,非参数统计方法可以发挥作用的情形有:①总体分布形式未知或分布类型不明;尤其是对于分布不知是否正态的小样本资料。②分布呈非正态而又无适当数据转换方法的偏态分布的资料(非正态分布的资料):

③等级资料:不能精确测定,只能以严重程度、优劣等级、次序先后等表示——单向有序行×列表资料不满足参数检验条件的资料:各组方差明显不齐。

数据一端或两端是不确定数值(必选),如“>50kg”等。非参数检验适用范围非参数统计的主要优点①由于没有条件限制,适用范围广。它可适用于有序分类资料、偏态分布资料、变异较大或方差不齐的资料、分布型不明的资料及有特大、特小值或数据的某一端有不确定数值的资料。②搜集资料方便。由于非参数统计在搜集资料时可用“等级”或“符号”来评定观察结果,因而搜集资料十分方便,更符合实际情况。③具有较好的稳健性;参数检验是建立在严格的假定条件基础上的,一旦不符合假定条件,其推断的正确性将受到质疑,而非参数检验都是带有最弱的假定,所受条件限制很少,稳健性好。非参数检验比较的常常是中位数,而中位数具有较好的耐极端值的作用。将变量值从小到大或从弱到强转换成秩后再计算检验统计量,从而推断一个总体表达分布位置的中位数M和已知M0、两个或多个总体的分布是否不同。特点:对总体分布的形状差别不敏感,只对总体分布的位置差别敏感。非参数统计的主要优点对适宜用参数方法的资料,若采用非参数处理,因没有充分利用资料提供信息,而使检验效率降低,会增加Ⅱ类错误(假阴性)的概率。反之,如果不符合参数检验的条件,非参数检验有极高的检验效率。αβ非参数统计的主要缺点

非参数检验是一种与总体分布无关的统计方法,它不比较参数,而是通过比较分布的位置来完成统计检验。基本思想是基于秩次(通过编秩,用秩次代替原始数据信息来进行检验)即检验各组的平均秩是否相等。如果经检验得各组的平均秩不相等,则可以推论数据的分布不同,进一步可推论各分布间分布位置发生了平移。非参数统计的基本思想非参数检验的方法很多,秩和检验是较常用的,检验效率较高的一种。其基本原理是“编秩求和”。秩次(rank):将数值变量值从小到大,或等级变量值从弱到强所排列的序号。秩和:用秩次号代替原始数据后,所得某些秩次号之和,即按某种顺序排列的序号之和,称为秩和。秩次和秩和例1

设有以下两组数据:

A组4.76.42.63.25.2B组1.72.63.62.33.7

两组各有5个变量值。现在依从小到大的顺序将它们排列起来,并标明秩次,结果如下:A组2.6

3.24.75.26.4

秩次3.558910B组1.72.32.63.63.7秩次123.567秩次和秩和第一节配对设计资料的符号秩和检验第二节完全随机设计两样本比较的秩和检验第三节完全随机设计多个样本比较的秩和检验第四节随机区组设计资料的秩和检验第五节多个样本两两比较的秩和检验

第6章假设检验之秩和检验第一节配对设计资料的符号秩和检验

(Wilcoxonsigned-ranktest)

一、基本思想二、检验步骤一、基本思想符号秩和检验是由Wilcoxon于1945年提出,又称Wilcoxon

符号秩检验常用于检验差值的总体中位数是否等于零配对资料有:

同对的两个受试对象分别接受不同处理

同一样品用两种不同方法测试

同一受试对象处理前后的比较或不同部位测定值比较配对资料的编秩规则按照配对设计,先求出对子之间的差值;按其差值的绝对值,从小到大进行排序,其序号即秩次,并在秩次之前保持原差值的正负号不变;编秩遇到差值为零时则舍去不编秩;对绝对值相等的差值若符号不同取平均值,并在秩次之前保持原差值的正负号;【例1】某医院检验科试用新旧两种方法检测谷丙转氨酶,新法的检测时间缩短了10分钟。用两种方法检测同一份血清,结果见表1。问两法测得结果有无差别?表1两法检测血清中的谷丙转氨酶[nmol/(S·L)]样本号旧法新法差值正差值秩次⑸负差值秩次⑴⑵⑶⑷=⑵-⑶⑹16080-2082142152-106324224021.548082-21.5538251376212243-3197220227-75895100-53.592362003610103843-5

3.5T+=18.5T-=36.5绝对值小者为秩分析步骤:1.建立检验假设,确定检验水准H0:两法检测结果相同,即差值总体中位数等于零,Md=0H1:两法检测结果不同,即差值的总体中位数Md≠0α=0.052.选择检验方法、计算统计量⑴编秩:⑵求秩和:本例按双侧检验,T=T+=18.5。3.确定P值、做出推论查“附表11T界值表(配对比较的符号秩和检验用)”,若检验统计量T值在Tα界值范围内,其P>α;若T值在Tα上、下界值范围外,则P<α。课堂练习P159表6.19正态近似法n>25时,T分布近似正态分布可用正态近似法作u检验:相同秩次较多时的校正值注意:仍为非参数检验第二节完全随机设计两样本比较的秩和检验一、基本思想二、检验步骤一、基本思想进行完全随机设计的两组数值变量资料和两组有序分类变量资料的比较时,若两个样本总体不能满足正态性和方差齐性的要求,可采用WilcoxonMann-Whitneytest进行两样本比较的秩和检验。目的是比较两样本分别代表的总体分布是否相同。如果H0成立,n1与n2确定后,则n1样本的秩和T与其平均秩和n1(n+1)/2不应该相差很大;如相差悬殊,超出所列界值范围,就怀疑H0,接受H1。提示两总体分布位置不同。假设检验的要点:1.混合编秩、数据相等时取平均秩2.分别求两组的秩和3.以样本量较小组的秩和为T4.查成组设计的T界值表、确定P值如果n1>10或n2>20则可用正态近似法:当相同秩次较多时用校正公式:ti为第i个相同秩次的个数二、检验步骤(一)两组数值变量资料的秩和检验(二)两组有序分类变量资料的秩和检验

【例2】测得铅作业与非铅作业工人的血铅值(μmol/L)见表2,问两组工人的血铅值有无差别?表2两组工人的血铅(μmol/L)铅作业组非铅作业组血铅值秩次血铅值秩次0.8290.2410.8710.50.2420.97120.2931.21140.3341.64150.4452.08160.5862.13170.6370.7280.8710.5

1.0113n1=7秩和=93.5n2=10秩和=59.5二、检验步骤1.建立假设、确定检验水准H0:两组工人血铅值的总体分布相同;H1:两组工人血铅值的总体分布不同α=0.052.选择检验方法、计算统计量⑴编秩:⑵求T值:分别求两组秩和。本例:n1=7,n2=10,T=93.53.确定P值、做出推论由n1、n2-n1查“附表,若T值在T界值范围内,则P>α;若T值在界值范围外或等于界值,则P≤α。课堂练习P161表6.20(二)两组有序分类变量资料的秩和检验有序分类变量(ordinalcategoricalvariable):各类别之间有程度的差别。如尿糖化验结果按-、±、+、++、+++分类;疗效按治愈、显效、好转、无效分类。对于有序分类变量,应先按等级顺序分组,清点各组的观察单位个数,编制有序变量(各等级)的频数表,所得资料称为等级资料。

【例3】某医院用复方石苇冲剂治疗老年慢性支气管炎患者216例,疗效见表3,问该药对两型支气管炎治疗效果是否相同?表3复方石苇冲剂治疗两型老年慢性支气管炎疗效的比较疗效人数合计秩次范围平均秩次秩和⑴单纯型喘息型⑷⑸⑹单纯型喘息型

⑵⑶

⑺=⑵⑹⑻=⑶⑹控制6220821~8241.52573.0830显效41377883~160121.54981.54495.5好转141630161~190175.52457.02808.0无效111526191~216203.52238.53052.5合计12888216————12250.011186.01.建立检验假设:H0:两型支气管炎疗效分布相同;H1:两型支气管炎疗效分布不同α=0.052.计算检验统计量

⑴编秩⑵⑵求秩和

⑶计算u值3.确定P值、做出推论

uc=3.837>2.58,故P<0.01,按水准拒绝H0,接受H1,差异有显著的统计学意义,提示复方石苇冲剂治疗两型支气管炎的疗效不同,对单纯型疗效较好(疗效由好到差排序,其平均秩和较小)。uc

==3.8371、卡方分析2、/view/d2a794fc700abb68a982fba3.html

Ridit(Reference

IDentical

unIT)分析,又称参照单位分析。主要用于分析单向有序列联

表。第三节完全随机设计多个样本比较的秩和检验

(Kruskal-Wallis法)—H检验一、多组有序分类变量资料的秩和检验二、多组数值变量资料的秩和检验基本思想进行完全随机设计的多个数值变量资料的检验时,若它们的总体不能满足正态性和方差齐性的要求,可采用Kruskal-Wallis秩和检验,也称K-W检验或H检验。还可用于多组有序分类变量资料的比较。其目的是比较多个样本分别代表的总体分布位置是否相同。此时卡方检验只能检验出各组间内部的构成比不同,而不能比较各组间的优劣关系。H值的计算tj为第j个相同秩次的个数。【例4】某医院用3种复方制剂治疗慢性胃炎,数据见表4,试比较其疗效。

表43种复方制剂治疗慢性胃炎疗效比较疗效例数合计秩次范围平均秩次秩和(Ri)复方Ⅰ复方Ⅱ复方Ⅲ⑷⑸⑹复方Ⅰ复方Ⅱ复方Ⅲ⑴⑵⑶

⑺=⑴⑹⑻=⑵⑹⑼=⑶⑹痊愈4256531~5327

1134135162显效186172022354~27616530690

2805

3300有效753626137277~4133452587512420

8970无效504231123414~536475237501995014725合计35310083536————814493531027157检验步骤1.建立假设、确定检验水准H0:三种复方制剂疗效的总体分布位置相同H1:三种复方制剂疗效的总体分布位置不同或不全相同α=0.052.选择检验方法、计算统计量⑴编秩:同例3。⑵求秩和(Ri)和统计量H值:

4.确定P值,作出推断结论⑴小样本情况:当组数k≤3,且ni≤5时,可查H界值表,确定P值。如果H>H

,则P<;反之,P>。⑵大样本情况:若k>3或ni>5时,理论上,H近似服从自由度为k-1的χ2分布,可查χ2界值表确定P值。本例需查χ2界值表(附表6)得χ20.05,2=5.99,P<0.05,按α=0.05水准,拒绝H0,接受H1,差异有显著的统计学意义,提示3种复方制剂治疗慢性胃炎疗效不同或不全相同。

二、多组数值变量资料的秩和检验[例5]检测不同程度再生障碍性贫血患者血清中可溶性CD8抗原水平(U/ml)见表9-5⑴、⑶、⑸列,不同程度再生障碍性贫血患者血清中可溶性CD8抗原水平有无差别?

表5不同程度血清中可溶性CD8

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论