基于秩次的非参数检验_第1页
基于秩次的非参数检验_第2页
基于秩次的非参数检验_第3页
基于秩次的非参数检验_第4页
基于秩次的非参数检验_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2023/6/1潍坊医学院卫生统计学教研室1第九章

基于秩次的非参数检验卫生统计学教研室吕军城

TEL:8462425Office:B432

Email:cheng_china@163.com

当前第1页\共有67页\编于星期五\7点2023/6/1潍坊医学院卫生统计学教研室2前面学习了连续型资料假设检验方法(t检验、方差分析)等。

如果各样本所来自总体的分布不清、已知不服从正态分布或经变量转换后仍不服从正态分布时,如何进行检验呢?★需要一种不依赖于总体分布类型的检验方法,非参数检验方法-Nonparametrictest

。问题的提出:当前第2页\共有67页\编于星期五\7点2023/6/1潍坊医学院卫生统计学教研室3掌握参数统计、非参数统计的概念;掌握非参数统计法的优缺点、适用范围;掌握各秩和检验的编秩原则与判断方法;了解秩和检验与参数检验方法的检验效能的差别。

学习目标当前第3页\共有67页\编于星期五\7点2023/6/1潍坊医学院卫生统计学教研室4一、参数统计(Parametricstatistics)对于总体分布类型已知的资料,用相应于参数的统计量来估计参数所在范围或推断参数有无差别的统计方法。如t检验,F检验,Z检验等

第一节参数检验与非参数检验参数检验的特点针对总体参数进行估计或检验;要求总体分布已知;统计量有明确的理论依据;有严格的使用条件。当前第4页\共有67页\编于星期五\7点参数检验参数检验方法:t检验,方差分析;总体分布假定:各组样本所来自的总体为正态分布(已知的分布形式),各组样本所来自的总体方差齐性。当前第5页\共有67页\编于星期五\7点2023/6/1潍坊医学院卫生统计学教研室6二、非参数检验(Nonparametricstatistics)对总体分布类型不作要求,而对总体的分布或分布位置进行检验。亦称任意分布检验(Distribution-freetest)。特点:适用范围广受限条件少稳健性好方法简便,易于理解和掌握第一节参数检验与非参数检验当前第6页\共有67页\编于星期五\7点已知总体分布类型,对未知参数(μ、π)进行统计推断依赖于特定分布类型,比较的是参数

参数统计(parametricstatistics)

非参数统计(nonparametricstatistics)对总体的分布类型不作任何要求

不受总体参数的影响,比较分布位置

适用范围广;可用于任何类型资料(等级资料,或“>50mg”)三、非参数统计方法的优缺点当前第7页\共有67页\编于星期五\7点非参数检验的缺点:

其检验效能较低仅是参数统计的95%。利用资料信息不充分。对于符合参数统计分析条件者,采用参数统计分析。10、15、20秩和=620、50、80秩和=6当前第8页\共有67页\编于星期五\7点四、非参数统计方法适用范围

1、计量非正态资料;

2、偏态分布资料;

3、总体分布类型未知或不确定资料;

4、等级资料;

5、开口资料.※符合参数统计条件的首先应用参数统计方法※不符合参数统计条件的,经变量变化后应用参数统计方法;若仍不符合参数统计条件的,应用非参数统计方法.当前第9页\共有67页\编于星期五\7点秩次(rank):某种测量值按照从小到大的顺序排序后,每个测量值所对应的序号。秩和检验基本思想—(秩转换)

:基于秩次,通过编秩,用秩次代替原始数据信息进行校验,即检验各组的平均秩是否相等,判断分布位置有无差别。秩转换的非参数检验-秩和检验当前第10页\共有67页\编于星期五\7点2023/6/1潍坊医学院卫生统计学教研室11第二节两相关样本Wilcoxon符号秩检验Wilcoxon符号秩检验简介应用:1.两相关样本资料Wilcoxon符号秩和检验2.单样本资料Wilcoxon符号秩和检验FrankWilcoxon由Wilcoxon于1945年提出;当前第11页\共有67页\编于星期五\7点一、两相关样本资料Wilcoxon符号秩和检验应用:配对设计定量资料样本差值的中位数与0比较;配对设计两组处理效应的比较:当差值服从正态分布时,采用配对t检验;如果差数严重偏离正态分布,可采用Wilcoxon符号秩检验。当前第12页\共有67页\编于星期五\7点

配对设计资料的数据表达形式研究对象处理前处理后差值d1X1Y12X2Y2345678……n当前第13页\共有67页\编于星期五\7点Wilcoxon符号秩检验的基本思想假定某种处理无作用,则每一个受试对象处理前后所得结果之差值的总体中位数M亦为0。在H0成立(两配对样本差值的总体中位数为0)的条件下,两配对样本的差值的正负及其绝对值的相对大小是随机的;在此情况下,正秩和与负秩和之间应当相近,差别不会太大;如果正秩和与负秩和之间相差足够大,则可认为H0成立的可能性很小,从而加以拒绝。当前第14页\共有67页\编于星期五\7点例9.1:某医院检验科试用新旧两种方法检测丙氨酸氨基转移酶,新方法的检测时间由20分钟缩短为10分钟。用两种方法检测同一份血清,结果见表9.1第(2)、(3)栏,问两法测得结果有无差别?

当前第15页\共有67页\编于星期五\7点表9-1两种方法测定血清谷-丙转氨酶(nmol/s/L)样品号(1)旧法(2)新法(3)16080214215232422404809053850621224372202278951009236200103843当前第16页\共有67页\编于星期五\7点表9-1两种方法测定血清谷-丙转氨酶(nmol/s/L)样品号(1)旧法(2)新法(3)差值(4)=(2)-(3)16080-202142152-103242240248090-1053850-126212243-317220227-7895100-5923620036103843-5当前第17页\共有67页\编于星期五\7点

二、检验步骤

1、建立假设,确定检验水准

H0:差值总体中位数Md=0H1:差值总体中位数Md≠0

α=0.05

2、计算统计量T:(1)求差值(2)编秩当前第18页\共有67页\编于星期五\7点编秩原则:

①依差值绝对值大小,从小到大依次编秩,并冠以“+”

或“-”号;②若差值绝对值相等:

符号相同,可以顺编,可以求平均秩次

符号不同,必须求平均秩,再冠以+、-号;③若差值为零,去掉,对子数相应减少。(3)正负秩次分别求和,以T+和T-表示(4)任取T+或T-为统计量。当前第19页\共有67页\编于星期五\7点表9-2两种方法测定血清谷-丙转氨酶(nmol/s/L)样品号旧法新法差值正差值秩次负差值秩次(1)(2)(3)(4)=(2)-(3)(5)(6)16080-2082142152-105.532422402148090-105.553850-1276212243-3197220227-74895100-52.592362003610103843-52.5(2+3)/2=2.5(5+6)/2=5.5当前第20页\共有67页\编于星期五\7点表9.2两种方法测定血清谷-丙转氨酶(nmol/s/L)样品号旧法新法差值正差值秩次负差值秩次(1)(2)(3)(4)=(2)-(3)(5)(6)16080-2082142152-105.532422402148090-105.553850-1276212243-3197220227-74895100-52.592362003610103843-52.5

T+=11T—=44当前第21页\共有67页\编于星期五\7点

判断标准:“内大、外等小”。

即若T在上下界值范围内,则P值大于相应的概率,即为“内大”。

若T在上下界值范围外(或等于界值),则P值小于(或等于)相应的概率,即为“外等小”。3、确定P值大小,做出结论(1)查表法:5≤n≤50时,查T界值表(p422)当前第22页\共有67页\编于星期五\7点本例结果分析:本例取正秩和,则T+

=11;查T界值表,双侧α=0.05的界值为8~47,本例T=11,故P>0.05;结论:不拒绝H0,尚不能认为两种方法检测血清中丙氨酸氨基转移酶含量的结果有差别。当前第23页\共有67页\编于星期五\7点

当n>50时,可用正态近似法作u检验分子中的0.5是连续性校正数,这种校正一般影响较小,常可省去。(2)正态近似法(n>50)当前第24页\共有67页\编于星期五\7点

当n>50且有相同秩号较多时,用正态近似法作u检验校正公式当前第25页\共有67页\编于星期五\7点二、单样本资料的Wilcoxon符号秩和检验

Wilcoxonsignedranktest

应用:单个样本中位数M和已知总体中位数(给某一定值)的比较当前第26页\共有67页\编于星期五\7点例:已知某地正常人尿氟含量中位数为45.3

μmol/L(1)尿氟含量(2)(1)-45.3(3)正秩(4)负秩44.21-1.091.545.30046.391.091.549.474.17351.055.75453.167.86553.267.96654.379.07757.1611.86867.3722.07971.0525.751087.3742.0711合计—(T+)64.5(T-)1.5某厂12名工人与当地正常人的尿氟含量比较当前第27页\共有67页\编于星期五\7点假设检验过程:与配对资料Wilcoxon符号秩检验假设检验步骤,

编秩步骤基本相同。

●先计算每一测量值与给定值的差数:di=xi-45.3;

●然后对差数进行编秩,与配对资料符号秩检验完全相同。此例得T=1.5,查表得P<0.005;拒绝H0,认为该厂工人的尿氟含量高于当地正常人的水平。当前第28页\共有67页\编于星期五\7点2023/6/1潍坊医学院卫生统计学教研室29Wilcoxon秩和检验(ranksumtest)用于推断计量资料或等级资料的两个独立样本所来自总体的分布位置是否有差别。简化为对两总体中位数M的比较。适用资料:两定量非正态资料或两组有序分类(等级)资料。第三节两个独立样本比较的Wilcoxon秩和检验当前第29页\共有67页\编于星期五\7点基本思想任一组秩和不应太大或太小假定H0成立:与平均理论秩和N(N+1)/4应相差不大

混合编秩

分别计算两组的秩和

当前第30页\共有67页\编于星期五\7点例9.2:某医生欲比较某新疗法与传统疗法治疗肾综合征出血热患者的降温效果,将病人随机分为两组,分别以新疗法与传统疗法治疗,以用药开始的体温降至正常值时所用的时间(小时)为疗效指标(每天固定时间测量体温四次),假定影响退热时间的混杂因素在所比较的两组间均衡,结果见表9-5,试比较两种疗法的退热时间有无差别?当前第31页\共有67页\编于星期五\7点表9-5两种疗法的退热时间(h)新疗法传统疗法25363040324435483750395639594260466448195240当前第32页\共有67页\编于星期五\7点(1)建立检验假设,确定检验水准H0:两总体分布位置相同H1:两总体分布位置同不同α=0.05当前第33页\共有67页\编于星期五\7点(2)混合编秩,求统计量T编秩原则:

(1)两组数据混合按升序编秩(2)如有相同数据在不同组时,求平均秩次。(3)两组数据分别求秩和(4)统计量的确定:n1=n2,则以任一组秩和为统计量Tn1≠n2,以n小者的秩和为统计量T

当前第34页\共有67页\编于星期五\7点表9-5两种疗法的退热时间(h)新疗法传统疗法退热时间秩次退热时间秩次25136530240932344113544813.53765015397.55616397.5591742106018461264194813.51952024021当前第35页\共有67页\编于星期五\7点(3)确定P值,作出结论若n1≤10且n2-n1≤10,通过查T界值表(附表9)确定P值;若两样本量不满足上述条件,则可采用正态近似法作u检验。当前第36页\共有67页\编于星期五\7点正态近似法分子中的0.5是连续性校正数,这种校正一般影响较小,常可省去。当前第37页\共有67页\编于星期五\7点相同秩次较多时,需采用以下公式进行校正。当前第38页\共有67页\编于星期五\7点结果分析:本例n1=10,n2-n1=1,本例取n1=10组的T值,T1=66.5,满足查T界值表的条件;查表得双侧0.05时T界值为:81-139;拒绝H0,接受H1

,认为两种疗法对肾综合征出血热患者的退热时间的总体分布位置不同。也可以用两独立样本比较Mann-WhitneyU检验(自学了解)当前第39页\共有67页\编于星期五\7点2023/6/1潍坊医学院卫生统计学教研室40

Kruskal-WallisH检验用于推断计量资料或等级资料的多个独立样本所来自总体的分布位置是否有差别。第四节多组独立样本比较的秩和检验WilliamKruskalW.AllenWallis当前第40页\共有67页\编于星期五\7点有序分类资料和不满足方差分析条件的完全随机设计多组资料比较,采用Kruskal-Wallis-H秩和检验(类似于方差分析)。适用资料:

▲多组连续变量非正态分布资料

▲多组有序(等级分组)资料。当前第41页\共有67页\编于星期五\7点例9.3

某研究者欲研究A、B两种菌对小鼠巨噬细胞吞噬功能的激活作用,将59只小鼠随机分为三组,其中一组为生理盐水对照组,用常规巨噬细胞吞噬功能的监测方法,获得三组的吞噬率(%),结果见表9.8,试比较不同实验条件下小鼠巨噬细胞的吞噬率有无差别?

当前第42页\共有67页\编于星期五\7点表9.8不同菌种对小鼠巨噬细胞的吞噬率(%)A菌组(1)B菌组(2)对照组(3)吞噬率秩次吞噬率秩次吞噬率秩次46145217471556215318325572254195823592455204916612660254411。。。。。。。。。。。。。。。。。。714572494512.57145885437871459055714592567450955875517652775394579859Ri924701145ni241916当前第43页\共有67页\编于星期五\7点(1)建立检验假设,确定检验水准H0:三个总体分布位置相同H1:三个总体分布位置不全相同α=0.05(2)混合编秩,分组求秩和,求统计量H将多组样本数据混合从小到大排序、编秩

;观察值相等但在不同组时,取平均秩次;分别计算各组样本的秩和Ri及样本量ni;当前第44页\共有67页\编于星期五\7点当相同秩次较多时,需校正。当前第45页\共有67页\编于星期五\7点当前第46页\共有67页\编于星期五\7点(3)确定P值,作出结论若组数k=3且每个样本例数ni≤5时,可通过查H界值表(附表10)确定P值;若组数k=3且最大样本例数>5或k>3时,则H或Hc近似服从ν=k-1的卡方分布,可通过查卡方界值表确定P值。当前第47页\共有67页\编于星期五\7点结果分析:本例v=2,每组例数均大于5,查卡方界值表,得。故P<0.005,拒绝H0,接受H1,认为三组菌种对小鼠巨噬细胞的吞噬率差别有统计意义,即可认为不同菌种对小鼠巨噬细胞的吞噬率的作用不同。当前第48页\共有67页\编于星期五\7点2023/6/1潍坊医学院卫生统计学教研室49第五节多组相关样本资料比较秩和检验自学:多组相关样本资料,也称为区组设计资料,或配伍组设计资料。当资料不满足方差分析条件时,可采用FriedmanM秩和检验。当前第49页\共有67页\编于星期五\7点2023/6/1潍坊医学院卫生统计学教研室50第六节等级资料的比较一、两组等级资料的比较

两组等级资料,其检验步骤与(第二节)两独立资料的Wilcoxon秩和检验相似,不同的是需要计算各等级的秩次范围、平均秩次。当前第50页\共有67页\编于星期五\7点例9.5

用某药治疗不同病情(单纯型和合并症型)的老年慢性支气管炎病人,疗效见表9.15第(2)、(3)栏,问该药对两种病情的疗效有无差别?当前第51页\共有67页\编于星期五\7点表9-15某药对支气管炎两种病情疗效的秩和检验疗效(1)单纯型(2)合并症型(3)合计(4)控制6542107显效18624有效302353无效131124合计n1=126n2=82208当前第52页\共有67页\编于星期五\7点(1)建立检验假设,确定检验水准H0:两种病情患者的疗效总体分布位置相同H1:两种病情患者的疗效总体分布位置不同α=0.05当前第53页\共有67页\编于星期五\7点(2)混合编秩,求统计量。确定各等级的合计人数;根据各等级的合计人数确定其秩次范围和平均秩;分别计算两样本的秩和T1和T2;取n较小的秩和(T)作为统计量T

;根据公式(9-3)计算u值,进行u检验。当前第54页\共有67页\编于星期五\7点表9-15某药对支气管炎两种病情疗效的秩和检验疗效(1)单纯型(2)合并症型(3)合计(4)秩次范围(5)平均秩次(6)单纯型秩和(7)合并型秩和(8)控制65421071~1075435102268显效18624108~131119.52151717有效302353132~18415847403634无效131124185~208196.52554.52161.5合计n1=126n2=82208T1=12955.5T2=8780.5平均秩次=(秩次范围上限+秩次范围下限)/2当前第55页\共有67页\编于星期五\7点结果分析:本例n1=126,n2=82,N=126+82=208,T=T1=8780.5;当前第56页\共有67页\编于星期五\7点查附表1,|u0.05/2|=1.96,故P>0.05。按的检验水准,接受H0,两种病情病人的疗效差异无统计学意义,尚不能认为该药对两种病情的疗效有差别。当前第57页\共有67页\编于星期五\7点二、多组等级资料的比较编秩步骤:同两组等级资料比较;统计量计算:同第四节多组独立样本比较的

Kruskal-WallisH检验。(1)按不同等级分组,定秩次范围;(2)求各等级平均秩次、各等级秩和;(3)多组资料分别求秩和;(4)判断方法同多组资料的比较方法。当前第58页\共有67页\编于星期五\7点例9.6五种病人阴道涂片按巴氏细胞学分级的检查结果,见表9.16第(1)~(6)栏,问五种病人细胞学分级有无程度上的差别?当前第59页\共有67页\编于星期五\7点表9.16五种病人阴道涂片的细胞学分级比较巴氏分级(1)慢性炎症(2)轻度增生(3)重度增生(4)原位癌(5)浸润癌(6)合计(7)Ⅰ211900040Ⅱ44413052Ⅲ006113148Ⅳ023154262Ⅴ000217798当前第60页\共有67页\编于星期五\7点表9.16五种病人阴道涂片的细胞学分级比较巴氏分级(1)慢性炎症(2)轻度增生(3)重度增生(4)原位癌(5)浸润癌(6)合计(7)秩次范围(8)平均秩次(9)Ⅰ2119000401~4020.5Ⅱ4441305241~9266.5Ⅲ00611314893~140116.5Ⅳ023154262141~202171.5Ⅴ000217798203~300251.5ni25255050150300

Ri696.5998.53940933530180

平均Ri27.939.978.8186.7201.2

当前第61页\共有67页\编于星期五\7点确定P值方法

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论