分类变量资料的假设课件_第1页
分类变量资料的假设课件_第2页
分类变量资料的假设课件_第3页
分类变量资料的假设课件_第4页
分类变量资料的假设课件_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十二章基于秩转换的非参数检验

山西医科大学卫生统计教研室刘桂芬

liugf66@.cn分类变量资料的假设参数检验的特点条件不满足时——采用非参数统计的方法。分析目的:对总体参数(μ

π)进行估计或检验。分布:要求总体分布已知,如:连续性资料——正态分布计数资料——二项分布、POISSON分布等统计量:有明确的理论依据(t分布、u分布)有严格的适用条件,如:正态分布Normal总体方差齐EqualVariance数据间相互独立Independent?分类变量资料的假设非参数检验又称为任意(不拘)分布检验(distribution-freetest),这类方法并不依赖总体分布的具体形式,应用时可以不考虑研究变量为何种分布以及分布是否已知,进行的是分布之间而不是参数之间的检验,故又称非参数检验(nonparametrictest),简称非参检验。

非参数检验方法很多,本章主要介绍基于秩转换的非参数检验。

非参数检验的概念分类变量资料的假设非参数检验的优点:

①适用范围广②受限条件少。参数检验对总体分布等有特别限定,而非参数检验的假定条件少,也不受总体分布的限制,更适合一般的情况。③具有稳健性。参数检验是建立在严格的假设条件基础之上的,一旦不符合假设条件,其推断的正确性将受到怀疑;而非参数检验都是带有最弱的假定,所受的限制很少,稳健性好。

分类变量资料的假设①对符合用参数检验的资料,如用非参数检验,会丢失部分信息。

②虽然非参数检验计算简便,但有些问题的计算仍显繁冗。

非参数检验的缺点:分类变量资料的假设内容提要:配对设计差值比较的符号秩检验(Wilcoxon配对法)完全随机设计两样本比较的Mann-WhiterU检验完全随机设计多个样本比较的秩和检验(Kruskal—Wallis法)随机区组设计资料比较的秩和检验Ridit分析分类变量资料的假设第一节配对设计差值比较的符号秩检验配对设计差值比较的符号秩检验由Wilcoxon1945年提出,又称Wilcoxon符号秩检验(Wilcoxonsigned-ranktest),常用于检验差值的总体中位数是否等于零。分类变量资料的假设(1)建立检验假设,确定检验水准

Ho:差值总体中位数Md=0

H1:差值总体中位数Md≠0

α=0.05分析步骤:

(2)编秩:求差值编秩方法:依差值的绝对值从小到大编秩。编秩时注意两点:遇差值为0者,舍去不计,n相应减少差值的绝对值相等,符号不同者应取平均秩次编秩后,按差值的正负给秩次冠上符号。分类变量资料的假设(3)求差值为正或负的秩和

差值为正的秩和以T+表示

差值为负的秩和以T-表示。

T++T-=n(n+1)/2

(4)确定P值和作出推断结论:

当n≤50时,查T界值表

T在界值范围内P>α

T在界值范围外P<α

分析步骤:分类变量资料的假设T界值表的构造原理假定一组配对数据n=4,则:秩次有:1,2,3,4。差值为正的秩次与差值为负的秩次共有24=16种组合。即,每种组合出现的概率为:1/16=0.0625。16种组合如下表:=》分类变量资料的假设T界值表的构造原理差值为正的秩次差值为负的秩次T+T-T概率1,2,3,4—10000.06252,3,419110.06251,3,428220.06251,2,43733}0.1253,41,27331,2,34644}0.1252,41,36441,42,3555}0.1252,31,45551,32,4464}0.12541,2,34641,23,4373}0.12531,2,437321,3,42820.062512,3,41910.0625—1,2,3,401000.0625《=返回分类变量资料的假设无论n有多大,都可以按上述方式计算得到检验统计量T的概率分布。n=4时的任一种组合的概率都>0.05,所以在T界值表中没有n=4的界值。最少也应在6对数据以上.T界值表的构造原理分类变量资料的假设

当n>50,可采用正态近似法,计算u值。

Z或正态近似法分类变量资料的假设若相同秩次较多,应作校正计算。

Z或

式中,tj为第j(j=1,2,…)个相同差值的个数。

正态近似法分类变量资料的假设第二节完全随机设计两样本比较的

Mann-Whiter(U检验)

某医师测得两组28名妇女大腿内侧皮下脂肪厚度,试进行Mann-WhiterU检验.

甲组1.82.22.52.83.23.63.84.0

4.24.44.85.66.06.26.67.0

10.0

乙组1.82.02.02.03.03.84.25.4

7.6

分类变量资料的假设1.建立检验假设,确定检验水准(α)

H0:两总体分布位置相同,总体中位数M1=M2

H1:两总体分布位置不同,总体中位数M1≠M2

α=0.05。2.选择B组,清点每组数据B前A组数据的个数.

按数值由小到大排列,若有相同数据,取平均秩。分析步骤:

分类变量资料的假设3.计算U值,并确定检验统计量

求出两组的秩统计量UA、UB。

4.确定P值和作出推断结论

分析步骤:

分类变量资料的假设当n1>20或(n2-n1)>10时,附表6中查不到P值,则可采用正态近似法求u值来确定P值,其公式如下:

Z或正态近似法分类变量资料的假设第三节完全随机设计多样本比较

的秩和检验一、原始数据的K—W检验(Kruskal—Wallis法)

分析步骤:

1.建立检验假设,确定检验水准

2.混合编秩

3.求秩和并计算检验统计量H

4.确定P值和作出推断结论分类变量资料的假设1.建立检验假设,确定检验水准(α)

H0:k个总体分布位置相同;

H1:k个总体分布位置不同或不全相同;

α=0.05。2.混合编秩

将各组数据混合,由小到大编秩。遇有原始数据相同时,若相同数据在同一组内,则仍按顺序编秩;若相同数据在不同组,则取它们的平均秩次。

分析步骤:分类变量资料的假设3.求秩和并计算检验统计量H

将各组秩次分别相加,求出各组的秩和Ri。i为组序。检验统计量值H可按下式计算:

式中,Ri为各组的秩和,ni为各组样本含量,N为总样本含量。分析步骤:分类变量资料的假设当各组相同秩次较多时,可对H值进行校正,按下式求值。分析步骤:分类变量资料的假设4.确定P值和作出推断结论

当组数K=3,每组样本含量ni≤5时,可查附表(H界值表)得到P值。

若k>3或ni>5时,H值的分布近似于自由度为k-1的χ2分布,此时可查附表4χ2界值表得到P值。

最后按P值作出推断结论。

分析步骤:分类变量资料的假设二、频数表资料的K—W检验

分析步骤:

1.建立检验假设,确定检验水准

2.编秩

3.求秩和并计算检验统计量H

4.确定P值和作出推断结论分类变量资料的假设白细胞(1)支气管扩张(2)肺水肿(3)肺癌(4)病毒性呼吸道感染(5)合计(6)秩次范围(7)平均秩次(8)-++++++029635525732353011192010

1—1112—3031—5051—60

62140.555.5RiNi739.517.043.50

436.51529.10

409.51724.09244.51122.23—60———————四种疾病患者痰液内嗜酸性粒细胞比较分类变量资料的假设第四节随机区组设计资料比较的秩和检验随机区组设计资料比较,如果观察结果不满足方差分析条件,可用FriedmanM检验(Friedman’sMtest)。分析步骤1.建立检验假设和确定检验水准2.编秩:先在每一配伍组内将数据从小到大编秩,如有相同数据,取平均秩次;再求各处理组秩和Ri,i=1,2,...,k。分类变量资料的假设3.计算检验统计量M值(1)查表法(b≤15,k≤15):M=Σ(Rj-R)2==》M界值表基于χ2分布近似法得到χ2值查有关的M界值表(2)χ2分布近似法分析步骤4.确定P值和作出推断结论返回主题分类变量资料的假设第五节多个样本资料的两两比较如同方差分析一样,当多个样本比较的秩和检验,拒绝H0,认为多组处理效应不同或不全相同时,常需进一步作两两比较的秩和检验,以推断哪些组之间不同,或哪些组之间相同。分类变量资料的假设一、成组设计资料的两两比较成组设计多组定量资料或等级资料比较,经Kruskal-Wallis检验,拒绝H0后,需进一步作两两比较。分析步骤:

1.建立检验假设和确定检验水准

2.计算检验统计量

3.确定P值并作出推断结论分类变量资料的假设分析方法之一:

——精确法:样本含量较小时,采用两样本秩和检验。之二:

——正态近似法——Z或u检验法之三:

——(扩展的)t检验法分类变量资料的假设

RA、RB:任两个对比组A及B的秩和,分母:-的标准误其中、nA、nB分别为A、B两组相应的样本例数平均秩次:=RA/nA及

=RB/nB

,k:处理组数,n:各处理组的总例数。方法之二:正态近似法公式:分类变量资料的假设方法之二:正态近似法如何确定P值?

——u界值表检验水准α=0.05?由于K个样本两两比较增大了第一类错误,为保证α=0.05,需要对检验水准进行调整,即:α‘=α/比较的次数多组间两两比较:α’=α/[k(k-1)/2]多个实验组与对照组比较α‘=α/(k-1)分类变量资料的假设

RA、RB:任两个对比组A及B的秩和,分母:A-B的标准误其中、nA、nB分别为A、B两组相应的样本例数平均秩和A=RA/nA及B=RB/nB

,k:处理组数,n:各处理组的总例数。H:H检验统计量。方法之三:t检验法公式:v=n-k分类变量资料的假设二、随机区组设计资料的两两比较随机区组设计资料经Friedman检验拒绝H0,可进一步作两两组间比较方法步骤(同前)分析方法:之一:精确法之二:正态近似法——Z或u检验法之三:q检验法分类变量资料的假设方法之二:正

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论