秩和检验【统计学】.ppt_第1页
秩和检验【统计学】.ppt_第2页
秩和检验【统计学】.ppt_第3页
秩和检验【统计学】.ppt_第4页
秩和检验【统计学】.ppt_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、9 非参数统计分析方法 non-parametric statistics,余小金 东南大学公共卫生学院 流行病学与卫生统计学系,1,主要内容Outline,9.0 Introduction to nonparametric test 9.1 Wilcoxon signed rank test( paired design) 9.2 Wilcoxon rank sum test( completely randomized design, 2 groups) 9.3 Wilcoxon rank sum test( completely randomized design, more than

2、2 groups) 9.4 multiple comparison,2,9.0非参数检验简介 9.1配对设计秩和检验 9.2完全随机设计秩和检验 9.3多组比较秩和检验 9.4 两两比较,两类统计方法,参数统计方法 总体均数的可信区间估计 均数比较的t检验或z检验 均数比较的方差分析 率比较的u检验 非参数统计方法 卡方检验 秩和检验,3,t检验等的条件 正态性 方差齐性,非参数统计 (nonparametric statistics),概念 不以一定的抽样分布为基础;不通过统计量来估计参数或对参数进行推断。常用的有符号检验,秩和检验,卡方检验,游程检验等 优缺点 计算简单;不需严格的正态性假

3、设,因而适用范围广; ;对异常数据不敏感;单调转换下的不变性; 检验效能低;,4,非参数统计方法的适用范围,5,统计学家们Wilcoxon-Mann-Whitney,20世纪40年代,美国氰胺公司化学家Frank wilcoxon 实验中由于仪器的预热过程,数据变异较大,导致t检验方法似乎有误。 基于组合与排列的方法。 Wilcoxon, F. (1945) Individual Comparisons by Ranking Methods. Biometrics Bulletin 1: 8083. 经济学家Henry B.Mann和Ohio State University 统计学研究生 D

4、.Ransom Whitney 20世纪30年代,苏联数学家安德烈柯尔莫哥洛夫和N.V.Smirnov 发展了无需使用参数的分布比较方法,6,Frank wilcoxon (1892-1965),位次(rank)的概念,中位数(median)复习概念 数值的具体大小与相对大小(exact magnitude and relative magnitude) 不考虑数值的具体大小,只考虑其相对大小,用对代表秩次的连续整数的统计来代替对具体数值计算统计指标。所以,秩和检验不是针对总体的数值分布,而是总体的位置排列。,7,一个小问题,比较男生与女生的平均身高(不许用任何测量工具),8,9.2 两样本比

5、较的秩和检验Wilcoxon rank-sum test,表9.2 两种方法治疗胆道梗阻患者测得血清总胆红素下降量,9,检验假设,H0:.的分布位置相同。 H1:.的分布位置不同。 =0.05,10,11,求检验统计量T值,统一排序,并给予秩次(为什么?)。 遇相同数据时,怎么办? 分别求两组秩和,以样本含量较小者为n1,其秩和为统计量T。若n1=n2,可取任一组的秩和为T。 本例T1=78(n1=10),T2=175(n2=12),T=78。,12,确定P值和作出推断结论,由n1,n2-n1查附表18,若T值在界值T范围内,则P;若T值在界值T外,或恰好等于下界值(或上界值),则P。 本例n

6、1=10,n2-n1=23,T=78,查附表12得双侧P0.05,按=0.05水准,拒绝H0,接受H1,故认为可以认为两组患者血清总胆红素下降量是不相同的。,13,基本思想,N=n1+n2 秩次应从1到N,总秩和是一定的,即从1到N的连续整数的求和。 如果两样本来自一个总体,样本例数相等时,应平分总秩和;样本例数不等时则按比例分总秩和。,14,正态近似与校正数,如果n1或n2-n1超出附表的范围,可用正态近似法即u检验计算u值.相同秩次较多时要作校正。,15,uc=,表9.3 两种疗法对急性脑梗死期的疗效比较,16,9.1 配对符号检验Wilcoxon signed-rank test 表9.

7、1 治疗前后测得患者血清总胆红素,17,检验假设,H0 :所测前后值的总体分布位置相同,差值的总体中位数Md=0); H1:所测前后值的总体分布位置不同( Md0); =0.05,18,求检验统计量 T值,编秩 依差值的绝对值从小到大编秩,再根据差值的正、负给秩次冠以正负号; 编秩时如遇差值等于0,舍去不计,有效对子数n相应减少,本例有效对子数n=8; 遇有差值的绝对值相等,符号不同,则取其平均秩次。如表10.6第(4)栏中差值绝对值等于0.02的有4个,它们位次是4、5、6、7,其平均秩次为(4+5+6+7)/4=5.5。 分别求出正、负秩次之和T+ 和T-(二者之和等于n(n+1)/2。可

8、用于验算计算是否正确)。 本例T+=41,T-=14(和为55),任取T+ (或T- )作检验统计量T.本例取T=14,19,确定P值和作出推断结论,当n。 本例n=10,T=14;查附表,得T在双侧界值范围内,P 0.05。按双侧=0.05水准,不拒绝H0 ,故尚不能认为术前和术后患者血清总胆红素检测结果有差别。,20,正态近似法,当n 25,超出附表17的范围,可用正态近似法即u检验,按式(10.6)计算 u值:,21,9.3 多个样本比较的秩和检验Kruskal-Wallis H test,22,表9.4 4组人群AFP检测结果,假设检验步骤,23,H0:四组人群AFP检测结果总体分布相同; H1:四组人群AFP检测结果总体分布不同或不完全相同 (1)编秩;(2)求秩和 (3) 计算统计量H 确定P值和作出推断结论 若组数k=3,每组例数ni5,可查附表19,H界值表得出P值; 若k3最小样本例数不小于5,则H近似服从=k-1的2分布。 本例k=4,每组例数ni

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论