常用非参数统计方法课件_第1页
常用非参数统计方法课件_第2页
常用非参数统计方法课件_第3页
常用非参数统计方法课件_第4页
常用非参数统计方法课件_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、常用非参数统计方法孙金芳 sjf_流行病与卫生统计学系东南大学公共卫生学院概念复习统计描述数值资料 (P4 变量的分类)集中趋势 平均数 (P9) 算术均数:单峰对称分布(正态、近似正态分布)中位数: 偏态分布、分布不规则、开口资料(位置指标,对分布不作要求)2022/8/202参数统计 VS 非参数统计参数统计(parametric statistics):已知总体分布类型,通过样本统计量对总体参数进行估计和检验。区间估计:t检验: u1= u2 ?要求独立随机样本、取自正态总体、方差齐性非参数统计(nonparametric statistics):不依赖总体分布类型,不对参数进行估计或检

2、验,通过样本观察值推断总体分布位置是否相同。2022/8/203 非参数检验又称任意分布检验(distribution-free test)。优点:资料分布特征要求较低,适用范围广,收集资料方便;对不满足参数方法的资料,效率高。缺点:对适宜用参数方法的资料,若用非参数法处理,没有充分利用资料提供的信息,导致检验效能下降。犯第类错误概率比参数检验大。 非参数方法很多,主要介绍秩和检验(rank sum test) 。2022/8/20414102311131214155678916非正态分布:两个班同学(n1,n2)从高到低、交错地排在队伍中,编号(即身高的秩次),若两个班同学身高相近(排列均匀

3、),则每个班所报数字之和(秩和T)与其理论秩和相差不大。反之,则有理由相信其中一个班同学的身高比另一个班高。比较 n1的秩和T与其理论秩和n1(N+1)/2,这就是秩和检验的思想。 2022/8/206 秩(rank):观察值从小到大排序,该序号在统计学上称为秩/秩次;秩和:秩次求和得到;秩和检验:用秩和进行假设检验的方法。秩(rank) 秩和(rank sum)秩和检验(rank sum test) 秩和检验(rank sum test)用数据排序的秩来代替原数据进行假设检验: 位置检验适宜作非参数检验的资料 计量资料,总体偏离正态性或总体分布未知 等级资料:痊愈、显效、有效、无效;-、 、

4、+、+、+; 心功能分级;烧伤程度 边界不确定的资料:如出现50mg或0.5mg以下2022/8/208两样本比较秩和检验 例 测得铅作业与非铅作业工人的血铅值 (mol/L),问两组工人的血铅值有无差别?2022/8/209SPSS 软件检验正态性与方差齐性结果正态性检验groupKolmogorov-SmirnovaShapiro-Wilk统计量dfSig.统计量dfSig.x铅作业组.2017.200*.8637.162非铅作业组.17410.200*.91910.3482022/8/2010一、建立检验假设,确定检验水准0:铅作业与非铅作业工人血铅值分布的位置相同,1:铅作业与非铅作业

5、工人血铅值分布的位置不同。 0.052022/8/2011二、计算检验统计量T 值混合编秩0.24 0.24 0.29 0.33 0.44 0.58 0.63 0.72 0.82 0.87 0.87 0.97 1.01 1.21 1.64 2.08 2.13 遇有原始数据相同时,可分两种情况处理:相同数据在同一组,其秩次按位置的顺序。相同数据分在两组,均取其平均秩次(10+11)/2=10.5。 2022/8/20122022/8/2013两组秩次分别相加 T1=93.5 T2=59.5取较小样本的秩和记为统计量 T, 本例 n1=7,n2=10,取=T193.5两组合计的秩和为多少?2022

6、/8/2014查附表12, n1=7, n2-n1=10-7=3, 原则:内大外小 双侧0.0542-84 拒绝 42 接受 84 拒绝 按0.05水准,拒绝H0,接受H1,故认为铅作业工人比非铅作业工人血铅值高。三、确定P值和作出推断结论2022/8/2015正态近似检验,公式为: 当相同秩次较多时, 2022/8/2016等级资料的形式例10.2 用某药治疗不同病情的老年慢性支气管炎病人,疗效见表10.2第(1)、(2)两栏,问该药对两种病情的老年慢性支气管炎病人的疗效是否相同? 常错误采用 卡方检验2022/8/2017一、假设H0:两种病情病人的疗效分布相同。H1:两种病情病人的疗效分

7、布不同。=0.052022/8/2018二、计算检验统计量uc值 排秩求秩和统计量T 。n1=82,T=8780.5本例n1=82,n2=126,n2-n1=44,已超过附表12所列范围,2022/8/20192022/8/2020三、确定P值和作出结论推断 uc0.05,按=0.05水准尚不能拒绝H0,故认为本疗法对上述两种病情的患者并未显示出不同疗效。 卡方检验未考虑等级的强弱信息,秩和检验更适合于单向有序分类资料。2022/8/2021多个样本比较的秩和检验多个组资料:1 有序分类资料2 定量资料,但其不满足正态性或方差齐性H检验(Kruskal-Wallis 法) 2022/8/202

8、2例10.3 在研究白血病时,测得鼠脾的DNA含量如表10.3第(1)、(3)、(5)、(7)栏。问不同病情的鼠脾DNA含量有无差别?2022/8/2023一、建立假设检验,确定检验水准H0:四种鼠脾DNA含量总体分布位置相同。 H1:四种鼠脾DNA含量总体分布位置不同 或不全同。 2022/8/2024二、计算检验统计量混合编秩: 由小到大排列,统一编秩相同值:同组顺序编号,不同组取平均秩次。计算各组秩和Ri (i=1,2,3,4)计算统计量H值 2022/8/2025三、确定P值,作出统计推断K=4, ni5, H20.05(3),即P,因此拒绝H0,接受H1认为四种鼠脾DNA含量总体分布

9、位置不同或不全同 。K=3,ni3,最小样本例数=5,近似服从自由度为k-1的卡方分布, 2 界值表。2022/8/2026等级资料(校正H)例10.4某医生用三种方剂治疗某妇科病,疗效如表10.4,问三种方剂的疗效有无差别?2022/8/2027假设H0:三种方剂疗效分级的总体分布相同。H1:三种方剂疗效分级的总体分布不同或不全同。 =0.05求检验统计量Hc 2022/8/20282022/8/2029多个样本间的多重比较当多个样本比较的秩和检验拒绝H0,认为各总体分布位置不同或不全相同时,常需进一步作两两比较的秩和检验,以推断哪两个总体分布位置不同,或哪两个总体分布位置相同。 为此需进行

10、组间的多重比较(multiple comparison)。 2022/8/2030配对符号秩和检验 主要用于配对数值变量资料的检验。例 用过硫酸铵分光光度法和示波极谱法测定水中锰的含量(mg/L),见表10.第(2)、(3)栏,问两法结果有无差别? 2022/8/2031差值的正态性检验正态性检验Kolmogorov-SmirnovaShapiro-Wilk统计量dfSig.统计量dfSig.d.3339.005.6029.0002022/8/2032检验的基本思想: 假定两种处理效应相同,则差值的总体分布是以0为对称的,即差值总体中位数为0。 相当于这些差值按绝对值大小编秩,再冠以原来的正、

11、负符号,正秩与负秩在理论上是随机的,即正、负秩和应相近。配对设计资料主要是对差值进行分析。2022/8/2033H0:两种方法所测值总体分布位置相同,即 (差值的总体中位数为零)。H1:两种方法所测值总体分布位置不同,即 (差值的总体中位数不为零)。一、建立假设检验,确定检验水准2022/8/2034二、计算检验统计量算出各对数值之代数差 d=xi-yi编秩 a:将差值的绝对值从小到大编秩 b: 当差值为0,则不计该例(n随之减少) c: 如两差值相等,则取其平均秩次给秩添加正负号 d0的秩次为“”;d0.10 按=0.05水准,不能拒绝H0,尚不能认为两种方法测定锰含量有差别。2022/8/2036正态近似法(N50)n50, 可利用秩和分布的正态近似法,其中 统计量2022/8/2037正态近似法公式确定概率P: 2022/8/2038统计学基本内容2022/8/2039分析资料的步骤:1、确定资料的类型: 分类资料、定量资料;2、选择适当的统计方法;3、作出统计推断结论。定量资料的分析: t检验 Z(U)检验 (F检验)分类资料的分析: 检

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论