医学统计学教学课件:第十章 基于秩次的假设检验方法_第1页
医学统计学教学课件:第十章 基于秩次的假设检验方法_第2页
医学统计学教学课件:第十章 基于秩次的假设检验方法_第3页
医学统计学教学课件:第十章 基于秩次的假设检验方法_第4页
医学统计学教学课件:第十章 基于秩次的假设检验方法_第5页
已阅读5页,还剩97页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第十章 基于秩次的假设检验方法主要内容配对设计资料的符号秩和检验单样本资料的符号秩和检验完全随机化设计两独立样本的秩和检验完全随机设计多个独立样本的秩和检验随机化区组设计资料的秩和检验复习参数统计: 计量资料通常要求样本来自正态总体,或方差齐等,在此基础上用样本统计量对总体参数进行推断或作假设检验的统计分析方法。参数检验方法t检验两独立样本t检验要求:正态、方差相等、个体独立配对t检验要求:差值正态、个体独立方差分析完全随机设计方差分析要求:正态、方差相等、个体独立参数检验方法两组性别结构是否相同?两组某种不良反应的发生率是否相同?多组发生率是否相同?多组构成是否相同?定性无序分类资料未解决的

2、问题疗效用痊愈、显效、有效、无效四级分类法进行评价时,两组或多组如何比较?对两组患者空腹胰岛素水平进行比较时,有的病例测量结果为Ins300,如何处理?未解决的问题对应于多分类变量(有序)非正态分布不完整数据:如,Ins300正态分布但方差不相等时非参数检验的概念非参数检验又称为任意(不拘)分布检验(distribution-free test),这类方法并不依赖总体分布的具体形式,应用时可以不考虑研究变量为何种分布以及分布是否已知,进行的是分布之间而不是参数之间的检验,故又称非参数检验(nonparametric test),简称非参检验。非参数检验的优缺点1.优点 适用范围广,且收集资料、

3、统计分析比较简单。2.缺点 损失了部分信息,检验效能降低了,容易犯第二类错误。已知总体分布类型,对未知参数(、)进行统计推断依赖于特定分布类型,比较的是参数 参数统计(parametric statistics) 非参数统计(nonparametric statistics)对总体的分布类型不作任何要求 不受总体参数的影响,比较分布或分布位置 适用范围广;可用于任何类型资料(等级资料,或“50mg” ) 参数检验与非参数检验比较参数检验 非参检验 要求资料服从某种分布 对资料的分布没有特殊要求,总体为偏态、总体分布未知的计量资料(尤其在n60,60例2 9名 肺炎病人的治疗结果:危险程度 治愈

4、 治愈 死亡 无效 治愈 有效 治愈 有效 无效 秩次 3 6 4 9 2 8 1 5 7 10 11 10.5 10.5平均秩次 2.5 2.5 9 7.5 2.5 5.5 2.5 5.5 7.5秩次 1 2 9 7 3 5 4 6 8第一节 配对设计资料的符号秩和检验复习:配对设计1.同一受试对象分别接受两种不同的处理2.同一受试对象处理前后3.两个同质受试对象分别接受两种不同的处理适用条件 1. 配对设计的计量资料,但不服从 正态分布或分布未知 2. 配对设计的等级资料Wilcoxon符号秩检验,用于推断配对资料的差值是否来自中位数为0的总体。家兔号A照射B照射A-B秩次(1)(2)(3

5、)(4)(5)139551610242541293515543443474355553-2-164563181172252301284844-4-39404886104555108114032-8-612495786合计R=10(68) 表1 家兔皮肤损伤程度(评分)(1)建立检验假设,确定检验水准 Ho:差值总体中位数Md=0 H1:差值总体中位数Md0 =0.05分析步骤: (2)编秩:求差值编秩方法:依差值的绝对值从小到大编秩。编秩时注意两点: 遇差值为0者,舍去不计,n相应减少;差值的绝对值相等,取平均秩次编秩后,按差值的正负给秩次冠上符号。(3)求差值为正或负的秩和 差值为正的秩和以

6、T+表示 差值为负的秩和以T-表示。 T+T-=n(n+1)/2 T=min(T+,T-) (4)确定P值和作出推断结论: 当n50时,查T界值表(附表11,P503) T在界值范围内 P T在界值范围外或相等 P50,可采用正态近似法,计算z值。 若相同秩次较多(超过25%),应作校正计算。 Z 或 式中,tj为第j(j=1,2,)个相同差值的个数。 正 态 近 似 法到例题例10-1 临床某医生研究白癜风病人的白介素IL-6水平(u/l)在白斑部位与正常部位有无差异,调查的资料如表1所示:表10-1 白癜风病人的不同部为白介素IL-6指标(u/l)病人号白斑部位正常部位140.0388.5

7、7297.1380.00380.32123.72425.3239.03519.6124.37614.5092.75749.63121.57844.5689.76一般步骤建立假设检验H0:差值的总体中位数为0;H1:差值的总体中位数不为0(双侧);或差值的总体中位数0(0,则秩次为“+”,d0,则秩次为“-”;求正负秩次之和T+与T-,绝对值较小者,作为统计量T值。表 3 白癜风病人的不同部为白介素IL-6指标(u/l)病人号白斑部位正常部位d=正常-白斑秩次140.0388.5748.54297.1380.00-17.13380.32123.7243.40425.3239.0313.71519

8、.6124.374.76614.5092.7578.25749.63121.5771.94844.5689.7645.20合计13 4 5 6 7 8-3T+=33T-=32查配对比较的符号秩和检验表,确定P值范围。当n50时,查附表11的T界值表,当T恰为附表的界值时, P值一般小于 表中对应的概率值; 本例n=8,查T界值表T0.05(8)=333,P 0,即差值的总体中位数大于零, 取单侧检验水准为0.05。 3. 编秩去掉d=0的对子,总的对子数也要相应减去;用绝对值d编秩次,如果出现绝对值相等时(ties),则将它们的平均秩次值作为他们的秩次;把差值的符号标在秩上,如果d0,则秩次为

9、“+”,d0,则秩次为“-”; 4. 求正负秩和并确定检验统计量T+=62.5, T-=3.5; T=min(T+,T-)=3.55. 确定P值并作出统计推断 本例n=11,T=3.5,查配对设计T界值表,得P10或(n2-n1)10时,附表12中查不到P值,则可采用正态近似法求Z值来确定P值,其公式如下:正态近似法若相同秩次较多,应作校正计算例10.4 对无淋巴细胞转移与有淋巴细胞转移的胃癌患者,观察其生存时间,问两组患者的生存时间是否不同? 无淋巴细胞转移有淋巴细胞转移时间秩次时间秩次1252582712291238124217462146245629603034364048n1=10n2

10、=14表10.4 两组胃癌患者生存时间1. 建立假设: H0:两总体分布相同, H1:两总体分布不同; =0.05假设检验步骤 计算统计量 将两个样本由小到大的顺序统一编秩,数值相等时取平均秩次,求出两组秩和,以样本含量较小组的秩和作为检验统计量T,T=T1=162 查表及结论 n1=10, n2-n1=14-10=4,查T界值表(附表12) T0.05(4)=91-159, T =162落在界值范围外,所以P 0.05,拒绝 H0,认为两组患者的平均生存时间不同。二、等级资料的两样本比较例10.544例健康人与24例慢性气管炎病人痰液嗜酸性粒细胞的测量值(*106/L),问健康人与慢性支气管

11、病人痰液嗜酸性粒细胞有无显著差别?表10.5 两组人痰嗜酸性粒细胞的秩和计算嗜酸性粒细胞数(1)健康人(2)病人(3)-511+1810+163+50合计4424一般步骤建立假设检验及确定显著水准H0: 两总体分布相同H1: 两总体分布不同 =0.05 编秩号两样本观察值从小到大混合编秩,编秩时,观察值相同时,取原秩次的平均秩次。嗜酸性粒细胞数(1)例数统一编秩健康人(2)病人(3)范围(4)平均秩次(5)-5111-168.5+181017-4430.5+16345-6354.0+5064-6866.0合计4424表10.5 两组人痰嗜酸性粒细胞比较求秩和设n1和n2分别为两样本的含量,规定

12、n1n2。分别计算两样本含量为n1和n2组对应的秩和T1和T2,取样本含量小的n1的秩和T1为统计量T值。嗜酸性粒细胞数(1)例数统一编秩病人组秩和(6)=(3)*5健康人(2)病人(3)范围(4)平均秩次(5)-5111-168.593.5+181017-4430.5305.0+16345-6354.0162.0+5064-6866.00.0合计4424T1=560.5表10.5 两组人痰嗜酸性粒细胞比较确定P值当n110,且相同秩次较多,所以计算z值的校正值 Z0.05=1.96,Z Z0.05, P0.05,拒绝H0,认为总体分布不同,即健康人与气管炎病人的痰液嗜酸性粒细胞数有差别。 (

13、查附表2 自由度趋于无穷大时)基本思想: 如果H0成立,由于抽样误差的存在两样本的平均秩和不一定相等,但差别不应太大。当两样本平均秩和相差太大,超出了抽样误差可以解释的范围时,有理由怀疑H0的正确性,从而拒绝H0问题1:两小样本定量资料比较的假设检验,首先应考虑 A. 用t检验 B. 用秩和检验 C. t检验与秩和检验均可 D. 资料符合t检验还是秩和检验的条件问题2:两样本秩和检验的是 ( )。两样本秩和相等两总体分布相同 两样本分布相同两总体秩和相等两总体均数相等问题3:对于RxC列链表资料,若R是等级资料,比较的目的是推断C的处理组处理效应的等级是否不同时,宜用 A. t检验 B. 检验

14、 C. 秩和检验 D. F检验 问题4:两独立样本比较的秩和检验,其检验统计量T是( )。A. 为了查T界值表方便,一般以秩和较小者为TB. 为了查T界值表方便,一般以秩和较大者为TC. 为了查T界值表方便,一般以例数较小者秩和为TD. 为了查T界值表方便,一般以例数较大者秩和为TE. 当两样本例数不等时,任取一样本的秩和为T都可以查T界值表问题5:在作两样本比较时,已知n1,n2均小于30,总体方差不齐且呈极度偏峰的资料宜用 A. t检验 B. t检验 C. Z检验 D. 秩和检验第 四 节 完全随机设计 多组独立样本的秩和检验适用条件:不满足参数检验应用条件的完全随机设计的多个样本比较多个

15、等级资料比较基本思想: 如果各总体分布相同,则各组混合编秩的平均秩次应该相差不大 采用Kruskal-Wallis 秩和检验,又称K-W检验或H 检验 1.建立假设,确定检验水准 H0:多个总体分布相同 H1:多个总体分布不全相同 =0.052.编秩:多组数据从小到大混合编秩。 遇相同数据,取平均秩次。3.求各组秩和:将各组秩次相加,即Ti, i 表示组号。4.计算检验统计量假设检验步骤 统计量计算公式: 为各组的秩和, 为各组对应的例数, N为总例数当相同秩次较多时,采用校正公式H 和HC 近似服从自由度为g -1的 分布,查 界值表确定P 值5.确定p值,得出结论:(1)当k=3(k为组数

16、),每组例数ni 5,查H界值表(附表13,三样本比较的秩和检验用)。(2)当k3,ni5,近似服从 = k 1 的 2 分布,查2 界值表(附表3 2 界值表) 。例10.6某医师检测种卵巢功能异常患者血清中促黄体素的含量()资料见下表,问种患者血清中促黄体素的含量是否有差别?1. 定量变量多组独立样本的秩和检验卵巢发育不良丘脑性闭经垂体性闭经促黄体素含量()秩次()促黄体素含量()秩次()促黄体素含量()秩次().表10.6三种卵巢功能异常患者血清中促黄体素的含量一、建立检验假设,确定检验水准 H0 :三组卵巢功能异常患者血清中促黄体素的含量总体分布位置相同; H1:三组卵巢功能异常患者血

17、清中促黄体素的含量总体分布位置不全相同。 =0.05二、计算统计量 混合编秩号,分组求秩和R1,R2,R3, 相同秩次取平均秩次。 计算检验统计量HH的校正, ti是相同秩次个数。 本例数据同秩不多,不用校正 三、 求P值,下结论 0.05,自由度为2 的 界值为5.99 5,=k-1=3-1=2 查界值表20.01(2)=9.21, 220.01(2); 5,=k-1=3-1=2 查界值表 = 9.21, 2 ; 0.01按0.05水准,拒绝H0,接受H1, 故可认为三种复方小叶枇杷治疗老年慢性支气管炎疗效不全相同3.多个独立样本的多重比较如同方差分析一样,当多个样本比较的秩和检验,拒绝H0

18、,认为多组处理效应不同或不全相同时,常需进一步作两两比较的秩和检验,以推断哪些组之间不同,或哪些组之间相同。 R、R:任两个对比组及的秩和,分母: - 的标准误其中、 n、n分别为、两组相应的样本例数平均秩次: =R/ n 及 =R/ n ,:各处理组的总例数。公式:对例10.8做三个样本间得两两比较建立检验假设,确定检验水准 :任意两组总体分布位置相同 :任意两组总体分布位置不同 计算检验统计量t值对比组()()()()()()老复方与复方38210177.934.72420.20复方与复方1013947.691.71580.053. 确定值,做出统计推断第五节随机区组设计资料的秩和检验若随

19、机区组设计的计量资料不满足方差分析的条件时,可用Friedman秩和检验,又称M检验。复习:随机区组设计随机区组设计:是配对设计的扩展。设计方法是按两个因素分组,一个是区组因素,一个是处理因素。具体做法:按实验对象的自然属性或对实验结果有影响的非实验因素设置区组(block),如将同窝别或体重相近的同种系动物配成区组,再分别将各区组内的动物随机分配到各个不同处理组中,每只动物接受一种处理。各处理组的动物不仅数量相等,而且生物学特点也较均衡。例10.9 调查某城市七所医院一年内春、夏、秋、冬四个季节婴儿出生数,试比较七所医院不同季节的婴儿出生数是否有差别?假设检验步骤1.建立假设检验H0:4个季节婴儿出生数的总体分布相同H1:4个季节婴儿出生数的总体分布不同 0.052.编秩将各区组内(同一个医院)的数据由小到大编秩,遇相同数值取平均秩次,再将各处理组(季节)的秩次相加,得到各处理组秩和Rj3.计算统计量M值4.确定P值,做出推断结论1)查表法: 当区组数b15,处理组数k15时,查附表14. 本例区组数b=7,处理组数k=4,查附表14 M0.05=92,MM0.05,P0.05;按=0.05 检验水准,不拒绝H0。尚不能认为各医院 不同季节婴儿出生数有差别。2)2 近似法: 当区组数b或处理组数k超出M界值表的范围

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论