分类变量资料的假设检验_第1页
分类变量资料的假设检验_第2页
分类变量资料的假设检验_第3页
分类变量资料的假设检验_第4页
分类变量资料的假设检验_第5页
已阅读5页,还剩74页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

关于分类变量资料的假设检验第一页,共七十九页,编辑于2023年,星期日非参数检验又称为任意分布检验(distribution-freetest),它不考虑研究对象总体分布具体形式,也不对总体参数进行统计推断,而是通过检验样本所代表的总体分布形式是否一致来得出统计结论。第二页,共七十九页,编辑于2023年,星期日非参数检验的优点:

①适用范围广,不论样本来自的总体分布形式如何,都可适用;

②某些非参数检验方法计算简便,研究者在急需获得初步统计结果时可采用;

③易于理解和掌握;

④可用于不便精确测量的资料或等级资料。

第三页,共七十九页,编辑于2023年,星期日非参数检验的缺点:

①对符合用参数检验的资料,如用非参数检验,会丢失信息,导致检验效率下降,犯第Ⅱ类错误的可能性比参数检验大。

②虽然许多非参数检验计算简便,但有些问题的计算仍显繁冗。

第四页,共七十九页,编辑于2023年,星期日配对资料的符号秩和检验

(Wilcoxon配对法)

第五页,共七十九页,编辑于2023年,星期日例6-1某医院对12例患者进行“巩膜瓣下灼烙角膜咬切术”,手术前后的视力如表6-1,问手术后视力是否有改善?

第六页,共七十九页,编辑于2023年,星期日第七页,共七十九页,编辑于2023年,星期日(1)建立检验假设,确定检验水准

H0:差值总体中位数0,即手术前

后视力无变化;

H1:Md≠0,手术前后视力有变化;

α=0.05

第八页,共七十九页,编辑于2023年,星期日(2)求每对观察对象数据的差值,如上表第(4)栏;

第九页,共七十九页,编辑于2023年,星期日(3)编秩:依差值的绝对值从小到大编秩。编秩时,遇差值为0者,舍去不计,同时样本例数相应减去(如本例病人编号为3、5、11的三对数据差值为0,故编秩时舍去,样本例数n=12-3=9);第十页,共七十九页,编辑于2023年,星期日遇绝对值相等差值,若正负号一致,则按顺序编秩即可,若有符号不同者,则应取平均秩次(如本例中病人编号为4、10、12的三对数据差值的绝对值均为0.1,其秩次按顺序编为1、2、3,但因差值有正有负,故取平均秩次(1+3)/2=2;同理,病人编号为2、9的两对数据编秩结果取平均秩次8.5)。编秩后,按差值的正负号给秩次添上符号。第十一页,共七十九页,编辑于2023年,星期日(4)求秩和并确定检验统计量:

分别求出正负秩次之和,正秩和以T+表示,负秩和的绝对值以T-表示。T+及T-之和等于n(n+1)/2。此式可验证T+和T-的计算是否正确。如本例T+=19.5,T-=25.5,其和为45,n=9(因舍去三对差值为0的数据),9(9+1)/2=45。取T+和T-中较小者作为检验统计量T,本例取T=19.5。第十二页,共七十九页,编辑于2023年,星期日(5)确定P值和作出推断结论:当n≤50时,查附表5,配对比较的符号秩和检验用T界值表,按所取检验水准作出推断结论(此界值表用下限界值,T值越大,P值越大;反之P值越小)。本例n=9,T=19.5,查附表7,T界值表,得双侧P>0.10,按双侧α=0.05水准,不拒绝H0,故不能认为手术后视力有改善。

第十三页,共七十九页,编辑于2023年,星期日当n>50,超出附表7的范围,查不到界值时,可采用正态近似法,按下式计算u值,查u界值来判断结果。

第十四页,共七十九页,编辑于2023年,星期日如果相同秩次较多时,应改用下式作校正计算。

上式中,tj为第j(j=1,2,…)个相同差值的个数,假定差值中有2个0.1,3个0.2,5个0.3,则t1=2,t2=3,t3=5,。第十五页,共七十九页,编辑于2023年,星期日本法的基本思想:

假定无效假设H0成立,则配对的差值的总体分布是对称的,总体中位数为0,理论上T值分布应近似均数为n(n+1)/4,方差为n(n+1)(2n+1)/24的正态分布,T+与T-应非常接近;若正、负秩和相差悬殊,则无效假设成立的可能性也小。

第十六页,共七十九页,编辑于2023年,星期日两样本比较的秩和检验

(Wilcoxon两样本比较法)

第十七页,共七十九页,编辑于2023年,星期日一、原始数据的两样本比较的秩和检验第十八页,共七十九页,编辑于2023年,星期日

基本步骤:

1.建立检验假设,确定检验水准(α)

2.混合编秩

3.求秩和并确定检验统计量

4.确定P值和作出推断结论第十九页,共七十九页,编辑于2023年,星期日

1.建立检验假设,确定检验水准(α)

一般无效假设H0是两总体分布位置相同,M1=M2;备择假设H1是两总体分布位置不同,M1≠M2。α取0.05。

第二十页,共七十九页,编辑于2023年,星期日2.混合编秩

将两样本数据混合,按数值由小到大编秩,若有相同值可按以下方法处理:①相同数据在同一组内,则仍按顺序编秩;②相同数据在不同组,则取它们的平均秩次。第二十一页,共七十九页,编辑于2023年,星期日3.求秩和并确定检验统计量

将两组秩次分别相加,求出两组的秩和R1、R2。当n1<n2时,以较小样本含量组的秩和R1作为检验统计量T;若n1=n2,可任取一组之秩和作为T。

第二十二页,共七十九页,编辑于2023年,星期日4.确定P值和作出推断结论

以n1,n2-n1及T值查附表6,两样本比较的秩和检验用T界值表,得出P值。按所取检验水准作出推断结论。查表时,若统计量T在某一行的上、下界值范围内,其P值大于表中相应的概率;若T值在上、下界值范围外,其P值小于表中相应的概率;若T值恰好等于上、下界值,其P值等于表中相应的概率。

第二十三页,共七十九页,编辑于2023年,星期日当n1>20或(n2-n1)>10时,附表6中查不到P值,则可采用正态近似法求u值来确定P值,其公式如下:

第二十四页,共七十九页,编辑于2023年,星期日上式中T为检验统计量值,n1、n2分别为两样本含量,N=n1+n2,0.5这连续性校正数。上式为无相同秩次时使用或作为相同秩次较少时的近似值。当两样本相同秩次较多(超过总样本数的25%)时,应按下式进行校正,u经校正后可略增大,P值则相应减小。第二十五页,共七十九页,编辑于2023年,星期日

tj意义同前。

第二十六页,共七十九页,编辑于2023年,星期日例6-2依降钙素具有抑制骨吸收,抑制破骨细胞活性和数量,减少骨钙释放的作用。某医生用其治疗绝经后妇女骨质疏松症,收集了30名绝经后骨质疏松症妇女,随机分为两组,一组16名服用依降钙素+乳酸钙,另一组14名只服乳酸钙,24周后观察两组患者腰椎L2—4骨密度的改善率,以了解依降钙素治疗绝经后妇女骨质疏松症是否有效。各组患者腰椎L2—4骨密度的改善率(%)。第二十七页,共七十九页,编辑于2023年,星期日第二十八页,共七十九页,编辑于2023年,星期日

1.建立检验假设,确定检验水准(α)

H0:M1=M2,即两治疗组骨密度改善率

的总体分布相同;

H1:M1≠M2,即两治疗组骨密度改善率

的总体分布不同。

α=0.05

第二十九页,共七十九页,编辑于2023年,星期日2.混合编秩

依据两组数值由小到大编秩,结果见上表。

3.求秩和并确定检验统计量T

把两组秩次分别相加求出两组的秩和值,R1=315.5,R2=149.5。因乳酸钙组样本含量较小,故T=R2=149.5。第三十页,共七十九页,编辑于2023年,星期日4.确定P值和作出推断结论

以较小样本含量为n1,n1=14,n2-n1=2,查附表6,两样本比较秩和检验用T界值表(双侧)。

第三十一页,共七十九页,编辑于2023年,星期日T0.05(14,2)=(170,264);

T0.01(14,2)=(156,278)

T=149.5,在T0.01(14,2)界值外,故P<0.01,按α=0.05水准拒绝H0,接受H1,可认为两治疗组骨密度改善率的总体分布不同,再根据临床实际可认为依降钙素+乳酸钙治疗绝经后妇女骨质疏松的效果比单纯用乳酸钙治疗的效果好。第三十二页,共七十九页,编辑于2023年,星期日

二、频数表资料(或等级资料)的两样本比较的秩和检验

第三十三页,共七十九页,编辑于2023年,星期日例6-3用某药治疗不同病情的老年性支气管炎病人,疗效见下表第(2)、(3)栏,试比较该药对不同病情老年性支气管炎的疗效有无差别?

第三十四页,共七十九页,编辑于2023年,星期日第三十五页,共七十九页,编辑于2023年,星期日1.建立检验假设,确定检验水准(α)

H0:M1=M2,即两种病情病人疗效的总体

分布相同;

H1:M1≠M2,即两种病情病人疗效的总

体分布不同。

α=0.05

第三十六页,共七十九页,编辑于2023年,星期日2.混合编秩

求两组各疗效等级的合计数、秩次范围和平均秩次,如疗效等级为“控制”者共107人,其秩次范围为1—107,平均秩次为(1+107)/2=54.0。其余等级依此类推,结果如上表第(4)、(5)、(6)栏。

3.求检验统计量T

n1=82,n2=126,n2>n1,故应求单纯性老年支气管炎病人组的秩和作为检验统计量,结果见上表第(7)栏,T=8780.5。

第三十七页,共七十九页,编辑于2023年,星期日

4.确定P值和作出推断结论

本例样本含量较多,超出附表6的范围,需用下式求u值来判断结论。又因频数表资料相同秩次数较多(超过总样本数25%),故需用校正公式。第三十八页,共七十九页,编辑于2023年,星期日第三十九页,共七十九页,编辑于2023年,星期日u0.05=1.96,故uC<u0.05,P>0.05,按α=0.05水准,不能拒绝H0,两种病情病人疗效的总体分布相同,尚不能认为该药对上述两种病情患者疗效不同。

第四十页,共七十九页,编辑于2023年,星期日

成组设计多个样本比较的秩和检验(Kruskal—Wallis法)

第四十一页,共七十九页,编辑于2023年,星期日一、原始数据的K—W检验第四十二页,共七十九页,编辑于2023年,星期日

基本步骤:

1.建立检验假设,确定检验水准(α)

2.混合编秩

3.求秩和并计算检验统计量H

4.确定P值和作出推断结论

第四十三页,共七十九页,编辑于2023年,星期日

1.建立检验假设,确定检验水准(α)

H0:k个总体分布位置相同;

H1:k个总体分布位置不同或不全相同;

α=0.05。第四十四页,共七十九页,编辑于2023年,星期日2.混合编秩

将各组数据混合,由小到大编秩。遇有原始数据相同时,若相同数据在同一组内,则仍按顺序编秩;若相同数据在不同组,则取它们的平均秩次。

第四十五页,共七十九页,编辑于2023年,星期日

3.求秩和并计算检验统计量H

将各组秩次分别相加,求出各组的秩和Ri。i为组序。检验统计量值H可按下式计算:

式中,Ri为各组的秩和,ni为各组样本含量,N为总样本含量。

第四十六页,共七十九页,编辑于2023年,星期日当各组相同秩次较多时,可对H值进行校正,按下式求值。

第四十七页,共七十九页,编辑于2023年,星期日4.确定P值和作出推断结论

当组数K=3,每组样本含量ni≤5时,可查附表7(H界值表)得到P值。若k>3或ni>5时,H值的分布近似于自由度为k-1的χ2分布,此时可查附表4χ2界值表得到P值。最后按P值作出推断结论。

第四十八页,共七十九页,编辑于2023年,星期日例6-4某研究者测定正常人、单纯性肥胖、皮质醇增多症者各10人的血浆总皮质醇含量见下表,问这三组人的血浆总皮质醇含量有无差别?

第四十九页,共七十九页,编辑于2023年,星期日第五十页,共七十九页,编辑于2023年,星期日

1.建立检验假设,确定检验水准(α)

H0:三组人的血浆总皮质醇含量总

体分布相同;

H1:三组人的血浆总皮质醇含量总

体分布不同或不全相同。

α=0.05。

第五十一页,共七十九页,编辑于2023年,星期日2.混合编秩

将三组人的血浆总皮质醇含量值混合,由小到大编秩。本例有两个3.1,分别在正常人和单纯性肥胖组,其平均秩次为(10+11)/2=10.5;另有两个15.6,但都在皮质醇增多症组,故其秩次按位置顺序记为27、28。

第五十二页,共七十九页,编辑于2023年,星期日3.求秩和并计算检验统计量H

将各组秩次分别相加,求出各组的秩和Ri,见上表6-4。i为组序。检验统计量值H可按上式计算:

第五十三页,共七十九页,编辑于2023年,星期日

4.确定P值和作出推断结论

本例ni均为10,自由度ν=K-1=3-1=2,查χ2界值表,p<0.005,按α=0.05水准拒绝H0,接受H1,故可认为三组人的血浆总皮质醇测定值有差别。第五十四页,共七十九页,编辑于2023年,星期日

二、频数表资料(或等级资料)的K—W检验

第五十五页,共七十九页,编辑于2023年,星期日例6-5四种疾病患者痰液内嗜酸性粒细胞的检查结果见表6-5。问四种疾病患者痰液内嗜酸性粒细胞有无差别?

第五十六页,共七十九页,编辑于2023年,星期日第五十七页,共七十九页,编辑于2023年,星期日

1.建立检验假设,确定检验水准(α)

H0:四种疾病患者的痰液内嗜酸性粒细胞

总体分布位置相同;

H1:四种疾病患者的痰液内嗜酸性粒细胞

总体分布位置不同或不全相同。

α=0.05。

第五十八页,共七十九页,编辑于2023年,星期日2.混合编秩

先计算各等级的合计,见上表中第(6)栏,再确定秩次范围,如第(7)栏所示,然后计算平均秩次,见第(8)栏。

第五十九页,共七十九页,编辑于2023年,星期日3.求秩和并计算检验统计量

将每组各等级的例数乘相应的平均秩次再相加,求出各组的秩和Ri,如本例支气管扩张组的秩和R1=0×6+2×21+9×40.5+6×55.5=739.5,同理:R2=436.5,R3=409.5,R4=244.5。第六十页,共七十九页,编辑于2023年,星期日

4.确定P值和作出推断结论

本例ni均为10,自由度ν=k-1=4-1=3,查χ2界值表,p<0.005,按α=0.05水准拒绝H0,接受H1,故可认为四种疾病患者痰液内嗜酸性粒细胞有差别。第六十一页,共七十九页,编辑于2023年,星期日多个样本间两两比较的秩和检验(Nemenyi法)

第六十二页,共七十九页,编辑于2023年,星期日一、样本例数相等的两两比较秩和检验

第六十三页,共七十九页,编辑于2023年,星期日例6-6对例6-4资料做3个样本间的两两比较。

第六十四页,共七十九页,编辑于2023年,星期日1.建立检验假设,确定检验水准(α)

H0:三组人的血浆总皮质醇含量任意两组

的总体分布均相同;

H1:任意两组总体分布不同或不全相同。

α=0.05。

第六十五页,共七十九页,编辑于2023年,星期日第六十六页,共七十九页,编辑于2023年,星期日3.判断结果

以各样本例数为n,处理组数为k,查附表8,D界值表中的Dα(n,k)界值,与上表中的差值D相比,若D≥Dα(n,k),则P≤α。本例n=10,k=3,查得D0.05(10,3)=92.3,D0.01(10,3)=114.7。

第六十七页,共七十九页,编辑于2023年,星期日检验结果正常人组与单纯性肥胖组血浆总皮质醇含量相比P>0.05,正常人与皮质醇增多症组、单纯性肥胖组与皮质醇增多症组比较均P<0.01,按α=0.05水准,可认为正常人与单纯性肥胖者血浆总皮质醇含量无差别;正常人与皮质醇增多症者、单纯性肥胖与皮质醇增多症者间血浆总皮质醇含量有差别,皮质醇增多症者血浆总皮质醇含量高于正常人及单纯性肥胖者。第六十八页,共七十九页,编辑于2023年,星期日

二、各样本例数不同或不全相同的两两比较的秩和检验

第六十九页,共七十九页,编辑于2023年,星期日

基本步骤:

1.建立检验假设,确定检验水准(α)

H0:四种疾病患者的痰液内嗜酸性粒细胞

任意两总体分布位置均相同;

H1:任意两总体分布位置不同或不全相同。

α=0.05。第七十页,共七十九页,编辑于2023年,星期日2.计算统计量值先用下式计算χ2值:

式中和为两两比较组中任两个比较组的平均秩和,如

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论