医学统计学-非参数统计分析view_第1页
医学统计学-非参数统计分析view_第2页
医学统计学-非参数统计分析view_第3页
医学统计学-非参数统计分析view_第4页
医学统计学-非参数统计分析view_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

非参数统计分析交通大学医学院生物统计学教研室参数统计非参数统计(parametric

statistics)(nonparametric

statistics)已知总体分布类型,对未知参数进行统计推断对总体的分布类型不作任何要求不受总体参数的影响,比较分布或分布位置依赖于特定分布类型,比较的是参数均数t检验

正态

分布均数方差分析

正态分布适用范围广;可用于任何类型资料(等级资料,或两端

)对于符合参数统计分析条件者,采用非参数统计分析,其检验效能较低基本概念参数统计:在总体分布型是已知的基础上,对总体参数进行估计或检验。如总体均数的区间估计、两个或多个均数的比较、相关系数和回归系数的假设检验等。非参数统计:检验假设中不对参数作明确的断定,也不涉及关于样本总体的分布.其相应的无效假设是H0:各组的总体分布相同,备择假设为H1:各组的总体分布不同或不全相同。优点:适用于任何总体分布收

料方便。应用范围:①半定量资料。②偏态分布。③资料的分布类型不能确定。④个别数据偏离过大。这里指的是随机偏离而不是“过

差”。⑤各组离散程度相差悬殊,即方差不齐。⑥数据的某一端无确定数值,如“<0.01g”、“>50mg”、“1/1024以上”等,只给一个

下限或上限,而没有具体数值。缺点:对适宜用参数方法的资料,若用非参数处理,常损失部分信息,降低效率。虽然许多非参数法计算简便,但不少问题的计算,特别样本较大时,比较繁杂。第一节

符号检验根据正、负符号个数进行假设检验的方法称为符号检验(sign

test)。首先将原始观察值按设定的规则,转换成+、-号然后计数正、负号的个数作出检验该检验可用于配对资料:总体分布

从正态分布或分布不明特别有时当配对比较的结果不能获得具体数字只能定性地表达时(如颜色深浅,程度强弱)P228例9.1表9.名受试者对两种镇痛药的评价病例号镇痛药物好好好差好好好好好AB差差差好差差差差差符号+++-+++++H0:两种药镇痛效果无差别“H1:两种药镇痛效果有差别规定A药比B药好为“+”,A药比B药差为 -”计算正、负符号个数,得:n+=8,n-=1代入公式2

=(|n+-n-|-1)2/(n++n-)(公式11.1)得:

2

=(|8-1|-1)2/(8+1)=4,

度df=1>

2

0.05(1)现

2

,故P<0.05,H0,认为在α=0.05水平上差异有统计学意义,即两种镇痛药效果有差别。data

dat1;input

a

b;= -b;cards;proc

univariate

data=dat1;var

d;run;1

00

11

01

0;检验位置检验:Mu0=0--统计量----------P

值-------Student

t

t

3.5 Pr

>

|t|

0.0081符号

M

3.5 Pr

>=|M|

0.0391符号秩

S

17.5 Pr

>=

|S|

0.

1二、配对设计的符号秩和检验(P230)P230

例9.2表

9.2

UU

前后家兔

密度的变化12345678910前336371386364377292288304333302后258291300285298303312260339290差值d7880867979-11-2444-612秩次69107.57.524513正的秩次69107.57.553负的秩次-2-4-1两组数据来自相同的分布。如无效假设成立,则差值的出现正负号的概率应相近,即X>Y与Y>X的机会均等,如果出现正号或负号的次数较多,则说明某一种数据偏大。换言之,也就是差值di的中位数为0。计算步骤①建立假设H0:差值总体中位数Md=0。H1:Md≠0。=0.05。②求差值。③编秩。依差值的绝对值从小到大编秩,编秩时、如遇差数等于零,舍去不计。遇有差值相同,则取其平均等级,再根据差值的正、负给秩次冠以正负号。④求秩和并计算检验统计量。分别求出正负号等级之和,两者中较小者称为T。查附表十,符号秩和检验用T界值表。(P433)当T>T0.05时,P>.当T0.01<T≤T0.05时,0.01<P≤0.05当T≤T0.01时,P≤0.01本例:查附表十得n=10,T0.05=8,T0.01=3,现T=7<T0.05

所以P<0.05,

H0。认为前后家兔

密度的变化有统计学意义。当n>25时,可按(11.2)式求U值。u

s v

[T

n(n1)

4]/

n(n1)(2n1)/24U服从标准正态分布,故有:U≥1.96时,P≤0.05;U≥2.58时,P≤0.01;U<1.96时,P>0.05注意:当有相同的差值绝对值时,给以平均秩次。如果第2个病例差值为15,它和第10个病例的差值-15的绝对值相同。因此这二个病例的秩次都取2.5。连续性校正:分子取绝对值后,再减去0.5。称为连续性校正。一般影响较小,常可省去。如果相同秩次较多时,式(11.2)分母的根号里再减去某校正式。称为对于相同秩次的校正。3t

t48

j

j假设差值如下:3.5

3.5

6

6

6

9.5

9.5

9.5

9.52)(33

3)(43

4)(t3

t

)(23j

j90proc

univariatedata=dat2

normal;var

d;run;data

dat2;in ut

before

afterd=before-after;cards;336

258371

291386

300364

285377

298292

303288

312304

260333

339302

290;三.两样本秩和检验(P215)两样本秩和检验(rank

sum

test)又称

Wilcoxon秩和检验,适用于成组样本的差异统计学检验。步骤:先将两样本混合由小到大排列据一律给以平均秩次。编秩,相同的数表9.4两组血铅值的比较铅作业组秩次非铅作业组秩次0.3240.2630.4790.2420.57100.59122.21170.376.13.113.08180.2110.6714.50.3352.13160.4270.6714.50.458n1=8T1=101.5N2=10T2=69.5分别以n1,n2代表两样本含量,并规定n1≤n2,将量

n1组

和记

T1,如n1=n2,可任取一组的秩和为T1。然后据n1与n2的值查秩和检验T界值表(附表十一)作判断。如算得的T1值在相应概率水平P值一行的上下界值范围内时,P就大于表中的概率水平;反之,则概率水平小于表中的P。若T值恰好等于界值,其P值等于相应的概率。本例 组的例数较少故取组为n1=8,健康人组n2=10n1组的T1为:T1=4+9+10+……+16=101.5查附表十一(P401),当n1=8,n2-n1=2时,表中p=0.05一行的上下界限为53~99,p=0.01一行的上下界限为47~105,T1在P=0.05行的界限外,但在P=0.01行的界限内,所以P<0.05。H0。认为两组血铅值的差异有统计学意义。当n1或n2-n1,已超出附表十一的范围,可用式(11.3)的U检验。U服从标准正态分布,故可据U0.05=1.96,U0.01=2.58,作出统计推断。当相同秩次较多,使U偏小,也要进行对于相同秩次的校正。j

j3(t

t

) (

N

3

N

)c

1

uc

u

/

cdata

dat4;do

group=1

to

2;input

n;=1

ton;input

x@@;output;end;end;cards;80.320.470.572.210.643.080.67

2.13100.260.240.59

0.370.580.210.330.42

0.670.45;run;proc

univariate

data=dat4

normal;class

group;var

x;run;proc

npar1way

data=dat4

wilcoxon;classgroup;varx;run;Wilcoxon

Two-Sample

TestStatistic

101.5000Normal

ApproximationZ

2.2225One-Sided

Pr

>

ZTwo-Sided

Pr

>

|Z|0.01310.0263例9.6

本例资料没有具体数据,而只有相对大小,可用秩和检验法。例9.7本例资料中有些数值都小于某值,但没有确定之值,可用秩和检验法。四.完全随机设计秩和检验(P220)用于两个以上样本的比较,相当于方差分析.本法又称为Kruskal

Wallis检验(KruskalWallis

test)(K-W检验)。例9.9

P245

轻度和重度再障贫血患者

中可溶性CD8抗原水平与正常人的差别K-W检验计算步骤各样本数据混合,由小到大排列并给以秩次;计算各样本之秩和Ti;计算H值如公式(11.4);其中ni为各样本含量,n为总例数,有n=∑ni当k=3,各个样本含量均≤5时,可由附表十二查得H临界值,H0.01

,H0.05

。当H<H0.05时,P>0.05,H≥H0.05时,P≤0.05,H≥H0.01时,P≤0.01。K-W检验计算步骤当k>3或各样本含量超过附表十二范围时,由于H分布近似于χ2分布,其度为k-1,可查χ2值表(附表三),作出统计推断。当具有相同观察值的例数较多时,H值需按11.5

式校正,

正系 C由

11.6

式求得。3

(t

t

)]

/[(n

1)n(n

1)]c

1[

j

j总例数相同值的个数本例:T1=127.5,T2=150,T3=218.5n=12+10+9=31。32i

iT

n

(127.52

1210

218.529)

11.748i1求得H值=11.7748因有相等值,故需求校正HC值,由表11.10计算C值=0.9962HC=

11.7748/0.9962=

11.82查χ2值表(附表三),df=k-1=2时,χ20.01(2)=9.21,现χ2>χ2

,

P<0.01,

H

,认为CD8抗原0.01

0水平3组之间的差异有统计学意义。程序9.8

P246等级分组资料的秩和检验例9.114种疾病痰液内嗜酸粒细胞的等级分布是否有差别?支气管扩张秩和=8.5×1+29×3+54.5×10+74.5×7=1162同样有:肺水肿秩和=684,肺癌=891,H=10.742修正因子:C=0.248HC=10.742/0.9248=11.61550.05

0.01df=3-1=2,由χ2界值表(附表三)χ

2

=7.81,

χ

2

=9.21。现χ2>χ20.05

,故P<0.05,

H0,认为4种疾病患者痰液内嗜酸粒细胞等级的差异有统计学意义。程序9.9例:对于下面的资料进行统计分析组别合计痊愈

显效A

50(75)

100(75B

100(75)

50(75)150

150有效

无效

合计100(75

50(75

30050(75)

100(75)

300150

150

600如作χ2检验,则

2

O

T

2T22757550

75100

75

4

4

66.66673,

P

0.001注意:此时的无效假设是A药组与B药组的各种疗效按等级的构成比是否相同?而不能回答两组疗效是否相同这一问题。这也是临床研究的资料分析时常见的错误之一。运用本次所讲的非参数检验,将会出现戏剧性的结果。疗效等级总体分布相同。疗效等级总体分布不同。1.

建立假设H0:不同组H1:不同组α=0.05。疗效等级组别合计等级范围平均等级各组等级之和A药B药A药B药痊愈501001501~15075.537757550显效10050150151~300225.52255011275有效10050150301~450375.53755018775无效50100150451~600525.2627552550合计3003006009015090150计算检验统计量H值:R

2H

i

3N

112N

N

1300

90150

2

3

601ni12

90150

2600

601300根据所讲的相同秩次较多,需要进行校正,校正公式为:HC=H/C,C值计算公式同上次课所讲的公式。

t

N

N

j

j33c

1

t

C,

。本例

度为2-

=

,P值=1。类似1、基础代谢率神有精神合计正常2373016~35316641~172441>7010合计总胆红素有无2.试比较下面两组患肝炎婴儿的差别?总胆红素(umol/L)一般组重症组合计<174417~101080~15217160~1910240~22320~44400~22合计301949镇痛效果合谷足三里扶突+385347++442923+++122819++++241633五.随机单位组设计秩和检验(P223)当试验按随机单位组设计时,欲作秩和检验可用

本法,称为Friedman秩和检验(Friedman

test)。例9.12

P250随机单位组设计秩和检验(1)在各个单位组对k个处理的观察值由小到大排列并指定秩次;计算k个处理的秩次和T1

,T2

,……,Tk

;用公式(11.7)计算H值当k=3,b≤15或k=4,b≤8时,可由附表十三查得其界值,当H<H0.05时,P>0.05,H≥H0.05时,P≤0.05,H≥H0.01时,P≤0.01。药物受试者ABC12312321263217231合计19149当k,b超过附表十三(p403)范围时,H近似于χ2分布,可按df=k-1查χ2值表(附表三)作统计判断。本例:b=12,k=3,由(9-10)式得H=18.375查附表十三,当b=12,k=3时,H0.05=6.17,H0.01=9.50,所以P<0.01,

H0,认为三种药物的创面愈合百分比的差异有统计学意义。程序9.10Spearman等级相关适用于:①

从双变量正态分布而不宜做线性相关;②总体分布类型未知;③用等级表示的资料。基本思想:一鼠1,鼠2,……,鼠n的两个指标:X

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论