医学统计学-版5方差分析_第1页
医学统计学-版5方差分析_第2页
医学统计学-版5方差分析_第3页
医学统计学-版5方差分析_第4页
医学统计学-版5方差分析_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

方差分析(

ysis

Of

Variance,ANOVA)施红英温州医

学预防医学系Medical

Statistics能否用两样本t检验进行两两比较而得出结论?kn

C

2若规定=0.05,则每一次比较犯I型错误的概率为0.05;每一次不犯I型错误的概率为1-0.05;比较n次,则每一次都不犯I型错误的概率为(1-0.05)n;所以,两两比较n次,犯I型错误的概率为1-(1-0.05)n

>>0.05

。多个样本均数的比较,不能直接用两样本t

检验来作两两比较;应

ysis

ofVariance,ANOVA)。又称F

检验方差分析的用途两个或多个均数的比较分析因素间的交互作用方差齐性检验回归模型的假设检验内容提要方差分析概述:基本概念、基本思想及应用条件完全随机设计资料的方差分析随机区组设计资料的方差分析多个样本均数间的多重比较变量变换SPSS演示和结果表达案例

1.

基本概念ysisofvariance,ANOVA:是用于检验以某一分类变量得到的多个总体均数是否相等的方法,从而判断某分类型自变量是否对某数值型因变量产生影响的统计方法。分类型自变量

数值型因变量不同血型

身高促销方式

销售额某临床试验:某医生为研究一种四类降糖新药的疗效,以

的纳入标准和排除标准选择了60名2型糖尿病患者,按完全随机设计方案将患者分为三组进行双盲临床试验。其中,降糖新药高剂量组21人、低剂量组19人、对照组20人。对照组服用公认的降糖药物,治

4

2

值(mmol/L),结果如下表。问:治疗4

,餐后2小时血糖下降值的三组总体平均水平是否不同?案例高剂量组低剂量组对照组5.616.3-0.62.012.42.79.511.85.75.60.97.86.014.612.87.07.06.98.74.94.17.93.91.59.28.1-1.84.31.69.45.03.8-0.16.46.43.83.56.16.37.03.07.55.813.212.75.43.98.48.016.59.83.12.212.215.59.212.61.16.011.82型患者治疗4餐后2小时血糖的下降值(mmol/L)9.19525.80005.43001.

基本概念因素(因子):单因素方差分析(one-way

ANOVA)两因素方差分析水平:因子的具体表现2.

基本思想各样本均数的差异各总体均数的差异各样本均数之间的差异(总变异)来源:组间差异--处理+随机误差

各总体均数不全相等组内差异--随机误差

各总体均数相等2.

基本思想μ

3x3μx2

μ

2x1

μ

1x3x2

x12.

基本思想问题:组间变异、组内变异用什么来衡量?方差S2

—均方MS组间

组间–

MS

=SS

/(k-1)–

MS组内=SS组内/(n-k)F=MS组间

/MS组内–

原假设H0成立,则F=1;原假设H0不成立,则F>>1。F值达到多少才有意义呢?

x

)

2i

iiSS

n

(x组间iji

jSS

(x

xi

)

2组内SS总

SS组间

SS组内总组间

组内2.

基本思想P

0.05不

H0,差异无统计学意义,尚不能认为多个总体均数不等或不全相等。F

F(1,

2)P

0.05H0,接受H1,差异有统计学意义,可以认为多个总体均数不全相等。F

F(1,

2)3.

方差分析的基本假定正态分布方差齐性独立性完全随机设计资料的方差分析完全随机设计:采用完全随机化的分组方法,将全部实验对象分配到g个处理组,各组接受不同的处理,试验结束后比较各组均数之间的差异有无统计学意义,推论处理因素的效应。例:为研究饲料中维生素E的缺乏对肝中维生素A含量的关系,将大鼠随机分为3组。第1组给予维生素E缺乏的饲料,第2组给予正常饲料,第3组给予维生素E含量较为丰富的饲料,然后定期将大鼠处死,测定肝中维生素A的含量。--完全随机设计资料例:为研究母亲职业是否影响新生儿体重,不同职业产妇所生孩子的出生体重(g)。--完全随机设计资料1建立检验假设,确定检验水准H0:三个总体均数相等,即1=2=

3H1:三个总体均数不等或不全相等

=0.05选择检验方法,计算检验统计量2(3)确定P值,做出推断结论F

MS组间MS组内1

组间

k

12

组内

N

k基本步骤P

0.05不

H0,差异无统计学意义,尚不能认为多个总体均数不等或不全相等。P

0.05H0,接受H1,差异有统计学意义,可以认为多个总体均数不全相等。F

F(1,

2)F

F(1,

2)变异来源平方和SS度df均方F值

P值MS组间组内SSASSE1=

k-12=

n-kSSA/

1MSA/MSESSE/

2合计SSTn-1★单因素方差分析表某医生为研究一种四类降糖新药的疗效,以

的纳入标准和排除标准选择了60名2型

患者,按完全随机设计方案将患者分为三组进行双盲临床试验。其中,降糖新药高剂量组21人、低剂量组19人、对照组20人。对照组服用公认的降糖药物,治疗4

测得其餐后2小时血糖的下降值(mmol/L),结果如下表。问:治疗4

,餐后2小时血糖下降值的三组总体平均水平是否不同?案例5.616.3-0.62.012.42.79.511.85.75.60.97.86.014.612.87.07.06.98.74.94.17.93.91.59.28.1-1.84.31.69.4Xij

5.03.8-0.16.46.43.83.56.16.37.03.07.55.813.212.75.43.98.48.016.59.83.12.212.215.59.212.61.16.011.82型患者治疗4高剂量组餐后2小时血糖的下降值(mmol/L)低剂量组 对照组ni211920Xi9.19525.80005.4300

6.Si

217.360518.186712.3843

1860(N)8650(X).4176(S2)变异来源SSMSFP组间(处理组间)176.7612288.38065.537<0.01组内(误差)909.87235715.9627总

计1086.633559方差分析表结论?随机区组设计的方差分析随机区组设计资料----两因素方差分析配伍组设计资料:为研究k个处理效果有无差别,先将实验对象配伍,每个配伍组的实验对象数等于处理组数k,然后将同一配伍组的k个研究对象随机安排到k个不同的处理组,所得的资料。同一研究对象的k个部位测同一指标所得的数据;同一样品用多种不同方法测同一指标所得的数据;例:同时在若干个教室的讲台边、中间、后面3个部位测得的粉尘数;例:对每份血样用A、B、C、D四种方法测量所得的资料;案例1为探索丹参对肢体缺血再灌注损伤的影响,将30只纯种新西兰实验用大白兔,按窝别相同、体重相近划分为10个区组。每个区组3只大白兔随机采用A、B、C三种处理方案,

即在松止血带前分别给予丹参

2ml/kg

丹参1ml/kg、生理盐水2ml/kg,在松止血带前及松后1小时分别测定血中白蛋白含量(g/L),算出白蛋白减少量如下表,问A、B两方案分别与C方案的处理效果是否不同?(data:

bdb.sav)区组ABC12.212.914.2522.322.644.5633.153.674.3341.863.293.8952.562.453.7861.982.744.6272.373.154.7182.883.443.5693.052.613.77103.422.864.23ABC三种方案处理后大白兔血中白蛋白减少量(g/L)随机区组设计方差分析中变异的分解总变异MS总处理间变异处理因素+随机误差的作用MS组间

MSA区组间变异MS区组

MSB区组因素+随机误差的作用误差MS误差

MSE随机误差的作用基本步骤(1)建立检验假设,确定检验水准对于处理组H0:三个总体均数相等,即1=2=

3H1:三个总体均数不全相等对于区组H0:十个总体均数相等H1:十个总体均数不全相等=0.05=0.05(2)选择检验方法,计算检验统计量随机区组设计方差分析计算表变异来源

SS

v

MS

F处理组i

n

(

X

X

)2i

ik-1 SS

处理/(k-1)MS处理MS误差区组

X

)2jjj

n

(

Xb-1SS

区组/(b-1)MS区组MS误差误差SS总

SS处理

SS区组(k-1)(b-1)SS

组内/(k-1)(b-1)总变异2

X

(X)2NN-1SS

总/N-1属于两因素方差分析(3)确定P值,做出推断结论P

0.05不

H0,差异无统计学意义,尚不能认为多个总体均数不等或不全相等。P

0.05H0,接受H1,差异有统计学意义,可以认为多个总体均数不全相等。F

F(1,

2)F

F(1,

2)案例1为探索丹参对肢体缺血再灌注损伤的影响,将30只纯种新西兰实验用大白兔,按窝别相同、体重相近划分为10个区组。每个区组3只大白兔随机采用A、B、C三种处理方案,

即在松止血带前分别给予丹参

2ml/kg

丹参1ml/kg、生理盐水2ml/kg,在松止血带前及松后1小时分别测定血中白蛋白含量(g/L),算出白蛋白减少量如下表,问A、B两方案分别与C方案的处理效果是否不同?(data:

bdb.sav)区组ABC12.212.914.2522.322.644.5633.153.674.3341.863.293.8952.562.453.7861.982.744.6272.373.154.7182.883.443.5693.052.613.77103.422.864.23ABC三种方案处理后大白兔血中白蛋白减少量(g/L)方差分析表变异来源SSMSFP处理组13.701826.850932.639<0.01区

组1.557790.17310.825>0.05误

差3.7790180.2099总

计19.038529结论?多个样本均数的两两比较P<0.05,差别有统计学意义方法:LSD:假阳性SNK:q

检验,多组间两两比较BonferroniDunnett-t检验:多个实验组与一个对照组Sidak等1、q

检验(Student-

-Keuls法,SNK法):用于多个样本均数间作两两比较。A

Bq

xA

x

BSx

x2xA

xBS

n

n

1 2

MS误差

1

1

2

、最小有意义差异法(

least

significantdifference,

LSD法):用于对照组与各处理组的比较。

eAB

e

nnt

X

A

B

X

MS

1

1

变量变换对数转换平方根转换倒数变换平方根反正弦转换Box-Cox变换对数转换Y

=

lgX

lnX一般用于下列情况:(1)原始数据呈对数正态分布时(如等比级数资料),转换后可使数据呈正态分布。(2)标准差与均数成比例时(或CV值比较接近时),可使数据方差齐性。(3)使曲线直线化。如指数曲线直线化。平方根转换用于Poisson分布资料的正态化。Y

X

Y

X

1倒数变换常用于数据两端波动较大的资料,可使极端值影响减小。Y

1X平方根反正弦转换Y

arcsin

X用于服从二项分布,P<30%或>70%时,使资料呈正态分布、方差齐性。Box-Cox变换SPSS演示:单因素方差分析SPSS演示:随机区组设计方差分析:结果表达A

型性格与非胰岛素依赖型关系的病例对照研究,中华医学杂志,2001.案例案例1:“地域”与“抑郁”作了一项

,研究地理位置与患抑郁症之间的关系。研究第一部分:他们选择了60个65岁以上的健康人,其中20人居住在佛罗里达,20人居住在纽约,20人居住在北卡罗来纳。对选中的每个人给出了测量抑郁症的一个标准化测验,搜集到表1中的资料,较高的得分表示较高的抑郁症水平。研究第二部分:考虑地理位置与患有慢

(诸如关节炎、高血

压、心脏失调等)的65岁以上的人患抑郁症之间的关系。在患有慢的65岁以上的人中也选出60个组成样本,同样20个人居住在佛罗里达,20个人在纽约,20个人在北卡罗来纳。这个研究记录的抑郁症水平资料如表2。表1表2佛罗里达纽约北卡罗来纳佛罗里达纽约北卡罗来纳543473103811171113111、试

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论