单向方差分析_第1页
单向方差分析_第2页
单向方差分析_第3页
单向方差分析_第4页
单向方差分析_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

单向方差分析第一页,共二十一页,编辑于2023年,星期日一、问题的提出先看一个例子:某医生为研究一种降糖药的疗效,以统一的纳入标准和排除标准选择了39名II型糖尿病患者,随机将其分为两组进行双盲临床试验。其中试验组19人,对照组20人,对照组服用公认的降糖药物。治疗4周后测得其餐后2小时血糖的下降值(mmol/L),结果如表1。问治疗4周后餐后2小时血糖下降值的两组总体水平是否不同?第二页,共二十一页,编辑于2023年,星期日表1II型糖尿病患者治疗4周后餐后2小时血糖的下降值(mmol/L)试验组对照组

-0.6 12.4

5.7 0.9

12.8 7.0

4.1 3.9

4.3 9.4

6.4 3.8

7.0 7.5

5.4 8.4

3.1 12.2

6.0第三页,共二十一页,编辑于2023年,星期日

显然,当两个样本来自正态总体,且两个总体方差相等时,我们可用两样本均数比较的t-检验来解决这个问题。其检验假设:为

其检验统计量为:其中:第四页,共二十一页,编辑于2023年,星期日

但在实际工作中,常常会遇到两个以上的样本均数的比较,如将上述问题改为:某医生为研究一种降糖药的疗效,以统一的纳入标准和排除标准选择了60名II型糖尿病患者,随机将其分为三组进行双盲临床试验。其中高剂量组21人,低剂量组19人,对照组20人,对照组服用公认的降糖药物。治疗4周后测得其餐后2小时血糖的下降值(mmol/L),结果如表2。问治疗4周后餐后2小时血糖下降值的三组总体水平是否不同?第五页,共二十一页,编辑于2023年,星期日表2

II型糖尿病患者治疗4周后餐后2小时血糖的下降值(mmol/L)高剂量组低剂量组对照组

5.6-0.6 12.4

9.5

5.70.9

6.0

12.87.0

8.7

4.1 3.9

4.9

4.3 9.4

8.1

6.4 3.8

3.8

7.07.5

6.1

5.48.4

13.2

3.112.2

16.5

6.09.2第六页,共二十一页,编辑于2023年,星期日

如何解决这个问题呢?这里,先介绍几个概念:要考察的指标称为试验指标----本例即血糖的下降值;影响试验指标的条件称为因素(处理因素)----本例即药物;因素所处的状态称为该因素的水平----本例药物有3个不同的水平(三个不同的处理组)。

在一项试验中,如果影响试验指标的因素只有一个,则称该试验为单因素试验(本例);如果影响试验指标的因素有多个,则称该试验为多因素试验。第七页,共二十一页,编辑于2023年,星期日

我们在因素(药物)所处的每一水平下进行了独立试验,其结果是一随机变量。如果将因素的每一水平分别视为一个总体,各总体的均值分别为,则表中数据可视为来自三个不同总体的样本值。如果三个总体都服从正态分布,且三个总体方差都相等(方差齐性),则本例的问题即为如下的检验假设问题:下面,我们把这个问题推广到更一般的情形。第八页,共二十一页,编辑于2023年,星期日

一般地,对于单因素试验,假设因素A有s个水平:A1,A2,…,As。在水平Aj(j=1,2,…,s)进行nj次独立试验,得到如下的试验结果:水平A1A2…As样本观测值…………样本总和T•1T•2…T•s样本均值…总体均值…表3单因素方差分析的资料格式第九页,共二十一页,编辑于2023年,星期日

假定各水平Aj均为正态总体,

j=1,2,…,s,且各水平下的样本之间相互独立.

在这个假定之下,方差分析的任务就是要检验如下的假设:其备择假设为:

如何来检验这个假设呢?英国统计学家R.A.Fisher从方差构成的角度对这个问题进行了探讨,并于1923年首次给出了如下的平方和分解定理。H0:μ1=μ2=

…=μs

H1:μ1,μ2,…,μs

不全相等第十页,共二十一页,编辑于2023年,星期日二、Fisher的平方和分解考虑总平方和

(totalsumofsquares)其中:是所有样本观测值的总平均;SS总又称为总变差,它反映了全部试验数据之间的差异。记水平Aj下的样本均值为第十一页,共二十一页,编辑于2023年,星期日对总平方和SS总可作如下的分解:注意到于是总平方和SS总可分解为第十二页,共二十一页,编辑于2023年,星期日其中:中的各项表示在水平Aj下,样本观测值与样本均值之间的差异,这种差异是由抽样所引起的,故SS组内

(Errorsumofsquares)称为组内离差平方和(又称为误差平方和),且可以证明:SS组内的自由度为n-s。中的各项表示水平Aj下的样本均值与全部观测数据的总平均值之间的差异,这种差异是由水平Aj及随机误差所引起的,故称SS组间

(Modelsumofsquares)为组间平方和,且可以证明:SS组间的自由度为s-1。而第十三页,共二十一页,编辑于2023年,星期日于是,Fisher构造了如下的统计量:并证明了这个F统计量服从自由度为(s-1,n-s)的F分布。

由于分子MS组间是由各水平组不同所引起的差异及随机误差所构成的,而分母MS组内仅由随机误差所构成,故当F≈1,可以认为各水平组之间的差异不存在,即推断H0成立;F>>1,则认为各水平组之间存在差异,即推断H0不成立。注意:F值非负。其中:

MS组间=SS组间/(s-1)称为组间均方(ModelMeanSquare),

MS组间=SS组内/(n-s)称为组内均方(ErrorMeanSquare)。第十四页,共二十一页,编辑于2023年,星期日

对于事先给定的检验水准若,则p<,拒绝H0若,则p≥,不拒绝H0

至于F值究竟要大到何种程度才能拒绝原假设,可由F分布的临界值来确定。通常可以通过查F分布的界值表来决定。第十五页,共二十一页,编辑于2023年,星期日三、方差分析的步骤1.建立检验假设,确定检验水准;2.按照表3的格式,整理并计算出相应的统计量;3.计算出各平方和、自由度及相应的均方;单因素试验方差分析表方差来源平方和自由度均方F值组间SS组间s-1MS组间组内SS组内n-sMS组内

总SS总n-1

5.查F界值表,确定p值,并作出统计学推断。4.列出如下形式的方差分析表:H0:μ1=μ2=

…=μs

H1:μ1,μ2,…,μs

不全相等第十六页,共二十一页,编辑于2023年,星期日

在方差分析的计算中,上述第2、3步计算量较大,在实际应用中,通常是利用统计分析软件来完成的。下面我们通过一个实例,介绍在SAS(StatisticsAnalysisSystem)软件中进行方差分析的方法。第十七页,共二十一页,编辑于2023年,星期日四、实例

考虑本章开头的例子。首先提出检验假设:

并取

为了进行方差分析,我们调用SAS系统,并执行如下的计算程序:第十八页,共二十一页,编辑于2023年,星期日Datafcfx;Inputx@@;If_n_<=20theng=1;If20<_n_<=39theng=2;If39<_n_theng=3;Cards;12.40.97.03.91.66.43.03.92.21.12.77.86.91.59.43.87.58.412.26.0-0.65.712.84.1-1.8-0.16.312.79.812.62.05.67.07.94.36.47.05.43.15.69.56.08.79.25.03.55.88.015.511.816.311.814.64.98.13.86.113.216.59.2;;;;Procanovadata=fcfx;Classg;Modelx=g;Run;这两段程序提交运行后,可得如下结果:第十九页,共二十一页,编辑于2023年,星期日TheANOVAProcedureDependentVariable:x

SumofSourceDFSquaresMeanSquareFValuePr>FModel2176.76497688.3824885.540.0063Error57909.87152415.962658CorrectedTotal591086.636500上述结果即

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论