华北理工卫生统计学课件08方差分析_第1页
华北理工卫生统计学课件08方差分析_第2页
华北理工卫生统计学课件08方差分析_第3页
华北理工卫生统计学课件08方差分析_第4页
华北理工卫生统计学课件08方差分析_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八章方差分析(analysisofvariance)无论是在试验研究还是在调查研究中,如比较组数为k个,当k=2时,两组总体均数比较是否相等的假设可采用前面介绍的t检验或z检验(当然也可采用今天所介绍的方差分析);当k>2时,即检验两组以上的总体均数是否相等时,如采用前面所学两样本t检验进行两两比较,而得出结论,会使犯一类错误的概率增大。如从已知正态总体N(10,52)进行随机抽样,共抽取k=10组样本,每组样本含量均20,每组样本均数和标准差结果见表9-2。样本编号k1234567891012.6110.859.239.1110.909.249.5510.289.128.754.295.443.936.554.834.863.883.895.384.08表9-2从已知正态总体N(10,52)进行随机抽取10个样本的(ni=20)的结果

如要进行两两比较的t检验,即10个样本每两个进行,其比较的次数为:实验结果表示:若=0.05,则在45次比较中,发现有5次有统计学意义,结果见表9-3。从理论上讲10个样本均来自同一正态总体,应当无差别,但我们用两样本比较的t检验时,规定=0.05,其实际犯第一类错误的概率为5/45=0.11,显然比所要控制的0.05要大。需采用本章介绍的方差分析(ANOVA)样本编号k1与31与61与71与91与10tp2.6010.0132.3290.0252.3720.0232.7270.0292.9180.006表9-3

.45次比较中5次有统计学意义的结果方差分析的用途及应用条件①进行两个或两个以上样本均数的比较;方差分析对分析数据的要求及条件比较严格,即要求各样本为随机样本,各样本来自正态总体,各样本所代表的总体方差齐性或相等。a.可以同时分析一个、两个或多个因素对试验结果的作用和影响;b.分析多个因素的独立作用及多个因素之间的交互作用;②进行回归方程的线性假设检验。第一节方差分析的基本概念第二节完全随机设计资料的方差分析第三节随机区组设计资料的方差分析第四节

多个样本均数间的两两比较第五节方差分析的前提条件和变量变换第八章方差分析一、方差分析的几个名词离均差离均差平方和SS方差(2

S2

)均方(MS)标准差:S自由度:关系:MS=SS/二、方差分析的含义方差是描述变异的一种指标,方差分析是一种假设检验的方法。方差分析就是对变异的分析。是对总变异进行分析。看总变异是由哪些部分组成的,这些部分间的关系如何。三、方差分析的基本思想根据变异的来源,将全部观察值总的离均差平方和及自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某些特定因素的作用加以解释。通过比较不同来源变异的方差(也叫均方MS),得出F值,借助F分布做出统计推断,从而判断某因素对观察指标有无影响。第一节方差分析的基本概念第二节完全随机设计资料的方差分析第三节随机区组设计资料的方差分析第四节

多个样本均数间的两两比较第五节方差分析的前提条件和变量变换第八章方差分析

完全随机设计资料的方差分析用于完全随机设计(成组设计)的多个样本均数的比较。该分析中仅涉及一个研究因素,此因素有K(K≥2)个水平或状态。

无论是实验还是观察,研究目的都是比较不同水平下,各组平均值之间的差别是否具有统计学意义,这种多个样本均数的比较都可用单因素方差分析。例1某医生为研究一种四类降糖新药的疗效,以统一的纳入标准和排除标准选择了60名2型糖尿病患者,按完全随机设计方案将患者分为三组进行双盲临床试验。其中,降糖新药高剂量组21人,低剂量组19人,对照20人。对照组服用公认的降糖药物,治疗4周后测得其餐后2小时血糖的下降值(mmol/L),结果如表9-1所示。问治疗4周后,餐后2小时血糖下降值的总体平均水平是否不同?

高剂量组低剂量组对照组合计5.616.3-0.62.012.42.79.511.85.75.60.97.86.014.612.87.07.06.98.74.94.17.93.91.59.28.1-1.84.31.69.45.03.8-0.16.46.43.83.56.16.37.03.07.55.813.212.75.43.98.48.016.59.83.12.212.215.59.212.66.06.011.8211920609.19525.80005.43006.865017.360518.186712.384318.4176表1

2型糖尿病患者治疗4周后餐后2小时血糖下降值(mmol/L)表4方差分析试验数据示意图用Xij表示第i个处理组的第j个观察值;i=1、2…k;j=1,2,…ni

ni第i个处理组的例数总例数N=∑ni。第i个处理组的均数用表示,全部实验结果的总均数用表示。

方差分析的目的就是通过分析各个处理组均数之间的差别,推断它所代表的k个总体均数间是否存在差别。一.

总变异的分解

总变异(三个组共60人的餐后2小时血糖测定值大小不等;该变异既包含随机误差,又包含了三组用药即处理的不同)组内变异:个体差异及血糖的随机测定误差。组间变异:不同用药的影响及随机测量误差。各种变异的表示方法SS总总MS总SS组内组内MS组内SS组间组间MS组间三者之间的关系:SS总=SS组内+SS组间总=组内+组间变异比较:

F=↓

F=1:处理因素(三种药物)的作用相同。

F>1:处理因素(三种药物)的作用不相同F服从自由度为ν1与ν2的F分布,见:p435附表3F与比较:

F<,p>α处理因素的作用相同

F≥,P≤α处理因素的作用不同表5成组设计方差分析的计算公式变异来源SSνMSF

总组间组内N-1K-1N-KSS组间/组间SS组内/组内MS组间/MS组内SS总-SS组间二、分析计算步骤

(1)建立假设并确定检验水准

H0:三个总体均数相等;即μ1=μ2=μ3

H1:三个总体均数不等或不全相等

α=0.05

(2)计算检验统计量F值

表6例1的方差分析表变异来源SSdfMSFP组间(处理组间)176.7612288.3806

5.537<0.01组内(误差)909.87235715.9627总1086.6335593).

确定P值并作出推断结论以分子的自由度ν组间=2为ν1,分母的自由度ν组内=57为ν2,查附表3.1,方差分析用F界值表,F0.05(2,60)=3.15F0.01(2,60)=4.98,F=5.537>F0.01(2,60)=4.98, P<0.01。在α=0.05水准上拒绝H0,接受H1可以认为三种人的血糖水平不同。

注意:以上结论表明,总的说三种人的血糖水平有差别,但并不能说明任何两种人的血糖值均有差别。只能说可能至少有两组人的血糖值有差别,可能有的组间没有差别。要了解那些组均数间有差别,那些组均数间没有差别,需要进一步做两两比较。

当k=2时,对同一资料,单因素方差分析等价于成组设计的t检验,且F=t2。第一节方差分析的基本概念第二节完全随机设计资料的方差分析第三节随机区组设计资料的方差分析第四节

多个样本均数间的两两比较第五节方差分析的前提条件和变量变换第八章方差分析

随机区组设计的多个样本均数的比较可用多个样本均数比较的两因素方差分析。两因素是指主要的研究因素和配伍组(区组)因素,研究因素有k个水平,共有n个区组。表7A.B.C三种方案处理后大白兔血中白蛋白减少量(g/L))区组号A方案B方案C方案123456789102.212.323.151.862.561.982.372.883.053.422.912.643.673.292.452.743.153.442.612.864.254.564.333.893.784.624.713.563.774.233.12333.17333.71673.01332.93003.11333.41003.29333.14333.5033

102.58000.2743102.97600.1581104.17000.1605

30(N)3.2420

0.6565(S2)一、总变异的分解

总变异处理组间变异:A、B、C不同方案的影响及机测量误差。区组间变异:既反映了十个区组不同的影响同时又包括了随机测量误差。误差变异:个体差异及血白蛋白的随机测定误差。SS总总SS组内组内MS组内SS组间组间MS组间变异之间的关系:SS总=SS组内+SS组间+SS区间总=组内+组间+区间变异间的关系SS区间区间MS区间统计量F的计算F1=MS组间/MS组内

F2=MS区间/MS组内表10随机区组设计方差分析的计算公式变异来源SSvMSF处理间区组间k-1n-1V总-v处理-v配伍SS处理/v处理SS区组/v区组SS误差/v误差MS处理/MS误差MS区组/MS误差总

N-1

SS总-SS处理-SS配伍误差二.分析计算步骤(1)建立假设并建立检验水准对于处理组:

H0:三个总体均数全相等,即μ1=μ2=μ3H1:三个总体均数不等或不全相等对于区组:

H0:十个总体均数全相等

H1:十个总体均数不等或不全相等α=0.05(2)计算检验统计量F值表9例2的方差分析表变异来源SSdfMSFP组间(处理组间)13.708026.850932.639<0.01区组间1.557790.17310.825>0.05误差3.7790180.2099总19.0385293).

确定P值并作出推断结论以分子的自由度ν处理=2为ν1,分母的自由度ν误差=18为ν2,查附表3,方差分析用F界值表,F0.05(2,18)=2.62,F处理=32.639>F0.05(2,18)=2.62, P<0.05。在α=0.05水准上拒绝H0,认为三种方案的处理有差别.以分子的自由度ν区组=9为ν1,分母的自由度ν误差=18为ν2,查附表3,方差分析用F界值表,F0.05(9,18)=2.00,F处理=0.825<F0.05(9,18)=2.00, P>0.05。在α=0.05水准上不拒绝H0,还不能认为十个区组间有差别.第一节方差分析的基本概念第二节完全随机设计资料的方差分析第三节随机区组设计资料的方差分析第四节

多个样本均数间的两两比较第五节方差分析的前提条件和变量变换第八章方差分析在检验多组均数差别的无效假设H0时,常见的有以下两种情况:1.检验某几个特定的总体均数是否相等,其无效假设称为部分无效假设即某几个组所对应的总体均数相等,H0:μi=μj(i≠j),如研究者对实验结果有一个大致的设想,在设计阶段就根据研目的或专业知识决定了某些均数间的两两比较,常见于事先有明确假设的证实性实验研究。2.检验全部k个总体均数是否相等,其无效假设称为完全无效假设即所有各组所对应的总体均数都相等,H0:μ1=μ2=μ3=…=μk。例如在研究设计阶段对实验结果知之不多的探索性研究,或经数据结果的提示后,才决定的多个均数间的两两比较,这类情况往往涉及到每两个均数的两两比较。一、多个样本均数间每两个均数的比较:即SNK-q检验。为两个对比组的样本均数为比较两组差值的标准误,当各处理组例数相等时,也相等,MS误差为方差分析中算得的误差均方(组内均方),nA和nB分别为两对比组的样本例数。计算的检验统计量为q值,q的分布与两比较组之间的组间跨度a及自由度ν有关。组间跨度a是指之间涵盖的均数个数(包括自身在内)

每个对比组所包含的组数(组间跨度)a=2,3,…K。根据检验统计量q值,组间跨度a,误差自由度ν误差及检验水准α,查q界值表,确定P值。例5对例1资料做两两比较H0:任两对比组的总体均数相等,即μA=μB

H1:任两对比组的总体均数不等,即μA≠μB

α=0.05将三个样本均数从小到大排列,并编上组次:

组次123

均数9.19525.80005.4300

组别高剂量组低剂量组对照组

列出两两计算表(见表9-18)

表18例1的SNK检验计算表对比组两均数之差差值的q对比组内q临界值PA与B标准误包含组数a0.050.011与33.76520.88274.26633.404.280.01~0.051与23.39520.89453.79622.833.76<0.012与30.37000.90510.10922.833.73>0.05二、

Dunnett检验:它适用于多个实验组与一个对照组的比较

根据算得的t值、误差的自由度、试验组数(K-1)及检验水准查Dunnett-t界值表,作出统计推断结论。

例9-6分析例9-2比较A、B两方案(均为实验组)与方案(对照组的总体均数是否不同?A(B)方案与C方案相比

H0:A(B)方案与C方案的总体均数相等

H1:A(B)方案与C方案的总体均数不等

α=0.05

2)计算检验统计量

表19例2的Dunnett-t检验计算表对比组T与C两均数之差tDPA与C-1.5900-7.760<0.01B与C-1.1940-5.827<0.013)确定P值,作出统计推断结论,查Dunnett界值表,得双侧t0.05=2.04,t0.01=2.84,P<0.01,在α=0.05水准上,拒绝H0,接受H1。故认为A

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论