第九章-方差分析_第1页
第九章-方差分析_第2页
第九章-方差分析_第3页
第九章-方差分析_第4页
第九章-方差分析_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

会计学1第九章----方差分析t检验u检验单样本样本均数与总体均数n较小σ已知,σ未知但n足够大两样本样本均数与样本均数n1、n2均较小n1、n2均较大

适用于u检验的资料都可以使用t检验多个样本均数比较方差分析(F检验)第1页/共61页方差分析的发明者

方差分析由著名英国统计学家R.A.Fisher在1923年提出,为纪念Fisher,以F命名,故方差分析又称F检验。第2页/共61页

例6.1随机抽取50~59岁男性正常者、冠心病人、脂肪肝患者各11人,测定空腹血糖值,试推断三类人群空腹血糖值总体均数是否相同?第3页/共61页

第一节方差分析的概述第4页/共61页

在进行科研时,有时需要按实验设计将所研究的对象随机分为多个处理组,施加不同的干预措施,所施加的干预措施称为处理因素。处理因素至少有两个水平。第5页/共61页

一、多个样本均数间的比较能否用t检验或

u检验?为什么?

第6页/共61页原因:

五个样本均数进行比较,每次两个均数作一次t检验,共需作10(C52=10)次t检验。若每次比较的检验水准α=0.05,则每次比较不犯Ⅰ型错误的概率为(1-α)=0.95。当这些检验独立进行时,则10次比较均不犯Ⅰ型错误的概率为0.9510=0.5987,此时犯Ⅰ型错误的概率,即总的检验水准α变为1-0.5987=0.4013比0.05大的多。犯Ⅰ型错误的概率增大,可能将原本无差别的两个总体推断为有差别,误判为有统计意义。因此多重比较不宜用的t检验或u检验作两两比较。第7页/共61页

比较的次数为Ck2即次。若每次比较的检验水准为α,则每次比较不犯Ⅰ型错误的概率为(1-α)。当这些检验独立进行时,则m次比较均不犯Ⅰ型错误的概率为(1-α)m,此时犯Ⅰ型错误的概率,即总的检验水准α变为1-(1-α)m。第8页/共61页

二、方差分析的目的

在无效假设成立的前提下,通过分析各处理组均数之间的差别,以推断其各相应总体均数间有无差别,从而说明处理因素的效果是否不同(或处理因素是否起作用)。第9页/共61页

三、方差分析的基本思想

根据实验设计的类型及研究目的,将全部观察值之间所表现出来的总变异,分解为两个或多个部分。除随机误差作用外,其余每个部分的变异均可由某个因素的作用加以解释。通过比较不同变异来源的均方(MS),借助F分布做出统计推断,从而推断研究因素对试验结果有无影响。第10页/共61页

四、方差分析的应用条件

1、各样本是相互独立的随机样本,且来自正态分布的总体;2、相互比较的各样本的总体方差相等,即具有方差齐性。

独立性、随机性、正态性、方差齐性第11页/共61页五、方差分析的用途

1、用于进行两个或多个样本均数的比较;2、分析两因素或多因素间的交互作用;3、用于回归方程的线性假设检验。第12页/共61页六、方差分析的优点

1、不受比较组数的限制,可比较多组均数;2、可同时分析多个因素的作用;3、可分析因素间的交互作用.第13页/共61页

第二节完全随机设计的方差分析

one-wayANOVA

(单因素方差分析)

第14页/共61页完全随机设计(completelyrandomdesign)是将全部试验对象按随机化的方法,分配到各个处理组中,各组对象分别接受不同水平的处理;试验或观察结束后,比较各组均数之间的差别有无统计学意义,推断处理因素的效应。第15页/共61页

各组样本含量可以相等也可以不等,相等时检验效率较高。由于完全随机设计的方差分析只有一个研究因素,所以又称为单因素方差分析。第16页/共61页一、数据的基本形式第17页/共61页第1组第2组…第k组X11X21…Xk1X12X22…Xk2┇┇…┇X1jX2j…Xkj┇┇…┇X1nX2n…Xkn…n1n2…nkNS1S2…SkS2222

完全随机设计方差分析的数据结构第18页/共61页

例随机抽取50~59岁男性正常者、冠心病人、脂肪肝患者各11人,测定空腹血糖值,试推断三类人群空腹血糖值总体均数是否相同?第19页/共61页正常组冠心病组脂肪肝组4.756.265.784.754.366.68┇┇…4.625.595.72111111334.610.28955.060.54495.710.42745.130.6207三组观察对象空腹血糖检测结果(mmol/L)第20页/共61页二、变异分解第21页/共61页

1、总变异:33个空腹血糖检测数据大小不等,这种变异称为总变异。总变异的大小可用离均差平方和表示,即各观测值Xij与总均数差值的平方和,记为SS总。SS总反映了所有观测值之间总的变异程度。第22页/共61页

计算公式:第23页/共61页

简化计算公式:第24页/共61页

2、组间变异:

各处理组的样本均数大小不等,这种变异称为组间变异,其大小可用各组均数与总均数的离均差平方和表示。记作SS组间。

组间变异存在的原因:

⑴.随机误差(包括个体变异和测量误差);⑵.处理因素的不同水平可能对实验结果有影响。第25页/共61页

计算公式:第26页/共61页3、组内变异:

在同一处理组内,虽然各受试对象接受的处理相同,但测量值之间仍不同,这种变异称为组内变异(误差),其大小可用组内各测量值Xij与其组均数差值的平方和表示,

记为SS组内,反映了随机误差的影响。第27页/共61页

计算公式:第28页/共61页4、三种变异的关系:离均差平方和与自由度具有可加性第29页/共61页5、方差分析的检验统计量F值:第30页/共61页

检验统计量F值的意义:

多个样本均数比较的方差分析,其无效假设H0是各样本均数来自相同的总体,即处理因素对研究结果无影响,组间变异与组内变异均只反映随机误差作用的大小,则F值在理论上应等于1,由于抽样的偶然性,得到的F值不会恰好等于1,而是接近1。若处理因素对研究结果有影响,将出现MS组间明显大于MS组内,F值也明显大于1。F值越大,拒绝H0的理由越充分。第31页/共61页

若组间变异明显大于组内变异,则不能认为组间变异仅反映随机误差的大小,处理因素也在起作用。根据计算出的检验统计量F值,查界值表得到相应的P值,按所取检验水准α作出统计推断结论。检验统计量F值服从F分布。

F<Fα,(ν组间,ν组内),则P

>α,不拒绝H0,还不能认为各样本所来自的总体均数不同;

当F≥Fα,(ν组间,ν组内),则P≤α,拒绝H0,接受H1,可认为总体均数不等或不全相等。第32页/共61页三、实例计算第33页/共61页

例6.1随机抽取50~59岁男性正常者、冠心病人、脂肪肝患者各11人,测定空腹血糖值,试推断三类人群总体均值是否相同?第34页/共61页3组观察对象空腹血糖测定结果(mmol/L)组别

测量值甲组4.754.754.774.614.494.025.034.574.214.884.62乙组6.264.365.244.674.555.184.615.125.264.835.59丙组5.786.685.445.865.675.245.425.146.095.745.72第35页/共61页组别正常组114.610.2895冠心病组115.060.5449脂肪肝组115.710.4274合计335.130.6207第36页/共61页

1、变异的分解:

本资料是根据研究者所施加的干预措施不同进行分组的。处理因素:即干预措施,

三个水平:正常组冠心病组脂肪肝组第37页/共61页(1)、总变异:

33个空腹血糖的检测结果不尽相同,具有变异。这一变异既有随机误差,又包含了处理因素的影响。第38页/共61页第39页/共61页(2)、组内变异:

正常组、冠心病组和脂肪肝组三组观察对象,同一组内的各个研究对象的空腹血糖测定结果大小不同。产生这种差异的原因是研究对象的个体差异、测量误差等偶然因素。由这类原因造成的误差称为随机误差,方差分析中称组内变异。

SS组内的大小与变异及样本含量有关,能够客观反映组内变异的是组内均方(即方差),用MS组内表示。第40页/共61页第41页/共61页(3)、组间变异:

正常组、冠心病组和脂肪肝酒组三组各组的组均数不尽相同,在方差分析中称为组间变异,它表明各处理因素间的变异程度。组间变异包括了随机误差,也反映了处理因素可能对观察结果的影响。能够客观反映组间变异的是组间均方(即方差),用MS组间表示。第42页/共61页第43页/共61页2、分析步骤:即三个组空腹血糖值的总体均数相等三个组空腹血糖值的总体均数不等或不全相等第44页/共61页变异来源SS自由度均方MSFP总变异12.328632组间6.694723.364417.97<0.01组内5.6339300.1878

查表得F0.05(2,

30)=2.89,F0.01(2,

30)=3.89,F>3.89,

P<0.01,按α=0.05,拒绝H0,接受H1,可以认为三组人群的空腹血糖值总体均数不等或不全相等,

即不同人群空腹血糖值存在差异。第45页/共61页注意:

方差分析的结果若拒绝H0,接受H1,不能说明各组总体均数两两间都有差别。如果要分析哪两组之间有差别,需要进行多个均数间的多重比较。当k=2时,完全随机设计的方差分析结果与完全随机设计的两样本均数比较的t

检验是等价的,而且F=t2。第46页/共61页

已知各组均数、标准差和样本含量时F值的简便计算方法。当原始数据未知,只知各组均数、标准差和样本含量时,可进行如下计算,分两种情况:1、各组样本含量ni相等;2、各组样本含量ni不等。第47页/共61页1、各组样本含量ni相等时,F值的计算:

第48页/共61页

本例计算结果:

同前。

第49页/共61页2、各组样本含量ni不等时,F值的计算:

第50页/共61页第三节多个样本均数间的多重比较第51页/共61页

SNK(Student-Newman-Keuls)-q检验

适用于多个样本均数两两之间的全面比较。

统计量q的公式:注:在完全随机设计的方差分析中,MS误差为MS组内,ν误差为ν组内。第52页/共61页SNK(Student-Newman-Keuls)-q检验优点:1.灵敏度适中;2.犯Ⅰ类、Ⅱ类错误的概率都不是很大。3.由于采用多重界值,检验的准确性较高。第53页/共61页3组观察对象空腹血糖测量结果(mmol/L)组别

测量值正常组4.754.754.774.614.494.025.034.574.214.884.62冠心病组6.264.365.244.674.555.184.615.125.264.835.59脂肪肝组5.786.685.445.865.675.245.425.146.095.745.72变异来源SS自由度均方MSFP总变异12.328632组间6.694723.364417.97<0.01组内5.6339300.1878第54页/共61页

例:三组观察对象空腹血糖值均数两两之间有无差别?H0:A=B,即任意两对比组的总体均数相等H1:A≠B,即任意两对比组的总体均数不等α=0.05

将3个均数由大到小排队,并编上秩次:

均数5.715.064.61组别脂肪肝组冠心病组正常组秩次123第55页/共61页

计算检验统计量:

第1组与第3组比

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论