数理统计:方差分析_第1页
数理统计:方差分析_第2页
数理统计:方差分析_第3页
数理统计:方差分析_第4页
数理统计:方差分析_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

方差分析方差分析的基本概念

当两个总体方差相等时,可用t

检验来检验两个总体均值间的差异性;当总体是三个或三个以上时如何检验呢?就要用本章的方差分析。它是在二十世纪20年代由英国著名统计学家R.A.Fisher首先应用到农业试验中的。

方差分析的作用:从方差的角度分析试验数据、判断各因素各状态对试验结果影响大小。方差分析的方法也有所不同。本章重点介绍单、双因素方差分析。方差分析的几个概念

例1

检验某种激素对羊羔增重的效应。选用3个剂量进行试验,加上对照(不用激素)在内,每次试验要用4只羊羔,若进行4次重复,则共需要16只羊羔。研究激素用量对羊羔增重的影响是否显著。羊羔的增重(kg/每头/每200日)

处理重复1(对照)234147505754252545365362676974451575759

试验中,我们所关心的指标,即羊羔的增重数量,称为试验指标或响应值;影响增重数量(响应值)的指标是激素,称为因素;激素用量(因素的状态)称为因素的水平或简称水平。本例中有1个因素,4个水平,故称为单因素试验。

在方差分析中,通常取1-3个因素进行研究。因素的每一个状态称为一个水平,水平可以是数量化的,也可以是定性的。

例1为单因素四水平试验。也就是四个总体的比较问题。

本例中有一因素(激素,记为A)四个不同水平(分别记为A1,A2,A3,A4)。可认为一个激素水平的增重量就是一个总体,在方差分析中总假定各总体独立地服从同方差的正态分布,即第j个激素水平的增重量是一个随机变量,它服从分布N(

j,

2)i=1,2,3,4.

要检验假设

若拒绝H0,我们就认为这四个激素水平的平均增重量之间有显著差异;反之,就认为各激素水平间增重量的不同是由随机因素引起的。

方差分析是检验同方差的若干正态母体均值是否相等的一种统计分析方法。基本概念

1、指标:试验中所考虑的量

2、因素:影响试验指标的条件

3、水平:因素所处的状态

第一讲单因素方差分析

如果一项试验中只有一个因素在改变称为单因素试验,如果多于一个因素在改变称为多因素试验.例1考察温度对某要得率的影响,选了五种不同的温度,在同一温度下各做了四次试验,结果如下表。试问温度的不同是否影响该药的得率?

温度得率606570758018680837696289839081933918894849549084858294合计8983.758880.7594.50得率差异的原因:1.受试验中随机因数的影响2.由于温度不同(即所考察的因素或处理水平不同)前者是不可避免的试验误差,而后者可能确实存在,也可能不存在,换言之,就是一个因素的不同水平可能对试验的结果的影响有显著意义,也可能没有显著意义。设分别表示在温度60,65,70,75,80下的某药的得率,显然它们都是随机变量,代表五个总体,且假定设每一个观察记为xij,则问题即是作如下的假设检验一般地,设单因素试验中,因素A有k个水平(总体),记为A1,A2,…,Ak,相应的响应值(试验结果)X1,X2,…,Xk

是k个相互独立的总体,且Xj~N(

j,

2)(

j=1,2,…,k)。今对第j个总体进行nj次重复观测,得到nj个观测数据xij(i=1,2,…,nj),这可以看成是取自Xj的一个容量为nj的样本。这里,并不要求n1,n2,…,nk完全相同。观测数据及计算列表如下。问题:几个符号说明组内平均值(水平Aj下的样本平均值)样本总平均值,其中n=n1+n2+…+nk组内和(水平Aj下的样本和)总离差平方和组内离差平方和组间离差平方和符号的统计意义总离差平方和

事实上可以看到总离差平方和是样本方差S2

的(n-1)倍,所以它反映的是整批数据的波动程度。造成这种波动的因素主要有两个:一个是随机因素造成的,一个是由于水平间的差异所造成。若假设H0为真,则这一种波动主要是由随机因素引起的差异,若H0为假,则这种差异除了随机因素的差异,主要是由水平间的差异所造成。基本思想:把总离差平方和分离成随机因素部分和因素水平部分,寻找适合的统计量进行度量,若因素水平引起的差异过大的,则拒绝H0。离差平方和间的关系离差平方和间的关系证:该项求和为0的自由度为n-1的自由度为n-k的自由度为k-1

一般,当F>F0.01时,称因子的影响高度显著,记为“**”;当F≥F0.05时,称因子的影响显著,记为“*”;当F<F0.05时,称因子无显著影响,即认为因子各水平间无差异.拒绝域:方差分析的解题步骤1.建立原假设H02.在H0成立的前提下,由试验结果数据表,计算检验统计量的F值,计算过程如下:先利用计算器先计算全部数据的样本均值,样本方差S2和各组的样本均值样本方差,再利用公式计算先利用计算器先计算全部数据的样本均值,样本方差S2和各组的样本均值样本方差,再利用公式计算先利用计算器先计算全部数据的样本均值,样本方差S2和各组的样本均值样本方差,再利用公式计算3.查临界值4.给出统计判断。拒绝H0续上例1.设立原假设2.计算统计量拒绝H0,即认为温度对得率有显著的影响。4.比较3.查表第二节两两间的多重比较一、T法(T.W.Tukey)

设因素A共有k个水平,每个水平均作m次试验,经方差分析判明各水平间存在显著性差异后,为比较两两均值间差异是否显著,可用T值进行判断。T值计算公式为:为组内均方.m为试验试验.其中可由附表14查得.

一般的,假如第i组与第j组的均值之差的绝对值大于T值,即就判断ui与uj之间差异显著;否则判断差异不显著。T法优点:与统一的T值比较,简化计算过程,计算量较少。T法缺点:要求各试验组的试验次数相同。

一般的,假如第i组与第j组的均值之差的绝对值大于T值,即就判断ui与uj之间差异显著;否则判断差异不显著。例2:续上例.由题设:从而计算T值为:二、S法(H.Scheffe)

因素A有k个水平(总体

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论