线性模型与基本假定_第1页
线性模型与基本假定_第2页
线性模型与基本假定_第3页
线性模型与基本假定_第4页
线性模型与基本假定_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一、线性模型与基本假定

假设某单因素试验有k个处理,n次重复,完全随机设计,则共有nk个观察值,其数据结构和符号如表5-1所示。xij可以表示为第一节方差分析的基本原理与步骤12/16/2022其中,为第i个处理观测值总体平均数;为试验误差、相互独立、且服从正态分布N(0,σ2)。

若令则(5-1)式可以改写为(5-4)12/16/2022其中,μ为全试验观测值总体平均数;是第i个处理的效应,表示处理i对试验结果产生的影响。

显然有(5-4)式叫做单因素完全随机设计试验资料的数学模型。

12/16/2022

表示为总平均数μ、处理效应αi、试验误差εij之和。由εij相互独立且服从正态分布N(0,σ2),可知各处理Ai(i=1,2,…,k)所属总体亦应具正态性,即服从正态分布N(μi,σ2)。尽管各总体的均数可以不等或相等,σ2则必须是相等的。12/16/2022

所以,单因素完全随机设计试验资料的数学模型可归纳为:

效应的可加性(additivity)

分布的正态性(normality)

方差的一致性(homogeneity)12/16/2022二、平方和与自由度的分解在方差分析中用样本方差即均方来度量资料的变异程度。在表5-1中,度量全部观测值总变异的总均方分解为度量处理间变异的处理间均方和度量处理内变异的处理内均方两部分。12/16/2022

统计学上,这种分解是通过将总均方的分子──称为总离均差平方和,简称为总平方和,分解为处理间平方和与处理内平方和两部分;将总均方的分母──称为总自由度,分解为处理间自由度与处理内自由度两部分来实现的。12/16/2022(一)总平方和的分解

在表5-1中,反映全部观测值总变异的总平方和是各观测值xij与总平均数的离均差平方和,记为SST。即因为12/16/2022其中12/16/2022所以

式中,为各处理平均数与总平均数的离均差平方和与重复数n的乘积,反映了重复n次的处理间变异,称为处理间平方和,记为SSt,即12/16/2022为各处理内离均差平方和之和,反映了各处理内的变异即误差,称为处理内平方和或误差平方和,记为SSe,即

于是有SST=SSt+SSe

12/16/20223种平方和的简便计算公式矫正数

12/16/2022(二)总自由度的分解

在计算总平方和时,资料中kn个观测值的离均差要受这一条件的约束,故总自由度等于资料中观测值的总个数减一,即kn-1。总自由度记为dfT,dfT=kn-1。12/16/2022

在计算处理间平方和时,k个处理均数的离均差要受这一条件的约束,故处理间自由度为处理数减一,即k-1。处理间自由度记为dft,dft=k-1

12/16/2022在计算处理内平方和时,kn个离均差要受k个条件的约束,即故处理内自由度为资料中观测值的总个数减k

,即kn-k

。处理内自由度记为dfe

dfe=kn-k=k(n-1)(i=1,2,…,k)12/16/2022因为所以12/16/2022各项平方和除以各自的自由度便得到总均方、处理间均方和处理内均方,分别记为MST(或)、MSt(或)和MSe(或),即12/16/2022

【例5-1】有一水稻施肥的盆栽试验,设置了5个处理:A1和A2分别施用两种不同工艺流程的氨水,A3施碳酸氢铵,A4施尿素,A5不施氮肥。每个处理各4盆(施氮处理的施肥量每盆皆为折合纯氮1.2克),共有5×4=20盆,随机置于同一盆栽场。其稻谷产量(g/盆)列于表5-2。12/16/2022

各项平方和与自由度计算如下12/16/202212/16/2022

方差分析就是通过MSt

与MSe的比较来推断是否为零即是否相等。三、F检验相当于μ1=μ2=…=μk12/16/2022统计学已证明,在的条件下,服从自由度df1=k-1与df2=k(n-1)的F分布。即

12/16/2022

若实际计算的F值大于,则F

值在α=0.05的水平上显著,我们以95%的可靠性(即冒5%的风险)推断MSt代表的总体方差大于MSe代表的总体方差,即这种用F值出现概率的大小推断一个总体方差是否大于另一个总体方差的方法称为F检验(F-test)。12/16/2022

对于单因素完全随机设计试验资料的方差分析:无效假设H0:μ1=μ2=…=μk备择假设HA:各μi不全相等或

F=MSt/MSe,也就是要判断处理间均方是否显著大于处理内(误差)均方。

12/16/2022实际进行F检验时,是将由试验资料所算得的F值与根据df1=dft(大均方即分子均方的自由度)、df2=dfe(小均方即分母均方的自由度)查附表4所得的临界F值,相比较作出统计推断。

12/16/2022若F<,即p>0.05,不能否定统计学上,把这一检验结果表述为:各处理间差异不显著或简述为F值不显著,在F值的右上方标记“ns”,或不标记符号;

H0:12/16/2022若≤F<即0.01<p≤0.05,否定H0:接受HA:

统计学上,把这一检验结果表述为:各处理间差异显著或简述为F值显著,在F值的右上方标记“*”;12/16/2022若F≥,即p≤0.01,否定H0:,接受HA:统计学上,把这一检验结果表述为:各处理间差异极显著或简述为F值极显著,在F值的右上方标记“**”。

12/16/2022对于【例5·1】,因为根据df1=dft=4,df2=dfe=15查附表4,得F0.01(4,15)=4.89,因为F>F0.01(4,15),即p<0.01,表明五种不同施肥处理的稻谷产量差异极显著,施肥处理不同,产量亦不同。12/16/2022表5-3表5-2资料方差分析表变异来源SSdfMSF值处理间301.2475.3011.19**处理内101.0156.73总变异402.21912/16/2022四、多重比较

F值显著或极显著,否定无效假设HO,表明试验中各处理平均数间存在显著或极显著差异,但并不意味着每两个处理平均数间的差异都显著或极显著的,也不能具体说明哪些处理平均数间有显著或极显著差异,哪些差异不显著。下一张

主页

退出

上一张

12/16/2022有必要进行两两处理平均数间的比较,以具体判断两两处理平均数间的差异显著性。

统计学上把多个平均数两两间的相互比较称为多重比较。多重比较的方法很多,常用的有最小显著差数法(LSD法)和最小显著极差法(LSR法)。12/16/2022

此法的基本作法是:在F检验显著的前提下,先计算出显著水平为α的最小显著差数,然后将任意两个处理平均数的差数的绝对值与其比较:下一张

主页

退出

上一张

(一)最小显著差数法(LSD法)12/16/2022若>LSDα,则与在α水平上差异显著;反之,则在α水平上差异不显著。最小显著差数由下式计算:

式中:为在F检验中误差自由度下,显著水平为α的临界t值,为均数差数标准误,

下一张

主页

退出

上一张

12/16/2022其中为F检验中的误差均方,n为各处理的重复数。当显著水平α=0.05和0.01时,从t值表中查出和,得:

利用LSD法进行多重比较时,可按如下步骤进行:

12/16/2022(2)计算最小显著差数和;(3)将平均数多重比较表中两两平均数的差数与、比较,作出统计推断。

下一张

主页

退出

上一张

(1)列出平均数多重比较表比较表中各处理按其平均数从大到小自上而下排列;

12/16/2022对于【例5-1】,多重比较如表5-4所示。

12/16/2022

检验结果:差数2.5、1.5、3.0不显著;差数4.5、4.0、4.5显著;差数7.0、8.5、7.0和11.5极显著。表明:施尿素的稻谷平均产量极显著高于对照和施氨水2、显著高于施氨水1;

施碳酸氢铵的稻谷平均产量极显著高于对照、显著高于施氨水2;12/16/2022

施氨水1的稻谷平均产量极显著高于对照;

施氨水2的稻谷平均产量显著高于对照;

施尿素与施碳酸氢铵、施碳酸氢铵与施氨水1、施氨水1与施氨水2的稻谷平均产量差异不显著;

以施尿素的稻谷产量最高。12/16/2022

(二)最小显著极差法(LSR法)

LSR法的特点是把平均数的差数看成是平均数的极差,根据极差范围内所包含的处理数(称为秩次距)k的不同而采用不同的检验尺度,以克服LSD法的不足。这些在显著水平α上依秩次距k的不同而采用的不同的检验尺度叫做最小显著极差(LSR)。12/16/2022

因为LSR法是一种极差检验法,所以当一个平均数大集合的极差不显著时,其中所包含的各个较小集合极差也应一概作不显著处理。常用的LSR法有q检验法和新复极差法两种。

1、q

检验法

此法是以统计量q的概率分布为基础的。q值由下式求得:

12/16/2022式中,w为极差,为标准误,分布依赖于误差自由度dfe及秩次距k。利用q检验法进行多重比较时,为了简便起见,不是将算出的q值与临界q值比较,而是将极差与比较,从而作出统计推断。为α水平上的最小显著极差:下一张

主页

退出

上一张

12/16/2022

(1)列出平均数多重比较表;(2)由自由度dfe、秩次距k查临界q值,计算最小显著极差LSR0.05,k,LSR0.01,k;(3)将平均数多重比较表中的各极差与相应的最小显著极差LSR0.05,k,LSR0.01,k比较,作出统计推断。

下一张

主页

退出

上一张

12/16/2022

对于【例5-1】,各处理平均数多重比较表见表5-5(同表5-4)。前已述及,在表5-5(即表5-4)中,极差4.5、3.0、1.5和3.0的秩次距为2;极差7.0、4.0和4.5的秩次距为3;极差8.5和7.0的秩次距为4;极差11.5的秩次距为5。

查附表7,得df=15时,p=2,3,4的q值,进而可得LSR,列于表5-6。12/16/2022

2、SSR法此法是由邓肯(Duncan)于1955年提出,又称为Duncan法,或新复极差法。新复极差法与q法的检验步骤相同,唯一不同的是计算最小显著极差时需查SSR表(附表6)而不是查q值表。最小显著极差计算公式为:

下一张

主页

退出

上一张

12/16/2022

对于【例5-1】,各处理平均数多重比较表同表5-4。

已算出=1.2971,依dfe=15,k=2,3,4,5,由附表6查临界SSR0.05(15,k)和SSR0.01(15,k)值,乘以=1.2971,求得各最小显著极差,SSR值与LSR值列于表5-7。

将表5-4中的极差与表5-7中的最小显著极差比较,除极差4.0不显著外,其余检验结果与LSD法相同。12/16/2022以上介绍的三种多重比较方法,其检验尺度有如下关系:

LSD法≤SSR法≤q法当秩次距k=2时,取等号;秩次距k≥3时,取小于号。在多重比较中,LSD法的尺度最小,q检验法尺度最大,新复极差法尺度居中。用上述排列顺序前面方法检验显著的差数,用后面方法检验未必显著;用后面方法检验显著的差数,用前面方法检验必然显著。下一张

主页

退出

上一张

12/16/2022

生物试验中,由于试验误差较大,常采用SSR法;

F检验显著后,为了简便,也可采用LSD法。12/16/2022

此法是将多重比较结果直接标记在平均数多重比较表上,如表5-4、表5-5所示。由于在多重比较表中各个平均数差数构成一个三角形阵列,故称为三角形法。此法的优点是简便直观,缺点是占的篇幅较大。

1、三角形法(三)多重比较结果的表示方法12/16/2022

2、标记字母法

先将各处理平均

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论