线性模型与基本假定.ppt_第1页
线性模型与基本假定.ppt_第2页
线性模型与基本假定.ppt_第3页
线性模型与基本假定.ppt_第4页
线性模型与基本假定.ppt_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、一、线性模型与基本假定,假设某单因素试验有k个处理,n次重复,完全随机设计,则共有nk个观察值,其数据结构和符号如表5-1所示。 xij可以表示为,第一节 方差分析的基本原理与步骤,为试验误差、相互独立、且服从正态分布N(0,2)。,若令,则(5-1)式可以改写为,(5-4),其中,为全试验观测值总体平均数;,是第i个处理的效应,表示处理i对试验结果产生的影响。,显然有,(5-4)式叫做单因素完全随机设计试验资料的数学模型。,表示为总平均数、处理效应i、试验误差ij 之和。 由ij相互独立且服从正态分布N(0,2),可知各处理Ai (i=1,2,k) 所属总体 亦 应 具 正 态 性 , 即

2、服 从 正 态 分 布N(i ,2) 。尽管各总体的均数可以不等或相等,2则必须是相等的。,所以,单因素完全随机设计试验资料的数学模型可归纳为: 效应的可加性(additivity) 分布的正态性(normality) 方差的一致性(homogeneity),二、平方和与自由度的分解,在方差分析中用样本方差即均方来度量资料的变异程度。,在表5-1中,度量全部观测值总变异的总均方分解为度量处理间变异的处理间均方和度量处理内变异的处理内均方两部分。,统计学上,这种分解是通过将总均方的分子称为总离均差平方和,简称为总平方和,分解为处理间平方和与处理内平方和两部分;将总均方的分母称为总自由度,分解为处

3、理间自由度与处理内自由度两部分来实现的。,(一)总平方和的分解,在表5-1中,反映全部观测值总变异的总平方和是各观测值xij与总平均数 的离均差平方和,记为SST。即,因为,其中,所以,式中, 为各处理平均数 与总平均数 的离均差平方和与重复数n的乘积,反映了重复n次的处理间变异,称为处理间平方和,记为SSt,即,为各处理内离均差平方和之和,反映了各处理内的变异即误差,称为处理内平方和或误差平方和,记为SSe,即,于是有,SST = SSt + SSe,3种平方和的简便计算公式,矫正数,(二)总自由度的分解,在计算总平方和时,资料中kn个观测值的离均差,要受,这一条件的约束,故总自由度等于资料

4、中观 测值的总个数减一, 即kn-1。总自由度记为 dfT,dfT=kn-1。,在计算处理间平方和时,k个处理均数的离均差,要受,这一条件的约束,故处理间自由度为处理数减一,即k-1。处理间自由度记为dft,dft=k-1,在计算处理内平方和时,kn个离均差,要受k个条件的约束,即,故处理内自由度为资料中观测值的总个数减 k ,即 kn - k 。 处理内自由度记为 dfe dfe=kn-k=k(n-1),(i=1,2,k),因为,所以,各项平方和除以各自的自由度便得到总均方、处理间均方和处理内均方,分别记为MST(或,)、MSt(或,)和 MSe (或,),即,【例5-1 】有一水稻施肥的盆

5、栽试验,设置了5个处理:A1和A2分别施用两种不同工艺流程的氨水,A3施碳酸氢铵,A4施尿素,A5不施氮肥。每个处理各4盆(施氮处理的施肥量每盆皆为折合纯氮1.2克),共有5420盆,随机置于同一盆栽场。其稻谷产量(g/盆)列于表5-2。,各项平方和与自由度计算如下,方差分析就是通过MSt 与MSe的比较来推断 是否为零即 是否相等。,三、F检验,相当于,1=2=k,统计学已证明,在 的条件下, 服从自由度df1=k-1与df2=k(n-1)的F分布。即,若实际计算的F值大于 ,则F 值在=0.05的水平上显著,我们以95%的可靠性(即冒5%的风险)推断 MSt 代表的总体方差大于MSe代表的

6、总体方差,即,这种用 F 值出现概率的大小推断一个总体方差是否大于另一个总体方差的方法称为F检验(F-test)。,对于单因素完全随机设计试验资料的方差分析: 无效假设H0:1=2=k 备择假设HA:各i不全相等,或,F=MSt / MSe,也就是要判断处理间均方是否显著大于处理内(误差)均方。,实际进行F检验时,是将由试验资料所算得的 F 值与根据 df1= dft (大均方即分子均方的自由度)、df2=dfe (小均方即分母均方的自由度)查附表4所得的临界F值,,,相比较作出统计推断。,若F ,,即p0.05,不能否定,统计学上,把这一检验结果表述为:各处理间差异不显著或简述为F值不显著,

7、在F值的右上方标记“ns”,或不标记符号;,H0:,若,F,即0.01p0.05,否定H0:,接受HA:,统计学上,把这一检验结果表述为:各处理间差异显著或简述为F值显著,在F值的右上方标记“*”;,若F,,即p0.01,否定H0:,,接受HA:,统计学上,把这一检验结果表述为:各处理间差异极显著或简述为F值极显著,在F值的右上方标记“*”。,对于【例51】,因为,根据 df1=dft=4, df2=dfe=15 查附表 4 ,得F0.01(4,15) =4.89,因为FF0.01(4,15) , 即p0.01,表明五种不同施肥处理的稻谷产量差异极显著,施肥处理不同,产量亦不同。,表5-3 表

8、5-2资料方差分析表,四、多重比较 F 值显著或极显著,否定无效假设HO ,表明试验中各处理平均数间存在显著或极显著差异,但并不意味着每两个处理平均数间的差异都显著或极显著的,也不能具体说明哪些处理平均数间有显著或极显著差异,哪些差异不显著。,下一张,主 页,退 出,上一张,有必要进行两两处理平均数间的比较,以具体判断两两处理平均数间的差异显著性。 统计学上把多个平均数两两间的相互比较称为多重比较。 多重比较的方法很多,常用的有最小显著差数法(LSD法)和最小显著极差法 (LSR法) 。,此法的基本作法是: 在F 检验显著的前提下 ,先 计 算 出 显 著 水 平为的 最 小显著差数 ,然后将

9、任意两个处理平均数的差数的绝对值 与其比较:,下一张,主 页,退 出,上一张,(一)最小显著差数法(LSD法),若 LSD,则 与 在水平上差异显著;反之,则在水平上差异不显著。 最小显著差数由下式计算: 式中: 为在F检验中误差自由度下,显著水平为的临界t值, 为均数差数标准误,,下一张,主 页,退 出,上一张,其中 为F检验中的误差均方,n为各处理的重复数。 当显著水平=0.05和0.01时,从t值表中查出 和 , 得: 利用LSD法进行多重比较时,可按如下步骤进行:,(2)计算最小显著差数 和 ; (3)将平均数多重比较表中两两平均数的差 数与 、 比较,作出统计推断。,下一张,主 页,

10、退 出,上一张,(1) 列出平均数多重比较表 比较表中各处理按其平均数从大到小自上而下排列;,对于【例5-1】,多重比较如表5-4所示。,检验结果: 差数 2.5、 1.5、 3.0 不显著;差数 4.5、 4.0、 4.5显著;差数 7.0、8.5、7.0和11.5极显著。 表明:施尿素的稻谷平均产量极显著高于对照和施氨水2、显著高于施氨水1; 施碳酸氢铵的稻谷平均产量极显著高于对照、显著高于施氨水2;,施氨水1的稻谷平均产量极显著高于对照; 施氨水2的稻谷平均产量显著高于对照; 施尿素与施碳酸氢铵、施碳酸氢铵与施氨水1、施氨水1与施氨水2的稻谷平均产量差异不显著; 以施尿素的稻谷产量最高。

11、,(二)最小显著极差法 (LSR法) LSR 法的特点是把平均数的差数看成是平均数的极差, 根据极差范围内所包含的处理数(称为秩次距) k 的不同而采用不同的检验尺度,以克服LSD法的不足 。这些在显著水平上依秩次距 k 的不同而采用的不同的检验尺度叫做 最小显著极差(LSR)。,因为LSR法是一种极差检验法,所以当一个平均数大集合的极差不显著时,其中所包含的各个较小集合极差也应一概作不显著处理。 常用的LSR法有q检验法和新复极差法两种。 1、q 检验法 此法是以统计量q的概率分布为基础的。q值由下式求得:,式中,w为极差, 为标准误,分布依赖于误差自由度 dfe 及秩次距 k。 利用q检验

12、法进行多重比较时 , 为了简便起见,不是将算出的 q 值 与 临 界 q 值 比较,而是将极差与 比较,从而作出统计推断。 为水平上的最小显著极差:,下一张,主 页,退 出,上一张,(1)列出平均数多重比较表; (2)由自由度 dfe、 秩次距k查临界q值,计算最小显著极差LSR0.05,k,LSR0.01,k; (3)将平均数多重比较表中的各极差与相应的最小显著极差LSR0.05,k , LSR0.01,k 比较,作出统计推断。,下一张,主 页,退 出,上一张,对于【例5-1】, 各处理平均数多重比较表见表5-5(同表5-4)。前已述及,在表5-5(即表5-4)中,极差4.5、3.0、1.5

13、和3.0的秩次距为2;极差7.0、4.0和4.5的秩次距为3;极差8.5和7.0的秩次距为4;极差11.5的秩次距为5。,查附表7,得df=15时,p=2,3,4的q 值,进而可得LSR,列于表5-6。,2、SSR法 此法是由邓肯 (Duncan) 于1955年提出,又称为Duncan法,或新复极差法。 新复极差法与q法的检验步骤相同,唯一不同的是计算最小显著极差时需查SSR表 (附表6)而不是查q值表。最小显著极差计算公式为:,下一张,主 页,退 出,上一张,对于【例5-1】,各处理平均数多重比较表同表5-4。,已算出 =1.2971,依dfe=15, k=2,3,4,5, 由 附表6 查

14、临界SSR0.05(15,k)和SSR0.01(15,k)值,乘以 =1.2971,求得各最小显著极差,SSR值与LSR值列于表5-7。,将表5-4 中的极差与 表5-7 中的最小显著极差比较,除极差4.0不显著外,其余检验结果与LSD法相同。,以上介绍的三种多重比较方法, 其检验尺度有如下关系: LSD 法 SSR 法 q 法 当秩次距k=2时,取等号;秩次距 k3时,取小于号。在多重比较中,LSD法的尺度最小,q检验法尺度最大,新复极差法尺度居中。 用上述排列顺序前面方法检验显著的差数,用后面方法检验未必显著; 用后面方法检验显著的差数,用前面方法检验必然显著。,下一张,主 页,退 出,上

15、一张,生物试验中,由于试验误差较大,常采用SSR法 ; F检验显著后,为了简便, 也可采用LSD法。,此法是将多重比较结果直接标记在平均数多重比较表上,如表 5-4、表5-5所示。由于在多重比较表中各个平均数差数构成一个三角形阵列,故称为三角形法。此法的优点是简便直观,缺点是占的篇幅较大。,1、三角形法,(三)多重比较结果的表示方法,2、标记字母法 先将各处理平均数由大到小自上而下排列;然后在最大平均数后标记字母a,并将该平均数与 以下各平均数依次相比,凡差异不显著标记同一 字母 a,直到某一与其差异显著的平均数标记字母 b 为止; 再以标有字母b的平均数为标准,与上方比它大的各个平均数比较 ,凡差异不显著一律再加标b ,直至显著为止;,下一张,主 页,退 出,上一张,再以标记有字母b的最大平均数为标准,与下面各未标记字母的平均数相比 ,凡差异不显著,继续标记字母b,直至某一个与其差异显著的平均数标记c为止; ; 如此重复下去,直至最 小一个平均数被标记、比较完毕为止。 这样,各平均数间凡有一个相同字母的即为差异不显著,凡无相同字母的即为差异显著。 用小写拉丁字母表示显著水平= 0.05,用大写拉丁字母表示显著水平= 0.01。,对于【例5-1】,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论