数学6 1单因素方差分析课件_第1页
数学6 1单因素方差分析课件_第2页
数学6 1单因素方差分析课件_第3页
数学6 1单因素方差分析课件_第4页
数学6 1单因素方差分析课件_第5页
已阅读5页,还剩75页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章方差分析第一节单因素方差分析

第二节

双因素方差分析第六章方差分析第一节单因素方差分析第二节

方差分析(analysisofvariance)就是采用数理统计方法对数据进行分析,以鉴别各种因素及因素间的交互作用对研究对象某些试验指标的影响大小的一种有效方法.第一节方差分析一、问题的提出注:方差分析简记为ANOVA.方差分析(analysisofvaria

例1

检验不同饲料对鸡增重的效应。选用三种饲料:A1以鱼粉为主,A2以槐树粉为主,A3以苜蓿粉为主。特选24只相似雏鸡随机分三组,每组各喂一种饲料,60天后观察其重量,试验结果如下10481029103210221021108010291093A31001112210741090110999010921107A210281009101210021001106010091073A1鸡重(g)饲料A例1检验不同饲料对鸡增重的效应。选用三种饲料:A几个概念:(1)所考察的试验结果(如产品质量、数量、销量、成本等)称为试验指标,简称指标。例中为鸡的重量。(2)在试验中对所关心的“指标”有影响的、要加以考察改变状态的原因称为因子,用A,B,C等大写英文字母表示。例中为饲料。(3)因素在试验中所取的各种不同状态称为因子的水平.因素A的r个水平常用A1,A2,…,Ar表示,其中r称为因素A的水平数。例中有1个因素,3个水平。几个概念:(1)所考察的试验结果(如产品质量、数量、销量、成(4)若只考察一个因素对指标的影响,这种试验称为单因素试验,相应的方差分析就称为单因素方差分析;例中为单因素试验。若一个试验中同时考察两个因素,则这时对试验所作的方差分析称为双因素方差分析;因素多于两个,相应的称为多因素方差分析.试验中,使用配方Ai下第j只鸡的重量记为yij,i=1,2,3;j=1,2,…8.我们的目的是研究不同饲料对鸡增重的影响是否相同。(4)若只考察一个因素对指标的影响,这种试验称为单因素试验,

例1(续)

对原始数据作如下变换:每个数-1000

(为了处理更加简便)4829322221802993A311227490109-1092107A2289122160973A1鸡重(g)饲料A例1(续)对原始数据作如下变换:每个数-1000(图形分析—散点图)(图形分析—散点图)二、单因素方差分析的统计模型考虑的因素记为A,假定它有r个水平,记为A1,A2,…,Ar

.在每一水平下考察的指标可看成一个总体,共有r个总体.作如下假定:(1)每一总体服从正态分布N(i

,i2),i=1,2,…,r;(2)各总体同方差,即12=22=……=r2=2;(3)从每个总体中抽取的样本是相互独立的,即所有试验结果yij都独立.二、单因素方差分析的统计模型考虑的因素记为简而言之,每一总体独立地服从同方差的正态分布.且这些假定的成立与否都可用统计方法进行验证.

单因素方差分析(singlefactoranalysisofvariance)是要判断因素对指标是否有显著影响,归结为判断不同总体是否有相同分布的问题.简而言之,每一总体独立地服从同方差的正态分布.且这些因为各总体方差相同,所以要判断因素对指标是否有显著影响,就化为比较各水平下的均值是否相同.即检验其备择假设为H1:μ1,μ2,…,μr不全相同.(常省略不写)因为各总体方差相同,所以要判断因素对指标是否有显著影响,对水平Ai

作了m次观察,第i水平的第j次观察为yij

,这样可得观察资料(若各水平观察次数不同时,略有不同,后叙)

合计yr1,yr2,….,yrmAr…….…y21,y22,….,y2mA2y11,y12,….,y1mA1试验数据水平对水平Ai作了m次观察,第i水平的第j次称第i水平下的均值与总均值的差为因子A的第i水平的主效应,简称Ai的效应.易见记总均值为设是来自总体的简单随机样本,则单因子方差分析的统计模型为其中εij=yij-μi称为随机误差.称第i水平下的均值与总均值的差单因子方差分析的统计模型可改写为:可改写为方差分析是通过对误差的分析研究来检验具有相同方差的多个正态总体均值是否相等的一种统计方法.单因子方差分析的统计模型可改写为:可改写为方对水平Ai

作了m次观察,第i水平的第j次观察为yij

,这样可得观察资料(若各水平观察次数不同时,略有不同,后叙)T合计Tryr1,yr2,….,yrmAr………….…T2y21,y22,….,y2mA2T1y11,y12,….,y1mA1平均和试验数据水平对水平Ai作了m次观察,第i水平的第j次记总观察次数,组平均值,三.平方和分解总平均值及1.组内偏差与组间偏差与记总观察次数,组平均(图形分析—散点图)(图形分析—散点图)组间偏差:反映了组内数据与组内平均的随机误差组内偏差:反映了随机误差和第i个水平的效应

则组间偏差:反映了组内数据与组内平均的随机误差组内偏差:反映了2.偏差平方和与自由度设有k个数据x1,x2,….,xk,且,偏差平方和:反映了数据的集中或分散程度,即数据波动的大小自由度:平方和中独立的随机变量的个数.由于,所以平方和中独立的偏差个数为

k-1,的自由度为fQ=k-1因此均方和:反映了每个自由度上数据的离散程度,排除了自由度的干扰2.偏差平方和与自由度设有k个数据x1,x2,3.总平方和分解公式总偏差平方和:它反映了观测数据总的变异程度组间(因子A的)偏差平方和:反映因子A的不同水平效应间的差异组内(误差)偏差平方和:反映了随机误差ij对试验结果影响的总和ST=SA+Se

,fT

=fA

+fe

—平方和分解公式

定理1:3.总平方和分解公式总偏差平方和:它反映了观测数据组(1)Se

/σ2~χ2(n-r),从而E(Se)=(n-r)2进一步,若H0成立,则定理2:(2)

SA/σ2~χ2(r-1),(3)SA与Se独立.(1)Se/σ2~χ2(n-r),从而对水平Ai

作了m次观察,第i水平的第j次观察为yij

,这样可得观察资料(若各水平观察次数不同时,略有不同,后叙)T合计Tryr1,yr2,….,yrmAr………….…T2y21,y22,….,y2mA2T1y11,y12,….,y1mA1平均和试验数据水平对水平Ai作了m次观察,第i水平的第j次4.检验方法若SA显著地大于Se,说明间的差异显著地大于随机误差,那么H0可能不成立.取检验统计量当H0成立时,因此拒绝域为4.检验方法若SA显著地大于Se,说明5、方差分析表

(analysisofvariancetable):fT=n-1ST总和MSe=Se/fefe=n-rSe误差F=MSA

/MSeMSA=SA/fAfA=r-1SA因素F比均方和自由度平方和方差来源5、方差分析表(analysisofvariance注:数据复杂时,采用EXCEL软件可得到分析结果,并可给出检验的p值.即p=P(X≥F),其中X~

F(r-1,n-r).判断:注:数据复杂时,采用EXCEL软件可得到分析结果,并可给出检

例1(续1)试验结果如下,试检验不同饲料对鸡增重的效应。10481029103210221021108010291093A31001112210741090110999010921107A210281009101210021001106010091073A1鸡重(g)饲料A解(1)列出数据计算表(对原始数据作一个线性变换(yij-1000))合计4829322221802993A311227490109-1092107A2289122160973A1数据(原始数据-1000)水平线性变换不影响方差分析的结果例1(续1)试验结果如下,试检验不同饲料对鸡增重[数学]61单因素方差分析课件[数学]61单因素方差分析课件[数学]61单因素方差分析课件[数学]61单因素方差分析课件[数学]61单因素方差分析课件取α=0.05.得F0.95(2,21)=3.47,而F=3.595>3.47.拒绝H0.故认为因子A是显著的,即三种饲料对鸡的增重有明显差别.取α=0.05.得F0.95(2,21)=3.47,而F=四.数据结构式及其参数估计1.数据结构式其中μ为总体均值,αi为第i个水平的效应,且εij为试验误差,在上述结构式下,i=1,…,r,

j=1,…,m且独立四.数据结构式及其参数估计1.数据结构式其中μ为总体均值2.点估计用最大似然估计法可求出一般平均μ,各主效应αi

和误差方差σ2的估计.总平均μ的估计:主效应αi的估计:误差方差σ2的估计:各水平均值μi

的估计:由于它不是σ2的无偏估计,实用中采用:=MSe2.点估计用最大似然估计法可求出一般平均[数学]61单因素方差分析课件置信区间由于且两者独立,故故,各水平均值μi的1-α置信区间为,Se/σ2~χ2(n-r),置信区间由于且两者独立,故故,各水平均注:单因子试验的统计分析可得如下三个结果:(1)因子A是否显著.(2)试验的误差方差σ

2的估计.(3)各水平均值μi的点估计与区间估计.(此项在因子A不显著时无需进行)注:单因子试验的统计分析可得如下三个结果:(1)因子A五.重复数不等情形下的方差分析1.数据略有不同TTn合计Tryr1,yr2,….,yrmrmrAr………….…T2y21,y22,….,y2m2m2A2T1y11,y12,….,y1m1m1A1平均和试验数据重复数水平设因素A有r个水平A1,A2,…,Ar.且第i水平Ai下重复进行mi次试验,i=1,…,r,获如下数据:五.重复数不等情形下的方差分析1.数据略有不同TTn合2.基本假定、平方和分解、方差分析及判断准则相同计算公式稍有不同。特别注意SA

的计算公式!统计模型为:记2.基本假定、平方和分解、方差分析及判断准则相同统计模型为则各平方和公式为:则各平方和公式为:例2茶是一种饮料,它含有叶酸(folacin),这是一种维他命B。如今要比较各种茶叶中的叶酸含量。现选定绿茶,这是一个因子,用A表示。又选定四个产地的绿茶,记为A1,A2,A3,A4,它是因子A的四个水平。测定试验误差,需要重复。选用不平衡设计,即A1,A2,A3,A4分别制作了7,5,6,6个样品,共有24个样品。试对之进行方差分析,从中可得到什么结果?例2茶是一种饮料,它含有叶酸(folacin),这是一种维若取显著性水平α=0.05.查表可得由于F>3.10,故应拒绝原假设即认为四种绿茶的叶酸平均含量有显著差异.从方差分析表上还可以获得若取显著性水平α=0.05.查表可得由于F>3.10,故应拒诸均值的参数估计故均值的95%的置信区间是[7.13,9.41].诸均值的参数估计故均值的95%的置信区间是[7.13,9.4思考:方差分析中的检验与两个独立正态总体(方差未知且相等)中均值差的检验有何异同?思考:补充一:多重比较在确认因子A的r个水平均值间有显著差异的情况下,进一步要问:哪些水平均值间确有显著差异,那些水平均值间无显著差异,这就要进行多重比较.补充一:多重比较在确认因子A的r个水平均值间有显

同时比较任意两个水平间有无显著差异的问题称为多重比较问题.譬如,r=3时,同时检验如下三个假设若r较大,要同时检验个假设,即:多重比较同时比较任意两个水平间有无显著差异的问题称为多重比较因此拒绝域形式:同时考虑考察因子A的r个水平,每个水平下重复数为mi

.假设诸试验数据,则样本均值应是的良好估计,若假设为真,不应过大,过大就应拒绝下面讨论临界值cij的确定:(分两种情况)因此拒绝域形式:同时考虑考察因子A的r个水平,每个水平下重复(1)重复数相等情况的多重比较(Tukey法)经计算,对给定显著性水平α,其中是统计量的抽样分布的1-

α分位数。拒绝域形式:在各水平试验次数相同时,诸临界值可认为相同,记为c.(1)重复数相等情况的多重比较(Tukey法)经计算,对

例2(第一节中例1续)检验不同饲料对鸡增重的效应中,饲料因子显著.试进行多重比较.例2(第一节中例1续)检验不同饲料对鸡增重的效应中,[数学]61单因素方差分析课件[数学]61单因素方差分析课件[数学]61单因素方差分析课件[数学]61单因素方差分析课件[数学]61单因素方差分析课件[数学]61单因素方差分析课件[数学]61单因素方差分析课件[数学]61单因素方差分析课件[数学]61单因素方差分析课件(2)重复数不等情况的多重比较(Scheffe法)考察因子A的r个水平均值,每个水平下的重复数分别为且有当成立时,有且Fij不应过大,过大应拒绝.在各mi不同时,诸临界值也不相同,但可要求拒绝域形式:(2)重复数不等情况的多重比较(Scheffe法)考察因子A同时考察Cr2个假设时,至少有一个假设不成立就构成该多重比较的拒绝域:同时考察Cr2个假设时,至少有一个假设不成立就构成该多重判断:当时,拒绝,否则保留Scheffe证明了则对给定显著性水平α

,取定临界值从而

(这里为近似分布,不是渐近分布)判断:当时,拒绝,否则保留Scheffe证补充:方差齐性检验方差齐性是进行方差分析的三个基本假定之一,需要确认.实际确定:如,两个车间的设备相同,操作技术水平相当,可确认两车间生产的产品的误差近似相等.统计确定:要对如下的假设作出判断:(齐性,即相等)补充:方差齐性检验方差齐性是进行方差分析的三个基本假定之一,[数学]61单因素方差分析课件[数学]61单因素方差分析课件第六章方差分析第一节单因素方差分析

第二节

双因素方差分析第六章方差分析第一节单因素方差分析第二节

方差分析(analysisofvariance)就是采用数理统计方法对数据进行分析,以鉴别各种因素及因素间的交互作用对研究对象某些试验指标的影响大小的一种有效方法.第一节方差分析一、问题的提出注:方差分析简记为ANOVA.方差分析(analysisofvaria

例1

检验不同饲料对鸡增重的效应。选用三种饲料:A1以鱼粉为主,A2以槐树粉为主,A3以苜蓿粉为主。特选24只相似雏鸡随机分三组,每组各喂一种饲料,60天后观察其重量,试验结果如下10481029103210221021108010291093A31001112210741090110999010921107A210281009101210021001106010091073A1鸡重(g)饲料A例1检验不同饲料对鸡增重的效应。选用三种饲料:A几个概念:(1)所考察的试验结果(如产品质量、数量、销量、成本等)称为试验指标,简称指标。例中为鸡的重量。(2)在试验中对所关心的“指标”有影响的、要加以考察改变状态的原因称为因子,用A,B,C等大写英文字母表示。例中为饲料。(3)因素在试验中所取的各种不同状态称为因子的水平.因素A的r个水平常用A1,A2,…,Ar表示,其中r称为因素A的水平数。例中有1个因素,3个水平。几个概念:(1)所考察的试验结果(如产品质量、数量、销量、成(4)若只考察一个因素对指标的影响,这种试验称为单因素试验,相应的方差分析就称为单因素方差分析;例中为单因素试验。若一个试验中同时考察两个因素,则这时对试验所作的方差分析称为双因素方差分析;因素多于两个,相应的称为多因素方差分析.试验中,使用配方Ai下第j只鸡的重量记为yij,i=1,2,3;j=1,2,…8.我们的目的是研究不同饲料对鸡增重的影响是否相同。(4)若只考察一个因素对指标的影响,这种试验称为单因素试验,

例1(续)

对原始数据作如下变换:每个数-1000

(为了处理更加简便)4829322221802993A311227490109-1092107A2289122160973A1鸡重(g)饲料A例1(续)对原始数据作如下变换:每个数-1000(图形分析—散点图)(图形分析—散点图)二、单因素方差分析的统计模型考虑的因素记为A,假定它有r个水平,记为A1,A2,…,Ar

.在每一水平下考察的指标可看成一个总体,共有r个总体.作如下假定:(1)每一总体服从正态分布N(i

,i2),i=1,2,…,r;(2)各总体同方差,即12=22=……=r2=2;(3)从每个总体中抽取的样本是相互独立的,即所有试验结果yij都独立.二、单因素方差分析的统计模型考虑的因素记为简而言之,每一总体独立地服从同方差的正态分布.且这些假定的成立与否都可用统计方法进行验证.

单因素方差分析(singlefactoranalysisofvariance)是要判断因素对指标是否有显著影响,归结为判断不同总体是否有相同分布的问题.简而言之,每一总体独立地服从同方差的正态分布.且这些因为各总体方差相同,所以要判断因素对指标是否有显著影响,就化为比较各水平下的均值是否相同.即检验其备择假设为H1:μ1,μ2,…,μr不全相同.(常省略不写)因为各总体方差相同,所以要判断因素对指标是否有显著影响,对水平Ai

作了m次观察,第i水平的第j次观察为yij

,这样可得观察资料(若各水平观察次数不同时,略有不同,后叙)

合计yr1,yr2,….,yrmAr…….…y21,y22,….,y2mA2y11,y12,….,y1mA1试验数据水平对水平Ai作了m次观察,第i水平的第j次称第i水平下的均值与总均值的差为因子A的第i水平的主效应,简称Ai的效应.易见记总均值为设是来自总体的简单随机样本,则单因子方差分析的统计模型为其中εij=yij-μi称为随机误差.称第i水平下的均值与总均值的差单因子方差分析的统计模型可改写为:可改写为方差分析是通过对误差的分析研究来检验具有相同方差的多个正态总体均值是否相等的一种统计方法.单因子方差分析的统计模型可改写为:可改写为方对水平Ai

作了m次观察,第i水平的第j次观察为yij

,这样可得观察资料(若各水平观察次数不同时,略有不同,后叙)T合计Tryr1,yr2,….,yrmAr………….…T2y21,y22,….,y2mA2T1y11,y12,….,y1mA1平均和试验数据水平对水平Ai作了m次观察,第i水平的第j次记总观察次数,组平均值,三.平方和分解总平均值及1.组内偏差与组间偏差与记总观察次数,组平均(图形分析—散点图)(图形分析—散点图)组间偏差:反映了组内数据与组内平均的随机误差组内偏差:反映了随机误差和第i个水平的效应

则组间偏差:反映了组内数据与组内平均的随机误差组内偏差:反映了2.偏差平方和与自由度设有k个数据x1,x2,….,xk,且,偏差平方和:反映了数据的集中或分散程度,即数据波动的大小自由度:平方和中独立的随机变量的个数.由于,所以平方和中独立的偏差个数为

k-1,的自由度为fQ=k-1因此均方和:反映了每个自由度上数据的离散程度,排除了自由度的干扰2.偏差平方和与自由度设有k个数据x1,x2,3.总平方和分解公式总偏差平方和:它反映了观测数据总的变异程度组间(因子A的)偏差平方和:反映因子A的不同水平效应间的差异组内(误差)偏差平方和:反映了随机误差ij对试验结果影响的总和ST=SA+Se

,fT

=fA

+fe

—平方和分解公式

定理1:3.总平方和分解公式总偏差平方和:它反映了观测数据组(1)Se

/σ2~χ2(n-r),从而E(Se)=(n-r)2进一步,若H0成立,则定理2:(2)

SA/σ2~χ2(r-1),(3)SA与Se独立.(1)Se/σ2~χ2(n-r),从而对水平Ai

作了m次观察,第i水平的第j次观察为yij

,这样可得观察资料(若各水平观察次数不同时,略有不同,后叙)T合计Tryr1,yr2,….,yrmAr………….…T2y21,y22,….,y2mA2T1y11,y12,….,y1mA1平均和试验数据水平对水平Ai作了m次观察,第i水平的第j次4.检验方法若SA显著地大于Se,说明间的差异显著地大于随机误差,那么H0可能不成立.取检验统计量当H0成立时,因此拒绝域为4.检验方法若SA显著地大于Se,说明5、方差分析表

(analysisofvariancetable):fT=n-1ST总和MSe=Se/fefe=n-rSe误差F=MSA

/MSeMSA=SA/fAfA=r-1SA因素F比均方和自由度平方和方差来源5、方差分析表(analysisofvariance注:数据复杂时,采用EXCEL软件可得到分析结果,并可给出检验的p值.即p=P(X≥F),其中X~

F(r-1,n-r).判断:注:数据复杂时,采用EXCEL软件可得到分析结果,并可给出检

例1(续1)试验结果如下,试检验不同饲料对鸡增重的效应。10481029103210221021108010291093A31001112210741090110999010921107A210281009101210021001106010091073A1鸡重(g)饲料A解(1)列出数据计算表(对原始数据作一个线性变换(yij-1000))合计4829322221802993A311227490109-1092107A2289122160973A1数据(原始数据-1000)水平线性变换不影响方差分析的结果例1(续1)试验结果如下,试检验不同饲料对鸡增重[数学]61单因素方差分析课件[数学]61单因素方差分析课件[数学]61单因素方差分析课件[数学]61单因素方差分析课件[数学]61单因素方差分析课件取α=0.05.得F0.95(2,21)=3.47,而F=3.595>3.47.拒绝H0.故认为因子A是显著的,即三种饲料对鸡的增重有明显差别.取α=0.05.得F0.95(2,21)=3.47,而F=四.数据结构式及其参数估计1.数据结构式其中μ为总体均值,αi为第i个水平的效应,且εij为试验误差,在上述结构式下,i=1,…,r,

j=1,…,m且独立四.数据结构式及其参数估计1.数据结构式其中μ为总体均值2.点估计用最大似然估计法可求出一般平均μ,各主效应αi

和误差方差σ2的估计.总平均μ的估计:主效应αi的估计:误差方差σ2的估计:各水平均值μi

的估计:由于它不是σ2的无偏估计,实用中采用:=MSe2.点估计用最大似然估计法可求出一般平均[数学]61单因素方差分析课件置信区间由于且两者独立,故故,各水平均值μi的1-α置信区间为,Se/σ2~χ2(n-r),置信区间由于且两者独立,故故,各水平均注:单因子试验的统计分析可得如下三个结果:(1)因子A是否显著.(2)试验的误差方差σ

2的估计.(3)各水平均值μi的点估计与区间估计.(此项在因子A不显著时无需进行)注:单因子试验的统计分析可得如下三个结果:(1)因子A五.重复数不等情形下的方差分析1.数据略有不同TTn合计Tryr1,yr2,….,yrmrmrAr………….…T2y21,y22,….,y2m2m2A2T1y11,y12,….,y1m1m1A1平均和试验数据重复数水平设因素A有r个水平A1,A2,…,Ar.且第i水平Ai下重复进行mi次试验,i=1,…,r,获如下数据:五.重复数不等情形下的方差分析1.数据略有不同TTn合2.基本假定、平方和分解、方差分析及判断准则相同计算公式稍有不同。特别注意SA

的计算公式!统计模型为:记2.基本假定、平方和分解、方差分析及判断准则相同统计模型为则各平方和公式为:则各平方和公式为:例2茶是一种饮料,它含有叶酸(folacin),这是一种维他命B。如今要比较各种茶叶中的叶酸含量。现选定绿茶,这是一个因子,用A表示。又选定四个产地的绿茶,记为A1,A2,A3,A4,它是因子A的四个水平。测定试验误差,需要重复。选用不平衡设计,即A1,A2,A3,A4分别制作了7,5,6,6个样品,共有24个样品。试对之进行方差分析,从中可得到什么结果?例2茶是一种饮

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论