《概率论与数理统计》课件 孟祥波 第九章 方差分析_第1页
《概率论与数理统计》课件 孟祥波 第九章 方差分析_第2页
《概率论与数理统计》课件 孟祥波 第九章 方差分析_第3页
《概率论与数理统计》课件 孟祥波 第九章 方差分析_第4页
《概率论与数理统计》课件 孟祥波 第九章 方差分析_第5页
已阅读5页,还剩92页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

概率论

与数理统计理学院数学系“悟道诗---严加安”随机非随意,概率破玄机;无序隐有序,统计解迷离.第九章方差分析第一节单因素方差分析二、单因素方差分析的数学模型四、单因素方差分析表一、单因素方差分析的基本原理三、离差平方和及自由度的分解五、小结孩子编号甲乙丙丁11701701651582175163171156317716716716441801651721615182174160168表9.1四个家庭的成年孩子的身高(单位:cm)例9.1.1考察甲、乙、丙、丁四个家庭的孩子的身高,已知每个家庭均有5个成年的孩子,其身高数据如表9.1所列.试分析不同家庭的成年孩子的身高有无显著差别.家庭称为因素(或因子),成年孩子的身高称为试验指标.用表示家庭因素,则有四个水平:甲、乙、丙和丁,也可用表示因素的第个水平所对应的5个成年孩子的身高是来自同一个总体的样本,这里就有4个总体和4个独立的样本,通常假定这些总体服从方差相同的正态分布记分别表示4个总体的总体均值,不全相等则分析不同家庭的成年孩子的身高有无显著差别就相当于作如下假设检验一、单因素方差分析的基本原理数据间的差异系统偏差(组间偏差):来自不同总体样本数据之间的差异随机误差(组内偏差):来自同一总体样本数据之间的差异同一个家庭的5个孩子的身高是不一样的,这种差异为随机误差;不同家庭的成年孩子的身高也是不一样的,这种差异为系统偏差.图9.1四个家庭的成年孩子身高的分组箱线图若原假设成立,所有孩子的身高应该处于同一水平,即图中总平均线高度,而实际上受家庭因素和其他随机因素影响,20个孩子的身高是不全相同的.一、单因素方差分析的基本原理第个家庭的第个孩子的身高

第个家庭的5个孩子的平均身高

所有孩子的总平均身高左端表示单个孩子的身高与总平均身高的差异,可理解为单个样本数据的总离差.右端被拆分为两项,其中第一项为组内偏差,第二项为组间偏差.一、单因素方差分析的基本原理一、单因素方差分析的基本原理总离差平方和组间离差平方和:系统因素所造成的离差平方和组内离差平方和:随机因素所造成的离差平方和单因素方差分析就是将样本数据的总离差平方和分解为组间离差平方和与组内离差平方和,然后根据这两个平方和构造检验统计量,推导统计量所服从的分布,最后确定检验的拒绝域.二、单因素方差分析的数学模型设因素有个水平,对应试验指标的个总体,记为,它们的分布为令二、单因素方差分析的数学模型组别样本样本均值样本方差表9.2个总体的样本二、单因素方差分析的数学模型单因素方差分析的数学模型为

其中(Independentidenticallydistributed)表示独立同分布.欲检验因素对试验指标有无显著影响,相当于检验 不全相等二、单因素方差分析的数学模型令单因素方差分析的数学模型可改写为式等价于不全为二、单因素方差分析的数学模型表示由因素的第个水平所造成的偏离总均值的增量,称为因素的第个水平的效应,可以看作对总平均的“贡献”大小.若,称的效应为正,若,称的效应为负.三、离差平方和及自由度的分解由(9.5)令用作为的估计,作为的估计,作为的估计,作为的估计,则式(9.5)变为三、离差平方和及自由度的分解记为样本数据的总离差平方和,即

结合上述分解,有三、离差平方和及自由度的分解由于所以

三、离差平方和及自由度的分解其中

可以看出为因素所造成的离差平方和,称为组间离差平方和,

为随机因素所造成的离差平方和称为组内离差平方和.定理9.1.1在以上记号下,对于模型式(9.5),有以下结论成立.(1)

,且与相互独立(2)原假设成立时,三、离差平方和及自由度的分解三、离差平方和及自由度的分解构造检验统计量

由定理9.1.1可知,当原假设成立时,其中称为组间均离差平方和,

为组内均方离差平方和.三、离差平方和及自由度的分解当统计量的观测值大于某个临界值时,应拒绝原假设,所以对于给定的显著性水平,检验的拒绝域为其中为分布的上侧分位数.四、单因素方差分析表当时,应拒绝原假设,认为因素对试验指标有显著影响.四、单因素方差分析表可将临界值换成检验的值,其定义为当时,应拒绝原假设,认为因素对试验指标有显著影响,并且值越小,显著性越强当时,应接受原假设,认为因素对试验指标无显著影响当,亦即时,为慎重起见,可增加样本容量,重新进行抽样检验.对于给定的显著性水平,四、单因素方差分析表例9.1.2考察甲、乙、丙、丁四个家庭的孩子的身高,已知每个家庭均有5个成年的孩子,其身高数据如表9.1所列.试分析不同家庭的成年孩子的身高有无显著差别.(取显著性水平)解利用表9.1中数据,计算得

的自由度分别为3、16和19,从而可得各均方分别为四、单因素方差分析表计算得于是可得单因素方差分析表如下:四、单因素方差分析表由方差分析表可知,故认为不同家庭的成年孩子的身高有显著差别.小结单因素方差分析的基本原理单因素方差分析的数学模型离差平方和及自由度分解单因素方差分析表利用统计量判断是否接受原假设概率论

与数理统计理学院数学系“悟道诗---严加安”随机非随意,概率破玄机;无序隐有序,统计解迷离.第九章方差分析第二节双因素方差分析二、单因素方差分析的数学模型四、小结一、单因素方差分析的基本原理三、统计分析如果在例9.1.1中,不只考虑家庭因素对成年孩子身高的影响,还考虑地域因素的影响,这就是一个双因素方差分析.一、双因素方差分析的基本原理如果和对的影响是相互独立的,此时的双因素方差分析称为无交互作用的双因素方差分析;

如果除了和对试验结果的单独影响外,因素

和因素的搭配还会对产生一种新的影响,这时的双因素方差分析称为有交互作用的双因素方差分析.假设试验指标同时受到因素和的影响,对于无交互作用的双因素方差分析一、单因素方差分析的基本原理样本观测值—总均值

=因素的效应+因素的效应+随机误差一、双因素方差分析的基本原理无交互作用的双因素方差分析就是将样本数据的总离差平方和分解为三部分:系统因素所造成的离差平方和,系统因素所造成的离差平方和,以及随机因素所造成的离差平方和,然后根据这三个平方和构造检验统计量,推导统计量所服从的分布,最后确定检验的拒绝域.对于有交互作用的双因素方差分析一、双因素方差分析的基本原理样本观测值—总均值=

的效应+的效应+的交互作用+随机误差一、双因素方差分析的基本原理有交互作用的双因素方差分析就是将样本数据的总离差平方和分解为四部分:系统因素所造成的离差平方和,系统因素所造成的离差平方和,

的交互作用所造成的离差平方和,以及随机因素所造成的离差平方和,然后根据这四个平方和构造检验统计量,推导统计量所服从的分布,最后确定检验的拒绝域.二、双因素方差分析的数学模型设因素有个不同的水平,因素有

个不同的水平,每种水平组合

下的试验结果看作是取自正态总体的一个样本,各水平组合与总体分布如下二、单因素方差分析的数学模型二、单因素方差分析的数学模型令则表示因素的第个水平的效应,表示因素的第个水平的效应,它们满足二、单因素方差分析的数学模型1.无交互作用的双因素方差分析模型若,即每种水平组合下的总体均值可看作是总平均与各因素水平效应

的简单迭加,此时不考虑的交互作用.为简单起见,假设每种水平组合下只做一次独立试验(无重复试验),结果记为,试验误差为,则无交互作用的双因素方差分析模型为二、单因素方差分析的数学模型1.无交互作用的双因素方差分析模型二、单因素方差分析的数学模型

2.有交互作用的双因素方差分析模型若,记

其中表示和对试验结果的某种联合影响,称为和的交互作用的效应,简称交互效应,它们满足为简单起见,假设在每种水平组合下均做次试验(等重复试验),并假设所有的试验是相互独立的,所得试验结果记为每次试验误差记为,则有交互作用的双因素方差分析模型为二、单因素方差分析的数学模型

2.有交互作用的双因素方差分析模型为研究交互作用的影响是否显著,在两因素的各种水平组合下需要做重复试验.二、单因素方差分析的数学模型

2.有交互作用的双因素方差分析模型(9.15)二、单因素方差分析的数学模型

2.有交互作用的双因素方差分析模型注9.2.1对于双因素方差分析,若不考虑交互作用,在因素A,B的每种水平组合下只需做一次试验,即可进行后续的统计分析,当然也可以做重复试验.若考虑交互作用,在各水平组合下需要做重复试验,才可进行后续的统计分析.三、统计分析1.无交互作用的双因素方差分析检验因素对试验指标的影响是否显著,等价于检验假设

原假设成立表示因素对试验指标无显著影响.类似地,检验因素对试验指标的影响是否显著,等价于检验假设

原假设成立表示因素对试验指标无显著影响.(1)平方和分解三、统计分析1.无交互作用的双因素方差分析假设每种水平组合下只做一次独立试验,试验结果如下(1)平方和分解三、统计分析1.无交互作用的双因素方差分析其中(1)平方和分解三、统计分析1.无交互作用的双因素方差分析由式(9.14)可知

用作为的估计,作为的估计,作为的估计,则有(1)平方和分解三、统计分析1.无交互作用的双因素方差分析记为样本数据的总离差平方和,即

将分解如下:(1)平方和分解三、统计分析1.无交互作用的双因素方差分析可以证明,在上述平方和分解式中,所有交叉乘积的和项均为0.为因素所造成的离差平方和;为因素所造成的离差平方和;为随机因素所造成的离差平方和.(1)平方和分解三、统计分析1.无交互作用的双因素方差分析定理9.2.1在以上记号下,对于模型(9.14),有以下结论成立:·,且、和相互独立;·成立时,;·成立时,;·和都成立时,.(2)检验的统计量和拒绝域三、统计分析1.无交互作用的双因素方差分析构造检验统计量其中(2)检验的统计量和拒绝域三、统计分析1.无交互作用的双因素方差分析由定理9.2.1,在原假设和分别成立时,有对于给定的显著性水平,和对应的拒绝域分别为(3)无交互作用的双因素方差分析表三、统计分析1.无交互作用的双因素方差分析三、统计分析1.无交互作用的双因素方差分析当时,应拒绝原假设

,认为因素对试验指标有显著影响.(3)无交互作用的双因素方差分析表当时,应拒绝原假设

,认为因素对试验指标有显著影响.表中临界值可以分别替换为检验的值,其定义为

对于给定的显著性水平,当时,应拒绝原假设;当时,应拒绝原假设.三、统计分析1.无交互作用的双因素方差分析例9.2.1某饮料生产企业研制出一种新型饮料.饮料的颜色共有四种,分别为橘黄色、粉色、绿色和无色透明.随机从五家超市收集了前一时期该饮料的销售量数据,见下表假设在超市和颜色的各种搭配下,销售量总体服从同方差的正态分布.试分析超市和饮料的颜色对饮料的销售量是否有显著影响.(取显著性水平)颜色B超市A橘黄色粉色绿色无色126.531.227.930.8228.728.325.129.6325.130.828.532.4429.127.924.231.7527.229.626.532.8三、统计分析1.无交互作用的双因素方差分析解:计算各行、各列的样本均值及总均值得于是、、和的自由度分别为4、3、12和19,从而可得各均方分别为三、统计分析1.无交互作用的双因素方差分析计算得于是可得双因素方差分析表三、统计分析1.无交互作用的双因素方差分析由方差分析表可知,

,故认为超市对饮料的销售量无显著影响,而饮料的颜色对饮料的销售量有显著影响.三、统计分析2.有交互作用的双因素方差分析对于有交互作用的双因素方差分析,除了要检验无交互作用的双因素方差分析中的假设外,还要检验假设原假设成立表示因素和的交互作用对试验指标无显著影响.三、统计分析2.有交互作用的双因素方差分析(1)平方和分解假设在每种水平组合下均做次试验,并假设所有的试验是相互独立的,试验结果如下三、统计分析2.有交互作用的双因素方差分析(1)平方和分解其中三、统计分析2.有交互作用的双因素方差分析(1)平方和分解由其中三、统计分析2.有交互作用的双因素方差分析(1)平方和分解用作为的估计,作为的估计,作为的估计,作为的估计,则有记为样本数据的总离差平方和,即三、统计分析2.有交互作用的双因素方差分析(1)平方和分解可以证明,上式中所有交叉乘积的和项均为0.三、统计分析2.有交互作用的双因素方差分析(1)平方和分解其中为因素所造成的离差平方和,为因素所造成的离差平方和,为因素的交互作用所造成的离差平方和,为随机因素所造成的离差平方和.三、统计分析2.有交互作用的双因素方差分析(1)平方和分解定理9.2.2在以上记号下,对于模型(9.15),有以下结论成立.·,且、、和相互独立;·成立时,;·、和都成立时,.·成立时,;·成立时,;(2)检验的统计量和拒绝域三、统计分析2.有交互作用的双因素方差分析构造检验统计量其中(2)检验的统计量和拒绝域三、统计分析2.有交互作用的双因素方差分析由定理9.2.2,在原假设、和分别成立时,有对于给定的显著性水平,、和对应的拒绝域分别为(3)有交互作用的双因素方差分析表三、统计分析2.有交互作用的双因素方差分析三、统计分析2.有交互作用的双因素方差分析当时,应拒绝原假设,认为因素对试验指标有显著影响.(3)无交互作用的双因素方差分析表当时,应拒绝原假设,认为因素对试验指标有显著影响.当时,应拒绝原假设,认为因素的交互作用对试验指标有显著影响.三、统计分析2.有交互作用的双因素方差分析(3)无交互作用的双因素方差分析表表中临界值可以分别替换为检验的值,其定义为

对于给定的显著性水平,当时,应拒绝原假设;当时,应拒绝原假设;当

时,应拒绝原假设.三、统计分析2.有交互作用的双因素方差分析例9.2.2考察合成纤维中对纤维弹性有影响的两个因素:收缩率和总拉伸倍数,它们各取4种水平,在各水平组合下均做2次试验,试验结果如表中所列假设在各水平组合下,纤维弹性总体服从同方差的正态分布.试分析收缩率、总拉伸倍数及其交互作用分别对纤维弹性有无显著影响.(取显著性水平)

总拉伸倍数B收缩率AB1(460)B2(520)B3(580)B4(640)A1(0)71,7372,7375,7377,75A2(4)73,7576,7478,7774,74A3(8)76,7379,7774,7574,73A4(12)75,7373,7270,7169,69三、统计分析2.有交互作用的双因素方差分析解:计算得、、、和的自由度分别为3、3、9、16和31,从而可得各均方分别为计算得三、统计分析2.有交互作用的双因素方差分析于是可得双因素方差分析表三、统计分析1.无交互作用的双因素方差分析由方差分析表可知,

,故认为收缩率对纤维弹性有显著影响,总拉伸倍数对纤维弹性无显著影响,收缩率和总拉伸倍数的交互作用对纤维弹性有显著影响.小结双因素方差分析的基本原理无交互作用的双因素方差分析模型和有交互作用的双因素方差分析模型利用相关统计量判断检验因素对试验指标的影响是否显著概率论

与数理统计理学院数学系“悟道诗---严加安”随机非随意,概率破玄机;无序隐有序,统计解迷离.第九章方差分析第三节综合例题二、例9.3.2一、例9.3.1三、例9.3.3四、小结由式(9.38)可知随机误差的离差平方和,此时检验统计量失去意义,因此需要做重复试验.例9.3.1对于双因素方差分析,若考虑交互作用,在因素的每种水平组合下需要做重复试验,才可进行后续的统计分析.请解释做重复试验的原因.解若不做重复试验,在因素的每种水平组合下只有一个试验结果,于是,,例9.3.2对于单因素方差分析,假设在因素的每个水平下均做次试验,即,证明:(1);(2)当成立时,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论