概率论与数理统计课件第8章_第1页
概率论与数理统计课件第8章_第2页
概率论与数理统计课件第8章_第3页
概率论与数理统计课件第8章_第4页
概率论与数理统计课件第8章_第5页
已阅读5页,还剩77页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、概率论与数理统计课件第8章概率论与数理统计课件第8章 在工农业生产和科研活动中,我们经常遇到这样的问题:影响产品产量、质量的因素很多,例如影响农作物的单位面积产量有品种、施肥种类、施肥量等许多因素。我们要了解这些因素中哪些因素对产量有显著影响,就要先做试验,然后对测试结果进行分析,作出判断。方差分析就是分析测试结果的一种方法。引 言 在工农业生产和科研活动中,我们经常遇到这样的问题:影基 本 概 念 试验指标试验结果。 可控因素在影响试验结果的众多因素中,可人为 控制的因素。水平可控因素所处的各种各种不同的状态。每个 水平又称为试验的一个处理。单因素试验如果在一项试验中只有一个因素改变, 其它

2、的可控因素不变,则该类试验称为 单因素试验。基 本 概 念 试验指标试验结果。 可控因素在影响试引例 例1 (灯丝的配料方案优选)某灯泡厂用四种配料方案制成的灯丝生产了四批灯泡,在每批灯泡中作随机抽样,测量其使用寿命(单位:小时),数据如下: 灯泡寿命灯丝12345678甲1600 161016501680170017201800乙15801640164017001750丙14601550160016201640174016601820丁151015201530157016801600引例 例1 (灯丝的配料方案优选)某灯泡厂用四种配料方案制灯泡的使用寿命试验指标 灯丝的配料方案试验因素(唯一

3、的一个) 四种配料方案(甲乙丙丁)四个水平 因此,本例是一个四水平的单因素试验。 引 例 用X1,X2,X3,X4分别表示四种灯泡的使用寿命,即为四个总体。假设X1,X2,X3,X4相互独立,且服从方差相同的正态分布,即XiN(i,2)(i=1,2,3,4)本例问题归结为检验假设 H0:1= 2= 3= 4 是否成立 灯泡的使用寿命试验指标 灯丝的配料方案试验因素(唯一 我们的目的是通过试验数据来判断因素 A 的不同水平对试验指标是否有影响。 设 A 表示欲考察的因素,它的 个不同水平,对应的指标视作 个总体 每个水平下,我们作若干次重复试验: (可等重复也可不等重复),同一水平的 个结果,就

4、是这个总体 的一个样本: 单因素试验的方差分析因此,相互独立,且与 同分布。 我们的目的是通过试验数据来判断因素 A 的不单因素试验资料表其中诸 可以不一样,水平重复 1. ni(水平组内平均值)(总平均值)试验结果单因素试验资料表其中诸 可以不一样,水平重复 1( 纵向个体间的差异称为随机误差(组内差异),由试验造成;横向个体间的差异称为系统误差(组间差异),由因素的不同水平造成。品种重复123例:五个水稻品种单位产量的观测值P165 纵向个体间的差异称为随机误差(组内差异),由 由于同一水平下重复试验的个体差异是随机误差,所以设:其中 为试验误差,相互独立且服从正态分布线性统计模型 单因素

5、试验的方差分析的数学模型具有方差齐性。相互独立,从而各子样也相互独立。首先,我们作如下假设: 即 由于同一水平下重复试验的个体差异是随机误差,所以设:令 (其中 )称为一般平均值。称为因素A的第 个水平 的效应。则线性统计模型变成于是检验假设: 等价于检验假设: 显然有: 整个试验的均值 令 (其中 考察统计量经恒等变形,可分解为:其中组间平方和(系统离差平方和)反映的是各水平平均值偏离总平均值的偏离程度。如果H0 成立,则SSA 较小。若H0成立,则总离差平方和 见书P168 其中 考察统计量经恒等变形,可分解为:其中组间平方和(系统离差平方组内平方和误差平方和这里反映的是重复试验种随机误差

6、的大小。表示水平Ai的随机误差; 表示整个试验的随机误差组内平方和这里反映的是重复试验种随机误差的大小。表示水平Ai若假设 成立,则 由P106定理5.1可推得:将 的自由度分别记作则(记 ,称作均方和)(各子样同分布) 若假设 则(记 ,称作均方和)对给定的检验水平 ,由得H0 的拒绝域为:F 单侧检验 结论:方差分析实质上是假设检验,从分析离差平方和入手,找到F统计量,对同方差的多个正态总体的均值是否相等进行假设检验。单因素试验中两个水平的均值检验可用第七章的T检验法。思考:为什么此处只做单侧检验? 则(记 (1)若 ,则称因素的差异极显著(极有统计意义),或称因素A的影响高度显著,这时作

7、标记 ;约 定 (2)若 ,则称因素的差异显著(差异有统计意义),或称因素A的影响显著,作标记 ;(3)若 ,则称因素A有一定影响,作标记( );(4)若 ,则称因素A无显著影响(差异无统计意义)。注意:在方差分析表中,习惯于作如下规定:(1)若 ,则称因素的差异极显著单因素试验方差分析表方差来源组间组内总和平方和自由度均方和F 值F 值临介值简便计算公式:其中同一水平下观测值之和 所以观测值之和单因素试验方差分析表方差来源组间组内总和平方和自由度均方和F 例2 P195 2 以 A、B、C 三种饲料喂猪,得一个月后每猪所增体重(单位:500g)于下表,试作方差分析。饲料ABC增重51 40

8、43 4823 25 2623 28解: 例2 P195 2 以 A、B、C 三种饲解:解:不同的饲料对猪的体重的影响极有统计意义。列方差分析表方差来源组间组内总和平方和自由度均方和F 值F 值临介值不同的饲料对猪的体重的影响极有统计意义。列方差分析表方差来源例2的上机实现步骤1、输入原始数据列,并存到A,B,C列; 例2的上机实现步骤1、输入原始数据列,并存到A,B,C列; 各水平数据放同一列各水平数据放在不同列2、选择StatANOVAone-way(unstacked) 各水平数据放同一列各水平数据放在不同列2、选择StatAN概率论与数理统计课件第8章不同的饲料对猪的体重的影响极有统计

9、意义。不同的饲料对猪的体重的影响极有统计意义。概率论与数理统计课件第8章定理 在单因素方差分析模型中,有 如果H0不成立,则 所以, 即H0不成立时, 有大于1的趋势。 所以H0为真时的小概率事件应取在F值较大的一侧。 定理 在单因素方差分析模型中,有 如果H0不成立,则 双因素试验方差分析双因素试验方差分析 双因素试验的方差分析 在实际应用中,一个试验结果(试验指标)往往受多个因素的影响。不仅这些因素会影响试验结果,而且这些因素的不同水平的搭配也会影响试验结果。 例如:某些合金,当单独加入元素A或元素B时,性能变化不大,但当同时加入元素A和B时,合金性能的变化就特别显著。 统计学上把多因素不

10、同水平搭配对试验指标的影响称为交互作用。交互作用在多因素的方差分析中,把它当成一个新因素来处理。 我们只学习两个因素的方差分析,更多因素的问题,用正交试验法比较方便。 双因素试验的方差分析 在实际应用中,一个试验无交互作用的双因素试验的方差分析 数学模型 假设某个试验中,有两个可控因素在变化,因素A有a个水平,记作A1,A2,Aa;因素B有b个水平,记作B1,B2,.Bb;则A与B的不同水平组合AiBj(i=1,2,a;j=1,2,b)共有ab个,每个水平组合称为一个处理,每个处理只作一次试验,得ab个观测值Xij,得双因素无重复实验表无交互作用的双因素试验的方差分析 数学模型 双因素无重复(

11、无交互作用)试验资料表因素 A因素 B双因素无重复(无交互作用)试验资料表因素 A因素 B 无交互作用的双因素试验的方差分析线性统计模型 基本假设(1) 相互独立; (2) ,(方差齐性)。其中 所有期望值的总平均 水平Ai对试验结果的效应 水平Bj对试验结果的效应 试验误差 无交互作用的双因素试验的方差分析线性统计模型 基本假设特性: 水平Ai对试验结果的效应 水平Bj对试验结果的效应 试验误差 要分析因素A,B的差异对试验结果是否有显著影响,即为检验如下假设是否成立:特性: 水平Ai对试验结果的效应 水平Bj对试验结果的效应 总离差平方和的分解定理仿单因素方差分析的方法,考察总离差平方和可

12、分解为:称为因素A的离差平方和,反映因素 A 对试验指标的影响。称为因素B的离差平方和,反映因素 B 对试验指标的影响。称为误差平方和,反映试验误差对试验指标的影响。 总离差平方和的分解定理仿单因素方差分析的方法,考察总离差平可推得:将 的自由度分别记作,则若假设 成立,则:可推得:将 对给定的检验水平 ,F 右侧检验时,当时,当拒绝H01,即A 因素的影响有统计意义。拒绝H02,即B 因素的影响有统计意义。对给定的检验水平 ,F 右侧检验时,当时,当拒绝H双因素(无交互作用)试验的方差分析表方差来源因素A总和平方和自由度均方和F 值F 值临介值因素B误差注意 各因素离差平方和的自由度为水平数

13、减一,总平方和的自由度为试验总次数减一。双因素(无交互作用)试验的方差分析表方差来源因素A总和平方和双因素(无交互作用)试验的方差分析表简便计算式:其中:双因素(无交互作用)试验的方差分析表简便计算式:其中:例1 设甲、乙、丙、丁四个工人操作机器、各一天, 其产品产量如下表,问工人和机器对产品产量是否有显著 影响?工人 A机器 B甲 乙 丙 丁 例1 设甲、乙、丙、丁四个工人操作机器、各一天,工解 基本计算如原表 解 基本计算如原表 结论:工人对产品的产量有显著影响,机器对产品的产量有极显著影响。 结论:工人对产品的产量有显著影响,例1的上机操作对应例1 的数据输入方式原始数据,行因素水平,列

14、因素水平例1的上机操作对应例1 的数据输入方式原始数据,行因素水平,概率论与数理统计课件第8章概率论与数理统计课件第8章*在 下接受,在 下否决在 下否决(A)(B)工人对产品产量有显著影响,而机器对产品产量的影响极显著。*在 下接受,在 有交互作用的双因素试验的方差分析线性统计模型 基本假设(1) 相互独立; (2) ,(方差齐性)。 有检验交互作用的效应,则两因素A,B的不同水平的搭配必须作重复试验。 处理方法:把交互作用当成一个新因素来处理,即把每种搭配AiBj看作一个总体Xij。观测值总平均 因素A的效应 因素B的效应 交互作用的效应 试验误差 有交互作用的双因素试验的方差分析线性统计

15、模型 基本假设 有交互作用的双因素试验的方差分析线性统计模型 其中 所有期望值的总平均 水平Ai对试验结果的效应 水平Bj对试验结果的效应 试验误差 交互效应 有交互作用的双因素试验的方差分析线性统计模型 其中 特性: 要判断因素A,B及交互作用AB对试验结果是否有显著影响,即为检验如下假设是否成立:特性: 要判断因素A,B及交互作用AB对试 总离差平方和的分解定理仿单因素方差分析的方法,考察总离差平方和可分解为: SSA称为因素A的离差平方和,反映因素 A 对试验指标的影响。 SSB称为因素B的离差平方和,反映因素 B 对试验指标的影响。SSAB称为交互作用的离差平方和,反映交互作用AB对试

16、验指标的影响。SSE称为误差平方和,反映试验误差对试验指标的影响。 总离差平方和的分解定理仿单因素方差分析的方法,考察总离差平 若“各因素、各水平及其交互作用的影响无统计意义”的假设 成立,则 则可推得: 由 作右侧假设检验来考察各因素及因素间的交互作用对试验指标的影响力. 若“各因素、各水平及其交互作用的影响无统计意义双因素有重复(有交互作用)试验资料表因素 A因素 B双因素有重复(有交互作用)试验资料表因素 A因素 B双因素(有重复)试验方差分析表方差来源因素A总和平方和自由度均方和F 值F 值临介值因素B误差各离差平方和的计算公式参看出P180_181这里双因素(有重复)试验方差分析表方

17、差来源因素A总和平方和自由度例3 P183 例题2因素A(能量)因素 B(蛋白质)例3 P183 例题2因素A(能量)因素 B(蛋白质)输入数据时,C2表示行因素水平,C3表示列因素水平。第几次重复不必列明,软件自会识别。输入数据时,C2表示行因素概率论与数理统计课件第8章概率论与数理统计课件第8章概率论与数理统计课件第8章结果显示如P185均0.01饲料中能量的高低、蛋白质含量的不同及两者的交互作用对鱼的体重的影响极有统计意义。结果显示如P185均0.01饲料中能量的高低、蛋白质含量的各因素,各水平,各交互作用下的均值。各因素,各水平,各交互作用下的均值。作业 P195 3 4(借助软件完成

18、) 预习第三节 正交试验设计 及其统计分析 作业 P195 正交试验设计正交试验设计 引言 试验设计是数理统计中的一个较大的分支,它的内容十分丰富。我们简介正交试验设计。 正交试验设计是利用“正交表”进行科学地安排与分析多因素试验的方法。其主要优点是能在很多试验方案中挑选出代表性强的少数几个试验方案,并且通过这少数试验方案的试验结果的分析,推断出最优方案,同时还可以作进一步的分析,得到比试验结果本身给出的还要多的有关各因素的信息。 引言 试验设计是数理统计中的一个较大的分支 正交表是一种特别的表格,是正交设计的基本工具。我们只介绍它的记号、特点和使用方法。 正交表的记号及含义记号及含义 正交表

19、的列数(最多能安排的因素个数,包括交互作用、误差等)正交表的行数(需要做的试验次数)各因素的水平数(各因素的水平数相等)q正交表的代号 正交表是一种特别的表格,是正交设计的基本工具如 表示 ?表示各因素的水平数为2,做8次试验,最多考虑7个因素(含交互作用)的正交表。如 表示 ?表示各因素的水平数为2, 正交表的特点1、正交表中任意一列中,不同的数字出现的次数相等;表示:在试验安排中,所挑选出来的水平组合是均匀 分布的(每个因素的各水平出现的次数相同) 均衡分散性2、正交表中任意两列,把同行的两个数字看成有序数 对时,所有可能的数对出现的次数相同。表示:任意两因素的各种水平的搭配在所选试验中出

20、现 的次数相等 整齐可比性这是设计正交试验表的基本准则 正交表的特点1、正交表中任意一列中,不同的数字出现的次数 正交试验设计的基本步骤 确定目标、选定因素(包括交互作用)、确定水平;2. 选用合适的正交表;3. 按选定的正交表设计表头,确定试验方案;4. 组织实施试验;5. 试验结果分析。 正交试验设计的基本步骤 确定目标、选定因素(包括交互作用) 例1 为了解决花菜留种问题,以进一步提高花菜种子的产量和质量,科技人员考察了浇水、施肥、病害防治和移入温室时间对花菜留种的影响,进行了四个因素各两个水平的正交试验,各因素及其水平如下表:因素水平1水平2A:浇水次数不干死为原则,整个生长期只浇水1

21、2次根据生长需水量和自然条件浇水,但不过湿B:喷药次数发现病害即喷药每半月喷一次C:施肥次数开花期施硫酸铵进室发根期、抽薹期、开花期和结果期各施肥一次D:进室时间11月初11月15日 例1 为了解决花菜留种问题,以进一步提高花菜解 第一步:选择适当的正交表 这是一个四因素两水平的正交试验及分析问题,因此要选择型的表,且不考虑交互作用时, , 仍然是满足条件的最小的正交表,所以选用正交表 注:也可由试验次数应满足的条件来选择正交表。 若考虑A与B、A与C的交互作用,则 ,而 是满足条件的最小的正交表,所以还可选用正交表 解 第一步:选择适当的正交表 这是一个四其中:由 确定。是可求出的,而 是未

22、知的,当不考虑交互作用时:可取故 N 不是唯一的。试验次数N的确定原则 所以一般地,由 确定 N,其中:由 确定。是 如三因素四水平 43 的正交试验至少应安排次以上的试验。 如三因素四水平 43 并包括第一、二个因素的交互作用的正交试验至少应安排的试验次数为 若再加上包括第一、五个因素的交互作用的正交试验则至少应安排的试验次数为次以上的试验。 又如安排 的混合水平的正交试验至少应安排所以一般地,有 如三因素四水平 43 的正交试验至少应安排次以上的试验。 第二步 表头设计查交互作用表 表示位于第二、第四列的两因素的交互作用要放于第六列。如P190 L8(27)的交互作用表列号 1 2 3 4

23、 5 6 7 1 (1) 3 2 5 4 7 6 2 (2) 1 6 7 4 5 3 (3) 7 6 5 4 4 (4) 1 2 3 5 (5) 3 2 6 (6) 1 注意:主效应因素尽量不放交互列。如A、B因素已放C1、C2列,则C 因素就不放C3列。第二步 表头设计查交互作用表 表示位于第花菜留种的表头设计列号 1 2 3 4 5 6 7因子考虑交互作用AB和AC,则例1的表头可设计为 注:第6列为空白列,当随机误差列;也可把第7列作空白列。一般要求至少有一个空白列。按正交表 得试验方案: 只需将各列中的数字“1”、“2”分别理解为所填因素在试验中的水平数,每一行就是一个试验方案。花菜留

24、种的表头设计列号 1 2 第三步 按所选定的正交试验方案组织试验,记录试验 结果; 见P192 表8-22 水 列平 号试验号ABAXBCAXCD产量12345671111111135021112222325312211224254122221142552121212200621221212507221122127582212112375第三步 按所选定的正交试验方案组织试验,记录试验见P19 第四步 分析正交试验结果方法1 直观分析(极差分析) (1)计算极差,确定因素的主次顺序 第j列的极差 或 极差越大,说明这个因素的水平改变对试验结果的影响越大,极差最大的那个因素,就是最主要的因素。对例1来说,各因素的主次顺序为 第四步 分析正交试验结果方法1 直观分析(极差分析)(2)确

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论