工学第5章-常用统计技术-1-方差分析课件_第1页
工学第5章-常用统计技术-1-方差分析课件_第2页
工学第5章-常用统计技术-1-方差分析课件_第3页
工学第5章-常用统计技术-1-方差分析课件_第4页
工学第5章-常用统计技术-1-方差分析课件_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第1节方差分析(ANALYSISOFVARIANCE)方差分析用不同的生产方法生产同一种产品,比较各种生产方法对产品的影响是人们经常遇到的问题。比如,化工生产中,原料成份、剂量、顺序、催化剂、反应温度、压力、时间、机器设备以及操作人员技术水平等因素对产品都会有影响,有的影响大些,有的影响小些。为此,需要找出对产品有显著影响的因素。方差分析就是鉴别各因素效应的一种有效的统计方法。它的应用范围十分广阔,可以成功地应用在试验工作的很多方面。补充内容:常用统计技术方差分析是统计检验的一种。由英国著名统计学家R.A.FISHER推导出来的,也叫F检验。一、方差分析的基本概念二、单因素方差分析三、重复数不等的单因素方差分析四、两因素方差分析(多个样本均数间的多重比较)主要内容一、方差分析的基本概念数据()

数据和(T)方差()

离均差()1、几个名词和概念因素水平

F分布※因子(因素)有时会遇到需要比较多个总体均值的问题。

例1:现有甲、乙、丙三个工厂生产同一种零件。为了解不同工厂的零件的强度有无明显的差异,现分别从每一工厂随机抽取四个零件测定其强度,数据如表1所示。试问三个工厂的零件强度是否相同(假定每一个总体都服从正态分布且各总体的方差相等)?工厂零件强度甲乙丙1031019811011310710811682928486三个工厂的零件的强度数据不同工厂的零件强度不同。因此可以将工厂看成是影响零件强度指标的一个因素。不同的工厂便是该因素的不同状态。试验中可改变(可控制)的试验条件称之为因子,常用大写字母A、B、C等表示。※水平指的是因子所处的状态,采用在因素的字母加下标表示。一般,一个因子会有几个水平。例如因子A有4个水平,则表示为:A1、A2、A3。

※F分布若随机变量,,则随机变量的函数的分布规律称为F(n1,n2)分布,其中参数n1、n2是两个自由度,任意一个自由度不同就是另一个F分布,正如正态分布中均值或方差不同就是另一个正态分布一样。

F分布在一象限内,呈正偏态,随着两个自由度的增大,趋近于正态分布。一般情况下,F分布的均值接近1,方差一般都小于1,且随两自由度的增大越来越小。-4-2024600.050.10.150.20.250.30.350.4正态分布),(2smN密度函数:222)(21)(smsp--=xexp分布函数:dyexFyx222)(21)(smsp--¥-ò=其中:m为均值,2s为方差,+¥<<¥-x※标准正态分布N(0,1)密度函数:2221)(xex-=pjdyexyx2221)(-¥-ò=Fp

分布函数:统计特征数(一)样本平均值(二)样本中位数(三)样本方差(四)样本标准偏差(五)样本极差表示数据的集中位置表示数据的离散程度(一)样本平均值如果从总体中抽取一个样本,得到一批数据X1,X2,X3….Xn,则样本的平均值::样本的算术平均值n:样本大小(二)样本中位数和样本众数把统计数据X1,X2,X3….Xn按大小顺序重新排列,排在正中间的那个数就是样本中位数,用符号表示。当n为奇数时,正中间的数只有一个;当n为偶数时,正中间的数有两个,此时,中位数为正中两个数的算术平均值。样本众数是将统计数据X1,X2,X3….Xn按大小顺序重新排列,其中出现频数最高的那个数用符号

表示。

(三)样本方差——是衡量统计数据分散程度的一种特征数,其计算公式:S2:样本方差;:某一数据与样本平均值之间的偏差。样本方差和样本标准差都是衡量一个样本波动大小的量,样本方差或样本标准差越大,样本数据的波动就越大.

(四)样本标准偏差国际标准化组织规定,把样本方差的正平方根作为样本标准偏差,用符号S来表示:(五)样本极差——一组数据中最大值与最小值之差。用符号R表示:R=Xmax-Xmin例1、某校从甲、乙两名优秀选手中选1名选手参加全市中学生田径百米比赛,该校预先对这两名选手测试了8次,测试成绩如下表:根据测试成绩,请判断派哪一位选手参加比赛更好?解析:此题要用样本的方差的大小来衡量甲、乙两名选手百米赛成绩的稳定性,方差较小的稳定性强些.

2、方差分析的含义

方差是描述变异的一种指标,方差分析是一种假设检验的方法,即是对变异的分析;方差分析是对总变异进行分析。考察总变异是由哪些部分组成的,这些部分间的关系如何。3、方差分析的基本思想根据变异的来源,将全部观察值总的离均差平方和及自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某些特定因素的作用加以解释。通过比较不同来源变异的方差(也叫均方MS),借助F分布做出统计推断,从而判断某因素对观察指标有无影响。方差分析根据试验中考察的因子的个数,可分为:

单因子方差分析

两因子方差分析

多因子方差分析(试验设计)4、方差分析的分类5、方差分析的假设及结论指标服从正态分布不同水平的方差和均方差相等相互独立的随机样本(数据相互独立)

方差分析是在相同方差假定下检验多个正态均值是否相等的一种统计分析方法。不全相等二、单因子方差分析

——试验中所要考察的影响因素只有一个,则称之为单因子试验,其数据分析可采用单因子方差分析法。

设一个试验中要考察的影响因子A,其有r个水平,在每一个水平下各进行m次重复试验,结果用Yi1,Yi2,…,Yim表示。(一)、引起数据误差的原因组间变异总变异组内变异

试验的数据共有n=rm个。这n个数据的差异可以用总离散平方和(也简称为平方和)来表示。因子A的水平不同(组间平方和)随机误差(组内平方和)※各种变异的表示方法:※三者之间的关系:总变异处理变异误差变异※总变异:

所有测量值之间总的变异程度。其自由度为:※组间变异:各组均数与总均数的离均差平方和。反映的是随机误差+处理因素的共同影响。其自由度为:※组内变异:同一组内,虽每个对象接受的处理相同,但测量值不相同,这种变异称为组内变异,也称Se误差。用各组内各测量值Yij与其所在组的均数差值的平方和来表示,反映随机误差的影响。其自由度为:

变异程度除与离均差平方和的大小有关外,还与其自由度有关。由于各部分自由度不相等,因此各部分离均差平方和不能直接比较,须:将各部分离均差平方和除以相应自由度,其比值称为均方差,简称均方(meansquare,MS)。

均方差:组间均方和组内均方的计算公式为:

当MSA与MSe相差不大时,可以认为因子A的影响不显著;反之,则认为A是显著的。一般用两者的比值来表示这种关系,称之为F比:F比:注:公式是在H0成立的条件下进行的,即MSA与MSe差别应该很小(即F值应接近于1)。那么要接近到什么程度呢?Fisher计算出了F的分布规律(即标准的F值)。即认为因子A的影响显著(或称之为在显著水平)※显著性的具体判定方法:※简便的计算方法:1、所考察的问题

为考察四种解毒药的解毒效果,按完全随机化方法将N=24只大白鼠随机等分成4组(将大白鼠编成1~24号,用计算机对每个大白鼠产生一个随机数,然后按随机数从小到大的顺序排序,前面6个大白鼠分为第一组,紧接着的6个大白鼠分成第二组,…),每组大白鼠服用一种解毒药。服用之后,考察大白鼠血中胆碱脂酶的含量

(μ/ml)。(二)、举例2H0:即4个试验组总体均数相等H1:4个试验组总体均数不全相等

(1)

建立检验假设2、具体分析步骤(2)

确定显著性水平检验水准:一个因素(factor):解毒药四个水平(level)(r=4·):A、B、C、空白对照D,

i=1,2,3,4分别代表A、B、C、D每水平有m=6只大白鼠,分别表示为j=1,2,…,6注:显著性检验的判断是依据小概率事件原理进行的。小概率α在这里称为显著性水平,实际是判断错误的概率(即风险度),与其相对应的β=1-α称为置信度。(3)计算离均差平方、自由度、均方(4)计算F值,列方差分析表(5)下结论注意:即使是同一种解毒药,其效果也是波动的。这种波动可以用方差来度量,即方差的估计。这里,方差的估计是MSe。因此,标准差的估计是:查附表F界值表,得F0.05(3,20)=3.10。由于F>F0.05(3,20),在0.05水平上不同的解毒药物的效果显著处理因素的4个水平中至少有一个组的总体平均值不同于其他各组。从表中所示的值可见,不同解毒药物的效果是不同的。解毒药物A和C与空白对照组D相近。B组血中胆碱脂酶含量较其他组高。三、重复数不等的单因子方差分析

——单因子试验中,若每个水平下重复试验的次数不同。

设一个试验中要考察的影响因子A,在Ai水平下有mi次试验(各不全相等),其计算方法需进行如下改变:四、双因子方差分析

——试验中所要考察的影响因素有A、B两个,则称之为双因子试验,可采用双因子方差分析法进行数据分析,其目的是检验两个因素对试验结果有无影响。

对每一因子的每一水平都可取一个容量为nij的样本(这里介绍无重复试验的情况),因素A有r个水平,因素B有s个水平。对因素A、B的每一个水平的组合(Ai,Bj),i=1,2,···,r;j=1,2,···,s)只进行一次试验,得到n=r·s个结果Yij,将结果列表(如下页表)。其中Yij表示因素A的第个水平与因素B的第个水平构成的一组配合(Ai,Bj)进行试验的结果。※各种变异的表示方法:※三者之间的关系:总变异处理变异误差变异区组变异

为了解3种不同配比的饲料对仔猪生长影响的差异,对3种不同品种的猪各选3头进行试验,测得在3个月内猪体重的增加量(如下表所示)。假定猪体重增加量服从正态分布,且各种配合的方差相等。试分析不同饲料和猪的品种对猪的生长有无显著影响。例3:

1、将表中数据各减去50,其差计为Yij,列出方差计算表如下:解:

2、由上表数据可计算:

3、列出方差分析表如下:

4、得出结论:说明不同饲料对猪体重的增长无显著影响;说明品种的差异对猪体重增长的影响相当显著。作业1、某工厂从3个外协加工的机械锻件,各任取4个锻件,由同一台试验机

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论