版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第九章方差分析和回归分析关键词: 单因素试验一元线性回归回归诊断
1方差分析(Analysisofvariance,简称:ANOVA),是由英国统计学家费歇尔(Fisher)在20世纪20年代提出的,可用于推断两个或两个以上总体均值是否有差异的显著性检验.2§1单因素方差分析例:为了比较三种不同类型日光灯管的寿命(小时),现将从每种类型日光灯管中抽取8个,总共24个日光灯管进行老化试验,根据下面经老化试验后测算得出的各个日光灯管的寿命(小时),试判断三种不同类型日光灯管的寿命是不是有存在差异.3日光灯管的寿命(小时)类型寿命(小时)类型I52906210574050005930612060805310类型II58405500598062506470599054705840类型.III71306660634064707580656072906730引起日光灯管寿命不同的原因有二个方面:其一,由于日光灯类型不同,而引起寿命不同.其二,同一种类型日光灯管,由于其它随机因素的影响,也使其寿命不同.4在方差分析中,通常把研究对象的特征值,即所考察的试验结果(例如日光灯管的寿命)称为
试验指标.对试验指标产生影响的原因称为因素,“日光灯管类型”
即为因素.因素中各个不同状态称为
水平,如日光灯管三个不同的类型,即为三个水平.5单因素方差分析
仅考虑有一个因素A对试验指标的影响.假如因素A有r个水平,分别在第i水平下进行了
多次独立观测,所得到的试验指标的数据6每个总体相互独立.因此,可写成如下的
数学模型:7
方差分析的目的就是要比较因素A的r个水平下试验指标理论均值的差异,问题可归结为比较这r个总体的均值差异.8检验假设9假设等价于10为给出上面的检验,主要采用的方法是平方和分解。即假设数据总的差异用总离差平方和分解为二个部分:一部分是由于因素A引起的差异,即效应平方和;另一部分则由随机误差所引起的差异,
即误差平方和。1112证明:
1314151617定理9.1.118方差来源平方和自由度均方F比因素Ar-1误差n-r总和n-1单因素试验方差分析表1920
例1设有5种治疗荨麻疹的药,要比较它们的疗效。假设将30个病人分成5组,每组6人,令同组病人使用一种药,并记录病人从使用药物开始到痊愈所需时间,得到下面的记录:(=0.05)21药物类型治愈所需天数x15,8,7,7,10,824,6,6,3,5,636,4,4,5,4,347,4,6,6,3,559,3,5,7,7,622这里药物是因子,共有5个水平,这是一个单因素方差分析问题,要检验的假设是“所有药物的效果都没有差别”。
2324方差来源平方和自由度均方F比因素A36.46749.117
3.90误差58.500252.334总和94.9672925未知参数的估计26272829在Excel上实现方差分析先加载''数据分析"这个模块,方法如下:在excel工作表中点击主菜单中“工具”
点击下拉式菜单中“加载宏”
就会出现一个“加载宏”
的框.
在“分析工具库”
前的框内打勾点击“确定”.这时候再点击下拉式菜单会新出现“数据分析”.然后就可以进行统计分析了.30以下面的例子来说明用Excel进行方差分析的方法:保险公司某一险种在四个不同地区一年的索赔额情况记录如表所示.试判断在四个不同地区索赔额有无显著的差异?31保险索赔记录地区索赔额(万元)A11.601.611.651.681.701.701.78A21.501.641.401.701.75A31.641.551.601.621.641.601.741.80A41.511.521.531.571.641.6032在Excel工作表中输入上面的数据点击主菜单中“工具”点击下拉式菜单中“数据分析”
就会出现一个“数据分析”
的框.
点击菜单中“方差分析:单因素方差分析”点击“确定”,出现“方差分析:单因素方差分析”
框.33在“输入区域”中标定你已经输入的数据的位置根据你输入数据分组情况(是按行分或按列分)确定分组.选定方差分析中F检验的显著水平选定输出结果的位置点击“确定”.
在你指定的区域中出现如下方差分析表:34方差来源平方和自由度均方F比P-valueFcrit组间0.049230.01642.16590.12083.0491
组内0.1666220.0076总计0.215825方差分析表35根据Excel给出的方差分析表,假设H0的判别有二种方法:363738方差分析的前提39方差分析和其它统计推断一样,样本的独立性对方差分析是非常重要的,在实际应用中会经常遇到非随机样本的情况,这时使用方差分析得出的结论不可靠.因此,在安排试验或采集数据的过程中,一定要注意样本的独立性问题.40在实际中,没有一个总体真正服从正态分布的,而方差分析却依赖于正态性的假设.不过由经验可知,方差分析F检验对正态性的假设并不是非常敏感,即,实际所得到的数据,若没有异常值和偏性,或者说,数据显示的分布比较对称的话,即使样本容量比较小(如每个水平下的样本容量仅为5左右),方差分析的结果仍是值得依赖的.41方差齐性对于方差分析是非常重要的,因此在方差分析之前往往要进行方差齐性的诊断,检验方差齐性假设通常采用Barlett检验.不过,也可采用如下的经验准则:当最大样本标准差不超过最小样本标准差的两倍时,方差分析F检验结果近似正确.42例
检验a,b两种药物的抗癌效果,要做动物试验。作法是:将患有某种癌的白鼠随机地分成三组。第一组:注射a物质,第二组:注射b物质,第三组:不做处理。经过一段时间观察后,得到寿命数据。在试验中,考虑白鼠的性别有可能对其寿命有显著的影响。将“性别”作为另一个因素——“双因素试验”。因素A:药物,三个水平;因素B:性别,二个水平;两个因素共有2×3=6种组合。§2双因素方差分析43
(一)
无交互作用的双因素方差分析
因素B因素A4445分别检验假设4647484950双因素无重复试验的方差分析表方差来源平方和自由度均方F比因素A因素B误差总和51例
假定对3个小麦品种和3块试验地块进行区组设计试验,得到如下的数据:
表
小麦品种区组试验数据
小麦品种(A)试验地块(B)总和B1B2B3A1258279242779A2302314336952A3321318327966总和881911905269752双因素无重复试验的方差分析表方差来源平方和自由度均方F比F值α=0.05因素A7232.666723616.333312.506.94因素B168.0000284.00000.296.94误差1157.33334289.3333总和8558.0000853在这个问题中我们所关心的是因素A的效应,由方差分析表知,原假设不成立,即认为小麦品种的产量之间有显著差异。在这里,品种3的单产最高,而品种1的产量最低,因此可以断定品种3明显地优于品种1。
54
(二)
有交互作用的双因素方差分析
因素B因素A555657分别检验假设:585960616263双因素试验的方差分析表方差来源平方和自由度均方F比因素A因素B交互作用误差总和64例
为了比较3种松树在4个不同的地区的生长情况有无差别,在每个地区对每种松树随机地选取5株,测量它们的胸径,得到的数据列表如下。
松树数据表松树种类地区1234123,15,26,13,2125,20,21,16,1821,17,16,24,2714,17,19,20,24228,22,25,19,2630,26,26,20,2819,24,19,25,2917,21,18,26,23318,10,12,22,1315,21,22,14,1223,25,19,13,2218,12,23,22,1965输出各单元总和及因素水平总和:
松树数据的总和表单元总和B1B2B3B4水平总和A19810010594397A2120130116105471A3758410294355水平总和293314323293122366方差来源平方和自由度均方F比F值α=0.05因素A344.93332172.46679.453.19因素B46.0500315.35000.842.80交互作用113.6000618.93331.042.30误差875.60004818.2417总和1380.183359双因素方差分析表67§3一元线性回归分析一、确定性关系:当自变量给定一个值时,就确定应变量的值与之对应。如:在自由落体中,物体下落的高度h与下落时间t之间有函数关系:
变量与变量之间的关系
68二、相关性关系:
变量之间的关系并不确定,而是表现为具有随机性的一种“趋势”。即对自变量x的同一值,在不同的观测中,因变量Y可以取不同的值,而且取值是随机的,但对应x在一定范围的不同值,对Y进行观测时,可以观察到Y随x的变化而呈现有一定趋势的变化。69如:身高与体重,不存在这样的函数可以由身高计算出体重,但从统计意义上来说,身高者,体也重。如:父亲的身高与儿子的身高之间也有一定联系,通常父亲高,儿子也高。70我们以一个例子来建立回归模型某户人家打算安装太阳能热水器.为了了解加热温度与燃气消耗的关系,记录了16个月燃气的消耗量,数据见下表.71
月份平均加热温度燃气用量
月份平均加热温度燃气用量Nov.246.3Jul.01.2Dec.5110.9Aug.11.2Jan.438.9Sep.62.1Feb.337.5Oct.123.1Mar.265.3Nov.306.4Apr.134Dec.327.2May.41.7Jan.5211Jun.01.2Feb.306.972在回归分析时,我们称“燃气消耗量”为响应变量记为Y,“加热温度”为解释变量记为X,由所得数据计算相关系数得r=0.995,表明加热温度与燃气消耗之间有非常好的线性相关性.如果以加热温度作为横轴,以消耗燃气量作为纵轴,得到散点图的形状大致呈线性.73747576777879一元线性回归要解决的问题:80参数估计81整理得正规方程系数行列式828384
在误差为正态分布假定下,的最小二乘估计等价于极大似然估计。85采用最大似然估计给出参数的估计与最小二乘法给出的估计完全一致。采用最大似然估计给出误差的估计如下:此估计不是的无偏估计。86例1K.Pearson收集了大量父亲身高与儿子身高的资料。其中十对如下:父亲身高x(吋)60626465666768707274儿子身高y(吋)63.665.26665.566.967.167.468.370.170求Y关于x的线性回归方程。8788参数性质89即为正态随机变量的线性组合,所以服从正态分布。证明(1)90(2)类似可得。91回归方程显著性检验采用最小二乘法估计参数,并不需要事先知道Y与x之间一定具有相关关系。因此μ(x)是否为x的线性函数:一要根据专业知识和实践来判断,二要根据实际观察得到的数据用假设检验方法来判断。92(1)影响Y取值的,除了x,还有其他不可忽略的因素;(2)E(Y)与x的关系不是线性关系,而是其他关系;(3)Y与x不存在关系。若原假设被拒绝,说明回归效果是显著的,否则,若接受原假设,说明Y与x不是线性关系,回归方程无意义。回归效果不显著的原因可能有以下几种:93假设的检验统计量与方差分析方法类似,仍采用平方和分解。一般地,用来描述之间的总的差异大小,称SST为总平方和。94可以证明:95可以证明,由参数估计的性质可知,当时,
969798也可采用t检验99例3检验例1中回归效果是否显著,取α=0.05。100回归系数
的置信区间由101102回归参数估计和显著性检验的Excel实现
例1(续)前面我们已经分析了加热温度与燃气消耗量之间的关系,认为两者具有较好的线性关系,下面我们进一步建立燃气消耗量(响应变量)与加热温度(解释变量)之间的回归方程.采用Excel中的“数据分析”
模块.在Excel工作表中输入上面的数据点击主菜单中“工具”
点击下拉式菜单中“数据分析”
就会出现一个“数据分析”
的框,点击菜单中“回归”
,点击“确定”,出现“回归”框.103在“Y值输入区域”中标定你已经输入的响应变量数据的位置,在“X值输入区域”中标定你已经输入的解释变量数据的位置(注意:数据按“列”输入)“置信度”中输入你已经确定置信度的值选定输出结果的位置点击“确定”.在指定位置输出相应的方差分析表和回归系数输出结果,例1的输出结果如下所示,104
自由度平方和均方F值P_值
回归1168.581168.5811467.5511.415E-15误差141.6080.115总的15170.189方差分析表105
Coef.标准误差tStatPvalueLower95%Upper95%Intercept1.0890.1397.8411.729E-060.7911.387X0.1890.00538.3091.415E-150.1780.200方差分析中,给出了假设检验
的F检验.方差分析表中各项也与前一节方差分析表中的意义类似.值得注意的是,方差分析表中“均方”列中,相应于“误差”行的值即为模型误差方差的估计,即
=0.115.106107108预测预测一般有两种意义.109110因此,根据观测结果,点预测为111112113114115116117例
合金钢的强度y与钢材中碳的含量x有密切关系。为了冶炼出符合要求强度的钢常常通过控制钢水中的碳含量来达到目的,为此需要了解y与x之间的关系。其中x:碳含量(%)y:钢的强度(kg/mm2)数据见下:x0.030.040.050.070.090.100.120.150.170.20y40.539.541.041.543.042.045.047.553.056.0118(1)画出散点图;(2)设μ(x)=α+βx,求α+β的估计;(3)求误差方差的估计,画出残差图;(4)检验回归系数β是否为零(取α=0.05);(5)求回归系数β的95%置信区间;(6)求在x=0.06点,回归函数的点估计和95%置信区间;(7)求在x=0.06点,Y的点预测和95%区间预测。
1190.030.050.070.090.110.130.150.170.1956545250484644424038(1)合金钢的强度y与钢材中碳的含量x的散点图1201211221230.030.050.070.090.110.130.150.170.19x0e1240.030.050.070.090.110.130.150.170.1956545250484644424038合金钢的强度y与钢材中碳的含量
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度瓷砖加工服务外包合同
- 2024年度东莞市企业并购合同
- 2024年度影视版权采购合同
- 2024年度婚礼车队租赁服务合同
- 2024年度北京市出租车行业司机招聘广告发布合同
- 广告招牌工程合同范例
- 2024年度安置房建设项目绿化景观设计与施工合同
- 渔业养殖租赁合同范例
- 炒家买卖合同模板
- 水电工程合同范例
- 国华定洲发电厂二期工程创优规划
- 高级孔板阀操作维护手册
- 消防监控系统维护保养及巡检管理制度
- 齿轮减速器的结构认识及拆装
- 《IQC培训资料》PPT课件.ppt
- 《人民防空工程质量验收与评价标准》(RFJ01-2015)
- 土地整治项目全套表格
- 煤焦油水分、密度的测定方法
- 方格纸,申论答题卡A4打印模板
- 第七章气相色谱法PPT课件
- 西师大版一年级数学上册应用题与解决问题专项表
评论
0/150
提交评论