《应用统计学教程》课件第10章_第1页
《应用统计学教程》课件第10章_第2页
《应用统计学教程》课件第10章_第3页
《应用统计学教程》课件第10章_第4页
《应用统计学教程》课件第10章_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第10章方差分析10.1方差分析的基本原理10.2单因素方差分析10.3双因素方差分析方差分析(ANOVA)最早由英国统计学家费舍尔在进行试验设计时为解释试验数据而提出的一种统计方法。在不同试验条件下取得不同样本,需要根据样本数据判断不同试验条件下平均数是否相等。在假设检验中,介绍了两个总体平均数之差的假设检验,本章可以看做是对这一问题的拓展,方差分析可用于多个平均数的比较。同时,根据对平均数影响的因素多少,可分为单因素方差分析、双因素方差分析和多因素方差分析。10.1.1方差分析的数据结构方差分析是分析多个平均数是否相等的问题,因此,可以根据不同的条件将样本数据安排在一张数据表中。比如要检验三台机器生产的次品数是否存在差异(即理论上三个机器平均的次品数是否相等)。我们可以观察三台机器一周5天各自生产的次品数,用表10-1表示。表10-1三台机器每天生产的次品数列平均:总平均:响应变量(因变量)、自变量(因素)单因素方差分析和双因素方差分析

机器1机器2机器347534950465554586152545051514910.1.2方差分析中关于数据的基本假定1.每个总体数据服从正态分布。2.对于每一个总体具有相同的方差3.响应变量观察值相互独立。10.1.3组间变差和组内变差1、借助图形的直觉观察2.方差分解1)样本间离差或组间离差(SumSquareBetweenGroup,SSB)2)随机误差来解释,我们定义组内离差(SumSquareErrorinGroup,SSE)3)总离差平方和SST10.1.4F-检验为了比较组间水平因素和组内随机因素对于离差偏离程度的影响,英国统计学家费舍尔构造了F统计量其中:(k-1)、(n-k)分别是F分布的自由度。SSB/(k-1)叫做组间均方差,SSE/(n-k)叫做组内均方差。在满足三个基本假定的条件下,公式10.6所计算的统计量服从F分布,当数据来自方差相等的正态总体时,观察公式:根据F分布的规律,若原假设µ1=µ2=µ

3成立,则组间均方差相对于组内均方差而言,比值应该接近于1,

如果F统计量数值非常大,落入小概率区间,则拒绝原假设。这一小概率也就是假设检验的显著性水平,是事先给定的,通常取1%、5%或10%。

取显著性水平5%,F

临界值F0.05(2,12)=3.885

。观察下图,统计量值落入3.885的右侧,即小概率区间,因此拒绝H0,有充分理由认为3台机器生产的次品数存在显著差异。10.2单因素方差分析10.2.1单因素方差分析的数据结构观察值因素

A1A2…Ak1x11x12…x1k2x21

…x2k…

rxr1xr2…xrk10.2.2单因素方差分析的步骤1、提出原假设和备择假设H0:µ1=µ2=µ

3(自变量对响应变量没有显著影响)H1:µ1,µ2,µ

3不全等(自变量对响应变量有显著影响2、构造统计量3、

与临界值比较做决策则落入拒绝域,拒绝原假设。则落入非拒绝域,不能拒绝原假设4、方差分析表一般的方差分析表结构不同机器生产的次品数的方差分析表差异源SSdfMSFP-valueFcrit组间SSBr-1MSBMSB/MSE

组内SSEn-rMSE

总计SSTn-1

差异源SSdfMSFpFcrit组间130

2658.290.005463.8852组内

94127.8333总计224145、用EXCEL进行方差分析的过程不同佣金支付方式下销售业务员销售额销售提成固定薪金销售提成+加固定薪金165120140981151561309022021012611219510713418715523524080用EXCEL进行方差分析的操作步骤:第一步:选择“数据”下的“数据分析”(EXCEL2003下为“工具”-数据分析)。第二步:在“数据分析工具”框中选择“单因素方差分析”,单击确定。第三步:在出现的对话框(如图10-3)中用鼠标选择数据区域A1:C8;“标志位于第一行”前的选择框打钩;显著性水平

处输入0.05;分组方式按“列”;输出区域选择A12。点击确定得到图(10-4)。图10-3单因素方差分析过程图10-4单因素方差分析结果:方差分析表10.2.3方差分析中的多重比较若|t|>ta/2,拒绝原假设。等价于故将:称为最小显著性差异方法(leastsignificantdifference,LSD)。对于例10-1中如果要进行两两比较,则根据图10-4中的MSE计算出:取显著性水平a=0.05

,根据公式10.11分别计算LSD得到:10.3双因素方差分析在双因素方差分析中,根据因素A和因素B对响应变量所起作用的方式不同,可分为独立无交互双因素方差分析和交互双因素方差分析。1、

独立无交互双因素方差分析数据结构列因素12…k行因素1x11x12…x1k2x21x22…x2k……………rxr1xr2…xrk2、方差分解因此定义行因素的第i个水平下,样本平均值:定义列因素的第j个水平下,样本平均值:定义总的样本品均值总离差平方和

行因素不同水平下的离差平方和列因素不同水平下的离差平方和随机离差平方和可通过离差平方和关系满足行因素的检验统计量列因素的检验统计量3、运用EXCEL进行独立无交互方差分析图10-7独立无交互双因素方差分析结果10.3.2交互双因素方差分析在双因素方差分析中,在两个变量各自影响响应变量的同时,可能存在两个因素交互对响应变量产生影响,也就是说两个自变量并不独立,可能存在不同自变量的组合条件下响应变量存在差异。

列因素

12…k行因素1x111x121

x1k1x112x122

x1k2..

.x11mx12m

x1km2x211x221

x2k1x212x222

x2k2..

.x21mx22m

x2km…

rxr11xr21

xrk1xr12xr22

xrk2..

.xr1mxr2m

xrkm

例10.3分段式定价方案是电力公司鼓励用户在高峰期尽量节约用电而在非高峰期错时使用电力的一种措施。为了了解用户对若干定价方案的满意度,进行一项试验。试验中考虑两个因素,即价格比(高峰期电价与非高峰期电价的比值)和高峰期的时间长度。每个因素考察三个水平,共计个水平组合下让用户进行满意度打分。假定每个定价方案下随机抽取4个用户组成样本,得到的用户评价数据如表。1)在0.05显著性水平下,说明价格比和高峰期时长是否对用户满意度产生影响。2)在0.05显著性水平下,说明价格比和高峰期时长是否对用户满意度存在交互作用。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论