统计学教程含七方差分析_第1页
统计学教程含七方差分析_第2页
统计学教程含七方差分析_第3页
统计学教程含七方差分析_第4页
统计学教程含七方差分析_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学教程含七方差分析第一页,共五十三页,编辑于2023年,星期三方差分析的基本原理单因素方差分析双因素方差分析第二页,共五十三页,编辑于2023年,星期三某饮料企业生产一种新型饮料。饮料的颜色分为黄色、无色、粉色和绿色四种。为确定饮料的颜色是否对饮料的销售量有显著影响,从5个超市中搜集了该种饮料的样本数据如下表所示。管理者想用这些样本数据来检验假设:颜色对销售量没有显著影响。超市黄色无色粉色绿色1234527.925.128.524.226.526.528.725.129.127.231.228.330.827.929.630.829.632.431.732.8样本均值

样本方差=26.44=3.298=27.32=2.672=29.56=2.143=31.46=1.658总均值=28.695方差分析是对多个总体均值是否相等这一假设进行检验。四种颜色饮料销售量样本数据总体1总体2总体3总体4因变量或称响应变量自变量或称因素水平1水平2水平3水平4处理1处理2处理3处理4样本1样本2样本3样本4方差分析的基本原理第三页,共五十三页,编辑于2023年,星期三方差分析的假定条件1.对每个总体,响应变量服从正态分布:2.对每个总体,响应变量的方差相同:3.观察值是独立的总体1总体3总体4总体2不尽相等方差分析的基本原理第四页,共五十三页,编辑于2023年,星期三原假设为假时,样本均值来自不同的抽样分布。原假设为真时,样本均值来自同一个抽样分布。不尽相等不尽相等1m方差分析的基本原理第五页,共五十三页,编辑于2023年,星期三可由样本均值间的差异导出σ2一个估计量,此估计量称为σ2的组间估计量:方差分析的基本原理第六页,共五十三页,编辑于2023年,星期三式中:表示水平的个数。每个样本方差都给出σ2的无偏估计。将其进行平均可得出σ2的又一个估计量,此估计量称为σ2的组内估计量。方差分析的基本原理第七页,共五十三页,编辑于2023年,星期三H0为真时,组间估计是σ2的无偏估计。H0为假时,σ2的组间估计必然偏大。由于σ2的组内估计不受总体均值是否相等的影响,所以无论H0为真或为假,组内估计总是σ2的无偏估计。H0为真,则σ2的两个估计量必然很接近,其比值将接近于1;H0为假,组间估计将大于组内估计,其比值也将偏大。本例中:组间估计/组内估计=25.6152/2.4428=10.486。方差分析的基本原理第八页,共五十三页,编辑于2023年,星期三服从分子自由度为,分母自由度为的分布。(25.25)自由度(5.5)自由度(2.1)自由度不同自由度下的F分布曲线0方差分析的基本原理第九页,共五十三页,编辑于2023年,星期三(3,16)自由度下的F分布曲线。3.2410.486结论:拒绝原假设,接受备择假设,即:饮料的颜色对饮料的销售量有显著影响。方差分析的基本原理第十页,共五十三页,编辑于2023年,星期三单因素方差分析的步骤方差分析的多重比较单因素方差分析第十一页,共五十三页,编辑于2023年,星期三单因素方差分析的步骤某计算机产品公司拥有三个工厂,为确定工厂中有多少员工了解全面质量管理,分别从每个工厂选取一个由6名员工组成的随机样本,并对他们进行质量意识测试。得到数据资料如下表所示。管理者想用这些数据来检验假设:三个工厂的平均测试分数相同。观察值工厂1工厂2工厂3123456857582767185717573746982596462697567三个工厂18名员工的测试分数第十二页,共五十三页,编辑于2023年,星期三第一步:建立假设第二步:计算样本均值第三步:计算总样本均值第四步:计算样本方差第五步:计算总体方差的组间估计第六步:计算总体方差的组内估计第七步:计算F统计量第八步:编制方差分析表第九步:做出统计决策单因素方差分析的步骤第十三页,共五十三页,编辑于2023年,星期三水平1总体1水平2水平3总体2总体3观察值工厂1工厂2工厂3123456857582767185717573746982596462697567不尽相等不尽相等第个总体的均值水平的个数式中:单因素方差分析的步骤第十四页,共五十三页,编辑于2023年,星期三观察值工厂1工厂2工厂3123456857582767185717573746982596462697567样本均值797466第个水平下的样本均值第个水平下的第个观察值第个水平下的样本容量式中:单因素方差分析的步骤第十五页,共五十三页,编辑于2023年,星期三若则有:式中:总样本均值单因素方差分析的步骤第十六页,共五十三页,编辑于2023年,星期三观察值工厂1工厂2工厂3123456857582767185717573746982596462697567样本均值797466样本方差342032总均值73第个水平下的样本方差式中:单因素方差分析的步骤第十七页,共五十三页,编辑于2023年,星期三与相联系的自由度式中:反映组间差异,它只有一个约束。组数为。因此,其自由度为。若则有:单因素方差分析的步骤第十八页,共五十三页,编辑于2023年,星期三反映组内差异。各组自由度为共有组,因此,自由度为。式中:※算法二:单因素方差分析的步骤第十九页,共五十三页,编辑于2023年,星期三统计量服从分布,其分子自由度为,分母自由度为。单因素方差分析的步骤第二十页,共五十三页,编辑于2023年,星期三方差来源平方和SS自由度df均方MSF值组间组内SSTRSSESSTr-1nT-rnT-1MSTRMSEMSTTR/MSE方差来源平方和SS自由度df均方MSF值组间组内总差异51643094621517258.0028.679.00方差分析表总差异单因素方差分析的步骤第二十一页,共五十三页,编辑于2023年,星期三

=

+方差分析可被视为将总平方和分解为不同成分的一种统计方法。总平方和=处理平方和+误差平方和单因素方差分析的步骤第二十二页,共五十三页,编辑于2023年,星期三(2,15)自由度下的F分布曲线拒绝域接受域结论:拒绝原假设接受原接受备择假设,即三个工厂的平均测试分数不尽相同。不尽相等时,则有:临界值单因素方差分析的步骤第二十三页,共五十三页,编辑于2023年,星期三方差分析的多重比较原假设与备择假设检验统计量t统计量服从自由度为nT-r的t分布。若即拒绝原假设则方差分析的多重比较-最小显著性差异法(leastsignificantdifference简写为LSD)第二十四页,共五十三页,编辑于2023年,星期三FisherLSD法对两总体均值相等性检验方法中的总体方差估计替换为MSE,得出自由度为nT-r的t统计量,用于总体均值的多重比较。方差分析的多重比较第二十五页,共五十三页,编辑于2023年,星期三四种颜色饮料销售量样本数据超市黄色无色粉色绿色1234527.925.128.524.226.526.528.725.129.127.231.228.330.827.929.630.829.632.431.732.8均值26.4427.3229.5631.46结论:黄色与无色无显著差异;

粉色与绿色无显著差异。已知查表得计算得方差分析的多重比较第二十六页,共五十三页,编辑于2023年,星期三双因素方差分析某商品有五种不同的包装方式,在五个不同地区销售,现从每个地区随机抽取一个规模相同的超级市场,得到该商品不同包装的销售量资料如下表所示。现欲检验包装方式与销售地区对该商品销售量是否有显著影响。trbl方式1方式2方式3方式4方式5地区1地区2地区3地区4地区52022241626121014422202018816101218620146101810某商品不同地区不同包装的销售量双因素方差分析是对不同处理及不同区组总体均值是否相等进行检验。第二十七页,共五十三页,编辑于2023年,星期三双因素方差分析第一步:建立假设第二步:计算样本均值和总样本值第三步:计算离差平方和第四步:计算均方值第五步:计算F统计量第六步:编制双因素方差分析表第七步:做出统计决策第二十八页,共五十三页,编辑于2023年,星期三双因素方差分析关于不同处理下的总体关于不同区组下的总体(包装方式之间销售量无差别)(包装方式之间销售量有差别)(地区之间销售量有差别)(地区之间销售量无差别)不尽相等不尽相等第二十九页,共五十三页,编辑于2023年,星期三双因素方差分析trbl方式1方式2方式3方式4方式5区组均值地区1地区2地区3地区4地区5202224162612101442220201881610121862014610181015.214.016.810.418.8处理均值21.612.416.413.211.615.04不同地区不同包装销售量的样本均值与总样本均值第三十页,共五十三页,编辑于2023年,星期三双因素方差分析处理平方和区组平方和误差平方和总平方和第三十一页,共五十三页,编辑于2023年,星期三双因素方差分析处理均方区组均方误差均方第三十二页,共五十三页,编辑于2023年,星期三服从分子自由度为分母自由度为的分布。双因素方差分析服从分子自由度为分母自由度为的分布。第三十三页,共五十三页,编辑于2023年,星期三双因素方差分析方差来源平方和SS自由度df均方MSF值处理区组误差总计SSTRSSBLSSESSTr-1k-r(r-1)(k-1)nT-1MSTRMSBLMSEFtrFbl双因素方差分析表方差来源平方和SS自由度df均方MSF值处理区组误差总计335.36199.36346.24880.9644162483.8449.8421.643.8743072.303142l第三十四页,共五十三页,编辑于2023年,星期三双因素方差分析(4,16)自由度下的F分布曲线拒绝域接受域结论:该商品销售量地区间无显著差异。包装方式间有显著差异。第三十五页,共五十三页,编辑于2023年,星期三结束第三十六页,共五十三页,编辑于2023年,星期三单因素方差分析双因素方差分析用SPSS作方差分析第三十七页,共五十三页,编辑于2023年,星期三四种颜色饮料销售量样本数据超市黄色无色粉色绿色1234527.925.128.524.226.526.528.725.129.127.231.228.330.827.929.630.829.632.431.732.8[数据集12]=2=3=4color=1sale定义变量单因素方差分析第三十八页,共五十三页,编辑于2023年,星期三调用此过程可完成单因素方差分析单因素方差分析第三十九页,共五十三页,编辑于2023年,星期三单因素方差分析的基本过程可采纳系统的默认方式。各种

选项多重比较第四十页,共五十三页,编辑于2023年,星期三F统计量=10.544的P值=0.000<0.05。故拒绝原假设,接受备择假设,即不同颜色的饮料的销售量有显著差异。单因素方差分析第四十一页,共五十三页,编辑于2023年,星期三对四种颜色下各总体的均值进行多重比较。第四十二页,共五十三页,编辑于2023年,星期三最小显著性差异法第四十三页,共五十三页,编辑于2023年,星期三第四十四页,共五十三页,编辑于2023年,星期三由于方差分析的前提是各水平下的总体服从方差相等的正态分布,因此须对方差分析的前提进行检验。第四十五页,共五十三页,编辑于2023年,星期三输出不同水平下的描述性统计量输出方差相等性的检验结果输出各水平下均值的折线图。计算中涉及的变量含有缺失值时暂时剔除观测剔除所有含有缺失值的观测第四十六页,共五十三页,编辑于2023年,星期三检验统计量=0.255相伴P值=0.856>0.05故可以认为4种水平下各总体的方差无显著差异,满足单因素方差分析中的方差相等性要求。单因素方差分析第四十七页,共五十三页,编辑于2023年,星期三样本数据所显示的四种颜色饮料销售量的差异。单因素方差分析第四十八页,共五十三页,编辑于2023年,星期三调用此过程可完成多因素方差分析。操作过程中涉及广义线性模型的内容,故在此从略。多因素方差分析第四十九页,共五十三页,编辑于2023年,星期三

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论