《应用统计学》第5章-分类变量对数值变量的影响_第1页
《应用统计学》第5章-分类变量对数值变量的影响_第2页
《应用统计学》第5章-分类变量对数值变量的影响_第3页
《应用统计学》第5章-分类变量对数值变量的影响_第4页
《应用统计学》第5章-分类变量对数值变量的影响_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

*,*,警惕过多地检验。你对数据越苛求,数据会越多地向你供认,但在威逼下得到的供词,在科学询查的法庭上是不容许的。StephenM.Stigler,统计名言,*,怎样解决下面的问题?,来自不同地区的大学生每个月的平均生活费支出是否不同呢?家电的品牌对它们的销售量是否有显著影响呢?不同的路段和不同的时段对行车时间有影响吗?超市的位置和它的销售额有关系吗?不同的小麦品种产量有差异吗?,5.1方差分析解决什么问题?5.2考虑一个分类变量的影响5.3考虑两个分类变量的影响,第5章分类变量对数值变量的影响,5.1方差分析解决什么问题?5.1.1比较均值是否相同5.1.2从误差分析入手5.1.3在什么样的前提下分析?,第5章分类变量对数值变量的影响,5.1.1比较均值是否相同,5.1方差分析解决什么问题?,*,方差分析解决什么问题?(例题分析),【例】确定超市的位置和竞争者的数量对销售额是否有显著影响,获得的年销售额数据(单位:万元)如下表,因子,水平,样本数据,*,什么是方差分析(ANOVA)?(analysisofvariance),比较多个总体均值是否相等例如:不同位置的超市销售额均值是否一样研究分类自变量(因子factor)对数值因变量(观测结果)的影响例如:“超市位置”是一个分类自变量,“竞争者数量”也是一个分类自变量两个或多个水平(level)或分类。例如:3个超市位置,4种竞争者一个数值型因变量,销售额只考虑一个因子对观测数据的影响称为单因素方差分析(one-wayanalysisofvariance);考虑两个因子对观测数据的影响称为双因素方差分析(two-wayanalysisofvariance),5.1.2从误差分析入手,5.1方差分析解决什么问题?,*,误差分解,组内误差(withingroups)样本数据内部各观察值之间的差异比如,同一位置下不同超市之间销售额的差异反映随机因素的影响,称为随机误差组间误差(betweengroups)不同样本之间观察值的差异比如,不同位置超市之间销售额的差异可能是随机误差,也可能是超市位置本身所造成的系统性系统误差总误差(total)全部观测数据的误差大小,*,误差表示(平方和SS),数据的误差用平方和(sumofsquares)表示组内平方和(sumofsquaresforerror)也称误差平方和或残差平方和,记为SS残差不同因子(不同位置超市)的组内误差平方和组间平方和(sumofsquaresforfactor)也称因子平方和,记为SS因子不同因子(不同位置超市)的组间误差平方和总平方和(sumofsquaresfortotal)反映全部数据误差大小的平方和,记为SST误差间的关系:SST=SS因子+SS残差,*,误差度量(均方MS),用均方(meansquare)表示误差大小,以消除观测数据的多少对平方和的影响用平方和除以相应的自由度均方也称方差(variance)组间均方也称组间方差(between-groupsvariance),反映各因子间误差的大小MS因子=SS因子自由度(因子个数-1)组内均方也称组内方差(within-groupsvariance),反映随机误差的大小MS残差=SS残差自由度(数据个数-因子个数),*,误差分析(F-检验),将组间均方与组内均方进行比较,分析差异是否显著F=(MS因子MS残差)F(因子自由度,残差自由度)用F分布作出决策,给定的显著性水平若FF(或PF(或PF(或PF(或PF(或PF(或P),拒绝H0,案例分析地理位置与抑郁症有关吗,1、案例背景为了分析地理位置与患抑郁症之间的关系,纽约洲北部地区的一家医疗中心的专家进行了调查研究。选择了60个相当健康的人组成一个样本,其中20人居住在佛罗里达,20人居住在纽约,20人居住在北卡罗米纳。另外还给出这三个地区患慢性病的人患抑郁症的样本数据,以考虑地理位置与患有慢性病的人患抑郁症之间的关系,这些慢性病诸如关节炎、高血压、心脏失调等。同样也给出60个样本,三个地区的样本数量各占三分之一。,案例分析,2、案例数据描述3、案例拟解决问题(1)比较地理因素对健康人患抑郁症影响程度是否相同?(2)比较地理因素对患有慢性病人患抑郁症的影响程度是否相同?(3)不同地理位置间患抑郁症程度是否相同?,案例分析,4、案例分析要求(1)描述统计学方法概括说明两部分研究的资料,关于抑郁症的得分,你的初步观测结果是什么?(2)对两个数据集使用方差分析方法,陈述每种情况下被检验的假设,你的结论

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论