数据的参数检验和方差分析课件_第1页
数据的参数检验和方差分析课件_第2页
数据的参数检验和方差分析课件_第3页
数据的参数检验和方差分析课件_第4页
数据的参数检验和方差分析课件_第5页
已阅读5页,还剩92页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数据的参数检验和方差分析zf*zf优选数据的参数检验和方差分析假设检验的基本问题假设检验的基本原理 小概率事件原理小概率思想是指小概率事件(P0.01或P160cm 或者 u160cm为右尾检定( Upper-tailed Test ); u2或12,即两样本来自的总体均数不相等.1.2 两样本的t检验根据来自两个总体的独立样本对其总体均值的检验 观测样本独立且是服从正态分布的随机样本 与 已知时 构造统计量 与 未知但相等时 构造统计量 计算t统计量时是用两样本均数差值的绝对值除以两样本均数差值的标准误分析(Analyze)比较均值(Compare mean)两独立样本t检验(Indepen

2、dent-Samples T Test)(1)组内变动(within groups),代表本组内各样本与该组平均值的离散程度,即水平内部(组内)方差分别给第5和第6组赋值 -.奋斗的双脚在踏碎自己的温床时,却开拓了一条创造之路。统计软件输出 p - 值的位置,有的用 “ p-value ” ,有的用 significant 的缩写 “Sig”总体方差 已知,用统计量3 配对样本的t检验针对同样的样本实验前后均值的比较16个样本的 weight 也平均下降 8 磅影响农作物产量的因素,如品种、施肥量、土壤等。当计算时涉及的变量有缺失值,则剔除在该变量上为缺失的样本即水平之间(组间)方差弹出Opt

3、ion对话框例4:为检测某种药物对攻击性情绪的影响,对 100 名服药者和 150 名非服药者进行心理测试,得到相应的某指标。 相应的假设检验问题为: H0:1=2 H1: 1大于2 1 为第一组的总体均值,而2 为第二组的总体均值。 用SPSS 处理数据: 分析(Analyze)比较均值(Compare mean)两独立样本t检验(Independent-Samples T Test) SPSS 输出结果:注意:这个输出的前面三列( Levenes Test for Equality of Variances )为检验这两个样本所代表的总体之方差是否相等(零假设为相等)。如果显著,即在 Si

4、g 列中的该 Levene 检验 p- 值很小(这里是 0.008 ),说明两总体的方差相等被拒绝。就应该看两总体方差不等的结果,即最后一行的 t 检验输出( p- 值 0.347/2 );否则看上面一行的结果。因为总体方差相同时使用的检验统计量与方差不同时使用的不一样 结论:通过计算,t统计量等于0.942,p值为 0.1735 (输出中的双尾检验p值0.347的一半)。因此无法拒绝零假设,即服药与未服药的攻击性情绪无差异。例5: 某商场的营销部拟对某种信用卡购物促销方式及效果进行评估。随机抽取了500名持卡消费者。信用卡购物促销方式之一:过去三个月消费实施降低利率的方式;方式之二:采取标准

5、的信用卡购物方式。(两种方式各有250名消费者)。 (见数据文件: creditpromo.sav )(1) 分析的下拉菜单中选择: 分析(Analyze)比较均值(Compare mean)两独立样本t检验(Independent-Samples T Test)弹出对话框 SPSS操作过程:选择检测变量分组变量选择分组取值定义选择检测变量:$ spent during promotional period. 选择分组变量:Type of mail insert received.点击 Define Groups对分组变量的取值进行定义. 第一组的分组取值第二组的分组取值运用分界点进行分组(2

6、) 输出结果及分析: independent-samples statistic该表是描述性统计表:不同消费方式下样本大小、消费金额的均值、标准差、均值的标准误. 该表可看出从样本平均值来看,接受利率优惠的消费者的平均消费要高出接受标准方式的消费者有71美元.结论: 因计算的T统计量为-2.26,sig值为0.0240.05;所以,可得出新药对triglyceride level 无影响。而实验前后weight的t统计量为11.2;sig值0.0000.05;所以,可认为体重下降8.06绝非偶然,而是新药起了作用。如何解决多元多总体的均值检验?不同型号的计算机的平均维修时间是相同?2 方差分析

7、首先计算各样本平均数若按两个总体平均值比较的检验法,把样本平均数两两组成对: 将这15对平均数一一进行比较检验计算工作量太大即使每对都进行了比较,并且都以0.95的置信度得出每对均值都相等的结论,但是由此要得出这6个型号的维修时间的均值都相等这一结论的置信度仅是 估计的精确性和检验的灵敏度降低其他方法?方差分析(analysis of variance , ANOVA ):又称变异数分析或F检验,其目的是推断两组或多组资料的总体均数是否相同,检验两个或多个样本均数的差异是否有统计学意义。方差分析中几个重要概念:1)观测因素或称为观测变量 如:考察农作物产量的影响因素。农作物产量就是观测变量。2

8、)控制因素或称控制变量:进行试验(实验)时,我们称可控制的试验条件为因素(Factor)。其中因素变化的各个等级为水平(Level)。 影响农作物产量的因素,如品种、施肥量、土壤等。 如果在试验中只有一个因素在变化,其他可控制的条件不变,称它为单因素试验; 若试验中变化的因素有两个或两个以上,则称为双因素或多因素试验 。 方差分析就是从观测变量的方差入手,研究诸多控制变量(因素)中哪些变量是对观测变量有显著影响的变量方差分析的基本原理 设有r个总体,各总体分别服从 ,假定各总体方差相等。现从各总体随机抽取样本。透过各总体的样本数据推断r个总体的均值是否相等? :至少有一组数据的平均值与其它组的

9、平均值有显著性差异。 分析的思路:用离差平方和(SS)描述所有样本总的变异情况,将总变异分为两个来源: (1)组内变动(within groups),代表本组内各样本与该组平均值的离散程度,即水平内部(组内)方差 (2)组间变动(between groups),代表各组平均值关于总平均值的离散程度。即水平之间(组间)方差 即:SS总=SS组间+SS组内消除各组样本数不同的影响-离差平方和除以自由度(即均方差)。从而构造统计量:方差分析的基本思想就是通过组内方差与组间方差的比值构造的F统计量,将其与给定显著性水平、自由度下的F值相对比,判定各组均数间的差异有无统计学意义。零假设否定域:方差分析的

10、应用条件 (1)可比性,若资料中各组均数本身不具可比性则不适用方差分析。 (2)正态性,各组的观察数据,是从服从正态分布的总体中随机抽取的样本。即偏态分布资料不适用方差分析。对偏态分布的资料应考虑用对数变换、平方根变换、倒数变换、平方根反正弦变换等变量变换方法变为正态或接近正态后再进行方差分析。 (3)方差齐性,各组的观察数据,是从具有相同方差的相互独立的总体中抽取得到的。即若组间方差不齐则不适用方差分析。一元单因素方差分析:分析某一个因素A的不同水平是否对某一个观测变量Y产生了显著影响。一元多因素方差分析:分析某两个或多个因素的不同水平是否对某一个观测变量Y产生了显著影响。2.1 一元方差分

11、析例1:某饮料生产企业研制出一种新型饮料. 饮料的颜色共有四种 : 橘黄色、粉色、绿色和无色透明。这四种饮料的营养含量、味道、价格、包装等可能影响销售量的因素全部相同。现从地理位置相似、经营规模相仿的五家超市上收集了该种饮料的销售情况。 2.1.1 一元单因素方差分析问题:饮料的颜色是否对销售量产生影响? 其中:饮料的颜色即是影响因素(控制因素、变量) 销售量是观测变量。在其他条件相同的情况下,上述问题就归结为一个检验问题,即:差异的产生来自两个方面: 一方面是由不同颜色的差异造成的,既不同的饮料颜色对销售量产生了影响。用组间方差表示 另一方面是由于抽选样本的随机性而产生的差异,即各颜色内的随

12、机误差,如相同颜色的饮料在不同的商场销售量也不同。用组内方差表示。一元单因素方差分析Spss 选项: 分析(Analyze) 比较均值( Compare Mean) 单因素ANOVA(One-Way ANOVA)SPSS 输出结果:可看出F值为10.486,P值是0.000。推断零假设不成立。表明颜色不同饮料的销量也不同。如何用SPSS对方差分析的方差相等要求进行判定?(因正态分布的要求不是很严格 ,分析忽略)Spss 选项:在 One-Way ANOVA 中选择Option ,选定 Homogeneity-of variance进一步考察: 究竟是哪一个水平对观察变量产生了显著影响,即那种颜

13、色的饮料对销售量有显著影响?运用单因素方差分析的多重比较检验SPSS窗口中Post Hoc选项进行选择。 例2: 为了迎合消费者的需求,某音像公司拟推出一张新的DVD 专辑. 市场营销部分收集不同年龄的消费者群体对新的DVD 专辑的评价等相关数据信息。(见数据文件 dvdplayer.sav ) 从该数据文件我们想知道 : 是否不同消费者群体对DVD的评价不一样呢? 32-38岁与39-45岁两个年龄段的消费者全体对DVD的评价是否一样呢? 32岁以下与 45岁以上的消费者群体对DVD的评价是否一样呢? SPSS的处理过程:(1) 一元单因素方差分析的菜单选择: 分析(Analyze) 比较均

14、值(Compare Mean) 单因素方差分析(One-Way ANOVA) 弹出One-way ANOVA对话框选择 Total DVD assessment 作为因变量.选择 Age Group 作为影响因素.点击选项Options按钮. 多重比较检验 :两两比较看哪些水平之间存在均值差异. 先验比较检验:事先设定因变量在因素的不同不平下是否有差异. 描述性统计量、均值图、缺失值的处理观测变量(因变量)输入框影响因素(自变量)输入框弹出Option对话框统计量选择描述性统计.如:均值、方差等固定效应、随机效应模型的标准差、标准误、置信区间等方差同质性(相等)检验 当F检验方差相等不成立时,

15、用Brown-Forsythe统计量或Welch统计量检验组间均值是否相等,比F检验更可取。 选择均值图Means plot. 点击继续 Continue. 点击一元单因素对话框中的两两比较 Post Hoc .均值示意图可直观看出组间均值差异弹出双重比较检验对话框组均值示意图缺失值处理假设组间方差相等时的多重比较检验假设组间方差不等时的多重比较检验确定显著性水平选择方差不等时的Tamhanes T2. 点击继续 Continue.点击一元单因素方差分析中的 对比Contrasts 按钮. 弹出Contrasts 对话框第1组系数赋值为0,点击 Add. 第二组系数赋值为0,点击Add.紧接着

16、, 给第3和第4组系数赋值,要使两系数和为0.给第3组赋值-1 ,点击 Add.给第4组系数赋值为 1. 给第5和第6组赋值为0.点击 Next 进入下一组先验对比检验. 首先,比较第 3 和 第4个年龄段的消费者群体;其他年龄段的忽略不考虑,赋值为0.零假设为:两组无差异 其次,对第1、2两个年龄段的消费者与第5、6两个年龄段的消费者进行先验对比。第3和4两个年龄段的消费者不考虑。 给第1组赋值 .5 ,点击 Add.给第2组赋值 .5 ,点击 Add. 分别给第3和第4组赋值为0,点击Add. 分别给第5和第6组赋值 -.5, 点击 Add.点击Continue.点击一元单因素对话框中的

17、OK,输出分析结果output. (2) 结果分析:方差齐性(相等)检验 从上表可看出:各总体方差相等的零假设成立。因为统计量 Levene statistic为0.574 ,该统计量实现的可能性 sig. 值为 0.720,说明零假设发生可能性是很大的,我们没有充分的理由拒绝它,由此接受零假设。差异表现如何,究竟来自哪儿 ? 由此表可看出,对DVD的评价的差异主要来自不同年龄的消费者群体的组间差异,因为F 统计量为4.601;同时依据sig值 0.001,也可说明我们最初的零假设不同年龄群体对DVD的评价无差异发生的可能性为0.001,我们没有充分理由接受它. 方差分析表组均值示意图 该图给

18、我们较为直观的印象:32-45 岁的消费者对 DVD 的评价高于其他消费者群体. 若要作更细致和精确的分析,可通过一元方差分析中的先验比较和多重比较来完成。 对比系数表 检验 32-38 和39-45 两个群体对DVD的评价是否有差异,零假设认为:二者无差异。其他年龄段的消费者群体忽略不考虑,所以分别赋值为0;而32-38 和39-45 两个群体分别赋值-1 和 1类似地,若想对比32岁以下和45岁以上的消费者群体对DVD的评价是否有差异,零假设认为二者无差异,所以,分别给18-24、25-31赋值为.5,分别给46-52、53-59赋值为-.5,其他群体不考虑赋值为0。The signifi

19、cance values for the tests of the first contrast are both larger than 0.10. This indicates that the age 39-45 group is not significantly more favorable toward the DVD player than the age 32-38 group. Likewise, the significance values for the tests of the second contrast are larger than 0.10. Partici

20、pants under 32 and over 45 have statistically equivalent assessment scores. 假设方差不等时的检验结果假设方差相等时的检验结果Post Hoc Tests双重假设检验2.1.2 一元多因素方差分析基本思想:研究两个或两个以上因素(控制变量)是否对某个观测变量产生显著性影响。如:饮料销售,除了关心饮料颜色之外,还想了解销售地区、销售策略是否影响销售量?若把饮料的颜色看作影响销售量的因素A,饮料的销售地区看作影响因素B,销售策略看作影响因素C。对因素A和因素B同时进行分析,就属于双因素方差分析。对因素A、B以及C (或更多因

21、素)同时进行分析,就属多因素方差分析。 双(多)因素方差分析有两种类型:1、无交互作用的双(多)因素方差分析,它假定因素A和因素B的效应是相互独立的,不存在相互关系;2、有交互作用的双(多)因素方差分析,它假定因素A和因素B的结合会产生出一种新的效应(相互影响)。例如,若假定不同地区的消费者对某种颜色有与其他地区消费者不同的特殊偏爱,这就是两个因素结合后产生的新效应,属于有交互作用的背景;否则,就是无交互作用的背景。 案例分析:广告城市与销售额数据目标:企业对不同广告形式在不同地区的广告效果(销售额)进行评估;例2: 某杂货店对其消费者的购买习惯作了一项问卷调查。重要想关注:不同性别、不同的购

22、买习惯是否会影响到其在一个月内的消费金额。 (数据见: grocery_1month.sav )因变量dependent variable: Amount spent自变量Independent variables: gender shopping style一元双因素问题(1)建立假设:对于因素: gender 零假设 H0: 备择假设 H1:对于因素: shopping style 零假设 H0: 备择假设 H1:交互影响因素: 零假设 H0: 备择假设 H1:(2) 一元多因素的 SPSS处理过程: 菜单选择:分析(Analyze) 一般线性模型(General Linear Model

23、) 单变量(Univariate)弹出univariate对话框因变量选择固定因素随机因素(协方差分析时)协变量选择(协方差分析时)权数变量选择模型选择按钮实现先验对比检验和趋势检验图形分析双重比较检验将分析结果以变量的形式存入SPSS数据编辑窗口中置信水平和描述性统计等选择 Amount spent as 作为因变量. 选择 Gender and Shopping style 进入固定因素框. 点击 Model按钮. GenderShopping styleGenderShopping style饱和模型(考虑交互效应gender*Shopping style )非饱和模型(不考虑交互效应,

24、系统默认模型 )若选择非饱和模型,则点击custom.点击作图 Plots进入形象分析对话框.选择 style作为横坐标变量. 选择 gender 作为纵坐标变量. 点击 Add按钮. 点击Continue.按钮再点击 Post Hoc 按钮进入双重比较对话框.形象分析:用图形直观分析控制变量间是否存在交互作用假设方差相等双重假设检验假设方差不等选择 style 作为双重比较检验的因素. 选择方差相等中的 Tukey 统计量选项. 选择方差不等中的 Tamhanes T2 统计量选项. 点击 Continue. 再点击 Options. 选择 gender*style 显示其均值情况. 选择

25、Descriptive statistics, Homogeneity tests, Estimates of effect size, and Spread vs. level plot 等选项. 点击Continue. 点击Ok. (3)the results analysis (结果分析,略)多元单因素方差分析:分析某一个因素的不同水平是否对某个观测向量Y产生了显著影响多元多因素方差分析:分析某两个或多个因素的不同水平是否对某个观测向量Y产生了显著影响2.2 多元方差分析例1:考察汉族、藏族、蒙古族三个民族的人均收入水平 INC、15岁及以上人口上学或毕业比例 EDU是否有差异。(多元单因素分析问题)需考察的影响因素为:民族观测变量为:INC和EDU SPSS处理: 分析(Analyze) 一般线性模型(Genera

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论