均值方差检验_第1页
均值方差检验_第2页
均值方差检验_第3页
均值方差检验_第4页
均值方差检验_第5页
已阅读5页,还剩96页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 第二章 均值向量和协方差阵的检验 假设检验的基本问题1、假设检验的基本原理 小概率事件原理小概率思想是指小概率事件(P0.01或P0,检验水准为单侧0.05。b. 计算统计量 进行样本均数与总体均数比较的t检验时t值为样本均数与总体均数差值的绝对值除以标准误的商,其中标准误为标准差除以样本含量算术平方根的商3. 确定概率,作出判断 以自由度v(样本含量n减1)查t界值表,0.025P2或10或d0,即差值的总体均数不为“0”,检验水平为 。B. 计算统计量 进行配对设计t检验时 t值为差值均数与0之差的绝对值除以差值标准误的商,其中差值标准误为差值标准差除以样本含量算术平方根的商。C. 确定

2、概率,作出判断 以自由度v(对子数减1)查t界值表,若P=,则还不能拒绝H0。例4:要比较50个人在减肥前和减肥后的重量。这样就有了两个样本,每个都有50个数目。这里不能用前面的独立样本均值差的检验;这是因为两个样本并不独立。每一个人减肥后的重量都和自己减肥前的重量有关。但不同人之间却是独立的。令减肥前的重量均值为 1 ,而减肥后的均值为2 ;这样所要进行的检验为: H0: 12 H1: 1大于2也可以把两个样本中配对的观测值逐个相减,形成一个由独立观测值组成的样本;然后用单样本检验方法,看其均值是否为零。在相减之后公式和单样本均值检验无异。 用 SPSS 处理数据: Spss 选项:Anal

3、yzeCompare Means Paired-Samples T Test SPSS输出结果 : Spss 输出结果得到双尾 p- 值为 0.002 ,这里的单尾 p- 值于是为 0.001 因此减肥后和减肥前相比,平均重量显著要轻。 (4)多元、多总体的均值检验?:各总体均值是否相等?各个总体之间的差异表现在哪儿?是由什么引起的?能否继续采用前面的3种类型所选用的t检验?为什么? 不能,因为: a、计算工作量大 变量或总体两两检验 b、估计的精确性和检验的灵敏度降低如何解决?方差分析( analysis of variance , ANOVA )一、方差分析的基本思想1、定义 方差分析又称

4、变异数分析或F检验,其目的是推断两组或多组资料的总体均数是否相同,检验两个或多个样本均数的差异是否有统计学意义。2、了解方差分析中几个重要概念:(1)观测因素或称为观测变量 如:考察农作物产量的影响因素。农作物产量就是观测变量。(2)控制因素或称控制变量 进行试验(实验)时,我们称可控制的试验条件为因素(Factor),因素变化的各个等级为水平(Level)。 影响农作物产量的因素,如品种、施肥量、土壤等。 如果在试验中只有一个因素在变化,其他可控制的条件不变,称它为单因素试验; 若试验中变化的因素有两个或两个以上,则称为双因素或多因素试验 。 方差分析就是从观测变量的方差入手,研究诸多控制变

5、量(因素)中哪些变量是对观测变量有显著影响的变量3、方差分析的基本原理 设有r个总体,各总体分别服从 ,假定各总体方差相等。现从各总体随机抽取样本。透过各总体的样本数据推断r个总体的均值是否相等? :至少有一组数据的平均值与其它组的平均值有显著性差异。 分析的思路:用离差平方和(SS)描述所有样本总的变异情况,将总变异分为两个来源: (1)组内变动(within groups),代表本组内各样本与该组平均值的离散程度,即水平内部(组内)方差 (2)组间变动(between groups),代表各组平均值关于总平均值的离散程度。即水平之间(组间)方差即:SS总=SS组间+SS组内消除各组样本数不

6、同的影响-离差平方和除以自由度(即均方差)。从而构造统计量:方差分析的基本思想就是通过组内方差与组间方差的比值构造的F统计量,将其与给定显著性水平、自由度下的F值相对比,判定各组均数间的差异有无统计学意义。零假设否定域:例1:某公司计划购买一台计算机。为了选择优良型号的计算机以减少日后的维修问题,他们对6种型号的计算机作了初步调查,每种型号调查4台,结果列于表1。这些结果表示每个型号的计算机上个月维修的小时数。试问由此结果能否判定由于计算机型号不同而造成它们在维修时间方面有显著差异? 研究的指标(即观测变量)就是维修时间,记作Y;控制因素是计算机的型号,分为6个水平即A,B,C,D,E,F,把

7、每个水平所对应的指标看成一个总体。现在的试验就是进行调查,每种型号调查4台,相当于每个总体中抽取一个容量为4的样本,得到的数据记作 即为表1数据。 该例考察的问题是:不同型号的计算机的平均维修时间是相同?首先计算各样本平均数若按两个总体平均值比较的检验法,把样本平均数两两组成对: 将这15对平均数一一进行比较检验计算工作量太大即使每对都进行了比较,并且都以0.95的置信度得出每对均值都相等的结论,但是由此要得出这6个型号的维修时间的均值都相等这一结论的置信度仅是 估计的精确性和检验的灵敏度降低其他方法?按照统计假设检验的原理,在本例中原假设是:不同型号的计算机的平均维修时间是相同的。如果这个原

8、假设为真,那么各型号的样本平均数之间的变异程度就不可能太大。因此,我们考虑应该使用方差或观测值的偏差平方和的概念来进行检验。 方差分析的基本原理就是按照上述统计思想进行的,即:(1)将数据总的偏差平方和按照产生的原因分解成由因素的水平不同引起的偏差平方和以及由试验误差引起的偏差平方和两部分之和: (总的偏差平方和)=(由因素水平引起的偏差平方和)+(试验误差平方和) (2)上式右边两个平方和的相对大小可以说明因素的不同水平是否使得各平均值(各型号的平均维修时间)产生显著性差异,为此进行适当的统计假设检验。 例2 SIM手机高、中、低三种收入水平被调查者的用户满意度是否有显著性差异 即:研究被调

9、查者的收入水平是否会影响其对SIM手机的满意程度。SPSS处理:Analyze Compare Mean One-Way ANOVA 结果如下:以上是一元方差分析统计量,多元方差分析统计量?书27页多元的均值向量检验?例5: 调查某中学同年级22名男女生, 测量其身高(cm)、体重(kg)和胸围(cm),数据见表。试检验该中学全体男女生的身体发育状况有无差别。某中学22名男、女生身体测量资料 男 生 女 生 编号 身高 体重 胸围 编号 身高 体重 胸围 1 171 58.5 81.0 1 152 44.8 74 2 175 65 87 2 153 46.5 80 3 159 38 71 3

10、158 48.5 73.5 4 155.3 45 74 4 150 50.5 87 5 152 35 63 5 144 36.3 68 6 158.3 44.5 75 6 160.5 54.7 86 7 154.8 44.5 74 7 158 49 84 8 164 51 72 8 154 50.8 76 9 165.2 55 79 9 153 40 70 10 164.5 46 71 10 159.6 52 76 11 159.1 48 72.5 12 164.2 46.5 73一元方差分析的结果 身高 体重 胸围 组别 平均值 标准差 平均值 标准差 平均值 标准差 男 161.9 6.8

11、 48.1 8.3 74.4 5.9 女 154.2 5.0 47.3 5.6 77.4 6.6 F值 8.7* 0.1 1.3 * P0.01从表可以看出,该校男、女生的身高差异有显著性意义,而体重、胸围差异无显著性意义。那么, 该年级全体男女生的身体发育状况有无差别,我们不能得到一个明确的结论。多元方差分析(操作参见书例2.1,第36页):SPSS 选项: Analyze General Linear Model Multivariate 可用男、女生的身高、体重、胸围组成的样本均数向量推论该年级男、女生身体发育指标的总体均数向量1和2相等与否, 得到: F=8.8622,P=0.0008

12、。拒绝该年级男女生身体发育指标的总体均数向量相等的假设,从而可认为该校男女生身体发育状况不同。 4、方差分析的应用条件 (1)可比性,若资料中各组均数本身不具可比性则不适用方差分析。 (2)正态性,各组的观察数据,是从服从正态分布的总体中随机抽取的样本。即偏态分布资料不适用方差分析。对偏态分布的资料应考虑用对数变换、平方根变换、倒数变换、平方根反正弦变换等变量变换方法变为正态或接近正态后再进行方差分析。(3)方差齐性,各组的观察数据,是从具有相同方差的相互独立的总体中抽取得到的。即若组间方差不齐则不适用方差分析。二、方差分析的内容1、类型: 依据涉及的分析变量多少分为:一元方差分析、多元方差分

13、析 依据对分析变量的影响因素的数量分为:单因素方差分析、多因素方差分析 2、分析步骤: (1)建立检验假设; H0:多个样本总体均数相等。 H1:多个样本总体均数不相等或不全等。(2)确定检验统计量;(3)给定显著水平;(3)计算统计量、确定P值并作出推断结果。单因素方差分析一、单因素方差分析概念: 分析某一个因素A的不同水平是否对观测变量Y产生了显著影响。例:某饮料生产企业研制出一种新型饮料. 饮料的颜色共有四种 : 橘黄色、粉色、绿色和无色透明。这四种饮料的营养含量、味道、价格、包装等可能影响销售量的因素全部相同。现从地理位置相似、经营规模相仿的五家超市上收集了该种饮料的销售情况。 问题:

14、饮料的颜色是否对销售量产生影响? 其中:饮料的颜色即是影响因素(控制因素、变量) 销售量是观测变量。在其他条件相同的情况下,上述问题就归结为一个检验问题,即:差异的产生来自两个方面: 一方面是由不同颜色的差异造成的,既不同的饮料颜色对销售量产生了影响。用组间方差表示 另一方面是由于抽选样本的随机性而产生的差异,即各颜色内的随机误差,如相同颜色的饮料在不同的商场销售量也不同。用组内方差表示。Spss 选项: Analyze Compare Mean One-Way ANOVA (一元单因素方差分析)SPSS 输出结果:可看出F值为10.486,P值是0.000。推断零假设不成立。表明颜色不同饮料

15、的销量也不同。 如何用SPSS对方差分析的方差相等要求进行判定?(因正态分布的要求不是很严格 ,分析忽略)Spss 选项:在 One-Way ANOVA 中选择Option ,选定 Homogeneity-of variance进一步考察: 究竟是哪一个水平对观察变量产生了显著影响,即那种颜色的饮料对销售量有显著影响?运用单因素方差分析的多重比较检验SPSS窗口中Post Hoc选项进行选择。 例:考察汉族、藏族、蒙古族三个民族的人均收入水平 INC、15岁及以上人口上学或毕业比例 EDU是否有差异。(多元单因素分析问题)需考察的影响因素为:民族观测变量为:INC和EDU SPSS处理:Ana

16、lyze General Linear Model Multivariate 人均收入、教育比例Dependent Variables 民族 Fixed Factors 结果:结果分析:三个民族的人均收入、受教育比例有显著差异。双因素、多因素方差分析一、基本思想研究两个或两个以上因素(控制变量)是否对观测变量产生显著性影响。如:饮料销售,除了关心饮料颜色之外,还想了解销售地区、销售策略是否影响销售量?若把饮料的颜色看作影响销售量的因素A,饮料的销售地区看作影响因素B,销售策略看作影响因素C。对因素A和因素B同时进行分析,就属于双因素方差分析。对因素A、B以及C (或更多因素)同时进行分析,就属

17、多因素方差分析。 双(多)因素方差分析是对影响因素进行检验,究竟是一个因素在起作用,还是两个(多个)因素都起作用,或是两个(多个)因素的影响都不显著。 二、分类:双(多)因素方差分析有两种类型:1、无交互作用的双(多)因素方差分析,它假定因素A和因素B的效应是相互独立的,不存在相互关系;2、有交互作用的双(多)因素方差分析,它假定因素A和因素B的结合会产生出一种新的效应(相互影响)。例如,若假定不同地区的消费者对某种颜色有与其他地区消费者不同的特殊偏爱,这就是两个因素结合后产生的新效应,属于有交互作用的背景;否则,就是无交互作用的背景。 三、以双因素为例:FA=MSA/MSE FB=MSB/M

18、SE 例4 某商品有五种不同的包装方式(因素A),在五个不同地区销售(因素B),现从每个地区随机抽取一个规模相同的超级市场,得到该商品不同包装的销售资料如下表。 表4 某种商品不同地区不同包装的销售资料 检验包装方式和销售地区对该商品销售是否有显著性影响?(=0.05) (1)建立假设对因素A :对因素B:(2)计算统计量因素A的列均值分别为:因素B的行均值分别为:总均值=15.04SST=(20-15.04)2 +(10-15.04)2=880.96 SSA=5(21.6-15.04)2 +5(11.6-15.04)2=335.36 SSB=3(15.2-15.04)2 +3(16.8-15

19、.04)2=199.36SSE=880.96-335.36-199.36=346.24 (3)统计决策对于因素A,因为FA=1.903F-crit;故拒绝H0,接受H1,说明不同的地区对该商品的销售产生不同的影响。 SPSS处理(一元多因素方差分析): Analyze General Linear Model Univariate (1)无交互效应(2)有交互效应例5 职业、年龄是否是居民储蓄(存取款额、收入水平)的影响因素SPSS处理(多元多因素方差分析): Analyze General Linear Model Multivariate (1)有交互作用(2)无交互作用2.2 协方差阵的检验(1)检验(2)检验SPSS处理:参见均值检验2.3 形象分析(Pro)一、问题提出 设从总体 ,中各自独立地抽取样本 和 , 。他们的均值向量差为:例 在爱情和婚姻的调查中,对一个由若干名丈夫和妻子组成的样本进行了问卷调查,请他们回答以下几个问题:(1)你对伴侣的爱情的“热度”感觉如何?(2)伴侣对你的爱情的“热度”感觉如何?(3)你对伴侣的爱情的“可结伴”水平感觉如何?(4)伴侣对你的爱情的“可结伴”水平感觉如何? 回答采用没有、很小、有些、很大和非常大5个等级,得到结果如表。丈夫对妻子妻子对丈夫 X1 X2 X3 X4 X1 X2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论