均值、方差检验3_第1页
均值、方差检验3_第2页
均值、方差检验3_第3页
均值、方差检验3_第4页
均值、方差检验3_第5页
已阅读5页,还剩112页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

zf2.1均值向量的检验2.2协方差阵的检验2.3上机实现

第二章均值向量和协方差阵的检验

2024/1/292zf假设检验的基本问题假设检验的基本原理

小概率事件原理小概率思想是指小概率事件(P<0.01或P<0.05等)在一次试验中基本上不会发生。利用反证法思想,先提出假设H0,再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立;反之,则认为假设成立。2024/1/293zf假设检验的步骤

(1)提出一个原假设和备择假设(2)确定检验统计量(3)确定显著性水平α(4)确立置信区间(5)结论2024/1/294zf例:现对某地区成年女性的平均身高进行检验,看是否达到160

cm。随机抽样了50个样本,抽样样本均值为162。(1)提出零假设(nullhypothesis)和备择假设(alternativehypothesis)

H0:u=160cmH1:u160cm如何对此假设进行检验呢?通过随机抽样,从样本资料中找充分证据去拒绝或接受H02024/1/295zf(2)设定显著性水平α

(如:设α=0.05)(3)确定检验统计量:即选择适当的统计量,并在原假设H0成立的条件下确定该统计量的分布。

如:t、Z统计量(4)确定置信区间

假定此例为:(157,163)(5)结论

假定此例中计算得到t=1.92,以及t=1.92实现的可能性P值为0.06。在0.05水平下t分布表中的t值为1.96统计软件输出p-值的位置,有的用“p-value”,有的用significant的缩写“Sig”2024/1/296zf依据t=1.92<t分布表中的t值为1.96,接受H0,拒绝H1;依据t=1.92实现的可能性P值为0.06﹥显著性水平α的0.05,也可得到‘接受H0,拒绝H1’的结论;依据样本均值162落在(157,163)这一置信区间,仍可得到‘接受H0,拒绝H1’的结论。接受H1并不表示H1为真,只是表示样本资料并没有充分证据可以拒绝H1,也可能会发生‘拒绝正确零假设的错误,即第一类错误’接受H0并不表示H0为真,只是表示样本资料并没有充分证据可以拒绝H0,也可能会发生‘备选假设正确时反而说零假设正确的错误,即第二类错误’2024/1/297zf此例中备择假设H1:u160cm的假设称为双尾检验(Two-tailedTest

);如果备选假设为H1:u>160cm或者u<160cm

则称为单尾检验(One-tailedTest)。其中u>160cm为右尾检定(Upper-tailedTest

);

u<160cm为左尾检定(Lower-tailedTest

实际中选择何种备选假设,需根据检验的需要决定。需要注意的是:计算机输出结果中的p值是双尾检验的概率。如果备选假设选择的是单尾检验,则要将计算机给的p值除以2,即取p值的一半。注意:2024/1/298zf2.1均值向量的检验根据样本对其总体均值大小进行检验(One-SampleTTest)两总体的均值比较:根据来自两个总体的独立样本对其总体均值的检验(IndependentTwo-SampleTTest)配对样本的检验(Pair-SampleTTest)多个总体均值的检验2024/1/299zf一个指标的均值检验-

根据样本对其总体均值大小进行检验假设从总体取出一容量为n的样本,得到均值和标准差s,现要透过样本推断总体均值是否与某给定值(理论值或标准值)有无差别进行检验.记

数据服从正态分布2024/1/2910zf总体方差已知,用统计量

当零假设成立,则统计量服从正态分布。检验的拒绝域为总体方差未知

用样本方差代替总体方差,用统计量:

当零假设成立,则统计量服从正态分布。检验的拒绝域为2024/1/2911zf2024/1/2912zf例1:如果你买了一包标有500g重的一包红糖,你觉得份量不足。于是你找到监督部门;当然他们会觉得一包份量不够可能是随机的。于是监督部门就去商店称了50包红糖(数据在sugar.sav);其中均值(平均重量)是498.35g;这的确比500g少,但这是否能够说明厂家生产的这批红糖平均起来不够份量呢?于是需要统计检验。

2024/1/2913zf首先,可以画出这些重量的直方图(图1)判断样本是否服从正态分布2024/1/2914zf提出假设由于厂家声称每袋500g(标明重量),因此零假设为总体均值等于500g(被怀疑对象总是放在零假设);而且由于样本均值少于500g(这是怀疑的根据),把备选假设定为总体均值少于500g(这种备选假设为单向不等式的检验为单尾检验,)。即,H0:u=500H1:u小于5002024/1/2915zf确定统计量检验统计量就是作为对均值的标准化见书:第21页(2.1)(2.2)用SPSS处理数据:

分析(Analyze)—比较均值(Comparemean)—单样本t检验(OneSampleTTest)

2024/1/2916zfSpss输出结果:t=-2.696(也称为t值),同时得到p-值为0.005(由于计算机输出的为双尾检验的p-值,比单尾的大一倍,应该0.010除以2)在0.5%的条件下,红糖标记重量为500g是不能接受的,实际上平均起来要少于500g。2024/1/2917zf见图2的t分布图,在直观上看这也的确是个小概率事件。

2024/1/2918zf例2:某汽车厂商声称其发动机排放标准的一个指标平均低于20个单位。在抽查了10台发动机之后,得到下面的排放数据:17.0、21.7、17.9、22.9、20.7、22.4、17.3、21.8、24.2、25.4。该样本均值为21.13。究竟能否由此认为该指标均值超过20?假设检验问题就是:H0:u=20H1:u大于202024/1/2919zf用SPSS处理数据:分析(Analyze)—比较均值(Comparemean)—单样本t检验(OneSampleTTest)

Spss输出结果:

p-值为0.1243(计算机输出的双尾检验的p-值除以2)﹥0.05,因此,没有证据否定零假设。2024/1/2920zft分布图:t分布图可以看出,右边的尾概率不能说是小概率。如果要是拒绝零假设的话,犯错误的概率就多于12%(0.1243)了,因此没有足够证据来拒绝零假设。2024/1/2921zf例3:

某汽车生产厂商要求其生产的汽车刹车直径为322毫米。其中有8个生产车间。质量监控中心样本。(数据见

brakes.sav)究竟该厂商生产的刹车是否达标?其中哪些车间的刹车达标?哪些车间的刹车不达标?2024/1/2922zf(1)数据拆分:data—splitdata数据编辑菜单下选择::Data-SplitFile

弹出新对话框

2024/1/2923zf选择Comparegroups.

选择分组变量MachineNumber.

点击OK

2024/1/2924zf(2)单样本T检验的SPSS操作:

Analyze—Comparemean—One-SampleTTest

弹出新对话框2024/1/2925zf选择检测变量设定检测值选择检测变量:DiscBrakeDiameter(mm).

设定检测值:322点击

Options.

2024/1/2926zf置信水平设置

缺失值处理

设置置信水平,如90%.

设置缺失值的处理.点击

Continue.

再在点击

“One-SampleTTest”对话框点击

OK.当计算时涉及的变量有缺失值,则剔除在该变量上为缺失的样本剔除所有在任意变量上有缺失值的样本2024/1/2927zf(3)结果分析:

one-samplestatistic描述性统计:每个车间的样本大小,汽车刹车直径的均值、标准差、均值的标准误。各车间生产的刹车直径都在322毫米左右。2024/1/2928zf

One-samplettest依据此表,我们可做出怎样的结论?2024/1/2929zf目的是推断两个样本群体分别代表的总体均数是否相等。其假设一般为:H0:µ1=µ2,即两样本来自的总体均数相等.H1:µ1>µ2或µ1<µ2,即两样本来自的总体均数不相等.2.1.3两总体均值的比较———

根据来自两个总体的独立样本对其总体均值的检验

观测样本独立且是服从正态分布的随机样本2024/1/2930zf与已知时

构造统计量

与未知但相等时

构造统计量计算t统计量时是用两样本均数差值的绝对值除以两样本均数差值的标准误2024/1/2931zf2024/1/2932zf例4:为检测某种药物对攻击性情绪的影响,对100名服药者和150名非服药者进行心理测试,得到相应的某指标。相应的假设检验问题为:H0:μ1=μ2

H1:μ1大于μ2

μ1

为第一组的总体均值,而μ2为第二组的总体均值。用SPSS处理数据:Analyze—CompareMeans—Independent-SamplesTTest

2024/1/2933zfSPSS输出结果:注意:这个输出的前面三列(Levene‘sTestforEqualityofVariances)为检验这两个样本所代表的总体之方差是否相等(零假设为相等)。如果显著,即在Sig列中的该Levene检验p-值很小(这里是0.008),说明两总体的方差相等被拒绝。就应该看两总体方差不等的结果,即最后一行的t检验输出(p-值=0.347/2);否则看上面一行的结果。因为总体方差相同时使用的检验统计量与方差不同时使用的不一样

2024/1/2934zf结论:通过计算,t统计量等于0.942,p值为0.1735(输出中的双尾检验p值0.347的一半)。因此无法拒绝零假设,即服药与未服药的攻击性情绪无差异。2024/1/2935zf例5:

某商场的营销部拟对某种信用卡购物促销方式及效果进行评估。随机抽取了500名持卡消费者。信用卡购物促销方式之一:过去三个月消费实施降低利率的方式;方式之二:采取标准的信用卡购物方式。(两种方式各有250名消费者)。(见数据文件:creditpromo.sav

)2024/1/2936zf(1)分析的下拉菜单中选择:

Analyze—CompareMeans—Independent-SamplesTTest

弹出对话框

SPSS操作过程:2024/1/2937zf选择检测变量分组变量选择分组取值定义选择检测变量:$spentduringpromotionalperiod.

选择分组变量:Typeofmailinsertreceived.点击‘DefineGroups’对分组变量的取值进行定义.

2024/1/2938zf第一组的分组取值第二组的分组取值运用分界点进行分组2024/1/2939zf(2)输出结果及分析:

independent-samplesstatistic该表是‘描述性统计’表:不同消费方式下样本大小、消费金额的均值、标准差、均值的标准误.该表可看出从样本平均值来看,接受利率优惠的消费者的平均消费要高出接受标准方式的消费者有71美元.2024/1/2940zf结论:因计算的T统计量为-2.26,sig值为0.024<<0.05,所以可得出接受新的信用卡购物方式的消费者消费金额高出另一种购物方式的71.11美元显著异于0.超市应尽力将新的信用卡购物方式推广.2024/1/2941zf配对样本的检验(pairedsamples):(针对同样的样本)考察实验前后样本均值有无差异。能够很好地控制非实验因素对结果的影响。注意:该方法能够很好地控制非实验因素对结果的影响;但同一样本实验前后并不独立。补充:配对样本的均值比较———

同样的样本实验前后均值的比较

怎么处理??要消除配对样本相关性影响,处理方法:用配对样本差值与总体均数“0”进行比较,即推断差数的总体均数是否为“0”。故其检验过程与依据样本均数推断总体均数大小的t检验类似。配对样本差值服从正态分布2024/1/2942zf例6:某减肥茶生产商拟对其生产的新产品的减肥效果进行检验,随机抽取了50个人,考察了50个人减肥前的体重和减肥后的体重。注意:每一个人减肥后的重量都和自己减肥前的重量有关。但不同人之间却是独立的。令减肥前的重量均值为μ1,而减肥后的均值为μ2;这样所要进行的检验为:H0:μ1=μ2

H1:μ1大于μ22024/1/2943zf也可以把同一样本实验前后两个观测值逐个相减,形成一个由独立观测值组成的样本;然后用单样本检验方法,看其均值是否为零。在相减之后公式和单样本均值检验无异。用SPSS处理数据:Analyze—CompareMeans—Paired-SamplesTTest

2024/1/2944zfSpss输出结果得到双尾p-值为0.002,这里的单尾p-值于是为0.001.

因此减肥后和减肥前相比,平均重量显著要轻。SPSS输出结果:减肥前后的体重高度相关2024/1/2945zf例7:某药物生产商欲评估某新药对有心脏病家族病史的病人有无效果。随机选取了16个病人,服药后观察了6个月。在这项研究中,着重考察了实验前后病人的‘weights’和‘triglyceridelevels’.(数据文件:dietstudy.sav.)2024/1/2946zf(1)下拉菜单选项:

Analyze—CompareMeans—Paired-SamplesTTest

弹出配对样本对话框SPSS处理步骤2024/1/2947zf选择Triglyceride

和FinalTriglyceride

作为第一配对变量.

选择Weight

和FinalWeight

作为第二配对变量.

点击OK.

(置信水平选择Option以系统默认为准)2024/1/2948zf(2)结论及分析:

paired-samplesstatistic均值样本量标准差均值的标准误=标准差/从16个样本的’triglyceridelevels’指标看到服用新药后,该指标水平将下降14.06.

16个样本的weight也平均下降8磅从标准差看服药前后的weight相对指标triglyceridelevels的变异度更大.

2024/1/2949zfpaired-samplescorrelation服药前后triglyceridelevels指标的相关系数为-0.286,(统计意义上)无显著的相关关系:从总体看triglyceridelevels服药后降低了,但16个样本该指标上的变化却很不一致,有的没变化,有的反而上升了。服药前后weight指标的相关系数为0.996,(统计意义上)有非常显著的相关关系:所有的样本weight都很一致地降低了。2024/1/2950zfpaired-samplestest该表是‘配对样本t检验’结果表,给出了‘实验前后triglyceride差值’和‘实验前后weight的差值’的均值、标准差、均值的标准误、置信区间、t统计量、自由度、sig值等结论:因为实验前后triglyceridelevel

的t统计量为1.2;sig值0.1245(双尾为0.249)>>0.05;所以,可得出新药对triglyceridelevel

无影响。而实验前后weight的t统计量为11.2;sig值0.000<<0.05;所以,可认为体重下降8.06绝非偶然,而是新药起了作用。2024/1/2951zf如何解决多元多总体的均值检验?2024/1/2952zf多元、多总体的均值检验:各总体均值是否相等?各个总体之间的差异表现在哪儿?是由什么引起的?能否继续采用前面的3种类型所选用的t检验?为什么?不能,因为:a、计算工作量大变量或总体两两检验b、估计的精确性和检验的灵敏度降低如何解决?2.1.2、2.1.4:多元多总体均值检验—方差分析2024/1/2953zf不同型号的计算机的平均维修时间是相同?2024/1/2954zf首先计算各样本平均数若按两个总体平均值比较的检验法,把样本平均数两两组成对:

2024/1/2955zf将这15对平均数一一进行比较检验——计算工作量太大即使每对都进行了比较,并且都以0.95的置信度得出每对均值都相等的结论,但是由此要得出这6个型号的维修时间的均值都相等这一结论的置信度仅是——估计的精确性和检验的灵敏度降低其他方法??2024/1/2956zf方差分析(analysisofvariance,ANOVA):又称变异数分析或F检验,其目的是推断两组或多组资料的总体均数是否相同,检验两个或多个样本均数的差异是否有统计学意义。方差分析中几个重要概念:1)观测因素或称为观测变量如:考察农作物产量的影响因素。农作物产量就是观测变量。2)控制因素或称控制变量:进行试验(实验)时,我们称可控制的试验条件为因素(Factor)。其中因素变化的各个等级为水平(Level)。影响农作物产量的因素,如品种、施肥量、土壤等。

2024/1/2957zf如果在试验中只有一个因素在变化,其他可控制的条件不变,称它为单因素试验;若试验中变化的因素有两个或两个以上,则称为双因素或多因素试验。

方差分析就是从观测变量的方差入手,研究诸多控制变量(因素)中哪些变量是对观测变量有显著影响的变量2024/1/2958zf方差分析的基本原理

设有r个总体,各总体分别服从,假定各总体方差相等。现从各总体随机抽取样本。透过各总体的样本数据推断r个总体的均值是否相等?

:至少有一组数据的平均值与其它组的平均值有显著性差异。

2024/1/2959zf分析的思路:用离差平方和(SS)描述所有样本总的变异情况,将总变异分为两个来源:(1)组内变动(withingroups),代表本组内各样本与该组平均值的离散程度,即水平内部(组内)方差(2)组间变动(betweengroups),代表各组平均值关于总平均值的离散程度。即水平之间(组间)方差即:SS总=SS组间+SS组内2024/1/2960zf消除各组样本数不同的影响--离差平方和除以自由度(即均方差)。从而构造统计量:方差分析的基本思想就是通过组内方差与组间方差的比值构造的F统计量,将其与给定显著性水平、自由度下的F值相对比,判定各组均数间的差异有无统计学意义。零假设否定域:2024/1/2961zf方差分析的应用条件(1)可比性,若资料中各组均数本身不具可比性则不适用方差分析。(2)正态性,各组的观察数据,是从服从正态分布的总体中随机抽取的样本。即偏态分布资料不适用方差分析。对偏态分布的资料应考虑用对数变换、平方根变换、倒数变换、平方根反正弦变换等变量变换方法变为正态或接近正态后再进行方差分析。(3)方差齐性,各组的观察数据,是从具有相同方差的相互独立的总体中抽取得到的。即若组间方差不齐则不适用方差分析。2024/1/2962zf方差分析的类型:依据涉及的分析变量多少分为:一元方差分析、多元方差分析依据对分析变量的影响因素的数量分为:单因素方差分析、多因素方差分析

2024/1/2963zf一元单因素方差分析:分析某一个因素A的不同水平是否对某一个观测变量Y产生了显著影响。一元多因素方差分析:分析某两个或多个因素的不同水平是否对某一个观测变量Y产生了显著影响。一元方差分析2024/1/2964zf例1:某饮料生产企业研制出一种新型饮料.饮料的颜色共有四种:橘黄色、粉色、绿色和无色透明。这四种饮料的营养含量、味道、价格、包装等可能影响销售量的因素全部相同。现从地理位置相似、经营规模相仿的五家超市上收集了该种饮料的销售情况。一元单因素方差分析2024/1/2965zf问题:饮料的颜色是否对销售量产生影响?2024/1/2966zf其中:饮料的颜色即是影响因素(控制因素、变量)销售量是观测变量。在其他条件相同的情况下,上述问题就归结为一个检验问题,即:2024/1/2967zf差异的产生来自两个方面:

一方面是由不同颜色的差异造成的,既不同的饮料颜色对销售量产生了影响。用‘组间方差’表示另一方面是由于抽选样本的随机性而产生的差异,即各颜色内的随机误差,如相同颜色的饮料在不同的商场销售量也不同。用‘组内方差’表示。一元单因素方差分析Spss选项:

Analyze—CompareMean—One-WayANOVA2024/1/2968zfSPSS输出结果:可看出F值为10.486,P值是0.000。推断零假设不成立。表明颜色不同饮料的销量也不同。2024/1/2969zf如何用SPSS对方差分析的‘方差相等’要求进行判定?(因正态分布的要求不是很严格,分析忽略)Spss选项:在One-WayANOVA中选择Option,选定Homogeneity-of–variance2024/1/2970zf进一步考察:究竟是哪一个水平对观察变量产生了显著影响,即那种颜色的饮料对销售量有显著影响?运用单因素方差分析的多重比较检验SPSS窗口中PostHoc选项进行选择。

2024/1/2971zf2024/1/2972zf例2:为了迎合消费者的需求,某音像公司拟推出一张新的DVD专辑.市场营销部分收集不同年龄的消费者群体对新的DVD专辑的评价等相关数据信息。(见数据文件

dvdplayer.sav

从该数据文件我们想知道:

是否不同消费者群体对DVD的评价不一样呢?32-38岁与39-45岁两个年龄段的消费者全体对DVD的评价是否一样呢?32岁以下与45岁以上的消费者群体对DVD的评价是否一样呢?

2024/1/2973zfSPSS的处理过程:(1)一元单因素方差分析的菜单选择:

Analyze—CompareMean—One-WayANOVA

弹出One-wayANOVA对话框2024/1/2974zf选择TotalDVDassessment

作为因变量.选择

AgeGroup

作为影响因素.点击‘Options’按钮.

多重比较检验:两两比较看哪些水平之间存在均值差异.

先验比较检验:事先设定因变量在因素的不同不平下是否有差异.

描述性统计量、均值图、缺失值的处理观测变量(因变量)输入框影响因素(自变量)输入框弹出Option对话框2024/1/2975zf统计量选择描述性统计.如:均值、方差等固定效应、随机效应模型的标准差、标准误、置信区间等方差同质性(相等)检验

当F检验方差相等不成立时,用Brown-Forsythe统计量或Welch统计量检验组间均值是否相等,比F检验更可取。组均值示意图缺失值处理

选择Meansplot.

点击Continue.

点击一元单因素对话框中的‘PostHoc’.均值示意图可直观看出组间均值差异Caseswithmissingvaluesareexcludedfromallanalyses.Acasewithamissingvalueforagivenanalysisisnotusedinthatanalysis.

弹出双重比较检验对话框2024/1/2976zf假设组间方差相等时的多重比较检验假设组间方差不等时的多重比较检验确定显著性水平选择方差不等时的‘Tamhane'sT2’.

点击Continue.

点击一元单因素方差分析中的‘Contrasts’按钮.

弹出Contrasts对话框2024/1/2977zf第1组系数赋值为0,点击

Add.

第二组系数赋值为0,点击Add.紧接着,给第3和第4组系数赋值,要使两系数和为0.给第3组赋值-1

,点击Add.给第4组系数赋值为1.

给第5和第6组赋值为0.点击Next进入下一组先验对比检验.

首先,比较第3和第4个年龄段的消费者群体;其他年龄段的忽略不考虑,赋值为0.零假设为:两组无差异2024/1/2978zf

其次,对第1、2两个年龄段的消费者与第5、6两个年龄段的消费者进行先验对比。第3和4两个年龄段的消费者不考虑。

给第1组赋值.5,点击Add.

给第2组赋值.5,点击Add.

分别给第3和第4组赋值为0,点击Add.

分别给第5和第6组赋值-.5,点击Add.点击Continue.点击一元单因素对话框中的OK,输出分析结果output.

2024/1/2979zf(2)结果分析:方差齐性(相等)检验

从上表可看出:各总体方差相等的零假设成立。因为统计量Levenestatistic为0.574,该统计量实现的可能性sig.值为0.720,说明零假设发生可能性是很大的,我们没有充分的理由拒绝它,由此接受零假设。2024/1/2980zf差异表现如何,究竟来自哪儿?由此表可看出,对DVD的评价的差异主要来自不同年龄的消费者群体的组间差异,因为F

统计量为4.601;同时依据sig值0.001,也可说明我们最初的零假设‘不同年龄群体对DVD的评价无差异’发生的可能性为0.001,我们没有充分理由接受它.方差分析表2024/1/2981zf组均值示意图

该图给我们较为直观的印象:32-45岁的消费者对DVD的评价高于其他消费者群体.

若要作更细致和精确的分析,可通过一元方差分析中的‘先验比较’和‘多重比较’来完成。

2024/1/2982zf对比系数表

检验32-38和39-45两个群体对DVD的评价是否有差异,零假设认为:二者无差异。其他年龄段的消费者群体忽略不考虑,所以分别赋值为0;而32-38和39-45两个群体分别赋值-1和1类似地,若想对比32岁以下和45岁以上的消费者群体对DVD的评价是否有差异,零假设认为二者无差异,所以,分别给18-24、25-31赋值为.5,分别给46-52、53-59赋值为-.5,其他群体不考虑赋值为0。Thesignificancevaluesforthetestsofthefirstcontrastarebothlargerthan0.10.Thisindicatesthattheage39-45groupisnotsignificantlymorefavorabletowardtheDVDplayerthantheage32-38group.

Likewise,thesignificancevaluesforthetestsofthesecondcontrastarelargerthan0.10.Participantsunder32andover45havestatisticallyequivalentassessmentscores.

假设方差不等时的检验结果假设方差相等时的检验结果2024/1/2983zfPostHocTests双重假设检验2024/1/2984zf一元多因素方差分析基本思想:研究两个或两个以上因素(控制变量)是否对某个观测变量产生显著性影响。如:饮料销售,除了关心饮料颜色之外,还想了解销售地区、销售策略是否影响销售量?若把饮料的颜色看作影响销售量的因素A,饮料的销售地区看作影响因素B,销售策略看作影响因素C。对因素A和因素B同时进行分析,就属于双因素方差分析。对因素A、B以及C(或更多因素)同时进行分析,就属多因素方差分析。2024/1/2985zf双(多)因素方差分析是对影响因素进行检验,究竟是一个因素在起作用,还是两个(多个)因素都起作用,或是两个(多个)因素的影响都不显著。

2024/1/2986zf双(多)因素方差分析有两种类型:1、无交互作用的双(多)因素方差分析,它假定因素A和因素B的效应是相互独立的,不存在相互关系;2、有交互作用的双(多)因素方差分析,它假定因素A和因素B的结合会产生出一种新的效应(相互影响)。例如,若假定不同地区的消费者对某种颜色有与其他地区消费者不同的特殊偏爱,这就是两个因素结合后产生的新效应,属于有交互作用的背景;否则,就是无交互作用的背景。

2024/1/2987zf以双因素为例:2024/1/2988zf2024/1/2989zf2024/1/2990zfFA=MSA/MSE

FB=MSB/MSE

2024/1/2991zf例1:某商品有五种不同的包装方式(因素A),在三个不同地区销售(因素B),现从每个地区随机抽取一个规模相同的超级市场,得到该商品不同包装的销售资料如下表。

表4某种商品不同地区不同包装的销售资料

检验包装方式和销售地区对该商品销售是否有显著性影响?(α=0.05)

2024/1/2992zf(1)建立假设对因素A:对因素B:2024/1/2993zf(2)计算统计量因素A的列均值分别为:因素B的行均值分别为:总均值=15.04SST=(20-15.04)2+…+(10-15.04)2=880.96

SSA=3(21.6-15.04)2+…+3(11.6-15.04)2=335.36

SSB=5(15.2-15.04)2+…+5(16.8-15.04)2=199.36SSE=880.96-335.36-199.36=346.24

2024/1/2994zf(3)统计决策对于因素A,因为FA=1.903<F-crit=3.006917;故接受H0

,说明不同的包装方式在该商品的销售上没有显著的差异。对于因素B,因为FB=2.303>F-crit;故拒绝H0,接受H1,说明不同的地区对该商品的销售产生不同的影响。

2024/1/2995zfSPSS处理(一元多因素方差分析):Analyze—GeneralLinearModel—Univariate(1)无交互效应(2)有交互效应2024/1/2996zf例2:某杂货店对其消费者的购买习惯作了一项问卷调查。重要想关注:不同性别、不同的购买习惯是否会影响到其在一个月内的消费金额。(数据见:grocery_1month.sav)因变量dependentvariable:Amountspent自变量Independentvariables:gendershoppingstyle一元双因素问题2024/1/2997zf(1)建立假设:对于因素:gender

零假设H0:

备择假设H1:对于因素:shoppingstyle

零假设H0:

备择假设H1:交互影响因素:

零假设H0:

备择假设H1:2024/1/2998zf(2)一元多因素的SPSS处理过程:

菜单选择:Analyze—GeneralLinearModel—Univariate弹出univariate对话框2024/1/2999zf因变量选择固定因素随机因素(协方差分析时)协变量选择(协方差分析时)权数变量选择模型选择按钮实现先验对比检验和趋势检验图形分析双重比较检验将分析结果以变量的形式存入SPSS数据编辑窗口中置信水平和描述性统计等选择

Amountspentas作为因变量.

选择

GenderandShoppingstyle

进入固定因素框.

点击‘Model’按钮.

2024/1/29100zfGenderShoppingstyleGenderShoppingstyle饱和模型(考虑交互效应gender*Shoppingstyle)非饱和模型(不考虑交互效应,系统默认模型)若选择非饱和模型,则点击custom.点击作图‘

Plots’进入形象分析对话框.2024/1/29101zf选择style作为横坐标变量.

选择gender

作为纵坐标变量.点击‘

Add’按钮.点击‘Continue.’按钮再点击‘

PostHoc’按钮进入双重比较对话框.形象分析:用图形直观分析控制变量间是否存在交互作用2024/1/29102zf假设方差相等双重假设检验假设方差不等选择

style

作为双重比较检验的因素.

选择方差相等中的Tukey

统计量选项.

选择方差不等中的Tamhane'sT2

统计量选项.

点击Continue.

再点击Options.2024/1/29103zf选择gender*style

显示其均值情况.选择Descriptivestatistics,Homogeneitytests,Estimatesofeffectsize,andSpreadvs.levelplot

等选项.点击Continue.点击Ok.(3)theresultsanalysis(结果分析,略)2024/1/29104zf多元单因素方差分析:分析某一个因素的不同水平是否对某个观测向量Y产生了显著影响多元多因素方差分析:分析某两个或多个因素的不同水平是否对某个观测向量Y产生了显著影响多元方差分析2024/1/29105zf例1:考察汉族、藏族、蒙古族三个民族的人均收入水平INC、15岁及以上人口上学或毕业比例EDU是否有差异。(多元单因素分析问题)需考察的影响因素为:民族观测变量为:INC和EDU

SPSS处理:Analyze—GeneralLinearModel—Multivariate多元单因素分析2024/1/29106zf人均收入、教育比例→DependentVariables民族→FixedFactors结果:三个民族的人均收入、受教育比例有显著差异。2024/1/29107zf例2:

调查某中学同年级22名男女生,测量其身高(cm)、体重(kg)和胸围(cm),数据见表。试检验该中学全体男女生的身体发育状况有无差别。2024/1/29108zf某中学22名男、女生身体测量资料─────────────────────────────

男生女生───────────────────编号身高体重胸围编号身高体重胸围─────────────────────────117158.581.0115244.87421756587215346.580315938713

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论