考研学习笔记 《统计学》(第6版)笔记和课后习题(含考研真题)详解-184-365_第1页
考研学习笔记 《统计学》(第6版)笔记和课后习题(含考研真题)详解-184-365_第2页
考研学习笔记 《统计学》(第6版)笔记和课后习题(含考研真题)详解-184-365_第3页
考研学习笔记 《统计学》(第6版)笔记和课后习题(含考研真题)详解-184-365_第4页
考研学习笔记 《统计学》(第6版)笔记和课后习题(含考研真题)详解-184-365_第5页
已阅读5页,还剩354页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

3.在假设检验中,原假设和备择假设()。A.都有可能成立B.都有可能不成立C.只有一个成立而且必有一个成立D.原假设一定成立,备择假设不一定成立【答案】C查看答案【解析】原假设和备择假设是对立的,二者只有一个成立且4.某工厂在生产过程的产品检验中,假设H₀:产品是合格的,显著水平为0.05,工厂经理问什么是显著性水平?下列说法正确的是()。A.若产品是合格的,则有5%的概率检验为不合格B.若产品是不合格的,则有5%的概率检验为合格C.在该检验中,有95%的检验结论是正确的,错误结论的可能性为5%D.假设这批产品有95%是合格的,不合格的概率为5%【答案】C查看答案【解析】通常把C称为显著性水平,在假设检验中,它的含义是当原假设正确时却被拒绝5.在假设检验中,原假设为H₀,备择假设为H₁,则称()为犯第二类错误。A.H₀为真,接受H₁B.H₀为真,拒绝H₁C.H₀不真,接受H₀D.H₀不真,拒绝H₀【答案】C查看答案6.若用90%的置信水平对总体均值进行大样本双侧区间估计,则Z值为().【答案】D查看答案【解析】若用90%的置信水平对总体均值进行大样本双侧区间估计,则Z值为7.将由显著性水平所规定的拒绝域平分为两部分,置于概率分布的两边,每边占显著性水平的1/2,这是()。A.单侧检验B.双侧检验C.右单侧检验D.左单侧检验【答案】B查看答案边占显著性水平的1/2;单侧检验将显著水平规定的拒绝域置于概率分布的左侧或者右侧,8.若假设检验H₀:新工艺不比旧工艺好,H₁:新工艺好于旧工艺,则下列属于犯第二类的A.新工艺较好,采用新工艺B.新工艺较好,保留旧工艺C.新工艺不好,采用新工艺D.新工艺不好,保留旧工艺【答案】B查看答案【解析】当原假设H₀为假时,却被接受了,犯了第二类错误,即取伪的错误。B项,新工艺好的条件下(即H₀为假),却保留旧工艺(即接受了H₀),是犯了第二类错误。9.比较两个总体均值是否相同的假设检验中,采用t检验的条件是()。A.两总体为正态分布,方差已知B.两总体为正态分布,方差未知C.两总体非正态分布,方差已知D.两总体非正态分布,方差未知【答案】B查看答案【解析】两总体为正态分布,方差已知采用z检验;两总体为正态分布,方差未知采用t检服从正态分布且方差已知或两个均为大样本时11.P值越小,()。A.拒绝原假设的可能性越小B.拒绝原假设的可能性越大C.拒绝备择假设的可能性越大D.不拒绝备择假设的可能性越小【答案】B查看答案【解析】P值就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果P12.在单侧检验中,给定显著性水平C和P值,可以拒绝原假设的是()。【答案】B查看答案【解析】P值就是当原假设为真时所得到的样本观察结果或更极端结13.在小样本情况下,当总体方差未知时,检验总体均值所使用的统计量是()。B.C.14.从方差未知的正态总体中随机抽取容量为n的一个小样本,在显著性水平为C的条件下,检验的假设为H₀:,H₁:==,则拒绝域为()。D.【解析】当双侧检验时,由显著水平为C,可知拒绝域的临界值为三。方差未知的小样本情况下,使用检验统计量,拒绝域为,即15.检验一个正态总体的方差时所使用的分布为()。A.正态分布C.x²分布D.F分布【答案】C查看答案16.随机抽取一个n=100的样本,计算得到X=60,s=15,要检验假设Ho:μ=65,H₁:μ≠65,检验的统计量的值为()。【答案】A查看答案17.若检验的假设为H₀:μ≥μo,H₁:μ<μo,则拒绝域为()。【解析】检验问题为左单侧检验,在正态总体方差已知或大样本情形下,显著性水平C下的拒绝域为18.设=为检验统计量的计算值,检验的假设为Ho:=,H₁,当【答案】A查看答案19.由49个观测数据组成的随机样本得到的计算结果为x²=68。取显著性水平α=0.01,检验假设H₀:H≥1.18,H₁:H<1.18,得到的检验结论是()。A.拒绝原假设B.不拒绝原假设C.可以拒绝也可以不拒绝原假设D.可能拒绝也可能不拒绝原假设【答案】B查看答案【解析】检验统计量为,代入数据计算得z=设。,所以在显著性水平C=0.01下,不能拒绝原假20.从一个二项总体中随机抽出一个n=135的样本,得到p=0.63,在C=0.01的显著性水平下,检验假设H₀:T=0.63,H₁:π≠0.63,所得的结论是()。A.拒绝原假设B.接受原假设C.可以拒绝也可以接受原假设D.可能拒绝也可能接受原假设【答案】B查看答案【解析】p=0.63;;由于-=<z<=,所以接受原假设。21.从正态总体中随机抽取一个n=35的随机样本,计算得到X=20,F=18,假定=20,要检验假设H₀:,则检验统计量的值为()。D.x²=34【答案】C查看答案【解析】检验统计量的值为:22.从正态总体中随机抽取一个n=10的随机样本,计算得到X=31.7,s=7,假定在α=0.05的显著性水平下,检验假设H₀:=≥50,H₀:<50,得到的结论是()。C.可以拒绝也可以接受H₀D.可能拒绝也可能接受H₀【答案】B查看答案由于,所以在显著性在α=0.05的水平下,接受Ho。23.随机抽取一个n=40的样本,得到X=6.5,s=7。在C=0.02的显著性水平下,检验假设Ho:μ≤5,H₁:μ>5,统计量的临界值为()。B.z=2.05D.z=-1.9624.检验假设Ho:μ≤50,H₁:μ>50,随机抽取一个n=16的样本,得到的统计量的值为t=2.5,在α=0.05的显著性水平下,得到的结论是()。C.可以拒绝也可以接受H₀D.可能拒绝也可能接受H₀【解析】这是右侧检验,方差未知并且n=16为小样本,拒绝域是:====1.7531,因为t==,所以在0.05的假设水平下,拒绝H₀。25.从某个城市中随机抽取15个家庭组成一个随机样本,得到样本均值为84.50,标准差为C.可以拒绝也可以接受H₀D.可能拒绝也可能接受H₀或者。代入数据计算得,=2.1448,所以,即在显著性水平C=0.05下,不能拒绝H₀。26.检验假设H₀:π=0.3,H₁:π≠0.3,由n=100组成的一个随机样本,得到样本比例为p=0.295。用于检验的P值为0.2,在α=0.05的显著性水平下,得到的结论是()。B.不拒绝H₀C.可以拒绝也可以不拒绝H₀D.可能拒绝也可能不拒绝H₀【答案】B查看答案【解析】因为检验P值大于显著性水平C=0.05,所以在显著性水平C=0.05下,不能拒绝27.检验两个总体的方差比时所使用的分布为()。A.正态分布B.t分布C.x²分布D.F分布28.从均值为μ和μ2的两个总体中,随机抽取两个大样本,在C=0.05的显著性水平下,要检验假设H₀:μ1-μ2=0,H₁:μ1-μ2≠0,则拒绝域为()。【答案】A查看答案【解析】因为是大样本总体均值差检验,所以应该采用z检验统计量。拒绝域为【答案】A查看答案【解析】30.一项研究表明,男人和女人对产品质量的评估角度有所不同。在对某一产品的质量评估中,被调查的500个女人中有58%对该产品的评分等级是“高”,而被调查的500个男人中给同样评分的却只有43%。要检验对该产品的质量评估中,女人评高分的比例是否超过男人B.不拒绝H₀C.可以拒绝也可以不拒绝H₀D.可能拒绝也可能不拒绝H₀因为=2.33,所以在显著性水平a=0.01下,拒绝Ho。31.来自总体1的一个容量为16的样本的方差=6,来自总体2的一个容量为20的样本的方差==3。在C=0.05的显著性水平下,检验假设H₀:E≤E,H:E>E,得到的结论是()。C.可以拒绝也可以接受H₀D.可能拒绝也可能接受H₀【答案】B查看答案,所以在显著性水平C=0.05下,接受H₀。1.下列属于假设检验基本思想的有()。A.先对总体的参数或分布函数的表达式做出某种假设,然后找出一个在假设成立条件下出现可能性甚小的(条件)小概率事件B.如果试验或抽样的结果使该小概率事件出现了,这与小概率原理相违背,表明原来的假C.若该小概率事件在一次试验或抽样中并未出现,就没有理由否定这个假设,表明试验或抽样结果支持这个假设,这时称假设也实验结果是相容的,或者说D.如果试验或抽样的结果使该小概率事件出现了,则不能否认这个假设E.若该小概率事件在一次试验或抽样中并未出现,则否定这个假设【答案】ABC查看答案2.在假设检验中,当我们作出拒绝原假设而接受备择假设的结论时,表示()。A.有充足的理由否定原假设B.原假设必定是错误的C.犯错误的概率不大于CD.犯错误的概率不大于βE.在H₀为真的假设下发生了小概率【答案】ACE查看答案犯错误的概率不超过C;换言之,就是在H₀为真的假设下发生了小概率事件。3.关于假设检验中两类错误的说法正确的有()。A.如果拒绝的是真的Ho,就可能犯弃真(第一类)错误,一般犯弃真错误的概率记为CB.如果接受的是不真的Ho,就可能会犯取伪(第二类)错误,一般犯取伪错误的概率记为βC.在样本容量n固定的条件下,要使C,β同时减小是可能的D.在样本容量n固定的条件下,当C增大时,β将随之减小;当CE.增大样本容量可以使C,β同时减小【答案】ABDE查看答案【解析】第I类错误是原假设H0为真却被拒绝了,犯这种错误的概率称为弃真错误;第Ⅱ类错误是原假设为伪却没有拒绝,犯这种错误的概率称为取伪错误。对于一定的样本量n,4.下面关于单侧和双侧假设检验的说法正确的有()。A.在显著性α水平下,检验假设Ho:μ=Ho;H₁:μ≠μo的假设检验,称为双侧假设检验B.右侧检验和左侧检验统称为单侧检验C.在显著性α水平下,检验假设Ho:μ≥Ho;H₁:μ<μo的假设检验,称为左侧检验D.在显著性α水平下,检验假设Ho:μ≥Ho;H₁:μ<μo的假设检验,称为右侧检验E.在显著性α水平下,检验假设H₀:μ≤μo;H₁:μ>μo的假设检验,称为右侧检验【答案】ABCE查看答案【解析】假设检验:①双侧检验:Ho:μ=Ho;H₁:μ≠μo;②单侧检验:右侧检验Ho:μ≤po,H₁:μ>Ho;左侧检验Ho:μ≥μo,H₁:μ<μo。5.在实际应用中,原假设的确定一般应遵循的原则有()。C.要把等号放在备择假设里D.要所答是所问,不要所答非所问【答案】ABDE查看答案【解析】在实际应用中,等号一般放在原假设里。6.为了考察某种类型的电子元件的使用寿命情况,假定该电子元件使用寿命的分布是正态分布。而且根据历史记录得知该分布的参数为:平均使用寿命=为100小时,标准差T为10小时。现在随机抽取100个该类型的电子元件,测得平均寿命为102小时,给定显著性A.提出假设Ho:μ≤100;H₁:μ>100B.提出假设H₀:μ≥100;H₁:μ<100C.检验统计量及所服从的概率分布为D.如果则称不与μo的差异是显著的,这时拒绝E.检验结果认为该类型的电子元件的使用寿命确实有显著提高【答案】ACDE查看答案③求出拒绝域:因为Za=Z0.05=1.645,所以拒绝域为:[1.645,+0];④作出统计判断:因为Z>Za=1.645,所以拒绝H₀,接受H₁,即当显著性水平等于0.05时,7.某种电子元件的重量x(单位:g)服从正态分布,μ,o²均未知。测得16只元件的重量分别为:159,280,101,212,224,379,179,264,222,362,168,250,149,260,485,170,判断元件的平均重量是否大于225g(取α=0.05)。下列计算过程中正确的提法有()。A.提出假设:Ho:μ≤225,H:μ>225B.提出假设:Ho:μ≥225,H₁:μ<225C.检验统计量及其概率分布为D.取α=0.05,经计算有:t<to.o₅(15)E.接受Ho,即认为元件的平均重量不大于225g【答案】ACDE查看答案【解析】由题意知n=16,,X=241.5,s=98.7259。这属于总体②计算统计量③求出拒绝域:因为ta(n-1)=6ns(15)=1.7531所以拒绝域为:(1.7531,+o);④作出统计判断:因为t=0.6685<1.7531,所以,当显著性水平为0.05时,接受H₀,即认为该种电子元件的平均重量不大于225g。8.关于假设检验,下列说法正确的有()。A.若P=1.1%=结论是统计显著,但不是高度显著B.一个检验的P值是H₀为真的概率C.若C=0.05时,一个统计结果是显著的,则它有5%的机会应归因于偶然性,95%的机D.在其他情况都相等,P=98%是比P=2%对原假设更加有力的支持E.P>C,则接受Ho计算出检验统计量超过或者小于(还要依照分布的不同、单侧检验、双侧检验的差异而定)设,它们均只有5%或更小。9.下列关于假设检验的陈述正确的有()。A.假设检验实质上是对原假设进行检验B.假设检验实质上是对备择假设进行检验C.当拒绝原假设时,只能认为肯定它的根据尚不充分,而不是认为它绝对错误D.假设检验并不是根据样本结果简单地或直接地判断原假设和备择假设哪一个更有可能正确E.当接受原假设时,只能认为否定它的根据尚不充分,而不是认为它绝对正确1.如果一个假设检验问题只是提出一个原假设,而且检验的目的仅在于判断原假设是否成立,那么这个检验问题称为显著性检验。()3.一项研究表明,司机驾车时因接打手机而发生事故的比例超过20%,用来检验这一结论的原假设和备择假设为H₀:π<20%;H₁:T≥20%。(4.设样本是来自正态总体N(μ,o²),其中o²未知,那么检验假设Ho:μ=μo时,用的是Z检验。()【解析】总体均值的假设检验中,①对于正态总体且o²已知,利用Z检验;②对于正态总体且o²未知,利用t检验;③对于非正态总体且为大样本,利用Z检验。5.检验一个正态总体的方差时所使用的分布为正态分布或者t分布。()【解析】检验一个正态总体的方差时所使用的分布为x²分布。1.某商场从一批袋装食品中随机抽取10袋,测得每袋重量(单位:克)分别为789,780,794,762,802,813,770,785,810,806,假设重量服从正态分布,要求在5%的显著性水平下,检验这批食品平均每袋重量是否为800克。(2)由于σ²未知,故选择检验统计量为:(3)由α=0.05,查t分布表得临界值:拒绝域为:(-0,—ta/2)=[ta/2,+o),即(-,-2.2622][2.2622,+);(4)计算统计量观测值t:因为|t|=1.642<2.2622,所以当C=0.05时,不能拒绝H₀,即在5%的显著性水平下,这批食品平均每袋重量是800克。2.某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克。现从某天生产的一批产品中按重复抽样随机抽取50包进行检查,测得每包重量,如表8-3所示。表8-3袋装食品的重量分组表每包重量(克)包数102102~104104~106合计7450(1)确定该种食品平均重量的95%的置信区间。(2)采用假设检验方法检验该批食品的重量是否符合标准要求(α=0.05,写出检验的具体步骤)。样本标准差为:由于是大样本,所以食品平均重量95%的置信区间为:即(100.867,101.773)。(2)提出假设:Ho:μ=100,H₁:μ≠100。检验的统计量的值为:由于z=5.712>Z₀.05/2=1.96,所以拒绝原假设,即该批食品的重量不符合标准要求。3.某市全部职工中,平常订阅某种报纸的占40%,最近从订阅率来看似乎出现降低的现象,随机抽200户职工家庭进行调查,有76户职工订阅该报纸,问报纸的订阅率是否显著降低解:假设检验为Ho:π≥40%,H₁:π<40%。计算统计量值为:由于Z=-0.577>-1.645,所以接受原假设,即报纸的订阅率没有显著降低。4.两种化学溶液,其浓度服从正态分布,经验说明两种溶液浓度的标准差分别为0.4和0.6。对两种化学溶液进行随机抽样,分别抽取10个和15个样本,若样本标准差分别为0.7和0.5,试分别在0.01和0.05的显著性水平下检验两种溶液浓度的方差是否相同。解:依题意有:n₁=10,n₂=15,si=0.7,s₂=0.5。(1)建立假设:Ho:≥=,H₁:(2)检验统计量:(3)临界值:C=0.01,Fo.o₁(9,14)=4.0297;在C=0.05,Fo.05(9,14)=2.646。(4)样本统计量的计算及判断:由于F=1.96<Fo.o₁(9,14)=4.0297;F=1.96<Fo.05(9,14)=2.646,所以无论在C=0.01或C=0.05,都不能拒绝原假设,即两种溶液浓度的方差相同。9.1复习笔记一、分类数据与x²统计量1.分类数据统计数据的类型有分类数据、顺序数据和数值型数据。分类数据和顺序数据的共同特征是,调查结果虽然是用数值表现的,但不同数值描述了调查对象的不同特征;数值型数据可以转化为分类数据。2.x²统计量x²统计量可以对分类数据拟合优度检验和独立性检验,可以用于测定两个分类变量之间的相关程度。若用仁表示观察值频数,用=表示期望值频数,则x²统计量可以写为:x²检验:是运用x²的计算结果与x²分布中的临界值进行比较,作出对原假设的统计决策。(1)x²统计量的特征①x²≥0,因为它是对平方值结果的汇总。②x²统计量的分布与自由度有关。③x²统计量描述了观察值与期望值的接近程度。两者越接近,即-三的绝对值越小,计算出的x²值越小;反之,-F的绝对值越大,计算出的x²值也越大。(2)x²分布与自由度的密切关系自由度越小,x²的分布就越向左边倾斜;随着自由度的增加,x²分布的偏斜程度趋于缓解,逐渐显露出对称性,随着自由度的继续增大,x²分布将趋近于对称的正态分布。二、拟合优度检验拟合优度检验(goodnessoffittest)是用x²统计量进行统计显著性检验的重要内容之一。它是依据总体分布状况,计算出分类变量中各类别的期望频数,与分布的观察频数进行对比,判断期望频数与观察频数是否有显著差异,从而达到对分类变量进行分析的目的。三、列联分析:独立性检验对于两个分类变量的分析,称为独立性检验,分析过程可以通过列联表的方式呈现,故又可称为列联分析。1.列联表列联表(contingencytable)是由两个以上的变量进行交叉分类的频数分布表。表中的行(row)是态度变量,表中的列(column)是单位变量。将横向变量(行)的划分类别视为R,纵向变量(列)的划分类别视为C,则可以把每一个具体的列联表称为R×C列联表。2.独立性检验独立性检验就是分析列联表中行变量和列变量是否相互独立。也就是检验行变量与列变量之间是否存在依赖关系。四、列联表中的相关测量对两个变量之间相关程度的测定,主要用相关系数表示;列联表中的变量通常是类别变量,它们所表现的是研究对象的不同品质类别,所以,把这种分类数据之间的相关称为品质相关。经常用到的品质相关系数有:φ相关系数、列联相关系数、V相关系数。1.φ相关系数φ相关系数是描述2×2列联表数据相关程度最常用的一种相关系数,其计算公式为:φ系数适合2×2列联表,这是因为对于2×2列联表中的数据,计算出的φ系数可以控制在0~1这个范围。当φ=0,表明两变量相互独立;当Iφl=1,表明两变量完全相关。注意:当列联表R×C中的行数R或列数C大于2时,φ系数将随着R或C的变大而增大,且φ值没有上限。这时用φ系数测定两个变量的相关程度就不够清晰,可以采用列联相关2.列联相关系数列联相关系数又称列联系数,简称c系数,主要用于大于2×2列联表的情况,其计算公式为:当列联表中的两个变量相互独立时,系数c=0,但它不可能大于1。c系数的特点:其可能的最大值依赖于列联表的行数和列数,且随着R和C的增大而增大。列联系数的局限:根据不同的行和列计算的列联系数不便于比较,除非两个列联表中行数和列数一致。3.V相关系数V系数的计算公式为:当两个变量相互独立时,V=0;当两个变量完全相关时,V=1,所以V的取值在0~1之间。如果列联表中有一维为2,即min[(R-1),(C-1)]=1,则V值就等于φ值。注意:对于同一个数据,系数F,,的结果不同。同样,对于不同的列联表,行数和列数的差异也会影响系数值。因此,在对不同列联表变量之间的相关程度进行比较时,不同列联表中行与行、列与列的个数要相同,并且采用同一种系数,这样的系数值才具有可比性。4.数值分析对于同一个数据,系数φ,c,V的结果不同。同样,对于不同的列联表,行数和列数的差异也会影响系数值。因此,在对不同列联表变量之间的相关程度进行比较时,不同列联表中行与行、列与列的个数要相同,并且采用同一种系数,这样的系数值才具有可比性。五、列联分析中应注意的问题1.条件百分表的方向一般说来,在列联表中变量的位置是任意的,即既可以把变量X放在列的位置,也可以放在行的位置。①如果变量X与Y存在因果关系,令X为自变量(原因),Y为因变量(结果),那么一般的做法是把自变量X放在列的位置,条件百分表也多按自变量的方向计算,这样便于更好地表现原因对结果的影响。②如果因变量在样本内的分布不能代表其在总体内的分布,例如,为了满足分析的需要,抽样时扩大了因变量某项内容的样本量,这时仍以自变量的方向计算百分表就会歪曲实际情况。在这种情况下,可以把计算百分表的方向变换一下,改为按因变量方向计算。次品类型根据抽查检验的数据表明:次品类型与厂家(即哪一个厂)生产是无关的(即是相互独立的)。建立假设:H₀:次品类型与厂家生产是独立的,H₁:次品类型与厂家生产不是独立的。可以计算各组的期望值,如表9-3所示(表中括号内的数值为期望值)。表9-3各组的期望值计算表生产厂生产厂AB次品类型而自由度等于(R-1)(C-1)=(3-1)×(3-1)=4,总计C若以0.01的显著性水平进行检验,查x²分布表得=。由于,故接受原假设Ho,即次品类型与厂家生产是独立的。3.说明计算x²统计量的步骤。答:计算x²统计量的步骤:(1)用观察值三减去期望值Je;(3)将平方结果除以;(4)将步骤(3)的结果加总,即得:答:(1)相关系数是描述2×2列联表数据相关程度最常用的一种相关系数。它的计算公式为:],式中,;n为列联表中的总频数,也即样本量。说系数适合2×2列联表,是因为对于2×2列联表中的数据,计算出的系数可以控制在0~1这个范围。(2)列联相关系数又称列联系数,简称c系数,主要用于大于2×2列联表的情况。c系数的计算公式为:当列联表中的两个变量相互独立时,系数c=0,但它不可能大于1。c系数的特点是,其可能的最大值依赖于列联表的行数和列数,且随着R和C的增大而增大。(3)克莱默提出了V系数。V系数的计算公式为:当两个变量相互独立时,V=0;当两个变量完全相关时,V=1。所以V的取值在0~1之间。如果列联表中有一维为2,5.构造下列维数的列联表,并给出x²检验的自由度。答:i行年列联表,如表9-4所示。甲厂甲厂乙丙乙丙总计项目态度1态度2单位1单位2…单位j而一=检验的自由度=(行数-1)(列数-1),所以a.当i=2,j=5时,表9-4即为2行5列的列联表,其三检验的自由度=(2-1)×(5-1)=4;b.当i=4,j=6时,表9-4即为4行6列的列联表,其检验的自由度=(4-1)×(6-1)=15;c.当i=3,j=4时,表9-4即为3行4列的列联表,其=检验的自由度=(3-1)×(4-1)=6。二、练习题1.欲研究不同收入群体对某种特定商品是否有相同的购买习惯,市场研究人员调查了四个不同收入组的消费者共527人,购买习惯分为:经常购买,不购买,有时购买。调查结果如表9-4所示。表9-4调查结果项目经常购买低收入偏低收入偏高收入高收入(1)提出假设;(2)计算x²值;(3)以α=0.1的显著性解:(1)提出假设:H₀:(即不同收入不完全相等(即不同收入群体对某种特定商品的购买习惯不完全相同)。(2)计算得各组的期望值,如表9-5所示(表中括号内的数值为期望值)。表9-5各组的期望值计算表偏低收入偏高收入项目低收入组高收入组总计买88(3)调查结果是3行4列的列联表,其自由度=(3-1)×算出的x²值为17.67>10.64=,故拒绝原假设,即不同收入群体对某种特定商品的购买习惯不完全相同。2.从总体中随机抽取了n=200的样本,调查后按不同属性依据经验数据,各类别在总体中的比例分别为:以C=0.1的显著性水平进行检验,说明现在的情况与经验数据相比是否发生了变化(用F值)。解:提出假设:Ho:现在情况与经验数据相比没有发生变而P[三(5-1)>14]=0.007295<0.1=C,故拒绝原假设。3.某报社关心其读者的阅读习惯是否与其文化程度有关,随机调查了254位读者。得到如表9-6所示的数据。表9-6调查数据阅读习惯大学以上大学和大专高中高中以下早上看中看有空看以0.05的显著性水平检验读者的阅读习惯是否与文化程度解:建立假设:Ho:(即阅读习惯与文化程度无关),H₁:不完全相等(即阅读习惯与文化程度有关)。计算各组的期望值,如表9-7所示(表中括号内的数值为期望值)。阅表9-7高中高中以下合计看12(13.34)16(15.76)8(7.28)8(7.62)65044956晚38(28.80)40(34.04)11(15.71)(16.46)5看21(19.70)2223.29)9(10.75)13(11.26)。表中各项的期望值的计算方法为:此调查数据是4行4列的列联表,其自由度为=(4-1)×(4-1)=9,P[x²(9)>31.86]=0.0002<0.05=C,故拒绝原假设,认为阅读习惯与文化程度有关。4.教学改革后学生有了更多的选课自由,但学院领导在安排课程上也面临新的问题。例如,MBA研究生班的学生选课学年之间的变化常常很大,去年的学生很多人选会计课,而今年的学生很多人选市场营销课。由于事先无法确定究竟有多少学生选各门课程,所以无法有效地进行教学资源的准备。有人提出学生所选课程与其本科所学专业有关。为此,学院领导将学生本科所学专业和MBA三门课程的选修课程情况做了统计,得到如表9-8所示的结果。表9-8选修课程统计结果MBA所选课程专业一专业一专业二专3181316业三其他专业1210105市场营销(1)以0.05的显著性水平检验学生本科所学专业是否影响其读MBA期间所选课程;解:(1)建立假设:Ho:π₁=π₂=π₃=π4(即本科专业与MBA选课无关),H₁:πI,π2,π3,π4不完全相等(即本科专业与MBA选课有关)。计算各组的期望值,如表9-9所示(表中括号内的数值为期望值)。业MBA所选课程31(24.08)813(17.37)1(12.44)12(8.97)10此选修课程统计结果是4行3列的列联表,其自由度为=(4-1)×(3-1)=6,当C=0.05时,G==12.592,,x²值14.87>12.592=oos(6),所以拒绝原假设。(2)由第(1)题计算结果可得:P[x²(6)>14.87]=0.021<0.05=C,故拒绝原假设,认为本科专业与MBA选课有关。解:由习题1中计算结果可得:1.列联分析是利用列联表来研究()。2.设列联表的行数为3,列数为4,则x²检验的自由度为()。3.列联表中的每个变量()。4.一所大学准备采取一项学生对餐厅改革的调查,为了解男女学生对这一措施的看法,分别抽取了300名男学生和240名女学生进行调查,得到的结果如表9-10所示。表9-10关于餐厅改革的调查结果这个表格是()。A.4×3列联表B.3×2列联表C.2×3列联表D.3×4列联表【答案】B查看答案【解析】表中的行是态度变量,这里划分为三类,即赞成,中立和反对;表中的列是单位变量,这里划分为两类,即男同学和女同学,即3×2列联表。5.一所大学为了解男女学生对后勤服务质量的评价,分别抽取了300名男学生和240名女学生进行调查,得到的结果如表9-11所示。表9-11关于后勤服务质量评价的调查结果满满男同学女同学这个列联表的最下边一行称为()。B.条件频数C.行边缘频数D.列边缘频数【答案】D查看答案6.某中学为了解教师对新课标改革的看法,分别抽取了300名男教师和240名女教师进行调查,得到的结果如表9-13所示。表9-13关于中学新课标改革的调查结果这个列联表的最右边一列称为()。A.总频数B.条件频数C.行边缘频数D.列边缘频数【答案】C查看答案7.某大学为了解学生对研究生奖学金制度改革的看法,分别抽取了300名男性研究生和240名女性研究生进行调查,得到的结果如表9-14所示。表9-14关于研究生奖学金制度改革的调查结果赞成计根据这个列联表计算的赞成研究生奖学金制度改革的行百分比分别为()。【解析】赞成研究生奖学金制度改革的行百分比分别为:90/174×100%=51.7%;8.某学校准备采取一项新的教师体制改革,为了解男女学生对这一措施的看法,分别抽取了300名男学生和240名女学生进行调查,得到的结果如表9-14所示。赞成观察值期望值表9-14男同学女同学B.1.2352C.2.6176【解析】x²检验可以用于变量间拟合优度检验和独立性检验,可以用于测定两个分类变量将表9-14中的数据代入计算得:x²=1.2352。9.某学校准备采取一项新的教师体制改革,为了解男女教师对这一措施的看法,分别抽取了50名男教师和50名女教师进行调查,得到的结果如表9-15所示。表9-15关于教师体制改革的调查结果男教师女教师合计如果要检验男女教师对教师体制改革的看法是否相同,提出的原假设为()。B.Ho:π1=π2=50【答案】D查看答案例应该是相同的(均为65/100=0.65)。所以提出的原假设和备择假设分别为:Ho:π1=π2=0.65(赞成比例一致);H₁:(赞成比例不一致)10.某大学为了解男女毕业生对开设《职业规划》这门课程的看法,分别抽取了500名男学生和500名女学生进行调查,得到的结果如表9-16所示。表9-16关于开设《职业规划》课程的调查结果男同学女同学5如果要检验男女毕业生对开设《职业规划》这门课程的看法是否相同,即检验假设H₀:π1=π2=850/1000=0.85,x²检验统B.2C.3【答案】B查看答案【解析】x²统计量的自由度是(R-1)(C-1)=(2-1)×(3-1)=2。11.相关系数是描述两个分类变量之间相关程度的一个统计量,它主要用于()。A.2×2列联表数据B.2×3列联表数据C.3×3列联表数据D.3×4列联表数据【答案】A查看答案【解析】W相关系数是描述2×2列联表数据相关程度最常用的一种相关系数。它的计算公12.φ相关系数的取值范围是()。【答案】A查看答案【解析】φ相关系数的取值范围在0~1之间,且φ的绝对值越大,说明变量X与Y的相关13.如果两个分类变量之间相互独立,则φ相关系数的取值为()。【答案】A查看答案A.完全相关B.相互独立C.存在相关关系,但不是完全相关D.无法判断【答案】A查看答案15.当列联表中的两个变量相互独立时,计算的列联相关系数c()。【答案】A查看答案16.对于同一个列联表计算的c系数和φ系数,其结果是().A.c值必然大于等于φ值B.c值必然等于φ值C.c值必然小于等于φ值D.c值可能小于φ值【答案】C查看答案【解析】由于,所以c值必然小于等于φ值。17.利用x²分布进行独立性检验,要求样本容量必须足够大,特别是每个单元中的期望频数fe不能过小。如果只有两个单元,每个单元的期望频数必须()。A.等于或大于1B.等于或大于2C.等于或大于5D.等于或大于10【答案】C查看答案是5或以上;②如果有两个以上单元,且20%的单元期望频数fe小于5,则不能应用x²检18.如果列联表有两个以上的单元,不能应用x²检验的条件是()。B.20%的单元期望频数e小于10C.20%的单元期望频数e大于10【答案】D查看答案1.某电视机厂对三个元件生产厂提供的电子元件的三种性能进行质量检验。他们想知道元件生产厂家同元件性能的质量差异是否有关系。抽查了450只元件次品,整根据抽查检验的数据,他们认为次品类型与厂家(即哪一个厂)生产是无关的。(1)试以0.01的显著性水平进行检验,作出判断。(2)计算c系数和V系数。解:(1)建立假设:H₀:次品类型与厂家生产是独立的,H₁:次品类型与厂家生产不是独立的。计算得各组的频数理论值,如表9-18所示。表9-18各组的频数理论值计算表次品类型表中各项的理论频数计算方法为:即X的计算值为9.821。自由度等于(r-1)-1)(3-1)=4,查x²分布表得1。由于,故接受Ho,即次品类型与厂2.一种原料来自三个不同的地区,原料质量被分成三个不同等级。从这批原料中随机抽取500件进行检验,结果如表9-19所示。要求:检验各个地区和原料质量之间是否存表9-19抽样检验结果甲乙丙甲乙丙区丙地区050965解:(1)建立假设如下:Ho:地区和原料质量之间没有明显的关系(2)在原假设成立的条件下,可用x²进行独立性检验,计算的理论频数列于表9-20的括号中。表9-20区乙52(45.36)6064(52.64)5924(42.00)52地区(55.40)50(64.30)65(51.30)74丙地(61.24)(71.06)(56.70)9区合计162188150500(3)自由度为(3-1)×(3-1)=4,α=0.05的x²分布的临界值x²(4)=9.488<19.82,所以拒绝原假设,即认为地第10章方差分析10.1复习笔记一、方差分析引论1.方差分析及其有关术语方差分析:通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。因素(或因子):在方差分析中,所要检验的对象称为因素或因子。水平(或处理):因素的不同表现称为水平或处理。观测值:每个因子水平下得到的样本数据称为观测值。2.方差分析的基本思想和原理组内误差:来自水平内部的数据误差。它反映了一个样本内部数据的离散程度,只含有随机组间误差:来自不同水平之间的数据误差。这种差异可能是由于抽样本身形成的随机误差,也可能是由于行业本身的系统性因素造成的系统误差。因此,组间误差是随机误差和系统误差的总和,它反映了不同样本之间数据的离散程度。在方差分析中,数据的误差是用平方和来表示的。总平方和(SST):反映全部数据误差大小的平方和,它反映了全部观测值的离散状况。组内平方和(SSE):反映组内误差大小的平方和,也称为误差平方和,或残差平方和,它反映了每个样本内各观测值的总离散状况。组间平方和(SSR):反映组间误差大小的平方和,也称为因素平方和,它反映了样本均值之间的差异程度。(1)方差分析中的三个基本假定①每个总体都应服从正态分布。也就是说,对于因素的每一个水平,其观测值是来自正态分布总体的简单随机样本。②各个总体的方差a²必须相同。也就是说,对于各组观察数据,是从具有相同方差的正态总体中抽取的。③观测值是独立的。在上述假定成立的前提下,要分析自变量对因变量是否有影响,形式上也就转化为检验自变量的各个水平(总体)的均值是否相等。(2)问题的一般提法设因素有k个水平,每个水平的均值分别用μ1,μ2,…,=表示,要检验k个水平(总体)的均值是否相等,需要提出如下假设:Ho:H=H₂=….=自变量对因变量没有显著影响二、单因素方差分析单因素方差分析:方差分析中只涉及一个分类型自变量,其研究的是一个分类型自变量对一个数值型因变量的影响。进行单因素方差分析时,需要得到如表10-1所示的数据结构。表10-1单因素方差分析的数据结构观测值(j)因素(i)Xii(i=1,2,…,k;j=1,2,…,n)表示,即表示第1个水平(总体)的第j个观测值。其中,从不同水平中所抽取的样本量可以相等,也可以不相等。2.分析步骤(1)提出假设检验因素的k个水平(总体)的均值是否相等,需要提出假设为:Ho:自变量对因变量没有显著影响H₁:(i=1,2,…,k)不全相等自变量对因变量有显著影响如果拒绝原假设Ho,则意味着自变量对因变量有显著影响,也就是自变量与因变量之间有显著关系;如果不拒绝原假设Ho,则没有证据表明自变量对因变量有显著影响,也就是说,不能认为自变量与因变量之间有显著关系。(2)构造检验的统计量①计算各样本的均值假定从第个总体中抽取一个容量为的简单随机样本,令F为第1个总体的样本均值,则:,其中,N为第2个总体的样本量;i为第2个总体的第j个观测值。②计算全部观测值的总均值它是全部观测值的总和除以观测值的总个数,令总均值为巨,则有:③计算各误差平方和a.总平方和(SST)它是全部观测值与总平均值的误差平方和,其计算公式为:b.组间平方和(SSA)它是各组平均值(=1,2,….,k)与总平均值x的误差平方和,反映各样本均值之问的差异程度,其计算公式为:它是每个水平或组的各样本数据与其组平均值误差的平方和,反映了每个样本各观测值的离散状况,因此又称为组内平方和或残差平方和。该平方和反映了随机误差的大小,其计算公三个平方和之间的关系为:总平方和(SST)=组间平方和(SSA)+组内平方和(SSE)SSA是对随机误差和系统误差大小的度量,它反映了自变量对因变量的影响,也称为自变均方(方差):由于各误差平方和的大小与观测值的多少有关,为了消除观测值多少对误差SSA的自由度为k-1,其中k为因素水平(总体)的个数;SSE的自由度为n-k。SSA的均方也称为组间均方或组间方差,记为MSA,其计算公式为:SSE的均方也称为组内均方或组内方差,记为MSE,其计算公式为:分子自由度为k-1、分母自由度为n-k的F分布,即(3)统计决策如果原假设成立,则表明没有系统误差,组间方差一与组内方差一的比值差异就不会太大;如果组间方差显著大于组内方差,说明各水平(总体)之间的差异显然不仅仅有随机误差,还有系统误差。因此,判断因素的水平是否对其观根据给定的显著性水平C,在F分布表中查找与分子自由度一==、分母自由度若F>日,则拒绝原假设Ho:H₁=μ2=…-=Hk,表明从(i=1,2,…,k)之间的差异是显著若F<日,则不拒绝原假设H₀,没有证据表明A(i=1,2,…,k)之间有显著差异,即这(4)方差分析表差分析表。其一般形式如表10-2所示。表10-2方差分析表的一般形式误差来源平方和自由度均方组间(因素影则拒绝Ho。3.关系强度的测量这一比例记为R²,即4.方差分析中的多重比较山与从、.….、日与A之间究竟是哪两个均值不同呢?这就需要做进一步的分析,所使用的方法就是多重比较方法(例如最小显著差异方法),它是通过对总体均值之间的配对比较最小显著差异方法(LSD)是由费希尔提出的,其进行检验的具体步骤为:(2)计算检验统计量:(3)计算LSD,其公式为:则不拒绝H₀。1.双因素方差分析及其类型(1)无交互作用的双因素方差分析(又称为无重复双因素分析):两个因素对因变量的影(2)有交互作用的双因素方差分析(又称为可重复双因素分析):两个因素搭配在一起会(1)数据结构(如表10-3所示)列因素(j):平均值一=…(2)分析步骤行因素(自变量)对因变量没有显著影响不全相等行因素(自变量)对因变量有显著影响Ho:H=H₂=…-间..-F列因素(自变量)对因变量没有显著影响H₁:(j=1,2,..,r)不全相等列因素(自变量)对因变量有显著影响其中,分解后的等式右边的第一项是行因素所产生的误差平方和,记为SSR,即第二项是列因素所产生的误差平方和,记为SSC,即记为SSE,即总平方和SST的自由度为一;行因素的误差平方和SSR的自由度为k-1;列因素的误差平方和SSC的自由度为r-1;随机误差平方和SSE的自由度为(k-1)×(k-1)。b.均方是各平方和除以相应的自由度,所以各因素的均方分别为:行因素的均方;列因素的均方随机误差项的均方c.检验各因素对因变量的影响是否显著采检验行因素对因变量的影响是否显著,采用的统计量:检验列因素的影响是否显著,采用的统计量:若FR>Fα,,则拒绝原假设Ho:H₁=μ2=..=A=..=A,表明H(i=1,2,….,k)之间的差(3)关系强度的测量比值定义为R²,其平方根R则反映了这两个自变量合起来与因变量之间的关系强度。即3.有交互作用的双因素方差分析,行变量平方和,交互作用平方和,列变1.什么是方差分析?它研究的是什么?方差分析是检验多个总体均值是否相等的统计方法,但本质上它所研究的是分类型自变量对数值型因变量的影响,例如,变量之间有没有关系、关系的强度如何等。2.要检验多个总体均值是否相等时,为什么不作两两比较,而用方差分析方法?答:方差分析不仅可以提高检验的效率,同时由于它是将所有的样本信息结合在一起,也增加了分析的可靠性。检验多个总体均值是否相等时,如果作两两比较,则需要进行多次的t检验。随着增加个体显著性检验的次数,偶然因素导致差别的可能性也会增加(并非均值真的存在差别)。而方差分析方法则是同时考虑所有的样本,因此排除了错误累积的概率,从而避免拒绝一个真实的原假设。3.方差分析包括哪些类型?它们有何区别?答:(1)根据所分析的分类自变量的多少,方差分析可分为单因素方差分析和双因素方差分析。(2)区别:①单因素方差分析研究的是一个分类型自变量对一个数值型因变量的影响;②双因素方差分析研究的是两个分类变量对数值型因变量的影响。4.方差分析中有哪些基本假定?答:方差分析中有三个基本假定:(1)每个总体都应服从正态分布。也就是说,对于因素的每一个水平,其观测值是来自正态分布总体的简单随机样本。(2)各个总体的方差o²必须相同。也就是说,对于各组观察数据,是从具有相同方差的正态总体中抽取的。(3)观测值是独立的。5.简述方差分析的基本思想。答:方差分析的基本思想:通过分析研究中不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。6.解释因子和处理的含义。答:在方差分析中,所要检验的对象称为因素或因子;因素的不同表现称为水平或处理。例如:要分析行业(零售业、旅游业、航空公司、家电制造业)对投诉次数是否有显著影响,7.解释组内误差和组间误差的含义。答:由于抽样的随机性所造成的随机误差,这种来自水平内部的数据误差称为组内误差。来自不同水平之间的数据误差称为组间误差,这种差异可能是由于抽样本身形成的随机误差,也可能是由于行业本身的系统性因素造成的系统误差。因此,组间误差是随机误差和系统误差的总和。8.解释组内方差和组间方差的含义。答:组内平方和SSE的均方称为组内均方或组内方差,记为MSE,其计算公式为:组间平方和SSA的均方称为组间均方或组间方差,记为MSA,其计算公式为:9.简述方差分析的基本步骤。答:(1)单因素方差分析的基本步骤包括:H₁:μi(i=1,2,…,k)不全相等,即自变量对因变量有显著影响。若F>Fa,则拒绝原假设Ho:H=μ2=….-H,表明网(i=1,2,…,k)之间的差异是显著若F<Fa,则不拒绝原假设Ho,没有证据表明从(i=1,2,….,k)之间有显著差异。(2)无交互作用的双因素方差分析的基本步骤包括:Ho:H1=μ2=…=Hi=…=Hk,即行因素(自变量)对因变量没有显著影响;H₁:μi(i=1,2,…,k)不完全相等,即行因素(自变量)对因变量有显著影响。Ho:μ=μ2=…=Hj=…=Hr,即列因素(自变量)对因变量没有显著影响;H₁:H(j=1,2,…,r)不完全相等,即列因素(自变量)对因变量有显著影响。若FR>Fa,,则拒绝原假设Ho:H₁=μ2=...=A=...=H,表明从(i=1,2,….,k)之间的差若Fc>Fa,则拒绝原假设H₀:H₁=μ2=...=(3)有交互作用的双因素方差分析的基本步骤包括:Ho:H1=μ2=…=μi=…=Hk,即行因素(自变量)对因变量没有显著影响;H₁:Hi(i=1,2,…,k)不完全相等,即行因素(自变量)对因变量有显著影响。Ho:Hi=μ2=…=Hj=…=μr,即列因素(自变量)对因变量没有显著影响;H₁:Hi(j=1,2,.….,r)不完全相等,即列因素(自变量)对因变量有显著影响。H₁:μ(t=1,2,…,m)不完全相等,即交互作用对因变量有显著影响。②构造检验的统计量检验行因素对因变量的影响是否显著的统计量:检验列因素的影响是否显著的统计量:检验交互作用的影响是否显著的统计量:③统计决策若FR>Fa,则拒绝原假设Ho:HI=H₂=…-A=.-A,表明A(ż=1,2,…,k)之间的差若Fe>Fa,则拒绝原假设Ho:HI=H₂=….-Hy=….-4,表明竹(j=1,2,…,r)之间的差若FRc>F,,则拒绝原假设Ho:H=μ2=….=A=..-F,表明从(j=1,2,…,m)之间的10.方差分析中多重比较的作用是什么?答:多重比较方法是通过对总体均值之间的配对比较来进步检验到底哪些均值之间存在差异。多重比较的方法有许多,常用的是由费希尔提出的最小显著差异方法(LSD)。11.什么是交互作用?答:交互作用是一因素对另一因素的不同水平有不同的效果。例如:对于双因素方差分析,有交互作用就是两个因素搭配在一起对应变量产生一种新的效应。12.解释无交互作用和有交互作用的双因素方差分析。答:如果两个自变量因素对因变量的影响是相互独立的,需分别判断两个自变量因素对因变量的影响情况,称为无交互作用的双因素方差分析。如果除了两个自变量因素对因变量的单独影响外,两个因素的搭配还会对因变量产生一种新的影响效应,这时的双因素方差分析称为有交互作用的双因素方差分析。13.解释-F的含义和作用。答:(1)单因素方差分析中,R²表示组间平方和(SSA)占总平方和(SST)的比例,其平方根R反映了两个变量之间的关系强度。其计算公式为:(2)无交互作用的方差分析中,行平方和与列平方和加在一起度量了两个自变量对因变量的联合效应,联合效应与总平方和的比值定义为R²,其平方根R则反映了这两个自变量合起来与因变量之间的关系强度。即(3)有交互作用的方差分析中,R²的定义为:其中SSRC为交互作用的平方和。二、练习题1.从3个总体中各抽取容量不同的样本数据,结果如表10-4所示。检验3个总体的均值之间是否有显著差异(α=0.01)?表10-43个样本数据样本1样本2样本3解:设3个总体的均值分别为提出假设:由Excel输出的方差分析表,如表10-5所示。表10-5方差分析表由于P-value=0.040877>X=0.01(或F=4.6574<Fo.o₁(2,9)=8.0215),不拒绝原假设,没有证据表明3个总体的均值之间有显著差异。2.下面是来自5个总体的样本数据,如表10-6所示。表10-65个总体的样本数据样本1样本2样本3样本4样本5取显著性水平C=0.01,检验5个总体的均值是否相等?解:设5个总体的均值分别为提出假设:由Excel输出的方差分析表,如表10-7所示。表10-7方差分析表由于P-value=0.00001<C=0.01(或F=15.8234>Fo.o₁(4,18)=4.579),拒绝原假设。表明5个总体的均值之间有显著差异。3.一家牛奶公司有4台机器装填牛奶,每桶的容量为4L。下面是从4台机器中抽取的样本数据,如表10-8所示。表10-8样本数据机器1机器2机器3机器4取显著性水平F=0.01,检验4台机器的装填量是否相同?解:设4台机器的平均装填量分别为由Excel输出的方差分析表,如表10-9所示。表10-9方差分析表由于P-value=0.000685<X=0.01(或F=10.0984>Fo.o₁(3,15)=5.4170),拒绝原假设。表明4台机器的平均装填量之间有显著差异。4.一家管理咨询公司为不同的客户进行人力资源管理讲座。每次讲座的内容基本上是一样理者的满意度评分,如表10-10所示(评分标准从1~10,10代表非常满意)。表10-10不同层次管理者的满意度评分高级管理者中级管理者低级管理者取显著性水平C=0.05,检验管理者的水平不同是否会导致评分的显著性差异?由Excel输出的方差分析表,如表10-11所示。表10-11方差分析表由于P-value=0.000849<C=0.05(或F=11.75573>Fo.o₅(2,15)=3.68232),5.某家电制造公司准备购进一批5#电池,现有A,B,C三个电池生产企业愿意供货,为比较它们生产的电池质量,从每个企业各随机抽取5只电池,经试验得其寿命(单位:h)数据如表10-12所示。表10-12电池寿命试验号ABC试分析3个企业生产的电池的平均寿命之间有无显著差异(C=0.05)?如果有差异,用LSD方法检验哪些企业之间有差异?解:设3个企业生产的电池的平均寿命分别为E提出假设:Ho:H₁:不全相等。由Excel输出的方差分析表,如表10-13、10-14所示。表10-13表10-14方差分析表由于P-value=0.0003<X=0.05(或F=17.0684>Fo.o₅(2,12)=3.8853),拒绝原假设。表明电池的平均寿命之间有显著差异。为判断哪两个企业生产的电池平均使用寿命之间有显著差异,首先提出如下假设:检验1:检验2:检验3:计算检验统计量:根据方差分析表10-14可知,MSE=18.03333。根据自由度=n-k=15-3=12,查t分布表得==。由于每个样本的样本量均为5,所以池的平均使用寿命之间有显著差异;,拒绝原假设。因此,企业A与企业B电池的平均使用寿命之间有显著差异。6.一家产品制造公司管理者想比较A,B,C三种不同的培训方式对产品组装时间的多少培训方式不同培训方式对产品组装有显著影响。7.某企业准备用三种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多,进行方差分析得到的结果,如表10-17所示。组内总计6 要求:(1)完成上面的方差分析表。(2)若显著性水平C=0.05,检验三种方法组装的产品数量之间是否有显著差异?表10-18方差分析表不能拒绝原假设,即没有证据表明3种方法组装的产品数量之间有显著差异。程度进行测试,分别在低速(40km/h)、中速(80km/h)、高速(120km/h)下进行测试。表10-19是对5家供应商抽取的轮胎随机样本在轮胎行驶1000km后的磨损程度。表10-19轮胎行驶1000km后的磨损程度供应商车速低速(1)不同车速对磨损程度是否有显著影响?(2)不同供应商生产的轮胎的磨损程度是否有显著差异?解:(1)设低速、中速、高速的平均磨损程度分别为由Excel输出的方差分析表,如表10-20所示。表10-20方差分析表由于P-value=2.39E-06<C=0.01(或一=97.6822>(2,8)=8.6491),拒绝原假设。(2)设不同供应商轮胎的平均磨损程度分别为-9.有5种不同品种的种子和4种不同的施肥方案,在20块同样面积的土地上,分别采用5种种子和4种施肥方案搭配进行试验,取得的收获量数据如表10-21所示。表10-21土地收获量施肥方案检验种子的不同品种对收获量的影响是否有显著差异?不同的施肥方案对收获量的影响是否有显著差异(α=0.05)?解:设不同品种的种子的平均收获量分别为M,A2,A₃,A₄,A。设不同施肥方式的平均收获量分别为提出假设:H1:A,H₂,H₃H4由Excel输出的方差分析表如10-22所示。表10-22方差分析表由于P-value=0.0033<C=0.05(或一==7.2397>(4,12)=3.2592),拒绝原假设。表明不同品种的种子对收获量的影响有显著差异。P-value=0.0019<C=0.05(或一=9.2047>间(3,12)=3.4903),拒绝原绝原假设。表明不同施肥方案对收获量的影响有显著差异。10.为研究食品的包装和销售地区对其销售量是否有影响,在某周的三个不同地区中用三种不同包装方法进行销售,获得的销售量数据如表10-23所示。表10-23销售量数据检验不同的地区和不同的包装方法对该食品的销售量是否有显著影响(CX=0.05)?解:设不同地区的平均销售量分别为提出假设:H₀:不全相等。提出假设:Ho:由Excel输出的方差分析表如表10-24所示。表10-24方差分析表由于P-value=0.9311>C=0.05(或一=0.0727<Foos(2,4)=6.9443),不拒绝原假设。没有证据表明不同的地区对该食品的销售量有显著影响。P-value=0.1522>C=0.05(或—==3.1273<Foos(2,4)=6.9443),不拒绝原假设。没有证据表明不同的包装方法对该食品的销售量有显著影响。11.一家超市连锁店进行一项研究,确定超市所在的位置和竞争者的数量对销售额是否有显著影响。表10-25是获得的月销售额数据(单位:万元)。表10-25月销售额数据超市位置超市位置0位于市内居民小411位于市内居民小41区位于写字楼区位于写字楼位于郊区取显著性水平C=0.01,取显著性水平C=0.01,检验:2(1)竞争者的数量对销售额是否有显著影响?(2)超市的位置对销售额是否有显著影响?(3)竞争者的数量和超市的位置对销售额是否有交互影响?解:由Excel输出的方差分析表如表10-26所示。表10-26方差分析表设。表明竞争者的数量对销售额有显著影响;广告方案广告媒体报纸电视2.下列关于单因素方差分析的叙述,不正确的是()。A.方差分析可以对若干平均值是否相等同时进行检验B.进行方差分析要求各水平下的样本容量相同C.总平方和能分解为组内平方和与组间平方和之和D.进行方差分析时各水平下的样本容量可以不相同【答案】B查看答案【解析】方差分析通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。总平方和=组内平方和+组间平方和。进行方差分析时不要求各水平下的样本容量相等。3.双因素方差分析有两种类型:一个是有交互作用的,一个是无交互作用的。区别的关键是看这对因

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论