第七章 两个总体的假设检验_第1页
第七章 两个总体的假设检验_第2页
第七章 两个总体的假设检验_第3页
第七章 两个总体的假设检验_第4页
第七章 两个总体的假设检验_第5页
已阅读5页,还剩84页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章

两总体的假设检验第一节均值差异的假设检验第二节比例差异的假设检验第三节均值差异比较的SPSS应用两个正态总体的参数检验两个总体的检验Z

检验(大样本)t

检验(小样本)t

检验(小样本)Z检验F

检验独立样本配对样本均值比例方差两个独立样本之差的抽样分布m1s1总体1s2

m2总体2抽取简单随机样样本容量n1计算X1抽取简单随机样样本容量n2计算X2计算每一对样本的X1-X2所有可能样本的X1-X2m1-m2抽样分布第一节均值差异的假设检验假设:H0:两总体不存在差异,即u1=u2,H1:两总体存在差异,即u1不等于u2。要求:随机抽样;每个总体都是正态分布;两个总体的标准差相等。一、两个独立样本均值之差的检验(一)两个总体均值之差的Z检验(12、22

已知)(二)两个总体均值之差的Z检验

(12、22

未知,大样本)(三)两个总体均值之差的t检验(12、22未知,小样本)其中:(一)两个总体均值之差的Z检验

(12、22

已知)1、假定条件两个样本是独立的随机样本两个总体都是正态分布若不是正态分布,可以用正态分布来近似(n130和n230;n1+n2100)2、原假设:H0:1-

2

=0;备择假设:H1:1-

2

0检验统计量为两个总体均值之差的Z检验(例子)

例1:有两种方法可用于制造某种以抗拉强度为重要特征的产品。根据以往的资料得知,第一种方法生产出的产品其抗拉强度的标准差为8公斤,第二种方法的标准差为10公斤。从两种方法生产的产品中各抽取一个随机样本,样本容量分别为n1=32,n2=40,测得x2=50公斤,x1=40公斤。问这两种方法生产的产品平均抗拉强度是否有显著差别?(=0.05)两个总体均值之差的Z检验

(计算结果)H0:

1-2=0H1:

1-2

0=

0.05n1=32,n2

=

40临界值(s):检验统计量:决策:结论:

拒绝H0有证据表明两种方法生产的产品其抗拉强度有显著差异Z01.96-1.96.025拒绝H0拒绝H0.025例:某大学欲比较大学毕业后留校工作与分配到其他岗位的人工资水平的差别,因为工资还与工龄等其他因素有关,因此抽选大学毕业后满10年在校工作的教师50人,另外抽选大学毕业后满10年在机关、企业工作的人员进行比较,取得的数据如下。试比较大学毕业后留校当教师与分配在机关企业等工作人员的工资水平是否有差异?(α=.05)大学教师机关、企业工作人员两个总体均值之差的Z检验(12、22

未知,大样本)练习:1、为了比较已婚妇女对婚后生活得态度是否因为婚龄而有所区别,将已婚妇女按照对婚后生活得态度分为“不满意”和“满意”两组,从“不满意”组中随机抽取500名妇女,平均婚龄为9.2年,标准差为2.8年;从“满意”组随机抽取600名妇女,均值为8.5年,标准差为2.3年,试问在显著性水平为0.05情况下,两组是否存在显著差异?练习题2:为了比较就近上学和因家远而乘车上学的小学生学习成绩是否有差别。某校从就近上学的小学生中随机抽查800名,平均学习总成绩为520分,标准差为40分;从乘车上学的小学生中抽查1000名,其平均总成绩为505分,标准差为50分。问二者学习成绩是否有差别(0.05)?如果有差别那种方式更好些?(二)两个总体均值之差的t检验

(12、22未知,小样本)1、检验具有等方差的两个总体的均值2、假定条件两个样本是独立的随机样本两个总体都是正态分布两个总体方差未知但相等12=223、检验统计量其中:两个总体均值之差的t

检验(例子)例:一个车间研究用两种不同的工艺组装某种产品所用的时间是否相同。让一个组的10名工人用第一种工艺组装该产品,平均所需时间为26.1分钟,样本标准差为12分钟;另一组8名工人用第二种工艺组装,平均所需时间为17.6分钟,样本标准差为10.5分钟。已知用两种工艺组装产品所用时间服从正态分布,且s12=s22

。试问能否认为用第二种方法组装比用第一中方法组装更好?(=0.05)两个总体均值之差的t

检验H0:

1-2

0H1:

1-2>0=

0.05n1=10n2

=

8临界值(s):检验统计量:决策:结论:

接受H0没有证据表明用第二种方法组装更好t0拒绝域0.051.7459某市卫生局对市场上出售的甲乙两种冰激淋进行了检验,甲种抽了11只,查明冰激淋含脂肪平均为127%,样本标准差为038%;乙种抽了10只,查明冰激淋含脂肪平均为141%,样本标准差为048%。试以5%的显著水平检验甲种的脂肪含量是否比乙种低?解:NEXT决策:接受原假设。结论:即甲种的脂肪含量不高于乙种。二、二个相关(配对或匹配)样本的均值检验(配对样本t

检验)1、检验两个相关总体的均值配对或匹配重复测量(前/后)2、假定条件两个总体都服从正态分布如果不服从正态分布,可用正态分布来近似(n1

30,n230)有时为了比较两种产品,或两种仪器、两种方法等的差异,我们常在相同的条件下作对比实验,得到一批成对的观察值,然后分析观察数据作出判断——配对比较法。

在人事测评中,假如我们用同一套测验工具在不同时间对某位销售主管施测两次,结果如何呢?是否两次的测评分数会有非常显著的差异呢?ABCEFGHI第一次16PF测试结果769871093第二次16PF测试结果87109810103LMNOQ1Q2Q3Q4第一次16PF测试结果23756282第二次16PF测试结果24636592

配对样本的t

检验(数据形式)观察序号样本1样本2差值1x11x21D1=x11-x212x12x22D2=x12-x22MMMMix1ix2iDI=x1i-x2iMMMMnx1nx2nDn=x1n-x2n假设差值Di来自正态总体,若两样本无差异,则差值应属于随机误差,而随机误差可以认为服从正态分布,均值为0。相关样本eg:配对样本(实验组与控制组);同一样本前后时期的变化等;假设两相关样本间有n对个案,每对个案可能都有差异d=(X1-X2),而这些差异的均值为Xd,标准差为Sd,Xd的抽样分布符合t分布。

配对样本的t

检验(检验统计量)样本均值样本标准差自由度df=n

-1统计量例:一个以减肥为主要目标的健美俱乐部声称,参加其训练班至少可以使减肥者平均体重减重8.5公斤以上。为了验证该宣称是否可信,调查人员随机抽取了10名参加者,得到他们的体重记录如下表:配对样本的t

检验(例子)在

=0.05的显著性水平下,调查结果是否支持该俱乐部的声称?训练前94.5101110103.59788.596.5101104116.5训练后8589.5101.5968680.58793.593102样本差值计算表训练前训练后差值Di94.5101110103.59788.596.5101104116.58589.5101.5968680.58793.5931029.511.58.57.51189.57.51114.5合计—98.5配对样本的t

检验(计算表)配对样本的t

检验(计算结果)样本均值样本标准差H0:

m1

m2

8.5H1:

m1

m2

<8.5a=0.05df=

10-1=9临界值(s):检验统计量:决策:结论:

接受H0有证据表明该俱乐部的宣称是可信的配对样本的t

检验(计算结果)-1.833t0拒绝域.05例:消费者先对公司打分,再让他们一天两次观看公司录像,一周后再对公司打分。数据如下表所示,令α=0.05,检验看过一周录像后对公司的打分和之前相比是否有显著差异?个人1234567事前32112117303814事后39153513413922d-7-4-144-11-1-81. 假定条件两个总体是独立的两个总体都服从二项分布可以用正态分布来近似2.检验统计量第二节两个总体比例之差的Z检验扬州大学283.总体成数差的检验步骤1.原假设

H0:pA-pB=D0

2.备择假设H1:双边H1(pA-pB

)≠D0

单边H1(

pA-pB

)>D0或H1(

pA-pB

)<D0;3.统计量扬州大学29①单边:Z>Za[H1:(

pA-pB)>D0]②单边:Z<-Za[H1:(

pA-pB)<

D0](续3)——4.拒绝域a③双边a-Zaa/2a/2-Za/2Za/2两个总体比例之差的检验

(假设的形式)假设研究的问题没有差异有差异比例1≥比例2比例1<比例2总体1≤比例2总体1>比例2H0P1–P2=0P1–P20P1–P20H1P1–P20P1–P2<0P1–P2>0两个总体比例之差的Z检验

【例】对两个大型企业青年工人参加技术培训的情况进行调查,调查结果如下:甲厂:调查60人,18人参加技术培训。乙厂调查40人,14人参加技术培训。能否根据以上调查结果认为乙厂工人参加技术培训的人数比例高于甲厂?(=0.05)两个总体比例之差的Z检验

(计算结果)H0:

P1-P2

0H1:P1-P2<0=0.05n1=60,n2=40临界值(s):检验统计量:决策:结论:接受H0没有证据表明乙厂工人参加技术培训的人数比例高于甲厂-1.65Z0拒绝域练习:一保险机构称,对于新出台的某险种,沿海地区的人们与内地人们的喜爱程度无显著性差异。为了了解事实,进行了一次抽样调查,在沿海地区抽查了300人,195人喜欢该险种;内地抽查了400人,220人喜欢该险种。在0.05显著性水平下检验人们的态度是否有差异。

决策:拒绝H0。解:结论:

沿海和内地人们的喜好有差异。多个样本均值的检验假设:H0

:u1=u2=u3=……H1

:至少有两个样本的均值M是不相等的。方法:方差分析;F检验法。第四节两个变量相关的检验X2检验及其相关测量法;Gamma及其他级序相关的验;

单因方差分析与F检验;

非参数检验:U检验与H检验;第四节两个变量相关的检验两个变量在样本中相关并不能肯定它们在总体中也相关,因为样本中的相关可能是由抽样误差造成的。我们关心的是总体情况,因此用根据抽样理论,用样本资料检验两变量在总体中是否相关。在选用相关的检验法时,要注意检验法所要求的变量的测量层次;X2检验及其相关测量法X2检验法(非参数检验法):要求:(1)随机样本;(2)两定类变量假设:H0:总体中X与Y不相关;H1:总体中X与Y相关;公式:X2

=sum[(f-e)2/e]自由度为Df=(r-1)(c-1);f为样本观测的实际次数,e是预期次数。X2检验及其相关测量法预期次数:总体中两变量无关时,每格所应有的次数;算法:相应的两边缘次数的乘积除以样本量。eg:e11=B1*A1/ne12=B1*A2/ne21=B2*A1/ne22=B2*A2/n例题:某乡镇研究职业代际流动。调查了共140人,其结果如下表,问:父辈职业与子辈职业是否有关?具体相关程度如何?脑力体力农业合计脑力205530体力10301050农业555060合计3540651402、注意:针对2*2的列联表,或者是某个预期次数等于或者小于5时,需要对卡方检验做修正;(修正值、fisher精确鉴定法)3、对单元格的要求:预期次数等于或者小于5的单元格建议不应该超过总格数的20%。处理方法:将期望值较小的各值合并。例题:是否有显著性差异?期望值321138724241实际值3011086235544、列联表的检验是通过频次而不是通过相对频次的比较进行的。练习题:1、根据研究问题:城乡分割的二元结构是否会影响人们的消费水平,根据经验和研究的逻辑,研究假设分别为:(1)城市人的消费与农村人的消费存在显著差异;(2)城市人的消费水平高于农村人;(3)户口(代表城乡二元结构的变量)对个人消费水平有显著影响。请你回答采用什么统计技术来验证这些假设。斯皮尔曼等级相关系数及其检验(P320)分两种情况:(1)n大于等于10,满足t分布统计量(2)n大于等于30,满足Z分布统计量Gamma及其他级序相关的检验基本逻辑:以Gamma系数来求出样本中X与Y的相关,然后以Z检验法或t检验法来推论在总体中的Gamma是否等于0。方法:对于随机样本中两个定序变量,若n大于100,G值的抽样分布近似正态分布,若样本较小,G值的抽样分布近似t分布。(P331)

2、在320户5个孩子的家庭中,男女性别比例描述如下:

问:这一结果与“男孩、女孩的出生概率相同”的假设一致吗?

5男4男3男2男1男0男合计0女1女2女3女4女5女185611088408320例题:一下是五百名文化程度代际流动的抽样调查,试判断二者是否有显著关系(显著性水平=0.05)大学中学小学大学1183715中学1813032小学94398Gamma及其他级序相关的检验直接检验S因子(S=Ns-Nd),间接检验G系数:较为精确。方法(了解):为使S的抽样分布近似正态分布,S——S’;S’的标准误se的求法;检验值Z=S’/se;凡是以S=Ns-Nd作为分子的级序相关系数,都可以通过S的检定来推论总体情况。Gamma及其他级序相关的检验S’的取值:Se的取值:A代表x的边际分布,B代表y的边际分布例题:试就一下样本等级列联表进行统计检验(显著性水平=0.001)1234合计1810022020412824合计814121044练习题:书后练习:第三题和第四题回归系数和积距相关系数系数的检验回归系数的检验知识回顾:三种变差研究假设的设置:H0:(回归系数)=0H1:0检验统计量:F检验书上例题:P354相关系数的检验:研究假设的设定:H0:总体相关系数为零H1:总体相关系数不为零方法一:检验统计量:方法二:直接通过相关系数来进行检验(1)计算出r值;(2)根据给定的显著性水平,和自由度(k=n-2),按照附表查出临界相关系数;(3)比较r值,判断是否接受研究假设。书后练习题:P373第二题方差分析方差分析适用范围:定类-定距变量方差分析分类:一元方差分析、二元方差分析以及多元方差分析什么是方差分析?(一个例子)表8-1该饮料在五家超市的销售情况超市无色粉色橘黄色绿色1234526.528.725.129.127.231.228.330.827.929.627.925.128.524.226.530.829.632.431.732.8【例8.1】某饮料生产企业研制出一种新型饮料。饮料的颜色共有四种,分别为橘黄色、粉色、绿色和无色透明。这四种饮料的营养含量、味道、价格、包装等可能影响销售量的因素全部相同。现从地理位置相似、经营规模相仿的五家超级市场上收集了前一时期该饮料的销售情况,见表8-1。试分析饮料的颜色是否对销售量产生影响什么是方差分析?(例子的进一步分析)检验饮料的颜色对销售量是否有影响,也就是检验四种颜色饮料的平均销售量是否相同设1为无色饮料的平均销售量,2粉色饮料的平均销售量,3为橘黄色饮料的平均销售量,4为绿色饮料的平均销售量,也就是检验下面的假设H0:1234

H1:1,2,3,4

不全相等检验上述假设所采用的方法就是方差分析方差分析的基本思想和原理

(几个基本概念)因素或因子所要检验的对象称为因子要分析饮料的颜色对销售量是否有影响,颜色是要检验的因素或因子水平因素的具体表现称为水平A1、A2、A3、A4四种颜色就是因素的水平观察值在每个因素水平下得到的样本值每种颜色饮料的销售量就是观察值方差分析的基本思想和原理

(几个基本概念)试验这里只涉及一个因素,因此称为单因素四水平的试验总体因素的每一个水平可以看作是一个总体比如A1、A2、A3、A4四种颜色可以看作是四个总体样本数据上面的数据可以看作是从这四个总体中抽取的样本数据方差分析的基本思想和原理

(两类误差)随机误差在因素的同一水平(同一个总体)下,样本的各观察值之间的差异如同一种颜色的饮料在不同超市上的销售量是不同的不同超市销售量的差异可以看成是随机因素的影响,或者说是由于抽样的随机性所造成的,称为随机误差

系统误差在因素的不同水平(不同总体)下,各观察值之间的差异如同一家超市,不同颜色饮料的销售量也是不同的这种差异可能是由于抽样的随机性所造成的,也可能是由于颜色本身所造成的,后者所形成的误差是由系统性因素造成的,称为系统误差方差分析的基本思想和原理

(两类方差)组内方差因素的同一水平(同一个总体)下样本数据的方差比如,无色饮料A1在5家超市销售数量的方差组内方差只包含随机误差组间方差因素的不同水平(不同总体)下各样本之间的方差比如,A1、A2、A3、A4四种颜色饮料销售量之间的方差组间方差既包括随机误差,也包括系统误差方差分析的基本思想和原理

(方差的比较)如果不同颜色(水平)对销售量(结果)没有影响,那么在组间方差中只包含有随机误差,而没有系统误差。这时,组间方差与组内方差就应该很接近,两个方差的比值就会接近1如果不同的水平对结果有影响,在组间方差中除了包含随机误差外,还会包含有系统误差,这时组间方差就会大于组内方差,组间方差与组内方差的比值就会大于1当这个比值大到某种程度时,就可以说不同水平之间存在着显著差异方差分析中的基本假定每个总体都应服从正态分布对于因素的每一个水平,其观察值是来自服从正态分布总体的简单随机样本比如,每种颜色饮料的销售量必需服从正态分布各个总体的方差必须相同对于各组观察数据,是从具有相同方差的总体中抽取的如四种颜色饮料的销售量的方差都相同观察值是独立的如每个超市的销售量都与其他超市的销售量独立方差分析中的基本假定在上述假定条件下,判断颜色对销售量是否有显著影响,实际上也就是检验具有同方差的四个正态总体的均值是否相等的问题如果四个总体的均值相等,可以期望四个样本的均值也会很接近四个样本的均值越接近,我们推断四个总体均值相等的证据也就越充分样本均值越不同,我们推断总体均值不同的证据就越充分方差分析中基本假定如果原假设成立,即H0:m1=m2=m3=m4四种颜色饮料销售的均值都相等没有系统误差

这意味着每个样本都来自均值为、方差为2的同一正态总体

Xf(X)1

2

3

4

方差分析中基本假定如果备择假设成立,即H1:mi(i=1,2,3,4)不全相等至少有一个总体的均值是不同的有系统误差

这意味着四个样本分别来自均值不同的四个正态总体Xf(X)3

1

2

4

单因方差分析与F检验单方差分析中的F检验:通过对各观察数据误差来源的分析来判断多个总体均值是否相等;是参数检定法的一种;目的:推算在各组总体中的均值是否相等。要求:1.随机样本;2.有一个变量是定距变量;3.各组总体都是正态分布;4.各组总体具有相等的方差;构造检验的统计量为检验H0是否成立,需确定检验的统计量构造统计量需要计算水平的均值全部观察值的总均值TSS:总离差平方和RSS:组内平方和(剩余平方和):个各观测值对本组平均值的离差平方和BSS:组间平方和:观测值的组平均值对总平均值的离差平方和单因方差分析与F检验基本逻辑:将全部方差(以TSS估计,自由度为:n-1)分解为两个部分:消减方差(以BSS估计,自由度为k-1)和剩余方差(以RSS估计,自由度为n-k),然后从相互比较中推论X与Y在总体中是否相关。F=总体的消减误差/总体的剩余误差即F=(BSS/df1)/(RSS/df2);或F=组间方差/组内方差单因方差分析与F检验例题:20名同学的家庭职业背景对语文水平的影响语文水平(得分)干部工人农民7852838259759173829061788580808151836454各组个案数785各组均值84.2961.7579.60各组方差4.409.642.87单因方差分析与F检验问题:总体中三组家庭背景的学生是否有不同的语文成绩?步骤:H0:M1=M2=M3;H1:不完全相同;E=0.84,n=20,k=3F=E2(n-k)/(1-E2)(k-1)=19.83在所要求的显著度下查表得Fa。若F小于Fa

,则拒绝H0

,即总体中三类家庭背景的学生的语文成绩存在差别。例题:1、研究地域(X)与教育年限(Y)的关系,随机抽取96个30岁的青年。结果如下:农村N=56,Y=11.72,城郊N=27,Y=12.63,城市N=13,Y=14.63。全部样本均值为12.34,各分类Y平方和为804.24。试对两变量的相关作检验(显著度0.05)P386表13-4重点关注书后练习:P420练习题1.在0.05的显著性水平下,检验四种教学方法对学生能力是否有不同的影响。教学方法测试人数得分和得分平方和1644833,7842754242,2703641929,7194434730,203非参数检验由于定类和定序变量都不具备运算功能,因此无法对于总体分布作出假定或检验总体的某种参数,所以应该采用非参数检验法;非参数检验方法,又称为分布自由鉴定法,这类方法的使用不需要对总体分布作出任何事先的假定。非参数检验的优点:对总体分布无须加以限制,计算量比较少,简单易行;非参数检验的缺点:检验效率较差;非参数检验较参数检验需要更大的样本量,才能获得相似的检验效力;习题研究者认为工人的平均年龄有升高的趋势,根据五年前的统计,总体工人的平均年龄是34岁。根据抽样调查资料(N=374),工人的平均年龄为36.24岁,标准差为10.32岁,要求的显著度是0.05,你认为工人平均年龄身高了吗?研究者认为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论