教育统计学课件-8 假设检验_第1页
教育统计学课件-8 假设检验_第2页
教育统计学课件-8 假设检验_第3页
教育统计学课件-8 假设检验_第4页
教育统计学课件-8 假设检验_第5页
已阅读5页,还剩84页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

心理与教育统计学第七章假设检验假设检验在统计方法中的地位统计方法描述统计推断统计参数估计假设检验一、假设检验的根本思想和原理什么是假设?(hypothesis)对总体参数的具体数值所作的陈述总体参数包括总体均值、比例、方差等分析之前必需陈述我认为这种新药的疗效比原有的药物更有效!什么是假设检验?(hypothesistest)先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程有参数检验和非参数检验逻辑上运用反证法,统计上依据小概率原理假设检验的根本思想...因此我们拒绝假设

=50...如果这是总体的真实均值样本均值m=50抽样分布H0这个值不像我们应该得到的样本均值...20原假设(nullhypothesis)研究者想收集证据予以反对的假设又称“0假设〞总是有符号,或表示为H0H0:=某一数值例如,H0:10cm研究者想收集证据予以支持的假设也称“研究假设〞总是有符号,或表示为H1H1:<某一数值,或某一数值例如,H1:<10cm,或10cm备择假设(alternativehypothesis)一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,那么说明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和备择假设提出假设解:研究者想收集证据予以证明的假设应该是“生产过程不正常〞。建立的原假设和备择假设为H0:10cmH1:10cm某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设解:研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述。建立的原假设和备择假设为

H0:

500H1:

<500500g提出假设一家研究机构估计,某城市中家庭拥有汽车的比例超过30%。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设解:研究者想收集证据予以支持的假设是“该城市中家庭拥有汽车的比例超过30%〞。建立的原假设和备择假设为H0:30%H1:30%提出假设原假设和备择假设是一个完备事件组,而且相互对立在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立先确定备择假设,再确定原假设等号“=〞总是放在原假设上因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)提出假设(结论与建议)课本例5-1某校高中一年级试用一种新的教学法学习数学,根据实验结果知道,用原来的教学法,数学考试平均成绩为79分〔记为m0〕,标准差为11分〔记为s0〕,使用新的教学方法后,从中随机抽取参加试验的30人〔记为n〕,计算得到他们的数学平均成绩为84分〔记为〕,能否从总体上说新的教学法与原来的教学法存在差异或者说新的教学法优于原来的教学法?H0〔原假设〕:新的教学法与原来的教学法不存在差异,m=m0m0数学考试平均成绩为79分〔记为m0〕标准差为11分〔记为s0〕样本均值的抽样分布假设检验中的小概率原理什么小概率?1. 小概率事件指的是在一次试验中,不可能发生的事件发生;2. 在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设3. 小概率由研究者事先确定,为显著性水平

0.05、0.01、0.001m0样本均值的抽样分布样本均值的抽样分布m00.025

0.025

样本统计量0.95置信水平小概率事件指的是在一次试验中,不可能发生的事件发生;显著性水平和拒绝域接受H0m00.025

0.025

样本统计量拒绝H0拒绝H00.95置信水平显著性水平和拒绝域抽样分布m0临界值临界值a/2a/2

样本统计量拒绝H0拒绝H01-

置信水平a越大,接受域区间就会较小;a越小,接受域区间就会较大。0临界值临界值

a/2a/2

样本统计量拒绝H0拒绝H0抽样分布1-

置信水平显著性水平和拒绝域(双侧检验)0临界值临界值a/2

a/2

样本统计量拒绝H0拒绝H0抽样分布1-

置信水平显著性水平和拒绝域(双侧检验)0临界值临界值a/2

a/2

样本统计量拒绝H0拒绝H0抽样分布1-

置信水平显著性水平和拒绝域(双侧检验)课堂提问:1.什么叫0假设,其符号为,其表现形式为?2.什么叫备择假设,其符号为,其表现形式为?3.什么叫小概率事件,它在假设检验中有何规那么?4.请根据图形指出,哪些区域是零假设的拒绝域,哪些区域是零假设的接受域?5.显著性水平取值越大,接受域区间就越大,反之,接受域区间就越小。这句话对吗?假设检验中的两类错误第Ⅰ类错误(弃真错误)原假设为真时拒绝原假设第Ⅰ类错误的概率记为

被称为显著性水平第Ⅱ类错误(取伪错误)原假设为假时未拒绝原假设第Ⅱ类错误的概率记为

(Beta)

H0为真时样本平均数的分布。H1为真时样本平均数的分布。陪审团审判裁决实际情况无罪有罪无罪正确错误有罪错误正确H0检验决策实际情况H0为真H0为假未拒绝H0正确决策(1–a)第Ⅱ类错误(b)拒绝H0第Ⅰ类错误(a)正确决策(1-b)假设检验就好似一场审判过程统计检验过程假设检验中的两类错误

错误和

错误的关系

你不能同时减少两类错误!

的关系就像翘翘板,

就大,

就小影响

错误的因素1. 显著性水平

对于固定的n当

减少时

增大,但

+12. 总体标准差

增大时增大3. 样本容量

n当n增大、减少4.真伪值的距离。距离越短越大,犯Ⅱ类错误越大统计成效和效果量1. 统计成效等于1-,即当零假设不为真时,拒绝零假设的概率。统计成效实际上反映了通过有效的实验处理发现存在的差异的概率,即检验的效率。其值越大越好。2. 效果量〔effectsize〕是实验处理的效应大小,或者自变量和因变量关系的大小。效果量反映了零假设不为真的程度。3. 样本容量n,水平、效果量和统计成效这四者之间的关系是:其中任意一个都是其余三个的函数。在样本容量和水平等情形都确定的情况下,效果量增加或减少,统计成效值也随之增加或减少,反之亦然。统计成效和效果量4. 计算统计成效〔1-〕主要有两个功能:A.对于一定的效果量和水平,确定获得统计显著性所需要的样本容量;B.评价已完成的研究或者实验,尤其是统计不显著的结论,通过统计成效的计算可得知是不是由于样本容量缺乏而未能到达统计显著性。备择假设没有特定的方向性,并含有符号“〞的假设检验,称为双侧检验或双尾检验(two-tailedtest)备择假设具有特定的方向性,并含有符号“>〞或“<〞的假设检验,称为单侧检验或单尾检验(one-tailedtest)备择假设的方向为“<〞,称为左侧检验备择假设的方向为“>〞,称为右侧检验双侧检验与单侧检验假设双侧检验单侧检验左侧检验右侧检验原假设H0:m

=m0H0:m

m0H0:m

m0备择假设H1:m

≠m0H1:m

<m0H1:m

>m0双侧检验与单侧检验m0临界值a样本统计量拒绝H0抽样分布1-

置信水平显著性水平和拒绝域(单侧检验)m0临界值a样本统计量拒绝H0抽样分布1-

置信水平观察到的样本统计量显著性水平和拒绝域(左侧检验)m0临界值a样本统计量拒绝H0抽样分布1-

置信水平观察到的样本统计量显著性水平和拒绝域(右侧检验)给定显著性水平,查表得出相应的临界值z或z/2,t或t/2将检验统计量的值与水平的临界值进行比较作出决策双侧检验:统计量>临界值,拒绝H0左侧检验:统计量<临界值,拒绝H0右侧检验:统计量>临界值,拒绝H0思考题:绘图解释说明在样本容量和显著水平都不变的条件下,单侧检验犯

错误的概率比双侧检验要小。什么是P值?(P-value)在原假设为真的条件下,检验统计量的观察值大于或等于其计算值的概率双侧检验为分布中两侧面积的总和反映实际观测到的数据与原假设H0之间不一致的程度被称为观察到的(或实测的)显著性水平决策规那么:假设p值<,拒绝H0m0临界值a样本统计量拒绝H0抽样分布1-

置信水平计算出的样本统计量P值左侧检验的P值m0临界值a拒绝H0抽样分布1-

置信水平计算出的样本统计量P值右侧检验的P值双侧检验的P值

/

2

/

2Z拒绝H0拒绝H0m0临界值计算出的样本统计量计算出的样本统计量临界值1/2P值1/2P值m0数学考试平均成绩为79分〔记为m0〕标准差为11分〔记为s0〕样本均值的抽样分布假设检验步骤1.建立原假设和备择假设2.从所研究的总体中抽出一个随机样本3.在零假设成立的前提下,寻找和决定适宜的统计量及其抽样分布,并计算出统计量的值。常用的抽样分布:标准化的正态分布、t分布、F分布;对应的检验方法:Z检验、t检验和F检验。4.确定一个适当的显著性水平,并计算出其临界值,指定拒绝域5.将统计量的值与临界值进行比较,作出决策统计量的值落在拒绝域,拒绝H0,否那么不拒绝H0也可以直接利用P值作出决策二、总体均值的显著性检验一、总体服从正态分布,总体方差s2设x1,x2,…,xn是来自正态总体N〔m0,s2〕的样本容量为n的随机样本,那么对均值是否等于值作出检验。此时的假设检验成为Z检验。1.假设检验的两个假设:H0:m=m0〔m0〕H1:mm02.由于s2,且样本来自于正态总体,那么样本均数的抽样分布均值为m,方差为s2/n。由此,可计算统计量:一、总体服从正态分布,总体方差s2设x1,x2,…,xn是来自正态总体N〔m0,s2〕的样本容量为n的随机样本,那么对均值是否等于值作出检验。此时的假设检验成为Z检验。3.对于选定的显著性水平a,查标准化的正态分布表得到临界值Za/2。,或4.比较统计量Z与Za/2的值,假设∣Z∣>Za/2,那么拒绝零假设H0;假设∣Z∣Za/2,那么接受零假设H0。一、总体服从正态分布,总体方差s2例5-4.全市统一考试的数学平均分m0=62分,标准差s0=10.2分,市内一所学校的90名学生在该次考试的平均成绩为68分,问该校成绩与全市平均成绩的差异是否显著〔a=0.05〕?解:〔1〕提出假设H0:m=62;H1:m62〔2〕计算统计量〔3〕由显著性水平a=0.05,查表得Za/2=1.96〔4〕∣Z∣=5.58>1.96一、总体服从正态分布,总体方差s2例5-5.某高校参加同专业的统一考试,随机抽查64份问卷,由此求得平均成绩为69分,标准差为9.5分。该科全体考生成绩服从正态分布,且总平均分为65分,问该校考生的平均成绩是否高于全体考生的平均水平〔a=0.05〕?解:〔1〕提出假设H0:m65;H1:m>65〔2〕计算统计量〔3〕由显著性水平a=0.05,查表得Za=1.64〔4〕∣Z∣=3.37>1.64二、总体服从正态分布,总体方差s2未知设x1,x2,…,xn是来自正态总体N〔m0,s2〕的样本容量为n的随机样本,当方差未知时,可用其无偏估计量S2来代替。此时的假设检验成为t检验。1.假设检验的两个假设:H0:m=m0〔m0〕H1:mm02.由于s2未知,那么先计算样本的方差S2,再计算统计量:二、总体服从正态分布,总体方差s2未知设x1,x2,…,xn是来自正态总体N〔m0,s2〕的样本容量为n的随机样本,当方差未知时,可用其无偏估计量S2来代替。此时的假设检验成为t检验。3.对于选定的显著性水平a,自抽取样本中计算得到的自由度df=n-1,查t分布表得到临界值ta/2〔df〕。4.比较统计量与临界值ta/2,假设∣t∣>ta/2,那么拒绝零假设H0;假设∣t∣ta/2,那么接受零假设H0。二、总体服从正态分布,总体方差s2未知例5-6.学生的学习成绩与教师的教学方法有关。某校一教师采用了一种他认为是新式有效的教学方法。经过一年的教学后,从该教师所教班级中随机抽取了6名学生的考试成绩,分别为48.5,49.0,53.5,49.5,56.0,52.5,而在该学年考试中,全年级的总平均分数为52.0,试分析这种教学方法与未采用新教学方法的学生成绩有无显著性差异〔考生成绩服从正态分布,取a=0.05〕?解:计算样本均值为51.5,样本标准差S为2.98〔1〕提出假设H0:m=52;H1:m52〔2〕计算统计量〔3〕由显著性水平a=0.05,自由度df=6-1=5,查表得ta/2(5)=2.571〔4〕∣t∣=0.41<ta/2(5)=2.571二、总体服从正态分布,总体方差s2未知例5-7.某省进行数学竞赛,发现分数分布不是正态分布。竞赛的总平均分是43.5分。某市参加竞赛的学生168人,平均分为45.1,S=18.7,问该市平均分与省平均分是否有显著差异〔取a=0.05〕?解:〔1〕提出假设H0:m=43.5;H1:m43.5〔2〕计算统计量〔3〕由显著性水平a=0.05,,查表得Za/2=1.96〔4〕∣Z∣=1.11<Za/2=1.96

是否已知小样本容量n大

是否已知否t检验否z检验是z检验

是z检验总体均值的显著性检验总结假设双侧检验左侧检验右侧检验假设形式H0:m=m0H1:

m

m0H0:m

m0H1:m<m0H0:

m

m0

H1:

m>m0统计量

已知:

未知:拒绝域P值决策拒绝H0大样本的总体均值显著性检验假设双侧检验左侧检验右侧检验假设形式H0:m=m0H1:

m

m0H0:m

m0H1:

m<m0H0:

m

m0

H1:

m>m0统计量

已知:

未知:拒绝域P值决策拒绝H0注:的拒绝域同大样本小样本的总体均值显著性检验1.一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为255.8ml。取显著性水平

=0.05,检验该天生产的饮料容量是否符合标准要求?H0

0=

1=255H1

0

1

=0.05n=40临界值:Z/2=1.96检验统计量:z01.96-1.960.025拒绝H0拒绝H00.025决策:结论:

|Z|=1.01<1.96,即接受原假设H0样本提供的证据说明:该天生产的饮料符合标准要求2.一种机床加工的零件尺寸绝对平均误差允许值为1.35mm。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低?(

=0.01)50个零件尺寸的误差数据(mm)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.161.121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.86H0

1

0=1.35H1

1<

0

=0.01n=50临界值:Z

=2.33检验统计量:|Z|=2.6061>2.33,即拒绝原假设H0新机床加工的零件尺寸的平均误差与旧机床相比有显著降低决策:结论:-2.33z0拒绝H00.01P值的图示0-2.33a=0.01z拒绝H0抽样分布1-

计算出的样本统计量=-2.6061P值P=0.004579

3.某一小麦品种的平均产量为5200kg/hm2。一家研究机构对小麦品种进行了改进以期提高产量。为检验改进后的新品种产量是否有显著提高,随机抽取了36个地块进行试种,得到的样本平均产量为5275kg/hm2,标准差为120/hm2。试检验改进后的新品种产量是否有显著提高?(=0.05)H0

5200H1

>5200

=0.05n=36临界值:Z

=1.645检验统计量:|Z|=3.75>1.645,即拒绝原假设H0

(P=0.000088<

=0.05)改进后的新品种产量有显著提高。决策:结论:z0拒绝H00.051.645抽样分布P=0.00008801.645a=0.05拒绝H01-

计算出的样本统计量=3.75P值P值的图示4.一种汽车配件的平均长度要求为12cm,高于或低于该标准均被认为是不合格的。汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进。现对一个配件提供商提供的10个样本进行了检验。假定该供货商生产的配件长度服从正态分布,在0.05的显著性水平下,检验该供货商提供的配件是否符合要求?

10个零件尺寸的长度(cm)12.210.812.011.811.912.411.312.212.012.3H0

=12H1

12

=0.05df=10-1=9临界值:t/2=2.262检验统计量:|t|=0.7035<2.262即接受原假设H0该供货商提供的零件符合要求。

决策:结论:t02.262-2.2620.025拒绝H0拒绝H00.025三、两总体均值差异的显著性检验一、两组样本相互独立,总体方差s12与s22设有两个服从正态分布的相互独立的总体X和Y,它们的均值分别为m1和m2,方差分别为s12与s22,x1,x2,…,xn和y1,y2,…,yn是分别来自X和Y的两组独立的随机样本,我们要根据两组样本的信息,检验出两总体均值m1和m2差异是否显著的结论。方差的一个重要性质是:当两个变量独立时,其和或差的方差等于各自方差的和,即:sX+Y2=sX2+sY2或sX-Y2=sX2+sY2由抽样分布的理论可知,来自X的样本均数方差为s12/n1,来自Y的样本均数方差为s22/n2,因而的方差为:一、两组样本相互独立,总体方差s12与s22设有两个服从正态分布的相互独立的总体X和Y,它们的均值分别为m1和m2,方差分别为s12与s22,x1,x2,…,xn和y1,y2,…,yn是分别来自X和Y的两组独立的随机样本,我们要根据两组样本的信息,检验出两总体均值m1和m2差异是否显著的结论。那么下面的统计量将服从标准正态分布,应用Z检验的步骤和方法,就可以得到假设检验的结果。一、两组样本相互独立,总体方差s12与s22例5-8在参加了全国统一考试后,考生某科成绩服从正态分布。在甲省抽取657名考生的成绩,得到平均分为57.41的分,且该省的总标准差为5.77分;在乙省抽取686名考生的成绩,得到平均分为55.95分,该省的总标准差为5.17分。问两省考生在该次考试中,平均分是否有显著差异〔取a=0.01〕?解:〔1〕提出假设:H0:1=2;H1:12〔2〕计算统计量一、两组样本相互独立,总体方差s12与s22例5-8在参加了全国统一考试后,考生某科成绩服从正态分布。在甲省抽取657名考生的成绩,得到平均分为57.41的分,且该省的总标准差为5.77分;在乙省抽取686名考生的成绩,得到平均分为55.95分,该省的总标准差为5.17分。问两省考生在该次考试中,平均分是否有显著差异〔取a=0.01〕?解:〔3〕对给出的a=0.01,查表得到临界值Z0.01/2=2.58〔4〕Z=4.88>Z0.01/2=2.58。二、两组样本相互独立,总体方差未知,且s12=s22如果我们要检验零假设H0:

1=

2,而当总体方差相等即零假设成立的情况下,我们可以计算出两个样本平均数和两个样本方差。从抽样分布的理论可知,下面的统计量将服从自由度为df=n1+n2-2的t分布。二、两组样本相互独立,总体方差未知,且s12=s22根据以上信息,我们就可以根据给定的显著性水平a以及计算得到的自由度df,查t分布表得到临界值ta/2〔df〕。假设∣t∣>ta/2,那么拒绝零假设H0;假设∣t∣ta/2,那么接受零假设H0。例5-9.某校进行一项智力速度测验,共有19名学生参加,其中男生12人,女生7人。测验共200题,在规定时间里,答对1题记1分。测验结束后,得到以下测验成绩:男生12人:83、146、119、104、120、161、107、134、115、129、99、123;女生7人:70、118、101、85、107、132、94;试确定男女生平均成绩有无显著差异〔a=0.05〕二、两组样本相互独立,总体方差未知,且s12=s22解:〔1〕检验假设:H0:1=2;H1:12〔2〕计算统计量:平均成绩1=120,平均成绩2=101;s12=445.82,s22=425.33〔3〕给定的a=0.05,且df=12+7-2=17,查表ta/2〔17〕=2.11三、两组样本相互独立,总体方差未知,且s12≠s22如果方差不等,或者方差不齐性,如何比较两总体的平均数差异呢?在s12≠s22以及H0:1=2成立的条件下,上述统计量t不再服从自由度df=n1+n2-2的t分布。在这种情况下,我们应该采用下面两种近似的检验方法。〔1〕Aspin-Welch检验。三、两组样本相互独立,总体方差未知,且s12≠s22〔1〕Aspin-Welch检验。例5-10为了对某门教学方法进行改革,某校对各方面情况相似的两个班进行教改实验,甲班45人,采用教师面授的教学方法;乙班36人,采用教师讲授要点,学生讨论的方法。一学年后,用同一试题对两个班的学生进行测验,得到以下结果:甲班平均分69.5分,标准差为8.35分;一般平均分78.0分,标准差为16.5分。试问两种教学方法其效果是否有显著性差异(a=0.01)解:〔1〕检验假设为:H0:1=2;H1:12〔2〕计算检验统计量三、两组样本相互独立,总体方差未知,且s12≠s22例5-10为了对某门教学方法进行改革,某校对各方面情况相似的两个班进行教改实验,甲班45人,采用教师面授的教学方法;乙班36人,采用教师讲授要点,学生讨论的方法。一学年后,用同一试题对两个班的学生进行测验,得到以下结果:甲班平均分69.5分,标准差为8.35分;一般平均分78.0分,标准差为16.5分。试问两种教学方法其效果是否有显著性差异(a=0.01)解:三、两组样本相互独立,总体方差未知,且s12≠s22例5-10为了对某门教学方法进行改革,某校对各方面情况相似的两个班进行教改实验,甲班45人,采用教师面授的教学方法;乙班36人,采用教师讲授要点,学生讨论的方法。一学年后,用同一试题对两个班的学生进行测验,得到以下结果:甲班平均分69.5分,标准差为8.35分;一般平均分78.0分,标准差为16.5分。试问两种教学方法其效果是否有显著性差异(a=0.01)解:〔3〕计算df,求出临界值。三、两组样本相互独立,总体方差未知,且s12≠s22如果方差不等,或者方差不齐性,如何比较两总体的平均数差异呢?在s12≠s22以及H0:1=2成立的条件下,上述统计量t不再服从自由度df=n1+n2-2的t分布。在这种情况下,我们应该采用下面两种近似的检验方法。〔2〕Cochran-Cox检验。这种检验方法用ta/2(n1-1)与ta/2(n2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论