版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
假设检验问题:新推出的电视节目收视率高吗?在自然科学和社会科学等中,常常要对某些重要问题做出回答:是或否为了回答这些问题,我们需要对感兴趣的问题进行试验或观察获得相关数据
,根据这些数据决定是或否的过程称为假设检验。。
总体
假设检验的过程抽取随机样本均值
x
=20
我认为人口的平均年龄是50岁提出假设
拒绝假设别无选择!作出决策假设检验●统计推论是在随机抽样的基础上,根据样本资料对总体进行推论的一种方法,主要包括区间估计和假设检验等假设检验
一、总体和样本二、抽样分布三、抽样分布原理四、假设检验假设检验在许多情况下我们不必要或不可能进行全面调查。这时,要了解总体的情况,只能由样本统计量估计总体参数。中国统计年鉴2001中国人口统计年鉴中国市场统计年鉴世界发展报告世界经济年检工业普查数据中国统计出版社假设检验一、总体和样本总体:在统计分析中被调查的对象的全体样本:所抽取的一部分个体。涵义总体样本由被调查研究的全体个体组成调查研究的总体中某些个体组成特征量名称参数统计量符号总体集合的基数N总体平均数u总体标准差样本集合的基数n样本平均数样本标准差s假设检验二、抽样分布抽样分布:全部可能样本统计量的概率分布叫做抽样分布。如平均数抽样分布等抽样误差:某个样本的统计量和总体参数之间的差异为抽样误差。如平均数、标准差的抽样误差。对同一总体抽样,各次抽样的统计量并不相同。假设检验三、抽样分布原理假定一个实验小组有四人N=4,其写作成绩分别为:21、20、19、18(分)(25为满分)。若样本容量n=2,则全部可能样本(不重复抽样)是6个,6个样本及它们的平均数、标准差如下页表所示。假设检验三、抽样分布原理假设检验三、抽样分布原理样本容量n=2,则全部可能样本(重复抽样)是16个:
频数频率(%)18.010.0618.520.1319.030.1919.540.2520.030.1920.520.1321.010.06合计161.00假设检验三、抽样分布原理平均数抽样分布图:接近正态分布。
1818.51919.52020.521
=19.5;=0.79;==假设检验三、抽样分布原理中心极限定理当总体很大时,无论它呈现何种分布,只要样本容量n足够大,那么样本平均数的抽样分布,必定趋近于正态分布;从正态总体中抽取的全部可能样本,无论样本容量有多大,样本平均数的抽样分布必定遵从于正态分布;即使是非正态总体,只要n≥30,其抽样分布必定趋近于正态分布;抽样分布的平均数等于总体平均数
假设检验三、抽样分布原理中心极限定理抽样分布的标准差比总体标准差小,且随着样本容量的增加,抽样分布的标准差减小:也称为“抽样平均误差”。样本容量n越大,样本平均数围绕总体平均数摆动的幅度越小,样本平均数的分布曲线变得又窄又高,它意味着样本平均数落在总体平均数附近的概率也相应增大。假设检验三、抽样分布原理平均数的抽样分布及应用:▲例题:假定某大型公司全部推销员个人营业额(月)的总体分布如下图1,现从中抽取一个包括30人的随机样本,其样本平均数大于15750元的概率是多少?图1:总体分布:σ=2000图2:抽样分布
P?
15000X15000假设检验三、抽样分布原理●平均数的抽样分布及应用:解:由于n≥30,是容量为30的所有可能样本之一,15750是所有样本平均数随机变量之一,见图2。根据中心极限定理作适当变换,下列关系式成立:所以:Z=2.05,查表,对应概率为0.4798,故大于15750元的概率为0.5-0.4798=0.02。假设检验三、抽样分布原理平均数的抽样分布及应用:▲习题1:某次年级英语考试,全部考生成绩服从平均数为75分,标准差为8分的正态分布。从中随机抽取25人,其样本平均数偏离原总体平均数4分以上的可能性有多大?假设检验三、抽样分布原理▲习题1:某次年级英语考试,全部考生成绩服从平均数为75分,标准差为8分的正态分布。从中随机抽取25人,其样本平均数偏离原总体平均数4分以上的可能性有多大?假设检验三、抽样分布原理平均数的抽样分布及应用:▲习题2:某零售集团公司的所有商场资金流转天数为50天,标准差为18天,若对这些商场进行样本容量为36家的随机抽样调查,被调查商场资金流转天数平均在48—52天之间的概率是多少?假设检验三、抽样分布原理▲习题2:某零售集团公司的所有商场资金流转天数为:50天,标准差为18天,若对这些商场进行样本容量为36家的随机抽样调查,被调查商场资金流转天数平均在48—52天之间的概率是多少?假设检验三、抽样分布原理▲样本的容量与抽样平均误差的关系●从非正态分布的总体抽样,当样本容量足够大的时候,可以把抽样分布看成正态分布。●抽样平均数的平均误差是度量样本平均数在总体平均数周围分散程度的一个量。越小,说明样本平均数在总体平均数周围越集中,用这样的样本来推断总体的平均数的精确度越高;反之,推断总体的平均数的精确度越低。假设检验三、抽样分布原理▲样本的容量与抽样平均误差的关系●由上面的公式我们可以看出,对于指定的总体而言是常量,所以容量n越大,越小。
●但是,容量太大工作量也会随之增加。因此,一般情况下容量不小于30;对于平均数抽样,达到15就满足要求。假设检验三、抽样分布原理
对于无限总体(重复抽样),总体不会因抽样而发生改变,有限总体(不重复抽样)抽样会使剩下的个体被抽中的概率越来越大。有限总体(或不重复抽样)需作适当修正,公式如下:
当抽样比例n/N<0.05时,可以省略修正系数;当抽样比例n/N≥0.05时,一般需要使用修正系数。四、假设检验什么是假设?
假设是对总体参数的一种推断;如书店里平均消费大于25元吗?
总体平均看电视时间为12小时吗?我相信这个班级的平均成绩为80!四、假设检验
假设检验是在两种互相对立的行动之间,通过抽样实验来进行抉择的统计分析方法。基本思想总体我认为:总体平均年龄为50岁。(假设)拒绝样本均值为20样本假设样本均值
=50基本思想抽样分布样本均值不大可能为这个值…...如果这实际上是总体均值
因此拒绝零假设u=50.20H0H0cc假设检验的原理(小概率原理)如果对总体的某种假设是真实的,那么不利于或不能支持这一假设的事件A(小概率事件)在一次试验中几乎不可能发生的;要是在一次试验中A竟然发生了,就有理由怀疑该假设的真实性,拒绝这一假设。四、假设检验小概率事件未发生总体(某种假设)抽样样本(观察结果)检验(接受)(拒绝)小概率事件发生假设检验的一般步骤▲建立假设
原假设(无效假设,H0):两个总体均数相等;备择假设(H1):与H0相反;▲确定显著性水平(
)
区分大小概率事件的标准▲计算统计量选择不同的统计方法:u,t▲确定概率值▲做出推论四、假设检验假设检验的几个基本概念◎原假设,也称虚拟假设(无效假设、零假设)陈述需要检验的假设用H0
表示代表“正常”的情形总是包含等号“=”检验以“假定原假设为真”开始如:“全校学生平均月消费为600元”表示为:H0:μ=600。四、假设检验假设检验的几个基本概念◎备择假设,也称对立假设。 为零假设的对立情况备择假设用H1表示代表对“正常”情形挑战从不包含等号上例中“全校学生平均月消费为600元”的对立假设为H1:μ≠600。◎这里原假设H0与备择假设H1是互相对立的,其中只能有一个成立。若接受虚无假设H0,就必须拒绝对立假设H1;若接受对立假设H1,就必须拒绝虚无假设H0四、假设检验
检验过程是比较样本观察结果与总体假设的差异。差异显著,超过了临界点,拒绝H0;反之,差异不显著,接受H0差异临界点拒绝H0接受H0cc判断
怎样确定c?四、假设检验假设检验的几个基本概念◎显著性水平
定义如果零假设成立样本统计量不可能的取值区间,称为样本分布的拒绝域,用
表示;显著水平与置信度相反,它表示如果假设是真的,在某一界限范围以外样本平均数所占的百分比。四、假设检验假设检验的基本原理是根据小概率原理,做出是否接受原假设决定的。若α=5%,见下图:图中C1、
C2叫做临界值。临界值以外的部分是拒绝区。从图中可以看出,做一个检验时,使用的显著水平愈高,“零假设”为真而被拒绝的概率愈大。图中的样本平均数在接受区。但若使用α=10%的显著水平,平均数就可能落在拒绝区而被拒绝。◎进行假设检验时,通常要先规定显著水平。常用的显著水平为:α=0.1、0.05、0.01、0.02。四、假设检验假设检验的几个基本概念
(1)否定一个不真实的零假设在检验一个假设时(2)否定一个真实的零假设有四种可能结果(3)肯定一个不真实的零假设
(4)肯定一个真实的零假设拒绝区域与非拒绝区域图1法庭案例的拒绝区域与非拒绝区域.没有足够的证据证明被告是有罪的,因此,在这个区域原假设是不能被拒绝的.有足够的证据证明被告是有罪的,因此,在这一区域有关被告无罪的原假设被拒绝.C显著水平
临界点非拒绝区域
拒绝区域两类错误实际情形被告无罪被告有罪法庭的判决被告无罪正确的判决TypeIIorβ
错误被告有罪TypeIorα
错误正确的判决表1检验能力◎检验结论错误H0:无罪陪审团裁决0
检验实际情况实际情况裁决无罪有罪决策H0
为真H0为假无罪正确错误不拒绝H0置信度1-α第二类错误
有罪错误正确拒绝H0第一类错误
1-
H1:有罪四、假设检验假设检验的几个基本概念◎检验结论错误
第一类错误弃真错误后果往往严重出现第一类错误的概率为
,等于显著性水平
第二类错误取伪错误出现第二类错误的概率为
与
的逆向关系
不能同时降低两类错误!α大β就小,α小β就大基本原则:力求在控制α前提下减少β
α——显著性水平,取值:0.1,0.05,0.001等;如果犯I类错误损失更大,为减少损失,α值取小;如果犯II类错误损失更大,α值取大。
确定α,就确定了临界点c。①设有总体:X~N(μ,σ2),σ2已知。②随机抽样:样本均值③标准化:④确定α值,⑤查概率表,知临界值⑥计算Z值,作出判断0接受区拒绝区拒绝区四、假设检验※假设检验双侧检验单侧检验左侧检验右侧检验双侧检验与单侧检验假设双侧检验单侧检验左侧检验右侧检验原假设H0:m
=m0H0:m
m0H0:m
m0备择假设H1:m
≠m0H1:m
<m0H1:m
>m0●双侧检验双侧检验的原假设与备择假设(以均值检验为例)临界值临界值拒绝域拒绝域接受域图1双侧检验示意图双侧检验案例1:根据美国人口普查数据,1998年美国家庭平均拥有人口3.18人。一研究人员想检验1998年以后,这一均值是否发生了变化。如果自1998年以后,家庭平均人口增加或减少了,那么家庭人口规模就发生了变化。双侧检验这是一个双侧检验的例子。以μ
表示现时所有家庭的平均人口,两个可能的决策是H0:μ=3.18(家庭规模没有发生变化)H1:μ≠3.18(家庭人口规模已经发生了变化)双侧检验一个检验是否是单尾或双尾的,由备择假设的符号决定.如果备择假设有不等号(≠),那么,这是一个双尾检验.双侧t
检验⑴.总体正态⑵.⑶.检验统计量
⑷.根据样本数据求得t
的取值,对规定,查表得临界值,若则拒绝,否则接受。
案例2:
1995年,已知某地20岁应征男青年的平均身高为168.5cm。2003年,在当地20岁应征男青年中随机抽取85人,平均身高为171.2cm,标准差为5.3cm,问2003年当地20岁应征男青年的身高与1995年相比是否不同?
检验界值u0.05/2=1.96,u0.01/2=2.58,u>u0.01/2,得P<0.01,按α=0.05水准,拒绝H0,接受H1,2003年当地20岁应征男青年与1995年相比,差别有统计学意义。可认为2003年当地20岁应征男青年的身高有变化,比1995年增高了。
2003年当地20岁应征男青年身高总体均数的95%的可信区间为170.1~172.3cm。该区间的下限已高于1995年身高的总体均数168.5cm,也说明2003年20岁应征男青年增高了。单侧检验
单侧检验不仅考虑是否相等,在不等时还要考虑方向。单侧检验有两种情况:左侧检验和右侧检验。●单侧检验
左侧检验
左侧检验的原假设与备择假设(以均值检验为例)临界值拒绝域接受域图2左单侧检验示意图左侧检验
案例3:一饮料公司声称,其饮料罐,平均来说,容纳了12盎司的苏打.然而,如果这些饮料罐容纳的饮料如果少于规定数量,那么这个公司将被指控消费者欺诈.假定一消费代理处需要做一检验,以检验苏打容量平均来说是否少于12盎司.左侧检验以μ表示所有饮料罐的平均苏打容量.两个可能的决策是H0:μ=12盎司(均值不小于12盎司)H1:μ<12盎司(均值小于12盎司)左侧检验当备择假设包含一小于符号
(<)时,这一检验是左尾检验。右侧检验
右侧检验的原假设与备择假设(以均值检验为例)临界值拒绝域接受域图3右单侧检验示意图右侧检验
案例4:根据美国教师联合会1999年的一份研究,1997–98年度学校教师的平均起薪是$25,735.我们需要做一关于美国教师平均起薪检验,检验其是否高于$25,735。右侧检验以μ表示全美学校教师的平均起薪,两个可能的决策是H0:μ=$25,735(其新均值不高于$25,735)H1
:μ>$25,735(其新均值高于$25,735)右侧检验当备择假设中包含大于符号
(>)时,检验是右尾检验.双尾检验单侧左尾检验单侧右尾检验原假设H0中的符号==or≥=or≤备择假设中H1的符号≠<>拒绝域两侧左侧右侧单侧Z
检验⑴.总体正态,或n
较大()⑵.⑶.检验统计量
⑷.根据样本数据求得Z
的取值,对规定的,查表得临界值或。对于右侧检验则拒绝,否则接受。或若若则拒绝,否则接受。而对于左侧检验单侧t
检验⑴.总体正态⑵.⑶.检验统计量
⑷.根据样本数据求得t
的取值,对于右侧检验则拒绝,否则接受。或则拒绝,否则接受。而对于左侧检验若若
案例5:消费者协会接到消费者投诉,指控品牌纸包装饮料存在容量不足,有欺骗消费者之嫌。包装上标明的容量为250毫升。消费者协会从市场上随机抽取50盒该品牌纸包装饮品,测试发现平均含量为248毫升,小于250毫升。这是生产中正常的波动,还是厂商的有意行为?消费者协会能否根据该样本数据,判定饮料厂商欺骗了消费者呢?
分析:例2中按历史资料,总体的标准差是4毫升。我们通过检验总体均值是否等于250毫升,来判断饮料厂商是否欺骗了消费者。消费者协会实际要进行的是一项统计检验工作。检验总体平均=250是否成立。程序如下:第一步:确定原假设与备选假设。:=250;:<250
以上的备选假设是总体均值小于250毫升,因为消费者协会希望通过样本数据推断出厂商的欺骗行为(大于250毫升一般不会发生)。因此使用左侧检验。
第二步:构造出检验统计量。我们知道,如果总体的标准差已知,则正态总体(正常情况下,生产饮料的容量服从正态分布)的抽样平均数,也服从正态分布,对它进行标准化变换,可得到:
可用z作为检验统计量。
第三步:确定显著性水平,确定拒绝域。通常显著水平由实际问题确定,我们这里取α=0.05,左侧检验,拒绝域安排在左边,查标准正态分布表得临界值:-=-1.645,拒绝域是z<-1.645。第四步:计算检验统计量的数值。样本平均数,n=50,代入检验统计量得:
第五步:判断。检验统计量的样本取值落入拒绝域。拒绝原假设,接受备选假设,认为有足够的证据说明该种纸包饮料的平均容量小于包装盒上注明的250毫升,厂商有欺诈之嫌。案例6麻省储蓄银行的经理一直很注重为客户提供服务的质量。在旧计算机系统下,应答机每小时平均可服务22名客户.。银行管理层注意到如果以这种效率提供服务,客户等待时间将会很长。最近银行管理层更换了计算机系统,期望以此提高服务的效率,缩短客户等待时间,从而提高顾客满意度。案例6为检测新系统是否比旧系统更具效率,银行管理层随机地选取了18个小时作为一个样本,发现,这些时间内平均每小时每个应答机服务的顾客人数为28人,而标准差为2.5人.在1%的显著水平下,你能否得出新系统更为有效的结论?假定出纳每小时服务的人数近似服从标准正态分布。案例6H0:μ=22新系统不具有更高效率H1:μ>22新系统更为有效的案例6样本为小样本总体近似正态分布总体标准差未知因此,使用t分布进行该检验案例6α=.01备择假设中的大于号表明该假设检验是单侧右侧检验右侧区域面积=α=.01df=n
–1=18–1=17临界值为2.567案例6α=.01
不拒绝H0拒绝H0临界值t02.567案例6根据H0案例6检验统计量的值t=10.182大于临界值落入拒绝区域由此,我们拒绝原假设H0案例7Priority健康俱乐部的管理层声称:“该组织会员在加入该组织后,在第一个月将减掉10磅或以上的体重”。一消费者组织想确认该说法是否属实,因而从该俱乐部随机选取了36名会员作为样本,发现所选取的会员在第一个月内平均减掉9.2磅,而该样本的标准差则为24磅。如果显著水平α=.01,你的决策是什么?如果α=.05呢?案例7H0:μ≥10 (平均减重10磅及以上 )H1:μ<10 (平均减重小于10磅)正态总体方差的检验——卡方(
2)检验1. 检验一个总体的方差或标准差2. 假设总体服从正态分布3. 原假设为H0:
2=
024. 检验统计量四、假设检验◎X2分布的特征:●x2分布是一个以自由度n-1为参数的分布族,自由度n-1决定了分布的形状,不同的自由度n-1有不同的x2分布。这一点与t分布相同。●x2分布是一种非对称分布。这一点与t分布和Z分布不同。x2分布一般为右偏分布。当n增大时,x2分布接近于正态分布。●x2分布的变量值始终为正值。四、假设检验◎X2分布:四、假设检验◎X2分布表的使用:当n=9,α=0.05时,x2值为X20.05=15.507。即对于8个自由度,得到的检验统计量x2值大于或等于15.507的概率为5%。当n=10,α=0.05时,x2值为X20.05=16.919。四、假设检验◎X2分布检验过程:1、建立假设:H0:σ2=σ02(或σ2≥σ02,σ2≤σ02)2、构造相应的检验统计量:~3、确定显著水平:一般使用α=0.05或0.10,0.014、制定决策规则:若是双侧检验,临界值为X21-α/2(n-1)和
X2α/2(n-1)拒绝区在两个尾端。若是单侧检验拒绝区只有一侧,左侧或右侧。5、计算临界值,并比较后得出结论。
2检验
例:长期正常生产的资料表明,某厂产品的厚度服从正态分布,其方差为0.25。现从某日产品中随机抽取20根,得修正的样本方差为0.42。试判断该日产品厚度是否与正常生产情况存在显著差异?(α=0.05)检验结果H0:
2=0.25,H1:
2
0.25
=0.10,n-1=
20-1=19接受区域:(10.117,30.144)统计量:结论:
在
=0.10的水平上拒绝H0,即有证据表明该日厚度的波动与正常生产情况时有显著差异。四、假设检验◎X2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 煤矿隐患管理制度
- 节约用水的宣传总结7篇
- 最吸引人的冷饮宣传语
- 【语文课件】怎样写景课件
- 第一单元语文教育课件
- 《变换句式》课件
- 2022年公务员多省联考《申论》真题(天津市级卷)及答案解析
- 2024年新高一英语初升高衔接《名词性从句》含答案解析
- 《总机构性能》课件
- 合成纤维纸市场发展现状调查及供需格局分析预测报告
- 2024山东省招聘社区工作者试题及答案
- 2024年全国宪法知识竞赛经典试题库及答案(共90题)
- 八年级地理上册 4.1《交通运输》教案 (新版)新人教版
- 2024年6月高考历史浙江卷试题答案详解及复习备考指导课件
- 2024-2025学年新教材高中生物 第五章 细胞的能量供应和利用 第2节 1 细胞的能量“货币”ATP教案 新人教版必修1
- 2024年团务附有答案
- 比赛中的行为经济学
- 代持股份免责协议书
- 2024年成都电子信息产业功能区建设发展有限责任公司招聘笔试冲刺题(带答案解析)
- 做一个有温度的护士课件
- 锂离子电池制造中的安全问题与防范措施
评论
0/150
提交评论