




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第4章假设检验1、假设检验概述2、假设检验的流程3、单总体参数检验4、双总体参数检验5、假设检验的局限性6、SPSS应用举例1第1节假设检验概述1、基本思想2、数据的适用范围24.1.1基本思想参数估计是探索性统计推断方法;假设检验是验证性统计推断方法;用样本数据验证对总体统计特征的某一观点;这一观点称为假设。34.1.1基本思想对总体的统计特征所作的陈述总体统计特征跟参数有关,称为参数假设检验,如:总体均值、比例、方差等总体统计特征跟参数无关,称为参数假设检验,分析之前必须陈述4什么是假设?
(hypothesis)我认为这批新生产的灯泡的合格率达到了市场的规范要求4.1.1基本思想先对总体的统计特征提出某种假设,然后利用样本信息判断假设是否成立的过程有参数检验和非参数检验逻辑上运用反证法,统计上依据小概率原理5什么是假设检验?
(hypothesistest)4.1.1基本思想什么是小概率事件原理?在一次试验中,一个几乎不可能发生的事件发生的概率。在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设。小概率由研究者事先确定。6假设检验中的小概率事件原理4.1.2数据的适用范围假设检验是对一组数据来源的总体的统计规律进行检验,包括一个总体或两个总体的均值、比例和方差。从数据观测值的特征来看,假设检验的方法对定性数据和定量数据的研究是通用的;从数据描述现象与时间的关系来看,假设检验适用于大多数截面数据而应用于分析时间序列数据的情形较少。对均值和方差的检验适用于定量数据,而对比例的检验适用于定性数据。7第2节假设检验的流程1、提出假设2、构造检验统计量3、计算检验统计量4、作出决策84.2.1提出假设研究者想收集证据予以反对的假设又称“0假设”总是有符号
,
或
表示为H0H0:
=某一数值
指定为符号
=,
或
例如,
H0:
10cm9原假设
(nullhypothesis)null4.2.1提出假设之所以用零来修饰原假设,其原因是原假设的内容总是表示没有差异或没有改变,或变量间没有关系等等零假设总是一个与总体参数有关的问题,所以总是用希腊字母表示。关于样本统计量如样本均值或样本均值之差的零假设是没有意义的,因为样本统计量是已知的,当然能说出它们等于几或是否相等10为什么叫0假设?
4.2.1提出假设研究者想收集证据予以支持的假设也称“研究假设”总是有符号
,
或
表示为
H1H1:
<某一数值,或
某一数值例如,H1:
<10cm,或
10cm11备择假设(alternativehypothesis)4.2.1提出假设【例4.1】一种零件的生产标准是直径应为20cm。为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于20cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和备择假设。12例题分析解:研究者是想收集证据来证明生产过程不正常。因此,建立的原假设和备择假设分别为H0:
20cmH1:
20cm4.2.1提出假设(1)原假设与备择假设是一对完备的事件组,且是一对完全互斥事件。一项检验中,原假设和备择假设有且仅有一项成立。(2)原假设是假设总体参数未发生改变,备择假设是假设总体参数发生了变化,所以"="总是在原假设上。(3)假设是基于研究者的角度和立场出发的,同样的问题因立场不同会有完全不同方向的假设,也可能得出不同的结论。13原假设与备择假设关系4.2.1提出假设14
假设检验的基本形式4.2.1提出假设逻辑上用了反证法,原假设与备择假设的选择至关重要从南京彭宇案与美国辛普森杀妻案的对比分析来看假设选择的重要性。2018年上半年的“俄国间谍中毒案”引发的英俄外交风波法庭审判中的“疑点归于被告”or“疑点归于原告”,“无罪推定”or“有罪推定”在假设检验中,属于“疑点归于原假设”或“原假设推定”15原假设与备择假设的选择4.2.2构造检验统计量基于原假设构造检验统计量,即假设原假设为真时,检验统计量满足一抽样分布;根据样本观察值计算检验统计量的值;根据抽样分布计算检验统计量值的概率;如果概率很小,拒绝原假设,说明备择假设所述结论是显著的;否则,不能拒绝原假设,说明备择假设所述结论是不显著。16检验的基本思想4.2.2构造检验统计量首先提出一个假设,如业主月收入的平均值为8000元。如果样本数据中,某户业主的月收入为7000元,显然与8000元存在一定的差距。样本(7000元)与假设(8000元)之间的差距有可能是由于抽样误差或系统误差引起的。依据小概率事件原理,计算在假设成立的条件下,样本值或更极端值发生的概率。如果7000元发生的概率较大,则没有理由认为8000元的假设是不成立的,即不拒绝原假设;反之,如果7000元发生的概率极小,依据小概率事件在一次实验中是几乎不可能发生的原理。它应该是不该发生的事情。但事实是∶这件本不该发生的事件却恰恰在这一次试验中发生了。对此只能认为8000元的假设是不成立的,即拒绝原假设。17对某居民小区业主的月收入平均值进行假设检验4.2.3计算检验统计量在完成第二步检验统计量的选择后,所选择的不同检验统计量所对应的计算公式需要不同的参数,这些参数可以根据样本数据得来,将参数带入公式后即可计算得到小概率事件的概率。例如,引入案例中所对应的检验统计量为,根据样本数据计算出和代入后即可得到相应的概率。184.2.4作出决策19假设检验中的两类错误1. 第Ⅰ类错误(弃真错误)原假设为正确时拒绝原假设第Ⅰ类错误的概率记为
被称为显著性水平2. 第Ⅱ类错误(取伪错误)原假设为错误时未拒绝原假设第Ⅱ类错误的概率记为
(Beta)4.2.4作出决策20假设检验中的两类错误(决策结果)H0:无罪假设检验就好像一场审判过程统计检验过程4.2.4作出决策21
和
的关系
你要同时减少两类错误的唯一办法是增加样本容量!
和
的关系就像翘翘板,
小
就大,
大
就小4.2.4作出决策22两类错误的控制1.一般来说,对于一个给定的样本,如果犯第Ι类错误的代价比犯第Ⅱ类错误的代价相对较高,则将犯第Ⅰ类错误的概率定得低些较为合理;反之,如果犯第Ι类错误的代价比犯第Ⅱ类错误的代价相对较低,则将犯第Ⅰ类错误的概率定得高些2.一般来说,发生哪一类错误的后果更为严重,就应该首要控制哪类错误发生的概率。但由于犯第Ι类错误的概率是可以由研究者控制的,因此在假设检验中,人们往往先控制第Ι类错误的发生概率4.2.4作出决策23显著性水平(significantlevel)假设检验中犯第Ⅰ类错误的概率,记为。1. 是一个概率值2. 原假设为真时,拒绝原假设的概率抽样分布的拒绝域3. 表示为
(alpha)常用的
值有0.01,0.05,0.104. 由研究者事先确定4.2.4作出决策24统计显著性在假设检验中,如果样本提供的证据拒绝原假设,我们说检验的结果是显著的,如果不拒绝原假设,我们则说结果是不显著的。一项检验在统计上是“显著的”,意思是指:这样的(样本)结果不是偶然得到的,或者说,不是靠机遇能够得到的。拒绝原假设,表示这样的样本结果并不是偶然得到的;不拒绝原假设(拒绝原假设的证据不充分),则表示这样的样本结果只是偶然得到的。注:不拒绝不意味着原假设正确。4.2.4作出决策——利用检验统计量25检验统计量(teststatistic)根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量对样本估计量的标准化结果原假设H0为真点估计量的抽样分布拒绝域:能够拒绝原假设的检验统计量的所有取值组成的集合4.2.4作出决策——利用检验统计量26抽样分布H0临界值临界值a/2a/2
拒绝H0拒绝H01-
置信水平拒绝域非拒绝域拒绝域显著性水平和拒绝域(双侧检验)4.2.4作出决策——利用检验统计量27显著性水平和拒绝域(双侧检验)H0临界值临界值a/2
a/2样本统计量拒绝H0拒绝H0抽样分布1-
置信水平4.2.4作出决策——利用检验统计量28显著性水平和拒绝域(双侧检验)H0临界值临界值
a/2a/2样本统计量拒绝H0拒绝H0抽样分布1-
置信水平4.2.4作出决策——利用检验统计量29显著性水平和拒绝域(双侧检验)H0临界值临界值a/2
a/2样本统计量拒绝H0拒绝H0抽样分布1-
置信水平4.2.4作出决策——利用检验统计量30显著性水平和拒绝域(单侧检验)H0临界值a拒绝H0抽样分布1-
置信水平RegionofRejectionRegionofNonrejection4.2.4作出决策——利用检验统计量31显著性水平和拒绝域(左侧检验)H0临界值a拒绝H0抽样分布1-
置信水平样本统计量4.2.4作出决策——利用检验统计量32显著性水平和拒绝域(左侧检验)H0临界值a样本统计量拒绝H0抽样分布1-
置信水平4.2.4作出决策——利用检验统计量33显著性水平和拒绝域(右侧检验)H0临界值a样本统计量拒绝H0抽样分布1-
置信水平4.2.4作出决策——利用检验统计量34显著性水平和拒绝域(右侧检验)H0临界值a样本统计量抽样分布1-
置信水平拒绝H04.2.4作出决策——利用检验统计量35决策规则给定显著性水平
,查表得出相应的临界值z
或z
/2,t
或t
/2将检验统计量的值与
水平的临界值进行比较作出决策双侧检验:I统计量I>临界值,拒绝H0左侧检验:统计量<-临界值,拒绝H0右侧检验:统计量>临界值,拒绝H04.2.4作出决策——利用P值进行决策36什么是P值?
(P-value)如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率P值告诉我们:如果原假设是正确的话,我们得到目前这个样本数据的可能性有多大,如果这个可能性很小,就应该拒绝原假设被称为观察到的(或实测的)显著性水平决策规则:若p值<
,拒绝H04.2.4作出决策——利用检验统计量37双侧检验的P值
/
2
/
2Z拒绝H0拒绝H00临界值计算出的样本统计量计算出的样本统计量临界值1/2P值1/2P值4.2.4作出决策——利用检验统计量38左侧检验的P值0临界值a样本统计量拒绝H0抽样分布1-
置信水平计算出的样本统计量P值4.2.4作出决策——利用检验统计量39右侧检验的P值0临界值a拒绝H0抽样分布1-
置信水平计算出的样本统计量P值4.2.4作出决策——利用P值进行决策40利用P值进行决策,需要计算出P值,将其与事先确定的显著性水平进行比较,根据比较结果确定是否拒绝原假设。如果计算得到的P值小于显著性水平,则说明此时拒绝原假设犯错误的概率小于预先设定的水平,不太可能犯错误,所以可以拒绝原假设;如果P值大于显著性水平,则说明拒绝原假设犯错误的概率大于预先设定的水平,犯错误的可能性很大,所以不能拒绝原假设。当P≤时,拒绝原假设H0;当P>时,不拒绝原假设H0。4.2.5假设检验结论的表述41“显著”与“不显著”1.当拒绝原假设时,我们称样本结果是统计上显著的拒绝原假设时结论是清楚的2.当不拒绝原假设时,我们称样本结果是统计上不显著的不拒绝原假设时,并未给出明确的结论,不能说原假设是正确的,也不能说它不是正确的4.2.5假设检验结论的表述42“接受”与“不拒绝”假设检验的目的在于试图找到证据拒绝原假设,而不在于证明什么是正确的当没有足够证据拒绝原假设时,不采用“接受原假设”的表述,而采用“不拒绝原假设”的表述。“不拒绝”的表述实际上意味着并未给出明确的结论,我们没有说原假设正确,也没有说它不正确“接受”的说法有时会产生误导,因为这种说法似乎暗示着原假设已经被证明是正确的了。但事实上,H0的真实值我们永远也无法知道,H0只是对总体真实值的一个假定值,由样本提供的信息也就自然无法证明它是否正确4.2.5假设检验结论的表述43假设检验的步骤根据描述和样本信息确定原假设与备择假设。选择检验统计量并计算具体数值。确定显著性水平。作出决策∶利用统计量检验或利用P值进行决策。利用统计量检验∶根据显著性水平计算临界值与拒绝域,统计量的值落在拒绝域则拒绝H0,否则不拒绝H0利用P值进行决策∶当P<时,拒绝原假设H0;当P>时,不拒绝原假设H0第3节单总体参数检验1、单总体均值的检验2、单总体比例的检验3、单总体方差的检验444.3.1单总体均值的检验45本方法用于检验单个总体的质量水平,它所适用的数据类型为定量数据,所选取的检验统计量与样本大小、总体是否服从正态分布和总体方差是否已知有关。当样本容量n<30时,为小样本;当样本容量n≥30时,为大样本。检验方法分为大样本数据的检验方法和小样本数据的检验方法两大类。4.3.1单总体均值的检验46大样本数据的单总体均值检验1. 假定条件正态总体或非正态总体大样本(n
30)使用z检验统计量
2
已知:
2
未知:4.3.1单总体均值的检验47例题分析【例4.2】为了解某届考生的考试水平,某次考试后从中随机抽取了49位考生的成绩,通过计算得到这49位考生的平均成绩为72.5分,标准差为14,取显著性水平为0.05,问∶是否可以认为在此次考试中全体考生的平均成绩为70分?双侧检验4.3.1单总体均值的检验48H0
:
=70H1
:
70
=0.05n
=49临界值(c):检验统计量:决策:不拒绝H0结论:
不能证明该班级考生的水平与平均水平有差异。(总体方差已知)4.3.1单总体均值的检验49例题分析【例4.3】经调查研究,某工厂以前所使用的一种设备对零件进行加工时,其尺寸的绝对平均误差为1.70mm。为使误差降低,该工厂新进了一批设备来加工该零件。为了检验与旧设备相比,新设备对零件加工的误差是否有显著性地降低,该工厂从某批加工的零件中抽取了36个进行检验。36个零件所测得的绝对误差数据如下∶那么,在显著性水平为0.01的情况下,是否可以认为与旧设备相比新设备加工的零件尺寸的平均误差有显著降低?
单侧检验(左侧检验)4.3.1单总体均值的检验50H0
:
=1.70H1
:
<1.70
=0.01n
=36临界值(c):z
=z0.01=-2.33z=-9.66<z=-2.33,检验统计量:决策:拒绝H0结论:
新设备加工的零件尺寸的平均误差与旧设备相比有显著降低。(总体方差未知)4.3.1单总体均值的检验51大样本数据的单总体均值检验4.3.1单总体均值的检验52小样本数据的单总体均值检验1. 假定条件总体服从正态分布小样本(n<
30)检验统计量
2
已知:
2
未知:4.3.1单总体均值的检验53例题分析【例4.4】一种飞机配件的标准直径为12cm,直径大于或小于12cm的配件都被认为不合格。飞机制造企业在购进配件时,对供货商提供的样品进行抽样检验。来决定是否采购。现从样品中抽取了10个样本进行检验,样本数据分别为(单位∶cm)∶12.2、10.8、11.8、12.0、12.4、11.9、12.2、11.3、12.3、12.0。假定供货商生产的配件长度服从正态分布,在显著性水平为0.05的情况下,能否确定该供货商提供的配件符合要求?双侧检验4.3.1单总体均值的检验54H0
:
=12H1
:
12
=0.05df
=10-1=9临界值(c):检验统计量:决策:不拒绝H0结论:
样本提供的数据不足以推翻"供货商提供的配件符合要求"的看法。4.3.1单总体均值的检验55小样本数据的单总体均值检验4.3.2单总体比例的检验56假定条件总体服从二项分布可用正态分布来近似(大样本)检验的z统计量
0为假设的总体比例4.3.2单总体比例的检验57例题分析【例4.5】某酒店主管经理估计顾客中20—30岁的会员占总人数的80%为了验证该估计是否正确,研究人员随机抽取了200位顾客,调查得知其中有146位是会员。分别取显著性水平
=0.05和
=0.01,判断该主管经理的估计是否正确。双侧检验4.3.2单总体比例的检验58H0
:
=80%H1
:
80%
=0.05n=40临界值(c):z/2=z0.025=1.96|z|=2.475>z/2=1.96检验统计量:决策:拒绝H0结论:
在=0.05的显著性水平下,该主管经理的估计不正确。4.3.2单总体比例的检验59H0
:
=80%H1
:
80%
=0.01n=40临界值(c):z/2=z0.005=2.58|z|=2.475<z/2=2.58检验统计量:决策:不拒绝H0结论:
在=0.01的显著性水平下,不能断定该主管经理的估计不正确。4.3.2单总体比例的检验60总体比例的检验方法假设双侧检验左侧检验右侧检验假设形式H0:
=
0H1:
0H0
:
=
0H1:
<
0H0
:
=
0H1:
>
0统计量拒绝域P值决策拒绝H04.3.3单总体方差的检验61检验一个总体的方差或标准差假设总体近似服从正态分布使用
2分布检验统计量(
2检验)样本方差假设的总体方差4.3.3单总体方差的检验62检验方法总结假设双侧检验左侧检验右侧检验假设形式H0
:
2=
02H1:
2
0H0
:
2=
02H1:
2
<
02H0:
2
=
02H1:
2
>
02统计量拒绝域P值决策
拒绝H04.3.3单总体方差的检验63例题分析【例4.6】公司生产的发动机部件的长度服从正态分布。该公司称它的标准差为0.048cm,某调研部门现随机抽取5个部件,测得它们的长度分别为1.44,1.40,1.36,1.55,1.32cm,取显著性水平为=0.05。那么,能否认为该公司生产的发动机部件的长度的标准差确实为0.048cm?双侧检验4.3.3单总体方差的检验64检验统计量:决策:拒绝H0结论:
认为该发动机的部件长度标准差不是0.048cm。H0
:
2=0.0482H1
:
2
0.0482
=0.05df=5-1=4临界值(s):第4节双总体参数检验1、双总体均值之差的检验2、双总体比例之差的检验3、双总体方差比的检验654.4.1双总体均值之差的检验66(独立大样本)1. 假定条件两个样本是独立的随机样本正态总体或非正态总体大样本(n1
30和n2
30)检验统计量
12
,
22
已知:
12
,
22
未知:4.4.1双总体均值之差的检验67例题分析【例4.7】手机的续航时间是消费者购买时考虑的一项重要因素。某手机品牌A为了了解其手机续航时间是否比市场上最受欢迎的手机品牌B的续航时间短,选择了35款A品牌手机和40款B品牌手机作为样本进行调查。数据显示两品牌手机的续航平均时间分别为33h、35h。已知两个品牌的手机续航时间的标准差分别为12h、4h。在显著性水平为=0.05的情况下,能否认为A品牌的手机续航时间小于B品牌的手机续航时间?4.4.1双总体均值之差的检验68检验统计量:决策:不拒绝H0结论:
没有证据表明男性与女性的睡眠时长有显著差异。H0
:
1=
2H1
:
1≠
2
=0.05n1=13,n2
=11临界值(c):(例题分析)抽取的样本为小样本,总体方差已知4.4.1双总体均值之差的检验69小样本的检验方法(
12,
22已知)假定条件两个独立的小样本两个总体都是正态分布
12,
22已知检验统计量4.4.1双总体均值之差的检验70小样本的检验方法(
12,
22未知但
12=
22)假定条件两个独立的小样本两个总体都是正态分布
12、
22未知但相等,即
12=
22检验统计量其中4.4.1双总体均值之差的检验71小样本的检验方法(
12,
22未知且不相等
12
22)假定条件两个总体都是正态分布
12,
22未知且不相等,即
12
22样本容量相等,即n1=n2=n检验统计量自由度为假定条件两个总体都是正态分布
12,
22未知且不相等,即
12
22样本容量不相等,即n1
n2检验统计量4.4.1双总体均值之差的检验72小样本的检验方法(
12,
22未知且不相等
12
22)自由度为4.4.1双总体均值之差的检验73例题分析【例4.8】睡眠与人体健康息息相关,不少专家认为,成年人每天需要睡7~9h。有相关报告显示,2020年我国人均睡眠时长为6.5h。想知道男性与女性的睡眠时长是否有差异,某研究机构随机抽取了24人样本,其中男性13人,女性11人。调查发现∶样本中男性的平均睡眠时长为6.2h,标准差为2.4h;女性的平均睡眠时长为6.7h,标准差为1.5h。假定两个总体的标准差无差异。试问∶在0.05的显著性水平下,男性与女性的睡眠时长是否有差异?4.4.1双总体均值之差的检验74检验统计量:决策:拒绝H0结论:
认为该发动机的部件长度标准差不是0.048cm。H0
:
2=0.0482H1
:
2
0.0482
=0.05df=5-1=4临界值(s):4.4.1双总体均值之差的检验75独立大样本总结76独立小样本总结4.4.1双总体均值之差的检验77配对样本假定条件两个总体配对差值构成的总体服从正态分布配对差是由差值总体中随机抽取的
数据配对或匹配(重复测量(前/后))检验统计量样本差值均值样本差值标准差4.4.1双总体均值之差的检验78配对样本匹配样本情形下两个总体均值之差的检验方法假设双侧检验左侧检验右侧检验假设形式H0
:d=0H1:d
0H0
:d=0H1:d<0H0:d=0
H1:d>0统计量拒绝域P值决策拒绝H04.4.1双总体均值之差的检验79例题分析【例4.9】某一减肥产品的广告宣称其产品可以在一年内帮助用户成功减肥10斤。为了检验该产品广告是否可信,从该减肥产品的用户中随机抽取了16名,分别记录其在使用产品前的初始体重和使用该产品一年后的体重,数据如下(单位∶斤)∶试在0.05的显著性水平下,判断该减肥广告是否可信。4.4.1双总体均值之差的检验80检验统计量:决策:拒绝H0结论:
在0.05的显著性水平下,该减肥产品的广告不可信。H0
:
1-
2=10H1
:
1-
2
<10
=0.05n=16临界值(c):单侧的t检验为-1.7534.4.1双总体均值之差的检验814.4.2双总体比例之差的检验821.假定条件两个总体都服从二项分布可以用正态分布来近似2.检验统计量检验H0:
1-
2=0检验H0:
1-
2=d0独立样本下双总体比例之差的检验4.4.2双总体比例之差的检验83独立样本下双总体比例之差的检验假设双侧检验左侧检验右侧检验假设形式H0
:
1-
2=0H1:
1-
2
0H0
:
1-
2=0
H1:
1-
2<0
H0:
1-
2=0
H1:
1-
2>0
统计量拒绝域P值决策拒绝H04.4.2双总体比例之差的检验84例题分析【例4.10】某助听器进口公司购进的助听器全部来自两个品牌。今年该公司又要大规模采购助听器,希望在这两个品牌中选择维修率更低的。为了比较两个品牌的助听器的维修率,公司决定从已购买的两种助听器中进行抽样调查,分别抽取24个品牌A助听器和20个品牌B助听器,抽样的两品牌维修率分别为31%和26%试问∶在0.05的显著性水平下,该公司应该购进哪个品牌的助听器?4.4.2双总体比例之差的检验85检验统计量:决策:不拒绝H0结论:
在0.05的显著性水平下,没有证据表明两个品牌的维修率有显著差异。H0
:
1=
2H1
:
1
≠
2
=0.05n1=24,n2=20临界值(c):在0.05的显著性水平下,双侧检验的临界值分别为-1.96和1.964.4.2双总体比例之差的检验861.假定条件两个总体配对差值构成的总体服从正态分布配对差是由差值总体中随机抽取的
小样本情况:配对差值经标准化后服从自由度为n-1的t分布。2.检验统计量配对样本下双总体比例之差的检验4.4.2双总体比例之差的检验87例题分析【例4.11】为了比较两种方法对某饮料中脂肪含量的测定结果是否有差异,某食品研究机构随机抽取了10瓶饮料,分别用哥特里-罗紫法和脂肪酸水解法测定其结果如表4-11所示。问∶在显著性水平为0.05的情况下,两种方法的测定结果是否不同?【例4.11】问∶在显著性水平为0.05的情况下,两种方法的测定结果是否不同?4.4.2双总体比例之差的检验88例题分析4.4.2双总体比例之差的检验89检验统计量:决策:拒绝H0结论:
在0.05的显著性水平下,两种测量方法对脂肪含量的测量结果有差异。H0
:
1=
2H1
:
1
≠
2
=0.05n=10临界值(c):例题分析4.4.3双总体方差比的检验90(F检验)假定条件两个总体都服从正态分布,且方差相等两个独立的随机样本检验统计量4.4.3双总体方差比的检验91(F检验临界值)FF1-
F
拒绝H0方差比F检验示意图拒绝H04.4.3双总体方差比的检验92(检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0:
12/
22=1H1:
12/
221H0:
12/
22=1H1:
12/
22<1H0:
12/
22=1H1:
12/
22>1统计量拒绝域P值决策拒绝H04.4.2双总体比例之差的检验93例题分析【例4.12】某家具品牌想比较其旗下两个零售店日销售额的波动情况。从每家零售店记录的销售额中分别抽取8个独立随机的日销售额样本(单位:万元),数据如下∶零售店1:12434618278947086351586274零售店2:10008459634187891450687592这些数据是否提供了充分的证据表明两个零售店的日销售额波动情况之间存在差异?(a=0.01)4.4.2双总体比例之差的检验94检验统计量:零售店1和零售店2的销售额标准差分别是421.63和311.31。决策:不拒绝H0结论:
在0.1的显著性水平下,没有证据表明两个零售店日销售额波动情况之间存在差异。H0
:H1
:
=0.01n1=8,n2=8临界值(c):在显著性水平为0.1的条件下,求得双侧检验的左侧临界值为0.264,右侧临界值为3.787例题分析第5节假设检验的局限性1、统计显著与实际显著2、样本容量的问题3、检验方法的局限性4、小概率事件原理的局限性5、先验概率和伪阳性反几率带来的错误推论9596当原假设被拒绝时,我们称样本结果在统计上是显著的(statisticallysignificant);当不拒绝原假设时,我们称样本结果在统计上是不显著的。在“显著”和“不显著”之间没有清楚的界限,只是在P值越来越小时,我们就有越来越强的证据,检验的结果也就越来越显著。4.5.1统计显著与实际显著4.5.1统计显著与实际显著97较大的样本会让显著性检验比较敏感;用小样本作的显著性检验敏感度又常常不够;在总体真值不变的情况下,大的样本会使P值变小,而小的P值也不一定就有实际显著性;无论总体的状况如何,观测值多一点,就可以把P值抓得更准些;在假设检验时,不仅要报告P值,而且也要报告样本大小。样本容量对检验结果的影响4.5.1统计显著与实际显著98投掷硬币1000次、4040次和10000次时出现正面样本比例的抽样分布0.50.507这个结果出乎预料吗?n=1000n=4040n=100004.5.1统计显著与实际显著99在实际检验中,不要把统计上的显著性与实际上的显著性混同起来;当我们设定一个原假设,比方说,H0:
=1,其意义很可能是接近于1,且接近到这样一种程度,以至为了实际目的都可以把它看作是1;然而,1.1是否“实际上无异于”1?这在某种程度上已不是一个统计学问题,而是一个与你的研究相关联的实际问题,因而不能靠假设检验来解决这个问题。4.5.2样本容量的问题100在假设检验中检验结果是否显著与样本容量有着很大的关系。当样本容量较大时,小概率事件发生的可能性较大,即使不大的效应值也能达到"显著"水平。而当样本容量足够大时,小概率事件几乎一定发生,即几乎任何微小的效应值都能达到"显著"水平。当样本容量很小时,小概率事件发生的可能性变得非常小。即使较大的效应值也往往达不到"显著"水平。因此,在报告假设检验结果时,除了报告显著性水平,还需要报告样本容量。4.5.2样本容量的问题101研究者想要研究A、B两个地区的中小学生智力水平是否存在显著性差异,对两个地区中小学生的智力情况进行了相关调查。A地区有儿童15000人测得平均智商是102.15分,标准差是15分。B地区有儿童195000,平均智商是101.85分,标准差也是15分。z检验结果表明组间差异显著(z=2.36,P<0.05)。而实际上,两地区儿童的智商平均值只相差0.3分,只有0.016个标准差,它们之间的差异显然是微不足道的,而由于样本容量较大,最终检测出的结果是二者存在显著性差异,这显然是存在很大问题的。4.5.3检验方法的局限性102由前面提出假设的章节可知,"="都出现在原假设中,这是采用检验方法的局限性带来的。因为双侧检验的P值是单侧的2倍,所以会出现单侧检验显著而双侧检验不显著的情况。例如,两种方法没有显著差异(双侧检验),但有显著提高(单侧检验),这是悖论。单侧检验采用假设是不完备的(如左侧检验mm
),有一半的风险有可能被忽略了。因此,单侧检验的应用条件是确保没有考虑的风险一定是没有的。进行左侧检验时,一定要确保不会出现大于假设值。只可能出现小于假设值。4.5.4小概率事件原理的局限性103在实际使用假设检验的方法进行决策时,研究结果不显著的通通没有报告。数据做了多重分析,却只报告特定部分的P值(一
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年北京丰台区高三一模高考政治试卷试题(含答案详解)
- 施工单位个人工作总结模版
- 小学班主任教育故事案例
- 2025年终思想工作总结模版
- 图书角的布置与管理
- 阿坝职业学院《文学研究方法论》2023-2024学年第一学期期末试卷
- 陇东学院《拓展训练》2023-2024学年第二学期期末试卷
- 陕西中医药大学《幼儿园舞蹈创编》2023-2024学年第一学期期末试卷
- 陕西国防工业职业技术学院《国际贸易理论与实务一》2023-2024学年第二学期期末试卷
- 陕西学前师范学院《智能交通系统》2023-2024学年第一学期期末试卷
- 墙绘验收单模板
- 节后复工检查表
- 音乐歌曲网上搜课件
- 财务有哪些制度要上墙
- 医学教学课件:软组织肿瘤影像诊断
- 矿山矿石损失与贫化管理规程
- 安全生产晨会管理制度
- 直线导轨装配文档课件
- 2022年招标师资格《招标采购专业实务》考试题库(真题整理版)
- (GIS)110kv组合电器
- 第3章地基处理(振密、挤密)
评论
0/150
提交评论