版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三讲假设检验第1页,共142页,2023年,2月20日,星期三统计应用
药物筛选中的假设检验
制药公司开发研制新的药物时,药物筛选成为需面临的一个极其重要的决策问题统计学是对药物筛选技术做出了巨大贡献的学科之一。药物筛选过程中有两种可能的行为“拒绝”开发的新药,这意味着所检验的药物无效或只有微弱的效果。此时采取的行动就是将该药物废弃暂时”接受”开发的新药,此时需要采取的行动是对该药物进行进一步的细致试验根据两种可能出现的研究结果,人们提出了如下相应的假设形式H0:新药对治疗某种特定疾病无效(或效果微弱)H1:新药对治疗某种特定疾病有效第2页,共142页,2023年,2月20日,星期三第三讲假设检验3.1
假设检验的基本问题3.2
一个总体参数的检验3.3
两个总体参数的检验第3页,共142页,2023年,2月20日,星期三假设检验在统计方法中的地位统计方法描述统计推断统计参数估计假设检验第4页,共142页,2023年,2月20日,星期三学习目标假设检验的基本思想和原理假设检验的步骤一个总体参数的检验两个总体参数的检验P值的计算与应用用Excel进行检验第5页,共142页,2023年,2月20日,星期三3.1假设检验的基本问题3.1.1假设的陈述3.1.2两类错误与显著性水平3.1.3统计量与拒绝域3.1.4利用P值进行决策3.1.5统计显著性与实际显著性第6页,共142页,2023年,2月20日,星期三假设的陈述第7页,共142页,2023年,2月20日,星期三什么是假设?
(hypothesis)对总体参数的具体数值所作的陈述总体参数包括总体均值、比例、方差等分析之前必须陈述我认为这种新药的疗效比原有的药物更有效!第8页,共142页,2023年,2月20日,星期三什么是假设检验?
(hypothesistest)先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程有参数检验和非参数检验逻辑上运用反证法,统计上依据小概率原理第9页,共142页,2023年,2月20日,星期三假设检验的基本思想...因此我们拒绝假设
=50...如果这是总体的假设均值样本均值m
=50抽样分布H0这个值不像我们应该得到的样本均值...20第10页,共142页,2023年,2月20日,星期三总体假设检验的过程抽取随机样本均值
x
=20我认为人口的平均年龄是50岁提出假设拒绝假设别无选择!作出决策第11页,共142页,2023年,2月20日,星期三原假设与备择假设第12页,共142页,2023年,2月20日,星期三原假设
(nullhypothesis)研究者想收集证据予以反对的假设又称“0假设”总是有符号,或4. 表示为H0H0:
=某一数值指定为符号=,或例如,H0:
10cmnull第13页,共142页,2023年,2月20日,星期三为什么叫0假设?之所以用零来修饰原假设,其原因是原假设的内容总是表示没有差异或没有改变,或变量间没有关系等等零假设总是一个与总体参数有关的问题,所以总是用希腊字母表示。关于样本统计量如样本均值或样本均值之差的零假设是没有意义的,因为样本统计量是已知的,当然能说出它们等于几或是否相等第14页,共142页,2023年,2月20日,星期三研究者想收集证据予以支持的假设也称“研究假设”总是有符号
,
或表示为H1H1:
<某一数值,或某一数值例如,H1:
<10cm,或
10cm备择假设(alternativehypothesis)第15页,共142页,2023年,2月20日,星期三【例】一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和备择假设提出假设(例题分析)解:研究者想收集证据予以证明的假设应该是“生产过程不正常”。建立的原假设和备择假设为
H0:
10cmH1:
10cm
第16页,共142页,2023年,2月20日,星期三【例】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500g。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设提出假设(例题分析)解:研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述。建立的原假设和备择假设为
H0:
500H1:
<500500g绿叶洗涤剂第17页,共142页,2023年,2月20日,星期三【例】一家研究机构估计,某城市中家庭拥有汽车的比例超过30%。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设提出假设(例题分析)解:研究者想收集证据予以支持的假设是“该城市中家庭拥有汽车的比例超过30%”。建立的原假设和备择假设为
H0:
30%H1:
30%第18页,共142页,2023年,2月20日,星期三原假设和备择假设是一个完备事件组,而且相互对立在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立先确定备择假设,再确定原假设等号“=”总是放在原假设上因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)提出假设(结论与建议)第19页,共142页,2023年,2月20日,星期三双侧检验与单侧检验第20页,共142页,2023年,2月20日,星期三备择假设没有特定的方向性,并含有符号“”的假设检验,称为双侧检验或双尾检验(two-tailedtest)
备择假设具有特定的方向性,并含有符号“>”或“<”的假设检验,称为单侧检验或单尾检验(one-tailedtest)备择假设的方向为“<”,称为左侧检验
备择假设的方向为“>”,称为右侧检验
双侧检验与单侧检验第21页,共142页,2023年,2月20日,星期三双侧检验与单侧检验
(假设的形式)假设双侧检验单侧检验左侧检验右侧检验原假设H0:m
=m0H0:m
m0H0:m
m0备择假设H1:m
≠m0H1:m
<m0H1:m
>m0以总体均值的检验为例第22页,共142页,2023年,2月20日,星期三两类错误与显著性水平第23页,共142页,2023年,2月20日,星期三假设检验中的两类错误1. 第Ⅰ类错误(弃真错误)原假设为正确时拒绝原假设第Ⅰ类错误的概率记为被称为显著性水平2. 第Ⅱ类错误(取伪错误)原假设为错误时未拒绝原假设第Ⅱ类错误的概率记为(Beta)第24页,共142页,2023年,2月20日,星期三H0:无罪假设检验中的两类错误(决策结果)陪审团审判裁决实际情况无罪有罪无罪正确错误有罪错误正确H0检验决策实际情况H0为真H0为假未拒绝H0正确决策(1–a)第Ⅱ类错误(b)拒绝H0第Ⅰ类错误(a)正确决策(1-b)假设检验就好像一场审判过程统计检验过程第25页,共142页,2023年,2月20日,星期三假设检验中的两类错误(决策结果)问:如何才能同时减少犯两类错误的概率?答:增加样本容量(多次试探)。第26页,共142页,2023年,2月20日,星期三显著性水平
(significantlevel)1. 是一个概率值2. 原假设为真时,拒绝原假设的概率抽样分布的拒绝域3. 表示为(alpha)常用的
值有0.01,0.05,0.104. 由研究者事先确定第27页,共142页,2023年,2月20日,星期三我们可以在事先确定用于拒绝原假设H0的证据必须强到何种程度。这等于说我们要求多小的P值。而这个P值就叫显著性水平,用表示显著性水平表示总体中某一类数据出现的经常程度假如我们选择=0.05,样本数据能拒绝原假设的证据要强到:当H0正确时,这种样本结果发生的频率不超过5%;如果我们选择=0.01,就是要求拒绝H0的证据要更强,这种样本结果发生的频率只有1%如果P值小于或等于,我们称该组数据不利于原假设的证据有的显著性水平显著性水平
(significantlevel)第28页,共142页,2023年,2月20日,星期三significant(显著的)一词的意义在这里并不是“重要的”,而是指“非偶然的”一项检验在统计上是“显著的”,意思是指:这样的(样本)结果不是偶然得到的,或者说,不是靠机遇能够得到的。统计显著性
(significant)第29页,共142页,2023年,2月20日,星期三假设检验中的小概率原理什么小概率?1. 在一次试验中,一个几乎不可能发生的事件发生的概率2. 在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设3. 小概率由研究者事先确定第30页,共142页,2023年,2月20日,星期三统计量与拒绝域第31页,共142页,2023年,2月20日,星期三根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量对样本估计量的标准化结果原假设H0为真点估计量的抽样分布检验统计量(teststatistic)标准化的检验统计量第32页,共142页,2023年,2月20日,星期三显著性水平和拒绝域
(双侧检验)抽样分布H0临界值临界值a/2a/2
拒绝H0拒绝H01-置信水平拒绝域非拒绝域拒绝域第33页,共142页,2023年,2月20日,星期三显著性水平和拒绝域
(双侧检验)H0临界值临界值a/2
a/2
样本统计量拒绝H0拒绝H0抽样分布1-置信水平第34页,共142页,2023年,2月20日,星期三显著性水平和拒绝域
(双侧检验)H0临界值临界值
a/2a/2
样本统计量拒绝H0拒绝H0抽样分布1-置信水平第35页,共142页,2023年,2月20日,星期三显著性水平和拒绝域
(双侧检验)H0临界值临界值a/2
a/2
样本统计量拒绝H0拒绝H0抽样分布1-置信水平第36页,共142页,2023年,2月20日,星期三显著性水平和拒绝域
(单侧检验)H0临界值a拒绝H0抽样分布1-置信水平RegionofRejectionRegionofNonrejection第37页,共142页,2023年,2月20日,星期三显著性水平和拒绝域
(左侧检验)H0临界值a拒绝H0抽样分布1-置信水平样本统计量第38页,共142页,2023年,2月20日,星期三显著性水平和拒绝域
(左侧检验)H0临界值a样本统计量拒绝H0抽样分布1-置信水平第39页,共142页,2023年,2月20日,星期三显著性水平和拒绝域
(右侧检验)H0临界值a样本统计量拒绝H0抽样分布1-置信水平第40页,共142页,2023年,2月20日,星期三显著性水平和拒绝域
(右侧检验)H0临界值a样本统计量抽样分布1-置信水平拒绝H0第41页,共142页,2023年,2月20日,星期三决策规则给定显著性水平,查表得出相应的临界值z或z/2,t或t/2将检验统计量的值与水平的临界值进行比较作出决策双侧检验:I统计量I>临界值,拒绝H0左侧检验:统计量<-临界值,拒绝H0右侧检验:统计量>临界值,拒绝H0第42页,共142页,2023年,2月20日,星期三利用
P值进行决策第43页,共142页,2023年,2月20日,星期三什么是P值?
(P-value)如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率P值告诉我们:如果原假设是正确的话,我们得到目前这个样本数据的可能性有多大,如果这个可能性很小,就应该拒绝原假设被称为观察到的(或实测的)显著性水平决策规则:若p值<,拒绝H0第44页,共142页,2023年,2月20日,星期三双侧检验的P值/
2/
2Z拒绝H0拒绝H00临界值计算出的样本统计量计算出的样本统计量临界值1/2P值1/2P值第45页,共142页,2023年,2月20日,星期三左侧检验的P值0临界值a样本统计量拒绝H0抽样分布1-置信水平计算出的样本统计量P值第46页,共142页,2023年,2月20日,星期三右侧检验的P值0临界值a拒绝H0抽样分布1-置信水平计算出的样本统计量P值第47页,共142页,2023年,2月20日,星期三原假设的可信度有多高?如果H0所代表的假设是人们多年来一直相信的,就需要很强的证据(小的P值)才能说服他们拒绝的结论是什么?如果拒绝H0而肯定H1
,就需要有很强的证据显示要支持H1。比如,H1代表要花很多钱把产品包装改换成另一种包装,你就要有很强的证据显示新包装一定会增加销售量(因为拒绝H0要花很高的成本)多大的P值合适?显著性检验的目的是要描述样本所提供不利于原假设的证据有多强。P值就在做这件事。但是,要证明原假设不正确,P值要多小,才能令人信服呢?这要根据两种情况来确定第48页,共142页,2023年,2月20日,星期三传统的显著性水平,如1%、5%、10%等等,已经被人们普遍接受为“拒绝原假设足够证据”的标准,我们大概可以说:10%代表有“一些证据”不利于原假设;5%代表有“适度证据”不利于原假设;1%代表有“很强证据”不利于原假设固定显著性水平是否有意义第49页,共142页,2023年,2月20日,星期三拒绝H0P值决策与统计量的比较拒绝H0的两个统计量的不同显著性Z拒绝H00统计量1
P1
值统计量2
P2
值拒绝H0临界值第50页,共142页,2023年,2月20日,星期三与其人为地把显著性水平固定按某一水平上,不如干脆选取检验统计量的P值与其大致知道犯第Ⅰ错误的概率,不如干脆知道一个确切的犯第Ⅰ类错误的概率(P值)与其为选取“适当的”的而苦恼,不如干脆把真正的(P值)算出来P值决策与统计量的比较(结论)第51页,共142页,2023年,2月20日,星期三假设检验结论的表述第52页,共142页,2023年,2月20日,星期三假设检验结论的表述
(“显著”与“不显著”)当拒绝原假设时,我们称样本结果是统计上显著的拒绝原假设时结论是清楚的当不拒绝原假设时,我们称样本结果是统计上不显著的不拒绝原假设时,并未给出明确的结论,不能说原假设是正确的,也不能说它不是正确的第53页,共142页,2023年,2月20日,星期三假设检验结论的表述
(“接受”与“不拒绝”)假设检验的目的在于试图找到证据拒绝原假设,而不在于证明什么是正确的当没有足够证据拒绝原假设时,不采用“接受原假设”的表述,而采用“不拒绝原假设”的表述。“不拒绝”的表述实际上意味着并未给出明确的结论,我们没有说原假设正确,也没有说它不正确“接受”的说法有时会产生误导,因为这种说法似乎暗示着原假设已经被证明是正确的了。但事实上,H0的真实值我们永远也无法知道,H0只是对总体真实值的一个假定值,由样本提供的信息也就自然无法证明它是否正确第54页,共142页,2023年,2月20日,星期三假设检验结论的表述
(为什么不说“接受”)【例】比如原假设为H0:=10,从该总体中抽出一个随机样本,得到x=9.8,在=0.05的水平上,样本提供的证据没有推翻这一假设,我们说“接受”原假设,这意味着样本提供的证据已经证明=10是正确的。如果我们将原假设改为H0:=10.5,同样,在=0.05的水平上,样本提供的证据也没有推翻这一假设,我们又说“接受”原假设。但这两个原假设究竟哪一个是“真实的”呢?我们不知道第55页,共142页,2023年,2月20日,星期三假设检验步骤的总结陈述原假设和备择假设从所研究的总体中抽出一个随机样本确定一个适当的检验统计量,并利用样本数据算出其具体数值确定一个适当的显著性水平,并计算出其临界值,指定拒绝域将统计量的值与临界值进行比较,作出决策统计量的值落在拒绝域,拒绝H0,否则不拒绝H0也可以直接利用P值作出决策第56页,共142页,2023年,2月20日,星期三3.2一个总体参数的检验3.2.1总体均值的检验3.2.2总体比例的检验3.2.3总体方差的检验第57页,共142页,2023年,2月20日,星期三一个总体参数的检验z检验(单尾和双尾)
t检验(单尾和双尾)z
检验(单尾和双尾)
2检验(单尾和双尾)均值总体参数比例方差第58页,共142页,2023年,2月20日,星期三总体均值的检验第59页,共142页,2023年,2月20日,星期三总体均值的检验
(作出判断)是否已知小样本容量n大是否已知否
t检验否z检验是z检验
是z检验第60页,共142页,2023年,2月20日,星期三总体均值的检验
(大样本)第61页,共142页,2023年,2月20日,星期三总体均值的检验
(大样本)1. 假定条件正态总体或非正态总体大样本(n30)使用z检验统计量2
已知:2
未知:第62页,共142页,2023年,2月20日,星期三总体均值的检验(2
已知)
(例题分析)【例】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为255.8ml。取显著性水平=0.05
,检验该天生产的饮料容量是否符合标准要求?双侧检验绿色健康饮品绿色健康饮品255255第63页,共142页,2023年,2月20日,星期三总体均值的检验(2
已知)
(例题分析)H0
:
=255H1
:
255
=
0.05n
=
40临界值(c):检验统计量:z01.96-1.960.025拒绝H0拒绝H00.025决策:结论:
不拒绝H0样本提供的证据还不足以推翻“该天生产的饮料符合标准要求”的看法第64页,共142页,2023年,2月20日,星期三总体均值的检验(z检验)
(P值的计算与应用)第1步:进入Excel表格界面,直接点击【f(x)】第2步:在函数分类中点击【统计】,并在函数名菜单下选择【NORMSDIST】,然后【确定】第3步:将z的绝对值1.01录入,得到的函数值为
0.843752345
P值=2(1-0.843752345)=0.312495
P值远远大于,故不拒绝H0第65页,共142页,2023年,2月20日,星期三总体均值的检验(2
未知)
(例题分析)【例】一种机床加工的零件尺寸绝对平均误差为1.35mm。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低?(=0.01)
左侧检验50个零件尺寸的误差数据(mm)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.161.121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.86第66页,共142页,2023年,2月20日,星期三总体均值的检验(2
未知)
(例题分析)H0
:
1.35H1
:
<1.35
=
0.01n
=
50临界值(c):检验统计量:拒绝H0新机床加工的零件尺寸的平均误差与旧机床相比有显著降低决策:结论:-2.33z0拒绝H00.01第67页,共142页,2023年,2月20日,星期三总体均值的检验(z检验)
(P值的计算与应用)第1步:进入Excel表格界面,直接点击【f(x)】第2步:在函数分类中点击【统计】,并在函数名的菜单下选择【ZTEST】,然后【确定】第3步:在所出现的对话框【Array】框中,输入原始数据所在区域;在【X】后输入参数的某一假定值(这里为
1.35);在【Sigma】后输入已知的总体标准差(若总体标准差未知则可忽略不填,系统将自动使用样本标准差代替)第4步:用1减去得到的函数值0.995421023
即为P值
P值=1-0.995421023=0.004579
P值<=0.01,拒绝H0用Excel计算P值第68页,共142页,2023年,2月20日,星期三总体均值的检验(z检验)
(P值的图示)0-2.33a=0.01z拒绝H0抽样分布1-计算出的样本统计量=2.6061P值P=0.004579
第69页,共142页,2023年,2月20日,星期三总体均值的检验(2
未知)
(例题分析)【例】某一小麦品种的平均产量为5200kg/hm2
。一家研究机构对小麦品种进行了改良以期提高产量。为检验改良后的新品种产量是否有显著提高,随机抽取了36个地块进行试种,得到的样本平均产量为5275kg/hm2,标准差为120/hm2
。试检验改良后的新品种产量是否有显著提高?(=0.05)
右侧检验第70页,共142页,2023年,2月20日,星期三总体均值的检验(2
未知)
(例题分析)H0
:
5200H1
:
>5200
=
0.05n
=
36临界值(c):检验统计量:拒绝H0(P=0.000088<
=0.05)改良后的新品种产量有显著提高决策:结论:z0拒绝H00.051.645第71页,共142页,2023年,2月20日,星期三总体均值的检验(z检验)
(P值的图示)抽样分布P=0.00008801.645a=0.05拒绝H01-计算出的样本统计量=3.75P值第72页,共142页,2023年,2月20日,星期三总体均值的检验
(大样本检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0
:m=m0H1:mm0H0:mm0H1:m<m0H0:m
m0H1:m>m0统计量已知未知拒绝域P值决策拒绝H0第73页,共142页,2023年,2月20日,星期三总体均值的检验
(小样本)第74页,共142页,2023年,2月20日,星期三总体均值的检验
(小样本)1. 假定条件总体服从正态分布小样本(n<
30)检验统计量2
已知:2
未知:第75页,共142页,2023年,2月20日,星期三总体均值的检验
(小样本检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0
:m=m0H1:mm0H0
:mm0H1:m<m0H0:mm0H1:m>m0统计量已知未知拒绝域P值决策拒绝H0注:
已知的拒绝域同大样本第76页,共142页,2023年,2月20日,星期三总体均值的检验
(例题分析)【例】一种汽车配件的平均长度要求为12cm,高于或低于该标准均被认为是不合格的。汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进。现对一个配件提供商提供的10个样本进行了检验。假定该供货商生产的配件长度服从正态分布,在0.05的显著性水平下,检验该供货商提供的配件是否符合要求?10个零件尺寸的长度(cm)12.210.812.011.811.912.411.312.212.012.3第77页,共142页,2023年,2月20日,星期三总体均值的检验
(例题分析—正态性检验)汽车配件的正态概率图
第78页,共142页,2023年,2月20日,星期三总体均值的检验
(例题分析)H0
:
=12H1
:
12
=0.05df=10-1=9临界值(c):检验统计量:不拒绝H0样本提供的证据还不足以推翻“该供货商提供的零件符合要求”的看法决策:结论:t02.262-2.2620.025拒绝
H0拒绝H00.025第79页,共142页,2023年,2月20日,星期三总体均值的检验(t检验)
(P值的计算与应用)第1步:进入Excel表格界面,直接点击【f(x】第2步:在函数分类中点击【统计】,并在函数名的菜单下选择【TDIST】,然后【确定】第3步:在出现对话框的【X】栏中输入计算出的t的绝对值0.7035,在【Deg-freedom】(自由度)栏中输入本例的自由度9,在【Tails】栏中输入2(表明是双侧检验,如果是单测检验则在该栏输入1)第4步:P值=0.499537958
P值>=0.05,故不拒绝H0
第80页,共142页,2023年,2月20日,星期三用置信区间进行检验第81页,共142页,2023年,2月20日,星期三置信区间和假设检验作一项统计检验,不能只去看是否有统计上的显著性,置信区间会更有用置信区间的宽度会帮助我们把真正的总体参数定位得更准确置信区间比假设检验更有用第82页,共142页,2023年,2月20日,星期三置信区间和假设检验
(例题分析)投掷一枚均匀的硬币,在样本容量分别为n=1000、n=4040和n=10000时,样本比例为p=0.507,出现正面的比例95%的置信区间如下投掷1000次和投掷4040次所得到的区间都包含了0.5这个数字(总体参数),所以我们不会怀疑硬币是否均匀。可是投掷10000次时,我们却有信心真正的总体参数落在(0.504,0.510)之间。因此我们有信心p值(总体参数)不是0.5投掷次数95%的置信区间n=10000.507±0.031(0.476,0.538)n=40400.507±0.015(0.492,0.522)n=100000.507±0.003(0.504,0.510)第83页,共142页,2023年,2月20日,星期三用置信区间进行检验
(双侧检验)求出双侧检验均值的置信区间2已知时:2未知时:若总体的假设值0在置信区间外,拒绝H0第84页,共142页,2023年,2月20日,星期三用置信区间进行检验
(单侧检验)左侧检验:求出单边置信下限若总体的假设值0小于单边置信下限,拒绝H0右侧检验:求出单边置信上限若总体的假设值0大于单边置信上限,拒绝H0第85页,共142页,2023年,2月20日,星期三用置信区间进行检验
(例题分析)【例】一种袋装食品每包的标准重量应为1000g。现从生产的一批产品中随机抽取16袋,测得其平均重量为991g。已知这种产品重量服从标准差为50g的正态分布。试确定这批产品的包装重量是否合格?(=0.05)双侧检验!第86页,共142页,2023年,2月20日,星期三用置信区间进行检验
(例题分析)H0:
=1000H1:
1000
=
0.05n
=49临界值(s):置信区间为决策:结论:
假设的0=1000在置信区间内,不拒绝H0没有证据表明这批产品的包装重量不合格Z01.96-1.96.025拒绝H0拒绝H0.025第87页,共142页,2023年,2月20日,星期三总体比例的检验第88页,共142页,2023年,2月20日,星期三适用的数据类型离散数据
连续数据数值型数据数据品质数据第89页,共142页,2023年,2月20日,星期三总体比例检验假定条件总体服从二项分布可用正态分布来近似(大样本)检验的z统计量0为假设的总体比例第90页,共142页,2023年,2月20日,星期三总体比例的检验
(检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0:=0H1:0H0
:0H1:<0H0
:0H1:>0统计量拒绝域P值决策拒绝H0第91页,共142页,2023年,2月20日,星期三总体比例的检验
(例题分析)【例】一种以休闲和娱乐为主题的杂志,声称其读者群中有80%为女性。为验证这一说法是否属实,某研究部门抽取了由200人组成的一个随机样本,发现有146个女性经常阅读该杂志。分别取显著性水平
=0.05和=0.01
,检验该杂志读者群中女性的比例是否为80%?它们的P值各是多少?双侧检验第92页,共142页,2023年,2月20日,星期三总体比例的检验
(例题分析)H0
:
=80%H1
:
80%
=0.05n
=200临界值(c):检验统计量:拒绝H0(P=0.013328<
=0.05)该杂志的说法并不属实
决策:结论:z01.96-1.960.025拒绝
H0拒绝
H00.025第93页,共142页,2023年,2月20日,星期三总体比例的检验
(例题分析)H0
:
=80%H1
:
80%
=0.01n
=200临界值(c):检验统计量:不拒绝H0(P=0.013328>=0.01)样本提供的证据还不足以推翻“该杂志声称读者群中有80%为女性”的看法
决策:结论:z02.58-2.580.025拒绝H0拒绝H00.025第94页,共142页,2023年,2月20日,星期三总体方差的检验
(2检验)第95页,共142页,2023年,2月20日,星期三总体方差的检验
(2检验)
检验一个总体的方差或标准差假设总体近似服从正态分布使用2分布检验统计量样本方差假设的总体方差第96页,共142页,2023年,2月20日,星期三总体方差的检验
(检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0
:2=02H1:2
0H0
:2
02H1:2
<
02H0:2
02H1:2
>02统计量拒绝域P值决策拒绝H0第97页,共142页,2023年,2月20日,星期三总体方差的检验
(例题分析)【例】啤酒生产企业采用自动生产线灌装啤酒,每瓶的装填量为640ml,但由于受某些不可控因素的影响,每瓶的装填量会有差异。此时,不仅每瓶的平均装填量很重要,装填量的方差同样很重要。如果方差很大,会出现装填量太多或太少的情况,这样要么生产企业不划算,要么消费者不满意。假定生产标准规定每瓶装填量的标准差不应超过和不应低于4ml。企业质检部门抽取了10瓶啤酒进行检验,得到的样本标准差为s=3.8ml。试以0.10的显著性水平检验装填量的标准差是否符合要求?朝日BEER朝日BEER朝日BEER朝日第98页,共142页,2023年,2月20日,星期三总体方差的检验
(例题分析)H0
:2=42H1
:2
42
=0.10df=
10-1=9临界值(s):统计量:不拒绝H0样本提供的证据还不足以推翻“装填量的标准差不符合要求”的看法
2016.91903.32511
/2=0.05决策:结论:第99页,共142页,2023年,2月20日,星期三3.3两个总体参数的检验3.3.1两个总体均值之差的检验3.3.2两个总体比例之差的检验3.3.3两个总体方差比的检验第100页,共142页,2023年,2月20日,星期三两个总体参数的检验总体参数独立样本配对样本均值差比例差方差比z
检验(大样本)t
检验(小样本)t
检验(小样本)z检验F
检验第101页,共142页,2023年,2月20日,星期三两个总体均值之差的检验
(独立大样本)第102页,共142页,2023年,2月20日,星期三两个总体均值之差的检验
(独立大样本)1. 假定条件两个样本是独立的随机样本正态总体或非正态总体大样本(n130和n230)检验统计量12
,22
已知:12
,22
未知:第103页,共142页,2023年,2月20日,星期三两个总体均值之差的检验
(大样本检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0
:m1-m2=0H1:m1-m20
H0
:m1-m20H1:m1-m2<0H0:m1-m20
H1:m1-m2>0统计量12
,
22
已知12
,
22
未知拒绝域P值决策拒绝H0第104页,共142页,2023年,2月20日,星期三两个总体均值之差的检验
(例题分析)
【例】某公司对男女职员的平均小时工资进行了调查,独立抽取了具有同类工作经验的男女职员的两个随机样本,并记录下两个样本的均值、方差等资料如右表。在显著性水平为0.05的条件下,能否认为男性职员与女性职员的平均小时工资存在显著差异?
两个样本的有关数据
男性职员女性职员n1=44n1=32
=75
=70S12=64
S22=42.25第105页,共142页,2023年,2月20日,星期三两个总体均值之差的检验
(例题分析)H0
:1-2=0H1
:1-2
0
=
0.05n1
=44,n2
=32临界值(c):检验统计量:决策:结论:
拒绝H0该公司男女职员的平均小时工资之间存在显著差异
z01.96-1.960.025拒绝H0拒绝H00.025第106页,共142页,2023年,2月20日,星期三两个总体均值之差的检验
(独立小样本)第107页,共142页,2023年,2月20日,星期三两个总体均值之差的检验
(12,
22
已知)假定条件两个独立的小样本两个总体都是正态分布12,22已知检验统计量第108页,共142页,2023年,2月20日,星期三两个总体均值之差的检验
(12,22
未知但12=22)假定条件两个独立的小样本两个总体都是正态分布12、22未知但相等,即12=22检验统计量其中:自由度:第109页,共142页,2023年,2月20日,星期三两个总体均值之差的检验
(12,
22
未知且不相等1222)假定条件两个总体都是正态分布12,22未知且不相等,即1222样本容量相等,即n1=n2=n检验统计量自由度:第110页,共142页,2023年,2月20日,星期三两个总体均值之差的检验
(12,
22
未知且不相等1222)假定条件两个总体都是正态分布12,22未知且不相等,即1222样本容量不相等,即n1n2检验统计量自由度:第111页,共142页,2023年,2月20日,星期三两个总体均值之差的检验
(例题分析)
【例】甲、乙两台机床同时加工某种同类型的零件,已知两台机床加工的零件直径(单位:cm)分别服从正态分布,并且有12=22
。为比较两台机床的加工精度有无显著差异,分别独立抽取了甲机床加工的8个零件和乙机床加工的7个零件,通过测量得到如下数据。在=0.05的显著性水平下,样本数据是否提供证据支持
“两台机床加工的零件直径不一致”的看法?两台机床加工零件的样本数据
(cm)甲20.519.819.720.420.120.019.019.9乙20.719.819.520.820.419.620.2第112页,共142页,2023年,2月20日,星期三两个总体均值之差的检验
(例题分析—正态性评估)两台机床加工零件直径的正态概率图第113页,共142页,2023年,2月20日,星期三两个总体均值之差的检验
(例题分析)H0
:1-2
=0H1
:1-2
0
=0.05n1
=8,n2
=
7临界值(c):检验统计量:决策:结论:
不拒绝H0样本提供的证据还不足以推翻“两台机床加工的零件直径不一致”的看法t02.160-2.1600.025拒绝H0拒绝H00.025第114页,共142页,2023年,2月20日,星期三两个总体均值之差的检验
(例题分析—箱线图比较)两台机床加工零件尺寸的Mean/SD/1.96*SD箱线图
第115页,共142页,2023年,2月20日,星期三两个总体均值之差的检验
(用Excel进行检验)第1步:将原始数据输入到Excel工作表格中第2步:选择【工具】下拉菜单并选择【数据分析】选项第3步:在【数据分析】对话框中选择
【t-检验:双样本等方差假设】第4步:当对话框出现后在【变量1的区域】方框中输入第1个样本的数据区域在【变量2的区域】方框中输入第2个样本的数据区域在【假设平均差】方框中输入假定的总体均值之差在【】方框中输入给定的显著性水平(本例为0.05)
在【输出选项】选择计算结果的输出位置,然后【确定】用Excel进行检验第116页,共142页,2023年,2月20日,星期三两个总体均值之差的检验
(例题分析)【例】为检验两种方法组装产品所需时间的差异,分别对两种不同的组装方法各随机安排12个工人,每个工人组装一件产品所需的时间(单位:min)下如表。假定两种方法组装产品的时间服从正态分布,但方差未知且不相等。取显著性水平0.05,能否认为方法1组装产品的平均时间明显地高于方法2?两个方法组装产品所需的时间方法1方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.521第117页,共142页,2023年,2月20日,星期三两个总体均值之差的检验
(用Excel进行检验)第1步:将原始数据输入到Excel工作表格中第2步:选择“工具”下拉菜单并选择【数据分析】选项第3步:在【数据分析】对话框中选择
【t-检验:双样本异方差假设】第4步:当对话框出现后在【变量1的区域】方框中输入第1个样本的数据区域在【变量2的区域】方框中输入第2个样本的数据区域在【假设平均差】方框中输入假定的总体均值之差在【】方框中输入给定的显著性水平(本例为0.05)
在【输出选项】选择计算结果的输出位置,然后【确定】用Excel进行检验第118页,共142页,2023年,2月20日,星期三两个总体均值之差的检验
(例题分析—箱线图比较)两种方法组装产品所需时间的Mean/SD/1.96*SD箱线图第119页,共142页,2023年,2月20日,星期三两个总体均值之差的检验
(匹配样本)第120页,共142页,2023年,2月20日,星期三两个总体均值之差的检验
(匹配样本)假定条件两个总体配对差值构成的总体服从正态分布配对差是由差值总体中随机抽取的
数据配对或匹配(重复测量(前/后))检验统计量样本差值均值样本差值标准差第121页,共142页,2023年,2月20日,星期三匹配样本
(数据形式)
观察序号样本1样本2差值1x11x21d1=x11-x212x12x22d2=x12-x22MMMMix1ix2idi
=x1i
-x2iMMMMnx1nx2ndn
=x1n-x2n第122页,共142页,2023年,2月20日,星期三两个总体均值之差的检验
(匹配样本检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0
:d=0H1:d0H0
:d0H1:d<0H0:d0
H1:d>0统计量拒绝域P值决策拒绝H0第123页,共142页,2023年,2月20日,星期三两个总体均值之差的检验
(例题分析)
【例】某饮料公司开发研制出一新产品,为比较消费者对新老产品口感的满意程度,该公司随机抽选一组消费者(8人),每个消费者先品尝一种饮料,然后再品尝另一种饮料,两种饮料的品尝顺序是随机的,而后每个消费者要对两种饮料分别进行评分(0分~10分),评分结果如下表。取显著性水平=0.05,该公司是否有证据认为消费者对两种饮料的评分存在显著差异?两种饮料平均等级的样本数据旧饮料54735856新饮料66743976第124页,共142页,2023年,2月20日,星期三两个总体均值之差的检验
(用Excel进行检验)第1步:选择“工具”下拉菜单,并选择【数据分析】选项第3步:在分析工具中选择【t检验:平均值成对二样本分析】第4步:当出现对话框后
在【变量1的区域】方框内输入变量1的数据区域
在【变量2的区域】方框内输入变量2的数据区域
在【假设平均差】方框内输入假设的差值(这里为0)
在【】框内输入给定的显著性水平,然后【确定】
用Excel进行检验第125页,共142页,2023年,2月20日,星期三两个总体均值检验方法总结均值差检验独立样本匹配样本大样本小样本小样本12、22已知12、22未知12、22已知12、22未知Z检验Z
检验Z检验t检验12=2212≠22t检验n1=n2n1≠n2t
检验t
检验第126页,共142页,2023年,2月20日,星期三两个总体比例之差的检验第127页,共142页,2023年,2月20日,星期三1. 假定条件两个总体都服从二项分布可以用正态分布来近似检验统计量检验H0:1-2=0检验H0:1-2=d0两个总体比例之差的检验第128页,共142页,2023年,2月20日,星期三两个总体比例之差的检验
(检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0
:1-2=0H1:1-20H0
:1-20
H1:1-2<0
H0:1-20
H1:1-2>0
统计量拒绝域P值决策拒绝H0第129页,共142页,2023年,2月20日,星期三两个总体比例之差的检验
(例题分析)
【例】一所大学准备采取一项学生在宿舍上网收费的措施,为了解男女学生对这一措施的看法是否存在差异,分别抽取了200名男学生和200名女学生进行调查,其中的一个问题是:“你是否赞成采取上网收费的措施?”其中男学生表示赞成的比例为27%,女学生表示赞成的比例为35%。调查者认为,男学生中表示赞成的比例显著低于女学生。取显著性水平=0.05,样本提供的证据是否支持调查者的看法?21netnet第130页,共142页,2023年,2月20日,星期三两个总体比例之差
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 银行存取方案课程设计
- 标识绘制课程设计思路
- 指纹打卡机课程设计
- 船型论证课程设计例子
- 道路课程设计案例
- 温控电风扇课程设计
- 玻璃材料课程设计
- 锻压课程设计摘要
- 植物花卉速写课程设计
- 糖尿病肾病早期诊断策略-洞察分析
- (完整版)铝矾土进口合同中英文
- 《庖丁解牛》获奖课件(省级公开课一等奖)-完美版PPT
- 化工园区危险品运输车辆停车场建设标准
- 6月大学英语四级真题(CET4)及答案解析
- 气排球竞赛规则
- 电梯维修保养报价书模板
- 危险化学品目录2023
- FZ/T 81024-2022机织披风
- GB/T 33141-2016镁锂合金铸锭
- JJF 1069-2012 法定计量检定机构考核规范(培训讲稿)
- 综合管廊工程施工技术概述课件
评论
0/150
提交评论