




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
假设检验假设检验的基本问题1假设检验的基本步骤2假设检验的两类错误3单个总体均值的的检验4本章学习内容单个总体比例及方差的检验5假设检验的基本问题假设检验的基本思想1假设检验的基本概念2本节学习内容导入RonaldAylmerFisher英国著名的统计学家,遗传学家,现代数理统计的奠基人之一。他在抽样分布理论、相关回归分析、多元统计分析、最大似然估计理论,方差分析和假设检验有很多的建树。导入女士品茶20世纪20年代后期在英国剑桥一个夏日的下午,一群大学的绅士和他们的夫人以及来访者,正围坐在户外的桌旁享用下午的奶茶。奶茶一般是由牛奶和茶混合而成的,调制时候可以先倒茶后倒牛奶,也可以先倒牛奶后倒茶。这时候,一名女士说她能区分这两种不同做法的调制出来的奶茶。那么如何检验这位女士的说法?为此Fisher进行了研究,从而提出了假设检验的思想。导入假设检验的应用推广素质教育以后,教学效果是不是有所提高?(教育统计)某种新胃药是否比以前更有效?(卫生统计)醉酒驾车认定为刑事犯罪后是否交通事故会减少?(司法统计)如何检测某批种子的发芽率?(农业统计)海关工作人员如何判定某批产品能够通关?(海关统计)《红楼梦》后40回作者的鉴定(文学统计)民间借贷的利率为多少?(金融统计)兴奋剂检测(体育统计)假设检验的基本思想为研究某山区的成年男子的脉搏均值是否高于一般成年男子脉搏均值,某医生在一山区随机抽查了25名健康成年男子,得其脉搏均值x为74.2次/分,标准差为6.0次/分。根据大量调查已知一般健康成年男子脉搏均值为72次/分,能否据此认为该山区成年的脉搏均值μ高于一般成年男子的脉搏均值μ0?
问题1:造成这25名男子脉搏均值高于一般男子的原因是什么?由资料已知样本均值与总体均值不等,原因有二:两者非同一总体,即两者差异由地理气候等因素造成,也就是可以说高山成年人的脉搏比一般人的要高;两者为同一总体,即两者差异由抽样误差造成。假设检验的基本思想为研究某山区的成年男子的脉搏均值是否高于一般成年男子脉搏均值,某医生在一山区随机抽查了25名健康成年男子,得其脉搏均值x为74.2次/分,标准差为6.0次/分。根据大量调查已知一般健康成年男子脉搏均值为72次/分,能否据此认为该山区成年的脉搏均值μ高于一般成年男子的脉搏均值μ0?
问题2、怎样判断以上哪个原因是成立的?若x与接近,其差别可用抽样误差解释,x来自于;若x与相差甚远,其差别不宜用抽样误差解释,则怀疑x不属于。检验如下假设:原假设:高山成年人脉搏与一般人的脉搏没有差异:μ=µ0备择假设:高山成年人脉搏与一般人的脉搏有差异:µ≠µ0假设检验的基本概念概念事先对总体参数或分布形式作出某种假设然后利用样本信息来以一定的概率判断原假设是否成立参数检验和非参数检验(第8章的内容)作用一般是对有差异的数据进行检验,判断差异是否显著(概率)如果通过了检验,不能拒绝原假设,说明没有显著差异,那么这种差异是由抽样造成的如果不能通过检验,则拒绝原假设,说明有显著差异,这种差异是由系统误差造成的。证伪不能存真原假设与备择假设原假设(nullhypothesis):一般研究者想收集证据予以反对的假设。表示为H0备择假设(alternativehypothesis):一般研究者想收集证据予以支持的假设。表示为H1由于假设检验中只有在小概率事件发生的情况下才拒绝原假设,因此在假设检验过程中是保护原假设的。有三种形式:双侧检验H0:µ=µ0,H1:µ≠µ0(不等,有差异);左侧检验H0:µ≥µ0,H1
:µ<µ0(降低,减少);右侧检验H0:µ≤µ0,H1:µ>µ0(提高,增加)采用哪种形式要根据实际问题。原假设与备择假设【例1】某种饮料的易拉罐瓶的标准容量为335毫升,为对生产过程进行控制,质量监测人员定期对某个分厂进行检查,确定这个分厂生产的易拉罐是否符合标准要求。如果易拉罐的平均容量大于或小于335毫升,则表明生产过程不正常。试陈述用来检验生产过程是否正常的原假设和备择假设【解】研究者想收集证据予以证明的假设应该是“生产过程不正常”。建立的原假设和备择假设为H0:
335mlH1:
335ml原假设与备择假设【例2】消费者协会接到消费者投诉,指控品牌纸包装饮料存在容量不足,有欺骗消费者之嫌。包装上标明的容量为250毫升。消费者协会从市场上随机抽取50盒该品牌纸包装饮品进行假设检验。试陈述此假设检验中的原假设和备择假设。【解】消费者协会的意图是倾向于证实饮料厂包装饮料小于250ml。建立的原假设和备择假设为H0:
≥
250mlH1:<250ml原假设与备择假设【例3】一家研究机构估计,某城市中家庭购买有价证券的比例超过30%。为验证这一估计是否正确,该研究机构随机抽取了一个50户组成的样本进行检验,试陈述此问题中的原假设和备择假设。【解】研究者想收集证据予以支持的假设是“城市中家庭购买有价证券的比例超过30%”。建立的原假设和备择假设为H0:
≤
30%H1:
30%设计检验统计量根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量标准化的检验统计量设计检验统计量非正态小样本情形不讨论。总体分布样本容量σ已知σ未知正态分布大样本小样本*非正态分布大样本拒绝域和接受域的确定(双侧检验)抽样分布0临界值临界值a/2a/2
样本统计量拒绝H0拒绝H01-
置信水平拒绝域接受域拒绝域判断规则从概率的角度来讲,如果统计量取值的概率小于或者等于显著水平,表明小概率事件发生了,因此拒绝原假设,反之,不能拒绝原假设。(p值*)如果统计量的值正好落在拒绝域之内,那么拒绝原假设,如果落在接受域之内,则不能拒绝原假设,如果正好等于临界值,也要拒绝原假设。【例4】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml,服从正态分布。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了16罐进行检验,测得每罐平均容量为257.2ml。取显著性水平
=0.05,检验该天生产的饮料容量是否符合标准要求?双侧检验判断规则H0
:
=255H1
:
255
=0.05n=16临界值(Zc):检验统计量:z01.96-1.960.025拒绝H0拒绝H00.025决策:不能拒绝H0结论:样本提供的证据表明:该天生产的饮料与标准没有显著差异,样本均值与标准的差异是因为随机因素所引起的。
显著性水平和拒绝域(单侧检验)0临界值a样本统计量拒绝H0抽样分布1-
置信水平拒绝域接受域显著性水平和拒绝域(左侧检验)0临界值a样本统计量拒绝H0抽样分布1-
置信水平观察到的样本统计量显著性水平和拒绝域(左侧检验)0临界值a样本统计量拒绝H0抽样分布1-
置信水平观察到的样本统计量显著性水平和拒绝域(右侧检验)【例5】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml,服从正态分布。换了一批工人后,质检人员在某天生产的饮料中随机抽取了16罐进行检验,测得每罐平均容量为257.2ml。取显著性水平
=0.05,检验该天生产的饮料容量是否增加了?右侧检验z0拒绝H00.051.645H0
:
≤255H1
:
>255决策:拒绝H0结论:样本提供的证据表明:该天生产的饮料与标准有显著差异,可以认为换工人后容量增加了。显著性水平和拒绝域(右侧检验)0临界值a样本统计量拒绝H0抽样分布1-
置信水平观察到的样本统计量显著性水平和拒绝域(右侧检验)0临界值a样本统计量拒绝H0抽样分布1-
置信水平观察到的样本统计量小概率思想采用逻辑上的反证法,依据统计上的小概率原理(核心是构造小概率事件)总体(某种假设)抽样样本(观察结果)检验(不能拒绝原假设)(拒绝原假设)小概率事件未发生小概率事件发生小概率思想假设检验中的反证法与数学中的反证法的比较小概率事件在一次实验中不可能发生的事件,如果发生了,那么就可以拒绝原来的假设。泰力布:等待黑天鹅的人反证法假设检验方法用途证明H1成立判断H1成立还是H0成立推理过程设H0成立设H0成立寻找矛盾构造小概率事件发现矛盾—>H1成立小概率事件发生—>拒绝H0成立没有发现矛盾—>证明失败小概率事件没有发生—>不能拒绝H0成立假设检验的两类错误两类错误和假设检验的规则1假设检验中的两类错误之间的关系2置信区间与假设检验之间的关系3本节学习内容一个总体的检验4两类错误和假设检验的规则第Ⅰ类错误(弃真错误)原假设为真时拒绝原假设第Ⅰ类错误的概率记为
被称为显著性水平第Ⅱ类错误(取伪错误)原假设为假时未拒绝原假设第Ⅱ类错误的概率记为
(Beta)
两类错误和假设检验的规则H0:无罪陪审团审判裁决实际情况无罪有罪有罪错误正确无罪正确错误H0检验决策实际情况H0为真H0为假拒绝H0第Ⅰ类错误(a)正确决策(1-b)未拒绝H0正确决策(1–a)第Ⅱ类错误(b)假设检验就好像一场审判过程统计检验过程假设检验中的两类错误之间的关系H0:药品为真药真药假药拒绝拒绝域大
大弃真正确不拒绝正确接受域小
小取伪宁可错杀三千,不可放过一个。H0:某次面试为好机会好机会不好的机会拒绝(不去)拒绝域小
小正确不拒绝(去)正确接受域大
大假设检验中的两类错误之间的关系
错误和
错误的关系
你不能同时减少两类错误!只能增加样本容量。
和
的关系就像翘翘板,
小
就大,
大
就小置信区间与假设检验之间的关系根据置信度1-α构造置信区间,如果统计量落在置信区间中,那么接受原假设,如果不在置信区间中,那么拒绝原假设。根据显著水平α,可以构建置信度为1-α的置信区间。一个总体的检验Z检验(单侧和双侧)t检验(单侧和双侧)Z检验(单侧和双侧)
2检验(单侧和双侧)均值一个总体比例方差单个总体均值的检验单个正态总体均值的检验1本节学习内容单个正态总体均值的检验确定检验统计量的因素:样本容量的大小总体分布形状总体方差是否已知主要情形正态总体(方差已知,小样本,)正态总体(方差未知,且为小样本)大样本(不论总体是否正态,不论方差是否已知)三种假设检验的形式(双侧,左侧和右侧)总体平均数的检验(正态,方差已知,小样本)假定条件总体服从正态分布小样本(n<30),但是总体方差已知检验统计量总体平均数的检验(正态,方差已知,小样本)【例】某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为
0=0.081mm,总体标准差为0.025。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(
=0.05)H0:
=0.081,H1:
0.081,
=0.05,n=200临界值(s)(双侧检验)检验统计量:决策:拒绝H0结论:有证据表明新机床加工的零件的椭圆度与以前有显著差异。Z01.96-1.96.025拒绝H0拒绝H0.025总体均值的检验规则(正态,方差已知,小样本)假设双侧检验左侧检验右侧检验假设形式H0
:m=m0H1:
m
m0H0
:m
m0H1:
m<m0H0:
m
m0
H1:
m>m0统计量
已知拒绝域P值决策拒绝H0总体平均数的检验(正态,方差未知,小样本)假定条件总体服从正态分布小样本(n<30),但是总体方差未知检验统计量总体均值的检验规则(正态,方差未知,小样本)假设双侧检验左侧检验右侧检验假设形式H0
:m=m0H1:
m
m0H0
:m
m0H1:
m<m0H0:
m
m0
H1:
m>m0统计量总体
未知拒绝域P值决策拒绝H0总体均值的检验(正态,方差未知,小样本)【例】某机器制造的肥皂厚度规定为5cm,假设肥皂厚度服从正态分布。今欲了解机器性能是否良好,取16块肥皂为样本,测得平均厚度为5.2cm,标准差为0.4cm。问在显著水平为0.05的水平下,机器是否为良好?双侧检验H0
:
=5H1
:
5
决策:不能拒绝H0结论:认为该机器还是良好的,没有充分的理由拒绝原假设。t02.13-2.130.025拒绝H0拒绝H00.025总体均值的检验(正态,方差未知,小样本)【例】某机器制造的肥皂厚度规定为5cm,假设肥皂厚度服从正态分布。今欲了解机器性能是否良好,取16块肥皂为样本,测得平均厚度为5.2cm,标准差为0.4cm。问在显著水平为0.05的水平下,肥皂的平均厚度是否偏高?右侧检验H0:
≤5H1:
>5
决策:拒绝H0结论:认为肥皂的平均厚度偏高。
t(15)0拒绝H00.051.753P值=0.031972<5%,拒绝。总体平均数的检验(大样本)假定条件正态总体或非正态总体大样本(n
30)使用z检验统计量
2已知
2未知总体均值的检验规则(大样本)假设双侧检验左侧检验右侧检验假设形式H0
:m=m0H1:
m
m0H0
:m
m0H1:
m<m0H0:
m
m0
H1:
m>m0统计量
已知:
未知:拒绝域P值决策拒绝H0总体均值的检验(大样本,
2
已知)【例】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为255.8ml。取显著性水平=0.05,检验该天生产的饮料容量是否符合标准要求?双侧检验H0
:
=255,H1
:
255,
=0.05,n=40
决策:不拒绝H0结论:样本提供的证据表明:该天生产的饮料符合标准要求z01.96-1.960.025拒绝H0拒绝H00.025总体均值的检验(大样本,
2
已知)H0
:
≥1.35H1
:
<1.35
=0.01n=50临界值(c):检验统计量:
决策:拒绝H0结论:新机床加工的零件尺寸的平均误差与旧机床相比有显著降低-2.33z0拒绝H00.01总体均值的检验(大样本,
2
未知)【例】某一小麦品种的平均产量为5200kg/hm2。一家研究机构对小麦品种进行了改良以期提高产量。为检验改良后的新品种产量是否有显著提高,随机抽取了36个地块进行试种,得到的样本平均产量为5275kg/hm2,标准差为120/hm2。试检验改良后的新品种产量是否有显著提高?(
=0.05)右侧检验H0
:
5200H1
:
>5200,
=0.05,n=36
决策:拒绝H0
结论:改良后的新品种产量有显著提高z0拒绝H00.051.645单个总体比例及方差的检验总体比例的检验1总体方差的检验2本节学习内容总体比例的检验假定条件np>5,nq>5,样本比例可用正态分布来近似(大样本)检验的z统计量
0为假设的总体比例总体比例的检验规则假设双侧检验左侧检验右侧检验假设形式H0:
=
0H1:
0H0
:
0H1:
<
0H0
:
0
H1:
>
0统计量拒绝域P值决策拒绝H0总体比例的检验【例15】一种以休闲和娱乐为主题的杂志,声称其读者群中有80%为女性。为验证这一说法是否属实,某研究部门抽取了由200人组成的一个随机样本,发现有146个女性经常阅读该杂志。分别取显著性水平0.05和0.01,检验该杂志读者群中女性的比例是否为80%?它们的值各是多少?双侧检验H0
:
=80%H1
:
80%
=0.05z01.96-1.960.025拒绝H0拒绝
H00.025拒绝H0
该杂志的说法不属实。H0
:
=80%H1
:
80%,
=0.01z02.58-2.580.025拒绝H0拒绝H00.025不拒绝H0
该杂志的说法属实总体方差的检验检验一个总体的方差或标准差假设总体近似服从正态分布使用
2分布检验统计量样本方差假设的总体方差总体方差的检验规则假设双侧检验左侧检验右侧检验假设形式H0
:
2=
02H1:
2
02H0
:
2
02H1:
2<
02H0:
2
02H1
:
2>
02统计量拒绝域P值决策拒绝H0总体方差的检验【例16】啤酒生产企业采用自动生产线灌装啤酒,每瓶的装填量为640ml,但由于受某些不可控因素的影响,每瓶的装填量会有差异。此时,不仅每瓶的平均装填量很重要,装填量的方差同样很重要。如果方差很大,会出现装填量太多或太少的情况,这样要么生产企业不划算,要么消费者不满意。假定生产标准规定每瓶装填量的标准差不应超过和不应低于4ml。企业质检部门抽取了10瓶啤酒进行检验,得到的样本标准差为s=3.8ml。试以0.10的显著性水平检验装填量的标准差是否符合要求?双侧检验H0
:
2=42H1
:
2
42
=0.10df=10-1=9不拒绝H0,装填量的标准差否符合要求
2016.91903.32511
/2=0.05P值检验问题什么是P值1本节学习内容P值检验步骤2P值的Excel计算3假设检验总结4是一个概率值。如果原假设H0为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为P值(P-value)。显著性水平
,是研究者自己事先给定的“小概率”标准,从而犯第一类错误的最大概率不能超过
,而P值不是事先给定的,是根据样本观测值计算出来的,它是犯第1类错误的实际概率,P值也称为观测到的显著性水平。什么是P值(P-value)双侧检验P值
/
2
/
2
Z拒绝拒绝H0值临界值计算出的样本统计量计算出的样本统计量临界值1/2P值1/2P值什么是P值双侧检验时,P-值是曲线上方大于等于和小于等于样本统计量区域的面积之和左侧检验P值H0值临界值a样本统计量拒绝域抽样分布1-
置信水平计算出的样本统计量P值什么是P值左侧检验时,P-值为曲线上方小于等于检验统计量区域的面积右侧检验P值H0值临界值a拒绝域抽样分布1-
置信水平计算出的样本统计量P值什么是P值右侧检验时,P-值为曲线上方大于等于检验统计量区域的面积P值是关于数据的概率。它与原假设对或错的概率无关。P值表明在某个总体的许多样本数据中,某一类数据出现的经常程度。如果原假设是正确的,P值告诉我们得到这类样本数据的可能性有多大。如果这个可能性很小,就有理由拒绝原假设。不论是单侧检验还是双侧检验,P值的决策规则:若p-值<
,拒绝H0
若p-值>
,不拒绝H0
什么是P值
P值是反映实际观测到的数据与原假设之间不一致程度的一个概率值。P值越小,说明实际观测到的数据与原假设之间不一致的程度就越大,检验的结果也就越显著。利用P值检验,不必事先确定显著性水平,不同决策者可以灵活地根据P值来做出自己的决策。P值有效地补充了
提供的关于检验可靠性的有限信息。是用于确定是否拒绝原假设的另一个重要工具,P值的应用几乎取代了传统的统计量检验方法,它不仅能得到与统计量检验相同的结论,而且给出了统计量检验不能给出的信息。什么是P值提出原假设和备择假设计算样本的检验统计量的值规定显著性水平
根据检验统计量的值确定P值把P值直接与显著性水平比较大小作出决策若p-值<
,拒绝H0
若p-值>
,不拒绝H0
P值检验步骤统计量检验步骤提出原假设和备择假设计算样本的检验统计量的值规定显著性水平
根据
确定临界值
把检验统计量的值与临界值
比较作出决策统计量的值落在拒绝域中,拒绝原假设。统计量的值落在接受域中,不能拒绝原假设。P值的Excel计算Z检验P值的Excel计算进入Excel界面,直接点击“f(x)”在函数分类中点击“统计”,在函数名菜单下选择“NORMSDIST”,然后确定在对话框中将z值录入,点击确定即可得到P值。注意:Excel给出的P值不一定是我们需要的那个P值,比如:这里的“NORMSDIST”函数的P值表示的是标准正态分布下Z统计量值左边的面积。如果是左侧检验,可以直接用这个P值。如果是双侧检验或右侧检验,最后的P值要重新计算。其它函数给出的P值也是同理的。P值的Excel计算
t检验P值的Excel计算进入Excel界面,直接点击“f(x)”在函数分类“统计”中,选择“TDIST
在出现对话框的X栏中输入计算出的t的绝对值
在Deg-freedom(自由度)栏中输入自由度在Tai
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 电力安全生产风险
- 股权激励居间合同范例
- 糖尿病的临床护理途径
- 商铺转让居间协议样本
- 跨行业携手!房地产行业协会与科技企业签订创新合同合作
- 2024珠海市南方爱迪技工学校工作人员招聘考试及答案
- 2024沿河土家族自治县中等职业学校工作人员招聘考试及答案
- 2024河南省工商行政管理学校工作人员招聘考试及答案
- 2024河北航空管理中等专业学校工作人员招聘考试及答案
- 互联网技术服务框架合同
- 贵州省黔西南州、黔东南州、黔南州中考文综试题(图片版含答案)
- 例谈小组合作学习在小学英语教学中的有效开展(讲座)课件
- 农产品食品检验员(中级)技能等级认定考试题库(含答案)
- 吊车牵引放线跨越公路和停电10千伏线路方案说明
- 幼儿园中班安全《会咬人的电》课件
- 幼儿园维稳排查记录表
- 活动一:文明好宝宝(语言活动)课件
- 2005雷克萨斯gs430gs300原厂维修手册中文sa
- 中学生问题行为及其对策
- 风险管理师国家职业技能标准
- 电气系统设计方案
评论
0/150
提交评论