大学统计学第8章 假设检验_第1页
大学统计学第8章 假设检验_第2页
大学统计学第8章 假设检验_第3页
大学统计学第8章 假设检验_第4页
大学统计学第8章 假设检验_第5页
已阅读5页,还剩72页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八章假设检验假设检验在统计方法中的地位统计方法描述统计推断统计参数估计假设检验统计应用

药物筛选中的假设检验

制药公司开发研制新的药物时,药物筛选成为需面临的一个极其重要的决策问题统计学是对药物筛选技术做出了巨大贡献的学科之一。药物筛选过程中有两种可能的行为“拒绝”开发的新药,这意味着所检验的药物无效或只有微弱的效果。此时采取的行动就是将该药物废弃暂时”接受”开发的新药,此时需要采取的行动是对该药物进行进一步的细致试验根据两种可能出现的研究结果,人们提出了如下相应的假设形式H0:新药对治疗某种特定疾病无效(或效果微弱)H1:新药对治疗某种特定疾病有效第8章假设检验8.1

假设检验的基本问题8.2

一个总体参数的检验8.3

两个总体参数的检验什么是假设检验?

(hypothesistest)1.

先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程2.逻辑上运用反证法,统计上依据小概率原理我认为这种新药的疗效比原有的药物更有效!假设检验中的小概率原理

什么是小概率?1. 在一次试验中,一个几乎不可能发生的事件发生的概率2. 在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设3. 小概率由研究者事先确定总体假设检验的过程抽取随机样本x

=20s=6我认为人口的平均年龄是50岁提出假设

拒绝假设别无选择!作出决策原假设与备择假设原假设

(nullhypothesis)研究者想收集证据予以反对的假设又称“0假设”总是有符号,

或表示为H0H0:

=某一数值指定为符号=,或例如,H0:

10cmnull研究者想收集证据予以支持的假设也称“研究假设”总是有符号,

或表示为H1H1:

<某一数值,或某一数值例如,H1:

<10cm,或10cm备择假设(alternativehypothesis)原假设和备择假设是一个完备事件组,而且相互对立在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立先确定备择假设,再确定原假设等号“=”总是放在原假设上因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)提出假设(结论与建议)单侧检验时零假设和备择假设的选择通常把研究者要证明的假设作为备择假设;把需要充分证据才能证明的假设作为备择假设;将所作出的声明作为原假设;把现状(StatusQuo)作为原假设;把不能轻易否定的假设作为原假设;【例】一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和备择假设提出假设(例题分析)解:研究者想收集证据予以证明的假设应该是“生产过程不正常”。建立的原假设和备择假设为

H0:

10cmH1:

10cm

【例】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500g。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设提出假设(例题分析)解:研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述。建立的原假设和备择假设为

H0:

500H1:

<500500g绿叶洗涤剂【例】一家研究机构估计,某城市中家庭拥有汽车的比例超过30%。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设提出假设(例题分析)解:研究者想收集证据予以支持的假设是“该城市中家庭拥有汽车的比例超过30%”。建立的原假设和备择假设为

H0:

30%H1:

30%双侧检验与单侧检验备择假设没有特定的方向性,并含有符号“”的假设检验,称为双侧检验或双尾检验(two-tailedtest)

备择假设具有特定的方向性,并含有符号“>”或“<”的假设检验,称为单侧检验或单尾检验(one-tailedtest)备择假设的方向为“<”,称为左侧检验

备择假设的方向为“>”,称为右侧检验

双侧检验与单侧检验双侧检验与单侧检验

(假设的形式)假设双侧检验单侧检验左侧检验右侧检验原假设H0:m

=m0H0:m

m0H0:m

m0备择假设H1:m

≠m0H1:m

<m0H1:m

>m0以总体均值的检验为例显著性水平显著性水平

(significantlevel)1. 是一个概率值2. 原假设为真时,拒绝原假设的概率抽样分布的拒绝域3. 表示为(alpha)常用的

值有0.01,0.05,0.104.我们可以在事先确定用于拒绝原假设H0的证据必须强到何种程度。假如我们选择=0.05,样本数据能拒绝原假设的证据要强到:当H0正确时,这种样本结果发生的频率不超过5%;如果我们选择=0.01,就是要求拒绝H0的证据要更强,这种样本结果发生的频率只有1%5. 由研究者事先确定显著性水平和拒绝域

(双侧检验)H0临界值临界值

a/2a/2

样本统计量拒绝H0拒绝H0抽样分布1-置信水平显著性水平和拒绝域

(左侧检验)H0临界值a样本统计量拒绝H0抽样分布1-置信水平显著性水平和拒绝域

(右侧检验)H0临界值a样本统计量抽样分布1-置信水平拒绝H0显著水平和拒绝域单侧检验与双侧检验α/21–αα/2-Zα/2

Zα/2

α–Zα0

α0Zα双侧检验左侧检验右侧检验1.根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量2.对样本估计量的标准化结果检验统计量(teststatistic)

标准化的检验统计量总体均值的检验

(作出判断)是否已知小(正态总体)样本容量n大是否已知否t检验否z检验是z检验

是z检验假设检验结论的表述假设检验结论的表述

(“显著”与“不显著”)当拒绝原假设时,我们称样本结果是统计上显著的拒绝原假设时结论是清楚的当不拒绝原假设时,我们称样本结果是统计上不显著的不拒绝原假设时,并未给出明确的结论,不能说原假设是正确的,也不能说它不是正确的假设检验结论的表述

(“接受”与“不拒绝”)假设检验的目的在于试图找到证据拒绝原假设,而不在于证明什么是正确的当没有足够证据拒绝原假设时,不采用“接受原假设”的表述,而采用“不拒绝原假设”的表述。“不拒绝”的表述实际上意味着并未给出明确的结论,我们没有说原假设正确,也没有说它不正确“接受”的说法有时会产生误导,因为这种说法似乎暗示着原假设已经被证明是正确的了。但事实上,H0的真实值我们永远也无法知道,H0只是对总体真实值的一个假定值,由样本提供的信息也就自然无法证明它是否正确……正如一个法庭宣告某一判决为“无罪(notguilty)”而不为“清白(innocent)”,统计检验的结论也应为“不拒绝”而不为“接受”。

JanKmenta假设检验结论的表述

(为什么不说“接受”)【例】比如原假设为H0:=10,从该总体中抽出一个随机样本,得到x=9.8,s=1,在=0.05的水平上,样本提供的证据没有推翻这一假设,我们说“接受”原假设,这意味着样本提供的证据已经证明=10是正确的。如果我们将原假设改为H0:=10.5,同样,在=0.05的水平上,样本提供的证据也没有推翻这一假设,我们又说“接受”原假设。但这两个原假设究竟哪一个是“真实的”呢?我们不知道假设检验步骤的总结陈述原假设和备择假设确定一个适当的显著性水平,并计算出其临界值,指定拒绝域从所研究的总体中抽出一个随机样本,并利用样本数据算出其具体统计量将统计量的值与临界值进行比较,作出决策统计量的值落在拒绝域,拒绝H0,否则不拒绝H0也可以直接利用P值作出决策5.给出结论8.2一个总体参数的检验8.2.1总体均值的检验8.2.2总体比例的检验8.2.3总体方差的检验总体均值的检验总体均值的检验(例题分析)【例】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为255.8ml。取显著性水平=0.05,检验该天生产的饮料容量是否符合标准要求?H0

=255H1

255=0.05临界值(c):检验统计量:决策:结论:

不拒绝H0样本提供的证据还不足以推翻“该天生产的饮料符合标准要求”的看法0.025拒绝H0拒绝H00.025总体均值的检验(例题分析)【例】某一小麦品种的平均产量为5200kg/hm2

。一家研究机构对小麦品种进行了改良以期提高产量。为检验改良后的新品种产量是否有显著提高,随机抽取了36个地块进行试种,得到的样本平均产量为5275kg/hm2,标准差为120/hm2

。试检验改良后的新品种产量是否有显著提高?(=0.05)H0

5200H1

>5200=0.05临界值(c):z0拒绝H00.051.645检验统计量:拒绝H0(P=0.000088<

=0.05)改良后的新品种产量有显著提高决策:结论:总体均值的检验

(例题分析)【例】一种汽车配件的平均长度要求为12cm,高于或低于该标准均被认为是不合格的。汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进。现对一个配件提供商提供的10个样本进行了检验。假定该供货商生产的配件长度服从正态分布,在0.05的显著性水平下,检验该供货商提供的配件是否符合要求?10个零件尺寸的长度(cm)12.210.812.011.811.912.411.312.212.012.3总体均值的检验

(例题分析)H0

=12H1

12=0.05df=10-1=9临界值(c):检验统计量:不拒绝H0样本提供的证据还不足以推翻“该供货商提供的零件符合要求”的看法决策:结论:t02.262-2.2620.025拒绝

H0拒绝H00.025总体比例的检验

(例题分析)【例】一种以休闲和娱乐为主题的杂志,声称其读者群中有80%为女性。为验证这一说法是否属实,某研究部门抽取了由200人组成的一个随机样本,发现有146个女性经常阅读该杂志。分别取显著性水平=0.05和=0.01,检验该杂志读者群中女性的比例是否为80%?它们的P值各是多少?H0

=80%H1

80%

=0.05n

=200临界值(c):z01.96-1.960.025拒绝

H0拒绝

H00.025检验统计量:拒绝H0(P=0.013328<

=0.05)该杂志的说法并不属实

决策:结论:总体方差的检验20/22

020总体方差的检验

(检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0

:2=02H1:2

0H0

:2

02H1:2

<

02H0:2

02H1:2

>02统计量拒绝域P值决策

拒绝H0总体方差的检验(例题分析)【例】啤酒生产企业采用自动生产线灌装啤酒,每瓶的装填量为640ml,但由于受某些不可控因素的影响,每瓶的装填量会有差异。假定生产标准规定每瓶装填量的标准差不应超过和不应低于4ml。企业质检部门抽取了10瓶啤酒进行检验,得到的样本标准差为s=3.8ml。试以0.10的显著性水平检验装填量的标准差是否符合要求?H0

:2=42H1

:2

42=0.10df=10-1=9临界值(s):2016.91903.32511/2=0.05统计量:不拒绝H0样本提供的证据还不足以推翻“装填量的标准差不符合要求”的看法

决策:结论:利用

P值进行决策什么是P值?

(P-value)如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率P值告诉我们:如果原假设是正确的话,我们得到得到目前这个样本数据的可能性有多大,如果这个可能性很小,就应该拒绝原假设决策规则:若p值<,拒绝H0双侧检验的P值/

2/

2Z拒绝H0拒绝H00临界值计算出的样本统计量计算出的样本统计量临界值1/2P值1/2P值左侧检验的P值0临界值a样本统计量拒绝H0抽样分布1-置信水平计算出的样本统计量P值右侧检验的P值0临界值a拒绝H0抽样分布1-置信水平计算出的样本统计量P值z检验的p-值:检验统计量为z统计量的p-值计算公式,表示检验统计量的抽样数据,则p-值的计算方法如下:如果:,p-值=2 如果:,p-值= 如果:,p-值=

用P值进行检验比根据统计量检验提供更多的信息统计量检验是我们事先给出的一个显著性水平,以此为标准进行决策,无法知道实际的显著性水平究竟是多少比如,根据统计量进行检验时,只要统计量的值落在拒绝域,我们拒绝原假设得出的结论都是一样的,即结果显著。但实际上,统计量落在拒绝域不同的地方,实际的显著性是不同的。比如,统计量落在临界值附近与落在远离临界值的地方,实际的显著性就有较大差异。而P值给出的是实际算出的显著水平,它告诉我们实际的显著性水平是多少P值决策与统计量的比较拒绝H0P值决策与统计量的比较拒绝H0的两个统计量的不同显著性Z拒绝H00统计量1

P1

值统计量2

P2

值拒绝H0临界值总体均值的检验(例题分析)【例】某一小麦品种的平均产量为5200kg/hm2

。一家研究机构对小麦品种进行了改良以期提高产量。为检验改良后的新品种产量是否有显著提高,随机抽取了36个地块进行试种,得到的样本平均产量为5275kg/hm2,标准差为120/hm2

。试检验改良后的新品种产量是否有显著提高?(=0.05)H0

5200H1

>5200=0.05临界值(c):z0拒绝H00.051.645检验统计量:拒绝H0(P=0.000088<

=0.05)改良后的新品种产量有显著提高决策:结论:总体均值的检验(z检验)

(P值的图示)抽样分布P=0.00008801.645a=0.05拒绝H01-计算出的样本统计量=3.75P值总体均值的检验(例题分析)【例】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为255.8ml。取显著性水平=0.05,检验该天生产的饮料容量是否符合标准要求?H0

=255H1

255=0.05临界值(c):检验统计量:决策:结论:

不拒绝H0(P=0.3104>

=0.05)样本提供的证据还不足以推翻“该天生产的饮料符合标准要求”的看法0.025拒绝H0拒绝H00.025总体比例的检验

(例题分析)【例】一种以休闲和娱乐为主题的杂志,声称其读者群中有80%为女性。为验证这一说法是否属实,某研究部门抽取了由200人组成的一个随机样本,发现有146个女性经常阅读该杂志。分别取显著性水平=0.05和=0.01,检验该杂志读者群中女性的比例是否为80%?它们的P值各是多少?H0

=80%H1

80%

=0.05n

=200临界值(c):z01.96-1.960.025拒绝

H0拒绝

H00.025检验统计量:拒绝H0(P=0.013328<

=0.05)该杂志的说法并不属实

决策:结论:假设检验中的两类错误假设检验中的两类错误1. 第Ⅰ类错误(弃真错误)原假设为正确时拒绝原假设第Ⅰ类错误的概率记为被称为显著性水平2. 第Ⅱ类错误(取伪错误)原假设为错误时未拒绝原假设第Ⅱ类错误的概率记为(Beta)H0临界值临界值

a/2a/2

样本统计量拒绝H0拒绝H0抽样分布1-置信水平检验能力

(poweroftest)拒绝一个错误的原假设的能力根据的定义,是指没有拒绝一个错误的原假设的概率。这也就是说,1-

则是指拒绝一个错误的原假设的概率,这个概率被称为检验能力,也被称为检验的势或检验的功效(power)可解释为正确地拒绝一个错误的原假设的概率

错误和

错误的关系你要同时减少两类错误的惟一办法是增加样本容量!和的关系就像翘翘板,小就大,大就小8.3两个总体参数的检验8.3.1两个总体均值之差的检验8.3.2两个总体比例之差的检验8.3.3两个总体方差比的检验两个总体均值之差的检验

两个总体均值之差的检验

(独立大样本)1. 假定条件两个样本是独立的随机样本正态总体或非正态总体大样本(n130和n230)检验统计量12

,22

已知:12

,22

未知:两个总体均值之差的检验

(12,

22

已知)假定条件两个独立的小样本两个总体都是正态分布12,22已知检验统计量两个总体均值之差的检验

(12,22

未知但12=22)假定条件两个独立的小样本两个总体都是正态分布12、22未知但相等,即12=22检验统计量其中:自由度:两个总体均值之差的检验

(12,

22

未知且不相等1222)假定条件两个总体都是正态分布12,22未知且不相等,即1222检验统计量自由度:两个总体均值之差的检验

(例题分析)

【例】某公司对男女职员的平均小时工资进行了调查,独立抽取了具有同类工作经验的男女职员的两个随机样本,并记录下两个样本的均值、方差等资料如右表。在显著性水平为0.05的条件下,能否认为男性职员与女性职员的平均小时工资存在显著差异?

两个样本的有关数据

男性职员女性职员n1=44n1=32=75=70S12=64S22=42.25两个总体均值之差的检验

(例题分析)H0

:1-2=0H1

:1-2

0=0.05n1=44,n2

=32临界值(c):检验统计量:决策:结论:

拒绝H0该公司男女职员的平均小时工资之间存在显著差异

z01.96-1.960.025拒绝H0拒绝H00.025两个总体均值之差的检验

(例题分析)

【例】某饮料公司开发研制出一新产品,为比较消费者对新老产品口感的满意程度,该公司随机抽选一组消费者(8人),每个消费者先品尝一种饮料,然后再品尝另一种饮料,两种饮料的品尝顺序是随机的,而后每个消费者要对两种饮料分别进行评分(0分~10分),评分结果如下表。取显著性水平=0.05,该公司是否有证据认为消费者对两种饮料的评分存在显著差异?两种饮料平均等级的样本数据旧饮料54735856新饮料66743976两个总体比例之差的检验1. 假定条件两个总体都服从二项分布可以用正态分布来近似检验统计量检验H0:1-2=0, >

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论