统计学假设检验_第1页
统计学假设检验_第2页
统计学假设检验_第3页
统计学假设检验_第4页
统计学假设检验_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

假设检验-引例澳大利亚统计局公布的2010年第一季度失业率为6.1%。而RoyMorgan公司在调查了14656名18岁以上的居民以后得到的失业率为7.8%。你认为RoyMorgan的结果显著高于统计局的数字吗?教育部的数字表明,2012年大学毕业生的入职薪水平均值是3000元。杭州电子科技大学的毕业办对毕业的学生进行追踪,调查了80名学生,发现平均薪水为3300元。根据调查结果能否认为杭电学生的平均入职薪水高于全国平均水平?1假设检验的过程和思路

总体假设总体的平均薪水是3000判断样本均值是3300样本2统计方法统计描述统计推断参数估计假设检验点估计区间估计3假设检验(HypothesisTesting)也称为显著性检验,是事先作出一个关于总体参数的假设,然后利用样本信息来判断原假设是否合理,即判断样本信息与原假设是否有显著差异,从而决定应接受或否定原假设的统计推断方法。对总体作出的统计假设进行检验的方法依据是概率论中的“小概率事件实际不可能发生”原理。假设检验的基本原理4假设检验的基本原理

利用假设检验进行推断的基本原理是:小概率事件在一次试验中几乎不会发生。如果对总体的某种假设是真实的(例如学生上课平均出勤率≥95%),那么不利于或不能支持这一假设的事件A(小概率事件,例如样本出勤率=55%

)在一次试验中几乎不可能发生的;要是在一次试验中A竟然发生了(样本出勤率=55%),就有理由怀疑该假设的真实性,拒绝提出的假设。5基本原理统计学是通过假设检验的方法来解决上述问题的。假设检验和参数估计是统计推断的两个组成部分,它们都是利用样本对总体进行某种推断。参数估计是用样本统计量估计总体参数的方法,总体参数在估计之前是未知的。假设检验则是先对总体提出一个假设,然后利用样本信息去检验这个假设是否成立。6假设检验的一般问题假设检验的步骤假设检验中的小概率原理两类错误双侧检验和单侧检验7假设检验总体均值的假设检验总体比例的假设检验总体方差的假设检验s未知s已知大样本小样本两个总体均值差的假设检验8假设检验的步骤根据问题要求提出

原假设(H0)和备择假设(H1);确定适当的检验统计量及相应的抽样分布;

计算检验统计量的值;选取显著性水平,确定原假设的接受域和拒绝域;作出统计决策。9总体假设检验的过程抽取随机样本均值

X=20我认为人口的平均年龄是50岁提出假设

拒绝假设!

别无选择.作出决策10什么是原假设与备择假设原假设通常是研究者想收集证据予以反对的假设原假设,用H0表示,例如:H0:

μ=3000总是包含等号“=”,≥,≤。备择假设通常是研究者想收集证据予以支持的假设;

与原假设对立。零假设,用H1表示,例如:H0:

μ≠3000总是包含等号“≠”,>,<。原假设和备择假设是互斥的,它们中仅有一个正确;等号必须出现在原假设中把现状(做出的声明)作为原假设;或者说不能轻易否定的假设为原假设最常用的有三种情况:双侧检验、左侧检验和右侧检验。检验以“假定原假设为真”开始,如果得到矛盾说明备择假设正确。原假设与备择假设12举例1一种零件的生产标准是直径10cm,对生产过程进行监控以确定零件加工是否符合要求。如果零件的平均直径大于或者小于10cm,则表明生产过程不正常,必须调整。试陈述用于检验生产过程是否正常的原假设和备择假设。设这台机床生产的零件平均直径为μ。

H0:μ

=10(生产过程正常)

H1:μ≠10(生产过程不正常)13举例2某品牌洗发水在产品说明书中称:平均净含量不少于500ml。相关机构要通过抽检其中一批产品来验证是否属实。试陈述用于检验的原假设和备择假设。设该品牌洗发水的平均净含量真值是μ。

如果μ<500,表明说明书的内容不属实。H0:μ

≥500(净含量符合说明书)

H1:μ

<500(净含量不符合说明书)14举例3据阿里巴巴公司公布,杭州城市中家庭拥有汽车的比率超过50%。为验证这一估计是否正确,某研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设和备择假设。研究者想收集证据予以证明:比率不超过50%H0:p≥50%(比率超过50%)

H1:p<50%(比率不超过50%)15选择检验统计量检验统计量是根据样本观测结果计算得到的,据以对原假设和备择假设作出决策的某个统计量,不同的总体参数适用的检验统计量不同。假设检验中用到的检验统计量,都是标准化检验统计量,反应了点估计量与假设的总体参数相比,相差多少个标准差。对总体均值的检验,标准化检验统计量为:点估计量-假设值点估计量的抽样标准差16均值检验中检验统计量的选择总体正态?n≥30?σ2已知?否是是否否是实际中总体方差总是未知的,因而这是应用最多的公式根据中心极限定理得到的近似结果。

σ未知时用s来估计。增大n;数学变换等。规定显著性水平,确定拒绝域显著性水平α是一个概率值。原假设为真时,拒绝原假设的概率,是抽样分布的拒绝域。拒绝域的面积随α的减小而减小。常用的α

值为0.01,0.05,0.1由研究者事先确定。18双侧检验和单侧检验假设检验分为双侧检验和单侧检验。(一)双侧检验例1某机床厂加工一种零件,根据经验知道,该厂加工的零件的椭圆度渐近服从正态分布,其总体均值为0.081mm,总体标准差为0.025mm。今另换一台新机床进行加工,取200个零件进行检验,得到椭圆度均值为0.076mm。试问新机床加工零件的椭圆度总体均值与以前有无显著差异。19双侧检验

(显著性水平与拒绝域)H0值样本统计量置信水平临界值临界值a/2a/2

拒绝域拒绝域抽样分布1-20㈡、单侧检验单侧检验分为左单侧检验和右单侧检验两种。1、左单侧检验例某批发商欲从厂家购进一批灯泡,根据合同规定,灯泡的使用寿命平均不低于1000小时。已知灯泡使用寿命服从正态分布,标准差为20小时。在总体中随机抽取100个灯泡,得知样本均值为960小时,批发商是否应该购买这批灯泡?解:提出假设:H0:μ≥1000H1:μ<1000

左单侧检验图示(α=0.05)。也可以把左单侧检验称为下限检验。21左侧检验

(显著性水平与拒绝域)样本统计量H0值临界值a拒绝域抽样分布1-置信水平样本统计量22右单侧检验例3某种大量生产的袋装食品,按规定每袋重量不得少于250克。现在从一批该种食品中任意抽取50袋,发现有6袋低于250克。如果规定不合格率超过5%,就不得出厂,这批食品能否出厂呢?解:原假设H0:μ≤5%

备择假设H1:μ>5%右单侧检验(α=0.05),也称为上限检验23右侧检验

(显著性水平与拒绝域)样本统计量H0值临界值a拒绝域抽样分布1-置信水平样本统计量24H0:无罪假设检验中的两类错误假设检验就好像一场审判过程统计检验过程正确正确错误错误25假设检验中的两类错误不能同时降低两类错误!对一定的样本量n,不能同时减小犯这两种错误的概率如果减小a错误,就会b增大错误的机会;如果减小b错误,则会增大a错误的概率。26第二节一个正态总体参数的检验总体均值的检验总体方差的检验总体比例的检验27一个总体参数的检验Z检验(单侧和双侧)t检验(单侧和双侧)Z检验(单侧和双侧)

2检验(单侧和双侧)均值一个总体比例方差28一、总体均值的检验

(检验统计量)总体是否已知?用样本标准差S代替t检验小样本容量n否是z检验

z检验大29一、总体方差已知的均值检验

1.双侧Z

检验假设条件:总体正态,或

n

较大()步骤:⑴

⑵构造并计算检验统计量

⑶规定显著性水平,查表得临界值。

⑷进行决策。若样本统计量则拒绝,否则接受。0临界值临界值a/2

a/2

拒绝H0拒绝H01-置信水平举例某服装品牌主管经理估计会员的平均年龄是35岁,研究人员从2013年入会的新会员中随机抽取40人,调查得到他们的年龄数据如下。试根据调查结果判断主管经理的估计是否准确?311.提出原假设和备选假设H0:

m=35;m表示总体会员的平均年龄,即总体会员的平均年龄与主管经理估计的35岁没有差异。备选假设可以表示为H1:

m≠35。原假设与备选假设互斥,检验结果二者必取其一。2.确定适当的检验统计量在具体问题中,选择什么统计量,需要考虑:

总体方差已知还是未知?样本是大样本还是小样本?在本例中,由于n=40>30是大样本,近似服从正态分布,以样本标准差代替总体标准差,所用的统计量是:323.选取显著性水平,确定接受域和拒绝域接受域和拒绝域

本例为双侧检验,接受域:-1.96≤z≤1.96

拒绝域:z<-1.96或z>1.96临界值临界值接受域1

-4.作出统计决策在本例中,由于z=-3.455<-1.96,落在拒绝域内,所以拒绝原假设H0。结论:在a=0.05的显著性水平下,抽样结果的平均年龄显著低于主管经理的估计值,有理由认为经理的估计不准确。二、2

未知大样本均值的检验

(z检验)【例】某电子元件批量生产的质量标准为平均使用寿命1200小时。某厂宣称他们采用一种新工艺生产的元件质量大大超过规定标准。为了进行验证,随机抽取了100件作为样本,测得平均使用寿命1245小时,标准差300小时。能否说该厂生产的电子元件质量显著地高于规定标准?(=0.05)单侧检验342

未知大样本均值的检验

(z检验)H0:1200H1:>1200=0.05n=100检验统计量:在=0.05的水平上不能拒绝H0不能认为该厂生产的元件寿命显著地高于1200小时决策:结论:Z0拒绝域0.051.645352

未知小样本均值的检验

(例题分析)【例】某机器制造出的肥皂厚度为5cm,服从正态分布,今欲了解机器性能是否良好,随机抽取10块肥皂为样本,测得平均厚度为5.3cm,标准差为0.3cm,试以0.05的显著性水平检验机器性能良好的假设。双侧检验362

未知小样本均值的检验

(t检验)H0:=5H1:

5=0.05df=10-1=9临界值(s):检验统计量:在=0.05的水平上拒绝H0说明该机器的性能不好

决策:结论:t02.262-2.262.025拒绝H0拒绝H0.02537一个总体比例的检验假定条件有两类结果总体服从二项分布可用正态分布来近似()比例检验的Z统计量p为假设的总体比例38一个总体比例的检验

(例题分析)【例】一项统计结果声称,某市老年人口(年龄在65岁以上)的比重为14.7%,该市老年人口研究会为了检验该项统计是否可靠,随机抽选了400名居民,发现其中有57人年龄在65岁以上。调查结果是否支持该市老年人口比重为14.7%的看法?(=0.05)双侧检验39一个总体比例的检验

(例题分析)H0:p=14.7%H1:p

14.7%=0.05n=400检验统计量:在

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论