统计学假设检验_第1页
统计学假设检验_第2页
统计学假设检验_第3页
统计学假设检验_第4页
统计学假设检验_第5页
已阅读5页,还剩93页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学假设检验第一页,共九十八页,编辑于2023年,星期三

……正如一个法庭宣告某一判决为“无罪(notguilty)”而不为“清白(innocent)”,统计检验的结论也应为“不拒绝”而不为“接受”。

——JanKmenta统计名言第二页,共九十八页,编辑于2023年,星期三案例辛普森杀妻案第三页,共九十八页,编辑于2023年,星期三辛普森案(英语:O.J.Simpsonmurdercase,又称加利福尼亚人民诉辛普森案,英语:Peoplev.Simpson)是美国加利福尼亚州最高法院对前美式橄榄球明星、演员O•J•辛普森进行的刑事诉讼,在该案中,辛普森被指控于1994年犯下两宗谋杀罪,受害人为其前妻妮克尔•布朗•辛普森及其好友罗纳德•高曼。该案被称为是美国历史上最受公众关注的刑事审判案件。第四页,共九十八页,编辑于2023年,星期三案发时间,1994年6月12日深夜案发后凌晨,辛普森门外有血迹现场滴落的血痕中有辛普森的血,辛普森家中血手套和辛普森的脏衣服都有被害人的血第五页,共九十八页,编辑于2023年,星期三法庭战争

检方的“铁证如山”与“梦幻律师团”在检方看来,本案可谓是“铁证如山”,本案中无论是证据数量,还是证据的可信程度,在检方看来,都达到了很高的标准。第六页,共九十八页,编辑于2023年,星期三控辩双方几个关键的地方

控方:检方在审判的最初几周出示证据,证明辛普森曾有对妮可尔的家庭暴力史。辩方:时遭受丈夫家庭暴力中,遭受丈夫伤害的概率为1%第七页,共九十八页,编辑于2023年,星期三控方:鞋码与辛普森的相似,辛普森手上有划痕辩方:世界上与辛普森鞋码一样的人数不胜数,在左手有伤痕的人也不尽其数,所以这样的证据对案件的判断是没有任何价值的。第八页,共九十八页,编辑于2023年,星期三控方:在犯罪现场发现的血液,DNA鉴定发现与辛普森是完全一致的,而DNA鉴定两个人一致的可能性只有万分之。辩方:在洛杉矶300万人口中,就有300个人DAN一致,辛普森是洛杉矶人口的1人,所以,辛普森是杀人凶手的概率只有0.03%。如果认为新浦森有罪的话,那么误判的概率将高达99.97%.最终无罪释放。第九页,共九十八页,编辑于2023年,星期三控方:平时遭受丈夫家庭暴力中,非正常死亡的,其凶手为丈夫的概率为80%。控方:可能会有很多与辛普森鞋码一样的人,但也会有很多左手有划痕的人,但辛普森是一个嫌疑犯,不能把他放在所有的人当中去进行归类,于是只能放在嫌疑犯中,在嫌疑犯中,跟辛普森鞋码吻合的人的概率非常之小第十页,共九十八页,编辑于2023年,星期三法庭宣判过程法官假定辛普森无罪——控方搜集证据证明他有罪,只有当证据充足的时候才能宣判有罪,否则要接受法官的假定。第十一页,共九十八页,编辑于2023年,星期三辛浦森(Simpson'sParadox)悖论案例1:是否存在种族歧视被告种族受害者种族死刑判决是否白人白人19132

黑人09黑人白人1152

黑人697160166

36290326第十二页,共九十八页,编辑于2023年,星期三总的看,白人有19/160=12%的被告被判处死刑,与之对应,黑人只有17/166=10%的被告被判死刑,白人死刑率要高一些.但如果考虑受害者的种族,结论就相反了.当受害者是白人时,有11/63=17.5%的黑人被告被判死刑,而只有19/151=12.6%的白人被告被判死刑.当受害者是黑人时,白人被告没一个人(0%)被判死刑,而黑人被告确有6/103=5.8%的被判死刑.第十三页,共九十八页,编辑于2023年,星期三控方:DNA鉴定辩方:把辛普森至于300万人群当中,但新浦是是嫌疑犯,所以应把他放在嫌疑犯这个人群中,那么样本与他一致的也就他一个人第十四页,共九十八页,编辑于2023年,星期三综上,只有辛普森一个人符合三个条件第十五页,共九十八页,编辑于2023年,星期三第7章假设检验7.1假设检验的基本问题7.2一个总体参数的检验第十六页,共九十八页,编辑于2023年,星期三学习目标

1.理解假设检验的基本思想和基本步骤;2.理解假设检验的两类错误及其关系;3.熟练掌握一个总体平均数、总体成数各种假设检验方法;4.利用P-值进行假设检验。用Excel进行检验第十七页,共九十八页,编辑于2023年,星期三假设检验知识结构总体参数检验一个总体两个总体均值比例方差均值差比例差方差比独立样本匹配样本大样本F检验Z检验大样本小样本Z检验1222已知1222未知Z检验t检验大样本小样本Z检验2已知Z检验2未知t检验Z检验卡方检验第十八页,共九十八页,编辑于2023年,星期三7.1假设检验的基本原理

7.1.1怎样提出假设?

7.1.2怎样做出决策?

7.1.3怎样表述决策结果?第7章假设检验第十九页,共九十八页,编辑于2023年,星期三7.1.1怎样提出假设?7.1假设检验的基本原理第二十页,共九十八页,编辑于2023年,星期三1.什么是假设?假设:定义为一个调研者或管理者对被调查总体的某些特征所做的一种假定或猜想。是对总体参数的一种假设。常见的是对总体均值或比例和方差的检验;在分析之前,被检验的参数将被假定取一确定值。我认为到KFC消费的人平均花费2.5美元!第二十一页,共九十八页,编辑于2023年,星期三2、市场调研中常见的假设检验问题一项跟踪调查的结果表明,顾客对产品的了解程度比6个月前所做的类似调查中的显示要低。结果是否明显降低?是否低到需要改变广告策略的程度?一位产品经理认为其产品购买者的平均年龄为35岁。为检验其假设,他进行了一项调查,调查表明购买者平均年龄为38.5岁。调查结果与其观点的差别是够足以说明此经理里的观点是不正确的?第二十二页,共九十八页,编辑于2023年,星期三3、问题在哪里?

某广告商宣称其代理的A产品的合格率达到99%,质检人员为了验证,随机抽取了一件产品,发现是一件次品。质检人员会是什么反应呢?第二十三页,共九十八页,编辑于2023年,星期三什么是假设检验?

(hypothesistest)先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的统计方法有参数检验和非参数检验逻辑上运用反证法,统计上依据小概率原理小概率是在一次试验中,一个几乎不可能发生的事件发生的概率在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设第二十四页,共九十八页,编辑于2023年,星期三原假设

(nullhypothesis)又称“0假设”,研究者想收集证据予以反对的假设,用H0表示所表达的含义总是指参数没有变化或变量之间没有关系最初被假设是成立的,之后根据样本数据确定是否有足够的证据拒绝它总是有符号,或H0:

=某一数值H0:

某一数值H0:

某一数值例如,H0:

10cmnull第二十五页,共九十八页,编辑于2023年,星期三也称“研究假设”,研究者想收集证据予以支持的假设,用H1或Ha表示所表达的含义是总体参数发生了变化或变量之间有某种关系备择假设通常用于表达研究者自己倾向于支持的看法,然后就是想办法收集证据拒绝原假设,以支持备择假设

总是有符号,

或H1:

某一数值H1:

某一数值H1:<某一数值备择假设(alternativehypothesis)第二十六页,共九十八页,编辑于2023年,星期三【例】一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和被择假设提出假设(例题分析)解:研究者想收集证据予以证明的假设应该是“生产过程不正常”。建立的原假设和备择假设为

H0:

10cmH1:

10cm第二十七页,共九十八页,编辑于2023年,星期三【例】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设提出假设(例题分析)解:研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述。建立的原假设和备择假设为

H0:

500H1:

<500第二十八页,共九十八页,编辑于2023年,星期三【例】一家研究机构估计,某城市中家庭拥有汽车的比例超过30%。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设提出假设(例题分析)解:研究者想收集证据予以支持的假设是“该城市中家庭拥有汽车的比例超过30%”。建立的原假设和备择假设为

H0:

30%H1:

30%第二十九页,共九十八页,编辑于2023年,星期三提出假设总结H0:通常是将研究者不愿相信的、不认可的、想拒绝的结论H0:

=某一数值H0:

某一数值H0:

某一数值H1:与原假设是对立的,通常是研究者想要支持的、愿意相信的结果H1:

某一数值H1:

某一数值H1:<某一数值先确定备择假设,再确定原假设原假设和备择假设必有一个成立,而且只有一个成立

等号只能出现在原假设里因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)第三十页,共九十八页,编辑于2023年,星期三备择假设没有特定的方向性,并含有符号“”的假设检验,称为双侧检验或双尾检验(two-tailedtest)备择假设具有特定的方向性,并含有符号“>”或“<”的假设检验,称为单侧检验或单尾检验(one-tailedtest)备择假设的方向为“<”,称为左侧检验

备择假设的方向为“>”,称为右侧检验

双侧检验与单侧检验第三十一页,共九十八页,编辑于2023年,星期三双侧检验与单侧检验

(假设的形式)假设双侧检验单侧检验左侧检验右侧检验原假设H0:m

=m0H0:m

m0H0:m

m0备择假设H1:m

≠m0H1:m

<m0H1:m

>m0以总体均值的检验为例第三十二页,共九十八页,编辑于2023年,星期三7.1.2怎样做出决策?7.1假设检验的基本原理第三十三页,共九十八页,编辑于2023年,星期三假设检验的步骤1.提出原假设H0和备择假设H12.构造适当的检验统计量3.给定显著性水平

0.01,0.05,0.104.计算检验统计量的值5.做出判断第三十四页,共九十八页,编辑于2023年,星期三假设检验的基本思想...

因此我们拒绝假设

=50...

如果这是总体的假设均值样本均值m

=50抽样分布H0这个值不像我们应该得到的样本均值...20第三十五页,共九十八页,编辑于2023年,星期三两类错误与显著性水平(了解)研究者总是希望能做出正确的决策,但由于决策是建立在样本信息的基础之上,而样本又是随机的,因而就有可能犯错误原假设和备择假设不能同时成立,决策的结果要么拒绝H0,要么不拒绝H0。决策时总是希望当原假设正确时没有拒绝它,当原假设不正确时拒绝它,但实际上很难保证不犯错误第Ⅰ类错误(错误)原假设为正确时拒绝原假设第Ⅰ类错误的概率记为,被称为显著性水平2. 第Ⅱ类错误(错误)原假设为错误时未拒绝原假设第Ⅱ类错误的概率记为(Beta)第三十六页,共九十八页,编辑于2023年,星期三显著性水平

(significantlevel)事先确定的用于拒绝原假设H0时所必须的证据能够容忍的犯第Ⅰ类错误的最大概率(上限值)2. 原假设为真时,拒绝原假设的概率抽样分布的拒绝域3. 表示为(alpha)

常用的值有0.01,0.05,0.104. 由研究者事先确定第三十七页,共九十八页,编辑于2023年,星期三错误和错误的关系你不能同时减少两类错误!和的关系就像翘翘板,小就大,大就小第三十八页,共九十八页,编辑于2023年,星期三依据什么做出决策?若假设为H0=500,H1<500。样本均值为495,拒绝H0吗?样本均值为502,拒绝H0吗?做出拒绝或不拒绝原假设的依据是什么?传统上,做出决策所依据的是样本统计量,现代检验中人们直接使用由统计量算出的犯第Ⅰ类错误的概率,即所谓的P值第三十九页,共九十八页,编辑于2023年,星期三根据样本观测结果计算出对原假设和备择假设做出决策某个样本统计量对样本估计量的标准化结果原假设H0为真点估计量的抽样分布

检验统计量(teststatistic)标准化的检验统计量第四十页,共九十八页,编辑于2023年,星期三用统计量决策

(双侧检验)H1:m

≠m0,I统计量I>临界值,拒绝H0

抽样分布H0临界值临界值a/2a/2拒绝H0拒绝H01-置信水平RegionofRejectionRegionofNonrejectionRegionofRejection第四十一页,共九十八页,编辑于2023年,星期三用统计量决策

(左侧检验)H1:m

<m0,统计量<-临界值,拒绝H0抽样分布H0临界值a拒绝H01-置信水平RegionofRejectionRegionofNonrejection第四十二页,共九十八页,编辑于2023年,星期三用统计量决策

(右侧检验)H1:m

>m0,统计量>临界值,拒绝H0

抽样分布H0临界值

拒绝H01-置信水平RegionofNonrejectionRegionofRejectiona第四十三页,共九十八页,编辑于2023年,星期三统计量决策规则给定显著性水平,查表得出相应的临界值z或z/2,t或t/2将检验统计量的值与水平的临界值进行比较作出决策双侧检验:H1:m

≠m0,I统计量I>临界值,拒绝H0,3>1.96,拒绝左侧检验:H1:m

<m0,统计量<-临界值,拒绝H0,-3<-1.96,拒绝右侧检验:H1:m

>m0,统计量>临界值,拒绝H0,3>1.96,拒绝当单侧检验时,只要统计量与z或

t大小比较方向与备择假设符合一致时,拒绝不过,总而言之,无论是哪一种检验形式,只要I统计量I>临界值,拒绝H0第四十四页,共九十八页,编辑于2023年,星期三用P值决策软件操作中的sig.即为P值

(P-value)如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率,也就是我们拒绝原假设面临的风险P值告诉我们:如果原假设是正确的话,我们得到得到目前这个样本数据的可能性有多大,如果这个可能性很小,就应该拒绝原假设被称为观察到的(或实测的)显著性水平决策规则:若p值<,拒绝H0,即是说,拒绝原假设犯弃真错误的风险比事先假定的风险还小,所以拒绝原假设也无妨。第四十五页,共九十八页,编辑于2023年,星期三双侧检验的P值/

2/

2Z拒绝H0拒绝H00临界值计算出的样本统计量计算出的样本统计量临界值1/2P值1/2P值第四十六页,共九十八页,编辑于2023年,星期三左侧检验的P值Z拒绝H00临界值计算出的样本统计量1/2P值第四十七页,共九十八页,编辑于2023年,星期三右侧检验的P值Z拒绝H00计算出的样本统计量临界值1/2P值第四十八页,共九十八页,编辑于2023年,星期三用P值进行检验比根据统计量检验提供更多的信息统计量检验是我们事先给出的一个显著性水平,以此为标准进行决策,无法知道实际的显著性水平究竟是多少比如,根据统计量进行检验时,只要统计量的值落在拒绝域,我们拒绝原假设得出的结论都是一样的,即结果显著。但实际上,统计量落在拒绝域不同的地方,实际的显著性是不同的。比如,统计量落在临界值附近与落在远离临界值的地方,实际的显著性就有较大差异。而P值给出的是实际算出的显著水平,它告诉我们实际的显著性水平是多少P值决策与统计量的比较第四十九页,共九十八页,编辑于2023年,星期三拒绝H0P值决策与统计量的比较拒绝H0的两个统计量的不同显著性Z拒绝H00统计量1

P1

值统计量2

P2

值拒绝H0临界值第五十页,共九十八页,编辑于2023年,星期三7.1.3怎样表述决策结果?7.1假设检验的基本原理第五十一页,共九十八页,编辑于2023年,星期三假设检验不能证明原假设正确假设检验的目的主要是收集证据拒绝原假设,而支持你所倾向的备择假设假设检验只提供不利于原假设的证据。因此,当拒绝原假设时,表明样本提供的证据证明它是错误的,当没有拒绝原假设时,我们也没法证明它是正确的,因为假设检验的程序没有提供它正确的证据这与法庭上对被告的定罪类似:先假定被告是无罪的,直到你有足够的证据证明他是有罪的,否则法庭就不能认定被告有罪。当证据不足时,法庭的裁决是“被告无罪”,但这里也没有证明被告就是清白的第五十二页,共九十八页,编辑于2023年,星期三假设检验不能证明原假设正确假设检验得出的结论都是根据原假设进行阐述的我们要么拒绝原假设,要么不拒绝原假设当不能拒绝原假设时,我们也从来不说“接受原假设”,因为没有证明原假设是真的采用“接受”原假设的说法,则意味着你证明了原假设是正确的没有足够的证据拒绝原假设并不等于你已经“证明”了原假设是真的,它仅仅意为着目前还没有足够的证据拒绝原假设,只表示手头上这个样本提供的证据还不足以拒绝原假设比如,在例6.2中,如果拒绝原假设,表明样本提供的证据证明该品牌洗涤剂的净含量与说明书所标识的不相符。如果不拒绝原假设,只能说这个样本提供的证据还不足证明净含量不是500克或500克以上,并不等于证明了净含量就超过了500克“不拒绝”的表述方式实际上意味着没有得出明确的结论第五十三页,共九十八页,编辑于2023年,星期三假设检验不能证明原假设正确“接受”的说法有时会产生误导这种说法似乎暗示着原假设已经被证明是正确的了实事上,H0的真实值我们永远也无法知道,不知道真实值是什么,又怎么能证明它是什么?H0只是对总体真实值的一个假定值,由样本提供的信息也就自然无法证明它是否正确采用“不拒绝”的表述方法更合理一些,因为这种表述意味着样本提供的证据不够强大,因而没有足够的理由拒绝,这不等于已经证明原假设正确第五十四页,共九十八页,编辑于2023年,星期三假设检验不能证明原假设正确【例】比如原假设为H0:=10,从该总体中抽出一个随机样本,得到x=9.8,在=0.05的水平上,样本提供的证据没有推翻这一假设,我们说“接受”原假设,这意为着样本提供的证据已经证明=10是正确的。如果我们将原假设改为H0:=10.5,同样,在=0.05的水平上,样本提供的证据也没有推翻这一假设,我们又说“接受”原假设。但这两个原假设究竟哪一个是“真实的”呢?其人弗能应也第五十五页,共九十八页,编辑于2023年,星期三假设检验不能证明原假设正确假设检验中通常是先确定显著性水平,这就等于控制了第Ι类错误的概率,但犯第Ⅱ类错误的概率却是不确定的在拒绝H0时,犯第Ⅰ类错误的概率不超过给定的显著性水平,当样本结果显示没有充分理由拒绝原假设时,也难以确切知道第Ⅱ类错误发生的概率采用“不拒绝”而不采用“接受”的表述方式,在多数场合下便避免了错误发生的风险因为“接受”所得结论可靠性将由第Ⅱ类错误的概率来测量,而的控制又相对复杂,有时甚至根本无法知道的值,除非你能确切给出,否则就不宜表述成“接受”原假设第五十六页,共九十八页,编辑于2023年,星期三假设检验不能证明原假设正确在实际检验中,针对一个具体的问题,将检验结果表述为“不拒绝”原假设,这似乎让人感到无所是从比如,你想购买一批产品,检验的结果没有拒绝原假设,即达到合同规定的标准要求,你是否购买这批产品呢?这时,你可以对检验的结果采取某种默认态度,退一步说,你可以将检验结果表述为“可以接受”原假设,你但这并不等于说你“确实接受”它第五十七页,共九十八页,编辑于2023年,星期三统计上显著不一定有实际意义当拒绝原假设时,我们称样本结果是统计上显著的(statisticallySignificant)当不拒绝原假设时,我们称样本结果是统计上不显著的在“显著”和“不显著”之间没有清除的界限,只是在P值越来越小时,我们就有越来越强的证据,检验的结果也就越来越显著第五十八页,共九十八页,编辑于2023年,星期三“显著的”(Significant)一词的意义在这里并不是“重要的”,而是指“非偶然的”一项检验在统计上是“显著的”,意思是指:这样的(样本)结果不是偶然得到的,或者说,不是靠机遇能够得到的如果得到这样的样本概率(P)很小,则拒绝原假设在这么小的概率下竟然得到了这样的一个样本,表明这样的样本经常出现,所以,样本结果是显著的统计上显著不一定有实际意义第五十九页,共九十八页,编辑于2023年,星期三统计上显著不一定有实际意义在进行决策时,我们只能说P值越小,拒绝原假设的证据就越强,检验的结果也就越显著但P值很小而拒绝原假设时,并不一定意味着检验的结果就有实际意义因为假设检验中所说的“显著”仅仅是“统计意义上的显著”一个在统计上显著的结论在实际中却不见得就很重要,也不意味着就有实际意义因为值与样本的大小密切相关,样本量越大,检验统计量的P值也就越大,P值就越小,就越有可能拒绝原假设第六十页,共九十八页,编辑于2023年,星期三统计上显著不一定有实际意义如果你主观上要想拒绝原假设那就一定能拒绝它这类似于我们通常所说的“欲加之罪,何患无词”只要你无限制扩大样本量,几乎总能拒绝原假设当样本量很大时,解释假设检验的结果需要小心在大样本情况下,总能把与假设值的任何细微差别都能查出来,即使这种差别几乎没有任何实际意义在实际检验中,不要刻意追求“统计上的”显著性,也不要把统计上的显著性与实际意义上的显著性混同起来一个在统计上显著的结论在实际中却不见得很重要,也不意为着就有实际意义第六十一页,共九十八页,编辑于2023年,星期三7.2.1总体均值的检验

(大样本)7.2一个总体参数的检验第六十二页,共九十八页,编辑于2023年,星期三总体均值的检验

(大样本)1. 假定条件大样本(n30)使用z检验统计量2

已知:2

未知:第六十三页,共九十八页,编辑于2023年,星期三总体均值的检验(2已知),P164第1题相似

(例题分析—大样本)【例】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为255.8ml。取显著性水平=0.05,检验该天生产的饮料容量是否符合标准要求?双侧检验第六十四页,共九十八页,编辑于2023年,星期三假设检验的步骤1.提出原假设H0和备择假设H12.给定显著性水平

0.01,0.05,0.10,查表求临界值3.构造适当的检验统计量4.计算检验统计量的值并于临界值进行比较5.做出判断|统计两|>临界值,拒绝原假设,说明在统计上是显著的第六十五页,共九十八页,编辑于2023年,星期三总体均值的检验(2

已知)

(例题分析-大样本)H0

=255H1

255

=0.05n

=

40临界值(c):检验统计量:决策:结论:不拒绝原假设

用Excel中的【NORMSDIST】函数得到的双尾检验P=0.312945不拒绝H0没有证据表明该天生产的饮料不符合标准要求

z01.96-1.960.005拒绝

H0拒绝H00.005第六十六页,共九十八页,编辑于2023年,星期三总体均值的检验(z检验)

(P值的计算与应用)第1步:进入Excel表格界面,直接点击【fx】第2步:在函数分类中点击【统计】,并在函数名菜单下选择【NORMSDIST】,然后【确定】第3步:将z的绝对值1.01录入,得到的函数值为

0.843752345

P值=2(1-0.843752345)=0.312495

P值远远大于,故不拒绝H0第六十七页,共九十八页,编辑于2023年,星期三总体均值的检验(2

未知)

(例题分析—大样本)【例】一种机床加工的零件尺寸绝对平均误差为1.35mm。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低?(=0.01)样本均值为1.3152左侧检验50个零件尺寸的误差数据(mm)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.161.121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.86第六十八页,共九十八页,编辑于2023年,星期三总体均值的检验

(例题分析—大样本)H0

1.35H1

<1.35=0.01n

=50临界值(c):检验统计量:-2.6061<-1.96,于是拒绝H0新机床加工的零件尺寸的平均误差与旧机床相比有显著降低决策:结论:-2.33z0拒绝H00.01第六十九页,共九十八页,编辑于2023年,星期三总体均值的检验

(P值的计算与应用—大样本)第1步:进入Excel表格界面,直接点击【f(x)】第2步:在函数分类中点击【统计】,并在函数名的菜单下选择【ZTEST】,然后【确定】第3步:在所出现的对话框【Array】框中,输入原始数据所

在区域;在【X】后输入参数的某一假定值(这里为

1.35);在【Sigma】后输入已知的总体标准差(若总体标准差未知则可忽略不填,系统将自动使用样本标准差代替)第4步:用1减去得到的函数值0.995421023

即为P值

P值=1-0.995421023=0.004579

P值<=0.01,拒绝H0用Excel计算P值第七十页,共九十八页,编辑于2023年,星期三总体均值的检验

(P值的图示)计算出的样本统计量=2.6061P=0.004579

Z拒绝H00临界值P值第七十一页,共九十八页,编辑于2023年,星期三总体均值的检验(2

未知)

(例题分析)【例】某一小麦品种的平均产量为5200kg/hm2

。一家研究机构对小麦品种进行了改良以期提高产量。为检验改良后的新品种产量是否有显著提高,随机抽取了36个地块进行试种,得到的样本平均产量为5275kg/hm2,标准差为120/hm2

。试检验改良后的新品种产量是否有显著提高?(=0.05)

右侧检验第七十二页,共九十八页,编辑于2023年,星期三总体均值的检验(2

未知)

(例题分析)H0

5200H1

>5200=0.05n

=36临界值(c):检验统计量:拒绝H0因为3.75>1.65,或者(P=0.000088<

=0.05)改良后的新品种产量有显著提高决策:结论:z0拒绝H00.051.645第七十三页,共九十八页,编辑于2023年,星期三总体均值的检验(z检验)

(P值的图示)抽样分布P=0.000088

01.645a=0.05拒绝H01-计算出的样本统计量=3.75P值第七十四页,共九十八页,编辑于2023年,星期三总体均值的检验

(小样本)1. 假定条件总体服从正态分布小样本(n<

30)检验统计量2

已知:2

未知:第七十五页,共九十八页,编辑于2023年,星期三[例7-2]某市历年来对7岁男孩的统计资料表明,他们的身高服从均值为1.32米、标准差为0.12米的正态分布。现从各个学校随机抽取25个7岁男学生,测得他们平均身高1.36米,若已知今年全市7岁男孩身高的标准差仍为0.12米,问与历年7岁男孩的身高相比是否有显著差异(取=0.05)。

解:从题意可知,=1.36米,=1.32米,=0.12米。

(1)建立假设:H0:=1.32,

H1:1.32

(2)确定统计量:

方差已知第七十六页,共九十八页,编辑于2023年,星期三

(3)Z的分布:Z~N(0,1)

(4)对给定的=0.05确定临界值。因为是双侧备择假设所以查表时要注意。因概率表是按双侧排列的,所以应查1-0.05=0.95的值,查得临界值=1.96。

(5)检验准则。|Z|<1.96,接受H0,反之,拒绝H0。

(6)决策:因Z=1.67<1.96;落在了接受域,因此认为今年7岁男孩平均身高与历年7岁男孩平均身高无显著差异,即不能拒绝零假设。

第七十七页,共九十八页,编辑于2023年,星期三总体均值的检验

(例题分析—小样本)【例】一种汽车配件的平均长度要求为12cm,高于或低于该标准均被认为是不合格的。汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进。现对一个配件提供商提供的10个样本进行了检验。假定该供货商生产的配件长度服从正态分布,在0.05的显著性水平下,检验该供货商提供的配件是否符合要求?

10个零件尺寸的长度(cm)12.210.812.011.811.912.411.312.212.012.3第七十八页,共九十八页,编辑于2023年,星期三总体均值的检验

(例题分析—小样本)H0

=12H1

12

=0.05df=10-1=9临界值(c):检验统计量:不拒绝H0没有证据表明该供货商提供的零件不符合要求

决策:结论:t02.262-2.2620.025拒绝

H0拒绝H00.025第七十九页,共九十八页,编辑于2023年,星期三总体均值的检验

(P值的计算与应用-t

检验)第1步:进入Excel表格界面,直接点击【fx】第2步:在函数分类中点击【统计】,并在函数名的菜单下选择【TDIST】,然后【确定】第3步:在出现对话框的【X】栏中输入计算出的t的绝对值0.7035,在【Deg-freedom】(自由度)栏中输入本例的自由度9,在【Tails】栏中输入2(表明是双侧检验,如果是单测检验则在该栏输入1)第4步:P值=0.499537958

P值>=0.05,故不拒绝H0

第八十页,共九十八页,编辑于2023年,星期三一个总体均值的检验

(作出判断)是否已知小样本量n大是否已知否

t检验否z检验是z检验

是z检验第八十一页,共九十八页,编辑于2023年,星期三7.2.1总体比例的检验7.3一个总体参数的检验第八十二页,共九十八页,编辑于2023年,星期三总体比例检验假定条件总体服从二项分布可用正态分布来近似(大样本)检验的z统计量0为假设的总体比例第八十三页,共九十八页,编辑于2023年,星期三总体比例的检验

(例题分析)【例】一种以休闲和娱乐为主题的杂志,声称其读者群中有80%为女性。为验证这一说法是否属实,某研究部门抽取了由200人组成的一个随机样本,发现有146个女性经常阅读该杂志。分别取显著性水平

=0.05和=0.01

,检验该杂志读者群中女性的比例是否为80%?它们的P值各是多少?第八十四页,共九十八页,编辑于2023年,星期三总体比例的检验

(例题分析)H0

=80%H1

80%

=0.05n

=200临界值(c):检验统计量:拒绝H0(P=0.013328<

=0.05)该杂志的说法并不属实

决策:结论:z01.96-1.960.025拒绝

H0拒绝

H00.025第八十五页,共九十八页,编辑于2023年,星期三总体比例的检验

(例题分析)H0

=80%H1

80%=0.01n

=200临界值(c):检验统计量:不拒绝H0(P=0.013328>=0.01)没有证据表明“该杂志声称读者群中有80%为女性”的看法不正确

决策:结论:z02.58-2.580.005拒绝H0拒绝H00.005第八十六页,共九十八页,编辑于2023年,星期三

[例7-7]某企业的产品畅销国内市场。据以往调查,购买该产品的顾客有50%是30岁以上的男子。该企业负责人关心这个比例是否发生了变化,而无论是增加还是减少。于是,该企业委托了一家咨询机构进行调查,这家咨询机构从众多的购买者中随机抽选了400名进行调查,结果有210名为30岁以上的男子。该厂负责人希望在显著性水平0.05下检验“50%的顾客是30岁以上的男子”这个假设。

解:(1)建立假设

由题意可知,这是双侧检验,故建立假设H0:=50%.

H1:50%

第八十七页,共九十八页,编辑于2023年,星期三(2)计算统计量

由于样本容量=

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论