第6章假设检验_第1页
第6章假设检验_第2页
第6章假设检验_第3页
第6章假设检验_第4页
第6章假设检验_第5页
已阅读5页,还剩136页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第6章假设检验6.1假设检验的一般问题6.2单个总体的假设检验6.3两个总体的假设检验6.4假设检验的其他问题引例引例1:再谈女士品茶在实验中,那位女士被奉上一连串的已经调制好的茶,其中,有的是先加茶有的先加奶,各占一半情形一:如果只给那位女士一杯茶,那么即使她没有区分能力,她也有50%的机会猜对。如果给两杯茶,她仍可能猜对。事实上,如果她知道两杯茶分别以不同的方式调制,她可能一下子全部猜对(或全部猜错)情形二:这位女士能做出区分,她仍然有猜错的可能。或者是其中的一杯与奶没有充分地混合,或者是泡制时茶水不够热。即便这位女士能做出区分,也很有可能是奉上了10杯茶,她却只是猜对了其中的9杯

引例2:维生素真相2007年2月28日出版的国际权威医学杂志《美国医学会杂志》发表了一项由多国研究人员共同完成的研究。这项研究显示,服用维生素E死亡率增加4%,服用茁胡萝卜素死亡率增加7%,服用维生素A死亡率增加16%,没有证据表明维生素C能延年益寿引例3:大学生与农民工工资中国社科院发布《2009人口与劳动绿皮书》,称随着大学毕业生的增加和有经验的青年农民工的抢手,两者工资待遇有趋同的趋势,甚至刚出校门的毕业生工资不及同龄农民工国家统计局《2005年全国1%人口抽样调查的微观数据》显示,21岁和22岁的大学毕业生与同龄的青年农民工的工资分布进行对比,发现都是“千元档”,青年农民工的平均工资水平甚至略高于大学毕业生新闻报道模式一篇帖子《回家后,我无颜面对的事情:怎么大学生不如农民工呢》引发的……月薪2200—3000元,不管吃住、农民工掉头就走;月薪1200—1500元,大学生不求包吃住重庆许多知名企业已打出了月薪4000的诱人旗号招揽民工。而北京市人社局网站公布的2010年北京市应届毕业生的平均工资仅为1937元,首都的大学生身价尚不如重庆民工?6.1假设检验的一般问题假设检验的基本思想假设的陈述两类错误与显著性水平检验统计量与拒绝域检验中的P值假设检验的基本思想(续)什么是假设

(hypothesis)?对总体参数的具体数值所作的陈述总体参数包括总体均值、比率、方差等分析之前必须陈述我认为这种新药的疗效比原有的药物更有效!假设检验的基本思想(续)假设检验

(hypothesistesting)先给予总体未知参数一个假设值,再利用样本或实验结果来推断此假设的可信度。逻辑上采用反证法,依据统计上的小概率原理概率证伪假设检验的基本思想(续)小概率原理在一次试验中,一个几乎不可能发生称为小概率事件在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设小概率的大小一般由研究者事先确定假设检验的基本思想(续)IdentifythePopulationAssumethepopulation平均GPA(学分绩点)is3.5(

)REJECTTakeaSampleNullHypothesisNo,notlikely!假设检验的基本思想(续)=3.5不太可能得到这个样本均值......如果事实上,这正是总体的均值....因此我们拒绝原假设=3.5.μ

的抽样分布2.4如果H0为真假设的陈述原假设和备择假设原假设?(nullhypothesis)稻草人待检验的假设,又称“0假设”研究者想收集证据予以反对的假设总是有等号,或表示为H0

例如,

H0:

某特定值若为不等式(或)

也可写为=

H0:

3.5假设的陈述(续)备择假设(alternativehypothesis)与原假设对立的假设,也称“研究假设”这与原假设为互斥研究者想收集证据予以支持的假设。总是有不等号:

,

或表示为H1

例如,H1:<某特定值

如H1:<3.5

假设的陈述(续)零假设的提出所假设的总体参数值为研究者认为不对的总体参数值实质:科学研究中的保守主义比如:新的工艺或技术没有造成任何改变,新药没有任何疗效,变量间没有联系假设的陈述(续)例析消协接到很多消费者的投诉:超市中五磅的碎牛肉缺斤少两。消协检查时,原及备择假设为:市政府所用的红绿灯平均寿命为2000小时,一家制造商宣称他们新产品比原来的寿命要长,且价格相同。市政府想要测试新灯泡的寿命是否超过2000小时,原及备择假设为:假设的陈述(续)一家公司的产品市场占有率为30%,公司在某些区域测试新推出的广告,要检验广告是否会增加销售:汽车车门的油漆平均五年会开始脱落,某科学家宣称新的油漆寿命比较长,汽车公司想测试新油漆的寿命:假设的陈述(续)选择的结果

由于我们只有在证据很充分的情况下才能推翻原假设,因此原假设比备择假设占据更有利的地位,假设的写法对于结果有很大影响例:FoodandDrugAdministration(FDA)在核准新药上市中,面临以下两个可能的结果

新药对于大众有益

新药对于大众无益处两者都可以被选为nullhypothesis假设的陈述(续)若FDA选择以下的方式:

H0:新药对于大众没有益处不应该上市

H1:新药对于大众有益处此时药厂必须举证推翻H0,否则FDA不会核准新药上市由于这种假设方式,美国的新药上市过程十分冗长,但好处为有害药物要上市十分困难假设的陈述(续)若FDA选择以下的方式:

H0:新药对于大众有益处应该上市。

H1:新药对于大众没有益处不应该上市。此时除非有强而有力的证据显示药物无效或有害,否则暂且假定此药为有益处的。这种方式可以使新药快速上市,但风险也很高假设的陈述(续)评述实际上,假设检验中,我们计算的条件概率为:P(observeddata|theoryistrue)即在假设理论为真的前提下,观察到目前样本数据的概率为何?如果理论为真,则样本数据应比较有可能是…比较不可能是…若观察到与理论一致的样本(较有可能发生的样本),则暂且假定理论为真若观察到样本在理论为真的假设下不太可能发生,则推翻理论假设的陈述(续)对提出假设的建议原假设和备择假设是一个完备事件组,而且相互对立

在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立先确定备择假设,再确定原假设等号“=”总是放在原假设上,为什么?因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)检验的目的主要是收集证据拒绝原假设双侧检验和单侧检验(续)双侧检验备择假设没有特定的方向性,无论是大于还是小于某一假设值,都必需采取相应的行动措施例如,某种零件的尺寸,要求其平均长度为10cm,大于或小于10cm均属于不合格我们想要证明(检验)大于或小于这两种可能性中的任何一种是否成立建立的原假设与备择假设应为

H0:

=10H1:

10双侧检验和单侧检验(续)单侧检验备择假设具有特定的方向性,并含有符号“>”或“<”的假设检验,称为单侧检验或单尾检验(one-tailedtest)备择假设的方向为“<”,称为左侧检验备择假设的方向为“>”,称为右侧检验

双侧检验和单侧检验(续)例析:一项研究表明,采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上。检验这一结论是否成立研究者总是想证明自己的研究结论(寿命延长)是正确的备择假设的方向为“>”(寿命延长)建立的原假设与备择假设应为

H0:

1500H1:

1500双侧检验和单侧检验(续)一项研究表明,改进生产工艺后,会使产品的废品率降低到2%以下。检验这一结论是否成立研究者总是想证明自己的研究结论(废品率降低)是正确的备择假设的方向为“<”(废品率降低)建立的原假设与备择假设应为

H0:2%H1:

<2%双侧检验和单侧检验(续)某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上。如果你准备进一批货,怎样进行检验检验权在销售商一方作为销售商,你总是想收集证据证明生产商的说法(寿命在1000小时以上)是不正确的备择假设的方向为“<”(寿命不足1000小时)建立的原假设与备择假设应为

H0:

1000H1:

<1000双侧检验和单侧检验(续)假设研究的问题双侧检验左侧检验右侧检验H0m=m0m

m0m

m0H1m≠m0m<m0m>m0两类错误与显著性水平两类错误统计检验有点像法院审案,在样本数据(证据)还没有充分显示嫌疑人「有罪」之前,我们暂且假定原假设为:嫌疑人「无罪」。在法院的审判中有两种可能的错误:无罪的人被误判为有罪,有罪的人被无罪释放。两类错误与显著性水平(续)与法院审判类似,检验也有两种犯错的可能:nullhypothesis在正确的情况下被推翻(typeIerror错杀无辜)及nullhypothesis不正确但没有被拒绝(typeIIerror放纵坏人)重温“辛普森杀妻案”H0:无罪陪审团审判裁决实际情况无罪有罪无罪正确错误有罪错误正确H0检验决策实际情况H0为真H0为假未拒绝H0正确决策(1–a)第Ⅱ类错误(b)拒绝H0第Ⅰ类错误(a)正确决策(1-b)假设检验就好像一场审判过程假设检验过程两类错误与显著性水平(续)第一类错误和第二类错误第一类错误(弃真错误)原假设为真时拒绝原假设第一类错误的概率为,即显著性水平(1-

)则置信水平两类错误与显著性水平(续)第二类错误(取伪错误)原假设为假时没有拒绝原假设第二类错误的概率为(Beta)Thepowerofthetestis(1-)两类错误与显著性水平(续)例析USAToday报导在美国非法赌博的金额至少平均每人每年$200,你觉得这个数字太过于夸张,因此找了n个人的样本来估计每年非法赌博的平均金额。你想要检验的假设为:

H0:μ≧$200

H1:μ<$200两类错误与显著性水平(续)假设真正的总体均值为$200,如果你估计的样本平均远低于$200,则你会推翻正确的假设,从而而犯下型I错误如果实际非法赌博的金额远低于$200,即H0并不正确,但你运气欠佳,得到的样本估计的均值十分接近200,则你应该推翻H0。但样本数据却不足以推翻错误的假设,此时你犯了型II的错误两类错误与显著性水平(续)切记当检验统计量落在拒绝域(rejectionregion)内,不代表我们证明(prove)原假设为错误的。只能说我们对于原假设所陈述的内容真实性有很大的怀疑—原假设不是不正确,就是极不可能发生同理,当检验统计量落在无法拒绝域中,并不是证明(prove)零假设为真,仅是表示证据不足以推翻零假设两类错误与显著性水平(续)例析饮料的例子拒绝域无法拒绝域=0=.05两类错误与显著性水平(续)=.05拒绝Ho无法拒绝

HoHoisTrueHoisFalse95%=.8023正确决策第I类错误第II类错误正确决策19.77%Z0Z1如果μ=11.99两类错误与显著性水平(续)=.05HoisTrueHoisFalse95%拒绝Ho无法拒绝

Ho=.0708正确决策第I类错误第II类错误正确决策92.92%Z0Z1如果μ=11.96两类错误与显著性水平(续)0111.9511.9611.9711.9811.9912Probability(1-b)概率的变化/~sundar/java/applets/HypoTest1Applet.html两类错误与显著性水平(续)和的关系就像翘翘板,小就大,大就小Reduceprobabilityofoneerrorandtheotheronegoesupholdingeverythingelseunchanged.两类错误与显著性水平(续)影响

错误的因素总体参数的真值随着假设的总体参数与真实参数值差异的减小而增大显著性水平

当减少时增大n两类错误与显著性水平(续)显著性水平(significantlevel)显著性水平是一个概率值P(零假设不被接受|零假设为真)原假设为真时,拒绝原假设的概率抽样分布的拒绝域的面积表示为(alpha)常用的值有0.01,0.05,0.10由研究者事先确定两类错误与显著性水平(续)如何选择考虑犯错误的代价:地震?ChooseSmallerTypeIErrorWhentheCostofRejectingtheMaintainedHypothesisisHighLevelAcriminaltrial:convictinganinnocentperson挑战者号失事与检验功效两类错误与显著性水平(续)原假设在检验前被视为是正确的,除非有充分的证据,不然我们不轻易推翻原假设。通常我们选择极小的显著水平如.01或.05来确保我们不会推翻一个正确的原假设http://www.ds.unifi.it/VL/VL_EN/applets/MeanTestExperiment.html/~sundar/java/applets/两类错误与显著性水平(续)检验统计量与拒绝域检验统计量根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量对样本估计量的标准化结果假设H0为真点估计量的抽样分布

标准化的检验统计量检验统计量与拒绝域(续)拒绝域根据显著性水平,我们可以将检验统计量分成穷尽及互斥的两组数值区域:Therejectionregion

(拒绝域)Thenonrejectionregion

(无法拒绝域)临界值是区分拒绝域及无法拒绝域的界线。检验统计量与拒绝域(续)000aaa/2

临界值拒绝域检验统计量与拒绝域(续)抽样分布H0值临界值临界值a/2a/2样本统计量拒绝域拒绝域1-置信水平检验统计量与拒绝域(续)抽样分布H0值临界值临界值a/2a/2样本统计量拒绝域拒绝域1-置信水平检验统计量与拒绝域(续)抽样分布H0值临界值临界值a/2a/2样本统计量拒绝域拒绝域1-置信水平检验统计量与拒绝域(续)抽样分布H0值临界值临界值a/2a/2样本统计量拒绝域拒绝域1-置信水平检验统计量与拒绝域(续)抽样分布H0值临界值a样本统计量拒绝域1-置信水平检验统计量与拒绝域(续)H0值临界值a样本统计量拒绝域1-置信水平观察到的样本统计量左侧检验检验统计量与拒绝域(续)H0值临界值a样本统计量拒绝域1-置信水平观察到的样本统计量检验统计量与拒绝域(续)H0值临界值a样本统计量拒绝域1-置信水平观察到的样本统计量右侧检验检验统计量与拒绝域(续)H0值临界值a样本统计量拒绝域1-置信水平观察到的样本统计量检验统计量与拒绝域(续)统计决策将检验统计量的值与水平的临界值进行比较,给定显著性水平,查表得出相应的临界值z或z/2,t或t/2作出决策双侧检验:I统计量I>临界值,拒绝H0左侧检验:统计量<-临界值,拒绝H0右侧检验:统计量>临界值,拒绝H0检验统计量与拒绝域(续)注意根据样本所提供的信息,我们面临两种可能的决定:

拒绝nullhypothesis(rejectingH0)

无法拒绝nullhypothesis(notrejectingH0)有人会说接受acceptednullhypothesis,不过较为正确的说法应该是无法拒绝或无法推翻H0假设检验中的P值P值(P-value)的缘起在假设检定中,我们通常会事先决定显著水平α,然后根据决定之后的α值找出拒绝域及接受域但在很多的情况下,我们无法预估typeI错误及typeII错误的成本,因此无法确定合意的α值。所以有时候我们直接指出得到观察统计量的概率假设检验中的P值(续)P值如果原假设为真,P-值是抽样分布中大于或小于样本统计量的概率左侧检验时,P-值为曲线上方小于等于检验统计量部分的面积右侧检验时,P-值为曲线上方大于等于检验统计量部分的面积被称为观察到(theobservedsignificantlevel)的显著性水平假设检验中的P值(续)P-value告诉我们:「如果零假设为真,我们观察到目前数据显示的检验统计量的概率有多高?」如果这个概率很小,则我们可以拒绝零假设,因为如果假设为真,则仅有很小的概率抽取任意的随机样本会得到目前的观察值P-value是不仅止于告诉我们在某一显著水平下是否拒绝H0,如果我们知道P-value=.002则我们知道H0不但在.05的显著水平下会被拒绝,在.005的水平下也会被拒绝假设检验中的P值(续)如果仅知道P-value=.04,则是否拒绝H0可以由读者来决定,如果某一研究人员决得.01才算显著,则H0不会被拒绝,如果将显著水平置于.05,则拒绝一般在研究报告中,研究者经常直接写出p-value而让读者自己去决定是否要拒绝H0一些证据:P〈.010适度证据:P〈.005很强证据:P〈.001假设检验中的P值(续)/2/2Z拒绝拒绝H0值临界值计算出的样本统计量计算出的样本统计量临界值1/2P值1/2P值双侧检验假设检验中的P值(续)H0值临界值a样本统计量拒绝域抽样分布1-置信水平计算出的样本统计量P值左侧检验假设检验中的P值(续)H0值临界值a拒绝域抽样分布1-置信水平计算出的样本统计量P值右侧检验小结:假设检验的步骤临界值方法P值方法第1步确定零假设和备择假设第1步确定零假设和备择假设第2步抽取随机样本第2步抽取随机样本第3步确定适当检验统计量并用样本数据计算其具体值第3步确定检验统计量的值第4步确定显著性水平,计算临界值及拒绝域第4步计算P值第5步比较检验统计量的值与临界值,决定拒绝还是无法拒绝原假设第5步比较P值和α,如果小于α则拒绝原假设,否则无法拒绝第6步给出假设检验的结论第6步给出假设检验的结论6.2单个总体的假设检验Z检验(单尾和双尾)

t检验(单尾和双尾)Z检验(单尾和双尾)

2检验(单尾和双尾)均值单个总体比例方差单个总体均值检验总体是否已知?用样本标准差S代替

t检验小样本容量n否是z检验

z检验大单个总体均值检验(续)总体均值的检验(2

已知,或2未知但大样本)假定条件总体服从正态分布若不服从正态分布,可用正态分布来近似(n30)使用Z-统计量2

已知:2

未知:单个总体均值检验(续)例解(2

已知)

Doesanaverageboxofcerealcontain368gramsofcereal?Arandomsampleof25boxesshowed=372.5.Thecompanyhasspecifieds

tobe15gramsandthedistributiontobenormal.Testatthea=0.05level.

368gm.H0:m=368H1:m¹368单个总体均值检验(续)Z01.96.025Reject-1.96.0251.50372.5Reject单个总体均值检验(续)a

=0.05n=25临界值:±1.96检验统计量:决策:结论:DoNotRejectata=.05.Z01.96.025Reject-1.96.025H0:m=368H1:m¹3681.50InsufficientEvidencethatTrueMeanisNot368.单个总体均值检验(续)P值解法(p-Value=0.1336)³(a=0.05)

DoNotReject.01.50ZRejecta

=0.051.96p-Value=2x0.0668TestStatistic1.50isintheDoNotRejectRegionReject单个总体均值检验(续)例解(2未知但大样本)某电子元件批量生产的质量标准为平均使用寿命1200小时。某厂宣称他们采用一种新工艺生产的元件质量大大超过规定标准。为了进行验证,随机抽取了100件作为样本,测得平均使用寿命1245小时,标准差300小时。能否说该厂生产的电子元件质量显著地高于规定标准?(=0.05)单个总体均值检验(续)H0:1200H1:>1200=0.05n=100临界值(s):检验统计量:在

=0.05的水平上不能拒绝H0不能认为该厂生产的元件寿命显著地高于1200小时决策:结论:Z0拒绝域0.051.645单个总体均值检验(续)总体均值的检验(2未知小样本)假定条件总体为正态分布2未知,且小样本使用t

统计量单个总体均值检验(续)例解某汽车制造商宣称该公司一款低价车肇事平均修车费低于等于$200。消费者基金会认为修车费高于此数值,欲检证下列假设:

H0:uu0

H1:u>u0消费者基金会不愿在证据不充分的条件下,随意驳斥制造商的宣称,因此将假设检定的显著水平严格地定在1%。因为检证肇事修车的成本甚高,因此消基会仅找了9个样本,发现:245,305,175,250,280,160,250,195,210单个总体均值检验(续)H0:

200H1:>

200=0.01n=100临界值(s):t.01,8=2.896检验统计量:在

=0.01的水平上不能拒绝H0不能认为收费较高决策:结论:Z0拒绝域0.012.896单个总体均值检验(续)例解一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里,对一个由20个轮胎组成的随机样本作了试验,测得平均值为41000公里,标准差为5000公里。已知轮胎寿命的公里数服从正态分布,我们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符?(=0.05)单个总体均值检验(续)H0:

40000H1:<40000=0.05df=20-1=19临界值(s):检验统计量:

=0.05的水平上不能拒绝H0有证据表明轮胎使用寿命显著地大于40000公里决策:

结论:

-1.7291t0拒绝域.05?单总体比率检验单总体比率检验假定条件有两类结果总体服从二项分布可用正态分布来近似比例检验的Z统计量单总体比率检验(续)例析Amarketingcompanyclaimsthatasurveywillhavea4%responserate.Totestthisclaim,arandomsampleof500weresurveyedwith25responses.Testatthea=.05significancelevel.单总体比率检验(续)0.05临界值:

±1.961.1411a=.05n=500Donotrejectata=.05.H0:p

=.04H1:p

¹.04检验统计量:决策:结论:Z0RejectReject.025.0251.96-1.96Wedonothavesufficientevidencetorejectthecompany’sclaimof4%responserate.0.04单总体比率检验(续)(p-Value=0.2538)³(a=0.05)

DoNotReject.01.1411ZRejecta

=0.051.96p-Value=2x.1269TestStatistic1.1411isintheDoNotRejectRegionRejectP值解法单总体方差检验单总体方差的检验(2检验)检验单个总体的方差或标准差假设总体近似服从正态分布检验统计量样本方差假设的总体方差)1(~)1(22022--=nSncsc单总体方差检验(续)例解某厂商生产出一种新型的饮料装瓶机器,按设计要求,该机器装一瓶一升(1000cm3)的饮料误差上下不超过1cm3。如果达到设计要求,表明机器的稳定性非常好。现从该机器装完的产品中随机抽取25瓶,分别进行测定(用样本减1000cm3),得到如下结果。检验该机器的性能是否达到设计要求

(=0.05)0.3-0.4-0.71.4-0.6-0.3-1.50.6-0.91.3-1.30.71-0.50-0.60.7-1.5-0.2-1.9-0.51-0.2-0.61.1单总体方差检验(续)H0:2=1H1:2

1=0.05df=25-1=24临界值(s):统计量:在

=0.05的水平上不能拒绝H0不能认为该机器的性能没有达到设计要求

2039.3612.40

/2=.05决策:结论:6.3两个总体的假设检验两个总体的检验Z

检验(大样本)t

检验(小样本)t

检验(小样本)Z检验F

检验独立样本配对样本均值比率方差两总体均值的检验假设研究的问题没有差异有差异均值1均值2均值1<均值2均值1均值2均值1>均值2H0

1–2=0

1–20

1–20H1

1–20

1–2<0

1–2>0两总体均值的检验(续)独立样本(12、22

已知)假定条件两个样本是独立的随机样本两个总体都是正态分布若不是正态分布,可以用正态分布来近似(n130和n230)检验统计量为两总体均值的检验(续)

当样本n>30时,两样本均值的抽样分布为近似正态分布121/n1222/n21-2两总体均值的检验(续)独立样大样本

(12、22

未知,)如果是大样本(n>30),则我们可以用样本方差s2來取代未知的总体方差2。两总体均值的检验(续)例解(P&G)公司宣布含氟牙膏Crest可以防止蛀牙,为了检证此一假设,我们找了一群牙齿健康状况相同的十岁小朋友,将之分成用「含氟」及用普通牙膏两组,观察一年后纪录其蛀牙状况假设从用普通牙膏的小朋友中取100个随机样本,其蛀牙平均值为4.8颗,方差为s12=1.1颗。在从用含氟牙膏的小朋友中取120独立样本,计算其平均蛀牙数为3.6颗,方差为s22=0.9颗,在显著水平5%下检定上述的假说两总体均值的检验(续)RejectH0两总体均值的检验(续)例解IsthereevidencetoconcludethattheaveragemonthlychargeintheentirepopulationofAmericanExpressGoldCardmembersisdifferentfromtheaveragemonthlychargeintheentirepopulationofPreferredVisacardholders?两总体均值的检验(续)两总体均值的检验(续)独立小样本(12=22

)检验具有等方差的两个总体的均值假定条件两个样本是独立的随机样本两个总体都是正态分布两个总体方差未知但相等12=22检验统计量其中:两总体均值的检验(续)

NYSE

NASDAQ

Number 21 25

SampleMean

3.272.53SampleStdDev 1.301.16Assumingequalvariances,is

thereadifferenceinaverage

yield(a

=0.05)?©1984-1994T/MakerCo.例解You’reafinancialanalystforCharlesSchwab.IsthereadifferenceinaveragedividendyieldbetweenstockslistedontheNYSE&NASDAQ?Youcollectthefollowingdata:两总体均值的检验(续)p-Value2(p-Valueisbetween.02and.05)<(a=0.05)Reject.02.03ZRejecta

22.0154isbetween.01and.025TestStatistic2.03isintheRejectRegionReject-2.0154=.025P值解法两总体均值的检验(续)H0:m1-m2=0i.e.(m1=m2)H1:m1-m2¹0i.e.(m1

¹m2)a

=0.05df=21+25-2=44临界值(s):检验统计量:

决策结论Rejectata=0.05.Thereisevidenceofadifferenceinmeans.t02.0154-2.0154.025RejectH0RejectH0.0252.03两总体均值的检验(续)独立小样本(1222

)检验具有等方差的两个总体的均值假定条件两个样本是独立的随机样本两个总体都是正态分布两个总体方差未知但相等1222

检验统计量两总体均值的检验(续)匹配样本检验两个总体的均值配对或匹配各种前测、后测的比较如广告前后的销售额、接受训练前后的成绩差异…等由于两组数据不是独立随机样本,我们将两两的差异当成一个随机样本来处理假定条件两个总体都服从正态分布如果不服从正态分布,可用正态分布来近似两总体均值的检验(续)观察序号样本1样本2差值1x11x21d1=x11-x212x12x22d2=x12-x22MMMMix1ix2idi

=x1i-x2iMMMMnx1nx2ndn

=x1n-x2n两总体均值的检验(续)样本差值均值样本差值标准差自由度df

=n

-1统计量μd:假设的差值两总体均值的检验(续)例解Assumeyouworkinthefinancedepartment.Isthenewfinancialpackagefaster(a=0.05level)?Youcollectthefollowingprocessingtimes:User

ExistingSystem(1)

NewSoftware(2)

Difference

DiC.B. 9.98Seconds 9.88Seconds .10T.F. 9.88 9.86 .02M.H. 9.84 9.75 .09 R.K. 9.99 9.80 .19M.O. 9.94 9.87 .07D.S. 9.84 9.84 .00S.S. 9.86 9.87 -.01C.T. 10.12 9.98 .14K.T. 9.90 9.83 .07S.Z. 9.91 9.86 .05两总体均值的检验(续)Isthenewfinancialpackagefaster(0.05level)?H0:md

£

0

H1:

md

>

0

a=.05检验统计量临界值=1.8331df=n-1=9Reject

a=.051.8331决策:RejectH0tSherejectionzone.结论:Thenewsoftwarepackageisfaster.3.66两总体比率之差检验比率之差检验假定条件两个总体是独立的两个总体都服从二项分布n1p1≥5,n1q1≥5,n2p2≥5,n2q2≥5可以用正态分布来近似检验统计量两总体比率之差检验(续)例解在高校学生的一个随机样本中,36名男生中有16人说他们购买食品时看生产日期,而36名女生中则有28人说说好们购买食品时看生产日期,判断在这一点上,女生是否比男生更细心?(α=0.05)两总体比率之差检验(续)H0:1-

2

0H1:1-

2<0=0.05n1=36,n2=36临界值(s):检验统计量:决策:结论:

=0.05的水平拒绝H0女生显著高-1.645Z0拒绝域两总体方差比检验两个总体方差比的检验假定条件两个总体都服从正态分布,且方差相等两个独立的随机样本

假定形式H0:s12=s22

或H0:s12

s22(或

)H1:s12

s22H1:s12

<s22(或>)检验统计量F=s12/s22~F(n1–1,n2–1)两总体方差比检验(续)FF1-F无法拒绝域两总体方差比检验(续)

NYSE

NASDAQ

Number 2125

SampleMean

3.272.53SampleStdDev 1.301.16IsthereadifferenceinthevariancesbetweentheNYSE&NASDAQatthe

a=0.05level?©1984-1994T/MakerCo.例解You’reafinancialanalystforCharlesSchwab.IsthereadifferenceinaveragedividendyieldbetweenstockslistedontheNYSE&NASDAQ?Youcollectthefollowingdata:两总体方差比检验(续)

H0:

s12=s22

H1:s12

¹

s22

a

=

.05df1

=

20df2

=

24

临界值:检验统计量:决策:结论:Donotrejectata=0.05.0F2.330.415.025RejectReject.0251.25Thereisinsufficientevidencetoproveadifferenceinvariances.6.4假设检验的其他问题区间估计与假设检验比较根据置信区间检验求出双侧检验均值的置信区间若总体的假设值0在置信区间外,拒绝H0

2已知时:2未知时:区间估计与假设检验比较(续)抽样分布H0值上限下限a/2a/2样本统计量1-置信水平H0值区间估计与假设检验比较(续)左侧检验:求出单边置信下限若总体的假设值0小于单边置信下限,拒绝H0区间估计与假设检验比较(续)右侧检验:求出单边置信上限若总体的假设值0大于单边置信下限,拒绝H0区间估计与假设检验比较(续)假设检验的局限小心诠释统计显著性样本很大时,即使效应(effect)差异不大也会产生统计显著性;但可能因为效应差异不大而没有实际的效用数据上呈现的统计显著性应配合资料形态来诠释离群值的检查等配合估计区间来诠释置信区间也估计效应的大小区间估计与假设检验比较(续)例析1000组配对样本的相关系数为0.08,在1%的显著性水平下具有显著性,仅表示有足够的证据认为总体相关系数不是零且应为正在实用上,0.08的相关性常可忽略而不会影响后续分析以散布图检查资料的相关性检查数据间是否具有函数关系,或是离群值影响相关性的强度等以相关系数的置信区间来了解相关性的强度区间估计与假设检验比较(续)置信区间只能在预先规定的概率α前提下进行计算,而假设检验能够根据样本数据获得的统计量(Z,t)及样本的其他信息(如自由度n)获得确切的概率P值假设检验的几点补充说明再谈统计显著性统计显著性的价值在于,指出“效应(effect)的发生并非偶然”的证据。可应用于:新药产品的有效性与安全性需显著性证据法庭在审理差别待遇的诉讼需要统计显著性营销者需要知道新的广告策略是否显著地优于旧的策略医学研究者要了解新的疗法是否显著得好……假设检验的几点补充说明(续)检验的原理是“小概率事件在一次试验中不发生”,以此作为推断的依据,决定是无法拒绝或拒绝。但是这一原理只是在概率意义下成立,并不是严格成立的,即不能说小概率事件在一次试验中绝对不可能发生假设检验的几点补充说明(续)在假设检验中,原假设与备选假设的地位是不对等的。一般来说是较小的,因而检验推断是“偏向”原假设,而“歧视”备选假设的。因为,通常若要否定原假设,需要有显著性的事实,即小概率事件发生,否则就认为原假设成立。因此在检验中无法拒绝,并不等于从逻辑上证明了的成立,只是找不到不成立的有力证据。在应用中,对同一问题若提出不同的原假设,甚至可以有完全不同的结论假设检验的几点补充说明(续)从另一个角度看,既然是受保护的,则对于的肯定相对来说是较缺乏说服力的,充其量不过是原假设与试验

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论