第四假设检验演示文稿_第1页
第四假设检验演示文稿_第2页
第四假设检验演示文稿_第3页
第四假设检验演示文稿_第4页
第四假设检验演示文稿_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四假设检验演示文稿1当前第1页\共有47页\编于星期三\11点2(优选)第四假设检验当前第2页\共有47页\编于星期三\11点在抛弃原假设后可供选择的命题称为备择假设(alternativehypothesis),记为H1。选择哪一个备择假设要视问题而定。在本例中,餐厅经理是想知道当前平均营业额的增加是否是由于新菜单而引起的,因而将命题1作为备择假设。上面所确定的假设可以分别表示:

H0:μ=8000H1:μ>8000

(2)寻找检验统计量当前第3页\共有47页\编于星期三\11点假设的任务是要确认原假设H0是否为真。我们的做法是:先假定H0成立,然后用样本去判断其真伪。由于样本信息较为分散,因此需要构造一个统计量来做判断,此统计量称为检验统计量。本例可用样本均值作为检验统计量。在H0为真时,的观察值应接近8000,如果远离8000,那就有理由怀疑H0不真。如今8300与8000算近还是算远?或说要多大才拒绝H0?这就需要定一个界限c,即当≥c时,拒绝H0;当<c时,接受H0;

这是我们检验法则的初型,这里的c称为检验临界值。

当前第4页\共有47页\编于星期三\11点使原假设H0被拒绝的样本观察值所组成的区域称为检验拒绝域,用W表示;而接受原假设H0的样本观察值所组成的区域称为检验的接受域,用A表示。本例中,W与A分别为:

(3)显著性水平与临界值。

当我们对原假设H0是否为真作出判断时有可能会犯错误,这就是要冒风险,为了控制这一风险,首先需要用一个概率去表示这一风险,这个概率便是“H0为真但被拒绝”的概率,这个概率又称为显著性水平,记为α。即

当前第5页\共有47页\编于星期三\11点取α=0.05,则可算出c=8350.9,这一临界值唯一决定了拒绝域W。

二、假设通常我们把关于总体分布的某个命题作为假设。在对总体分布的参数作假设检验时,原假设和备择假设都可看作参数空间Θ的某个真子集Θ0与Θ1,且这两个子集不能相交,其并可以是参数空间Θ也可以是Θ的一个子集。两个假设可分别记为:

H0

:θ∈Θ0,H1:θ∈Θ1当前第6页\共有47页\编于星期三\11点原假设与备择假设的建立主要根据具体问题来决定的。常把没有把握不能轻易肯定的命题作为备择假设,而把没有充分理由不能轻易否定的命题作为原假设,只有理由充分时才拒绝它,否则应予接受。譬如在例1中,我们不敢肯定新菜单有用,因而把μ>8000作为备择假设,而把μ=8000作为原假设。又譬如某人有一颗重23.1克的钻石想拍卖,拍卖行的职工需要将钻石反复秤重来作判断,由于这时不能轻易否定钻石重量,故可建立假设

H0

:μ=23.1,H1:μ≠23.1.如果Θ0(或Θ1)中只含有一个元素,则称该假设为简单假设,否则称为复杂假设。当前第7页\共有47页\编于星期三\11点三、两类错误

第一类错误:原假设H0为真,但由于样本的随机性,使样本观察值落入拒绝域W,这时所下的判断便是拒绝H0,这类错误称为第一类错误,其发生的概率称为犯第一类错误的概率,也称为拒真概率,它便是显著性水平α。第二类错误:原假设H0为假,但由于样本的随机性,使样本观察值落入接受域A,这时所下的判断便是接受H0,这类错误称为第二类错误,其发生的概率称为犯第二类错误的概率,也称为取伪概率,记为β。好的检验法则总希望犯两类错误的概率α与β都很小,但这在一般场合下很难实现。当前第8页\共有47页\编于星期三\11点四、假设检验问题的类型1.总体分布是已知的还是未知的。若总体分布是已知,只对其参数作假设检验,这种检验被称为参数检验,若总体分布未知,这时涉及的检验称为非参数检验。2.总体分布是正态还是非正态。若总体分布是正态,其参数的假设检验问题已有较为成熟的检验法则,若总体分布是非正态的,那就需要一个一个地讨论与解决,没有一般方法而言。3.备择假设的选取涉及拒绝域的形式是单边还是双边的。如果拒绝域的形式为W={T(x)>c},这种检验称为单边检验。如果拒绝域形式为W={T(x)≤c,或T(x)≥d},这种检验称为双边检验,这里T(x)是检验统计量。当前第9页\共有47页\编于星期三\11点显著性检验的思想和步骤(1)根据实际问题作出假设H0与H1;(2)构造统计量,在H0真时其分布已知;(3)给定显著性水平的值,参考H1,令

P{拒绝H0|H0真}=,求出拒绝域W;(4)计算统计量的值,若统计量W,则拒绝

H0,否则接受H0当前第10页\共有47页\编于星期三\11点4.2单个正态总体的假设检验一、单个正态总体均值的假设检验1、2已知的情形---U检验

对于假设H0:=0;H1:0,构造查表,计算,比较大小,得出结论当前第11页\共有47页\编于星期三\11点说明:(1)H0:=0;H1:m0称为双边HT问题;而H0:=0;H1:>0(或<0),则称为单边问题;

(2)

H0:0;H1:>0

或H0:0;H1:u<u0

也称为单边HT问题,不过这是一个完备的HT问题。

(3)可证:完备的HT问题与不完备的HT问题有相同的拒绝域,从而检验法一致。·先考虑不完备的右边HT问题的解H0:=0;H1:>0,当前第12页\共有47页\编于星期三\11点现考虑完备的右边HT问题H0:0;H1:>0,若取拒绝域为则犯第一类错误的概率为当前第13页\共有47页\编于星期三\11点于是故是H0:0;H1:>0,的水平为的拒绝域当前第14页\共有47页\编于星期三\11点

例1:设某厂生产一种灯管,其寿命X~N(,2002),由以往经验知平均寿命=1500小时,现采用新工艺后,在所生产的灯管中抽取25只,测得平均寿命1675小时,问采用新工艺后,灯管寿命是否有显著提高。(=0.05)解:检验统计量为的拒绝域为

对于=0.05因为拒绝H0,即灯管寿命有显著提高当前第15页\共有47页\编于星期三\11点·左边HT问题H0:=0;H1:<0,或H0:0;H1:<0,可得显著性水平为的拒绝域为当前第16页\共有47页\编于星期三\11点例2已知某炼铁厂的铁水含碳量在正常情况下服从正态分布N(4.55,0.112).某日测得5炉铁水含碳量如下:4.28,4.40,4.42,4.35,4.37.如果标准差不变,该日铁水的平均含碳量是否显著偏低?(取=0.05)解:检验统计量为的拒绝域为

计算得对于=0.05因为拒绝H0,即该日铁水的平均含碳量显著偏低当前第17页\共有47页\编于星期三\11点注:上题中,用双边检验或右边检验都是错误的.若用双边检验,H0:=4.55;H1:4.55,则拒绝域为由|U|=3.78>1.96,故拒绝H0,说明可以认为该日铁水的平均含碳量显著异于4.55.但无法说明是显著高于还是低于4.55.不合题意若用右边检验,H0:4.55;H1:>4.55,则拒绝域为由U=-3.78<-1.96,故接受H0,说明不能认为该日铁水的平均含碳量显著高于4.55.但无法区分是等于还是低于4.55.不合题意.当前第18页\共有47页\编于星期三\11点2、2未知的情形·双边检验:对于假设H0:=0;H1:0由P{|T|t/2(n1)}=,得水平为的拒绝域为|T|t/2(n1),当前第19页\共有47页\编于星期三\11点解:检验统计量为的拒绝域为

计算得对于=0.05,n=7因为接受H0,热敏电阻测温仪间接测温无系统偏差例3用热敏电阻测温仪间接温量地热勘探井底温度,重复测量7次,测得温度(℃):112.0113.4111.2112.0114.5112.9113.6而用某种精确办法测得温度为112.6(可看作真值),试问用热敏电阻测温仪间接测温有无系统偏差(设温度测量值X服从正态分布,取=0.05)?当前第20页\共有47页\编于星期三\11点·右边HT问题H0:=0

;H1:>0,或H0:0

;H1:>0,由P{Tt(n1)}=,得水平为的拒绝域为Tt(n1),当前第21页\共有47页\编于星期三\11点解:检验统计量为的拒绝域为

计算得对于=0.05,n=10因为接受H0,新生产不比过去生产的抗拉强度要高例4

某厂生产镍合金线,其抗拉强度的均值为10620(kg/mm2)今改进工艺后生产一批镍合金线,抽取10根,测得抗拉强度(kg/mm2)为:10512,10623,10668,10554,10776,10707,10557,10581,10666,10670.认为抗拉强度服从正态分布,取=0.05,问新生产的镍合金线的抗拉强度是否比过去生产的合金线抗拉强度要高?当前第22页\共有47页\编于星期三\11点·左边HT问题H0:=0

;H1:<0,或H0:0

;H1:<0,由P{T-t(n1)}=,得水平为的拒绝域为T-t(n1)当前第23页\共有47页\编于星期三\11点解:检验统计量为的拒绝域为

计算得对于=0.1,n=10因为接受H0,新生产不低于过去生产的抗拉强度EX设正品镍合金线的抗拉强度服从均值不低于10620(kg/mm2)的正态分布,今从某厂生产的镍合金线中抽取10根,测得平均抗拉强度10600(kg/mm2),样本标准差为80.,问该厂的镍合金线的抗拉强度是否不合格?(=0.1)

当前第24页\共有47页\编于星期三\11点二、单个正态总体方差的假设检验假定未知,双边检验:对于假设当前第25页\共有47页\编于星期三\11点得水平为的拒绝域为当前第26页\共有47页\编于星期三\11点解:检验统计量为的拒绝域为

计算得对于=0.05,n=10因为接受H0,认为整批保险丝的熔化时间的方差小于等于80例5电工器材厂生产一批保险丝,取10根测得其熔化时间(min)为42,65,75,78,59,57,68,54,55,71.问是否可以认为整批保险丝的熔化时间的方差小于等于80?(=0.05,熔化时间为正态变量.)当前第27页\共有47页\编于星期三\11点设保险丝的融化时间服从正态分布,取9根测得其熔化时间(min)的样本均值为62,标准差为10.(1)是否可以认为整批保险丝的熔化时间服从N(60,92)?(=0.05)(2)是否可以认为整批保险丝的熔化时间的方差显著大于70?(=0.05)EX答:(1)|t|=0.6<2.306,接受60;2.18<X2=9.877<17.535,接受10(2)X2=11.42<15.507,认为方差不显著大于70当前第28页\共有47页\编于星期三\11点4.3双正态总体均值差与方差比的假设检验一、均值差的假设检验当前第29页\共有47页\编于星期三\11点而对应的单边问题拒绝域为拒绝域为当前第30页\共有47页\编于星期三\11点例6.比较甲,乙两种安眠药的疗效。将20名患者分成两组,每组10人.其中10人服用甲药后延长睡眠的时数分别为1.9,0.8,1.1,0.1,-0.1,4.4,5.5,1.6,4.6,3.4;另10人服用乙药后延长睡眠的时数分别为0.7,-1.6,-0.2,-1.2,-0.1,3.4,3.7,0.8,0.0,2.0.若服用两种安眠药后增加的睡眠时数服从方差相同的正态分布.试问两种安眠药的疗效有无显著性差异?(=0.10)解:检验统计量为拒绝域为当前第31页\共有47页\编于星期三\11点这里:对于=0.10,因为拒绝H0,认为两种安眠药的疗效有显著性差异当前第32页\共有47页\编于星期三\11点上题中,试检验是否甲安眠药比乙安眠药疗效显著?EX1这里:t=1.86>1.3304,故拒绝H0,认为甲安眠药比乙安眠药疗效显著EX2上题中,试检验是否乙安眠药比甲安眠药疗效显著?当前第33页\共有47页\编于星期三\11点二、方差比的假设检验

两样本独立,给定检验水平,由观测值假定1,2未知当前第34页\共有47页\编于星期三\11点由p{FF1/2(n11,n21)或FF/2(n11,n21)}=F1/2F/2得拒绝域FF1/2(n11,n21)或FF/2(n11,n21)当前第35页\共有47页\编于星期三\11点而对应的单边问题拒绝域为FF(n11,n21)FF1(n11,n21)拒绝域为当前第36页\共有47页\编于星期三\11点例7.有甲乙两种机床,加工同样产品,从这两台机床加工的产品中随机地抽取若干产品,测得产品直径为(单位:mm):甲:20.5,19.8,19.7,20.4,20.1,20.9,19.6,19.9.乙:19.7,20.8,20.5,19.8,19.4,20.6,19.2.

假定甲,乙两台机床的产品直径都服从正态分布,试比较甲,乙两台机床加工的精度有无显著差异?(=0.05)解:0.1957<F<5.7,接受H0,甲,乙两台机床加工的精度无显著差异检验统计量为拒绝域为:{FF1/2(n11,n21)或FF/2(n11,21)}计算得:F10.025(7,6)=1/5.12=0.1953FF0.025(7,6)=5.7当前第37页\共有47页\编于星期三\11点§4.4检验的p值一个假设检验问题的结论是很简单的,但在给定的显著性水平下,不是拒绝原假设H0就是接受原假设H0。然而有可能发生如下情况:在显著性水平α=0.05下拒绝原假设H0,可在显著性水平α=0.01下接受原假设H0。因为降低显著性水平会导致拒绝域缩小,这样原来落在α=0.05的拒绝域中的检验统计量的观察值就有可能落在α=0.01的接受域中,也就是说选取不同的α会得出不同的结论。

当前第38页\共有47页\编于星期三\11点例1一支香烟中的尼古丁含量X服从正态分布N(μ,1),合格标准规定μ不能超过1.5mg.为对一批香烟的尼古丁含量是否合格作判断,可建立如下假设:

H0:μ≤1.5,

H1:μ>1.5这是在方差已知情况下对正态分布的均值作单边检验,所用的检验统计量为拒绝域是

当前第39页\共有47页\编于星期三\11点

表1上例中不同α的拒绝域与结论

显著性水平α

拒绝域

U=2.1时的结论0.05

{u≥1.645}

拒绝H0

0.025

{u≥1.96}

拒绝H0

0.01

{u≥2.33}

接受H0

0.005

{u≥2.58}接受H0从上表可看出,当α相对大一些时,U的临界值就小

当前第40页\共有47页\编于星期三\11点从而2.1超过了临界值,故应拒绝H0;而当α减小时,临界值便会增大,2.1就可能不会超过临界值,这时便接受H0.用时检验统计量U的分布可求得在一般场合,p值的定义是:在现代计算机的软件中都会在一个假设检验问题中给出相应的p值,那么对任意指定的显著性水平,我们便可以根据p值来下结论.定义4.3.1在一个假设检验问题中,拒绝假设H0的最小显著性水平称为p值.当前第41页\共有47页\编于星期三\11点回到上例中,如果指定显著性水平为,则拒绝域为,由样本求得如果,则,从而u落在拒绝域中,故结论是:在水平下拒绝H0;如果,则,从而u未落在拒绝域中,故在水平下应接受H0。当前第42页\共有47页\编于星期三\11点对任意指定的显著性水平,在与P比较后可得到如下结论:如果值,则在显著性水平下拒绝;如果值,则在显著性水平下接受。任一检验问题的p值可以根据检验统计量的样本观察值和检验统计量在下一个特定的参数值对应的分布求出。

(1)在对的检验中,(2)在对的检验中,

(3)在对的检验中,当前第43页\共有47页\编于星期三\11点

§4.5秩和检验

一、基本概念威尔柯克逊(Wilcoxon)在1945年首先提出了比较两个总体分布函数的秩和检验法。

秩和检验以及其它的秩检验法,都是建立在秩及秩统计量基础上的非参数方法。定义4.5.1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论