概率论与数理统计(第四版)第八章_第1页
概率论与数理统计(第四版)第八章_第2页
概率论与数理统计(第四版)第八章_第3页
概率论与数理统计(第四版)第八章_第4页
概率论与数理统计(第四版)第八章_第5页
已阅读5页,还剩99页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八章假设检验§8.1假设检验根据样本的信息检验关于总体的某个假设是否正确。参数假设检验非参数假设检验让我们先看一个例子:参数假设检验罐装可乐的容量按标准为355毫升。生产流水线上罐装可乐不断地封装,然后装箱外运。怎么知道这批罐装可乐的容量是否合格呢?通常的办法是进行抽样检查:如每隔1小时,抽查5罐,得到一个容量为5的子样(x1,…,x5)。每隔一定时间,抽查若干罐。如何根据这些值来判断生产是否正常?在正常生产条件下,由于种种随机因素的影响,每罐可乐的容量应在355毫升上下波动。这些因素中没有哪一个占有特殊重要的地位。因此,根据中心极限定理,假定每罐容量服从正态分布是合理的。要检验的假设:H0:(=355)对立假设:H1:称

H0为原假设(零假设);称H1为备择假设(对立假设)。在实际工作中,往往把不轻易否定的命题作为原假设。如何判断原假设H0

是否成立?对差异作定量的分析,以确定其性质:

差异可能是由抽样的随机性引起的,称为“抽样误差”或随机误差合理的界限在何处?应由什么原则来确定?必须认为这个差异反映了事物的本质差别,即反映了生产已不正常。这种差异称作“系统误差”

带概率性质的反证法小概率事件在一次试验中基本上不会发生。方法:原则:例这里有两个盒子,各装有100个球。另一盒中的白球和红球数99个白球一个红球…99个一盒中的白球和红球数99个红球一个白球…99个现从两盒中随机取出一个盒子,问这个盒子里是白球99个还是红球99个?假设:这个盒子里有99个白球。从中随机摸出一个:p=1/100

是小概率事件小概率事件在一次试验中基本上不会发生。我们有很大的把握说:原假设:“这个盒子里有99个白球。”

不成立一般的反证法要求在原假设成立的条件下导出的结论是绝对成立的,如果事实与之矛盾,则完全绝对地否定原假设。概率反证法的逻辑是:如果小概率事件在一次试验中居然发生,我们就以很大的把握否定原假设。“小概率”该多小?在假设检验中,我们称这个小概率为显著性水平,用表示。的选择要根据实际情况而定。常取现在回到我们前面罐装可乐的例中:H0:(=355)H1:对给定的显著性水平

,可以在N(0,1)表中查到分位点的值,使0也就是说,“”是一个小概率事件。W:为拒绝域如果由样本值算得该统计量的实测值落入区域W,则拒绝H0

;否则,不能拒绝H0。这里所依据的逻辑是:如果H0

是对的,那么衡量差异大小的某个统计量落入区域W(拒绝域)是个小概率事件。如果该统计量的实测值落入W,也就是说,H0成立下的小概率事件发生了,那么就认为H0不可信而否定它。否则我们就不能否定H0

(只好接受它)。不否定H0并不是肯定H0

一定对,而只是说差异还不够显著,还没有达到足以否定H0的程度。所以,假设检验又叫“显著性检验”。如果在很小的情况下H0仍被拒绝了,则说明实际情况很可能与之有显著差异。基于这个理由,人们常把时拒绝H0称为是显著的,而把在时拒绝H0称为是高度显著的。假设检验的一般步骤:

1.提出原假设和备择假设;

2.取一检验统计量,在H0成立下求出它的分布;3.对给定的显著性水平α,查表确定临界值,从而得否定域

4.将样本值代入算出统计量的实测值,并以此作出结论。

例1

某工厂生产的一种螺钉,标准要求长度是32.5毫米.实际生产的产品,其长度X假定服从正态分布未知,现从该厂生产的一批产品中抽取6件,得尺寸数据如下:32.56,29.66,31.64,30.00,31.87,31.03问这批产品是否合格?统计解:已知X~未知。

得拒绝域:W:|t|>4.0322对给定的显著性水平=0.01,查表计算

<4.0322没有落入拒绝域结论:不能拒绝H0,这批产品合格。假设检验会不会犯错误呢?小概率事件在一次试验中基本上不会发生。不是一定不发生我们使用的原则是:两类错误第一类错误如果H0成立,但统计量的实测值落入拒绝域,从而作出拒绝H0的结论,那就犯了“以真为假”的错误。第二类错误如果H0不成立,但统计量的实测值未落入拒绝域,从而作出接受H0的结论,那就犯了“以假为真”的错误。请看下表P{拒绝H0|H0为真}=

,

H0为真实际情况决定

拒绝H0接受H0

H0不真第一类错误正确正确第二类错误P{接受H0|H0不真}=.受控未受控

两类错误是互相关联的,当样本容量固定时,一类错误概率的减少导致另一类错误概率的增加。

要同时降低两类错误的概率,或者要在不变的条件下降低,需要增加样本容量。例2

某织物强力指标X的均值=21公斤.改进工艺后生产一批织物,今从中取30件,测得=21.55公斤。假设强力指标服从正态分布且已知=1.2公斤,问在显著性水平=0.01下,新生产织物比过去的织物强力是否有提高?解:提出假设:右边检验拒绝域为:代入=1.2,n=30,并由样本值计算得统计量Z的实测值:>2.33故拒绝原假设H0,认为:新生产织物比过去的织物强力有显著提高。=2.33计算单边检验:{双边检验:右边检验:左边检验:§8.2正态总体均值的假设检验(一)单个正态总体均值的检验双边检验:检验统计量:拒绝域为:

右边检验:拒绝域为:左边检验:拒绝域为:

检验统计量:双边检验:拒绝域为:右边检验:拒绝域为:左边检验:拒绝域为:例3

某种元件的寿命X(以小时计)服从正态分布N(,

2),,2均未知。现测得16只元件的寿命如下:

159280101212224379179264222362168250149260485170

问是否有理由认为元件的平均寿命大于225(小时)?统计解:按题意需检验:H0:≤0=225H1:>225检验统计量:拒绝域为现在n=16取

=0.05=1.7531<1.7531计算没有落在拒绝域中,故接受H0,即认为元件的平均寿命不大于225小时。(二)两个正态总体均值差的检验

检验统计量?检验统计量:双边检验:右边检验:拒绝域为:左边检验:拒绝域为:拒绝域为:

检验统计量:双边检验:右边检验:拒绝域为:左边检验:拒绝域为:拒绝域为:例4

在平炉上进行一项试验以确定改变操作方法的建议是否会增加钢的得率,试验是在同一只平炉上进行的。每炼一炉钢时除操作方法外,其它条件都尽可能做到相同。先用标准方法炼一炉,然后用建议的新方法炼一炉,以后交替进行,各炼了10炉,其得率分别为

(1)标准方法

78.172.476.274.377.478.476.075.576.777.3

(2)新方法

79.181.077.379.180.079.179.177.380.282.1

设这两个样本相互独立,且分别来自正态总体N(1,2)和N(2,2)

,1,2,2均未知。问建议的新操作方法能否提高得率?(取=0.05.)返回计算解:需要检验假设检验统计量:分别求出标准方法和新方法下的样本均值和样本方差:拒绝域为:又样本观察值t=-4.295<-1.7341,落入拒绝域,所以拒绝H0,即认为建议的新操作方法较原来的方法为优。§8.3正态总体方差的假设检验(一)单个正态总体方差的检验检验统计量:双边检验:拒绝域为:右边检验:拒绝域为:左边检验:拒绝域为:例5

某厂生产的某种型号的电池,其寿命(以小时计)长期以来服从方差2=5000的正态分布,现有一批这种电池,从它的生产情况来看,寿命的波动性有所改变。现随机取26只电池,测出其寿命的样本方差s2=9200。问根据这一数据能否推断这批电池的寿命的波动性较以往的有显著变化(取=0.02)?解:本题要求在水平=0.02下检验假设拒绝域为:检验统计量:=46=44.314=11.524拒绝H0,认为这批电池寿命的波动性较以往的有显著的变化。计算(二)两个正态总体方差比的检验检验统计量:双边检验:拒绝域为:右边检验:拒绝域为:右边检验:拒绝域为:解:

此处n1=n2=10,=0.01,例6

试对例4中的数据检验假设:

H0:12=22,H1:12

22(取=0.01)=6.54检验统计量:拒绝域为:例4计算现在s12=3.325

s22=2.225

故接受H0

,认为两总体方差相等。F=s12/s22=1.49,即有0.153<F

<6.54有人推测,矮个子的人比高个子的人长寿这个结论对吗?我们来做一个检验。GeorgeWashington1stPresident

Stature:6’2”(188cm)

Born:February22,1732Died:December14,1799(67)美国历届总统资料

JohnAdams

2ndPresidentStature:5’6”(168cm)Born:October30,1735Died:July4,1826(90)

美国历届总统资料ThomasJefferson3ndPresidentStature:6’2.5”(189cm)Born:April13,1743Died:July4,1826(64)美国历届总统资料JamesMadison4thPresident

Stature:5‘4“(163cm)Born:March16,1751Died:June28,1836(85)美国历届总统资料美国历届总统资料JamesMonroe

5thPresident

Stature:6‘(183cm)Born:April28th,1758Died:July4,1831(73)美国历届总统资料JohnQuincyAdams6thPresident

Stature:5‘7“(171cm)Born:July11,1767

Died:February23,1848(80)美国历届总统资料AndrewJackson

7thPresident

Stature:6‘1“(171cm)Born:March15,1767Died:June8,1845

(78)美国历届总统资料MartinVanBuren

8thPresident

Stature:5‘6“(168cm)Born:December5,1782Died:July24,186(79)美国历届总统资料

WilliamHenryHarrison

9thPresident

Stature:5‘8“(173cm)Born:February9,1773Died:April4,1841(68)美国历届总统资料JohnTyler

10thPresident

Stature:6‘(183cm)Born:March29,1790Died:January18,1862

(71)美国历届总统资料JamesK.Polk

11thPresident

Stature:5‘8“(173cm)Born:November2,1795Died:June15,1849(53)美国历届总统资料ZacharyTaylor12thPresident

Stature:5‘8“(173cm)Born:November24,1784Died:July9,1850(65)美国历届总统资料MillardFillmore13rdPresident

Stature:5‘9“(175cm)Born:January7,1800Died:March8,1874(74)美国历届总统资料

FranklinPierce

14thPresident

Stature:5‘10“(178cm)Born:November23,1804Died:October8,1869(64)美国历届总统资料UlyssesS.Grant18thPresident

Stature:5‘8.5“(174cm)Born:April27,1822Died:July23,1885

(63)美国历届总统资料RutherfordB.Hayes

19thPresident

Stature:5‘8.5“(174cm)Born:October4,1822Died:October4,1822(70)

美国历届总统资料BenjaminHarrison

23thPresident

Stature:5‘6“(168cm)Born:August20,1833Died:March13,1901(67)美国历届总统资料HarrySTruman

33rdPresident

Stature:5‘9“(175cm)Born:May8,1884Died:December26,1972(88)矮个子总统高个子总统总统寿命总统寿命总统寿命Madison85W.Harrison68Wilson67VanBuren79Polk53Hoover90B.Harrison67Taylor65Monroe73J.Adams90Grant63Tyler71J.Q.Adams80Hayes70Buchanan77Truman88Taft72Fillmore74Harding57Pierce64Jackson78A.Johnson66Washington67T.Roosevelt60Arthur56Coolidge60F.Roosevelt63Eisenhower78L.Johnson64Cleveland71Jefferson83SPSS§8.4分布拟合检验可能遇到这样的情形,总体服从何种理论分布并不知道,要求我们直接对总体分布提出一个假设。例如,从1500到1931年的432年间,每年爆发战争的次数可以看作一个随机变量,椐统计,这432年间共爆发了299次战争,具体数据如下:战争次数X01234

22314248154

发生X次战争的年数上面的数据能否证实X

服从Poisson分布的假设是正确的?返回又如,某工厂制造一批骰子,声称它是均匀的。也就是说,在投掷中,出现1点,2点,…,6点的概率都应是1/6。为检验骰子是否均匀,把骰子实地投掷6000次,统计各点出现的次数。得到的数据能否说明“骰子均匀”的假设是可信的?点数123456次数910111010301050960940再如,某钟表厂对生产的钟进行精确性检查,抽取100个钟作试验,拨准后隔24小时以后进行检查,将每个钟的误差(快或慢)按秒记录下来。该厂生产的钟的误差是否服从正态分布?解决这类问题的工具是英国统计学家K.皮尔逊在1900年发表的一篇文章中引进的所谓

检验法。这是一项很重要的工作,不少人把它视为近代统计学的开端。

K.皮尔逊

检验法是在总体X的分布未知时,根据来自总体的样本,检验关于总体分布的假设的一种检验方法。是一种非参数检验。

我们先提出原假设:

H0:总体X的分布函数为F(x)然后根据样本的经验分布和所假设的理论分布之间的吻合程度来决定是否接受原假设.这种检验通常称作拟合优度检验。分布拟合的检验法的基本原理和步骤如下:1.

将总体X的取值范围分成k个互不重迭的小区间,记作A1,A2,…,Ak

.2.

把落入第i个小区间Ai的样本值的个数记作fi

,称为实测频数。所有实测频数之和f1+f2+…+fk等于样本容量n。3.

根据所假设的理论分布,可以算出总体X的值落入每个Ai的概率

pi

,于是

npi

就是落入Ai的样本值的理论频数。样本与理论分布之间的差异的大小。

皮尔逊引进如下统计量表示经验分布与理论分布之间的差异:皮尔逊证明了如下定理:若原假设中的理论分布F(x)已经完全给定,那么当

时,统计量:渐近服从自由度为

k-1

的分布。如果F(x)中有r

个未知参数需用相应的估计量来代替,那么当时,统计量渐近服从自由度为

k-r-1

的分布。查分布表可得临界值,使得根据这个定理,对给定的显著性水平,得拒绝域:(不需估计参数)(估计r个参数)如果根据所给的样本值X1,X2,…,Xn

算得统计量的实测值落入拒绝域,则拒绝原假设,否则就认为差异不显著而接受原假设。

皮尔逊定理是在n无限增大时推导出来的,因而在使用时要注意n足够大,以及npi不太小这两个条件。

根据计算实践,要求

n不小于50,以及npi

都不小于5。否则应适当合并区间,使npi满足这个要求。例1:检验骰子是否均匀我们先提出原假设:

H0:总体X为均匀分布

点数123456次数9101110103010509609403.610001/694062.510001/61050412.110001/6111021.610001/696050.910001/6103038.1010001/69101npipifiAi11.071拒绝H0骰子不均匀!例2:检验每年爆发战争次数分布是否服从Poisson分布。H0:

X服从参数为的Poisson分布的极大似然估计为:=0.69战争次数X01234发生X次战争的年数22314248154例2pi的估计是:i=0,1,2,3,4计算结果列表如下:X01234Σfi223142481540.580.310.180.010.02216.7149.551.612.02.160.1830.3760.25114.161.6232.43自由度为:4-1-1=2=5.991=2.43<5.991,认为每年发生战争的次数X服从参数为0.69的Poisson分布。不能拒绝H0计算在此,我们以遗传学上的一项伟大发现为例,说明统计方法在研究自然界和人类社会的规律性时,是起着积极的、主动的作用。奥地利生物学家孟德尔进行了长达八年之久的豌豆杂交试验,并根据试验结果,运用他的数理知识,发现了遗传的基本规律。孟德尔子二代子一代…黄色纯系…绿色纯系根据他的理论,子二代中,黄、绿之比近似为3:1,他的一组观察

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论