概率论-ch8.6分布拟合检验_第1页
概率论-ch8.6分布拟合检验_第2页
概率论-ch8.6分布拟合检验_第3页
概率论-ch8.6分布拟合检验_第4页
概率论-ch8.6分布拟合检验_第5页
免费预览已结束,剩余31页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六节

分布拟合检验一、

2拟合检验法二、偏度、峰度检验三、小结

2一、

拟合检验法

2检验法的定义这是在总体的分布未知的情况下,根据样本X1

,X2

,L

,Xn

来检验关于总体分布的假设H0

:总体X

的分布函数为F

(x),H1

:总体X

的分布函数不是F

(x),的

法.说明在这里备择假设H1可以不必写出.(2)若总体

X

为离散型则上述假设相当于:H0

:

总体

X

的分布律为P{X

ti

}

pi

,

i

1,2,L.若总体

X

为连续型:

则上述假设相当于H0

:总体X

的概率密度为f

(x).在使用

2检验法检验假设

H

时,

F

(

x)的0形式已知,但其参数值未知,需要先用最大似然估计法估计参数,然后作检验.但一般来说,若H0

为真,且试验次数又多时,这种差异不应很大.nf中,事件A

出现的频率i

i与

p

(或

pˆ )

往往有差异,iik将随机试验可能结果的全体

分为k

个互不相容的事件

A1,

A2

,

L

,

An

(

Ai

,

Ai

Aj

,

i

j,i

1i,

j

1,

2,

L

,

k

).

于是在假设

H0

下,

可以计算pi

P(

Ai

)

(或

pˆi

(

Ai

)),

i

1,2,

L

,

k.

在n次试验2.

2检验法的基本思想3.kikin

nnpfi

2pi

n

fii

12

2

i

1

p2或

定理设检验假设H0

的统计量为定理若

n

充分大(

50),

则当

H0

为真时(不论H0中的分布属什么分布),

上统计量总是近似地服从自由度为k

r

1的

2

分布,其中,r是被估计的参数的个数.于是,如果在假设H0

下,i

1npi(

fi

npi

)2

2(k

r

1),k

2

H0

,否则就接受H0

.则在显著性水平

下注意在使用

2检验法时,

n要足够大,

np

不i

太小.根据实践,

一般

n

50,

每一个npi

5.例1把一颗出现的点数出现的频数试检验这颗重复抛掷300

次,结果如下:1

2

3

4

5

640

70

48

60

52

30的六个面是否匀称?(取

0.05)解

根据题意需要检验假设H0:

这颗

的六个面是匀称的.60(或

H

:

P{

X

i}

1(i

1,2,L,6))一次所出现的点数(可能其中

X表示抛掷这值只有6

个),取i

{

i

}, (

i

1,2,

L

,6

)互不相容事件.(i

1,2,L,6)为则事件

Ai

X

i

{X

i}6(i

1,2,L,6)npi在

H0

为真的前提下,

pi

P(

Ai

)

1

,i

1k

2

(

fi

npi

)26300

16(40

300

1)26300

16(70

300

1)26300

16(48

300

1)2300

16

2

20.16,6(60

300

1)2300

16度为6

1

5,6(52

300

1)2,66300

1(30

300

1)220.052查

(5)表得

11.07,

2

20.16

11.07,所以

H0,认为这颗的六个面不是匀称的.在一试验中,每隔一定时间观察一次由某种铀所放射的到达计数器上的

粒子数,

共观察了100次,得结果如下表:i0

1

2

3

4

5

6

7

8

9

10

11

12fi9

2

1

2

1

0AiA0

A1

A2

A3

A4

A5

A6

A7

A8

A9

A10

A11

A12,

i

0,1,2,L,i!

ie

i考虑

X

应服从泊松分布

P

X其中fi

是观察到有i

粒子的次数.从理论上是否符合实际?(

0.05)i!问PX

iei例2解

所求问题为:

在水平

0.05

下检验假设H0

:总体

X

服从泊松分布,

i

0,1,2,

L

,i!PX

iei由于在H0

中参数

未具体给出,故先估计.由最大似然估计法得根据题目中已知表格,

x

4.2,P{X

i}有估计如

pˆ0

PˆX

0

e4.2

0.015,3!e4.2

4.23

0.185,3pˆ

PˆX

311pˆ12

PˆX

12

1

pˆi

0.002,i

1具体计算结果见下页表8.3,i!e4.2

4.2iiˆX

i

,

i

0,1,2,

L

,pˆ

P

表8.3Aifipˆinpˆ

if

2

/

npˆi

iA0A10.015

0.0780.0631.56.34.615A2A3A40.1320.1850.19413.218.519.419.39415.62234.845A5A690.1630.11416.311.47.4237.105A790.0696.911.739A820.0363.6A9A1012

60.0170.007

0.0651.70.75.538A11

A12100.0030.0020.30.2

=106.281例2的

2

拟合检验计算表(6)

12.592

6.2815,0.056,

2

(k

r

1)

2故接受H0,认为样本来自泊松分布总体.其中有些npˆi

5的组予以合并,使得每组均有npi

5,如表中第四列化括号所示.并组后k

8,故

2

的度为8

1

1

至世界记录到里氏震级4级和4级以上计如下:共2231天中,全共162次,统(

0.05)(X

表示相继两次

间隔天数,Y

表示出现的频数)X0

45

910

1415

1920

2425

2930

3435

39

40Y50312617108668试检验相继两次

间隔天数

X

服从指数分布.解

所求问题为:

在水平0.05下检验假设例30H

:

X

的概率密度0,1f

(

x)

xe

,

x

0,x

0.由于在H0

中参数

未具体给出,故先估计

.162由最大似然估计法得ˆ

x

2231

13.77,的子区间[ai

,ai1

),i

1,2,L,9.X

为连续型随

量,将X

可能取值区间[0,

)分为k

9

个互不(见下页表)Aifipˆinpˆ

if

2

/

npˆi

iA1

:

0

x

4.55031261710866

80.27880.21960.15270.10620.07390.05140.03580.0248

0.056845.165635.575224.737417.204411.97188.32685.79964.0176

13.21929.201655.3519A2

:

4.5

x

9.527.0132A3

:

9.5

x

14.527.3270A4

:14.5

x

19.516.7980A5

:19.5

x

24.58.3530A6

:

24.5

x

29.57.6860A7

:

29.5

x

34.56.2073A8

:

34.5

x

39.5A9

:

39.5

x

14.8269

=163.5633表8.4例3的

2

拟合检验计算表在H0

为真的前提下,0,x

0,x

0.X

的分布函数的估计为Fˆ

(x)

1

ex13.77

,概率pi

P(Ai

)有估计pˆi

(

Ai

)

Pˆ{ai

X

ai

1

}

(ai1

)

(ai),如

pˆ2

(

A2

)

Pˆ{4.5

X

9.5}

(9.5)

(4.5)

0.2196,8pˆ9

(

A9

)

1

(

Ai

)

0.0568,i

1(6)

12.592

1.5633,

2

(k

r

1)

20.05故在水平0.05

下接受H0

,认为样本服从指数分布.

2

163.5633

162

1.5633,k

8,

r

1,下面列出了84个依特拉

人男子的头颅的最大宽度(mm),试验证这些数据是否来自正态总体?(

0.1)141148132138154142150146155

158150140147148144150149145149

158143141144144126140144142141

140145135147146141136140146142

137148154137139143140131143141

149148135148152143144141143147

146150132142142143153149146149

138142149142137134144146147140

142140137152145例4解所求问题为检验假设0e ,

x

.H

:

X

的概率密度f

(x)(

x

)22

212π由于在

H0

中参数

,

2

未具体给出,故先估计,

2

.ˆ2

6.02

,由最大似然估计法得ˆ

143.8,将X

可能取值区间(,)分为7

个小区间,(见下页表)在H0

为真的前提下,X

的概率密度的估计为Aifipˆinpˆ

if

2

/

n

pˆi

iA1

:

x

129.5A2

:129.5

x

134.51

41033249

30.0087

0.05190.17520.31200.28110.1336

0.03750.73

5.094.3614.7226.2123.6111.22

14.373.154.91A3

:134.5

x

139.56.79A4

:139.5

x

144.541.55A5

:144.5

x

149.524.40A6

:149.5

x

154.510.02A7

:154.5

x

=87.67表8.5例4的

2

拟合检验计算表12π

6262e ,

x

.fˆ

(

x)

(

x143.8)2概率pi

P(Ai

)有估计如pˆ2

(A2

)

Pˆ129.5

x

134.5

6

6

134.5

143.8

129.5

143.8

(1.55)

(2.38)

0.0519

.

2

(k

r

1)

2

(5

2

1)

2

(2)

4.605

3.67,0.1

0.1故在水平0.1

下接受H0,认为样本服从正态分布.一农场10年前在一鱼塘里按如下比例20:15:40:25投放了四种鱼:鲑鱼、鲈鱼、竹夹鱼和鲇鱼的鱼苗.现在在鱼塘里获得一样本如下:序号1234种类鲑鱼鲈鱼竹夹鱼鲇鱼数量(条)132100200168

600检验各鱼类数量的比例较10年前是否有显著改变?(取

0.05)例5解

X

记鱼种类的序号,根据题意需检验假设:432i0.20

0.15

0.40

0.25X

1H0

:X

的分布律为p所需计算列表如下(n

600)Aifipinpif

2

/

npˆi

iA11320.20120145.20A21000.1590111.11A32000.40240166.67A41680.25150188.16=611.14表8.6例5

2

拟合检验计算表

2

611.14

600

11.14,认为各鱼类数量之比较10

年前有显著改变.k

4,

r

0,20.0520.05(k

r

1)

(3)

7.815

11.14,

故H0,二、偏度、峰度检验1.问题的提出根据第五章关于中心极限定理的论述知道,正态分布随

量较广泛地存在于客观世界,

因此,

当研究一连续型总体时,

人们往往先

是否服从正态分布.

上面介绍的

2

检验法虽然

是检验总体分布的较一般的方法,

但用它来检验总体的正态性时,

犯第II类错误的概率往往较大.为此,在对检验正态总体的种种方法进行比较后,认为“偏度、峰度检验法”和“ -

克法”较为有效.(此处只介绍前一种)2.随D(

X

)随量的偏度和峰度的定义量X

的偏度和峰度指的是X

的标准化变量X

E(X

)的三阶中心矩和四阶中心矩:D(

X

)

X

E(

X

)

3

v1

E

,(

D(

X

))3

/

23E[(

X

E(

X

))

]

X

E(

X

)

4v2

E

D(

X

)

(

D(

X

))24E[(

X

E(

X

))

]

.

当随

X

服从正态分布时,

v1

0

且v2

3.3.样本偏度和样本峰度的定义,21.G

~

N

3

6 24n(n

2)(n

3)n

1 (n

1)2

(n

3)(n

5)

(n

1)(n

3)

G

~

N

0,6(n

2)

,设X1

,X2

,L

,Xn

是来自总体X

的样本,242分别称为样本偏度和样本峰度.B2BG

,21B3

/

2B3则G

其中Bk

(k

2,3,4)是样本k阶中心矩.若总体

X

为正态变量,则当n

充分大时,近似地有4.偏度、峰度检验法设

X1

,

X

2

,

L

,

Xn

是来自总体

X

的样本,现在来检验假设

H0

:

X

为正态总体.16(n

2)

(n

1)(n

3)记

,2,

24n(n

2)(n

3)(n

1)2

(n

3)(n

5),26n

1

3

11u

G1

,22u

G2

2

.当

H0

为真且

n

充分大时,

近似地有u1

~

N

(0,1),

u2

~

N

(0,1).由第六章第二节知样本偏度G1

和样本峰度G2

分别依概率收敛于总体偏度v1

和总体峰度v2

.因此当

H0

为真且

n

充分大时,

一般地G1

与v1

0的偏离不应太大,G2

与v2

3的偏离不应太大.故从直观来看当|

u1

|

或|

u2

|

过大时,

H0

.取显著性水平为,

H0的

域为|

u1

|

k1

或|

u2

|

k2

,其中k1

和k2

由下两式决定,2P

{|

u

|

k

}

;H0

1

12P

{|

u

|

k

}

.H0

2

2即k1

z

/4

,k2

z

/

4

,于是得

域u1

z

/

4或

u2

z

/

4

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论