版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、实验十三 二项分布的计算与中心极限定实验目的1. 研究用Poisson逼近与正态逼近进行二项分布近似计算的条件2. 检验中心极限定理§1 引言二项分布在概率论中占有很重要的地位。N次Bernoulli实验中正好出现K次成功的概率有下式给出,k=0,1,2,.n.二项分布的值有现成的表可查,这种表对不同的n及p给出了b(k;n.p)的数值。在实际应用中。通常可用二项的Poisson逼近与正态逼近来进行二项分布的近似计算。在本实验中,我们来具体地研究在什么条件下,可用Poisson逼近与正态逼近来进行二项分布的近似计算。 在概率论中,中心极限定理是一个很重要的内容,在本实验中,我们用随即
2、模拟的方法来检验一个重要的中心极限定理Liderberg-Levi中心极限定理。 §2 实验内容与练习1 1二项分布的Poisson逼近用Mathematica软件可以比较方便地求出二项分布的数值。例如n=20;p=0,1;TableBinomialn,k*pk*(1-p)(n-k),k,0,20给出了b(k;20,0.1)(k=0,1,2,.,20)的值。联系1 用Mathematica软件给出了b(k;20,0.1),b(k;20,0.3)与b (k;20,0.5)(k=0,1,2,.,20)的值。LISTpOLTtableBinomi al20,k*0.1k*0.9(20-k)
3、,k,0,20,PlotJoined->True 图13.1 b(k;20,0.1) (k=1,1,2,20)的散点图练习2绘出b(l;20,0.3)与b(k;20,0.5)(k=0,1,2,20)的散点图根据下面的定理,二项分布可用Poisson分布来进行近似计算。定理13。1 在Bernoulli实验中,以Pn 代表事件A在试验中出现的概率,它与试验总数有关.如果npn,则当n时,。由定理13,1在n很大,p很小,而=np大小适中时,有练习3 用Poisson逼近给出b(k;100,0.01)(k=0,1,2,.,100)与b(k;1000,0.001)(k=0,1,2,1000)的
4、近似值,并与它们的精确值比较,表13,1二项分布的Poisson逼近kB1(k)B2(k)P(k)R1(k)R2(k)03.6603210-13.6769510-13.6787910-11.8510-31.8410-413.6973010-13.6806310-13.6787910-11.8510-31.8410-421.8486510-11.8403210-11.8349010-19.2510-49.2010-536.0999210-26.1282510-26.1316210-23.1410-43.0710-541.4941710-21.5290010-21.5328310-23.8710-
5、43.8310-552.8977910-33.0488110-33.0656610-31.6810-41.6910-564.6345110-45.0610010-45.1094410-44.7510-54.8410-676.2863510-57.1938110-57.2992010-51.0110-51.0510-687.3816910-68.9382610-69.1239910-61.7410-61.8610-797.6219510-79.8618110-71.0137810-62.5210-72.7610-8107.0060410-89.7828410-81.0137810-73.1310
6、-83.5510-910)(表中即位b1(k)与b(k;1000,0.001)(k=0,1,2,.10)(记为b2(k)的Poisson逼近的近似值记为p9k)与它们的精确值的比较,其中r1(k)=/b1(k)-p9k)/,r2(k)=/b2(k)-p(k)/从表13。1可以看出,用Poisson分布来计算b(k;1000,0.001)比b(k;100,0.01)的效果好得多,我们可以画出它们的散点图(图13。2)来观察近似计算的效果,下面的程序给出了b(k;20,0.1)的近似计算的精确值的比较图13。2b(k;20,0.1)的Poisson近似计算的精确值的比较练习4绘出b(k;100,0
7、.01)与b(k;1000,0.001)的近似计算与精确计算的散点图。那么n,p,。到底取何值时,我们可以用Poisson分布来近似计算二项分布的值呢?我们可以用误差来作为衡量标准评价缉私的效果若n与p给定,则b(k;n,p)与其Piosson逼近的误差是的k函数;根据上式可以定义二项分布的Poisson逼近的误差定义13。2若n,p给定,我们定义二项分布b(k;n,p)(k=0,1,p)的Poisson逼近的误差为;差通过简单的程序运算我们可以求得;p100,0.01=1.85*10-3 p1000,0.001=1.84*10-4练习5通过编程求出在n=10,100,1000与10000,=
8、0.1,1与10时,二项分布的Poisson逼近的误差,填入表13,2; 表13。2二项分布的Poisson逼近的误差表n0.11.010.0101001.8510-310001.8410-410000你能从中发现什么规律那?在一定条件下我们可以认为,若绝对误差p<=10-3,则可以接受近似计算结果在=1时,若n=100,p=0.01,则p100,0.01=1.85 10-3>10-3,不能接受计算结果,即此时不能用Poisson逼近来缉私计算二项分布的值,若n=1000,p=0.001,则p1000,0.001=1.84 10-4<10-3,此时可用Poisson逼近来缉私
9、计算二项分布的值,对=1,我们可以用编程求出n=2,3,.1000的对应的Poisson二项分布的逼近的误差,图13。3就是误差的散点图。在=1时,要使绝对误差p>=10-3,必须n>=185练习6在=0.1,0.5,2.0,5.0,10.0时,n取何值,可使绝对误差p<=10-3? 图13。3Poisson逼近的误差(=1)练习7 若误差标准该为p<=10-4或其它的数据,研究上面对应的问题,练习8 对于n,p,到底取何值时,可以用Poisson分布 来近似计算二项分布的值,你有什么结论? 22 二项分布的正态逼近21节中讨论了用Poisson逼近来近似计算二项分布的
10、问题。在实际应用中,我们还可以用正态逼近来近似计算二项分布。计算的根据是局部极限定理,在n->时,有 Cnkpkqk图13.4b(k;20,0.1)的正态逼近近似计算与精确的比较图13。4是b(k;20,0.1)的正态逼近的近似值与精确的比较的散点图 。图 13。5用另一种方式更直观地显示出逼近的效果。 图13。5中,阶梯函数给出概率Cnkpkqn-k,而曲线则给出对应的正态分布密度函数。其Mathematica程序如下:由于n的取值比较小,我们可以看出,近似的效果不是很好。练习9 用正态逼近给出b(k;100,0.01)(k=0,1,2,100)与b(k;1000,0.001) (k=
11、0,1,2,1000)的近似值,与它们的精确值作比较。做出近似计算与精确计算的散点图。练习10 做出b(k;100,0.01)与b(k;1000,0.001)的阶梯函数与对应的正态分布密度函=数曲线,观察其效果。 若n与p给定,我们也可以定义二项分布b(k;n,p) (k=0,1,2,n)的正态逼近的误差为: Nn,p=maxNn,p(k)=max|Cnkpkqn-k-(1/) (1/) exp(-(1/2)(k-np)/2)是、式中q=1-p.练习11 若分别取0.1,0.5,1.0,2.0,5.0,10.0,n取何值时,可使绝对误差N<=10-3?练习12 n ,p取何值时,可以用正
12、态逼近来近似计算二项分布的值。练习13 比较二项分布的Poisson逼近与正态逼近的优劣。23 中心极限定理的验证1 正态分布的假设检验在实际应用中,有许多随机数据都可以看作来自于正态分布。那么,如何检验一批数据是否来自于正态分布呢? 按照国家标准,我们采用D检验来判断随机数据的正态性。下面通过一个例子介绍D检验的过程。例 下面是某种刀具生产的合格零件个数(已用Mathematica语句的形式给出),判断它们是否满足正态分布: t=459,362,624,509,584,433,748,815,505,612,452,434,982,640,742,565,706,593,680,926,65
13、3,164487,734,608,428,1153,593,844,527,552,513,781,474,388,824,538,862,659,775,859,755,649,697,515,628,954,771,609,402,960,885,610,292,837,473,677,358,638,699,634,555,570,84,416,606,1062,484,120,447,654,564,339,280,246,687,539,790,581,62,724,531,512,577,496,468,499,544,645,764,558,378,765,666,763,217
14、,715,310,851,解 (1)将100个数据按非减次序排列: X(1)<=X( 2)=<=X( 100) (2)计算统计量(其中n=100,X是数据样本的均值): (3)计算统计量; Y= (4)给定检验水平 =0.05,查表得临界值Z/2,; =-2.54及Z1-/2 =1.31. (5)若 Z/2<Y<Z1-/2. ,则接受正态分布假设,否则拒绝正态分布假设。经计算得Y=-1.2933,显然-2 .54<-1.2933<1.31,接受正态分布假设.D检验的Mathematica程序如下:Fata1:=Modulez1=-0.54,z2=1.31,d
15、ada=Sortdada1,N=Lengthdada;Mean=Sumdadak,k,1,n/n;D1=Sum(k-(n+1)/2)*dadak,k,1,n;D2=(Sqrtn)SqrtSum(dadak-mean)2,k,1,n;D=d1/d1;Y=Sqrtn*(d-0.28209479)/0.02998598;Result=Ifz1<y<z2,1,0;Returnresult;Ft运行该程序(运行程序前已将题给数据t输入),得ft的结果为1,表示通过正态检验。当然,我们可将程序中Ifz1<y<z2,1,0语句改为Ifz1<y<z2,Print“succe
16、ed”,Print“fail”来输入是否通过检验的信息。D检验的几个常用的临界值见表13.3表13.3 D检验的临界值表/n0.0050.0250.050.950.9750.995100-3.57 -2.54-2.071.141.311.59200-3.30-2.39-1.961.291.501.85500-3.04-2.24-2.851.421.672.111000-2.91-2.16-1.791.491.752.25练习14 用Mathmatica软件产生2000个标准正态分布的伪随机数(参见实验十二),用D检验的方法检验其正态性。2中心极限定理的检验下面我们来研究一个重要的中心极限定理。
17、定理13.3(Liderberg_Levi) 设1,2,n,是一串相互独立相同分布的随机变量,且. Ei=m, D=2,对于标准化随机变量之和n=1/(i-m),在02时,有LimPn<x=1/2e-t2/2dt.我们先讨论相互独立的随机变量i(每个i服从二项分布b(k;20,0.1)(I=1,2,)之和的极限情况。已知Ei=m=2,Di=2=1.8,考虑标准化随机变量之和 n=1/(i-m). 对于固定的n,我们每次Mathematica软件模拟100个分布n的随机数,然后D用检验来判定其是否能通过正态分布检验.重复一定的次数,观测其能通过正态分布检验的比率.在下面的程序中,我们取n=
18、30(程序中的number)<<StatisticsDisstributionsrndn_,p_:=RandomBionmialDistributionn,p;Cleark,c,a;Whole=25;number=30;s=0,c=0;Nn=20;pp=0.1;nu=nn*pp;sigma=Sqrtnn*(1-pp);Forj=1,j<=whole,j+,A=;ForI=1,I<=100,I+,s=(Sumrndnn,pp-nu,k,l,number);A=Appenda,s/(sigma*Sqrtnumber);C=c+fa;Pritc下面就是程序运行20 次得到的结
19、果:24,25,23,23,21,24,25,23,24,24,24,24,24,23,24,23,25,23,22,25.可见其结果比较稳定,通过正态分布检验的比率为473/500=94.6%.练习15 通过其他计算机模拟求出,对分布n=b(k;20,0。1),n取何值时,可使其在检验水平=0。05条件下,以95%的概率通过正态分布的检验。若取按水平=0。01,结果又如何?练习16 选取其他的二项分布,研究上述问题。练习17 对于Poisson分布,选取适当的研究上述问题。设1,2,n,是相互独立,均服从0,1均匀分布的随机 变量,这是定理13.3的条件得到满足,故1+2+n渐近于正态变量.
20、我们可以选取适当的n,由0,1均匀分布随机数来产生正态 分布随机 数.那么n取多少比较合适呢?练习18 分别取 正态分布D检验的检验水平=0.05,研究n=6,8,10,12,14时相互独立的0,1均匀分布的随机 变量之和1+2+n通过正态 分布检验的概率.在实际应用中,取 n=12,用来产生标准正态 分布随机 数,这种方法的效果任何呢?练习 19 对于n=12,分别在检验水平=0.01,=0.05,=0.1情况下研究上述问题.3 本实验涉及的Mathematica软件语句说明 1. Sortdata1将集合data1按从小到大的顺序重排.2. GraphicsGraylever0.5,Rec
21、tanglek-0.5,0,k+0.5,tabk+1二维图形元素,表示一个矩形,其 灰度值为0.5,对教形顶点分别为k-0.5,0与k+0.5,tabk+1.3. ListPlott2,PlotJoined->True,PlotStyle->Graylever0.1,Dashing0.02,Thickness0.01,PlotRange->0,20,0,0.3;上述语句中PlotStyle的三个选项的含义:(1) Graylever0.5图形的灰度值为0.5.(2) Dashing0.02图形为虚线,其中虚线长度为0.02.(3) Thickness0.01图形为粗线,线的宽
22、度值为0.01. D=(3)计算统计量; Y= (4)给定检验水平 =0.05,查表得临界值Z/2,; =-2.54及Z1-/2 =1.31. (5)若 Z/2<Y<Z1-/2. ,则接受正态分布假设,否则拒绝正态分布假设。经计算得Y=-1.2933,显然-2 .54<-1.2933<1.31,接受正态分布假设.D检验的Mathematica程序如下:Fata1:=Modulez1=-0.54,z2=1.31,dada=Sortdada1,N=Lengthdada;Mean=Sumdadak,k,1,n/n;D1=Sum(k-(n+1)/2)*dadak,k,1,n;D
23、2=(Sqrtn)SqrtSum(dadak-mean)2,k,1,n;D=d1/d1;Y=Sqrtn*(d-0.28209479)/0.02998598;Result=Ifz1<y<z2,1,0;Returnresult;Ft运行该程序(运行程序前已将题给数据t输入),得ft的结果为1,表示通过正态检验。当然,我们可将程序中Ifz1<y<z2,1,0语句改为Ifz1<y<z2,Print“succeed”,Print“fail”来输入是否通过检验的信息。D检验的几个常用的临界值见表13.3表13.3 D检验的临界值表/n0.0050.0250.050.95
24、0.9750.995100-3.57 -2.54-2.071.141.311.59200-3.30-2.39-1.961.291.501.85500-3.04-2.24-2.851.421.672.111000-2.91-2.16-1.791.491.752.25练习14 用Mathmatica软件产生2000个标准正态分布的伪随机数(参见实验十二),用D检验的方法检验其正态性。2中心极限定理的检验下面我们来研究一个重要的中心极限定理。定理13.3(Liderberg_Levi) 设1,2,n,是一串相互独立相同分布的随机变量,且. Ei=m, D=2,对于标准化随机变量之和n=1/(i-m)
25、,在02时,有LimPn<x=1/2e-t2/2dt.我们先讨论相互独立的随机变量i(每个i服从二项分布b(k;20,0.1)(I=1,2,)之和的极限情况。已知Ei=m=2,Di=2=1.8,考虑标准化随机变量之和 n=1/(i-m). 对于固定的n,我们每次Mathematica软件模拟100个分布n的随机数,然后D用检验来判定其是否能通过正态分布检验.重复一定的次数,观测其能通过正态分布检验的比率.在下面的程序中,我们取n=30(程序中的number)<<StatisticsDisstributionsrndn_,p_:=RandomBionmialDistributionn,p;Cleark,c,a;Whole=25;number=30;s=0,c=0;Nn=20;pp=0.1;nu=nn*pp;sigma=Sqrtnn*(1-pp);Forj=1,j<=whole,j+,A=;ForI=1,I<=100,I+,s=(Sumrndnn,pp-nu,k,l,number);A=Appenda,s/(sigma*Sqrtnumber);C=c+fa;Pritc下面就是程序运行20 次得到的结果:24,25,23,23,21,24,25,23,24,24,24,24,24,23,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 工业园区照明节能措施
- 幼儿成长规划协议
- 药品库房作业指导书
- 农业仓库彩钢瓦搭建合同
- 临时演员参演动作片合同
- 住宅区电力供应办法
- 2024年金融理财产品售后服务保障协议3篇
- 2024年车厂出口业务合同2篇
- 外交团队管理促进国际合作
- 社交媒体经营部管理办法
- 扫描电子显微镜(SEM)-介绍-原理-结构-应用
- 北京市海淀区2024-2025学年七年级上学期期中考试英语试卷(含答案)
- 中资企业出海报告:潮涌浪阔四海扬帆
- 老旧小区改造室外消火栓工程施工方案和技术措施
- 《地质灾害监测技术规范》
- 2024-2030年中国云母制品制造市场发展状况及投资前景规划研究报告
- 2025年上半年内蒙古鄂尔多斯伊金霍洛监狱招聘17名(第三批)易考易错模拟试题(共500题)试卷后附参考答案
- 24秋国家开放大学《农产品质量管理》形考任务1-2+形考实习1-3参考答案
- 2024-2025学年人教版八年级上册地理期末测试卷(二)(含答案)
- 80、沈阳桃仙机场二平滑工程冬期施工方案
- 一年级数学练习题-20以内加减法口算题(4000道)直接打印版
评论
0/150
提交评论