大数定理与中心极限定理doc_第1页
大数定理与中心极限定理doc_第2页
大数定理与中心极限定理doc_第3页
大数定理与中心极限定理doc_第4页
大数定理与中心极限定理doc_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGEPAGE1大数定理与中心极限定理doc第一篇:大数定理与中心极限定理doc第五章:大数定律与中心极限定理一,切贝谢夫不等式:0,有pXEXDX2或PXEX1nDX2二,序列Xn依概率收敛于a;0,有limPXna1三,大数定理:设X1,X2,是相互独立的序列:EXi1、若均存在,且DXil,则有切贝谢夫定理.DXi1n1nPXiEXi10,有limnni1ni12、若:XBnp,即XXi1ni某事件发生的次数,则有XPp1贝努里大数定律;0,有limnn3、若Xi同分布,且EXia,则有辛钦大数定律1n0,有limPXia1nni1注:小概率原理四,中心极限定理:1、李亚普诺定理:相互独立(同分布)的和服从正态分布即:设X1,,Xn相互独立,则X2、拉普拉斯定理:若XBnp,i1n李说XiNE,XDX则paXpFbFa拉说例1、一个螺丝钉重量是个随机变量,期期望是1两,标准差是0.1两,求一盒(100)个同型号螺丝钉的重量超过10.2斤的概率?EXi1解:设Xi=“一个螺丝钉的重量”2DXi(0.1)0.01X“一盒螺丝钉的重量”100EXEXi100100李i1则XXiN(EX,DX)100i1DXDXi1000.011i1102100所求P(X102)1P(X102)1F(102)111(2)10.977250.022750例2.美、英战机向基地组织投弹100次,每次命中目标的炸弹数目是一个随机变量,期数学期望为2,方差为1.69。求在100次轰炸中有180颗到220XX弹命中目标的概率?EXi2解:设Xi=“第次命中目标得得炸弹数”DXi1.69X“100次命中得炸弹数”100EfEfi20XX00李i1则XXiN(EX,DX)其中100i1DfDfi169i1所求220XX0018020XX(180f220XXF(220XXF(180)1313(1.54)(1.54)2(1.54)10.87644例3.已知某电网10000盏灯,没盏开着得概率为0.7,求有6800—720XX灯开着得概率?解:设X“开着得灯数”EXinp7000则XB(10000,0.7)DXinpq45.83所求为:720XXnp6800npP(6800X720XXF(720XXF(6800)拉=2(4.36)10.99999例4.一批产品次品率为0.005,求10000件产品中的次品数不大于70的概率?解:设X“10000件中的次品数”EXinp50则XB(10000,0.005)7.053,拉70np所求为P(X70)F(70)(2.84)0.9977第二篇:第五章大数定理与中心极限定理第五章大数定律与中心极限定理§1大数定律概率论中用来阐明大量随机变量现象平均结果的稳定性的一系列定理统称大数定律。大数定律是一种表现必然性与偶然性之间的辨证关系的规律。由于大数定理的作用,大量的随机因素的总合作用必然导致某种不依赖个别随机事件的结果。为了证明一系列关于大数定律的定理,我们首先介绍切贝谢夫不等式。一、切贝谢夫不等式设随机变量X的数学期望为E(X)及方差D(X),若对于任意的正数,有下列不等式成立:即PXE(X)D(X)2,或PXE(X)1D(X)2。证设X是连续随机变量,其密度函数为f(x),则由P(XE(X))f(x)dxXE(X)(xE(x))2XE(x)2f(x)dx12(XE(X))f(x)dx2=D(X)2,所以有PXE(X)D(X)2。由对立事件,PXE(X)1D(X)2。切贝谢夫不等式的作用就在于在不知道分布,而仅知道期望和方差的情况下,可以估计随机变量的概率。例在每次试验中,事件A发生的概率为0.5。利用切贝谢夫不等式估计:在1000次试验中的事件。因为和式中的每一项都是非负数,所以如果扩大求和范围至随机变量X一切可能值xi,则只能增大和式的值。因此A发生的次数在450至550次之间的概率。解设X表示在1000次试验中事件A发生的次数,则X~B(1000,0.5)的二项分布,且有E(X)np500,D(X)npq250,P450X550=PX5005012505020.9450X550450500X500550500X50050,所以有P450X5500.9。特别是当3,则有PXE(x)30.8887,若知道X~N(,2)的正态分布,则有PXE(x)30.9974。二切贝谢夫大数定理设Xn为独立随机变量序列,具有有限的期望为EXi,(i1,2,,n)及方差DXi2,(i1,2,,n)若对于任意的正数,恒有1limPnnni1Xinni11E(Xi)1。或limPnnni1Xinni1E(Xi)0.证因为E(11nni1nXi)1nnEXii1,D(nXi)ni11nnDXii1n。对随机变量Xi应用切贝谢夫不等式得ni1n1Pni1Xi1nnEXii112n。当n时,得到1limPnn1limPnnni1nXi1n1ni1nEXi1。但概率不能大于一,所以我们有1。XinEXii1i1切贝谢夫定理的意义可以作如下解释:独立随机变量X1,X2,,Xn的算术平均值X1nni1Xi,当n时,与其真值是相同的。推论设独立随机变量X1,X2,,Xn服从同一分布,并且有数学期望a及方差2,则X1,X2,,Xn的算术平均值,当n时,按概率收敛于数学期望a,即对于任何正数,恒有1limPnnni1Xia1。(5.4)三、贝努里大数定律在n次独立试验中,事件A发生的频数为nA,P(A)p,P(A)q,0p1nAlimPp当试验次数无限增大时(n),频率按概率收敛于它的概率。即n1。nn证设在第i次试验中事件A发生的次数Xi(i1,2,,n,)。由贝努里试验知,X1ni1,2,,n。EAnnnXi,i1EXip,DXipq,EXii1nnpnp,i11n又DA2nnni1pqp(1p)nnn2Pp1所以有由切贝谢夫不等式,则有AlimPp1。这就在理论上证明了频率收敛于概率,也就是我们在第一章中用频率nnn来代替概率计算的理论根据。§2中心极限定理概率论中有关论证明随机变量和的极限分布是正态分布的一系列定理,叫做中心极限定理。一、独立同分布中心极限定理设X1,X2,,Xn,是独立同分布的随机变量,具有有限的期望EXi,及方差D(Xi)2nnni1,2,,n。设随机变量nnnni1Xi,则有Eni1n,Dni1n。设n,En0,Dn1。若对任意的实数x,有limPnxn12xetdt,当n时,有nN(0,1)标准正态分布。二、棣莫佛-拉普拉斯中心极限定理设随机变量n(n1,2,)服从参数为n,p(0p1)的二项分布,对任意的区间(a,b),恒有limPannnpnpqnb12abetdt(b)(a)。证:设ni11,第i次A发生Xi,而Xi0,第i次A不发生,EXip,DXipq,i1,2,,n将随机变量n(n1,2,)标准化,YnnnpxlimPnnpqxtnnpnpq,则由独立同分布中心极限定理,有edt(x),tnnpb若对任意的区间(a,b)有limPannpq12aebdt。更一般地Px1Xx2Px1npnpqXnpnpqx2npx1npx2np()(),npqnpqnpq称这个公式为棣莫佛-拉普拉斯中心极限定理。例某运输公司有500辆汽车参加保险,在一年内汽车出事故的概率为0.006,参加保险的汽车每年交800元的保险费,若出事故最多可得保险费50000元,求在一年内保险公司赚钱不小于20XX0元的概率。解设X表示500辆汽车中出事故的车辆数,则X~B(500,0.006)的二项分布,而np5000.0063,npq30.9942.982,保险公司赚钱不小于20XX0元的事件X4,即求P(0X4),12.98232.982)50080050080050000X20XX0032.982X32.982事件0因此P(0X4)P43(2.982)(=(0.579)(1.737)0.7190.959110.7781.所以保险公司赚钱不小于20XX0元的概率为0.7781。例假设生产线上组装每件成品的时间服从指数分布,统计资料表明该生产线每件成品的组装时间平均为10分钟,各件产品的组装时间相互独立。(1)试求组装100件成品需要15至20XX的概率;(2)以95%的概率在16小时之内最多可以组装多少成品?解设Xi(i1,2,,100)是第i件成品的组装时间,由条件知:X1,,X100服从独立指数分布,且EXi10(分钟),DXi102(1)由于n100充分大,根据中心极限定理定理,100件成品的组装时间Xi近似服从i1正态分布N(10010,100102),因此,有Xi120XXP1P900i1Xi1001010i12(2)(1)0.9772(10.8413)0.8185其中9001560,120XX20XX0,(x)是N(0,1)分布函数。(2)16小时即960分钟,要求确定n,使nPXi9600.95i1n由于当n充分大时,Xi近似服从正态分布N(10n,102n),可见i1NxI10n96010n96010ni10.95Pn10n10n另一方面,查表可求(1.645)0.95于是,有96010n10n1.645(*)由此,得方程100n219470.6025n96020其解为n181.18,n2113.53,其中n2不满足(*),为增根。于是,在16个小时之内以概率0.95最多组装81或82件产品。习题五、2;4;6;9;13;15。第三篇:第五章大数定理及中心极限定理0.***4第五章大数定理及中心极限定理一、选择题1.已知的Xi密度为f(xi)(i1,2,,100),且它们相互独立,则对任何实数x,概率P{Xii1100x}的值为(C).100A.无法计算B.xixi1100[f(xi)]dx1dx100i1C.可以用中心极限定理计算出近似值D.不可以用中心极限定理计算出近似值2.设X为随机变量,EX,DX2,则P{|X|3}满足(A).A.B.C.D.13193.设随机变量X1,X2,,X10相互独立,且EXi1,DXi2(i1,2,,10),则(C)A.P{Xi1}1B.P{Xi1}122i110i11010C.P{Xi10}120XX.P{Xi}120XX22i1i14.设对目标独立地发射400发炮弹,已知每发炮弹的命中率为0.2由中心极限定理,则命中60发~100发的概率可近似为(C).A.(2.5)B.2(1.5)1C.2(2.5)1D.1(2.5)5.设X1,X2,,Xn独立同分布,EXi,DXi2,i1,2,,n,当n30时,下列结论中错误的是(C).A.Xi近似服从N(n,n2)分布i1nnXin近似服从N(0,1)分布C.X1X2服从N(2,22)分布D.Xi不近似服从N(0,1)分布i1n6.设X1,X2,为相互独立具有相同分布的随机变量序列,且Xii1,2,服从参数为2的指数分布,则下面的哪一正确?(D)nnXn2XniiA.limPxx;B.limPxx;nnnnX2X2iiC.limPxx;D.limPxx;nn其中x是标准正态分布的分布函数.二、填空题1、设n是n次独立重复试验中事件A出现的次数,P(A)p,q1p,nnp[a,b]则对任意区间有limPab=nnpq2、设n是n次独立重复试验中事件A出现的次数,p是事件A在每次试验中发生的概率,则对于任意的0,均有limP|np|=.nn3、一颗骰子连续掷4次,点数总和记为p(10X18)X,估计4、已知生男孩的概率为0.515,求在1000个新生婴儿中女孩不少于男孩的概率=.第四篇:04第四节大数定理与中心极限定理第四节大数定理与中心极限定理概率论与数理统计是研究随机现象统计规律性的学科.而随机现象的规律性在相同的条件下进行大量重复试验时会呈现某种稳定性.例如,大量的抛掷硬币的随机试验中,正面出现频率;在大量文字资料中,字母使用频率;工厂大量生产某种产品过程中,产品的废品率等.一般地,要从随机现象中去寻求事件内在的必然规律,就要研究大量随机现象的问题.在生产实践中,人们还认识到大量试验数据、测量数据的算术平均值也具有稳定性.这种稳定性就是我们将要讨论的大数定律的客观背景.在这一节中,我们将介绍有关随机变量序列的最基本的两类极限定理大数定理和中心极限定理.内容分布图示★大数定理的引入★切比雪夫不等式★例1★例2★大数定理★中心极限定理的引入★林德伯格—勒维定理★例3★例6★推论大数定理★棣莫佛—拉普拉斯定理★例4★例5★例7★例8★高尔顿钉板试验中心极限定理★内容小结★课堂练习★习题4-4内容要点:一、依概率收敛与微积分学中的收敛性的概念类似,在概率论中,我们要考虑随机变量序列的收敛性.定义1设X1,X2,,Xn,是一个随机变量序列,a为一个常数,若对于任意给定的正数,有limP{|Xna|}1,则称序列X1,X2,,Xn,依概率收敛于a,记为nXnaP(n).PP定理1设Xna,Ynb,又设函数g(x,y)在点(a,b)连续,则g(Xn,Yn)g(a,b).P二、切比雪夫不等式定理2设随机变量X有期望E(X)和方差D(X)2,则对于任给0,有P{|X|}22.上述不等式称切比雪夫不等式.注:(i)由切比雪夫不等式可以看出,若2越小,则事件{|XE(X)|}的概率越大,即,随机变量X集中在期望附近的可能性越大.由此可见方差刻划了随机变量取值的离散程度.(ii)当方差已知时,切比雪夫不等式给出了X与它的期望的偏差不小于的概率的估计式.如取3,则有P{|XE(X)|3}9220.111.故对任给的分布,只要期望和方差2存在,则随机变量X取值偏离E(X)超过3的概率小于0.111.三、大数定理1.切比雪夫大数定律定理3(切比雪夫大数定律)设X1,X2,,Xn,是两两不相关的随机变量序列,它们数学期望和方差均存在,且方差有共同的上界,即D(Xi)K,i1,2,,则对任意0,有1limPnnni1Xi1nni1E(Xi)11nn注:定理表明:当n很大时,随机变量序列{Xn}的算术平均值学期望2.伯努利大数定理1nni1Xi依概率收敛于其数E(X).ii1定理4(伯努利大数定律)设nA是n重伯努利试验中事件A发生的次数,p是事件A在每次试验中发生的概率,则对任意的0,有nnlimPAp1或limPAp0.nnnn注:(i)伯努利大数定律是定理1的推论的一种特例,它表明:当重复试验次数n充分大时,事件A发生的频率nAn依概率收敛于事件A发生的概率p.定理以严格的数学形式表达了频率的稳定性.在实际应用中,当试验次数很大时,便可以用事件发生的频率来近似代替事件的概率.(ii)如果事件A的概率很小,则由伯努利大数定律知事件A发生的频率也是很小的,或者说事件A很少发生.即“概率很小的随机事件在个别试验中几乎不会发生”,这一原理称为小概率原理,它的实际应用很广泛.但应注意到,小概率事件与不可能事件是有区别的.在多次试验中,小概率事件也可能发生.3.辛钦大数定理定理5(辛钦大数定律)设随机变量X1,X2,,Xn,相互独立,服从同一分布,且具有数学期望E(Xi),i1,2,,则对任意0,有1limPnnni1Xi1.注:(i)定理不要求随机变量的方差存在;(ii)伯努利大数定律是辛钦大数定律的特殊情况;(iii)辛钦大数定律为寻找随机变量的期望值提供了一条实际可行的途径.例如,要估计某地区的平均亩产量,可收割某些有代表性的地块,如n块,计算其平均亩产量,则当n较大时,可用它作为整个地区平均亩产量的一个估计.此类做法在实际应用中具有重要意义.四、中心极限定理在实际问题中,许多随机现象是由大量相互独立的随机因素综合影响所形成,其中每一个因素在总的影响中所起的作用是微小的.这类随机变量一般都服从或近似服从正态分布.以一门大炮的射程为例,影响大炮的射程的随机因素包括:大炮炮身结构的制造导致的误差,炮弹及炮弹内炸药在质量上的误差,瞄准时的误差,受风速、风向的干扰而造成的误差等.其中每一种误差造成的影响在总的影响中所起的作用是微小的,并且可以看成是相互独立的,人们关心的是这众多误差因素对大炮射程所造成的总影响.因此需要讨论大量独立随机变量和的问题.中心极限定理回答了大量独立随机变量和的近似分布问题,其结论表明:当一个量受许多随机因素(主导因素除外)的共同影响而随机取值,则它的分布就近似服从正态分布.1.林德伯格—勒维定理定理6(林德伯格—勒维)设X1,X2,,Xn,是独立同分布的随机变量序列,且E(Xi),D(Xi),i1,2,,n,2则nXini1limPxnnx12et2/2dt注:定理6表明:当n充分大时,n个具有期望和方差的独立同分布的随机变量之和近似服从正态分布.虽然在一般情况下,我们很难求出X1X2Xn的分布的确切形式,但当n很大时,可求出其近似分布.由定理结论有ni1Xinn1近似n~N(0,1)ni1Xin近似/~N(0,1)X~N(,22/n),X1nni1Xi.故定理又可表述为:均值为,方差的0的独立同分布的随机变量X1,X2,,Xn,的算术平均值X,当n充分大时近似地服从均值为,方差为2/n的正态分布.这一结果是数理统计中大样本统计推断的理论基础.2.棣莫佛—拉普拉斯定理在第二章中,作为二项分布的正态近似,我们曾经介绍了棣莫佛—拉普拉斯定理,这里再次给出,并利用上述中心极限定理证明之.定理7(棣莫佛—拉普拉斯定理)设随机变量Yn服从参数n,p(0p1)的二项分布,则对任意x,有YnnplimPxnnp(1p)x12et22dt(x)注:易见,棣莫佛—拉普拉斯定理就是林德伯格—勒维定理的一个特殊情况.3.用频率估计概率的误差设n为n重贝努里试验中事件A发生的频率,p为每次试验中事件A发生的概率,q1p,由棣莫佛—拉普拉斯定理,有nPpPnnpqnnpnpqnpqn1.pqnpqn2pq这个关系式可用解决用频率估计概率的计算问题:4.李雅普诺夫定理定理8(李雅普诺夫定理)设随机变量X1,X2,,Xn,相互独立,它们具有数学期望n和方差:E(Xk)k,n时,D(Xk)2k0,i1,2,,记B2n.若存在正数,使得当k12k1Bn2nnE{|k1Xkk|2}0,则随机变量之和Xk的标准化变量:k1nZnk1nXkEXkk1DXkk1nnnkXk1Bnk1k的分布函数Fn(x)对于任意x,满足nnXkkk1k1limFn(x)limPxnnBnx12et/22dt(x).注:定理8表明,在定理的条件下,随机变量nnZnk1XkBnk1k.nn当n很大时,近似地服从正态分布N(0,1).由此,当n很大时,XkBnZnk近似地服k1k1n2.这就是说,无论各个随机变量Xk(k1,2,)服从什么分布,只要满从正态分布N,Bknk1n足定理的条件,那么它们的和Xk当n很大时,就近似地服从正态分布.这就是为什么正态随k1机变量在概率论中占有重要地位的一个基本原因.在很多问题中,所考虑的随机变量可以表示成很多个独立的随机变量之和,例如,在任一指定时刻,一个城市的耗电量是大量用户耗电量的总和;一个物理实验的测量误差是由许多观察不到的、可加的微小误差所合成的,它们往往近似地服从正态分布.例题选讲:切比雪夫不等式例1(讲义例1)已知正常男性成人血液中,每一毫升白细胞数平均是7300,均方差是700.利用切比雪夫不等式估计每毫升白细胞数在520XX9400之间的概率.解设每毫升白细胞数为X,依题意,7300,27002,P{520XXX9400}P{520XX7300X730094007300}P{2100X2100}P{|X|2100}.所求概率为由切比雪夫不等式P{|X|2100}1222/(2100)1(700/2100)11/98/9,即每毫升白细胞数在520XX~9400之间的概率不小于8/9.例2在每次试验中,事件A发生的概率为0.75,利用切比雪夫不等式求:事件A出现的频率在0.74~0.76之间的概率至少为0.90?解设X为次试验中,事件A出现的次数,则X~b(n,0.75),0.75n,20.750.25n0.1875n,所求为满足P{0.74X/n0.76}0.90的最小的n.P{0.74X/n0.76}可改写为P{0.74nX0.76n}P{0.01nX0.75n0.01n}P{|X|0.01n}在切比雪夫不等式中取0.01n,则P{0.74X/n0.76}P{|X|0.01n}122/(0.01n)210.1875n/0.0001n11875/n依题意,取n使11875/n0.9,解得n1875/(10.9)1875,0即n取18750时,可以使得在n次独立重复试验中,事件A出现的频率在0.74~0.76之间的概率至少为0.90.中心极限定理例3(讲义例2)一盒同型号螺丝钉共有100个,已知该型号的螺丝钉的重量是一个随机变量,期望值是100g,标准差是10g,求一盒螺丝钉的重量超过10.2kg的概率.解设为第i个螺丝钉的重量,i1,2,,100,100且它们之间独立同分布,于是一盒螺丝钉的重量为XXi1i,且由E(Xi)100,D(Xi)10,n100,知E(X)100E(Xi)10000,由中心极限定理有P{X1020XXPnD(X)100,i1Xinn1020XXnX10000pn1001020XX10000100X10000X10000P21P21001001(2)10.977250.02275.例4(讲义例3)计算机在进行数学计算时,遵从四舍五入原则.为简单计.现在对小数点后面第一位进行舍入运算,则误差X可以认为服从[0.5,0.5]上的均匀分布.若在一项计算中进行了100次数字计算,求平均误差落在区间[3/20XX/20XX的概率.解n100,用Xi表示第i次运算中产生的误差.相互独立,都服从[0.5,0.5]上的均匀分布,X1,X2,,X100且E(Xi)0,var(Xi)1/12,i1,2,,100,从而Y100100i1Xi1000100/1235100i1近似Xi~N(0,1).故平均误差X1100100i133,Xi落在20XX上的概率为3331PXP20XX0020XX20XX0i1Xi320XX3P35100i1Xi3(3)(3)0.9973.例5(讲义例4)某公司有20XX员工参加一种资格证书考试.按往年经验考试通过率为0.8,试计算这20XX员工至少有150人考试通过的概率.解1,令10,第i人通过考试第i人未通过考试,i1,2,,20XX依题意,P{Xi1}0.8,np20XX0.8160,np(1p)32.20XX1Xi是考试通过人数,由中心极限定理4,得P{XiX160/32~N(0,1),150}P{X160/32}150160/20XX似i1i20XXi32P{20XX1Xi160/321.77}1(1.77)(1.77)0.96,即至少有150名员工通过这种考试的概率为0.96.例6(讲义例5)某市保险公司开办一年人身保险业务,被保险人每年需交付保险费160元,若一年内发生重大人身事故,其本人或家属可获2万元赔金.已知该市人员一年内发生重大人身事故的概率为0.005,现有5000人参加此项保险,问保险公司一年内从此项业务所得到的总收益在20XX40万元之间的概率是多少?解记Xi1,若第i个被保险人发生重大事0,若第i个被保险人未发生重大故事故(i1,2,,5000)于是Xi均服从参数为p0.005的两点分布,且p{Xi1}0.005,np25.5000i1Xi是5000个被保险人中一年内发生重大人身事故的人数,保险公司一年内从此5000i1项业务所得到的总收益为0.01650002于是Xi万元.5000P20XX.01650002Xi40P20XXi15000i1Xi30P20XX5250.9955000i1Xi25250.995(1)(1)0.6826250.9953025例7对于一个学校而言,来参加家长会的家长人数是一个随机变量,设一个学生无家长,1名家长,2名家长来参加会议的概率分别0.05,0.8,0.15.若学校共有400名学生,设各学生参加会议的家长数相互独立,且服从同一分布.求参加会议的家长数X超过450的概率.解以Xk(k1,2,,400)记第k个学生来参加会议的家长数,则Xk的分布律为Xkpk00.0510.820XX5400易知E(Xk)1.1,D(Xk)0.19,k1,2,,400,而XXk1k,由定理3,随机变量400Xk1k4001.1X4001.14000.190.19近似~400N(0,1),故X4001.14504001.1P{X450}P4000.194000.19X4001.11P1.1474000.191(1.147)0.1357.例8设有1000人独立行动,每个人能够按时进入掩蔽体的概率为0.9.以95%概率估计,在一次行动中,至少有多少人能进入掩蔽体.解用Xi表示第i人能够按时进入掩蔽体,令SnX1X2X1000.设至少有m人能进入掩蔽体,则要求P{mSn}0.95,Sn90090{mSn}m10000.910000.90.1Sn90090近似由中心极限定理,有~N(0,1),所以m900Sn900S900m900P{mSn}Pn1P90909090查正态分布数值表,得m900901.65,故m90015.65884.35884人.课堂练习某地有甲、乙两个电影院竞争当地每天的1000名观众,观众选择电影院是独立的和随机的.问:每个电影院至少应设有多少个座位,才能保证观众因缺少座位而离去的概率小于1%?第五篇:第四章大数定律与中心极限定理第四教学目的:大数定律与中心极限定理1.使学员理解随机变量序列依概率收敛、按分布收敛的含义,知道两种收敛的关系,理解连续性定理的意义。2.使学员牢固掌握马尔科夫大数定律、辛钦大数定律及其证明、理解契贝晓夫、贝努力里大数定律的意义。3.使学员能熟练应用DeMoivre-Laplace中心极限定理作近似计算及解决生产、生活中的实际问题。4.使学员掌握、独立同分布场合下的Lindeberg-Leve中心极限定理的证明及应用,知道德莫佛—拉斯定理是其特例。本课程一开始引入事件与概率的概念时,我们就知道就一次试验而言,一个随机事件可以出现也可不出现,但作大量的重复试验则呈现出明显的规律性——统计规律性。即,任一事件出现的频率是稳定于某一固定数的,这固定数就是该事件在一次试验下发生的概率,这里说的“频率稳定于概率”实质上是频率依某种收敛意义趋于概率,“大数定律”就是解释这一问题的。另外在前一章介绍正态分布时,我们一再强调正态分布在概率统计中的重要地位和作用,为什么实际上有许多随机现象会遵循正态分布?这仅仅是一些人的经验猜测还是确有理论依据,“中心极限定理”正是讨论这一问题的。§4.2*随机变量序列的两种收敛性假设1(),2(),,n(),是定义在同一概率空间(,F,P)上的一列随机变量,显然,其中每个r.v,k()可以看成是定义在概率空间上的一个有限可测函数,因此,我们*§4.2使用的是原教材的编号,是方便学员看书复习。可以象在实变函数论中对可测函数列定义收敛性一样,给出随机变量列{k()}的收敛性概念。以下我们讨论时,总假定r.v列{n}和r.v.都是定义在同一概率空间(,F,P)上的,对于某样本点0,显然{n(0)}可视为一普通实数列,(0)则可看作一实数,此时若有limn(0)(0),则称随机变量列{n}在点0收敛到。若对任意,均有nlimn()(),则称{n}在上点点收敛到。但在本章的讨论中,我们没有必n要对{n}要求这么高,一般是考虑下面给出的收敛形式。定义4.2设有一列随机变量,1,2,,如对任意的>0,有limP{:n()()}0(4.6)n则称{n}依概率收敛到,并记作4.6limnPnP,4.6或n(4.6)式也等价于limP{n}}0n从定义可见,依概率收敛就是实函中的依测度收敛。时,其相我们知道,随机变量的统计规律由它的分布函数完全刻划,当n应的分布函数Fn(x)与F(x)之间的关系怎样呢?例4.2设n(n1)及都服从退化分布:P1P{n}1,n1,2,nP{0}1对任给>0,当n>1时,有P{n}P{n}02,(n)所以nP10n而n的d.f为Fn(x)1x1nx的d.f为F(x)01x0x0易验证当x0时,有Fn(x)→F(x)(n→)但x0时,Fn(0)1不趋于F(0)0上例表明,一个随机变量依概论收敛到某随机变量,相应的分布函数不是在每一点都收敛,但如果仔细观察这个例,发现不收敛的点正是F(x)的不连续点,类似的例子可以举出很多,使人想到要求Fn(x)在每一点都收敛到F(x)是太苛刻了,可以去掉F(x)的不连续点来考虑。定义4.3设{Fn(x)}为一分布函数序列,如存在一个函数F(x),使在F(x)的每一连续点x,都有limFn(x)F(x)n则称分布函数列{Fn(x)}弱收敛于F(x),并F(x)n(4.7)记作Fn(x)定义4.3设r.v.n(n1)和的分布函数分别为Fn(x),F(x),若WLFn(x)F(x)n,则称n按分布收敛于,并记作n(n)W,则n定理4.4若n证对于xR,任取xx,因有PL(x)(nx,x)(nx,x)(nx)(nx,x)故P(x)P(nx)P(nx,x)即F(x)Fn(x)P(nxx),故P(nxx)0因n所以有F(x)limFn(x)nP同理可证,对xx有F(x)limFn(x)n于是对任意xxx有F(x)limFn(x)limFnF(x)nn令xx,xx,有F(x0)limFn(x)limFnF(x0)nn若x是F(x)的连续点,就有limFn(x)F(x)。证毕。此定理的逆不真。n例4.3抛掷一枚均匀硬币,记1=“出现正面”,2=“出现反面”则P(1)P(2)1211令n()n=1,2,„„02()10211因Fn(x)与F(x)完全相同,显然有Fn(x)→F(x)对xR成立。但P{n12}P(n0,1)P(n1,1)=P11111。对n1成立22222不成立。∴n一般来说,按分布收敛不能推出依概率收敛,但在特殊情况下,却有下面的结果。n,定理4.5设C是一常数,P(C)1,则n(即n,CnC)PLPL证()由定理4.1推得()(不妨就设C)对任给0,有P{nC}P(nC)P(nC)1Fn(C)Fn(C0)(4.8)因C的分布函数为0xCWF(x)F(x)只在xc处不连续,而c处都是连续的,由Fn(x)1xC在((4.8)中令n得limP(nc)1100n本章将要向大家介绍的大数定律实际上就是随机变量列依概率收敛于常数的问题,由定理4.5知,它可归结为相应的分布函数列弱收敛于一退化分布,而中心极限定理就是随机变量的分布函数列弱收敛问题,可见分布函数列的弱收敛在本章讨论中占重要地位。然而,要直接判断一个分布函数列是否弱收敛是很困难的上一章我们就知道,分布函数与特征函数一一对应,而特征函数较之分布函数性质优良很多,故判断特征函数的收敛一般较易,那么是否有WFnxF(x)相应的n(t)(t)答案是肯定的。定理4.6分布函数列{Fn(x)}弱收敛于分布函数F(x)的充要条件是相应的特征函数列{n(t)}收敛于F(x)的特征函数(t)例4.4若~P()证明1limP(x)2xet22dt随机变量到依pr收敛具有如下性质。a,nb定理4.7(斯鲁茨基)若nPP则有(1)nPnab(2)b0时,nPanbP,f(x)为连续函数书P220XX4.8nf()(4.9)则有f(n)P§4.1大数定律本章一开始我们就指出大数定律是从讨论“频率稳定于概率”这件事引入的,概率的发展史上,这件事又是从贝努里试验这个概型入手的。设事件A在一次试验中发生的概率为P,将试验独立重复地进行n次,如果其中事件A发生的次数为n,则nn就是这n次试验中事件A发生的频率。所谓频率nn稳定到概率P,是指当n增大时,敛。nn依某种收敛意义向P逼近。很容易验证,这里的收敛意义不是普通的收limnnnP(4.1)事实上,(4.1)意味着,对任给0,能找到N,当nN时,有nnP4.1我们知道,在n重贝努里试验中,不管n多大,{A出现n次}这一结果都是可能发生的,当这个结果发生时,nn,即nnP1P,因此,对于01P,不管N取多大,nP不发生的可n也不能保证nN时(4.1)′成立。但可以想见,当n很大时,6能性很小了,比如PnP1Pn0(n)。于是猜想可能有nP。这个猜想nn是正确的,其证明暂放后一步。现不妨先承认有事实nnPP(4.2)若令k1,第k次试验A发生k1,2,0,第k次试验A不发生则(4.2)意味着1n1nPkE(k)nk1nk1上式反映出大量随机现象的平均结果具有的一种稳定性,我们称之为大数定律。k为一随机变量序列,它们具有有限的数学期望Ek,k1,2。定义4.1,设1nPPEn(或(nEn)k服从大令nk,若n,则称随机序列0)nk1数定律。下面的定理给出随机序列服从大数律的一个充分条件。k是一列两两不相关的随机变量序列,其中每一随定理4.1(契贝晓夫大数定律)设机变量都有有限的数学期望和方差,且方差有公共上界:DkC,(C为常数);K1,2,k服从大数定律。则证明:只须证,对任给0,均有1n1nP{kEk}0(0)(4.3)nk1nk1由契贝晓夫不等式1n1n0PkEknk1nk1下面我们来证明(4.2)式1nD(k)nk12Cn2(n)0定理4.2(贝努里大数定律)设n是n重贝努重试验中事件A出现的次数,每次试验都有P(A)P,则nnPP。k,则EkP,DkP(1P)[证明]照(4.2)定义随机序列1,k1,2,4k服从大数律,因此由定理4.1知,k1nkPEkk1nnn,这就是nnPP,k服从大上面所述的两个大数定律,后一个是前一个的特款,从定理4.1的证明看出,数律的一个充分条件是D(k)k12nn0(n)(4.4)(4.4)所示的条件常称为马尔可夫条件,由此得如下的马尔可夫大数定律(书P222习题4.23)k满足(4.4)所示的马尔可夫条件,则它服从大数定律。若随机变量序列证:对任给0,由契贝晓夫不等式,有1n1n0PkEknk1nk1D(k)nk122n再由(4.4)立得结论。k相互独立的条件。另方面,显然定理4.1我们注意到,马尔可夫大数律并没有附加又是它的特款。因此,上面所述的三个大数定律,马尔可夫大数律才是最基本的,当然,它的条件也是充分而非必要的。我们还注意到上面的三个大数定律,其证明都要依靠契贝晓夫不等式,所以要求随机变量的方差存在。但进一步的研究表明,方差存在这个条件并不一定必要。比如在独立同分布的场合,就可去掉这个条件。著名的俄国数学家XИНЧИН证明了这点。定理4.3(辛钦大数定律)设k为相互独立,同分布的随机序列,具有有限的数学期望Eka(a为常数),则k服从大数定律。证:因1,2,同分布,故有相同的特征函数(t),又Eka在t=0处展开,有(0)i,将(t)(t)(0)(0)t0(t)1iat0(t)1n由1,2,相互独立,得nk的特征函数为nk1tttgn(t)[()]n[1ia0()]nnnnttnL1iata,再由定对于任意tR,limgn(t)lim[1ia0()]e,由定理4.6知nnnnna,即k服从大数定理。理4.5得nP贝努里大数定律显然是辛钦大数定律的特款。k为独立同分布随机变量序列,存在Ena,Dn,令例4.1设21n1n2nk,Sn(kn)2nk1nk1证明Sn2P2ki·证:i·d则{n}亦i·i·d21n2Pa,k(2a2)由辛钦大数律nnk1Pa由(4.9),(n)2P21n2P2由斯鲁茨基定理Sk(n)2(4.5)nk12n§4.3中心极限定

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论