随机变量的概率分布与数字特征_第1页
随机变量的概率分布与数字特征_第2页
随机变量的概率分布与数字特征_第3页
随机变量的概率分布与数字特征_第4页
随机变量的概率分布与数字特征_第5页
已阅读5页,还剩58页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

随机变量的概率分布与数字特征第1页,共63页,2023年,2月20日,星期二一、随机变量的概念在第一章,我们介绍了随机事件及其概率,可以看到很多事件都可采取数值标识。如抽检产品时出现的废品个数;掷骰子出现的点数等。对那些非数值标识的事件,实际上也可人为地加以数值标识。例如,对新生儿的性别,可用0表示女,1表示男;对生化检验的结果,可用0表示阴性,1表示阳性;对生产的产品,可用2表示优质品,1表示次品,0表示废品等。因此,随机试验的结果可用一个变量来表示,这种随试验结果不同取不同数值的变量称为随机变量。第2页,共63页,2023年,2月20日,星期二二、离散型随机变量及其概率分布1、定义:按一定概率取有限个或可列个值的随机变量,称为离散型随机变量。设X所有可能取值为(i=1,2,…)称为离散型随机变量X的概率函数或分布律。也可用表格来表示(称为概率分布表或分布列)2、概率函数(分布律)X第3页,共63页,2023年,2月20日,星期二性质:(1)

(2)(i=1,2,…)例设随机变量X的分布律为(k=1,2,3,4,5),求:(1)P(X=1或X=2)(2)解(1)P(X=1或X=2)=P(X=1)+P(X=2)=1/15+2/15=1/5(2)=P(X=1)+P(X=2)+P(X=3)=1/15+2/15+3/15=2/5第4页,共63页,2023年,2月20日,星期二三、离散型变量的几种常见分布1、伯努利概型试验只有两种可能结果:A及,把这个试验独立重复n次,就构成了n重伯努利试验,简称伯努利试验。设P(A)=p=1-p=q(其中0<p<1),记B={n重贝努利试验中事件A出现k次}则定理(伯努利公式)(k=0,1,…n)第5页,共63页,2023年,2月20日,星期二例1某药治某病的治愈率为p,现用此药治该病5例,问治愈3例的概率是多少?例2袋中装有白球20个和黑球10个,每次抽一个:(1)作有放回抽取5次,求抽到白球3次的概率;(2)作无放回抽取5次,求抽到白球3次的概率。解治5例病人,看成做5次独立的试验。每次试验只有A={治愈}和={未治愈}两个结果。且P(A)=p则这个试验是5重的伯努利试验设B={治愈3例}={A出现3次}所以第6页,共63页,2023年,2月20日,星期二解(1)有放回抽球,可看成每次试验是独立的,属于伯努利试验,令A={抽到白球}且P(A)=2/3故(2)无放回抽球,说明每次试验间不独立,因此不属伯努利试验,应看成古典概型。无放回抽5次,可看成一次抽5个球,由古典公式得第7页,共63页,2023年,2月20日,星期二2、二项分布(1)若随机变量X的概率函数为(k=0,1,…n),q=1-p(2)性质则称X服从二项分布,记为由于各概率函数值正好是二项式展开式中的对应各项,故名二项分布。第8页,共63页,2023年,2月20日,星期二例3设,求P(X=4),P(2<X<6)。解因为所以X的概率函数为k=0,1,…,20故用查表法计算较简便=0.79392—0.19579=0.59813第9页,共63页,2023年,2月20日,星期二遇到二项分布中概率p>0.5时,不能直接查表但可以转化为其对立事件的概率计算。设X代表A出现次数,Y代表出现次数,则X+Y=n且例4X~B(10,0.7),求解第10页,共63页,2023年,2月20日,星期二(3)二项分布的最可能值:使P(X=k)取最大值的k值。即n重伯努利试验中事件A最可能出现的次数。结论:若(n+1)p为整数,则和若(n+1)p为非整数,则例5有10%的人对某药有肠道反应,为考察此药的质量,现随机选5人服用此药,试求:(1)其中k(k=0,1,…,5)个人有反应的概率;(2)不多于2人有反应的概率;(3)有人有反应的概率。第11页,共63页,2023年,2月20日,星期二解:随机选5人服药,各人间对药物的反应具有独立性,且每人服药后有反应的概率均为视为0.1,这相当于做5次独立重复试验,即p=0.1,n=5的伯努利试验。因而反应的人数X~B(5,0.1)(1)k个人有反应的概率为(k=0,1,…,5)概率分布表如下X012345P(X=k)0.590490.328050.072900.008100.000450.00001第12页,共63页,2023年,2月20日,星期二(2)不多于2人有反应的概率为=0.9045+0.32805+0.0729=0.99144(3)有人有反应的概率为3、泊松分布(稀有事件模型)在很多实际问题中,n重伯努利试验中的n往往很大,p很小,则试验结果A出现的次数X,可看成泊松分布。正是因为结果A在n次试验中出现的次数非常少,故A可看作稀有事件。第13页,共63页,2023年,2月20日,星期二(k=0,1,2….)其中参数(1)概率函数(2)性质服从泊松分布的随机变量在实际中是很多的,例如三胞胎出生次数,癌症发病人数,放射的粒子个数,特大洪水发生的年数,抽检大量产品中出现次品的件数,等等。第14页,共63页,2023年,2月20日,星期二(3)泊松定理在n重伯努利试验中,事件A在一次试验中出现的概率为p。若,np也较小,则令=np有(k=0,1,2,…)从定理也可看出,事件A发生的次数X若服从参数为的泊松分布,则表示A在大量试验中发生的平均次数。第15页,共63页,2023年,2月20日,星期二例6已知某厂生产的针剂的废品率为0.01,400支针剂中,废品至少有5支以上的概率是多少?解:设400支针剂中废品数为X,检查400支针剂看成做400次独立重复试验,即n=400;每次试验结果为废品或正品,抽到废品的概率即p=0.01则X~B(400,0.01),可近似看成泊松分布第16页,共63页,2023年,2月20日,星期二例7某人在一次试验中遇到危险的概率是1%,如果他在一年里每天都要独立重复做一次这样的试验,那么他在一年中至少遇到一次危险的概率是多少?解:此人做的试验可看成伯努利试验,n=365,每次试验遇到危险的概率p=0.01设他在一年中遇到危险的次数为X,则X~B(365,0.01)因为n很大,p较小,可近似看成泊松分布第17页,共63页,2023年,2月20日,星期二4、两点分布(0-1分布)(k=0,1)Xpi01p1-p=q可以看出,两点分布即为二项分布中n=1的特殊情况。例8一批产品共100件,其中有95件正品,5件废品,从中任取一件,观察产品质量.若其结果用随机变量X来描述,求X的概率函数。解:设抽到正品,X=1;抽到废品,X=0则X的分布律为X01P第18页,共63页,2023年,2月20日,星期二5、几何分布(k=1,2,…)引例进行重复独立实验,设每次成功的概率为p,将实验进行到出现一次成功为止,以X表示所需实验的总次数,求X的分布律。6、超几何分布引例设有N件产品,其中有M件正品,现任取n件,求n件中恰有k件正品的概率。(以X表示n件中的正品数)k=0,1,2,…,l,其中l=Min(M,n)第19页,共63页,2023年,2月20日,星期二四、分布函数1、定义:设X是一随机变量,x为任意实数,则称函数为X的分布函数。

2、性质F(x)在间断点处右连续,即F(x)单调不减3、常用公式由此看出,已知X的分布函数就可知X在任一范围内取值的概率,这说明分布函数全面地描述了随机变量的分布情况。第20页,共63页,2023年,2月20日,星期二4、离散型随机变量的分布函数例设某药检所从送检的药品中先后抽3件,如果送检的10件中有2件失效,试列出检得次品数的概率分布表,并求出分布函数。(分段函数)解检得次品数为随机变量,设为X,则X的可取值为0,1,2,由古典概率计算得第21页,共63页,2023年,2月20日,星期二X0120.46670.46670.0666X的分布函数为当x<0时,当时,当时,当时,即第22页,共63页,2023年,2月20日,星期二如果取X的值于横轴,的值于纵轴,便得到X的概率函数图,它由几条函数组成,每条线长的值等于该点上的概率。0x0.512取X的值于横轴,F(x)的值于纵轴,便得到X的分布函数图。此例中X是离散型随机变量,由此可见离散型随机变量的分布函数是台阶形,在分段点右连续。00.51F(x)x12第23页,共63页,2023年,2月20日,星期二一、连续型随机变量概念可取某个区间上所有值的变量。1、定义若f(x)非负可积,且则称X为连续型随机变量,f(x)称作概率密度函数。2、性质(X为连续型)第24页,共63页,2023年,2月20日,星期二3、连续型随机变量的分布函数4、分布函数与密度函数之间的互化重要公式:第25页,共63页,2023年,2月20日,星期二例1设X的分布函数为,求常数A、B及相应的密度函数。解:由F(x)的性质,有而由上述方程解得所以第26页,共63页,2023年,2月20日,星期二例2已知X的密度函数为(1)求相应的分布函数F(x);(2)求及解当时,当时,(1)第27页,共63页,2023年,2月20日,星期二当时,当x>2时,=1(2)或第28页,共63页,2023年,2月20日,星期二或第29页,共63页,2023年,2月20日,星期二二、连续型随机变量的几种常见分布1、正态分布(1)分布形式(2)图形与性质

特点是“两头小,中间大,左右对称”.正态分布的密度曲线是一条关于对称的钟形曲线.x轴是f(x)的渐近线第30页,共63页,2023年,2月20日,星期二可见决定了图形的中心位置,称为位置参数;决定了图形中峰的陡峭程度,称为形状参数.左图不变右图不变第31页,共63页,2023年,2月20日,星期二(3)标准正态分布标准正态分布函数重要公式:若,则X~N(0,1)第32页,共63页,2023年,2月20日,星期二例1设X~N(0,1),求:(1);(2)(3)解(1)查表得0.02275(2)=0.02275(3)结论:设X~N(0,1),则第33页,共63页,2023年,2月20日,星期二例2设X~N(2,4),求:(1)f(5)(2)P(-4<X<2)解由已知得,(1)(2)第34页,共63页,2023年,2月20日,星期二例3设,求(1)(2)解(1)(2)这个结果说明在一次试验中,服从正态分布的随机变量X落在区间内的概率相当大,即X几乎必然落在上述区间内,这就是通常所说的“”原理。第35页,共63页,2023年,2月20日,星期二2、均匀分布X~U[a,b]这说明X落在子区间的概率只与子区间的长度有关,与子区间的位置无关。(1)形式设(c,c+l)是[a,b]上的一个子区间,则第36页,共63页,2023年,2月20日,星期二(2)分布函数3、对数正态分布若,则称X服从对数正态分布。4、韦布尔分布、指数分布5、分布第37页,共63页,2023年,2月20日,星期二一、均数(数学期望)引例设有一批药材是由三个等级的药材组成,现观察它的等级X。若有放回地抽取10件,其中有5件1等、3件2等、2件3等,则所取的10件产品的平均等级是多少?解X的所有取值为1,2,3,10件产品的平均等级为将上式改写成这种把每个等级与相应的频率乘积的和,称为1,2,3分别以5/10,3/10,2/10为权的加权平均。第38页,共63页,2023年,2月20日,星期二我们知道,如果再抽取10件,平均等级就不一定是1.7等了,可见由于抽样不同,抽样的平均等级也不同,它是一个随机变量。但是,随着试验(抽取药材)的次数增大,出现1,2,3等品的频率就会逐渐稳定在稳定在各自的概率附近。设表示第i(i=1,2,3)等药材出现的概率,则整批药材的平均等级为我们称这种加权平均值为均数,也叫数学期望。第39页,共63页,2023年,2月20日,星期二1、离散型随机变量的均数设离散型随机变量X的概率函数为(i=1,2,3,…)则规定X的均数均数是反映随机变量取值的集中趋势的一个数字特征。例1已知X的分布列为X012Pi½¼¼

求EX解:第40页,共63页,2023年,2月20日,星期二2、连续型随机变量的均数设连续型随机变量X的概率密度为f(x),则规定X的均数为例2求在[a,b]上服从均匀分布的随机变量X的均数EX。解依题意有由定义得第41页,共63页,2023年,2月20日,星期二3、常见分布的均数(2)若X~B(n,p),则EX=np(3)若,则(4)若X~U[a,b],则(5)若,则(1)若X~两点分布,则EX=p第42页,共63页,2023年,2月20日,星期二4、均数的性质(1)E(c)=c(c为常数)(2)(k为常数)(3)(k,b为常数)(4)(X与Y独立)例3已知X的分布列为X012Pi½¼¼

求E(2X+3)解第43页,共63页,2023年,2月20日,星期二二、方差均数反映了随机变量取值的平均情况,它是随机变量的一个重要数字特征,但只看均数是不够的,还应知道随机变量的取值对均数的偏离程度。引例设有甲、乙两台制丸机生产同一种药丸的直径(mm)的概率分布表如下X56789Pi0.050.10.70.10.05Y456789100.050.10.20.30.20.10.05第44页,共63页,2023年,2月20日,星期二如果药丸的标准直径为7mm,问哪台机器的性能更好?解易算出EX=EY=7,可见两台机器都是按标准生产的。但是从分布可见,甲机器比乙机器生产的丸径稳定,也就是甲生产的丸径与标准丸径的偏差小。因此,甲机器的生产性能比乙好。最终,我们选用来刻画随机变量X的取值对均数EX的平均偏离程度(波动程度)。1、方差定义称为X的标准差。方差反映了随机变量取值对均数的平均偏离程度。第45页,共63页,2023年,2月20日,星期二(1)离散型(2)连续型其中(i=1,2,…)其中f(x)是X的概率密度函数为了便于计算,可由定义式推出实用计算公式为即第46页,共63页,2023年,2月20日,星期二3、方差的性质(1)D(C)=0(C为常数)(2)(k为常数)(3)(k、b为常数)(4)(X与Y独立,可推广到任意有限个相互独立随机变量的情况)例4已知X的分布列为X012Pi½¼¼

求D(2X+3)解D(2X+3)=4DX=第47页,共63页,2023年,2月20日,星期二0141/21/41/4由X的分布列得则而由例1知EX=所以第48页,共63页,2023年,2月20日,星期二三、变异系数——标准差相对于均数的变化率变异系数用来比较两个均数相差很大或者量纲不同的随机变量取值的波动程度。例5据调查,某地18岁男子身高均数为165.08cm,标准差为4.98cm,体重均数为51.6kg,标准差为5.01kg,试比较该地男子的身高和体重波动程度哪个大?解因为身高和体重单位不同,直接用标准差比较波动程度不合适,应用变异系数来比较第49页,共63页,2023年,2月20日,星期二身高体重可见,体重的相对波动程度大于身高的相对波动程度。第50页,共63页,2023年,2月20日,星期二离散型变量的二项分布、泊松分布和连续型变量的正态分布,是三种最基本也是最重要的分布,它们之间有着密切的联系,即当时,二项分布以泊松分布为极限分布;当时,二项分布以正态分布为极限分布;当时,泊松分布以正态分布为极限分布以上第一种渐近分布在第一节中已经介绍过,这里不再重复。以下介绍后两种渐近分布。二项分布的正态近似当时,第51页,共63页,2023年,2月20日,星期二有了二项分布的两个近似运算,现总结二项分布问题中的计算方法的选择:(1)当n为一个较小的数,可直接用二项分布公式(2)当n是一个大的数,p很小,np较小,则用泊松分布近似计算;(3)当n是一个大的数,np较大时,则用正态分布近似计算第52页,共63页,2023年,2月20日,星期二例1某车间送检一批针剂,其中次品的概率是0.01,问抽检500支针剂,有5支次品的概率是多少?解设抽检的500支针剂中次品数为X则X~B(500,0.01),其中n很大,np=5较小,因此化为泊松分布P(5)近似计算例2对一癌症高发病地区进行普查,患病率为0.005,现有这地区一万人的乡村,试求:(1)此乡有70人患癌症的概率;(2)有30~50人患病的概率;第53页,共63页,2023年,2月20日,星期二解设一万人的乡村中患癌症的人数为X,则X~B(10000,0.005),此时n很大,但np=50较大,故用正态分布来计算(1)(2)第54页,共63页,2023年,2月20日,星期二当时,泊松分布的正态近似例3某药厂大批量生产外用药,平均每个月的废品数为35件,试估计下个月内出现废品数少于40件的概率。解设此药厂每月生产的废品数为X,出现废品属于伯努利试验之稀有事件,则X~P(35),可用正态分布近似计算则X~N(35,35)第55页,共63页,2023年,2月20日,星期二所谓极限定理,就是采用极限的方法得出随机变量分布的一系列定理。一般可以分为两类:第一类是阐述若干个随机变量的均数的极限定理,统称为大数定律;第二类是阐述在怎样的条件下,当n不断增大时,n个独立随机变量之和的极限分布为正态分布,统称为中心极限定理。1、切比雪夫不等式(Chebyshev)设随机变量X有期望EX和方差DX,则对于,有一、大数定律第56页,共63页,2023年,2月20日,星期二或切比雪夫不等式只用均数和方差就描述了随机变量大概的概率分布情况,无需知道X的分布,因此它在理论研究及实际应用中很有价值。例1某地区调查10000名某疾病患者,该病需住院治疗的概率为0.7,试用切比雪夫不等式估计10000名患者中同时需要住院的人数在6800~7200之间的概率。解设X表示同时住院的病人数,则X~B(10000,0.7)第57页,共63页,2023年,2月20日,星期二若要精确计算,应用正态分布近似计算,即X~N(700

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论