24-第二章第四节(概率统计)_第1页
24-第二章第四节(概率统计)_第2页
24-第二章第四节(概率统计)_第3页
24-第二章第四节(概率统计)_第4页
24-第二章第四节(概率统计)_第5页
已阅读5页,还剩51页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章随机变量及其分布2.4连续型随机变量及其概率密度内容简介:对于连续型随机变量X,同离散型随机变量X并行研究,先后讨论概率密度、分布函数及其二者关系问题,其中重点研究三种常用的连续型随机变量的分布——均匀分布、指数分布和正态分布.重点学习正态分布的理论.第二章随机变量及其分布2.4连续型随机变量及其概率密度2.4.1提出问题若随机变量X的所有的可能取值充满一个区间,那么就不能像离散型随机

变量那样,以指定它取每个值的概率的方式给出其概率分布,怎样来研究这种情形呢?2.4.2预备知识1.反常积分,原函数,定积分的几何意义,定积分与反常积分计算;

2.奇偶函数,单调增函数,分布函数连续性.2.4.3提出概念

连续型随机变量X的所有可能取值充满一个区间,对这种类型的随机变量,不能像离散型随机变量那样,以指定它取每个值概率的方式去给出其概率分布,而是通过给出所谓“概率密度函数”的方式.

下面我们就来介绍对连续型随机变量的描述方法.1.连续型随机变量的概率密度

定义对于随机变量X,如果存在一个非负可积函数f(x),使得对于任意的实数x,有F(x)=P{-∞<X≤x}=则称X为连续型随机变量,其中函数f(x)称为X的概率密度函数,简称为概率密度.

由定义可以看出:连续型分布函数F(x)是处处连续的,而一般定义(2.3.1)得到的分布函数F(x)仅是右连续的.几何意义见下图.概率密度f(x)的性质:

(1)

f(x)≥0,x∈(-∞,+∞).

(4)若f(x)在点x处连续,则有(5)

连续型随机变量取任一指定值的概率为0,

即P{X=a}=0,a为任一指定值.

(3)对于任意实数x1,x2(x1≤x2),P{x1<X≤x2}=F(x2)-F(x1)=讲评如果任意一个非负实函数f(x)满足以上两条性质(1)、(2),则f(x)就是一个随机变量的概率密度.这两条性质是判定一个函数f(x)是否为某个随机变量X的概率密度函数的充要条件.

由性质(2)知道,介于曲线y=f(x)与Ox轴之间的面积等于1.见(图2-7).

由性质(3)知道,X落在区间(x1,x2]上的概率P{x1<X≤x2}等于区间(x1,x2]上曲线y=f(x)之下的曲边梯形的面积值(图2-8).这是因为性质(4)说,若f(x)在点x处连续,有故X的概率密度f(x)在x这一点的值,恰好是X落在区间(x,x+△x]上的概率与区间长度△x之比的极限.这里,如果把概率理解为质量,则f(x)相当于线密度.若不计高阶无穷小,有

P{x<X≤x+△x}≈f(x)△x.它表示随机变量X取值落入区间(x,x+△x]的概率近似等于f(x)△x.由导数的定义,我们得到:

讲评由P(A)=0,不能推出A=,但P()=0;由P(B)=1,也不能推出B=Ω,即B并非必然事件,但P(Ω)=1.性质(5)是因为因此,对连续型随机变量X,(2.4.2)式成为

P{x1≤X<x2}=P{x1<X≤x2}=P{x1<X<x2}.P{X=a}例2.4.1设连续型随机变量X的概率密度f(x)如右式,试求:

(1)因为故由

(1)常数k;(2)P{|X|≤0.5};(3)X的分布函数.

2.4.4理论应用

(2)所求概率

(3)因为得到当x<-1时,当-1≤x<1时,当x≥1时,

得X的分布函数

(4)计算连续型随机变量X落入区间(a,b]或[a,b)或[a,b]内的概率都用公式

P{a<X≤b}=P{a≤X<b}=P{a<X<b}=P{a≤X≤b}=或

(∵P{X=a}=0)

(1)确定f(x)中的待定参数用公式讲评(2)已知概率密度f(x),求分布函数用定义(3)已知分布函数F(x),求概率密度f(x)用关系

注意F(x)和f(x)为分段函数时的定义区间写法.

常用的连续型随机变量的分布有均匀分布、指数分布和正态分布.2.4.5常见常用的连续型随机变量的分布

1.均匀分布

均匀分布的分布函数为

若连续型随机变量X的概率密度为则称X在区间(a,b)上服从均匀分布,其中a,b为分布参数,且a<b,

记为X~U(a,b).

均匀分布的概率密度f(x)及分布函数F(x)的图形分别如下图所示.若X~U(a,b),则对于满足a≤c<

d≤b的c,d,总有

可见,若随机变量X在区间(a,b)上服从均匀分布,则X落入该区间中任一相等长度的子区间内的概率相同,即X落入任何子区间的概率仅与该区间的长度成正比,而与其位置无关.此性质进一步说明了几何概率定义的合理性.

均匀分布常见于下列情形:某一事件等可能地在某一时间段发生;在数值计算中,由于进行四舍五入,小数点后某一位小数舍入的误差,例如对小数点后第一位是按四舍五入原则得到时,那么一般认为误差在(-0.05,0.05)上服从均匀分布.

由题意,可以认为测量误差X(单位:cm)

在区间(-0.05,0.05)上服从均匀分布,故知X的概率密度为

例2.4.2

测量一个工件的长度,要求准确到毫米,即若以厘米为单位计,小数点后第一位数字是按“四舍五入”的原则得到.求由此产生的测量误差X的概率密度,并求某次测量中,其误差的绝对值小于0.03的概率.解因此所求概率为

2.指数分布若连续型随机变量X的概率密度为

则称

X服从参数为λ的指数分布,其中λ>0,是一常数,记为X~E(λ).用分段积分的方法,易知指数分布的分布函数为

例2.4.3

多年统计表明,某厂生产的电视机的寿命X~E(0.2)(单位:万小时).

(1)某人购买了一台该厂生产的电视机,问其寿命超过4万小时的概率是多少?

(2)某单位一次购买了10台这种电视机,问至少有2台寿命大于4万小时的概率又是多少?

(3)若已知一台电视机的寿命大于4万小时,问这台电视机的寿命大于5万小时的概率是多少?解由题设知,随机变量X的概率密度为(1)

电视机寿命超过4万小时的概率为

(2)设Y={10台电视视中寿命大于4万小时的台数},则Y服从二项分布,即有Y~B(10,).于是P{Y≥2}=1-P{Y=0}-P{Y=1}

=0.9765.(3)这是求条件概率P{X>5|X>4}.讲评

(1)这里X~E(0,2),Y服从二项分布Y~B(10,).用到结论P{X>4}=e-0.8.

(2)此题比较综合,应引起重视.

指数分布常用于可靠性统计研究中,如元件的寿命,动植物的寿命,服务系统的服务时间等等.连续型随机变量X的指数分布概率密度还有形式:

3.正态分布

正态分布是应用最广泛的一种连续型分布.正态分布在19世纪前叶由高斯(Gauss)加以推广,所以通常又称为高斯分布.

正态分布是概率论与数理统计中最常用也是最重要的一种概率分布,它在解决实际问题中有着广泛的应用.经验表明,当一个变量受到大量微小的、互相独立的随机因素影响时,这个变量往往服从或近似地服从正态分布.在正常条件下,各种产品的质量指标,零件的尺寸,纤维的强度和张力,农作物的产量,小麦的穗长和株高,测量误差,射击目标的水平或垂直偏差,信号噪声,等等,都服从或近似地服从正态分布.(1)正态分布的定义

若随机变量X

的概率密度为

则称X服从参数为μ和σ2的正态分布,其中μ和σ(σ>0)都是常数.常记为X~N(μ,σ2).f(x)所确定的曲线叫作正态曲线.

(2)正态分布的图形特点正态分布的概率密度图象见图2-11.图2-11正态分布的概率密度及参数μ,σ含义

正态分布的密度曲线是一条关于x=μ对称的钟形曲线,其特点是“两头小,中间大,左右对称”.μ决定了图形的中心位置,当μ取不同值时,图像将会发生平移;σ决定了图形的峰的陡峭程度:当σ较大时,曲线较平坦;当σ较小时,曲线则较陡峭.

令x1=μ+c,x2=μ-c(c>0),分别代入f(x),

可得f(μ+c)=f(μ-c),且f(μ+c)≤f(μ),

f(μ-c)≤f(μ),并在x=μ处达到最大值:

当x→±∞时,f(x)→0.这说明曲线f(x)向左右伸展时,越来越接近x轴,即f(x)

以x轴为渐近线;用求导的方法可以证明,x=μ±σ为f(x)的两个拐点的横坐标.设X~N(μ,σ2),则随机变量X的分布函数是

(3)正态分布的分布函数当μ=0,σ=1时,得到的正态分布N(0,1)称为标准正态分布.其密度函数和分布函数常用φ(x)和Φ(x)表示.这里(4)标准正态分布关于φ(x)和Φ(x)的图形见图2-12.图2-12标准正态分布概率密度φ(x)和分布函数Φ(x)关系

关于分布函数Φ(x)和概率密度φ(x)有以下性质:(i)Φ(0)=0.5,

φ(0)=

(ii)Φ(-x)=1-Φ(x),

φ(-x)=φ(x).

标准正态分布的重要性在于,任何一个一般的正态分布N(μ,σ2)都可以通过“标准化”线性变换转化为标准正态分布.

定理

若X

~N(μ,σ2),

则Z=~N(0,1).证的分布函数为

=P{X≤μ+σx}

根据这个定理,只要将标准正态分布的分布函数制成表,就可以解决一般正态分布的概率计算问题.得到

由此得到

(5)正态分布表及正态分布计算问题

书末附有标准正态分布表,借助于该表,可以解决一般正态分布的概率计算问题.表中给的是当x≥0时Φ(x)的值.对于x<0时,用关系等式Φ(x)=1-Φ(-x)计算.特别地,P{│X│≤a}=2Φ(a)-1.

(2.4.13)(i)若X~N(0,1),则P{a<X<b}=P{a≤

X≤b}=Φ(b)-Φ(a).(2.4.12)(ii)若X~N(μ,σ2),则Y=

~N(0,1),且有

(2.4.14)

求导,得概率密度关系

(2.4.15)

P{a<X≤b}=(2.4.16)

区间概率关系:

讲评

(1)若X服从标准正态分布,即X~N(0,1)则X落于区间(a,b]上的概率为

P{a<X≤b}=P{a≤X<b}=P{a<X<b}=P{a≤X≤b}=Φ(b)-Φ(a).

(2)若X服从一般正态分布,即X~N(μ,σ2)

则X落于区间(a,b]上的概率为

P{a<X≤b}=P{a≤X<b}=P{a<X<b}=P{a≤X≤b}=F(b)-F(a)

(iii)3σ准则:由标准正态分布的查表计算可以求得,当X~N(0,1)时,

P{│X│≤1}=2Φ(1)-1=0.6826,P{│X│≤2}=2Φ(2)-1=0.9544,

P{│X│≤3}=2Φ(3)-1=0.9974.

(3)标准正态分布函数Φ(x)与正态分布函数F(x)的关系:F(x)=Φ

Φ(x)=F(μ+σx).

这说明,X的取值几乎全部集中在

[-3,3]区间内,超出这个范围的可能

性仅占不到0.3%.这表明,Y

的取值几乎全部集中在区间[μ-3σ,μ+3σ]内.这在统计学上称作3σ准则

(三倍标准差原则).

上述结论推广到一般的正态分布Y~N(μ,σ2)时,

P{│X-μ│≤σ}=0.6826,P{│X-μ│≤2σ}=0.9544,P{│X-μ│≤3σ}=0.9974.(6)上α分位点

为了便于今后在数理统计中的应用,对于标准正态随机变量,我们给出α分位点的定义.

设X~N(0,1),若zα满足条件

P{X>zα}=α(0<α<1),(2.4.17)则称数zα为标准正态分布的上α分位点.图2-13上α分位点zα下面列出了几个常用的zα的值.α0.0010.0050.010.0250.050.10zα3.0902.5762.3271.9601.6451.282特别地,由φ(x)图形的对称性知道z1-α=-zα.(2.4.18)显然,由P{X>zα}=α得到P{X≤zα}=1-α.(2.4.19)例2.2.4

设随机变量.X~N(3,22)(1)计算P{2<X≤5},P{|X|>2};(2)确定c使得

(3)设d满足

,问d至多为多少?

(1)利用(2.4.16)式,查标准正态分布表,得到(2)由

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论