第2章-随机变量及其分布_第1页
第2章-随机变量及其分布_第2页
第2章-随机变量及其分布_第3页
第2章-随机变量及其分布_第4页
第2章-随机变量及其分布_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

随机变量的概念(1)随机试验的可能结果不止一个.

例如:考察投掷两颗骰子的随机试验,假设这两颗骰子是可以分辨的,其样本空间为:

S

={(1,1),(1,2),…,(1,6),(2,1),(2,2),…,(6,6)}在某些情况下,人们主要感兴趣的不是试验结果本身,而是与试验结果有关的某个数.

例如:如果人们关心两颗骰子掷出的点数之和是否等于7,实际上就不会在乎其结果是(1,6)还是(2,5).现在是1页\一共有83页\编辑于星期一有些随机试验的结果本身是一个数,例如:某出租车公司的电话订车中心,一天之内接到订车电话的次数;某射手对一活动靶进行射击,到击中目标为止,所进行的射击次数;从一批灯泡中,任取一只,测定这只灯泡的寿命.有些随机试验的结果看起来与数量无关,例如:投掷一枚硬币,其基本事件为“正面向上”、“反面向上”;在有两个孩子的家庭中,考虑孩子的性别,其基本事件为“男男”、“男女”、“女男”、“女女”.如果我们将随机试验的结果数量化,使之与实数对应起来,我们就有可能利用数学分析的方法对随机试验的结果进行深入广泛的研究.现在是2页\一共有83页\编辑于星期一随机变量的概念(2)定义:随机变量是定义在样本空间

S上的实值函数.00.51P(B)P(A)0是定义在样本空间

S上的函数现在是3页\一共有83页\编辑于星期一附注:随机变量与普通函数有着本质的区别.随机变量是一种因变量(而非自变量),它的取值依赖于样本点,所以其定义域是抽象的样本空间.随机变量的取值随试验的结果而定,而试验各个结果的出现有一定的概率,因而随机变量的取值也有一定的概率.随机变量常用大写字母X,Y,

Z,…表示,而以小写字母x,y,z,…表示实数.若

L是一个实数集合,则集合{e|X(e)∈L}表示样本空间S中满足X(e)∈L的所有样本点组成的子集(随机事件).现在是4页\一共有83页\编辑于星期一实例1

掷一个硬币,观察出现的结果,共有两种情况:若用X表示掷一个硬币出现正面的次数,则有01即X(e)是一个随机变量.现在是5页\一共有83页\编辑于星期一实例2

在有两个孩子的家庭中,考虑其性别,共有4个样本点:若用X表示该家庭女孩的人数时,则有可得随机变量

若假设男孩和女孩的出生率相等,则现在是6页\一共有83页\编辑于星期一§2离散型随机变量及其分布律现在是7页\一共有83页\编辑于星期一离散型随机变量定义:若随机变量只能取有限个或可列个数值,则称为离散型随机变量.随机变量离散型随机变量非离散型随机变量现在是8页\一共有83页\编辑于星期一附注:随机变量与普通函数有着本质的区别.随机变量是一种因变量(而非自变量),它的取值依赖于样本点,所以其定义域是抽象的样本空间.随机变量的取值随试验的结果而定,而试验各个结果的出现有一定的概率,因而随机变量的取值也有一定的概率.随机变量常用大写字母X,Y,

Z,…表示,而以小写字母x,y,z,…表示实数.若

L是一个实数集合,则集合{e|X(e)∈L}表示样本空间S中满足X(e)∈L的所有样本点组成的子集(随机事件).现在是9页\一共有83页\编辑于星期一设离散型随机变量X的所有可能取值为,且离散型随机变量的分布分布律

显然,下列两个条件必定成立:(1)

(2)

也可以用表格的形式来表示现在是10页\一共有83页\编辑于星期一例:对技术熟练的射手甲对新手乙X和Y是不同的随机变量.结论:概率1,以不同的方式分布到各可能取值,就确定不同的随机变量.游戏规则:落在e0区域得0分;落在e1区域得1分;落在e2区域得2分.现在是11页\一共有83页\编辑于星期一例:已知随机变量X的概率分布描述如下:试求出X的分布.例:若随机变量X只取常数值a,即,则称X服从退化分布或单点分布.附注:其实X并不随机,但有时将它看作是随机变量更为方便,这是概率集中在一点a处的退化情形.现在是12页\一共有83页\编辑于星期一独立试验序列定义:若一个随机试验只有两种可能结果:

A(称为“成功”)与A(称为“失败”),

两者发生的概率分别为:(成功概率),

(失败概率),则此类试验称为成功概率为

p的伯努利试验.定义:将一个伯努利试验独立重复进行

n次,得到的试验序列称为

n重伯努利试验.现在是13页\一共有83页\编辑于星期一附注:所谓独立重复进行一个伯努利试验,是指每一次试验都是伯努利实验,只能发生或.“重复”是指在每次试验中成功概率

P(A)=p保持不变.“独立”是指每一次试验的结果互不影响,即若以

Ci表示第i

次试验的结果,则P(C1C2…Cn)=P(C1)P(C2)…P(Cn).现在是14页\一共有83页\编辑于星期一两点分布

在成功概率

P(A)=p

的伯努利试验中,事件

A出现的次数

X只能等于0或1,且它的分布律是即其中不难验证:所以这是一个概率分布,称X服从两点分布.现在是15页\一共有83页\编辑于星期一说明对于一个随机试验,如果样本空间只包含两个元素,即

S

=

{e1,e2}

我们总能在S上定义一个服从两点分布的随机变量

来描述这个随机试验的结果.(课本P.41)现在是16页\一共有83页\编辑于星期一二项分布(BinomialDistribution)

在成功概率

P(A)=p

n重伯努利试验中,事件

A出现的次数

X可能等于,且它的分布律不难验证:所以这是一个概率分布,称为二项分布,简记作.特别的,当n=1时,二项分布就是两点分布.现在是17页\一共有83页\编辑于星期一例:(产品抽样检验模型)设

N件产品有

M件次品,从中任取一件产品进行检验,则结果可能是:A(“次品”)或

A(“正品”),这是成功概率的伯努利试验.若采取“放回抽样”,接连抽取

n次,那么这样的抽检形成一个的

n重伯努利试验.若采取“不放回抽样”,接连抽取

n(≤N)次,那么这样的抽检不能视作

n重伯努利试验.当产品总量

N很大时,抽出少数几件不致影响次品率,故也可将不放回地接连抽取

n(远小于

N)次的检验看成

n重伯努利试验.现在是18页\一共有83页\编辑于星期一例:按规定,某种型号电子元件的使用寿命超过1500小时的为一级品.已知某一大批产品的一级品率为0.2,现在从中随机地抽查20只,问20只元件中恰有k只(k=0,1,…,20)为一级品的概率是多少?解:记20只元件中一级品的只数为X,那么X~b(20,0.2),于是分析:这是不放回抽样.当产品总量

N很大时,抽出少数几件不致影响一级品率,故也可将不放回地接连抽取

n(远小于N)次的检验看成

n重伯努利试验.现在是19页\一共有83页\编辑于星期一例:某人进行射击,设每次射击的命中率为0.02,独立射击400次,试求至少击中两次的概率.解:记400次射击中命中的次数为X,那么X~b(400,0.02),于是结论:只要试验的次数足够多,而且试验是独立进行的,那么小概率事件几乎肯定发生,决不能忽视小概率事件.现在是20页\一共有83页\编辑于星期一例:设有80台同类型的设备,各台工作是相互独立的,发生故障的概率都是0.01,且一台设备的故障能由一个人处理.考虑两种配备维修工人的方法,其一是由4人维修,每人负责20台;其二是由3人共同维护80台.试比较这两种方法在设备发生故障时不能得到及时维修的概率的大小.解:先讨论第二种方法.设80台设备同一时刻发生故障的台数为X,则X~b(80,0.01),所求概率为现在是21页\一共有83页\编辑于星期一再设第

i个人负责的20台设备同一时刻发生故障的台数为X,则X~b(20,0.01),于是解:(续)再讨论第一种方法.设Ai表示事件“第

i个人负责的20台设备发生故障不能得到及时维修”,则所求概率为结论:尽管第二种方法尽管任务重了(每人平均维护约27台),但工作效率不仅没降低,反而提高了.现在是22页\一共有83页\编辑于星期一解:假设需要发射n

枚导弹,则击中来犯敌机的导弹数是随机变量X~b(n,0.96),于是又因为所以从而取n=3,即需要发射3枚导弹.例:已知发生一枚地对空导弹击中来犯敌机的概率为0.96,问需要在相同条件下发射多少枚导弹才能保证至少有一枚导弹击中来犯敌机的概率大于0.999?现在是23页\一共有83页\编辑于星期一解:因为全是瞎蒙,所以每道题的任一个答案被选中的概率都是相等的,每做一道题就是进行一次成功概率为1/n

的伯努利试验.设答对的题目数量X~b(5,1/n),于是这人考试及格的概率为当n=3时,当n=4时,例:一个完全不懂英语的人去瞎蒙一次大学英语四级考试.设此考试有5道选择题,每题给出n

个答案以供选择,其中只有一个答案正确.试问这人居然答对3题以上从而及格的概率.现在是24页\一共有83页\编辑于星期一泊松分布(PoissionDistribution)

若随机变量

X以作为其一切可能取值,且其中常数,则称

X服从泊松分布,简记作.不难验证:所以这是一个概率分布.现在是25页\一共有83页\编辑于星期一

历史上,泊松分布是作为二项分布的近似,于1837年由法国数学家泊松引入的.近数十年来,泊松分布日益显示其重要性,成为概率论中最重要的几个分布之一.在实际中,许多随机现象(近似)服从泊松分布.二十世纪初罗瑟福和盖克两位科学家在观察与分析放射性物质放出的α粒子个数的情况时,他们做了2608

次观察(每次时间为7.5秒)发现放射性物质在规定的一段时间内,其放射的粒子数X服从泊松分布.泊松分布的背景及应用现在是26页\一共有83页\编辑于星期一

在生物学、医学、工业统计、保险科学及公用事业的排队等问题中,泊松分布是常见的.例如地震、火山爆发、特大洪水、交换台的电话呼唤次数等,都服从泊松分布.地震火山爆发特大洪水电话呼唤次数交通事故次数商场接待的顾客数现在是27页\一共有83页\编辑于星期一二项分布

泊松分布n很大,p

很小泊松分布与二项分布的关系现在是28页\一共有83页\编辑于星期一§3随机变量的分布函数现在是29页\一共有83页\编辑于星期一随机变量是定义在样本空间

S上的实值单值函数.若

L是一个实数集合,则集合表示样本空间

S中满足的所有样本点组成的随机事件.若随机变量只能取有限个或可列个数值,则称为离散型随机变量.离散型随机变量的分布律必满足:(1)(2)知识点回顾现在是30页\一共有83页\编辑于星期一引言非离散型随机变量,由于其可能取的值不能一个一个地列举出来,因而就不能像离散型随机变量那样用分布律来描述.在实际中,对于非离散型随机变量,如:误差ε,元件的寿命T

等,人们感兴趣的往往并不是误差ε

=0.05(mm),

寿命T=1251.3(h)的概率,而是考虑误差落在某个区间的概率,寿命大于某个数的概率.现在是31页\一共有83页\编辑于星期一随机变量的分布函数随机变量

X与任意实数

x的关系式

对应着随机事件

.概率

与实数

x的值有关,是实数变量

x的函数, 即

,称为随机变量

X的分布函数.备注:分布函数的定义域是实数集R.0xX0xXbaa用数学分析的方法研究随机变量成为可能!现在是32页\一共有83页\编辑于星期一随机变量

X的分布函数0x2Xx1分布函数的性质性质1:单调不减,即若,则必有.性质2:,且,.x性质3:在每一点

处均为右连续,即有现在是33页\一共有83页\编辑于星期一等价于例:设随机变量

X的分布律为:求

X的分布函数.解:当

时,

012x当

时,

012x为不可能事件

,故

,故现在是34页\一共有83页\编辑于星期一等价于当

时,

012当

时,等价于x012x,故例:设随机变量

X的分布律为:求

X的分布函数.故现在是35页\一共有83页\编辑于星期一综上所述,分布函数为0121于是例:设随机变量

X的分布律为:求

X的分布函数.现在是36页\一共有83页\编辑于星期一分布律与分布函数任意随机变量都可用分布函数来刻画其概率分布.对于离散型随机变量,可经由分布律得到分布函数.反过来,离散型随机变量的分布函数只在以正概率取值的点处发生跳跃间断,其跃度正是随机变量取该值的概率,于是对F(x)的每个跳跃间断点xk,有现在是37页\一共有83页\编辑于星期一例:已知离散型随机变量的分布律为分布函数是试确定其中的a,b,c,d,e的值.解:由F(-∞)=0,F(+∞)=1得

c=0,e=1由P{X=1}=F(1)-F(1-0)得

1-3/4=b,b=1/4,

又由1/4+a+b=1,从而得a=1/2由P{X=0}=F(0)-F(0-0)得

1/2=3/4-d,

从而

d=1/4即a=1/2,b=1/4,c=0,d=1/4,e=1现在是38页\一共有83页\编辑于星期一连续型随机变量随机变量离散型随机变量(只能取有限个或可列个数值)非离散型随机变量连续型随机变量(其可能取值布满某个区间)其它现在是39页\一共有83页\编辑于星期一并称y=f(x)的图像为

X的分布曲线.称被积函数

f(x)为X的概率密度,

连续型随机变量定义:如果对于随机变量

X的分布函数,存在非负函数,使得对于任意实数x,有就称

X为连续型随机变量,

0xy=f(x)面积x0备注:连续型随机变量的分布函数是连续函数.课本P.51附注1现在是40页\一共有83页\编辑于星期一概率密度的几何特征:概率密度的曲线总在x轴的上方,在整个实数轴有定义.对任意连续型随机变量,概率密度与x轴所围成的面积总是1.概率密度的性质(1)(1)(2)y=f(x)面积=10x(3)对任意实数a、b,xy=f(x)b面积a0现在是41页\一共有83页\编辑于星期一(4)若

f(x)

在点

x

处连续,则有

.(当很小时)概率密度的性质(2)0y=f(x)xx+xxyf(x)不是

X取值

x时的概率,但它可以反映

X在

x点附近取值的概率的大小.现在是42页\一共有83页\编辑于星期一对于连续型随机变量X

来说,它取任一指定的实数值

a的概率均等于零,即

P{X=a}=0.(课本P.53)证明:因为由此可得:不可能事件一定是零概率的事件,零概率事件不一定是不可能事件.必然事件一定是概率为1的事件,概率为1的事件不一定是必然事件.连续型随机变量取值在某个区间的概率,可以不特别考虑区间的端点,即,所以因为F(x)是连续函数,令,得P{X=a}=0.

现在是43页\一共有83页\编辑于星期一例:向半径为R的圆形靶射击,假定不会发生脱靶的情况,弹着点落在以靶心O为中心、r(r≤R)为半径的圆形区域的概率与该区域的面积成正比.设随机变量

X表示弹着点与靶心的距离,试求

X的分布函数及其密度函数.解:1.若

x<0,则是不可能事件,于是3.若x>R,

则是必然事件,于是xR现在是44页\一共有83页\编辑于星期一0R1F(x)x对分布函数求导,可得综合得:于是可认为概率密度函数为现在是45页\一共有83页\编辑于星期一思考题连续型随机变量的分布函数F(x)一定是连续函数.连续型随机变量的概率密度f(x)是连续函数吗?0≤f(x)≤1成立吗?现在是46页\一共有83页\编辑于星期一称为区间(a,b)上的均匀分布,记作.最简单的连续型随机变量是概率密度在某个有限区间(a,b)上取正的常数值,其余区间上皆为零的随机变量,即可以证明:现在是47页\一共有83页\编辑于星期一定义:设连续型随机变量

X具有概率密度则称

X在区间(a,b)服从均匀分布,记作.均匀分布(UniformDistribution)相应的分布函数为y=f(x)0xaby=F(x)0xab1现在是48页\一共有83页\编辑于星期一思考题连续型随机变量的分布函数F(x)一定是连续函数.连续型随机变量的概率密度f(x)是连续函数吗?0≤f(x)≤1成立吗?答:连续型随机变量的概率密度f(x)不一定是连续函数;0≤f(x)≤1一定成立.现在是49页\一共有83页\编辑于星期一说明类似地,我们可以定义区间[a,b]上的均匀分布;区间(a,b]上的均匀分布;区间[a,b)上的均匀分布.现在是50页\一共有83页\编辑于星期一可以证明:若,设,则均匀分布(UniformDistribution)y=f(x)0xab结论:服从均匀分布的随机变量落在(a,b)的子区间内的概率只依赖于子区间的长度而与子区间的位置无关.现在是51页\一共有83页\编辑于星期一例:设随机变量

X在[2,5]上服从均匀分布,现对

X进行三次独立观测,试求至少有两次观测值大于3的概率.X的分布密度函数为令A表示“X的观测值大于3”,解:即A={X>3}.从而有令Y表示3次独立观测中观测值大于3的次数,则由于现在是52页\一共有83页\编辑于星期一定义:设连续型随机变量

X具有概率密度,则称X服从参数为q

(>0)的指数分布.指数分布相应的分布函数为其中a=1/q现在是53页\一共有83页\编辑于星期一

某些元件或设备的寿命服从指数分布.例如无线电元件的寿命,电力设备的寿命,动物的寿命等都服从指数分布.应用与背景指数分布的重要性质:“无记忆性”.对任意的正数s,t,考虑条件概率如果将

X看作某类动物的寿命,则上式可解释为某动物已活到s岁(即X>s),则它再活

t年以上的概率与已经活过的岁数无关.所以指数分布又称为“永远年青”的分布.现在是54页\一共有83页\编辑于星期一指数分布的无记忆性设

X服从某种概率分布,若,则称这种概率分布具有无记忆性.指数分布是连续型随机变量中唯一具有无记忆性的分布.现在是55页\一共有83页\编辑于星期一定义:设连续型随机变量

X具有概率密度则称X服从正态分布,记作.正态分布(NormalDistribution)相应的分布函数为(其中和是常数,)现在是56页\一共有83页\编辑于星期一曲线关于x=µ

对称.当

x=µ时取得最大值在

x=µ±σ

处有拐点,以

x轴为渐近线.对于任意的,有

x

离µ越远,f(x)的值越小.同样长度的区间,当区间离µ越远,

X落在这个区间上的概率越小.正态分布的分布曲线现在是57页\一共有83页\编辑于星期一

特别地,称为标准正态分布,其密度函数及分布函数常记作固定σ,改变

µ的值,则图形沿

x轴平移,不改变其形状.固定

µ

,改变σ的值,则

σ越小,图形越尖,

X落在

µ附近的概率越大.正态分布的分布曲线现在是58页\一共有83页\编辑于星期一标准正态分布的概率密度表示为标准正态分布的分布函数表示为标准正态分布现在是59页\一共有83页\编辑于星期一

正态分布是最常见最重要的一种分布,例如测量误差;人的生理特征尺寸如身高、体重等;正常情况下生产的产品尺寸:直径、长度、重量高度等都近似服从正态分布.正态分布的应用与背景现在是60页\一共有83页\编辑于星期一正态分布的概率计算(1)设,则对任意的实数x,有原函数不是初等函数,因此概率不能通过积分算出.锦囊1:利用标准正态分布表.解:

查表例:已知,试求

.现在是61页\一共有83页\编辑于星期一锦囊2:利用.

查表正态分布的概率计算(2)现在是62页\一共有83页\编辑于星期一设,则对任意的实数a、b,有锦囊3:转换为标准正态分布.若,则对

X进行“标准化”的变换,可以证明.正态分布的概率计算(3)于是现在是63页\一共有83页\编辑于星期一3s法则若,则结论:尽管正态变量的取值范围是(-∞,+∞),但它的值落在(m-3s,m+3s)内几乎是肯定的事.这就是人们所说的“3s法则”.课本P.60图2-16现在是64页\一共有83页\编辑于星期一上a分位点定义:设X~N(0,1),若za

满足条件则称点za为标准正态分布的上a分位点.结论:z1−a

=−za

.现在是65页\一共有83页\编辑于星期一§5随机变量的函数的分布

离散型连续型定理及其应用现在是66页\一共有83页\编辑于星期一引言 在一些试验中,所关心的随机变量往往不能由直接测量得到,而它却是某个能直接测量的随机变量的函数,例如: 我们关心圆轴截面的面积A,虽然A不能直接测量得到,但是可以通过测量圆轴截面的直径d

计算得到,其中现在是67页\一共有83页\编辑于星期一引言

设X是一个随机变量,再设Y=g(X)是X的函数,则Y

也是一个随机变量.当X

等于x

时,Y

等于g(x).本节的任务是:

已知随机变量X

的概率分布以及Y=g(X),其中g(·)是已知的连续函数,试求随机变量Y的概率分布.现在是68页\一共有83页\编辑于星期一一、离散型随机变量的函数的分布

设X是离散型随机变量,其分布律为Y=g(X)是X的函数,则Y

也是离散型随机变量.它的取值为其中现在是69页\一共有83页\编辑于星期一第一种情形如果y1,y2,…,yn,…两两不同,即函数g(·)是单射,则于是随机变量Y

的分布律为或第二种情形如果y1,y2,…,yn,…有相同的项,则把这些相同的项合并(看作是一项);把相应的概率相加,即可得到随机变量Y

的分布律.现在是70页\一共有83页\编辑于星期一设随机变量

X

具有以下的分布律试求Y=(X-1)2

的分布律.

解:

Y有可能取的值为0,1,4.且Y=0对应于(X-1)2=0,解得X=1,所以P{Y=0}=P{X=1}=0.1,例1:现在是71页\一共有83页\编辑于星期一同理,P{Y=1}=P{X=0}+P{X=2}=0.3+0.4=0.7,P{Y=4}=P{X=-1}=0.2,所以,Y=(X-1)2的分布律为:Y=(X-1)2例1(续)现在是72页\一共有83页\编辑于星期一设随机变量X

具有概率密度:试求

Y=2X+8

的概率密度.解:(1)先求Y=2X+8

的分布函数

FY(y):例2:现在是73页\一共有83页\编辑于星期一例2(续)(2)

对分布函数求导,得:现在是74页\一共有83页\编辑于星期一

整理得Y=2X+8

的概率密度为:本例用到变限的定积分的求导公式例2(续)现在是75页\一共有83页\编辑于星期一二、连续型随机变量的函数的分布

设X是一个连续型随机变量,其概率密度为fX(x),再设

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论