概率论和数理统计电子教学案_第1页
概率论和数理统计电子教学案_第2页
概率论和数理统计电子教学案_第3页
概率论和数理统计电子教学案_第4页
概率论和数理统计电子教学案_第5页
已阅读5页,还剩149页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.一般地,对离散型随机变量其分布函数为结论:离散型随机变量的分布函数是阶梯函数,分布函数的跳跃点对应离散型随机变量的可能取值点,跳跃高度对应随机变量取对应值的概率;反之,如果某随机变量的分布函数是阶梯函数,则该随机变量必为离散型.例2设随机变量的分布函数为求的概率分布.解 由于图形是一个阶梯型曲线,故知是一个离散型随机变量,的跳跃点分别为对应的跳跃高度分别为9/19,6/19,4/19,如图.故X的概率分布为例3:一个靶子是半径为2米的圆盘,设击中靶上任一同心圆盘上的点的概率与该圆盘的面积成正比,并设射击都能中靶,以X表示弹着点与圆心的距离.试求随机变量X的分布函数解:1若则是不可能事件,于是3若,则是必然事件,于是第四节连续型随机变量及其概率密度一、连续型随机变量及其概率密度定义如果对随机变量的分布函数,存在非负函数,使得对于任意实数有则称为连续型随机变量,称为的概率密度函数,简称为概率密度或密度函数.概率密度性质:关于概率密度的说明1.对一个连续型随机变量,若已知其密度函数,则根据定义,可求得其分布函数,同时,还可求得的取值落在任意区间上的概率:2.连续型随机变量取任一指定值的概率为0.因注:概率为0的事件不一定是不可能事件.同样,概率为1的事件也不一定是必然事件。从而例1:设连续型随机变量具有概率密度确定常数,<2>求X的分布函数,<3>解<1>由密度函数的性质得解得的概率密度为X的分布函数<3>二、一些常用的连续型随机变量的分布1.均匀分布〔1定义若连续型随机变量的概率密度为则称在区间上服从均匀分布,.〔2均匀分布的密度函数满足性质〔3均匀分布的分布函数若随机变量X服从在[a,b]上的均匀分布,则分布函数为例2:已知乘客在某公共汽车站等车的时间服从区间<0,10>上的均匀分布,求乘客等车时间不超过的概率.解由于,所以的概率密度为故等车时间不超过的概率为-∞2指数分布〔1定义若随机变量的概率密度为,则称服从参数为的指数分布.简记为〔2指数分布的分布函数〔3指数分布的概率密度及分布函数分别如图所示例3某元件的寿命服从指数分布,已知其参数,求3个这样的元件使用1000小时,至少已有一个损坏的概率.解 由题设知,的分布函数为由此得到各元件的寿命是否超过1000小时是独立的,用表示三个元件中使用1000小时损坏的元件数,则所求概率为3正态分布1>定义若随机变量的概率密度为其中和都是常数,则称服从参数为和的正态分布.记为2>正态分布密度函数的图形性质:3>正态分布的分布函数:的图形是一条上升且关于点的曲线注:正态分布是概率论中最重要的连续型分布,在十九世纪前叶由高斯加以推广,故又常称为高斯分布.一般来说,一个随机变量如果受到许多随机因素的影响,而其中每一个因素都不起主导作用〔作用微小,则它服从正态分布.这是正态分布在实践中得以广泛应用的原因.例如,产品的质量指标,元件的尺寸,某地区成年男子的身高、体重,测量误差,射击目标的水平或垂直偏差,信号噪声、农作物的产量等等,都服从或近似服从正态分布.4、标准正态分布定义5:正态分布当时称为标准正态分布,此时,其密度函数和分布函数常用和表示:标准正态分布的重要性在于,任何一个一般的正态分布都可以通过线性变换转化为标准正态分布.5、定理设则证:6定理:,对任意区间有7、标准正态分布表的使用:〔1表中给出了时的数值,当时,利用正态分布的对称性,有〔2若则〔3若,则故的分布函数例4:设,求解 这里故例5:设求,解:则有的取值几乎都落入以为中心,以3为半径的区间内。称为3准则例6:公共汽车门的高度是按男子与车门顶碰头的机会在0.01以下设计的,设男子身高〔单位:服从正态分布,问车门高度为多少?解:设公共汽车门的高度为,由题设要求.而即.查附表3得.故,则故车门的高度超过时,男子与车门碰头的机会小于0.01练习1设某项竞赛成绩,若按参赛人数的10%发奖,问获奖分数线应定为多少?解 设获奖分数线为则求使成立的即查表得解得故分数线可定为78分.练习2将一温度调节器放置在内,调节器整定在℃,液体的温度〔以℃计是一个随机变量,且<1>若℃,求小于89℃的概率;<2>若要求保持液体的温度至少为80℃的概率不低于0.99,问至少为多少?解 <1>所求概率为<2>按题意需求满足即亦即故需第五节随机变量函数的分布一、随机变量的函数定义如果存在一个函数,使得随机变量满足:,则称随机变量是随机变量的函数.注:,由于是随机变量,其取值事先不确定,因此的取值也不确定,也是随机变量.本节主要解决的问题是,已知随机变量的分布,求其函数的分布,这里是已知的连续函数.本节主要研究是随机变量函数的随机性特征,即由自变量的统计规律性出发研究因变量的统计性规律.注:随机变量与的函数关系确定,为从的分布出发导出的分布提供了可能.二、是离散型随机变量例1:设随机变量的概率分布为试求的分布律.解:有可能取的值为,所以,的分布律为:求离散型随机变量函数的分布的一种方法:记的所有可能取值为对每个来说至少有一个,使成立,将所有满足式子中的对应的概率求和,作为事件的概率,上例也可用列表形式求解的概率分布为三、是连续型随机变量设已知的分布函数或概率密度函数,则随机变量函数的分布函数可按如下方法求得:例2:设随机变量,证明的线性函数也服从正态分布.证 记的分布函数为若,将对求导,得的概率密度为又的概率密度为所以若对求导,得的概率密度为故即服从正态分布的随机变量的线性函数仍服从正态分布特别上例中则得例3:设随机变量X具有概率密度求的概率密度解:<1>先求的分布函数例如,设X~N<0,1>,其概率密度为:则的概率密度为:定理1设随机变量具有概率密度,又设处处可导且恒有<或恒有>,则是一个连续型随机变量,其概率密度为其中是的反函数,且证明:单调增加,它的反函数存在且在严格单调增加,可导.分别记的分布函数为例4设随机变量在上服从均匀分布,求的概率密度函数.解在区间<0,1>上,函数的导数故严格单调增加,且具有反函数又故的概率密度函数由已知在上服从均匀分布,代入的表达式中练习1设随机变量的概率密度为,求的概率密度.解:<1>先求的分布函数:整理得的概率密度为:2设随机变量在上服从均匀分布,求的概率密度解:在区间上,函数,故于是在区间上单调下降,有反函数由前述定理,得已知在上服从均匀分布,代入的表达式中即服从参数为的指数分布。第三章多维随机变量及其分布在实际应用中,有些随机现象需要同时用两个或两个以上的随机变量来描述.例如,研究某地区学龄前儿童的发育情况时,就要同时抽查儿童的身高、体重,这里,和是定义在同一个样本空间上的两个随机变量.又如,考察某次射击中弹着点的位置时,就要同时考察弹着点的横坐标和纵坐标.在这种情况下,我们不但要研究多个随机变量各自的统计规律,而且还要研究它们之间的统计相依关系,因而还需考察它们的联合取值的统计规律,即多为随机变量的分布.由于从二维推广到多维一般无实质性的困难,故我们重点讨论二维随机变量.第一节二维随机变量一、二维随机变量及分布函数1定义:由随机变量构成的有序数,称为二维随机变量或二维随机向量.注:2定义:设是二维随机变量,对任意实数,二元函数称为二维随机变量的分布函数或称为随机变量和的联合分布函数.3二元分布函数的几何意义4随机点落在矩形区域:内的概率为=5分布函数的性质:〔1且对任意固定的对任意固定的<2>关于和均为单调不减函数,即对任意固定的当对任意固定的当<3>关于和均为右连续,即有注:上述四条性质是二维随机变量分布函数的最基本的性质,即任何二维随机变量的分布函数都具有这四条性质;更进一步地,我们还可以证明:如果某一二元函数。具有这四条性质,那么,它一定是某一二维随机变量的分布函数.破坏之一,则不是。二、二维离散型随机变量及其概率分布1定义:若二维随机变量只取有限对或可数对值,则称为二维离散型随机变量.结论:为二维离散型随机变量当且仅当均为离散型随机变量.2定义:若二维离散型随机变量所有可能的取值为则称为二维离散型随机变量的概率分布<分布律>,或的联合概率分布<分布律>.有时也将联合概率分布用表格形式来表示,并称为联合概率分布表:3二维离散型随机变量联合分布律的性质:1>2>4二维离散型随机变量的联合分布函数设二维离散型随机变量的联合概率分布为于是,的联合分布函数为注:对离散型随机变量而言,联合概率分布不仅比联合分布函数更加直观,而且能够更加方便地确定取值于任何区域上的概率,即,特别地,由联合概率分布可以确定联合分布函数:例1:从一只装有3只黑球和2只白球的口袋中取球两次,每次任取一只,不放回,令,求的概率分布.解的所有可能取值为例2:设随机变量服从参数为的指数分布,随机变量定义如下:求的联合概率分布.解:的分布函数为01001所以的联合概率分布为三、二维连续型随机变量及其概率密度1定义:设为二维随机变量,为其分布函数,若存在一个非负的二元函数,使对任意实数,有则称为二维连续型随机变量,并称为的概率密度<密度函数>,或的联合概率密度<联合密度函数>.2概率密度函数的性质:<3>设是平面上的区域,点落入内的概率为<4>若在点连续,则有3在几何上表示空间的一个曲面,的值等于以为底,以曲面为顶的柱体体积四、二维均匀分布设是平面上的有界区域,其面积为.若二维随机变量具有概率密度函数,则称在上服从均匀分布.例3:设二维随机变量的密度函数为<2>分布函数<3><5>解:〔1,练习1:设随机变量在1,2,3,4四个数中等可能地取值,另一个随机变量在中等可能地取一整数值。试求的分布律。解:2设二维随机变量的联合概率分布为YX010.30.10.110.050.2020.200.05求及解 3设的概率分布由下表给出,求,Y0200.10.2010.20.050.120.1500.1解 第二节边缘分布一、边缘分布函数1定义:二维随机向量作为一个整体,有分布函数,其分量与都是随机变量,有各自的分布函数,分别分别称为的边缘分布函数和Y的边缘分布函数;称为的联合分布函数。2求法:同理注:与的边缘分布函数实质上就是一维随机变量或的分布函数。称其为边缘分布函数的,是相对于的联合分布而言的。同样地,的联合分布函数是相对于的分量与的分布而言的。例1:解:二、离散型随机变量的边缘概率分布1边缘分布函数对于二维离散型随机变量,已知其联合概率分布为,其分布函数为则它关于X的边缘分布函数为它关于Y的边缘分布函数为2边缘概率分布随机变量的概率分布3已知联合概率分布求边缘概率分布的边缘概率分布可由下表表示例2设二维随机变量的联合概率分布为YX010.30.10.110.050.2020.200.05求的边缘分布律。解:YX010.30.10.10.510.050.200.2520.200.050.250.550.30.15例3:设随机变量01P-101P解:因故.因事件是互不相容的事件与的和,所以即由的联合概率分布及边缘概率分布表:-10101知故-10101三、连续型随机变量的边缘概率密度上式表明:是连续型随机变量,且其密度函数为:同理,由是连续型随机变量,且其密度函数为密度例3:设服从有界区域上的均匀分布,其中是由轴,轴及直线所围成的三角形区域,求关于X和Y的边缘概率密度.解:区域的面积为1,所以的概率密度为则关于X的边缘概率密度为关于的边缘概率密度为例4;解:则四、二维正态分布若二维随机变量具有概率密度其中均为常数,且,则称服从参数为的二维正态分布.例5:设求和的边缘概率密度解:由注:二维正态随机变量的两个边缘分布都是一维正态分布,且都不依赖于参数,亦即对给定的,不同的对应不同的二维正态分布,但它们的边缘分布都是相同的,因此仅由关于和关于的边缘分布,一般来说是不能确定二维随机变量的联合分布的.练习:1设的概率密度是求<1>的值;<2>两个边缘密度.解 <1>由确定所以<2>即2设随机变量和具有联合概率密度求边缘概率密度.解 3设服从单位圆域上的均匀分布,求X和Y的边缘概率密度.解当或时,从而当时,于是我们得到的边缘概率密度由和在问题中地位的对称性,将上式中的改成就得到的边缘概率密度第三节随机变量的独立性事件与独立的定义是:若则称事件与相互独立。借助于两个随机事件的相互独立的概念,引入随机变量的相互独立一、随机变量相互独立的概念1、定义,则称随机变量相互独立.说明〔1可知二维随机变量的联合分布函数可由其边缘分布函数唯一确定〔2对任意的,随机事件与相互独立.二、离散型随机变量的相互独立的充要条件如果是二维离散型随机变量,其概率分布及边缘概率分布分别为,,则随机变量和相互独立的充分必要条件是:对的所有可能取值均有,即,例1:设二维随机变量的联合概率分布为解:由又由联合概率分布,边缘概率分布为例2:甲、乙两人独立地各进行两次射击,假设甲的命中率为0.2,乙的命中率为0.5,以和分别表示甲和乙的命中次数,试求和的联合概率分布.解因为和相互独立,所以和的联合概率分布可由边缘概率分布求得.因为,.所以和的边缘概率分布为列表为由和的独立性,和的联合概率分布,故和的联合概率分别为三、连续型随机变量相互独立的充要条件如果是二维连续型随机变量,其概率密度函数及边缘概率密度函数和在面上除个别点及个别曲线外均连续时,随机变量和相互独立的充分必要条件是:在,,的连续点处都有例3:设证明与相互独立的充要条件是.证明:因""若X和Y相互独立,则,有特别地,将代入上式,有从而=0。""将=0代入联合概率密度函数,得所以,X与Y相互独立。例4:设随机变量的概率密度为求<1>与的边缘概率密度,<2>判断与是否相互独立;解 <1>当时,当时,所以类似可得由于当时,,故与不相互独立.例5:某旅客到达火车站的时间均匀分布在早上7:558:00,,而火车这段时间开出的时间的概率密度为求此人能及时赶上火车的概率.解由题意知的概率密度为因和相互独立,所以和的联合概率密度为此人能及时赶上火车的概率为关于二维随机变量的一些概念,定义2:设是定义在样本空间Ω上的个随机变量,则称为维随机变量.定义3:对于任意个实数,函数称为维随机变量的分布函数或随机变量的联合分布函数.定义4:对于维随机变量的分布函数,若存在非负函数使对于任意实数有则称为维连续型随机变量,称为维连续型随机变量的概率密度.定义5:设维随机变量的分布函数为,则的维边缘分布函数就随之确定.例如关于,关于的边缘分布函数分别记为又若是的概率密度,则关于,关于的边缘概率密度分别为定义6:设,分别是维随机变量的分布函数和边缘分布函数,若对任意实数,有则称相互独立.由定义6可知,维连续型随机变量中,相互独立的充分必要条件是对任意实数有成立,其中依次是的概率密度和的边缘概率密度.定义7:若对任意的实数;有其中依次为随机变量,和的分布函数,那么称随机变量和相互独立.我们还可以得到下面的定理.定理1:设和相互独立,则和相互独立.又若是两个连续函数,则和相互独立.练习:1.解:则有和直线2设的概率密度为<1>;<2>问和是否独立?解 <1>即因对一切均有:故独立.<2>即由于存在面积不为0的区域,使故和不独立.第四节条件分布第一章中,我们介绍了条件概率的概念,在事件发生的条件下事件发生的条件概率将其推广到随机变量:设有两个随机变量与,在给定取某个或某些值的条件下,求的概率分布。这个分布就是条件分布一、离散型随机变量的条件概率分布1条件分布律定义其概率分布为边缘概率分布为设概率分布,==,概率分布.2、条件概率分布具有概率分布的以下特性:1>;3、条件分布函数定义对固定的4、性质和相互独立条件分布律=边缘分布律例1设与的联合概率分布为YX0200.10.2010.30.050.120.1500.1<1>求关于的边缘概率分布;<2>求时,的条件概率分布以及时,的条件概率分布;<3>判断与是否相互独立?解<1>由与的联合概率分布得关于的边缘概率分布120.30.450.25<2>在时,的条件概率分布为又故在时,的条件概率分布可类似求得<2>因而即所以,与不独立.二、连续型随机变量的条件分布1.设<X,Y>是二维连续型随机向量,由对任意有所以不能直接用条件概率公式得到条件分布若则若则=2条件密度函数的性质3、性质X和Y相互独立.条件概率密度=边缘概率密度例2:设二维随机变量的概率密度是求条件概率密度,及解:故当时,在的条件下,的条件概率密度为故当时,在的条件下,的条件概率密度为当时例3:设数在区间随机取值,当观察到时,数在区间上随机地取值.求的概率密度.解:练习1设服从单位圆上的均匀分布,概率密度为求X的边缘分布及解:当时,当时,熟练时,被积函数为零的部分可以不写。所以上的均匀分布2设的概率密度是求解:为此,需求出由于于是,对故对3解:4:一射手进行射击,击中目标的概率为,射击进行到击中目标两次为止.以表示首次击中目标所进行射击次数,以表示总共进行的射击次数.试求和的联合分布及条件分布.解:在条件下随机变量的条件分布律为当时在条件下随机变量Y的条件分布律为当时第三节两个随机变量函数的分布在实际问题中,有些随机变量往往是两个或两个以上随机变量的函数.例如,医学上考察某地区40岁以上的人群,用和分别表示一个人的年龄和体重,表示这个人的血压,并且已知与,的函数关系式我们希望通过的分布来确定的分布.在本节中,我们重点讨论两种特殊的函数关系:〔1<2>和,其中与相互独立.一、离散型随机变量的函数的分布设是二维离散型随机变量,其概率分布为,又是一个二元函数,则也是一个一维离散型随机变量,设的所有可能取值为,则的概率分布为其中是指若有一些都使,则将这些对应的概率相加。例1设随机变量的概率分布如下表-1012-10.20.150.10.320.100.10.5求〔1的概率分布;〔2的概率分布解由的概率分布可得-2-101123410-1-2-20240.20.150.10.30.100.10.05把值相同项对应的概率值合并得〔1的概率分布为-2-1012340.20.150.10.400.10.05〔2的概率分布-2-101240.40.10.150.20.10.05例2:若和相互独立,且分别服从参数为的泊松分布,求的分布律.解:因所有可能取值为,故所有可能取值为,事件可以写成互不相容的事件之和,由相互独立,所以有这表明服从参数为的泊松分布。二、连续型随机变量的函数的分布设是二维连续型随机向量,其概率密度函数为,令为一个二元连续函数,则是一维连续随机变量,可用类似于求一维随机变量函数分布的分布函数法来求的分布.〔1>求分布函数其中,积分区域是由平面内由不等式所确定,即〔2>求概率密度,对几乎所有的z,有讨论和的函数及,的概率分布。1.的分布设是二维连续型随机向量,其概率密度函数为,则的分布函数为这里积分区域是直线左下方的半平面〔见图3-6即利用广义二重积分有〔3.1或〔3.2图3-6固定和,对式〔3.1中方括号内的积分作变量替换,令得由概率密度于分布函数的关系,可得的概率密度为〔3.3同理对式〔3.2作变量替换,又可写成〔3.4〔3.3式和〔3.4式可作为两个随机变量和的概率密度的一般公式。特别地,当和相互独立时,因为对于所有和有,其中分别是关于和的边缘概率密度,所以〔3.5〔3.6以上两个公式称为卷积公式,记作,即例3:设和是两个相互独立的随机变量.且均服从标准正态分布,求的概率密度。解:因及和相互独立,故由卷积公式得的概率密度为令得即一般,若相互独立,且由卷积公式可知仍然服从正态分布且这一结论还能推广到个相互独立的正态随机变量之和的情况,即且它们相互独立,则它们的和仍然服从正态分布,且有例4设随机变量与相互独立,其概率密度分别为,求随机变量的密度。解用两种方法求解方法1利用卷积公式由定义知,仅当即时上述积分的被积函数才不等于零,如图3-8知图3-8当时,当时,当时,故方法2先求的分布函数。由已知的概率密度为则的分布函数为当时,〔图3-9〔1图3-9〔1图3-8〔2当时,〔图3-9〔2当时,〔图3-9〔3综上得的分布函数图3-8〔3故的概率密度为2.,的分布设随机变量相互独立,其分布函数分别为和,和的分布函数分别记为,由于事件,而相互独立,所以事件与事件相互独立,由此可得由于事件,而相互独立,所以事件与事件相互独立,由此可得上述结果容易推广到个相互独立的随机变量的情况,设是个相互独立的随机变量,其分布函数分别为,,则的分布函数为的分布函数为特别地,当相互独立且具有相同分布函数时有,设系统由两个相互独立的子系统联接而成,联接的方式分别为〔1串联,〔2并联,〔3备用〔当系统损坏时,系统开始工作,如图3—9所示.设的寿命分别为,已知它们的概率密度分别为其中且试分别就以上三种联接方式写出的寿命的概率密度.解〔1串联的情况由于当中有一个损坏时,系统就停止工作,所以这是的寿命为由题设知,,的分布函数分布为于是,的分布函数为所以的概率密度为〔2并联的情况由于当且仅当都损坏时,系统才停止工作,所以这时的寿命为.于是,的分布函数为从而的概率密度为3>.备用时,由于当系统损坏时系统才开始工作,这时整个系统的寿命是和两者寿命之和,即由和相互独立,的概率密度当时,;当时,有例6:设随机变量相互独立且都服从具有同一参数的分布,试求的概率分布.解由于每个可能取的值为0,1,则所有可能取值为由相互独立知,以某一特定方式取〔如前个取1,后个取0的概率为.而取的两两互不相容的方式共有种,由概率的有限可加性有.即服从.反过来,可以证明,一个服从以为参数的二项分布的随机变量可以看作个相互独立且都服从参数为的分布的随机变量之和,即把一个随机变量分解成有限个随机变量之和,这是在处理概率论的有关问题时常用的方法.{了解商的分布:连续型随机变量商的分布于是练习1:设与相互独立,且均在区间上服从均匀分布,求的密度函数.解:解法二:由卷积公式,得为确定积分限,先找出被积函数不为零的区域2设某种商品一周的需要量是一个随机变量,其概率密度函数为如果各周的需要量相互独立,求两周需要量的概率密度函数.解 分别用和表示第一、二周的需求量则从而两周需求量利用卷积公式计算.当时,若则若则从而当时,若则若即则故从而第四章随机变量的数字特征前面讨论了随机变量的分布函数,从中知道随机变量的分布函数能完整地描述随机变量的统计规律性.但在许多实际问题中,人们并不需要去全面考察随机变量的变化情况,而只要知道它的某些数字特征即可.例如,在评价某地区粮食产量的水平时,通常只要知道该地区粮食的平均产量;又如,在评价一批棉花的质量时,既要注意纤维的平均长度,又要注意纤维长度与平均长度之间的偏离程度,平均长度较大,偏离程度小,则质量就较好.等等.实际上,描述随机变量的平均值和偏离程度的某些数字特征在理论和实践上都具有重要的意义,它们能更直接、更简洁更清晰和更实用地反映出随机变量的本质.本章将要讨论的随机变量的常用数字特征包括:数学期望、方差、相关系数、矩.第一节数学期望引例:某班有N个人参加数学考试,其中有个人得分,,,求该班学生的平均成绩。解:平均成绩为:若用X表示成绩,则,一、随机变量的数学期望平均值是日常生活中最常用的一个数字特征,它对评判事物、作出决策等具有重要作用.1定义设是离散型随机变量的概率分布为如果绝对收敛,则定义为随机变量的数学期望<又称均值>也就是说:离散型随机变量的数学期望是一个绝对收敛的级数和。注:2定义设是连续型随机变量,其密度函数为,如果反常积分绝对收敛,定义的数学期望为例1甲,乙两人进行射击,所得分数分别记为,它们的分布律分别为试评定他们的射击技术水平的高低.解:例2:某人每次射击命中目标的概率为,现连续向目标射击,直到第一次命中目标为止,求射击次数的数学期望.解设为直到第一次命中目标为止所进行的试验次数,则X取值为1,2,…,事件表示前次射击未命中目标,而第次射击命中目标.其概率为例3:设随机变量服从参数为的指数分布,求的数学期望.解:由题意,的概率密度为则例4:设随机变量X服从柯西分布,概率密度为求E<X>解:因反常积分不收敛,所以不存在例5:有2个相互独立工作的电子装置,它们的寿命服从同一指数分布,其概率密度为,若将这2个电子装置串联联接组成整体,求整体寿命<以小时计>的数学期望.解 的分布函数为的分布函数为因而的概率密度为于是的数学期望为二、随机变量函数的数学期望设是一随机变量,为实函数,则也是一随机变量,理论上,虽然可通过的分布求出的分布,再按定义求出的数学期望.但这种求法一般比较复杂.下面不加证明地引入有关计算随机变量函数的数学期望的定理.定理1设是一个随机变量,,且存在,则〔1若为离散型随机变量,其概率分布为则的数学期望为:〔2若为连续型随机变量,其概率密度为,则的数学期望为注:<i>定理的重要性:求时,不必知道的分布,只需知道的分布即可.<ii>上述定理可推广到二维以上的情形,即有定理2设是二维随机变量,,且存在,则〔1若为离散型随机变量,其概率分布为则的数学期望为〔2若为连续型随机向量,其概率密度为则的数学期望为例6:设随机变量X的概率分布为解法一:先求Y的概率分布故解法二例7:设二维随机变量的联合概率分布为:YX12121/81/21/41/8求的数学期望解:法1设,则的值为法2:2356的概率分布为2356例8:设国际市场上对我国某种出口商品的每年需求量是随机变量<单位:吨>,它服从区间上的均匀分布,每销售出一吨商品,可为国家赚取外汇3万元;若销售不出,则每吨商品需贮存费1万元,问应组织多少货源,才能使国家收益最大?解 设组织货源吨,显然应要求国家收益<单位:万元>是的函数表达式为设的概率密度函数为则于是的期望为记,,得,又故吨时,取极大值,也是最大值,因此组织3500吨商品为好.例9:设二维随机变量的概率密度为求数学期望解:<1>记,则<2>记注意:当我们求时,不必算出的概率密度,只把看成利用的概率密度来计算即可.四、数学期望的性质1.设是常数,则2.若是常数,则3.4.设独立,则;证:注:<1>由不一定能推出独立,<2>这个性质可推广到有限个随机变量之和的情形.例10:设X是随机变量,求的最小值解:记则令得又因所以时的最小值例11:设相互独立的随机变量的密度函数分别为.求解:例12:一载有20位乘客的客车自始发站开出,前方有10个车站可以下车.设每位乘客在各个车站下车是等可能的,并设各乘客是否下车相互独立.如果到达一站没有乘客下车就不停车,以表示停车的次数,求解:引入随机变量易知由题意由此进而练习1设一汽车沿一街道行使,需要通过三个设有红绿灯的路口,每盏红绿灯独立地以1/2的概率允许或禁止汽车通过.以X表示汽车首次遇到红灯前已通过的路口数,求的概率分布和数学期望.解:的可能取值为0,1,2,3设={汽车在第个路口遇到红灯}X的分布律为:2设<X,Y>在区域A上服从均匀分布,其中A为x轴,y轴和直线x+y+1=0所围成的区域。求,,解:===3设二维离散型随机向量<X,Y>的概率分布如下表所示,XY01200.100.250.1510.150.200.15求的数学期望解:列表<X,Y><0,0><0,1><0,2><1,0><1,1><1,2>X+Y012123Z01010-1p0.100.250.150.150.200.15得Z的分布律Z-101p0.150.450.40故4设随机变量的数学期望概率密度为,求a与b的值,并求分布函数.解 由题意知解方程组得当时,有所以第二节方差随机变量的数学期望是对随机变量取值水平的综合评价,而随机变量取值的稳定性是判断随机现象性质的另一个十分重要的指标.如:在实际问题中常关心随机变量与均值的偏离程度,可用表示,但不方便;所以通常用来度量随机变量与其均值的偏离程度。一、方差的定义1定义1设是一个随机变量,若存在,则称它为的方差,记为方差的算术平方根称为标准差或均方差,它与具有相同的度量单位,在实际应用中经常使用.2方差刻划了随机变量的取值与数学期望的偏离程度,它的大小可以衡量随机变量取值的稳定性.从方差的定义易见:<1>若的取值比较集中,则方差较小;<2>若的取值比较分散,则方差较大;如引例二、方差的计算1若是离散型随机变量,且其概率分布为则2若是连续型随机变量,且其概率密度为则3方差的简化公式:.4设随机变量具有数学期望方差称为X的标准化变量即的数学期望为0,方差为1.三、方差的性质1.设常数,则;2.若是随机变量,若是常数,则3.4.设是两个独立的随机变量,则证明:若独立,上式右端为0,则5.随机变量的方差,即充分性显然,必要性的证明略去.因,性质5说明,当方差为零时,随机变量以概率1集中在数学期望这一点上,即方差等于零的随机变量与以概率1等于常数的随机变量是一样的.它进一步说明方差是度量随机变量与它的数学期望的偏离程度的指标.四.下面求几个常用分布的数学期望和方差<1>分布设随机变量分布,其概率分布为则〔2泊松分布设随机变量X服从参数为泊松分布,其概率分布为,k=0,1,2,...<3>二项分布设,则可看作是个相互独立且都服从参数为的分布的随机变量之和,即因服从分布.故由于相互独立,于是<4>.均匀分布若,其概率密度为<5>.指数分布设随机变量服从参数为的指数分布,其概率密度为<6>.正态分布设随机变量,概率密度为注:服从正态分布的随机变量的概率密度中的两个参数和分别就是该随机变量的数学期望和均方差,因而服从正态分布的随机变量的分布完全可由它的数学期望和方差所确定.例1:设随机变量相互独立,且都服从参数为的指数分布,而是的算术平均值,求解:因,故所以例2设活塞的直径〔以cm计,气缸的直径相互独立,任取一只活塞,任取一只气缸,求活塞能装入气缸的概率.解 按题意需求由于故有练习1:设连续型随机变量的密度函数为:求解:2:设随机变量和相互独立,且,.求的概率密度解:由,,且和相互独立知服从正态分布,且.故,Z的概率密度为3:设随机变量服从参数为1的指数分布,求解:的密度函数为所以又所以第三节协方差及相关系数对多维随机变量,随机变量的数学期望和方差只反映了各自的平均值与偏离程度,并没能反映随机变量之间的关系.本节将要讨论的协方差是反映随机变量之间依赖关系的一个数字特征.一、协方差的定义1定义设为二维随机变量,若存在,则称其为随机变量和的协方差,记为,即2计算公式〔1若为离散型随机向量,其概率分布为则〔2若为连续型随机向量,其概率分布为则.〔3方差的计算化简.特别地,当与独立时,有二、协方差的性质1.协方差的基本性质,其中是常数;为任意常数;<6>若与相互独立时,则2.随机变量和的方差与协方差的关系特别地,若与相互独立时,则.三、相关系数的定义定义1设为二维随机变量,协方差存在,称为随机变量和的相关系数.有时也记为.注意:无量纲,相关系数与协方差之间相差一个常数特别地,当时,称与不相关.四、相关系数性质定理1:设是随机变量和的相关系数则〔1〔2的充要条件是,即和以概率1存在线性关系其中为常数,且时,时,<3>若和相互独立,则.即和不相关.证明:<1>设和的均方差分别为,则,所以又由于所以,故即<2>由方差的性质5,的充要条件是,由<1>的证明可知若,则,这等价于,即其中,则,这等价于,即其中故的充要条件是,且时,时,<3>若和相互独立,则故,于是.即和不相关.注:相关系数刻画了随机变量Y与X之间的"线性相关"程度.的值越接近1,Y与X的线性相关程度越高;的值越近于0,Y与Y的线性相关程度越弱.当时,Y与X的变化可完全由X的线性函数给出.当时,Y与X之间不是线性关系.例1:设随机变量和相互独立,都服从参数为的泊松分布,求随机变量和的相关系数.解:因故所以因而又所以例2:设随机变量和的方差都为1,其相关系数为0.25,求与的协方差解:因故例3:设二维随机变量在由轴,轴及直线所围成的区域上服从均匀分布,求和的相关系数.解:的概率密度为同理故,从而例4:设二维随机变量的概率分布为YX010010判断和是否不相关,是否相互独立?解:由的概率分布知-10101故和的边缘概率分布是01-101,由000-101000得的概率分布为-101故从而,所以和不相关.又可知所以和不是相互独立的.例5:设二维随机变量求证证明:由已知可求出:,注:<1>若与独立,则与不相关;但由与不相关,不一定能推出与独立。<2>在上一章中我们已经得到:若服从二维正态分布,那么和相互独立的充要条件为.现在知道即为与的相关系数,故有下列结论:"若服从二维正态分布,则与相互独立,与不相关".练习:1.设连续型随机变量的密度函数为求和.解 由的密度函数可求得其边缘密度函数分别为:于是从而又所以故2.已知,且与的相关系数设求及解 因且所以又因故第四节矩协方差矩阵一、原点矩和中心矩数学期望、方差、协方差是随机变量常用的数字特征,它们都是一些特殊的矩,矩是最广泛使用的数字特征.最常用的矩有两种,原点矩和中心矩.定义1设和是随机变量为正整数.〔1若存在,则称其为随机变量的阶原点矩.〔2若则称其为的阶中心矩<3>若存在,则称其为和的阶混合原点矩;<4>若存在,则称其为和的阶混合中心矩.注:<1>的数学期望是的一阶原点矩;<2>的方差是的二阶中心矩;<3>协方差是和的二阶混合中心矩.例1:设随机变量,求的二阶原点矩,以及三阶,四阶中心距.解:由题意知:,故三、协方差矩阵定义:设二维随机变量关于和的两个二阶中心矩和两个二阶混合中心矩都存在,即则称矩阵〔对称矩阵,为二维随机变量的协方差矩阵.类似设维随机变量关于的二阶中心矩和二阶混合中心矩都存在,则称矩阵为的协方差矩阵.为对称矩阵.例2:设二维随机变量写出的协方差矩阵.解:由因此,所以的协方差矩阵为引入下面的列向量和矩阵其中经计算得第五章大数定律与中心极限定理本章主要讨论概率论中的两类重要定理:一类是描述一系列随机变量的和的平均结果稳定性的大数定律;另一类是用来描述满足一系列随机变量和的分布以正态分布为极限的中心极限定理.§5.1大数定律前面我们提到过事件发生的频率具有稳定性,即随着实验次数的增加,事件发生的频率逐渐稳定于概率这个常数。在实践中我们还发现大量的随机现象的平均结果也具有稳定性,这种用极限方法研究大量独立随机试验的规律性的一系列定律称为大数定律。一、切比雪夫不等式定理1:设随机变量有期望和方差,则对于任给,有.上述不等式称切比雪夫不等式.证:切比雪夫不等式也可以写成注:<1>由切比雪夫不等式可以看出,若越小,则事件的概率越大,即,随机变量集中在期望附近的可能性越大.由此可见方差刻划了随机变量取值的离散程度.<2>当方差已知时,切比雪夫不等式给出了与它的期望的偏差不小于的概率的估计式.如取则有故对任给的分布,只要期望和方差存在,则随机变量取值偏离超过的概率小于0.111.切比雪夫不等式的应用:在随机变量的分布未知的情况下,只利用的期望和方差,即可对的概率分布进行估值。例1:200个新生婴儿中,估计男孩儿多于80个且小于120个的概率〔假定生男孩儿和生女孩儿的概率均为0.5。解:设表示男孩儿的个数,则用切比雪夫不等式估计故二、大数定理1定义:若对于任意,都相互独立,则称相互独立.2定义1设是一个随机变量序列,为一个常数,若对于任意正数,有则称序列依概率收敛于,记作的直观解释是:对任意,当充分大时,"与的偏差大于等于"这一事件发生的概率很小〔收敛于0,这里的收敛性是在概率意义上的收敛性。这就是说,不论给定怎样小的,与的偏差大于等于是可能的,但是当很大时,出现这种偏差的可能性很小,因此,当很大时,事件几乎是必然要发生的,这与高等数学中的序列收敛概念是不同的。依概率收敛的序列有如下性质:设又设函数在点连续,则.3定理2〔切比雪夫大数定律设随机变量序列相互独立,它们分别有有限的数学期望和方差,并且存在正数,使得则对任意给定的正数,有证明:因为由切比雪夫不等式得在上式中令n→∞,并注意到概率小于等于1,得切比雪夫大数定律表明:在定理所给条件下,随机变量序列的算术平均值序列依概率收敛于他们的数学期望的算术平均值。推论:〔切比雪夫大数定律的特殊情形推论表明:在独立同分布的条件下,随机变量的算数平均依概率收敛于它们的数学期望.这一推论是实际问题中使用算术平均值的依据,当我们要测量某一个量时,可以在不变的条件下重复测量次,得到个结果,可以认为分别是服从同一分布,有相同的数学期望和方差的随机变量的试验数值,由推论可知,当充分大时,取次测量结果的算术平均值作为的近似值,发生的误差很小.定理3<伯努利大数定律>设是次独立重复试验中事件发生的次数,是事件在每次试验中发生的概率,则对任意正数,有或.证:由于是次独立重复试验中事件发生的次数,因此是一个随机变量,且,从而有因根据切比雪夫不等式,对任意给定的正数,有令则或伯努利大数定律表明:一个事件在次独立重复试验中发生的频率依概率收敛于事件发生的概率,伯努利大数定律以严格的数学形式表达了频率的稳定性.从伯努利大数定律的等价形式可以看到当很大时,事件在次独立重复试验中发生的频率与在试验中发生的概率有较大偏差的可能性很小,在实际应用中,当试验次数很大时,便可以利用事件发生的频率来近似代替事件发生的概率.切比雪夫大数定律推论中要求随机变量的方差存在,但在这些随机变量服从同一分布的情况下,并不需要这些要求,有如下辛钦大数定律。定理4<辛钦Khintchine大数定律>:设随机变量相互独立,服从同一分布,且具有数学期望则对任意给定的正数,有.注:<1>定理不要求随机变量的方差存在;<2>伯努利大数定律是辛钦大数定律的特殊情况;<3>辛钦大数定律为寻找随机变量的期望值提供了一条实际可行的途径.例如,要估计某地区的平均亩产量,可收割某些有代表性的地块,如块,计算其平均亩产量,则当较大时,可用它作为整个地区平均亩产量的一个估计.此类做法在实际应用中具有重要意义.§5.2中心极限定理在客观实际问题中有许多随机变量,它们是大量的相互独立的随机变量的综合影响所形成的,其中的每一个因素在总的影响中所起的作用是微小的,这种随机变量往往近似地服从正态分布,这种现象正是中心极限定理的客观背景.定理1<独立同分布的中心极限定理>:设随机变量相互独立,服从同一分布,且具有数学期望和则随机变量<1>的分布函数对于任意实数满足定理表明:当充分大时,个具有数学期望和方差的独立同分布的随机变量之和近似服从正态分布.一般情况下,我们很难求出的分布的确切形式,但当很大时,可求出其近似分布.由定理结论有〔2即当充分大时,可以通过给出其近似的分布,这样可以利用正态分布对作理论分析和实际计算.对式〔2左端变形得到或所以定理1又可表述为:当充分大时,均值,方差为的独立同分布的随机变量的算术平均值近似地服从均值为,方差为的正态分布.这一结果是数理统计中大样本统计推断的理论基础.例1设随机变量相互独立,且都服从参数为的泊松分布,记,求的近似值.解易知由定理1,随机变量于是定理2〔李雅普诺夫定理设随机变量相互独立,它们具有数学期望和方差:,记若存在正数,使得当时,则随机变量之和的标准化变量的分布函数对于任意,满足证明略定理2表明,:在定理的条件下,随机变量当很大时,近似地服从正态分布.由此,当很大时,近似地服从正态分布.这就是说,无论各个随机变量服从什么分布,只要满足定理的条件,那么它们的和当很大时,就近似地服从正态分布.在许多实际问题中,所考察的随机变量往往可以表示成很多个独立的随机变量之和,例如一个实验中的测量误差是由许多观察不到的、可加的微小误差所合成的,它们往往近似服从正态分布。定理3棣莫佛—拉普拉斯〔DeMoirre-Laplas定理设随机变量服从二项分布,则对任意数,有证明我们可以将看成是个相互独立,且服从同一分布的随机变量之和,即有,其中的概率分布为由于由定理1得定理3是定理1的特殊情况,它表明:正态分布是二项分布的极限分布,当充分大时,由服从随机变量作出的标准化随机变量的分布,可用标准正态分布近似代替,从而解决了二项分布的计算问题。例2据统计,某年龄段保险者中,一年内每个人死亡的概率为0.005,现在有10000个该年龄段的人参加人寿保险,试求未来一年内在这些保险者里面死亡人数不超过70个人的概率。解设表示10000个投保者在一年内死亡人数,由题意知,由棣莫佛—拉普拉斯定理近似计算例3某车间有200台车床,在生产期间因各种原因,常需车床停工,设开工率为0.6〔即平均60%的时间工作,设每台车床的工作是独立的,且在开工时需电力1千瓦,问应供应多少千瓦电力就能以99.9%的概率保证该车间不会因供电不足而影响生产.解对每台车床的观察作为一次试验,每次试验观察该台车床在某时刻是否工作,工作的概率为0.6,共进行200次试验。用表示在某时刻工作看的车床数,则。现在的问题是:求满足的最小的,由定理3知近似服从于是由,且查标准正态分布表〔附表3得,故,解得即所求,即供应142千瓦电力就能以99.9%的概率保证该车间不会因供电不足而影响生产。注:用中心极限定理估计要比切比雪夫不等式估计要准,事实上,切比雪夫不等式的估计只给出了这个概率的下限。另外正态分布和泊松分布都是二项分布的极限分布,一般说来,对于很大,很小〔通常而的情形的二项分布,用泊松分布近似比用正态分布计算精确,用正态分布近似只以为条件.练习1:已知正常男性成人血液中,每一毫升白细胞数平均是,均方差是.利用切比雪夫不等式估计每毫升白细胞数在之间的概率.解:设表示每毫升血液中含白细胞个数,则故2:独立地掷6颗骰子,点数之和记为,试用切比雪夫不等式估计解:则从而第六章数理统计的基本知识数理统计的内容主要包括以下两个方面:一、如何收集、整理数据资料;二、如何对所得的数据资料进行分析、研究,从而对所研究的对象的性质、特点作出推断.后者就是我们所说的统计推断问题.本书只讲述统计推断的基本内容,即数理统计的基本知识、参数估计、假设检验、方差分析及回归分析等.在概率论中,我们是在假设随机变量的分布已知的前提下去研究它的性质、特点和规律性,例如介绍常用的各种分布、讨论其随机变量的函数的分布、求出其随机变量的数字特征等.在数理统计中,我们研究的随机变量,其分布是未知的,或者是不完全知道的,人们是通过对所研究的随机变量进行重复独立的观察,得到许多观察值,对这些数据进行分析,从而对所研究的随机变量的分布作出种种推断的.本章我们将介绍总体、随机样本及统计量等基本概念,并着重介绍几个常用统计量及抽样分布.§6.1随机样本一、总体与总体分布1.总体:将研究对象的某项数量指标的值的全体称为总体.总体中的每个元素称为个体.总体中所包含的个体的个数称为总体的容量.容量为有限的称为有限总体.否则称为无限总体.注:有些有限总体,它的容量很大,我们可以认为它是一个无限总体.例如考察全国正在使用的某种型号灯泡的寿命所形成的总体,由于个体的个数很多,就可以认为是无限总体.在总体中,由于每个个体的出现是随机的,所以研究对象的该项数量指标X的取值就具有随机性,X是一个随机变量.因此,我们所研究的总体,即研究对象的某项数量指标X,它的取值在客观上有一定的分布.我们对总体的研究,就是对相应的随机变量X的分布的研究.X的分布函数和数字特征就称为总体的分布函数和数字特征,今后将不区分总体与相应的随机变量,笼统称为总体X.二、样本与样本分布在实际中,总体的分布一般是未知的,或只知道它具有某种形式,其中包含着未知参数.在数理统计中,人们都是通过从总体中抽取一部分个体,然后根据获得的数据来对总体分布得出推断的,被抽出的部分个体叫做总体的一个样本.从总体抽取一个个体,可以看作是对代表总体的随机变量X进行一次试验〔或观测,得到X的一个试验数据〔或观测值.从总体中抽取一部分个体,就看作是对随机变量X进行若干次试验〔或观测,得到X的一些试验数据〔或观测值.从总体中抽取若干个个体的过程称为抽样.抽样结果得到X的一组试验数据〔或观测值称为样本.样本中所含个体的数量称为样本容量.为了使样本能很好地反映总体的情况,从总体中抽取样本,必须满足下述两个条件:1.代表性因抽取样本要反映总体,自然要求每个个体和总体具有相同分布.2.独立性各次抽取必须是相互独立的,即每次抽样的结果既不影响其他各次抽样的结果,也不受其他各次抽样结果的影响.这种随机的、独立的抽样方法称为简单随机抽样.由此得到的样本称为简单随机样本.从总体中进行放回抽样,显然是简单随机抽样,得到的是简单随机样本.从有限总体中进行不放回抽样,显然不是简单随机抽样,但是当总体容量N很大而样本容量较小时,也可以近似地看作是放回抽样,即可以近似地看作是简单随机抽样,得到的样本可以近似地看作是简单随机样本.注:从总体抽取容量为的样本,就是对代表总体的随机变量X在相同条件下随机地、独立地进行次试验〔或观测,将次试验结果按试验的次序记为.由于是对随机变量试验的结果,且各次试验是在相同条件下独立地进行的,所以可认为是相互独立的,且与总体服从相同的分布.定义1:设总体是具有某一分布函数的随机变量,如果随机变量相互独立,且都与具有相同的分布,则称为来自总体的简单随机样本,简称样本.称为样本容量.在对总体进行一次具体的抽样并做观测之后,得到样本的确切数值,称为样本观察值〔或观测值,简称为样本值.如果总体的分布函数为,则样本的联合分布函数为如果总体是离散型随机变量,且概率分布为则样本的联合概率分布为如果总体是连续型随机变量,且具有概率密度,则样本的联合概率密度为三、统计推断问题简述总体和样本是数理统计中的两个基本概念.样本来自总体,自然带有总体的信息,从而可以从这些信息出发去研究总体的某些特征〔分布或分布中的参数.另一方面,由样本研究总体可以省时省力〔特别是针对破坏性的抽样试验而言.我们称通过总体的一个样本对总体的分布进行推断的问题为统计推断问题.总体、样本、样本值的关系:总体↙↖推断〔个体样本→样本值抽样在实际应用中,总体的分布一般是未知的,或虽然知道总体分布所属的类型,但其中包含着未知参数.统计推断就是利用样本值对总体的分布类型、未知参数进行估计和推断.为对总体进行统计推断,还需借助样本构造一些合适的统计量,即样本的函数,下面将对相关统计量进行深入的讨论.例1:设总体服从正态分布,概率密度为则其样本的联合概率密度为§6.2抽样分布样本是进行统计推断的依据.在应用时,往往不是直接使用样本本身,而是针对不同的问题构造样本的适当函数,利用这些样本的函数进行统计推断.一、统计量的概念定义1:设是来自总体的一个样本,是的函数,若中不含未知参数,则称是一个统计量.设是相应于样本的样本值,则称为的观察值.注:统计量是随机变量.不一定和总体同分布,不同的统计量有不同的分布.二、常用的统计量1.样本均值观测值记为2.样本方差观测值记为3.样本标准差观测值记为4.样本<k阶>原点矩观测值记为5.样本<k阶>中心矩观测值记为注:〔1上述五种统计量可统称为矩统计量,简称为样本矩,它们都是样本的显示函数,它们的观察值仍分别称为样本均值、样本方差、样本标准差、样本<k阶>原点矩、样本<k阶>中心矩.〔2样本的一阶原点矩就是样本均值,样本一阶中心矩恒等于零,三、矩估计法的理论根据若总体的阶矩存在,则当时证:独立且与同分布独立且与同分布.故有从而由第五章的大数定理知进而由第五章中关于依概率收敛的序列的性质知道其中为连续函数,这就是下一章所要介绍的矩估计法的理论根据。例1:从一批袋装糖果中随机抽取8袋,测得其质量〔单位:为:230,243,185,240,228,196,246,200<1>写出总体、样本、样本值及样本容量.<2>求样本均值、样本方差及样本二阶原点矩.解<1>总体:袋装糖果质量;样本:8袋袋装糖果的质量样本值:样本容量:<2>样本均值样本方差样本二阶原点矩例2:设总体服从参数为的泊松分布,记作,从总体中抽取样本,和分别为样本均值和样本方差.求.解:由已知有且因三、抽样分布统计量的分布为抽样分布.<一>、分布1.定义2设是取自总体的样本,则称统计量为服从自由度为的分布,记为这里,自由度是指上式右端所包含的独立变量的个数.2.分布的概率密度:其中为Gamma函数,具有<1><2><3>的图形如下3.分布的数学期望与方差:若,则证:故所以又由于相互独立,所以也相互独立于是4.分布的可加性:若且和相互独立,则5.分布的分位点定义:设,对给定的正数称满足条件的点为分布的上分位点.简称为上侧分位点.如图就是使得图中阴影部分的面积为时,在轴上所确定出来的点.对于不同的与,上分位点的值已制成表格,可以查用〔见附表4.但该表只详列到为止,费歇曾证明,当充分大时,有当时,可利用此式求得分布的上分位点的近似值.其中是标准正态分布的上分位点,可按如下定义.6.标准正态分布的上分位点定义;设,对给定的正数若满足条件即,则称点为标准正态分布的上分位点标准正态分布的上分位点可自附表3查得.如,设,满足的点查附表3知.7.标准正态分布的双侧分位点定义:设,对给定的正数,若满足条件即,则称点为标准正态分布的双侧分位点.注:求双侧分位点,即是求上分位点.例如,设满足的,查附表3可得<二>、t分布1、定义2设,且与相互独立,则称服从自由度为的分布,记为,2、分布的概率密度:3、分布具有如下性质:〔1.的图形关于纵轴对称,且;〔2.当充分大时,分布近似于标准正态分布;4、分布的分位点:设,对给定的实数称满足条件的点为分布的上分位点.5、由密度函数的对称性,注:由分布上分位点的定义及图形的对称性知分布的上分位点可通过附表5查得.在时,就用标准正态分布的上分位点近似:6、分布的双侧分位数设,对给定的实数称满足条件点为分布的上分位点.显然有对不同的与,分布的双侧分位数可从附表查得.<三>、分布1定义3设且与相互独立,则称服从自由度为的分布,记为2、分布的概率密度:3、分布具有如下性质:〔1.若,则〔2.若则4.分布的分位数:设,对给定的实数称满足条件的点为分布的上分位点.分布的上侧分位数的可自附表查得.5.分布的一个重要性质:证明:此式常常用来求分布表中没有列出的某些上侧分位数.如:<四>、正态总体的样本均值与方差的分布定理1设是总体的样本,是样本均值则证:因为随机变量相互独立且与总体所以于是推论:设总体是取自的一个样本,则有定理2设总体是取自的一个样本,与分别为该样本的样本均值与样本方差,则有<1><2>与相互独立.定理3设总体是取自的一个样本,与分别为该样本的样本均值与样本方差,则有证:由定理1知,统计量又由定理2知,统计量因为与相互独立,所以与也相互独立于是,由分布的定义可知,统计量定理4设,是两个相互独立的正态总体,又设是取自总体的样本,与分别为该样本的样本均值与样本方差.是取自总体的样本,与分别为此样本的样本均值与样本方差.再记是与的加权平均,即则<1>证明:统计量,且与相互独立,由正态分布的性质知即推论:在定理4的条件下,如果则随机变量<2>当时,证:由定理4推论可知,统计量又由定理2知因为与相互独立,所以由分布的可加性可知统计量因为与相互独立,与相互独立所以统计量与也相互独立于是,由分布定义可知,统计量<3>证:且相互独立,由分布的定义有例3:从正态总体中抽取容量为的样本,求样本均值落在区间内的概率.解:由于例4:设是来自正态总体的样本,求概率解:由知,因此练习1设是来自总体的样本,又设试求常数C,使服从分布.解:因所以且它们相互独立故应取,从而2设总体X服从标准正态分布,是来自总体X的一个简单随机样本,试问统计量服从何种分布?解:因为,且与相互独立所以3设为X的一个样本,求:<1>样本均值的数学期望与方差;<2>解:〔1由于所以于是〔2得4设两个总体X与Y都服从正态分布,今从总体X与Y中分别抽得容量的两个相互独立的样本,求解:由已知得:于是第七章参数估计在实际问题中,当所研究的总体分布类型已知,但分布中含有一个或多个未知参数时,如何根据样本来估计未知参数,这就是参数估计问题.参数估计问题分为点估计问题与区间估计问题两类.所谓点估计就是用某一个函数值作为总体未知参数的估计值;区间估计就是对于未知参数给出一个范围,并且在一定的可靠度下使这个范围包含未知参数.例如,灯泡的寿命是一个总体,根据实际经验知道,服从,但对每一批灯泡而言,参数是未知的,要写出具体的分布函数,就必须确定出参数.此类问题就属于参数估计问题.参数点估计问题的一般提法:设有一个统计总体,总体的分布函数为,其中为未知参数<可以是向量>.现从该总体中随机地抽样,得一样本,是相应的一个样本值.点估计问题是用样本构造一个适当的统计量来估计参数,称为的估计量.估计量的值称为为的估计值§7.1点估计一、矩估计法1定义:设总体的分布函数中含有个未知参数,如果总体的阶原点矩存在,记为样本k阶原点矩,即解得并以作为的估计量,则称量,这种参数估计法称为参数的矩估计法,简称矩法。注:估计量是一个随机变量,是样本的函数,即是一个统计量,对不同的样本值,的估计值一般是不同的.矩估计法的基本思想是用样本矩估计总体矩.因为由大数定理知,当总体的k阶矩存在时,样本的k阶矩依概率收敛于总体的k阶矩.例如,可用样本均值作为总体均值的估计量,一般地,记总体阶矩样本阶矩;用相应的样本矩去估计总体矩的方法就称为矩估计法.用矩估计法确定的估计量称为矩估计量.相应的估计值称为矩估计值.矩估计量与矩估计值统称为矩估计.例1设总体的均值及方差都存在,且有,但均为未知,又设是来自的样本.试求的矩估计量.解:令解之得结论:不管总体服从何种分布,总体期望和方差的矩估计量分别为样本均值、样本二阶中心矩,即估计值例2:用一个仪器测量某零件的长度,设零件测得长度服从正态分布,现进行五次测量,其结果如下:92,94,103,105,106.求总体中参数与的矩估计值.解:由例1知的矩估计量分别为与,故的矩估计值分别为与,即例3:设总体在上服从均匀分布,未知.是来自的样本,试求的矩估计量.解:法1由在上服从均匀分布知由上例样本均值及二阶中心矩分别是总体均值及总体方差的矩估计量.故有,解得的矩估计量分别是,法2:即解得注意到以代替得到的矩估计量分别为例4:设总体X服从指数分布,其概率密度函数其中,是未知参数.是来自总体X的样本,求参数的矩估计量解:法1:由,故由矩估计法知解得,则参数的矩估计量为法2:由例1,,解得参数的矩估计量为矩估计的优点是:简单易行,不需要事先知道总体是什么分布。缺点是:当总体的分布类型已知时,未充分利用分布所提供的信息;此外,一般情形下,矩估计不具有唯一性。而总体矩未必存在。二、极大似然估计法极大似然估计法是在总体的分布类型已知前提下,使用的一种参数估计法.一个随机试验如果有若干个可能的结果,而在一次试验中,结果出现,则一般认为试验条件对出现有利,也即出现的概率最大.在随机试验中,许多事件都有可能发生,概率大的事件发生的可能性也大。若在一次试验中,某事件发生了,则有理由认为此事件比其他事件发生的概率大,这就是所谓的极大似然原理。极大似然估计法就是依据这一原理得到的一种参数估计方法例5:设有外形完全相同的两个箱子,甲箱有99只白球1只黑球,乙箱有1只白球99只黑球.今随机地抽取一箱,再从取出的一箱中抽取一球,结果取得白球.问这球从哪一个箱子中取出?解由概率论知甲箱中抽得白球的概率.乙箱中抽得白球的概率,由此看到,这一白球从甲箱中抽出的概率比从乙箱中抽出的概率大得多.根据极大似然原理,既然在一次抽样中抽得白球,当然可以认为是从概率大的箱子中取出的.所以我们做出统计推断是从甲箱中取出的.这一推断也符合人们长期的实践经验.该问题转化为参数估计问题,则应取参数的估计值为例6:设某车间生产一批产品,要估计这批产品的不合格品率.解用表示一件产品是合格品或不合格品.表示这件产品是不合格品.表示这件产品是合格品.则的概率分布为这里为不合格品率.我们从中取一个容量为的样本,样本取观察值的概率为其中或显然这概率可以看作是未知参数的函数,用表示,称作似然函数,即在一次抽样中获得这一组特殊观察值的概率应该最大,也即似然函数应该达到最大值.所以我们以使达到最大的值作为参数的一个估计值是合理的.由于对数函数是的单调增函数,所以与在同一个值上达到最大.对求导,并令其等于零,得,于是得方程解得不难验证,它使达到最大,称为参数的极大似然估计值.相应的统计量为,称作参数的极大似然估计量.求极大似然估计法的基本思想是:选择的值,使抽得的样本观测值出现的可能性最大.用这个值作为未知参数的估计值,从而得到它的估计量.这种求估计量的方法称为极大似然估计法.下面分别就离散型总体和连续型总体情形作具体讨论.1.总体为离散型设总体的概率分布为其中为未知参数.是取自总体的样本,样本的观察值为,则样本的联合概率分布为给定样本值后,令它是未知参数的函数,记为,并称其为的似然函数.若有使则称为的极大似然估计值.称相应的统计量为极大似然估计量.它们统称为的极大似然估计求最大似然估计的一般方法求未知参数的极大似然估计问题,归结为求似然函数的最大值点的问题.当似然函数关于未知参数可微时,可利用微分学中求最大值的方法求.主要步骤:<1>写出似然函数;<2>令或,求出驻点;注:因函数是L的单调增加函数,且函数与函数有相同的极值点,故常转化为求函数的最大值点较方便.<3>判断并求出最大值点,在最大值点的表达式中,用样本值代入就得参数的极大似然估计值.注:<1>当似然函数关于未知参数不可微时,只能按极大似然估计法的基本思想求出最大值点。<2>上述方法易推广至多个未知参数的情形.<3>称为似然方程,称为似然方程组例7:设总体服从参数泊松分布,是取自总体的样本,求参数的极大似然估计量.解:的概率分布为设为样本的观察值,则的似然函数为对数似然函数为似然方程为得的极大似然估计值为故的极大似然估计量2.总体为连续型设总体的概率密度为,其中为未知参数,是取自总体的样本,则样本的联合概率密度为设样本的观察值为.因为连续型随机变量取某个定值的概率为0,这就导致了对任意的,均有故我们必须设法避开这一技术性的困难.考虑落在点的邻域〔边长为的维立方体内的概率近似地为它是的函数.极大似然估计的思想就是选取使得样本落在观察值的邻域内的概率达到最大的数值作为参数的估计值,但因子不随而变化,故只需考虑函数,即样本的联合概率密度.称为似然函数.若有使得则称为参数的极大似然估计值,称为极大似然估计量.其中参数可以是向量.同离散型一样,解似然方程,可得的极大似然估.例8:设是正态总体的样本观察值,其中是未知参数,试求和的极大似然估计量.解:总体的概率密度为似然函数为对数似然函数为似然方程组为由第一个方程,得到代入第二方程,得到参数和2的极大似然估计量分别为例9:设总体在上服从均匀分布,未知,是一个样本值.试求的极大值似然估计量.解:设总体的概率密度为:因此似然函数在参数及时,似然函数的偏导数不为0,可按极大似然法的基本思想确定的最大值.令练习1设总体X的概率密度为其中是未知数,是取自X的样本,求参数的矩估计.解 数学期望是一阶原点矩其样本矩为而即为的矩估计2设总体X的概率分布为其中为未知参数.现抽得一个样本求的矩估计值.解 先求总体一阶原点矩一阶样本矩由得推出所以的矩估计值第二节估计量的评选标准同一参数可以有几种不同的估计,这时就需要判断采用哪一种估计为好的问题。另一方面,对于同一个参数,用矩法和极大似然法即使得到的是同一个估计,也存在衡量这个估计优劣的问题。估计量的评选标准就是:评价一个估计量"好"与"坏"的标准。评价一个估计量的好坏,不能仅仅依据一次试验的结果,而必须由多次试验结果来衡量.因为估计量是样本的函数,是随机变量.故由不同的观测结果,就会求得不同的参数估计值.因此一个好的估计,应在多次重复试验中体现出其优良性.估计量的评价一般有三条标准:1.无偏性;2.有效性;3.相合性〔一致性一.无偏性估计量是随机变量,对于不同的样本值会得到不同的估计值.一个自然的要求是希望估计值在未知参数真值的附近,不要偏高也不要偏低.由此引入无偏性标准.定义1设是未知参数的估计量,若则称为的无偏估计量.若称为有偏估计量,的偏差.如果是有偏估计量,注:无偏性是对估计量的一个常见而重要的要求,其实际意义是指估计量没有系统偏差,只有随机偏差.在科学技术中,称为用估计而产生的系统误差.定理1设为取自总体的样本,总体的均值为,方差为.则<1>样本均值是的无偏估计量;<2>样本方差是的无偏估计量;<3>样本二阶中心矩是的不是无偏估计量.,是渐近无偏估计量证明:<1>因为独立同分布,且所以故是的无偏估计量;<2>因注意到于是,有故样本方差是的无偏估计量;<3>故是的有偏估计量.故是的渐近无偏估计量.二.有效性一个参数常有多个无偏估计量,在这些估计量中,自然应选用对的偏离程度较小的为好,即一个较好的估计量的方差应该较小.由此引入评选估计量的另一标准—有效性.定义2设和都是参数的无偏估计量,若,则称较有效.例1:设是总体的样本,证明都是总体均值的无偏估计量,并比较哪个更有效.解:故,都是总体均值的无偏估计量则,故较更有效三.一致性<相合性>我们不仅希望一个估计量是无偏的,并且具有较小的方差,还希望当样本容量无限增大时,估计量能在某种意义下任意接近未知参数的真值,由此引入相合性<一致性>的评价标准.定义3设为未知参数的估计量,若当时,依概率收敛于,即对任意,有或则称为的一致估计量.例2:证明样本阶原点矩是总体阶原点矩的一致估计量.证明:样本阶原点矩依概率收敛于总体阶原点矩即对任意的,有所以是总体的一致估计量.注:1样本方差是总体方差的一致估计量.由于样本阶原点矩与样本方差分别作为总体阶原点矩与总体方差的估计是无偏的、一致的,因此是较好的估计,2.若是连续函数,是的一致估计量,则是的一致估计量,所以用矩估计法确定的统计量一般是一致估计量.人们还证明了在相当广泛的情况下,极大似然估计量也是一致估计量.第三节区间估计点估计是利用样本计算出的值来估计未知参数.其优点是:可直地告诉人们"未知参数大致是多少";缺点是:并未反映出估计的误差范围<精度>.故在使用上还有不尽如人意之处.而区间估计正好弥补了点估计的这一不足之处.例如,在估计某湖泊中鱼的数量的问题中,若根据一个实际样本,利用最大似然估计法估计出

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论