概率论与数理统计PPT完整全套教学课件

上传人：b*** IP属地：浙江上传时间：2023-07-03 格式：PPTX 页数：205 大小：2.73MB 积分：35 举报 版权申诉

已阅读5页，还剩200页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

概率论与数理统计第1章随机事件第2章随机变量第3章多维随机变量第4章随机变量的数字特征第5章大数定律与中心极限定理第6章样本及抽样分布第7章参数估计第8章假设概念1.2随机事件的概率1.31.4条件概型与乘法公式1.5全概率公式与贝叶斯公式第一章随机事件古典概型与几何概型独立性随机事件1.61.1概率论与数理统计是现代数学的一个重要分支，它是研究随机现象统计规律的一门学科.该学科的应用遍布各个领域，已成为科技工作者和经济管理工作者必备的数学工具.本章通过随机试验，介绍概率论中样本空间、随机事件及概率等基本概念，讨论概率的性质及计算方法，为本门课程的学习打好基础.章前导读第一章随机事件70%在自然界及人类社会活动中可以观察到很多现象，但从其结果能否确定的角度概括起来无非两类现象.一类是在一定条件下，事件未发生之前就确定出现什么结果的现象，称为确定性现象或必然现象.例如树上熟透了的苹果总是落到地上，将一块石头向上抛必然会下落等.另一类是在一定条件下，事件未发生之前不能确定出现什么结果的现象，称为随机现象或偶然现象.例如从装有不同颜色小球的黑盒子中摸球，摸出的球是什么颜色？掷一枚质地均匀的硬币时，是正面朝上还是反面朝上？仅就一次或少数几次实验而言，随机现象似乎带有偶然性或不确定性.但经过人们长期的实践和研究后，发现随机现象在大量重复试验中，它的每种可能出现的的结果呈现某种规律性，下面这个著名的例子就表明了这种规律性.例如，均匀的硬币抛掷足够多次数，出现正面向上和反面向上的次数比例近似1∶1，且掷的次数越多，越接近这个比例.历史上多位数学家作过抛掷一枚均匀硬币的试验（见表1-1）.1.1随机事件1.1.1随机现象70%在一定条件下，随机现象有多种可能的结果发生，事先不能预知将出现哪种结果，但通过大量的重复观察，出现的结果会呈现出某种规律，称为随机现象的统计规律性.概率论与数理统计就是研究和揭示随机现象统计规律性的一门数学学科.1.1随机事件1.1.1随机现象70%要想了解随机现象的统计规律性，就必须在相同的条件下，对随机现象进行观察或者进行科学实验，概率论和数理统计学中把这种观察和科学实验统称为试验.例如：E1：记录某种产品的使用寿命；E2：记录某位播音员在某次播音节目中发音的错误次数；E3：观察某一路段在一段时间内出现交通事故的次数；E4：记录某一运动员在十次投篮中投中的次数.上述试验具有以下共同特征：（1）重复性.试验可在相同条件下重复进行；（2）观察性.试验的可能结果不唯一，但能事先明确试验的所有可能结果；（3）随机性.每次试验只会出现一种结果，但出现哪一种结果，在试验前不能确定.1.1随机事件1.1.2随机试验、样本空间70%我们把具有上述三个特征的试验称为随机试验，简称试验，记为E.本书后面所提到的试验皆指随机试验.做试验的目的在于研究试验结果出现的统计规律性，尽管在每次试验之前不能预知试验的结果，但试验的所有可能结果组成的集合是已知的.在统计学中，我们把随机试验的每一个可能结果称为一个样本点，记为ω.全部可能结果，即所有样本点全体构成的集合称为这个随机试验的样本空间，记为Ω，Ω=ω.对于一个具体的问题，确定一个相应的样本空间是研究随机现象的第一步.由此可见，由于所考察的随机试验不同，因而相应的样本空间可能很简单也可能很复杂.但是即使在同一随机试验中，由于试验的目的不同，样本点和样本空间都可能不相同，例如例2和例3中同是将一枚硬币抛两次，但是由于试验的目的不一样，样本空间就不一样.从上面的例子还可以看出，有的样本空间是数集，有的样本空间不是数集，有的样本空间是有限集，有的样本空间是无限集.1.1随机事件1.1.2随机试验、样本空间70%1.随机事件的概念随机试验E的样本空间Ω的子集，称为随机事件，简称为事件，通常用大写字母A，B，C等表示，也可以用语言描述加花括号表示.例如E2中，｛出错次数不超过两次｝就是一个随机事件.在每次试验中，当且仅当这一子集A中的一个样本点出现时，称事件A发生，否则称事件A没有发生.例如抛掷一颗质地均匀的骰子，若用A表示｛出现奇数点｝，则A={1，3，5}，这是一个随机事件，它在一次试验中可能发生，也可能不发生.当且仅当掷出的点数是1，3，5中的任意一个数时，A事件发生.下面介绍几个特殊的随机事件.基本事件由一个样本点构成的事件称为基本事件，记为{ωi}.如例1中的试验有两个基本事件：{H}，{T}.必然事件每次试验中都必然发生的事件称为必然事件.样本空间Ω包含所有的样本点，它是Ω自身的子集，每次试验中都必然发生，故它就是一个必然事件，因而必然事件也用Ω来表示.不可能事件每次试验中都不可能发生的事件称为不可能事件.空集Ø不包含任何样本点，它作为样本空间的子集，在每次试验中都不可能发生，故Ø就是一个不可能事件.因而不可能事件也用Ø来表示.1.1随机事件1.1.3随机事件的概念、关系与运算70%严格说来必然事件和不可能事件不具有随机性，但是，为了使随机事件的集合更完善，我们规定必然事件和不可能事件也是随机事件.2.随机事件间的关系在研究随机现象时，我们看到，同一个试验下可以有很多随机事件，其中有些随机事件比较简单，有些随机事件则比较复杂.为了从较简单事件发生的规律来寻求较复杂事件发生的规律，我们需要研究同一试验下各种事件间的关系和运算.1.1随机事件1.1.3随机事件的概念、关系与运算3.随机事件间的运算设Ω是给定试验的样本空间，）都是事件A，B，C，Ak（k=1，2，…Ω的子集（1）和事件（2）积事件（3）差事件（4）逆事件（5）完备事件组1.1随机事件1.1.3随机事件的概念、关系与运算70%4.随机事件的运算律与集合的运算相似!可以验证事件间的运算满足如下运算规律'1.1随机事件1.1.3随机事件的概念、关系与运算上述各运算律可以推广到有限个或可数个事件的情形!70%1.概率的描述定义对于随机试验，仅仅了解样本空间是不够的，我们更关心某些结果出现的可能性大小，希望对这种可能性大小进行定量描述，进而找出这些事件内在的统计规律.定义1随机事件A发生的可能性大小，称为事件A发生的概率，记为P（A）.显然，P（Ø）=0，P（Ω）=1，0≤P（A）≤1.但定义1没有给出P（A）的具体数值.2.概率的统计定义在相同条件下将试验重复进行n次，在n次重复试验中，随机事件A发生的次数记为rn（A），则事件A发生的频率随机事件在一次试验中是否发生不确定，但在大量重复试验中它的发生具有统计规律性.由表1-1可看出，在大量重复试验中，某个事件A发生的频率是稳定的，其数值在某个确定的常数附近摆动.随着重复试验的次数n的增加，事件A发生的频率越来越趋近于这个确定的常数.随机事件A发生的可能性大小就是这个频率的稳定中心.1.2随机事件的概率1.2.1概率的定义70%定义2在相同条件下重复进行n次试验，若当试验的重复次数充分多时，事件A发生的频率fn（A）稳定地在某常数p附近波动，并随着试验次数的增大逐渐稳定于p，则称常数p为事件A的概率，记为P（A）.概率的统计定义不能确定试验次数为多少时，我们才能得到概率的数值，且有些试验不能大量进行，但可用试验次数n较大时的频率作为概率的估计值.频率具有下列性质：概率是频率的稳定中心，频率满足的性质概率也应该满足.1.2随机事件的概率1.2.1概率的定义70%3.概率的公理化定义定义3设Ω是随机试验E的样本空间，若对于E的每一个随机事件A，都有一个实数P（A）与A对应，且满足以下三条公理.1.2随机事件的概率1.2.1概率的定义70%1.2随机事件的概率1.2.2概率的性质利用公理化定义中的三条公理!我们可以推导出概率的几个重要性质!1.2随机事件的概率1.2.2概率的性质这是互斥事件的加法公式.性质3：对任一事件A，有70%1.3古典概型与几何概型1.3.1古典概型（1）每次试验中，可能发生的结果只有有限个，即（2）每次试验中!每一种结果发生的可能性相同，即显然，由上式定义的概率满足概率的公理化定义及其导出的基本性质.70%显然，由上式定义的概率满足概率的公理化定义及其导出的基本性质.在计算古典概率下的事件概率时，首先要利用排列、组合及乘法原理、加法原理的知识确定样本空间的基本事件总数，然后在样本空间中找寻事件A包含的基本事件数，进而求得相应的概率.排列，组合的基本概念（1）加法原理（2）乘法原理（3）排列（4）组合1.3古典概型与几何概型1.3.1古典概型70%条件概率是一个重要的概念，它是在已知事件A发生的条件下事件B发生可能性大小的客观度量，记为P（BA）.由于诸事件之间往往有一定联系，因而事件A发生以后，事件B发生的概率可能会发生变化1.4条件概型与乘法公式1.4.1条件概率70%1.4条件概型与乘法公式1.4.2乘法公式由条件概率的定义，我们可以得到下面的定理：定理1设有随机事件A和B，若P（A）>0，则70%对于一些简单的事件，我们可以利用概率性质及公式计算其概率.对于较复杂事件的概率，在计算中往往把它分解为若干个互斥的较简单事件之和.先求出这些较简单事件的概率，再利用概率的有限可加性及乘法公式得到所求事件的概率，这就是全概率公式的思想.1.5全概率公式与贝叶斯公式1.5.1全概率公式70%1.5全概率公式与贝叶斯公式1.5.2贝叶斯公式理论和实际中经常见到这样一类问题：某复杂事件B已发生，且是由若干“原因”事件Ai，i=1，2，…，n引起的.若已知各种“原因”事件发生的概率P（Ai），求其中某个“原因”发生的条件概率P（Ai︱B）是多少？解决这一问题的公式就是下面介绍的另一重要公式——贝叶斯公式.事件B的发生受多个两两互斥“原因”事件A1，A2，…，An的影响，用全概率公式计算P(B)；若事件B已经发生，已知P(Ai)，P（B︱Ai)，i=1，2，…，n，计算事件B由“原因”事件Aj引起的可能性，用贝叶斯公式.70%条件概率反映某个事件B发生对另一个事件A发生的概率有影响.一般情况下，PAB≠PA定义5设同一样本空间中的任意两个事件A，B，若PAB=PAPB，则称事件A与事件B相互独立.1.6独立性1.6.1独立性70%从事件的独立性，我们联系到试验的独立性.试验E1与试验E2是独立的，直观解释是试验E1的结果的发生与试验E2的结果的发生是独立的.进行n次试验，如果任何一次试验中各结果发生的概率都不受其他各次试验结果发生与否的影响，则称这n次试验是相互独立的.在商品质量抽样检查中是抽到正品还是次品；在掷硬币时是出现正面还是反面，篮球比赛中某队是赢还是输，这些结果是人们感兴趣的.在这类问题中，试验的可能结果只有两个：A出现或者出现，这种只有两个可能结果的试验称为伯努利（Bernoulli）试验.若随机试验满足：（1）进行n次独立重复试验；1.6独立性1.6.2伯努利概型70%1.6独立性1.6.2伯努利概型本章首先从试验观察结果介绍随机事件的不确定性和频率的稳定性，进一步认识随机现象，通过引入大量经济实例，帮助学生了解概率的意义；通过数学试验，观察、发现随机事件的统计规律性，帮助学生了解通过大量重复试验，用频率估计概率的方法，进而引出概率的三个定义，仔细讨论了概率的三条公理和概率的性质，运用概率的性质解决相关问题；着重研究了两种重要的概率模型：古典概型和几何概型，并讨论了摸球问题、质点入盒问题以及会面问题；给出条件概率的概念，由此得到求积事件概率的乘法公式，进而综合概率的完备事件组的加法公式与乘法公式得到了全概率公式及贝叶斯公式；由一个事件对另一事件发生的概率是否有影响引出事件的独立性概念.本章小结第一章谢谢观赏概率论与数理统计2.2离散型随机变量2.32.4随机变量的分布函数2.5随机变量函数的分布第二章随机变量连续型随机变量随机变量的定义2.1随机变量是概率论的另一个重要概念.随机变量的引入使概率论的研究由对个别随机事件的研究扩大为对随机变量所表征的随机现象的研究.本章将介绍离散型随机变量和连续型随机变量及其分布.章前导读第二章随机变量70%为了方便研究随机试验的各种结果及各种结果出现的概率，我们常把随机试验的结果与实数对应起来，即把随机试验的结果进行数量化，引入随机变量的概念.2.1随机变量的定义从定义知道，随机变量是一个函数，它定义在样本空间Ω上，而取值在实轴上.因此，它与通常函数所不同的是，它的自变量是随机试验的结果.由于随机试验结果的出现具有随机性，即在一次具体试验前，我们无法预先知道试验会出现哪一个结果.因此，随机变量的取值也具有一定的随机性.这正是随机变量与一般函数的最大不同之处，正是由于对随机变量这一特殊性质的研究需要，产生了现代概率论.70%定义2如果随机变量的所有可能取值是有限个或可列无限多个，则称这种随机变量为离散型随机变量.定义3设离散型随机变量X的所有可能取值为xi（i=1，2，3，…），则称X取xi的概率2.2

离散型随机变量2.2.1离散型随机变量的概率分布70%在理论和应用上，离散型随机变量的分布有很多，但其中重要的有两点分布、二项分布和泊松（Poisson）分布.在本小节和后续章节中，我们将对这三种离散型分布做详细讨论，对其他离散型分布，读者可参阅书后的附录.2.2

离散型随机变量2.2.2常见的离散型随机变量的概率分布来描述该随机试验的结果.例如，对射手射击是否“中靶”，掷硬币是否“币值面朝上”，检查产品是否“合格”，明天是否“下雨”，种子是否“发芽”等试验，均可用服从两点分布的随机变量来描述.其中0<p<1，q=1－p，则称X服从参数为p的两点分布或（0-1）分布，记为X～B（1，p）.对于任何一个只有两种可能结果的随机试验E，如果用Ω={ω1，ω2}表示其样本空间，我们总可以在Ω上定义一个服从两点分布的随机变量70%在实际问题中，有时一个随机试验可能有多个结果.例如，在产品质量检查中，检查结果有四种：一等品、二等品、三等品和不合格品.但是，如果把前三种统称为合格品，则试验的结果就只有合格品和不合格品两种.于是，也可以用两点分布来描述这类随机试验.又如，研究者记录了某城市每月交通事故发生的次数，则它可能取的值为0，1，2，…，这是无限多个结果.但是，如果我们关心的问题是每月发生交通事故的可能性，我们可以把观测的结果分成“发生交通事故”和“不发生交通事故”两种情况.于是，就可用两点分布来研究每月发生交通事故的可能性.2.二项分布将试验E在相同条件下重复进行n次，如果将第i次试验的结果记成Ai（i=1，2，…，n），总有A1，A2，…，An相互独立，即每次试验结果出现的概率都不依赖于其他各试验的结果，则称这n次试验是相互独立的.2.2

离散型随机变量2.2.2常见的离散型随机变量的概率分布伯努利试验概型是从现实世界许多的随机现象中抽象出来的一种基本的概率模型.例如，在一批产品的质量检查中，若将检查结果分为“合格”和“不合格”两种，且采用放回抽样，则检查n件产品就是n重伯努利试验.又如，在对某种新开发产品的市场调查中，70%要了解消费者对于这种产品的态度.若分为“喜欢”和“不喜欢”两种，且采用放回抽样，则随机访问n位消费者的调查就是n次伯努利试验（在这个问题中，由于消费者群体很大，而n一般相对较小，即便不采用放回抽样，仍然可以近似看成伯努利试验）.这样的例子还可以举出很多，因此伯努利试验与其对应的概率分布，即下面将引进的二项分布在概率论与数理统计的理论与应用上有十分重要的地位.2.2

离散型随机变量2.2.2常见的离散型随机变量的概率分布70%3.泊松分布如果随机变量X的概率分布为2.2

离散型随机变量2.2.2常见的离散型随机变量的概率分布即P{X=k}满足概率分布的两个条件.在许多实际问题中，我们所关心的量都近似地服从泊松分布.例如，某医院每天来就诊的病人数；某地区一段时间间隔内发生火灾的次数、发生交通事故的次数；一段时间间隔内某放射性物质放射出的粒子数；一段时间间隔内某容器内部的细菌数；某地区一年内发生暴雨次数等，都近似地服从某一参数的泊松分布.70%在2.2中，我们讨论了一类重要的随机变量——离散型随机变量.在这一节中，先介绍直方图的概念，进而讨论另一类重要的随机变量——连续型随机变量，最后介绍随机变量的分布函数.【例11】某工厂生产一种零件，由于生产过程中各随机因素的影响，零件长度不尽相同.现有该厂生产的零件100个，测得其长度（单位：mm）如下：129，132，136，145，140，145，147，142，138，144，147，142，137，144，144，134，149，142，137，137，155，128，143，144，148，139，143，142，135，142，148，137，142，144，141，149，132，134，145，132，140，142，130，145，148，143，148，135，136，152，141，146，138，131，138，136，144，142，142，137，141，134，142，133，153，143，145，140，137，142，150，141，139，139，150，139，137，139，140，143，149，136，142，134，146，145，130，136，140，134，142，142，135，131，136，139，137，144，141，136.2.3

连续型随机变量2.3.1直方图70%用随机变量X表示零件的长度，和§2.1中的【例3】及【例4】中的随机变量类似，他们都是连续型随机变量的例子，其共同特点是：它们可能取某一区间内的所有值.这样，再使用刻画离散型随机变量概率分布的方法来刻画连续型随机变量的概率分布就会出现问题，必须寻找另外的方法.画直方图就是一种近似的方法，下面使用【例11】中的数据说明画直方图的过程.这100个数据的最小值是128，最大值是155.在画直方图时，先取一个区间，其左端点比数据的最小值稍小一些，右端点比最大值稍大一些，例如可取（127.5，131.5），（131.5，135.5），（135.5，139.5），（139.5，143.5），（143.5，147.5），（147.5，151.5），（151.5，155.5）.上述这些区间的端点均比数据多取一位小数，其目的是使数据不落在区间的端点上.每个小区间称为一个组，数据落入每个组的个数是频数，每个组的频数与数据总个数的比值是频率，这样可得到数据统计表，见表2-3.2.32.3.1直方图

连续型随机变量70%2.32.3.1直方图

连续型随机变量70%在平面直角坐标系的横轴上截出各组的区间，每组的区间长度称为组距，比例中组距为4.在各组上以组距为底向上作出长方形，使该长方形的面积等于该组的频率，即长方形的高=频率÷组距=频率/4.这样的图形称为直方图，如图2-2所示.2.32.3.1直方图

连续型随机变量70%由于概率可以由频率近似得到，因此，这个直方图可以近似地刻画零件长度X的概率分布情况.用上述直方图刻画X的概率分布情况是比较粗糙的.为了更加准确地刻画X的概率分布情况，应该增加数据的个数，同时要把组分得更细.可以设想：当数据个数越来越多，组分得越来越细时，直方图的外形轮廓越来越接近某一条曲线，如图22所示.这条曲线可以准确地刻画X的概率分布情况，它就是下面要定义的连续型随机变量的概率密度函数的图形.这就是说，刻画连续型随机变量的概率密度要使用概率密度函数.2.32.3.1直方图

连续型随机变量定义4若存在非负函数f（x），使随机变量X取值于任意区间（a，b\]上的概率可以表示为2.32.3.2概率密度函数则称X为连续型随机变量，f（x）为X的概率密度函数，简称概率密度.容易看出，概率密度函数具有如下性质：（2）对连续型随机变量X和任意常数a，总有P{X=a}=0.性质（2）说明，连续型随机变量取任意一点的概率为0.同时也说明，从P（A）=0，并不能推出A是不可能事件.因为在这里，虽然P{X=a}=0，但事件X=a并非不可能事件.这样，连续型随机变量X落在区间[a，b]，（a，b），（a，b\]，\[a，b）上的概率都相等，即P{a≤X≤b}=P{a<X<b}=P{a<X≤b}=P{a≤X<b}（2-9）且都等于f（x）在区间[a，b]上的积分，即曲线y=f（x）和直线x=a，x=b及y=0所围成的曲边梯形的面积.

连续型随机变量70%1.均匀分布若果随机变量X的概率密度函数为2.指数分布如果随机变量X的概率密度函数为2.32.3.3常见的连续型随机变量的概率密度函数其中λ>0为常数，则称X服从参数为λ的指数分布，记做X～Exp（λ）.指数分布是最常用的寿命分布，许多电子产品或元件的寿命都服从指数分布.

连续型随机变量70%2.33.正态分布如果随机变量X的概率密度函数为其中μ，σ（σ>0）为常数，则称X服从参数为μ，σ的正态分布或高斯（Gauss）分布，记为X～N（μ，σ2）.这里的字母N取自英文单词Normal（正常的）的首字母.同时称X为正态随机变量.正态分布的概率密度函数f（x）图形如图2-3所示.

连续型随机变量2.3.3常见的连续型随机变量的概率密度函数70%2.3从图2-3中容易看出，f（x）的图形呈钟形，且有如下特征：（1）关于直线x=μ对称；如果固定σ，改变μ的值，则图形沿着x轴平移，而图形的形状不变；如果固定μ，改

连续型随机变量2.3.3常见的连续型随机变量的概率密度函数70%2.3由φ（x）的对称性，可推出Φ（x）的如下重要性质：Φ（－x）=1－Φ（x）（2-15）Φ（x）的函数值已制成标准正态分布表（见附表2）.利用此表，我们可以计算参数已知的情形下，正态随机变量落在一个区间内的概率.先来看下面的定理.特别地，当μ=0,σ=1时的正态分布N（0，1）称为标准正态分布.对于标准正态分布N（0，1），其概率密度函数通常用φ（x）来表示，即

连续型随机变量2.3.3常见的连续型随机变量的概率密度函数70%对离散型随机变量，我们用概率分布来刻画它的概率分布情况.对连续型随机变量，我们用概率密度函数来刻画它的概率分布情况.现在，我们引入分布函数的概念，它可以对上述两类随机变量的概率分布情况进行刻画.它在概率论的理论研究中具有重要意义.2.4随机变量的分布函数这里的和式（2.23）是对所有满足xk≤x的pk求和.分布函数F（x）在x=xk（k=1，2，…）处有跳跃值pk，且分布函数F（x）是一个右连续的函数.70%在很多实际问题中，我们常常对某些随机变量函数（也是随机变量）感兴趣.这是因为在一些试验中，我们所关心的量往往不能通过直接观测来得到，而它恰是某个能直接观测到的随机变量的已知函数.比如，我们能直接测量到圆轴正截面的直径D，而所关心的却是该截面的面积A=πD24.这里，随机变量A是随机变量D的函数.本节我们将讨论如何由已知随机变量X的分布来求X的函数Y=g（X）的分布.在这里，g是一个已知的连续函数.2.5随机变量函数的分布70%2.5随机变量函数的分布2.5.1离散型随机变量函数的分布设离散型随机变量X的概率分布为P{X=xk}=pk，k=1，2，…，g是一个已知的单值函数.令Y=g（X），则Y也是一个离散型随机变量.70%2.5随机变量函数的分布2.5.2续型随机变量函数的分布对于连续型随机变量X，求Y=g（X）的概率密度函数的基本方法是：根据分布函数的定义先求Y=g（X）的分布函数，即然后求上式对y的导数，得到Y的概率密度函数fY（y）=F′Y（y）.下面我们通过一些例子加以说明.定理2若随机变量X有概率密度函数fX（x），x∈（－∞，+∞），y=g（x）为严格单调函数，且g′（x）对一切x都存在，记（a，b）为g（x）的值域，则随机变量Y=g（X）的概率密度函数为a=g（+∞），b=g（－∞）.这里x=h（y）是y=g（x）的反函数.显然，当g（x）为严格单调增函数时，a=g（－∞），b=g（+∞）；当g（x）为严格单调减函数时，a=g（+∞），b=g（－∞）.本章首先引入了随机变量的概念，使随机试验中的各种事件可以用随机变量来描述，从而将对随机现象的研究转化成对随机变量的研究.本书只讨论两类重要的随机变量：离散型随机变量和连续型随机变量.主要研究这两类随机变量及其分布.通过本章的学习，学生应理解随机变量、概率分布、概率密度以及分布函数的概念，掌握概率分布、概率密度、分布函数的性质，熟知两点分布、二项分布、泊松分布、均匀分布、指数分布、正态分布这六大重要分布，会利用分布函数、概率分布或概率密度计算随机事件的概率，会利用概率分布或概率密度求分布函数，会利用分布函数求概率分布或概率密度，掌握随机变量函数的分布的求解方法.本章小结第二章谢谢观赏概率论与数理统计3.2二维离散型随机变量3.33.4边缘分布3.5第三章多维随机变量二维连续型随机变量二维随机变量及其分布函数3.1条件分布随机变量的独立性3.6在实际问题中，除了经常遇到一个随机变量的情形外，还会遇到多个随机变量的情形.例如，炮弹在地面弹着点的位置X，Y是二维随机变量，需要用它的横坐标X与纵坐标Y来确定，而横坐标和纵坐标是定义在同一个样本空间Ω={所有可能的弹着点}上的两个随机变量；又如，某钢铁厂炼钢时每炉钢出炉时的基本指标必须考察由钢的硬度X、含碳量Y和含硫量Z组成的三维随机变量X，Y，Z的情况，它们也是定义在同一个样本空间Ω上的三个随机变量。因此，在实际应用问题上，有时只用一个随机变量是不够的，要考虑多个随机变量及其相互联系.本章以两个随机变量的情形为代表，讲述多维随机变量的一些基本内容.章前导读第三章多维随机变量70%3.1二维随机变量及其分布函数定义1设随机试验E的样本空间为Ω，X=X(ω)与Y=Y(ω)是定义在Ω上的两个随机变量，由它们构成的向量（X，Y）称为二维随机变量.类似地，可定义n维随机变量.设E是一个随机试验，它的样本空间是Ω，设随机变量X1（ω），X2（ω），…，Xn（ω）是定义在同一个样本空间Ω上n个随机变量，则称向量X1（ω），X2（ω），…，Xn（ω）为Ω上的n维随机变量，简记为X1，X2，…，Xn.与一维随机变量的情形类似，对于二维随机变量，也通过分布函数来描述其分布律规律.二维随机变量（X，Y）的性质不仅与X和Y的性质有关，而且还依赖于X和Y之间的相互关系.因此，仅仅逐个研究X和Y的性质是不够的，必须把（X，Y）作为一个整体来加以研究.70%3.1二维随机变量及其分布函数定义2设（X，Y）是二维随机变量，对任意实数x和y，称二元函数为二维随机变量（X，Y）的分布函数，或随机变量X和Y的联合分布函数.类似地，可定义n维随机变量X1，X2，…，Xn的分布函数.分布函数F(x，y)表示事件｛X≤x｝和事件｛Y≤y｝同时发生的概率，如果把二维随机变量（X，Y）看成是平面上随机点的坐标，那么，分布函数F(x，y)在(x0，y0)处的函数值F(x0，y0)就是随机点（X，Y）落在直线X=x0左侧和直线Y=y0下方无限矩形域内的概率，如图3-1所示.3.1二维随机变量及其分布函数分布函数F(x，y)具有以下基本性质.（1）F(x，y)是变量x和y的单调不减函数，即对于任意固定的y，当x2≥x1时，F(x2，y)≥F(x1，y)；对于任意固定的x，当y2≥y1时，F(x，y2)≥F(x，y1)；（2）由分布函数的定义得知0≤F(x，y)≤1，－∞<x<+∞，－∞<y<+∞；3.1二维随机变量及其分布函数对于上面四个式子，可以从F(x，y)的几何意义上加以解释，在图3-1中将无限矩形右边界向左无限移动（即令x→－∞），则随机点（X，Y）落在这个矩形区域内这一事件趋于不可能事件，则概率趋于零，即有F(－∞，y=0)；又如当x→+∞，y→+∞时，相当于在图3-1中将无限矩形扩展到整个平面，则随机点（X，Y）落在这个矩形区域内这一事件趋于必然事件，则概率趋于1，即有F(+∞，+∞)=1.（4）F（x，y）关于x右连续，关于y右连续，即F(x，y)=F(x+0，y)，F(x，y)=F(x，y+0).（5）对于任意的（x1，y1），（x2，y2），x1<x2，y1<y2，有F（x2，y2）－F（x2，y1）+F（x1，y1）－F（x1，y2）≥0.与一维随机变量类似，二维随机变量有两种类型：离散型与连续型，在下面两节我们将分别讨论.3.2二维离散型随机变量定义3若二维随机变量（X，Y）的所有可能取值是有限对或可列无穷多对时，则称（X，Y）为二维离散型随机变量.从二维离散型随机变量的定义易知，二维离散型随机变量（X，Y）的每一个分量都是离散型随机变量，形象地讲，二维离散型随机变量（X，Y）即为两个离散型随机变量凑在一起构成的向量.定义4设二维离散型随机变量（X，Y）的一切可能取值为（xi，yj），i，j=1，2，…，且（X，Y）各对可能取值的概率为P(X=xi，Y=yj)=pij，i，j=1，2，….（3-3）称（3.3）式为（X，Y）的（联合）分布律或（联合）概率分布.3.2二维离散型随机变量离散型随机变量（X，Y）的联合分布律可用表3-1表示.由概率的定义可知pij具有如下性质.（1）非负性：pij≥0，i，j=1，2，…；其中和式是对一切满足xi≤x，yj≤y的i，j求和.3.3二维连续型随机变量3.3.1二维连续型随机变量定义5设二维随机变量（X，Y）的联合分布函数为F(x，y)，如果存在非负函数f（x，y）使得对任意实数x，y，总有则称（X，Y）为二维连续型随机变量，f（x，y）为二维连续型随机变量（X，Y）的联合概率密度函数，简称概率密度.概率密度函数f（x，y）具有以下四条性质.（1）f（x，y）≥0，－∞<x<+∞，－∞<y<+∞；3.3二维连续型随机变量3.3.1二维连续型随机变量（4）设D是平面上的任意区域，则点（X，Y）落在D内的概率3.3二维连续型随机变量3.3.2二维均匀分布定义6设D是平面上的有界区域，其面积为d，若二维随机变量（X，Y）的概率密度为则称（X，Y）在区域D上服从均匀分布.和一维随机变量的均匀分布类似，（X，Y）服从D上的均匀分布落在D中某一区域A内的概率P{（X，Y）∈A}与A的面积成正比，而与A的位置和形状无关，即常用的平面上的有界区域多为矩形区域、圆型区域和三角形区域等.3.3二维连续型随机变量3.3.3二维正态分布定义7设二维随机变量(X，Y)联合概率密度函数为(X，Y)为二维正态随机变量.z=f(x，y)在三维空间中的图形就像是一个椭圆切面的钟倒扣在xOy平面上，其中心在(μ1，μ2)处，如图3-3所示.下面证明二维正态分布联合概率密度函数f(x，y)满足70%3.3二维连续型随机变量3.3.3二维正态分布3.4边缘分布3.4.1边缘分布函数二维随机变量（X，Y）作为一个整体，有分布函数F(x，y)，其分量X和Y都是随机变量，有各自的分布函数，分别记成FX(x)和FY(y)，依次称为X的边缘分布函数和Y的边缘分布函数，而称F(x，y)为（X，Y）的联合分布函数.这里需要注意的是X和Y的边缘分布函数其本质上就是一维随机变量X和Y的分布函数，边缘分布函数是相对于随机变量（X，Y）的联合分布而言的，同样，（X，Y）的联合分布函数F(x，y)是相对于（X，Y）的两个分量X和Y的分布而言的.边缘分布函数FX(x)和FY(y)都可以由联合分布函数F(x，y)确定，即3.4边缘分布3.4.2二维离散型随机变量的边缘分布律设（X，Y）是二维离散型随机变量，联合分布律为3.4边缘分布3.4.3二维连续性随机变量的边缘概率密度设(X，Y)是二维连续型随机变量，其概率密度函数为f(x，y)，由一维随机变量分布函数的定义和二维随机变量分布函数的定义可得3.4边缘分布3.4.3二维连续性随机变量的边缘概率密度分别称fX(x)和fY(y)为X和Y的边缘概率概率密度函数，简称边缘概率密度.这表明：X与Y都是服从均匀分布的随机变量.但对其他非矩形区域上的均匀分布不一定有上述结论.3.5条件分布3.5.1条件分布的概念在第一章，我们介绍了条件概率的概念，在事件B发生的条件下事件A发生的条件概率为在本节中，我们将其推广到随机变量，设有两个随机变量X和Y，在给定Y取某个值或某些值的条件下，X的分布称为X的条件分布.类似地，也可以定义Y的条件分布.例如：考虑某大学的全体学生，从中随机抽取一个学生，以X和Y分别表示其体重和身高，则X和Y都是随机变量，它们都有一定的分布律.现在限制180cm<Y<190cm，在这个条件下求X的条件分布.这就意味着要从该校的学生中把身高在180cm到190cm之间的那些人都挑出来，然后在挑出来的学生中求其体重的分布.显然这个分布与不加这个条件时的分布会不一样，在条件分布中体重取大值的概率会显著地增加.3.5条件分布3.5.1条件分布的概念从上述这个例子可以看出条件分布这个概念的重要性，弄清楚X的条件分布随Y值而变化的情况，就能了解身高对体重的影响.由于在许多问题中有关变量往往是相互影响的，这使得条件分布成为研究变量之间相依关系的一个有力工具，它在概率论与数理统计的许多分支中有着重要的应用.3.5条件分布3.5.2离散型随机变量的条件分布律这种情况是第一章中条件概率概念在另外一种形式下的运用.设(X，Y)是二维离散型随机变量，分布律为3.5条件分布3.5.2离散型随机变量的条件分布律容易看出，上述条件概率具有分布律的两条性质.为在X=xi条件下Y的条件分布律.3.5条件分布3.5.3连续型随机变量的条件概率密度设X，Y是二维连续型随机变量，由于对任意x，y，P｛X=x｝=0，P｛Y=y｝=0，故不能直接用条件概率公式得到条件分布，这时要使用极限的方法得到条件概率密度.70%3.5条件分布3.5.3连续型随机变量的条件概率密度定理1设随机变量(X，Y)的联合概率密度为f（x，y），Y的边缘概率密度为fY（y）.若f(x，y)在点(x，y)处连续，fY(y）在点y处连续，且fY（y)>0，则70%3.6随机变量的独立性第一章中，我们讨论了随机事件的独立性，对事件A与B，若有P（AB）=P（A）P（B），则称A与B相互独立.现在，利用两个事件相互独立的概念引出两个随机变量相互独立的概念.定义10设(X，Y)是二维随机变量，若对任意实数x，y，总有则称X与Y相互独立.设（X，Y）的联合分布函数为F（x，y），X和Y边缘分布函数分别为FX（x），FY(y)，则用联合分布函数和边缘分布函数表示随机变量独立性可表示为F（x，y）=FX（x）FY（y）.（3-24）因此，随机变量X与Y相互独立是指对任意实数x，y，随机事件{X≤x}与{Y≤y}相互独立.随机变量的相互独立是概率统计中一个十分重要的概念.设X，Y是二维离散型随机变量，则随机变量X与Y相互独立等价于对X，Y所有可能取的值xi，yj，i，j=1，2，…，有70%3.6随机变量的独立性设（X，Y）是二维连续型随机变量，则随机变量X与Y相互独立等价于对任意的实数x，y，有f（x，y）=fX（x）fY（y）.（3-27）下面对（X，Y）的连续情况加以说明.设X，Y是二维离散型随机变量，则随机变量X与Y相互独立等价于对（X，Y）所有可能取的值（xi，yj），i，j=1，2，…，有70%3.6随机变量的独立性下面对（X，Y）的连续情况加以说明.若X与Y相互独立，则对任意的实数(x，y)，有F（x，y）=FX（x）FY（y），两边对x，y求导得这表明X与Y相互独立.本章介绍了二维随机变量的基本概念，包括联合分布函数及其性质，二维离散型随机变量的联合分布律及其性质，二维连续型随机变量的联合概率密度及其性质；二维均匀分布、二维正态分布，二维随机变量边缘分布的概念，二维离散型随机变量边缘分布律的计算，二维连续型随机变量边缘概率密度的计算；条件分布的概念，离散型随机变量条件分布律的计算，连续型随机变量条件概率密度的计算，给出多个计算例子；最后介绍两个随机变量相互独立的概念，给出各种情况下两个随机变量相互独立的充要条件.本章小结第三章谢谢观赏概率论与数理统计4.2方差4.34.4矩与协方差矩阵第四章随机变量的数字特征协方差与相关系数数学期望4.1在上一章我们已经讨论了随机变量的分布函数、概率密度及分布律，它们都能够完整地描述随机变量的统计规律性.然而，在许多理论或实际问题中，并不需要去全面考察随机变量的全部特征，而只希望能够描述它们的某些数字特征即可.比如，某地区农作物产量是随机变量，我们在考察时，通常只关心该地区粮食的平均产量；又如，某城市个人收入是一个随机变量，在考察时，我们通常只关心该市的平均收入水平；再如，在评价棉花的质量时，既要注意纤维的平均长度，又要注意纤维长度与平均长度之间的偏离程度，平均长度较大，偏离程度较小，则质量较好.在以上各例子中，我们并不需要将所有随机变量的特征都完整地描述出来，我们关心的只是随机变量某方面的特征，如均值和方差等，它们能更直接、更简洁地反映出随机变量的本质.本章将讨论几个常用的数字特征：数学期望、方差、协方差、相关系数以及矩.章前导读第四章随机变量的数字特征70%4.1数学期望4.1.1离散型随机变量的数学期望在给出数学期望的定义之前，我们先看一个例子.引例1某服装公司生产两种套装，一种是大众装，每件价格200元，每月生产1万件；另一种是高档装，每件1800元，每月生产100件.现在问该公司生产的套装平均价格是多少？把每种套装的价格乘上生产件数，然后相加，得到总价格，最后除以总件数，即该问题中，我们计算了以两种套装生产的频率为权重的加权平均数.受此启发，随机变量X的所有可能取值的“平均数”应是各可能取值与其频率的乘积之和，这即所谓的“数学期望”.频率的稳定性告诉我们频率可以作为概率的估计值，故给出以下定义.70%4.1数学期望4.1.2连续型随机变量的期望下面介绍一些常用连续型随机变量的数学期望.1.均匀分布若随机变量X～U[a，b]，其概率密度为70%4.1数学期望4.1.2连续型随机变量的期望下面介绍一些常用连续型随机变量的数学期望.1.均匀分布若随机变量X～U[a，b]，其概率密度为70%4.1数学期望4.1.2连续型随机变量的期望70%4.1数学期望4.1.3随机变量函数的数学期望设随机变量X的分布律已知，在实际问题中有时需要计算的量并非X的期望，而是关于X的某个函数g（X）的期望.那么，如何计算它呢?由于g（X）也是随机变量，故应有分布律，其分布律可以由X的分布律求出.一旦知道了g（X）的分布律，就可以按照期望的定义把E[g（X）]计算出来.但使用该方法必须先求出g（X）的分布律，一般说来，这是比较复杂的事.那么，可否不求g（X）的分布律，只根据X的分布律来计算E[g（X）]呢？答案是肯定的，且有如下定理.定理1设Y=g（X）是x的连续函数，若X是离散型随机变量，其分布律为该定理的重要性在于，当我们求E[g（X）]时，不必再求g（X）的分布律，而只需知道X的分布律即可，这对求g（X）的期望带来了方便.注：由E(XY)=E(X)E(Y)不一定能推出X与Y相互独立.推广：若Xi(i=1，2，…)相互独立且数学期望存在时，下面仅对性质3进行证明（以连续型随机变量为例），其余留给读者自证.设二维随机变量(X，Y)的概率密度为f(x，y)，其边缘概率密度为fX(x)和fY(y)，则70%4.1数学期望4.1.4期望的性质设随机变量X和Y的数学期望存在，则（1）若c是常数，则E(c)=c；（2）若c是常数，则E(cX)=cE(X)；（3）E(X+Y)=E(X)+E(Y)；特别地，若c是常数，则E(X+c)=E(X)+c；推广：若Xi(i=1，2，…)的数学期望均存在，则（4）若a，b是常数，则E(aX+b)=aE(X)+b；（5）若X和Y是相互独立的，则E(XY)=E(X)E(Y).70%4.2方差上一节介绍了随机变量的期望，它体现了随机变量取值的平均水平，是随机变量的重要数字特征.但在一些场合，仅仅知道期望是不够的，还需了解其他数字特征.引例2要评价甲和乙两名射击选手的射击水平，假设他们的射击成绩X与Y的分布律分别如表4-6和表4-7所示.由于E(X)=E(Y)=9（环），即从数学期望的角度区分不出两名选手谁的技术更好.这种情况下，通常是考虑二者谁的技术更加稳定，即谁命中的环数偏离平均值更小.可见随机变量取值对数学期望的偏离程度也是一个重要的统计数字特征，这个统计数字特征就是我们将要介绍的方差.70%4.2方差4.2.1方差的定义定义3设X是一随机变量，若期望E{[X－E(X)]2}存在，则称其为X的方差，记为Var(X)，即注：平方是为了保证一切[X－E(X)]不会相互抵消，并都起正的作用，Var(X)也记为D(X).方差刻画了随机变量取值对于其数学期望的偏离程度.若X的取值比较集中，则方差较小；若X的取值比较分散，则方差较大；若方差Var(X)=0，则X以概率1取常数，并且此常数即为均值E(X).由定义知，方差是随机变量X的函数g(X)=[X－E(X)]2的期望.若X为离散型随机变量，则70%4.2方差4.2.1方差的定义（1）设c是常数，则Var(c)=0；（2）若c是常数，则Var(cX)=c2Var(X)；（3）若c是常数，则Var(X+c)=Var(X)；（4）Var(X1±X2)=Var(X1)+Var(X2)±2E{[X1－E(X1)][X2－E(X2)]}；（5）若X1与X2相互独立，则Var(X1+X2)=Var(X1)+Var(X`)可推广为：下面仅对性质3进行证明（以离散型随机变量为例），其余留给读者自证.70%4.2方差4.2.2方差的性质70%4.2方差4.2.2方差的性质70%4.2方差4.2.3几种常用随机变量的方差4.2方差4.2.3几种常用随机变量的方差下面仅就两点分布进行证明，其余留给读者自证.我们知道两点分布的分布律为P{X=1}=p，P{X=0}=1－p，则E（X2）=12×p+02×（1－p）=p.再由E(X)=p得Var（X）=E（X2）－［E（X）］2=p－p2=p（1－p）.70%4.3协方差与相关系数4.3.1协方差的定义对于二维随机变量(X，Y)，除了其分量X和Y的期望与方差外，还有一些数字特征用以刻画X与Y之间的相关程度，其中最主要的就是下面要讨论的协方差和相关系数.70%4.3协方差与相关系数4.3.1协方差的定义由（4.27）式和（4.28）式看出方差是协方差的特例.若X，Y为离散型随机变量，其联合分布律为P{X=xi，Y=yj}=pij，i，j=1，2，…，则有70%4.3协方差与相关系数4.3.1协方差的定义若X取值比较大时（如X>E(X)），Y也取值比较大（Y>E(Y)），这时有[X－E(X)][Y－E(Y)]>0.同时，若X取值比较小时（如X<E(X)），Y也取值比较小（Y<E(Y)），这时也有[X－E(X)][Y－E(Y)]>0于是，协方差Cov(X，Y)>0.可见正的协方差表示两个随机变量有“同时取较大值”或“同时取较小值”的倾向.反过来，若X取值比较大时（如X>E(X)），Y取值比较小（Y<E(Y)），这时有[X－E(X)][Y－E(Y)]<0.同时，若X取值比较小时（如X<E(X)），Y取值比较大（Y>E(Y)），这时也有[X－E(X)][Y－E(Y)]<0.于是，协方差Cov(X，Y)<0.可见负的协方差表示两个随机变量有“此小彼大”或者“此大彼小”的倾向.70%4.3协方差与相关系数4.3.2协方差性质70%4.3协方差与相关系数4.3.3相关系数的定义为X与Y的相关系数.在不致引起混淆时，记ρXY为ρ.若随机变量X与Y的相关系数ρ=0，则称X与Y线性无关，或线性不相关，简称不相关.70%4.3协方差与相关系数4.3.4相关系数性质（1）设X与Y是两个任意的随机变量，则|ρXY|≤1；（2）X与Y独立时，ρXY=0，即X与Y不相关，但其逆命题不一定为真；（3）|ρXY|=1的充要条件是：存在常数a≠0和b，使P{Y=aX+b}=1.下面仅根据下例对性质2进行证明，其余留给读者自证.70%4.4矩与协方差矩阵4.4.1

矩的定义数学期望、方差、协方差等都是随机变量最常用的数字特征，他们都是特殊的矩，矩是最广泛的数字特征，也是概率论与数理统计中最基本、最重要的概念.定义6对随机变量X，若E(xk)（k=1，2，…）存在，则称其为X的k阶原点矩；若E{[X－E(x)]k}（k=1，2，…）存在，则称其为X的k阶中心矩.显然，E(X)是X的一阶原点矩，Var（X）是X的二阶中心矩.定义7对随机变量(X，Y)，若E(XkYm)（k，m=1，2，…）存在，则称其为X与Y的k+m阶混合原点矩；若E{[X－E(X)]k[Y－E(Y)]m}（k，m=1，2，…）存在，则称其为X与Y的k+m阶混合中心矩.显然，X与Y的协方差Cov(X，Y)是X与Y的1+1阶混合中心矩.70%4.4矩与协方差矩阵4.4.2协方差阵70%4.4矩与协方差矩阵4.4.3协方差阵中元素的性质（1）cii=D(Xi)，i=1，2，…，n；（2）cij=cji，i，j=1，2，…，n；（3）c2ij≤cii×cjj.读者可参照协方差自行证明.本章介绍了随机变量期望的概念、性质及计算，给出了几种常用随机变量的期望，介绍了求随机变量函数期望的方法；随机变量方差的概念\性质及计算过程，给出了几种常用随机变量的方差；二维随机变量X，Y的分量X与Y的协方差及相关系数的概念、性质和计算过程；然后介绍随机变量的各种矩（k阶原点矩、k阶中心矩、k+m阶混合原点矩、k+m阶混合中心矩），n维随机变量的协方差阵的概念、性质和计算过程.本章小结第四章谢谢观赏概率论与数理统计5.1大数定律5.2第五章大数定律与中心极限定理中心极限定理在上一章我们已经讨论了随机变量的分布函数、概率密度及分布律，它们都能够完整地描述随机变量的统计规律性.然而，在许多理论或实际问题中，并不需要去全面考察随机变量的全部特征，而只希望能够描述它们的某些数字特征即可.比如，某地区农作物产量是随机变量，我们在考察时，通常只关心该地区粮食的平均产量；又如，某城市个人收入是一个随机变量，在考察时，我们通常只关心该市的平均收入水平；再如，在评价棉花的质量时，既要注意纤维的平均长度，又要注意纤维长度与平均长度之间的偏离程度，平均长度较大，偏离程度较小，则质量较好.在以上各例子中，我们并不需要将所有随机变量的特征都完整地描述出来，我们关心的只是随机变量某方面的特征，如均值和方差等，它们能更直接、更简洁地反映出随机变量的本质.本章将讨论几个常用的数字特征：数学期望、方差、协方差、相关系数以及矩.章前导读第五章大数定律与中心极限定理70%5.1大数定律重复试验中事件频率的稳定性，是大量随机现象统计规律性的典型表现.人们在实践中认识到频率具有稳定性，进而由频率的稳定性预见概率的存在，由频率的性质推断概率的性质，并在实际应用中用频率的值来估计概率的值.其实，在大量随机现象中，不但事件的频率具有稳定性，而且大量随机现象的平均结果一般也具有这种稳定性；单个随机现象对大量随机现象共同产生的总平均效果几乎不发生影响.这就是说，尽管单个随机现象的具体实现不可避免地引起随机偏差，然而在大量随机现象共同作用时，由于这些随机偏差互相抵消、补偿和拉平，致使总的平均结果趋于稳定.例如，一个钳工在测量一个工件时，由于测量具有随机误差，他总是反复测量多次，然后用多次的平均值来作为测量的结果.而且经验表明：只要测量的次数足够多，总可以达到要求的精度.概率论中，一切关于大量随机现象之平均结果的稳定性定理，统称为大数定律.下面介绍三个常见的大数定律，在这之前，先介绍概率论中非常著名的一个不等式——切比雪夫不等式和依概率收敛的概念。70%5.1大数定律5.1.1切比雪夫（Chebyshev）不等式我们知道，数学期望E（X）反映了随机变量X的平均值，而方差Var（X）刻画了随机变量X与数学期望E（X）的偏离程度.那么，在已知E（X）和Var（X）的情况下，如何利用方差Var（X）具体估计随机变量X对数学期望E（X）的偏离程度以及近似估计随机变量X的概率分布呢？切比雪夫不等式解决了这一问题，它是概率统计里一个很重要的不等式，揭示了随机变量的一个一般性质.定理1设随机变量X具有数学期望E（X）=μ，方差Var（X）=σ2，则对于任意正数ε，不等式成立.在证明定理之前，先解释这个概率不等式的含义.这个不等式对连续型和离散型两类随机变量均成立.当随机变量是连续型时，不等式左端的概率是概率密度曲线f（x）下两个尾部与X轴围成的面积（尾部概率）之和，如图5-1所示.70%5.1大数定律5.1.1切比雪夫（Chebyshev）不等式这个不等式指出，这两个尾部概率之和有一个上界，这个上界与方差σ2成正比，而与区间（μ－ε，μ+ε）的长度的一半的平方成反比，即σ2越小，两尾部的面积就越小，落入区间（μ－ε，μ+ε）的概率就越大，亦即X在μ附近的密集程度越高；反之，σ2越大，两尾部的面积就越大，落入区间（μ－ε，μ+ε）的概率就越小，亦即X在μ附近的密集程度越低.这说明了方差Var（X）完全刻画了随机变量X对E（X）的偏离程度.对于离散型随机变量也可作类似的解释.证这里仅给出连续型随机变量情况下的证明，离散型随机变量情况亦可类似证明.设f（x）是连续型随机变量X的密度函数，则70%5.1大数定律5.1.2依概率收敛定义1设{Xn}是一个随机变量序列，X是一个常数.若对于任意正数ε，有70%5.1大数定律5.1.3三个常见大数定律定理2［伯努利（Bernoulli）大数定律］设Xn是n重伯努利试验中事件A发生的次数，已知在每次试验中A发生的概率为p，则对任意正数ε，有70%5.2中心极限定理注①当在相同条件下重复试验多次时，随机事件发生的频率是趋于稳定的，它是在随机事件A发生的概率附近摆动，摆动的中心即为A发生的概率.②小概率事件在一次试验的结果中几乎是不可能出现的，这个规律也称为小概率事件原理.③事件A发生的频率Xn/n与其概率p有较大偏差（比如大于事先给定的ε）的可能性越来越小，但这并不意味着较大偏差就不再发生了，只是说小偏差发生的概率大，而大偏差发生的概率小，小到可以忽略不计，这就是频率稳定于概率的含义.它与微积分中“序列的极限”是不同的.70%5.2中心极限定理中心极限定理是概率论中最著名的结果之一.粗略地说，中心极限定理指出，大量的独立随机变量之和具有近似于正态的分布.因此，它不仅提供了计算独立随机变量之和的近似概率的简单方法，而且有助于解释为什么在客观世界中许多随机现象都服从或近似服从正态分布.下面介绍三个常用的中心极限定理，其中证明过程都将略去.定理5［李雅普诺夫（Liapunov）中心极限定理］设{Xn}是一个相互独立的随机变量序列，它们具有数学期望和方差：则随机变量之和的标准化变量为70%5.2中心极限定理也就是为什么正态随机变量在概率论中占有重要地位的一个基本原因.而当n较小时，这种近似性质不能保证.在概率论中，常把只有在n充分大时才具有的近似性质称为渐近性质，而在统计中称为大样本性质.70%5.2中心极限定理极限定理的另一种形式.注意，该定理条件要求随机变量X1，X2，…，Xn相互独立并同分布，因此，有时也称为独立同分布中心极限定理.下面比较切比雪夫大数定律的推论与林德伯格—列维中心极限定理.70%5.2中心极限定理下面比较切比雪夫大数定律的推论与林德伯格—列维中心极限定理.切比雪夫大数定律告诉我们：当n充分大时，独立同分布随机变量的算术平均值70%5.2中心极限定理客观世界中，人们在长期的实践中认识到频率具有稳定性，即当试验次数很大时，频率稳定在一个数的附近.这一事实显示了可以用一个数来表征事件发生的可能性的大小.这使人们认识到概率是客观存在的，进而由频率性质的启发和抽象给出了概率的定义，因而频率的稳定性是概率定义的客观基础.而伯努利大数定律则以严密的数学形式论证了频率的稳定性.中心极限定理表明，在相当一般的条件下，当独立随机变量个数很大时，其和的分布趋于正态分布.这一事实阐明了正态分布的重要性.中心极限定理也揭示了为什么在实际应用中会经常遇到正态分布，也就揭示了产生正态分布变量的原因.另一方面，它提供了独立同分布随机变量之和∑ni=1Xi（其中DXi存在）的近似分布，只要和式中项数个数充分大，就可以不必考虑和式中的随机变量服从什么分布，都可以用正态分布来近似，这在应用上是有效和重要的.本章小结第五章谢谢观赏概率论与数理统计6.1总体和样本6.26.3正态总体的抽样分布第六章样本及抽样分布统计量前面五章介绍了概率论的基本内容，主要包括随机变量概率分布的性质、特点和规律等.例如，求随机变量的数字特征，讨论随机变量函数的分布律等.但是在实际问题中，随机变量所服从的分布律可能完全不知道或部分不知道，那怎样才能知道一个随机变量分布律或参数呢？这就是数理统计需要解决的问题.数理统计是以概率论为理论基础的一个数学分支.它从实际的观测数据出发，主要研究随机现象的规律性，主要包括：实验设计与抽样调查设计，如何有效地收集数据与如何整理分析数据，从而做出统计推断.在科学研究中，数理统计占据一个十分重要的意义，是多种试验数据处理的理论基础.章前导读第六章样本及抽样分布70%6.1总体和样本在实际问题中，研究对象的数量往往很大.例如，我们要了解某厂所生产的一批灯泡的平均寿命.由于灯泡的数量很多，且测试灯泡的寿命具有破坏性，所以我们只能从这批产品中抽取一部分进行寿命测试，并且根据这部分产品的寿命数据对整批产品的平均寿命做出统计推断，这就是我们常说的抽样调查.在数理统计中，我们把研究对象的全体称为总体（或母体），而把组成总体的每个成员称为个体.总体中所包含个体的个数称为总体的容量，容量为有限的称为有限总体，容量

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

概率论与数理统计PPT完整全套教学课件

文档简介

温馨提示

最新文档

评论

概率论与数理统计PPT完整全套教学课件

文档简介

温馨提示

最新文档

评论

相关文档