概率论与数理统计的基本概念课件_第1页
概率论与数理统计的基本概念课件_第2页
概率论与数理统计的基本概念课件_第3页
概率论与数理统计的基本概念课件_第4页
概率论与数理统计的基本概念课件_第5页
已阅读5页,还剩347页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

概率论与数理统计

112/16/2022概率论与数理统计112/13/2022概率论与数理统计是研究随机现象数量规律的一门学科。2概率论与数理统计是研究随机现象2第一章概率论的基本概念

1.1随机试验

1.2样本空间

1.3概率和频率1.4等可能概型(古典概型)

1.5条件概率

1.6独立性第二章随机变量及其分布

2.1随机变量

2.2离散型随机变量及其分布

2.3随机变量的分布函数

2.4连续型随机变量及其概率密度

2.5随机变量的函数的分布第三章多维随机变量及其分布

3.1二维随机变量

3.2边缘分布

3.3条件分布

3.4相互独立的随机变量

3.5两个随机变量的函数的分布

3第一章概率论的基本概念3第四章随机变量的数字特征4.1数学期望4.2方差4.3协方差及相关系数4.4矩、协方差矩阵第五章大数定律和中心极限定理

5.1大数定律

5.2中心极限定理

第六章数理统计的基本概念

6.1总体和样本

6.2常用的分布4第四章随机变量的数字特征4第七章参数估计

7.1参数的点估计

7.2估计量的评选标准

7.3区间估计第八章假设检验8.1假设检验8.2正态总体均值的假设检验8.3正态总体方差的假设检验8.4置信区间与假设检验之间的关系8.5样本容量的选取8.6分布拟合检验8.7秩和检验第九章方差分析及回归分析9.1单因素试验的方差分析9.2双因素试验的方差分析9.3一元线性回归9.4多元线性回归55第十章随机过程及其统计描述10.1随机过程的概念10.2随机过程的统计描述10.3泊松过程及维纳过程第十一章马尔可夫链11.1马尔可夫过程及其概率分布11.2多步转移概率的确定11.3遍历性第十二章平稳随机过程12.1平稳随机过程的概念12.2各态历经性12.3相关函数的性质12.4平稳过程的功率谱密度6第十章随机过程及其统计描述6第五章大数定律和中心极限定理关键词:

契比雪夫不等式

大数定律

中心极限定理7第五章大数定律和中心极限定理7§1大数定律背景本章的大数定律,对第一章中提出的 “频率稳定性”,给出理论上的论证为了证明大数定理,先介绍一个重要不等式8§1大数定律背景本章的大数定律,对第一章中提出的 899

例1:在n重贝努里试验中,若已知每次试验事件A出 现 的概率为0.75,试利用契比雪夫不等式估计n,使 A出现的频率在0.74至0.76之间的概率不小于0.90。10例1:在n重贝努里试验中,若已知每次试验事件A出 现 的概随机变量序列依概率收敛的定义11随机变量序列依概率收敛的定义11大数定律的重要意义: 贝努里大数定律建立了在大量重复独立试验中事件出现频率的稳定性,正因为这种稳定性,概率的概念才有客观意义,贝努里大数定律还提供了通过试验来确定事件概率的方法,既然频率nA/n与概率p有较大偏差的可能性很小,我们便可以通过做试验确定某事件发生的频率并把它作为相应的概率估计,这种方法即是在第7章将要介绍的参数估计法,参数估计的重要理论基础之一就是大数定理。12大数定律的重要意义:12§2中心极限定理背景:有许多随机变量,它们是由大量的相互独立的随机变量的 综合影响所形成的,而其中每个个别的因素作用都很小,这种 随机变量往往服从或近似服从正态分布,或者说它的极限分布 是正态分布,中心极限定理正是从数学上论证了这一现象,它 在长达两个世纪的时期内曾是概率论研究的中心课题。

13§2中心极限定理背景:有许多随机变量,它们是由大量的相互独1414

例2:设某种电器元件的寿命服从均值为100小时的指数分布,现 随机取得16只,设它们的寿命是相互独立的,求这16只元件 的寿命的总和大于1920小时的概率。15例2:设某种电器元件的寿命服从均值为100小时的指数分布,

例3:某保险公司的老年人寿保险有1万人参加,每人每年交200 元, 若老人在该年内死亡,公司付给受益人1万元。设老年人死亡 率为0.017,试求保险公司在一年内这项保险亏本的概率。16例3:某保险公司的老年人寿保险有1万人参加,每人每年交20

例4:设某工厂有400台同类机器,各台机器发生故障的概 率都是0.02,各台机器工作是相互独立的,试求机 器出故障的台数不小于2的概率。17例4:设某工厂有400台同类机器,各台机器发生故障的概 第六章数理统计的基本概念 关键词:

样本

总体

个体

统计量

18第六章数理统计的基本概念 关键词:18引言:数理统计学是一门关于数据收集、整理、分析 和推断的科学。在概率论中已经知道,由于大 量的 随机试验中各种结果的出现必然呈现它的 规律 性,因而从理论上讲只要对随机现象进行 足够多次观察,各种结果的规律性一定能清楚 地呈现,但是实际上所允许的观察永远是有限 的,甚至是 少量的。

例如:若规定灯泡寿命低于1000小时者 为次 品,如何确定次品率?由于灯泡寿命试验是 破坏性试验,不可能把整批灯泡逐一检测,只 能抽取一部分灯泡作为样本进行检验,以样本 的信 息来推断总体的信息,这是数理统计学研 究的问题之一。19引言:数理统计学是一门关于数据收集、整理、分析 和推§1总体和样本总体:研究对象的全体。如一批灯泡。个体:组成总体的每个元素。如某个灯泡。抽样:从总体Z中抽取有限个个体对总体进行观察的取值过程。随机样本:随机抽取的n个个体的集合(Z1,Z2,…,Zn),

n为样本容量简单随机样本:满足以下两个条件的随机样本(Z1,Z2,…,Zn)称 为简单随机样本。

1.每个Zi与Z同分布

2.Z1,Z2,…,Zn是相互独立的随机变量[说明]:后面提到的样本均指简单随机样本,由概率论知,若总体Z 具有概率密度f(x), 则样本(Z1,Z2,…,Zn)具有联合密度函数:20§1总体和样本总体:研究对象的全体。如一批灯泡。20统计量:样本的不含任何未知参数的函数。常用统计量:设(Z1,Z2,…,Zn)为取自总体Z的样本21统计量:样本的不含任何未知参数的函数。21随机变量独立性的两个定理22随机变量独立性的两个定理22§2常用的分布

23§2常用的分布23

24 24

2525

2626

272728282929正态总体样本均值和方差的分布30正态总体样本均值和方差的分布303131概率论与数理统计的基本概念课件复习思考题61.什么叫总体?什么叫简单随机样本?总体X的样本X1,X2,…,Xn有哪两个主要性质?2.什么是统计量?什么是统计量的值?3.样本均值和样本方差如何计算?4.N(0,1)分布,t分布,χ2分布和F分布的双侧、下侧、上侧分位点是如何定义的?怎样利用附表查这些分位点的值?5.对一个正态总体的三个常用统计量及其分布是什么?6.对两个正态总体的三个常用统计量及其分布是什么?33复习思考题61.什么叫总体?什么叫简单随机样本?总体X的样第七章参数估计 关键词:

矩估计法 极大似然估计法 置信区间 置信度34第七章参数估计 关键词:343535§1

参数的点估计36§1参数的点估计363737

3838

3939极大似然估计法极大似然估计的原理介绍考察以下例子:假设在一个罐中放着许多白球和黑球,并假定已经知道两种球的数目之比是1:3,但不知道哪种颜色的球多。如果用返回抽样方法从罐中任取n个球,则其中黑球的个数为x的概率为:若取n=3,如何通过x来估计p值先计算抽样的可能结果x在这两种p值之下的概率:

0123

40极大似然估计法极大似然估计的原理介绍012341414242

4343

44444545

4646表1

例2,例4,例5中两种估计方法所得结果

例题

矩估计量极大似然估计量

例2

例4例547表1例2,例4,例5中两种估计方法所得结果例§2估计量的评选标准从表1看到,对总体的未知参数可用不同方法求得不同的估计量,如何评价好坏?通常用三条标准检验:无偏性,有效性,相合性

无偏性48§2估计量的评选标准从表1看到,对总体的未知参数可用

4949

5050纠偏方法51纠偏方法51有效性52有效性52

5353相合性54相合性54

5555§3区间估计56§3区间估计56

5757

单侧置信区间58单侧置信区间58

正态总体均值方差的区间估计59正态总体均值方差的区间估计5960606161

6262区间短精度高区间长精度低63区间短区间长636464

6565666667676868例12:两台机床生产同一个型号的滚珠,从甲机床生产的滚 珠中抽取8个,从乙机床生产的滚珠中抽取9个,测得这 些滚珠得直径(毫米)如下:甲机床15.014.815.215.414.915.115.214.8乙机床15.215.014.815.114.614.815.114.515.069例12:两台机床生产同一个型号的滚珠,从甲机床生产的滚 7070[说明]置信区间包含两方面含义1.置信水平2.区间长度置信水平越高,区间越大,但区间精确度差置信区间越小,精确度高,但置信水平差71[说明]置信区间包含两方面含义71待估参数其他参数W的分布置信区间单侧置信限一个正态总体两个正态总体正态总体均值、方差的置信区间与单侧置信限待估其他W的分布置信区间单侧置信限一复习思考题71.总体未知参数矩估计的思想方法是什么?试写出0-1分布、二项分布b(m,p)、泊松分布∏(λ)、均匀分布U(a,b)、正态分布N(μ,σ2)中有关参数的矩估计式2.极大似然估计的主要步骤是什么?3.未知参数的估计量与估计值有什么区别?5.估计量的三个基本评价标准是什么?你能理解它们的含义吗?6.求参数置信区间的一般方法是什么?对正态总体,试从有关的统计量自行导出几类参数的置信区间?7.置信度的含义是什么?置信度、区间长度和样本容量的关系怎样?复习思考题71.总体未知参数矩估计的思想方法是什么?试写出复习思考题81.假设检验的基本思想是什么?其中使用了一条什么原理?2.检验的显著性水平α的意义是什么?3.比较双边、左边和右边检验的拒绝域。4.使用U检验法可以进行哪些假设检验?5.使用t检验法可以进行哪些假设检验?6.使用χ2检验法可以进行哪些假设检验?7.使用F检验法可以进行哪些假设检验?8.正态总体期望与方差的区间估计和假设检验两者之间有什么相似之处?9.成对数据差的t检验适用于哪些特殊场合?10.分布拟合的χ2检验的基本步骤是什么?74复习思考题81.假设检验的基本思想是什么?其中使用了一条什 关键词:

随机过程 状态和状态空间 样本函数 有限维分布函数 均值函数 方差函数 自相关函数 自协方差函数 互相关函数 互协方差函数 正态过程 独立增量过程泊松过程维纳过程第十章随机过程及其统计描述75 关键词:第十章随机过程及其统计描述75§1随机过程的概念

随机过程被认为是概率论的“动力学”部分,即它的研究对象是随时间演变的随机现象,它是从多维随机变量向一族(无限多个)随机变量的推广。

给定一随机试验E,其样本空间S={e},将样本空间中的每一元作如下对应,便得到一系列结果:76§1随机过程的概念随机过程被认为是概率论的“动力学

一维、二维或一般的多维随机变量的研究是概率论的研究内容,而随机序列、随机过程则是随机过程学科的研究内容。从前面的描述中看到,它的每一样本点所对应的,是一个数列或是一个关于t的函数。

77一维、二维或一般的多维随机变量的研究是概率论的研究内容

例1:抛掷一枚硬币的试验,样本空间是S={H,T},现定义:123478例1:抛掷一枚硬币的试验,样本空间是S={H,T},现定义

7979

8080

8181

例5:考虑抛掷一颗骰子的试验:例5:考虑抛掷一颗骰子的试验:随机过程的分类:随机过程可根据参数集T和任一时刻的状态分为四类,参数集T可分为离散集和连续集两种情况,任一时刻的状态分别为离散型随机变量和连续型随机变量两种:连续参数连续型的随机过程,如例2,例3连续参数离散型的随机过程,如例1,例4离散参数离散型的随机过程,如例5离散参数连续型的随机过程,如随机相位正弦波83随机过程的分类:83§2随机过程的统计描述84§2随机过程的统计描述84

例1:抛掷一枚硬币的试验,定义一随机过程:85例1:抛掷一枚硬币的试验,定义一随机过程:85

8686(二)随机过程的数字特征87(二)随机过程的数字特征878888

8989

9090

续91续919292(三)二维随机过程的分布函数和数字特征93(三)二维随机过程的分布函数和数字特征939494

9595§3泊松过程及维纳过程96§3泊松过程及维纳过程96独立增量过程的性质:97独立增量过程的性质:979898(一)泊松分布等间隔的不等间隔的99(一)泊松分布等间隔的不等间隔的99100100续101续101证毕102证毕102103103104104105105106106定理一:强度为λ的泊松流(泊松过程)的点间间距是相互独立的随 机变量,且服从同一指数分布定理二:如果任意相继出现的两个质点的点间间距是相互独立, 且服从同一个指数分布:

这两个定理刻画出了泊松过程的特征,定理二告诉我们,要确定一个计数过程是不是泊松过程,只要用统计方法检验点间间距是否独立,且服从同一个指数分布。则质点流构成强度为λ的泊松过程107定理一:强度为λ的泊松流(泊松过程)的点间间距是相互独立的(二)维纳过程维纳过程是布朗运动的数学模型以W(t)表示运动中一微粒从时刻t=0到时刻t>0的位移的横坐标,且设W(0)=0。由于微粒的运动是受到大量随机的、相互独立的分子碰撞的结果,于是:粒子在时段(s,t]上的位移可看作是许多微小位移的 和,根据中心极限定理,假设位移W(t)-W(s)服从正 态分布是合理的。由于粒子的运动完全由液体分子不规则碰撞而引起 的,这样,在不相重叠的时间间隔内,碰撞的次数、 大小和方向可假设相互独立,即W(t)具有独立增量, 同时W(t)的增量具有平稳性。108(二)维纳过程维纳过程是布朗运动的数学模型108109109 关键词:

无后效性(马尔可夫性) 齐次马尔可夫链

n步转移概率 n步转移概率矩阵 C-K方程 马氏链的有限维分布律 遍历性 极限分布(平稳分布)第十一章马尔可夫链110 关键词:第十一章马尔可夫链110§1马尔可夫过程及其概率分布马尔可夫性(无后效性)过程(或系统)在时刻t0所处的状态为已知的条件下,过程在时刻t>t0所处状态的条件分布与过程在时刻t0之前所处的状态无关。通俗地说,就是在已经知道过程“现在”的条件下,其“将来”不依赖于“过去”。§1马尔可夫过程及其概率分布马尔可夫性(无后效性)

证毕!112证毕!112由上例知,泊松过程是时间连续状态离散的马氏过程,

维纳过程是时间状态都连续的马氏过程。时间和状态都离散的马尔可夫过程称为马尔可夫链,简称马氏链,记为:{Xn=X(n),n=0,1,2,…},参数集T1={0,1,2,…},记链的状态空间为:113由上例知,泊松过程是时间连续状态离散的马氏过程,113

114114的状态XmXm+1的状态115的状态XmXm+1的状态115

例2:(0-1传输系统)如图所示,只传输数字0和1的串联系统中,设每一级的传真率为p,误码率为q=1-p。并设一个单位时间传输一级,X0是第一级的输入,Xn是第n级的输出(n≥1),那么{Xn,n=0,1,2…}是一随机过程,状态空间I={0,1},而且当Xn=i为已知时,Xn+1所处的状态的概率分布只与Xn=i有关,而与时刻n以前所处的状态无关,所以它是一个马氏链,而且还是齐次的,它的一步转移概率和一步转移概率矩阵分别为:……n21X0X1X2XnXn-1116例2:(0-1传输系统)……n21X0X1X2XnXn-1例3:一维随机游动。设一醉汉Q(或看作一随机游动的质点)在直线上 的点集I={1,2,3,4,5}作随机游动,且仅在1秒、2秒等时刻发生 游动,游动的概率规则是:如果Q现在位于点i(1<i<5),则下一 时刻各以的概率向左或向右移动一格,或以的概率留在 原处;如果Q现在处于1(或5)这一点上,则下一时刻就以概率1 移动到2(或4)这点上,1和5这两点称为反村壁,这种游动称为 带有两个反村壁的随机游动。解:以Xn表示时刻n时Q的位置,不同的位置就是Xn的不同状态,而且当Xn=i为已知时,Xn+1所处的状态的概率分布只与Xn=i有关,而与Q在时刻n以前如何到达i是完全无关的,所以{Xn,n=0,1,2…}是一马氏链,且是齐次的,它的一步转移概率矩阵为:如果把1这点改为吸收壁,即Q一旦到达1这一点,则永远留在点1时,此时的转移概率矩阵为:13452117例3:一维随机游动。设一醉汉Q(或看作一随机游动的质点)在

例4:排队模型

设服务系统由一个服务员和只可以容纳两个人的等候室组成。服务规则为:先到先服务,后来者需在等候室依次排队,假设一个需要服务的顾客到达系统时发现系统内已有3个顾客,则该顾客立即离去。设时间间隔⊿t内有一个顾客进入系统的概率为q,有一接受服务的顾客离开系统(即服务完毕)的概率为p,又设当⊿t充分小时,在这时间间隔内多于一个顾客进入或离开系统实际上是不可能的,再设有无顾客来到与服务是否完毕是相互独立的。现用马氏链来描述这个服务系统:设Xn=X(n⊿t)表示时刻n⊿t时系统内的顾客数,即系统的状态。{Xn,n=0,1,2…}是一随机过程,状态空间I={0,1,2,3},且如前例2、例3的分析可知,它是一个齐次马氏链,它的一步转移概率矩阵为:等候室服务台系统随机到达者离去者118例4:排队模型等候室服务台系统随机到达者离去者118

例5:有甲、乙两袋球,开始时,甲袋有3只球,乙袋有2只 球;以后,每次任取一袋,并从袋中取出一球放入另 一袋。Xn表示第n次抽取后甲袋的球数,n=1,2,…; {Xn,n=1,2,…}是一随机过程, 状态空间I={0,1,2,3,4,5},当Xn=i时,Xn+1=j的概率 只与i有关,与n时刻之前如何取到i值是无关的,这 是一马氏链,且是齐次的,一步转移概率矩阵为:在实际问题中,一步转移概率通常可通过统计试验确定。如下例:甲乙119例5:有甲、乙两袋球,开始时,甲袋有3只球,乙袋有2只 球

例6:某计算机机房的一台计算机经常出故障,研究者每隔15分钟观察一次计算机的运行状态,收集了24个小时的数(共作97次观察),用1表示正常状态,用0表示不正常状态,所得的数据序列如下:1110010011111110011110111111001111111110001101101111011011010111101110111101111110011011111100111

解:设Xn为第n(n=1,2,…,97)个时段的计算机状态, 可以认为它是一个齐次马氏链,状态空间I={0,1}, 96次状态转移情况是: 0→0:8次;0→1:18次;1→0:18次;1→1:52次; 因此一步转移概率可用频率近似地表示为:例6:某计算机机房的一台计算机经常出故障,研究者每隔15分

例7:已知计算机在某一时段(15分钟)的状态为0,问在此条件 下,从此时段起,该计算机能连续正常工作45分钟(3个时段) 的条件概率是多少?解:由题意,某一时段的状态为0就是初始状态为0,即X0=0, 所求的概率为:121例7:已知计算机在某一时段(15分钟)的状态为0,问在此条

122122

123123§2多步转移概率的确定124§2多步转移概率的确定124证毕!125证毕!125126126

从0出发,经4步首次回到0状态127从0出发,127

续128续128129129§3遍历性130§3遍历性130齐次马氏链在什么条件下才具有遍历性?如何求出它的极限分布?有限链的遍历性的充分条件:131131

132132例1:一质点在1,2,3三个点上作随机游动,1和3是两个反射壁, 当质点处于2时,下一时刻处于1,2,3是等可能的。 写出一步转移概率矩阵,判断此链是否具有遍历性, 若有,求出极限分布。133例1:一质点在1,2,3三个点上作随机游动,1和3是两个反例2:一质点在1,2,3三个点上作随机游动,1和3是两个反射 壁,当质点处于2时,下一时刻转移到1和3的概率各为½。 写出一步转移概率矩阵,判断此链是否具有遍历性, 若有,求出极限分布。134例2:一质点在1,2,3三个点上作随机游动,1和3是两个反

例3:一质点在1,2,3三个点上作随机游动,1和3是两个 吸收壁,当质点处于2时,下一时刻转移到1和3的 概率各为½。写出一步转移概率矩阵,判断此链是 否具有遍历性?若有,求出极限分布。135例3:一质点在1,2,3三个点上作随机游动,1和3是两个 关键词:

(宽)平稳过程 时间均值 时间相关函数 各态历经性 各态历经过程 谱密度 维纳——辛钦公式 白噪声第十二章平稳随机过程136 关键词:第十二章平稳随机过程136§1平稳随机过程的概念137§1平稳随机过程的概念137138138139139

140140

141141

142142

续143续143144144§2各态历经性

如何根据实验记录确定平稳过程的均值和自相关函数呢?按照数学期望和自相关函数的定义,需要时,一个平稳过程重复进行大量观察,获得一族样本函数用统计实验方法,均值和自相关函数近似地为:

平稳过程的统计特性不随时间的推移而变化,根据这一特点,能否通过在一个很长时间内观察得到的一个样本曲线来估计平稳过程的数字特征呢?本节给出的各态历经定理证实,只要满足某些条件,那么均值和自相关函数实际上可以用一个样本函数在整个时间轴上的平均值来代替。145§2各态历经性如何根据实验记录确定平稳过程的均值146146147147

148148149149

150150续151续151证毕!152证毕!152153153

见下页154见下页154155155各态历经定理的重要价值在于它从理论上给出了如下保证:一个平稳过程X(t),若0<t<+∞,只要它满足各态历经性条件,便可以根据“以概率1成立”的含义,从一次试验所得到的样本函数x(t)来确定该过程的均值和自相关函数。156各态历经定理的重要价值在于它从理论上给出了如下保证§3相关函数的性质

见下页157§3相关函数的性质见下页157

见下页158见下页158证毕柯西-施瓦兹不等式159证毕柯西-施瓦兹159应用:160应用:160

161161§4平稳过程的功率谱密度(一)平稳过程的功率谱密度§4平稳过程的功率谱密度(一)平稳过程的功率谱密度163163164164165165166166(二)谱密度的性质167(二)谱密度的性质1671681681234567表12.11234567表12.1

170170

171171172172

173173174174(三)互谱密度及其性质175(三)互谱密度及其性质175课件结束!12/16/2022课件结束!12/13/2022概率论与数理统计

17712/16/2022概率论与数理统计112/13/2022概率论与数理统计是研究随机现象数量规律的一门学科。178概率论与数理统计是研究随机现象2第一章概率论的基本概念

1.1随机试验

1.2样本空间

1.3概率和频率1.4等可能概型(古典概型)

1.5条件概率

1.6独立性第二章随机变量及其分布

2.1随机变量

2.2离散型随机变量及其分布

2.3随机变量的分布函数

2.4连续型随机变量及其概率密度

2.5随机变量的函数的分布第三章多维随机变量及其分布

3.1二维随机变量

3.2边缘分布

3.3条件分布

3.4相互独立的随机变量

3.5两个随机变量的函数的分布

179第一章概率论的基本概念3第四章随机变量的数字特征4.1数学期望4.2方差4.3协方差及相关系数4.4矩、协方差矩阵第五章大数定律和中心极限定理

5.1大数定律

5.2中心极限定理

第六章数理统计的基本概念

6.1总体和样本

6.2常用的分布180第四章随机变量的数字特征4第七章参数估计

7.1参数的点估计

7.2估计量的评选标准

7.3区间估计第八章假设检验8.1假设检验8.2正态总体均值的假设检验8.3正态总体方差的假设检验8.4置信区间与假设检验之间的关系8.5样本容量的选取8.6分布拟合检验8.7秩和检验第九章方差分析及回归分析9.1单因素试验的方差分析9.2双因素试验的方差分析9.3一元线性回归9.4多元线性回归1815第十章随机过程及其统计描述10.1随机过程的概念10.2随机过程的统计描述10.3泊松过程及维纳过程第十一章马尔可夫链11.1马尔可夫过程及其概率分布11.2多步转移概率的确定11.3遍历性第十二章平稳随机过程12.1平稳随机过程的概念12.2各态历经性12.3相关函数的性质12.4平稳过程的功率谱密度182第十章随机过程及其统计描述6第五章大数定律和中心极限定理关键词:

契比雪夫不等式

大数定律

中心极限定理183第五章大数定律和中心极限定理7§1大数定律背景本章的大数定律,对第一章中提出的 “频率稳定性”,给出理论上的论证为了证明大数定理,先介绍一个重要不等式184§1大数定律背景本章的大数定律,对第一章中提出的 81859

例1:在n重贝努里试验中,若已知每次试验事件A出 现 的概率为0.75,试利用契比雪夫不等式估计n,使 A出现的频率在0.74至0.76之间的概率不小于0.90。186例1:在n重贝努里试验中,若已知每次试验事件A出 现 的概随机变量序列依概率收敛的定义187随机变量序列依概率收敛的定义11大数定律的重要意义: 贝努里大数定律建立了在大量重复独立试验中事件出现频率的稳定性,正因为这种稳定性,概率的概念才有客观意义,贝努里大数定律还提供了通过试验来确定事件概率的方法,既然频率nA/n与概率p有较大偏差的可能性很小,我们便可以通过做试验确定某事件发生的频率并把它作为相应的概率估计,这种方法即是在第7章将要介绍的参数估计法,参数估计的重要理论基础之一就是大数定理。188大数定律的重要意义:12§2中心极限定理背景:有许多随机变量,它们是由大量的相互独立的随机变量的 综合影响所形成的,而其中每个个别的因素作用都很小,这种 随机变量往往服从或近似服从正态分布,或者说它的极限分布 是正态分布,中心极限定理正是从数学上论证了这一现象,它 在长达两个世纪的时期内曾是概率论研究的中心课题。

189§2中心极限定理背景:有许多随机变量,它们是由大量的相互独19014

例2:设某种电器元件的寿命服从均值为100小时的指数分布,现 随机取得16只,设它们的寿命是相互独立的,求这16只元件 的寿命的总和大于1920小时的概率。191例2:设某种电器元件的寿命服从均值为100小时的指数分布,

例3:某保险公司的老年人寿保险有1万人参加,每人每年交200 元, 若老人在该年内死亡,公司付给受益人1万元。设老年人死亡 率为0.017,试求保险公司在一年内这项保险亏本的概率。192例3:某保险公司的老年人寿保险有1万人参加,每人每年交20

例4:设某工厂有400台同类机器,各台机器发生故障的概 率都是0.02,各台机器工作是相互独立的,试求机 器出故障的台数不小于2的概率。193例4:设某工厂有400台同类机器,各台机器发生故障的概 第六章数理统计的基本概念 关键词:

样本

总体

个体

统计量

194第六章数理统计的基本概念 关键词:18引言:数理统计学是一门关于数据收集、整理、分析 和推断的科学。在概率论中已经知道,由于大 量的 随机试验中各种结果的出现必然呈现它的 规律 性,因而从理论上讲只要对随机现象进行 足够多次观察,各种结果的规律性一定能清楚 地呈现,但是实际上所允许的观察永远是有限 的,甚至是 少量的。

例如:若规定灯泡寿命低于1000小时者 为次 品,如何确定次品率?由于灯泡寿命试验是 破坏性试验,不可能把整批灯泡逐一检测,只 能抽取一部分灯泡作为样本进行检验,以样本 的信 息来推断总体的信息,这是数理统计学研 究的问题之一。195引言:数理统计学是一门关于数据收集、整理、分析 和推§1总体和样本总体:研究对象的全体。如一批灯泡。个体:组成总体的每个元素。如某个灯泡。抽样:从总体Z中抽取有限个个体对总体进行观察的取值过程。随机样本:随机抽取的n个个体的集合(Z1,Z2,…,Zn),

n为样本容量简单随机样本:满足以下两个条件的随机样本(Z1,Z2,…,Zn)称 为简单随机样本。

1.每个Zi与Z同分布

2.Z1,Z2,…,Zn是相互独立的随机变量[说明]:后面提到的样本均指简单随机样本,由概率论知,若总体Z 具有概率密度f(x), 则样本(Z1,Z2,…,Zn)具有联合密度函数:196§1总体和样本总体:研究对象的全体。如一批灯泡。20统计量:样本的不含任何未知参数的函数。常用统计量:设(Z1,Z2,…,Zn)为取自总体Z的样本197统计量:样本的不含任何未知参数的函数。21随机变量独立性的两个定理198随机变量独立性的两个定理22§2常用的分布

199§2常用的分布23

200 24

20125

20226

203272042820529正态总体样本均值和方差的分布206正态总体样本均值和方差的分布3020731概率论与数理统计的基本概念课件复习思考题61.什么叫总体?什么叫简单随机样本?总体X的样本X1,X2,…,Xn有哪两个主要性质?2.什么是统计量?什么是统计量的值?3.样本均值和样本方差如何计算?4.N(0,1)分布,t分布,χ2分布和F分布的双侧、下侧、上侧分位点是如何定义的?怎样利用附表查这些分位点的值?5.对一个正态总体的三个常用统计量及其分布是什么?6.对两个正态总体的三个常用统计量及其分布是什么?209复习思考题61.什么叫总体?什么叫简单随机样本?总体X的样第七章参数估计 关键词:

矩估计法 极大似然估计法 置信区间 置信度210第七章参数估计 关键词:3421135§1

参数的点估计212§1参数的点估计3621337

21438

21539极大似然估计法极大似然估计的原理介绍考察以下例子:假设在一个罐中放着许多白球和黑球,并假定已经知道两种球的数目之比是1:3,但不知道哪种颜色的球多。如果用返回抽样方法从罐中任取n个球,则其中黑球的个数为x的概率为:若取n=3,如何通过x来估计p值先计算抽样的可能结果x在这两种p值之下的概率:

0123

216极大似然估计法极大似然估计的原理介绍01232174121842

21943

2204422145

22246表1

例2,例4,例5中两种估计方法所得结果

例题

矩估计量极大似然估计量

例2

例4例5223表1例2,例4,例5中两种估计方法所得结果例§2估计量的评选标准从表1看到,对总体的未知参数可用不同方法求得不同的估计量,如何评价好坏?通常用三条标准检验:无偏性,有效性,相合性

无偏性224§2估计量的评选标准从表1看到,对总体的未知参数可用

22549

22650纠偏方法227纠偏方法51有效性228有效性52

22953相合性230相合性54

23155§3区间估计232§3区间估计56

23357

单侧置信区间234单侧置信区间58

正态总体均值方差的区间估计235正态总体均值方差的区间估计592366023761

23862区间短精度高区间长精度低239区间短区间长6324064

24165242662436724468例12:两台机床生产同一个型号的滚珠,从甲机床生产的滚 珠中抽取8个,从乙机床生产的滚珠中抽取9个,测得这 些滚珠得直径(毫米)如下:甲机床15.014.815.215.414.915.115.214.8乙机床15.215.014.815.114.614.815.114.515.0245例12:两台机床生产同一个型号的滚珠,从甲机床生产的滚 24670[说明]置信区间包含两方面含义1.置信水平2.区间长度置信水平越高,区间越大,但区间精确度差置信区间越小,精确度高,但置信水平差247[说明]置信区间包含两方面含义71待估参数其他参数W的分布置信区间单侧置信限一个正态总体两个正态总体正态总体均值、方差的置信区间与单侧置信限待估其他W的分布置信区间单侧置信限一复习思考题71.总体未知参数矩估计的思想方法是什么?试写出0-1分布、二项分布b(m,p)、泊松分布∏(λ)、均匀分布U(a,b)、正态分布N(μ,σ2)中有关参数的矩估计式2.极大似然估计的主要步骤是什么?3.未知参数的估计量与估计值有什么区别?5.估计量的三个基本评价标准是什么?你能理解它们的含义吗?6.求参数置信区间的一般方法是什么?对正态总体,试从有关的统计量自行导出几类参数的置信区间?7.置信度的含义是什么?置信度、区间长度和样本容量的关系怎样?复习思考题71.总体未知参数矩估计的思想方法是什么?试写出复习思考题81.假设检验的基本思想是什么?其中使用了一条什么原理?2.检验的显著性水平α的意义是什么?3.比较双边、左边和右边检验的拒绝域。4.使用U检验法可以进行哪些假设检验?5.使用t检验法可以进行哪些假设检验?6.使用χ2检验法可以进行哪些假设检验?7.使用F检验法可以进行哪些假设检验?8.正态总体期望与方差的区间估计和假设检验两者之间有什么相似之处?9.成对数据差的t检验适用于哪些特殊场合?10.分布拟合的χ2检验的基本步骤是什么?250复习思考题81.假设检验的基本思想是什么?其中使用了一条什 关键词:

随机过程 状态和状态空间 样本函数 有限维分布函数 均值函数 方差函数 自相关函数 自协方差函数 互相关函数 互协方差函数 正态过程 独立增量过程泊松过程维纳过程第十章随机过程及其统计描述251 关键词:第十章随机过程及其统计描述75§1随机过程的概念

随机过程被认为是概率论的“动力学”部分,即它的研究对象是随时间演变的随机现象,它是从多维随机变量向一族(无限多个)随机变量的推广。

给定一随机试验E,其样本空间S={e},将样本空间中的每一元作如下对应,便得到一系列结果:252§1随机过程的概念随机过程被认为是概率论的“动力学

一维、二维或一般的多维随机变量的研究是概率论的研究内容,而随机序列、随机过程则是随机过程学科的研究内容。从前面的描述中看到,它的每一样本点所对应的,是一个数列或是一个关于t的函数。

253一维、二维或一般的多维随机变量的研究是概率论的研究内容

例1:抛掷一枚硬币的试验,样本空间是S={H,T},现定义:1234254例1:抛掷一枚硬币的试验,样本空间是S={H,T},现定义

25579

25680

25781

例5:考虑抛掷一颗骰子的试验:例5:考虑抛掷一颗骰子的试验:随机过程的分类:随机过程可根据参数集T和任一时刻的状态分为四类,参数集T可分为离散集和连续集两种情况,任一时刻的状态分别为离散型随机变量和连续型随机变量两种:连续参数连续型的随机过程,如例2,例3连续参数离散型的随机过程,如例1,例4离散参数离散型的随机过程,如例5离散参数连续型的随机过程,如随机相位正弦波259随机过程的分类:83§2随机过程的统计描述260§2随机过程的统计描述84

例1:抛掷一枚硬币的试验,定义一随机过程:261例1:抛掷一枚硬币的试验,定义一随机过程:85

26286(二)随机过程的数字特征263(二)随机过程的数字特征8726488

26589

26690

续267续9126892(三)二维随机过程的分布函数和数字特征269(三)二维随机过程的分布函数和数字特征9327094

27195§3泊松过程及维纳过程272§3泊松过程及维纳过程96独立增量过程的性质:273独立增量过程的性质:9727498(一)泊松分布等间隔的不等间隔的275(一)泊松分布等间隔的不等间隔的99276100续277续101证毕278证毕102279103280104281105282106定理一:强度为λ的泊松流(泊松过程)的点间间距是相互独立的随 机变量,且服从同一指数分布定理二:如果任意相继出现的两个质点的点间间距是相互独立, 且服从同一个指数分布:

这两个定理刻画出了泊松过程的特征,定理二告诉我们,要确定一个计数过程是不是泊松过程,只要用统计方法检验点间间距是否独立,且服从同一个指数分布。则质点流构成强度为λ的泊松过程283定理一:强度为λ的泊松流(泊松过程)的点间间距是相互独立的(二)维纳过程维纳过程是布朗运动的数学模型以W(t)表示运动中一微粒从时刻t=0到时刻t>0的位移的横坐标,且设W(0)=0。由于微粒的运动是受到大量随机的、相互独立的分子碰撞的结果,于是:粒子在时段(s,t]上的位移可看作是许多微小位移的 和,根据中心极限定理,假设位移W(t)-W(s)服从正 态分布是合理的。由于粒子的运动完全由液体分子不规则碰撞而引起 的,这样,在不相重叠的时间间隔内,碰撞的次数、 大小和方向可假设相互独立,即W(t)具有独立增量, 同时W(t)的增量具有平稳性。284(二)维纳过程维纳过程是布朗运动的数学模型108285109 关键词:

无后效性(马尔可夫性) 齐次马尔可夫链

n步转移概率 n步转移概率矩阵 C-K方程 马氏链的有限维分布律 遍历性 极限分布(平稳分布)第十一章马尔可夫链286 关键词:第十一章马尔可夫链110§1马尔可夫过程及其概率分布马尔可夫性(无后效性)过程(或系统)在时刻t0所处的状态为已知的条件下,过程在时刻t>t0所处状态的条件分布与过程在时刻t0之前所处的状态无关。通俗地说,就是在已经知道过程“现在”的条件下,其“将来”不依赖于“过去”。§1马尔可夫过程及其概率分布马尔可夫性(无后效性)

证毕!288证毕!112由上例知,泊松过程是时间连续状态离散的马氏过程,

维纳过程是时间状态都连续的马氏过程。时间和状态都离散的马尔可夫过程称为马尔可夫链,简称马氏链,记为:{Xn=X(n),n=0,1,2,…},参数集T1={0,1,2,…},记链的状态空间为:289由上例知,泊松过程是时间连续状态离散的马氏过程,113

290114的状态XmXm+1的状态291的状态XmXm+1的状态115

例2:(0-1传输系统)如图所示,只传输数字0和1的串联系统中,设每一级的传真率为p,误码率为q=1-p。并设一个单位时间传输一级,X0是第一级的输入,Xn是第n级的输出(n≥1),那么{Xn,n=0,1,2…}是一随机过程,状态空间I={0,1},而且当Xn=i为已知时,Xn+1所处的状态的概率分布只与Xn=i有关,而与时刻n以前所处的状态无关,所以它是一个马氏链,而且还是齐次的,它的一步转移概率和一步转移概率矩阵分别为:……n21X0X1X2XnXn-1292例2:(0-1传输系统)……n21X0X1X2XnXn-1例3:一维随机游动。设一醉汉Q(或看作一随机游动的质点)在直线上 的点集I={1,2,3,4,5}作随机游动,且仅在1秒、2秒等时刻发生 游动,游动的概率规则是:如果Q现在位于点i(1<i<5),则下一 时刻各以的概率向左或向右移动一格,或以的概率留在 原处;如果Q现在处于1(或5)这一点上,则下一时刻就以概率1 移动到2(或4)这点上,1和5这两点称为反村壁,这种游动称为 带有两个反村壁的随机游动。解:以Xn表示时刻n时Q的位置,不同的位置就是Xn的不同状态,而且当Xn=i为已知时,Xn+1所处的状态的概率分布只与Xn=i有关,而与Q在时刻n以前如何到达i是完全无关的,所以{Xn,n=0,1,2…}是一马氏链,且是齐次的,它的一步转移概率矩阵为:如果把1这点改为吸收壁,即Q一旦到达1这一点,则永远留在点1时,此时的转移概率矩阵为:13452293例3:一维随机游动。设一醉汉Q(或看作一随机游动的质点)在

例4:排队模型

设服务系统由一个服务员和只可以容纳两个人的等候室组成。服务规则为:先到先服务,后来者需在等候室依次排队,假设一个需要服务的顾客到达系统时发现系统内已有3个顾客,则该顾客立即离去。设时间间隔⊿t内有一个顾客进入系统的概率为q,有一接受服务的顾客离开系统(即服务完毕)的概率为p,又设当⊿t充分小时,在这时间间隔内多于一个顾客进入或离开系统实际上是不可能的,再设有无顾客来到与服务是否完毕是相互独立的。现用马氏链来描述这个服务系统:设Xn=X(n⊿t)表示时刻n⊿t时系统内的顾客数,即系统的状态。{Xn,n=0,1,2…}是一随机过程,状态空间I={0,1,2,3},且如前例2、例3的分析可知,它是一个齐次马氏链,它的一步转移概率矩阵为:等候室服务台系统随机到达者离去者294例4:排队模型等候室服务台系统随机到达者离去者118

例5:有甲、乙两袋球,开始时,甲袋有3只球,乙袋有2只 球;以后,每次任取一袋,并从袋中取出一球放入另 一袋。Xn表示第n次抽取后甲袋的球数,n=1,2,…; {Xn,n=1,2,…}是一随机过程, 状态空间I={0,1,2,3,4,5},当Xn=i时,Xn+1=j的概率 只与i有关,与n时刻之前如何取到i值是无关的,这 是一马氏链,且是齐次的,一步转移概率矩阵为:在实际问题中,一步转移概率通常可通过统计试验确定。如下例:甲乙295例5:有甲、乙两袋球,开始时,甲袋有3只球,乙袋有2只 球

例6:某计算机机房的一台计算机经常出故障,研究者每隔15分钟观察一次计算机的运行状态,收集了24个小时的数(共作97次观察),用1表示正常状态,用0表示不正常状态,所得的数据序

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论