版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、07.02.2021,1,概率论与数理统计,2,概率论与数理统计是研究随机现象 数量规律的一门学科,3,第一章 概率论的基本概念 1.1 随机试验 1.2 样本空间 1.3 概率和频率 1.4 等可能概型(古典概型) 1.5 条件概率 1.6 独立性 第二章 随机变量及其分布 2.1 随机变量 2.2 离散型随机变量及其分布 2.3 随机变量的分布函数 2.4 连续型随机变量及其概率密度 2.5 随机变量的函数的分布 第三章 多维随机变量及其分布 3.1 二维随机变量 3.2 边缘分布 3.3 条件分布 3.4 相互独立的随机变量 3.5 两个随机变量的函数的分布,4,第四章 随机变量的数字特
2、征 4.1 数学期望 4.2 方差 4.3 协方差及相关系数 4.4 矩、协方差矩阵 第五章 大数定律和中心极限定理 5.1 大数定律 5.2 中心极限定理 第六章 数理统计的基本概念 6.1 总体和样本 6.2 常用的分布,5,第七章 参数估计 7.1 参数的点估计 7.2 估计量的评选标准 7.3 区间估计 第八章 假设检验 8.1 假设检验 8.2 正态总体均值的假设检验 8.3 正态总体方差的假设检验 8.4 置信区间与假设检验之间的关系 8.5 样本容量的选取 8.6 分布拟合检验 8.7 秩和检验 第九章 方差分析及回归分析 9.1 单因素试验的方差分析 9.2 双因素试验的方差分
3、析 9.3 一元线性回归 9.4 多元线性回归,6,第十章 随机过程及其统计描述 10.1 随机过程的概念 10.2 随机过程的统计描述 10.3 泊松过程及维纳过程 第十一章 马尔可夫链 11.1 马尔可夫过程及其概率分布 11.2 多步转移概率的确定 11.3 遍历性 第十二章 平稳随机过程 12.1 平稳随机过程的概念 12.2 各态历经性 12.3 相关函数的性质 12.4 平稳过程的功率谱密度,7,第五章 大数定律和中心极限定理,关键词: 契比雪夫不等式 大数定律 中心极限定理,8,1 大数定律,背景 本章的大数定律,对第一章中提出的 “频率稳定性”,给出理论上的论证 为了证明大数定
4、理,先介绍一个重要不等式,9,10,例1:在n重贝努里试验中,若已知每次试验事件A出现的概率为0.75,试利用契比雪夫不等式估计n,使A出现的频率在0.74至0.76之间的概率不小于0.90,11,随机变量序列依概率收敛的定义,12,大数定律的重要意义: 贝努里大数定律建立了在大量重复独立试验中事件出现频率的稳定性,正因为这种稳定性,概率的概念才有客观意义,贝努里大数定律还提供了通过试验来确定事件概率的方法,既然频率nA/n与概率p有较大偏差的可能性很小,我们便可以通过做试验确定某事件发生的频率并把它作为相应的概率估计,这种方法即是在第7章将要介绍的参数估计法,参数估计的重要理论基础之一就是大
5、数定理,13,2 中心极限定理,背景:有许多随机变量,它们是由大量的相互独立的随机变量的综合影响所形成的,而其中每个个别的因素作用都很小,这种随机变量往往服从或近似服从正态分布,或者说它的极限分布是正态分布,中心极限定理正是从数学上论证了这一现象,它在长达两个世纪的时期内曾是概率论研究的中心课题,14,15,例2:设某种电器元件的寿命服从均值为100小时的指数分布,现随机取得16只,设它们的寿命是相互独立的,求这16只元件的寿命的总和大于1920小时的概率,16,例3:某保险公司的老年人寿保险有1万人参加,每人每年交200元,若老人在该年内死亡,公司付给受益人1万元。设老年人死亡率为0.017
6、,试求保险公司在一年内这项保险亏本的概率,17,例4:设某工厂有400台同类机器,各台机器发生故障的概 率都是0.02,各台机器工作是相互独立的,试求机 器出故障的台数不小于2的概率,18,第六章 数理统计的基本概念,关键词: 样 本 总 体 个 体 统 计 量,19,引言:数理统计学是一门关于数据收集、整理、分析 和推断的科学。在概率论中已经知道,由于大量的随机试验中各种结果的出现必然呈现它的规律性,因而从理论上讲只要对随机现象进行足够多次观察,各种结果的规律性一定能清楚地呈现,但是实际上所允许的观察永远是有限的,甚至是少量的。 例如:若规定灯泡寿命低于1000小时者为次品,如何确定次品率?
7、由于灯泡寿命试验是破坏性试验,不可能把整批灯泡逐一检测,只能抽取一部分灯泡作为样本进行检验,以样本的信息来推断总体的信息,这是数理统计学研究的问题之一,20,1 总体和样本,总体:研究对象的全体。如一批灯泡。 个体:组成总体的每个元素。如某个灯泡。 抽样:从总体Z中抽取有限个个体对总体进行观察的取值过程。 随机样本:随机抽取的n个个体的集合(Z1,Z2,Zn), n为样本容量 简单随机样本:满足以下两个条件的随机样本(Z1,Z2,Zn)称 为简单随机样本。 1. 每个Zi与Z同分布 2. Z1,Z2,Zn是相互独立的随机变量 说明:后面提到的样本均指简单随机样本,由概率论知,若总体Z 具有概率
8、密度f(x), 则样本(Z1,Z2,Zn)具有联合密度函数,21,统计量:样本的不含任何未知参数的函数。 常用统计量:设(Z1,Z2,Zn)为取自总体Z的样本,22,随机变量独立性的两个定理,23,2 常用的分布,24,25,26,27,28,29,30,正态总体样本均值和方差的分布,31,33,复习思考题 6,1.什么叫总体?什么叫简单随机样本?总体X的样本X1,X2,Xn有 哪两个主要性质? 2.什么是统计量?什么是统计量的值? 3.样本均值和样本方差如何计算? 4.N(0,1)分布,t分布,2分布和F分布的双侧、下侧、上侧分位点是 如何定义的?怎样利用附表查这些分位点的值? 5.对一个正
9、态总体的三个常用统计量及其分布是什么? 6.对两个正态总体的三个常用统计量及其分布是什么,34,第七章 参数估计,关键词: 矩估计法 极大似然估计法 置信区间 置信度,35,36,1 参数的点估计,37,38,39,40,极大似然估计法,极大似然估计的原理介绍 考察以下例子: 假设在一个罐中放着许多白球和黑球,并假定已经知道两种球的数目之比是1:3,但不知道哪种颜色的球多。如果用返回抽样方法从罐中任取n个球,则其中黑球的个数为x的概率为: 若取n=3,如何通过x来估计p值 先计算抽样的可能结果x在这两种p值之下的概率,41,42,43,44,45,46,47,表1 例2,例4,例5中两种估计方
10、法所得结果,48,2 估计量的评选标准,从表1看到,对总体的未知参数可用不同方法求得不同的估计量,如何评价好坏? 通常用三条标准检验:无偏性,有效性,相合性 无偏性,49,50,51,纠偏方法,52,有效性,53,54,相合性,55,56,3 区间估计,57,58,单侧置信区间,59,正态总体均值方差的区间估计,60,61,62,63,区间短 精度高,区间长 精度低,64,65,66,67,68,69,例12:两台机床生产同一个型号的滚珠,从甲机床生产的滚 珠中抽取8个,从乙机床生产的滚珠中抽取9个,测得这 些滚珠得直径(毫米)如下: 甲机床 15.0 14.8 15.2 15.4 14.9
11、15.1 15.2 14.8 乙机床 15.2 15.0 14.8 15.1 14.6 14.8 15.1 14.5 15.0,70,71,说明 置信区间包含两方面含义 1.置信水平 2.区间长度 置信水平越高,区间越大,但区间精确度差 置信区间越小,精确度高,但置信水平差,正态总体均值、方差的置信区间与单侧置信限,复习思考题 7,1.总体未知参数矩估计的思想方法是什么?试写出0-1分布、 二项分布b(m,p)、泊松分布()、均匀分布U(a,b)、正态分布N(,2)中有关参数的矩估计式 2.极大似然估计的主要步骤是什么? 3.未知参数的估计量与估计值有什么区别? 5.估计量的三个基本评价标准是
12、什么?你能理解它们的含义吗? 6.求参数置信区间的一般方法是什么?对正态总体,试从有关 的统计量自行导出几类参数的置信区间? 7.置信度的含义是什么?置信度、区间长度和样本容量的关系怎样,74,复习思考题 8,1.假设检验的基本思想是什么?其中使用了一条什么原理? 2.检验的显著性水平的意义是什么? 3.比较双边、左边和右边检验的拒绝域。 4.使用U检验法可以进行哪些假设检验? 5.使用t检验法可以进行哪些假设检验? 6.使用2检验法可以进行哪些假设检验? 7.使用F检验法可以进行哪些假设检验? 8.正态总体期望与方差的区间估计和假设检验两者之间有什么 相似之处? 9.成对数据差的t检验适用于
13、哪些特殊场合? 10.分布拟合的2检验的基本步骤是什么,75,关键词: 随机过程 状态和状态空间 样本函数 有限维分布函数 均值函数 方差函数 自相关函数自协方差函数 互相关函数互协方差函数 正态过程 独立增量过程 泊松过程 维纳过程,第十章 随机过程及其统计描述,76,1 随机过程的概念,随机过程被认为是概率论的“动力学”部分,即它的研究对象是随时间演变的随机现象,它是从多维随机变量向一族(无限多个)随机变量的推广。 给定一随机试验E,其样本空间S=e,将样本空间中的每一元作如下对应,便得到一系列结果,77,一维、二维或一般的多维随机变量的研究是概率论的研究内容,而随机序列、随机过程则是随机
14、过程学科的研究内容。从前面的描述中看到,它的每一样本点所对应的,是一个数列或是一个关于t的函数,78,例1:抛掷一枚硬币的试验,样本空间是S=H,T,现定义,79,80,81,例5:考虑抛掷一颗骰子的试验,83,随机过程的分类: 随机过程可根据参数集T和任一时刻的状态分为四类,参数集T可分为离散集和连续集两种情况,任一时刻的状态分别为离散型随机变量和连续型随机变量两种: 连续参数连续型的随机过程,如例2,例3 连续参数离散型的随机过程,如例1,例4 离散参数离散型的随机过程,如例5 离散参数连续型的随机过程,如随机相位正弦波,84,2 随机过程的统计描述,85,例1:抛掷一枚硬币的试验,定义一
15、随机过程,86,87,二) 随机过程的数字特征,88,89,90,91,续,92,93,三) 二维随机过程的分布函数和数字特征,94,95,96,3 泊松过程及维纳过程,97,独立增量过程的性质,98,99,一) 泊松分布,100,101,续,102,证毕,103,104,105,106,107,定理一:强度为的泊松流(泊松过程)的点间间距是相互独立的随 机变量,且服从同一指数分布 定理二:如果任意相继出现的两个质点的点间间距是相互独立, 且服从同一个指数分布: 这两个定理刻画出了泊松过程的特征,定理二告诉我们,要确定一个计数过程是不是泊松过程,只要用统计方法检验点间间距是否独立,且服从同一个
16、指数分布,则质点流构成强度为的泊松过程,108,二) 维纳过程,维纳过程是布朗运动的数学模型 以W(t)表示运动中一微粒从时刻t=0到时刻t0的位移的横坐标,且设W(0)=0。由于微粒的运动是受到大量随机的、相互独立的分子碰撞的结果,于是: 粒子在时段(s,t上的位移可看作是许多微小位移的 和,根据中心极限定理,假设位移W(t)-W(s)服从正态分布是合理的。 由于粒子的运动完全由液体分子不规则碰撞而引起的,这样,在不相重叠的时间间隔内,碰撞的次数、大小和方向可假设相互独立,即W(t)具有独立增量,同时W(t)的增量具有平稳性,109,110,关键词: 无后效性(马尔可夫性) 齐次马尔可夫链
17、n步转移概率 n步转移概率矩阵 C-K方程 马氏链的有限维分布律 遍历性 极限分布(平稳分布,第十一章 马尔可夫链,1 马尔可夫过程及其概率分布,马尔可夫性(无后效性) 过程(或系统)在时刻t0所处的状态为已知的条件下,过程在时刻tt0所处状态的条件分布与过程在时刻t0之前所处的状态无关。 通俗地说,就是在已经知道过程“现在”的条件下,其“将来”不依赖于“过去,112,证毕,113,由上例知,泊松过程是时间连续状态离散的马氏过程, 维纳过程是时间状态都连续的马氏过程。 时间和状态都离散的马尔可夫过程称为马尔可夫链,简称马氏链, 记为:Xn=X(n),n=0,1,2,参数集T1=0,1,2,,
18、记链的状态空间为,114,115,Xm+1的状态,116,例2:(0-1传输系统) 如图所示,只传输数字0和1的串联系统中,设每一级的传真率为p,误码率为q=1-p。并设一个单位时间传输一级,X0是第一级的输入, Xn是第n级的输出(n1),那么Xn,n=0,1,2是一随机过程, 状态空间I=0,1,而且当Xn=i为已知时,Xn+1所处的状态的概率分布只与Xn=i有关,而与时刻n以前所处的状态无关,所以它是一个马氏链,而且还是齐次的,它的一步转移概率和一步转移概率矩阵 分别为,117,例3:一维随机游动。设一醉汉Q(或看作一随机游动的质点)在直线上的点集I=1,2,3,4,5作随机游动,且仅在
19、1秒、2秒等时刻发生游动,游动的概率规则是:如果Q现在位于点i(1i5),则下一时刻各以 的概率向左或向右移动一格,或以 的概率留在原处;如果Q现在处于1(或5)这一点上,则下一时刻就以概率1移动到2(或4)这点上,1和5这两点称为反村壁,这种游动称为带有两个反村壁的随机游动。 解:以Xn表示时刻n时Q的位置,不同的位置就是Xn的不同状态,而且当Xn=i为已知时,Xn+1所处的状态的概率分布只与Xn=i有关,而与Q在时刻n以前如何到达i是完全无关的,所以Xn,n=0,1,2 是一马氏链,且是齐次的,它的一步转移概率矩阵为: 如果把1这点改为吸收壁,即Q一旦到达1这一点,则永远留在点1时,此时的
20、转移概率矩阵为,118,例4:排队模型 设服务系统由一个服务员和只可以容纳两个人的等候室组成。服务规则为:先到先服务,后来者需在等候室依次排队,假设一个需要服务的顾客到达系统时发现系统内已有3个顾客,则该顾客立即离去。 设时间间隔t内有一个顾客进入系统的概率为q,有一接受服务的顾客离开系统(即服务完毕)的概率为p,又设当t充分小时,在这时间间隔内多于一个顾客进入或离开系统实际上是不可能的,再设有无顾客来到与服务是否完毕是相互独立的。 现用马氏链来描述这个服务系统: 设Xn=X(nt)表示时刻nt时系统内的顾客数,即系统的状态。Xn,n=0,1,2是一随机过程,状态空间I=0,1,2,3,且如前
21、例2、例3的分析可知,它是一个齐次马氏链,它的一步转移概率矩阵为,119,例5:有甲、乙两袋球,开始时,甲袋有3只球,乙袋有2只球;以后,每次任取一袋,并从袋中取出一球放入另一袋。Xn表示第n次抽取后甲袋的球数,n=1,2,;Xn,n=1,2,是一随机过程, 状态空间I=0,1,2,3,4,5,当Xn=i时,Xn+1=j的概率只与i有关,与n时刻之前如何取到i值是无关的,这是一马氏链,且是齐次的,一步转移概率矩阵为: 在实际问题中,一步转移概率通常可通过统计试验确定。 如下例,例6:某计算机机房的一台计算机经常出故障,研究者每隔15分钟观察一次计算机的运行状态,收集了24个小时的数(共作97次
22、观察),用1表示正常状态,用0表示不正常状态,所得的数据序列如下: 1110010011111110011110111111001111111110001101101 111011011010111101110111101111110011011111100111 解:设Xn为第n(n=1,2,97)个时段的计算机状态, 可以认为它是一个齐次马氏链,状态空间I=0,1, 96次状态转移情况是: 00:8次; 01:18次; 10:18次; 11:52次; 因此一步转移概率可用频率近似地表示为,121,例7:已知计算机在某一时段(15分钟)的状态为0,问在此条件下,从此时段起,该计算机能连续正常
23、工作45分钟(3个时段)的条件概率是多少? 解:由题意,某一时段的状态为0就是初始状态为0,即X0=0, 所求的概率为,122,123,124,2 多步转移概率的确定,125,证毕,126,127,从0出发, 经4步首次回到0状态,128,续,129,130,3 遍历性,131,齐次马氏链在什么条件下才具有遍历性?如何求出它的极限分布? 有限链的遍历性的充分条件,132,133,例1:一质点在1,2,3三个点上作随机游动,1和3是两个反射壁,当质点处于2时,下一时刻处于1,2,3是等可能的。 写出一步转移概率矩阵,判断此链是否具有遍历性, 若有,求出极限分布,134,例2:一质点在1,2,3三个点上作随机游动,1和3是两个反射 壁,当质点处于2时,下一时刻转移到1和3的概率各为。 写出一步转移概率矩阵,判断此链是否具有遍历性, 若有,求出极限分
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度设备购买与安装协议2篇
- 2024年邮政汽车运输协议3篇
- 2024年度市场推广合同:新能源电动汽车品牌线上线下整合营销协议
- 2024年度人参果知识产权保护合同3篇
- 2024年度金融服务合同:详细阐述金融产品、服务内容及风险控制的具体条款3篇
- 2024年度电影发行合同:国产电影海外市场推广
- 全新光伏发电项目开发合作协议(2024版)
- 二零二四年度教育信息化建设合同(在线教育发展)
- 2024年度版权许可使用与再授权协议3篇
- 二零二四年度新能源发电设备安装施工合同2篇
- 【新教材】人教版(2024)七年级上册英语Unit 2 Were Family!教案
- 2024-2030年中国服装OEM行业市场现状分析及竞争格局与投资发展研究报告
- 【我国绿色债券市场发展现状及问题探究9100字(论文)】
- 人教版七年级数学上册专题01绝对值化简的四种考法(原卷版+解析)
- 修补外墙防水合同
- 汽车维修服务实施方案(2篇)
- 山东省商河县重点达标名校2024年中考联考生物试卷含解析
- 《电站锅炉受热面电弧喷涂施工及验收规范》
- 中国世界遗产欣赏智慧树知到期末考试答案章节答案2024年浙江农林大学
- MOOC 实验室安全学-武汉理工大学 中国大学慕课答案
- 学校危险化学品安全教育
评论
0/150
提交评论