chap02概率统计基础_第1页
chap02概率统计基础_第2页
chap02概率统计基础_第3页
chap02概率统计基础_第4页
chap02概率统计基础_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第02讲概率统计基础第02讲概率统计基础一、概率统计基本概念 1确定事件和随机事件2随机变量与概率3连续型随机变量的概率分布函数4离散型随机变量的概率分布函数5随机变量概率密度函数6随机变量的数学特征 提纲二、系统仿真中常用的随机分布1离散分布2连续分布3经验分布三、仿真输入模型的构建1收集数据2利用直方图识别数据分布 3参数估计4拟合优度检验5选择无数据的输入模型第02讲概率统计基础一、概率统计基本概念 1确定事件和随机事件2随机变量与概率3连续型随机变量的概率分布函数4离散型随机变量的概率分布函数5随机变量概率密度函数6随机变量的数学特征 提纲二、系统仿真中常用的随机分布1离散分布2连续分布3经验分布三、仿真输入模型的构建1收集数据2利用直方图识别数据分布 3参数估计4拟合优度检验5选择无数据的输入模型一、概率统计基本概念1.确定事件和随机事件确定事件:在给定条件下进行的试验中,一定发生或一定不发生的事件分别称为必然事件和不可能事件,这类事件是确定性的,总称为确定事件。随机事件:在给定条件下进行的试验中,可能发生也可能不发生,而在大量重复试验中却具有某种规律性的事件,称为随机事件。一、概率统计基本概念2.随机变量与概率一、概率统计基本概念3.概率分布函数连续型随机变量的概率分布函数离散型随机变量的概率分布函数一、概率统计基本概念5.随机变量概率密度函数6.随机变量的数字特征均值:方差:离散随机变量连续随机变量第01讲系统建模与仿真概述一、概率统计基本概念 1确定事件和随机事件2随机变量与概率3连续型随机变量的概率分布函数4离散型随机变量的概率分布函数5随机变量概率密度函数6随机变量的数学特征 提纲二、系统仿真中常用的随机分布1离散分布2连续分布3经验分布三、仿真输入模型的构建1收集数据2利用直方图识别数据分布 3参数估计4拟合优度检验5选择无数据的输入模型第01讲系统建模与仿真概述一、概率统计基本概念 1确定事件和随机事件2随机变量与概率3连续型随机变量的概率分布函数4离散型随机变量的概率分布函数5随机变量概率密度函数6随机变量的数学特征 提纲二、系统仿真中常用的随机分布1离散分布2连续分布3经验分布三、仿真输入模型的构建1收集数据2利用直方图识别数据分布 3参数估计4拟合优度检验5选择无数据的输入模型2.1离散分布0-1分布X的均值和方差分别为:2.1离散分布贝努利试验及二项分布2.1离散分布贝努利试验及二项分布例2.1在某条手机装配生产线上,手机能通过最终检测的概率为5‰,若某次产品检测过程中,抽取了该产线的100件产成品,问刚好有2件产品不合格品的概率。解:从题设条件可知,每个手机不合格的概率

,而在抽取100件产品中出现不合格品的概率实验,是一个二项分布问题,运用二项分布概率质量函数计算即可。2.1离散分布几何分布在进行贝努利实验中,获得第一次成功实验所经过的实验次数的随机变量X服从几何分布,其pmf函数如下:2.1离散分布几何分布例2.2在银行服务网点,需要进行服务的顾客到达后,其中有30%的顾客需要进行定期存款业务,20%的顾客需要开通网上银行业务。那么在某天上班开始后,第三个顾客是该天第一个进行定期存款业务顾客的概率是多少?第三个顾客是该天第一个开通网上银行业务顾客的概率是多少?2.1离散分布负二项分布对于贝努利分布实验,获得第k次成功实验所经过的实验次数的随机变量X服从负二项分布,其pmf函数如下:,2.1离散分布负二项分布例2.3在银行服务网点,需要进行服务的顾客到达后,其中有30%的顾客需要进行定期存款业务,20%的顾客需要开通网上银行业务。那么在某天上班开始后,第10个到达的顾客是当天的第3个进行定期存款业务顾客的概率是多少?第20个到达的顾客是当天的第6个开通网上银行业务顾客的概率是多少?,2.1离散分布泊松分布指数分布2.1离散分布泊松分布例2.4生产线中的设备在每个小时内出现故障的次数服从均值为5次的泊松分布,则分析在下一个小时内出现4次故障的概率为多少?出现8次故障的概率为多少?2.2连续分布均匀分布,2.2连续分布均匀分布例2.5对某个仓储系统进行仿真,平均每小时到达20台入库物流车,简便起见,就可以设定物流车进入仓库的间隔服从均值为3分钟的均匀分布。例2.6对城市公交系统进行仿真,从早上6:00开始至早上8:00,公交车每隔20分钟到达特定的车站。若某个乘客不知道公交车具体时间表,他每天会在早上7:00到早上7:30之间随机到达(均匀分布),则这个乘客等待公交车的时间超过5分钟的概率是多少?,2.2连续分布指数分布,泊松分布2.2连续分布指数分布例2.7假设一盏工业用灯的寿命(以千小时计)服从损坏率=1/3的指数分布,即平均每3000小时损坏一盏。该灯的使用寿命能超过其平均寿命的概率是,2.2连续分布指数分布例2.8求例2.7中的工业用灯在工作了2500个小时后,再生存1000个小时的概率。,2.2连续分布伽马分布(Gamma),伽马函数的计算:2.2连续分布伽马分布(Gamma),=1=22.2连续分布伽马分布(Gamma)例2.9在某个时刻生产线上的三台设备都出现了故障,而该生产线只有一名维修工人,根据以往的统计数据,工人对每台设备维修的时间服从均值为15分钟的指数分布,试求工人能够在30分钟内将三台设备都修复的概率,2.2连续分布伽马分布(Gamma)例2.9在某个时刻生产线上的三台设备都出现了故障,而该生产线只有一名维修工人,根据以往的统计数据,工人对每台设备维修的时间服从均值为15分钟的指数分布,试求工人能够在30分钟内将三台设备都修复的概率,2.2连续分布埃尔朗分布(Erlang)故:伽马分布>埃尔朗分布>指数分布2.2连续分布正态分布(Normal)N

(0,5),N(0,10),N(4,5),N(4,10)2.2连续分布正态分布(Normal)例2.10配送中心装满一货车货物所需的时间X服从正态分布

,单位为小时,在中午12点钟开始进行一辆货车的装货作业,那么能够在下午3点之前装满车辆的概率为多少Excel的正态分布函数Norm.Dist()=Norm.Dist(-0.5,0,1,1)=Norm.Dist(3,4,2,1)2.2连续分布威布尔分布(Weibull),2.2连续分布威布尔分布(Weibull),2.2连续分布威布尔分布(Weibull),2.2连续分布威布尔分布(Weibull),2.2连续分布三角分布(Triangle),2.2连续分布三角分布(Triangle),2.2连续分布三角分布(Triangle)例2.12当某项作业时间数据没有现成记录或难以收集时,通常采用三角分布来进行估计,假若单位产品入库作业时间估计服从参数为(50,70,120)秒的三角分布,那么试求某个单位产品入库作业时间能够在60秒、70秒或80秒完成的概率,2.2连续分布对数正态分布(LogNormal),2.3经验分布离散型经验分布连续型经验分布2.3经验分布离散型经验分布为了进行饭店服务人员数量配备和对饭店餐桌大小的设置进行优化,以实现在特定经营面积下提高顾客服务水平和赢利能力,需要了解每次就餐顾客的数量。通过一段时间的观察发现,获得了具体的就餐人数和频次如表2.1所示。2.3经验分布离散型经验分布2.3经验分布连续型经验分布假设对车间钻床维修时间收集了150个维修数据,进行维修时间简要统计如表2.2所示。2.3经验分布连续型经验分布第01讲系统建模与仿真概述一、概率统计基本概念 1确定事件和随机事件2随机变量与概率3连续型随机变量的概率分布函数4离散型随机变量的概率分布函数5随机变量概率密度函数6随机变量的数学特征 提纲二、系统仿真中常用的随机分布1离散分布2连续分布3经验分布三、仿真输入模型的构建1收集数据2利用直方图识别数据分布 3参数估计4拟合优度检验5选择无数据的输入模型三、仿真输入模型的构建3.1收集数据在进行运作系统仿真时,可能的输入数据可以划分为如下两类。(1)时间量:加工时间、故障时间间隔、维修时间、准备及换模时间、运输时间。(2)结构量:产品——种类、数量、成本、重量或颜色属性。设备——种类、数量、作业方式(Single、Assembly)、成本。人员——类别、数量、作业能力、成本。仓库——类别、数量、容量、存储方式、成本。方法——作业流程、生产调度方式、应急处理方式。三、仿真输入模型的构建3.1收集数据数据收集注意事项(1)编制数据收集计划,设计数据收集表格并安排足够的时间。(2)在数据收集的同时,试着分析数据。(3)试着合并相似的数据集。(4)做散布图来解释两个变量之间是否有关系。(5)一系列看似无关的观察实际上却是自相关的,要考虑到这种可能性。(6)记住输入数据与输出数据或性能数据之间的区别,并确保收集的是输入数据。三、仿真输入模型的构建3.2利用直方图识别数据分布 直方图构造步骤如下。(1)将数据范围划分成区间。区间经常是等宽的;然而,如果调整了频度的高度,也可以使用不相等的宽度。(2)在水平轴上做标记,以确定所选的区间。(3)求每个区间里发生的频度。(4)在垂直轴上做标记,以便能画出每个区间的总发生数。(5)在垂直轴上画出频度。三、仿真输入模型的构建3.2利用直方图识别数据分布 例2.13制作离散数据直方图每天从一条生产线上抽取1000件产品进行质量检验,记录抽检的不合格品数量,连续抽检100天,获得观测数据如表2.3所示。从直方图与常用的随机分布概率质量曲线对比可以初步判断,1000件产品批中不合格品数量可能服从二项分布或泊松分布。三、仿真输入模型的构建3.2利用直方图识别数据分布 例2.14制作连续数据直方图电子元器件寿命试验中通常采用恒定压力加速试验,可以通过增加电压、温度、湿度等来进行。在某个电子元件加速试验中,采取试验温度250℃,获得81件产品的寿命记录如下(单位:小时)三、仿真输入模型的构建3.2利用直方图识别数据分布 从直方图与常用的随机分布概率密度曲线对比可以初步判断,该产品寿命可能服从指数分布。三、仿真输入模型的构建3.3参数估计三、仿真输入模型的构建3.4拟合优度检验拟合优度检验就是评估确定后的概率密度函数表示数据输入模型的适宜程度,也就是评估容量为n的随机变量X的随机样本服从特定分布形式的适宜程度。三、仿真输入模型的构建3.4拟合优度检验拟合优度检验就是评估确定后的概率密度函数表示数据输入模型的适宜程度,也就是评估容量为n的随机变量X的随机样本服从特定分布形式的适宜程度。卡方检验基本思想引例11234567891011121314…n24.717.814.811.316.122.125.925.611.624.720.827.316.028.918.312.8上述数列是否服从[10,34]之间的均匀分布?10341/24p1p2p3p4p5p6落在每个区间的概率pi为多少?B1B2B3B4B5B6n个样本,理论上落在每个区间的个数Bi为多少?n个样本,实际落在每个区间的个数fi为多少?理论与实际之间的差距Gap区间数量:k卡方检验基本思想引例上述数列是否服从均值为2的指数分布?落在每个区间的概率pi为多少?n个样本,理论上落在每个区间的个数Bi为多少?n个样本,实际落在每个区间的个数fi为多少?p1p2p3p4p5p6B1B2B3B4B5B61234567891011121314…n1.612.074.482.080.274.370.190.015.210.450.950.920.621.920.763.680.00.30.60.91.21.51.8理论与实际之间的差距Gap三、仿真输入模型的构建3.4拟合优度检验例:卡方检验泊松分布例:卡方检验指数分布三、仿真输入模型的构建3.4拟合优度检验例:卡方检验指数分布三、仿真输入模型的构建3.5选择无数据的输入模型1.利用工程数据通常情况下,一个产品或过程都会有一个厂家提供的性能等级,例如,一个磁盘驱动器的平均故障时间是10000小时;一个激光打印机每分钟可以打印12页;一把刀具的切削速度是1厘米/秒,等等。对于类似于这些产品的输入模型,可以利用其工程数据来确定一个大概的输入模型。2.利用专家建议同在该过程或相似过程上有经验的人进行交谈,经常会获得一些乐观的、悲观的或最可能的实践数据,或者该过程参数是接近于常量还是剧烈变化的,通过这些专家建议然后确定输入模型。3.利用物理或惯例的限制大多数实际过程在性能上都有物理的限制,例如,计算机数据输入的速度受到扫描设备

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论