




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、学习目标学习目标 v随机现象是概率论和数理统计的基础。随机现象是概率论和数理统计的基础。 v随机现象的某些样本点组成的集合称为随随机现象的某些样本点组成的集合称为随 机事件,简称事件。如掷骰子时,机事件,简称事件。如掷骰子时,“出现出现 奇数点奇数点”为一个事件,它由为一个事件,它由1点,点,3点和点和5 点共点共3个样本点组成。个样本点组成。 随机事件的特征随机事件的特征 1 任一事件任一事件a是相应样本空是相应样本空 间中的一个子集;间中的一个子集; 2 事件事件a发生当且仅当发生当且仅当a中 中 某一样本点发生;某一样本点发生; 3 任一样本空间都有一个任一样本空间都有一个 最大子集,最
2、大子集, 即即,它对它对 应的事件为必然事件;应的事件为必然事件; 4 任一样本空间都有一个任一样本空间都有一个 最小子集,最小子集, 即即,它对它对 应的事件为不可能事件;应的事件为不可能事件; a 1 2 维恩(维恩(venn)图图 随机事件的关系随机事件的关系 b a a a b b 包含 互不相容 相等 随机事件的运算随机事件的运算 a a a a b b b a 对立事件a与b的并 a与b的交 a与b的差 随机事件的概率随机事件的概率 在一个随机现象中,用来表示任一随机事件的在一个随机现象中,用来表示任一随机事件的a发生可能性大小发生可能性大小 的实数的实数-该事件的概率,记为该事件
3、的概率,记为p(a)。 1)非负性:非负性:p(a)0 2)正则性:正则性:p()=1 3)可加性:可加性:a1, a2, an为互不相容事件,则有为互不相容事件,则有 p(a1 a2 an)=p(a1)+p(a2)+p(an) 确定概率的古典方法确定概率的古典方法(略)略) 统计方法确定概率的要点:统计方法确定概率的要点: 1)与事件)与事件a有关的随机现象是允许大量重复试验的;有关的随机现象是允许大量重复试验的; 2)在)在n次重复试验中,次重复试验中, 事件事件a发生发生an次,由次,由a发生的频率为发生的频率为 pn*(a) = kn/n =事件事件a发生的次数重复试验次数发生的次数重
4、复试验次数 3) pn*(a) 将会随重复试验次数不断增加而趋于稳定,此稳定值将会随重复试验次数不断增加而趋于稳定,此稳定值 即为事件即为事件a的概率。的概率。 概率的性质概率的性质 1 p(a)=1-p(a) 2 p()=0 3 若若ab, p(b-a)=p(b) - p(a) 4 p(ab) = p(a) + p(b) p(ab) 5 对任意两个事件对任意两个事件a与与b,有有 p(ab) = p(a b) p(b) = p(b a) p(a) p(a b)指事件指事件b已发生的条件下,事件已发生的条件下,事件a再发生的概率,称为再发生的概率,称为 条件概率。条件概率。 6 若两事件若两事
5、件a与与b相互独立,则相互独立,则a与与b同时发生的概率为同时发生的概率为 p(ab) = p(a) p(b) 7若两事件若两事件a与与b相互独立,则在事件相互独立,则在事件b发生的条件下,事件发生的条件下,事件a的的 条件概率等于条件概率等于p(a)。 独立事件:其中一个事件的发生不依赖另一个事件发生与否。独立事件:其中一个事件的发生不依赖另一个事件发生与否。 随机变量及其分布随机变量及其分布 用来表示随机现象结果的变量用来表示随机现象结果的变量-随机变量,一般用随机变量,一般用x,y, z等表示,分为离散随机变量和连续随机变量。等表示,分为离散随机变量和连续随机变量。 x1 x2 x3 x
6、4 x5 x a b x 离散随机变量的可能取值 连续随机变量的可能取值 随机变量的取值是随机的,但它有一定的规律性,这个规随机变量的取值是随机的,但它有一定的规律性,这个规 律性就是分布。分布包含两方面:律性就是分布。分布包含两方面: (1) x可能取哪些值,或在哪个区间上取值;可能取哪些值,或在哪个区间上取值; (2) x取这些值的概率各是多少,或取这些值的概率各是多少,或x在任一区间上取值的在任一区间上取值的 概率是多少?概率是多少? 离散随机变量的分布离散随机变量的分布 x p x1 x2 xn p1 p2 pn 连续随机变量的分布连续随机变量的分布 分布的中心位置均值 xi pi x
7、离散 分布 e(x) = xi-e(x)2 p(x)在在(a,b)区间的积分区间的积分 x连续分布 i i 方差的开方即方差的开方即标标准差准差 ! 离均值e(x) 近的值xi发 生的可能性 大,远离均 值e(x)的值xi 发生的可能 性小,方差 就小。 e(ax+b) = ae(x) +b var(ax+b)= a2 var(x) e(x1+x2) = e(x1)+e(x2) var(x1x2) =e(x1)+e(x2) 标准差不标准差不 可以相加可以相加! 几种常用分布几种常用分布 二项分布二项分布 泊松分布泊松分布 正态分布正态分布 均匀分布均匀分布 n ,0,1,2,xp1p x n
8、xp xn x 1.重复进行重复进行n次试验;次试验; 2.n次试验间相互独立;次试验间相互独立; 3.每次试验仅有两个结果每次试验仅有两个结果 ,如,如pass/fail, go/nogo, 统称为成功统称为成功/ 失败;失败; 4.每次试验中成功的概率每次试验中成功的概率 均为均为p,失败的概率均为失败的概率均为 1-p; 5.一般用于不合格品的统一般用于不合格品的统 计。计。 e(x) = np var(x) = np (1-p) (x)= np(1-p) 的开方的开方 制造过程中的不合格品率为制造过程中的不合格品率为0.10.1,从成品中随机取,从成品中随机取6 6个,恰有一个个,恰有
9、一个 不合格品的概率是多少?不超过一个不合格品的概率是多少?不合格品的概率是多少?不超过一个不合格品的概率是多少? 二项分布的位置、散布和二项分布的位置、散布和 形状与样本数和不合格品形状与样本数和不合格品 率有关。率有关。 0,1,2,x x! e xp x 泊松分布与计点过程泊松分布与计点过程 相关,计点过程上在相关,计点过程上在 一定时间内或一定区一定时间内或一定区 域内或一特定单位内域内或一特定单位内 进行的。如出错率,进行的。如出错率, 缺陷率缺陷率(dpo, dpu, dpmo等等) e(x) = var(x) = (x)= 的开方的开方 表示某特定单位内的平均数;表示某特定单位内
10、的平均数; x表示某特定单位内出现的点数。表示某特定单位内出现的点数。 泊松分布的位置、散布和泊松分布的位置、散布和 形状与均值形状与均值有关。有关。 p a) = 1-(a) (-a) = 1-(a) p(azb) = (b)-(a) p(i zi a) = 2(a) - 1 p(xa) = 1-(a- )/ p(axb) = (b- )/ (a- ) / point of inflection 1 + - 68.27% 95.45% 99.73% 0.002 12, n 中所含的参数也都相同,如都为正态中所含的参数也都相同,如都为正态 分布且都有相同的均值分布且都有相同的均值和相同方差和相
11、同方差2。 分布未知,但其均值分布未知,但其均值和方差和方差都存在,都存在, 则在则在n较大时,其较大时,其 样本均值近似服从正态分布样本均值近似服从正态分布n(, 2/n)。 平均值运算使人们从非正态平均值运算使人们从非正态 分布获得正态分布分布获得正态分布 ! ! 要重视研究偏态要重视研究偏态 分布产生的原因分布产生的原因 ! x x xx x x x x x x x x x x x x x x x x x x xxx x x x x x x x x x x x x x x x x s 样本均值样本均值 样本标准差样本标准差 总体总体 样本样本 设设x1, x2, , xn 是从总体是从总
12、体x中随机抽取的容量为中随机抽取的容量为n的样本,将的样本,将 它们的观测值从小到大排列,它们的观测值从小到大排列, x1 x2 xn , , 即有序样本。 即有序样本。 描述样本中心位置的统计量描述样本中心位置的统计量 均值均值 x = 1/n xi i=1 n 中位数中位数 x = x (n+1 )/2 n 为偶数为偶数 x(n/2) + x (n+1 )/2 n 为奇数为奇数 众数众数: 数据中出现次数最多的数数据中出现次数最多的数, 可能不唯一可能不唯一 四分位数四分位数q:有序样本约有序样本约25%处的值为处的值为q1,约约75%处的值处的值 为为q3,50%处的值处的值q2即中位数
13、即中位数 均值与所有观测值相关,即所有值都会对均值产生影响;均值与所有观测值相关,即所有值都会对均值产生影响; 均值对极端值非常敏感,一个极端大的值会将均值拉向自己均值对极端值非常敏感,一个极端大的值会将均值拉向自己 一边;一边; 所有观测值与均值的差相加后为零!所有观测值与均值的差相加后为零! 对分组数据而言,样本均值近似为对分组数据而言,样本均值近似为 x = 1/n fixi, 其中其中k为分为分 组数,组数,xi是第是第i 组的组中值,组的组中值,fi是第是第i组的频数。组的频数。 中位数不受极大和极小值的影响!中位数不受极大和极小值的影响! 使用众数最典型的例子就是衬衫制造商使用使用
14、众数最典型的例子就是衬衫制造商使用s,m,l,xl 等尺寸投放市场。等尺寸投放市场。 当样本中有超过一个众数时,总体中也会有超过一个众数。当样本中有超过一个众数时,总体中也会有超过一个众数。 例:例: 二十个数据按以下升序排列:二十个数据按以下升序排列: 204228252300324444624720816 912 1176 1296 1392 1488 1512 2520 2856 3192 3528 3710 请确定请确定q1, q2 和和q3。 2016 2 25201512 + 3 q 1044 2 1176912 + 2 qx 384 2 444324 + 1 q 描述样本分散程度
15、的统计量描述样本分散程度的统计量 极差:极差:r = xmax xmin 方差:方差:var(x) = 1n xx s n 1i 2 i 2 标准差:标准差: 1n xx s n 1i 2 i inter-quartile range: iqr = q3 - q1 对极值很敏对极值很敏 感感 对极值不敏对极值不敏 感感 n 1 为自为自 由度由度 变异系数:变异系数:cv = s / x 测得上海至北京距离为测得上海至北京距离为1463km, 测量标准差为测量标准差为1km, 而测一张桌子的长度为而测一张桌子的长度为1m, 测量标准差为测量标准差为0.01m,谁谁 的测量精度高?的测量精度高?
16、 几种抽样分布几种抽样分布 正态样本均值正态样本均值xbar的分布为正态分布的分布为正态分布n(,2/n) 正态样本方差正态样本方差s2除以总体方差除以总体方差2的的n-1倍的分布是自由度倍的分布是自由度 n-1的的2分布,记为分布,记为2 (n-1), (n-1)s2/2 = ( xi-x )2/2 2 (n-1) n i=1 两个独立的正态样本方差之比的分布是两个独立的正态样本方差之比的分布是f分布分布 1/(n-1) *( xi-x )2 s12/s22 = f(n-1, m-1) 1/(m-1) *( yi-y )2 n i=1 m i=1 n-1 n-1 分子分子 自由度自由度 m-1 m-1 分母分母 自由度自由度 众数为众数为(n-1)m / n(m+2) 和和f f分布均分布均 为正半轴上的为正半轴上的 偏态分布偏态分布 正态总体参数的无偏估计正态总体参数的无偏估计 正态均值正态均值的无偏估计:样本均值的无偏估计:样本均值和样本中位数和样本中位数 样本均值样本均值总比样本中位数总比样本中位数更有效,因为更有效,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 前人给我们留下的阴凉400字9篇范文
- 《语文古典诗歌欣赏教案:唐诗三首》
- 《艺术欣赏:西方绘画技法教学教案》
- 智能硬件系统集成服务合同协议
- 开国典礼读写课:初中记叙文教学与写作教案
- 走进自然感受生活记事作文14篇范文
- 八月十五放鞭炮活动方案
- 公交公司七夕活动方案
- 公交周年庆活动方案
- 以诚信为主题的演讲稿类型文章(9篇)
- 高中英语-人教-选修二-单词默写
- 江苏省苏州市(2024年-2025年小学四年级语文)部编版质量测试(下学期)试卷及答案
- 高等职业学校铁道机车车辆制造与维护专业岗位实习标准
- 炸药成型与装药的制备-性能关系
- 2024至2030年中国医疗信息化行业趋势研究及投资前景分析报告
- 南昌市产业投资集团有限公司人才招聘笔试真题2023
- 2024年山东省德州经开区小升初数学试卷
- 剧毒易制爆化学品防盗、防抢、防破坏及技术防范系统发生故障等状态下的应急处置预案
- HY/T 0409-2024近岸海域水质浮标实时监测技术规范
- 《正常分娩》课件
- JGJ25-2010 档案馆建筑设计规范
评论
0/150
提交评论