




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三章概率3.1概率在统计学中(统计推断中)的作用基于样本数据作出的推断是不确定的,一个样本很少能完美精确的叙述它所来自的总体,总是存在一定范围内的误差,因此关于估计(推断)不确定程度的度量(推断的可靠性)在统计学中十分重要。我们用概率来度量估计(推断)的不确定程度(推断的可靠性)3.2事件、样本空间和概率试验是获得一个观测值或进行一次测量的过程简单事件是一个试验的基本结果,它不能分解为更简单的结果样本空间是试验所有简单事件的集合试验投挪一枚硬币,观测朝上的质样本空间简单事件H观测到正面简单事件T观测到反面这个样本空间可以表示为包含两个简单事件的集合SH,T试验投掷一颗骰子,观测朝上的U样本空
2、间简单事件1观测到1简单事件2观测到12简单事件3观测到13简单事件4观测到4简单事件5观测到5简单事件6观测到6这个样本空间可以表示为包含6个简单事件的集合S1,2,3,4,5,6试验投掷两枚硬币,观测朝上的面样本空间简单事件1观测到HH简单事件2观测到HT简单事件3观测到TH简单事件4观测到TT这个样本空间可以表示为包含4个简单事件的集合SHH,HT,TH,TT虽然两枚硬币在外观上是相同的,事实上它们也是两个不同的硬币维恩(Venn)图样本空间(S)用一个封闭的图形表示,包含一个称作 样本点的点集,每个点代表一个简单事 件,样本空间(S)中的样本点的个数等于与试验相关的简单事件个数1 2
3、3* *4 5 6SS维恩图为解决概率问题提供了一个简单直接的方法,画图通常可以使 问题一目了然简单事件的概率是进行试验时度量简单事件将会发生的可能性的一当试验重复的次数个数。非常多时,概率可以用观测到的简单事件的次数的比例来近似,大数定律表述了当试验被不断地重复进行时,一个结果发生次数的相对频率趋近于这个结果的真实(理论)概率。有些试验不可能重复,因此不可能通过反复的试验来估算概率(如投资一个项目时,投资成功的概率),可以通过确定类似投资成功的比例来估算概率从生产线抽取一个产品(试验),它的样本空间S产品有缺陷,产品无缺陷,已知生产线受控时,10%勺产品是 有缺陷的,求产品无缺陷的概率不能将
4、等概率指派给简单事件,即产品无缺陷的概率不是50%生产线可能是失控的,因此不能将生产线受控时的缺陷率10%当作产品无缺陷的概率可以通过收集一段时间内缺陷产品和无缺陷产品的个数来近似的估计两个简单事件的概率对于一个简单事件 E, E的概率记为P(E)1.0 P(E)1 (所有简单事件的概率必须在0和1之间)I . |二.(样本空间中所有简单事件的概率之和等于1)1 1事件是简单事件的一个指定集合(投掷骰子的试验中,观测到的点数为奇数)事件A的概率等于事件A所包含的简单事件概率之和P(1)+ P(3)+ P(5)计算任意事件概率的步骤a定义试验,即描述获得观测值(测量值)的过程及记录的观测值(测量
5、值)类型b定义并列举简单事件c指派简单事件的概率d确定事件所包含简单事件的集合e求事件所包含简单事件的概率之和3.3复合事件复合事件是两个或更多事件的组合事件A和事件B的并4(A或B)是在一次单独的试验中,事件A与事件B所包含的简单事件之和事件A和事件B的交以_. (A和B)是在一次单独的试验中,事件A与事件B同时包含的简单事件考虑有等可能简单事件S1,2,3,4,5,6的投掷骰子试验事件A投掷出一个偶数点=2,4,6事件B投掷出一个小于等于3的数=1,2,3事件C投掷出一个大于1的数=2,3,4,5,6p (Aurs JCO = Ip (AnBnc) =: P(2) =1/6求多个事件并和交
6、的概率时,先求两个事件并和交的概率,再将结果和下一个事件求并和交的概率3.4补事件事件A的补事件(A)是所有不在事件A中的简单事件组成的事件 A,P (A) +P (A ) =1,在很多概率问题中,计算事件的补事件的概率要比计算事件本身的概率更容易 c3.5条件概率投掷一颗均匀的骰子时,观测到偶数(事件A)的概率是1/2,假如已经知道某次投掷骰子的结果是小于等于3的一个数(事件B),事件A发生的概率就应该为 1/3,因为事件B发 生后样本空间从6个简单事件缩减到了3个在给定事件B发生的前提条件下,事件A发生的条件概率用记号T:表示,抽取生产线1OOOOPCS零件,分别用工厂标准和客户标准对零件
7、进行检验,事件I表示零件用工厂标准 检验合格(检验合格后才能出货给客户),事件B表示零件用客户标准检验合格(符合客户要求),求工厂检验合格后出货给客户,零件符合客户要求的概率:-订J试验分别用工厂标准和客户标准对零件进行检验包含4个简单事件如下表简单事件简单事件描述概率I和B工厂标准检验合格且客户标准检验合格0.80I和Bc工厂标准检验合格但客户标准检验不合格0.02Ic和B工厂标准检验不合格但客户标准检验合格0.15I c 和 Bc工厂标准检验不合格且客户标准检验不合格0.03P(I)工厂标准检验合格的概率=P(I和B)+P(I和)=0.80+0.02=0.82P(B)客户标准检验合格的概率
8、=P(I和B)+P(Ic和B)=0.80+0.15=0.95P(I)比P(B)小说明工厂的检验标准比客户检验标准严格P(B |J)=3.6并和交的概率法则概率的加法法则、=- _i -当;:m不包含简单事件,即L 一: _ = .,那么事件A和事件B是互斥事件概率的乘法法则彳=I : =i I. J如果事件B(A)的发生不改变事件A(B)发生的概率,即,那么事件A和事件B为独立事件,不独立的事件称作 相关事件 3独立事件和互斥事件3.1互斥事件可以由维恩图证明或说明,独立事件不可以,一般检查独立性的最好办法是确定 iFv: -| :. | 卜二|、.-:3.2互斥事件是相关事件。因为我们假定事
9、件B已经发生,那么事件 A就不可能发生(除非其中有一个事件的概率为0,否则结果总成立)3.3独立事件的乘法法则:. = I - I-3.4互斥事件的加法法则A =13.7贝叶斯法则利用概率进行推断的早期尝试是统计方法论的一个分支,称作贝叶斯统计方法,17世纪中叶英国伟大的哲学家托马斯贝叶斯所用的逻辑是将未知的条件概率转换为已知的条件概率1订怎)无人监控系统检测到闯入者的概率(设计概率)为0.90,但是天气(晴天/阴天/雨天)会影响无人监控系统检测到闯入者的概率,已知系统实际检测到闯入者时,天气有75%是晴天,20%是阴天,5%是雨天。系统不能检测到闯入者时,天气有60%是晴天,30%是阴天,1
10、0%是雨天。利用这些信息求已知天气为雨天时系统检测到闯入者的概率 事件D为系统检测到闯入者,Dc系统不能检测到闯入者已知 P(D)=0.90,P(Dc)=1.00-0.90=0.10 ; P (晴天 |D)=0.75,P (阴天 |D)=0.20,P (雨天 |D) =0.05 ; P (晴天 |Dc)=0.60,P (阴天 |Dc)=0.30,P (雨天 |Dc)=0.10,求 P(D| 雨天) 根据条件概率的计算公式,为了求 P(D|雨天)需要知道 |和P (雨天)r-. T?,-, ; TJ= P (雨天 |D)*P (D)=0.05*0.90=0.045二工勺门 陶灭沪 P (雨天 |
11、Dc) * P (Dc)=0.10*0.10=0.01 (出尺)-W1)门SX +用天)=0.045+0.01=0.055 (门甲天和n(r门雨天)是两个互斥且完备的事件),P (D| 雨天)=0.045/0.055=0.818贝叶斯法则给定k个互斥且完备 的自然状态(事件)Aj, A,a和一个观测(测量)到的事件E W血、二里上门功二(扎)k jij P(E)P (EIAJP (AJ+ p (EIAP (AJ + +P (EIAJPJ上面的例子中P (D) =% P (Dc) -A?是互斥且完备的自然状态(事件),雨天为一个观测(测量)到的事件EP(D| 雨天)=P(D)P(雨天|D)/P(
12、D)P(雨天|D)+P(Dc)P(雨天|Dc)=0.90*0.05/0.90*0.05+0.10*0.10=0.818P(D| 晴天)=P(D)P(晴天|D)/P(D)P(晴天|D)+P(Dc)P(晴天|Dc)=0.90*0.75/0.90*0.75+0.10*0.60=0.918P(D| 阴天)=P(D)P(阴天|D)/P(D)P(阴天|D)+P(Dc)P(阴天|Dc) =0.90*0.20/0.90*0.20+0.10*0.30=0.8573.8计数法则1.乘法法则从k个大小为上,乜,nk的每个集合中抽取一个元素,不同结果的个数S=n?n2*nk一个产品可以通过3条不同航线运输,每个航线有
13、4个不同路径,k=2, m为3条不同航线,n2为每条航线的4个不同路径,则不同结果的个数S=3*4=12,决策树表示法路线1 路线2 路线3 路线4从N个元素的集合中抽取-=、一-町!航线1 航线 航线1 航线1 航线1航线1 路线1 路线2 路堆3 路线4航线】 舫线2 航线2 航线2 航饪2航线, 路线1 路线2 路线3 路线4航线3 航线3 航线3 航线 航线3航线 路线1 路线二 路线3 路线4从装配线选择10个产品检查,每个产品分为有缺陷和无缺陷,求简单事件的个数k=io,每个集合包括2个元素,S=210=1O242.排列法则n个元素并将n个元素按不同次序排列,不同结果的个数,N!(
14、N 的阶乘)=N(N-1)(N-2),0!=120个候选人竞争3个不同的机械工程师岗位E,巳,Eb(需要考虑次序)乘法法则解法,k=3,担任岗位弓的候选人n=20),担任岗位E2的候选人(弓有人以后)2=19,担任岗位E3 的候选人(E河E有人以后)n3=18,S=20*19*18=6840排列法则解法,N=20, n=3, S=20*(20-1)(20-3+1)=6840从一个起点依次通过5个城市中的每一个N=5, n=5, S=5!/0!=120分割法则将N个元素的集合分割成分别包括n1, n2,nn+n2+nk=N)个元素的k组,不同结果的个数S=假设有12个程序员,3个安排编写程序A,
15、 4个编写程序B, 5个编写程序C,有多少种安排的方法 TOC o 1-5 h z fjl121k=3, N=12, n1=3, n2=4, n3=5, S=组合法则从N个元素中抽取n个元素,不考虑n个元素的次序,不同结果个数 S=,组合法则是分割法则k=2时的特殊情况3.9概率和统计清晰的建立概率和统计之间的连接非常重要。贝叶斯法则论证了概率可以用于统计推断,传统的统计推断以稍微不同的方式利用概率某公司为了证明生产的新型化学柱头螺栓比传统机械柱头螺栓有更强的保持能力和更大的负载能力(张力负荷强度)。从一天生产的化学柱头螺栓中随机选择3个测量张力负荷强度,这3个螺栓的张力负荷强度均大于1200
16、0,已知传统机械柱头螺栓有16%勺张力负荷强度大于12000定义事件A 化学柱头螺栓1张力负荷强度大于12000 A 化学柱头螺栓2张力负荷强度大于12000, 化学柱头螺栓3张力负荷强度大于120003个化学柱头螺栓的张力负荷强度都大于12000的概率=P(A) P(A2)P(A(3个螺栓是从大量产品中随机选取的,即第一个螺栓的张力负荷强度大于12000不影响第二个螺栓的张力负荷强度大于12000)。假定新型化学柱头螺栓不比传统机械柱头螺栓强或弱(化学柱头螺栓张力负荷强度的相对频率分布与传统机械柱头螺栓基本一致),即P(A)=0.16、i虫f萤厂/. ; : =P(A) P(A 2) P(A
17、 3)=0.16*0.16*0.16=0.04096(在统计学上这是不太可能发生的)而从一天生产的化学柱头螺栓中随机选择3个测量张力负荷强度,这3个螺栓的张力负荷强度均大于12000,说明新型化学柱头螺栓比传统机械柱头螺栓有更强的保持能力和更大的负载能力(张力负荷强度)这是稀有事件对统计推断的一个应用,从中可以看出概率的基本原则起着重要的作用3.10随机抽样在统计推断中,如何从总体中选取样本至关重要,因为样本的概率将用于推断总体的特征。随机选择 和随机化的概念是进行统计推断的的关键之一简单随机样本指所有可能的样本有相等的选中概率,从有N个元素的总体中抽取有n个元素n! (N-n)J N!的样本,每个样本被选中的概率相等,被选中的概率均为从10个(总体)零件中随机抽取5个(样本)测量尺寸4 C1C2加零
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论