大学统计学第4章概率基础课件_第1页
大学统计学第4章概率基础课件_第2页
大学统计学第4章概率基础课件_第3页
大学统计学第4章概率基础课件_第4页
大学统计学第4章概率基础课件_第5页
已阅读5页,还剩83页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统计学导论xxx 主讲第1页,共88页。第四章 概率基础第一节 随机现象与随机事件 第二节 概率的性质及其计算 第三节 随机变量及其分布 第四节 几种常用的概率分布2第2页,共88页。第一节 随机现象与随机事件一、确定性现象与随机现象 二、随机事件 3第3页,共88页。一、确定性现象与随机现象 确定性现象在一定条件下必然出现(或不出现)某种结果的现象 。随机现象在给定的条件下不能确切预言其结果的现象 。4第4页,共88页。二、随机事件 对随机现象进行观测又称作随机试验。随机试验的每一种结果或随机现象的每一种表现称作随机事件,简称为事件,一般用大写字母A,B,C,(必要时加下标)来表示。有时,也

2、可用大括号表示事件,括号中写明事件的内容。5第5页,共88页。(一)事件的种类 一个事件如果不能再被分解为两个或两个以上事件,称作基本事件。基本事件是试验的最基本结果:每次试验必出现一个基本事件,任何两个基本事件都不会同时出现。 由两个或两个以上基本事件所组成的事件称作复合事件。 一项随机试验的所有基本事件的集合,称作该随机试验的基本事件空间。必然事件是每次试验都一定出现的事件,记作。任何一次试验都不可能出现的事件称为不可能事件,记作。6第6页,共88页。(二)事件的关系和运算 事件的关系有:包含和相等;事件的运算有:和(并),差,交(积),逆。(1)包含:关系式 表示“若A出现,则B也出现(

3、反之则未必)”,称作“B包含A”,或“A导致B”。 7第7页,共88页。(2)相等:关系式A=B表示二事件A和B要么都出现,要么都不出现,称作“事件A等于事件B”或“事件A和B等价”。 (3)和(并):运算式A+B或AB读作“A加B”,称作“A与B的和(并)”,表示“A和B至少出现一个”。对于多个事件 , 或 表示“诸事件中至少出现一个”。 8第8页,共88页。(4)差:运算式 AB或AB读作“A减B”,称作“A与B的差”,表示“事件A出现但B不出现。”(5)交(积):运算式AB或AB,称作“A与B的交(或积)”,表示“事件A和B同时出现”。对于多个事件 表示“诸事件 同时出现”。 (6)逆事

4、件: =A不出现,称作A的对立事件或逆事件。显然A和 互为对立事件,它们之间有下列关系:,A =。(7)不相容:若AB=,即A与B不可能同时出现,则称A和B不相容。9第9页,共88页。第二节 概率的性质及其计算一、概率的概念二、随机事件的频率与概率的关系三、概率的性质四、概率的估计和计算10第10页,共88页。一、概率的概念 对于一个随机事件来说,它在一次试验中可能发生,也可能不发生。既然有可能性,就有可能性大小问题。事件A在随机试验中出现可能性大小的数值度量,称作概率。事件A的概率以P(A)表示。11第11页,共88页。二、随机事件的频率与概率的关系在相同条件下,重复进行同一随机试验,A是这

5、个试验的一个结果(事件)。设试验的次数为n,在n次重复试验中A出现的次数为nA,则事件A的频率为通过大量观测,可以发现:随机试验的频率具有随试验次数增加而趋向稳定的性质,而频率的稳定值可以用来反映事件发生的可能性大小。因此,可以说频率的稳定值p是事件A发生的概率。即P(A)=p12第12页,共88页。三、概率的性质设事件A的概率记作P(A),则它应该具有如下性质:性质1:非负性,即0P(A)1性质2:规范性,即,对于必然事件,有 P()=1性质3:对于随机事件Ai(i=1,2,),只要它 们两两互不相容,则有13第13页,共88页。四、概率的估计和计算(一)概率的直接计算 1.古典型概率 如果

6、一项随机试验的全部基本事件总数有限,并且各基本事件出现的可能性都相同,事件A由若干基本事件所组成,则A的概率可用下式计算14第14页,共88页。【例4-1】 袋中盛有除颜色外其他完全相同的50个不同颜色的小球,其中有10个白球。充分混匀后随意摸出一球。求所摸为白球的概率。 解:记A = 抽到白球。该试验总共有50个等可能的基本事件,A包含其中的10个。因此 15第15页,共88页。2.几何型概率 如果随机试验可模拟区域上随机投点。并且(1)这个区域有明确界限,可以作长度、面积、体积的几何度量。(2)随机点落在这个区域任何一点上的可能性都相同,也就是说,对于中的某一区域g,随机点落在g内的概率与

7、g的几何度量成正比,同它的形状以及在中的位置无关。16第16页,共88页。对于这种随机试验,如果以A表示随机点落在区域g中这一事件,则其概率可用下式计算17第17页,共88页。【例4-2】 某农场有耕地500亩,其中1号地块面积为8亩。向500亩耕地随机投点,随机点落在500亩耕地每一位置的可能性相等。求1号地块被抽中的概率。 18第18页,共88页。 解:随机点落在1号地块内的概率与地块的面积成正比。1号地块的几何度量为8亩,整个区域几何度量为500亩。记A=随机点落在1号地块=1号地块被抽中,则19第19页,共88页。(二)用频率估计概率 在最一般情况下,用事件在大量重复试验中出现的频率估

8、计其概率的值。这样做的依据是概率的稳定性。就这一点前面已经有所叙述。20第20页,共88页。(三)主观概率 根据决策者综合各种信息,并依靠其经验和判断力对事件的概率做出估计,这种概率的估计值被称为主观概率。主观概率不假定现象的可重复性,甚至可以根据一次性试验做出判断。例如,请资深体育评论员对即将参赛的两支足球队的胜、负可能性进行估计。在对事件出现的真实可能性缺乏有效估计时,主观概率法也可作为解决问题的一种方法。不过,目前对主观概率法的应用理论界尚存在争议。21第21页,共88页。(四)概率的计算 1.概率的加法法则 (1)任意事件的加法规则 任意两个事件和(并)的概率,等于两事件概率的和再减去

9、两事件同时发生的概率。即 22第22页,共88页。(2)不相容事件的加法规则 两个不相容事件与的和(并)的概率,等于两事件概率的和。即 对多个事件,这个规则也就是前面说过的概率的性质3。 23第23页,共88页。2.条件概率和乘法公式 在实际问题中,除了要知道事件发生概率外,有时还需要知道在“事件B已发生”的条件下,事件A发生的概率,这种概率称为条件概率,记作 。24第24页,共88页。条件概率的下列一般定义:设,A,B是任意两个事件,且P(B)0,则称 为“在事件B发生的条件下,事件A发生的条件概率”,简称“A关于B的条件概率”。由这个定义,可得到概率的乘法公式:设A与是B任意两个事件,且P

10、(A)0,P(B)0,则 25第25页,共88页。【例4-4】 设一批产品共N件,其中有M件次品,不放回地抽取两件,求事件第一件抽到的是正品,而第二件抽到的是次品的概率。 解:记A=第一件是正品,B=第二件是次品,所求事件为AB。根据乘法公式,有 26第26页,共88页。3.全概率公式 全概率公式可表述如下: 设 为个互不相容事件,且 ,则任一事件的概 率为27第27页,共88页。28第28页,共88页。29第29页,共88页。4.贝叶斯公式30第30页,共88页。31第31页,共88页。5.事件的独立性 对于两个事件A和B,假若事件B的发生会对事件A发生的概率产生影响,即 ,称事件A与B之间

11、统计相依。假若事件B的发生并不影响事件A发生的概率,称事件A与B之间统计独立。在A与B独立时显然有 ,这时,乘法公式式(4.9)成为32第32页,共88页。 通常把这个关系式作为事件独立性的定义。即设A与B是任意两个事件,如果满足 则称事件A与B独立,否则称A与B相依。 在实际应用中,如果两个事件相互间没有影响,则可以认为这两个事件相互独立。 33第33页,共88页。34第34页,共88页。 应该指出,两个事件相互独立与互不相容是两个不同的概念。独立性是指两个事件的发生互不影响,互不相容是指两个事件不能同时发生。两个不相容事件一定是统计相依的,两个独立事件一定是相容的(除非其中有一个事件的概率

12、为0)。 35第35页,共88页。36第36页,共88页。【例4-8】 对同一目标进行3次射击,第一、二、三次射击的命中概率分别是0.3、0.4、0.6,试求在这三次射击中恰有一次命中的概率。解:记 , (i=1,2,3),于是可以写出:37第37页,共88页。显然,这三个事件是两两不相容的。而 是这三个事件的和。根据不相容事件的加法法则,有由于三次射击是彼此独立的,即相互独立,故有 38第38页,共88页。39第39页,共88页。第三节 随机变量及其分布一、随机变量的概念二、随机变量的概率分布三、随机变量的数字特征40第40页,共88页。一、随机变量的概念(一)什么是随机变量 随机变量就是其

13、取值带有随机性的变量。在给定的条件下,这种变量取何值事先不能确定,只能由随机试验的结果来定,并且随试验的结果而变。41第41页,共88页。(二)随机变量的种类 如果随机变量的全体可能取值能够一一列举出来,这样的随机变量称作离散型随机变量(如掷一枚硬币首次出现正面向上所需要的投掷次数); 如果随机变量的全体可能取值不能一一列举,其可能的取值在数轴上是连续的,则该变量称为连续型随机变量(如可能出现的测量误差)。42第42页,共88页。二、随机变量的概率分布(一)概率分布的概念 随机变量的一切可能值的集合(值域),及其相应的概率叫做随机变量的概率分布。随机变量的统计性质可由它的概率分布来表征。43第

14、43页,共88页。 1.离散型随机变量的分布【例4-9】 历史上曾有不少人作过反复投掷均匀硬币的试验。现在定义这样一个随机变量: 表4-1 投掷硬币试验结果的频率分布试验结果X试验者:蒲 丰试验者:皮尔逊试验者:皮尔逊频数频率频数频率频数频率1(正面)0(反面)204819920.50690.4931601959810.50160.498412012119980.50050.4995合 计40401.0000120001.0000240001.000044第44页,共88页。 综上所述,离散型随机变量X的每一个可能的取值xi和随机变量取该值的概率p(xi)之间所确立的对应关系称作这个离散型随机

15、变量的分布。P(xi)(i=1,2,3,)称作随机变量X的概率分布或概率函数,它满足下面的关系:p(xi)0和 。45第45页,共88页。 【例4-10】 袋中共有50个球,其中记上0号的5个,记上k号的分别有k个( k = 1,2,9)。现从袋中任取一球。试做出所得号数的分布列。 解:记所取之球的号数为随机变量X,由古典概率的计算方法可知:P(x=0)=5 / 50,P(x = k) = k / 50 ( k = 1,2,9)。于是,可做出分布列(见表4-3)。 表4-3 离散型随机变量分布数列X = xi0123456789P(xi)0.100.020.040.060.080.100.12

16、0.140.160.1846第46页,共88页。2. 连续型随机变量的分布 【例4-11】检查了在相同条件下生产的246件汽车活塞,测得所切削之活塞孔对中心线的偏差数据。因偏差尺寸属于连续型变量,对这类变量观测数据的整理应当采用组距式分组。把整理结果做成频率分布表(见表4-4)和次数分布直方图(见图4-1)。 47第47页,共88页。表4-4汽车活塞削孔对中心线偏差的频率分布偏差尺寸分组(毫米)X = x频数(件)频率频率密度453535252515155 55 515 1525 2535 3545 218355450442712 40.00810.07320.14230.21950.2032

17、0.17890.10970.04880.01630.000810.007320.014230.021950.020320.017890.010970.004880.00163合 计2461.000048第48页,共88页。偏差尺寸(毫米)图4-1 活塞削孔对中心线的偏差的频率分布49第49页,共88页。 综上所述,连续型随机变量X的一系列取值区间(例如,可以是由与实数轴上的任意点所构成的一系列区间)和随机变量在该区间取值的概率之间确立的对应关系,称作这个连续型随机变量的分布。 连续型随机变量的分布可以用密度函数来描述,随机变量的密度函数记作 。 50第50页,共88页。 次数分布直方图是用各组

18、的频率密度作直条的高来画图的。当分组数无穷多,而组距(即直条的底边长)趋近于0时,直方图演变成平滑的曲线(如图4-1),这时,直条的高就成 为 。 连续型随机变量在某一数值区间内取值的概率等于竖立在该区间上的,以密度曲线为上底的曲边梯形的面积。写作51第51页,共88页。密度函数满足下面两个基本性质:(1)密度函数的函数值不会是负数,从图形看,密度曲线在横轴上方,以横轴为渐近线;(2)在整个实数轴上的密度函数值的和等于1,从图形看,密度曲线下覆盖的总面积等于1。这两个性质用密度函数式写作52第52页,共88页。三、随机变量的数字特征(一)随机变量的数学期望 随机变量X的数学期望是X的一切可能值

19、以相应的概率为权数的加权算术平均数。今后我们把X的数学期望记作E(X)。53第53页,共88页。若X是离散型随机变量, E(X)=若是连续型随机变量,其概率密度函数为p(x),则X的数学期望定义为 式中的定积分应绝对收敛。54第54页,共88页。 数学期望有下列性质:性质 1 E(c)=c 性质 2 E(X+c)=E(X)+c 性质 3 E(cX)= cE(X) 55第55页,共88页。 性质 4 E(XY)=E(X)E(Y) 推广性质5 若X与Y独立,E(XY)=E(X)E(Y) 推广 若X1,,Xn独立,有 E(X1X2Xn)=E(X1)(X2)E(Xn)56第56页,共88页。(二)随机

20、变量的方差、标准差和变异系数 1.方差和标准差 随机变量X的方差,记作V(X),是X与其数学期望的离差平方的数学期望。即V(X)=EX E( X )2 称 为X的标准差。 方差还可以有下列表达式 V(X)=E(X2)E( X )2 57第57页,共88页。若X是离散型随机变量,其分布如表4-5所示,则X的方差用下式计算。 V( X ) =若是连续型随机变量,其概率密度函数为,则的方差用下式计算。58第58页,共88页。方差有下列性质: 性质 1 V(c)= 0 性质 2 V(X+c)= V(X) 性质 3 V(cX)= c2V(X) 性质 4 若X与Y独立,有 若X1,Xn独立,有 性质 5

21、若X与Y独立,有 59第59页,共88页。2.变异系数随机变量的变异系数是随机变量的标准差与数学期望的比率。随机变量X的变异系数写作 (X)= 60第60页,共88页。第四节 几种常用的概率分布一、两点分布二、二项分布三、超几何分布四、正态分布五、 分布六、F分布七、t分布61第61页,共88页。一、两点分布如果随机变量X只取1和0两个值,取1的概率是,取0的概率是1-,我们称X服从两点分布或0-1分布,是X的参数。两点分布的数字特征如下: 数学期望:E(X)= ; 方差:V(X) = ( 1)62第62页,共88页。【例4-12】 已知在20件产品中有5件是二等品。现在从中任意抽取1件(每件

22、产品都有相等的可能性被抽到),写出抽取结果(是二等品、不是二等品)的分布列。 解:用随机变量X表示抽取结果。若结果是二等品,记X = 1;若结果不是二等品,记X = 0。分布列如表4-6。表4-6两点分布的分布列X = x10P(X = x)0.250.7563第63页,共88页。二、二项分布如果把一个贝努里试验在完全相同的条件下独立地重复n次,称作n重贝努里试验。n重贝努里试验应符合下列三个条件: (1)每次试验只有“成功”和 “失败”两种对立的结局; (2)各次试验“成功”的概率相同(都为); (3)各次试验相互独立。64第64页,共88页。以随机变量X表示n重贝努里试验中“成功”的次数,

23、它服从参数为(n,)的二项分布。二项分布的概率函数为 (k=0,1,n) 其中,k是n重贝努里试验中“成功”的次数。二项分布的数字特征如下: 数学期望:E(X)= n ; 方差: V(X)= n( 1)65第65页,共88页。【例4-13】 例4-12中,如果以还原方式抽取4次(即每次抽取后,把所抽取的产品放回),写出抽到二等品件数的分布列。 解:用随机变量X表示经过4次抽取,抽到二等品的件数。它可能的取值是0,1,2,3,4。分布列如表4-7。 表4-7二项分布的分布列 表中,X取0,1,2,3,4各数值的概率是用式(4.35)算出的,其中,n = 4, = 5 / 20 = 0.25, k

24、= 0,1,2,3,4。 X = k01234P(X = k)0.31640.42190.21090.04690.03966第66页,共88页。三、超几何分布超几何分布的试验背景是:对有限总体进行不还原方式(每次抽取后,所抽单位不再放回,称之为不还原方式)的简单随机抽样,观察样本中具有某种特征的单位数目。如果有限总体单位数目为N,其中具有某种特征的单位数目为M,对这个总体进行n次不还原简单随机抽样,用随机变量X表示样本中具有某种特征的单位的数目,则X服从参数为(N,M,n)的超几何分布。超几何分布的概率函数是 (k=0,1,min n,M )其中,k是样本中具有某种特征的单位的数目。67第67

25、页,共88页。超几何分布的数字特征如下: 数学期望:E(X)= n (这里, =M/N) 方差: = n( 1) 68第68页,共88页。【例4-14】例4-13中,如果改为不还原地抽取4次,写出抽到二等品件数的分布列。 解:用随机变量X表示经过4次抽取,抽到二等品的件数。它可能的取值是0,1,2,3,4。分布列如表4-8。 表4-8超几何分布的分布列 表中取0,1,2,3,4各数值的概率是用式(4.36)算出的。式中,N =20,M =5,n = 4。X = x01234P(X = x)0.28170.46960.21670.03100.001069第69页,共88页。四、正态分布 令随机变

26、量X是在一个随机试验中被测量的结果,并且,决定这项试验结果的是大量偶然因素作用的总和,每个因素的单独作用相对均匀地小,那么,X的分布就近似于正态分布。70第70页,共88页。正态分布的密度函数是正态分布的数字特征如下: 数学期望:E(X)= 方 差:V(X) =271第71页,共88页。图4-2 正态分布概率密度曲线72第72页,共88页。正态分布的密度函数有两个参数:和2。从密度函数的图形来说,决定着曲线在横轴上的位置, 越大,图形位置越靠右;2决定着曲线的形状,2越大,图形越“矮胖”(见图4-3)。 图4-3 正态分布概率密度曲线中 的参数作用73第73页,共88页。 把随机变量与它的数学期望相减之差除以该随机变量的标准差(方差的平方根),称作随机变量的标准化。标准化能简化正态分布概率的计算. 74第74页,共88页。75第75页,共88页。应用Excel工具中的下列函数可以直接进行正态分布下的变量值与概率的相互计算:(1)一般正态分布下由变量值求概率 NORMDIST(x,均值,标准差,TRUE或1)=P(Xx)。括号中是需要填写的有关参数(以下相同

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论