概率和理论分布_第1页
概率和理论分布_第2页
概率和理论分布_第3页
概率和理论分布_第4页
概率和理论分布_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 第四章第四章 概率和理论分布概率和理论分布 本章主要复习现象、事件、概率、频率等概念本章主要复习现象、事件、概率、频率等概念 介绍小概率原理介绍小概率原理 二项分布、泊松分布、正态分布等各类理论二项分布、泊松分布、正态分布等各类理论 分布的概念和性质分布的概念和性质 标准正态分布的概念和性质标准正态分布的概念和性质 抽样和抽样分布抽样和抽样分布 标准误的概念和作用标准误的概念和作用 与下面统计假设检验有密切关系的与下面统计假设检验有密切关系的t-t-分布、分布、 x x2 2- -分布和分布和F F分布分布 数理统计与经典数学最大的不同之处在于:数理统计与经典数学最大的不同之处在于:经典数学

2、只要计算结果,计算结果就是其目的经典数学只要计算结果,计算结果就是其目的数理统计也要计算,但得到计算结果不是目的,数数理统计也要计算,但得到计算结果不是目的,数理统计的目的是理统计的目的是用计算结果来进行估计用计算结果来进行估计、推断推断在数理统计中这种在数理统计中这种估计估计有两样东西是必备的:有两样东西是必备的: 样本样本 概率概率即我们必须计算即我们必须计算样本样本的统计量,在一定的的统计量,在一定的概率概率保证保证下,用所得统计量来下,用所得统计量来估计估计相应总体的参数,即用相应总体的参数,即用样本来样本来推断推断总体:总体:用一个试验的结果来得出更广用一个试验的结果来得出更广义的义

3、的、一般意义上的结论一般意义上的结论例如:收获季节到了,我们从一个果园中随机采摘例如:收获季节到了,我们从一个果园中随机采摘100 个苹果,我们很容易就可以知道这个苹果,我们很容易就可以知道这 100 个苹个苹果每个苹果的平均重量,这是小学算术果每个苹果的平均重量,这是小学算术但作为一个果农来说,他不仅仅希望知道这但作为一个果农来说,他不仅仅希望知道这 100 个个苹果的平均重量,他更希望通过这苹果的平均重量,他更希望通过这 100 个苹果的个苹果的平均重量和大小差异(变异)知道整个果园的产平均重量和大小差异(变异)知道整个果园的产量,知道这些苹果的均匀程度对他的销售的影响,量,知道这些苹果的

4、均匀程度对他的销售的影响,甚至通过这些差异追溯以往的果园管理情况甚至通过这些差异追溯以往的果园管理情况这里,这里,100 个苹果就是个苹果就是样本样本,整个果园就是,整个果园就是总体总体;100 个苹果的平均重量就是个苹果的平均重量就是样本平均数样本平均数,大小差,大小差异就是异就是标准差标准差,计算这,计算这 100 个苹果的平均值和标个苹果的平均值和标准差就是准差就是统计统计;从;从 100 个苹果知道整个果园的情个苹果知道整个果园的情况(况(估产估产),就是),就是推断推断;整个过程就是;整个过程就是统计推断统计推断推断过程中,必须有推断过程中,必须有概率保证概率保证,即有多大的,即有多

5、大的把握把握同样,在畜牧上、兽医上、水产上,都有类似的问同样,在畜牧上、兽医上、水产上,都有类似的问题:我们作了一个试验,总希望通过这一试验得题:我们作了一个试验,总希望通过这一试验得到一个一般性的结论到一个一般性的结论期间,有以下工作要作:期间,有以下工作要作:抽样抽样 试验试验 记录记录 数据整理数据整理 统计统计 推推断断 结论结论其中,推断是需要有概率保证的其中,推断是需要有概率保证的因为我们希望知道,这种推断是否可靠、可信度有因为我们希望知道,这种推断是否可靠、可信度有多大、会不会犯错误、犯错的可能性又有多大多大、会不会犯错误、犯错的可能性又有多大因此,可以说,统计学的基础就是因此,

6、可以说,统计学的基础就是概率概率,没有概率,没有概率和概率保证,统计和统计推断就成了无根之木,和概率保证,统计和统计推断就成了无根之木,无源之水无源之水事实上,概率在一般生活中也无处不在事实上,概率在一般生活中也无处不在第一节第一节 概率论初步概率论初步一、随机现象和随机事件一、随机现象和随机事件(一)现象(一)现象 必然现象必然现象(inevitable phenomenon) 不可能现象不可能现象(impossible phenomenon) 随机现象随机现象(random phenomenon)(二二)随机试验随机试验(random experiment)对随机现象进行观测,就是试验,满

7、足以下三个条对随机现象进行观测,就是试验,满足以下三个条件的试验即为件的试验即为随机试验随机试验(随机试验简称试验随机试验简称试验):1、允许在相同条件下重复允许在相同条件下重复2、每次试验其结果不一定相同每次试验其结果不一定相同3、试验前并不知道试验会产生什么样的结果试验前并不知道试验会产生什么样的结果(三三)随机事件随机事件(random event)试验所产生的中间或终了结果就称为事件试验所产生的中间或终了结果就称为事件随机试验的结果就是随机事件(简称事件)随机试验的结果就是随机事件(简称事件)用大写的拉丁字母用大写的拉丁字母 A、B、C 等来表示事件等来表示事件必然事件用必然事件用 U

8、 表示表示;不可能事件用不可能事件用 V 表示表示二、事件间的关系二、事件间的关系和事件、积事件和事件、积事件互斥事件、对立事件互斥事件、对立事件完全事件系、事件的独立性完全事件系、事件的独立性三、随机事件的概率三、随机事件的概率(probability)随机事件的出现,带有很大的偶然性;但这种偶然随机事件的出现,带有很大的偶然性;但这种偶然性也有一定的规律:有些随机事件出现的可能性性也有一定的规律:有些随机事件出现的可能性大一些,有些则小一些大一些,有些则小一些因此需要用一个数值来表示这种可能性,这一数值因此需要用一个数值来表示这种可能性,这一数值就是概率就是概率即随机事件的概率就是对随机事

9、件可能性大小的度即随机事件的概率就是对随机事件可能性大小的度量量对某一试验进行对某一试验进行 n 次重复,试验中事件次重复,试验中事件 A 出现出现 a 次,次,事件事件 A 出现的频率出现的频率(frequency)为:为:afn当当 n无限增大,无限增大,f 将趋向于一个定值将趋向于一个定值 p,p 即为随机即为随机事件的概率:事件的概率:事实上,由于事实上,由于 n总是无限大的,因此总是无限大的,因此 p 一般不可能一般不可能得到,因此在实际工作中,总是将得到,因此在实际工作中,总是将 n 充分大时的充分大时的 f 值近似地作为值近似地作为 p 值,即值,即 n 足够大时的频率就是足够大

10、时的频率就是近似的概率,或用频率值来估计概率近似的概率,或用频率值来估计概率概率也可以是一个理论值概率也可以是一个理论值 ,AaPpnn 抛一个均质硬币,其落地时,正面朝上和反面朝上抛一个均质硬币,其落地时,正面朝上和反面朝上具有同等的机会,即具有同等的机会,即同样的例子还有:同样的例子还有:A0.5P正面朝上B0.5P反 面 朝 上0.8AP母猪情期受胎0.85BP鱼卵孵化成鱼苗0.32CP口蹄疫免疫成功显然,显然, 即即 ,必然事件的概率为必然事件的概率为 1,不可能事件的概率为,不可能事件的概率为 0 概率与频率的区别和联系:概率与频率的区别和联系:1、频率的稳定就是概率频率的稳定就是概

11、率2、随机事件发生的频率是一个变量,而概率是一个随机事件发生的频率是一个变量,而概率是一个常量,一个定值,或一个理论值常量,一个定值,或一个理论值3、频率是概率的随机表现频率是概率的随机表现4、每一次试验可以得到一个频率,但希望通过一次每一次试验可以得到一个频率,但希望通过一次试验就得到概率是不可能的试验就得到概率是不可能的01an01f 01p 5、如果已经知道随机事件如果已经知道随机事件A发生的概率,就可以预发生的概率,就可以预测事件测事件A在将要进行的试验中出现的可能性在将要进行的试验中出现的可能性6、可以通过一个大样本的频率,或多个样本的频可以通过一个大样本的频率,或多个样本的频率来估

12、计或预测概率率来估计或预测概率小概率原理:小概率原理: 表示随机事件表示随机事件 A是不可能事件;若是不可能事件;若 很小,很小,如如 或或 等等,表示随机事件等等,表示随机事件 A 在在某一次试验中出现的概率很小,即不可能出现的某一次试验中出现的概率很小,即不可能出现的概率很大,以至于可以这样认为,在一次试验中概率很大,以至于可以这样认为,在一次试验中事件事件 A实际上是不可能事件,即实际上是不可能事件,即 ,这就是,这就是概率论中的小概率事件实际不可能性原理,简称概率论中的小概率事件实际不可能性原理,简称为小概率原理为小概率原理小概率原理是统计学中进行假设检验的基本原理,小概率原理是统计学

13、中进行假设检验的基本原理,在以后的学习中经常会碰到,也经常应用在以后的学习中经常会碰到,也经常应用 0AP0.05AP 0.01AP AP 0AP四、随机变量四、随机变量作一次试验,试验的可能结果可以是多样的:作一次试验,试验的可能结果可以是多样的: *有些试验结果是几个确定的结果,这些确定的结有些试验结果是几个确定的结果,这些确定的结果可以一一列出果可以一一列出 #有些试验结果是一个范围有些试验结果是一个范围如用如用 x表示变量,那么表示变量,那么 x的取值的表示:的取值的表示:或者可用一实数来表示(或者可用一实数来表示(*者:者:x=0 x=1 etc.)或者可用一个范围来表示(或者可用一

14、个范围来表示(#者:者:1.5x2.1 etc.)1、当随机变量当随机变量 x 的取值是一个确定的实数,且每的取值是一个确定的实数,且每一实数发生的概率也是确定的,这种类型的变量一实数发生的概率也是确定的,这种类型的变量就称为就称为 离散型随机变量(离散型随机变量(discrete random variable)如:设生男孩为如:设生男孩为 ,生女孩为,生女孩为 ,则,则其含义是:生男孩的概率为其含义是:生男孩的概率为 0.52,生女孩的概率为,生女孩的概率为0.48又如:又如: 为猪丹毒治愈,为猪丹毒治愈, 为未治愈,则为未治愈,则1x 0 x 10.52xP00.48xP1x 0 x 1

15、0.93xPp00.07xPq 设一个布袋里装有设一个布袋里装有1个白球、个白球、2个红球、个红球、3个黑球、个黑球、4个黄球,充分混匀,个黄球,充分混匀, 为取得白球,为取得白球, 为取得为取得红球,红球, 为取得黑球,为取得黑球, 为取得黄球,则为取得黄球,则将随机变量将随机变量 x 所有可能取值及其对应的概率一一列所有可能取值及其对应的概率一一列出,可形成离散型随机变量的概率分布列:出,可形成离散型随机变量的概率分布列:变量变量 x: x1 x2 x3 xn概率概率 p1 p2 p3 pn0 x1x 2x3x100.1xPp210.2xPp320.3xPp430.4xPpix xP上例中

16、:上例中: 从布袋中取得各色球从布袋中取得各色球x: 0 1 2 3概概 率率 0.1 0.2 0.3 0.4ix xP2、当变量当变量 x的取值是一个范围,且的取值是一个范围,且x在这一范围内的在这一范围内的概率是确定的,这种类型的变量就称为连续型随机概率是确定的,这种类型的变量就称为连续型随机变量(变量(continuous random variable)对于连续型随机变量,研究其取某一定值的概率是没对于连续型随机变量,研究其取某一定值的概率是没有意义的有意义的对于随机变量对于随机变量 x,若存在非负可积函数,若存在非负可积函数f(x),(-x+)对于任意对于任意a、b(a5 及及 nq

17、5 时接近正态时接近正态分布,当分布,当 n 时,服从正态分布时,服从正态分布即正态分布是二项分布的极限即正态分布是二项分布的极限xnppn22xnpqpqnnxpqn例例1:用某一常规药物治疗猪瘟病,其正常治愈率为用某一常规药物治疗猪瘟病,其正常治愈率为 0.7,对,对 20头罹患猪瘟的种猪用该种药物进行常规性治疗,问其中头罹患猪瘟的种猪用该种药物进行常规性治疗,问其中 16 头病猪被治愈的概率是多少?头病猪被治愈的概率是多少?此例中,此例中,p = 0.7,n = 20,m = 16该例中,该例中, 20200.7 0.7 1414, 2 2 20200.70.70.3 0.3 4.2 4

18、.2 2.052.05例例2:某药物对体外寄生虫的正常杀灭率为某药物对体外寄生虫的正常杀灭率为 0.9,人工培养该种,人工培养该种寄生虫寄生虫 50 头,用该药物进行常规性杀灭试验,问希望一次头,用该药物进行常规性杀灭试验,问希望一次杀灭杀灭 48 头的概率?头的概率?此例中,此例中,p = 0.9,n = 50,m = 48该例中,该例中, 50500.9 0.9 4545, 2 2 50500.90.90.1 0.1 4.5 4.5 2.122.12 164162020160.70.34845 0.0033 0.00810.129512.95%PC 482485050480.90.1122

19、50.00640.010.07817.81%PC二、泊松分布(二、泊松分布(poisson distribution)当二项分布中的当二项分布中的 n 、而、而 p 0时,二项分布将成时,二项分布将成为另一种新的分布:泊松分布(普哇松分布)为另一种新的分布:泊松分布(普哇松分布)即试验(或称观察)次数很大、而某事件出现的概率即试验(或称观察)次数很大、而某事件出现的概率很小,则离散型随机变量很小,则离散型随机变量 x 服从于泊松分布服从于泊松分布若随机变量若随机变量 x 的分布列为:的分布列为: 0 1 2 m p0 p1 p2 pm 其中:其中: (0,0,且且np,m=0,1,2, )而而

20、泊松分布只有一个参数:泊松分布只有一个参数:,np既是泊松分布的平均值,又是其方差既是泊松分布的平均值,又是其方差标准差为标准差为 即即!mmpem01!mmmmpeee emm 231.!2!3!mmemm2当随机变量当随机变量 x服从于参数为服从于参数为 的泊松分布时的泊松分布时记为记为泊松分布的图形决定于泊松分布的图形决定于,1时,时,P(x=0)为最大,为最大,12时,时,P(x=1)为最大,为最大, 27 0 0 0.0071 0.639 90 245 1.00 90.00首先计算每一视野内的破伤风杆菌平均值,并将其暂作为首先计算每一视野内的破伤风杆菌平均值,并将其暂作为值:值:将将

21、值代入值代入中各式,得各个中各式,得各个 P(x),见上表的第四列,将各个,见上表的第四列,将各个 P(x)与总频数相与总频数相乘,即得理论频数,即上表的最后一列乘,即得理论频数,即上表的最后一列如如依此类推依此类推每个视野中破伤风杆菌数大于每个视野中破伤风杆菌数大于7个的也应计算理论频数,即上表个的也应计算理论频数,即上表中的最后一行中的最后一行镜检视野内破伤风杆菌的分布图见下一页镜检视野内破伤风杆菌的分布图见下一页2452.722290nxwn 231.2!3!xPe 332.722232.72220.22103!3!Pee 552.722252.72220.08195!5!Pee 频频

22、数数 破伤风杆菌数破伤风杆菌数 0 1 2 3 4 5 6 7三、正态分布(三、正态分布(normal distribution)连续型随机变量是日常工作中最多见的一种变量,这连续型随机变量是日常工作中最多见的一种变量,这一类变量为可加、或呈线性时,一般服从正态分布一类变量为可加、或呈线性时,一般服从正态分布将这一类资料整理成直方图或折线图时,其图形总呈将这一类资料整理成直方图或折线图时,其图形总呈中间多、两边少的钟型(中间多、两边少的钟型(bell-shape)分布特征)分布特征假设将样本容量假设将样本容量n无限扩大,分组更细,即无限扩大,分组更细,即n 组距组距 0,则每一组的频数将趋向于

23、一个定值,即一,则每一组的频数将趋向于一个定值,即一概率值,此时,呈现在我们面前的将是一条中间高、概率值,此时,呈现在我们面前的将是一条中间高、向两边均匀对称下降的光滑曲线;这一类资料的概向两边均匀对称下降的光滑曲线;这一类资料的概率分布就称为正态分布率分布就称为正态分布和正态分布相对应的曲线称为和正态分布相对应的曲线称为正态分布密度曲线正态分布密度曲线用来描述这条曲线的函数称为用来描述这条曲线的函数称为正态分布密度函数正态分布密度函数正态分布是数理统计中最重要的一种理论分布正态分布是数理统计中最重要的一种理论分布呈正态分布的随机变量呈正态分布的随机变量 x其密度函数其密度函数 f(x)为:为

24、:上式中,上式中,为随机变量为随机变量 x 的平均值,的平均值, 2 2 为方差,为方差, 为标准差,任何一个正态分布均由参数为标准差,任何一个正态分布均由参数 和和 2 2 所决定所决定 22212xfxe一个随机变量一个随机变量 x 服从平均值为服从平均值为、方差、方差2 2为的正态为的正态分布时,记为分布时,记为正态分布的特点是:正态分布的特点是:1、正态分布曲线以直线、正态分布曲线以直线 x为对称,且在该处达为对称,且在该处达到顶峰,到顶峰,x x时时 为最大值为最大值2、曲线有两个拐点:、曲线有两个拐点:在这两个拐点处,曲线改变方向在这两个拐点处,曲线改变方向3、正态分布曲线在正态分

25、布曲线在 x 轴上的的位置由轴上的的位置由决定,而曲决定,而曲线高矮、胖瘦的形状由线高矮、胖瘦的形状由决定决定4、正态分布密度曲线向正态分布密度曲线向-、 +无限延伸无限延伸2,xN 12f x, f, f正态分布密度曲线与正态分布密度曲线与 x 轴所包围的面积恒为轴所包围的面积恒为1,即服,即服从正态分布的随机变量从正态分布的随机变量 x 在(在( -, +)间内取值)间内取值的概率为的概率为1而随机变量而随机变量 x 在区间(在区间(a,b)内取值的概率也可以)内取值的概率也可以看成是一块面积,这块面积由看成是一块面积,这块面积由x=a、x=b、y=0及曲及曲线所围成的曲边梯形所组成线所围

26、成的曲边梯形所组成即求随机变量即求随机变量 x 在某一区段内的概率就转化成了求由在某一区段内的概率就转化成了求由该区段与相应曲线所围成的曲边梯形面积的定积分:该区段与相应曲线所围成的曲边梯形面积的定积分: baxbaPfx dx而在讨论标准差的性质时,曾提到随机变量而在讨论标准差的性质时,曾提到随机变量 x的分的分布状况与标准差的关系,这里我们可以用面积来布状况与标准差的关系,这里我们可以用面积来表示之:表示之: 0.6827xPfx dx 22220.9545xPf x dx 33330.9973xPf x dx 1.961.961.961.960.95xPf x dx 2.582.582.582.580.99xPf x dx 而其两边的概率(即面积)则相应分别为(括弧内而其两边的概率(即面积)则相应分别为(括弧内的为一边面积):的为一边面积):0.3173(0.1584)0.0455(0.02258)0.0027(0.0014)0.05(0.025)0.01(0.005)标准正态分布标准正态分布不同的不同的值和值和值,决定了不同的正态分布密度曲值,决定了不同的正态分布密度曲线,这在实际使用中很不方便线,这在实际使用中很不方便因此可将不同正态分布中的随机变量因此可将不同正态分布中的随机变量 x 作一变换:作一变换:令令这一变换过程称为随机变量的标准化过程这一变换过程称为随

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论