生物统计学第二讲1_第1页
生物统计学第二讲1_第2页
生物统计学第二讲1_第3页
生物统计学第二讲1_第4页
生物统计学第二讲1_第5页
已阅读5页,还剩106页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生物统计学

BiostatisticsGangDongSchoolofLifeSciencesShanxiUniversity第三章概率和概率运算

一、概率的根本概念1.随机现象确定性现象〔必然现象〕指在一定条件下,必然会出现某种肯定的结果或必然不出现某种结果的现象。随机现象〔不确定现象〕指在同样的条件下进行一系列重复实验或观测,每次出现的结果并不完全一样的现象。第三章概率和概率运算

一、概率的根本概念1.随机现象投掷硬币正面向上频率调查实验者投掷次数(n)出现正面向上的次数(µ)频率=µ/nDeMorgenBuffonPearsonPearsonVinear2048404012000240003000010612048601912012149940.5180.50690.50160.50050.4998第三章概率和概率运算

一、概率的根本概念1.随机现象虽然随机现象的每次观察的结果不确定,但是大量观察的结果却呈现一定的规律性。研究随机现象规律性的科学就称为概率论,利用概率论得出的规律来揭示偶然性中存在的必然性的科学就是统计学。第三章概率和概率运算

一、概率的根本概念2.事件和事件间的关系2.1实验和试验的区别〔1〕试验〔trail〕:指为了了解某物的性能或某事的结果而进行的尝试性活动。一次尝试性活动就是一次试验。如调查小麦鲁麦15的株高,每测量一株小麦就是一次试验;第一株株高为67厘米,第二株为70厘米,我们说两次的试验结果不同。〔2〕实验〔experiment〕:设计一种方法,来检验一种理论或证实一种假设而进行的一系列操作或活动。即一系列试验构成一个实验。第三章概率和概率运算

一、概率的根本概念2.事件和事件间的关系2.2事件和事件的关系几个根本概念随机试验:从某一研究目的出发,对随机现象的观察活动称为随机试验,简称试验。随机事件:随机试验的每一个可能的结果称为随机事件,简称事件。如调查10个新生婴儿中男婴的数目。第三章概率和概率运算

一、概率的根本概念2.事件和事件间的关系根本领件:随机试验中,每一个可能发生的不再分解的最根本的结果称为根本领件。如:10个新生婴儿中男婴的数目有0、1、2……10等11种结果,每个数字就是一个根本领件。必然事件:在一定条件下,必然会出现某种肯定的结果,这种事件称为必然事件。如太阳从东边升起。不可能事件:在一定条件下,不可能发生的事件,称为不可能事件。如母猪下蛋。第三章概率和概率运算

一、概率的根本概念2.事件和事件间的关系2.2事件和事件的关系事件的包含与相等;事件的和;事件的差;事件的交;互不相容事件;对立事件等。下面只介绍较易混淆的三种根本领件关系。独立事件:事件A的发生不影响B的发生,事件B的发生也不影响事件A的发生。如A班的考研率和B班的考研率;再如甲乙两人打靶,两人中靶率互不干预等都是独立事件。第三章概率和概率运算

一、概率的根本概念2.事件和事件间的关系2.2事件和事件的关系对立事件:对于任一事件A,必有,A与为有特殊关系的对立事件。如果A+B=U,AB=Φ,记为B=。如婴儿的性别,非男即女;掷硬币正面向上与反面向上;打靶中与不中等都是对立事件。互斥事件:也叫互不相容事件,表示两件事不能同时发生,但他们可以同时不发生。如10个新生婴儿中男婴的数目是6个的事件和是7个的事件是互斥事件。第三章概率和概率运算

一、概率的根本概念2.事件和事件间的关系2.2事件和事件的关系对立事件不能同时发生,也不能同时不发生。所以对立事件一定是互斥事件;而互斥事件不一定是对立事件,一定不是独立事件;独立事件是相容事件,不能是互斥事件。第三章概率和概率运算

一、概率的根本概念3.事件的概率3.1概率的统计定义概率和频率是非常容易混淆的两个概念,举例说明二者的区别。如果某随机试验进行了n次〔即样本含量〕,其中根本领件A发生了m次〔即频数是m〕,那么事件A在随机试验中出现的频率是f(A)=m/n。大量试验使随机事件呈现规律性,即频率稳定性。某事件发生的稳定频率称为概率,表示该事件发生的可能性大小。概率是事件本身所固有的,是确定值,不随着人的主观意志而改变,而频率是不稳定的,围绕着概率摆动。第三章概率和概率运算

一、概率的根本概念3.事件的概率3.1概率的统计定义概率的统计定义是:在相同条件下,进行大量重复试验,假设事件A的频率稳定地在某一确定值P的附近摆动,那么称P为事件A发生的概率〔probability〕,记为P(A)=P。水污染小区居民贫血症调查频率表〔样本含量n不同〕抽样人n=20(人)n=200(人)n=2000(人)患病人数m患病频率m/nmm/nmm/nABCDEFGHI0500.2000.0500.2000.2500.3500.3000.1000.2000.200323138494037402947530.1600.1550.1900.2450.2000.1850.2000.1450.2350.2654044144093824164143884244103860.2020.2070.2050.1910.2080.2070.1940.2120.2050.193由定义知,任意事件A,0≤P(A)≤1,必然事件的概率为1,不可能事件的概率为0。第三章概率和概率运算

一、概率的根本概念3.事件的概率3.2概率的古典定义通过研究现象的内在规律来确定它的概率。如抛硬币、掷骰子、买彩票等。这类现象要符合两个条件:〔1〕随机试验的全部可能结果〔根本领件数〕是有限的;〔2〕各事件是互不相容且等可能的。那么,事件A发生的概率P(A)是A包含的事件数m与事件总数n的比值。P(A)=根本领件A的个数(m)/根本领件总数(n)第三章概率和概率运算

一、概率的根本概念3.事件的概率3.2概率的古典定义例:根据孟德尔遗传定律,计算双眼皮父亲〔Dd〕和母亲〔Dd〕的孩子是双眼皮的概率有多大?解:双眼皮基因D是显性。他们后代的基因型为DD、Dd、dD、dd四种类型,前3类都是显性,所以,P〔双眼皮〕=3/4=0.75第三章概率和概率运算

一、概率的根本概念3.事件的概率例:袋中装10个球,其中6个白球,4个红球。〔1〕放回式抽样:每次抽1球,看颜色后放回。①求抽3次都为白球的概率P(A)和3次都为红球的概率P(B)?解:总抽样的样本空间〔总抽样次数〕:n=103;三次取的都是白球的次数m=63。所以抽3次都为白球的概率P(A)=63/103=0.216同理,抽3次都为红球的概率P(B)=43/103=0.064②求抽3次,两次红球,一次白球的概率P(C)?解:P(C)=×42×6/103=0.288其中指三个球出现顺序的可能性。第三章概率和概率运算

一、概率的根本概念3.事件的概率例:袋中装10个球,其中6个白球,4个红球。〔2〕非放回式抽样:每次抽1球,不放回①抽3个都为白球的概率P(A)=(6×5×4)/(10×9×8)=0.167②抽3个两个红球,一个白球的概率P(B)=(×4×3×6)/(10×9×8)=0.30③抽3个都为红球的概率P(A)=(4×3×2)/(10×9×8)=0.033④抽3个两次白球,一次红球的概率P(B)=(×6×5×4)/(10×9×8)=0.25第三章概率和概率运算

一、概率的根本概念3.事件的概率3.3概率的主观定义一些实际问题,即没有古典定义的特点,也不能在相同条件下进行大量重复试验。如公安破获某一案件的概率,购置某支股票获得高收益的概率,某个学生考上中科院研究生的概率。这类问题只能根据人们的经验,以个人主观信念为根底来估计事件发生的概率。第三章概率和概率运算

二、概率的运算法那么1.概率的加法定理1.1狭义的加法〔定理1〕

如果A、B两个事件是互斥事件,P(A+B)=P(A)+P(B),表示A和B两个事件中至少有一个发生的概率。ABC例:植物所的研究生35%来自师范生,32%来自农业大学,那么师范生和农业大学生占全所研究生的比例就为35%+32%=67%第三章概率和概率运算

二、概率的运算法那么1.概率的加法定理1.2广义的加法〔定理2〕对于任意两个事件A和B,P(A+B)=P(A)+P(B)-P(AB),P(AB)表示A和B两个事件同时发生的概率。ABAB第三章概率和概率运算

二、概率的运算法那么1.概率的加法定理1.2广义的加法〔定理2〕例:某外企招聘大学生,要求条件是要么有大学英语六级证书,要么有计算机二级证书。某学校大学毕业生大学六级通过率为P(A)=70%,计算机二级通过率为P(B)=36%,二者都通过的有P(AB)=15%。任抽取一学生,符合应聘要求的概率P(A+B)=70%+36%-15%=91%。对于不便求出的概率,可以求其补集:因为P(A)+P()=1,所以P(A)=1-P()第三章概率和概率运算

二、概率的运算法那么2.条件概率和乘法定理要讨论概率的乘法公式,首先需要了解条件概率的概念。2.1条件概率:在事件A发生的条件下,求事件B发生的概率,称为在事件A发生条件下,事件B发生的概率,记为P(B|A);反之记为P(A|B)。如食道癌患者的存活率是30%、某位病人证明患有食道癌〔事件A已经发生〕,这位病人能够存活〔事件B〕的概率就用P(B|A)表示。第三章概率和概率运算

二、概率的运算法那么2.条件概率和乘法定理2.2概率的乘法公式〔定理3〕事件A和事件B同时发生的概率P(AB)等于其中任一事件的概率乘以在该事件发生的条件下另一事件发生的概率,即P(AB)=P(B)P(A|B)或者P(AB)=P(A)P(B|A)第三章概率和概率运算

二、概率的运算法那么2.条件概率和乘法定理例:班里发了5张电影票,有8个人想去看电影,只能抓阄,5个写有,3个写没有,甲先抓,乙第二个抓,求两人都能抓到电影票的概率。解:甲先抓,抓到的概率:乙第二个抓,抓到的概率:甲乙都抓到的概率:甲乙丙三人先抓,三人都抓到的概率:第三章概率和概率运算

二、概率的运算法那么3.独立事件及其乘法公式3.1简单的独立事件及其乘法公式如果两个事件A、B中,任一件事的发生并不影响另一件事的概率,即P(B|A)=P(B)或P(A|B)=P(A),那么认为事件A与事件B是独立的,对于独立事件,事件AB同时发生的概率等于两个事件概率的乘积〔定理4〕。即对于独立事件,概率的乘法公式为:P(AB)=P(A)P(B)第三章概率和概率运算

二、概率的运算法那么3.独立事件及其乘法公式3.1简单的独立事件及其乘法公式例:抽查甲乙两班的英语四级考试情况,甲班四级通过率为0.8,乙班四级通过率为0.7。从这两个班级中分别抽取1人,被抽取的2个人都通过四级的概率是多少?解:P(AB)=P(A)P(B)=0.8×0.7=0.56至少有1人通过的概率:P(A+B)=P(A)+P(B)-P(AB)=0.8+0.7-0.56=0.94恰好只有1人通过的概率:第三章概率和概率运算

二、概率的运算法那么3.独立事件及其乘法公式3.2独立事件的乘法公式的几个推论〔定理5〕

如果A1、A2、A3…An等n各事件相互独立,它们及其他们的补集也都相互独立,即A1、A2、A3、…、An和、、、…、之间都两两相互独立。第三章概率和概率运算

二、概率的运算法那么3.独立事件及其乘法公式3.2独立事件的乘法公式的几个推论〔定理5〕第三章概率和概率运算

二、概率的运算法那么4.全概率公式从几个简单的不相容事件的概率推算一个未知的复杂事件的概率。如果一个未知事件B的概率P(B)比较复杂,可以分解为简单的几个不相容事件的和P(A1)+P(A2)+P(A3)+…+P(An),那么事件B的概率〔定理6〕:P(B)=∑P(Ai)P(B|Ai)第三章概率和概率运算

二、概率的运算法那么5.贝叶斯定理贝叶斯定理(Bayes’theorem):也称为逆概率公式〔定理7〕它与全概率公式相反,某事件B发生的概率P(B),求该事件由某个原因所引起的条件概率P(Ai|B),它可以帮助我们分析引起事件发生的可能原因。第三章概率和概率运算

二、概率的运算法那么5.贝叶斯定理例:中年男性中肥胖者者占30%、标准体重占50%,偏瘦者占20%。这三类人群中患动脉硬化的概率分别为30%、10%、1%。从中年男性中随机抽取到1人,发现此人是动脉硬化患者,问这个病人是肥胖者的概率?解:用B表示抽到动脉硬化患者的事件;用A1表示抽到肥胖者的事件;用A2表示抽到标准体重的事件;用A3表示抽到偏瘦者的事件

:P(A1)=0.30;P(A2)=0.50;P(A3)=0.20;P(B|A1)=0.30;P(B|A2)=0.10;P(B|A3)=0.01第三章概率和概率运算

二、概率的运算法那么5.贝叶斯定理:P(A1)=0.30;P(A2)=0.50;P(A3)=0.20;P(B|A1)=0.30;P(B|A2)=0.10;P(B|A3)=0.01同样可求得:此病人是标准体重者的概率此病人是偏瘦者的概率第三章概率和概率运算

二、概率的运算法那么6.概率运算的表示方法设有A、B、C三个独立事件,用事件运算表示以下事件:第四章几种常见的概率分布

一、随机变量及其数学期望与方差

1.随机变量的概念和分类

概念:随机变量指在随着随机试验结果而变化的量。

分类:根据随机变量的取值特征分为离散型随机变量和连续型随机变量。2.随机变量的数学期望和方差概率分布就是指随机现象的各种可能结果发生的概率。数学期望〔Expection〕与方差的统计学意义数学期望主要用来描述随机变量的平均取值情况,而方差那么用来描述随机变量的取值对于平均值的离散程度。第四章几种常见的概率分布

一、随机变量及其数学期望与方差

2.随机变量的数学期望和方差数学期望,简称期望〔Expection〕,它说明了随机变量取值的平均水平,用“E(X)〞表示。对于频率资料,平均数计算:其中,X=组值或中值;p为频率;k=组数;px表示p与x的乘积第四章几种常见的概率分布

一、随机变量及其数学期望与方差

2.随机变量的数学期望和方差例:用一种复合饲料养猪,每天增重的kg数及其相应概率如下,求这批猪平均每天增重多少?每天增重kg数(中值)0.51.01.52.0概率0.100.200.500.20解:每天增重的数学期望

第四章几种常见的概率分布

一、随机变量及其数学期望与方差

2.随机变量的数学期望和方差设离散型随机变量X的概率分布如下表:Xx1x2x3…xn…Pp1p2p3…pn…那么X的数学期望:第四章几种常见的概率分布

一、随机变量及其数学期望与方差

3.方差的计算

对于随机变量X,总体方差的记为D(X)D(X)=E(X-EX)2=E(X2)-(EX)2==σ2

方差的具有以下两个根本性质:对于任一常数c,有D(cX)=c2∙D(X);对于互相独立的随机变量X1、X2、…、Xk,D(X1+X2+…+Xk)=D(X1)+D(X2)+…+D(Xk)除了方差外,我们还经常用到,一般用希腊字母“σ〞来表示,称为随机变量X的标准差,它也是描述随机变量取值离散程度的重要参数第四章几种常见的概率分布

一、随机变量及其数学期望与方差

3.方差的计算

简单的讲,就是总体标准差σ。数学期望就是随机变量的理论平均数,就是总体平均数“µ〞,随即变量的理论方差就是总体方差“σ2〞。随机变量的理论偏斜度和峭度就是总体偏斜度“γ1〞和峭度“γ2〞。第四章几种常见的概率分布

二、离散型随机变量的概率分布

随机变量的取值是离散型数据的,称为离散型随机变量。设离散型随机变量X的所有可能取值为Xi,取值得概率为P(Xi),那么P(Xi)就为离散型随机变量X的概率分布律。离散型随机变量概率分布的特点:〔1〕P(X)≥0;〔2〕第四章几种常见的概率分布

二、离散型随机变量的概率分布

1.二点分布〔伯努利分布:Bernoullidistribution〕两点分布是最简单,最常用概率分布。如:掷硬币“正面向上”或“反面向上”;产品“合格”、“不合格”;新生儿性别“男”“女”;种子“发芽”“不发芽”;打靶“中”与“不中”。P(X=1)=pP(X=0)=1-p,1-p用“q”表示,即q=1-p两点分布的概率分布函数为:在随机试验中,如果只有两种可能的试验结果,成功记为X=1,失败记为X=0,那么对应的随机变量〔1次试验的两个结果〕服从0-1分布,也称两点分布。第四章几种常见的概率分布

二、离散型随机变量的概率分布

2.二项分布在实际问题中常常要做屡次完全相同并且相互独立的试验,我们称这种试验为重复独立性试验。伯努利又将两点分布进行了推广。二项分布的条件:

①每次试验只有两种可能结果;②每一种结果在每次试验中都有恒定的概率,成功的概率都为p,失败的概率为1-p;③进行了n次重复试验,试验之间是相互独立的。第四章几种常见的概率分布

二、离散型随机变量的概率分布

2.二项分布如果从二项总体进行n次重复抽样,设出现“此〞的次数为y,那么y的取值可能为0、1、2、…、n,共有n+1种可能取值,这n+1种取值各有其概率,因而由变量y及其概率就构成了一个分布,这个分布叫做二项式概率分布,简称二项式分布或二项分布〔binomialdistribution〕。二项总体的抽样试验具有重复性和独立性。重复性是指每次试验条件不变,即在每次试验中“此〞事件出现的概率皆为p。独立性是指任何一次试验中“此〞事件的出现与其余各次试验中出现何种结果无关。第四章几种常见的概率分布

二、离散型随机变量的概率分布

2.二项分布P(x)=Cxnpxqn-xP(x)为随机变量x的二项分布,记作B(n,p)。x表示在n次试验中事件A出现的次数,n表示试验次数〔或样本含量〕,p表示事件A发生的概率〔每次试验是恒定的〕,q即1-p表示事件A不发生的概率。2.1二项分布的概率函数2.2二项分布的形状和参数二项分布的形状由n和p两个参数决定。(1)当p值较小且n不大时,分布是偏倚的。随n的增大,分布趋于对称;〔2〕对于固定的n和p,当x增加时,P(x)先随之增加并到达极大值,以后又下降;〔3〕当p值趋于0.5时,分布趋于对称。第四章几种常见的概率分布

二、离散型随机变量的概率分布

2.二项分布2.2二项分布的形状和参数服从二项分布B(n,p)的随机变量所构成的总体的平均数μ、标准差σ与n、p这两个参数有关。第四章几种常见的概率分布

二、离散型随机变量的概率分布

2.二项分布二项分布的计算也可以用Excel函数自动获得,下面再补充一些常用的Excel函数,在后续的计算中或者日常生活中都可能经常用到〔1〕Excel中二项分布的函数为Binomdist,其累积密度函数值可以在附表中查到。P(K)=Binomdist(k,n,p,trueorfalse),True表示向下累积密度函数,False表示概率密度函数。

第四章几种常见的概率分布

二、离散型随机变量的概率分布

2.二项分布P(K)=Binomdist(k,n,p,trueorfalse),True表示向下累积密度函数,False表示概率密度函数。解:P(0)=0.60(1-0.6)5=0.0102=Binomdist(0,5,0.6,false)P(1)=0.61(1-0.6)4=0.0768=Binomdist(1,5,0.6,false)P(2)=0.62(1-0.6)3=0.2304=Binomdist(2,5,0.6,false)P(3)=0.63(1-0.6)2=0.3456P(4)=0.64(1-0.6)1=0.2592P(5)=0.65(1-0.6)0=0.0778P(≥2)=P(2)+P(3)+P(4)+P(5)=0.9130例:某士兵每发射一粒子弹射中靶子的概率为0.6,他发射了5颗子弹,求士兵5发子弹都为击中靶子的概率和至少有2颗子弹射中靶子的概率?第四章几种常见的概率分布

二、离散型随机变量的概率分布

2.二项分布P(K)=Binomdist(k,n,p,trueorfalse),True表示向下累积密度函数,False表示概率密度函数。例:某士兵每发射一粒子弹射中靶子的概率为0.6,他发射了5颗子弹,求士兵5发子弹都为击中靶子的概率和至少有2颗子弹射中靶子的概率?解:P(≥2)=1-P(≤1)=1-Binomdist(1,5,0.6,true)

=1-0.0870=0.9130

第四章几种常见的概率分布

二、离散型随机变量的概率分布

2.二项分布〔2〕二项分布累积函数对应的临界值Critbinom(n,p,α)。n试验次数,p事件发生概率,α为累积函数值。即P(≤X)=α,X=Critbinom(n,p,α)。如打靶X=Critbinom(10,0.6,0.90)=8,指如果士兵打靶命中率为0.6,他打10发子弹,中8发一下的概率是90%。〔3〕Excel中某数阶层的计算函数为Fact如:5!=fact(5)或FACT(5)=120〔4〕Excel中某数m的n次方计算函数为:m^n如:55=5^5〔5〕Excel中以某数m为底的n的对数,计算函数为:log(n,m)如:Excel中以10为底的n的对数,计算公式为:=log10(n)〔6〕Excel中以自然对数e为底的n的对数,计算函数为:ln(n)Excel中自然对数e的n次方,计算函数为:exp(n)第四章几种常见的概率分布

二、离散型随机变量的概率分布

2.二项分布〔7〕Excel中从给定元素数目m得集合中抽取假设干n元素的排列组合数计算函数为:Combin(m,n)

如:=Combin(7,2)=21注:函数输入时字母不分大小写,也可以从函数列表中插入。第四章几种常见的概率分布

二、离散型随机变量的概率分布

3.几何分布3.1几何分布的概念前面讲的二项分布是n次重复独立性试验中,事件A发生k次〔0≤k≤n〕的概率。几何分布指的是n次重复独立性试验中,事件A第k次〔0≤k≤n〕出现的概率。概率分布函数为:

几何分布简单讲就是最后一次成功,其他失败的概率。第四章几种常见的概率分布

二、离散型随机变量的概率分布

3.几何分布1、几何分布的概念几何分布的总体平均数:方差:

几何分布是负二项分布的一种特殊情况,即最后一次成功,其余失败。可用Excel中的负二项分布的函数Negbinomdist来计算:P(k)=Negbinomdist(k-1,1,p)第四章几种常见的概率分布

二、离散型随机变量的概率分布

3.几何分布2、几何分布的应用举例P(k)=Negbinomdist(k-1,1,p)例:某新兵每发射一粒子弹射中靶子的概率为0.3,求他打靶过程中到第3发子弹才能击中靶子的概率?解:=0.3×0.72=0.147

用Excel计算:P(3)=Negbinomdist(2,1,0.3)=0.147负二项分布的一个重要性质是无记忆性,就是可以由任意一点开始。比方一个士兵打靶,不管前面打了几发,都不影响他恰好第n发子弹才能打中靶子的概率。第四章几种常见的概率分布

二、离散型随机变量的概率分布

4.泊松分布(Poissondistribution)

泊松〔Poisson,Simeon-Denis,1781—1840〕是法国数学家,为统计学做出了众多突出奉献。除了提出随机现象的泊松分布以外,还推广了“大数定理〞。对积分理论、行星运动理论、热物理、弹性理论、电磁理论、位势理论和概率论都有重要奉献,在数学中以他的姓名命名的有:泊松定理、泊松公式、泊松方程、泊松分布、泊松过程、泊松积分、泊松级数、泊松变换、泊松代数、泊松比、泊松流、泊松核、泊松求和法等。第四章几种常见的概率分布

二、离散型随机变量的概率分布

4.泊松分布(Poissondistribution)

4.1泊松分布的概念泊松分布可作为稀有事件〔小概率事件〕发生次数的概率分布模型。二项分布中n大、p小〔一般n≥20,p≤0.25或者n≥10,p≤0.10〕的概率用二项分布太繁琐,可用泊松分布近似计算其概率。现实生活中有很多现象也服从泊松分布,如:1年内飞机失事的次数;煤矿意外事故死亡人数;每平方米土地上的害虫数;1页书上错别字个数、商场每周售出的电视台数等。第四章几种常见的概率分布

二、离散型随机变量的概率分布

4.泊松分布(Poissondistribution)

4.2泊松分布的概率分布函数:其中:X为事件的发生次数或人数、细菌数等;μ为总体平均数;e是自然对数底,e=2.71828183。第四章几种常见的概率分布

二、离散型随机变量的概率分布

4.泊松分布(Poissondistribution)

4.3泊松分布的数学期望和方差

:μ=σ2=np=λ〔n为试验次数,p为小概率事件发生的概率,σ为总体标准差,λ为常数〕。但总体平均数μ往往是未知的,只能从所观察的随机样本中计算出相应的样本平均数作为μ的估计值。泊松分布的Excel函数名为Poisson:P(X)=Poisson(x,μ,trueorfalse)True表示向上累积函数,False表示概率密度函数。对于波松分布,当μ→∝时,波松分布以正态分布为极限。在实际计算中,当μ≥10时,泊松分布可用正态分布进行近似计算。第四章几种常见的概率分布

二、离散型随机变量的概率分布

4.泊松分布(Poissondistribution)

4.4泊松分布的应用举例

例:杂草的分布符合泊松分布,甲老汉,他的麦田内杂草不超过100颗草/亩,乙老汉不信,抽查了一分地,求每分〔0.1亩〕麦田里有12颗草的概率?解:μ=10,求P(12)P(12)==Poisson(12,10,false)=0.0948>0.05;说明如果每亩地有100颗草的话,1分地内有12颗草是很有可能的,是正常的。或者说每亩麦田内杂草并不显著多于100颗。第四章几种常见的概率分布

二、离散型随机变量的概率分布

4.泊松分布(Poissondistribution)

4.4泊松分布的应用举例

例:杂草的分布符合泊松分布,甲老汉,他的麦田内杂草不超过100颗草/亩,乙老汉不信,抽查了一分地,求每分〔0.1亩〕麦田里有15颗草的概率?解:μ=10,求P(15)P(15)==0.0347<0.05

说明如果每亩地不超过100颗草的话,1分地内不可能发现15颗草,也就是说这亩麦田内杂草显著多于100颗。第四章几种常见的概率分布

二、离散型随机变量的概率分布

4.泊松分布(Poissondistribution)

4.5泊松分布的重要特征和判断

符合泊松分布的随机变量的数学期望〔总体平均数〕和方差相等,都等于常数λ,即:μ=σ2=λ。判断一个随机现象是否符合泊松分布,就可以根据这一特征判断。第四章几种常见的概率分布

二、离散型随机变量的概率分布

4.泊松分布(Poissondistribution)

4.5泊松分布的重要特征和判断

例:检测饮用水的污染状况,即每毫升自来水中的细菌数,每次取1ml涂于1个平板上,共做了400个平板,结果如下表,判断每毫升自来水中细菌数是否符合泊松分布。细菌数/ml水012≥3合计次数(平板数)243120316400解:计算得:每毫升水中平均细菌数

〔第4组是开口组,组值取3〕,方差S2=0.496。两者很接近,故可认为每毫升水中细菌数服从波松分布。第四章几种常见的概率分布

二、离散型随机变量的概率分布

4.泊松分布(Poissondistribution)

4.5泊松分布的重要特征和判断

解:μ==0.500≈0.496

计算:P(0)==0.6065;P(1)==0.3033;

P(2)==0.0758;

=0.0144;验证:P(0)==0.6075;P(1)==0.3000;=0.0775;P(≥3)==0.0150;P(2)=用泊松分布计算细菌数分布的概率与实际频率非常一致。第四章几种常见的概率分布

二、离散型随机变量的概率分布

5.超几何分布超几何分布适用于屡次完全相同并且相互独立的重复试验,如果在有限总体中不重复抽样,抽样成功的次数X的概率分布服从超几何分布。如:有某种产品N个,其中不合格产品M个,现用非放回式抽样抽取产品n个,求其中含有的次品个数为X的概率?超几何分布的概率分布函数:超几何分布的数学期望:μ==np,方差:σ2==第四章几种常见的概率分布

二、离散型随机变量的概率分布

5.超几何分布Excel中超几何分布计算程序:Hypgeomdist

P(X)=Hypgeomdist(x,n,M,N)

其中,N:总体中的个体数;M:两种类型中某种类型的个体数;n:非放回式抽样的次数;x:在n次非放回式抽样中抽出的某种类型的个体数第四章几种常见的概率分布

二、离散型随机变量的概率分布

5.超几何分布例:有灯具厂共生产了某种灯具1000件,灯具厂公布的次品率p=0.005,某商店批发了20件这种灯具,发现其中有1件是次品,问厂方公布的次品率是否属实?如果是2件次品呢?解:由题意得:N=1000,M=1000×0.005=5,n=20,X=1Hypgeomdist(1,20,5,1000)=0.0926>0.05结论:如果次品率是0.005,可能出现20件灯具内有1件次品的情况,厂方公布的次品率属实。Hypgeomdist(2,20,5,1000)=0.0036<0.05第四章几种常见的概率分布

二、离散型随机变量的概率分布

6.概率分布图形

上述众多的离散型变量的概率分布中,最重要,最常见的是二项分布和泊松分布,需要重点掌握。下面简单分析一下这两种分布的图形,以加深对他们的理解。第四章几种常见的概率分布

二、离散型随机变量的概率分布

6.概率分布图形

二项分布概率不同时的抽样分布可以看出,当p<0.5时,二项分布分布的图形正偏;当p>0.5时,二项分布分布的图形负偏。

第四章几种常见的概率分布

二、离散型随机变量的概率分布

6.概率分布图形

二项分布概率不同时的抽样分布当p=0.5时,图形对称第四章几种常见的概率分布

二、离散型随机变量的概率分布

6.概率分布图形

二项分布总体不同样本含量时(p=0.35)的抽样分布第四章几种常见的概率分布

二、离散型随机变量的概率分布

6.概率分布图形

当p≠0.5时,随着样本含量的增加,二项分布的偏态程度会逐渐降低而趋于对称。

第四章几种常见的概率分布

二、离散型随机变量的概率分布

6.概率分布图形

泊松分布总体平均数不同时的抽样分布图

第四章几种常见的概率分布

二、离散型随机变量的概率分布

6.概率分布图形

泊松分布总体平均数不同时的抽样分布图

可以看出,随着λ值的增大,泊松分布的偏态程度也逐渐降低而趋于对称。不管二项分布还是泊松分布,总是平均值µ处的概率密度函数最大。a

µbX第四章几种常见的概率分布

三、连续型随机变量的概率分布

随机变量X的概率密度函数设为f(x),f(x)就是以下图的纵坐标,那么X取值在区间[a,b]上的概率就是以下图中阴影局部的面积,其表达式为:连续型变量概率分布函数图例第四章几种常见的概率分布

三、连续型随机变量的概率分布

连续型随机变量概率分布还具有如下性质:〔1〕分布密度函数总是大于或等于0,即f(x)≥0。〔2〕当随机变量X取某一特定值时,其概率等于0,即:所以,对于连续性随机变量,仅研究其在某一区间内取值的概率,而不讨论某一个值的概率。〔3〕在一次实验中,X的取值必在-∞<X<+∞范围内。第四章几种常见的概率分布

三、连续型随机变量的概率分布

1.正态分布1.1正态分布的形成正态分布又称为高斯分布,它的概率分布图形的特征是大多数变量都集中在平均值附近,有平均值向两侧,变量逐渐减少且对称分布,以下图就是一个正态分布图形。正态分布密度曲线第四章几种常见的概率分布

三、连续型随机变量的概率分布

1.正态分布高粱“三尺三〞株高测定结果〔cm〕155153159155150159157159151152159158153153144156150157160150150150160156160155160151157155159161156141156145156153158161157149153153155162154152162155161159161156162151152154157162158155153151157156153147158155148163156163154158152163158154164155156158164148164154157165158166154154157167157159170158第四章几种常见的概率分布

三、连续型随机变量的概率分布

1.正态分布高粱株高的频率分布图第四章几种常见的概率分布

三、连续型随机变量的概率分布

1.正态分布1.2正态分布的密度函数正态分布的密度函数为:式中:f(x)表示纵坐标的高度,横坐标x为每一个试验结果或观测值。μ为总体平均数;σ为总体标准差;e为自然对数底=2.71828183第四章几种常见的概率分布

三、连续型随机变量的概率分布

1.正态分布1.3正态曲线及其意义

〔1〕正态曲线有一个最顶峰,最顶峰对应的横坐标为总体平均值X=μ,以直线X=μ为中心,两侧对称下降呈“钟形〞。〔2〕总体标准差σ越小,曲线越陡,数据越集中〔见以下图〕。〔3〕曲线下的总面积为1,曲线下任意区间(a,b)之间的面积即为随机变量X落入区间(a,b)的概率。〔4〕正态分布的表示方法N(μ,σ2),第四章几种常见的概率分布

三、连续型随机变量的概率分布

1.正态分布1.3正态曲线及其意义

平均值μ相同、标准差σ不同标准正态分布图第四章几种常见的概率分布

三、连续型随机变量的概率分布

1.正态分布1.3正态曲线的标准化图中:A是数学成绩,B是英语成绩,C是语文成绩,三门课程的正态曲线不同,不利于统计分析和比较。如某个同学英语、语文与数学成绩分别为70、60、80分,哪门课好呢?CAf(x)B语文(A)、数学(B)、英语(C)三门课成绩的正态分布图第四章几种常见的概率分布

三、连续型随机变量的概率分布

1.正态分布1.3正态曲线的标准化

所有随机变量X必须经过标准化,使其变为不带任何单位的纯数,标准化后得到的数值u符合标准正态分布。标准化公式为:这里µ和σ是为变量X数学期望和标准差

每一个试验结果Xi,减去所有Xi的平均值µ,然后再除以Xi的标准差σ,就会得到一个ui值。第四章几种常见的概率分布

三、连续型随机变量的概率分布

1.正态分布1.3正态曲线的标准化每一个随机变量标准化后对应一个u值,以标准化的随机变量u为横坐标,以φ(u)为纵坐标,得到的正态分布图就是标准正态分布。φ(u)为u值对应的密度函数:与相对应,

任何变量标准化后,把所有的u作为一个随机变量,做成一个正态分布图,都会得到一个完全一样的标准正态分布图。第四章几种常见的概率分布

三、连续型随机变量的概率分布

1.正态分布1.3正态曲线的标准化因为所有的u的平均值μu=0;标准差σu=1

函数公式可以简化为:φ(u)表示纵坐标的高度第四章几种常见的概率分布

三、连续型随机变量的概率分布

1.正态分布1.3正态曲线的标准化µ

X

f(X)F(X)0

uφ(u)Ф(u)正态分布图和标准正态分布图图中F(X)和Φ(u)是累积函数,表示曲线下,X、u左边的面积。第四章几种常见的概率分布

三、连续型随机变量的概率分布

1.正态分布1.3正态曲线的标准化标准正态分布的特征如下:①任何随机变量标准化后:μ=0,σ=1,γ1=0,γ2=0,那么标准正态分布可记为N(0,1)。②u=0时纵坐标最高,是标准正态分布的对称轴,远离u=0,φ(u)都减小。③曲线两侧对称,φ(u)=φ(-u),即对称部位纵坐标高度相同。④曲线和横坐标所夹的面积等于1。⑤标准正态曲线的累积分布函数Φ(u)是标准正态曲线下从-∞到u所夹的面积,表示随机变量U落入区间〔-∞,u〕的概率。第四章几种常见的概率分布

三、连续型随机变量的概率分布

1.正态分布1.4正态分布表的应用随机变量的值,落在某区间[a,b]的概率,可以从标准正态分布累积函数Φ(u)的数值表〔附表2〕中查出。对于一般的正态分布,需要先将变量值标准化再查表。标准化的随机变量U落在某一区间的概率的计算关系式如下:P(U<u)=Φ(u)

如:P(U<2)=Φ(u)P(0<U<u)=Φ(u)-0.5

如:P(0<U<2)=Φ(2)-0.5P(U>u)=Φ(-u)=1-Φ(u)

如:P(U>2)=Φ(2)=1-Φ(-2)P(׀U׀>u)=2Φ(-u)

如:P(׀U׀>2)=2Φ(-2)P(׀U׀<u)=1-2Φ(-u)

如:P(׀U׀<2)=1-2Φ(-2)P(u1<U<u2)=Φ(u2)-Φ(u1)

如:P(-1<U<2)=Φ(2)-Φ(-1)第四章几种常见的概率分布

三、连续型随机变量的概率分布

1.正态分布1.4正态分布表的应用例:高梁品种“三尺三〞的株高X服从正态分布N〔156.14,4.802〕。求:①X<161厘米的概率。解:P(X<161)=Φ()=Φ(1)=0.8413②X>164厘米的概率:P(X>164)=1-Φ()=1-Φ(1.62)=1-0.9474=0.0526③X在152~162厘米之间的概率:P(152<X<162)=Φ()-Φ()=Φ(1.20)-Φ(-0.87)=0.8849-0.1922=0.6928第四章几种常见的概率分布

三、连续型随机变量的概率分布

1.正态分布1.5正态分布表的Excel运算函数〔1〕P=Normdist(X,μ,σ,trueorfalse)计算给定平均值和标准差的正态分布的累积函数。True表示向上累积函数,即Φ(u);False表示概率密度函数,即标准生态分布的纵坐标φ(u)。P(X<161)=Φ()=Normdist(161,156.14,4.8,true)=0.8413

第四章几种常见的概率分布

三、连续型随机变量的概率分布

1.正态分布1.5正态分布表的Excel运算函数〔2〕X=Norminv〔p,μ,σ〕计算给定平均值和标准差的正态分布的累积函数的逆函数。如求符合实验要求的最大值和最小值,如果显著性水平为0.05,那么Xmin=Norminv〔0.05,156.14,4.8〕=148.3;Xmax=Norminv〔0.95,156.14,4.8〕=164.1;〔3〕Φ(u)=Normsdist〔u〕计算标准正态分布的累积函数。〔4〕u=Normsinv〔p〕计算标准正态分布的累积函数的逆函数。第四章几种常见的概率分布

三、连续型随机变量的概率分布

1.正态分布1.6正态分布的单侧和双侧分位数每个标准化u值在正态分布表中〔见附表2〕对应一个值,记为α,表示从-∞到u所夹的面积,表示随机变量U落入区间〔-∞,u〕的概率。同样每个α值也对应一个u值〔见附表3〕,记为uα。统计学中,小概率事件的α临界值一般取0.05,u0.05=1.645,用概率表示为:P(u>1.645)=0.05。1.645位于正态分布曲线的右侧尾区,称为α的上侧分位数。-u0.05=-1.645对于左侧尾区,P(u<-1.645)=0.05,用概率表示为:P(u<-1.645)=0.05。称为α的下侧分位数。P(׀u׀>)=P(׀u׀>u0.025)=1.96,u0.025=±1.96称为双侧分位数。第四章几种常见的概率分布

三、连续型随机变量的概率分布

1.正态分布1.6正态分布的单侧和双侧分位数0.05-u0.0500.050u0.05下侧分位数

上侧分位数

标准正态分布的分位数第四章几种常见的概率分布

三、连续型随机变量的概率分布

1.正态分布1.6正态分布的单侧和双侧分位数0.025-u0.0250u0.0250.025双侧分位数第四章几种常见的概率分布

三、连续型随机变量的概率分布

1.正态分布1.7正态分布的应用估计参考值范围质量控制服从正态分布的变量落在μ±2σ及μ±3σ的概率为95%和99%,在试验中,为了控制检测误差,常以x±2s作为上下警戒线,以x±3s作为上下控制线。

第四章几种常见的概率分布

三、连续型随机变量的概率分布

1.正态分布1.7正态分布的应用正态分布是很多统计方法的理论根底二项分布、泊松分布的极限均为正态分布,在一定条件下,均可按正态分布的原理来处理。后面的t检验,方差分析,相关回归分析等多种统计方法均要求分析的指标服从正态分布。对于非正态分布资料,实施统计处理的一个重要途径是先作变量的转换,使转换后的资料近似正态分布,然后按正态分布的方法作统计处理。第四章几种常见的概率分布

三、连续型随机变量的概率分布

2.其他几种连续型数据的概率分布2.1均匀分布随机变量X的取值在[a,b]中任一小区间的概率与该小区间的长度成正比,而与该小区间的具体位置无关。

均匀分布概率分布图均匀分布的平均值:;均匀分布的方差:

第四章几种常见的概率分布

三、连续型随机变量的概率分布

2.其他几种连续型数据的概率分布2.2指数分布指数分布常可作为“寿命〞分布的近似,如电子元件的寿命、动物的寿命、的通话时间等都常假定服从指数分布。概率密度函数φ(x)和累积分布函数F(X)分布图形见以下图。λ=0.5λ=1.0λ=1.5φ(x)λ=0.5λ=1.0λ=1.5F(x)第四章几种常见的概率分布

三、连续型随机变量的概率分布

2.其他几种连续型数据的概率分布2.2指数分布〔1〕指数分布的密度函数为:φ(x)=,是X对应的指数分布的纵坐标。〔2〕指数分布的累积分布函数:F(X)=1-,表示小于X的概率。;P(≥X)=〔3〕指数分布的平均值何标准差:λ为常数,这是指数分布的特征即:P(≤X)=1-第四章几种常见的概率分布

三、连续型随机变量的概率分布

2.其他几种连续型数据的概率分布2.2指数分布〔4〕Excel中指数分布程序Expondist(X,λ,trueoffalse)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论