




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
生物统计Biostatistics主讲李雪林单位种子科学与工程系时间2010年9月河南科技大学第四章
理论分布与抽样分布主要内容第一节概率的基础知识第二节二项分布第三节正态分布第四节抽样分布一、事件和概率(一)事件(event)随机试验的每一种可能结果。
必然事件-----对于一类事件来说,在同一组条件的实现之下必然要发生的,称为必然事件。用U表示,其概率为1。不可能事件
-----对于一类事件来说,在同一组条件的实现之下必然不发生的,称为不可能事件。用V表示,其概率为0。随机事件(randomevent)----在同一组条件下,每次试验可能出现也可能不出现的事件。随机事件的特点(1)试验可以在相同条件下多次重复进行;(2)试验的所有结果事先已知;(3)每次试验只出现这些可能结果中的一个,但不能预先断定出现哪个结果。尽管随机事件在一定的条件下,有多种可能的结果发生,事前人们不能预言将出现哪种结果;对一次或少数几次观察或试验而言,其结果呈现偶然性、不确定性。但在相同条件下进行大量重复试验时,其试验结果却呈现出某种固有的、特定的规律性——频率的稳定性,通常称之为随机事件的统计规律性。(二)概率(probability)某一事件在试验中出现的可能性大小的一种度量,称为该事件的概率。在相同条件下进行n次重复试验,如果随机事件A发生的次数为m,那么m/n称为随机事件A的频率(frequency);当重复试验的次数n逐渐增大时,随机事件A的频率越来越稳定地接近某一数值p,那么就把p称为随机事件A的概率。事件A的概率表示方法为P(A)。例如:抛掷一枚硬币发生正面朝上的频率试验结果试验的次数频率1.000.000.250.500.750255075100125调查株数(n)52550100200500100015002000受害株数(a)212153372177351525704棉株受害频率(a/n)0.400.480.300.330.360.3540.3510.3500.352在相同条件下盲蝽象在某棉田危害程度的调查结果从上面两个事例可以看出,随着实验次数的增多,硬币正面朝上和棉田受害株这两个事件发生的频率越来越稳定地接近0.5和0.35,我们就把0.5和0.35分布作为这两个事件的概率。在一般情况下,随机事件的概率p是不可能准确得到的。通常以试验次数n充分大时随机事件A的频率作为该随机事件概率的近似值。即P(A)=p≈m/n(n充分大),0≤P(A)≤1。12345678910随机抽取一个球,求下列事件的概率;(1)事件A=抽得一个编号<4(2)事件B=抽得一个编号是2的倍数该试验样本空间由10个等可能的基本事件构成,即n=10,而事件A所包含的基本事件有3个,即抽得编号为1、2、3中的任何一个,事件A便发生。P(A)=3/10=0.3P(B)=5/10=0.5概率基本概念12345678910A=“一次取一个球,取得红球的概率”10个球中取一个球,其可能结果有10个基本事件(即每个球被取到的可能性是相等的),即n=10事件A:取得红球,则A事件包含3个基本事件,即m=3P(A)=3/10=0.312345678910B=“一次取5个球,其中有2个红球的概率”10个球中任意取5个,其可能结果有C105个基本事件,即n=C105P(B)=C32C73/
C105=0.417概率基本概念0≤P(A)≤1
任何事件P(U)=1
必然事件P(V)=0
不可能事件0<P(A)<1
随机事件概率的基本性质概率基本概念概率与频率的关系频率与概率都是一个居于0和1之间的数。频率是相对于样本而言,而概率则是相对于总体而言。因此可以说概率是频率的理论值,频率是概率的估计值。频率分布是一种观察分布,而概率分布则是一种理论分布。(三)小概率原理若事件A发生的概率较小,如小于0.05或0.01,则认为事件A在一次试验中不太可能发生,这称为小概率事件实际不可能性原理,简称小概率原理。这里的0.05或0.01或0.001称为小概率标准,农业试验研究中通常使用这几个小概率标准。小概率原理是统计学上进行假设检验(显著性检验)的基本依据。二、事件间的关系(一)和事件事件A和B至少有一个发生而构成的新事件称为事件A和B的和事件,记为A+B,读作“或A发生,或B发生”。例如,有一批种子,包含有能发芽的和不能发芽的。若A为“取到能发芽种子”,B为“取到不能发芽种子”,则A+B为“或者取到能发芽种子或者取到不能发芽种子”。事件间的和事件可以推广到多个事件:事件A1、A2、…、An至少有一发生而构成的新事件称为事件A1、A2、…、An的和事件,记为A1+A2+…+An=和事件A+BAB(二)积事件
事件A和B同时发生所构成的新事件称为事件A和B的积事件,记作AB,读作“A和B同时发生或相继发生”。事件间的积事件也可以推广到多个事件:事件A1、A2、…、An同时发生所构成的新事件称为这n个事件的积事件,记作A1A2…An=积事件ABAB(三)互斥事件事件A和B不可能同时发生,即A·B为不可能事件,记作A·B=V,称事件A和B互斥或互不相容。例如,有一袋种子,按种皮分黄色和白色。每次取1粒,若记A为“取到黄色”,B为“取到白色”,显然A和B不可能同时发生,即一粒种子不可能既为黄色又为白色,说明事件A和B互斥。这一定义也可以推广到n个事件。事件A1、A2、…、An不可能同时发生所构成的新事件称为这n个事件互斥或互不相容,记作A1·A2…·An=V。如:打麻将掷一粒骰子,出现1(or2、3、4、5、6)后,其他点便不出现。(四)对立事件事件A和B不可能同时发生,但必发生其一,即A+B为必然事件(记为A+B=U),AB为不可能事件(记为A·B=V),则称事件B为事件A的对立事件,并记B为。例如,上面例子中A为“取到黄色”,B为“取到白色”,A与B不可能同时发生,但是,任意抽取一粒种子,其皮色不是黄色就是白色,即A和B必发生其一,因此,A和B互为对立事件。两个事件互斥,它们未必对立;反之,两个事件对立,它们一定互斥。如果事件A、B互斥,则P(AorB)=P(A)+P(B);若A、B是对立事件,则P(AorB)=P(A)+P(B)=1。(五)完全事件系若事件A1、A2、…、An两两互斥,且每次试验结果必发生其一,则称A1、A2、…、An为完全事件系。例如,仅有三类花色:黄色、白色和红色,则取一朵花,“取到黄色”、“取到白色”和“取到红色”就构成完全事件系。(六)事件的独立性
若事件A发生与否不影响事件B发生的可能性,则称事件A和事件B相互独立。例如,事件A为“花的颜色为黄色”,事件B为“产量高”,显然如果花的颜色与产量无关,则事件A与事件B相互独立。反之,如果花的颜色为黄色的都产量高,则事件A与事件B是非独立。三、计算事件概率的法则(一)互斥事件的加法假定两互斥事件A和B的概率分别为P(A)和P(B)。则事件A与B的和事件的概率等于事件A的概率与事件B的概率之和,即P(A+B)=P(A)+P(B)。加法定理对于多个两两互斥的事件也成立:假定A1、A2、…、Ann个事件彼此间均是两两互斥的事件,其概率依次为P(A1),P(A2),…,P(An),则A1,A2到An和事件的概率P(A1+A2+…+An)等于P(A1),P(A2),…,P(An)之和,即P(A1+A2+…+An)=P(A1)+P(A2)+…+P(An)。例如,一捆花中红、黄、白花的概率分别为0.2、0.3、0.5,那么我们随机抽取一朵非白色花的概率为0.5(=0.2+0.3),这只是由加法定理得到的两个事件概率之和。(二)独立事件的乘法假定P(A)和P(B)是两个独立事件A与B各自出现的概率,则事件A与B同时出现的概率等于两独立事件出现概率P(A)与P(B)的乘积,即P(AB)=P(A)P(B)。乘法定理对于n个相互独立的事件也成立。假定P(A1),P(A2),…,P(An)是n个相互独立事件各自出现的概率,则该n个事件同时出现的概率P(A1A2…An)等于各自出现概率之乘积,即P(A1A2…An)=P(A1)P(A2)…P(An)。现有4粒种子,其中3粒为黄色、1粒为白色,采用复置抽样。试求下列两事件的概率:(A)第一次抽到黄色、第二次抽到白色;(B)两次都抽到黄色。P(A)=P(第一次抽到黄色种子)P(第二次抽到白色种子)=0.25×0.75=0.1875,P(B)=P(第一次黄色种子)P(第二次黄色种子)=0.75×0.75=0.5625。(三)对立事件的概率
若事件A的概率为P(A),那么其对立事件的概率为:(四)完全事件系的概率完全事件系的概率为1。
例如“从10个数字中随机抽得任何一个数字都可以”这样一个事件是完全事件系,其概率为1。
(五)非独立事件的乘法
如果事件A和B是非独立的,那么事件A与B同时发生的概率为事件A的概率P(A)乘以事件A发生的情况下事件B发生的概率P(B|A),即:P(AB)=P(A)P(B|A)四、概率分布(probabilitydistribution)事件的概率表示了某一事件(试验结果)在一次试验中出现的可能性大小。若要全面了解试验,则必须知道试验的全部可能结果及各种可能结果发生的概率,即必须知道随机试验的概率分布。为了深入研究随机试验,我们先引入变量和随机变量(randomvariable)的概念。相同性质事物间表现差异性(特征)的数据(量)叫变量(变数)。能代表整个事物特征特性的数据叫常量(常数)。常数在一定过程中是不变的,如平均数,标准差。(一)随机变量(randomvariable)一次试验的结果的数值性描一般用X,Y,Z来表示,具体取值常用小写字母x、y、z来表示。例如:投掷两枚硬币出现正面的数量(
X=x=0,1,2)。随机变量离散型变量连续型变量离散型随机变量(discreterandomvariable)如果随机变量X的结果是明确的,并可一一列出,当X取某一值时,其概率是确定的,则称X为离散型随机变量。试验随机变量可能的取值抽查100个产品一家餐馆营业一天电脑公司一个月的销售销售一辆汽车取到次品的个数顾客数销售量顾客性别0,1,2,…,1000,1,2,…0,1,2,…男性为0,女性为1连续型随机变量(continuousrandomvariable)如果表示试验结果的变量X,其可能取值为某范围内的任何数值,且X在其取值范围内的任一区间中取值时,其概率是确定的,则称X为连续型随机变量。可以取一个或多个区间中任何值所有可能取值不可以逐个列举出来,而是取数轴上某一区间内的任意点试验随机变量可能的取值抽查一批电子元件新建一座住宅楼测量一个产品的长度称量一个苹果的果实重使用寿命(小时)半年后工程完成的百分比测量误差(cm)称量误差(g)X
00
X100X
030
X200(Ⅰ)离散型随机变量的概率分布离散型随机变量的概率分布列出离散型随机变量X的所有可能取值列出随机变量取这些值的概率通常用下面的表格来表示X=xix1,x2
,…
,xnP(X=xi)=pip1,p2
,…
,pnP(X=xi)=pi称为离散型随机变量的概率函数
;离散型随机变量的概率分布
(例题分析)【例】投掷一颗骰子后出现的点数是一个离散型随机变量。写出掷一枚骰子出现点数的概率分布
X=xi123456P(X=xi)
pi1/61/61/61/61/61/6概率分布离散型随机变量的概率分布
(例题分析)【例】一部电梯在一周内发生故障的次数X及相应的概率如下表故障次数X=xi0123概率P(X=xi)
pi0.100.250.35
一部电梯一周发生故障的次数及概率分布
确定
的值求正好发生两次故障的概率求故障次数不超过2次的概率至少发生两次故障的概率离散型随机变量的概率分布
(例题分析)解:(1)由于0.10+0.25+0.35+
=1
所以,
=0.30
(2)P(X=2)=0.35(3)P(X
2)=0.10+0.25+0.35=0.70(4)P(X
2)=0.35+0.30=0.65(Ⅱ)连续型随机变量的概率分布
定义:如果对于随机变量X的分布函数F(x),存在非负函数f(x),使得对于任意实数x有则称X为连续型随机变量,其中函数f(x)为X的概率密度函数(probabilitydensityfunction)。(Ⅱ)连续型随机变量的概率分布
连续型随机变量(如产量、株高)的概率分布不能用分布列来表示,因为其可能取的值是不可数的。我们改用随机变量X在某个区间内取值的概率P(a≤x<b)来表示。图3.1鲢鱼体长的频率分布图354045505560657075808590直方图中同一组内的频率是相等的。由表中作150尾鲢鱼体长资料的频率分布方柱形图,图中纵座标为组距范围内的频率。可以设想,如果样本取得越来越大(n→+∞),组分得越来越细(i→0),某一范围内的频率将趋近于一个稳定值----概率。这时,频率分布方柱形图各个直方上端中点的联线----频率分布折线将逐渐趋向于一条曲线。换句话说,当n→+∞、i→0时,频率分布折线的极限是一条稳定的函数曲线。对于连续型随机变量的情况,这条函数曲线将是光滑的。这条曲线完全反映了鲢鱼体长的变动规律。这条曲线叫连续性随机变量的概率分布密度曲线,相应的函数叫概率分布密度函数设鲢鱼体长概率分布密度函数为f(x),当x取值于区间(a,b)时的概率为图中阴影部分的面积,即f(x)xab概率是曲线下的面积注意:
f(x)不是概率,密度函数f(x)表示X的所有取值x
及其频数f(x)。
x值(x值,频数)频数f(x)abx分布函数
(distributionfunction)1.连续型随机变量的概率可以用分布函数F(x)来表示,表示随机变量X的值小于x的概率。2.分布函数定义为根据分布函数,P(a<X<b)可以写为分布函数与密度函数的图示密度函数曲线下的面积等于1,表示瞬时幅值落在某指定范围内的概率。分布函数是曲线下小于x0
的面积,如果将X看成是数轴上的随机点的坐标,那么分布函数F(x)在x处的函数值就表示X落在区间(-∞,x]上的概率。。f(x)xx0F(x0
)f(x)abx毒性试验:白鼠死亡——生存临床试验:病人治愈——未愈临床化验:血清阳性——阴性事件成功(A)——失败(非A)这类“成功─失败型”试验称为Bernoulli试验。生活中贝努里试验因此,称P(X)为随机变量X的二项分布,记作X~B(n,p),也叫贝努里分布。试验的对象只有两种结果,事件A和
。事件A的概率是p,事件
的概率是q。而且p+q=1事件A和
是可以计数的。从二项总体中连续抽取n个个体,将结果是A的次数记为X。以x表示事件A在n个个体中出现的次数,则X是一个离散型随机变量。它的所有可能取值为0,1,2,…,n,其概率分布函数为完全事件系对于P(X=x)0,x=1,2,…,n,有同样当
n=1时,二项分布化简为二项分布二项分布的特征(1)每个观察单位只有两个对立结果。(2)若其中一个结果的概率为p,则其对立结果的概率为q=1-p。
(3)n个观察单位的观察结果是互相独立的,即每个观察单位的观察结果不会影响到其它观察单位的观察结果。二、二项分布的概率计算【例题1】豌豆红花与白花杂交,根据孟德尔遗传理论,F2代中红花与白花的比率为3∶1。若一次随机观察12株,有7株红花的概率是多少?若连续观察50次,有7株红花的理论上会有几次?解:n=12,p=3/4=0.75(红花),q=1/4=0.25(白花)。设12株豌豆中红花的株数以xi表示,则X为服从二项分布B(12,0.75)的随机变量。于是12株豌豆中有7株是红花的概率为:P(7)=C127.p7.q5=792×0.757×0.255=0.1032若观察50次(N),出现7株红花的理论次数为理论次数=N×P(7)=50×0.1032=5.16(次)【例题2】某小麦品种在田间出现自然变异植株的概率为0.0045,试计算:观察100株,获得两株或两株以上变异植株的概率是多少?期望有0.99的概率获得1株或1株以上的变异植株,至少应观察多少株?解:已知变异株概率p=0.0045;非变异株的概率q=1-p=0.9955;(1)当n=100,获得0个变异株概率,x=0,P(0)=0.6370
获得1个变异株概率,x=1,P(1)=0.2879
获得2株或以上变异株概率为:x≥2,P(X=x≥2)=1-P(0)-P(1)
=0.0751(2)如果期望调查n株中至少有1株是变异株的概率是0.99,即P(X=x≥2)=0.99。则获得非变异株的概率:
P(0)=1-0.99=0.01,即:x=0,P(0)=Cn0.p0.qn=0.01;因此:三、二项分布的形状和参数1.二项分布的形状由n和p两个参数决定(1)当p值较小且n值不大时图形是偏畸的。随着n值的增大,分布逐渐趋于对称。(2)当p值趋于0.5时,分布趋于对称。2、二项分布的参数若随机变量(次数X
)服从二项分布B(n,p),则该二项次数分布的平均数μx、标准差σx与参数n、p有如下关系:二项总体百分数分布的参数由于二项分布中变量X(次数)除以样本容量n,可以得到二项总体的百分数(成数)p分布。次数分布与百分数分布在同一坐标系中对比二项总体百分数分布的参数其平均数和标准差分别为:四、泊松分布1、泊松分布的意义在生物学研究中,当许多事件出现的概率很小,而样本的容量或试验次数却往往很大。即有很小的p值和很大的n值时,二项分布就变成了一种特殊的分布——泊松分布(Poissondistribution)。λ为参数,λ=np,x=0,1,2,…,∞。称x服从参数为λ的泊松分布,记为x~P(λ)泊松分布的平均数和方差、标准差为:2、泊松分布的特征数μ=σ2=λ是泊松分布的重要特征二项分布中,一般当P<0.1和np≤5时,可用泊松分布来近似计算。【例题】调查某个种猪场育种猪群仔猪畸形数,共记录200窝,畸形仔猪数的分布情况如下表所示。试判断畸形仔猪数是否服从泊松分布。表畸形仔猪数统计分布解:样本均数和方差S2计算结果如下:因为平均数和方差是相当接近的,因此可以认为畸形仔猪数服从波松分布。3、泊松分布的概率计算由上式可知,泊松分布的概率计算,依赖于参数λ的确定。但是在大多数服从泊松分布的实例中,分布参数λ往往是未知的,只能从所观察的随机样本中计算出相应的样本平均数作为λ的估计值。进而计算出x=0,1,2,…时的各事件概率由C.F.高斯(CarlFriedrichGauss,1777—1855)作为描述误差相对频数分布的模型而提出描述连续型随机变量的最重要的分布许多现象都可以由正态分布来描述可用于近似离散型随机变量的分布例如:二项分布经典统计推断的基础正态分布
(normaldistribution)xf(x)一、正态分布的定义及其特征(一)正态分布的定义若连续型随机变量x的概率分布密度函数则称随机变量x服从正态分布(normaldistribution),记为X~N(μ,σ2)。f(x)=随机变量X的频数
=正态随机变量X的均值
=正态随机变量X的方差
=3.1415926;e=2.71828x=随机变量的取值(-
<x<
)正态分布的概率概率是曲线下的面积!abxf(x)(二)正态分布的特征1、正态分布密度曲线是单峰、对称的悬钟形曲线,对称轴为x=μ;2、f(x)在x=μ处达到极大,极大值为;3、曲线在x=μ±σ处各有一个拐点,即曲线在(-∞,μ-σ)和(μ+σ,+∞)区间上是下凹的,在[μ-σ,μ+σ]区间内是上凸的;f(x)是非负函数,以x轴为渐近线,分布从-∞至+∞。4、正态分布有两个参数即平均数μ和标准差σ,两者确定其形状。5、分布密度曲线与横轴所夹的面积为1,即:二、标准正态分布由上述正态分布的特征可知,正态分布是依赖于参数μ和σ2(或σ)的一簇曲线,正态曲线的位置及形态随μ和σ2的不同而不同。这就给研究具体的正态总体带来困难,需将一般的N(μ,σ2)转换为μ=0,σ2=1的正态分布。因此,称μ=0,σ2=1的正态分布为标准正态分布(standardnormaldistribution)。标准正态分布的概率密度函数记作f(u)
:随机变量u服从标准正态分布,记作u~N(0,1),分布密度曲线如下图。对于任何一个服从正态分布N(μ,σ2)的随机变量x,都可以通过标准化变换:将其变换为服从标准正态分布N(0,1)的随机变量u,u称为标准正态变量或标准正态离差(standardnormaldeviate)。标准正态分布Xms一般正态分布
=1Z标准正态分布
标准正态分布上的α分位点设随机变量X~N(0,1),其概率密度函数为f(x)。对于给定的数α:0<α<1,称满足条件:P(X>uα)=的数uα为标准正态分布上的α分位点,其几何意义如图所示:对于给定的α,uα的值这样求得:由三、正态分布的概率计算(一)标准正态分布的概率计算在连续性随机变数中,不能够计算某一定值的概率,只能计求某一区间或范围的概率。在标准正态分布曲线下,变量u在[a,b]区间的概率可用曲线下区间的面积来表示。区间概率的可用下式表示P(a≤u<b)正态分布曲线下-∝到u的面积,可以通过定积分得出,即:F(ui)称为标准正态分布的累积函数。它是变量u小于某一定值ui的概率。因此,正态分布任一区间的概率可以如下式计算:由于标准正态分布的概率累积函数具有广泛的应用,所以,统计学家已计算好实际需要的各个F(ui)值,列于附表2。学习查表例如,u=1.75,累计概率F(1.75)是多少?查附表1,从第一列中找到1.7,在第一行中找到0.05。行与列相交处的数值0.95994,所以F(1.75)=0.95994例如:
F(u)=0.284,u值是多少?
这只要在附表1中找到与0.284最接近的值0.2843,对应行的第一列数-0.5,对应列的第一行数值0.07
即相应的为u=-0.57根据正态分布的对称性可推出下列关系式,再借助附表2,便能很方便地计算有关概率:关于标准正态分布,以下几种概率经常用到:P(-1≤u≤1)=0.6826P(-2≤u≤2)=0.9545P(-3≤u≤3)=0.9973P(-1.96≤u≤1.96)=0.95P(-2.58≤u≤2.58)=0.99u变量在上述区间以外取值的概率分别为:P(|u|≥1)=2F(-1)=1-P(-1≤u<1)=1-0.6826=0.3174P(|u|≥2)=2F(-2)=1-P(-2≤u<2)
=1-0.9545=0.0455P(|u|≥3)=1-0.9973=0.0027P(|u|≥1.96)=1-0.95=0.05P(|u|≥2.58)=1-0.99=0.01
从上述计算可知,虽然正态分布u的取值区间为(一∝,十∝),但实际上|u|>2.58的概率只有0.01,|u|>1.96的概率也只有0.05。即:在u±1.96和u±2.58范围内已分别包含了95%和99%的变量值。(二)标准正态分布的两尾概率和单尾概率以上在计算P(|u|≥1)和P(|u|≥2.58)等概率时,均为两尾概率值,即左尾概率和右尾概率之和。由于两尾概率值经常使用,为减少计算的麻烦,在附表3列出了两尾概率为某一值时的uα临界值,即正态离差u值表,可直接查用。例如可查得:两尾概率P=0.05时,uα
=1.959964;两尾概率P=0.01时,
uα=2.575829。标准正态分布单侧概率u值的查法如何查右尾P=0.05的uα临界值。可查表2,
uα=?
1.644854单尾概率对应的u值等于2倍双尾概率对应的u值如何查左尾P=0.05的临界值?
uα=?-1.644854右尾概率的u值为正,左尾概率的u值为负(三)一般正态分布的概率计算一般正态分布N(μ,σ2)的随机变量x,都可以通过标准化变换:将其转换为标准正态分布N(0,1)。因此,一般正态分布N(μ,σ2)的随机变量x在[x1
,x2]内取值的概率,等于服从标准正态分布N(0,1)的随机变量u在[(x1-μ)/σ,(x2-μ)/σ]内取值的概率。计算一般正态分布的概率时,只要将区间的上下限作适当变换(标准化),就可用查标准正态分布的概率表的方法求得概率了。[例题]设x服从μ=30.26,σ2=5.102的正态分布,试求P(21.64≤x<32.98)。则u服从标准正态分布,故首先X
=21.64
=5.10一般正态分布32.98
=1u标准正态分布
-1.690.530.6564【例题】随机抽取100株某植物做为样本,其株高(cm)分别为82,79,85,……,82,80。其样本平均数为82.3cm,标准差为1.7502。试求株高≥85cm概率。解:假设该植物株高服从正态分布。由于总体平均数μ和总体标准差σ未知,我们用样本平均数和样本标准差s来估计μ和σ。关于一般正态分布,以下几个概率(即随机变量x落在μ加减不同倍数σ区间的概率)是经常用到的。P(μ-σ≤x<μ+σ)=0.6826P(μ-2σ≤x<μ+2σ)=0.9545P(μ-3σ≤x<μ+3σ)=0.9973P(μ-1.96σ≤x<μ+1.96σ)=0.95P(μ-2.58σ≤x<μ+2.58σ)=0.99曲线下面积分布规律0-11-1.961.96-2.582.5868.27%95.00%99.00%μμ-σμ+σμ-1.96σμ+1.96σμ-2.58σμ+2.58σ68.27%95.00%99.00%
二项分布、泊松分布、正态分布间的关系
对于二项分布,在p→0,n→∞且np=λ(较小常数)情况下,二项分布趋于波松布。在这种场合,波松分布中的参数λ用二项分布的np代之;在p→0.5,n→∞时,二项分布趋于正态分布。在这种场合,正态分布中的μ、σ2用二项分布的np、npq代之。在实际计算中,当p<0.1且np<5时,二项分布可由波松分布近似;当p>0.1且n很大时,二项分布可由正态分布近似。
研究总体和从中抽取的样本之间的关系是统计学的中心内容。对这种关系的研究可从两方面着手,一是从总体到样本,这就是研究抽样分布(samplingdistribution)的问题;二是从样本到总体,这就是统计推断(statisticalinference)问题。一、抽样分布的概念从总体中抽取一个样本量为n的随机样本,我们可以计算出统计量的一个值。如果从总体中重复抽取样本量为n的样本,就可以得到统计量的多个值。统计量的抽样分布就是这一统计量所有可能值的概率分布。抽样分布是统计量的分布而不是总体或样本的分布。在统计推断中总体的分布一般是未知的,不可观测的(常常被假设为正态分布)。样本数据的统计分布是可以直接观测的,最直观的方式是直方图,可以用来对总体分布进行检验。抽样分布一般利用概率统计的理论推导得出,在应用中也是不能直接观测的。其形状和参数可能完全不同于总体或样本数据的分布。抽样分布的几个要点(一)抽样的方法抽样的方法有复置抽样和不复置抽样两种。复置抽样指每次抽出一个个体后,这个个体应返回原总体。不复置抽样指每次抽出的个体不再返回原总体。对于无限总体,复置与否都可保证各个体被抽到的机会仍会相等。对于有限总体,就应该采取复置抽样,否则各个体被抽到的机会就不相等。从理论上讲,若能从一个总体中抽取所有可能的样本,就能获得有关统计量变异的全部信息。
设总体的容量为N,每个样本的容量为n,则所有可能的样本数为:Nn(二)研究抽样分布的方法直接法,即抽样试验数理推导法后面我们以一个很小的有限总体为例,采用抽样试验的方法,研究样本统计量与原总体参数的关系。二、样本统计量的分布由于从总体中抽出的每一个样本,都可以计算出一个平均数,每个随机样本的平均数可能会有差异,所有可能的样本平均数就构成一个新的总体。所以样本
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 城市公共设施应急维修措施
- 医院除颤仪操作培训计划
- 2025年高精度数字电流表项目合作计划书
- 学校消防安全管理人职责概述
- 家庭厨师长的岗位职责与技能
- 一年级下册《道德与法治》家校合作计划
- 幼儿园创意手工年度计划
- 演出项目的创意策划与实施效果评估考核试卷
- 商会活动场所竣工后管理措施
- 新湘教版七年级上册数学课程评估计划
- 2025年安徽财贸职业学院单招综合素质考试题库新版
- 2025年安徽电气工程职业技术学院单招综合素质考试题库及答案参考
- 2025年乌兰察布职业学院单招职业倾向性测试题库及答案1套
- 2025年河南工业和信息化职业学院单招职业技能测试题库参考答案
- 2025年吉林铁道职业技术学院单招职业技能测试题库及参考答案
- 2025年春统编版七年级语文下册 第三单元 阅读综合实践(公开课一等奖创新教案+)
- 掐丝珐琅培训
- 教育数字化转型背景下高职院校工程造价专业人才培养模式的创新路径
- 2025年春新冀教版英语三年级下册课件 U3L4
- 人生下半场-(美)鲍伯·班福德著杨曼如译
- 高中家长会 高二文科班下学期家长会课件
评论
0/150
提交评论