数理统计的基础知识_第1页
数理统计的基础知识_第2页
数理统计的基础知识_第3页
数理统计的基础知识_第4页
数理统计的基础知识_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章 数理统计的基础知识在前四章的概率论部分中,我们讨论了概率论的基本概念、思想和方法。知道随机变量的统计规律性是通过随机变量的概率分布来全面描述的。在概率论的许多问题中,概率分布通常是已知的或假设为已知的,在这一前提下我们去研究它的性质、特点和规律性,即讨论我们关心的某些概率、数字特征的计算以及对某些问题的判断、推理等。但在许多实际问题中,所涉及到的某个随机变量服从什么分布我们可能完全不知道,或有时我们能够根据某些事实推断出分布的类型,但却不知道其分布函数中的某些参数。例如: 1 、某种电子元件的寿命服从什么分布是完全不知道的。2、 检测一批灯泡是否合格,则每个灯泡可能合格,也可能不合格,

2、则服从 ( 0-1)分布,但其中的参数p 未知。对这类问题要深入研究,就必须知道与之相应的分布或分布中的参数。数理统计要解决的首要问题就是:确定一个随机变量的分布或分布中的参数。数理统计学是研究随机现象规律性的一门学科,它以概率论为理论基础,研究如何以有效的方式收集、整理和分析受到随机因素影响的数据,并对所考察的问题作出推理和预测,直至为采取某种决策提供依据和建议。数理统计研究的内容非常广泛,可分为两大类:一是:怎样有效地收集、整理有限的数据资料。二是: 怎样对所得的数据资料进行分析和研究,从而对所考察对象的某些性质作出尽可能精确可靠的判断 本书中参数估计和假设检验。第一节数理统计的基本概念一

3、、总体与总体的分布在数理统计中,我们将研究对象的全体称为总体 或 母体 , 而把组成总体的每个元素称为个体 。 总体中所包含的个体的个数称为总体的容量. 容量为有限的总体称为有限总体; 容量为无限的总体称为无限总体. 总体和个体之间的关系就是集合与元素之间的关系.在实际问题中,研究对象往往是很具体的事物或现象,而我们所关心的不是每一个个体的种种具体的特征,而是其中某项或某几项数量指标,记为X 。例如:研究一批灯泡的平均寿命时,该批灯泡的全体构成了研究的总体,其中每个灯泡就是个体。但在实际问题中,我们仅仅关心灯泡的使用寿命(记 X 表示该批灯泡的寿命)。 则 X 就是我们研究的总体(所有灯泡寿命

4、的集合),每一个灯泡的寿命就是一个个体。再如:考查某一群体的身高和体重,则全体人员的(身高、体重)是总体,每个人的身高和体重是个体。由此给出定义:总体: 对所研究对象的某些指标进行试验,将试验的全部可能的观测值称为总体记为X。个体:每一个可能的观测值称为个体。对不同的个体,X 的取值一般是不同的。例如在试验中观察若干个个体就会得到X 的一种数值,但在试验或观察之前,无法确定会得到一组什么样的数值,所以X 是一个随机变量或随机向量,而X 的分布也就完全描述了我们所关心的指标,即总体的分布。为方便起见,以后我们将X 的可能取值的全体组成的集合称为总体,或直接称随机变量 X 为总体 , X 的分布也

5、就是总体的分布。例如:正态总体:是指表示总体某个数量指标的随机变量服从正态分布。1 】 总体的分布一般情况下是未知的,这就需要利用总体中部分个体的数据资料来对总体服从的分布进行检验这是分布拟合检验(非参数检验)问题;有时即使知道总体所服从的分布,但分布中的参数未知,这也需利用利用总体中部分个体的数据资料来对总体服从的分布中的未知参数进行统计推断(参数估计)。而这就需要从总体中抽取若干个体进行观察,从中获得研究总体的一些观察数据,然后通过这些数据的统计分析,对总体的分布进行判断或对总体的参数做出合理的估计。而一般的方法是按照一定的原则从总体中抽取若干个体进行观察,这个过程称为随机抽样。二、样本与

6、样本的分布由于每个个体的观察结果具有随机性,因此可以将第i次抽取的个体记为 Xi,则为随机变量,为此引入以下概念。1、 样本: 从一个总体X 中, 随机的抽出n 个个体X1,X2,L , Xn , 通常记为(X1 , X2, , Xn)这样取得的X1 ,X2 ,L , X n 称为总体X 的一个样本。样本所含的个体数目称为样本容量.【注2】:(1)由于每个Xi都是从总体X中随机抽出的,因此是一个随机变量,而样本(Xi,X2, ,Xn)就是n维的随机向量。(2)在依次取n个个体Xi,X2,L ,Xn观测完毕后,得到n个具体的数据(为必,4),称为样本(X1, X2, ,Xn) 的观测值样本值 。

7、因此样本本身是随机向量,而一经抽取就是一组确定的数值,这就是所谓的样本两重性。2、简单随机样本我们的目的是根据从总体中抽取的一个样本值(x1, x2, ,xn )对总体X 的分布或某些特征进行各种分析推断,所以要求抽取的样本能很好地反映总体的特性,为此我们要求随机抽取的样本(X1, X2, , Xn) 满足:( 1) 具有代表性。即样本的每个分量Xi 与总体X 有相同的分布;( 2) 具有独立性。即X1, X2,L ,Xn 是相互独立的随机变量,也就是说,n 次观察值之间是互相独立的;满足上述两条的样本称为简单随机样本, 今后如无特别说明,所说的样本均指简单随机样本。在实际问题中,抽取简单随机

8、样本的方法很简单:(1)放回抽样;(2)不放回抽样:有限总体,当样本容量远小于总体容量时,不放回近似代替放回;无限总体,总是用不放回抽样.综合上述,给出明确的数学概念:定义一:一个随机变量X或其相应的分布函数(分布律、密度函数)称为一个总体。定义二:若随机向量 X1,X2,L ,Xn是相互独立的随机变量且每个分量Xi与总体X有相同的分布,则称X1 , X2 ,L , X n 是来自总体的容量为n 的简单随机样本。简单随机样本的分布有如下性质:设总体 X 的分布函数为F(x) (称为总体分布函数), 或密度函数f (x) 或分布律 (称为总体概率密度),则来自总体的样本(X1, X2, , Xn

9、) 的n联合分布函数:F (x1, x2.xn)F(xi) ,称为样本分布函数i1n联合密度函数:f(x1,x2.xn)f (xi) ,称为连续样本密度函数i1n联合分布律:P(Xi,X2,L Xn) P(Xi Xi,X2 X2Xn ) P(X %),称为离散 i1样本密度【例1】 总体 X 服从参数为p 的( 0-1 )分布,PX 1 p, PX 0 1 p ,求(Xi,X2, ,Xn)的分布。【解】由题意 X的分布律为PX x pX(1 p)1 x,(x 0,1),设 (X1, X2,L , Xn) 为来自X 的简单随机样本值,则(X1, X2, , Xn) 的联合概率分布为nnnXin

10、Xip(X1,X2,LXn)P(X1X1, X2X2.XnXn)pXi(1 p)1Xipi1 (1 p) i1i1【例2】总体X服从N( , 2),求样本(Xi,X2, ,Xn)的联合密度函数.【解】设(Xi,X2,L ,Xn)为来自X的简单随机样本值,则(Xi,X2, ,Xn)的联合概率分布为11 Xi21n12f(Xi,X2,L ,Xn)-exp () () exp (x) i 1 22, 22 i 1三、统计推断问题简述总体和样本是数理统计中的两个基本概念.样本来自总体,自然带有总体的信息,从而可以从这些信息出发去研究总体的某些特征(分布或分布中的参数).另一方面,由样本研究总体可以省时

11、省力(特别是针对破坏性的抽样试验而言).我们称通过总体X的一个样本”,X2, ,Xn对总体X的分布进行推断的问题为 统计推断问题.总体、样本、样本值的关系:总体/ 、推断(个体)样本一样本值抽样在实际应用中,总体的分布一般是未知的,或虽然知道总体分布所属的类型,但其中包含着未知参数.统计推断就是利用样本值对总体的分布类型、未知参数进行估计和推断.通过观察或试验得到的样本值,一般是杂乱无章的,例如:例1样本的一些例子与观察值的表示方法:(1)某食品厂用自动装罐机生产净重为345克的午餐肉罐头,由于随机性,每个罐头的净重都有差别.现在从生产线上随机抽取10个罐头,秤其净重,得如下结果:344 33

12、6 345 342 340 338 344 343 344 343这是一个容量为10的样本的观察值,它是来自该生产线罐头净重这一总体的一个样本的观察值.(2)对363个零售商店调查周售额(单位:元)的结果如下:零售额 1000 (1000,5000 (5000,10000 (10000,20000 (20000,30000商店数 611351W42?5-这是一个容量为363的样本的观察值,对应的总体是所有零售店的周零售额.不过这里没有给出每一个样本的具体的观察值,而是给出了样本观察值所在的区间,称为分组样本的观察值.这样一来当然会损失一些信息,但是在样本量较大时,这种经过整理的数据更能使人们对

13、总体有一个大致的印象.通过该例可以看出,以上的两种样本值的表示方法,虽然能够反应出总体的一些大致 的信息,但不够直观,判断不出总体服从什么分布。为了对总体的分布有一个大致的判断, 就需要对所获得的样本值进行整理,而分组数据统计表或频率直方图是两种常用整理方法四、分组数据统计表和频率直方图1 .分组数据表:若样本值较多时,可将其分成若干组,分组的区间长度一般取成相等 称区间的长度为组距.分组的组数应与样本容量相适应.分组太少,则难以反映出分布的特 征,若分组太多,则由于样本取值的随机性而使分布显得杂乱.因此,分组时,确定分组数(或组距)应以突出分布的特征并冲淡样本的随机波动性为原则.区间所含的样

14、本值个数称为该区间的 组频数.组频数与总的样本容量之比称为组频率.2 .频数直方图:设X1, X 2, ,X n是总体X的一个样本,又设总体具有概率密度f ,如何用样本来推断f ?注意到现在的样本是一组实数,因此,一个直观的办法是将实轴划分为若干小区间,记下诸观察值 Xi落在每个小区间中的个数,根据大数定律中频率近似概率的原理,从这些 个数来推断总体在每一小区间上的密度。具体做法如下:设X1, X2, ,Xn是样本的n个观察值.(i)求出X1,X2, ,Xn中的最小者X和最大者X(n);(ii)选取常数a (略小于x)和b (略大于x(n),并将区间a,b等分成m个小区间( 般取m使m在1左右

15、):n 10ti,tit),i1,2, ,m, t般情况下,小区间不包括右端点(iii)求出组频数n ,组频率色 nhi(iv)在ti,tit)上以h为高,fi ,以及fip(i 1,2, ,n)t为宽作小矩形,其面积恰为fi ,所有小矩形合在一起就构成了频率直方图频率直方图能够大体刻画总体的分布情况。实际上,我们就是用直方图对应的分段函数,、fjn(x) ,x (tj i,tj, j 1,2,L ,mti来近似总体的密度函数 f (x).这样做为什么合理?我们引进“随机变量”,对每个小区间 (tj 1,tj,定义YiIE 了卜 WE0,右 Xi (tj 1,tj则Y是独立同分布于两点分布:P

16、Y x px(1 p)1x,x 0或 1其中p PXi (tj 1,tj),由大数定律,我们有nj1 ntjfjj Xi EXi P PX (tj 1,tjf(x)dxL(n )nn j 1tj1以概率为1成立,于是当n充分大时,就可用fj来近似代替上式右边以f(x)(x (tj 1,tj)为曲边的曲边梯形的面积,而且若m充分大,tj较小时,我们就可用小矩形的高度n(x) fj / tj 来近似取代 f(x),x (tj 1,tj.课本例4 :根据频率直方图可见,该零件的质量服从正态分布,其数学期望大约为 209,这可通过 第七章的分布拟合进行检验。【注2】样本的频率直方图可以形象地描述总体的

17、概率密度的大致形态。五、经验分布函数对于总体X的分布函数F (未知),设有它的样本X1,X2, ,Xn ,我们同样可以从样本出发,找到一个已知量来近似它,这就是经验分布函数Fn(x).定义 设总体X的一个容量为n的样本的样本值x1,x2, ,xn可按大小次序排列成x(1) x(2)x(n).k 若x(k) x x(ki),则不大于x的样本值的频率为 .因而函数n0, 若x x,Fn(x)-,若 x(k) x x(ki),n1,若 x x(n).与事件X x在n次独立重复试验中的频率是相同的,我们称Fn(x)为经验分布函数。【注3】Fn(x)是一个阶梯状的函数,在x X3, k 1,2, ,n处

18、有跃度为%的间断点,若有l个观察值相同,则Fn(x)在此观察值处的跃度为对于固定的x, Fn(x)1 即表本事件 Xx在n次试验中出现的频率,即Fn(x) 落在(,x)中Xi的个数。n用与直方图分析相同的方法可以论证Fn(x)F(x), n,以概率为1成立。经验分布函数的图形如图.对于经验分布函数 Fn(x),格里汶科(Glivenko)在1933年证明了以下的结果:对于任一 实数x,当n 时Fn(x)以概率1 一致收敛于分布函数 F(x),即Plim sup |Fn(x) F(x)| 0 1. n x因此,对于任一实数x当n充分大时,经验分布函数的任一个观察值Fn(x)与总体分布函数F(x)

19、只有微小的差别,从而在实际中可当作F(x)来使用.课本例5【注4】由图可以看出,经验分布函数是一个阶梯状的曲线,我们可以想象,当样本容 量增大时,相邻两阶梯的跃度将降低,阶梯的宽度将变窄,这样阶梯状的折线几乎能变成一 条曲线,则经验分布函数非常接近总体的分布函数。这就是由样本推断总体其可行性的最基本的理论依据.分布拟合检验的理论依据 六统计量样本是总体的代表和反映,但在抽取样本后,由于样本只是呈现为一堆“杂乱无章”的数据,虽然通过频率直方图或经验分布函数能够大致了解总体的分布曲线,但无从知道总体到底服从什么分布,因此需要对样本的观测值进行加工和提炼课本例6试对该该工厂的工人周工资的水平和收入悬

20、殊程度做个大致分析。显然,如果不进行加工,面对这大堆大小参差不齐的数据,你很难得出什么印象。 但是只要对这些数据稍事加工,便能作出大致分析:如记各工人的周工资数为X1,X2,L ,X30,则考虑(30_1xxi 153.530 i i它反映了该厂工人周工资的一般水平;收入的差别程度可以考虑i 302s(xi x)2 13.51 30 i i i这说明收入的差别不大,当然这需要一定的参照资料。由此可见对样本的加工是十分必要的。对样本加工,主要就是构造统计量。T T(Xi,X2 Xn)为一个 n 元T(Xi,X2L Xn)为一个统计量。定义:设Xi,X2, ,Xn为来自总体X的一个样本,连续函数,

21、若T(Xi,XzL Xn)中不含任何未知参数,则称例:设总体X服从正态分布N( , 2),其中 ,2未知。Xi, X2, ,Xn是从正态总体X中抽取的一个样本,则1nn 2 父A、一 Xi,Xi2 ,均是样本的统计量,n i ii i1 n而一xin i i1n 2 3、-2xi2 ,都不是统计量.i 1【注4】:统计量常用大写字母表示,若样本取得一组具体的数字,统计量用小写字母表示。七、常用的统计量 一样本矩-样本的数字特征复习:随机变量矩的定义设X与Y是随机变量。若 E(Xk)(k 1,2,)存在,则称它为 X的k阶原点矩.若EX E(X)k(k 1,2,)存在,则称它为X的k阶中心矩.常

22、见的统计量设Xi, X2, , Xn为总体X的样本,则下列各量均是统计量,它们今后要经常被用到。(1) XXi , X称为样本均值-一阶样本原点矩。(反映总体均值的信息)(2)S2n(Xii 1nX)2 占i1Xi2一2 八2 , 一,、0nX ), S2称为样本方差。(反映总体方差的信息)(3)S vS2, S称为样本标准差。1 n k 一,、(4) Ak Xi , Ak称为样本k阶原点矩)。(反映总体k阶矩的信息) n i 1/ l、1 nk,,“,八人,、(5) Bk (Xi X) , Bk称为样本k阶中心矩。(反映总体k阶中心矩的信息) n i 1如果取得样本(X1,X2, ,Xn)的

23、观测值(X1,X2, ,Xn),则由上述的公式可得到相应的样本矩的观测值, 中心矩。分别被称为样本均值、样本方差、样本标准差、样本k阶矩、样本k阶(6)顺序统计量将样本中的各分量按由小到大的次序排列成X(1) X(2)X(n),则称X,X,X(n)为样本的一组 顺序统计量,X(i)称为样本的第i个顺序统计量特别地,称X(1)min X1, X2,L , Xn称为最小顺序统计量,也称为样本极小值;称X(n) maxX1,X2,L , Xn称为最大顺序统计量,也称为样本极大值 称X(n)X(1)为样本的极差.X n 1 , n为奇数 ()*2称M 1为样本中位数1X nX n , n为偶数2(2)

24、(2 1)注意,对于简单随机样本 体X同分布的随机变量,然而实际上,最小顺序统计量X1,X2, ,Xn ,各个观测值X1,X2, ,Xn是独立并且与总 X(1) ,X,,X(n)既不独立也不同分布.X的分布就是最小分布,最小顺序统计量 X (n)的分布就是最大分布.【例7】 设电子元件的寿命 X服从参数0.0015的指数分布,今独立测试n 6个元件,记录它们的失效时间。求(1)没有元件在800小时之间失效的概率;(2)没有元件最后超过 3000小时的概率。【解】由题意,F(x)(0.0015X1 e ,x 00, other设Xi,X2,L ,X6分别表示6个元件的寿命,则 Xi,X2,L ,

25、X6独立同分布于 X,由题意知,“没有元件在800小时之间失效”等价于 X minXi,X2,L ,X6 800;“没有元件最后超过 3000小时”等价于 X maxX1,X2,L ,X6 3000。所以(1) PX(i) minXi,X2,L ,X68006PXi 800 1 PX 8006 e7.2 i 1 PX(n) maxXi,X2,L ,Xg 30006 _ 6_4 5_ 6PXi 3000 F (3000)1 e .i 1我们关心的问题是如何用以上统计量的观测值去推断总体的分布,即总体的数字特征。 一、相关的理论依据1、样本的k阶原点矩依概率收敛于总体的k阶原点矩1 n定理:如果总

26、体X的k阶原点矩EXk Uk存在,则有lim P| - Xk uk| 1 nn k 1证明:因为XX2.Xn相互独立且与X同分布,所以因而X1kM.Xnk相互独立且与Xk同分布,所以EX; . EX: EXk Uk 1nl.一n从而由羊钦大数定律有lim P| - Xkuk | 1, 即:AkpUknn k 12、样本矩的函数以概率收敛于总体矩的函数g(A”.,Ak)p g(u”.,Uk)以上两条是:下一章矩估计法的理论依据。,即可用样本观测值的k阶原点矩去估计总体白k阶原点矩(特别的,可用样本(观测值)的均值去估计总体的均值(数学期望);参数估计的理论依据。3、当n充分大时,可用样本观测值的

27、经验分布函数来近似代替总体分布函数。第二节常用统计分布统计量是我们对总体的分布规律或数字特征进行推断的基础。在使用统计量进行推断时必须要知道它的分布。在数理统计中,统计量的分布称为抽样分布,因而确定统计量的分布是数理统计的基本问题之一。下面我们介绍三类重要的分布一分位数设随机变量X的分布函数为F(x),对给定的实数 (01),若实数F满足不等式PX F , 则称F为随机变量X的分布的水平 若实数T满足不等式的上侧分位数.的双侧分位数.0.05的上侧分位数和双侧分位数定义:Xi,X2,.Xn来自总体 X N(u,22),则随机变量C1X1C2X2. CnXn服从正态分布U N(Gu,nCi2 2

28、), i 1P| X | T , 则称T为随机变量X的分布的水平 例1设 0.05,求标准正态分布的水平 复习正态分布2 N(,),n1、定义:设X1, X2, Xn相互独立同分布于标准正态分布,即 Xi N(0,1),i1,2, ,n,则随机变量2Xi2X2Xn2Xi2服从自由度为1n的2分布,记22,、(n)。这里自由度n是指独立变量的个数。特别的2、2分布的密度函数f(y)1n22ny2,y 0,y 01 x .e dx0其中函数,其定义为3、图形:给出n =1,4, 10, 20 时的2分布的密度函数的曲线。4、性质(1)数学期望和方差:_2_2_E( (n) n,D( (n) 2n1

29、证明:因为 Xi N(0,1),所以 EXi 0,DXi 1 EXilEXi4 -j=x、dx 3X N(0,1) / . n特别地若:X1,X2,.Xn 来自总体 X N(0,1),则 X N(0,1) , VnX N(0,1) n2、密度函数3、图形 4、性质 5、上 分位数:双侧分位数(二)2分布所以E(2(n)E(X12 X2X:)EX:1_. _2而DXiEX;_2 2-(EXi )3所以D(2(n)D(X12X;Xn)DX2EXi4_2 2_(EXi ) 2n(2)可加性若X1 2(n),X22(%),且Xi与X2相互独立X1 X2 2(n1 1)该结论可推广到n个独立服从卡方分布

30、随机变量图6-2分布的上分位3、上侧分位数定义:统计量2 2(n),则称P 22(n)2(n)f(X)dX的点2(n)为 2(n)分布的上侧分位数。(0< <1)用法是:已知和n,求出 2(n);已知 2 k中的k和n。查表求查表求上分位点443页表中给出了不同的自由度和确定的概率值对应的上分位点 2( n)的值。几点说明:2 2 一-如.查 0.995(10), 0.05 (20)等等。(1) P 22(n)2f(x)dx中上 分位点2(n)的意义是:我们需要求的2(n)是当随机变量在2(n) , + 取值时,其概率为给定的(2)表中只列出自由度为1-45的分布值。当自由度 n&

31、gt;45时,用以下近似计算公式:2(n) 2(z27)2其中z为标准正态分布的上 分位点1如:0.025 (61)” 后1)2 83.9808,(其中查表得 z 1.96,n 61)例2设X1, ,X6是来自总体N (0,1)的样本,又设Y (X1X2 X3)2 C(X4 X5 X6)2试求常数C,使CY服从2分布.(三)t分布(学生分布)2 .1、定义:设X N(0,1),Y (n),且X与Y相互独立,则称随机变量2 n 1L)h n服从自由度为n的t分布,记为t t(n)。f,、(To2、密度函数:f(t) 2(1n、,n23、密度函数图形特点:(1) f(t)是偶函数,图形关于纵轴对称

32、(2) lim f (x) .e与,因此当n充分大时,其图形近似为标准正态分布的密 n2度函数图形。随着 n的增大,t(n)的密度曲线与N(0,1)的密度曲线越来越接近,一般若n 45,就可认为它基本与 N(0,1)相差无几了。4、分位数(1)上侧分位数定义:统计量t t(n),则称Pt t (n) t(n)h«)dt 的点 t(n)为t(n)分布的上侧分位数。(0< <1),显然有ti(n)t (n)查表求.(2)双侧分位数P|T| t /2(n)t /2(n)f (x)dx""MW由密度函数的对称性有PT t /2(n)/2;PTt /2(n)/2

33、例;课本 132 页 t t(8),0.05 ,则查表可知,t0.05(8) 1.8595,t0.025 (8)2.3060所以有 PT 1.8595 PT 1.8595 P| T |2.3060 0.05【注】(1)当n>45时可用正态近似t (n) ut /2(n) u /2 ,查正态分布表可得;(2) t (n)为t(n)分布的上侧分位数,则PT t (n) 1 ;PT t (n); P| T | t (n) 2【例3】(四)F分布2分布,则随机变量1、定义:设X ,Y相互独立,分别服从自由度为ni, n2的服从自由度为(必,1)的F分布,记为n1 n222、密度函数(y)ni3、

34、图形4、性质:如果F F(n,n2). 1、(1) F (n2, n1).如果X t(n),则X2F(1,n):ni”2X n2Y n1n12上1y2n2 yn2n1 n2-2-5、上分位数(1 )定义:满足PF (n,m)(n'm)f(y)dy的点 F (n,m)为F (n,m)分布的上侧分数(2)性质:F1(n,m)F (m,n)证明:事实上,设 F F(n, m),1P -P F F (n,m) PF F (n,m)F F (n,m)于是Pl由 分位点的定义,显然F (n,m)Fi (m,n)一1成立。F (n,m)(3)查表:例如:课本133课本例4第三节抽样分布抽样分布,实际

35、上就是随机变量函数的分布,只是强调这一分布是由统计量所产生的。统计量是我们对总体的分布规律或数字特征进行推断的基础。在使用统计量进行推断时必须要知道它的分布。当总体的分布已知时, 统计量的分布是确定的, 能够求出来,如前面所讲 的样本矩,但是要精确求出统计量的分布,一般来说是比较困难的。在数理统计中,统计量的分布称为抽样分布,因而确定统计量的分布是数理统计的基本问题之一。本节我们重点讨论正态总体的抽样分布,即由从正态总体中抽取的样本构造成的统计 量服从何种分布,这是属于小样本统计范畴。下面我们介绍来自正态总体的四类重要的分布。一、来自单个正态总体的抽样分布定理1:设XN(u, 2),X1,X2

36、,Xn是来自总体X的容量为n的样本,X为样本均值,S2为样本方差,则有以下结论2Xu(1)样本均值:X : N(u,)或U : N(0,1)。板书证明n、.n样本方差:2 " n( 一 )2:2(n 1)1 1n n _ _2 12122s(Xi X) XinX n 1 i 1n 1 i 1记住结论,不用证明,注意与(4)比较(3)样本均值 X和样本方差s2独立n n(4)2 T (Xi )2(X)2 2(n)i 1i 1板书证明,记住结论,注意与(2)比较Xu(5)T -r=t(n 1)板书证明 S2例题讲解课本例1、设Xi,X2.,X25为来自总体XN(21,4)的样本,求:(1

37、)样本均值的数学期望与方差;(2) P| X 21| 0.24例2、(课后习题1)已知离散型总体 X的分布律为X246P1/31/31/3取容量为n=54的样本,求(1)样本均值 X落在4.1到4.4之间的概率;(2)样本均值 X超过4.5的概率解:由题意 EX 4, DX 8/3, EX 4, DX °X ,VdX 2/9 n 814.1 4 X 4Pi 2/92/91 PX 4.5 1(1)P4.1 X 4.4(2) PX 4.5例3、例4.4.4 4(1.8)(0.45) 0.9645 0.6736 0.2905 2/9 'X 4 4.5 4P 1(2.25) 0.01222/92/9、来自两个正态总体的抽样分布定理:设X1,X2.,Xn与Y1,Y2.,Ym分别为来自正态总体N( 1, 12)和N(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论