大学统计学课件6抽样及抽样分布_第1页
大学统计学课件6抽样及抽样分布_第2页
大学统计学课件6抽样及抽样分布_第3页
大学统计学课件6抽样及抽样分布_第4页
大学统计学课件6抽样及抽样分布_第5页
免费预览已结束,剩余66页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、组成元素组成元素具体对象具体对象组成元素组成元素变量的具体变量的具体取值取值研究的标志研究的标志例:班级同学的成绩例:班级同学的成绩班级同学的集合班级同学的集合(全体同学)(全体同学)组成元素:每位同学组成元素:每位同学同学成绩的集合同学成绩的集合组成元素:成绩分数组成元素:成绩分数6.1.1 6.1.1 统计推断中统计推断中的总体及总体分布的总体及总体分布6.1 6.1 总体与样本的统计分布总体与样本的统计分布3.1 总体与样本总体与样本在统计推断中在统计推断中, ,我们感兴趣的是总体单位的某个或某些数我们感兴趣的是总体单位的某个或某些数量特征。例如研究某种型号灯泡的寿命这一数量特征。总体的

2、量特征。例如研究某种型号灯泡的寿命这一数量特征。总体的含义是所感兴趣变量的所有取值。含义是所感兴趣变量的所有取值。 这些值的出现有不同的频率,假设这批灯泡有无限多个,这些值的出现有不同的频率,假设这批灯泡有无限多个,那么频率就收敛到了概率,从而有了使用寿命这个随机变量的那么频率就收敛到了概率,从而有了使用寿命这个随机变量的概率分布。这个分布称为总体分布。概率分布。这个分布称为总体分布。 数理统计学中数理统计学中“总体总体”这个基本概念从本质上讲这个基本概念从本质上讲:总体就总体就是一个随机变量是一个随机变量X X。1.1.样本概念样本概念 通过随机观测或试验的方法,获得的总体中一通过随机观测或

3、试验的方法,获得的总体中一部分个体,称为样本,每个个体称为样本单位。部分个体,称为样本,每个个体称为样本单位。就是抽取样本的过程。就是抽取样本的过程。6.1.2 6.1.2 统计推断中的样本及样本性质统计推断中的样本及样本性质2.2.样本的两个重要性质样本的两个重要性质 第一、样本点与总体同分布(第一、样本点与总体同分布( “ “样本与总体同分布样本与总体同分布”)。)。 第二、样本点之间相互独立(简称第二、样本点之间相互独立(简称“样本独立样本独立”) 两个性质常常合称为两个性质常常合称为 “ “样本独立同分布样本独立同分布(i.i.d) )”。满足上述。满足上述性质的样本为简单随机样本。以

4、下如不作特殊声明,所提到的性质的样本为简单随机样本。以下如不作特殊声明,所提到的样本都是简单随机样本。样本都是简单随机样本。在相同的条件下对总体在相同的条件下对总体X进行进行n次重复独立的观察。次重复独立的观察。将将n次观察结果按试验的次序记为次观察结果按试验的次序记为X1, X2, Xn 。 由于由于X1, X2, Xn 是对随机变量是对随机变量X观察的结果,观察的结果,且各次观察是在相同的条件下独立进行的,所以有理由且各次观察是在相同的条件下独立进行的,所以有理由认为认为X1, X2, Xn是是相互独立的相互独立的,且都是与总体,且都是与总体X具具有有相同分布的相同分布的随机变量(随机变量

5、(代表性代表性)。)。 这样得到的这样得到的X1, X2, Xn 称为来自总体称为来自总体X的一个的一个简单随机样本,简单随机样本,n为这个样本的容量。为这个样本的容量。 n次观察一经完成,我们就得到一组实数次观察一经完成,我们就得到一组实数x1, x2, xn ,它们依次是随机变量,它们依次是随机变量X1, X2, Xn的观察值,称为样本观测值。的观察值,称为样本观测值。简单随机抽样和简单随机样本的性质简单随机抽样和简单随机样本的性质不放回不放回放放 回回放回放回不放不放 回回独立性和同一性独立性和同一性不独立不独立当当n/N5%时,有限总时,有限总体不放回抽体不放回抽样等同于放样等同于放回

6、抽样回抽样3.3.抽样方法抽样方法 样本包含了总体的各种特征信息样本包含了总体的各种特征信息, ,是进行统计推是进行统计推断的依据。这些信息是断的依据。这些信息是“散布散布”在样本之中的在样本之中的. .在实在实际应用时际应用时, ,要从中得到所需要的统计信息要从中得到所需要的统计信息, ,往往不是往往不是直接使用样本本身直接使用样本本身, ,而是对样本进行而是对样本进行“处理处理”, ,将所将所需信息浓缩集中起来针对不同的问题,构造样本的需信息浓缩集中起来针对不同的问题,构造样本的适当函数适当函数进行统计推断。进行统计推断。总体参数总体参数未知未知总体其他信息总体其他信息未知未知总体分布总体

7、分布未知未知抽样得到随机样本抽样得到随机样本利用统计量推断总体信息利用统计量推断总体信息样本统计量样本统计量T=T(X1,X2,Xn)两个要点:两个要点:1、是样本的函数、是样本的函数2、不含未知的总体参数、不含未知的总体参数.抽样分布就是样本统计量的分布抽样分布就是样本统计量的分布样本样本X1,X2,Xn 如果样本如果样本X1, ,Xn的函数的函数T(X1, ,Xn)不含未不含未知参数,则称知参数,则称T(X1, ,Xn)是总体是总体X的一个统计量。的一个统计量。 6.2.1 6.2.1 统计量及统计量的分布统计量及统计量的分布统计值统计值12( ,.,)nT x xx 统计量既然是随机变量

8、的函数,那么它也应该统计量既然是随机变量的函数,那么它也应该是随机变量,并有其概率分布是随机变量,并有其概率分布,统计量的分布也统计量的分布也称为抽样分布称为抽样分布。抽样分布和统计推断有着密切的抽样分布和统计推断有着密切的联系。联系。统计量提出以后,必须要知道其分布才能在统计量提出以后,必须要知道其分布才能在统计推断中使用,因为只有知道了统计量的分布,统计推断中使用,因为只有知道了统计量的分布,才能利用概率论对总体的特征进行推断,并得到相才能利用概率论对总体的特征进行推断,并得到相应的推断的置信度。所以在统计推断中,一项重要应的推断的置信度。所以在统计推断中,一项重要的工作就是寻找统计量和导

9、出统计量的分布。的工作就是寻找统计量和导出统计量的分布。样本矩统计量样本矩统计量分位数统计量分位数统计量顺序统计量顺序统计量其他统计量其他统计量?,),(,22321哪些不是些是统计量判断下列各式哪为未知为已知其中样本的一个是来自总体设NXXX,11XT ,3212XeXXT ),(313213XXXT ),max(3214XXXT ,2215 XXT.是是不是不是222612321()TXXX是是是是是是是是【例6-1】总体X服从两点分布,概率分布律如下:(1)P Xp(0)1P Xp 从总体中抽取容量为n的样本,求统计量 的分布。 1niiTX解:其取值是0到n之间的所有整数,其分布是二项

10、分布:()(1)kkn knP TkC pp0,1,2,.,kn11TX212TXX311niiTXXn例例6-2.总体总体抽取容量为抽取容量为n的样本,构造如下三个统计量:的样本,构造如下三个统计量:求此三个统计量的抽样分布。求此三个统计量的抽样分布。) 1 , 1 ( NXiX11( )()1E TE X11( )()1D TD X212()()()2E TE XE X212()()()2D TD XD X3()()1E TE X31()()D TD Xn1T2T3T1/n解:由于样本是独立的,解:由于样本是独立的,服从均值和方差都为服从均值和方差都为1的正态分布,的正态分布,三个统计量都

11、是样本的线性函数,由正态分布的性质,三个统计量都是样本的线性函数,由正态分布的性质,三个统计量仍服从正态分布,分别求解其均值和方差:三个统计量仍服从正态分布,分别求解其均值和方差:,统计量统计量服从均值和方差都为服从均值和方差都为1的正态分布,这和总体的分布相同;的正态分布,这和总体的分布相同;统计量统计量服从均值和方差都为服从均值和方差都为2的正态分布的正态分布服从均值为服从均值为1,方差为,方差为的正态分布。的正态分布。nikinikiXXnXn11)(11中心矩原点矩3.样本k阶矩niiXnX11. 1 样本均值常用统计量常用统计量2122)()(11. 2SSXXnSnii标准差样本均

12、方差样本方差4.4. 样本相关系数样本相关系数5.顺序统计量为偶数为奇数中位数nXXnXMnnne2)2/1()2/()21()1()(XXRn极差1122(,),(,),(,)nnX YX YX Y是二维总体(, )X Y的简单随机样本12211()()()()niiinniiiiXX YYrXXYY( )12max,.,nnXXXX(1)12min,.,nXXXX 1(1)()()1pnpnpnpnpMXnpXXnp分位数: 的抽样分布与总体分布和样本量的抽样分布与总体分布和样本量n有关:有关: 总体是正态分布,样本均值总是正态分布总体是正态分布,样本均值总是正态分布 总体非正态分布,随着

13、总体非正态分布,随着n的增大,样本均值趋于正态分布的增大,样本均值趋于正态分布x 2分布分布 t 分布分布F分布分布抽样分布的重要定理抽样分布的重要定理 在在参数估计和假设检验等统计推断问题中这参数估计和假设检验等统计推断问题中这三个分布有广泛的应用。三个分布有广泛的应用。 2221nXX22( )n21. 2分布的定义和密度函数分布的定义和密度函数定义定义6-1 :设:设X1, ,Xn是相互独立,服从是相互独立,服从标准正态分布标准正态分布N(0,1)的随机变量,则称随机变的随机变量,则称随机变量:量: 所服从的分布为自由度所服从的分布为自由度是是n的的 分布,即分布,即2221( )nii

14、Xn记为记为独立同分布的随机变量序列独立同分布的随机变量序列随机变量服从标准正态分布随机变量服从标准正态分布新构造的随机变量为原随机变量平方和新构造的随机变量为原随机变量平方和分布的三个要点:分布的三个要点:2/211222( /2),0( )0,0nnxnxexf xx 2 2(n)分布是参数为分布是参数为n/2,1/2的的分布,即分布,即 2 2(n)的密度函数为的密度函数为2(0,1), 0,1, 1iiiiXNEXDXEXniEXEXDXiii, 2 , 1, 213)(224222211().nniiiiEEXEXn.2)(12122nDXXDDniinii证:所以:(1)nE)(2

15、nD2)(22.2. 2 2分布的性质分布的性质 2分布分布随着自由度随着自由度增加,分布渐近于正态。增加,分布渐近于正态。图图6-1 2的概率密度曲线的概率密度曲线(2 2) 分布的自由度分布的自由度2自由度可解释为可以自由选择数值的变量个数。21niiX自由度为n21()niiXX自由度为n-11222221211,nnijijXY12,1,2,1,2,ijX Y injn1222222121211()nnijijXYnn22221122(),(),nn)(2122221nn (3)分布可加性)分布可加性 且且2212,独立,则:独立,则:设设2212,独立,则:独立,则:独立,由卡方分布

16、的定义独立,由卡方分布的定义22244232222()23223 ()3xixxixE XedxxxeedxE X 正态分布的峰度正态分布的峰度3。 【例例6-3】设设X1, X2, X6是简单随机样本,是简单随机样本,服从分布服从分布N(0,2)的随机变量的随机变量,求求a,b和和c使使 服从服从 2分布分布 222123456()()aXb XXc XXX 3.3.上侧分位数上侧分位数 所谓一个分布的所谓一个分布的 上侧分位数就是指这样一个数,它上侧分位数就是指这样一个数,它使相应分布的随机变量不小于使相应分布的随机变量不小于( (大于等于)大于等于)该数的概率该数的概率为为 , ,比如,

17、若记比如,若记 2 2变量的变量的 上侧分位数为上侧分位数为 ,则满足,则满足222()p附表3中给出了自由度n45的2分布的上 分位数值.如对于0.1,25n 查附表3得20.1(25)34.382 方便通过方便通过EXCEL查分位点,函数为查分位点,函数为CHIINV。fx 常用函数 CHIINV 例例6-46-4 设总体设总体X1, X2 , X6服从服从N(0,1)分布分布。 试确定常数试确定常数c , 使使cY 服从服从 2 2。) 3 , 0 (, ) 3 , 0 (654321NXXXNXXX) 1 , 0 (31,31654321NXXXXXX265423213131XXXXX

18、X故因此1/3.c) 2(312Y22123456()()YXXXXXX1. t t分布的定义和密度函数分布的定义和密度函数).(/ntnYXT t(n)称为自由度为称为自由度为n的的t分布,记为分布,记为Tt(n)。6.3.2 t 分布分布t(n) 分布的概率密度为分布的概率密度为 t,)nt1()2n(n)21n() t ( f21n2定义定义6-2:若若X XN(0, 1), N(0, 1), Y Y 2 2(n), (n), X X与与Y Y独立,则独立,则 t t分布和标准正态分布类似,他们都是对称分布。分布和标准正态分布类似,他们都是对称分布。区别:区别:t t分布尾部厚,即服从分

19、布的随机变量取到尾部值的概分布尾部厚,即服从分布的随机变量取到尾部值的概率比标准正态分布略大。而对于接近原点的坐标点,率比标准正态分布略大。而对于接近原点的坐标点,t t分布的值分布的值比标准正态分布的值小。比标准正态分布的值小。因而因而t t分布曲线尾部厚于标准正态分布分布曲线尾部厚于标准正态分布,而峰低于标准正态分布。,而峰低于标准正态分布。 (1) f(t)(1) f(t)关于关于t=0(t=0(纵轴纵轴) )对称。对称。 (2) f(t)(2) f(t)的极限为的极限为N(0N(0,1)1)的密度函数,即的密度函数,即 x,e21) t () t ( flim2tn2,分子是标准正态随

20、机变量分子是标准正态随机变量分母是自由度为分母是自由度为n的卡方随机变量的卡方随机变量分子分母相互独立,且满足构造公式分子分母相互独立,且满足构造公式t分布的三个要点:分布的三个要点:分子:标准正态分布变量分子:标准正态分布变量分母:卡方变量除以自由分母:卡方变量除以自由度再开方度再开方 (1)(1) t t分布的数学期望与方差分布的数学期望与方差 ( )0E t ( )22nD tnn, (2) (2) t t分布的自由度分布的自由度分母分母2.2. t t分布的性质特征分布的性质特征 )() 10(nttP,称满足条件:对于给定的( )tnt的点为 分的上布分位点 。)()(1ntnt:由

21、概率密度的对称性知.)(45zntn时,当)(nt)(1nt附表2中给出了自由度n45时,当的 t 分布的上 分位数值; 如对于0.05,n20查附表2得方便通过方便通过EXCEL查分位点,函数为查分位点,函数为TINV。(注意:(注意:双侧,双侧,20.050.1)T0.05(20)1.7247例例6-5设X1 , X2X6N(0,2) t(5)c=?1(0,2)XN1(0,1)2XZN222222235624(5)22222XXXXX则由则由t t分布的构造,有分布的构造,有122222356242/522222XtXXXXX212222223456/5XXXXXX212222223456

22、5XXXXXX5C 26252423221XXXXXXc 例例6-6 设设X1, X2 , X9 相互独立,服从正态分布相互独立,服从正态分布N(0,16), Y1, Y2 , Y16相互独立,服从正态分布相互独立,服从正态分布N(0,9), X1, X2 , X9 与与Y1, Y2 , Y16 相互独立,求随机变量相互独立,求随机变量1292221216XXXZYYY所服从的分布。所服从的分布。129(0,9 16)XXXN因1291() (0,1)12XXXN故标准化标准化1(0,1) ,1,2,163iYNi 又216211(16)3iiY故标准化标准化根据根据t分布的构造,则分布的构造

23、,则12912922221612161112 (16)1316iiXXXXXXttYYYY定义定义6-3:若若X1 2(n1), X2 2(n2),X1和和 X2独立,则独立,则).,(/212211nnFnXnXF 称为第一自由度为称为第一自由度为n1 ,第二自由度为第二自由度为n2的的F分布分布,其概率密度为其概率密度为 0y, 00y,)ynn1)(2n()(y)n/n)(2nn()y(h2/ )nn(2122n12n2/n2121211111. F分布的定义和密度函数分布的定义和密度函数分子是自由度为分子是自由度为n1的卡方随机变量的卡方随机变量分母是自由度为分母是自由度为n2的卡方随

24、机变量的卡方随机变量分子分母相互独立,且满足构造公式分子分母相互独立,且满足构造公式F分布的三个要点:分布的三个要点:两个卡分变量两个卡分变量除以自由度之比除以自由度之比 2.F分布性质特征分布性质特征(1) F分布的数学期望和方差分布的数学期望和方差222( )(2)2nE Fnn 2212221222(2)( )(4)(2) (4)n nnD Fnn nn F分布有两个自由度,称为第一自由度和第二分布有两个自由度,称为第一自由度和第二自由度,分别对应构成自由度,分别对应构成F分布的分子和分母的自由分布的分子和分母的自由度。两个自由度的不同组合和形成度。两个自由度的不同组合和形成F分布曲线的

25、不分布曲线的不同形态。同形态。F分布的两个自由度还有一个重要性质,分布的两个自由度还有一个重要性质,它们是可以互相转化的。它们是可以互相转化的。 ).,(/1),( F1221nnFFnnF则若),(/1),(12211nnFnnF结论:),() 10(21nnFFP,称满足条件:对于给定的12( ,)Fn nF的点为 分的上布分位点),(21nnF(3 3)F F分布的分布的上侧临界值上侧临界值 对某些较小的附表4中给出了自由度为( n1, n2 )的F 分布的上 分位数值。如对于查附表5得0.1(5,15)2.27F 方便通过方便通过EXCEL查分位点,函数为查分位点,函数为FINV。15

26、51 . 021nn 由于由于F分布表的局限性,我们不能用直接查表得到此题的分布表的局限性,我们不能用直接查表得到此题的下侧分位点。怎么办呢?下侧分位点。怎么办呢?11( , )( , )FnmF m n( ,)( ,)( ) 上侧:Fn mP FFn mf x dx 1( ,)10( ,)( ) 下侧:Fn mP FFn mf x dx 给定显著水平给定显著水平 0.05,查,查F(15,20)的的 上下侧分位点。上下侧分位点。多么方便啊!多么方便啊!EXCEL处理处理例例715. 4)6 , 8(05. 0F28. 058. 31)8 , 6(1)6 , 8(05. 095. 0FF96.

27、 2)7 , 4(1 . 0F25. 098. 31)4 , 7(1)7 , 4(1 . 09 . 0FF例例8?)6 , 8(95. 0F?)7 , 4(9 . 0F例例492 ( ),(1, ).Xt nXFn已知试证解:解:),(ntX由于由于,nZYX 所以所以.,),(),1 , 0(2独独立立且且其其中中ZYnZNY ,122nZYX 则则分布的定义知分布的定义知由由 F)., 1(2nFXT分布与分布与F分布的关系分布的关系定义定义 本节的前面部分,为我们提供了讨论统计本节的前面部分,为我们提供了讨论统计量的分布可以利用的结论,下面讨论总体服从正量的分布可以利用的结论,下面讨论总

28、体服从正态分布场合的抽样分布,这是因为在应用中许多态分布场合的抽样分布,这是因为在应用中许多随机变量的概率分布或是正态分布,或是近似正随机变量的概率分布或是正态分布,或是近似正态的。态的。 定理定理6-1设设X X1 1, X, X2 2,X,Xn n是来自正态总体是来自正态总体的简单随机样本,则的简单随机样本,则(1 1)(2 2)2 ( ,)XN 则(3)nNX2,1 , 0 NnXZ第一个重要统计量第一个重要统计量独立与,且2221222) 1()() 1(SXnXXSnnii第二个重要统计量第二个重要统计量样本均值与样本方差相互独立11niiXXn2211()niiSXXn证明:证明:

29、是是X X1 1, X, X2 2,X,Xn n的线性函数,故的线性函数,故 服从正态分布。服从正态分布。X)(1)1()(11niiniiXEnXnEXEXnXDnXDnii212)(1)(),(2nNX1 , 0 NnX构造第一行为的n阶正交矩阵A,进行正交变换,即1122nnYXYXYX AA AI 12,nY YY1/21/21/2(,)nnn111222nnnYXXYXXVarVarVarYXXAAAAIAI可知,也是独立标准正态变量。根据变换有111,nkkYXnXn222111nnniiiiiiYXXXX22112nniiiiXXXX Xn X2211niiXXY2221()nn

30、iiiiYXX故2S与X, )/1 ,0(/1nNnYX , ) 1() 1(22nSn得得相互独立,得例67.153从正态总体 中抽n=25的样本,参数未知2( ,)N 25122)(241iiXXS2()D S2.3(| 1)PX(1)22(0.5771.5173)SP2(,)XNn2.3(|1)PX1(|)2 .3 /2 52 .3 /2 5XP25n (|2 .1 7 4 )PZ2(2 .1 7 4 )1PZ20 .9 8 510 .9 7 对于服从对于服从N N(0,10,1)的随机变)的随机变量量z z,设其分布函数为,设其分布函数为(z z),则),则标准正态分布在任意区间的概率

31、可标准正态分布在任意区间的概率可以表示为:以表示为:()( )( )P aXbba ()2 ( ) 1P zaa ()1( )zz (2)2( ,)25Nn 样本来自,222222(1)(25 1)(24)nSS222224(0.5771.5173)(0.577 241.5173 24)SSPP2(0.577 24(24)1.5173 24)P2(13.848(24)36.415)P22(24)13.848)(24)36.415)PP0.950.050.90(3)22224(24)S2(24)48D444222(24)48122424D)24(.24222S)(2SD222(1)nS 定理定理

32、6-2 设设X1, X2,Xn是来自正态总体是来自正态总体的随机样本,则的随机样本,则(2 2)2 ( ,)XN 则(3)1ntnSXt第三个重要统计量第三个重要统计量证明:证明:222(1)0,1 ,(1)iXnSNnt ,由 分布定义有:11) 1(22ntnSXnSnnXt【例例6-9(p154)2( ,)N 总体11,. ,nnXXX样本11niiXXnniiXXnS122)(11分布?) 1(11ntSXXnnnn),(21NXn),(2nNX) 1(, 0(21nnNXXn) 1 , 0() 1(21NnnXXZn标准化2222(1)(1)nSn因为12nZt2221) 1() 1() 1(nSnnnXXnSXXnnnn11定理定理6-3 6-3 :设:设X X1 1,X X2 2,X Xn n来自来自XN

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论