随机样本和统计量_第1页
随机样本和统计量_第2页
随机样本和统计量_第3页
随机样本和统计量_第4页
随机样本和统计量_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1 它们都以随它们都以随机现象的统计规律为研究对象机现象的统计规律为研究对象. 数理统计与概率论是两个有密切联系的学科数理统计与概率论是两个有密切联系的学科, 但在研究问题的方法上有很大区别:但在研究问题的方法上有很大区别:概率论概率论 已知随机变量服从某分布已知随机变量服从某分布, 寻求分布的性质、寻求分布的性质、 数字特征、及其应用数字特征、及其应用; 数理统计数理统计 通过对实验数据的统计分析通过对实验数据的统计分析, 寻找所服从的分寻找所服从的分布和数字特征布和数字特征, 从而推断整体的规律性从而推断整体的规律性. 数理统计的核心问题数理统计的核心问题由样本推断总体由样本推断总体 第六

2、章第六章 样本及抽样分布样本及抽样分布2 也就是说也就是说, 我们获得的只是局部我们获得的只是局部观察资料观察资料. 因而从理论上因而从理论上讲,只要对随机现象进行足够多次观察,讲,只要对随机现象进行足够多次观察, 但客观上但客观上只允许我们对随机现只允许我们对随机现象进行次数不多的观察试验,象进行次数不多的观察试验, 被研究的随机现象的被研究的随机现象的规律性一定能清楚地呈现出来规律性一定能清楚地呈现出来. 数理统计就是数理统计就是在概率论的基础上在概率论的基础上研究怎样以研究怎样以有效的有效的方式方式收集、整理和分析可收集、整理和分析可获的有限的获的有限的, 带有随机性的数带有随机性的数据

3、据资料资料,由于大量随机现象必然呈现出它的规律性由于大量随机现象必然呈现出它的规律性. 对所考察问题的统计性规律对所考察问题的统计性规律尽可能地尽可能地作出作出精确精确而可靠的而可靠的推断或预测,推断或预测, 为采取一为采取一定的决策和行动提供依据和建议定的决策和行动提供依据和建议.3 这部分内容的重点在于介绍数理统计的一些重要概念和典这部分内容的重点在于介绍数理统计的一些重要概念和典型的统计方法,它们是实际中最常用的知识型的统计方法,它们是实际中最常用的知识. 学习统计无须把过多时间化在计算上学习统计无须把过多时间化在计算上, 应更有效地把时间应更有效地把时间用在基本概念、方法原理的正确理解

4、上用在基本概念、方法原理的正确理解上. 在数理统计中,不是对所研究的对象全体在数理统计中,不是对所研究的对象全体 ( 称称为为总体总体)进行观察,而是抽取其中的部分进行观察,而是抽取其中的部分(称为称为样本样本)进行观察获得数据(进行观察获得数据(抽样抽样),并通过这些数据对总),并通过这些数据对总体进行推断体进行推断.数理统计方法具有数理统计方法具有“部分推断整体部分推断整体”的特征的特征 .总体中的每个元素总体中的每个元素例如例如: 某工厂生产的灯泡寿命是一个总体某工厂生产的灯泡寿命是一个总体,每个每个灯泡的寿命是一个个体灯泡的寿命是一个个体; 某学校男生的身高的全体是一个总体某学校男生的

5、身高的全体是一个总体,每每个男生的身高是一个个体个男生的身高是一个个体一、总体、个体、随机样本一、总体、个体、随机样本总体总体 研究对象全体元素组成的集合研究对象全体元素组成的集合 所研究的对象的所研究的对象的某个某个( (或某些或某些) )数量指数量指标标 的全体的全体, ,它是一个随机变量它是一个随机变量. .记为记为x x . . x x 的分布函数和数字特征称为总体的分布的分布函数和数字特征称为总体的分布函数和数字特征函数和数字特征. .个体个体:6.1 6.1 随机样本和统计量随机样本和统计量 从总体中抽取一部分个体来进行观察从总体中抽取一部分个体来进行观察或试验或试验,称为称为抽样

6、抽样; 被抽出的部分个体称为被抽出的部分个体称为总体的一个总体的一个样本样本 抽取样本的目的在于对总体的统计规抽取样本的目的在于对总体的统计规律进行推断或估计律进行推断或估计, 故要求所抽取的样本故要求所抽取的样本能很好的反映总体的特性能很好的反映总体的特性.最常用的是简最常用的是简单随机样本。单随机样本。 总体容量有限的称为总体容量有限的称为有限总体有限总体, 称总体中所含个体的数目为称总体中所含个体的数目为总体容量总体容量, 总体容量无限的称为总体容量无限的称为无限总体无限总体. 定义定义: 设设x1, x2, . , xn为来自总体为来自总体x的样本的样本,如果如果x1, x2, . ,

7、 xn相互独立相互独立,且每一个都是且每一个都是与总体与总体x有相同分布的随机变量有相同分布的随机变量, 则称则称x1, x2, . , xn为总体为总体x的容量为的容量为n的的简单随机简单随机样本样本,简称为简称为随机样本随机样本或或样本样本,其观察值其观察值x1, x2, . , xn称为称为样本值样本值.7 它要求抽取的样本它要求抽取的样本x1, x2, , xn 满足满足下面两点下面两点:2.代表性:代表性: xi ( (i =1,2,n) ) 与所考察的总与所考察的总体体 x 同分布同分布. 1.独立性:独立性: x1, x2, , xn 是相互独立的是相互独立的 随机变量随机变量

8、; 今后今后, 说到说到 “x1, , xn 是取自某总体的样本是取自某总体的样本”时时, 若不特别说明若不特别说明, 就指简单随机样本就指简单随机样本.简单随机样本是应用中最常见的情形简单随机样本是应用中最常见的情形, 由定义知由定义知,若若x1,x2,.,xn为为x的一个样本的一个样本, x的分布函数为的分布函数为f(x),则则x1,x2,.,xn的联合分的联合分布函数为布函数为: niinxfxxf11*)(),( niinxfxxf11*)(),( 若若x的概率密度为的概率密度为f(x),则则x1,x2,.,xn的的联合概率密度为联合概率密度为:9 求样本求样本( (x1, x2, x

9、3 ) )的的 概率分布概率分布. . 例例1 设总体设总体 x b( (1, p), ), 即即 p( (x=x) )= p x(1-(1-p) )1-1-x, , x = 0 , 1 . 设设 x1, x2, x3 为为 x 的一个样本的一个样本, 解解 x i = 0, 1; i = 1, 2, 3 . ( (x1, x2, x3 ) )的分布列的分布列 p( (x1= x1 , x2= x2 , x3= x3 ) )31)(iixxp311)1(ixxiipp,)1(3213213xxxxxxpp又又 x1 + x2 + x3 =0, 1, 2, 3 , p( (x1= x1 , x2

10、= x2 , x3= x3 ) ) kkpp3)1(k = 0, 1, 2, 3 . ,)1()(iixxippxxp 10例例2).()(),(2,1,)(211sexdxexxxxnn和和)计算)计算(的概率分布;的概率分布;)写出)写出(是一个样本:是一个样本:,设总体服从泊松分布设总体服从泊松分布 解解 0, 2 , 1 , 01 iixiixexxxpi)由于)由于(的概率分布为的概率分布为因此样本因此样本nxx,1 niniixnixxeexniii11.1 niiixxp111nnxdxdxexexdxe )()(,)()(,)()()2(则有则有由于,由于, niixxnese

11、122)(11)(12二、频率直方图二、频率直方图 这是一种根据样本观察值来近似地求总这是一种根据样本观察值来近似地求总体的概率密度的图解法体的概率密度的图解法. 设总体设总体x是一个连续型随机变量,样本是一个连续型随机变量,样本观察值观察值x1 ,x2, ,xn,找个区间包括这些观察找个区间包括这些观察值,再把区间分成若干部分值,再把区间分成若干部分.nmvttiiii 的的频频率率为为样样本本观观察察值值落落入入,(11: iiiittvy矩形的高矩形的高 dxxfvbai 13三、经验分布函数三、经验分布函数成成将它们按大小次序排列将它们按大小次序排列观察值观察值的样本的样本的容量为的容

12、量为是总体是总体设设,21nxxxxn,*2*1nxxx :,*xfrxn定义函数定义函数 *1*1*0,(1,2,1),1,.nkknxxkfxxxxknnxx14 .).(*数的近似数的近似的分布函的分布函它是它是或样本分布函数或样本分布函数的经验分布函数的经验分布函数为总体为总体称称xxxfn 例如例如,估计一个物体的重量估计一个物体的重量,重复重复n次称重次称重,其其结果依次记为结果依次记为x1,x2,.,xn通常用样本的算术平均值通常用样本的算术平均值 ,或其或其 niixnx11它某个由样本计算出来的且看上去合理的它某个由样本计算出来的且看上去合理的量来估计重量量来估计重量 在获得

13、了样本之后在获得了样本之后, ,下一步对样本进行统计分析下一步对样本进行统计分析, , 即对样本进行加工、整理即对样本进行加工、整理, , 从中提取有用信息从中提取有用信息. .一个一个有效的方法就是构造一些有效的方法就是构造一些样本的函数样本的函数, ,通过通过样本函数样本函数把样本中所含的把样本中所含的( (某一方面某一方面) )的信息集中起来的信息集中起来. . 四、统计量四、统计量定义定义: 设设x1,x2,.,xn是总体是总体x的一个样本的一个样本,随机变量随机变量g(x1,x2,.,xn)是是x1,x2,.,xn的一个的一个连续函数连续函数,且且g中中不包含任何未知参数不包含任何未

14、知参数,则称则称g(x1,x2,.,xn)为一为一个个统计量统计量 统计量是样本的函数统计量是样本的函数,它是一个随机变它是一个随机变量量,统计量的分布称为统计量的分布称为抽样分布抽样分布 设设(x1, x2, . , xn)是样本是样本(x1,x2,.,xn)的的样本值样本值,则称则称g(x1, x2, . , xn)是是g(x1,x2,.,xn)的一个观察值的一个观察值.这种不含任何未知参数、完全由样本决定的这种不含任何未知参数、完全由样本决定的量称为统计量量称为统计量17例例 是未知参数, 22, ),(nx若 , 已知,则为统计量是一样本,),(21nxxxniiniixxnsxnx1

15、22111,1是统计量, 其中),(2nxi则但niix1221不是统计量.c例例3 设总体设总体xb(2, p),其中其中p为未知参数为未知参数, (x1, x2, x3)是取自总体是取自总体x的样本的样本,则则_不不是统计量是统计量(a) x1+x2 (b) maxx1, x2, x3(c) x3 +2p(d) (x2 x1)2设设x1,x2,.,xn是总体是总体x的一个样本的一个样本, niixnx11样本平均值样本平均值: niixxns122)(11样本方差样本方差:2ss 样本标准差样本标准差:常用统计量常用统计量: nikikxna11样本样本k阶阶(原点原点)矩矩:(k=1,2

16、,) nikikxxnb1)(1样本样本k阶中心矩阶中心矩:(k=1,2,)例如21222111nniisxxnsnnbxa niixnx11样本平均值样本平均值: niixxns122)(11样本方差样本方差:), 2 , 1( )(11 kxxnbnikik样本样本k阶中心矩阶中心矩:样本样本k阶阶(原点原点)矩矩: nikikana11(k=1,2,)它们的观察值分别为它们的观察值分别为: niixxns122)(11)2(1112112 niniiniixxxxn)2(11212xnxnxxnnii )(11212xnxnnii 由样本平均值和样本方差的表达式可得由样本平均值和样本方差

17、的表达式可得:23注注 样本方差样本方差 与样本二阶中心矩与样本二阶中心矩 的不同的不同2ns2sniniiniixxxx12112222122xnxnxnii212xnxnii)(22xan故22221)(1nsnnxanns222xabniiiniixxxxxx12212)2()(推导推导关系式关系式221nsnns1)24例例4 4 从一批机器零件毛坯中随机地抽取10件, 测得其重量为(单位: 公斤): 210, 243, 185, 240, 215, 228, 196, 235, 200, 199求这组样本值的均值、方差、二阶原点矩与二阶中心矩.解解),(1021xxx令)199,20

18、0,235,196,228,215,240,185,243,210(2543.433)(9110122iixxs101225 .47522101iixa0 .390)(101109101222iixxsb19.217)199200235196228215240185243230(101x则则26例例5 5 在总体 中,随机抽取一个容量为36的样本,求样本均值 落在50.8到53.8之间的概率.)3 . 6,52(2nx解解)36/3 . 6,52(2nx故6/ 3 . 6528 .506/ 3 . 6528 .53)8 .538 .50( xp8239. 0)1429. 1()7143. 1

19、(271.标准正态分布标准正态分布2. 2分布分布3. t分布分布4. f分布分布6.26.2 数理统计中常用的分布数理统计中常用的分布 正态总体是最常见的总体正态总体是最常见的总体, 本节介绍本节介绍的几个抽样分布均对正态总体而言的几个抽样分布均对正态总体而言.28 设设xn(0,1),对任给的对任给的 , 0 z0.05=1 0.05=0.95 px1.64=0.9495 px1.65=0.9505 z0.05 (1.64+1.65)/2=1.645公式公式: (z )=1 0.050.0250.0051.6451.962.575zzz常用数字30 设设xi n(0,1) (i=1,2,.

20、,n), 且它们相互且它们相互独立独立,则称随机变量则称随机变量2 2分布分布定义定义: niix122 服从自由度为服从自由度为n的的 2分布分布,记为记为 2 2(n) 2分布分布最常用的是拟合优度检验最常用的是拟合优度检验 31222121,02( )( )0,0 xnnne xxf xx一般其中,01)(dtetxtx在x 0时收敛,称为函数,具有性质)(!) 1()2/1 (, 1) 1 (),() 1(nnnnxxx)(2n的密度函数为自由度为 n 的32)(2nm nmiixyy122110 设设 y1 2 (m), y2 2 (n), 且且 y1 , y2 相互独立,相互独立,

21、 2 分布的基本性质分布的基本性质则则 2 分布的可加性分布的可加性y1 +y2 = ? , miixy121, nmmiixy122;)(221nmyy 20 若若 y 2 (n), 则则 = n , = 2n . ey dy niixeey12)( niiiexxd12)(,11nni niixddy12)( niiiexex1224)(.221nni = 1 xdexexxi 224421 = 3 30 设设 x1, , xn 相互独立相互独立, 且都服从正态分布且都服从正态分布 n( ( , 2),),40 若若y 2 分布分布, , ;)()(12122nxynii 近似服从近似服从

22、 n( (0,1) ). 应用中心极限定理可得应用中心极限定理可得则则 nny2 则当则当 n 充分大时充分大时, 33o 2 (n) x f(x) 设设 2 2(n),其密度函数为其密度函数为f(x),对于给对于给定的正数定的正数 (0 1),称满足条件称满足条件 dxxfnpn)(222)()(的点的点 2 (n)为为 2(n)分布的上分布的上 分位点分位点 2分布的上分布的上 分位点分位点:当当n充分大时充分大时,22)12(21)( nzn 34例例2 (练习九练习九.五五) 设设xn( , 2),(x1,x2,.,x16)是取自总体是取自总体x的样本的样本,求概率求概率:2)(161

23、2216122 iixp解解: x1,x2,.,x16相互独立相互独立且且)1 , 0( nxi )16()( 21612 iix352)(1612216122 iixp32)(81612 iixp 32)(8)(16121612 iiiixpxp 0.95 0.01=0.9436例例3 3 设总体 的样本,26542321)()(xxxxxxy) 1 , 0( nx16,xx为总体 x 试确定常数 c , 使 cy 服从2分布.解解) 3 , 0 (, ) 3 , 0 (654321nxxxnxxx) 1 , 0 (31,31654321nxxxxxx265423213131xxxxxx故因

24、此1/3.c) 2(312y37 设设xn(0,1),y 2(n),且且x与与y相互独相互独立立,则称随机变量则称随机变量3 t分布分布定义定义:服从自由度为服从自由度为n的的t分布分布,记为记为tt(n)nyxt t 的密度函数为:的密度函数为:.)1()2(2)1()(212 nnxnnnxf 38o tf(t)t分布的上分布的上 分位点分位点: 设设tt(n),其密度函数为其密度函数为f(t),对于给定对于给定的正数的正数 (0 45时时, t (n) z 40 且且 xn( (2 , 1 ),), y i n( (0 , 4 ),),i = 1, 2, 3, 4 , , 设设 x, y

25、1, y2, y3, y4 相互独立相互独立, 例例4令令 ,)2(4412 iiyxz解解 x- -2 n( (0 , 1 ) ), i = 1, 2, 3, 4 . t( (4) ), 412)2(4iiyxz即即 z 服从自由度为服从自由度为 4 的的 t 分布分布. 求求 z 的分布的分布. 4)2(2412 iiyx由由 t 分布的定义分布的定义y i / 2n( (0 , 1), ), 41题题 设随机变量 x 与y 相互独立,x n(0,16), y n(0,9) , x1, x2 , x9 与y1, y2 , y16 分别是取自 x 与 y 的简单随机样本, 求统计量12922

26、21216xxxzyyy所服从的分布.解解)169, 0(921nxxx)1, 0()(431921nxxx4216, 2 , 1,)1 , 0(31inyi)16(3122161iiy16314311612921iiyxxx)16( t2162221921yyyxxx从而43t分布用于在小样本场合下的正态分布分布用于在小样本场合下的正态分布(大样本大样本场合下可以用正态分布来近似场合下可以用正态分布来近似),有时候在信息有时候在信息不足的情况下不足的情况下,只能用只能用t分布分布,比如在整体方差不比如在整体方差不知的情况下知的情况下,对总体均值的估计和检验通常要对总体均值的估计和检验通常要用

27、用t统计量统计量44 记作记作 f f(m, n) .由由f 分布的定义可见,若分布的定义可见,若 f f(m, n), , )(, )(22nymx 且且定义定义:设随机变量设随机变量 x 与与y 独立,独立,所服从的分布为所服从的分布为第一自由度为第一自由度为 m , 第二自由度为第二自由度为 n 的的 f 分分布,布,nymxf 4、f 分布分布 ,0 0, ,0,)2()2()2()(21222xxnxmxnmnmnmxfnmmnm 则则 f 的概率密度为的概率密度为 则称统计量则称统计量 其图形其图形参见参见172f分布多用于比例的估计和检验分布多用于比例的估计和检验 45o xf(

28、x)f分布的上分布的上 分位点分位点: 设设ff(m,n),其密度函数为其密度函数为f(x),对于给对于给定的正数定的正数 (0 f1 1 ) )= 0. 025 , p( (f f3 3 ) )= 0. 95 .1/f f(15(15, 24) ), 查附表查附表7 知知 ,44. 2)24,15(1025. 02 ff025. 0)44. 2/1( fp,)24,15(1)15,24(95. 0195. 0 ff,11. 2)15,24(95. 0 f.474. 011. 213 f统计三大分布的定义和基本性质在后面的学习中常用到统计三大分布的定义和基本性质在后面的学习中常用到, 要牢记!

29、要牢记!481. 单个正态总体的抽样分布单个正态总体的抽样分布2. 两个正态总体的抽样分布两个正态总体的抽样分布6.3 抽样分布定理抽样分布定理49 设设x1,x2,.,xn是来自正态总体是来自正态总体n( , 2)的样本的样本,则则1.单个正态总体的抽样分布单个正态总体的抽样分布定理定理:(1),(2nnx )1 , 0( nnx (2)与与s2相互独立相互独立x(3)1()1(222 nsn (4)1( ntnsx 50(1) niixnx11)1 , 0( nnx 为为n个相互独立的正态个相互独立的正态x服从正态分布服从正态分布 niixenxe1)(1)(= niixdnxd12)(1)(n2 ),(2nnx 随机变量的线性组合随机变量的线性组合51(4),1 , 0( nnx 且它们相互独立且它们相互独立由由t分布的定义分布的定义,)1(1)1(22 ntnsnnx )1( ntnsx 即即22)1( sn 2(n 1)52例例1(练习九练习九.二二.(1) 设设(x1,x2,xn)是取是取自总体自总体x的样本

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论