统计量及其分布_第1页
统计量及其分布_第2页
统计量及其分布_第3页
统计量及其分布_第4页
统计量及其分布_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、4.3 统计量及其分布统计量及其分布 我们知道样本是总体的反应,在利用样本推断总体时,往往不能直接利用样本,而需要对它进行一定的加工,这样才能有效地利用其中的信息,否则,样本只是呈现为一堆“杂乱无章”的数据。例例5.3.1 从某地区随机抽取从某地区随机抽取50户农民,调查其年收入情况,得户农民,调查其年收入情况,得到下列数据(每户人均元):到下列数据(每户人均元): 924 800 916 704 870 1040 824 690 574 490 972 988 1266 684 764 940 408 804 610 852 602 754 788 962 704 712 854 888 7

2、68 848 882 1192 820 878 614 846 746 828 792 872 696 644 926 808 1010 728 742 850 864 738试对该地区农民收入的水平和贫富悬殊程度做个大致分析.显然,如果不进行加工,面对这大堆大小参差不齐的数据,你很难得出什么印象.但是只要对这些数据稍事加工,便能作出大致分析:如记各农户的年收入为 , 则考虑 这样,我们可以从得出该地区农民平均人均收人水平属中等,从可以得出该地区农民贫富悬殊不大的结论.(当然还需要一些参照资料)由此可见对样本的加工是十分重要的. 对样本加工,这在数理统计学中往往通过构造一个合适的依赖于样本的函

3、数-统计量来达到.一、统计量的概念一、统计量的概念1.定义定义 定义定义4.3.1 样本 的一个函数如不含未知参数,则称之为统计量.通常记为. 如果样本容量为 ,它也就是 个随机变量的函数,并且要求这个函数是不依赖于任何未知参数的随机变量. 例如:总体 ,其中 为未知参数, 为取自总体的样本,则 ,均为统计量,但 不是统计量(因为 为未知参数).12,n 12( , ).nT T nn2,N212,nniiininiin1111,max,12.常用统计量常用统计量v定义定义4.3.2 若 是从总体 中取出的容量为 的样本,v统计量 称为样本均值;v统计量 称为样本方差;v统计量 称为样本的阶原

4、点矩;v统计量 称为样本的阶中心矩;12,n n11niin22221111()nnniiiiSnn nikiknA11kniiknB)(11若 是样本( )的一组观测值分别为样本均值 和样本方差 的观测值.设 为二维总体 的样本,则称统计量 为样本协方差;称统计量 为样本相关系数,其中 , . 将 中观测值 从小到大排列成 ,(若 = ,则其先、后次序可任意排),我们规定 为上述样本的这样一个函数:当样本 无论取得怎样一组观测值, 总取其中 为观测值,并称这样定义的 为第个 次序(顺序)统计量.其中特别地称 为最小顺序统计量; 为最大顺序统计量.若 是从总体 中取出的容量为 的样本 为样本中

5、位数.),(21nxxxn21,21221211)(1,1xxnxxnSxnxniiniinnii2nS1122( ,),(,),(,)nn ( , ) 1211()()niiiSn12SS S2211()niiSn2211niiSn12,n 12( ,)nx xx 12nxxxixjx i12,n i ix ii(1)1minii n ( )1maxnii n 12,n n1()2*()(1)22,1, 2nnnnMn为奇数为偶数二、统计量的分布二、统计量的分布 统计量是随机变量,统计量的分布称作抽样分布.下面讨论统计量的分布. 1.期望与方差的分布期望与方差的分布 定理定理4.3.1设总体

6、 的分布函数 具有二阶矩,即 .若 是取自总体的一个样本,则样本均值 的数学期望和方差分别为 . 利用期望和方差的性质很容易证明. 若假设总体的原点矩 和中心矩 都存在,则样本方差的数学期望和方差依次为 , .2. 分布分布 设 为相互独立的随机变量,它们都服从标准正态 分布,则称随机变量 服从自由度为 的 分布,记作 我们知道 分布具有可加性,即若 是 个相互独立的随机变量, , ,则. F x2,ED 12,n nDE2,kkE4 , 3 , 2 , 1,)(1kEkk221)(nnSEn3224222422423)2(2)(nnnSDn3221),cov(nnSn12,n ) 1 , 0

7、(N21niin2)(2n212,k k2()jjnkj2 , 1211()kkjjjjn 分布有下列基本性质: 设 ,则() , ;() 的密度函数为 其中 称为伽马函数,定义为 图5-3描绘了 分布密度函数在 时的图形.可以看出,随着 的增大, 的图形趋于“平缓”,其图形下面积的重心亦逐步往右下移动. 另外,费歇(R.A.Fisher)曾证明,当 较大时, 近似服从 . 图5-322( )n( )En( )2Dn0, 00,)(21)(21222xxexxpxnnn)(. 0,)(01dxexx)(2n20,10, 4 , 1nn)(xpn)(22n) 1 , 12(nN3. 分布和分布和

8、 分布分布 设 , , 与 独立,则称随机变量服从自由度为 的 分布,又称学生氏分布,记成 利用独立随机变量商的密度公式,不难由已知的 , 的密度公式得到 的密度: 显然它是 的偶函数,图5-4描绘了 时 的概率密度曲线,作为比较,还描绘了 的密度曲线. 图5-4tF(0,1)N2( )nTnnt)(ntT) 1 , 0(N)(2n)(ntxnxnnnxpn,)1 ()2()21()(212x5 , 2n)(nt) 1 , 0(N 利用伽马函数的斯特林公式可以证明从图形我们也可看出,随着 的增大, 的密度曲线与 的密度曲线越来越接近,一般若 ,就可认为它基本与 相差无几了. 设 , , 与 独

9、立,则称随机变量服从自由度为( , )的 分布,记成 类似可得, 的密度函数为图5-5描绘了几种 分布的密度曲线. 由 分布的定义容易看出,若 ,则 图5-5nexpx,21)(22n)(nt(0,1)N30n (0,1)N21()n22()n12nFn1n2nF),(21nnFF),(21nnF0, 00,)()2()2()2()(221122221212121121xxnxnxnnnnnnxpnnnnnFF),(21nnFF),(112nnFF 四、四、 分位数分位数 设 为一随机变量, 为其分布函数,我们知道对于给定的实数 , 给出了事件 的概率.在统计中,我们常常需要考虑上述问题的逆问

10、题:就是若已给定分布函数 的值,亦即已给定事件 的概率,要确定 取什么值.易知,对通常连续型随机变量,实际上就是求 的反函数,准确地说,有如下定义: 定义定义4.3.3 设 的分布函数为 , 满足则称 为 的 分位数(点). 若 有密度 ,则分位数 表示 以左的一块阴影面积(如图4-6)为 图4-6 几种常用分布 的分位点都在书后附表中可以查到.其中 是分布函数表 反过来查,而其它几个分布,则是分别对给出的几个 的常用值,如 =0,0.25,0.05,0.1,0.9,0.95,0.975等等,列出相应分布对应 值的分位点. F xx( )F xPxx)(xFxx F x F xx(),01F

11、xPxx F x)(xpxx),(),(),(),1 , 0(212nnFntnN) 1 , 0(N)(x 图4-7给出了四种常用分布的分位点表示方法,其中 的 分位点通常记成 . 图4-7 这里要注意到如下几个有用的事实.1) 若 ,要求 的分位数 可化成求的分位数 :此时 ,故 ,即 2) 对于 ,由密度函数的对称性可知即 .) 1 , 0(Nu2( ,)N x) 1 , 0(NxPxP(0,1)Nuxux)(ntT1)(1)()(ntTPntTPntTP)()(1ntnt3)对于 , 即 .4) 对于较大的 ,由 , 的渐近性质,可得或 . 利用这些事实可以扩展分位数表.例5.3.2 求

12、下列分位数:(1) ;(2) ;(3) ;(4) 解: (1) 从 表中,查不到 ,取表中接近的数应在0.8997与0.9015之间,从表头查出相应的 为1.28与1.29,故取 (2) 分布表没有 但利用对称性,可查出 ,故 (3)从 分布表中,查不到 ,可查出 ,故(4)表上查不到 ,需利用 分布与正态分布的关系查 出 ,),(21nnFF),(112nnFF21212111(,)(,)11(,)1.P FPF n nF n nFPF n nF ),(1),(12211nnFnnFn)(nt)(2n2( ),2( )21,tnunun22)12(21)(nun分位数的为其中。) 1 , 0

13、(,90Nuu)4(25. 0t)10,14(1 . 0F)50(2025. 0)(x9000. 0u285. 19 . 0ut25. 07407. 0)4(75. 0t7407. 0)4(25. 0tF)10,14(1 . 0F10. 2)10,14(9 . 0F.476. 010. 21)10,14(1 . 0F)50(2025. 0296. 1025. 0u29.31)150296. 1(21)50(22025. 0 五、五、 正态总体的抽样分布正态总体的抽样分布 在概率统计问题中,正态分布占据着十分重要的位置,这是基于一则在应用中,许多量的概率分布或者是正态分布,或者接近于正态分布;再

14、则,正态分布有许多优良性质,便于进行较深入的理论研究.因此,我们着重来讨论一下正态总体下的抽样分布,其中最重要的统计量自然是样本均值 和样本方差 定理定理5.3.2 (费歇定理) 设总体 服从 ,( )是取自这个总体的一组样本,则 服从正态分布 . 由正态分布的性质容易证得. 定理定理5.3.3 设 是正态总体 的一组样本,其样本均值与样本方差分别为 ,则1) 相互独立; 2) 服从自由度为 的 分布.证明略. 利用这一基本的抽样分布定理,可以得出一些常用统计量的分布,下面的结果以后经常要用到. 2S),(2Nn21,),(2nNn21,),(2Nniin112122121)(1niiniin

15、nnS_2,nS22nSn1n2推论1 设 为取自正态总体 的一个样本, 分别为样本均值与样本方差,则 是自由度为 的 变量,即它服从 分布.这是因为由定理5.3.2, ,则 ,又 及 与 独立知推论2 设 与 分别是从正态总体 抽取的两个样本且相互独立,并设 分别为这两个样本方差, 分别为这两个样本均值,则. 特别地当 时,则 .事实上,又已知出自两个总体的样本是独立的,因而n21,),(2N2_,nS1nnS1nt1t n)/,(2nN/n0,1N) 1(222nnS2S (1)11nTt nnSSnn12,n 212,n ),(),(222211NN121212,nn 与1212_222

16、212111211() ,()nnniniiiSSnn2112_1_1,1niiniinn) 1, 1() 1() 1(2121122222221121nnFnSnnSnFnn2221) 1, 1() 1(1(211222221121nnFnSnnSnFnn1222122222(1),(1)nnmSnSmn11222212122222(1)1(1,1)(1)1nnnnmSnmSmF mnnSmnSn推论3 设 与 分别是从正态总体 抽取的两个样本,且 与 相互独立,则随机变量 服从自由度 的t分布. 其中 分别为这两个样本的样本均值, 分别为这两个样本的样本方差,且 . , ,又 独立,故又 , ,由 的可加性知,再类似地利用定理5.3.3及两总体样本的独立性知, 与 独立,因而.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论