应用统计基本概念与抽样分布_第1页
应用统计基本概念与抽样分布_第2页
应用统计基本概念与抽样分布_第3页
应用统计基本概念与抽样分布_第4页
应用统计基本概念与抽样分布_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数理统计的基本概念与抽样分布数理统计的基本概念与抽样分布 例:某钢筋厂每天可以生产某型号钢筋10000根,钢筋厂每天需要对生产过程进行控制,对产品的质量进行检验。如果把钢筋的强度作为钢筋质量的重有指标,于是质量管理人员需要做如下方面的工作 第一,对生产出来的钢筋的强度进行检测,获得必要的数据。 第二,对通过抽样获取的部分数据进行整理、分析并推断出这10000根钢筋的质量是否合乎要求。1.2 总体、个体、样本总体、个体、样本 1.2.1 总体与个体 我们把所研究对象的全体称为总体或母体。组成总体的每个单元称为个体 总体X可看作一个随机变量 ,称X的概率分布为总体分布,称X的数字特征为总体的数字特

2、征 ,对总体进行研究就是对总体的分布或对总体的数字特征进行研究 .1.2.2 样本 从总体中抽取的一部分个体称为样本或者子样,其中所含个体的个数称为样本容量 . 样本具有二重性:随机性和确定性 定义1.1 设总体X的样本满足 独立性:每次观测结果既不影响其它结果,也不受其它结果的影响;即相互独立; 代表性:样本中每一个个体都与总体X有相同分布。则称此样本为简单随机样本。 进行有放回抽样就是简单随机样本 ,无放回抽样就不是简单随机样本。但N很大,n相对较小时无放回抽样得到的样本可以近似看作简单随机样本. 称样本的分布为样本分布。如果 为简单随机样本, 为总体X的分布函数,则样本分布有比较简单的形

3、式 它完全由总体X的分布函数确定 12(,)nXXX( )F x 它完全由总体X的分布函数确定 ),(),221121nnnxXxXxXPxxxF(1122() ()()nnP Xx P XxP Xx1( )niiF x )(),(121ininxfxxxfininnpxXxXxXP12211),(两种形式例1.1 设有一批产品,其次品率为p,如果记“ ”表示抽取一件产品是次品;“ ” 表示抽取一件产品是正品;那么,产品的质量就可以用X的分布来衡量。X服从0-1分布,参数就是次品率p。如果为简单随机样本,求样本分布. 解:总体X的概率分布为 ,)1 ()(1 xxppxXP0X1X 12(,)

4、nXXX所以的概率分布为iixxninnppxXxXxXP112211)1 (),(niiniixnxpp11)1 ( 例1.2 设总体X服从参数为 的正态分布,求样本 的分布密度。 解:总体X的分布密度为所以 的概率分布为 2, 12(,)nXXX22)(21,21)(xexfx12(,)nXXX212211( ,)() exp() )22nnif x xxx 统计量统计量 统计量的定义 定义1.2 设 为总体X的一个样本, 为 的连续函数,且不含有任何未知参数,则称T为一个统计量。 注:1.统计量是完全由样本确定的一个量,即样本有一个观测值时,统计量就有一个唯一确定的值 ; 2.统计量是一

5、个随机变量,它将高维随机变量问题转化为一维随机变量来处理 ,但不会损失所讨论问题的信息量.12(,)nXXX12(,)nTT XXXnXXX,21常见的统计量 1.样本均值 2.样本方差 3.k 阶原点矩4.k 阶中心矩 5.顺序统计量6.样本极差 与中位数(1)(n)(k)最大顺序统计量:X最小顺序统计量:X第K顺序统计量:X 例1.3 设总体X为连续型的,求最大顺序统计量与最小顺序统计量的分布密度 . 解: 最大顺序统计量 的分布函数为 )(nX),()()(21)()(xXxXxXPxXPxFnnnninixFxXP)()(1 最小顺序统计量 的分布函数为)(1)()()1()1()1(

6、xXPxXPxF121(,)nP Xx XxXx ninixFxXP)(1 1)(11 如果总体中服从均匀分布则( )00( )01nnnxxFxxx(1)00()( )101nnxxFxxx 其分布密度为其它00)(1)(xnxxfnnn其它00)()(1)1(xxnxfnn充分统计量例:某厂要了解其产品的不合格率p,检验员检查了10件产品,检查结果是,除前二件是不合格品(记为 )外,其它都是合格品(记为 )。当厂长问及检查结果时检验员可作如下两种回答: (1) 10件中有两件不合格; (2) 前两件不合格。 这两种回答反映了检验员对样本的两种不同的加工方法。其所用的统计量分别为1, 121

7、XXniXi, 4 , 3, 0 显然,第二种回答是不能令人满意的,因为统计量不包含样本中有关p的全部信息。而第一种回答是综合了样本中有关p的全部信息。因为样本 提供了两种信息: (1) 10次检验中不合格品出现了几次; (2) 不合格品出现在哪几次试验上。1011;IiXT212XXT),(1021XXX 第二种信息(试验编号信息)对了解不合格品率p是没有什么帮助的 . 充分统计量就是能把含在样本中有关总体或者参数的信息一点都不损失地提取出来。或者说充分统计量包含了有关总体或有关参数的全部信息. 考虑样本 的分布 ),(1021XXX111122101010101111010(,)()(1)

8、(1)(1)iiiixxiiiixxTTP Xx XxXxP Xxpppppp 由于 且 是服从二项分布故11112210101110101111010(,)()(1)(1)(1)iiiixxiiiixxttP Xx XxXxTtP Xxpppppp1T111101110()(1)tttP TtC pp 它与 无关p111111111112210101110101010101010(,|)(1)/(1)(1)/(1)1iixxtttttttttP Xx XxXxTtppC ppppC ppC定义1.3 设总体X的分布为一个含未知参数的分布族 , 是X的一个样本。 是一个统计量,对给定的t ,样

9、本 在的条件 下的条件分布与参数 无关,则称统计量T是参数 的充分统计量。:F),(21nXXX),(21nXXXTT),(21nXXXtT 上例的一般情况是 设 是来自0-1分布 的一个简单随机样本,其中 ,则 是 参数的充分统计量。 12(,)nXXXxxxXP1)1 ()(1 , 0 x01niiXT1 由定义可得定理1.1 设 是参数 的充分统计量, 是单值可逆函数,则 也是参数 的充分统计量。),(21nXXXTT)(ts)(Ts 当总体为连续型总体时,充分统计量要用条件分布密度来描述。奈曼(J.Neyman)和哈尔斯(P.R.Halmos)在20世纪40年代提出并严格证明了一个判别

10、充分统计量的方法:因子分解定理。 定理1.2 (因子分解定理)设样本的联合分布为一个含未知参数的分布族 ,则 是一个充分统计量当且仅当存在这样的两个函数: (1)与 无关的非负函数 ; (2)与 有关,且仅与统计量T的值有关的非负函数 使得 其中 在离散总体的情况下表示样本的分布列,在连续总体的情况下表示样本的分布密度。:),(,21nxxxf),(21nXXXTT),(21nxxxh),(21nxxxTg),(),(),(212121nnnxxxTgxxxhxxxf),(21nxxxf 例 设 是来自 分布,即它的分布密度为 的一个简单随机样本,其中 则 分别是参数 的充分统计量),(21n

11、XXX),(2N221()2,1( )2xfxe ,0 x ,0 21211,()nniiiiTX TXX2, 解:样本 的联合分布密度为如果令由因子分解定理知 是 的充分统计量。),(21nXXX222221222,()( ,)(2)exp()22nnTn Xfx xx 1),(21nxxxh12( ( ,)ng T x xx222222()(2)exp()22nTn X),(21TT),(2 例 设总体X的分布密度为 是X的一个简单随机样本,试证明最小顺序统计量 的充分统计量。),(21nXXX2);(xxfx0(1)X是证:样本 的联合分布密度为如果令由因子分解定理知 是 的充分统计量。

12、12(,)nXXX1212212( ,),0,()nnnnfx xxx xxx xx 122121( ,)( ,)nnh x xxx xx12( ( ,)ng T x xx(1),0nx (1)X1.4抽样分布 我们称统计量的分布为抽样分布 ,不同的统计量其分布不一定相同.常见的分布类型有: 正态分布正态分布 伽玛分布伽玛分布 卡方分布卡方分布 t 分布分布 F分布分布 伽玛分布伽玛分布定义1.4 如果连续型随机变量X的密度函数为其中 为 函数,则称X为服从参数是 的伽玛分布,记为 ,0, 00,)()(1xxexxfx0, 001)(dxexx,),(X 伽玛分布的性质伽玛分布的性质(1)由

13、此可得10()()( )( )kkxkxkE Xxedx2(),()E XD X (2) 如果 ,并且X和Y相互独立,容易求得 这个性质称为可加性,即伽玛分布具有可加性.12(, ),(, )XY ),(21YX 卡方分布卡方分布用构造性的方式定义是用构造性的方式定义是 定义定义1.5 设设 为相互独立的随机变为相互独立的随机变量,且均服从量,且均服从 ,则它们的平方和,则它们的平方和 也是一个随机变量,它所服从的分布称为自由度也是一个随机变量,它所服从的分布称为自由度为为n的的 分布,记为分布,记为 12,nXXX) 1 , 0(N222212nXXX)(22n2 它的密度函数为 其密度函数

14、与参数n有关,它的图形也有一定差异0, 00,)21)(2122(2xxexxfxnnn 卡方分布的性质卡方分布的性质若,则若,则即卡方分布是一种伽玛分布,因此具有伽玛即卡方分布是一种伽玛分布,因此具有伽玛分布的性质分布的性质()()()() 如果,并且如果,并且X和和Y相互独立,有相互独立,有 卡方分布也具有可加性卡方分布也具有可加性)(22n)21,2(2n2()EnnD2)(22212(),()XnYn)(212nnYX 例是来自参数为的指数分布总体,试证明: 12(,)nXXX)2(22nXn 总体的密度为当时,我们有密度为说明,0( ),00,0 xexf xx2021)2()2(x

15、xtedtexXPxXP0 x ,0, 00,21)(2xxexfx2 X)2(22X 假定子样是简单随机子样,则且它们之间相互独立,故有22(2)iX2122(2 )niin XXn t 分布分布构造性的方式定义定义1.6 设,且X与Y相互独立,记 则也是一个随机变量,它所服从的分布称为自由度为n的t分布,记为 ) 1 , 0( NX)(2nYnYXT )(ntT 它的密度函数为与参数n有关,不同的n其图形也有差异1221()2( )(1),( )2nnxf xxnnn 性质若则()当时,t分布是柯西分布,柯西分布不存在数学期望和方差参数为2的t分布也不存在数学期望和方差()时,)(ntT1

16、n2n ( )0,( )2nTD Tn ()可以证明这是标准正态分布的分布密度,即当n充分大时,T近似服从标准正态分布 221lim( )2xnf xe 分布分布构造性的方式定义定义1. 设,且X与Y相互独立,记 则也是一个随机变量,它所服从的分布称为自由度为(m,n)的F分布,记为 2( )Xm)(2nYX mFY n( , )FF m n 它的密度函数为它与m,n有关,其图形也有一定差异0, 00,)1 ()()2()2()2()(2122xxxnmxnmnmnmxfnmmm 容易得到若,则),(nmFF1( ,)F n mF 例设试证明:证明:由t分布的构造性定义知,存在相互独立的变量和

17、,使得于是,仍相互独立,由分布的定义知结论成立 ( ),Tt n2(1, )TFnnYXT 2221XXTY nY n2XY与 分位数:定义1.6 设X为连续型随机变量,其分布函数为 ,对,如果存在数 满足 则称为此分布的分位数分位数的几何意义 可用图形表示,它的值可查表得到,不同的分布有不同的分位数,有不同的表可查)(xf10 xdxxfxXP)()(xx 常见的分位数有它们的值可以通过附表1、附表2、附表3、附表4 查得 2,( ),( ),( , )Zn tn Fm n 分位数具有性质(1)(2)(3)当n 足够大时(一般n 45)有近似公式 )()(,11ntntZZ),(1),(1m

18、nFnmF2( ),2tnZnnZ例:查表求下列分位数的值0.050.9752220.050.990.050.050.990.050.050.99,(10),(10),(50)(10),(10),(100)(9,10),(9,10),ZZtttFF 抽样分布定理 定理1.1 设总体 , 为X的一个简单随机样本, 为样本均值与样本方差,则有: (1) (2),(2NX12(,)nXXX2,SX),(2nNX);1() 1(222nsn (3) 相互独立; (4) 2XS与) 1(ntnSX 定理1.2 设有两个总体与,从两个总体与中分别独立抽取容量为m,n的简单随机样本记为样本的样本均值与方差,为样本的样本均值与方差,则() ),(211NX),(222NY),(21mXXX),(21nYYY2,XSX),(21mXXX),(21nYYY2,YSY) 1 , 0()()(222121NnmYX()()若则其中) 1, 1(222212nmFSSYX

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论