抽样与抽样分布_第1页
抽样与抽样分布_第2页
抽样与抽样分布_第3页
抽样与抽样分布_第4页
抽样与抽样分布_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第十章 抽样与抽样分布第一节 抽样与抽样分布 第二节 参数估计的基本方法第三节 总体参数的区间估计第一节抽抽样与抽抽样分布布一、抽样样判断二、抽样样方法三、抽样样分布一、抽样判断断什么叫叫抽样判判断从所研究究的总体体全部元元素(单单位)中中抽取一一部分元元素(单单位)进进行调查查,并根根据样本本数据所所提供的的信息来来推断总总体的数数量特征征叫样本本推断。二、抽样样方法根据抽取取样本的的原则不不同,抽抽样方法法有概率抽样样和非概概率抽样样。概率抽样样的常用用方法有有:1、简单随机机抽样2、分层抽样样3、整群抽样样1、简单单随机抽抽样从总体体N个单位中中随机地地抽取n个单位作作为样本本,使得每一

2、一个容量量为n的样本都都有相同的机机会(概率)被抽中抽取元元素的具具体方法法有重复复抽样和和不重复复抽样特点:简单、直直观,在在抽样框框完整时时,可直直接从中中抽取样样本局限性性当N很大时,不易构构造抽样样框,抽抽出的单单位很分分散,给给实施调调查增加加了困难难,没有有利用其其他辅助助信息以以提高估估计的效效率2、分层层抽样将抽样样单位按按某种特特征或某某种规则则划分为为不同的的层,然然后从不不同的层层中独立立、随机机地抽取取样本优点保证样本本的结构构与总体体的结构构比较相相近,从从而提高高估计的的精度组织实施施调查方方便既可以对对总体参参数进行行估计,也可以以对各层层的目标标量进行行估计3、

3、整群抽样样将总体体中若干干个单位位合并为为组(群群),抽抽样时直直接抽取取群,然然后对中中选群中中的所有有单位全全部实施施调查特点抽样时只只需群的抽样框框,可简简化工作作量调查的地地点相对对集中,节省调调查费用用,方便便调查的的实施缺点是估估计的精精度较差差三种不同同性质的的分布1、总体分布布2、样本分布布3、抽样分布布三者之间间有什么么关系?1、总体分布布1)总体体中各元元素的观观察值所所形成的的相对频频数(频频率)分分布2)分布布通常是是未知的的(因为为几乎得得不到总总图所有有观察值值)3)可以以(根据据理论分分析)假假定它服服从某种种分布总体2、样本分布布1)一个个样本中中各观察察值的形

4、形成的相相对频数数(频率率)分布布2)也称称经验分分布3)当样样本容量量n逐渐增大大时,样样本分布布逐渐接接近总体体的分布布3、抽样分布布1)样本统统计量的的概率分分布,是是一种理理论分布布在重复复选取容容量为n的样本本时,由由该统计计量的所所有可能取值形形成的相相对频数数分布2)样本统统计量是是样本的的函数,依据不不同的样样本计算算出来的的值是不不同的所所以统计计量是随随机变量量样本均值值,样本比例例,样本本方差等等3)结果来来自容量量相同的的所有可可能样本本4)提供了了样本统统计量长长远而稳稳定的信信息,是是进行推推断的理理论基础础,也是是抽样推推断科学学性的重重要依据据(1)总总体分布布

5、、样本本均值的的抽样分分布【例】设一个总总体,含含有4个个元素(个体) ,即即总体单单位数N=4。4 个个个体分别别为x1=1,x2=2,x3=3,x4=4。总体体分布、总体的均均值、方方差及分分布如下下总体分布14230.1.2.3现从总体体中抽取取n2的简简单随机机样本,在重复复抽样条条件下下,共有有42=16个个样本。所有样样本的结结果为3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n = 2 的样本(共16个)计算出各各样本的的均值,如下表表。并给给出样本本均值的的抽样分分布3.53.0

6、2.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值( )x样本均值的抽样分布1.000.10.20.3P ( x )1.53.04.03.52.02.5样本均值值的分布布与总体体分布的的比较的分布形形式与原原有总体体和样本本容量n的大小小有关总体分布布14230.1.2.3抽样分布P ( x )1.00.1.2.31.53.04.03.52.02.5x= 2.52=1.25当总体服服从正态态分布N(,)时,样本均值值的抽样样分布仍仍然是服服从正态态分布的的,其均均值仍为为,方差为为,即即样本均均值的方方差

7、比原原总体的的方差要要小,而而且样本本容量n越大,方差越越小。 = 2.52 =1.25X总体分布上述结论论是对正正态总体体而言的的,不过过实际上上,即使使对于非非正态总总体而言言,随着着样本容容量的增增加,的的抽样分分布也会会近似地地变成正正态的。事实上上,只要要样本足足够大(通常要要求样本本容量不不小于45),即使是是从非正正态分布布的总体体中抽样样,根据据统计学学中的中中心极限限定理,样本均均值的抽抽样分布布与从正正态分布布总体中中的抽样样所得到到的结果果也近似似相同。总结:样样本均值值的抽样样分布样本均值值的数学学期望仍仍为样本均值值的方差差(方差的概概率意义义在于刻刻画了随随机变量量

8、取值的的分散程程度。方方差越小小,随随随机变量量的取值值越集中中在期望望值附近近。)重复抽样样不重复抽抽样(2)样样本比例例的抽样样分布总体中具具有某种种属性的的单位数数与总体体全部单单位数之之比称为为总体比比例,也也称总体体的成数数,记作作 P。而样本本中具有有某种属属性的单单位数与与样本总总数之比比称为样样本比例例,或称称样本成成数,记记作p。若从总体体中随机机抽取出出容量为为n的样样本,发发现其中中具有某某种属性性的单位位数为m,则样样本中具具有某种种属性的的单位的的比例就就为p=m/n样本比例例是一个个随机变变量,当当样本容容量很大大时,近近似地服服从正态态分布。其分布布的数学学期望为

9、为总体的的成数,方方差等于于,即:第二节参参数估估计的基基本方法法参数估计计也就是是用样本本统计量量去估计计总体的的参数。比如,用样本本均值估估计总体体均值估估计总体体均值,用样本本方差估估计总体体方差,用样本本比例估估计总体体比例等等。用来估计计总体参参数的统统计量的的名称,称为估估计量,用符号号表表示用来估计计总体参参数时计计算出来来的估计计量的具具体数值值,称为为估计值值点估计与与区间估估计参数估计计的方法法有点估估计和区区间估计计(一)点估计计点估计又又称定值值估计。它是用用实际样样本指标标数值代代替总体体指标数数值,即即总体平平均数的的点估计计值就是是样本平平均数,总体成成数的点点估

10、计值值就是样样本成数数。这种种估计不不考虑是是否有抽抽样误差差。例如,对对一批某某种型号号的电子子元件10000只进进行耐用用时间检检查,随随机抽取取100只,测测试的平平均耐用用时间为为1055小时时,合格格率为91%,我们推推断说10000只电电子元件件的平均均耐用时时间为1055小时,全部电电子元件件的合格格率也是是91%。评价估计计量的标标准用于估计计的估估计量很很多,究究竟用样样本的哪哪种估计计量作为为总体参参数的估估计呢?统计学家家给出了了一些标标准:(一)无无偏性。即以抽抽样指标标估计全全及指标标要求抽抽样指标标值的平平均数等等于被估估计的全全及指标标本身。(二)一一致性。即当样

11、样本容量量n充分分大的时时,若样样本指标标充分地地靠近被被估计的的全体指指标,则则该样本本指标是是被估计计的全体体指标的的一致估估计量。(三)有有效性。即如果果一个样样本估计计量的方方差比其其他估计计量的方方差小,则称该该样本估估计量是是被估计计的全及及指标的的有效估估计量。(二)区区间估计计区间估计计所表明明的是一一个可能能范围,不是一一个绝对对可靠的的范围。是用样样本指标标和它的的抽样极极限误差差构成的的区间来来估计总总体指标标,并以以一定的的概率保保证总体体指标将将在所估估计的区区间内。第三节总总体体参数的的区间估估计一、总总体均值值的区间间估计二、总体体比例的的区间估估计一、总体体均值

12、的的区间估估计1、区间间估计的的基本原原理根据样样本平均均数的分分布特征征可知:p(x-x-Xx+x)= F(t)在概率保保证程度度为F(t),概率度度为t的的情况下下,总体体平均数数的数值值将在x-x和x+x的的范围内内。其中中,x-x称称为估计计下限,x+x称为为估计上上限。区区间x-x,x+x称为置置信区间间 。估计可可靠性程程度称为为置信度度。如果我我们将构构造置信信区间的的步骤重重复多次次,置信信区间中中包含总总体参数数真值的的次数所所占的比比率称为为置信水水平。当总体服服从正态态分布且且方差已已知时,或者总总体不是是正态分分布且方方差未知知但大样样本,在在这种情情况下,样本均均值的

13、抽抽样分布布均为正正态分布布,其数数学期望望是方方差是根据正态态分布的的性质可可以得出出总体均均值所所在的区区间为:如果总体体方差未未知,大大样本条条件下,则可以以用样本本方差代代替总体体方差,这时时总体均均值在1-置信水平平下的置置信区间间可以写写为如果是采采取不重重复抽样样,而且且抽样比比很大时时,则样样本分布布的方差差应乘以以修正系系数,这时时总体均值值在1-置置信信水平下下的置信信区间可可以写为为: 当总体方方差未未知时时,总体体均值在在1-置置信水水平的置置信区间间可以写写为:(二)总总体成数数的估计计区间总体成数数的区间间估计原原理与总总体平均均数相同同,即:在概率率保证程程度为F(t),概率率度为t的情况况下,总总体成数数的数值值将在p-p和p+p的的范围内内。其中中p-p称为为估计下下限,p+p称为估估计上限限。区间间p-p,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论