-《统计学》第9章抽样与抽样估计_第1页
-《统计学》第9章抽样与抽样估计_第2页
-《统计学》第9章抽样与抽样估计_第3页
-《统计学》第9章抽样与抽样估计_第4页
-《统计学》第9章抽样与抽样估计_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第九章抽样与抽样估计第1节 抽样样与抽样样分布一、有关关抽样的的基本概概念总体(Population)研究对象象的全体体称为总总体样本(子子样)(Sample)从总体中中抽取一一部分个个体进行行试验或或观察,这种从从总体中中抽取个个体的行行为称为为抽样。而从总总体中抽抽样所得得的一部部分个体体叫样本本总体参数数(Population parameter)描述总体体分布特特征的数数值样本统计计量(Samplestatistic)抽样方法法重置抽样样(重复抽抽样)(Samplingwithreplacement)要从总体体N个单位中中随机抽抽取一个个容量为为n的样本,每次从从总体中中抽取一一个单位

2、位,把顺顺序号登登记下来来之后,重新放放回参加加下一次次抽选,连续反反复抽取取n次组成所所要求容容量的样样本。不重置抽抽样(不重复复抽样)(Samplingwithoutreplacement)要从总体体N个单位中中随机抽抽取一个个容量为为n的样本,每次次从总总体中抽抽取一个个单位,被抽中中的单位位不再放放回参加加下一次次抽选,连续进进行次便便组成样样本。不重复抽抽样所得得样本对对总体的的代表性性较大,抽样误误差较小小,所以以实践中中通常采采用不重重复抽样样。抽样的组织方方式简单随机机抽样:从总体中中抽取样样本最常常用的方方法。从从容量为为N的总体中中进行抽抽样,如如果容量量为n的每个可可能样

3、本本被抽到到的可能能性相等等,则称称容量为为n的样本为为简单随随机样本本。分层抽样样:也称称分类抽抽样或类类型抽样样,它是是按某个个主要标标志对总总体各单单位进行行分类,然后从从各层中中按随机机原则分分别抽取取一定数数目的单单位构成成样本。整群抽样样:也称称丛聚抽抽样或集集团抽样样。它是是将总体体分为若若干部分分(每一部分分称为一一个群),然后按按随机原原则从中中一群一一群地抽抽选,对对抽中群群内的所所有单位位进行全全面调查查。系统抽样样也称机机械抽样样。它是是先将总总体单位位按一定定顺序排排队,计计算出抽抽样间隔隔(或抽抽样距离离),然然后按固固定的顺顺序和间间隔抽取取样本单单位。总体分布布

4、(population distribution)样本分布布(sampledistribution)一个样本本中各观观察值的的分布也称经验验分布当样本容容量n逐渐增大大时,样样本分布布逐渐接接近总体体的分布布样本二、抽样样分布(Samplingdistribution)1、抽样分分布的意意义对统计量量的所有有可能取取值及其其对应概概率的描描述,就就是统计计量的抽抽样分布布,即抽样分布布。抽样分布布反映样样本统计计量的分分布特征征,根据据抽样分分布的规规律,可可揭示样样本统计计量与总总体参数数之间的的关系,计算抽抽样误差差,并说说明抽样样推断的的可靠程程度。抽样误差差:误差差登记性误误差代表性误

5、误差系统性误误差随机性误误差登记性误误差是指指在调查查和汇总总过程中中由于观观察、测测量、登登记、计计算等方方法的差差错或被被调查者者提供虚虚假资料料而造成成的误差差。任何何一种统统计调查查都可能能产生登登记性误误差。代表性误误差是指指用样本本指标推推断总体体指标时时,由于于样本结结构与总总体结构构不一致致、样本本不能完完全代表表总体而而产生的的误差。系统性误误差是指指由于非非随机因因素引起起的样本本代表性性不足而而产生的的误差,表现为为样本估估计量的的值系统统偏低或或偏高。随机性误误差又称称偶然性性误差,是指遵遵循随机机原则抽抽样,由由于随机机因素(偶然性性因素)引起的的误差。抽样估估计中的

6、的所谓抽抽样误差差,就是是指的这这种随机机误差。抽样误差差登记性误误差:存存在于一一切调查查中代表性误误差:仅仅产生于于抽样调调查,不不可避免免。代表性误误差抽样误差差在实际际一次调调查中是是调查不不出来的的,但其其平均值值是可以以推算的的系统性误误差:不不随样本本量增减减而变化化随机误差差(抽样样误差):随样样本量增增大而减减小抽样平均均误差和和抽样极极限误差差抽样平均均误差:所有可可能的样样本指标标与总体体指标间间的平均均差异程程度。抽样极限限误差样本指标标与总体体指标之之间允许许的误差差范围叫叫抽样极极限误差差。也称称抽样允允许误差差。它是样本本指标可可允许变变动的上上限或下下限与总总体

7、指标标之差的绝绝对值。即:落在总体体均值某某一区间间内的样样本X95.45% 的样本99.73% 的样本x- 368.27%的样本x- 2x- X+ 3X+2X+ x大数定律律及中心心极限定定理重复抽样样:(1)总体是是正态分分布,样样本必然然是正态态分布(2)样本平平均数的的平均数数等于总总体平均均数(3)样本平平均数的的方差等等于总体体方差除除以样本本容量n(4)n越大,样样本平均均数越趋趋近于正正态分布布例:样本本均值的的抽样分分布【例】设一个总总体,含有4个元素(个体),即总体体单位数数N=4。4个个体分分别为X1=1、X2=2、X3=3、X4=4。总体的的均值、方差及及分布如如下总体

8、分布14230.1.2.3均值和方方差现从总体体中抽取取n2的简单随随机样本本,在重重复抽样样条件下下,共有有4*4=16个样本。所有样样本的结结果为3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n = 2 的样本(共16个)计算出各各样本的的均值,如下表表。并给给出样本本均值的的抽样分分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值X样本均值的抽样分布1.00.1.2.3P (X )1.

9、53.04.03.52.02.5样本均值值的分布布与总体体分布的的比较= 2.52=1.25总体分布布14230.1.2.3抽样分布P ( X )1.00.1.2.31.53.04.03.52.02.5X大数定律律及中心心极限定定理不重复抽抽样:(1)总体是是正态分分布,样样本必然然是正态态分布(2)样本平平均数的的平均数数等于总总体平均均数(3)样本平平均数的的方差等等于总体体方差除除以样本本容量n(4)n越大,样样本平均均数越趋趋近于正正态分布布抽样平均均误差(1)均值重复抽样样:不重复抽抽样:抽样平均均误差(1)比例重复抽样样:不重复抽抽样:影响抽样样误差大大小的因因素是:总体被研研究标

10、志志的变异异程度。在其他条条件不变变的情况况下,总总体标志志的变异异程度愈愈小,则则抽样误误差也愈愈小;总总体标志志的变异异程度愈愈大,则则抽样误误差也愈愈大。抽样单位位数的多多少。在其他条条件不变变的情况况下,抽抽样单位位数愈多多,抽样样误差愈愈小;抽抽样单位位数愈少少,抽样样误差愈愈大。抽样的方方法。在其他条条件不变变的情况况下,重重复抽样样的抽样样误差大大于不重重复抽样样。抽样的组组织形式式。抽样误差差的大小小与样本本单位数数的平方方根成反反比:如如果抽样样误差要要减少二二分之一一,则样样本单位位数必须须增大到到4倍。例、从某某校1000名学生中中简单随随机抽取取50名学生,称得平平均体

11、重重为50千克,若若已知总总体标准准差为10千克,计计算重复复抽样及及不重复复抽样下下抽样平平均误差差。解:重复复抽样条条件下,不重复抽抽样条件件下,在样本量量相同的的情况下下,不重重复抽样样的平均均误差要要小于重重复抽样样的平均均误差。第3节 总体体平均数数和总体体比例的的估计抽样估计计必须包包括三要要素:1)估计值值2)估计值值的误差差范围3)概率保保证程度度(置信信度)一、点估计(Pointestimate)点估计也也称定值值估计,常用点点估计方方法有矩矩估计,极大似似然估计计。样本均值值是总体体均值的的点估计计量,样样本方差差s2是总体方方差2的点估计计量,样样本比例例p是总体比比例P

12、的点估计计量。优良估计计量的标标准:无无偏偏性有有效效性一一致致性区间估计计就是根据据样本求求出总体体未知参参数的估估计区间间,并使使其可靠靠程度达达到预定定要求。(1)总体方差差2已知时由于,所以对对于给定定的置信信度1-,有即 可见,极极限误差差的计算算公式为为则总体均均值的置置信区间间为例:从某某大学学学生中随随机抽取取100名调查体体重情况况。经称称量和计计算,得得到平均均体重为为58千克。根根据过去去的资料料知道大大学生体体重的标标准差是是10千克。在在95%的置信水水平下,求该大大学学生生平均体体重的置置信区间间。解:已知知=58,=10,z/2=1.96,n=100=10/10=

13、1(千克)=1.961=1.96(千克)置信下限限为58-1.96=57.04,置信上限限为58+1.96=59.96故所求置置信区间间为(57.04,59.96)千克。(2)总体方差差2未知时由于t(n-1),对于给给定的置置信度1-,有置信下限限置置信上限限在大样本本下,总总体均值值的置信信区间为为例:某保保险公司司投保人人年龄设设某保险险公司投投保人年年龄呈正正态分布布,现从从中抽取取10人,其年年龄分别别为:32,50,40,24,33,44,45,48,44,47岁。试以以95%的置信水水平估计计该保险险公司投投保人的的平均年年龄。解:当置信度度为95%时,=2.26222.6544

14、=6.00(岁)因为40.7-6.00=34.740.7+6.00=46.7所以该保保险公司司投保人人的平均均年龄的的置信区区间为(34.7,46.7)岁。总体比例例的区间间估计在大样本本条件下下,若np5,n(1-p) 5,则样本本比例趋趋近于正正态分布布。对于给定定置信度度,有总体比例例的置信信区间为为小样本条条件下,不作介介绍。例:总体体比例的的区间估估计【例】某城市想想要估计计下岗职职工中女女性所占占的比例例,随机机抽取了了100个下岗职职工,其其中65人为女性性职工。试以95%的置信水水平估计计该城市市下岗职职工中女女性比例例的置信信区间解:已知n=100,p65%, 1-=95%,

15、z/2=1.96该城市下下岗职工工中女性性比例的的置信区区间为55.65%74.35%例:某厂厂对一批批产品进进行质量量检验,随机重重复抽取取样品100只,样本本合格品品率为95,试计计算把握握程度为为90的合格格品率置置信区间间。解:已知知n=100,p=95%,1-=90%,查表得得z/2=1.96=0.0218p=z/2=1.960.0218=0.0359或3.59%95%-3.59%=91.41%,95%+3.59%=98.59%故该批产产品合格格率的置置信区间间为(91.41%,98.59%)第5节样样本容量量的确定定在重复抽抽样下,所以,必必要抽样样单位数数在不重复复抽样下下,必要

16、要抽样单单位数 例:某市市进行职职工家庭庭生活费费抽样调调查,已已知职工工家庭平平均每人人每月生生活费收收入的标标准差为为110元,允许许误差范范围10元,概率率把握程程度95%,试确定定应抽选选的户数数。解解:【例】拥有工商商管理学学士学位位的大学学毕业生生年薪的的标准差差大约为为2000元,假定定想要估估计年薪薪95%的置信区区间,希希望边际际误差为为400元,应抽抽取多大大的样本本容量?解:影响必要要抽样数数目的因因素(1)允许误误差范围围。当其它它条件不不变时,允许误误差愈小小,必要要的抽样样单位数数就需要要愈多;反之,允许误误差愈大大,抽样样单位数数就可以以愈少。(2)总体方方差2。

17、其他条条件不变变的情况况下,总总体方差差2愈大,总总体单位位的差异异程度愈愈大,则则样本单单位数应应愈多;反之,样本单单位数可可愈少。(3)抽样估估计的可可靠程度度1-。当其他他条件不不变时,抽样估估计的可可靠程度度愈高,z/2数值愈大大,抽样样数目就就必须愈愈多;反反之,抽抽样估计计的可靠靠程度愈愈低,抽抽样数目目就可以以愈少。(4)抽样方方法。相相同条件件下,由由于采用用重复抽抽样比不不重复抽抽样的误误差大,所以,前者应应比后者者多抽一一些样本本单位。除上述因因素之外外,抽样样组织方方式也是是影响抽抽样单位位数的一一个原因因 。本章小结结总体分布布、样本本分布、抽样分分布单总体参参数推断断

18、时样本本统计量量的分布布参数估计计的一般般问题一个总体体参数的的区间估估计样本容量量的确定定期末考试试大纲第九章抽抽样样与抽样样估计抽样调查查中的基基本概念念;总体体均值与与成数的的简单估估计;必必要样本本量的计计算不作作考试要要求。知识重点点:抽样方法法重置抽样样不重置抽抽样注意:不重复抽抽样所得得样本对对总体的的代表性性较大,抽样误误差较小小,所以以实践中中通常采采用不重重复抽样样。抽样的组织方方式简单随机机抽样:分层抽样样:整群抽样样:系统抽样样也称机机械抽样样。误差:误差差登记性误误差代表性误误差系统性误误差随机性误误差抽样平均均误差(1)均值重复抽样样:不重复抽抽样:抽样平均均误差(

19、2)比例重复抽样样:不重复抽抽样:影响抽样样误差大大小的因因素是:总体被研研究标志志的变异异程度。抽样单位位数的多多少。抽样的方方法。抽样的组组织形式式。(1)总体方差差2已知时总体均值值的置信信区间为为区间估计计其中极限限误差为为(2)总体方差差2未知时总体均值值的置信信区间为为其中极限限误差为为总体比例例的区间间估计总体比例例的置信信区间为为第5节样样本容量量的确定定在重复抽抽样下,所以,必必要抽样样单位数数在不重复复抽样下下,必要要抽样单单位数 影响必要要抽样数数目的因因素(1)允许误误差范围围。当其它它条件不不变时,允许误误差愈小小,必要要的抽样样单位数数就需要要愈多;反之,允许误误差

20、愈大大,抽样样单位数数就可以以愈少。(2)总体方方差2。其他条条件不变变的情况况下,总总体方差差2愈大,总总体单位位的差异异程度愈愈大,则则样本单单位数应应愈多;反之,样本单单位数可可愈少。(3)抽样估估计的可可靠程度度1-。当其他他条件不不变时,抽样估估计的可可靠程度度愈高,z/2数值愈大大,抽样样数目就就必须愈愈多;反反之,抽抽样估计计的可靠靠程度愈愈低,抽抽样数目目就可以以愈少。(4)抽样方方法。相相同条件件下,由由于采用用重复抽抽样比不不重复抽抽样的误误差大,所以,前者应应比后者者多抽一一些样本本单位。除上述因因素之外外,抽样样组织方方式也是是影响抽抽样单位位数的一一个原因因 。练习:某电子元元件厂生生产A型号的电电子管,现从10000件产品中中,抽取取100件进行检检验,结结果是60件合格。计算合合格品率率的抽样样平均误误差。练习:对对一批电电子元件件进行耐耐用性能能的检查查,随机机重置抽抽样方法法选取100件作耐用用测试,所得结结果的分分组资料料如下:耐用时数(小时)组中值(x)件数(f)900以下 875 1900950 925 29501000 975 6100010501025 35105011001075 43110011501125 91150

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论