第5章抽样分布与参数估计ppt课件_第1页
第5章抽样分布与参数估计ppt课件_第2页
第5章抽样分布与参数估计ppt课件_第3页
第5章抽样分布与参数估计ppt课件_第4页
第5章抽样分布与参数估计ppt课件_第5页
已阅读5页,还剩66页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、n 抽样调查的含义抽样调查的含义n 抽样调查的分类抽样调查的分类n 抽样调查的特点抽样调查的特点n 抽样调查的运用抽样调查的运用n 样本单位的抽选方法样本单位的抽选方法n 抽样调查的组织方式抽样调查的组织方式n 抽样调查中的几个根本概念抽样调查中的几个根本概念n 抽样推断中的实际根据抽样推断中的实际根据前往按照一定的程序按照一定的程序, ,从所研讨对象的全体从所研讨对象的全体总体中抽取一部分单位样本进展总体中抽取一部分单位样本进展调查,根据样本资料的估计值,对总体待调查,根据样本资料的估计值,对总体待估参数作出具有一定可靠程度的估计和推估参数作出具有一定可靠程度的估计和推断,以反映总体的数量特

2、征或数量表现。断,以反映总体的数量特征或数量表现。计算样本统计量计算样本统计量如:样本均值、如:样本均值、比例、方差比例、方差n 总体分布总体分布n 样本分布样本分布n 抽样分布抽样分布前往前往前往前往本章主要讨论随机抽样的原理和方法本章主要讨论随机抽样的原理和方法前往前往前往把上述两种分类结合起来,便构成可供选择的把上述两种分类结合起来,便构成可供选择的四种抽样方法:四种抽样方法: 但在抽样调查实际中,通常只讨论思索顺序但在抽样调查实际中,通常只讨论思索顺序的反复抽样及不思索顺序的不反复抽样两种的反复抽样及不思索顺序的不反复抽样两种情形下的能够样本数目。情形下的能够样本数目。 不思索顺序不思

3、索顺序思索顺序思索顺序不反复抽样不反复抽样反复抽样反复抽样不反复抽样不反复抽样反复抽样反复抽样!nNNANnnnNBN!nNNCnNn1nnNN nDC 前往12KnnniiNnnNiiiiiNnnN 1Kiinn 1N2NKN1n2nKn排序根据的标志:排序根据的标志:1无关标志;无关标志;2有关标志有关标志n 分层抽样:层内是抽样调查分层抽样:层内是抽样调查 , 层间是全层间是全面调查面调查n 整群抽样:群内是全面调查整群抽样:群内是全面调查 , 群间是抽群间是抽样调查样调查例:总体群数例:总体群数R=16 样本群数样本群数r=4 样本容量样本容量ABCDEFGHIJKLMNOPLHPDd

4、plhnnnnnn 例:在某省例:在某省100多万农户抽取多万农户抽取1000户调查户调查农户消费性投资情况。农户消费性投资情况。n 第一阶段:从省内部县中抽取第一阶段:从省内部县中抽取5个县;个县;n 第二阶段:从抽中的第二阶段:从抽中的5个县中各抽个县中各抽4个乡;个乡;n 第三阶段:从抽中的第三阶段:从抽中的20个乡中各抽个乡中各抽5个村;个村;n 第四阶段:从抽中的第四阶段:从抽中的100个村中各抽个村中各抽10户。户。样本样本n=10010=1000户户前往 普通普通 时,称为大样本;时,称为大样本; 时,称为小样本时,称为小样本30n 30n 对于某一研讨对象,当研讨目确实定时,全

5、及总体对于某一研讨对象,当研讨目确实定时,全及总体是确定的,样本总体是不确定的。是确定的,样本总体是不确定的。总体平均数总体均值:总体平均数总体均值:总体成数:总体成数:总体规范差:总体规范差:XXFXNF或1NPN22()()XXXXFNF或(1)PPN1是总体中具有某种特性个体数目是总体中具有某种特性个体数目针对数量标志针对数量标志针对能否标志针对能否标志样本平均数样本均值:样本平均数样本均值:样本成数:样本成数:样本规范差:样本规范差:xxfxnf或1npnn1是样本中具有某种特性个体数目是样本中具有某种特性个体数目22()()11xxxxfsnf或(1)spp对于某一研讨对象,当研讨目

6、确实定时,总体目的对于某一研讨对象,当研讨目确实定时,总体目的是确定的,样本目的是不确定的。是确定的,样本目的是不确定的。数量标志数量标志能否标志能否标志前往 从正态分布的再生定理可以看出,只需从正态分布的再生定理可以看出,只需总体变量服从正态分布,那么从中抽取的样总体变量服从正态分布,那么从中抽取的样本,不论本,不论n是多少,样本平均数都服从正态分是多少,样本平均数都服从正态分布。布。 但是在客观实践中,总体并非都是正态但是在客观实践中,总体并非都是正态分布。对于从非正态分布的总体中抽取的样分布。对于从非正态分布的总体中抽取的样本平均数的分布问题,需求由中心极限定理本平均数的分布问题,需求由

7、中心极限定理来处理。来处理。前往本章中即本章中即: xXpP只需只需 ,那么样本目的同总体目的之间,那么样本目的同总体目的之间就有不同,即利用样本推断总体存在误差。就有不同,即利用样本推断总体存在误差。nN 抽样误差是由于抽样呵斥的误差,是抽样误差是由于抽样呵斥的误差,是由于用样本估计总体而产生的误差,无法由于用样本估计总体而产生的误差,无法防止,在概率抽样中,抽样误差事先可以防止,在概率抽样中,抽样误差事先可以计算并控制。计算并控制。2总体方差越大各调查单位标志值之间的差别越大各调查单位标志值之间的差别越大抽样分布越分散抽样分布越分散抽样误差越大抽样误差越大20当总体方差为即总体内各调查单位

8、标志值之间即总体内各调查单位标志值之间无差别,那么不存在抽样误差无差别,那么不存在抽样误差样本容量是影响抽样误差大小最直接、最有效的样本容量是影响抽样误差大小最直接、最有效的要素;要素;其他条件一样时,反复抽样误差不反复抽样的误差其他条件一样时,反复抽样误差不反复抽样的误差从抽样方式上看,简单随机抽样、分层抽样、从抽样方式上看,简单随机抽样、分层抽样、系统抽样、整群抽样与多阶段抽样的抽样误差系统抽样、整群抽样与多阶段抽样的抽样误差也有区别。也有区别。其他条件一样时,其他条件一样时,n 越接近越接近 N,误差越小。,误差越小。抽样实践误差指抽样估计值与总体目的值之间的离抽样实践误差指抽样估计值与

9、总体目的值之间的离差,表示为:差,表示为:xX或或pP抽样平均误差指一切能够样本抽样误差的平均数抽样平均误差指一切能够样本抽样误差的平均数, 是抽样误差的普通程度。是抽样误差的普通程度。本章中主要讲述:本章中主要讲述:xp22xsnn(1)(1)pPPppnn21xsNnnN修正系数修正系数当当 N 很大时,通常大于很大时,通常大于 500,N-1 近似为近似为N,此时,此时221xsNnsnnNnN抽样比抽样比同理可得:同理可得: (1)1pppNnnN(1)1pppnnN当当 N 很大时很大时/2/2/2xxppuuu 即抽样极限误差是指以样本估计总体在某种概率意义抽样极限误差是指以样本估

10、计总体在某种概率意义下所允许的最大误差范围,是估计的精度。下所允许的最大误差范围,是估计的精度。xpxXpP 通常用“ ”来表示 抽样极限误差与抽样平均误差之比的系数称抽样极限误差与抽样平均误差之比的系数称为抽样概率度为抽样概率度 , 记为记为 t。样本容量较大时,。样本容量较大时,t分布分布与正态分布差别不大,用与正态分布差别不大,用 表示。表示。/2u也叫定值估计,是以所抽样本资料为根据,直接也叫定值估计,是以所抽样本资料为根据,直接根据所选择的估计量对总体目的作出一个确定值根据所选择的估计量对总体目的作出一个确定值的估计。的估计。xX或或pP以点估计为根据,用一个具有一定可靠程度的区间以

11、点估计为根据,用一个具有一定可靠程度的区间范围来估计总体目的。可靠程度即估计结果正确的范围来估计总体目的。可靠程度即估计结果正确的概率大小。概率大小。/2/2xxxuXxu/2/2pppuPpuxxxXx pppPp 或或或或月工资水月工资水平平x(元)(元)1240 1340 1400 1500 1600 1800 2000 2600工人数工人数f(人)(人)46910864322/2/2211500,50,1600()327.761327.7646.355020.04552,92.795.45%(160092.7,160092.7)(1507.3xxxNnxfxfxxfsfuusnn 解:

12、已知:()简单随机抽样的样本平均数为:(元)标准差为:(元)抽样平均误差:(元)( )时(元)月平均工资的的置信区间为:,1692.7)95.45%(1507.3 1500,1692.7 1500)(2260950,2539050)(元)工资总额的的置信区间为:(元)年收入(千元)年收入(千元)家庭数家庭数f组中值组中值x4以下以下52-8.8387.204886-4.8184.328124010-0.825.60121620143.2204.8016以上以上7187.2362.88合合 计计801164.80 xx2()xxf222/2/2211200,80,10.80()1164.8014

13、.7417914.748010.170.4180120020.04552,0.821xxxNnxfxfxxfsfusnNun 解:已知:()简单随机抽样的样本平均数为:(千元)方差为:(千元 )抽样平均误差:(千元)( )时(千元)每户农民平均收入95.45%(10.800.82,10.800.82)(9.98,11.62)的的置信区间为:(千元)/2/219012000,200,0.952000.95(1 0.95)0.015412002(0.051.96,0.030295%(91.98% 98.02%95%(1839.6 19610.4)pppNnnpupup 解:已知:()抽样平均误差:

14、( )时合格品率的的置信区间为:,)合格品数量的的置信区间为:,)/2/2300916000,300,0.973000.97(1 0.97)30010.0096300600020.04552,0.019295.45%(95.08% 98.92%95.45%(5704(.81)1pppppNnpnnNuu 解:已知:()抽样平均误差:( )时合格品率的的置信区间为:,)合格品数量的的置信区间为:5935.2,)前往前往,1,2,iiNnn iKN 1Kiinn 1N2NKN1n2nKn 2112-,-1iinnijijijjiiiixxxxsnn2221111,KKKKiiiiiiiiiiiiN

15、 xn xN sn sxsNnNn2xsn 21xsnnN 那么样本总体的平均数和方差分别为:那么样本总体的平均数和方差分别为:因此,可以计算抽样平均误差:因此,可以计算抽样平均误差:或或P148例5-3例:总体群数例:总体群数R=16 样本群数样本群数r=4 样本容量样本容量ABCDEFGHIJKLMNOPLHPDdplhnnnnn1,1,2,MijjixxirM 111rMrijiijixxxrrM n 等群体整群抽样的抽样平均误差计算。等群体整群抽样的抽样平均误差计算。n 设全及总体划分为设全及总体划分为R群,每个群包含群,每个群包含的单位数均相等,为的单位数均相等,为M;从全及总体中随

16、;从全及总体中随机抽取机抽取r群组成一个样本,对抽中的群组成一个样本,对抽中的r群中群中一切的总体单位进展调查。根据样本数据,一切的总体单位进展调查。根据样本数据,可以计算各群体的平均数可以计算各群体的平均数那么样本总体平均数为那么样本总体平均数为21xRrrR 2211riixxr 由于整群抽样都采用不反复抽样方法,且总体由于整群抽样都采用不反复抽样方法,且总体群数群数R通常不是很大,所以样本平均数的抽样平通常不是很大,所以样本平均数的抽样平均误差为均误差为其中,其中,2表示样本各群平均数间的方差,称为表示样本各群平均数间的方差,称为样本群间方差,即样本群间方差,即P149例5-4排序根据的

17、标志:排序根据的标志:1无关标志;无关标志;2有关标志有关标志1,1,2,mijjixxirm 111rmrijiijixxxrrm n 主要讨论两阶段抽样的抽样平均误差计算。主要讨论两阶段抽样的抽样平均误差计算。n 第一阶段:设全及总体划分为第一阶段:设全及总体划分为R群,每群的单位群,每群的单位数为数为Mi,从中随机抽取,从中随机抽取r群群n 第二阶段:从抽中的第二阶段:从抽中的r群各抽出群各抽出mj个单位组成样个单位组成样本本n 为简化起见,为简化起见, Mi=M; mj =m,根据样本数据,根据样本数据,可以计算各群体的平均数可以计算各群体的平均数 那么样本总体平均数为那么样本总体平均

18、数为其中,其中, 表示样本群的群间方差,表示样本群的群间方差, 表示样本群表示样本群各群方差的平均数,即各群方差的平均数,即2211xssrrmrRrm RM 2S 2211riixxSr 由于多阶段抽样都采用不反复抽样方法,那么由于多阶段抽样都采用不反复抽样方法,那么有样本平均数的抽样平均误差为有样本平均数的抽样平均误差为 21122111rmijirijiixxSsrr m 2S 前往 抽样调查实际中,样本容量抽样调查实际中,样本容量n确实定具确实定具有实真实在的意义。有实真实在的意义。n过大,违背抽样调查过大,违背抽样调查的目的,的目的,n过小,那么抽样误差偏大,无法过小,那么抽样误差偏

19、大,无法作出准确的估计。作出准确的估计。2总体方差越大各调查单位标志值之间的差别越大各调查单位标志值之间的差别越大抽样分布越分散抽样分布越分散抽样误差越大抽样误差越大假想象满足一定的精度要求假想象满足一定的精度要求 , 那么必需样本量就越多那么必需样本量就越多要求越高要求越高, 所需样本量就越大所需样本量就越大其他条件一样时,反复抽样所需其他条件一样时,反复抽样所需n不反复抽样所需不反复抽样所需n分层抽样所需样本量最少分层抽样所需样本量最少, 整群抽样所需样本量最多整群抽样所需样本量最多衡量可靠度普通用衡量可靠度普通用t分布,衡量准确度普通用抽样误差分布,衡量准确度普通用抽样误差本章主要研讨简

20、单随机抽样下如何确定本章主要研讨简单随机抽样下如何确定 n 。简单随机抽样下必备样本量确实定简单随机抽样下必备样本量确实定n对于反复抽样:对于反复抽样:/2/2xxsuun 2222xxusn222(1)ppuppn同理可得:同理可得:n对于不反复抽样:对于不反复抽样:2/2/21xxsnuunN 2222222xxNusnNus 同理同理:22222(1)(1)ppNuppnNupp /222222222222222150,0.051.96,10,1.965096.0497101102331.9650864.36865910 3xxxxxxxssuuusnn 解:() 已知:(元)时(元)平均数的随机不重复抽样必要的样本量为(户)( )(元)(户),是原来的 倍年

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论