社会经济统计学 第七章抽样估计(下)_第1页
社会经济统计学 第七章抽样估计(下)_第2页
社会经济统计学 第七章抽样估计(下)_第3页
社会经济统计学 第七章抽样估计(下)_第4页
社会经济统计学 第七章抽样估计(下)_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1第五节第五节 成数及其抽样估计成数及其抽样估计 一、成数及其性质一、成数及其性质 是非标志是非标志(交替标志交替标志):只有两种标志表现。:只有两种标志表现。 成数成数具有某种标志的单位数在总体单位数中所占的比重。具有某种标志的单位数在总体单位数中所占的比重。总体单位数为总体单位数为N,具有某种标志的单位用具有某种标志的单位用1表示,单位数为表示,单位数为N1,成数为成数为 不具有某种标志的单位用不具有某种标志的单位用0表示,单位数为表示,单位数为N0,成数为成数为成数的平均数就是成数本身。成数的平均数就是成数本身。成数的标准差为成数的标准差为PQ的几何平均数。的几何平均数。NNP1NNQ0

2、标志表现标志表现xf比重比重是是1N1非非0N0合计合计N1NNP1NNQ0PNNNNfxfxp010101PQNNNPNPffxxp0102122)0 ()1 ()(2二、样本成数的分布二、样本成数的分布 1、样本成数、样本成数 样本单位数为样本单位数为n,具有某种标志者用具有某种标志者用1表示,单位数为表示,单位数为n1,成数为成数为 ;不具有某种标志者用;不具有某种标志者用0表示,单位数为表示,单位数为n0,成数为成数为 ;p+q=1 2、大数定理:、大数定理:只要只要n足够大足够大(n50),样本成数趋于样本成数趋于总体成数总体成数pP,样本标准差趋于总体标准差样本标准差趋于总体标准差

3、 3、样本成数的分布、样本成数的分布 数理统计证明,在数理统计证明,在n不小于不小于50,nP和和nQ均不小于均不小于5(保证不太偏保证不太偏)时,样本成数的分布近似于正态分布。时,样本成数的分布近似于正态分布。 样本成数的均数等于总体成数。样本成数的均数等于总体成数。 样本样本成数的标准差成数的标准差,重置抽样,重置抽样 不重置抽样不重置抽样nnp1nnq0PpPxpnPQpnPQNnnPQNnNnPQp)1 ()1(3三、总体成数的抽样估计三、总体成数的抽样估计 据中心极限定理有据中心极限定理有 极限抽样误差极限抽样误差 概率度概率度t与置信概率与置信概率之间的关系查标准正态分布表。之间的

4、关系查标准正态分布表。 数理统计证明:数理统计证明:pq为为PQ的偏误估计量,而的偏误估计量,而 是是PQ的无偏估计量,即的无偏估计量,即 抽样误差抽样误差 : 重置抽样重置抽样 不重置抽样不重置抽样)(pppPpPpptpqnn1PQpqnnE)1(pnpqnpqnPQp1npqNnnpqNnNnPQp)1 (1)1(4成数抽样估计的步骤成数抽样估计的步骤 1、据样本资料计算、据样本资料计算p、q 2、检验检验 n50 np5 nq5 3、用正态分布表依据用正态分布表依据确定确定t 4、计算计算抽样误差抽样误差 重置抽样重置抽样 不重置抽样不重置抽样 5、计算极限抽样误差、计算极限抽样误差

5、6、计算置信区间、计算置信区间 7、回答、回答npqnpqnPQp1npqNnnpqNnNnPQp)1 (1)1(pptpppp,5 成数抽样估计举例成数抽样估计举例学生学生7000人,抽取人,抽取100人,有男生人,有男生60人,以人,以90%的置信概率估计全部学生中男生人数。的置信概率估计全部学生中男生人数。解:据样本资料可得解:据样本资料可得 检验检验 np=605 nq=405 n=10050 均满足条件均满足条件=90% 表正态分布表得表正态分布表得 t=1.64抽样误差抽样误差极限抽样误差极限抽样误差男生比重置信区间男生比重置信区间男生总数置信区间男生总数置信区间10060p100

6、40q%86. 4)70001001 (1004 . 06 . 0)1 (Nnnpqp%98. 7%86. 464. 1ppt%98. 7%604759,36416课外作业课外作业 某地有小麦某地有小麦10000亩,抽样调查亩,抽样调查 结果如右表所示。结果如右表所示。 以以95%的置信概率估计小麦的置信概率估计小麦 亩产量所在范围。亩产量所在范围。 以以68.27%的置信概率估计的置信概率估计 亩产量在亩产量在300kg以上的播种面积数。以上的播种面积数。亩产量分组亩产量分组(kg)亩数亩数(亩亩)200以下以下10200-25022250-30030300-35025350以上以上137例

7、6-3例例3 3 对一批产品对一批产品40004000按不重复抽样方法抽取按不重复抽样方法抽取200200件进行检验,发现有废品件进行检验,发现有废品8 8件;又知样本容量件;又知样本容量n n为为成品总量成品总量N N的。当概率为的。当概率为95%95%时,估计这批成品中时,估计这批成品中废品率的区间范围。废品率的区间范围。8例6-5对对50005000件零件进行抽样调查,测得样本废品率为件零件进行抽样调查,测得样本废品率为1.5%1.5%,抽样平均误差为,抽样平均误差为0.5%0.5%,现以,现以95%95%的概率保证,的概率保证,估算全部零件的废品数量。估算全部零件的废品数量。 总量指标

8、的抽样推算总量指标的抽样推算9第六节第六节 必要样本容量必要样本容量 一、必要样本容量的意义一、必要样本容量的意义 据大数定理:样本容量越大,代表性越强,误差据大数定理:样本容量越大,代表性越强,误差越小,估计越可靠,但样本单位数过多,就失去了抽样越小,估计越可靠,但样本单位数过多,就失去了抽样估计的意义。反之,样本容量过小,误差太大,也失估计的意义。反之,样本容量过小,误差太大,也失去了抽样估计的意义。去了抽样估计的意义。 按事先给定的置信概率和极限抽样误差计算的抽样按事先给定的置信概率和极限抽样误差计算的抽样单位数,称为必要样本容量。单位数,称为必要样本容量。 二、影响样本容量的因素二、影

9、响样本容量的因素169 1、抽样推断的可靠程度、抽样推断的可靠程度 2、允许误差的范围、允许误差的范围 3、总体各单位标志变异程度、总体各单位标志变异程度 4、 抽样的方法抽样的方法 5、抽样的组织方式、抽样的组织方式10 三、必要样本容量的计算公式三、必要样本容量的计算公式 估计均数估计均数 重置抽样重置抽样 不重置抽样不重置抽样 估计成数估计成数 重置抽样重置抽样 不重置抽样不重置抽样 ntx222xxtnNnntx122222tNNtnxxnPQtp22ppPQtnPQtNPQNtnpp222)1 (NnnPQtp11四、必要样本容量的应用四、必要样本容量的应用 1、 和和 未知,用历史

10、资料试验性抽样未知,用历史资料试验性抽样 P和和Q未知,历史资料或试验抽样用未知,历史资料或试验抽样用PQ=0.25 2、np必须满足不少于必须满足不少于50,nP、nQ均不小于均不小于5的条的条件,否则增加数量,以至达到规定条件。件,否则增加数量,以至达到规定条件。 3、同时估计、同时估计 和和P,若若 用较大数。用较大数。 必要样本容量计算练习必要样本容量计算练习 1、对万亩小麦抽样测产,要求允许误差不超过、对万亩小麦抽样测产,要求允许误差不超过5公斤,置信概率不低于公斤,置信概率不低于95%,该抽查多少亩?,该抽查多少亩?(=30公公斤斤) 2、对、对7000名大学生戴眼镜情况进行抽样调

11、查,允名大学生戴眼镜情况进行抽样调查,允许误差不超过许误差不超过5%,置信概率不低于,置信概率不低于68.27%,该抽多少,该抽多少人?人?XXpxnn 123.3.某市有职工某市有职工96,00096,000户,在职工家庭生活费调查中,已知职工家庭每人户,在职工家庭生活费调查中,已知职工家庭每人平均生活费收入的标准差为平均生活费收入的标准差为4040元,在概率保证程度为元,在概率保证程度为95.45%95.45%的条件下,的条件下,要求抽样极限误差不超过要求抽样极限误差不超过1010元,现进行简单随机不重复抽样,其样本容元,现进行简单随机不重复抽样,其样本容量确定如下:量确定如下: 13第六

12、节第六节 抽样设计抽样设计 一、抽样设计的目的一、抽样设计的目的 根据调查对象的特点和调查目的的要求,确定合适的根据调查对象的特点和调查目的的要求,确定合适的样本抽选方式,并对其产生的抽样误差进行估计的工作样本抽选方式,并对其产生的抽样误差进行估计的工作 抽样方式抽样方式 单阶段抽样单阶段抽样 简单简单(纯纯)随机抽样随机抽样 两阶段两阶段抽样抽样 类型抽样类型抽样(分类、分层分类、分层) 机械抽样机械抽样(等距、系统等距、系统) 整群抽样整群抽样 多阶段抽样多阶段抽样 以上方法的结合应用以上方法的结合应用 多阶段对称等距抽样多阶段对称等距抽样 保证随机性、提高代表性、减少抽样误差、以求效果最

13、佳。保证随机性、提高代表性、减少抽样误差、以求效果最佳。14抽样抽样组织方式组织方式(不同于不同于调查调查的组织方式的组织方式) 阶段抽样另解阶段抽样另解 单单阶段抽样阶段抽样抽出的样本单位抽出的样本单位直接就是总体单位直接就是总体单位 两阶段两阶段抽样抽样先将总体进行先将总体进行分组分组,从中随机抽取,从中随机抽取一些组,然后再从中选的一些组,然后再从中选的组中随机抽取总体单位组中随机抽取总体单位 机械抽样机械抽样:组更多;整群抽样也是群组。组更多;整群抽样也是群组。 多阶段抽样多阶段抽样将总体进行多层次的分组,然后依将总体进行多层次的分组,然后依次在各组中随机抽取,直到抽取总体单位次在各组

14、中随机抽取,直到抽取总体单位15抽样方法抽样方法概率概率抽样抽样非概率非概率抽样抽样重复抽样重复抽样不重复抽样不重复抽样简单随机抽样简单随机抽样等距抽样等距抽样 分层抽样分层抽样 整群抽样整群抽样 多级抽样多级抽样 即放回抽样。比如,要从总体即放回抽样。比如,要从总体N个单位中随个单位中随机抽取容量为机抽取容量为n的样本,每次从总体中抽取的样本,每次从总体中抽取一个单位,把这看作是一次试验,将结果一个单位,把这看作是一次试验,将结果记录后放回总体中,重新参加下一次的抽记录后放回总体中,重新参加下一次的抽取;将此过程连续进行取;将此过程连续进行n次次 即不放回抽样,是指即不放回抽样,是指从总体中

15、抽取的单位从总体中抽取的单位不再放回去,只从剩不再放回去,只从剩下的单位中进行抽取下的单位中进行抽取 等距抽样也称为系统抽样,它是按照某种顺序给等距抽样也称为系统抽样,它是按照某种顺序给总体中所有单元编号,然后随机地抽取一个编号总体中所有单元编号,然后随机地抽取一个编号作为样本的第一个单元,样本的其它单元则按照作为样本的第一个单元,样本的其它单元则按照某种确定的规则抽取(如等距原则)某种确定的规则抽取(如等距原则) 先将总体按照某种特征或指标分成几先将总体按照某种特征或指标分成几个排斥的又是穷尽的子总体,或层,个排斥的又是穷尽的子总体,或层,然后在每个层内按照随机的方法抽取然后在每个层内按照随

16、机的方法抽取元素元素 先将总体划成许多先将总体划成许多相互排斥的子总体或群相互排斥的子总体或群,然后以,然后以群为初级抽样单元,按某种概率抽样技术,如简单群为初级抽样单元,按某种概率抽样技术,如简单随机抽样,从中抽取若干个群,对抽中的群内的所随机抽样,从中抽取若干个群,对抽中的群内的所有单元都进行调查有单元都进行调查 第一阶段从所有群中抽取若干群,在每个抽中的第一阶段从所有群中抽取若干群,在每个抽中的群中,再抽取若干单元进行调查群中,再抽取若干单元进行调查 16二、简单二、简单(纯纯)随机抽样随机抽样 1、抽样方式、抽样方式 对全及总体的所有对全及总体的所有 单位不作任何分组排队单位不作任何分

17、组排队 的情况下,从中任意抽的情况下,从中任意抽 取样本单位。取样本单位。 直接抽取法抽签法直接抽取法抽签法 随机数法随机数法 2、计算公式、计算公式 3、运用特点、运用特点 用于单位少变异小的总体用于单位少变异小的总体估估计计方方式式抽样误差抽样误差抽样单位数抽样单位数均均数数重重置置不不重重置置成成数数重重置置不不重重置置nx2)1 (2NnnxnPQp)1 (NnnPQpxxtn22222222tNNtnxxppPQtn22PQtNPQNtnpp22217三、类型抽样三、类型抽样(分类、分层分类、分层)1、抽样方式、抽样方式 将全及总体各单位按一定标志分成若干类型组,然将全及总体各单位按

18、一定标志分成若干类型组,然 后在各类型组中抽取样本单位。后在各类型组中抽取样本单位。(分组与抽样结合分组与抽样结合)类型比例抽样大组多抽、小组少抽类型比例抽样大组多抽、小组少抽类型最优抽样大组多抽、变异大多抽类型最优抽样大组多抽、变异大多抽 类型抽样的特点:类型抽样的特点: 提高样本的代表性提高样本的代表性 大小搭配、分布接近大小搭配、分布接近 降低抽样平均误差降低抽样平均误差 数理统计证明了总方差分解原理数理统计证明了总方差分解原理 总方差等于组间方差与平均组内方差之和总方差等于组间方差与平均组内方差之和 = + 平均组内方差平均组内方差 是各组组内方差的平均数。是各组组内方差的平均数。 组

19、间方差组间方差 是各组平均数之间的方差是各组平均数之间的方差 因各组皆查,故组间方差不影响抽样误差。因各组皆查,故组间方差不影响抽样误差。 估计各组有关特征数估计各组有关特征数2xNnNnNnNnkk2211iiiiiNNnn2i22i2x182、计算公式、计算公式 以平均组内方差以平均组内方差 代替总体方差。代替总体方差。3、运用特点、运用特点 分组时应尽量缩小分组时应尽量缩小 组内方差。组内方差。估估计计方方式式抽样误差抽样误差抽样单位数抽样单位数均均数数重重置置不不重重置置成成数数重重置置不不重重置置nx2)1 (2NnnxnPQp)1 (NnnPQpxxtn22222222tNNtnx

20、xppPQtn22PQtNPQNtnpp222219 类型抽样的抽样平均误差的计算类型抽样的抽样平均误差的计算 (1)平均数的抽样平均误差)平均数的抽样平均误差 (2)成数的抽样平均误差)成数的抽样平均误差抽样组织方式抽样组织方式20抽样组织方式抽样组织方式例6-7某厂有甲乙两个车间都生产保温瓶胆,乙车间技术先进,其某厂有甲乙两个车间都生产保温瓶胆,乙车间技术先进,其产量是产量是甲车间的甲车间的2 2倍倍,为了调查该厂保温瓶的保温时间,按,为了调查该厂保温瓶的保温时间,按两车间产量比例两车间产量比例共抽查共抽查6060只瓶胆,其资料如表所示。只瓶胆,其资料如表所示。现以现以95.45%95.4

21、5%的可靠程度推断该厂生产的全部瓶胆的平均保温时的可靠程度推断该厂生产的全部瓶胆的平均保温时间的可能范围。间的可能范围。21 a22抽样组织方式抽样组织方式例6-8某地区有某地区有1000010000居民住户,按城市居民和农村居民的比例采居民住户,按城市居民和农村居民的比例采用用不重复不重复抽样方法抽取抽样方法抽取10001000户进行手机拥有量的调查,资料户进行手机拥有量的调查,资料如表如表6.36.3所示。所示。 现以现以95%95%的概率推断该地区手机拥有户的比重范围。的概率推断该地区手机拥有户的比重范围。2324四、机械抽样四、机械抽样 1、抽样方式、抽样方式 将全及总体所有单位按某一

22、标志顺将全及总体所有单位按某一标志顺序排列后,按相等的距离抽取样本单位。序排列后,按相等的距离抽取样本单位。 有关标志排队法有关标志排队法 无关标志排队法无关标志排队法(可视为不重置的简单随机抽样可视为不重置的简单随机抽样) 抽样间隔:抽样间隔: 样本单位抽取半距法随机起点法样本单位抽取半距法随机起点法(有系统性误差有系统性误差) 2、计算公式、计算公式 特殊类型抽样分组多不重置组抽一特殊类型抽样分组多不重置组抽一不重置抽样不重置抽样采用重置抽样采用重置抽样 3、运用特点、运用特点用于变异大、总体单位少的情况用于变异大、总体单位少的情况 应避免系统性误差应避免系统性误差 常有现成排队可用常有现

23、成排队可用nNk nx2nPQp25五、整群抽样五、整群抽样 1、抽样方式、抽样方式 将全及总体单位划分为若干群体,将全及总体单位划分为若干群体,一群一群地抽取,并对抽中群的所有单位进行全面调查。一群一群地抽取,并对抽中群的所有单位进行全面调查。 只需对群编号样本群抽选可用简单或机械法只需对群编号样本群抽选可用简单或机械法 2、计算公式、计算公式 影响因素的因素样本群的多少。共分影响因素的因素样本群的多少。共分R群、抽出群、抽出r群。群。 群间方差群间方差(组间组间) 群内方差不影响抽样误群内方差不影响抽样误差差 抽样方式抽样方式 皆不重置皆不重置 修正修正 抽样误差抽样误差 均数估计均数估计 成数估计成数估计 3、运用特点、运用特点样本单位集中、调查省人省事样本单位集中、调查省人省事 分群时尽量缩小群间方差分群时尽量缩小群间方差222ix)1 (2Rrrxx)1 (2Rrrpp26 整群抽样的抽样平均误差的计算整群抽样的抽样平均误差的计算 设总体中的全部单位划分为设总体中的全部单位划分为R群,每群中所包含群,每群中所包含的单位数为的单位数为m,现从所有群中抽取,现从所有群中抽取r群组成样本。群组成样本。 27

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论