版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 统计学原理(第七讲) 教学目的与要求:教学目的与要求: 统计抽样技术是抽样调查的继续,它提供了一套利用抽样资料来估计总体数量特征的方法。通过本章的学习,要求: 1、理解统计抽样的含义与特点; 2、理解抽样误差及其影响因素; 3、重点掌握抽样平均误差的含义及其 计算; 4、重点掌握抽样极限误差的含义、计 算及区间估计 5、了解抽样的组织形式,掌握必要样 本数目的含义及其计算 6、能结合实际资料进行抽样估计。 本本 章章 主主 要要 内内 容容: :统计抽样的含义与特点统计抽样的含义与特点抽样误差及其影响因抽样误差及其影响因素素抽样估计的方法抽样估计的方法抽样的组织设计抽样的组织设计一、抽样推断
2、的概念和特点一、抽样推断的概念和特点 概概 念念统计抽样是统计抽样是抽样调查抽样调查和和抽样推断抽样推断的总称,的总称,是按随机原则从总体中抽取部分单位进行是按随机原则从总体中抽取部分单位进行调查,并根据这部分单位的调查资料推算调查,并根据这部分单位的调查资料推算总体数量特征的一种统计分析方法总体数量特征的一种统计分析方法。特特 点点 由部分推断整体由部分推断整体。 按随机原则抽取样本单位按随机原则抽取样本单位。 运用了概率估计的方法运用了概率估计的方法。 抽样误差可以事先计算并加以控制。抽样误差可以事先计算并加以控制。第一节第一节 统计抽样的意义统计抽样的意义二、统计抽样的作用二、统计抽样的
3、作用1 1、能够解决全面调查无法或难以解决的问题、能够解决全面调查无法或难以解决的问题 2、可以补充和修订全面调查的结果、可以补充和修订全面调查的结果3、可以在短期内取得时效性强的资料、可以在短期内取得时效性强的资料4、可以应用于生产过程中产品质量的检查和、可以应用于生产过程中产品质量的检查和 控制控制三、统计抽样的基本概念三、统计抽样的基本概念(一)全及(一)全及总体总体 和和 样本总体样本总体全及总体全及总体:简称总体,指所要认识的研究对象全体,简称总体,指所要认识的研究对象全体,又叫母体。总体单位总数用又叫母体。总体单位总数用“N”N”表示。表示。总体样本总体样本:简称样本。是从全及总体
4、中随机抽取出来简称样本。是从全及总体中随机抽取出来的那部分单位组成的集合体,又叫子体。的那部分单位组成的集合体,又叫子体。样本单位总数用样本单位总数用“n”n”表示。表示。(二)全及指标(参数)和样本指标(统计量)(二)全及指标(参数)和样本指标(统计量) 参参 数数 反映总体数量特征的全及指标反映总体数量特征的全及指标参数参数研究总体中研究总体中的数量标志的数量标志总体平均数总体平均数总体标准差总体标准差研究总体中研究总体中的品质标志的品质标志总体成数总体成数成数方差成数方差(只有两种表现)2(1)pspp1NPN2()XXNXFXFXXN2()XXFF是非标志(未分组资料)(分组资料)(分
5、组资料)成数平均数成数平均数PXP01NQPN 统统 计计 量量根据样本总体计算的综合指标根据样本总体计算的综合指标。研究数研究数量标志量标志 样本平均数样本平均数 样本标准差样本标准差研究品研究品质标志质标志样本成数样本成数 成数标准差成数标准差 nxx22xxff1pspp1npnxxnxfxf(分组资料)(分组资料)成数平均数成数平均数 PxPn注:n1、全及总体是唯一确定的,所以根据全及总n 体计算的全及指标也是唯一确定的,但它 n 是未知的。n2、样本总体是不确定的,所以根据样本总体n 计算的样本指标是不确定的,它是样本的n 函数,是个随机变量,但它是已知的。(三)样本容量和样本个数
6、(三)样本容量和样本个数样本容量:样本容量: 一个样本包含的单位数。用一个样本包含的单位数。用 “n” “n”表示。表示。一般要求一般要求 n 30 n 30(大样本)(大样本)样本个数:样本个数:从一个全及总体中可能抽取的样本的总从一个全及总体中可能抽取的样本的总体的个数体的个数注:注:1 1、社会经济统计中的抽样调查多属于大样本、社会经济统计中的抽样调查多属于大样本 调查调查; ;2 2、本章的计算和分析都是建立在大样本的理、本章的计算和分析都是建立在大样本的理 论基础上论基础上. .注:可能抽取的样本个数与样本容量及抽样方法注:可能抽取的样本个数与样本容量及抽样方法 等因素有关。等因素有
7、关。(四)重复抽样和不重复抽样(四)重复抽样和不重复抽样重复抽样重复抽样:又称回置抽样。又称回置抽样。可能组成的样本数目:可能组成的样本数目:nN不重复抽样不重复抽样: 又称不回置抽样。又称不回置抽样。可能组成的样本数目:可能组成的样本数目:N N(N-1N-1)()(N-2N-2)(N-n+1N-n+1)(考虑样本单位的前后顺序)(考虑样本单位的前后顺序)例如:从例如:从A、B、C、D四个单位中,抽出两个单位构四个单位中,抽出两个单位构成一个样本,问可能组成的样本数目是多少?成一个样本,问可能组成的样本数目是多少?重复抽样重复抽样A AACADB ABBBCBDABC ACBCCCDDADB
8、DCDD= 42 =16 (个样本)不重复抽样不重复抽样N(N-1)(N-2).43 = 12(个样本)注:注:根据概率论,在相同样本容量的要求下,同根据概率论,在相同样本容量的要求下,同一个总体的重复抽样的样本个数总是大于不一个总体的重复抽样的样本个数总是大于不重复抽样的样本个数重复抽样的样本个数nN第二节 抽 样 误 差一、抽样误差的意义一、抽样误差的意义抽样误差:抽样误差:是指在遵循随机原则的前提下,抽样是指在遵循随机原则的前提下,抽样 指标和全及指标之间的差别或离差。指标和全及指标之间的差别或离差。区别:区别:登记误差登记误差 系统误差系统误差误差:误差:客观现象的统计资料与客观现象真
9、值之间客观现象的统计资料与客观现象真值之间 的差别的差别1 1、概、概 念念2 2、影响抽样误差大小的因素、影响抽样误差大小的因素1 1)、总体各单位标志值的差异程度)、总体各单位标志值的差异程度2 2)、样本的单位数)、样本的单位数3 3)、抽样方法)、抽样方法4 4)、抽样调查的组织形式)、抽样调查的组织形式二、抽样平均误差二、抽样平均误差抽样平均误差:抽样平均误差:是指所有可能的样本指标与总是指所有可能的样本指标与总体指标之间离差平方的算术平均数的平方根。体指标之间离差平方的算术平均数的平方根。即即抽样平均数或抽样成数的标准差抽样平均数或抽样成数的标准差,反映了抽,反映了抽样指标与总体指
10、标的平均误差程度。样指标与总体指标的平均误差程度。实际抽样误差:实际抽样误差:从一个总体中抽取多个样本,从一个总体中抽取多个样本,每个样本指标与总体指标之间的离差。每个样本指标与总体指标之间的离差。无法测算假设总体包含假设总体包含1 1、2 2、3 3、4 4、5 5,五个数字。,五个数字。则:总体平均数为则:总体平均数为现在,采用重复抽样从中抽出两个,组成一个样现在,采用重复抽样从中抽出两个,组成一个样本。可能组成的样本数目:本。可能组成的样本数目:2525个。个。如:如: 1 322142.52243235421234535X 多数样本指标与总体指标都有误差多数样本指标与总体指标都有误差,
11、 ,误差有大、误差有大、有小,有正、有负,抽样平均误差就是将所有的误有小,有正、有负,抽样平均误差就是将所有的误差综合起来,再求其平均数,所以抽样平均误差是差综合起来,再求其平均数,所以抽样平均误差是反映反映的指标。的指标。 抽抽 样样 平平 均均 误误 差差 的的 计计 算算 公公 式式抽样平均数抽样平均数的平均误差的平均误差抽样成数抽样成数平均误差平均误差(以上两个公式实际上就是第四章讲的以上两个公式实际上就是第四章讲的标准差标准差。但反映的是样本指标与总体指标的平均离差程度)但反映的是样本指标与总体指标的平均离差程度)MXxx2MPpp2实际上,利用上述两个公式是计算不出抽样平均误差的。
12、实际上,利用上述两个公式是计算不出抽样平均误差的。想一想,为什么?想一想,为什么?1、抽样平均数的抽样平均误差的计算方法、抽样平均数的抽样平均误差的计算方法 (根据数理统计理论推出(根据数理统计理论推出)1 1)重复抽样:)重复抽样:此公式说明,抽样平均误差与总体标准差成正比,此公式说明,抽样平均误差与总体标准差成正比,与样本容量成反比。(当总体标准差未知时,可与样本容量成反比。(当总体标准差未知时,可用样本标准差或过去总体的同类资料代替)用样本标准差或过去总体的同类资料代替)通过例题可说明以下几点通过例题可说明以下几点:样本平均数的平均数等于总体平均数样本平均数的平均数等于总体平均数。抽样平
13、均数的标准差仅为总体标准差抽样平均数的标准差仅为总体标准差的的可通过调整样本单位数来控制抽样平均误差可通过调整样本单位数来控制抽样平均误差。nxn12 2)采用不重复抽样:)采用不重复抽样:公式表明:抽样平均误差不仅与总体变异程度、公式表明:抽样平均误差不仅与总体变异程度、样本容量有关,而且与总体单位数的多少有关样本容量有关,而且与总体单位数的多少有关。Nnnx1221xNnnN近似公式:近似公式:例例7 73 3(p162)p162)结论:结论:1 1、样本指标的平均数等于总体平均数;、样本指标的平均数等于总体平均数; 2 2、抽样平均误差实质是所有可能样本指标、抽样平均误差实质是所有可能样
14、本指标 之间的标准差。之间的标准差。抽样成数的抽样平均误差的计算方法抽样成数的抽样平均误差的计算方法1)采用重复抽样)采用重复抽样:2)采用不重复抽样:)采用不重复抽样:nppp11111pppppNnnnNnN例例 题:题:7-4 7-4 已知:已知:10000N 1 0 0n60%p 160%40%4.9%100pppn某厂生产某型号的电子管,根据过去的情况,产品某厂生产某型号的电子管,根据过去的情况,产品一级品率为一级品率为6060,现从,现从1000010000件电子管中抽取件电子管中抽取100100件件进行检验,求一级品率的抽样平均误差。进行检验,求一级品率的抽样平均误差。Nnnpp
15、p1160%40%10014.87%10010000计算结果表明:不重复抽样的平均误差小于重复计算结果表明:不重复抽样的平均误差小于重复抽样,但是抽样,但是“N”N”的数值越大,则两种方法计算的数值越大,则两种方法计算的抽样平均误差就越接近。的抽样平均误差就越接近。三、抽三、抽 样样 极极 限限 误误 差差1 1、抽样极限误差、抽样极限误差含义含义:指在进行抽样估计时,根据所研究对象的变动指在进行抽样估计时,根据所研究对象的变动程度和分析任务的要求,所确定的样本指标与程度和分析任务的要求,所确定的样本指标与总体指标之间可允许的最大误差范围。总体指标之间可允许的最大误差范围。2、计算方法、计算方
16、法:它等于样本指标可允许变动的上限或下限与它等于样本指标可允许变动的上限或下限与总体指标之差的总体指标之差的绝对值绝对值。抽样平均数极限误差抽样平均数极限误差:抽样成数极限误差:抽样成数极限误差:xxXpppPp ppP平均数置信区间:平均数置信区间:成数置信区间:成数置信区间:xxxXx 3 3、抽样误差的概率度、抽样误差的概率度抽样极限误差通常用抽样平均误差为标准来衡量,抽样极限误差通常用抽样平均误差为标准来衡量,把抽样极限误差除以抽样平均误差,表示抽样极限把抽样极限误差除以抽样平均误差,表示抽样极限误差是抽样平均误差的倍数,它是测量抽样估计可误差是抽样平均误差的倍数,它是测量抽样估计可靠
17、程度的一个参数,称为概率度,通常用靠程度的一个参数,称为概率度,通常用t t表示。表示。公式表示:公式表示: 4 4、抽样估计的置信度(和概率度有一一对应的函数关系)、抽样估计的置信度(和概率度有一一对应的函数关系)1 1、抽样估计置信度:、抽样估计置信度:是表明抽样指标和总体指标的误是表明抽样指标和总体指标的误 差,不超过一定范围的概率保证程度。差,不超过一定范围的概率保证程度。2 2、抽样估计的概率保证程度:、抽样估计的概率保证程度:是指抽样误差不超过一是指抽样误差不超过一 定范围的概率大小,用字母定范围的概率大小,用字母F(t)F(t)表示。表示。 当当t=1t=1时,时,F(t)=68
18、.27% F(t)=68.27% 当当t=2t=2时时, F(t)=95.45%, F(t)=95.45% 当当t=3t=3时时, F(t)=99.73%, F(t)=99.73%xxt ppt 理论已经证明,在大样本的情况下,抽理论已经证明,在大样本的情况下,抽样平均数的分布接近于正态分布,分布特点样平均数的分布接近于正态分布,分布特点是:抽样平均数以总体平均数为中心,两边是:抽样平均数以总体平均数为中心,两边完全对称分布,即抽样平均数的正误差与负完全对称分布,即抽样平均数的正误差与负误差的可能性是完全相等的。且抽样平均数误差的可能性是完全相等的。且抽样平均数愈接近总体平均数,出现的可能性愈
19、大,概愈接近总体平均数,出现的可能性愈大,概率愈大;反之,抽样平均数愈离开总体平均率愈大;反之,抽样平均数愈离开总体平均数,出现的可能性愈小,概率愈小,趋于数,出现的可能性愈小,概率愈小,趋于0 0。(见下图)(见下图)正正 态态 概概 率率 分分 布布 图图由此可知由此可知, ,误差范围愈大误差范围愈大, ,抽样估计的置信度愈高抽样估计的置信度愈高, ,但抽但抽样估计的精确度愈低;反之,误差范围愈小,则抽样样估计的精确度愈低;反之,误差范围愈小,则抽样估计的置信度愈低,但抽样估计的精确度愈高。估计的置信度愈低,但抽样估计的精确度愈高。即即可可靠性和精确度是一对矛盾靠性和精确度是一对矛盾68.
20、27%95.45%2XXXX2X99.73%3X3X例例 题题 7 75 5:设样本粮食平均亩产量设样本粮食平均亩产量 ,又知抽样,又知抽样平均误差平均误差 ,求总体粮食平均亩产量,求总体粮食平均亩产量 之间的估计置信度。之间的估计置信度。 2 521 2 .5xxt查正态概率表,当查正态概率表,当t=2t=2时,置信度为时,置信度为95.4595.45,即总体亩产量在即总体亩产量在475475525525千克之间的概率保证千克之间的概率保证程度为程度为95.4595.45。500 x 千克12.5x千克50025X在千克第三节第三节 抽样估计的方法抽样估计的方法一、总体参数的点估计一、总体参
21、数的点估计总体参数优良估计的标准总体参数优良估计的标准 无偏性无偏性一致性一致性有效性有效性二、总体参数的区间估计二、总体参数的区间估计区间估计三要素区间估计三要素估计值估计值抽样误差范围抽样误差范围抽样估计的置信度抽样估计的置信度px ,px, tFpx,xxxXx pppPp xXpP精确度可靠度三、总体参数区间估计的方法三、总体参数区间估计的方法(一)根据给定的抽样误差范围,求概率保证程度(一)根据给定的抽样误差范围,求概率保证程度 ( (可靠度可靠度) )分析步骤:分析步骤: 1 1、抽取样本,计算抽样指标(抽样、抽取样本,计算抽样指标(抽样 平均误差)平均误差); ;2 2、根据给定
22、的极限误差范围,求出、根据给定的极限误差范围,求出 概率度概率度; ;3 3、查表求出概率、查表求出概率F F(t t)即置信度)即置信度. .例例 题题 7 78 8:某城市随机抽取某城市随机抽取400400户居民进行家计调查,得每户年耐用户居民进行家计调查,得每户年耐用品的消费支出的标准差为品的消费支出的标准差为200200元,试确定该市居民年平均元,试确定该市居民年平均每户耐用品的消费支出在每户耐用品的消费支出在930.4930.4969.6969.6元之间的概率保元之间的概率保证程度。证程度。已知:已知:4 0 0n 2001 9 .61 .9 61 0 xxt20010(400pn元
23、)查正态概率表,得置信度为查正态概率表,得置信度为9595(二)根据给定的概率(二)根据给定的概率F F(t t),推算抽样极限误差并计),推算抽样极限误差并计 算出总体参数的可能范围算出总体参数的可能范围分分 析析 步步 骤骤:1 1、抽取样本,计算样本指标。、抽取样本,计算样本指标。2 2、根据给定的、根据给定的F F(t t)查表求得概率度)查表求得概率度 t t 。3 3、根据概率度和抽样平均误差计算极限误差。、根据概率度和抽样平均误差计算极限误差。4 4、计算被估计值的上、下限,对总体参数作出、计算被估计值的上、下限,对总体参数作出 区间估计。区间估计。 某进出口公司出口一种名茶,规
24、定每包重某进出口公司出口一种名茶,规定每包重量不低于量不低于150150克,现在不重复抽样的方法抽取克,现在不重复抽样的方法抽取其中的其中的1 1进行检验,其抽查结果见下表。进行检验,其抽查结果见下表。例例 题题 7 77 7每包重量/克包5148532.414915020148.5299012.815015150148.575252.015115220148.5303028.8 合计1001503076.0fxxf2xxf要求以99.73的概率估计这批茶叶平均每包的重量范围,以便确定该批茶叶是否达到重量规格的要求例题例题77解题过程:解题过程:15030150.31
25、00 xfxf克1 1、计算抽样平均误差、计算抽样平均误差20.76110.010.087100 xsnnN克2 2、计算抽样极限误差、计算抽样极限误差30.0870.26xxt克3 3、计算总体平均数的置信区间、计算总体平均数的置信区间平均每包重量区间为:平均每包重量区间为:150.30 0.26克即克即150.04150.56克克2()760.87100 xxfsf克由F(t)=99.73%,查正态概率表的t=3例例 题题 79:某企业生产一批食品罐头工某企业生产一批食品罐头工6000060000桶,随机不重复桶,随机不重复抽查抽查300300桶发现,其中有桶发现,其中有6 6桶不合格,试
26、以桶不合格,试以95.4595.45的可靠性估计这批罐头合格品率的可能范围的可靠性估计这批罐头合格品率的可能范围已知:已知:N=60000n=30006n 9 5 .4 5 %Ft1、计算样本成数、计算样本成数:03 0 069 8 %3 0 0nnpnNnnppp112、计算抽样平均误差:、计算抽样平均误差:0 .9 80 .0 23 0 010 .8 %3 0 06 0 0 0 0t=22 0.8%1.6%ppt 所以这批罐头合格品率可能范围是98 1.6 抽样方案是统计调查方案的一种形式,是统抽样方案是统计调查方案的一种形式,是统 计抽样工作的实施计划,其基本结构与一般的统计抽样工作的实
27、施计划,其基本结构与一般的统 计调查方案相同。计调查方案相同。第四节第四节 抽样方案的设计抽样方案的设计一、抽样框的编制一、抽样框的编制( (解决如何根据目标总体抽选解决如何根据目标总体抽选 被调查单位被调查单位) ) 抽样框是指由现象总体的所有单位组成的抽样框是指由现象总体的所有单位组成的一个框架一个框架, ,是实施抽样推断的基础条件之一是实施抽样推断的基础条件之一. .特点:特点:1 1、范围与被抽样的总体一致、范围与被抽样的总体一致 2 2、不一定是目标总体基本单位、不一定是目标总体基本单位 3 3、包括全部总体单位,不重复、不遗漏、包括全部总体单位,不重复、不遗漏n三种基本形式三种基本
28、形式: :n1 1、名录抽样框:按总体中所有单位排、名录抽样框:按总体中所有单位排n列而成的抽样框。列而成的抽样框。n n2 2、区域抽样框:按自然地理位置排列而成的、区域抽样框:按自然地理位置排列而成的抽样框抽样框n n3 3、时间抽样框:将一个较长的时间过程划分、时间抽样框:将一个较长的时间过程划分为若干个小的时间单位所形成的抽样框为若干个小的时间单位所形成的抽样框具体表现形式主要为包括总体全部单位的名册、地图等 n 抽样框在抽样调查中处于基础地位,抽样框在抽样调查中处于基础地位,是抽样调查必不可少的部分,抽是抽样调查必不可少的部分,抽n样框是否全面对推断总体具有较大影响。样框是否全面对推
29、断总体具有较大影响。对于抽样调查来说,样本的代表对于抽样调查来说,样本的代表n性如何,抽样调查最终推算的估计值性如何,抽样调查最终推算的估计值n真实性如何,首先取决于抽样框的质量。真实性如何,首先取决于抽样框的质量。 二、抽取样本单位的方法(按随机原则)2 2、随机数表法(适用于总体单位数很大的、随机数表法(适用于总体单位数很大的 总体)总体) 将总体编号将总体编号, ,通常按自然数的顺序编排即通常按自然数的顺序编排即1 1, 2 2,3 3,,N,N,并编制并编制N N个与总体对应的号签。然个与总体对应的号签。然 后将号签摇匀,重复或不重复抽样,从中随机后将号签摇匀,重复或不重复抽样,从中随
30、机 抽取抽取n n个号签,则与之对应的单位组成样本。个号签,则与之对应的单位组成样本。通常利用随机数表来确定样本单位通常利用随机数表来确定样本单位。随机数表:用计算机、随机数字机等方法编制。1 1、抽签法(适用于总体单位数较少的总体)、抽签法(适用于总体单位数较少的总体) 1、简单随机抽样(纯随机抽样)对全及总体不经过任何排队或分类,按照随机原对全及总体不经过任何排队或分类,按照随机原则从则从N N个单位总体中抽取个单位总体中抽取n n个样本单位的抽样方式。个样本单位的抽样方式。三、抽样的组织形式特点:特点:1 1、最基本的抽样组织形式、最基本的抽样组织形式 2 2、适用于均匀分布的总体、适用
31、于均匀分布的总体 1) 1)概念:概念:类型抽样也叫分层抽样,它类型抽样也叫分层抽样,它是运用统计是运用统计 分组法,把全及总体按主要标志划分组法,把全及总体按主要标志划分为几个类型分为几个类型 组,然后在各组中再按随机原则抽组,然后在各组中再按随机原则抽取样本单位的取样本单位的 组织形式。组织形式。 方法:方法:设总体由N个单位构成,分为K组,满足 然后从每组 单位中抽取 单位构成样本容量为 的样本,使 2) 2)分类分类 等比例类型抽样、不等比例类型抽样 iiNnnN123kNNNNNiNinn12knnnn1212kKnnnnNNNN等比例类型抽样等比例类型抽样优点:)优点:)222(1
32、),iiixinnnNn3)3)抽样平均误差的计算(以抽样平均数为例)抽样平均误差的计算(以抽样平均数为例) 222,iiixinnn重复抽样重复抽样第i组样本的抽样平均数:1(1, 2,)inijjiixxikn全样本的抽样平均数:1kiiix nxn第i组内方差:212()injijiixxn平均组内方差:221kiiiinn不重复抽样不重复抽样例711 某地区共有农村居民3920户,分为粮食作物专业 户、经济作物专业户和养殖专业户三种类型,用不重复抽样按5的等比例抽取样本户,调查其平均收入,所计算的有关指标见表(p171),求样本平均收入和抽样平均误差,并以95.45的概率估计该地区所有
33、居民平均收入的区间范围。农户类型总户数抽样户数每户平均收入收入标准差粮食作物户216010837040.4经济作物8养殖户2001050038.2合计3920196404.4942.96iNin/ix元/i元全样本平均数:1kiiix nxn370 108 440 78 500 10404.49(196元)平均组内方差:221kiiiinn22240.410846.87838.2101961845.43()元抽样平均误差:21ixnnN1845.4319618.9452.991963920( )95.45%,2,2 2.995.98().xF tt 则元区间范围为:4
34、0449598元 1)1)概念:概念:等距抽样又称机械抽样,它先将总 体单位按一定标志排列起来,而后按固定顺 序和一定距离来抽取样本单位的抽样方式。 特点:样本代表性较高,抽样误特点:样本代表性较高,抽样误差较小差较小。 2)2)分类分类 根据排队依据的标志标志不同 无关标志排队无关标志排队 有关标志有关标志排队排队 按样本单位抽选的方法方法不同,分为随机起随机起 点等距抽样点等距抽样、半距起点等距抽样半距起点等距抽样和对称等对称等 距抽样距抽样。3 3、等距抽样(又称机械抽样)、等距抽样(又称机械抽样)3)3)抽样方法:抽样方法: 设总体由设总体由N N个单位构成,现在需要抽取个容量个单位构
35、成,现在需要抽取个容量n n的的样本:样本: (1(1)按某一标志对总体单位排队)按某一标志对总体单位排队 (2(2)将)将N N分为分为n n个相等部分,即个相等部分,即 (3(3)从第一部分)从第一部分 个单位中随机抽取个单位中随机抽取 第第 个单位,而在第二部分中抽取第个单位,而在第二部分中抽取第 个单位,在第三部分中抽取第个单位,在第三部分中抽取第 个单位,个单位, ,在第,在第 个部分中抽取第个部分中抽取第 个个 单位,则共抽取单位,则共抽取 个单位构成样本。个单位构成样本。 NTn1,2, ,iTiiT2iTn(1)inTn注:注:1 1、第一个单位确定后,其余各个单位也随之、第一
36、个单位确定后,其余各个单位也随之 确定,一般第一个单位定在半距处,即确定,一般第一个单位定在半距处,即 处处2T4) 4)抽样平均误差计算抽样平均误差计算 (1)(1)如果总体是按无关标志排队,抽样平均如果总体是按无关标志排队,抽样平均 误差可采用误差可采用简单随机不重复抽样简单随机不重复抽样公式去公式去 近似计算;近似计算; (2)(2)如果总体是按有关标志排队,则可用如果总体是按有关标志排队,则可用等等 比例类型抽样比例类型抽样的公式去近似计算。的公式去近似计算。注:注:不论按什么标志排队,都要注意避免抽样不论按什么标志排队,都要注意避免抽样 间隔与现象本身的周期性节奏相重合。间隔与现象本
37、身的周期性节奏相重合。1) 概念:将总体各单位划分成许多群,然后从其中随概念:将总体各单位划分成许多群,然后从其中随 机抽取部分群,对中选群的所有单位进行全面调查机抽取部分群,对中选群的所有单位进行全面调查 的抽样组织形式。的抽样组织形式。4 4、整群抽样、整群抽样2)2)方法:假设将总体全部单位方法:假设将总体全部单位N N划分为划分为R R群,每群包群,每群包 括的单位数相等,即均为括的单位数相等,即均为M M,则有,则有N=RMN=RM,现从总体,现从总体 R R群中随机抽取群中随机抽取r r群组成样本,并对中选群组成样本,并对中选r r群的所有群的所有 M M个单位进行调查。个单位进行
38、调查。第第 群样本平均数:群样本平均数:i1(1,2, )MijjixxirM全样本平均数:全样本平均数:1riixxr群间方差:群间方差:221()riixxxr抽样平均误差:抽样平均误差:21xxRrrR整群抽样都采用不重复抽样整群抽样的抽样平均误差仅取决于各群间方差3)3)抽样平均误差的计算(以抽样平均数为例)抽样平均误差的计算(以抽样平均数为例)n例712:拟调查某县农户家禽饲养情况, 从该县100个村中随机抽取10个村,对中选村 所有农户的家禽饲养情况进行调查,测得平均 每户饲养家禽35只,各村的平均数的方差为16 只。试以95.45的概率估计全县平均每户家 禽的饲养只数。已知:21
39、00,10,35,16, ( )95.45%,2xRrxF tt则,抽样平均误差为:216 100 101.2()110100 1xxRrrR只极限误差为:2 1.22.4()xxt 只则以95.45的概率估计全县平均每户家禽饲养只数在32.637.4只范围内。1)概念:如果抽出的样本单位直接就是总体单位,则叫如果抽出的样本单位直接就是总体单位,则叫单阶段抽样,如:单阶段抽样,如: 简单随机抽样、类型抽样、简单随机抽样、类型抽样、等距抽样等。等距抽样等。 如果将总体进行多层次分组,然后依次在各层如果将总体进行多层次分组,然后依次在各层中随机抽组,直到抽取总体单位,称为多阶段中随机抽组,直到抽取
40、总体单位,称为多阶段抽样,如整群抽样就是第二阶段抽样比为抽样,如整群抽样就是第二阶段抽样比为100100的一种特殊的两阶段抽样。的一种特殊的两阶段抽样。5、多阶段抽样2)适用于当总体单位很多,分布广泛,又几适用于当总体单位很多,分布广泛,又几乎不可能从总体中直接抽取总体单位时乎不可能从总体中直接抽取总体单位时四、样本单位数的计算方法四、样本单位数的计算方法:通过抽样极限误差公式计算必要的样本单位数通过抽样极限误差公式计算必要的样本单位数重复抽样重复抽样:不重复抽样:不重复抽样:抽样平均数抽样平均数22222xxxtNNtnpptNpNptnp11222222xxtn221ppptn极限误差极限
41、误差2xxttn 必要样本必要样本单位数单位数21xxnttnN 同理:成数必要样本数分别为同理:成数必要样本数分别为(重复)(不重复)1 1、总体各单位标志值的差异程度、总体各单位标志值的差异程度2 2、抽样极限误差的大小、抽样极限误差的大小3 3、抽样估计的置信度、抽样估计的置信度4 4、抽样方法和抽样组织形式、抽样方法和抽样组织形式影响必要样本单位数的因素n例7-13: 某城市组织职工家庭生活抽样调查,已知以往职工家 庭平均每人每月生活费收入的标准差为11.5元,要求 把握程度为0.9545,允许误差为1元,问需要抽多少 户进行调查?已知:( )0.9545F t 2t 1,11.5x
42、元则:22222211.55291x2tn=户根据公式,在重复抽样条件下,样本平均数的单位数为:22(1)20.65 0.35569()(0.04)P22ptn=户样本成数的单位数为:22222 (250)625()2022xtn=户例715 某市开展职工家计调查,根据历史资料该市职工家庭平均每人每年收入的标准差为250元,而家 庭消费的恩格尔系数为65,现在用重复抽样的方法,要求在95.45的概率保证下,平均收入的极 限误差不超过20元,恩格尔系数的极限误差不超过4%,求必要的样本单位数。本章作业本章作业一判断题一判断题1、从全部总体单位中按照随机原则抽取部分单、从全部总体单位中按照随机原则
43、抽取部分单位组成样本,只可能组成一个样本。(位组成样本,只可能组成一个样本。( )2、 在抽样推断中,全及指标值是确定的、唯一的,而样本指标值是一个随机变量。( )3、抽样成数的特点是:样本成数越大,则抽样平均误差越大。、抽样成数的特点是:样本成数越大,则抽样平均误差越大。( )4、 抽样平均误差总是小于抽样极限误差。(抽样平均误差总是小于抽样极限误差。( )5、在其它条件不变的情况下,提高抽样估计的可靠程度,、在其它条件不变的情况下,提高抽样估计的可靠程度,则降低了抽样估计的精确程度。(则降低了抽样估计的精确程度。( )6、从全部总体单位中抽取部分单位构成样本,在样本变、从全部总体单位中抽取
44、部分单位构成样本,在样本变量相同的情况下,重复抽样构成的样本个数大于不重量相同的情况下,重复抽样构成的样本个数大于不重复抽样构成的样本个数。(复抽样构成的样本个数。( )7、抽样平均误差反映抽样误差的一般水平,每次抽样的误差可、抽样平均误差反映抽样误差的一般水平,每次抽样的误差可能大于抽样平均误差,也可能小于抽样平均误差。(能大于抽样平均误差,也可能小于抽样平均误差。( )10、样本单位数的多少与总体各单位标志值的变异程度成反比,与、样本单位数的多少与总体各单位标志值的变异程度成反比,与抽样极限误差范围的大小成正比。(抽样极限误差范围的大小成正比。( )11、抽样推断的目的是,通过对部分单位的
45、调查,来取得样本的各、抽样推断的目的是,通过对部分单位的调查,来取得样本的各项指标。(项指标。( ) n12、用来测量估计可靠程度的指标是抽样误差的概率、用来测量估计可靠程度的指标是抽样误差的概率度。度。n( )n13、总体参数区间估计必须具备三个要素即:估计值、总体参数区间估计必须具备三个要素即:估计值、抽样误差范围和抽样误差的概率度。(抽样误差范围和抽样误差的概率度。( )n二单项选择题部分二单项选择题部分n1:抽样平均误差是(:抽样平均误差是( A )。)。nA、抽增指标的标准差、抽增指标的标准差nB、总体参数的标准差、总体参数的标准差nC、样本变量的函数、样本变量的函数 nD、总体变量
46、的函数、总体变量的函数2、抽样调查所必须遵循的基本原则是(、抽样调查所必须遵循的基本原则是( B )。)。A、准确性原则、准确性原则 B、随机性原则、随机性原则C、可靠性原则、可靠性原则 D、灵活性原则、灵活性原则3、在简单随机重复抽样条件下,当抽样平均误差缩小为、在简单随机重复抽样条件下,当抽样平均误差缩小为原来的原来的1/2时,则样本单位数为原来的(时,则样本单位数为原来的( C )。)。A、2倍倍 B、3倍倍 C、4倍倍 D、1/4倍倍 n4、按随机原则直接从总体、按随机原则直接从总体N个单位中抽取个单位中抽取n个单位作个单位作为样本,这种抽样组织形式是(为样本,这种抽样组织形式是( A
47、 )。)。nA、简单随机抽样、简单随机抽样 n B、类型抽样、类型抽样 nC、等距抽样、等距抽样 nD、整群抽样、整群抽样n5、事先将总体各单位按某一标志排列,然后依排列顺、事先将总体各单位按某一标志排列,然后依排列顺序和按相同的间隔来抽选调查单位的抽样称为(序和按相同的间隔来抽选调查单位的抽样称为( C )nA、简单随机抽样、简单随机抽样 nB、类型抽样、类型抽样 nC、等距抽样、等距抽样 nD、整群抽样、整群抽样6、在一定的抽样平均误差条件下(、在一定的抽样平均误差条件下( A )。)。A、扩大极限误差范围,可以提高推断的可靠程度、扩大极限误差范围,可以提高推断的可靠程度 B、扩大极限误差
48、范围,会降低推断的可靠程度、扩大极限误差范围,会降低推断的可靠程度 C、缩小极限误差范围,可以提高推断的可靠程度、缩小极限误差范围,可以提高推断的可靠程度 D、缩小极限误差范围,不改变推断的可靠程度、缩小极限误差范围,不改变推断的可靠程度n8、反映样本指标与总体指标之间的平均误差程度的指、反映样本指标与总体指标之间的平均误差程度的指标是(标是( C )。)。nA、平均数离差、平均数离差 nB、概率度、概率度 nC、抽样平均误差、抽样平均误差 n D、抽样极限误差、抽样极限误差n9、以抽样指标估计总体指标要求抽样指标值的平均数、以抽样指标估计总体指标要求抽样指标值的平均数等于被估计的总体指标值本
49、身,这一标准称为(等于被估计的总体指标值本身,这一标准称为( A )。)。nA、无偏性、无偏性 nB、一致性、一致性 nC、有效性、有效性 nD、准确性、准确性n10、在其它条件不变的情况下,提高估计的概率保证、在其它条件不变的情况下,提高估计的概率保证程度,其估计的精确程度(程度,其估计的精确程度( B )。)。nA、随之扩大、随之扩大 nB、随之缩小、随之缩小 nC、保持不变、保持不变 nD、无法确定、无法确定11、对某种连续生产的产品进行质量检验,要求每隔一、对某种连续生产的产品进行质量检验,要求每隔一小时抽出小时抽出10分钟的产品进行检验,这种抽查方式是分钟的产品进行检验,这种抽查方式
50、是( D)。)。A、简单随机抽样、简单随机抽样 B、类型抽样、类型抽样 C、等距抽样、等距抽样 D、整群抽样、整群抽样12、抽样误差是指(、抽样误差是指(C )。)。A、调查中所产生的登记性误差、调查中所产生的登记性误差B、调查中所产生的系统性误差、调查中所产生的系统性误差C、随机的代表性误差、随机的代表性误差D、计算过程中产生的误差、计算过程中产生的误差n14、为了了解某工厂职工家庭收支情况,按该厂职工、为了了解某工厂职工家庭收支情况,按该厂职工名册依次每名册依次每50人抽取人抽取1 人,对其家庭进行调查,这种人,对其家庭进行调查,这种调查属于(调查属于(B )。)。nA、简单随机抽样、简单
51、随机抽样nB、等距抽样、等距抽样nC、类型抽样、类型抽样nD、整群抽样、整群抽样n15、抽样极限误差和抽样平均误差的数值之间的关系、抽样极限误差和抽样平均误差的数值之间的关系为(为( A )。)。nA、抽样极限误差可以大于或小于抽样平均误差、抽样极限误差可以大于或小于抽样平均误差nB、抽样极限误差一定大于抽样平均误差、抽样极限误差一定大于抽样平均误差nC、抽样极限误差一定小于抽样平均误差、抽样极限误差一定小于抽样平均误差nD、抽样极限误差一定等于抽样平均误差、抽样极限误差一定等于抽样平均误差n三多项选择题三多项选择题n1、抽样推断的特点是(、抽样推断的特点是( ) n、由推算认识总体的一种认识
52、方法、由推算认识总体的一种认识方法 n、按随机原则抽取样板单位、按随机原则抽取样板单位 n、运用概率估计的方法、运用概率估计的方法 n、可以计算,但不能控制抽样误差、可以计算,但不能控制抽样误差 n、可以计算并控制抽样误差、可以计算并控制抽样误差n2、抽样估计中的抽样误差(、抽样估计中的抽样误差( ) n、是不可避免要产生的、是不可避免要产生的 n、是可以通过改进调查方式来消除的、是可以通过改进调查方式来消除的n、是可以事先计算出来的、是可以事先计算出来的 n、只能在调查结束后才能计算的、只能在调查结束后才能计算的n、其大小是可能控制的、其大小是可能控制的n3、从总体中抽取样本单位的具体方法有(、从总体中抽取样本单位的具体方法有( )n、简单随机抽样、简单随机抽样 n、重复抽样、重复抽样 n、不重复抽样、不重复抽样 n、等距抽样、等距抽样 n、非概率抽样、非概率抽样n4、抽样推断中,样本容量的多少取决于(、抽样推断中,样本容量的多少取决于( )n、总体标准差的大小、总体标准差的大小 n、允许误差的大小、允许误差的大小 n、抽样估计的把握程度、抽样估计的把握程度 n、总体参数的大小、总体参数的大小 n、抽样方法和组织形式、抽样方法和组织形式n5、总体参数区间估计必须具备的三个要素是、总体参数区间估计必须具备的三个要素是n()n、样
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小学五年综合发展规划(2020.9-2025.8)
- 菱形网格护坡施工方案
- 2024年渤海理工职业学院高职单招职业适应性测试历年参考题库含答案解析
- 医院会计核算和财务管理相关问题探讨培训讲学
- 二零二五年环保设施建设合同作废声明模板3篇
- 6年级英语上沪教版
- Module3Unit9DinnerisreadyPeriod1(课件)-沪教牛津版(深圳用)英语二年级上册
- (完整版)监控摄像头安装安全技术交底
- 东南大学-区域经济学课件(2013-9-21)
- 2025版4A级旅游景区门票销售合作协议3篇
- 2024-2025学年高考英语语法第一轮复习:定语从句(讲义)(原卷版+解析)
- DB35T 2082-2022 人民防空疏散基地建设基本要求
- 瑞士万通831KF卡尔费休水分测定仪干货-库仑法
- 第14章第1节热机-课件(共21张课件)-人教版初中物理九年级全一册.课件
- 四年级数学(上)计算题专项练习及答案汇编
- 广东省广州市(2024年-2025年小学四年级语文)人教版期末考试(上学期)试卷及答案
- 23-燃气质量检测制度
- 《火灾调查 第2版》 课件全套 刘玲 第1-12章 绪论、询问 -火灾物证鉴定
- 借用他人名义买车协议完整版
- 校园超市经营投标方案(技术方案)
- 基于Web服务的办公系统设计与实现的开题报告
评论
0/150
提交评论