




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1第三章第三章 简单随机抽样简单随机抽样 2本章要点本章要点 简单随机抽样是抽样中最基本、最成熟、也简单随机抽样是抽样中最基本、最成熟、也是最简单的抽样设计方式,是所有概率抽样方法是最简单的抽样设计方式,是所有概率抽样方法发展、比较的基础。发展、比较的基础。 要求通过学习熟练掌握简单随机抽样的抽要求通过学习熟练掌握简单随机抽样的抽样方式和样本抽选方法;样方式和样本抽选方法; 熟知总体均值、总体总值和总体比例的简熟知总体均值、总体总值和总体比例的简单估计;单估计; 掌握样本量的确定;了解子总体的估计。掌握样本量的确定;了解子总体的估计。3第一节第一节 抽样方式抽样方式4 简单随机抽样也称纯随机抽
2、样。对于大小为的总简单随机抽样也称纯随机抽样。对于大小为的总体,抽取样本量为的样本,若全部可能的样本被抽中体,抽取样本量为的样本,若全部可能的样本被抽中的概率都相等,则称这样的抽样为简单随机抽样。根的概率都相等,则称这样的抽样为简单随机抽样。根据抽样单位是否放回可分为放回简单随机抽样和不放据抽样单位是否放回可分为放回简单随机抽样和不放回简单随机抽样。回简单随机抽样。 (一)放回简单随机抽样(一)放回简单随机抽样 (二)不放回简单随机抽样(二)不放回简单随机抽样 (三)不放回与放回简单随机抽样的比较(三)不放回与放回简单随机抽样的比较 一、什么是简单随机抽样一、什么是简单随机抽样5(一)放回简单
3、随机抽样(一)放回简单随机抽样 如果抽样是有放回的,那么每次抽取都都是从如果抽样是有放回的,那么每次抽取都都是从 个个总体单位中抽取,这时可能的样本为总体单位中抽取,这时可能的样本为 个(考虑样本个(考虑样本单位的顺序)或单位的顺序)或 个(不考虑样本单位的顺序),个(不考虑样本单位的顺序),每个样本被抽中的概率为每个样本被抽中的概率为 或或 ,这种抽样方式,这种抽样方式就是放回简单随机抽样,所得的样本称为放回的简单就是放回简单随机抽样,所得的样本称为放回的简单随机样本。考虑与不考虑样本单位顺序的放回简单随随机样本。考虑与不考虑样本单位顺序的放回简单随机抽样,有一个共同的特点,即同一个单位有可
4、能在机抽样,有一个共同的特点,即同一个单位有可能在同一个样本中重复出现。但是他们也有明显的区别:同一个样本中重复出现。但是他们也有明显的区别:一是可能的样本数不同;二是样本的概率分布不同,一是可能的样本数不同;二是样本的概率分布不同,由此会导致估计量的概率分布不同。由此会导致估计量的概率分布不同。 NnNnnNC1nN1nnNC11 6 可以证明,不考虑顺序的放回简单随机抽可以证明,不考虑顺序的放回简单随机抽样的估计量的方差大于等于考虑顺序的放回简样的估计量的方差大于等于考虑顺序的放回简单随机抽样的估计量的方差,因此在抽样实践单随机抽样的估计量的方差,因此在抽样实践中,若用到放回简单随机抽样这
5、种方式,也只中,若用到放回简单随机抽样这种方式,也只讨论和使用考虑顺序的情形。讨论和使用考虑顺序的情形。 7(二)不放回简单随机抽样(二)不放回简单随机抽样 如果抽样是无放回的,即同一个单位不能如果抽样是无放回的,即同一个单位不能在样本中重复出现,那么,若考虑样本单位的在样本中重复出现,那么,若考虑样本单位的顺序,则可能的样本为顺序,则可能的样本为 个,每个样本被抽个,每个样本被抽中的概率为中的概率为 ;若不考虑样本单位的顺序,;若不考虑样本单位的顺序,则可能的样本为则可能的样本为 个,每个样本被抽中的概率个,每个样本被抽中的概率为为 。这样的抽样方式就是不放回简单随机。这样的抽样方式就是不放
6、回简单随机抽样,所得的样本称为不放回简单随机样本。抽样,所得的样本称为不放回简单随机样本。 )!(!nNN !)!(NnN nNCnNC18 考虑样本单位顺序与不考虑样本单位顺序的不放回考虑样本单位顺序与不考虑样本单位顺序的不放回简单随机抽样,除了单位不可能在同一个样本中重复简单随机抽样,除了单位不可能在同一个样本中重复出现这一共同特点外,还有一个共同点,即虽然他们出现这一共同特点外,还有一个共同点,即虽然他们的可能样本数不同,考虑顺序是不考虑顺序的的可能样本数不同,考虑顺序是不考虑顺序的 倍,倍,但是它们的样本却有相同的概率分布。由此会导致依但是它们的样本却有相同的概率分布。由此会导致依据样
7、本构造的估计量的概率分布也是相同的。据样本构造的估计量的概率分布也是相同的。 由于这一共同点的存在,加之不考虑顺序的放回简由于这一共同点的存在,加之不考虑顺序的放回简单随机抽样的工作量更小,所以抽样实践中对于不放单随机抽样的工作量更小,所以抽样实践中对于不放回简单随机抽样,只讨论和使用不考虑顺序不放回简回简单随机抽样,只讨论和使用不考虑顺序不放回简单随机抽样这种方式。单随机抽样这种方式。 ! n9(三三)不放回与放回简单随机抽样的比较不放回与放回简单随机抽样的比较 1、每次抽取样本单位面对的总体结构不同。这是二者、每次抽取样本单位面对的总体结构不同。这是二者的主要不同之处。这一点使得前者的数学
8、处理相对的主要不同之处。这一点使得前者的数学处理相对简单。简单。 2、样本提供的信息量不同。显然,在样本量一定的条、样本提供的信息量不同。显然,在样本量一定的条件下,由于后者提供的信息量大于前者,其抽样效件下,由于后者提供的信息量大于前者,其抽样效率更高。率更高。 在实践中,一般多采用不考虑顺序的不放回简单在实践中,一般多采用不考虑顺序的不放回简单随机抽样,所以以下讨论如无特别说明,都指这一随机抽样,所以以下讨论如无特别说明,都指这一类简单随机抽样。类简单随机抽样。 10二、简单随机样本的抽选方法二、简单随机样本的抽选方法 简单随机样本的抽选,首先要将总体简单随机样本的抽选,首先要将总体 个单
9、位从个单位从1到到 编号,每个单位对应一个号;编号,每个单位对应一个号;然后从所编的号中抽号,如果抽到某个号,然后从所编的号中抽号,如果抽到某个号,则对应的那个单位入样,直到抽够则对应的那个单位入样,直到抽够 个单位个单位为止。为止。 (一)抽签法(一)抽签法 (二)随机数法(二)随机数法 nNN11(一)抽签法(一)抽签法 当总体不大时,可分别采用两种方法抽当总体不大时,可分别采用两种方法抽取。一种是全样本抽选法,另一种是逐个抽取。一种是全样本抽选法,另一种是逐个抽选法,按这两种方法抽到的选法,按这两种方法抽到的 个单位的样本个单位的样本是等价的,每个被抽到的样本的概率都等于是等价的,每个被
10、抽到的样本的概率都等于 。nNC1n12(二)随机数法(二)随机数法 当总体较大时,抽签法实施起来比较困当总体较大时,抽签法实施起来比较困难,这时可以利用随机数表、随机数骰子、难,这时可以利用随机数表、随机数骰子、摇奖机、计算机产生的伪随机数进行抽样。摇奖机、计算机产生的伪随机数进行抽样。1、利用随机数表进行抽选。、利用随机数表进行抽选。随机数表是一张由随机数表是一张由0,1,2,9这十这十个数字组成的,一般常用的是五位数的随机个数字组成的,一般常用的是五位数的随机数字表,数字表,10个数字在表中出现的顺序是随机个数字在表中出现的顺序是随机的,每个数字都有同样的机会被抽中。的,每个数字都有同样
11、的机会被抽中。13 用随机数表抽选简单随机样本时,一般可用随机数表抽选简单随机样本时,一般可根据总体大小根据总体大小 的位数决定在随机数表中随的位数决定在随机数表中随机抽取几列,比如机抽取几列,比如 =768,要从中抽取要从中抽取 =10的简单随机样本,则在随机数表中随机抽取的简单随机样本,则在随机数表中随机抽取相邻的相邻的3列,顺序往下(或往上),选出前列,顺序往下(或往上),选出前10个个001到到768之间的互不相同的数,如果这之间的互不相同的数,如果这3列列随机数字不够,可另选其他随机数字不够,可另选其他3列继续,直到抽列继续,直到抽够个够个 单位为止。单位为止。nNNn14 用此种方
12、法,当用此种方法,当 的最高位数较小,比如的最高位数较小,比如小于小于5,且不小,且不小 时,由于读到的随机数被舍时,由于读到的随机数被舍弃不用的比例较大,抽选效率较差。此时采弃不用的比例较大,抽选效率较差。此时采用下面的方法。在随机数表中随机抽取用下面的方法。在随机数表中随机抽取3列,列,顺序往下,如果得到的随机数大于顺序往下,如果得到的随机数大于247,小于,小于989(因为(因为247的的4倍为倍为988,因此,因此000及及989到到999的数字应舍弃),则用这个数除以的数字应舍弃),则用这个数除以247,得到的余数入样,显然这种方法效率要高得得到的余数入样,显然这种方法效率要高得多。
13、随机数表的起始页和起始点都应用随机多。随机数表的起始页和起始点都应用随机数产生。数产生。Nn153、利用摇奖机进行抽选。、利用摇奖机进行抽选。 4、利用计算机产生的伪随机数进行抽选。通常、利用计算机产生的伪随机数进行抽选。通常产生的伪随机数有循环周期。因此在有条件产生的伪随机数有循环周期。因此在有条件的情况下,一般不建议使用此种方法。的情况下,一般不建议使用此种方法。 2、利用随机数骰子进行抽选。、利用随机数骰子进行抽选。16(一)简单随机抽样在抽样理论中的地位(一)简单随机抽样在抽样理论中的地位它是抽样中最容易掌握的技术、也是发展它是抽样中最容易掌握的技术、也是发展最成熟的技术,建立了最完备
14、的理论。简单最成熟的技术,建立了最完备的理论。简单随机抽样也是比较其他抽样设计方法优劣的随机抽样也是比较其他抽样设计方法优劣的基础。其他抽样方法技术都是在它的理论技基础。其他抽样方法技术都是在它的理论技术基础上,针对它的局限发展起来的。术基础上,针对它的局限发展起来的。 三、简单随机抽样在抽样理论中的地位三、简单随机抽样在抽样理论中的地位 与局限性与局限性17 若总体单位数若总体单位数 很大时,编制抽样框困很大时,编制抽样框困难;抽样框中即使有辅助信息也不加利用,难;抽样框中即使有辅助信息也不加利用,使得估计的统计效率较其他利用辅助信息的使得估计的统计效率较其他利用辅助信息的抽样设计方法低;由
15、于样本在总体中的地理抽样设计方法低;由于样本在总体中的地理分布范围较广,如果采取面访,则费时、费分布范围较广,如果采取面访,则费时、费钱、费力,困难较大;可能得到一个钱、费力,困难较大;可能得到一个“差差”的简单随机样本;若不用计算机,而用随机的简单随机样本;若不用计算机,而用随机数表或随机数骰子抽取一个大样本,比较劳数表或随机数骰子抽取一个大样本,比较劳神单调。神单调。 N(二)简单随机抽样的局限性(二)简单随机抽样的局限性18四、有关指标与符号四、有关指标与符号指指 标标 总总 体体 样样 本本 总值总值均值均值比例比例比率比率有限总体方差有限总体方差无限总体方差无限总体方差 NiiYY1
16、 NiiYNY11)或或(0 1,111 iNiiYYNNNPXYXYXYRNiiNii 1121221)(11 NNYYNSNi NjYYN122)(1 niiyy1 niiyny11)或或 0 1( ,111 iniiyynnnpxyxyxyRniinii 11212)(11yynsnii 19第二节第二节 总体均值与总体总值总体均值与总体总值的简单的简单估计估计20(一)简单估计量的定义 y(三)简单估计量 的方差(四)简单估计量 的方差的无偏估计 y(二)简单估计量 的无偏性(五)放回简单随机抽样的简单估计 (六)设计效应(七)影响估计量精度的因素y一、总体均值的简单估计一、总体均值的
17、简单估计 21(一)简单估计量的定义(一)简单估计量的定义 对于简单随机抽样,最简单的估计是利用样本均值对于简单随机抽样,最简单的估计是利用样本均值作为总体均值的估计,即总体均值的简单估计量为:作为总体均值的估计,即总体均值的简单估计量为: niiyny11也就是说,样本均值是总体均值的简单估计量。也就是说,样本均值是总体均值的简单估计量。22(二)简单估计量(二)简单估计量 的无偏性的无偏性对于简单随机抽样,对于简单随机抽样, 是是 的无偏估计,即有的无偏估计,即有 yyYYyE)(证明:证明: nNCjjCyyEnN 1)()(12111jnjCjjCjjyyynynNnN NiinNYC
18、n1111YYNnnYCCnyENiiNiinNnN 111111)(YYNnnyEnyENiinii 111)(1)(这就是对称性论证法。由于总体中每一个单位的入样概率这就是对称性论证法。由于总体中每一个单位的入样概率都相等,所以不放回简单随机抽样是一种等概率抽样。都相等,所以不放回简单随机抽样是一种等概率抽样。23(三三)简单估计量简单估计量 的方差的方差 式中,式中, 抽样比;抽样比; 为有限总体校正系数。为有限总体校正系数。 y21)(SnfyV Nnf f 1证明:证明: 212)1()()(YynEYyEyVnii 21)(1YyEnnii )(1)(12212 jijiniiYy
19、YyEnYyEn21)(YYNnNii )(21YyEnii 24 jijiYyYyE)()()1()1(YYYYNNnnjjii )()1()1(1)(1)(2212YYYYNNnnnYYNnnyVjijiNii )(11)(121YYYYNnYYnNjjiiNii (11)()111(12121YYNnYYNnnNNiiNii 2211)(11SnfYYNnNnNNii 25 (四四)简单估计量简单估计量 的方差的无偏估计的方差的无偏估计 的无偏估计是:的无偏估计是: y)(yV21)(snfyv 式中式中 为样本方差。为样本方差。 2s证明:证明: 212)(11yynsnii 21)(
20、)(11YyYynnii )()(11221YynYynnii 26根据对称性论证法及根据对称性论证法及 的表达式,有的表达式,有 )(yV)(21YyEnii 21)(YYNnNii 2)1(SNNn )(2YynE2)(YynE )(ynV 2SNnN 由此可得:由此可得: 222)() 1() 1()(SnNNnNnSsE 27(五)放回简单随机抽样的简单估计(五)放回简单随机抽样的简单估计 现实中有许多情况下,抽样必须是放回的,现实中有许多情况下,抽样必须是放回的,即从总体中抽中的单位每次都要放回总体中去。即从总体中抽中的单位每次都要放回总体中去。例如在城市中对行人、车辆的调查,对超市
21、顾例如在城市中对行人、车辆的调查,对超市顾客、影剧院观众的调查等抽样都是有放回的,客、影剧院观众的调查等抽样都是有放回的,从而,有可能重复抽中某些单位。从而,有可能重复抽中某些单位。 对于每次抽到的结果对于每次抽到的结果(视为随机变量视为随机变量) 都有都有 iyYYNyEiNii 11)(221)(1)( YYNyViNii28由此可以证明:由此可以证明: YyEnyEnii )(1)(1nyVnyVnii212)(1)( 注意到注意到 )(21yyEnii )(212ynyEnii niiiyEyVnyEyV122)()()()()()(2222YnnYn 2)1( n29因此样本方差因此
22、样本方差 212)(11yynsnii 是无限总体方差是无限总体方差 的无偏估计量。的无偏估计量。 2 方差方差 的一个无偏估计是:的一个无偏估计是: )(yVnsyv2)( 考虑样本单位顺序的放回简单随机抽样也是考虑样本单位顺序的放回简单随机抽样也是等概率抽样。等概率抽样。 30)()(yVyVdeffsrsdeff11)() 1(22nNNSnNnNSnNNdeffn这说明除非 =1,否则在相同的样本量下,放回简单随机抽样的方差总是大于不放回的方差,即它的抽样效率一般比不放回简单随机抽样的低。根据抽样设计效应定义: 放回简单随机抽样的 为:31n【例【例3-3】为调查某大学学生的电信消费水
23、平,在全校】为调查某大学学生的电信消费水平,在全校=15230名学生中,用简单随机抽样的方法抽得一个名学生中,用简单随机抽样的方法抽得一个=36的样本。对的样本。对每个抽中的学生调查其上个月的电信支出金额(如表每个抽中的学生调查其上个月的电信支出金额(如表3-6所所示)。试以示)。试以95%的置信度估计该校大学生该月电信消费的平的置信度估计该校大学生该月电信消费的平均支出额。均支出额。 样本序号消费额(元)样本序号消费额(元)样本序号消费额(元)123456789101112453671317089337522567951314151617181920212223244853243941931
24、959111643576252627282930313233343536835133252890175743146194732 , , , , , 。因此,对该校大学生某月的电信消费的人均支出额的估计为53.64(元),由于置信度95%对应的 =1.96,所以,可以以95%的把握 说该校大学生该月的电信消费的人均支出额大约在53.641.966.1355,即41.6165.67元之间。 若采取放回简单随机抽样,则: , , ,以95%的把握估计该校大学生该月的电信消费的人均支出额大约在53.641.966.1428,即41.6065.68元之间。 计算结果说明,不放回比放回简单随机抽样估计的置
25、信区间略小一些。由于总体较大而抽样比较小,所以两者之间相差很小。1931iy )(64.53元y02771212. 0/ )1 (nf41.13582s6444.37/)1 ()(2nsfyv1355. 6)(yset64.53y7336.37)(2nsyv1428. 6)(yse解:依据题意和表中数据,可计算得:33 总体总值为总体均值的总体总值为总体均值的 倍,即倍,即 NiiYYNY1 niiynNyNY1N(一)简单估计量的定义(一)简单估计量的定义 N倍的样本均值是总体总值的简单估计量,倍的样本均值是总体总值的简单估计量,即即 二、总体总值的简单估计二、总体总值的简单估计 只要我们有
26、了总体均值的估计结果,就只要我们有了总体均值的估计结果,就可以很容易地推出总体总值的估计结果。可以很容易地推出总体总值的估计结果。34由于总体总值是总体均值的由于总体总值是总体均值的N倍,其简单倍,其简单估计量也是总体均值估计量的估计量也是总体均值估计量的N倍,而倍,而N是固是固定常数,所以总体总值的简单估计量的性质定常数,所以总体总值的简单估计量的性质由总体均值的简单估计量的性质来决定。由总体均值的简单估计量的性质来决定。 容易证明容易证明YYNyNEyNEYE )()()(222)1()()(SnfNyVNYV 222)1 ()()(snfNyvNYv 的无偏估计为的无偏估计为 )(YV(
27、二)简单估计量的性质(二)简单估计量的性质35【例例3.4】试以】试以95%的置信度估计例3.3中该校大学生该月电信消费的总支出额。解:依题意,N=15230,根据例3.3计算的结果,可估计该校大学生该月电信消费的总支出额为 (元)。在不放回简单随机抽样下, =1523037.6444 =1523037.6444=8731 727 749(元), (元), 以95%的把握估计该校大学生该月电信消费的总支出额为: 816 937.21.9693 443.71元即在633 787.531 000 086.87元之间。 若为放回简单随机抽样,则可得: 1523037.7336 =8752417947
28、(元), (元),以95%的把握估计该校大学生该月电信消费的总支出额为816 937.21.9693 554.36元,即在633 570.651 000 303.75元之间。2 .81693764.5315230yNY)()(2yvNYv271.93443)()(YvYse)()(2yvNYv236.93554)()(YvYse36第三节第三节 总体比例的简单估计总体比例的简单估计37规定规定 属属性性。,总总体体单单元元不不具具有有某某种种;总总体体单单元元具具有有某某种种属属性性0, 1Y 设总体中有设总体中有 个单位,具有某种属性的单位数个单位,具有某种属性的单位数为为 ;不具有该种属性
29、的单位数为;不具有该种属性的单位数为 。N1N1NN 具有某种属性的单位比例为:具有某种属性的单位比例为:YYNNNPNii 111不具有该种属性的单位的比例为:不具有该种属性的单位的比例为:PNNNQ 11 因此对总体比例的估计就是对总体均值的估计,因此对总体比例的估计就是对总体均值的估计,对总体中具有某种属性单位的总个数对总体中具有某种属性单位的总个数 的估计是的估计是对总体总值估计的一个特例。对总体总值估计的一个特例。 1N一、问题的提法一、问题的提法 38(一)简单估计量的定义(一)简单估计量的定义 二、总体比例的简单估计量及其性质二、总体比例的简单估计量及其性质 根据调查要求,利用简
30、单随机抽样的方式随机抽取个单位组成样本,其中 个具有某种属性,则样本比例(样本均值) 就是总体比例 的简单估计量; 就是总体中具有某种属性单位的总个数 的简单估计量。 n1nynynnpnii11NNP/1NpN 11N39(二)估计量的性质(二)估计量的性质pPPYyEpE)()(1、 是 的无偏估计。即有:p1)(NnNnpQpV2、 的方差为:3、 的无偏估计量是 ,即)(pV)(pvpqnfpqNnnNpv11) 1()(40当 都比较大时,我们以正态分布给出 及 的近似置信区间(置信度为 )为:nNnN,P1N11)1 (,1)1 (npqftpnpqftp1)(,1)(npqnNN
31、tNpnpqnNNtNpP1N)211)1 (),211)1 (nnpqftpnnpqftp)21)(),21)(nNnpqnNNtNpnNnpqnNNtNp修正后的 与 的置信区间分别为:41 【例例3.5】试以】试以95%的置信度估计例3.3中该校大学生该月电信消费支出超出80元的人数及其比例。解:根据例3.3所给的资料可知, =15230, =36, 7, =1.96。由此可计算得: 于是 的95%的置信区间为 的95%的置信区间为(0.0496 ,0.3392 )=(755,5166)。 Nn1nt1944. 01nnp1566. 0)1 (,0285. 011pppqnf0668.
32、01566. 00285. 01)1 (npqf0139. 021nP)0139. 00668. 096. 1 (1944. 0)211)1 (nnpqftp1NNN=(0.0496,0.3392)42第四节第四节 样本量的确定样本量的确定43 在抽样调查的理论方法研究中,样本量的确定在抽样调查的理论方法研究中,样本量的确定既有重要的理论意义,又有现实的实用价值。样本既有重要的理论意义,又有现实的实用价值。样本量过大,不符合抽样调查的宗旨;过小,则抽样误量过大,不符合抽样调查的宗旨;过小,则抽样误差偏大,无法保证估计精度的要求。样本量的确定差偏大,无法保证估计精度的要求。样本量的确定主要受两个
33、方面因素的影响和制约:主要受两个方面因素的影响和制约: 一是对抽样估计量精度的要求。对于一个确定一是对抽样估计量精度的要求。对于一个确定的抽样设计,估计量的精度要求高意味着要求的抽的抽样设计,估计量的精度要求高意味着要求的抽样误差小,而要想抽样误差小,就必须样本量大。样误差小,而要想抽样误差小,就必须样本量大。而总体单位调查标志的变异程度、总体的大小、样而总体单位调查标志的变异程度、总体的大小、样本设计和所使用的估计量、回答率等都是影响估计本设计和所使用的估计量、回答率等都是影响估计精度的因素,从而也是影响样本量的因素。精度的因素,从而也是影响样本量的因素。一、确定样本量主要考虑的因素一、确定
34、样本量主要考虑的因素44 二是实际调查运作的限制。调查的经费能支持二是实际调查运作的限制。调查的经费能支持多大的样本?允许调查持续的时间有多长?需要多多大的样本?允许调查持续的时间有多长?需要多少调查人员?虽然有些限制因素在样本量的计算公少调查人员?虽然有些限制因素在样本量的计算公式中还无法体现,但是在确定最终所需的样本量时式中还无法体现,但是在确定最终所需的样本量时必须加以考虑。实践中样本量的确定是在多种约束必须加以考虑。实践中样本量的确定是在多种约束条件下进行的折衷过程。条件下进行的折衷过程。 由于大部分限制约束条件不便于量化,确定样由于大部分限制约束条件不便于量化,确定样本量的计算公式时
35、往往只在抽样精度与调查费用两本量的计算公式时往往只在抽样精度与调查费用两者之间权衡。采用两种不同的方式来确定:一种是者之间权衡。采用两种不同的方式来确定:一种是在总费用一定的条件下使精度最高;另一种是在满在总费用一定的条件下使精度最高;另一种是在满足一定精度要求的条件下使费用最小。足一定精度要求的条件下使费用最小。 45给定绝对误差限给定绝对误差限 、相对误差限、相对误差限 和变异和变异系数系数 的允许上限的样本量确定公式,即的允许上限的样本量确定公式,即分别有:分别有: dr)(yCv2202tSnd22022t Snr Y2220)(YyCvSn 二、估计总体均值(总值)的样本确定二、估计
36、总体均值(总值)的样本确定46 由于总体方差由于总体方差 和总体均值和总体均值 未知,因此在利未知,因此在利用上述公式时,必须事先对它们做出估计。实际工用上述公式时,必须事先对它们做出估计。实际工作中,可以通过以往对同类问题调查积累的经验来作中,可以通过以往对同类问题调查积累的经验来估计,也可以通过预调查来估计,或通过其他调查估计,也可以通过预调查来估计,或通过其他调查方法和定性分析方法获得。方法和定性分析方法获得。 对于复杂抽样设计方法,由于确定样本量的公式对于复杂抽样设计方法,由于确定样本量的公式比较复杂,常常难于计算。在同样精度要求的条件比较复杂,常常难于计算。在同样精度要求的条件下,简
37、单随机抽样的样本量下,简单随机抽样的样本量 相对容易获得,这时相对容易获得,这时可以利用(可以利用(3.21)式先计算复杂抽样设计的设计效)式先计算复杂抽样设计的设计效应应 ,然后再间接推算复杂抽样设计方法所需要,然后再间接推算复杂抽样设计方法所需要的样本量的样本量 ,即有:,即有: 2SYndeffndeffnn 47【例例3.6】在例】在例3.3中,如果要求以95%的置信度估计该校大学生该月人均电信消费支出的绝对允许误差不超过5元,样本量应确定为多少? 解:依据所给条件: =15230, =5,置信度95%对应的标准正态分布表的上侧分位数为 1.96,且 =1358.41,据此可计算得:
38、=Nt2s2220Stn74.208541.135896. 1222061523074.208174.208100Nnnn 也就是说,至少应抽取一个样本量为206的简单随机样本,才能满足95%置信度条件下绝对误差不超过5元的精度要求。48根据样本比例根据样本比例 的方差公式的方差公式 可以推得:可以推得: p1)( NnNnpQpVNnnn1100 )(0pVPQn 其中其中 同样可求得给定绝对误差限同样可求得给定绝对误差限 、相对误差限、相对误差限 和变异系数和变异系数 的允许上限的样本量确定公式,的允许上限的样本量确定公式,即分别有:即分别有:dr)(yCv2202tSnd22022t S
39、nr Y2220)(YyCvSn 在无限总体或放回抽样情形下,在无限总体或放回抽样情形下, 即为所确即为所确定的样本量。定的样本量。 0n三、估计总体比例的样本量确定三、估计总体比例的样本量确定49【例例3.7】 在例3.5中,如果要求以95%的置信度估计该校大学生该月电信消费支出超出80元的人数比例的相对允许误差不超过10%,样本量至少应为多少?解:根据例3.5所给的资料和计算的结果可知: =15230, =36, 7, =1.96。 ,由此可计算得:Nn1nt,1944. 0p8056. 01944. 01q97.15911944. 001. 08056. 096. 12220pqtn14
40、4215230197.1591197.15911100Nnnn 计算结果说明,至少应抽取一个样本量为1442的简单随机样本,才能满足95%置信度条件下相对允许误差不超过10%的精度要求。50四、逆抽样法四、逆抽样法 现实中有这样一种情况,即总体中具有现实中有这样一种情况,即总体中具有所考虑属性的单位数很少,也就是说所考虑属性的单位数很少,也就是说 值很值很小。对于此类稀有事件的比例估计问题,利小。对于此类稀有事件的比例估计问题,利用前面给出的公式确定样本量有困难。用前面给出的公式确定样本量有困难。P 霍丹(霍丹(HaldaneHaldane)19451945年提出一种称为年提出一种称为逆抽样的
41、方法,专门用于此类小比例的抽样。逆抽样的方法,专门用于此类小比例的抽样。51第五节第五节 子总体估计子总体估计52一、问题的提出一、问题的提出 我们把总体中具有某种共同属性特征的单位的我们把总体中具有某种共同属性特征的单位的集合称为子总体。集合称为子总体。 对子总体的处理有多种方法:若每个子总体在编对子总体的处理有多种方法:若每个子总体在编制抽样框时就可以区分开,可以采用分层抽样方法进制抽样框时就可以区分开,可以采用分层抽样方法进行估计;若事先不能将各个子总体区分开来,但是事行估计;若事先不能将各个子总体区分开来,但是事先可以知道各个子总体的单位数先可以知道各个子总体的单位数 ,则可采用事后,
42、则可采用事后分层的方法进行估计;还有一种情况是,既不能事先分层的方法进行估计;还有一种情况是,既不能事先将各个子总体区分开来,又无法事先知道各个子总体将各个子总体区分开来,又无法事先知道各个子总体的单位数的单位数 。本节的讨论仅限于后一类子总体的估。本节的讨论仅限于后一类子总体的估计计 。jNjN53 jnijijjyny1)()(1 jNijijjYNY1)()(1二、子总体均值的估计二、子总体均值的估计样本均值样本均值是子总体均值是子总体均值的无偏估计量的无偏估计量542)(1)(jjjjSnfyV 式中式中 为第为第 个子总体的抽样比,子总体的个子总体的抽样比,子总体的方差未知,可用其样
43、本方差方差未知,可用其样本方差 2)(1)(2)(11jnijijjyynsj jjjNnf j其方差为其方差为 来估计。至此我们的问题并没有解决,因为来估计。至此我们的问题并没有解决,因为 未未知,所以知,所以 也是未知的。也是未知的。 jNjf55 我们可以将单位是否属于第我们可以将单位是否属于第 个子总体看作是总体个子总体看作是总体单位的一个属性特征,那么单位的一个属性特征,那么 就是总体的比例就是总体的比例 ,而而 就是其样本的比例就是其样本的比例 , 是是 的无偏估计,因的无偏估计,因此有此有jNNj/Pnnj/ppPNNnnEjj )(因为因为 和和 都是固定的,所以都是固定的,所
44、以 fNnNnEjj )(因此可用因此可用 来估计来估计 fjjjNnf/据此我们可得到据此我们可得到 的无偏估计量为的无偏估计量为)()( jyV2)(1)()()(111)(jnijijjjyynnfyvj njN56 上一小节解决了子总体均值的估计问题,上一小节解决了子总体均值的估计问题,但是由于但是由于 未知,子总体总值的估计问题依未知,子总体总值的估计问题依然没有得到解决。然没有得到解决。 jN定义定义 ,否否则则个个子子总总体体;个个单单元元属属于于第第若若第第0,jiYUii记记NNPjj jjPQ 1它们可以分别用它们可以分别用 , 进行估计。进行估计。nnpjj jjpq 1
45、三、子总体总值的估计三、子总体总值的估计57于是有于是有 )(1)(1)(1111jjNijijjNijiNiiYPYNNNYNUNUjj )(112122UNUNSNiiu )()(112)(221)(jjNijiYNPYNj )()()(112)(22)(2)(1)(jjjjjNijiYNPYNYYNj )()()1(1122)(2jjjjjPNNYNSNN 2)(2)(111jjjjjYQPNNSNN 58 总体总值总体总值 (也就是子总体总值(也就是子总体总值 )的)的一个简单无偏估计为一个简单无偏估计为 U)( jY jnijiniijynNunNuNY1)(1)(它的方差为它的方差
46、为 222)()1()()(ujSnfNuVNYV )(111)1(2)(22jjjjjYQPNNSNNnfN 59而样本方差而样本方差 212)(11uunsniiu )()1(112)(2jjjjjyqnpsnn )()(112)(2)(1)(jjjjnijiyqnpyynj 因此因此 的一个无偏估计为的一个无偏估计为 )()( jYV)()()1()1()(2)(2)(1)(2)(jjjjnijijyqnpyynnfNYvj 60编号为奇数的习题答案编号为奇数的习题答案3.1判断以下抽取方式是否为等概率抽样判断以下抽取方式是否为等概率抽样:(1)是是 (2)否否 (3)是是 (4)否否613.3为调查某中学学生的每月购书支出水平,在为调查某中学学生的每月购书支出水平,在
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025确保担保合同(适用于企业作为担保人的情况)
- 个人承揽汽车运输合同标准文本
- 出售花木苗圃合同标准文本
- 会务合作合同标准文本
- 催收写合同标准文本
- 冷库维护保养合同范本
- 买房电子合同标准文本
- 丽水工程合同范例
- 出口产品退回合同范例
- 办公厂房购买合同范例
- Unit 9 Kids and Computers公开课一等奖省优质课大赛获奖课件
- 重症感染与抗生素的选择课件
- 截流式合流制管道系统的特点与使用条件课件
- (站表2-1)施工单位工程项目主要管理人员备案表
- 中班美术《我心中的太阳》绘画课件幼儿园优质课公开课
- 应急管理工作检查记录表
- 四年级下册英语课件:Unit 4 There are seven days in a week-Lesson 19人教精通版
- 千分尺公开课教案
- 加油站承重罐区安全风险及管理
- 箱变施工安全文明保证措施
- 三体系管理手册全文
评论
0/150
提交评论