抽样方法讲稿精品课件_第1页
抽样方法讲稿精品课件_第2页
抽样方法讲稿精品课件_第3页
抽样方法讲稿精品课件_第4页
抽样方法讲稿精品课件_第5页
已阅读5页,还剩96页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、关于抽样方法第一张,PPT共一百零一页,创作于2022年6月 非概率抽样的用途是有限的,因为抽选单元的倾向性不允许对调查总体进行推断。然而非概率抽样快速简便,对探索性研究很有用,特别是在市场调查中应用非常广泛。第二张,PPT共一百零一页,创作于2022年6月 一、非概率抽样 非概率抽样是用主观的(非随机的)方法从总体中抽选单元,是一种快速、简易且节省的从总体中选取样本单元的方法。 要对总体进行推断需要对样本进行一些假定,即要求样本对总体具有代表性。在这点上非概率抽样一般不具备。第三张,PPT共一百零一页,创作于2022年6月 由于非概率抽样抽取样本有倾向性与偏差且没有一个抽样框,不可能计算出各

2、个单元的入样概率。从而无法得到总体目标量的可靠估计值及其抽样误差估计值。第四张,PPT共一百零一页,创作于2022年6月非概率抽样能用在下面几个方面的研究中:用来形成一种想法;作为设计开发概率抽样调查的初始步骤;在后续步骤中帮助理解概率抽样调查结果。有时,非概率抽样是唯一可行的选择。例如,在医学实验中,采用志愿者抽样可能是取得数据的唯一途径。第五张,PPT共一百零一页,创作于2022年6月非概率抽样常被用于抽选参加焦点座谈和深入访问的个人。另一个能较好发挥非概率抽样作用的例子是预研究。第六张,PPT共一百零一页,创作于2022年6月 非概率抽样的优点是:快速简便;费用相对较低;不需要抽样框;对

3、探索性研究和调查的设计开发很有用。第七张,PPT共一百零一页,创作于2022年6月非概率抽样的缺点是:为了对总体进行推断,需要对样本的代表性做很强的假定。不可能得到可靠的估计值以及抽样误差估计值。第八张,PPT共一百零一页,创作于2022年6月 非概率抽样的种类 非概率抽样方法有五种:随意抽样自愿抽样判断抽样配额抽样修正的概率抽样。第九张,PPT共一百零一页,创作于2022年6月 1.随意抽样随意抽样的样本单元的抽选以无目标、随意的方式进行,几乎没有或完全没有计划。它假定总体是同质的,即总体单元都相似。比如“街道拦截”访问法。第十张,PPT共一百零一页,创作于2022年6月 2.志愿者抽样 被

4、调查者都是志愿者。例如具有特定病情的人参加某些医疗实验;打电话参与广播或电视节目的人;抽选参加焦点座谈或深入访问的人。第十一张,PPT共一百零一页,创作于2022年6月 3.判断抽样由专家有目的地抽选有代表性的样本。它适用于探索性研究,如:抽选参加焦点座谈或深入访谈的人,但不宜用在试调查中。第十二张,PPT共一百零一页,创作于2022年6月 4.配额抽样 这是最常见的一种非概率抽样。抽样要从各个子总体中选取特定数量的单元(配额)。 总样本量:900人18-2526-3031-3536-4041-45男女比例28%17%17%19%19%50-55%50-45%第十三张,PPT共一百零一页,创作

5、于2022年6月 1936年总统选举预测得票率 单候 选 人 实际得票率 文摘杂志预测 盖洛普预测 罗斯福 602 430 540 兰 登 398 570 460 合 计 1000 1000 1000 那么,文摘杂志失败,盖洛普成功的原因究竟何在呢?第十四张,PPT共一百零一页,创作于2022年6月盖洛普采用的是一种叫作“分配法的方法。这种方法力求使调查对象在州,市,镇,村的大小,年龄,性别、社会阶层,人种等方面,能准确地代表美国的所有选民。例如,如果二十几岁的人占全体选民的27%,那么在3000人的调查对象中,二十几岁的人也应占27%,即810人。为确保所分配的比率不致出错,务必要求调查员直

6、接面见调查对象,以便确认。因此,调查的实施多采取访问调查的方法。第十五张,PPT共一百零一页,创作于2022年6月 盖洛普应用分配法进行总统选举颅测调查获得极大成功以后,该方法开始被广泛应用于民意调查和市场调查。可是在1948年的总统选举中,采用同样方法预言杜威将当选,结果与预测恰恰相反,杜鲁门当选了。 预 测 实际 候选人 Crossley Gallup Roper 结果杜鲁门 45% 44% 38% 50%杜威 50% 50% 53% 45% 第十六张,PPT共一百零一页,创作于2022年6月 从此,盖洛普失去了在民意调查界神话般的地位。不仅如此,其它调查机构也都出现了同样的失败。人们开始

7、向民意调查投来了怀疑的目光。于是,由许多学者和专家组成了一个委员会,对失败的原因进行了研究。结果指出分配法的下列缺点:第十七张,PPT共一百零一页,创作于2022年6月 采用分配法的目的最终在于使所抽选的调查对象能正确代表全体选民。可是分配法给予调查员的仅仅是这样一些关于基本特征方面的框框;大城市30-40岁的白人男子多少人,大城市40-50岁的黑人女子多少人等等,只要是属于这个框框之内的人调查对象的最终确定就完全取决于调查员的个人判断了。第十八张,PPT共一百零一页,创作于2022年6月 因此,不可避免调查员的爱好,调查对象对访问的配合程度等因素的影响。即使在年龄,社会阶层等分配调查对象时考

8、虑到了的几个特征上,调查对象能完全代表全体选民,但其他特征还是可能出现偏差。研究结果,随机抽样方法作为消除分配法主观因素影响的手段开始受到重视。第十九张,PPT共一百零一页,创作于2022年6月盖洛普后来的成功采用概率抽样年份 样本容量 获胜后选人 盖洛普 选举结果 误差 预测值 1952 5385 艾森豪威尔 51% 55.4% +4.4% 1956 8144 艾森豪威尔 59.5% 57.8% -1.7% 1960 8015 肯尼迪 51% 50.1% 0.1% 1964 6625 约翰逊 64% 61.3% -2.7% 1968 4414 尼克松 43% 43.5% 0.5% 1972

9、3689 尼克松 62% 61.8% -0.2% 1976 3439 卡特 49.5% 51.1% 1.6% 1980 3500 里根 55.3% 51.6% -3.7% 1984 3456 里根 59.0% 59.2% 0.2% 1988 4089 布什 56.0% 53.9% -2.1%第二十张,PPT共一百零一页,创作于2022年6月 5. 修正的概率抽样 修正的概率抽样是概率抽样与非概率抽样的结合。主要用于多阶段抽样,前几个阶段用概率抽样,最后用非概率抽样,一般是配额抽样。 第二十一张,PPT共一百零一页,创作于2022年6月 二、概率抽样在需要根据样本的结果对总体进行推断时应使用概率

10、抽样。最简单的概率抽样设计是等概率抽样,包括简单随机抽样和系统抽样。不等概率抽样比较复杂且大多需要辅助抽样框信息。不等概率抽样有:概率与大小成比例的抽样,整群抽样,分层抽样,多阶段抽样和多相抽样。不等概率抽样通常用来提高抽样设计方案的效率,或降低抽样费用。 第二十二张,PPT共一百零一页,创作于2022年6月 概率抽样有两条基本准则: 1) 单元是随机抽取的; 2) 调查总体中的每个单元都有一个非零的入样概率,并且能计算出这些概率。第二十三张,PPT共一百零一页,创作于2022年6月 概率抽样的主要优点有:能得到总体的可靠估计值并能计算每个估计值的抽样误差,因而能对总体进行推断。第二十四张,P

11、PT共一百零一页,创作于2022年6月 概率抽样的主要缺点有:与非概率抽样相比,概率抽样比较复杂,更费时,通常也更费钱。但总的说来,其利远大于弊。第二十五张,PPT共一百零一页,创作于2022年6月 概率抽样的种类 概率抽样有七种:简单随机抽样,系统抽样,等比例抽样,整群抽样,分层抽样,多阶抽样,多相抽样。第二十六张,PPT共一百零一页,创作于2022年6月 简单随机抽样(SRS)是所有概率抽样的出发点和理论基础。简单随机抽样是一种一步抽样法,它保证样本量为n的每个可能的样本都有相同的被抽中的概率p=n/N。抽样可以是放回的,也可以是不放回的。第二十七张,PPT共一百零一页,创作于2022年6

12、月 简单随机样本(图示)第二十八张,PPT共一百零一页,创作于2022年6月简单随机抽样在实际抽样中应用很少,常被用作评估其他抽样方法的效率的标准。抽样的误差是通过其抽样方差来测量的,如果一种抽样方法的抽样方差比另一种抽样方法的抽样方差小,我们就称这种抽样方法更有效率(统计效率)。第二十九张,PPT共一百零一页,创作于2022年6月与其他抽样技术相比,简单随机抽样有以下优点:是最简单的抽样技术;抽样框不需要其他(辅助)信息,唯一需要的只是一个关于调查总体所有单元的一个完全的清单和与其如何联系的信息;关于样本量的确定、总体估计与方差估计都有现成的标准公式可以利用,因此技术发展已经成熟。第三十张,

13、PPT共一百零一页,创作于2022年6月 简单随机抽样的缺点是:抽样框中即使有现成的辅助信息也不加利用,使得估计的统计效率较其他利用辅助信息的样本设计低;由于样本在总体中的地理分布范围比较广,如果采用面访,费用较高;有可能抽到一个“差的”样本;如果不用计算机,而用随机数表抽一个大样本将十分单调劳神。 第三十一张,PPT共一百零一页,创作于2022年6月 系统抽样(SYS)其抽样单元是从总体中等距抽出的。它需要一个抽样间距和一个随机起点。抽样间距是k=N/n,随机起点r是介于1到k之间的一个随机数。被抽中的单元是:r,r十k,r+2k,r+3k,r+(n-1)k。第三十二张,PPT共一百零一页,

14、创作于2022年6月 系统样本(图示)第三十三张,PPT共一百零一页,创作于2022年6月在系统抽样中,样本单元是从总体中按一定的(抽样)间距抽出的。如果N不能被n整除,则可以使用圆形系统抽样法来避免出现可能样本量不一致的情况。第三十四张,PPT共一百零一页,创作于2022年6月 系统抽样有以下优点:在没有抽样框时,可代替简单随机抽样;与简单随机抽样一样,系统抽样不需要辅助的抽样框信息;与简单随机抽样相比,系统抽样样本的分布较好(这还取决于抽样间隔及名录是如何排列的);与简单随机抽样一样,估计值容易计算;系统抽样比简单随机抽样简单。第三十五张,PPT共一百零一页,创作于2022年6月系统抽样的

15、另一个优点是,在事先没有总体单元名录的情况下,也可以用。此时,我们可以使用并构造一个概念抽样框(只需要单元的排列顺序),每隔k个抽一个单元直到总体的末尾。这种方法的一个缺点是,只有抽样完成后才知道实际样本量n。第三十六张,PPT共一百零一页,创作于2022年6月 系统抽样的缺点有:如果抽样间距正好碰上总体变化的某种未知的周期性,就会得到一个“差的”系统样本;由于不使用抽样框中的辅助信息,抽样策略的效率不高;在使用概念框时,不能预先知道最终样本量;抽样方差没有一个无偏的估计量;在总体大小N不能被样本量n整除且不使用圆形抽样法时,会得到样本量不同的样本。第三十七张,PPT共一百零一页,创作于202

16、2年6月与大小(或规模)成比例的概率(PPS)抽样PPS抽样是一种使用辅助信息从而使入样概率不相等的抽样技术。如果单元大小的度量是准确的,而且所研究的变量与单元的大小相关,PPS抽样能极大地提高精度。PPS抽样的一个很好的例子是商业调查。单元大小度量可用雇员数、年销售额、经营场所数等。第三十八张,PPT共一百零一页,创作于2022年6月 在PPS抽样中,单元的大小决定入样概率的大小。这就是说,以农场作为例子,一个面积为200公顷的农场被抽入样本的概率,是面积为100公顷的农场的二倍。第三十九张,PPT共一百零一页,创作于2022年6月 假定一个总体有六个农场,我们要估计这个农场总体的总支出。假

17、定我们已知每个农场的规模(以公顷计的农场大小),为便于说明,进一步假定我们已知它们的支出。第四十张,PPT共一百零一页,创作于2022年6月考虑下面的农场名录(总体值):抽样单元:农场抽样框辅助信息:以公顷计的农场规模调查变量:支出(元)15026000210004700003125638004300145000550023000062512500总计2000947300第四十一张,PPT共一百零一页,创作于2022年6月 对这个六个农场的总体,真正的总支出为947,300元。假定我们没有对这六个农场进行普查的经费,预算只够对一个农场的样本进行调查(把样本量取为1,只是为了说明方便,在实际调查

18、中,只抽一个单元的情况极少),我们可以抽简单随机样本,每个样本只含一个单元、每个单元入选的概率为16、大小为n=1的样本有六种可能。第四十二张,PPT共一百零一页,创作于2022年6月 下面我们来分析简单随机抽样的结果。对大小为1的样本,总体总支出的估计值,由抽中样本的单元的支出乘以该单元的权数1/6(权数是样本单元所代表的总体单元个数)得到。第四十三张,PPT共一百零一页,创作于2022年6月所有可能的n=1的简单随机样本。样本(抽中的农场)农场的如样概率农场的样本权数农场的支出(元)总体总支出的估计值(元)样本11/6626000156000样本21/664700002820000样本31

19、/6663800382800样本41/66145000870000样本51/662300001380000样本61/661250075000估计总值的平均数947300第四十四张,PPT共一百零一页,创作于2022年6月 用简单随机抽样时,总体的估计值随样本的不同而不同,其变化范围从75,000元到2,800,000元。PPS抽样能得到抽样变异性较小的估计值。第四十五张,PPT共一百零一页,创作于2022年6月样本(抽中的农场)农场的如样概率农场的样本权数农场的支出(元)总体总支出的估计值(元)样本150/20002000/50260001040000样本21000/20002000/1000

20、470000940000样本3125/20002000/125638001020800样本4300/20002000/300145000966667样本5500/20002000/500230000920000样本625/20002000/25125001000000估计总值的平均数947300所有可能的n=1的PPS样本第四十六张,PPT共一百零一页,创作于2022年6月对PPS样本,抽样变异性要小得多。从六个可能的样本得到的估计值的变化范围,从最低的920,000元到最高的1,040,000元,比简单随机样本好得多(PPS抽样的入样概率是按农场规模除以所有农场总规模计算得到的)。第四十七张

21、,PPT共一百零一页,创作于2022年6月 本例中假定农场的支出与其规模(大小)有关,这一假定在这里显然是成立的,否则PPS抽样不会这样有效。实际上,如果调查变量与大小变量不相关,PPS抽样可能不比简单随机抽样好(甚至可能更差)。 PPS抽样的主要优点是它使用了辅助信息,提高了抽样策略的统计效率,与简单随机抽样甚至与分层抽样相比,都能显著地减少抽样误差。第四十八张,PPT共一百零一页,创作于2022年6月 PPS抽样的主要优点是:由于使用了辅助信息,提高了抽样策略的统计效率,能显著地减少抽样误差。第四十九张,PPT共一百零一页,创作于2022年6月 PPS抽样有以下的缺点:抽样框中的所有单元,

22、都要有高质量的、能用作大小度量的辅助信息;抽样框的创建比简单随机抽样和系统抽样成本高,更复杂,因为需要度量和存储总体中每一个单元的大小;并非在任何情况下都能使用,因为并不是每一个总体都有稳定且与主要调查变量相关的有关大小或规模的度量;第五十张,PPT共一百零一页,创作于2022年6月抽样及估计(特别对不放回抽样)相当复杂;当单元大小度量不准确或不稳定时不适用,此时更好的办法是将单元按大小分组并使用分层抽样。第五十一张,PPT共一百零一页,创作于2022年6月 整群抽样 整群抽样中,总体单元被分为群,抽样时先抽取群的样本,调查被抽中的群中的所有单元。 采用整群抽样的两个理由:)抽选群能大大降低数

23、据收集的费用,当总体的分布比较广且调查采用面访时更是如此;)从总体中直接抽选个体在实际中并不总是可行的(没有关于个体的抽样框);第五十二张,PPT共一百零一页,创作于2022年6月 整群样本(图示)第五十三张,PPT共一百零一页,创作于2022年6月 整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。需要选择最优的群数量和大小,同时使总费用最小。第五十四张,PPT共一百零一页,创作于2022年6月 整群抽样的优点有:由于样本不如简单随机样本那样分散,整群抽样能大大降低数据收集的费用;当总体单元自然聚合成群(例如:住户、学校)时,整群抽样比简单随机抽样或系

24、统抽样更容易;如果对于调查变量而言,群内单元差异较大,而不同群的差异较小,整群抽样策略比简单随机抽样的统计效率更高。(例如为估计性别比采用按户的整群抽样);第五十五张,PPT共一百零一页,创作于2022年6月 整群抽样的缺点有:对调查变量,若群内单元有趋同性,则整群抽样的统计效率比简单随机抽样低,(这正是通常遇到的情况),但对此项效率的损失可通过增加群的抽取个数来弥补;通常无法提前知道调查总样本量,因为在进行调查前,我们通常不知道一个群内到底有多少个单元;方差估计可能比简单随机抽样更为复杂。第五十六张,PPT共一百零一页,创作于2022年6月 分层抽样(STR)采用分层抽样时,总体被分为同质的

25、、互不重迭的若干子总体(层),然后,在每一个层中独立地抽取样本。可以使用任何一种抽样方法来对每个层进行抽样。第五十七张,PPT共一百零一页,创作于2022年6月 分层样本(图示)第五十八张,PPT共一百零一页,创作于2022年6月 进行分层有三个主要理由:抽样方法的效率较高; 能保证欲进行分析的特定研究域有足够的样本量,以便进行分析; 避免抽到一个“差的”样本。第五十九张,PPT共一百零一页,创作于2022年6月为充分利用分层抽样的效率,层内必须有高度的同质性(即同一层内的每一个单元的调查指标应是相近的),而不同层之间的差异应尽可能大。第六十张,PPT共一百零一页,创作于2022年6月 分层抽

26、样的优点有:能提高对总体估计值的精度;能保证样本对被定义为层的那些子总体的代表性,从而得到有效的估计;操作与管理方便;能避免得到一个“差的”样本;在不同的层中可以使用不同的抽样框和不同的抽样方法。第六十一张,PPT共一百零一页,创作于2022年6月 分层抽样的缺点有:要求抽样框中的所有单元,都必须有能用于分层的辅助信息;调查框的创建较简单随机抽样和系统抽样需更多的费用,也更为复杂。第六十二张,PPT共一百零一页,创作于2022年6月 多阶抽样多阶抽样是用两个或更多连续的阶段抽取样本的过程。第一阶段抽取的单元称为初级或一级抽样单元(PSU),第二阶段抽取的单元称为次级或二级抽样单元(SSU),以

27、此类推。第六十三张,PPT共一百零一页,创作于2022年6月 多阶样本(图示)第六十四张,PPT共一百零一页,创作于2022年6月常见的多阶抽样是二阶抽样:第一阶抽样用地域框抽地理小区(PSU);第二阶用系统抽样抽小区内的住所(SSU)。在前面介绍的(一阶)整群抽样中,样本群中的所有单元都入样。在两阶抽样中,从每个抽中的群(一级)单元中再抽一部分(二级)单元进行调查。第六十五张,PPT共一百零一页,创作于2022年6月多阶抽样常与地域框结合使用,作为解决整群抽样效率低问题的一种方法。多阶抽样中的阶数越多,设计(及估计)越复杂,通常我们只用二阶或三阶抽样。第六十六张,PPT共一百零一页,创作于2

28、022年6月例:加拿大劳动力调查(LFS)全国被划分为1100多个层,每个层由一组普查小区(EA)组成。普查小区是由人口普查时所确定的地理区域,普查员能对它所覆盖的区域进行详细清查。第一阶抽样是从每个层中抽取关于普查小区或普查小区组的分层样本。在第二阶抽样中,将这些小区绘图,列出它们中的所有住所,并从中按系统抽样抽取住所。然后,调查抽中住所内的所有人。第六十七张,PPT共一百零一页,创作于2022年6月 多阶抽样的优点有:当群内单元对于调查变量是同质时,多阶抽样比单阶整群抽样的效率高;样本分布相对集中,因此采用面访的旅行时间和费用都大为降低;不需要有整个总体的名录框,所要的只是在每个阶段抽样都

29、有一个完整的抽样框。第六十八张,PPT共一百零一页,创作于2022年6月 多阶抽样的缺点有:虽然多阶抽样的效率比一阶整群抽样的高,但它没有简单随机抽样的效率高;通常不能提前知道多阶抽样的样本量,因为在具体调查前,我们不知道在每个大单元中到底包含多少个下级单元(若固定每个大单元中的抽样数目,则总的样本量也可控制);调查的组织较为复杂(比单阶整群抽样复杂);估计值与抽样方差的计算较为复杂。第六十九张,PPT共一百零一页,创作于2022年6月 多相抽样多相抽样先抽一个有很多单元的大样本,收集基本的信息,然后在这个大样本中抽取一个子样本,收集更详细的信息。多相抽样能用在抽样框缺乏辅助信息,而又想对总体

30、进行分层或筛选部分总体的情况。当没有充足的预算收集整个样本的信息,或这样做会导致额外的回答负担时,也可以用多相抽样抽取子样本的方法来收集更详细的信息。第七十张,PPT共一百零一页,创作于2022年6月 多相样本(图示)第七十一张,PPT共一百零一页,创作于2022年6月第一相是批发零售贸易月度调查。每个月,批发零售贸易月度调查要求批发零售基层单位提供两个数据:月度销售额和库存量。零售商品季度调查再从这些零售基层单位抽取一个子样本,在调查时要求它们把销售额分解到各类商品,如服装、电器、食品等。例:加拿大零售商品季度调查(QRCS)第七十二张,PPT共一百零一页,创作于2022年6月多相抽样可以用

31、于在一项调查中不同问题的数据收集费用差异很大的情形。第一相收集的数据除能用作分层及筛选信息外,还能用来提高估计的效率(例如用于比估计或回归估计)。第七十三张,PPT共一百零一页,创作于2022年6月 多相抽样的优点是:能显著提高估计值精度(与简单随机抽样相比);能用来获得抽样框中所没有的辅助信息(特别是分层信息);适用于某些调查指标的数据收集费用特别高,或会给被调查者带来较重的回答负担的情况;第七十四张,PPT共一百零一页,创作于2022年6月 多相抽样的缺点有:如果需要根据第一相的结果来进行第二相调查,得到整个调查结果的时间比单相调查长;由于对某些样本单元访问次数超过一次,故所需费用比一相调

32、查要多;调查的组织会很复杂;估计值和抽样误差的计算会相当复杂。第七十五张,PPT共一百零一页,创作于2022年6月 (三)抽样设计的比较 如果要以样本的结果为基础对总体进行推断,则选用概率抽样。 如果有目录,或能以适当的投入创建总体各单元的一个目录,则考虑用简单随机抽样。 如果数据使用者不管你使用什么样的设计,都认为样本是简单随机样本,则考虑用简单随机抽样或系统抽样。第七十六张,PPT共一百零一页,创作于2022年6月 如果总体分布的地理距离很宽,且每个单元的数据收集费用很高,则考虑使用多阶段抽样设计。 如果总体单元自然成群,或有总体单元分组目录,或者打算使用地域抽样框,则使用多阶整群抽样。

33、如果抽样框有能用作分层或能用作规模度量等的辅助信息,且这些变量与主要调查变量相关,则考虑用分层抽样;第七十七张,PPT共一百零一页,创作于2022年6月如果有准确且与主要调查变量相关的规模度量,则考虑使用与大小成比例的概率抽样;如果规模度量不准确,则考虑按规模度量分组并按规模分层。 如果需要作域估计且这些域能在抽样框中确定,则考虑将域作为层进行分层抽样。第七十八张,PPT共一百零一页,创作于2022年6月 如果抽样框缺乏想用来分层或对总体进行筛选的辅助信息,则考虑进行多相抽样,取一个较大的第一相样本用来收集在第二相要使用的分层信息。 如果要收集的部分信息收集起来费用较高,则考虑使用多相抽样。第

34、七十九张,PPT共一百零一页,创作于2022年6月影响调查样本量大小的因素主要有两个:一是调查估计值所希望达到的精度,也就是调查估计值所能允许的误差;二是调查实际操作的限制条件,如经费、时间等。样本量的确定第八十张,PPT共一百零一页,创作于2022年6月1影响精度的因素(1)总体的变异程度大;(2)总体的大小;(3)样本设计方式和所用的估计量;(4)调查的回答率的高低。第八十一张,PPT共一百零一页,创作于2022年6月总体大小 在样本量确定过程中,总体所起的作用因它的大小而有所差异。对于小规模总体,它起着重要作用;对于中等规模的总体,其作用中等;而大总体对样本量影响的作用很小。 第八十二张

35、,PPT共一百零一页,创作于2022年6月例如:用简单随机抽样估计P,要求在置信度为95%下误差限为0.05所需的样本量(p=0.05)总体大小N所需的样本量n5044100805002221000286500037010000385100000398100000040010000000400第八十三张,PPT共一百零一页,创作于2022年6月 样本设计和估计量 一般来说,当样本量采用简单随机抽样的计算公式,而实际使用的是更复杂的抽样方式时,为达到给定精度所需的样本量,应该在此基础上乘以一个称为设计效应因子。设计效应是对于相等的样本量,给定样本设计估计量的抽样方差对简单随机抽样估计量的抽样方差

36、的比率。第八十四张,PPT共一百零一页,创作于2022年6月简单随机抽样设计,设计效应等于1;分层抽样设计,设计效应一般小于等于1;整群或多阶抽样设计,设计效应一般大于等于1。对于非概率抽样,假设设计效应等于2或3。 若过去相同或相似主题的调查所用的抽样设计与我们计划实施的抽样设计相同或相似,就能得到当前调查主要变量设计效应的估计值。我们也可以从试调查中得到设计效应的估计值。 设计效应第八十五张,PPT共一百零一页,创作于2022年6月 调查的回答率需要根据预计的回答率调整样本量的大小,根据预计的回答率确定一个较大的样本才可能达到精度要求。 第八十六张,PPT共一百零一页,创作于2022年6月样本量的计算步骤1)对于简单随机抽样,对平均值估计的样本量计算:第1步:计算初始样本量 第八十七张,PPT共一百零一页,创作于2022年6月第2步:对总体大小进行调整:第3步:如果抽样设计不是简单随机抽样,则用下面公式对样本量进行调整 : 其中,B是设计效应。 第八十八张,PPT共一百零一页,创作于2022年6月 第4步:根据无回答再次进行调整,以确定最终的样本量: 其中,r为预计的回答率。 第八十九张,PPT共一百零一页,创作于2022年6月对于简单随机抽样,对比例估计的样本量的计算步骤:因为在比例估计中,样本的方差变为:于是第一步

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论