版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、安徽理工大学统 计 学第 三十二 讲主讲 雷思友 副教授/硕导/系主任1市场营销销2009-1/2/3/4Bequiet!Shut yourmouth!2第七七章章抽抽样样调调查查第一节抽抽样调查查概述第第二节抽抽样调查查的一般般原理第第三节抽抽样估计计第第四节节抽抽样的的组织形形式3(一)抽抽样推断断的含义义抽样调查查是按随随机原则则,从全全部研究究对象中中抽取一一部分单单位进行行观察,并根据据样本的的实际数数据,对对总体的的数量特特征做出出具有一一定可靠靠程度的的估计和和判断,从而达达到对全全部研究究对象的的认识的的一种统统计方法法。其中心问问题是如如何根据据已知的的部分资资料来推推断未知
2、知的总体体情况。第一节抽抽样样调查概概述一、抽样样调查的的含义4(二)抽抽样推断断的特点点1抽样样推断是是非全面面调查2抽样样推断是是按随机机原则抽抽选调查查单位。3抽样样推断是是用样本本的指标标数值去去推算总总体的指指标数值值。4抽样样推断中中产生的的抽样误误差,可可以事先先计算并并加以控控制。5二、抽样样调查的的主要内内容(一)随随机抽样样:按照照随机原原则从总总体中抽抽取部分分单位构成样样本的过过程。(二)统统计估计计:根据据随机抽抽取的部部分单位位的特性性来对总体的分分布函数数、分布布参数或或数字特特征等进进行推测测估算的的过程。(三)假假设检验验:根据据经验或或认识,提出某某一假设设
3、,并判判断该假假设正确性性的过程程。6三、抽样样推断的的作用(一)解解决了无无法进行行全面调调查或很很难进行行全面调查查的问题题(二)可可以补充充或修正正全面调调查的数数据(三)可可以节省省调查费费用和调调查时间间7四、抽样样推断涉涉及的基基本概念念(一)总总体和样样本1全及及总体(总体、母体)它是指调调查对象象的全部部单位,是由具具有某种种共同性性质的许多多单位组组成的。总体既既是我们们所要研研究的对对象,又是样本本所赖以以抽取的的母体。组成总总体的单单位称为为总体单位,总体的的单位数数通常用用N表示示。82抽样样总体(样本、子样)是指在总总体中按按随机原原则抽取取的那一一部分单位所构构成的
4、集集合体。组成样本本的单位位称为样本单位位,样本单单位数亦亦称样本本容量,通通常用n表示。样本单单位数总总是大于于1而小小于总体体单位数N的的,即1nN。9样本单位位数n相相对于总总体的单单位数N要小得得多。统统计把把nN称为抽抽样比例例。样本本单位数数达到或或超过30个个(n30)称为大样本,而在30个以以下(n30)称为为小样本。社会经经济现象象的抽样样调查多多取大样样本,而而自然实实验观察察则多取取小样本本。以很很小的样样本来推推断很大大的总体体,这是是抽样推推断法的的重要特特点。10(二)总总体指标标和抽样样指标1总体体指标总体指标标是指根根据总体体各单位位的标志志值计算算出来的,反映
5、映总体某某种属性性或特征征的综合合指标,亦称为总体参参数。由由于总体体是惟一一确定的的,因此此,根据总体计计算的总总体指标标也是惟一确定定的。常用的总总体指标标有:总体平均均数、总总体成数数、总体体标准差和总总体方差差。11(1)总总体平均均数代表总体体单位数数量标志志一般水水平的指指标,它它表明变变量变动的集集中趋势势,通常常用表表示。其中:X1,X2,Xn为为总体中中每一个个调调查单位位的取值值N是总体体单位数数是总和和符号12(2)总总体成数数当总体的的一个现现象有两两种表现现时,其其中具有有某一种表现现的单位位数占总总体单位位数目的的比重,叫总体成数数,用P或Q表表示。其其计算公公式为
6、:N代表总总体单位位数;N1代表表具有某某一种表表现的总总体单位位数;No代表表具有另另一种表表现的总总体单位位数;P、Q代代表成数数。1314例1某某公司生生产的10000件产产品中,有500件为为不合合格品。则产产品不不合格率率PN5001000050产产品合格格率Q1P1509515(3)总总体标准准差和总总体方差差。表表示示单位之之间标志志值的变变异程度度指标,叫做总总体标标准差,又称总体均方方差(标标准差)。总体标标准差的的平方称称为总体方差差。其计算算公式为为:162.抽样样指标抽抽样指指标是指指根据抽抽样总体体各单位位标志值值计算的的综合指指标,又又称样本本指标。常用的的抽样指指
7、标有:抽样平均均数、抽抽样成数数、抽样样总体标标准差和和抽样总总体方差差。17(1)抽抽样平均均数。代代表样样本单位位数量标标志一般般水平的的指标称称抽样平平均数数或样本本平均数数。18(2)抽抽样成数数。在在抽样总总体中,一个现现象有两两种表现现时,其其中具有有某一一种表现现的单位位数占抽抽样总体体单位数数的比重重,叫做做抽样样成数,亦称样样本成数数。用p或q表表示。其其计算公公式为为:19同总体成成数20例52)从从某某公司生生产的产产品中,抽样检检查了100件产品品,其中中有5件件不合格格,则:样样本产产品不合合格率:样样本产品品合格率率21(3)抽抽样总体体标准差差和抽样样总体方方差。
8、说说明抽抽样总体体之间标标志值变变异程度度的指标标,叫做抽样样总体体标准差差。抽样总总体标准准差的平平方称为为抽样总体体方差差(简称样样本方差差)。其其计算公公式为:22一个总体体可以抽抽取许多多个样本本,而样样本不同同,抽抽样指标标的数值值也各不不相同。可见,抽样指标标的数值值不是是惟一确确定的。因为抽抽样指标标是样本本变量的的函数,是随机机可变的的变量。也就是是说,由由 样本本观测值值所决定定的统计计量是随随机变量量。23(三)重重复抽样样和不重重复抽样样1重复复抽样(重置抽抽样)采用这种种方法抽抽取样本本单位的的特点是是:同一一单位有多次重重复被抽抽中的机机会,并并且总体体单位数数目始终
9、不变,每个单单位抽中中或抽不不中的机机会在各各次都是相同的的。242不重重复抽样样(不重重置抽样样)采用这种种方法抽抽取样本本单位的的特点是是:同一一单位只有一次次被抽中中的机会会,并且且总体单单位数目目随着样本单位位数目抽抽取的次次数的增增多而愈愈变愈少少。每个单位抽抽中或抽抽不中的的机会在在各次是是不同的的。25抽样推断断是通过过样本对对总体进进行推算算。其中中,统计计量与被被估算的的总体指指标之间间的关系系,是推推算的关关键。两两者的关关系主要要通过统统计量的的分布来来反映,且因样样本量的的大小而而有差别别。第二节抽抽样样推断的的一般原原理一、抽样样推断的的理论依依据26(一)大大样本统
10、统计量的的推断依依据大数定律律在重复试试验中,事件频频率的稳稳定性是是大量随随机现现象的统统计规律律性的典典型表现现。人们们根据频频率的稳稳定性预预见到概概率的存存在和概概率的性性质,同同样,在在长期的的统计实实践中,人们也也找到了了大量随随机现象象的平均均结果也也具有稳稳定性的的理论依依据,即即大数定定律。27大数定律律在统计中中是指一一切关于于大量随随机现象象的平均均结果果稳定性性的定理理,它为为那些均均值存在在稳定性性及整整个统计计推断提提供了最最基本的的理论依依据。大数定律律的本质质意义在在于,尽尽管单个个随机现现象的具具体表现现不可避避免地引引起随机机偏差,然而在在大量随随机现象象共
11、同作作用时,由于这这些随机机偏差互互相抵消消、补偿偿和拉平平,致使使总的平平均结果果趋于稳稳定。28比雪夫大大数定理理:设x1,x2,x3,xn为独立的的随机变变量序序列,服服从同一一分布,且具有有相同的的期望值值以及及方差,则对于于任意正正数有有29安徽理工工大学统 计学学第 三十十三讲讲主讲雷雷思友友 副教教授/硕硕导/系系主任30(二)大大样本统统计量分分布的依依据一中心极限限定理中心极限限定理是是指在一一定的条条件下,大量相相互独独立的随随机现象象的概率率分布是是以正态态分布为为极限。因正态态分布在在概率论论中占有有中心地地位,所所以把该该定理叫叫做中心心极限定定理。31大数定律律只揭
12、示示了大量量随机变变量的平平均结果果,但并并没有有涉及到到随机变变量的分分布规律律,而中中心极限限定理则则说明明了许多多随机变变量的分分布是正正态或近近似正态态的。这这就可以以简化统统计推断断中许多多统计量量的分布布问题,所以它它是统计计学中的的重要工工具之一一。32 二、抽样样推断的的原理抽样估计计就是以以样本的的实际资资料为依依据,计计算一定的的样本指指标,并并以此对对总体做做出数量量上的估计和判判断。其其原理是是:(一)抽抽样推断断运用的的是归纳纳推理方方法抽样推断断的方法法是归纳纳法,而而归纳法法推断结结论的正正确性必须过事事实的验验证。33(二)抽抽样推断断运用的的是概率率原理抽样推
13、断断的结论论,其可可靠性究究竟是多多少,需需要运用概率率的原理理加以说说明。(三)抽抽样推断断的结论论存在着着一定的的抽样误误差抽样误差差是抽样样调查所所特有的的,而且且是不可可避免的的。34抽样推断断结论的的可靠程程度和抽样误差差的大小是是联系系在一起起的。在在其他条条件不变变的情况况下,允允许的误误差范范围愈大大,则概概率的保保证程度度也愈大大;反之之,如如果精确确度的要要求愈高高,允许许的误差差范围愈愈小,则则概率的的保证程程度也愈愈小。抽抽样误差差范围可可以事先先通过定资料料加以计计算,并并能采取取一定的的组织措措施来控控制这个个误差范范围,保保证抽样样推断的的结果达达到一定定的可靠靠
14、程度。35三、抽样样推断的的优良标标准(一)无无偏性用抽样指指标推断断总体指指标要求求抽样指指标的平平均数等于被估估计的总总体指标标。就是是说,虽虽然每个个可能样本的抽抽样指标标不一定定等于未未知的总总体指标标,但在在多次反反复估计中,要要求各个个抽样指指标的平平均数应应该等于于总体指指标,亦亦即从平均来说说,抽样样指标的的估计是是没有偏偏误的,叫做无偏性。36例如,样样本平均均数总是是总体平平均数X的无偏偏估计量量,亦即即样本平平均数的的平均数数等于总总体平均均数。因因为37(二)一一致性用用抽样样指标推推断总体体指标要要求其样样本的单单位数充充分大大时,抽抽样指标标也充分分地靠近近总体指指
15、标。也也可以说说该抽样样指标对对总体指指标是一一个一致致估计量量。38证明:设设为为任任意正数数,根据据大数定定律有:抽样平均均数的期期望值等等于总体体平均数数,即39(三)有有效性用抽样指指标推断断总体指指标时,要求作作为优良良估计计量的方方差应比比其他估估计量的的方差小小。即用用抽样平平均数数和总体体某一变变量来估估计总体体平均数数,虽然然两者都都是无偏偏的估计计量,而而且在每每一次估估计中两两种估计计量和总总体平均均数都可可能有离离差,但但样本平平均数更更靠近在在总体平平均数的的周围,平均说说来它的的离差比比较小,所以对对比来说说,抽样样平均数数是更为为优良的的估计值值40第三节抽抽样估
16、估计一、抽样样误差的的概念1.由样样本得到到的估计计值与被被估计的的总体未未知真实实特征值值之差,就就是误差差。或样样本指标标数值与与总体指指标数值值之间的的差数。2.抽样样误差就就是指按按随机原原则抽样样时,单单纯由不不同的随随机样本得出出不同的的估计量量而产生生的误差差。41由于总体体平均数数和成数数是惟一一确定的的,抽样样平均数和成数数则是随随机变量量,因而而抽样误误差也不不是惟一确定的的,而是是随机变变量。抽抽样误差差愈小,表示样样本的代代表性愈愈高;反反之,样样本的代代表性就就愈低。同样,抽样误误差还说说明样本本指标与与总体指指标的相相差范围围,因此此,它也也是推算算总体的的依据。4
17、24.抽样样误差是是抽样调调查自身身所固有有的不可可避免的的误差,虽然然不能消消除这种种误差,但可以以用数理理统计方方法进行行计算确确定其数数量界限限并加以以控制,也就是是根据研研究的需需要,把把它控制制出所允允许的范范围以内内。43二、抽样样平均误误差(一一)抽样样平均误误差的含含义抽抽样样平均误误差是指指一个抽抽样方案案的所有有可能样样本的某某统计计量与总总体相应应指标的的离差的的平均值值。纯随随机抽样样平均误误差的定定义关系系式如下下:44上式表明明了抽样样平均误误差的含含义,并并不能作作为计算算公式。因为为:1.在现实实的抽样样中,我我们只能能取得一一个样本,不可可能也没没必要获获得全
18、部部所有可可能样本本,所以以抽样平均误误差也不不可能通通过所有有样本来来直接计计算。2.统计计量的分分布律中中我们已已经知道道:统计计量是以以总体相相应指标标为期望望值,抽抽样平均均误差实实质上就就是该统统计量在在其概率率分布中中的标准准差。45(二)抽抽样平均均误差的的计算1抽样样平均数数的平均均误差(1)在在重复抽抽样的条条件下总总体方差差已知,样本平平均数服从正正态分布布,其抽抽样平均均数的平平均误差差计算公公式为:46由上式可可以看出出,抽样平均均数的平平均误差差就是抽抽样平均数的的标准差差。抽样平均均误差和和总体标标准差是是成正比比的,与与样本单单位数的的平方根根成反比比。因此此,要
19、想想减少抽抽样平均均误差以以提高抽抽样指标标的代表表性,只只能增大大样本单单位数n,因为为总体标标准差是是不能改改变的。47(2)在在不重复复抽样的的条件下下,抽样样平均数数的平均误差计计算公式式为:当总体单单位数N很大时时,公式式中的N1可可以用N代替。48在实际计计算时,不重复复抽样的的抽样平平均数的的平均误误差可可用下式式计算:492成数数的平均均误差统计成数数(比重重)是一一种结构构相对数数,它实实际属于于是非标志平均均数的特特例。统统计上习习惯以1表示“是”,以0表表示“非”。p为为1的概概率,q1p为0的概率率。成数数的方差差是P(1P)其特特点为,最大值值为025(0.50.5)
20、,即当两两种表现现的总体体单位各各占一半半时,它它的变异异程度最最大。50当N很大大时,以以N代替替N1,则可可简化为为:51在重复抽抽样条件件下,其其计算公公式为:在不重复复抽样条条件下,其计算算公式为为:52例3某公司司生产一一批灯泡泡,共1000只,从从中随机机抽取100只只,测其其寿命平平均为1000小时,样本标标准差为为610小时,计算其其抽样误误差。按按重复复抽样计计算:53按不重复复抽样计计算:54例54某某公公司有员员工10000人,从从中随机机抽选1000人调查查电脑的的拥有率率,发现现50家家有,问问这一调调查的抽抽样误差差为多少少?解:p5010000.05按重复抽抽样计
21、算算:55按不重复复抽样计计算:56(三)极极限误差差极限限误差是是指抽样样推断中中依一定定的概率率保证下下的误差差的最最大范围围。1.抽样样平均数数的极限限误差:571.抽样样成数的的极限误误差:5859(四)抽抽样估计计的可靠靠程度抽抽样极极限误差差通常是是以抽样样平均误误差为标标准单位位来衡量量的,即即:60抽样极限限误差也也可以表表示为抽抽样平均均误差的的若干倍倍,其倍倍数即概概率度t:61同理:62例5.5某某农场种种植小麦麦5000亩,收获前前夕随机机抽取25亩亩进行实实割实测测,测得得平均亩亩产500千克克,标准准差为50千千克,试试求全部部5000亩小小麦的平平均亩产产在480
22、千克克至520千千克之间间的概率率。63三、影响响抽样误误差的因因素(一)抽样单单位数目目的多少少(二二)总体体被研究究的标志志的变异异程度(三)抽样方方法和组组织形式式的不同同64四、抽样样估计(一)抽抽样估计计的现实实意义社会经济济统计的的认识对对象是现现象总体体的数量量方面,理应搜集集现象总总体的全全面资料料,再依依据统计计目的研研究其总总体的数量特征征,以获获得总体体本质及及其规律律性的认认识。但但在实际际工作中,由于于受客观观条件或或环境的的限制,往往不不可能或或没必要要搜集总体的全全面资料料,只可可能或只只需要利利用样本本资料估估计总体体的数量特征或或推算总总体的总总量指标标,这就
23、就是抽样样估计。65(二)抽抽样估计计的方法法 抽样估计计有两种种方法:点估计计和区间间估计。点估计也叫定值值估计,它是以以抽样得得到的样样本指标作为总总体指标标的估计计值,同同时给出出极限误误差和相相应的可可靠程度度的一种种估计方方法。在在实践中中,对总总体的特特征值(如平均均数、成成数等)估计,主要借借助于点点估计,具体表表示点估估计是用用样本数数据计算算出估计计值,同同时给出出估计精精度和相相应的可可靠程度度。66区间估计计是根据一一定的精精确度和和可靠程程度的要要求,用样本指指标和抽抽样误差差去推断断总体指指标的可可能范围围的一种估估计方法法。由于于点估计计量与总总体的未未知参数数并不
24、完完全相等等,故它它们之间间必然存存在着一一定的误误差,并并且不能能确知误误差的大大小、估估计精度度的高低低以及估估计的可可信程度度等信息息。为此此区间估估计将考考虑这些些因素,即根据据样本统统计量及及估计的的可能误误差,找找出在一一定保证证程度下下的估计计区间,即置信信区间。67对总体平平均数(或总体体成数)的估计计有两种种情形:(一)根根据已经经给定的的极限抽抽样误差差范围,求概率率保证程度度F(t),进进而进行行点估计计和区间间估计。1.抽取取样本,计算样样本平均均数(或或样本成成数),作为总总体平均均数(或或总体成成数)的的估计值值,并计计算样本本标准差差S,以以此推算算抽样平平均误差
25、差。682.根据据给定的的抽样极极限误差差范围,估计总总体平均均数(或总体体成数)的下限限(或)和上上限(或或)。3.将将抽样极极限误差差除以抽抽样平均均误差,求出概概率度t值,再根t值查概概率表求求出相应应的可信信度F(t)。4.进行行区间估估计和点点估计。69例55)某某糖糖厂有一一台自动动包糖机机,包装装重量为为50kg。现对包包装的白白糖重量量进行检检验,每每生产10袋抽抽取1袋。某某日糖厂厂共包装装300袋,抽抽取的30袋资资料如下下,若根根据质量量要求,每袋糖糖的极限限误差不不大于120g,试估估计该机机器的包包装精度度。70重量(kg)x袋数f49.449.649.850.050
26、.250.450.650.813575441合计3071(1)计计算样本本平均数数和标准准差,并并推算平平均误差差:72(2)根根据给定定的极限限误差0.12kg,计计算总体体平均均数的上上限和下下限:73(3)74( 4)点估计计:该包包装机平平均包装装重量为为50.1kg,误误差不大大于120g的的可靠程程度为9545区区间间估计:在9545的可可靠程度度下,估估计该包包装机包包装的平平均重量量在49.98-50.22kg之之间。75例57某某公公司设计计一种新新式产品品,为了了预测销销路,随机抽抽取了900人人进行了了调查,结果有有720人表表示可以以购买。如果要要求极限限误差不不超过3
27、5,试试估计该该产品可可以销售售的比率率。(1)根据样样本资料料,计算算样本成成数及平平均误差差:76(2)根根据给定定的极限限误差3.5,计算算:77(4)点点估计:估计该该产品的的销售率率为80,其其误差差不大于于3.5的可可靠程度度为99。区区间估估计:在在99的保证证程度下下,估计计该产品品销售率率在76.5-83.5之之间。78(二)根根据给定定的可信信度F(t),求出极极限抽样样误差,进而而进行点点估计和和区间估估计。具具体步骤骤是:1.抽取样样本,计计算样本本平均数数(或样样本成数数)作为为总体平平均数数(或总总体成数数)的估估计值,并计算算样本标标准差S,以此此推算抽抽样平均均
28、误差。792.根据据给定的的可信度度F(t)的要要求,查查概率表表求得概概率度度t值。3.根据概概率度和和抽样平平均误差差计算抽抽样极限限误差的的可能范范围,并据以以计算被被估计的的总体平平均数(或总体体成数)的上、下限。4.进行行点估计计和区间间估计。80例5.8从从全全校近万万名学生生中,随随机抽取取100名学生生的平平均身高高为160cm,根据据计算,学生身身高的标标准差差为3cm。现现要求可可信度要要达到9545,试对全全体学学生的平平均身高高进行估估计。81(2)根根据给定定的可信信度F(t):9545,查概概率表t=2(3)计算极极限误差差和平均均身高的的上下限限:上上限160+0
29、.6160.6cm下下限160-0.6159.4cm82(4)点点估计:该校学学生平均均身高为为160cm其其误差不不大于于0.6cm的的可靠性性为9545。区区间间估计:在9545的保保证程度度下,该该校学生生的平均均身高为为159.4160.6cm之间间。83第四节抽抽样样的组织织形式一一、抽样的的组织方方式抽抽样组组织方式式按抽样时对对总体的的加工整整理形式式不同,分分为简单单随机抽抽样、类类型抽样样、等距距抽样和和整群抽抽样。84(一)简简单随机机抽样1简单单随机抽抽样的含含义简单随机机抽样又又称为纯纯随机抽抽样,它它是不对对总体做做任何加工整整理,直直接从总总体中抽抽取调查查单位的的
30、抽样方方式。必必须满足足下列两两条要求求:代表性性,即要要求样本本分布与与总体分分布相同同;独立性性,即要要求样本本各个单单位相互互独立。852简单单随机的的抽样方方法(1)抽抽签法。适合用用于总体体单位数数较少的的总体。 (2)随随机数表表法。适适合用于于大规模模的社会会经济调调查。 (3)简简单随机机抽样的的平均误误差86(二)类类型抽样样1类型型抽样的的含义 类型抽样样又称为为分层抽抽样或分分类抽样样,它是是将总体体单位先按一一定标志志分组,然后在在各组中中随机抽抽取样本本的抽样样组织方式。类类型抽样样是应用用于总体体内各单单位在被被研究标标志上有有明显差别的抽抽样。主主要原则则是:分分
31、组时应应使组内内差异尽尽可能小小,使组间差异异尽可能能大。872类型型抽样的的方法(1)等等比例抽抽样:按按同样的的抽样比比nN,确定定各组中中应抽的样本本单位数数,如各各组单位位数为N,则则从中抽抽取的样本单单位为N1(其nN相等等),各各组样本本单位数数确定后后,按随随机原则则从各组组中抽取取各类单单位组成成样本。(2)不不等比例例抽样多多指某类类单位在在总体中中占的比比重过小小时,对对其按比比例抽不不到或只只能抽到到很少数数量,为为了保证证样本中中各类单单位的代代表性而而采取不不等比例例抽样的的方法。88(三)等等距抽样样1等距距抽样的的概念等距抽样样又称为为机械抽抽样或系系统抽样样。它
32、是是先将总体各单单位按有有关标志志或无关关标志进进行排列列,再按按照固定定的顺序序和间隔隔来抽选选样本单单位的一一种抽样样组织形形式。等距抽样样是不重重复抽样样,通常常可以保保证被抽抽取的单单位在总总体中均匀分分布,缩缩小各单单位之间间的差异异程度,提高样样本的代代表性。892抽样样方法(1)无关标志志排队法法:就是指指总体单单位采用用与调查查项目没有关关系的标标志进行行排队的的方法。 (2)有关标志志排队法法:就是总总体单位位采用与与调查项项目有关关的标志进行行排队的的方法。90(四)整整群抽样样1.整群群抽样的的含义是先将总总体各单单位划分分成若干干群,再再以群为为单位从中随机机地抽取取出
33、若干干群来,对被抽抽中群的的所有单单位进行行调查的的一种抽抽样组织织形式。由于抽抽样单位位比较集集中,限限制了样样本单位位在总体体分配中中的均匀匀性,所所以有时时代表性性较低,抽样误误差较大大。一般般采用整整群抽样样通常都都要增加加一些样样本单位位,以缩缩小抽样样误差,提高估估计的准准确性。912抽样样方法首先对所所要研究究的总体体根据需需要划分分出群的的单位;其次把各各群按时时间顺序序或空间间顺序排排列编号号;最后可按按筒单随随机抽样样或等距距抽样的的方法抽抽取样本本群。92(五)阶阶段抽样样抽样调查查中,如如果抽出出的样本本单位直直接就是是总体单单位叫做单阶段抽抽样,如简单单随机抽抽样,类
34、类型抽样样。如果果先将总总体进行分分组,从从中随机机抽出一一些组,然后再再从中选选的组中中随机抽取总总体单位位,叫两阶段抽抽样。如果将将整体进进行多层层次分组,然后后依次在在各层次次中随机机抽取,直到抽抽取到总总体单位位,称为多阶段抽抽样。93多阶段抽抽样的优优点是:1.便于于组织抽抽样。它它可以直直接按现现行的行行政区划划或地理区域划划分阶段段的抽样样单元,从而简简化抽样样框的编编制。2.可以以获得各各阶段单单元的调调查资料料,根据据最初级级资料进进行逐级抽样推推断,得得到各级级的调查查资料。3.多阶阶段抽样样的方式式比较灵灵活,各各阶段抽抽样的组组织方式式应以前述四种种方式为为依据进进行选
35、择择。94二、样本本容量的的确定(一)确确定抽样样样本容量量的必要性性样本容量量就是抽抽样的数数目。根根据大数数定律,在抽样样调查中样本本容量越越多,样样本对总总体的代代表性越越大,抽抽样误差差越小;样本容量量减少,抽样误误差就要要增大。但同时时,抽样样数目越越多,抽样调查查的费用用也越高高,而且且还会影影响到调调查的时时效性。因此,确定样本本容量时时,应在在保证满满足抽样样调查对对数据的的估计精精确度和概率把把握程度度(置信信度)下下,尽量量缩小抽抽样数目目,即确确定必要要抽样数目目。95(二)影影响样本本容量的的因素1总体体被研究究标志的的变异程程度总体被研研究标志志的变异异程度大大,则应
36、应抽取较较多的样样本单位位;总体被研研究标志志的变异异程度小小,则可可抽取较较少的样样本单位位。962允许许的误差差范围即即要求的的估计精精度。如如果允许许的误差差范围小小,即要要求的的精确度度高,应应抽取较较多的样样本单位位;反之之应抽取取较少的的样本单单位。3抽样样推断的的可靠程程度抽抽样样推断要要求的可可靠程度度越高,则应抽抽取的样样本单位位越多;要求的的可靠程程度越低低,则应应抽取的的样本单单位越少少。97(三)必必要抽样样数目的的计算在简单随随机抽样样中,必必要抽样样数目的的计算公公式有:1重复复抽样条条件下(1)平平均数的的必要抽抽样数目目公式:98(2)成成数的必必要抽样样数目公
37、公式99例5.9对对某某型号电电子元件件10000只只进行耐耐用性能能调查。根根据以往往抽样测测定,求求得耐用用时数的的标准为为600小小时。试试在重复复抽样条条件下:概率保保证程度度为6827,元元件平均均耐用时时数的误误差范围围不超过过150小时,要抽取取多少元元件做检检查?100(2)根根据以往往抽样检检查知道道,元件件合格率率为95,合合格率率的标准准差为21.8,要要求在99.73的的概率保保证下下,允许许误差不不超过4,试试确定重重复抽样样所需抽抽取的的元件数数目是多多少?1012在不不重复抽抽样条件件下(1)平平均数的的必要抽抽样数目目公式:102(2)成成数的必必要抽样样数目公
38、公式:103抽 样推推断断 习题题课课104(一)判判断题1抽样样调查的的着眼点点就在于于对样本本数量特特征的认认识。()2极限限抽样误误差总是是大于抽抽样平均均误差。()3扩大大抽样误误差的范范围,可可以提高高推断的的把握程程度;缩缩小抽样样误差的的范围,则会降降低推断断的把握握程度。()1054总体体指标是是随机变变量,样样本指标标也是随随机变量量,因因此两者者之间会会产生误误差。()5缩小抽抽样误差差范围,则抽样样调查的的精确度度就会提提高。()6根据样样本总体体各单位位的标志志值或标标志特征征计算的的综合指指标称为为样本指指标。()7纯随随机抽样样就是遵遵循随意意性原则则抽选样样本。(
39、)1068不同同的抽样样组织方方式下,计算抽抽样平均均误差应应该采取不不同的公公式。()运用区间间估计的的方法,可以根根据样本本估计值值x和p,精确确地推断断出总体体参数x和p所所在的范范围。()由于抽样样调查中中既有登登记误差差又有抽抽样误差差,所以以只有登登记误差差的全面面调查准准确性高高。()10711抽抽样误差差在抽样样推断中中是不可可避免的的。()12重重复抽样样的抽样样误差一一定大于于不重复复抽样的的抽样误误差。()108(二)单单项选择择题1。在抽抽样推断断中,抽抽取样本本必须遵遵循()随意原原则随机原原则可比原原则对等等原则2能够够事先加加以计算算和控制制的误差差是()抽样误误
40、差登记记误差系统统性误差差测测量误差差3极限限误差与与抽样平平均误差差数值之之间的关关系为(前者一一定小于于后者前者一一定大于于后者前者一一定等于于后者前者既既可以大大于后者者,也可可以小于于后者1094抽样样调查的的主要目目的在于于()计算和和控制抽抽样误差差了解全全及总体体单位的的情况用样本本来推断断总体对调查查单位作作深入的的研究。5某企企业连续续性生产产,为检检查产品品质量,在24小时中中每隔30分钟钟取下一一分钟的的产品进进行全部部检查,这是()整群抽抽样简简单随机机抽样类型抽抽样纯随机机抽样1106.在抽抽样调查查中()既有登记记误差,也有代代表性误误差既无登记记误差,也无代代表性
41、误误差只有登记记误差,没有代代表性误误差没有登记记误差,只有代代表性误误差7.在抽抽样调查查中,避避免的误误差是()登记误误差系统性性误差计算误误差抽样误误差8置信信区间的的大小表表达了区区间估计计的()可靠性性准准确性显著著性及时性性1119抽样样推断中中的概率率保证程程度表达达了区间间估计的()显著性性准准确性可可靠性规律性性10抽抽样平均均误差反反映了样样本指标标与总体体指标之之间的()可能误误差范围围平均均误差程程度实际误误差实际际误差的的绝对值值11211样样本指标标和总体体指标()前者者是个确确定值,后者是是个随机机变量前者是是个随机机变量,后者是是个确定定值两者均均是确定定值两者
42、者均是随随机变量量12对标标志变异异程度较较大的总总体进行行抽样调调查时,宜采用用()纯纯随机抽抽样等距抽抽样类型抽抽样整群抽抽样11313在在抽样前前,需对对全及总总体单位位一一编编列序号号的抽样组织织方式是是()纯随机机抽样机械抽抽样类类型抽样样整群群抽样14抽抽样平均均误差是是()全部样样本指标标的平均均数全部样样本指标标的平均均差全部样样本指标标的标准准差全部样样本指标标的标志志变异系系数11415成成数方差差的最大大值,是是当P值值趋近于于()0109080516在在同等条条件下,重复抽抽样与不不重复抽抽样相比比较,其抽样平平均误差差()前者小小于后者者前前者大于于后者两者者相等无法确确定哪一一个大17在在其他条条件保持持不变的的情况下下,抽样样平均误误差()随着抽抽样数目目的增加加而加大大随着抽抽样数目目的增加加而减少少随着抽抽样数目目的减少少而减少少不会随随抽样数数目的改改变而变变动11518允允许误差差反映了了样本指指标与总总体指标标之间的的()抽抽样误差差的平均均数抽样误误差的标标准差抽样样误差的的可靠程程度抽样误误差的可可能范围围19从从2000名学学生中按按不重复复抽样方方法抽取取了100名进行调查查,其中中有女生生45名名,则样样本成数数的抽样样平均误误差为()0.24485497以以上都不不对116(三)多多项选择择题1抽样
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 福建师范大学《通信电子线路》2021-2022学年第一学期期末试卷
- 福建师范大学《师德案例与养成》2023-2024学年第一学期期末试卷
- 福建师范大学《环境学基础综合实验》2021-2022学年第一学期期末试卷
- 福建师范大学《管理学原理》2023-2024学年第一学期期末试卷
- 四川省成都市2021年中考英语真题(含答案)
- 员工安全记分管理实施细则
- 精益管理学习资料2
- 部分非常规作业许可证(样表)酸(碱)洗类作业
- 保育员一日工作安排
- 档案鉴定工作表
- 外科学-第六十二章-脊柱、脊髓损伤课件
- 电力基础知识汇总课件
- 初中语文人教六年级下册《专题阅读:概括主要事件》PPT
- 大象版小学科学二年级上册实验报告单全册
- 2020-2022学年部编版八年级语文古诗词专项练习卷 部编人教版八年级上册
- 手术室护士岗位说明书版
- 13、停电停水等突发事件的应急预案以及消防制度
- 医疗HRP整体解决方案课件
- 【知识点解析】抛物线的光学性质及其应用
- 冠心病介入治疗技术医疗质量控制指标(2021年版)可编辑版
- 分布式光伏安装清包合同
评论
0/150
提交评论