统计技术应用课件第七章 抽样调查_第1页
统计技术应用课件第七章 抽样调查_第2页
统计技术应用课件第七章 抽样调查_第3页
统计技术应用课件第七章 抽样调查_第4页
统计技术应用课件第七章 抽样调查_第5页
已阅读5页,还剩199页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章抽样调查学习目标(一)知识目标1.了解抽样调查的特点与应用范围;2.了解抽样调查的基本概念;3.了解抽样误差的概念;4.了解抽样推断的理论基础;5.了解抽样误差的概念;6.了解抽样平均误差的意义及其影响因素;7.了解抽样极限误差、可信度和概率度;8.了解总体参数的点估计和区间估计;9.了解抽样组织方式。(二)技能目标1.能够计算抽样平均误差;2.能够掌握区间估计的总体平均数的估计和总体成数的估计方法;3.能够根据置信度的要求,估计总体指标出现的可能范围。引导案例2012年2月,针对以螺旋藻为原料的保健食品存在重金属超标隐患,国家食品药品监督管理局组织中国食品药品检定研究院、北京市药品检验所等7家检验机构对市场上部分以螺旋藻为原料保健食品开展了铅、砷、汞重金属专项监测。根据市场产品抽样和媒体报道情况,国家食品药品监督管理局于2月29日布置对可疑产品开展专项监督检查。2012年3月30日,国家食品药品监督管理局公布以螺旋藻为原料保健食品重金属专项监督检查结果。结果显示,3个产品为假冒保健食品;1个产品的某批次产品铅、砷超过限量标准;其他9个产品铅含量在本次监督检查中结果均未超过国家限量标准。对于假冒和超过限量标准的产品,国家食品药品监督管理局责成相关食品药品监督管理部门依法严肃处理,要求加强螺旋藻为原料的保健食品监督检查,保障消费者食用安全。问题:从抽样调查的结果来看,可以估计以螺旋藻为原料的保健食品的合格率是多少?第一节抽样调查的一般问题统计工作的目的是获得和研究关于总体的数量特征,采用的基本方法是大量观察法,对总体的精确数量认识需要对总体进行全面调查,当总体较大或总体的外延不是很明确时,采用全面调查的方法既不灵活也造成很大浪费,例如在对玻璃器皿做耐温检测时常常会把产品破坏,为了进行全面的统计而把产品全部破坏显然是不可取的。因此,人们更多的是采用抽样调查的方法,根据部分总体单位构成的小总体的统计指标推测全及总体(即大总体)的统计指标。如要判断一张照片是1200万像素还是200万像素,用肉眼是不容易看出来的。放到电脑上来将照片的某部分放大,当放大到一定倍数时,若很快出现马赛克可以判断是200万像素,若还是很精细可以判断是1200万像素的。抽样调查的思想方法与此相同,在总体中按随机的原则抽取一部分(拿来放大的那部分照片)作为样本,样本的数量特征(照片的像素)与总体的数量特征(照片的像素)就有相近之处,可以用样本的数量特征来说明总体的数量特征。一、抽样调查的特点与应用范围抽样调查又称抽样推断或抽样估计,是根据随机的原则在总体中抽取一部分总体单位进行调查登记,进而利用这部分总体单位的数据(小总体的指标)对总体的有关数量特征在一定概率保证下作出推断的一种统计方法。(一)抽样调查的特点1.只抽取总体中一部分单位进行调查,是专门组织的一次性非全面调查。2.抽取部分单位要遵循随机原则,使样本单位均有被抽中的机会。这个特点是与其它非全面调查如重点调查、典型调查的主要区别之一。重点调查和典型调查的调查单位的选取受到调查者主观意识的影响,抽样调查的调查单位选取不受调查者主观意志的影响。当抽取足够多的单位时,样本就能够反映出总体的数量特征。遵守随机原则还能计算抽样误差,并把它控制在一定范围之内。3.以样本指标的数值去推断和估计总体指标的数值。因此,抽样调查又叫抽样推断。例如对几只灯泡进行寿命试验来判断整批灯泡的寿命。这个特点是抽样调查与其他非全面调查的又一区别。重点调查和典型调查都是非全面调查,但是其结果不能作为总体指标的代表;抽样调查之所以能够去推断和估计总体指标的数值,随机原则起到了关键的作用。抽样调查和全面调查的目的一致,都是为了达到对总体数量的认识,但是达到目的的手段和途径完全不同。抽样调查是通过科学的推断达到目的,可以节省时间、人力、物力和财力。4.抽样调查产生的误差,可以计算并可采取措施控制在一定范围之内,从而使抽样调查具有一定的可靠性。典型调查和重点调查也能用部分调查单位的指标数值去估计总体指标数值,但是这种估计不能计算误差,也不能说明估计的准确程度和可靠程度。(二)抽样调查的应用范围抽样调查适用的范围很广泛,在许多场合都可以运用抽样调查方法取得大量社会经济现象的数量方面的统计资料,特别是在某些特殊场合不可能用全面调查时必须采用抽样调查。1.用于单位数特别多或无限多的总体。如工农业产品连续性生产过程中的成品率调查,大气中某些污染情况调查等。2.对于产品造成破坏或损伤的检验调查方法。如电灯泡、茶叶、烟草等产品进行质量检验都是有破坏性的,不可能进行全面调查,只能使用抽样调查。3.用于不必要进行全面调查的现象。如水库中的鱼数、森林中的木材积蓄量、居民购买力调查等。如果进行全面调查,要消耗很大的人力物力,成本太高。4.时间紧迫、经费有限时可采用抽样调查。抽样调查的调查单位比全面调查要少得多,因而既能节约人力、费用和时间,又能比较快地得到调查结果。例如,农产品产量全面调查的统计数字要等收割完毕以后一段时间才能得到,而抽样调查的统计数字在收获的同时就可以得到,一般能比全面调查早得到两个月左右,这对于农产品的生产经营是很有利的。5.对普查数据校验时可采用抽样调查。在全面调查后,对某些数据进行修正,可采用抽样复查。人口普查之后,每年组织1%的人口抽样复查,对人口普查资料进行核查和修正。如我国第五次人口普查时使用长表和短表两种调查表,短表调查项目少,人人都要登记,长表在短表的基础上增加了很多项目,只供全国一小部分人口登记。这实际上就是在普查的同时进行抽样调查。6.检验新产品或新技术的使用效果时可采用抽样调查。利用抽样推断的方法,可以对于某种总体的假设进行检验和比对判断,来判断这种假设的真伪,以决定取舍。例如,新教学法的采用、新技术的利用、新医疗方法的使用等是否收到明显效果,须对未知的或不完全知道的总体作出一些假设,然后利用抽样调查的方法,根据实验材料对所作的假设进行检验,从而作出判断。二、抽样调查的基本概念(一)全及总体和抽样总体1.总体总体也称全及(统计)总体,指所要研究对象的全体,它是由所研究范围内具有某种共同性质的全体单位所组成的集合体。总体按各单位标志性质不同,可分为变量总体和属性总体两类。若被研究的标志是数量标志,则称这个总体为变量总体。抽样调查可以研究变量总体的各种指标,如均值和标准差。属性总体又称品质标志总体,抽样推断中仅研究品质标志中的特例交替标志,交替标志作为总体的指标,表现为成数,如合格率、满意度等。全及总体的单位数一般用来表示,总体的单位数通常都是很大的。弄清楚了全及总体,不仅可以明确抽样推断所要研究对象的范围,而且也便于确定抽样框(样本框)。对于某一具体问题来说,作为抽样推断对象的总体是唯一确定的。2.样本样本又称样本总体,是全及总体中部分总体单位构成的小总体,它是从全及总体中抽取出来的一部分单位所组成的集合体。(1)样本的容量样本的容量一般用表示,是指一个样本中所包含的单位数。一般来说,样本单位数超过30的样本称为大样本,不超过30的称为小样本。社会经济现象的抽样调查多取大样本,而自然实验观察多取小样本。(2)样本个数样本个数又称为样本可能数目,用来表示,它是指从一个总体中可能抽取的样本的总数量。如果样本个数是1,那么样本总体就是全及总体;当样本个数大于1时,抽取的样本有多种组合。但在实际工作中,只能抽取一个样本进行统计推断,而不可能获得全部可能的样本,所以并不常用。(二)全及指标和抽样指标1.全及指标全及指标也叫总体指标或总体参数,它是根据全及总体各单位标志值或标志属性计算的、反映总体某种属性的综合指标。由于全及总体是唯一确定的,根据全及总体计算的全及指标也是唯一确定的,所以称为参数。不同性质的总体需要计算不同的全及指标。对于总体中的数量标志,常用的总体参数有总体平均数、总体标准差和总体方差,有以下公式:总体平均数:总体方差:总体标准差:对于交替标志属性总体,由于各单位标志不能用数量来表示,只能用两种标志表现文字来加以描述,所以应计算结构相对指标,称为总体成数。总体成数常以大写英文字母来表示总体中具有某种性质的单位数在总体全部单位数中所占的比重,以表示总体中不具有某种性质的单位数在总体中所占的比重。设总体个单位中,有个单位具有某种性质,个单位不具有某种性质,,则总体成数为:交替标志在总体中的方差为:成数是交替标志作为总体中的变量的平均数。2.样本统计量(抽样样本指标)根据样本各单位标志值计算的、反映样本属性的指标称为样本统计量。和全及指标相对应的有样本均值、抽样成数统计量、样本标准差统计量和样本方差统计量等。和用小写英文字母表示,以便和全及指标相区别。假设有一样本,其各单位的取值分别为,,…,,则有以下公式:样本均值统计量:样本方差统计量:修正样本方差统计量:样本的指标称为统计量,是由于样本的个数不唯一,取到不同的样本,样本统计量的数值会不同,可以把统计量看作是随机抽取样本构成的总体上的一个随机变量,作为随机变量的统计量是参数估计的基础,可用统计量的数值作为总体参数的估计值,基于此这里给出了修正的样本方差统计量。在属性总体中,一个样本容量为的一个样本,设个单位中有单位具有某种属性,个单位不具有某种属性,,为样本中具有某种属性的单位数所占的比重,表示不具有某种属性的单位数所占的比重,则抽样(样本)成数统计量为:样本交替标志标准差统计量为:统计量是所有样本构成的总体上的(随机)变量。(三)抽样方法在总体中取出总体单位的顺序不同,构成了不同的抽样方法。抽样方法可分为重复抽样和不重复抽样。抽样方法的不同会影响所有样本所构成的总体的总体单位数(即会影响统计量的定义域),进而会影响抽样误差。1.重复抽样重复抽样也称为回置抽样,与抽取总体单位的顺序无关。是从总体个单位中随机抽取一个容量为的样本,每次随机抽取一个总体单位,记录该单位有关标志表现后,把它放回到全及总体中参加下一次抽选,照此下去直到抽选第个样本单位。每次抽取总体单位是在完全相同的条件下进行的,每个总体单位被选中的机会完全相等。从总体个单位中,用重复抽样的方法,随机抽取个单位构成一个样本,则共可抽取个样本,即样本所构成的总体单位数为。【例7-1】总体有A、B、C、D四个单位,要从中以重复抽样的方法抽取2个单位构成样本。先从4个单位中抽取1个,共有4种抽取方法,结果登记后再放回。然后再从相同的4个单位中抽取1个,也有4种抽取方法。这样取2个单位构成一个样本,其全部可能抽取的样本数目为个,它们是:AA,AB,AC,AD,BA,BB,BC,BD,CA,CB,CC,CD,DA,DB,DC,DD。因此重复抽样具有以下特点:每取一个样本可以看作是一次随机试验,每次的试验结果是独立的,每次试验是在相同条件下进行的,每个单位在每次试验中被选中的概率是相同的。2.不重复抽样不重复抽样又称为无回置抽样。抽取的总体单位跟顺序有关,是指从全及总体抽取样本时,随机抽取一个样本单位,记录该单位有关标志表现后,这个样本单位不再放回全及总体参加下一次抽选。然后从总体剩下的个单位中随机抽取第二个样本单位,记录它的有关标志表现后,该单位也不放回全及总体中去,再从总体剩下的个单位中抽取第三个样本单位,照此下去直到抽选出第个样本单位。在不重复抽样中,其样本可能的数目为即样本构成的总体中的总体单位数为【例7-2】从A、B、C、D这4个球中抽2个球,采用不重复抽样的方法,共有12种可能:AB,AC,AD,BA,BC,BD,CA,CB,CD,DA,DB,DC。概率理论已经证明在不重复抽样中,每次抽取一个样本,每个总体单位被抽中的概率是一致的。三、抽样推断的理论基础社会现象和自然现象可以分为两大类,一类现象是发生的结果可以确定,称之为必然现象。如在标准大气压下将水加热到100℃水就会沸腾,企业的成本会随着产出的增加在不断地增加。另一类现象是发生的结果无法确定,称之为随机现象。如明天的天气情况,掷一枚均匀硬币出现的结果具有不确定性等。社会经济现象大多具有这种不确定性,概率论就是描述这种随机现象数量特征的数学学科;在概率论中,将变量称为随机变量,与其他数学学科不同的是,概率统计中关注的是随机变量取一定数值(范围)的可能性(概率),称之为随机变量的分布。(一)随机变量及其分布规律抽样推断是在概率论的基础上进行的,概率论是研究随机现象数量规律的的数学方法。描述随机现象的函数称为随机变量,随机变量取值在一定范围内的概率,即随机变量的概率分布具有重要的意义。统计实践表明,大多数的变量分布服从钟形分布,规则的钟形分布在概率中称为正态分布,正态分布的分布函数具有很规则的特征。随机变量具有两个重要参数(即统计总体的指标):一个叫数学期望,记为,即的平均数(总体的平均指标);另一个是方差,记为,即变量的方差(总体标准差的平方)。对于服从正态分布的随机变量,也记为。正态分布的数学规律如下:分布函数:数学期望:方差:标准正态分布是数学期望为零,方差为1()的正态分布。一个服从正态分布的随机变量,可以经过变换转化为服从标准正态分布的随机变量,即标准正态分布具有很好的概率特征,如果已知一个变量服从标准的正态分布,那么这个变量取值在一定范围内的概率就是已知的,即:(二)大数定理与中心极限定理1.大数定理大数定理又称大数法则。大数定理:独立同分布的随机变量,,…,,…设它们的平均数为,方差为。则对任意的正数,有:,,…

该定理说明,当n充分大时,独立同分布的一系列随机变量,其平均数与它们共同的期望值之间的偏差,可以有很大的把握被控制在任意给定的范围之内。由于从总体中抽出的样本是独立且与总体同分布的,因此,当样本容量n

充分大时,样本平均值与总体平均值之间的误差可以有很大的把握被控制在任意给定的要求之内,这就是人们用样本平均估计总体平均的理论根据。由于成数指标是一个特殊的平均数,大数定理对成数指标自然也成立:设m是n次试验中事件A发生的次数,p是事件A发生的概率,则对于任意小的正数,有即当n充分大时,事件A发生的频率接近(依概率收敛于)事件A发生的概率,反映了频率在大量重复试验过程中的稳定性。该定理称为贝努里大数定理,它提供了用频率代替概率的理论根据。2.中心极限定理在客观实际中,总体的分布各种各样,不一定会服从正态分布。但由中心极限定理可知,只要总体满足一定的条件,随机变量的平均数(是总体的均值统计量)会近似于服从正态分布。(1)中心极限定理随机变量,,…,相互独立,且服从同一分布,该分布存在有限的期望和方差:,,(i=1,2,…)。当趋于无穷大时,个随机变量的算术平均数近似服从正态分布,即:中心极限定理的含义是许多微小的随机因素作用的结果,会以一种正态分布的形式反映出来。从上述定理可以得出结论,无论总体服从何种分布,只要它的期望值和方差存在,就可以通过增大样本容量的方式,保证样本平均数近似正态分布。也就是说,大样本的平均数近似服从正态分布。(2)迪摩佛—拉普拉斯定理交替标志的分布称为两点分布,可以用投掷硬币来模拟。在次投掷硬币的实验中,正面出现的次数的分布称为二项分布,记为,总体中交替标志的均值即为总体的成数。迪摩佛—拉普拉斯定理是中心极限定理的特例,当总体较大时,样本成数p近似服从正态分布

为总体的成数。迪摩佛—拉普拉斯定理为总体成数的抽样推断提供了理论依据。第二节抽样误差一、抽样误差的概念用抽样样本指标来估计全及指标是否可行,关键问题在于抽样误差。抽样误差是指由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起抽样样本指标和全及指标之间的绝对离差。如抽样平均数与总体平均数的绝对离差、抽样成数与总体成数的离差等。如某班50位同学中有30位男同学和20位女同学,现随机抽取5个同学为样本,由于随机的原因未必都能抽到3个男同学和2个女同学,使得利用样本计算的性别比例指标不能代表该班同学的性别比例指标,原因是样本指标和总体指标之间存在绝对离差。二、统计调查误差种类按产生的原因分,统计调查误差可分为登记性误差和代表性误差。1.登记性误差登记性误差是指统计调查时,由于主观原因在登记、汇总、计算、过录中所产生的误差。登记性误差不论全面调查或非全面调查都可能产生。2.代表性误差代表性误差是由于样本结构与总体结构不同,样本不能完全代表总体而产生的样本指标与总体指标之间的误差。代表性误差又可分为系统性误差和随机误差两种。系统性误差又称偏差,它是由于抽样调查没有遵循随机原则而产生的误差,即违反抽样调查的随机原则,有意地抽取较好或较差的单位进行调查,这种系统性原因造成的样本不足所产生的误差称为系统性误差,不能控制。随机误差又称偶然的代表性误差,它是指没有登记性误差的前提下,又遵循了随机原则所产生的误差。因为即使遵守了随机原则,但由于偶然抽取的样本结构与总体的结构发生偏差,就会出现或大或小的偶然的代表性误差。随机误差是抽样调查固有的误差,可以控制。通常所说的抽样误差指的是随机误差。抽样误差包括抽样实际误差和抽样平均误差两种。抽样实际误差是指某一样本指标与被它估计的总体指标之间数值的差异,如、。对于确定的全及总体来说,总体指标数值是确定的值,由于样本是按随机原则抽选的,从同一总体抽取样本容量相同的样本可以有多种不同的抽取放法,每个样本都有自己的样本指标,因此抽样实际误差是一个随机变量。作为抽样实际误差的随机变量在总体(样本构成的)中的标准差称为抽样平均误差,其统计意义是所有样本的抽样实际误差的平均值。三、抽样平均误差的意义上面已经讲过,抽样误差是一个随机变量,它的数值随着可能抽取的样本的不同而或大或小,为了总体衡量样本代表性的高低,就需要计算抽样误差的一般水平。抽样平均误差就是反映抽样误差一般水平的指标。抽样平均误差是所有样本与总体参数离差的平均数,即指样本统计量在由样本所构成的总体上的标准差。具体一个样本抽样的实际抽样误差是无法知道的(总体的参数未知),而抽样平均误差是可以计算的,这要借助概率的理论。设用表示抽样平均数的平均误差,表示抽样成数的平均误差,表示样本可能数目,则:

注意以上公式中求和是对所有样本求和的。【例7-3】总体为2、3、4,从总体中按重复抽样抽出两个单位组成样本。求抽样平均误差就是求所有可能样本平均数的标准差。在此;即为抽样平均误差。四、影响抽样平均误差的因素按照上面抽样平均误差的公式,也是不可算的,因为总体的参数未知;为了计算和控制抽样平均误差,需要分析影响抽样平均误差的因素。1.全及总体标志的变动程度()在其他条件不变的情况下,全及总体标志变异程度越大(即变量在总体内的起伏程度越大),抽样平均误差越大;反之,全及总体标志变异程度越小,抽样平均误差越小。2.样本容量()多少在其他条件不变的情况下,样本容量越大,抽样平均误差越小;反之,样本容量越小,抽样平均误差越小。因为样本容量越大越能反映总体、接近总体,误差就越小;反之,误差就越大。当样本容量与总体单位数相等时,就不存在抽样误差了。3.抽样组织方式不同的调查组织方式,如简单随机抽样、类型抽样、多阶段抽样等,所产生的抽样误差一般是不同的。因为不同的抽样方式抽出的样本对于总体的代表性高低也不相同,因而抽样误差也就不一样。一般来说,简单随机抽样的抽样误差最大,类型抽样、多阶段抽样的抽样误差就要明显地小一些。在统计实践中,为了有效降低抽样误差、提高抽样推断的可靠性,一方面应该根据被研究总体的性质和特点,选择不同抽样方式进行抽样;另一方面,还要努力寻求多种抽样方式相结合的复合型抽样组织方式。⒋抽样方法无论是随机抽样还是非随机抽样,都有重复抽样和不重复抽样两种方法。在其他条件相同时,不重复抽样的抽样误差一般小于重复抽样的误差,这是因为不重复抽样避免了从总体单位中的重复选择,因而更能反映总体结构,故抽样误差会较小些。五、抽样平均误差的计算1.样本平均数的抽样平均误差上述的抽样平均误差公式是不可算的,原因不知道总体的参数;但是抽样平均误差作为所有样本所构成的总体上的一个变量,抽样平均误差成为总体上的随机变量的标准差;利用相关的概率与数理统计知识,可以得到下面的公式。(1)重复抽样下抽样平均误差的计算如果全及总体变量的均值为标准差为;在重复抽样条件下,样本的均值统计量的均值为标准差为;从而可以得出一个计算抽样平均误差的转化公式。即:为样本单位数;在总体标准差未知,且样本单位数较大时,可以用样本修正标准差代替【例7-4】设有4个工人,其每月产量分别为70、90、130、150。这一总体的平均工资和工资标准差为:现在用重复抽样的方法,从4人产量中抽取2人构成样本,并求样本的平均产量,用以代表4人总体的平均产量水平。所有可能的样本以及各样本的平均产量列表如下:样本平均数的平均数(件)抽样平均误差(件)现在直接按重复抽样误差公式计算抽样平均误差。(件)所得结果与由定义计算的抽样平均误差完全相同。以上计算过程中可以呈现出几个基本关系:①样本平均数的平均数等于总体平均数。因而抽样平均误差的实质就是抽样平均数的标准差,所以也称为抽样标准误差。②抽样平均数的标准差(即抽样平均误差)比总体标准差小得多,仅为总体标准差的。③可以通过选择样本单位数来控制抽样平均误差。例如将样本单位数扩大为原来的4倍,则平均误差就缩小一半;如果抽样平均误差允许增加一倍,则样本单位数只需要原来的四分之一。(2)不重复抽样下抽样平均误差的计算在不重复抽样的条件下,抽样平均数的平均误差不但和总体变异程度、样本容量有关,而且还要考虑总体单位数多少:在一般情况下,总体单位数很大,抽样比例很小,则接近于1,因此,与的数值接近。在实际工作中,在没有掌握总体单位数的情况下或者总体单位数很大时,一般均用重复抽样平均误差公式来计算不重复抽样的平均误差。【例7-5】仍以4个工人为例,月产量分别为70、90、130、150件。现用不重复抽样方法,随机抽取2个工人,并求其平均产量,所有可能的样本以及各样本的平均产量列表如下:样本平均数的平均数(件)抽样平均误差根据已经计算的总体平均数=110,总体标准差件,也可以按不重复抽样误差公式计算。

(件)两者计算结果完全相同。由此可见,在不重复抽样的条件下,抽样平均数的平均数仍然等于总体平均数,而它的抽样平均误差18.26件比重复抽样的平均误差22.36件小。在计算抽样平均误差时,通常得不到总体标准差的数值,要用样本标准差s来代替总体标准差。【例7-6】随机抽选某校学生100人,调查他们的体重。得到他们的平均体重为58公斤,标准差为10公斤。问抽样推断的平均误差是多少?解:已知:,,,则

即:当根据样本学生的平均体重估计全部学生的平均体重时,抽样平均误差为1公斤。【例7-7】某厂生产一种新型灯泡共2000只,随机抽出400只作耐用时间试验,测试结果平均使用寿命为4800小时,样本标准差为300小时,求抽样推断的平均误差?解:已知:,,,(小时)(小时)

计算结果表明:根据部分产品推断全部产品的平均使用寿命时,采用不重复抽样比重复抽样的平均误差要小。2.抽样成数的抽样平均误差成数作为交替标志的均值,抽样成数的抽样平均误差是样本均值抽样平均误差的特例;只需要将全及成数的标准差平方代替公式中的全及平均数的标准差的平方,就可以得到抽样成数的平均误差公式。交替标志的标准差总体标准差样本标准差抽样成数的平均误差重复抽样:不重复抽样:【例7-8】某灯泡厂对10000个产品进行使用寿命检验,随机抽取2%样本进行测试,得资料如下:按照质量规定,电灯泡使用寿命在1000小时以上者为合格品,按以上资料计算抽样平均误差。电灯泡的平均使用时间(小时)电灯泡合格率电灯泡平均使用时间标准差

(小时)灯泡使用时间抽样平均误差:重复抽样的平均误差(小时)在不重复抽样下抽样平均误差(小时)灯泡合格率的抽样平均误差:重复抽样下抽样平均误差不重复抽样下抽样平均误差抽样平均误差计算公式显示可以通过调整样本容量来控制抽样平均误差。【例7-9】假定抽样单位数增加2倍、0.5倍时,抽样平均误差怎样变化?抽样单位数增加2倍,即为原来的3倍即:当样本单位数增加2倍时,抽样平均误差为原来的0.577倍。抽样单位数增加0.5倍,即为原来的1.5倍。即:当样本单位数增加0.5倍时,抽样平均误差为原来的0.8165倍。六、抽样极限误差1.抽样极限误差的概念用抽样指标来估计总体指标,要达到毫无误差一般来说是不可能的,所以在估计总体指标的同时,必须考虑估计误差的大小,给出最大允许误差。最大允许误差尽量要小一些,误差超过了一定的限度,样本资料就毫无价值了。如对粮食单位面积产量进行抽样调查,如果所抽的粮食每公顷产量的误差超过500千克,可以断定这种样本资料的价值是不大的。因为一般粮食平均每公顷产量为7500千克,而误差达到500千克,则误差为6.7%。通常粮食增产达到5%的幅度就是好收成,现在抽样误差已经超过了这个数目,这种统计数字就失去意义了。在进行抽样估计时,应该根据所研究对象的差异程度和分析的需要确定可允许的误差范围,在这个范围内的估计数字都是有效的。把这种可允许的最大误差范围称为极限误差,它等于样本指标可允许变动的上限或下限与总体指标之差的绝对值。根据概率理论,在已知误差(是个随机变量)的概率分布的前提下,可以计算出以一定的可靠程度保证抽样误差不超过某一给定的范围。故统计上又把抽样极限误差范围称为置信区间。设与分别表示抽样平均数与抽样成数的抽样极限误差,则有:2.总体范围的估计若有了抽样极限误差,则总体平均数和总体成数的可能范围可以用下式估计:抽样平均数的范围:≤≤抽样成数的极限误差:≤≤

如要估计某镇粮食亩产量和总产量水平,从8000亩粮食作物中,用不重复抽样抽取400亩,求得平均亩产为700公斤。如果确定抽样误差为5公斤,这就要求某镇粮食亩产在7005公斤,即在695至705公斤之间,而粮食总产量在8000(7005)公斤,即556万公斤至564万公斤之间。【例7-10】要估计一批产品的合格率,从1000件产品中抽取200件,其中有10件不合格品,如果确定抽样极限误差的范围为2%,试估计产品合格率的范围。样本成数:p=190/200=95%总体成数下限=95%-2%=93%总体成数上限=95+2%=97%即该产品合格率在93%-97%之间。七、可信度和概率度抽样估计不是百分百的确定性估计,而是在一定概率保证度下的判断和估计;抽样平均误差是表明抽样估计的准确度;而抽样最大允许误差范围即抽样极限误差是表明抽样估计准确度的允许范围,这个允许范围是在一定的可靠(概率)范围内的,在允许范围内,还要求确定其估计的可靠(概率)程度,即可信度。抽样估计的可信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。基于可信度的概率估计要求,抽样极限误差通常需要以抽样平均误差或为标准单位来衡量。把极限误差或分别除以或得相对数,表示误差范围为抽样平均误差的倍。是测量估计可靠程度的一个参数,称为概率度。

对于抽样平均数:因此,抽样平均数的抽样极限误差为:

对于抽样成数:因此,抽样成数的抽样极限误差为:这个公式的意义在于,在一定条件下,概率度越大,则抽样误差范围越大,样本可能落在误差范围内的概率越大,从而抽样估计的可信度也就越高;反之,越小,则越小,可能样本落在误差范围内的概率越小,从而抽样估计的可信度也就越低。而估计区间又与抽样极限误差有关,在一定的抽样方式下,抽样极限误差又是由概率度决定的。因而可靠程度与之间有正比关系。从理论上已经证明,在样本单位数足够多≥的条件下,抽样平均数是服从正态分布的,它以总体的均值为中心,以抽样平均误差为标准差;而标准化了的样本均值统计量服从标准的正态分布;这个统计量的最大取值范围即为样本均值统计量的概率度,而其取值的概率可以完全由标准正态分布的分布表来决定。在统计实践中,总体的方差往往是未知的,用方差统计量(公式7-9)的值替代总体的方差,此时标准化了的样本均值统计量服从分布。在统计实践中,总体的方差往往是未知的,用方差统计量(公式7-9)的值替代总体的方差,此时标准化了的样本均值统计量服从分布。第三节总体指标的推断一、总体参数估计总体参数估计就是指通过对样本各单位的实际观察取得样本数据,计算样本统计量的取值作为被估计参数的估计值。总体参数估计有点估计和区间估计两种。(一)总体参数的点估计1.点估计的概念点估计又称定值估计,它是利用样本计算出的统计量直接作为总体参数的估计量。如用样本平均数的实际值作为总体平均数的估计量;用样本成数的实际值作为总体成数的估计值。例如,根据某地区样本资料计算粮食平均每公顷产量9000千克,优质粮食作物的比重为80%,则可以用这些数值作为全地区粮食单位面积(每公顷)产量水平和优质品率的估计值。如用样本均值统计量作为总体参数的估计(样本的一阶原点矩),用修正的样本方差统计量作为总体参数的估计(样本的二阶中心矩)等。参数点估计中关键是如何构造点估计(统计)量,构造点估计量的方法有多种,如矩估计法、最大似然估计法和贝叶斯法等。2.估计量的评选标准估计总体参数,不一定只能用一个统计量,也可以用其他统计量。如估计总体平均数,可以用样本平均数,也可以用样本中位数、众数等等。应当以哪一种统计量作为总体参数的估计量才是最优的,这就有了评价统计量的优良估计标准问题。作为优良估计应该符合以下三个标准:(1)无偏性无偏性是指样本统计量的期望值(平均数)等于被估计的总体参数。也就是说,虽然每一次抽样,所计算的统计量和总体参数的真值可能有误差,误差可正可负、可大可小;但在多次反复的估计中,所有样本统计量取值的平均数应该等于总体参数本身。即样本统计量的估计,平均来说是没有偏差的。样本平均数的期望值等于总体平均数,样本成数的期望值等于总体成数。这说明以样本平均数作为总体平均数的估计量,以样本成数作为总体成数的估计量,是符合无偏性原则的。但是样本的标准差统计量就不符合这一标准,修正后的方差统计量才是一个无偏统计量了。(2)一致性一致性是指当样本的单位数充分大时,样本统计量也充分靠近总体参数。就是说随着样本单位数的无限增加,样本统计量和被估计的总体参数之差的绝对值小于任意小的数,(总体均值的一致性可由大数定理提供理论保证)实际上是几乎肯定的。从抽样误差的影响中可以看出,在其他因素不变的情况下,样本均值的抽样误差与样本单位数的平方根成反比变化,样本单位数愈多则误差就愈小,当样本单位数接近于总体单位数时,抽样误差也就接近于零。也就是说样本均值统计量作为总体参数的估计量是符合一致性原则的。(3)有效性有效性是指作为优良估计量的方差应该比其他估计量的方差小。例如用样本平均数或用总体某一变量值来估计总体平均数,虽然两者都是无偏的,而且在每一次估计中,两种估计量和总体平均数都可能有离差,但是样本平均数更靠近于总体平均数的周围,平均来说其离差比较小。所以对比说来,样本平均数是更为有效的估计量。不是所有估计量都符合以上标准。可以说完全符合以上标准的估计量要比不符合或不完全符合以上标准的估计量更为优良。例如在正态分布的情况下,总体平均数和中位数是重合在一起的,样本平均数是总体中位数的无偏估计量和一致估计量,而且样本平均数比样本中位数作为总体中位数的估计量也是更有效的,因为样本平均数的方差比样本中位数的方差更小。在正态分布的情况下,样本中位数是总体平均数的无偏估计量和一致估计量。但对比样本平均数却不是更有效和充分的估计量,因为它的方差比样本平均数的方差大,当然样本中位数也不是总体中位数的有效估计量。总体参数点估计的方法简便、易行。但这种估计没有表明抽样估计的误差,也没有指出误差在一定范围内的概率保证程度有多大。要研究这些问题,就需要采用区间估计的方法。(二)总体参数的区间估计总体参数的区间估计不是直接给出总体参数的估计值,而是利用实际样本资料,构造出一个置信区间,用这个区间来表明总体参数可能存在的范围,同时给出这个估计相应的概率保证程度(置信度)。用公式表示为:≤≤≤≤式中,和分别是总体平均数区间的上限与下限;和分别为总体成数的上限与下限。

,分别表示被估计总体参数在区间和内的概率为,即:≤≤≤≤称和为置信区间。置信区间就是联系一定概率保证程度确定的区间,表达了区间估计的精确性。为置信度或概率,表示区间估计的可靠程度。例如=0.95,说明有95%的可能总体参数包括在估计区间内。而不包括在这个区间的概率为

=5%,叫显著性水平。由上可见,科学的区间估计方法要具备三个基本要素:第一,要有合适的统计量作为估计量。第二,要有合理的允许误差范围,即抽样极限误差,指样本统计量与被估计总体参数离差的绝对值可允许变动的上限和下限。第三,要有可靠的概率保证程度,即估计的置信度,它涉及估计的可靠性问题;置信度与概率度是对应关系。对于总体的的均值,根据大数定理和中心极限定理,在大样本的情况下,样本均值服从正态分布,中心化后为标准正态分布;当总体方差未知时,用修正的方差统计量替代总体方差;随机变量服从自由度为的分布。(三)区间估计的两种方法1.给定抽样误差范围,估计概率保证程度根据给定的抽样误差范围

,估计其概率保证程度()的具体步骤是:第一步,抽取样本,根据样本单位标志值计算样本指标,如计算样本平均数或样本成数,作为总体指标的相应估计值。并计算样本标准差以推算抽样平均误差。第二步,根据给定的抽样极限误差范围,估计出总体指标(平均数或成数)的下限和上限。第三步,根据给定的抽样极限误差除以抽样平均误差,求出概率度值,再根据值和大小样本数查概率分布表,求出相应的概率保证程度();对大样本,查《正态分布概率表》;在方差未知的前提下,样本容量不大时查《分布临界值表》。并对总体参数作区间估计。这种估计方法分为总体平均数的估计和总体成数的估计两种形式。(1)总体平均数的估计【例7-11】某城市进行居民家计调查,随机抽取400个居民户,调查得年平均每户文化用品消费支出为900元,标准差为200元。要求抽样极限误差不超过20元,试对该市居民年平均每户文化用品消费支出情况做出估计。第一步,抽取样本,计算样本平均数和标准差,并计算抽样平均误差。元,元(元)在这里,样本是容量为400,是个大样本;总体标准差是用样本标准差来代替的;以下例子相同。第二步,根据给定的误差范围,计算该市居民户年均文化用品消费的范围。下限==900-20=880(元)上限==900+20=920(元)第三步,计算概率度,并查《正态分布概率表》表,查出置信度。可以有95.45%的概率保证程度,估计该市居民户年均文化用品消费支出在880-920元之间。(2)总体成数的估计【例7-12】对某市居民户独立拥有厨卫设施情况进行调查,随机抽取900居民户,其中有675户居民拥有独立的厨卫设施。要求抽样极限误差范围不超过2.73%,试对该市居民户独立拥有厨卫设施的比重进行估计。第一步,抽取样本,n=900是个大样本,计算样本成数和标准差,并推算抽样平均误差。第二步,根据给定的误差范围,计算总体成数的上下限。下限==75%-2.73%=72.27%上限==75%+2.73%=77.73%第三步,计算概率度,并查《正态分布概率表》表,查出置信度。可以有95%的概率保证程度,估计该市居民户拥有独立厨卫设施的比重在72.27%-77.73%之间。2.根据置信度的要求,估计总体指标出现的可能范围根据置信度的要求,估计总体指标出现的可能范围的具体步骤是:第一步,抽取样本,根据样本单位标志值计算样本指标,如计算样本平均数或样本成数,作为总体指标的相应估计值。并计算样本标准差用以推算抽样平均误差。第二步,根据给定的置信度的要求,大样本查《正态分布概率表》,求得概率度值;小样本查《分布临界值表》,求出概率度值。第三步,根据概率度和抽样平均误差来推算抽样极限误差的可能范围,并据以计算被估计总体指标的上下限,对总体参数作区间估计。(1)总体平均数的估计【例7-13】某外贸公司出口一种茶叶,规定每包规格不低于150克,现在用不重复抽样的方法抽取其中1%进行检验。测得结果如表7-5所示,要求以99.73%的概率估计这批茶叶平均每包的重量范围。以便确定平均重量是否达到规格要求。表7-5某外贸公司出口茶叶抽样资料每包重量(克)组中值包数148-149148.510149-150149.520150-151150.550151-152151.520合计——100第一步,根据样本资料计算样本平均数和标准差,并推算抽样平均误差。(克)(克)

(克)第二步,根据给定的置信度=0.9973,查表得概率度=3。第三步,根据概率度和抽样平均误差计算抽样极限误差,并估计总体平均数的上下限,判断其是否达到规格要求。(克)下限==150.3-0.26=150.04(克)上限==150.3+0.26=150.56(克)可以用99.73%的概率保证该批茶叶平均每包重量在150.4-150.56克之间,表明这批茶叶平均每包重量达到了规格要求。【例7-14】为研究坚持长跑对体重的影响,采集到10名坚持长跑者前后体重变化的数据:5,0,0,0,8,1,1,4,0,1(单位千克);若以90%的概率保证度,则坚持长跑前后体重变化的置信区间是多少?根据统计资料,知人群体重变化服从正态分布;第一步,根据样本资料计算样本平均数和标准差,并推算抽样平均误差。

(千克)(千克)(千克)第二步,根据给定的置信度=0.90,查《分布临界值表》得概率度=1.833。第三步,根据概率度和抽样平均误差计算抽样极限误差,并估计总体平均数的上下限,判断其是否达到规格要求。(千克)下限==2-1.59=0.41(千克)上限==2+1.59=3.59(千克)可以用90%的概率保证长期坚持锻炼人群重量变化在0.41-3.59千克之间。(2)总体成数的估计表7-5某外贸公司出口茶叶抽样资料每包重量(克)组中值包数148-149148.510149-150149.520150-151150.550151-152151.520合计——100要求用同样的概率,保证这批茶叶包装合格率范围。第一步,根据样本资料计算样本合格率和标准差,并推算抽样平均误差。第二步,根据给定的置信度=0.9973,查表得概率度=3。第三步,根据概率度和抽样平均误差计算抽样极限误差,并估计总体合格率的上下限。下限==0.7-0.137=0.563上限==0.7+0.137=0.837可以用99.73%的概率,保证该批茶叶包装的合格率在56.3%-83.7%之间。(四)总体总量指标的估计在对总体平均数和总体比例进行区间估计的基础上,还可以进一步对相应的总量指标,即总体标志总量和具有某一特征的总体单位数的区间做出估计。其方法是用总体单位数N分别乘以置信区间的上限和下限,得出要估计的总量指标的区间。

【例7-15】某企业生产某种产品的工人有1000人,某日采用不重复抽样从中随机抽取100人调查他们的当日产量。样本人均产量为35件,产量的样本标准差为4.5件,试以95.45%的置信度估计平均日产量的抽样极限误差、置信区间和当日该企业总产量的置信区间。

解:件,=4.5件,=100人,属于大样本。故(件)又知,则,该企业总体人均日产量在95.45%置信度下的置信区间为:

35-0.86≤≤35+0.86,即在34.14至35.86件之间。

该企业日总产量在95.45%置信度下的置信区间为:

,即在34140至35860件之间。

【例7-16】某厂对7月份生产的2000只产品质量进行抽样检验,采取重复抽样抽取样品200只,样品优质品率为85%,试计算当把握程度为90%时优质品率的区间范围以及优质品的总产量区间范围。

解:已知=2000只,=200只,=0.85,=0.90,

总体优质品率在置信度90%下的置信区间为

85%-4.15%≤≤85%+4.15%

即总体优质品率的置信区间在[80.85%,89.15%]之间。总体优质品总产量在90%置信度下的置信区间为,即总体优质品总产量的置信区间之间。二、抽样组织方式(一)简单随机抽样的组织方式1简单随机抽样的组织方式简单随机抽样的组织形式除了抽样框的名单外,不需要利用任何其他信息,所以也称为称纯随机抽样。这种方法的优点是使用起来简单易行,它适用于总体单位数不是太多的总体。采用简单随机抽样,在进行抽样调查之前应该先确定总体范围,并对总体进行编号,然后用抽签的方式或根据《随机数字表》来抽选必要的单位数。简单随机抽样最符合随机原则。简单抽样有几种不同的抽样方法。(1)抽签法。先给每个单位编上序号,将号码写在纸片上,掺和均匀后从中抽选,抽到哪个单位就是哪个单位,直到抽够预先规定的数量为止。这种方法看起来简单易行,总体单位数目不多时也可以使用。(2)随机数字法。首先要将全及总体中所有的单位加以编号,根据编号的位数确定选用随机数码表中若干栏数字。然后从任意一栏、任意一行的数字开始数,可以向任何方向数过去,碰上属于编号范围内的数字号码就定下来作为样本单位。如果是不重复抽样,则碰上重复的数字时不要它,直到抽够预定的数量为止。2.样本容量的确定组织抽样调查的一项重要工作就是确定合适的样本容量。在设计的时候,通常是先根据研究问题的性质确定允许的误差范围和必要的概率保证程度(或概率度),并根据总体的标准差通过抽样平均误差的公式来计算必要的样本单位数n。简单随机抽样在实践上受到许多限制。例如当总体很大时,要首先对每一个单位加以编号就有很大困难,对于无限总体,对其进行编号甚至是不可能的。但这种抽样方式从理论上说最符合随机原则,它的抽样误差容易得到理论上的论证。因此可以作为发展其他更复杂的抽样设计的基础,同时也是衡量其他抽样方式抽样效果的比较标准。(二)类型抽样的组织方式类型抽样是将统计分组法和简单随机抽样结合起来的一种抽样方式。通过分组,可以把总体分成几个在组内性质比较接近的类型,使得各组内标志差异缩小,各组间有较大差异,保证了样本单位能够均匀地分布在总体各部分,从而提高了样本的代表性。实践和数理统计都已证明,类型抽样能比简单随机抽样取得更好的效果。例如,对居民的家计调查,可以按国民经济部门分组来抽选样本单位;对农作物的单位面积产量调查,可以按不同的地理条件分组来抽选样本单位;对某种产品质量进行调查,可以按企业规模分组来抽选样本单位等等。这样都能保证样本有较充分的代表性。将总体分成若干组后,样本单位数在各组之间的分配主要有三种方法:一是按调查者主观意志任意确定各组应抽选单位数,这种分配方法称为随意分配。二是按各组的标志变异程度来确定各组应抽的单位数。对于标志变异大的组宜多抽一些单位进行调查,而标志变异小的组宜少抽一些单位进行调查。各组的抽选比例与对应的总体中各组单位数所占的比例是不相等的,这种分配方法称为最佳分配。三是按统一的比例确定各组应抽选的单位数,这种分配方法称为比例分配。(三)等距抽样的组织方式由于排队所依据的标志不同,有两种等距抽样方法。第一,无关标志排队法。即是指排列的标志和单位标志值的大小无关或不起主要的影响作用。例如,调查职工收入水平时,按职工姓氏笔划排队进行抽样。显然职工收入水平与姓氏笔划之间没有必然的联系。第二,有关标志排队法。所谓有关标志是指作为排列顺序的标志和单位标志值的大小有密切的关系。例如,职工家计调查,按职工平均工资排队抽取调查户等。按有关标志排队实质上是运用类型抽样的一些特点,有利于提高样本的代表性。(四)整群抽样的组织方式整群抽样的优点在于组织工作简单,搜集资料方便容易,调查费用较少。例如,对某工业产品的质量检验,不便于在流水作业线上一件一件地抽选检查,则可以每隔若干小时抽取一批产品进行检验,这样就方便多了。但是,正因为以群为单位进行抽选,抽选单位比较集中,显著地影响了在总体中各单位分布的均匀性,与其他抽样方式比较,抽样误差比较大,即使要得到同简单随机抽样相同的精确度,整群抽样都要调查相对较多的样本单位。一般地,在缺乏总体抽样框的情况下,宜采用整群抽样方式。(五)多阶段抽样的组织方式如我国农产品产量调查就是采用多阶段抽样调查,第一阶段从省抽县,第二阶段从中选县抽乡,第三阶段从中选乡抽村,再从中选的村中抽地块,最后从中选的地块中抽具体的样本单位,并以样本单位测得的实际资料来推算平均亩产和总产。又如我国职工家计调查,第一阶段先抽调查城市,第二阶段从中选城市的各部分中抽选调查单位,第三阶段再从单位中抽选职工,确定具体的调查户,调查各户每月实际的生活费收支情况。在实际工作中,当总体单位很多、分布广泛,又几乎不可能从总体中直接抽取总体单位时,常采用多阶段抽样。其优点是:第一,便于组织抽样。它可以按现有的行政区划或地理区域分各阶段的抽样单元,从而简化抽样框的编制。第二,可以获得各阶段单元的调查资料,根据最初级资料可进行逐级抽样推断,得到各级的调查资料。如农产品产量调查,可根据样本推断地块资料,根据地块资料可推断村的资料,然后依次推断乡、乡推县等。第三,多阶段抽样的方式比较灵活,各阶段抽样的组织方式应以前述四种为依据进行选择。一般在初级阶段抽样时多用分层抽样和等距抽样,在次级阶段抽样时多用等距抽样和简单随机抽样。同时,还可以根据各阶段的不同特点,采用不同的抽样比。如方差大的阶段,抽样比大一些,方差小的阶段,抽样比小一些。而且多阶段抽样在简化抽样工作的同时,又因抽样单位的分布较广,而具有较强的代表性。本章小结抽样调查又称抽样推断或抽样估计,是根据随机的原则在总体中抽取一部分总体单位进行调查登记,进而利用这部分总体单位的数据对总体的有关数量特征在一定概率保证下作出推断的一种统计方法。抽样调查适用的范围很广泛。抽样方法有:重复抽样和不重复抽样。抽样推断的理论基础有:随机变量及其分布规律和大数定理与中心极限定理。用抽样样本指标来估计全及指标是否可行,关键问题在于抽样误差。影响抽样平均误差的因素主要有:全及总体标志的变动程度、样本容量多少、抽样组织方式、抽样方法。在进行抽样估计时,应该根据所研究对象的差异程度和分析的需要确定可允许的误差范围,在这个范围内的估计数字都是有效的,这种可允许的最大误差范围称为极限误差。抽样估计的可信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。总体参数估计就是指通过对样本各单位的实际观察取得样本数据,计算样本统计量的取值作为被估计参数的估计值。总体参数估计有点估计和区间估计两种。抽样的组织方式有:简单随机抽样、类型抽样、等距抽样、整群抽样和多阶段抽样。本章实训模块一:知识理解一、简答题1、抽样调查的特点是什么?2、什么是抽样误差,什么是抽样平均误差?3、什么叫抽样分布,它和总体分布的关系是怎样的?4、什么是简单随机抽样?有什么特点?5、什么是分层抽样?什么是整群抽样?二、判断题(正确的画“√”,错误的画“×”)1.连续生产的电子管厂,每隔一小时抽取5分钟的产品进行产品质量检验,这是运用类型抽样方式。()

2.在进行农产量调查时,如果有意识地都从田边地头抽取样本,有可能使推算的农产量产生系统误差。()

3.分层抽样是将总体先分为若干群,然后成群地随机抽取样本单位。()

二、判断题(正确的画“√”,错误的画“×”)4.抽样极限误差是指样本指标与总体指标之间离差的可能范围。()

5.在重复抽样条件下,推断总体成数的必要抽样单位数目的公式为。()6.在一定抽样平均误差的条件下,要提高推断的可靠性,必须缩小极限误差。()二、判断题(正确的画“√”,错误的画“×”)7.在其他条件不变的情况下,提高抽样估计的可靠程度,其精确程度也将随之提高。()8.在抽样推断中,抽样误差虽然不可避免但可以控制。()9.对10000只灯泡进行耐用性能测试,根据以往资料,耐用时间标准差为51.91小时,若采用重复抽样方法,概率保证68.27%,平均耐用时数的误差范围不超过9小时。在这种条件下应抽取34只灯泡进行耐用性能测试。()二、判断题(正确的画“√”,错误的画“×”)10.点估计可以给出估计的可靠程度。()11.从100个住户中随机抽取了10户,调查其月消费支出额。经计算得到10户的平均月消费支出额为3500元,标准差为300元。假定总体服从正态分布,则总体平均月消费支出额95%的置信区间为:。()二、判断题(正确的画“√”,错误的画“×”)12.样本容量过大,统计量的标准误差也会增大,对总体参数的估计会不准确。()13.在参数估计中,无偏性是衡量一个估计量是否理想的唯一准则。()14.在对总体均值作区间估计时,若给定的显著性水平较小,则估计的结果将有较低的精确度和较高的可信程度。()15.在抽样推断中,作为推断对象的总体和作为观察对象的样本都是确定的、唯一的。()三、单项选择题(只有一个正确答案)1.为了了解某工厂职工家庭收支情况,按该厂职工名册依次每50人抽取1人,对其家庭进行调查属于()。A.简单随机抽样B.等距抽样C.类型抽样D.整群抽样2.抽样平均误差反映了样本指标与总体指标之间的()。A.实际误差B.调查误差C.可能误差范围D.平均误差三、单项选择题(只有一个正确答案)3.某地区职工样本的平均工资450元,抽样平均误差5元,该地区全部职工平均工资落在440~460元之间的估计置信度为()。A.2B.0.9545C.3D.0.99734.根据城市电话网100次通话情况调查,得知每次通话平均持续时间为4分钟,标准差为2分钟,在概率保证为95.45%的要求下,估计该市每次通话时间为()。A.3.9~4.1分钟之间B.3.8~4.2分钟之间

C.3.7~4.3分钟之间D.3.6~4.4分钟之间三、单项选择题(只有一个正确答案)5.进行重复随机抽样,为使抽样误差减少75%,抽样单位数必须是原来的()。A.倍B.倍

C.4倍D.16倍6.将总体各单位按某一标志排队,然后按相等的间隔来抽取样本单位的方法为()。

A.简单随机抽样

B.类型抽样C.等距抽样

D.整群抽样三、单项选择题(只有一个正确答案)7.在同样隋况下,不重复抽样的抽样平均误差与重复抽样的抽样平均误差相比,()。

A.后者小于前者

B.前者小于后者

C.两者相等

D.两者有时相等,有时不等8.将统计分组与随机抽样相结合,借以降低总体方差对抽样误差的影响,从而提高样本代表性,这种抽样组织方式属于()。

A.简单随机抽样

B.分层抽样C.等距抽样

D.整群抽样三、单项选择题(只有一个正确答案)9.联系一定的概率作参数区间估计时,概率表明的是要求估计的()。

A.精确度

B.可靠程度C.准确性

D.有效性10.根据抽样调查资料,某企业工人生产定额平均完成105%,抽样平均误差为1%,概率为0.9545时(t=2),可以确定生产定额平均完成百分比为()。

A.大于107%

B.不大于103%和不小于107%

C.在103%和107%之间

D.小于103%三、单项选择题(只有一个正确答案)13.有一批灯泡共1000箱,每箱200个,现随机抽取20箱并检查这些箱中的全部灯泡,这种抽样方式属于()。

A.纯随机抽样B.类型抽样C.整群抽样D.等距抽样14.某地有2万亩稻田,根据上年资料得知其中亩产的标准差为50公斤,若以95.45%的概率推断平均亩产量,要求极限误差不超过10公斤,应抽选()亩地作为样本进行抽样调查。

A.100B.250C.500D.1000三、单项选择题(只有一个正确答案)15.对甲乙两个工厂工人平均工资进行纯随机不重复抽样调查,调查的工人数一样,两工厂工资方差相同,但甲厂工人总数比乙厂工人总数多一倍,则抽样平均误差()。

A.甲厂比乙厂大B.乙厂比甲厂大C.两个工厂一样大D.无法确定16.当可靠度大于0.6827时,抽样极限误差()。

A.大于抽样平均误差B.小于抽样平均误差

C.等于抽样平均误差D.与抽样平均误差的大小关系依样本容量而定三、单项选择题(只有一个正确答案)17.对某行业职工收入情况进行抽样调查,得知其中80%的职工收入在800元以下,抽样平均误差为2%,当概率为95.45%时,该行业职工收入在800元以下所占比重是()。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论