第七章统计抽样_第1页
第七章统计抽样_第2页
第七章统计抽样_第3页
第七章统计抽样_第4页
第七章统计抽样_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章抽样调查一、抽样调查及其意义1、抽样调查的概念抽样调查是按照随机性原则,从研究总体中抽取一部分单位进行调查(或观察),用这一部分单位的数量特征(值)去推断研究总体的特征(值),从而达到认识总体的目的,也称为随机抽样调查或概率抽样调查。2、抽样调查的特点1、 抽样调查是一种非全面调查2、 按随机原则抽取单位3、 从数量上推断总体4、抽样调查会产生调查误差,但这种误差可以预防和控制。3、抽样调查的作用(1)不能作全面调查的时候使用(如破坏性实验)。(2)理论上可以全面调查,但实际很难实现。(3)节省人力、费用和时间的考虑。(4)与全面调查相比可以调查更多的项目。(5)提高调查质量和数字的准确性,修正和补充全面调查资料。调查误差(抽样误差和工作误差)二、抽样调查的基本原理1、几个基本概念(1)全及总体和抽样总体总体:研究对象的全体。总体单位数N。样本:从总体中抽取部分单位的集合体。样本容量:样本中所包含的单位数n。样本个数:从总体中可能抽取的样本的数量。抽样比:样本容量与总体单位数之比。(2)全及指标和抽样(样本)指标全及指标:是根据总体各单位标志值计算的反映总体特征的指标。它是个确定值,在抽样中也称为参数(即总体的数量特征)。主要有:全及平均数X,全及成数P=N1/N;全及方差2及标准差

。抽样(样本)指标,是按样本中各单位的标志值计算的反映样本特征的指标。它是一个随机变量,在抽样中也称为统计量,在进行统计推算的时候它又是总体参数的估计量。主要有:样本平均数x,样本成数:p=n1/n,样本方差s2及标准差s:(3) 重复抽样和不重复抽样重复抽样:每次都从N个总体单位中抽取样本(始终有N个候选单位),同一单位有多次重复中选的可能。(放回抽样)样本数目:考虑顺序:不考虑顺序:不重复抽样:每个单位只能被抽中一次。即它的候选单位是递减的:N,N-1,N-2,……,N-n+1。样本数目:考虑顺序:不考虑顺序:例有4名工人,每人每月产量分别是40,50,70,80,现随机从其中抽取两人,测算考虑顺序的样本个数。重复抽样考虑顺序样本数:42=16,不重复抽样考虑顺序样本数:4×3=12。抽样方案设计抽样方案设计的基本原则1、随机性原则2、实现最大抽样效果原则精度费用1009050100抽样方案简单随机抽样和系统抽样分层抽样和整群抽样

多阶段抽样

简单随机抽样与系统抽样简单随机抽样:在总体各单位都有同等被抽取可能性的假设条件下进行的抽样。抽样方法又分为直接抽选法、抽签法、随机数码表法,系统抽样,也称机械抽样、等距抽样是将总体各单位按某种标志排序,按相等的间隔抽取样本单位的抽样有关标志排队随机起点等距抽样无关标志排队半距起点等距抽样对称等距抽样类型抽样与整群抽样分层抽样,也称类型抽样是将总体按某种标志分成若干层(类型组),之后在每层中按随机原则抽取样本单位。类型比例抽样:类型适宜抽样:整群抽样:将总体分成若干群,再按随机原则抽取部分群,所抽取的群内所有单位作为样本单位的抽样方法。群内方差群间方差多阶段抽样多阶段抽样是指在抽选样本时,并不是一次直接从总体中抽取,而是分两个或两个以上的阶段来进行。

适用条件:1、调查范围广泛,没有合适的抽样框或者范围太大。2、相对节约人力和物力。3、可以利用现成的行政区划、组织系统作为划分阶段的依据。三、抽样平均误差抽样(实际)误差是指样本指标与总体指标之间数量上的差别。抽样平均误差是指所有可能出现的样本指标的标准差,所有可能出现的样本指标与总体指标的平均离差。影响抽样平均误差的因素1.全及总体标志的变异程度与抽样误差成正比.2.样本容量与抽样误差成反比.3.抽样的组织方式与抽样方法对误差的影响。重复抽样比不重复抽样的抽样平均误差大;简单随机抽样、整群抽样比类型抽样、机械抽样的抽样平均误差大。抽样平均误差的计算当总体资料未知时1、用过去调查取得的资料。2、用样本方差资料代替总体方差资料。3、利用小规模调查的资料。4、用估计的资料。抽样平均误差实用公式1、简单随机抽样例:从2500件电子元件中随机抽取4%的元件做样本,抽出的样本里有5件耐用时间不合格,计算该电子产品的不合格率的抽样平均误差。解:首先确定样本元件的不合格率,即抽样成数。2、类型抽样例:某乡共有农户4000户,用类型抽样的方法按10%抽取样本,情况资料见表:推断全乡抽样平均每户收入和抽样方差。农户总数样本数样本平均收入抽样标准差粮食作物区技术作物区250015002501503600540052754000400解:根据资料,3、机械抽样一般认为,无关标志排队等距抽样近似于简单随机抽样,因此一般按简单随机抽样方法计算抽样误差。有关标志排队等距抽样可以看作类型抽样,因此按类型抽样方法计算抽样平均误差。4、整群抽样整群抽样采用的都是不重复抽样,计算时要使用修正系数平均数抽样平均误差:成数抽样平均误差:例:某工厂生产某种灯泡,在连续生产720小时中,每隔24小时抽取1小时的全部产品加以检查。根据抽样资料计算,灯泡平均使用寿命为1200小时,群间方差为60小时,计算样本平均数的抽样误差。

四、全及指标推断应用样本统计量作为估计量去估计总体参数,称为参数估计。如果在估计中,直接用估计量作为固定的数值对参数作出估计即为点估计。如果在估计中要对参数做出带有某种可靠性的估计并给出对应于这一可靠性或置信度的区间,即为区间估计。抽样极限误差

抽样指标与全及指标之间有一定的误差范围,以一定的可靠程度保证抽样误差不超过某一给定范围,统计上称为抽样极限误差,也称置信区间。可信程度抽样误差范围Δ与抽样平均误差之间的关系是:概率与概率度之间满足函数关系:P=F(t)正态分布曲线由正态概率密度函数给出:当=0,=1时,正态分布称为标准正态分布,N(0,1)。xx+3x-3x+2x+x-x-268.27%95.45%99.73%频率总体平均数区间估计的步骤1)确定概率保证和概率度t。2)抽取一个样本容量为n的样本。3)计算样本平均数和标准差。在有限总体不重复抽样时,标准差修正为:4)构造置信区间:也就是说:如果从正态总体抽取一个容量为n的简单随机样本,并构造区间:我们有F(t)的把握说,这个区间包含总体平均数X。

说明:1)对于样本取自总体方差已知的非正态分布,当样本容量足够大时,仍然用上述区间作为总体平均数的置信区间。2)当总体方差2未知时,用样本方差s2代替。例题:某工业企业报告期生产某种橡胶轮胎10000个,从中抽取0.5%进行耐磨性能检验,结果得到样本的平均磨损量为5775毫克,平均磨损量的样本方差为50000,根据有关规定,在规定时间内的磨损量低于6000毫克为正品。试以95%的概率保证估计全部产品的平均磨损率。已知五、必要抽样单位数的确定确定原则:保证预期精确程度和可靠程度,确定恰当的必要样本数目。依据:1、可靠程度和精确程度。2、总体标志变异程度。3、抽样组织方法。抽样单位数的确定1、简单随机抽样2、类型抽样3、整群抽样例:某车间加工螺杆10000件,为确定其直径是否合格,决定从中抽取部分进行测量。为使直径的测量误差不超过0.1mm(可靠度取99%),按过去经验生产该螺杆的标准差为0.8mm,问至少应抽取多少件测量才可满足上述要求?解:这里已知N=10000件,=0.1mm,s=0.8mm.F(t)=0.99,查正态概率表可得t=2.58。按重复抽样计算时同时,以前加工螺杆的合格品率为98%,今要检验该批螺杆的合格率,为使合格率的测量误差不超过1%(可靠度95%),问抽取多少件检验才能满足要求?F(t)=0.95,t=1.96,=0.01,p=0.98,,按重复抽样计算时六、假设检验假设检验:根据一定的随机样本信息,判断总体未知参数作出的假设是否可信的统计分析方法。基本思想:为了判断总体的某个特征,先对总体特征作出一定的假设,在从总体中抽取一定容量的样本,计算和分析样本数居,对原假设作出接受或拒绝的决策。假设检验决策结果决策假设真实不真实不否定正确犯第二类错误(取伪错误)否定犯第一类错误(弃真错误)正确假设检验的步骤第一步:建立假设。要求:原假设必须包含等号在内,备择假设可在不等、大于、小于三者任选。检验结果只有两种可能:接受原假设就必须拒绝备择假设;拒绝原假设,就必须接受备择假设(发生错误的概率)。第二步:选择显著水平。第三步:寻找检验H0的统计量,确定其分布,计算统计量。第四步:用检验统计量值与临界值比较,若统计量值落在否定域内,说明原假设与样本描述的情况有显著差异,则拒绝原假设,(犯错误的概率为);如果统计量落在接受域,则接受原假设。第五步:做出决策。正态总体参数的检验(一)、方差已知时,对一个正态总体均值的检验。(1)检验统计量为1-α

接受域拒绝域拒绝域总体均值的假设检验例:某公司出口鱼罐头,标准规格是每罐250克,根据以往经验,标准差为3克。现从一批产品中抽取100罐检验,其平均重量为251克,假定重量服从正态分布,规定显著水平为0.05,问该批产品是否合乎出口标准。解:1)建立假设:H0:X=X0=250

,H1:XX0=2502)计算统计量确定显著水平。=0.05,双侧检验临界值:现z=3.33,远远大于临界值1.96,故否定原假设。即该批罐头重量不符合标准。也可以通过求X的置信区间来检验假设,如果求出的区间包含X,就接受原假设,否则就拒绝。如上题的置信区间为:由于X=250未包含在区间内,否定原假设。(2)

正态分布Zαα接受域拒绝域例:某厂生产一种产品,原月产量服从平均值X=75,方差=14的正态分布,设备更新后,为了考察产量是否提高,抽查了6个月产量,求得平均产量为78,,假设方差不变,在显著性水平α=0.05的情况下,月产量是否有显著提高?解:假设(3)-Zαα接受域拒绝域说明:如果检验统计量来自大样本,则按照中心极限定理,不论总体分布是否已知,是否正态,均可用Z统计量来近似。(二)方差未知时,对正态总体均值的检验检验统计量例:某食品厂每罐罐头标准重量为500克。现随机抽10罐来检查机器工作情况,10罐的重量为(单位:克):495、510、505、498、503、492、502、512、497、506假定重量服从近似正态分布,试问这段时间机器工作是否正常(给定显著水平5%)。解:建立假设:H0:=500

,H1:500,由样本计算:查表计算检验统计量:由于t=0.97<2.26,因此,不能拒绝原假设,即机器没有发生异常。总体成数假设检验对总体成数的假设检验必须在大样本条件下进行,所以应当进行Z检验。检验统计量不同的样本容量有不同的t分布,即:对每一个可能的自由度,都有一个不同的t分布。自由度,是可选择的数值的个数。一般如果样本容量为n,则自由度为n-1。0.050.100.150.2051015202530n=10n=1n=4n=202P0.20.60.8151015202530F(10,10)F(10,50)F(10,4)FP一个好的估计量应满

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论