统计学第六章抽样与抽样分布_第1页
统计学第六章抽样与抽样分布_第2页
统计学第六章抽样与抽样分布_第3页
统计学第六章抽样与抽样分布_第4页
统计学第六章抽样与抽样分布_第5页
已阅读5页,还剩80页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

河北工程大学经济管理学院主讲:岳志春yuezhichun@163.com统计学10/18/20221河北工程大学经济管理学院第六章抽抽样样与抽样样分布本章内容容:抽样样与抽样样分布是是推断统统计学中中的最基基本内容容。学习习本章了了解抽样样的概率率抽样方方法;理理解抽样样分布的的概念和和形式;;掌握样样本平均均数、样样本比例例的抽样样分布;;了解抽抽样组织织方式及及其抽样样分布。。重点是样样本平均均数、样样本比例例的抽样样分布。。2/8//20202河北工程程大学经经济管理理学院第六章抽抽样样与抽样样分布本章分三三节:第一节抽抽样样的基本本概念第二节抽抽样样分布第三节抽抽样样组织方方式及其其抽样分分布2/8//20203河北工程程大学经经济管理理学院第一节抽抽样样的基本本概念本节需要要把握四四个问题题:一、总体体与样本本;二、抽样样方法;;三、抽样样框;四、抽样样误差。。2/8//20204河北工程程大学经经济管理理学院一、总体体与样本本把握两个个问题::1、总体和和总体参参数;2、样本和和样本统统计量。。2/8//20205河北工程程大学经经济管理理学院1、总体与与总体参参数(1)总体:指根据研研究目的的确定的的所要研研究的同同类事物物的全体体,是所所要说明明其数量量特征的的研究对对象。按按所研究究标志性性质不同同,分为为变量总总体和属属性总体体,分别别研究总总体的数数量特征征和品质质特征。。构成总体体的个别别事物((基本单单元)就就是总体单位位,也称个个体。总总体单位位的总数数称为总体容量量,记作N。2/8//20206河北工程程大学经经济管理理学院1、总体与与总体参参数(2)总体参数数:指抽样估估计中用用来反映映总体数数量特征征的指标标。研究究目的确确定后,,总体确确定,总总体参数数存在但但未知,,需要估估计。A、变量总体体中各单单位可以以直接用用数量表表示,设设各单位位变量值值为:X1,X2,…XN,则总体参参数有均均值,标标准差或或方差以以及总体体标志总总量,即即我们研究究变量X值的全体体,X的取值有一一定分布布,为一一个随机机变量。。2/8//20207河北工程程大学经经济管理理学院(2)总体参数数:B、对于属性性总体,,各单位位不能用用数值来来表示,,但可以以计算总总体成数数,如前前面所学学P=N1/N,Q=N0/N,P+Q==1,则总体参参数有均均值,标标准差或或方差以以及具有有某一属属性的单单位总数数,即::1、总体与与总体参参数2/8//20208河北工程程大学经经济管理理学院2、样本和样样本统计计量(1)样本::是从总体体中抽出出的部分分单位的的集合,,样本所所包含的的总体单单位个数数称为样本容量量,一般用用n表示。把n≥30的样本称称为大样样本,n﹤30的样本称称为小样样本。对对于既定定总体,,由于抽抽取样本本的方式式方法不不同,样样本容量量可大可可小,样样本不确确定。样样本的内内部构成成与总体体内部构构成总有有一定差差异,即即样本不不能完全全代表总总体,用用样本估估计总体体总存在在代表性误误差。样本个数数:又称样本本可能数数目,它它是指从从一个总总体中可可能抽取取多少个个样本。。样本个个数的多多少与抽抽样方法法有关。。2/8//20209河北工程程大学经经济管理理学院2、样本和样样本统计计量(2)样本统统计量::又称样本本指标或或估计量量,它是是根据样样本资料料计算的的、用以以估计和和推断相相应总体体参数的的综合指指标,常常用的有有:2/8//202010河北工程程大学经经济管理理学院二、抽样样方法把握以下下问题::1、概率抽抽样与非非概率抽抽样;2、重复抽抽样与不不重复抽抽样。2/8//202011河北工程程大学经经济管理理学院(1)概率抽抽样:又称随机机抽样,,指按随随机原则则抽取样样本。随机原则则:就是排除除主观意意愿的干干扰,使使总体的的每一个个单位都都有一定定的概率率被抽选选为样本本单位,,每个单单位能否否入样是是随机的的。概率抽样样的基本本组织方方式有:简单单随机抽抽样、分分层抽样样、等距距抽样和和整群抽抽样。1、概率抽抽样与非非概率抽抽样2/8//202012河北工程程大学经经济管理理学院1、概率抽抽样与非非概率抽抽样(2)概率抽抽样的特特点:A、避免主观观选样带带来的倾倾向性误误差(系系统偏差差),使使样本资资料能够够估计、、推断总总体的数数量特征征;B、因为抽样样建立在在概率和和数理统统计基础础上,可可以计算算和控制制抽样误误差,能能说明估估计结果果的可靠靠程度。。实际中,,在不可可能或不不必要全全面调查查时,常常用概率率抽样推推断总体体,还可可以修正正或补充充全面调调查的结结果。2/8//202013河北工程程大学经经济管理理学院1、概率抽抽样与非非概率抽抽样(3)非概率率抽样::又称非随随机抽样样,指从从研究目目的出发发,根据据研究者者的经验验或判断断,从总总体中有有意识抽抽取若干干个单位位构成样样本。有有重点调调查、典典型调查查、配额额抽样、、方便抽抽样等。。配额抽样样:指抽选一一群特定定数目的的满足特特定条件件的被调调查者的的抽样方方法,这这群被调调查者已已知对此此研究主主题有用用,配额额通常是是年龄、、收入、、职业等等,使用用配额抽抽样有助助于降低低非概率率抽样方方法的偏偏差。2/8//202014河北工程程大学经经济管理理学院1、概率抽抽样与非非概率抽抽样(4)非概率率抽样::适用于::了解总体体大致情情况,总总结经验验教训,,进行大大规模调调查前的的试点等等,有其其优越性性。缺点:受主观影影响易产产生倾向向性误差差;不能能计算、、控制误误差,无无法说明明调查结结果的可可靠程度度。抽样一般般都是指指概率抽抽样。2/8//202015河北工程程大学经经济管理理学院2、重复抽抽样和非非重复抽抽样(1)重复抽抽样:又称重置置抽样,,是指从从总体中中抽出一一个样本本单位,,记录其其标志值值后,又又将其放放回总体体中继续续参加下下一轮单单位的抽抽取。特特点是::第一,,n个单位的的样本是是由n次试验的的结果构构成的。。第二,,每次试试验是独独立的,,即其试试验的结结果与前前次、后后次的结结果无关关。第三三,每次次试验是是在相同同条件下下进行的的,每个个单位在在多次试试验中选选中的机机会(概率)是相同的的。在重重复试验验中,样样本可能能的个数数是,,N为总体单单位数,,n为样本容容量。2/8//202016河北工程程大学经经济管理理学院2、重复抽抽样和非非重复抽抽样(2)非重复复抽样::又称为不不重置抽抽样,即即每次从从总体抽抽取一个个单位,,登记后后不放回回原总体体,不参参加下一一轮抽样样。下一一次继续续从总体体中余下下的单位位抽取样样本。特特点是::第一,,n个单位的的样本由由n次试验结结果构成成,但由由于每次次抽出不不重复,,所以实实质上相相当于从从总体中中同时抽抽取n个样本单单位。第第二,每每次试验验结果不不是独立立的,上上次中选选情况影影响下次次抽选结结果。第第三,每每个单位位在多次次(轮)试验中中中选的机机会是不不等的。。不重复复抽样,,如果是是考虑顺顺序,其其样本可可能个数数为;如果不不考虑顺顺序,其其样本可可能个数数为。。2/8//202017河北工程程大学经经济管理理学院三、抽样框框把握以下下问题::1、概念;;2、抽样框框的形式式;3、对抽样样框的要要求。2/8//202018河北工程程大学经经济管理理学院1、概念抽样框::指包括全全部抽样样单位的的名单框框架。调查目的的确定后后,总体体随之确确定,总总体又叫叫目标总总体,即即理论上上的抽样样范围,,与实际际抽样的的总体范范围有时时不一致致。此外外抽样单单位可以以是个总总体单位位,也可可以是若若干总体体单位的的集合。。如某省省进行农农户收支支调查,,目标总总体是全全省所有有农户,,抽样单单位可以以是每个个农户,,也可以以是每个个乡或村村。所以以,有目目标总体体后还必必须明确确实际进进行抽样样的总体体范围和和抽样单单位。2/8//202019河北工程程大学经经济管理理学院2、抽样框框的形式式(1)名单抽样样框:列出全部部总体单单位的名名录一览览表,如如职工名名单、企企业名单单等。(2)区域抽样样框:按地理位位置将总总体范围围划分为为若干小小区域,,以小区区域为抽抽样单位位。如某某市居民民住房调调查,将将全市居居民户划划分为若若干街道道或片区区。(3)时间表抽抽样框:将总体全全部单位位按时间间顺序排排列,把把总体的的时间过过程分为为若干小小的时间间单位,,以时间间单位作作为抽样样单位。。如对流流水线上上24小时内生生产的产产品进行行质量抽抽检。2/8//202020河北工程程大学经经济管理理学院3、对抽样样框的要要求(1)应与目目标总体体一致,,即包括括全部总总体单位位,不重重不漏,,否则破破坏随机机原则。。例如,,对某市市居民进进行抽查查,以电电话号码码本为抽抽样框不不科学。。(2)尽可能能利用与与所研究究变量高高度相关关的辅助助变量的的信息,,设计最最佳的抽抽样组织织方式和和抽样估估计方法法。2/8//202021河北工程程大学经经济管理理学院四、抽样样误差把握以下下问题::1、调查误误差概念念及其分分类;2、实际抽抽样误差差;3、抽样平平均误差差;4、抽样极极限误差差。2/8//202022河北工程程大学经经济管理理学院1、调查误误差概念念及其分分类(1)统计调调查的误误差:指指调查结结果与总总体真值值间的差差异。(2)分为登登记性误误差和代代表性误误差:A、登记性误误差:指在调查查和汇总总过程中中由于观观察、测测量、登登记、计计算等方方面的差差错或被被调查者者提供虚虚假资料料造成的的误差。。它是任任何一种种统计调调查都可可能产生生的,可可以避免免。2/8//202023河北工程程大学经经济管理理学院1、调查误误差概念念及其分分类(2)分为登登记性误误差和代代表性误误差:B、代表性误误差::指用样本本指标推推断总体体指标时时,由于于样本结结构与总总体结构构的不一一致,样样本不能能完全代代表总体体而产生生的误差差。代表性误误差又分分为系统误差差和随机误差差:a、系统误差差又称偏偏差,指指非随机机因素引引起的样样本代表表性不足足产生的的误差,,可以避避免;b、随机误差差,又称称偶然性性误差、、抽样误误差,随随机因素素引起的的代表性性误差,,不可避避免,但但可以计计算并加加以控制制。2/8//202024河北工程程大学经经济管理理学院2、实际抽抽样误差差(1)实际抽样样误差指指某一具具体样本本的样本本估计值值与与总体参参数的的真真实值之之间的离离差。。实际际中,总总体参数数未未知,误误差无法法计算。。平均数的的误差::成数的误误差:p-P2/8//202025河北工程程大学经经济管理理学院2、实际抽抽样误差差(2)由于样样本随机机抽取,,估计量量是随样样本不同同而不同同的随机机变量,,所以实实际抽样样误差是是随机变变量,可可正可负负,可大大可小。。就某个个既定的的抽样方方案,样样本估计计量所有有可能值值有一定定的分布布规律,,它们与与总体参参数的离离差即抽抽样误差差也有一一定的规规律。实实际中真真正计算算、控制制的误差差并不是是该误差差。2/8//202026河北工程程大学经经济管理理学院3、抽样平平均误差差(1)它是反反映抽样样误差一一般水平平的指标标。常用用样本估估计量的的标准差差反映所所有可能能样本估估计量与与其中心心的平均均离散程程度,即即抽样平平均数或或抽样成成数的标标准差,,公式为为:则抽样平平均数、、抽样成成数的标标准差分分别为::2/8//202027河北工程程大学经经济管理理学院3、抽样平平均误差差(2)又因为为,,则上式式变为反映所有有可能样样本的估估计值与与总体参参数的平平均差异异程度,,即抽样样平均误误差,可可以衡量量样本对对总体的的代表性性大小,,它越小小则统计计量的分分布就越越集中在在总体参参数的附附近。抽样平均均数、抽抽样成数数的标准准差变为为:另一个概概念是抽抽样方差差为为抽抽样平均均误差的的平方。。2/8//202028河北工程程大学经经济管理理学院4、抽样极极限误差差(1)它是指指一定概概率下样样本指标标与总体体参数间间抽样误误差的可可能范围围,又称称允许误差差。因为总总体参数数确定,,统计量量围绕其其左右变变动,用用统计量量与总体体参数之之差的绝绝对值表表示误差差的可能能范围。。公式表表示:在一定概概率下::平均数、、比例的的抽样极极限误差差,在一一定概率率下,2/8//202029河北工程程大学经经济管理理学院4、抽样极极限误差差(2)抽样极极限误差差是抽样样误差的的可能范范围而非非完全肯肯定范围围,可能能范围大大小与这这一估计计的可能能性大小小即概率率紧密联联系,这这个概率率被称为为置信度或可信程度度、把握程度度、概率率保证程程度等,表示为为,,其其他条件件不变的的情况下下,抽样样极限误误差越大大,置信信度越大大。2/8//202030河北工程程大学经经济管理理学院4、抽样极极限误差差(3)相关概概念:抽样误差差率=(抽样极极限误差差/估计量))×100%,抽样估估计精度度=100%-抽样误差差率估计精度度与置信信度矛盾盾。其他他条件不不变下,,提高估估计置信信度,增增大允许许误差,,使精度度降低;;反之,,提高精精度会降降低置信信度。实实际中根根据具体体情况,,可先确确定置信信度再求求极限误误差或先先确定极极限误差差再求相相应的把把握程度度。2/8//202031河北工程程大学经经济管理理学院第二节抽抽样分分布本节只讨讨论重复复的简单单随机抽抽样,所所得容量量为n的样本((x1,x2…xn)称为简单单随机样样本,它它满足两两个条件件:x1,x2…xn相互独立立;每个个xi(i=1,2,…,n)都与总体体X同分布。。把握以下下问题::一、抽样样分布的的概念;;二、抽样样平均数数的抽样样分布;;三、样本本比例的的抽样分分布;四、不重重复抽样样的修正正系数。。2/8//202032河北工程程大学经经济管理理学院一、抽样样分布的的概念把握以下下问题::1、抽样分分布的概概念;2、寻求抽抽样分布布的方法法。2/8//202033河北工程程大学经经济管理理学院1、抽样分分布的概概念(1)它是指指样本统统计量的的概率分分布。每个随机机变量都都有其概概率分布布,样本本统计量量是随机机变量,,有若干干可能取取值,每每个取值值有一定定的可能能性即概概率,从从而形成成统计量量的概率率分布。。样本统计计量是由由n个随机变变量构成成的样本本函数,,抽样分分布属于于随机变变量函数数的分布布。2/8//202034河北工程程大学经经济管理理学院1、抽样分分布的概概念(2)例如,,总体有有N个单位,,随机抽抽取n个单位进进行调查查,可抽抽取个个样样本,得得个个不尽尽相同的的样本平平均数,,将样本本平均数数全部可可能取值值及其出出现的概概率依序序排列得得到样本本平均数数的概率率分布即即平均数的的抽样分分布。同理得得到比例的抽抽样分布布、样本标准准差的抽抽样分布布。对于抽抽样分布布,同样样可以计计算其均值和方差(或或标准差差)等数字特特征反映映该分布布的集中中、离散散趋势。。2/8//202035河北工程程大学经经济管理理学院1、抽样分分布的概概念(3)抽样分分布反映映样本统统计量的的分布特特征,是是抽样推推断的重重要依据据,根据据其分布布规律,,可以揭示样本本指标与与总体参参数间的的关系,,估计抽抽样误差差,说明明抽样推推断的可可靠程度度。2/8//202036河北工程程大学经经济管理理学院2、寻求抽抽样分布布的方法法有精确方法法和大样本方方法,形成精精确和渐渐近抽样样分布。。(1)当总体体分布类类型已知知,对任任一自然然数n能导出统统计量的的分分布的明明显表达达式,称称为精确方法法,所得分分布为精确分布布。当n较小时特特别有用用,又称称小样本方方法,大多是是在正态总体体条件下得到的的。2/8//202037河北工程程大学经经济管理理学院2、寻求抽抽样分布布的方法法(2)大多数数场合,,精确分分布很难难求出或或表达式式复杂,,借助极极限定理理,寻求求n无限增大大时统计计量的极极限分布布,用极极限分布布当作所所求抽样样分布的的近似,,称为大样本方方法,这种极极限分布布称为渐近分布布。在抽样推推断中,,许多场场合下统统计量服服从正态态分布或或以正态态分布为为渐近分分布,此此外还有有分分布布、t分布、F分布等精精确抽样样分布。。2/8//202038河北工程程大学经经济管理理学院二、抽样样平均数数的抽样样分布把握以下下问题::1、总体方差差已知时,样本本平均数数的抽样样分布;;2、总体方差差未知时,样本本平均数数的抽样样分布。。2/8//202039河北工程程大学经经济管理理学院1、总体方方差已知知时,样样本平均均数的抽抽样分布布(大样样本)(1)定理1:设总体是一个简简单随机机样本,,则样本本平均数数证明:因因为总体体是是其一个个简单随随机样本本,所以以相相互独立立且都服服从,由概率论论知,相相互独立立的正态态随机变变量和服服从正态态分布,,其线性性函数也也服从正正态分布布。2/8//202040河北工程程大学经经济管理理学院1、总体方方差已知知时,样样本平均均数的抽抽样分布布(大样样本)(1)定理1的证明::而且,所以,将将样本平平均数标标准化,,有:2/8//202041河北工程程大学经经济管理理学院1、总体方方差已知知时,样样本平均均数的抽抽样分布布(大样样本)(2)定理2:若总体平平均数和和方方差有有限限,当样样本容量量n充分大时时,无论论总体形形式如何何,样本本平均数数近近似服服从正态态分布(3)由定理理知,样样本平均均数是以以总体平平均数为为分布中中心,且且n愈大,样样本平均均数的离离散程度度愈小,,抽样误误差愈小小。由此此得出抽抽样平均均数的标标准差即即抽样平均均误差的公式为为:实际计算算中,总总体标准准差未知知,可用用以前的标标准差代替;大大样本下下,用样本标准准差代替。2/8//202042河北工程程大学经经济管理理学院1、总体方方差已知知时,样样本平均均数的抽抽样分布布(大样样本)(4)由公式式(6.6))知,影响响抽样平平均误差差的因素素:A、总体方差差或标准准差,即即总体各各单位变变量值的的差异程程度;B、样本容量量,容量量越大,,误差越越小;C、抽样方法法(重复复、不重重复抽样样)和抽抽样组织织方式((分层抽抽样、等等距抽样样等)。。2/8//202043河北工程程大学经经济管理理学院2、总体方方差未知知时,样样本平均均数的抽抽样分布布(小样本)定理3:设总体是一个简简单随机机样本,,样本均均值为,,样样本标准准差为S,则统计量量2/8//202044河北工程程大学经经济管理理学院三、样本本比例的的抽样分分布把握以下下问题::1、总体比比例与样样本比例例;2、样本比比例的抽抽样分布布。2/8//202045河北工程程大学经经济管理理学院1、总体比比例与样样本比例例总体中具具有某种种特征的的单位占占全部单单位的比比例称作作总体比例例,记做P;样本中具具有此种种特征的的单位占占全部样样本单位位的比例例称作样本比例例,记做p。实际中如如产品的合合格率、某电视视节目的的收视率率等。2/8//202046河北工程程大学经经济管理理学院2、样本比比例的抽抽样分布布(1)X服从二项项分布,,且有E(X)=nP,V(X)=nP(1-P),当从总体体中抽出出一个容容量为n的样本时时,样本本中具有有某种特特征的单单位数x服从二项项分布,,即x~B(n,p),因而样本本比例p=x//n也服从二二项分布布,且有有:2/8//202047河北工程程大学经经济管理理学院2、样本比比例的抽抽样分布布(2)根据中中心极限限定理,,当二项分布布趋于正正态分布布,大样本下,若nP、n(1-P)皆大于5,样本比比例近似似服从正正态分布布:p~N(P,P(1-P)/n)),则比例的的抽样平均均误差为:实际中,,用以前的总总体比例例或样本比例例p代替。2/8//202048河北工程程大学经经济管理理学院四、不重重复抽样样的修正正系数1、与重复复抽样比比,由于于样本单单位不重重复,样样本单位位很可能能在总体体中更均均匀的分分布,从从而样本本结构更更能与总总体结构构近似,,因此不不重复抽抽样所得得样本对对总体的的代表性性更大,,抽样误误差较小小。前面所讲讲的抽样样分布和和抽样平平均误差差公式都都是就重重复抽样样而言。。2/8//202049河北工程程大学经经济管理理学院四、不重重复抽样样的修正正系数2、不重复复抽样的的抽样平平均误差差为:其中称称为不重重复抽样样的修正正系数,,N很大时,,其他条件件相同下下,不重复抽抽样误差差小于重重复抽样样。当N很大而n很小时,,系数接接近1,二者相相差不大大。因此此,无限限总体都都可以用用重复抽抽样的平平均误差差公式度度量抽样样误差;;有限总总体当抽抽样比例例很小时时(一般般小于5%),也常常用重复复抽样公公式计算算。2/8//202050河北工程程大学经经济管理理学院第三节抽抽样样组织方方式及其其抽样分分布把握以下下问题::一、简单单随机抽抽样;二、分层层抽样;;三、等距距抽样;;四、整群群抽样;;五、抽样样组织方方式的选选择。2/8//202051河北工程程大学经经济管理理学院一、简单单随机抽抽样它是最基基本的抽抽样组织织方式,,常用方方法有抽抽签法、、利用随随机数表表取数法法和电子子计算机机取数法法。它队对总总体单位位不进行行任何划划分或排排队,完完全随机机地直接接从总体体中抽取取样本单单位,使使每个单单位都有有完全均均等的机机会被抽抽中,故故又称纯纯随机抽抽样。它只对总总体单位位进行编编号。这这样估计计的效率率低,进进行大规规模抽样样调查时时,工作作不易展展开。2/8//202052河北工程程大学经经济管理理学院二、分层层抽样及及其抽样样估计把握以下下问题::1、分层层抽样的的概念及及特点;;2、等比比例分层层抽样方方式;3、抽样样平均误误差的计计算;4、例6-1。。2/8//202053河北工程程大学经经济管理理学院1、分层层抽样的的概念及及特点(1)也也称类型型抽样,,它是按按一定标标志对总总体各单单位进行行分类((或层、、子总体体),然然后分别别从每一一类中按按随机原原则抽取取一定的的单位构构成样本本。例如如,抽样样调查一一个城市市居民收收入分配配状况,,如果历历史资料料反映了了该城市市居民的的贫富结结构:高高收入者者、中等等收入者者与低收收入者的的比例结结构,我我们可以以按此结结构分类类分别从从高收入入者、中中等收入入者与低低收入者者中按一一定的比比例抽取取样本。。2/8//202054河北工程程大学经经济管理理学院1、分层层抽样的的概念及及特点(2)特特点:类类型抽样样是统计计分组与与抽样原原理的结结合,可可以提高高样本的的代表性性;不仅仅可以用用样本推推断总体体,还可可以推断断子总体体指标。。前提是对对总体的的结构有有着一定定的了解解,为了了充分利利用这些些信息,,提高估估计的精精确性,,对总体体按确定定标志进进行分类类,保证证抽出的的样本与与总体尽尽可能保保持相似似的结构构。2/8//202055河北工程程大学经经济管理理学院2、等比比例分层层抽样方方式分层抽样样可分为为等比例例和不等等比例分分层抽样样,实际际中采用用等比例例分层抽抽样。(1)设设总体由由N个单位组组成,按按对总体体的认识识,把总总体分为为k组,使得得:然后相应应从各组组中分别别按随机机方式抽抽出个单单位组成成样本。。设样本本容量为为n,它满足足:2/8//202056河北工程程大学经经济管理理学院2、等比比例分层层抽样方方式(2)比比例抽样样方式就就是从每每一类抽抽取时要求两两者间保保持合适适的比例例,也就就是保持持各组样样本单位位数与总总体同组组单位数数之比,,等于样样本容量量与总体体单位数数之比,,即所以各组组的样本本单位数数应为::

2/8//202057河北工程程大学经经济管理理学院3、抽样样平均误误差的计计算和区区间估计计(1)步步骤:设设样本是是:样本抽出出来后::第一步::计算各各组平均均数第二步::将各组组平均数数以各组组单位数数或各样样本组单单位数为为权数,,进行加加权平均均,求出出样本平平均数2/8//202058河北工程程大学经经济管理理学院3、抽样样平均误误差的计计算和区区间估计计(1)步步骤:第第三步::计算分分层抽样样的抽样样平均误误差,第第i组的组内内标准差差为第i组的的抽样平平均误差差为:即为的的方差,,表表示从第第i组中抽样样计算平平均数的的方差,,样本本平均数数的的方差为为,,样本平平均数的的抽样平平均误差差为记表表示示组(层层)内方方差平均均数。2/8//202059河北工程程大学经经济管理理学院3、抽样样平均误误差的计计算和区区间估计计(1)步步骤:同样可计计算在不不重复抽抽样条件件下的抽抽样平均均误差为为:2/8//202060河北工程程大学经经济管理理学院3、抽样样平均误误差的计计算(2)分分析:在在分组下下,总方方差=组组内方差差平均数数+组间间方差,,通过比比较,分分层抽样样的抽样样平均误误差小于于简单随随机抽样样的抽样样误差。。对于给定定的总体体,总体体方差一一定,划划分层时时应尽量量增大层层间差异异,缩小小层内差差异。因因为层内内差异越越小。分分层抽样样的抽样样平均误误差越小小,参数数估计的的效率越越高。2/8//202061河北工程程大学经经济管理理学院例6-1某地区对对居民在在一年内内用于某某类消费费的支出出进行等等比例分分层抽样样,结果果见表,,要求计计算该地地区平均均每户支支出的抽抽样平均均误差和和抽样极极限误差差。调查户数平均支出(元)方差城镇403502209农村8026029162/8//202062河北工程程大学经经济管理理学院4、例6-1解:样本本平均数数是:层内方差差平均数数:抽样平均均误差::抽样极限限误差::2/8//202063河北工程程大学经经济管理理学院三、等距距抽样把握以下下问题::1、等距距抽样的的概念和和特点;;2、无关关标志排排队等距距抽样;;3、有关关标志排排队等距距抽样。。2/8//202064河北工程程大学经经济管理理学院1、等距距抽样的的概念和和特点(1)又又称机械械抽样或或系统抽抽样,它它是将总总体各单单位按某某一标志志进行排排队,计计算出抽抽样间隔隔,并在在第一个个抽样间间隔内确确定一个个抽样起起点,再再按固定定的顺序序和间隔隔来抽取取样本单单位的抽抽样组织织形式。。根据需要要抽取的的样本单单位数n和总体的的单位数数N,可以计计算出等等距抽样样的间隔隔大小::K=N/n,再从第第一至第第K个单位的的范围内内确定抽抽样起点点,之后后每隔K个单位抽抽取一个个样本单单位。2/8//202065河北工程程大学经经济管理理学院1、等距距抽样的的概念和和特点(2)优优越性::提高样样本单位位分布的的均匀性性,样本本代表性性强,一一般工作作易开展展,实际际应用广广泛。但等距抽抽样在排排队后,,抽样起起点一确确定,整整个样本本就确定定了。其其随机性性体现在在排队和和抽样起起点的确确定上。。按排队标标志与调调查内容容的关系系,等距距抽样分分为无关关标志、、有关标标志排队队等距抽抽样,二二者抽样样起点确确定方式式、抽样样效果不不同。2/8//202066河北工程程大学经经济管理理学院2、无关标标志排队队等距抽抽样(1)它是指指等距抽抽样据以以排队的的标志与与调查内内容没有有直接关关系。例例如,城城市居民民家计调调查时,,将居民民按其居居住的街街道门牌牌号码排排队;产产品质量量检查按按产品生生产的时时间先后后顺序排排队,每每个一定定时间或或每生产产一定数数量的产产品抽取取一单位位产品。。2/8//202067河北工程程大学经经济管理理学院2、无关标标志排队队等距抽抽样(2)抽样起起点的确确定:从从所要调调查的标标志看,,总体单单位的排排序仍是是随机的的,抽样样起点r可以随机机确定,,即1≤r≤≤K,遵循随机机原则,,避免系系统偏差差。(3)无关标标志排队队等距抽抽样的效效果接近近于简单单随机抽抽样的效效果,其其抽样误误差通常常按简单单随机抽抽样的抽抽样误差差公式近近似计算算。2/8//202068河北工程程大学经经济管理理学院3、有关标标志排队队等距抽抽样(1)它是指指排队标标志与调调查内容容有关,,例如职职工家计计调查按按职工工工资水平平排队。。(2)在排队队后,从从所调查查变量看看,总体体单位也也大致呈呈顺序排排列,其其抽样起起点不宜宜随机确确定。否否则,若若第一个个间隔内内随机抽抽取一个个标志值值较小((或大))的单位位作起点点,整个个样本会会出现偏偏低(或或高)的的系统偏偏差。2/8//202069河北工程程大学经经济管理理学院3、有关标标志排队队等距抽抽样(3)半距起起点等距距抽样((中心系系统抽样样):以第一个个抽样距距离的一一半为抽抽样起点点(r=k//2)并每间隔隔k个单位抽抽一个单单位。这这样样本本单位是是处于每每个抽样样距离((组)中中点的总总体单位位。因单单位变量量值大致致呈顺序序排列,,所以这这些单位位变量值值能代表表所在间间距内的的一般水水平,由由此样本本代表性性较高。。但这种取取样限制制抽样的的随机性性,且只只能抽取取出一个个样本。。2/8//202070河北工程程大学经经济管理理学院3、有关标标志排队队等距抽抽样(4)对称等等距抽样样:在第第一个间间距内随随机确定定起点r(1≤r≤≤k),然后以组组界[k,2k,…,(n-1)k]为对称点点两两对对称地抽抽取样本本单位,,看书上上图,知知第一组组内r偏小,但但第二组组内样本本单位((2k-r)偏大;反反之,第第二组内内r偏大,则第第二个样样本单位位偏小,,这样整整体看,,样本有有较好的的代表性性,又保保证抽样样的随机机性,根根据排队队结果可可以抽出出k个样本2/8//202071河北工程程大学经经济管理理学院3、有关标标志排队队等距抽抽样(5)有关标标志排队队等距抽抽样相当当于分层层较多((将总体体分为同同等大小小的n个层)而而每层只只抽取一一个调查查单位的的分层抽抽样,所所以抽样样效果类类似于分分层抽样样,抽样样误差一一般按分分层抽样样的误差差公式近近似计算算。2/8//202072河北工程程大学经经济管理理学院四、整群群抽样把握以下下问题::1、整群抽抽样的概概念和特特点;2、整群抽抽样的抽抽样平均均误差;;3、例6-2。2/8//202073河北工程程大学经经济管理理学院1、整群抽抽样的概概念和特特点(1)整群抽抽样又称称集团抽抽样,就就是将总总体各单单位分成成若干群群,然后后从其中中随机抽抽取部分分群,对对中选的的群进行行全面调调查的抽抽样组织织方式。。例如居居民家计计调查,,以一个个乡(或或街道))的所有有住户或或所有人人口为一一群,对对抽中的的乡或街街道的住住户或人人口进行行全面调调查。2/8//202074河北工程程大学经经济管理理学院1、整群抽抽样的概概念和特特点(2)这种方方式是整整群的抽抽取样本本单位,,只需对对各群编编号,简简化工作作,抽样样单位集集中,便便于集中中调查,,简单方方便又节节省人力力、物力力、财力力和时间间,应用用广泛。。但抽样单单位集中中,抽样样单位在在总体中中分布不不够均匀匀。在其其他条件件相同下下,其样样本代表表性可能能较差,,要适当当多抽一一些样本本单位。。2/8//202075河北工程程大学经经济管理理学院2、整群抽抽样的抽抽样平均均误差(1)整群抽抽样的代代表性取取决于抽抽中群之之间的差差异,差差异大,,代表性性差。因因此其误误差与群群间差异异有关,,与群内内差异无无关。(2)设总体的的全部N个单位被被划分为为R群,每群群含有M个单位。。现在从从总体R群中随机机抽出r群组成样样本,对对中选的的群中的的所有单单位进行行全面调调查。群群的平均均数是::样本均值值是:2/8//2020762、整群抽抽样的抽抽样平均均误差(2)从上式可可以看出出,整群群抽样实实质上是是以群代代替总体体单位,,以群平平均数代代替总体体单位标标志值之之后的简简单随机机抽样。。群间方方差是::或者由样样本数据据估计::因此,样样本平均均数的抽抽样平均均误差是是:上式中出出现修正正系数,,这是是因为整整群抽样样都采用用不重复复抽样。。2/8//20207

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论