




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第六章抽样和抽样分布STAT本章重点:1、简单随机抽样;2、抽样分布;3、抽样分布;4、其它组织形式抽样;5、正态分布原理。本章难点:抽样分布原理。
10/10/1统计学院商抽样与抽样分布第1页第六章抽样和抽样分布统计实例(StatisticsinPractice)我国某家用电器企业是国内空调最大生产厂家之一,时其空调年销售就已到达700万台,销售额为120亿元。这家低调、在外界看来有些神秘家电企业,尽管不作声张,极少炒作,甚至喊出“不想做行业老大”话,之后3年来却成长势头迅猛,增加率一直40%以上,赢利率极高。这背后原因在于美较早就开始了提升企业竞争能力。为了防止当今家用电器行业低价利薄局面,实现多条腿走路,以在新一轮竞争中保持优势,该电器集团决议人又提出了进军汽车行业战略目标。为此他要求企业营销部对国际国内各大汽车生产厂家生产能力、销售额、营利能力、市场拥有率等方面作调查分析。作为企业营销部责任人来说,他必须思索怎样去采集汽车生产厂家这些经济机密数据?取得这些数据后,应采取什么方法作数据分析与推断。这必定会用到统计推断知识。10/10/2统计学院商抽样与抽样分布第2页第六章抽样和抽样分布
从这一章开始便进入推断统计学学习内容,它会节约人们时间和财物来到达认识对象最正确程度。现实世界包含素材集合非常庞大,从中提取需要信息非常困难。如:选民人数:每个候选人支持率是多少?产品:不合格率是多少?环境:污染程度怎样?市场:品种、价格、质量情况、购置力等情况了解。在这一章里,你将会了解到样本是怎样抽取,样本统计量是怎样分布,怎样依据样本统计量对总体参数做预计。10/10/3统计学院商抽样与抽样分布第3页第六章抽样和抽样分布STAT第一节抽样及抽样组织形式[例]某养猪场共有存栏肉猪10000头,现欲了解这批肉猪平均每头毛重,假如将每头肉猪都过称去称而获取数据将是不合算。我们能够按照“等机会标准”从中抽出100头肉猪称其重量,计算这100头猪平均每头毛重,以到达我们期望目标。本例中存栏肉猪10000头组成总体,则称为全及总体,它是指在统计抽样中所要了解研究对象整体,又称为母体,当我确定了研究目标时,它含有惟一性。普通全及总体单位总数用N表示,称作总体容量。10/10/4统计学院商抽样与抽样分布第4页第六章抽样和抽样分布STAT本例中所抽出100头肉猪组成总体,则称为样本总体,它是指在统计抽样中按照“等机会标准”从全及总体N(10000)中抽出部分单位(每个单位称作样本单位)所组成整体,简称样本,又称子样。普通样本总体单位总数用n(100)表示,称作样本容量。样本总体则不具惟一性,它可能个数与N、n及抽样方法相关。通常n<30称为小样本,n>30称为大样本,在抽样调查中取大或小样本会直接影响到抽样分布特征。[例]某养猪场共有存栏肉猪10000头,现欲了解这批肉猪平均每头毛重(设为),假如将每头肉猪过称去称而获取数据将是不合算。我们能够按照“等机会标准”从中抽出100头称其重量,计算出这100头猪平均毛重(假定平均每头95.5kg),以到达我们期望目标。10/10/5统计学院商抽样与抽样分布第5页一、统计抽样几个基本概念1、全及总体和样本总体
全及总体:研究对象全体,又称母体。容量用N表示。具备惟一性。
样本总体:按随机标准从总体中抽出部分单位全体,简称样本,被抽出每个单位称样本单位。容量用n表示。样本不具惟一性。第六章抽样和抽样分布10/10/6统计学院商抽样与抽样分布第6页第六章抽样和抽样分布STAT2、总体参数和样本统计量依据全及总体各单位变量值计算反应全及总体某数量特征综合指标,因为全及总体唯一确定,故称总体参数。如上例中依据样本总体各单位变量值计算反应样本总体某数量特征综合指标,因为样本总体不具惟一性,故称为样本统计量,它是一个随机变量。如上例中100头肉猪平均每头毛重(95.5kg)10/10/7统计学院商抽样与抽样分布第7页第六章抽样和抽样分布3、放回抽样与不放回抽样从全及总体中抽取样本有两种方法——放回抽样和不放回抽样。放回抽样,抽样安排---对每次被抽到单位经登记后再放回总体,重新参加下一次抽选抽样方法。在每次抽取中样本单位被抽中概率都等于统计中称这么抽样为相互独立试验。不放回抽样,抽样安排---对被抽到单位登记后不再放回总体抽样方法。不放回抽样与放回抽样比较,每次抽样条件是不一样,前一次抽取结果会对后一次抽取产生影响,统计中称这么抽样为相互不独立试验。注意:二种方法都遵照了“等机会标准”10/10/8统计学院商抽样与抽样分布第8页第六章抽样和抽样分布二、简单随机抽样
简单随机抽样也称为纯随机抽样。它是对总体单位不做任何分类或排队,直接从总体中按“随机标准”抽取样本单位调查方式。其样本抽取过程按总体为有限和无限不一样加以区分1、有限总体抽样从容量为N有限总体中进行抽样,假如容量为n每个可能样本被抽到可能性相等,则称被抽样本为简单随机样本。10/10/9统计学院商抽样与抽样分布第9页第六章抽样和抽样分布
为了便于抽取样本单位,普通在明确抽样框条件下,对总体每个单位都要编号,然后用抽签式或利用《随机数字表》进行抽取。
比如:N=500n=10编码从1-500号在随机数表中随意点二个数字,得到54-50=4行,34列。则选取号码从这个被选中数开始,因为500是个三位数,则小于500连续三位数即为中选号码。见表中所表示。10/10/10统计学院商抽样与抽样分布第10页第六章抽样和抽样分布10/10/11统计学院商抽样与抽样分布第11页第六章抽样和抽样分布2、无限总体抽样在实际应用中,若总体单位数很多,要逐一编号是难以办到,尤其是有些现象,事前也不可能编号(如一些连续大量正在生产产品)所以我们定义:被研究总体中所包括某一正在进行过程使得不可能列出总体中全部元素,则可视为无限总体。无限总体抽样条件:同一总体相互独立10/10/12统计学院商抽样与抽样分布第12页第六章抽样和抽样分布三、点预计点预计就是用样本预计量一个详细观察值直接作为总体未知参数预计值方法。如上例中随机抽取100头肉猪平均毛重(95.5kg)可作为10000头肉猪平均毛重点预计值惯用预计量有:(1)样本平均数为总体平均数预计量;(2)样本方差为总体方差预计量;(3)样本成数为总体成数P预计量。10/10/13统计学院商抽样与抽样分布第13页第六章抽样和抽样分布
在对总体特征做出预计时,并非全部预计量都是优良,从而产生了评价预计量是否优良标准。作为优良预计量应该符合以下三个标准:
无偏性一致性有效性10/10/14统计学院商抽样与抽样分布第14页第六章抽样和抽样分布1、无偏性假如样本某统计量数学期望值等于其所预计总体参数真值,则这个预计统计量就叫做该总体参数无偏预计量。如样本平均数数学期望是总体平均数,则样本均值是总体均值无偏预计量。这里无偏预计量是指没有系统偏差(非随机偏差)平均意义上量,即假如说一个预计量是无偏性,并不是确保用于单独一次预计中没有随机性误差,只是没有系统性偏差而已。这是一个优良预计量主要条件。若以代表被预计总体参数,代表无偏预计量则有:10/10/15统计学院商抽样与抽样分布第15页第六章抽样及抽样分布STAT(1)总体平均数、总体成数P无偏预计量[例]总体A、B、C三人年纪为:1,2,3,N=3n=2。=2岁10/10/16统计学院商抽样与抽样分布第16页第六章抽样及抽样分布STAT(3)总体方差2无偏预计量[例]总体三人A、B、C年纪为1,2,3。n=2,求样本方差。10/10/17统计学院商抽样与抽样分布第17页第六章抽样和抽样分布2,一致性若预计量随样本容量n增大而越来越靠近总体参数值时,则称该预计量为被预计参数一致性预计量。预计量一致性是从极限意义上讲,它适合用于大样本情况。假如一个预计量是一致性预计量,那么采取大样本就愈加可靠。当然,样本容量n增大时,预计量一致性会增强,但调查所需人、财、物力也对应增加。比如,以样本平均数预计总体平均数,符合一致性要求,即存在以下关系:式中为任意正数。10/10/18统计学院商抽样与抽样分布第18页第六章抽样及抽样分布STAT一致性也称大样本有益性10/10/19统计学院商抽样与抽样分布第19页第六章抽样和抽样分布3.有效性有效性是指无偏预计量中方差最小预计量。无偏预计量只考虑预计值平均结果是否等于待预计参数真值,而不考虑预计每个可能值及其次数分布与待预计参数真值之间离差大小离散程度。我们在处理实际问题时,不但希望预计值是无偏,更希望这些预计值离差尽可能地小,即要求比较各无偏预计量中与被预计参数离差较小为有效预计量。如样本平均数与中位数都是总体均值无偏预计量,但在一样样本容量下,样本平均数是有效预计量。10/10/20统计学院商抽样与抽样分布第20页第六章抽样及抽样分布STAT有效性:对无偏预计量,方差越小越有效。[例]假定总体参数=6,五次抽样后分别计算样本平均数和样本中位数,其结果以下10/10/21统计学院商抽样与抽样分布第21页第六章抽样和抽样分布第二节抽样分布从一个总体中随机抽出容量相同各种样本,再从这些样本计算出某统计量全部可能值概率分布,称为这个统计量抽样分布。在抽样推断中,不论是总体,还是样本,都能够用平均数、比率(或成数)、标准差和方差等指标来描述它们特征。当它们用来描述样本特征时,称为样本统计量;当它们用来描述总体特征时,称为总体参数。结构抽样分布包含以下几个步骤:(1)从容量为N有限总体中随机抽出容量为n全部可能样本;(2)算出每个样本统计量数值;(3)算出每个样本统计量数值相对应概率10/10/22统计学院商抽样与抽样分布第22页例:在一箱(5×50×200=50000支)卷烟中随机抽出40支测量烟丝重量X,然后对这箱卷烟烟丝重量进行分析。样本样本指标N=50000n=40放回抽样不放回抽样X1、X2、…XN10/10/23统计学院商抽样与抽样分布第23页第六章抽样和抽样分布假如将整理成份布数列,得到以下形式:样本平均数概率(频率)p1p2pk形成了抽样分布表下面再以一个简单实例来说明抽样分布形成10/10/24统计学院商抽样与抽样分布第24页考查一个N=6总体(6点骰子),其原始分布属于均匀分布:X123456P1/61/61/61/61/61/6
从这个总体中有放回地抽取n=2样本(二个骰子同时抛点数),全部可能样本总数为Nn=36,假定要经过样本预计总体均值,则全部36个可能结果为:第一次第二次123456111.522.533.521.522.533.54322.533.544.542.533.544.55533.544.555.563.544.555.5610/10/25统计学院商抽样与抽样分布第25页样本均值分布整理成:11.522.533.544.555.56p1/362/363/364/365/366/365/364/363/362/361/36用图示反应其分布情况如:10/10/26统计学院商抽样与抽样分布第26页第六章抽样和抽样分布假如我们将抽取简单随机样本过程看成是一个试验,那么,样本均值就是该试验结果数量描述。因而,样本均值就是—个随机变量。所以,与其它随机变量一样,含有平均数、期望值、方差和概率分布。因为各种可能取值是不一样简单随机抽样结果,所以概率分布称为抽样分布。对于这个抽样分布及其特征了解,能够使我们能够对样本均值与总体均值靠近程度进行概率描述。实践中,我们只从总体中抽取一个简单随机样本,抽样分布是理论分布,主要是我们必须掌握它特征。10/10/27统计学院商抽样与抽样分布第27页第六章抽样和抽样分布第三节抽样分布如前所述,样本均值全部可能取值概率分布一、期望值和标准差1、期望10/10/28统计学院商抽样与抽样分布第28页第六章抽样和抽样分布[例]总体A、B、C三人年纪为:1,2,3,N=3n=2。=2岁结论是:10/10/29统计学院商抽样与抽样分布第29页第六章抽样和抽样分布2.样本标准误差()定义:全部样本统计量抽样误差平均数,(采取标准计算形式)。A:抽样统计量抽样标准误差B:抽样成数P抽样标准误差10/10/30统计学院商抽样与抽样分布第30页第六章抽样和抽样分布抽样平均误差计算(1)抽样平均数度抽样平均误差A、重复抽样10/10/31统计学院商抽样与抽样分布第31页第六章抽样和抽样分布B、不重复抽样10/10/32统计学院商抽样与抽样分布第32页第六章抽样和抽样分布有限总体无限总体有限总体中为校正因子,普通可简写为普通当抽样比小于等于5%时,校正因子可忽略不计。10/10/33统计学院商抽样与抽样分布第33页第六章抽样和抽样分布二、中心极限定理(总体分布未知)当样本容量n>30,则不论是否已知总体分布状态,样本平均数分布趋近正态分布,而且其分布比总体分布更集中,即
其中为样本平均数方差,为总体方差定理:设X是含有期望值为,方差为任意总体,则样本平均数抽样分布,将伴随n增大而趋于正态分布,分布形式(参数)为~N()--------中心极限定理10/10/34统计学院商抽样与抽样分布第34页第六章抽样和抽样分布正态分布1401501601701801900.50.40.30.20.1身高(以已知总体为例)10/10/35统计学院商抽样与抽样分布第35页调整:“频率密度”(频率/组距)“频率”;
直方或折线覆盖下面积=1140150160170180190身高0.050.040.030.020.0110/10/36统计学院商抽样与抽样分布第36页当组数n无穷大,折线曲线。身高1401501601701801900.050.040.030.020.0110/10/37统计学院商抽样与抽样分布第37页注:参数、不一样分布形状与位置不一样。10/10/38统计学院商抽样与抽样分布第38页x1x2-Z0Z轻易证实得到10/10/39统计学院商抽样与抽样分布第39页162
170178-z/2
0
z/210/10/40统计学院商抽样与抽样分布第40页第四节抽样分布样本百分比全部可能取值概率分布一、期望值和标准差P---总体百分比1、期望2、标准差标准差又称百分比标准误计算式以下:有限总体无限总体依据中心极限定理,当样本容量n很大时,可视分布为正态分布。条件:10/10/41统计学院商抽样与抽样分布第41页第六章抽样和抽样分布定理:设p是含有期望值为P,方差为P(1-P)任意总体,则样本百分比抽样分布,将伴随n增大而趋于正态分布,分布形式(参数)为~N()--------中心极限定理注:研究样本百分比抽样分布时,能够把它作为平均数特例来进行分析。10/10/42统计学院商抽样与抽样分布第42页第六章抽样和抽样分布例:从一批产品中抽出200件,检验出10件不合格,问样本百分比在总体百分比范围内概率有多大?例中n为200,且大样本下,当总体未知,可用样本预计值替换查标准正态分布表,得概率为95.45%10/10/43统计学院商抽样与抽样分布第43页第六章抽样和抽样分布
第五节其它抽样方法
抽样组织方式是指在抽样时对总体加工整理形式。依据对总体加工整理形式不一样,在抽样调查中抽样组织方式很多,除简单随机抽样外,还有类型抽样、等距抽样、整群抽样、多阶段抽样、方便抽样和判断抽样等其它抽样方法。一、类型抽样类型抽样又称分层抽样或分类抽样。它是先将总体全部单按照某个标志分成若干组,然后在各组中采取简单随机抽样方式或其它方式抽取样本单位抽样组织方式。10/10/44统计学院商抽样与抽样分布第44页[例]10人年纪资料以下。N=10n=3,推断总体平均年纪。人:ABC
DEFG
HIJ年纪:5812
40424648
707276[简单随机抽样](B、H、I),(C、D、E
),(F、G、I)结论:总体变异较大时类型抽样。[类型抽样](B、E、I),(C、D、H
),(A、G、J)第六章抽样和抽样分布10/10/45统计学院商抽样与抽样分布第45页类型抽样是应用于总体内各单位在被研究标志上有显著差异抽样,如研究农作物产量时,耕地有平原、丘陵和山地等;研究职员工资水平时,各行业之间有显著差异。类型抽样实质上是把统计分组和抽样原理有机结合抽样组织方式。经过分组,能够使组中含有同质性,组间含有差异性,然后从各组中简单随机抽样。这么能够确保样本对总体含有更高代表性,所以计算出抽样误差就比较小。类型抽样应掌握主要标准是:分组时应使组内差异尽可能小,使组间差异尽可能大。
第六章抽样和抽样分布10/10/46统计学院商抽样与抽样分布第46页1、2、3、…、i、…、Ki+2Ki+(n-1)Kn二、等距抽样
等距抽样又称为机械抽样或系统抽样。它是先将总体各单位按某一标志次序排列,然后按照固定次序和相同间隔来抽取样本单位抽样组织方式。设全及总体有N个单位,现在需要抽取一个容量为n样本,能够将总体单位N按一定标志排队,然后将N划分为n个单位相等部分,每一部分都包含K个单位,即N/n=K。在第一部分K个单位中(次序为1、2、3、…、i、…、K)随机抽取一个单位i,而在第二部分中抽取第i+K单位。第三部分中抽取第i+2K单位……在第n部分抽取第i+(n-1)K单位,共n个单位组成一个样本,而且每个样本间隔均为K,这种抽样方法称等距抽样。10/10/47统计学院商抽样与抽样分布第47页等距抽样随机性表现在抽取第一个样本单位上,当第一个单位确定后,其余各个单位位置也就确定了。等距抽样能够分为无关标志排序抽样和相关标志排序抽样两类。
无关标志排序抽样是指排序标志与被研究标志无关,如:观察学生考试成绩用姓氏笔划;观察产品质量按生产先后次序等。无关标志排序能够确保抽样随机性,它实质上相当于简单随机抽样。
相关标志排序抽样是指排序标志与被研究标志相关。
在对总体各单位变异情况有所了解情况下,也能够采取相关标志进行总体单位排列,使各单位排列次序和它变量数值大小保持亲密关系。第六章抽样和抽样分布10/10/48统计学院商抽样与抽样分布第48页如:农产量抽样调查,可利用各县或各乡当年预计亩产或最近三年平均亩产标志排队,抽取调查单位;又如职员家计调查,可按职员平均工资排队,抽取调查企业或调查户。由此可见,按相关标志排序实质上是利用类型抽样一些特点,有利于提升样本代表性。但也必须注意到,等距抽样在排序时,第一个样本单位位置确定后,其余单位也随之确定,所以要防止抽样间隔和现象本身周期性节奏相重合,引发系统性影响。第六章抽样和抽样分布10/10/49统计学院商抽样与抽样分布第49页三、整群抽样整群抽样又称为分群抽样或集团抽样。它是将总体划分为若干群,然后以群为单位从中按简单随机抽样方式或等距抽样方式抽取部分群,对中选群中全部单位一一进行调查抽样组织方式。第六章抽样和抽样分布ABCDEFGHIJKLNOPLHPD1、按某种标志或要求将总体区分为若干群(R),群内单位数(M)相等;2、采取不重复抽样方式从R群随机抽出r群,尔后对样本群进行全方面调查以推断总体。总体群数R样本群数r10/10/50统计学院商抽样与抽样分布第50页
在大规模抽样调查中,假如总体单位多且分布区域广,缺乏进行抽样抽样框,或者在按经济效益标准不宜编制这种抽样框情况下,宜采取整群抽样方式。整群抽样中群主要是自然形成,如按行政区域、地理区域划分群。整群抽样和其它抽样组织方式比较,在相同条件下,抽样误差较大,代表性较低。在统计工作实践中采取整群抽样时,普通都要比其它抽样方式抽样更多单位,借以降低抽样误差,提升抽样结果准确程度。第六章抽样和抽样分布10/10/51统计学院商抽样与抽样分布第51页四、多阶段抽样多阶段抽样又称多级抽样。它是将抽取样本单位过程划分为几个阶段,然后逐阶段抽取样本单位抽样组织方式。
假如先将总体进行分组,从中随机抽出一些组,然后再从中选组中随机抽取总体单位,称为二阶段抽样,如整群抽样随机抽出群,再从群中随机抽出样本单位就是二阶段抽样。假如将总体进行多层次分组,然后依次在各层中随机抽取,直到抽到总体单位,就称为多阶段抽样,如我国农产量调查就是采取多阶段抽样调查,即先从省中抽县,然后从中选县抽乡,乡中抽村,再由中选村中抽地块,最终从中选地块中抽取小面积样本单位。
当总体单位很多且分布广泛,几乎不可能从总体中直接抽取总体单位时,常采取多阶段抽样。其优点在于:首先,便于组织抽样。它能够按现有行政区划或地理区域划分各阶段抽样单元,从而简化抽样框编制。10/10/52统计学院商抽样与抽样分布第52页
其次,能够取得各阶段单元调查资料,即依据最初级资料可进行逐层抽样推断,得到各级调查资料。如农产量调查,可依据样本推断地块资料,依据地块资料可推断村资料,然后依次推断乡、县等。第三,多阶段抽样方式比较灵活,各阶段抽样组织方式能够前述四种为依据进行选择。普通在初级阶段抽样时多用类型抽样和等距抽样,在次级阶段抽样时多用等距抽样和简单随机抽样。同时,还能够依据各阶段不一样特点,采取不一样抽样比。如方差大阶段,抽样比大一些;方差小阶段,抽样比小一些。而且多阶段抽样在简化抽样工作同时,抽样单位分布较广,含有较强代表性。五、非概率抽样方便抽样判断抽样10/10/53统计学院商抽样与抽样分布第53页课堂练习1、某企业出口一个名茶,要求每包规格重量不低于150g,现用简单随机抽样方法抽取其中1%进行检验,结果以下(1)试以99.73%概率确保程度估计这批茶叶平均每包重量范围。(2)试以一样概率确保程度预计这批茶叶包装合格率范围。解:F(t)=1–=99.73%,t=3
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 影视技术与创新
- 英语考试试卷及答案
- 企业团队能力培训课件
- 铲车操作培训及就业保障合同范本
- 餐厅厨师劳动合同与职业健康管理
- 餐饮业店铺租赁合同范本及食品安全责任协议
- 房屋抵押典当业务合同范本
- 小区地漏定期检查方案
- 工厂店铺定向选址方案
- 智能家居产品保密及信息安全合同
- 2023新能源光伏电站检修规程
- 特种作业人员体检表
- 2016电动汽车充换电服务网络运营管理系统通信规约:系统与站级监控系统通信规约
- 知识产权技术部内审核查表含审核记录
- 小学英语语法-动词课件
- 租船运输实务与法律航次租船合同
- 火电厂基本建设程序与设计内容深度介绍
- 上消化道出血疑难病例讨论课件
- 古诗词九宫格题目课件
- 保险行业管理会计sap方案
- 中医外科医生面试问题及答案
评论
0/150
提交评论