第6章抽样推断统计学陶浪平南京大学出版_第1页
第6章抽样推断统计学陶浪平南京大学出版_第2页
第6章抽样推断统计学陶浪平南京大学出版_第3页
第6章抽样推断统计学陶浪平南京大学出版_第4页
第6章抽样推断统计学陶浪平南京大学出版_第5页
已阅读5页,还剩98页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、本章主要内容第一节第一节 抽样推断的概述抽样推断的概述第二节第二节 抽样误差抽样误差(自学)(自学)第三节第三节 抽样推断的方法抽样推断的方法参参数估计数估计 第四节第四节 抽样组织设计抽样组织设计消费者协会接到消费者投诉,指控品牌纸包装饮料存在容量不足,有欺骗消费者之嫌。包装上标明的容量为250毫升。消费者协会从市场上随机抽取50盒该品牌纸包装饮品,测试发现平均含量为248毫升,小于250毫升。这是生产中正常的波动,还是厂商的有意行为?消费者协会能否根据该样本数据,判定饮料厂商欺骗了消费者呢?250 ml抽样推断:抽样推断: 从样本含有的信息中提取总体的信息从样本含有的信息中提取总体的信息一

2、个轮胎制造商发明了一种新轮胎,这种轮胎的里程数一个轮胎制造商发明了一种新轮胎,这种轮胎的里程数超过了企业现有生产线上轮胎的里程数。为了对这种新超过了企业现有生产线上轮胎的里程数。为了对这种新型轮胎作出评估,管理人员需要对新型轮胎的平均里程型轮胎作出评估,管理人员需要对新型轮胎的平均里程作出估计。制造商选择了作出估计。制造商选择了120120个这种新型轮胎作为样本个这种新型轮胎作为样本进行检验,检验结果的样本均值为进行检验,检验结果的样本均值为3650036500英里。于是,英里。于是,该种新型轮胎平均里程的估计值为该种新型轮胎平均里程的估计值为3650036500。某个政治团体的成员正考虑支持

3、某一候选人竞选国会议某个政治团体的成员正考虑支持某一候选人竞选国会议员。为了决定是否参加即将到来的普选,政团领导者需员。为了决定是否参加即将到来的普选,政团领导者需要对登记选民中支持这一候选人的比率做一个估计。受要对登记选民中支持这一候选人的比率做一个估计。受时间和成本的限制,不可能与登记选民总体中的每一个时间和成本的限制,不可能与登记选民总体中的每一个都取得联系。于是,选取都取得联系。于是,选取400400个登记选民为样本。如果个登记选民为样本。如果400400个选民中有个选民中有160160个对该候选人表示支持,则登记选民个对该候选人表示支持,则登记选民中支持该候选人的比率的估计值为中支持

4、该候选人的比率的估计值为160/400=0.4160/400=0.4参数估计在统计方法中的地位参数估计在统计方法中的地位描述统计描述统计推断统计推断统计参数估计参数估计假设检验假设检验参数估计:参数估计:通过样本的观察结果来推断总体参数的取值范围以及得到此结论的可靠程度。假设检验:假设检验:根据样本所提供的信息,对总体的某些方面,如总体的分布类型、总体参数的性质等作出结论性的判断。基本做法:基本做法:预先对总体参数的取值或总体分布形式作出假定,然后用样本数据来验证,从而作出是接受还是拒绝该假设的结论。统计方法例:某大学从该校学生中随机抽取例:某大学从该校学生中随机抽取100100人,调查到他们

5、平人,调查到他们平均每天参加体育锻炼的时间为均每天参加体育锻炼的时间为2626分钟。试以分钟。试以9595的置信水的置信水平估计该大学全体学生平均每天参加体育锻炼的时间(已平估计该大学全体学生平均每天参加体育锻炼的时间(已知总体方差为知总体方差为3636分钟)。分钟)。例:例:某地区水土中缺乏一种微量元素,根据医学研究结果某地区水土中缺乏一种微量元素,根据医学研究结果可知,人们如果摄取这种元素过少,脑功能可能受影响可知,人们如果摄取这种元素过少,脑功能可能受影响,因此可推测该地区儿童的智力水平可能低于一般水平,因此可推测该地区儿童的智力水平可能低于一般水平。心理学家使用某一标准化智力检验方法,

6、对该地区随。心理学家使用某一标准化智力检验方法,对该地区随机选取机选取3636名儿童进行智力测验,得到智力分数的平均值名儿童进行智力测验,得到智力分数的平均值是是9494分,已知总体标准差为分,已知总体标准差为1515分,问该地区儿童的智力分,问该地区儿童的智力水平是否和一般水平(水平是否和一般水平(100100分)有明显差异?分)有明显差异?抽样推断的过程抽样抽样计算计算推断推断抽样分布:抽样分布:样本统计量(样本平均数或样本比率)的样本统计量(样本平均数或样本比率)的概率分布概率分布1.样本统计量服从什么理论分布?样本统计量服从什么理论分布?2.统计量抽样分布的参数与总体的参数有什统计量抽

7、样分布的参数与总体的参数有什么关系?么关系?核心概念核心概念两个基本点两个基本点如果将抽取简单随机样本的过程看作一次试验,样本均值或比率就是试验结果的一个数值描述,即样本均值或样本比率就是一个随机变量。因此,也就有数学期望、方差和概率分布。一、抽样推断的概念和特征一、抽样推断的概念和特征二、抽样推断的应用范围二、抽样推断的应用范围三、抽样推断的内容三、抽样推断的内容四、有关抽样的基本概念和四、有关抽样的基本概念和理论依据理论依据统计学 第6章 抽样推断 第一节 抽样推断的概述本章目录 1.1.抽样推断的含义抽样推断的含义抽样推断抽样推断是根据随机原则从总体中抽取部分总体单位,以这一部分总体单位

8、单位的实际数据推算总体推算总体相应数量特征的一种统计分析方法。随机原则随机原则指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等的被抽中机会。随机抽样的目的随机抽样的目的是使样本与总体同分布。统计学 第6章 抽样推断 第一节 抽样推断的概述统计推断统计推断参数参数(未知量)(未知量)统统计量计量(已知量(已知量)统计学第统计学第6 6章章 抽样推断抽样推断统计学第统计学第6 6章章 抽样推断抽样推断2.2.抽样推断的特征抽样推断的特征(1)是由部分推算整体的一种认识方法(2)按随机原则抽取样本(3)运用概率估计的方法(4)抽样推断虽然存在一定的误差,但抽样误差可以事先计算

9、并加以控制统计学 第6章 抽样推断 第一节 抽样推断的概述统计学第统计学第6 6章章 抽样推断抽样推断1.对于一些具有破坏或损伤使用价值的检验调查方法,即被抽取的单位经过观测之后就失去了原有的形态或功能。(如灯泡耐用时间实验)2.反映不可能进行全面调查,而又要了解全面情况的社会经济现象总体的数量特征。(产品质量检验、商品市场占有率调查) 3.对可进行全面调查的现象,抽样调查可取得事半功倍的效果,并有其独到的作用。(居民生活状况调查) 统计学第统计学第6 6章章 抽样推断抽样推断4.可以对全面调查资料进行补充和订正。(人口的抽样推断检查) 5.可以用于工业生产过程的质量控制。 6.可以对某种总体

10、指标的假设进行检验,来判断这种假设的真伪,以决定取舍。 三、抽样推断的内容三、抽样推断的内容1.1.抽样估计抽样估计抽样估计抽样估计是通过以样本数据对总体某一未知数量特征进行估计的一种统计分析方法。2.2.假设检验假设检验假设检验假设检验是根据研究的目的和要求,先对总体某一未知的数量特征作某种假设,然后根据样本数据对这一假设进行检验,以判断假设的真伪的一种统计分析方法。统计学 第6章 抽样推断 第一节 抽样推断的概述四、有关抽样的基本概念及理论依据四、有关抽样的基本概念及理论依据1. 1.全及总体和样本全及总体和样本2. 2.全及指标全及指标(总体参数)和(总体参数)和抽样指标抽样指标(统计量

11、)(统计量)3. 3.重复抽样和不重复抽样重复抽样和不重复抽样统计学 第6章 抽样推断 第一节 抽样推断的概述(一)相关概念(一)相关概念统计学 第6章 抽样推断 第一节 抽样推断的概述又称总体或母体,是所要认识研究对象的全体,它由具有某种共同性质或特征的单位所组成。常用N表示全及总体的单位数目。又称样本总体、抽样总体或子样,是指从全及总体中按照随机原则抽取的那部分个体的组合。抽样总体的单位数称为样本容量,通常用n表示。1nN 。n30称为大样本,n 30称为小样本.n/N称为抽样比。例如:在100万户居民中,随机抽取1000户居民进行家庭收支情况调查,其中的100万户居 民就是全及总体,而被

12、抽中的1000户居民则构成抽样总体。统计学 第6章 抽样推断 第一节 抽样推断的概述nnxxx,210n1nmiimiiiniiffxxnxx111或统计学第6章 抽样推断miiimiiniifxxfsxxns121121111或miiimiiniifxxfsxxns12121221111或为自由度为为 的无偏估计的无偏估计2为为 的无偏估计的无偏估计pnnqnnp1,01pqnnppnnsp111pqnnppnnsp1112为 的无偏估计2P为 的无偏估计P统计学第八章 抽样推断ff xnxxPxp常用的参数常用统计量a.平均数: 成数: b.方差: 成数方差:ffXNXXffNXXXX22

13、2PXp)1 (2PPp ffnxxxx222)1 (2PPp(2 2)常用的参数和统计量)常用的参数和统计量统计学 第6章 抽样推断 第一节 抽样推断的概述重复抽样从总体N个单位中随机抽取一个样本容量为n的样本,每次从总体中抽取一个,并把结果登记下来,又放回总体中重新参加下一次的抽选。又称放回抽样不重复抽样每次从总体中抽选一个单位后就不再将其放回参加下一次的抽选。又称不放回抽样.总体单位数N不变,同一单位可能多次被抽中。总体单位数减少n,同一单位只可能被抽中一次。统计学第6章 抽样推断3.3.重复抽样和不重复抽样重复抽样和不重复抽样根据对样本的要求不同,可分为:考虑顺序抽样不考虑顺序抽样考虑

14、各单位的中选顺序。ABCCBA不考虑各单位的中选顺序。ABCCBA考虑顺序的重复抽样不考虑顺序的不重复抽样考虑顺序的不重复抽样不考虑顺序的重复抽样综合起来共有四种抽样方法统计学第6章 抽样推断考虑顺序的不重复抽样不考虑顺序的不重复抽样考虑顺序的重复抽样不考虑顺序的重复抽样)!/(!nNNpnNnNnnNC1 -nNC统计学第6章 抽样推断又称大数定律,表明大量随机观象平均结果具有稳定性的性质。是指在随机试验中,每次出现的结果不同,但是大量重复试验出现的结果的平均值却几乎总是接近于某个确定的值。简单的说,大数定理就是“当试验次数足够多时,事件发生的频率无穷接近于该事件发生的概率”。1)(limX

15、xPn如果变量总体存在有限的平均数和方差,那么不论这个总体的分布如何,随着样本容量的增加,样本平均数的分布,便趋近于正态分布。即:)(nNX,第二节第二节 抽样误差抽样误差一、抽样误差的概念及影响因素一、抽样误差的概念及影响因素二、抽样平均误差二、抽样平均误差三、抽样极限误差三、抽样极限误差统计学 第6章 抽样推断 第二节 抽样误差本章目录 (一)抽样误差的概念(一)抽样误差的概念 在抽样推断中,误差的来源很多,包括登记性误差和代表性误差。登记性误差 又称为调查误差或工作误差,是指在调查过程中,由于各种主观或客观的原因而引起的误差。统计学 第6章 抽样推断 第二节 抽样误差代表性误差代表性误差

16、是指在抽样调查中,样本各单位的结构情况不足以代表总体的状况,而用部分去推断总体所产生的误差。它包括两类误差:系统性误差和随机性误差。系统性误差系统性误差它是由于抽样时违反随机原则而产生的误差。系统性误差和登记误差一样,都是抽样组织工作造成的,应该采取措施预防或将其减小到最低程度。随机性误差随机性误差它是指由于随机抽样的偶然因素使样本代表性不足而引起的。随机性误差在抽样推断中是不可避免的。抽样误差广义:指代表性误差狭义:专指抽样调查中的随机性误差(二)抽样误差的影响因素 1.总体各单位标志值的差异程度; 2.样本的单位数; 3.抽样的方法; 4.抽样调查的组织形式。 重复抽样的抽重复抽样的抽样误

17、差比不重样误差比不重复抽样的大复抽样的大单位数越多,抽单位数越多,抽样误差越小样误差越小差异越大,抽差异越大,抽样误差越大样误差越大简单随机抽样的简单随机抽样的抽样误差最大抽样误差最大(一)什么是抽样平均误差 抽样平均误差是反映抽样误差一般水平的指标,其实质是指抽样平均数的标准差,它反映了抽样指标与总体指标的平均离散程度,也就是样本指标与总体指标的标准差,通常用抽样平均数的标准差来衡量。 抽样平均数的平均数=总体平均数(二)抽样平均误差的计算 1.重复抽样的条件下 2.不重复抽样的条件下统计学 第6章 抽样推断 第二节 抽样误差nxx:抽样平均误差统计学 第6章 抽样推断 第二节 抽样误差 式

18、中,n为样本容量 为总体标准差一般情况下是未知,可用样本标准差 替代 。npp:成数的抽样平均误差 式中,n为样本容量; 为总体成数标准差,一般情况下是未知的,可用样本成数标准差 替代 。Xxpp2.2.不重复抽样的条件下不重复抽样的条件下2X)1 () 1()(:22NnnNNnnNXxXx很大时近似为当;抽样平均误差统计学 第6章 抽样推断 第二节 抽样误差 式中,N为总体单位数;n为样本容量; 为总体方差一般情况下是未知,可用样本方差 替代。2x 式中, N为总体单位数; n为样本容量; 为总体成数方差一般情况下是未知,可用样本成数方差 替代 。1:2NnNnPp成数的抽样平均误差)1

19、(2NnnNPp很大时近似为当2P2p由此可以看出,同样条件下,重复抽样与不重复抽样的抽样平均误差之间相差一个 ,称 为校正因子。由于 ,因此在同样条件下,不重复抽样的平均误差总是小于重复抽样的平均误差。在抽样比例 很小时,Nn1Nn111NnNn11Nn3.当总体方差和标准差未知时,可用以下方法解决:用样本方差来代替总体方差可用过去全面调查的资料,也可以用过去抽样调查的资料代替如果有多个不同的材料,则应选择用方差数值较大的。用估计资料代替例:某企业生产一批灯泡,共10000只,随机抽取500只作耐用时间实验。测算结果平均使用寿命为5000小时,样本标准差为300小时,500只中发现10只不合

20、格。求平均数和成数的抽样平均误差。抽样极限误差抽样极限误差是指用绝对值形式表示的样本指标与总体指标偏差可允许的最大范围。即: 或 如果抽样极限误差用抽样平均误差来衡量,则有: 或 统计学 第6章 抽样推断 第二节 抽样误差XxxPpp。;Pp;X,x为总体成数为样本成数为总体平均指标为样本平均指标式中xxz ppz 即,抽样极限误差是抽样平均误差的多少倍。我们把倍数z称为抽样误差的概率度抽样误差的概率度本章目录第三节第三节 抽样推断的方法抽样推断的方法参数估计参数估计Parameter EstimationParameter Estimation统计学 第6章 抽样推断 第三节 参数估计本章目

21、录 也叫也叫抽样估计抽样估计,就是根据,就是根据样本指标样本指标数值对数值对总体指标总体指标数值作出估计或推断。由于总体指标是表明总体数数值作出估计或推断。由于总体指标是表明总体数量特征的参数,所以也称为量特征的参数,所以也称为参数估计参数估计。参数估计主参数估计主要分为要分为点估计点估计和和区间估计区间估计两种方法。两种方法。抽样推断抽样推断通常,把用来估计总体特征的样本指标叫通常,把用来估计总体特征的样本指标叫估计估计量或统计量,量或统计量,待估计的总体指标叫待估计的总体指标叫总体参数总体参数。特点特点1.它在逻辑上运用它在逻辑上运用归纳推理归纳推理而不是演绎推理。而不是演绎推理。 2.在

22、方法上运用不确定的在方法上运用不确定的概率估计方法概率估计方法,而不是,而不是运用确定的数学分析方法。运用确定的数学分析方法。 3.抽样估计存在抽样估计存在抽样误差抽样误差。 统计学 第6章 抽样推断 第三节 参数估计一、抽样推断的含义一、抽样推断的含义统计学 第6章 抽样推断 第三节 参数估计(一)参数点估计的概念及特点(一)参数点估计的概念及特点1.1.概念概念点估计又称为定值估计定值估计,就是用实际抽样调查资料得到的样本指标值直接作为相应总体参数的估计值。例如:统计学 第6章 抽样推断 第三节 参数估计2.2.特点特点方法简单方法简单,能够提供总体参数的具体估计值,从而可以作为行动决策的

23、数量依据。无法控制误差无法控制误差,仅适用于对推断的准确程度与可靠程度要求不高的情况。统计学 第6章 抽样推断 第三节 参数估计问题:问题:第一,我们为什么以这一个而不是那一个统计量来估计某个总体参数?估计值的优良标准估计值的优良标准第二,如果有两个以上的统计量可以用来估计某个总体参数,其估计结果是否一致?是否一个统计量要优于另一个?oemmx估计值的优良标准:估计值的优良标准:无偏性、有效性、一致性无偏性、有效性、一致性统计学统计学第第6 6章章 抽样推断抽样推断 统计学 第6章 抽样推断 第三节 参数估计1.无偏性无偏性 作为总体参数估计量的样本统计量,要求其期望值(平均数)等于被估计的总

24、体参数。这样的估计量称为无偏估计量。 2.有效性有效性 以抽样指标估计总体指标时,要求作为优良估计量的方差应比其它估计量的方差小。 3.一致性一致性 又称相合性相合性,作为优良估计量的样本容量充分大时,抽样指标也应充分地靠近总体参数。即: 从样本统计量期望的角度分析一般情况一般情况下均可满下均可满足足方差越小的估计量就越有效11limlimPpXxnn无偏性:无偏性:要求样本统计量的平均数等于被估计的总体参数本身。有效性:有效性:一致性:一致性:当样本容量充分大时,样本统计量充分靠近总体参数本身。的样本统计量。是估计是总体参数,若即满足无偏性。,)(E1)(limPn()为任意小的正数更有效。

25、则称的无偏估计量,而都是和若12221,21X经经数数学学证证明明, 是是 的的无无偏偏、一一致致且且有有效效的的估估计计量量。总体方差的无偏估计量为样本方差总体方差的无偏估计量为样本方差22()1xxSn点估计点估计完全正确的概率通常为完全正确的概率通常为0。因此,我们更多。因此,我们更多的是考虑用样本统计量去估计总体参数的范围的是考虑用样本统计量去估计总体参数的范围 区间估计区间估计。 1.误差率: or 2.估计精度:统计学 第6章 抽样推断 第三节 参数估计pPppp误差率误差率估计精度1XXxXx误差率 抽样推断的抽样推断的置信度置信度是表明样本指标和总体参数之间的误差不超过一定范围

26、的概率的概率保证程度。置信度一般用“1-a”表示。用公式表示为:统计学 第6章 抽样推断 第三节 参数估计例如,例如,“在95%置信度下,样本平均身高与总体平均身高的误差为5cm”表示在很多次抽样中,样本平均身高与总体平均身高相差小于5cm的抽样次数占总抽样次数的95%。 抽样推断的置信度是表明样本指标和总体参数之间的误差不超过一定范围的概率的概率保证程度。置信度一般用“1-”表示。 置信度与概率度的之间关系: 统计学 第6章 抽样推断 第三节 参数估计由定义可知: 同样,置信度可以通过正态分布概率表(P149)获得: 由此可见,抽样极限误差和估计的置信密度不抽样极限误差和估计的置信密度不可分

27、可分:极限误差范围越小,估计的置信度也越小;极限误差范围越大,估计的置信度也越大。统计学 第6章 抽样推断 第三节 参数估计统计学 第6章 抽样推断 第三节 参数估计均值是未知的总体总体随机样本随机样本我有 95% 的把握认为 在40和60之间。均值50X XX置信区间Confidence Interval样本统计量Sample Statistic置信边界 (下界)Lower Limit 置信边界 (上界) Upper Limit总体参数落在某区间内的概率总体参数落在某区间内的概率 1.区间估计的基本特点区间估计的基本特点 根据给定的置信度,利用实际抽样资料,指出总体参数可能存在的区间范围,这

28、个区间称为置信区间置信区间。用公式表示为: 统计学 第6章 抽样推断 第三节 参数估计式中:式中: 是总体平均数(或总体成数)区间的下限,是总体平均数(或总体成数)区间的下限, 是总体平均数(或总体成数)区间的上限是总体平均数(或总体成数)区间的上限 被估计总体参数 在区间 和 内的概率为1-a,即:其中 和 为置信区间。 统计学 第6章 抽样推断 第三节 参数估计2.区间估计必须具备的三个要素区间估计必须具备的三个要素(1)要有合适的统计量作为估计值估计值(2)要有合理的抽样误差范围抽样误差范围(3)要有一个可接受的置信度置信度统计学 第6章 抽样推断 第三节 参数估计1.1.根据给定的抽样

29、误差范围,估算概率保证程度根据给定的抽样误差范围,估算概率保证程度F(t)F(t)例题:例题:6.3-6.46.3-6.4(P152-153)P152-153)2.2.根据置信度根据置信度F(t)F(t)的要求,估计总体指标出现的可能的要求,估计总体指标出现的可能范围范围例题:例题:6.5-6.66.5-6.6(P153-153)P153-153)抽取样本,计算样本指标,推算抽样平均误差根据抽样极限误差范围,估计总体指标的上下限根据给定的抽样极限误差求出概率度值;计算概率保证程度F(t),并对总体参数做区间估计抽取样本,计算样本指标,推算抽样平均误差根据给定的概率保证程度F(t),查表求出概率

30、度值;推算抽样极限误差的可能范围,计算被估计总体指标的上下限,并对总体参数做区间估计一、抽样调查的组织原则二、常用的抽样组织方式统计学 第6章 抽样推断 第四节 抽样组织设计本章目录1.1.要保证抽样的随机性要保证抽样的随机性 抽取样本单位时,应确保每个总体单位都有被抽取的可能;在对样本单位的资料进行搜集和整理时,不能随意遗漏或更换样本单位。2.2.要选取适当的样本容量要选取适当的样本容量3.3.要努力兼顾抽样误差和抽样效果的要求要努力兼顾抽样误差和抽样效果的要求 在其他条件相同的情况下,选抽样误差最小的方案。4.4.费用最少费用最少 在其他条件相同的情况下,选费用最少的方案。统计学 第6章

31、抽样推断 第四节 抽样组织设计(一)简单随机抽样(二)类型抽样(三)等距抽样(四)整群抽样(五)多阶段抽样统计学 第6章 抽样推断 第四节 抽样组织设计统计学 第6章 抽样推断 第四节 抽样组织设计1.1.简单随机抽样(纯随机抽样)的含义简单随机抽样(纯随机抽样)的含义直接抽样法直接抽样法抽签法抽签法随机数字法随机数字法优点:优点:(1)操作简单,无须分组、分类、排队等处理;(2)在理论上最符合随机的原则,是其他抽样方式的基础缺点缺点:在实践中会受到限制,当总体各单位标志值之间差异很大时,采用此方法不能保证样本的代表性组织抽样调查的一项重要工作就是确定合适的样本容量在进行抽样推断设计时,先根据

32、研究问题的性质确定允许的误差范围和必要的概率保证程度F(t)(或概率度t),并根据总体的标准差 通过抽样平均误差的公式来计算必要的样本单位数n。简单随机抽样下样本容量的确定:简单随机抽样下样本容量的确定:统计学 第6章 抽样推断 第四节 抽样的组织形式nx)1(2Nnnx同理,重复抽样和不重复抽样的成数样本必要单位数分别为:5.5.应用上述公式计算样本容量应注意的问题:应用上述公式计算样本容量应注意的问题:上述公式计算的n是最低的,也是最必要的样本容量;一般总体方差是未知的,在实际计算时往往用有关资料代替;如果进行一次抽样调查,同时对总体平均数和总体成数进行区间估计,运用上述公式计算的 和 一

33、般不等,为了同时满足两个推断的要求,一般在两个样本容量中选择较大的一个;上面公式计算的n不一定是整数,如果带小数,一般不采用四舍五入的办法化成整数,而是用比这个数大的临近整数代替。例例6.7-6.8 P1576.7-6.8 P157xnpn统计学 第6章 抽样推断 第四节 抽样的组织形式 ( (二二) )类型抽样(分层抽样或分类抽样)类型抽样(分层抽样或分类抽样) 先将总体全部单位按某一标志分类,先将总体全部单位按某一标志分类,形成若干个类型组,然后从各类型中按随机原形成若干个类型组,然后从各类型中按随机原则分别抽取若干个样本单位,由各类型的样本则分别抽取若干个样本单位,由各类型的样本单位组成

34、样本。单位组成样本。总体总体N样本样本n等额分配等额分配等比例分配等比例分配最佳分配最佳分配2NkN1N1n2nkn经济分配经济分配各组样本单位数与样本容量之比等于各组总体单位数与全部各组样本单位数与样本容量之比等于各组总体单位数与全部总体单位数之比:总体单位数之比:各组的样本单位数为:各组的样本单位数为:类型抽样的误差仅与组内方差有关,而与组间方差无关,抽类型抽样的误差仅与组内方差有关,而与组间方差无关,抽样平均误差取决于各组内方差的平均水平。样平均误差取决于各组内方差的平均水平。分组标志的选择:分组标志的选择:一定是与研究目的有关的标志类型抽样是将分组法和随机原则相结合类型抽样是将分组法和

35、随机原则相结合类型抽样的优点类型抽样的优点: :它提高了样本的代表性它降低了总方差对抽样误差的影响类型抽样可以是重复抽样也可以是不重复抽样类型抽样可以是重复抽样也可以是不重复抽样类型抽样的样本平均数的计算:类型抽样的样本平均数的计算:在各组分别取样,计算各组抽样平均数在各组分别取样,计算各组抽样平均数 求样本平均数求样本平均数类型抽样的抽样平均误差的计算:类型抽样的抽样平均误差的计算:计算各组内方差计算各组内方差 计算各组内方差的平均数计算各组内方差的平均数3.3.计算抽样平均误差计算抽样平均误差(1 1)重复抽样)重复抽样(2 2)不重复抽样)不重复抽样类型比例抽样的必要抽样数目的确定:类型

36、比例抽样的必要抽样数目的确定:重复抽样条件下:重复抽样条件下: 或不重复抽样条件下:不重复抽样条件下: 或例例6.9 P1596.9 P159例:某乡粮食播种面积20000亩,现在按平原和山区面积比例抽取其中2%,计算各组平均亩产和各组亩产标准差,如下表所示:要求:样本平均亩产和抽样平均误差 以95.45%的概率估计某乡粮食平均亩产的可能范围重复抽样:不重复抽样:重复抽样:不重复抽样:(公斤)497400350120560280nxnxii(公斤)11230400150120802802222nniii(公斤)3 . 5400112302nix(公斤)25. 52000040014001123

37、012Nnnix 2%45.95ttF(公斤)6 .103 . 52xxt(公斤)5 .1025. 52xxt6 .5076 .104974 .4866 .10497xxxx5 .5075 .104975 .4865 .10497xxxx( (三三) ) 等距抽样(机械抽样或系统抽样)等距抽样(机械抽样或系统抽样)1.1.定义定义: 先按某一标志对总体各单位按顺序进行排队,然后按相等的距离或间隔来抽取样本单位。等距抽样是不重复抽样,适合于对单位数不等距抽样是不重复抽样,适合于对单位数不多且能进行排序的总体抽样。多且能进行排序的总体抽样。( (三三) ) 等距抽样(机械抽样或系统抽样)等距抽样(

38、机械抽样或系统抽样)2.2.等距抽样分类:等距抽样分类:按排队所依据的标志不同按排队所依据的标志不同,分为按有关标志排队和按无关标志排队。按样本单位抽选的方法不同按样本单位抽选的方法不同,分为:随机起点等距抽样、半距中点等距抽样和对称等距抽样。总体单位的排列顺序和所研究的标志总体单位的排列顺序和所研究的标志数值大小是无关的。如数值大小是无关的。如调查居民生活调查居民生活水平时,按姓氏笔划排队。水平时,按姓氏笔划排队。总体单位的排列顺序和所研究的标志总体单位的排列顺序和所研究的标志数值大小有密切关系。如数值大小有密切关系。如居民收入调居民收入调查,按银行存款高低排序。查,按银行存款高低排序。当抽

39、样间隔d(=N/n)确定以后,在第一组随机抽选第一个样本单位,设顺序号为a,则第二个样本单位的顺序号为d+a,其余类推,第n个样本单位的顺序号为(n-1)d+a。注:注:当总体按无关标志排队时,随机起点等距抽样是可以应用的;当总体按有关标志排队时,随机起点等距抽样会产生系统性误差。半距中点等距抽样半距中点等距抽样这种抽样方法要求各样本单位都选在各组的中点,各样本单位的顺序号是:第一个样本单位是d/2,第二个样本单位是d+d/2,第n各样本单位是(n-1)d+d/2。注:注:无论按有关标志排队还是按无关标志排队,都可以采用这种方法。半距中点等距抽样的优缺点半距中点等距抽样的优缺点优点:简单易懂,

40、易于实践缺点:随机性不明显只能抽取一个样本,不能进行样本轮换,因此,抽样框的利用率太低对称等距抽样对称等距抽样这种抽样方法要求在第一组随机抽取第一个样本单位,假设该单位的序号为a;在第二组与第一个样本单位对称的位置抽取第二个样本单位,它的序号为2d-a;在第三组与第二个样本单位对称的位置抽取第三个样本单位,它的序号为2d+a。以后抽取的样本单位序号依次为4d-a,4d+a,6d-a,6d+a。注:注:这种方法保留了半距起点等距抽样的优点,而且又避免了它的局限性,使其优点更加明显。 (总体单位按某一标志排序)(总体单位按某一标志排序)(总体单位按某一标志排序)(总体单位按某一标志排序)(总体单位按某一标志排序)(总体单位按某一标志排序)()(NnnPPNnnpx1)1 (12( (四四) )整群抽样(集团抽样)整群抽样(集团抽样)hlpdnnnnnABCDEFGHIJKLMNOPLHPD样本容量样本容量统计学 第6章 抽样推断 第四节 抽样组织设计(1)群与群之间不重叠,即总体中的任一单位只能属于某个群。(2)全部总体单位毫无遗漏,即总体内的任一单位必属于某个群。总体中各群内所包含的单位数可以相同,也可以不同。设将总体的全部单位N划分为R群

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论