华农统计学原理第四章课件_第1页
华农统计学原理第四章课件_第2页
华农统计学原理第四章课件_第3页
华农统计学原理第四章课件_第4页
华农统计学原理第四章课件_第5页
已阅读5页,还剩80页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章抽样调查第一节抽样调查的基本问题第二节抽样误差第三节参数估计第四节抽样调查的组织形式

第一节抽样调查的基本问题一)抽样调查的意义二)抽样调查的应用三)抽样调查的几个基本概念四)抽样推断的理论基础统计推断的过程样本总体样本统计量例如:样本均值、比例、方差总体均值、比例、方差一)抽样调查的意义(一)抽样调查的概念:

抽样调查是按随机原则从全部研究对象中抽取部分单位进行观察,并根据样本的实际数据对总体的数量特征作出具有一定可靠程度的估计和判断。

抽样调查可分为两种:非随机抽样和随机抽样.主要讨论随机抽样调查.

(二)抽样调查的特点

1.和全面调查相比较,抽样调查能节省人力,费用和时间面且比较灵活.

3.抽样调查要建立在随机取样的基础上。

2.有些情况下,抽样调查的结果比全面调查要准确.

4.抽样推断的误差可以事先计算并加以控制。二)抽样调查的应用(1)应用抽样法可以完成其他方式不能完成的调查任务.

A:对无限总体不可能进行全面调查。B:有些现象总体范围过大,单位分布又过于分散,很难或不必要进行全面调查。C:对于产品或商品具有破坏性的质量检验也不能进行全面调查。D:对那些资料要求紧迫,需以较短时间,迅速了解总体全面情况时,也可用抽样法。(2)应用抽样法可对全面调查的结果加以检验和修正

A:许多社会经济现象虽然可以全面调查,但同时开展抽样调查,把两者结合起来应用也具有重要的意义。B:全面调查不论是一次性普查,还是经常性统计报表制度,由于范围广、工作量大,参加人员多,就较多地存在发生登记性和计算性误差的可能。在全面调查后,随即抽取一部分单位重新再调查一次,将这些单位两次调查的资料进行对照、比较,计算其差错比率,并以此为依据对全面调查的资料加以修正,这样就可以进一步提高全面调查资料的准确性。C:另外,由于抽样调查范围小,可以根据需要增加一些调查项目,以便进行某项更深入的研究,以补充全面调查的不足。(3)应用抽样法可对总体进行假设检验.(4)应用抽样法可对生产过程中产品质量进行检查和控制.抽样调查不但广泛用于生产结果的核算和估计,而且也有效地应用于对成批或大量连续生产的工业产品在生产过程中进行质量控制,观察生产工艺过程是否正常,是否存在某些系统性的偏误,及时提供有关信息,分析可能的原因,便于采取措施,防止损失。三)抽样调查的几个基本概念

1)总体与样本(1)总体:抽样调查所要认识对象的全体,也叫母体,简称总体,它是具有某种共同性质或特征的许多单位的集合体。全及总体的单位数通常用N来表示,N总是很大的数。(2)样本:又叫子样或样本总体,简称样本。它是从全及总体中随机抽取出来,代表全及总体的那部分单位的集合体。样本总体的单位数称为样本容量,通常用n表示,相对N来说,n是很小的数,它可以是N的几十分之一、几百分之一、几千分之一、几万分之一。(一般来说,样本单位数达到或超过30个称为大样本,而在30个以下称为小样本。社会经济现象的抽样调查多取大样本)

2)参数和统计量

(一)参数又称总体指标,或全及指标.根据全及总体各个单位的标志值或标志属性计算的,反映总体某种属性或特征的综合指标。常用的全及指标有总体平均数(或总体成数)、总体标准差(或总体方差)。总体平均数:

总体方差:

总体标准差:

设总体中具有某一标志的单位数为则总体成数为:

总体成数的方差为:

(二)统计量又称样本指标或抽样指标,由样本各单位标志值计算出来反映样本特征,用来估计全及指标的综合指标(抽样指标)。统计量是样本变量的函数,用来估计总体参数,因此与总体参数相对应,统计量有样本平均数(或抽样成数)、样本标准差(或样本方差)。样本平均数:

样本方差:

样本标准差:

样本成数:

样本成数的方差:

对于一个问题总体是唯一确定的,所以总体指标也是唯一确定的,总体指标也称为参数,它是待估计的数。而统计量则是随机变量,它的取值随样本的不同而发生变化。常用的参数和统计量:参数:总体平均数总体成数P总体标准差总体方差统计量:样本平均数样本成数p样本标准差s样本方差(三)抽样方法

(1)重置抽样

也称重复抽样、放回抽样。它是指从总体N个单位中随机抽取容量为n的样本时,每次从总体中抽取一个单位,把结果登记下来后,重新返回,再从全及总体中抽取下一个样本单位。在这种抽样方式中,同一单位可能有多次被重复抽取的机会。(2)不重置抽样

也称不重复抽样、不放回抽样。它是指从总体N个单位中随机抽取容量为n的样本时,每次从总体中抽取一个单位,不再放回去,下一次则从剩下的总体单位中继续进行抽取,如此反复构成一个样本,就是说,每个总体单位只能被抽取一次,所以从总体中每抽取一次,总体就少一个单位,因此,先后抽出来的各个单位被抽中机会是不相等的。

(四)抽样框又称抽样结构,是指对可以选择作为样本的总体单位列出名册或排序编号,以确定总体的抽样范围和结构.(五)样本可能数目也称样本的可能数目,是指从总体N个单位中随机抽选取n个单位构成样本,通常有多种抽选方法,每一种抽选方法实际是n个总体单位的一种排列组合,这个组合数即称为样本的可能数目.四)抽样推断的理论基础1)大数定律,是关于大量随机现象具有稳定性质的法则。它说明如果被研究的总体是由大量的相互独立的随机因素所构成,而且每个因素对总体的影响都相对的小,那么,对这些大量因素加以综合平均的结果,因素的个别影响将相互抵消,而呈现出它们共同作用的倾向,使总体具有稳定的性质。大数法则的意义:现象的某种规律性,只有当具有这种现象的足够多数的单位综合汇总在一起的时候,才能显示出来。因此,只有从大量现象的总体中,才能研究这些现象的规律性。现象总体的规律性,通常是以平均数的形式表现出来。当所研究的现象总体包含的单位越多,平均数也就越能够正确地反映出这些现象的规律性。各单位的共同倾向(表现为主要的、基本的因素)决定着平均数的水平,而各单位对平均数的离差(表现为次要的、偶然的因素)则会由于足够多数单位的综合汇总的结果,而相互抵消,趋于消失。2)中心极限定理是研究变量和的分布序列的极限原理。论证:如果总体变量存在有限的平均数和方差,那么不论这个总体变量的分布如何,随着抽样单位数的增加,抽样平均数的分布便趋近于正态分布。这个结论对于抽烟推断是十分重要的,因为在经济现象中变量和的分布是普遍存在的。例如,城市用电量是千家万户用电量总和的分布;产品标准规格的偏差是许多独立因素之和的分布等。根据中心极限定理,我们有理由相信,这些分布都趋近于正态。在现实生活中,一个随机变量服从于正态分布未必很多,但多个随机变量和的分布趋近于正态分布则是普遍存在的。抽样平均数也是一种随机变量和的分布,因此,在抽样单位数充分大的条件下,抽样平均数也趋近于正态分布,这为抽样误差的概率估计提供了一个极为有效而方便的条件。正态分布正态分布是统计学中最重要的分布。这一分布是由阿伯拉罕·德莫弗于1733年首先发表。其他几位数学家如皮埃尔·西蒙、拉普拉斯、高斯等进一步发展,为纪念高斯,正态分布也称为高斯分布或常态分布。作用:正态分布是一种最常见的分布。许多变量的分布是正态的或近似于正态分布的。只要某一随机变量是大量相互独立的偶然因素的和,而且每个因素的个别影响几乎是同样地小,那么就可以断定这个随机变量服从于或近似地服从于正态分布。各种统计量(如平均值)的分布,对于大样本来说,是正态的或近似于正态的,即使它们所取的总体不是正态的也是如此。对于充分大的样本,正态分布也是一些其他分布的极好近似。正态分布的概率密度函数:正态分布曲线是钟型曲线,是一个对于平均值µ对称的分布,µ的任何一侧曲线均为另一侧曲线的镜像,当x

时,以x轴为其渐进线。平均数、中位数与众数三者相等;曲线位于x轴上方,即正态密度函数处处为正;曲线与x轴所包围的面积为1,由于正态曲线的对称性,若由平均值处引x轴的垂线,则其左右两侧面积各占总面积的50%;

如在平均值两侧离平均值三个标准差处引x轴的两条垂线,所形成的相应面积约等于总面积的99.73%;

如在平均值两侧离平均值两个标准差处引x轴的两条垂线,则这两条垂线与x轴与正态曲线所围的面积约等于总面积的95.45%;如在平均值两侧离平均值一个标准差处引x轴的两条垂线,则这两条垂线与x轴与正态曲线所围的面积约等于总面积的68.27%;2µ68.27%99.73%95.45%1µ3µ-1µ-2µ-3µ正态分布的重要特征标准正态分布正态分布是一个分布族,其中一个成员与另一个成员按不同的µ值和值来区别。这一分布族中最重要的成员是平均值为0和标准差为1的正态分布,被称为标准正态分布N(0,1).概率密度函数可以通过以下公式将正态分布N(0,1)变换为标准正态分布:

使用此公式把原分布中任意x值变换为标准正态分布中相应的Z值,由Z值利用标准正态分布表,可以求出与原计量值集合有关的概率。

第二节抽样误差一)抽样误差的概念二)抽样平均误差的意义三)抽样平均误差的计算四)抽样极限误差五)抽样估计的可靠程度调查误差调查误差登记性误差代表性误差系统偏差随机误差一)抽样误差的概念

由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起抽样指标和全及指标之间的绝对离差。抽样误差的概念 抽样误差是指样本指标与总体指标之间的离差。具体地讲,就是样本平均数与总体平均数的离差(即),或样本成数与总体成数的离差(即)。

抽样误差,就是按随机原则抽样,所得抽样指标和总体指标的差额,包括:抽样平均数与总体平均数的差额

抽样成数与总体成数的差额1、抽样误差是指由于抽样的随机性而产生的那一部分误差,不包括调查误差,也不包括可能发生的偏差。理解抽样误差有两个要点:2、随机误差有两种:实际误差和平均误差。总体的差异程度样本容量抽样方法抽样的组织形式总体标准差与平均误差成正比样本单位数与平均误差成反比重复抽样的平均误差大于不重复抽样的平均误差类型抽样的平均误差较小影响抽样误差的因素二)抽样平均误差的意义概念:是指所有可能出现的样本指标的标准差,也就是所有可能出现的样本指标和总体指标的平均离差。意义:由于抽样误差把所有可能的抽样指标与全及指标之间所存在的抽样误差的所有结果都考虑进去,概括地反映了整个抽样过程中一切可能结果的误差,表明抽样平均数(或成数)与总体平均数(或成数)的平均误差程度,因此,它既可以作为衡量抽样指标对于全及指标代表程度的一种尺度,又是计算抽样指标与全及指标之间变异范围的主要依据;同时,在组织抽样调查中,也是确定抽样单位数多少的计算依据之一。

抽样平均误差1、概念:抽样平均误差是抽样平均数或抽样成数的标准差。反映了抽样平均数与总体平均数抽样成数与总体成数的平均误差程度。2、计算方法:(一)抽样平均数的平均误差(二)抽样成数平均误差三)抽样平均误差的计算样本指标有平均指标和成数两种。因此,抽样误差也有两种:(一)平均指标抽样误差的计算:1、重复抽样的计算公式

2、不重复抽样的计算公式例题一:随机抽选某校学生100人,调查他们的体重。得到他们的平均体重为58公斤,标准差为10公斤。问抽样推断的平均误差是多少?例题二:某厂生产一种新型灯泡共2000只,随机抽出400只作耐用时间试验,测试结果平均使用寿命为4800小时,样本标准差为300小时,求抽样推断的平均误差?例题一解:即:当根据样本学生的平均体重估计全部学生的平均体重时,抽样平均误差为1公斤。例题二解:计算结果表明:根据部分产品推断全部产品的平均使用寿命时,采用不重复抽样比重复抽样的平均误差要小。已知:则:已知:则:(二)总体成数的抽样平均误差采用重复抽样:采用不重复抽样:例题三:

某校随机抽选400名学生,发现戴眼镜的学生有80人。根据样本资料推断全部学生中戴眼镜的学生所占比重时,抽样误差为多大?例题四:一批食品罐头共60000桶,随机抽查300桶,发现有6桶不合格,求合格品率的抽样平均误差?例题三解:已知:则:样本成数即:根据样本资料推断全部学生中戴眼镜的学生所占的比重时,推断的平均误差为2%。例题四解:已知:则:样本合格率计算结果表明:不重复抽样的平均误差小于重复抽样,但是“N”的数值越大,则两种方法计算的抽样平均误差就越接近。[例]从某厂生产的10000件产品中,随机抽取1000件进行调查,测得有85件为不合格。试求产品合格率的抽样平均误差。 解:根据条件可知,合格率P==91.5%1.在重复抽样条件下==0.88%2.在不重复抽样条件下=四)抽样极限误差含义:抽样极限误差指在进行抽样估计时,根据研究对象的变异程度和分析任务的要求所确定的样本指标与总体指标之间可允许的最大误差范围。计算方法:它等于样本指标可允许变动的上限或下限与总体指标之差的绝对值。=Δp│p-P│p-Δ≤P≤p+Δpp抽样平均数极限误差:抽样成数极限误差:≤≤五)抽样估计的可靠程度含义:抽样误差的概率度是测量抽样估计可靠程度的一个参数。用符号“t”表示。公式表示:

t=

Δμ

Δ=tμ(t是极限误差与抽样平均误差的比值)(极限误差是t倍的抽样平均误差)上式可变形为:

抽样估计的概率度是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。由于抽样指标值随着样本的变动而变动,它本身是一个随机变量,因而抽样指标和总体指标的误差仍然是一个随机变量,并不能保证误差不超过一定范围这个事件是必然事件,而只能给以一定程度的概率保证。因此,就有必要来计算抽样指标和总体指标的误差不超过一定范围的概率大小,即计算抽样指标落在一定区间范围内的概率,这种概率称之为抽样估计的概率度。

根据计算极限误差的基本公式概率度t的大小根据对推断结果要求的把握程度来确定,即根据概率保证程度的大小来确定。概率论和数理统计证明,概率度t与概率保证程度F(t)之间存在着一定的函数关系,给定不同的t值,就可以计算出F(t)来,相反,给出一定的概率保证程度F(t),则可以根据总体的分布,获得对应的t值。在实际应用中,因为我们所研究的总体大部分为正态总体,对于正态总体而言,为了应用的方便编有“正态分布概率表”供使用时查值。根据“正态分布概率表”,已知概率度t可查得相应的概率保证程度F(t);相反,已知概率保证程度F(t)也可查得相应的概率度t。现将几个常用的对应数值列于下表。常用概率度与概率保证度表

概率度t概率F(t)(%)1.002.003.001.641.962.5868.2795.4599.7390.0095.0099.00[例]对一批某型号的电子元件进行耐用性能检查,按重复随机抽样的资料分组列表如下,要求估计耐用时数的允许误差范围=10.5小时,是估计该批电子元件的平均耐用时数。表耐用时数组中值抽样检查结果(只)900以下900—950950—10001000—10501050—11001100—11501150—12001200以上875925975102510751125117512251263543931合计—100第一步,计算,s,:第二步,根据给定的=10.5小时,计算总体平均数的上下限: 下限==1055.5–10.5=1045(小时) 上限==1055.5+10.5=1066(小时)

第三步,根据,查正态分布概率表得概率F(t)=95.66%。推断的结论是:以95.66%的概率保证程度,估计该批电子元件的耐用时数在1045—1066小时之间。样本指标的抽样分布

约有68.27%处在平均值约有95.45%处在平均值约有99.73%处在平均值

68.27%95.45%99.73%1µ2µ3µ-1µ-2µ-3µ的全部数值中,即,在的一个标准偏差范围之内;的两个标准偏差范围之内;的三个标准偏差范围之内。

第三节参数估计一)点估计的优良标准二)总体参数的估计方法三)样本容量的确定

参数估计的一般问题(一)参数估计(parameterestimation)就是用样本统计量去估计总体的参数。估计量:用于估计总体参数的随机变量如样本均值、样本比率、样本方差等样本均值就是总体均值的一个估计量参数用表示,估计量用表示估计值:估计参数时计算出来的统计量的具体值如果样本均值

x=5600,则5600就是总体均值的估计值

参数估计的方法矩估计法最小二乘法最大似然法顺序统计量法估计方法点估计区间估计一)点估计的优良标准

1.无偏性:估计量抽样分布的数学期望等于被估计的总体参数。P(

)BA无偏有偏图有偏和无偏估计量的例子

2.一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数。AB较小的样本容量较大的样本容量P(

)图两个不同容量样本统计量的抽样分布

3.有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效。AB

的抽样分布

的抽样分布P(

)图两个无偏点估计量的抽样分布(一)点估计

用样本的估计量直接作为总体参数的估计值例如:用样本均值直接作为总体均值的估计例如:用两个样本均值之差直接作为总体均值之差的估计2. 没有给出估计值接近总体参数程度的信息点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等二)总体参数估计的方法

例:某灯泡厂采用新技术生产,需要了解这种灯泡的使用寿命,现随机抽取4只灯泡,测得使用寿命分别是:1502,1455,1342,1673.试估计灯泡的平均寿命和标准差.解:样本的平均数是样本标准差是

故:灯泡寿命的平均值的标准差分别是:

(二)区间估计基本特点:是根据给定的概率保证程度的要求,利用实际抽样资料,指出总体被估计值的上限和下限,即指出总体参数可能存在的区间范围,而不是直接给出总体参数的估计值。

方法:x落在区间

内概率是,为总体指标X的置信区间估计置信度—置信下限——置信上限

具备要素:估计值、抽样误差范围、概率保证程度

方法:根据给定条件而定

根据已给定的置信度,求抽样区间估计。具体步骤是:第一步,抽取样本,计算抽样指标,即计算样本平均数和抽样成数p,作为总体指标的估计值,并计算样本标准差s以推算抽样平均误差。第二步,根据给定的置信度F(t)的要求,查正态分布概率表求得概率度t值。第三步,根据概率度t和抽样平均误差推算抽样极限误差,并根据抽样极限误差求出被估计总体指标的上下限。

区间估计的计算方法

1)计算出样本的平均值样本方差及成数2)用公式计算

3)计算出允许误差

4)确定估计区间1)总体均值的区间估计

1. 假定条件总体服从正态分布,且方差(

2)

已知如果不是正态分布,可由正态分布来近似(n30)使用正态分布统计量Z总体均值

在1-

置信水平下的置信区间为[例]对我国某城市进行居民家庭人均旅游消费支出调查,随机抽取400户居民家庭,调查得知居民家庭人均年旅游消费支出为350元,标准差为100元,要求以95%的概率保证程度,估计该市人均年旅游消费支出额。第一步,根据抽样资料已算得:样本每户年人均消费支出=350(元)样本标准差=100(元)(元)第二步,根据给定的概率保证程度F(t)=95%,查得正态分布概率表得t=1.96。第三步,计算(元)则该市居民家庭年人均旅游消费支出额:下限=

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论