第5章 抽样推断_第1页
第5章 抽样推断_第2页
第5章 抽样推断_第3页
第5章 抽样推断_第4页
第5章 抽样推断_第5页
已阅读5页,还剩143页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第6章统计抽样与参数估计★第一节

抽样推断第二节

抽样误差第三节

参数估计的基本方法第四节抽样组织的设计第一节

抽样推断一、抽样推断的意义和一般步骤二、总体参数与样本统计量三、抽样框与样本数四、概率抽样与非概率抽样★一、抽样推断的意义和一般步骤㈠抽样推断的定义㈡抽样推断的特点㈢抽样推断的运用㈣抽样推断的一般步骤抽样调查研究

SamplingStudy为什么要抽样?

1.

涉及破坏受试对象质量控制2.取得精确可靠的结果3.实际情况的约束时间,成本等(化验)指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等的被抽中机会抽样推断按照随机原则

从调查对象中抽取一部分单位进行调查,并以调查结果对总体数量特征作出具有一定可靠程度的估计与推断,从而认识总体的一种统计方法你不必吃完整一头牛,才知道它的肉是咬不动的。

SamelJohnson统计推断涉及总体指标:参数(未知量)样本总体指标:统计量(已知量)抽样推断并非所有的抽样估计都按随机原则抽取样本,也有非随机抽样总体随机样本非随机样本与总体分布特征相同与总体分布特征不同按随机原则抽取样本单位目的是推断总体的数量特征抽样推断的结果具有一定的可靠程度,抽样误差可以事先计算并控制抽样推断的特点不可能进行全面调查时不必要进行全面调查时来不及进行全面调查时对全面调查资料进行补充修正时抽样推断的应用设计抽样方案抽取样本单位收集样本数据计算样本统计量推断总体参数抽样推断的一般步骤第一节

抽样推断一、抽样推断的意义和一般步骤二、总体参数与样本统计量三、抽样框与样本数四、概率抽样与非概率抽样★★二、总体参数和样本估计量㈠总体和样本㈡总体参数和样本统计量

总体(population)全及总体简称总体,是指所要认识对象的全体。全及总体的单位数用N表示,即使是有限总体,N一般也都是很大的。样本(sample)样本总体简称样本。是从全及总体中随机抽取出来,代表全及总体的部分单位的集合体。样本总体的单位数通常用n表示,对于N来说,n是很小的。

一般来说,样本单位数达到或超过30个称为大样本,30个以下称为小样本。社会经济调查一般为大样本。以很小的样本来推断很大的总体,这是抽样推断的特点之一。

把n/N叫做抽样比例。

全及总体是唯一确定的。而一个总体中可能抽取很多个抽样的样本。样本概念的二重性:一般的讨论样本时,样本应理解为n维随机变量;在一次具体容量为n的抽样中,则样本是n维随机变量的一个观察值。某个样本容量的抽样分布更大样本容量的抽样分布设总体中个总体单位某项标志的标志值分别为,其中具有某种属性的有个单位,不具有某种属性的有个单位,则⒈总体平均数(又叫总体均值):指被估计的总体指标,又被称为全及指标总体参数⒉总体单位标志值的标准差:⒊总体单位标志值的方差:⒋总体成数:⒌总体是非标志的标准差:⒍总体是非标志的方差:设样本中个样本单位某项标志的标志值分别为,其中具有和不具有某种属性的样本单位数目分别为和个,则⒈样本平均数(又叫样本均值):指根据样本单位的标志值计算的用以估计和推断相应总体指标的综合指标,又被称为估计量或统计量样本估计量⒉样本单位标志值的标准差:⒊样本单位标志值的方差:为自由度为的无偏估计为的无偏估计⒋样本成数:⒌样本单位是非标志的标准差:⒍样本单位是非标志的方差:为的无偏估计为的无偏估计

总体参数

样本统计量名称符号名称符号总体容量样本容量总体平均数样本平均数总体方差样本方差总体标准差样本标准差总体比例样本比例第一节

抽样推断一、抽样推断的意义和一般步骤二、总体参数与样本统计量三、抽样框与样本数四、概率抽样与非概率抽样★★★㈠抽样框㈡抽样方法㈢抽样组织方式㈣样本数和样本容量三、抽样框与样本数㈠随机原则——抽取样本单位时,应确保每个总体单位都有被抽取的可能;在对样本单位的资料进行搜集和整理时,不能随意遗漏或更换样本单位㈡抽样误差最小——在其他条件相同的情况下,选抽样误差最小的方案㈢费用最少——在其他条件相同的情况下,选费用最少的方案设计抽样方案时,通常是在误差达到一定要求的条件下,选择费用最少的方案抽样方案设计的基本准则抽样框指包括全部抽样单位的名单框架,仅对有限总体而言主要形式名单抽样框区域抽样框时间表抽样框编制抽样框列出全部总体单位名录的一览表。如职工或企业名单等。可采用抽签方式或随机数字表进行抽选样本的单位。名单抽样框序号学号姓名10711210101张晓20711210102李敏30711210103童星40711210104牛虎50711210105陈杨60711210107宋安70711210108楚生80711210109孔凯………区域抽样框在商场的大门口在微波炉柜台前在市区街道旁边在某个住宅小区和平区、河西区…

南开区

八里台街、新兴路街…

学府街

平湖里、风湖里…

照湖里居民一组居民二组…某外国公司在天津进行微波炉市场调查:时间表抽样框连续出产的产品总体可以编制抽样框:均匀的出产时间、可以预见到的产品总量。连续到加油站加油的汽车总体无法编制抽样框:时间不定、总量也无法确定。抽样方法重复抽样又被称作重置抽样、有放回抽样抽出个体登记特征放回总体继续抽取特点同一总体单位有可能被重复抽中,而且每次抽取都是独立进行不重复抽样又被称作不重置抽样、不放回抽样抽出个体登记特征继续抽取特点同一总体中每个单位被抽中的机会并不均等,在连续抽取时,每次抽取都不是独立进行

是最为常用的抽样方法,用于无限总体和许多有限总体样本单位的抽样。样本数样本数又称样本的可能数目,在考虑顺序的抽样条件下,从总体N中随机抽取n个样本单位共有多少种可能的抽选结果。例如:从A、B、C、D四个单位中,抽出两个单位构成一个样本,则可供选择的样本可以简单列举如下:

AAABACADBABBBCBDCACBCCCDDADBDCDD⒈重复抽样的可能样本数目:⒉不重复抽样的可能样本数目:共n个第一节

抽样推断一、抽样推断的意义和一般步骤二、总体参数与样本统计量三、抽样框与样本数四、概率抽样与非概率抽样★★★★概率抽样按照概率的随机原则抽取样本,称为概率抽样,得到的样本称为随机样本。基本的概率抽样方式有:简单随机抽样、分层抽样、等距抽样和整群抽样。从理论上说,概率抽样是最理想最科学的抽样方法,能保证样本数据对总体参数的代表性,而且能够将抽样误差限制在一定范围之内。相对来说,也是花费较大的抽样方式。简单随机抽样

(simplerandomsampling)从总体N个单位(元素)中随机地抽取n个单位作为样本,使得总体中每一个元素都有相同的机会(概率)被抽中抽取元素的具体方法有重复抽样和不重复抽样特点简单、直观,在抽样框完整时,可直接从中抽取样本用样本统计量对目标量进行估计比较方便局限性当N很大时,不易构造抽样框抽出的单位很分散,给实施调查增加了困难没有利用其他辅助信息以提高估计的效率分层抽样

(stratifiedsampling)将总体单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本优点保证样本的结构与总体的结构比较相近,从而提高估计的精度组织实施调查方便既可以对总体参数进行估计,也可以对各层的目标量进行估计系统抽样

(systematicsampling)将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k等单位优点:操作简便,可提高估计的精度缺点:对估计量方差的估计比较困难整群抽样

(clustersampling)将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查特点抽样时只需群的抽样框,可简化工作量调查的地点相对集中,节省调查费用,方便调查的实施缺点是估计的精度较差多阶段抽样

(multi-stagesampling)先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查群是初级抽样单位,第二阶段抽取的是最终抽样单位。将该方法推广,使抽样的段数增多,就称为多阶段抽样具有整群抽样的优点,保证样本相对集中,节约调查费用需要包含所有低阶段抽样单位的抽样框;同时由于实行了再抽样,使调查单位在更广泛的范围内展开在大规模的抽样调查中,经常被采用的方法

非概率抽样也叫做非随机抽样。是根据调查者的经验或判断,从总体中有意识的抽取若干单位构成样本。重点调查、典型调查、配额调查、方便调查等都属于非随机抽样。

大多数种类的研究,如产品测试、街头访问、电话调查、座谈会等,只要不是属于要进行总体数量推论的项目都可以使用。容易产生倾向性误差,且不能计算和控制抽样误差,无法说明调查结果的可靠程度。第5章统计抽样与参数估计★第一节

抽样推断第二节

抽样误差第三节

参数估计的基本方法第四节抽样组织的设计★第二节

抽样误差★一、抽样误差的概念二、影响抽样误差的因素三、抽样平均误差四、抽样极限误差、抽样估计的概率度、精度和可靠程度统计误差统计调查中的两类误差:一类是调查误差——各种调查方式中都可能出现。指在调查过程中由于观察、测量、登记、计算上的差错而引起的误差。又称为登记性误差。一类是代表性误差——指在抽样调查过程中用样本推断总体指标时可能产生的误差,是样本对于总体代表性引起的误差。代表性误差的两种情况:系统性偏误——由于违反随机原则而产生的系统性误差。随机性误差——按随机原则抽样时,不同抽样所得到的不同抽样指标值与总体参数之间的差异,具有随机性和偶然性,是抽样调查本身不可避免的误差。但这种随机性误差可利用大数定律精确的计算并通过抽样设计加以控制。说明对于任何一个样本,其抽样误差都不可能测量出来抽样误差的大小可以依据概率分布理论加以说明指样本估计量与总体参数之间数量上的差异,仅指由于按照随机原则抽取样本而产生的代表性误差,不包括登记性误差和系统偏差抽样误差常见的抽样误差抽样平均数与总体平均数之差抽样成数与总体成数之差第二节

抽样误差★一、抽样误差的概念二、影响抽样误差的因素三、抽样平均误差四、抽样极限误差、抽样估计的概率度、精度和可靠程度★影响抽样误差的因素1、总体各单位标志值的差异程度2、样本单位数的多少

3、抽样方法4、抽样组织方式越大,抽样误差越大;n越大,抽样误差越小;

不重复抽样的抽样误差比重复抽样的抽样误差小;简单随机抽样的误差比较大。所有样本指标(如均值、比例、方差等)所形成的分布称为抽样分布是一种理论概率分布随机变量是样本统计量——样本均值,样本比例等结果来自容量相同的所有可能样本 抽样分布

(概念要点)样本统计量总体未知参数样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量抽样分布样本统计量所有可能值的概率分布主要样本统计量平均数比率(成数)方差样本均值的抽样分布

(一个例子)【例】设一个总体,含有4个元素(个体),即总体单位数N=4。4个个体分别为X1=1、X2=2、X3=3、X4=4。总体的均值、方差及分布如下均值和方差总体分布14230样本均值的抽样分布

(一个例子)

现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果如下表3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n=2的样本(共16个)样本均值的抽样分布

(一个例子)计算出各样本的均值,如下表。并给出样本均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值(x)样本均值的抽样分布1.00.1.2.3P(x)1.53.04.03.52.02.5x所有样本均值的均值和方差式中:M为样本数目比较及结论:1.样本均值的均值(数学期望)等于总体均值

2.样本均值的方差等于总体方差的1/n=+++==å=5=u.2160.45.10.11LMxnii样本均值的分布与总体分布的比较抽样分布=2.5σ2=1.25总体分布P(x)1.00.1.2.31.53.04.03.52.02.5x=2.514230样本均值的抽样分布

与中心极限定理=50

=10X总体分布n=4抽样分布Xn=16当总体服从正态分布N~(μ,σ2)时,来自该总体的所有容量为n的样本的均值X也服从正态分布,X

的数学期望为μ,方差为σ2/n。即X~N(μ,σ2/n)中心极限定理

(图示)当样本容量足够大时(n

30),样本均值的抽样分布逐渐趋于正态分布中心极限定理:设从均值为,方差为

2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布一个任意分布的总体X平均数的抽样分布全部可能样本平均数的均值等于总体均值,即:从非正态总体中抽取的样本平均数当n足够大时其分布接近正态分布。从正态总体中抽取的样本平均数不论容量大小其分布均为正态分布。样本均值的标准差为总体标准差的比率的抽样分布全部可能样本比率的均值等于总体比率,即:从非正态总体中抽取的样本比率,当n足够大时其分布接近正态分布。从正态总体中抽取的样本比率,不论容量大小其分布均为正态分布。样本比率的标准差为总体标准差的样本抽样分布原总体分布估计量的优良性准则

(无偏性)P(X)XCA无偏有偏指样本指标的均值应等于被估计的总体指标。或说,估计量的数学期望等于被估计的总体参数。无偏性估计量的优良性准则

(有效性)AB中位数的抽样分布均值的抽样分布XP(X)作为优良的估计量,除了满足无偏性的要求外,其方差应比较小。或说,一个方差较小的无偏估计量称为一个更有效的估计量。有效性估计量的优良性准则

(一致性)AB较小的样本容量较大的样本容量P(X)X指随着样本单位数的增大,样本估计量将在概率意义下越来越接近于总体真实值一致性

对于任意ε>0,有

为的无偏、有效、一致估计量;为的无偏、有效、一致估计量;为的无偏、有效、一致估计量。数理统计证明:抽样估计量的优良标准第二节

抽样误差★一、抽样误差的概念二、影响抽样误差的因素三、抽样平均误差四、抽样极限误差、抽样估计的概率度、精度和可靠程度★★抽样平均误差指每一个可能样本的估计值与总体指标值之间离差的平均数,即样本估计量的标准差式中:为样本平均数的抽样平均误差;为可能的样本数目;为第个可能样本的平均数;为总体平均数注意:不要混淆抽样标准差与样本标准差!

抽样平均误差的计算理论公式实际上,利用这个公式是计算不出抽样平均误差的!!!抽样平均误差的实际应用计算公式纯随机抽样条件下⒈样本平均数的抽样平均误差当N≥500时,有重复抽样时:不重复抽样时:⒉样本成数的抽样平均误差重复抽样时:不重复抽样时:当N≥500时,有抽样平均误差的实际应用计算公式纯随机抽样条件下关于总体方差的估计方法用过去同类问题全面调查或抽样调查的经验数据代替;用样本标准差代替总体标准差,用代替。抽样平均误差的实际应用计算公式抽样平均数平均误差的实际计算公式解读采用重复抽样:此公式说明,抽样平均误差与总体标准差成正比,与样本容量平方根成反比。(当总体标准差未知时,可用样本标准差代替)(教材P279例题)通过例题可说明以下几点:①样本平均数的平均数等于总体平均数。②抽样平均数的标准差仅为总体标准差的③可通过调整样本单位数来控制抽样平均误差。例题:假定抽样单位数增加2倍、0.5

倍时,抽样平均误差怎样变化?解:抽样单位数增加2倍,即为原来的3倍则:抽样单位数增加0.5倍,即为原来的1.5倍则:即:当样本单位数增加2倍时,抽样平均误差为原来的0.577倍。即:当样本单位数增加0.5倍时,抽样平均误差为原来的0.8165倍。采用不重复抽样:公式表明:抽样平均误差不仅与总体变异程度、样本容量有关,而且与总体单位数的多少有关。与重复抽样相比,不重复抽样平均误差是在重复抽样平均误差的基础上,再乘以,而

总是小于1,所以不重复抽样的平均误差也总是小于重复抽样的平均误差。

例题一:例题二:某厂生产一种新型灯泡共2000只,随机抽出400只作耐用时间试验,测试结果平均使用寿命为4800小时,样本标准差为300小时,求抽样推断的平均误差?

随机抽选某校学生100人,调查他们的体重。得到他们的平均体重为58公斤,标准差为10公斤。问抽样推断的平均误差是多少?例题一解:即:当根据样本学生的平均体重估计全部学生的平均体重时,抽样平均误差为1公斤。例题二解:计算结果表明:根据部分产品推断全部产品的平均使用寿命时,采用不重复抽样比重复抽样的平均误差要小。已知:则:已知:则:n=100s=10x=58N=2000n=400s=300x=4800习题:有5个工人的日产量分别为(单位:件):6,8,10,12,14,用重复抽样的方法,从中随机抽取2个工人的日产量,用以代表这5个工人的总体水平。则抽样平均误差为多少?若改用不重复抽样方法,则抽样平均误差为多少?

解:根据题意可得:

不重复抽样条件下抽样平均误差重复抽样条件下抽样成数平均误差实际计算方法解读采用重复抽样:采用不重复抽样:例题三:

某校随机抽选400名学生,发现戴眼镜的学生有80人。根据样本资料推断全部学生中戴眼镜的学生所占比重时,抽样误差为多大?例题四:一批食品罐头共60000桶,随机抽查300桶,发现有6桶不合格,求合格品率的抽样平均误差?例题三解:已知:则:样本成数即:根据样本资料推断全部学生中戴眼镜的学生所占的比重时,推断的平均误差为2%。例题四解:已知:则:样本合格率计算结果表明:不重复抽样的平均误差小于重复抽样,但是“N”的数值越大,则两种方法计算的抽样平均误差就越接近。抽样平均数的抽样平均误差抽样成数的抽样平均误差重复抽样不重复抽样第二节

抽样误差★一、抽样误差的概念二、影响抽样误差的因素三、抽样平均误差四、抽样极限误差、抽样估计的概率度、精度和可靠程度★★★抽样极限误差

指在一定的概率保证程度下,抽样误差不允许超过的某一给定的最大可能范围,将这种以绝对值形式表示的抽样误差可能范围也称作允许误差、误差范围等。记作△抽样平均数的抽样极限误差表示为抽样成数的抽样极限误差表示为

由于总体指标是一个确定的数,而样本指标则是围绕总体指标上下波动的,它与总体指标之间既有正离差,也有负离差,样本指标变动的上限或下限与总体指标之差的绝对值就可以表示抽样误差的可能范围。抽样极限误差含义:抽样极限误差指在进行抽样估计时,根据研究对象的变异程度和分析任务的要求所确定的样本指标与总体指标之间可允许的最大误差范围。计算方法:设Δx与Δp分别表示样本平均数与样本成数的抽样极限误差,则有:|x-X|≤Δx,|p-P|≤Δp

上述不等式也可表示成:抽样平均数极限误差:抽样成数极限误差:x-Δx≤X≤x+Δxp-Δp≤P≤p+Δp抽样极限误差抽样估计的概率度z的解读

含义抽样估计的概率度是测量抽样估计可靠程度的一个参数。用符号“z”或“t”表示。公式表示:z=

Δμ

Δ=zμ(z是极限误差与抽样平均误差的比值)(极限误差是z倍的抽样平均误差)上式可变形为:注意到:

极限误差与概率有关,与抽样误差有关

提高把握程度,会增大允许误差,使估计精度降低;缩小允许误差,提高估计的精度,又会降低估计的把握程度。所以在实际中应根据具体情况,先确定一个合理的把握程度,再求相应的允许误差或先确定一个允许误差范围再求相应的把握程度。第5章统计抽样与参数估计★第一节

抽样推断第二节

抽样误差第三节

参数估计的基本方法第四节抽样组织的设计★★一、点估计二、区间估计三、样本容量的确定第三节

参数估计的基本方法★点估计指直接以样本指标来估计总体指标,也叫定值估计简单,具体明确优点缺点无法控制误差,仅适用于对推断的准确程度与可靠程度要求不高的情况一、点估计二、区间估计三、样本容量的确定第三节

参数估计的基本方法★★二、区间估计㈠区间估计的定义和原理㈡总体平均数的区间估计㈢总体成数的区间估计区间估计指根据样本指标和抽样极限误差以一定的可靠程度推断总体指标的可能范围;推断的总体指标的下限与上限所包括的区间——称为置信区间,估计的可靠程度——称为置信度。(这里只讨论常用的大样本的情况)估计正确性的一个概率保证,通常称为估计的置信度,用P(z)表示。估计误差的最大范围,通过极限误差Δ来反映。显然,Δ越小,估计的精度要求越高,Δ越大,估计的精度要求越低。极限误差的确定要以实际需要为基本标准。参数估计的两个要求:精度:可靠度:区间估计原理0.6827

落在范围内的概率为68.27%样本抽样分布曲线原总体分布曲线区间估计原理0.9545

落在范围内的概率为95.45%样本抽样分布曲线原总体分布曲线区间估计原理0.9973

落在范围内的概率为99.73%样本抽样分布曲线总体分布曲线总体平均数的区间估计表达式步骤⒈计算样本平均数;⒉搜集总体方差的经验数据;或计算样本标准差,即总体平均数的区间估计步骤⒊计算抽样平均误差:重复抽样时:不重复抽样时:总体平均数的区间估计步骤⒋计算抽样极限误差:⒌确定总体平均数的置信区间:总体平均数的区间估计【例A】某企业生产某种产品的工人有1000人,某日采用不重复抽样从中随机抽取100人调查他们的当日产量,要求在95﹪的概率保证程度下,估计该厂全部工人的日平均产量和日总产量。总体平均数的区间估计按日产量分组(件)组中值(件)工人数(人)110~114114~118118~122122~126126~130130~134134~138138~14211211612012412813213614037182321186433681221602852268823768165605887006489284648600784合计—100126004144100名工人的日产量分组资料解:则该企业工人人均产量及日总产量的置信区间为:即该企业工人人均产量在124.797至127.203件之间,其日总产量在124797至127303件之间,估计的可靠程度为95﹪。总体成数的区间估计表达式其中,为极限误差步骤⒈计算样本成数;⒉搜集总体方差的经验数据;⒊计算抽样平均误差:重复抽样条件下不重复抽样条件下总体成数的区间估计步骤⒋计算抽样极限误差:⒌确定总体成数的置信区间:总体成数的区间估计【例B】若例A中工人日产量在118件以上者为完成生产定额任务,要求在95﹪的概率保证程度下,估计该厂全部工人中完成定额的工人比重及完成定额的工人总数。总体成数的区间估计按日产量分组(件)组中值(件)工人数(人)110~114114~118118~122122~126126~130130~134134~138138~142112116120124128132136140371823211864合计—100100名工人的日产量分组资料完成定额的人数解:则该企业全部工人中完成定额的工人比重及完成定额的工人总数的置信区间为:即该企业工人中完成定额的工人比重在0.8432至0.9568之间,完成定额的工人总数在843.2至956.8人之间,估计的可靠程度为95﹪。一、点估计二、区间估计三、样本容量的确定第三节

参数估计的基本方法★★★三、样本容量的确定㈠确定样本容量的意义㈡推断总体平均数所需的样本容量㈢推断总体成数所需的样本容量㈣必要样本容量的影响因素样本容量调查误差调查费用小样本容量节省费用但调查误差大大样本容量调查精度高但费用较大找出在规定误差范围内的最小样本容量确定样本容量的意义找出在限定费用范围内的最大样本容量大确定方法推断总体平均数所需的样本容量⑴重复抽样条件下:通常的做法是先确定置信度,然后限定抽样极限误差。或S通常未知。一般按以下方法确定其估计值:①过去的经验数据;②试验调查样本的S。计算结果通常向上进位⑵不重复抽样条件下:确定方法推断总体平均数所需的样本容量【例A】某食品厂要检验本月生产的10000袋某产品的重量,根据上月资料,这种产品每袋重量的标准差为25克。要求在95.45﹪的概率保证程度下,平均每袋重量的误差范围不超过5克,应抽查多少袋产品?解:确定方法推断总体成数所需的样本容量⑴重复抽样条件下:通常的做法是先确定置信度,然后限定抽样极限误差。计算结果通常向上进位

通常未知。一般按以下方法确定其估计值:①过去的经验数据;②试验调查样本的;③取方差的最大值0.25。⑵不重复抽样条件下:确定方法推断总体成数所需的样本容量【例B】某企业对一批总数为5000件的产品进行质量检查,过去几次同类调查所得的产品合格率为93﹪、95﹪、96﹪,为了使合格率的允许误差不超过3﹪,在99.73﹪的概率保证程度下,应抽查多少件产品?【分析】因为共有三个过去的合格率的资料,为保证推断的把握程度,应选其中方差最大者,即P=93﹪。解:必要样本容量的影响因素总体方差的大小;允许误差范围的大小;概率保证程度;抽样方法;抽样的组织方式。重复抽样条件下:不重复抽样条件下:△越大,n需小越大,n需越大Z越大,n需越大重复抽,n需大简单随机抽,n需较大抽样复查的方法其全面调查时的登记结果为2.2861亿元其抽样复查的结果为2.1734亿元随机抽取五个下属单位修正系数为则:该企业集团所拥有的固定资产原值应为16.851×0.9507=16.020(亿元)所拥有固定资产原值的普查结果为16.851亿元某企业集团总体(一)根据给定的概率F(Z),推算抽样极限误差的可能范围及区间估计分析步骤:1、抽取样本,计算样本指标。2、根据给定的F(Z)查表求得概率度Z。3、根据概率度和抽样平均误差计算极限误差。4、计算被估计值的上、下限,对总体参数作出区间估计。总体参数区间估计的习题

某农场进行小麦产量抽样调查,小麦播种总面积为1万亩,采用不重复简单随机抽样,从中抽选了100亩作为样本进行实割实测,测得样本平均亩产400斤,方差144斤。

(1)以95.45%的可靠性推断该农场小麦平均亩产可能在多少斤之间?例题一:z=2样本指标,有时需要计算问题一解题过程:已知:问题一解:1、计算抽样平均误差2、计算抽样极限误差3、计算总体平均数的置信区间上限:下限:即:以95.45%的可靠性估计该农场小麦平均亩产量在

397.62斤至402.38斤之间.不重复抽样x-Δx≤X≤x+Δx(2)若概率保证程度不变,要求抽样允许误差不超过1斤,问至少应抽多少亩作为样本?问题二解:已知:则样本单位数:即:当至少应抽544.6亩作为样本。例题二:某纱厂某时期内生产了10万个单位的纱,按不重复随机抽样方式抽取2000个单位检验,检验结果合格率为95%,废品率为5%,试以95%的把握程度,估计全部纱合格品率的区间范围及合格品数量的区间范围?已知:区间下限:区间上限:例题三:为调查农民生活状况,在某地区5000户农民中,按不重复简单随机抽样法,抽取400户进行调查,得知这400户中拥有彩色电视机的农户为87户。要求计算:1.以显著性水平α=0.05的条件下估计该地区全部农户中拥有彩色电视机的农户在多大比例之间?2.若要求抽样允许误差不超过0.02,其它条件不变,问应抽多少户作为样本?例题三的问题一解:已知:N=5000n=4001、计算样本成数:2、计算抽样平均误差:3、计算抽样极限误差:4、计算总体P的置信区间:下限:上限:即:以95%的把握程度估计该地区农户中拥有彩电的农户在

17.87%至25.63%之间。例题三的问题二解:当其他条件不变时:=1635(户)(二)根据给定的抽样误差范围,作出一定概率保证程度下的区间估计分析步骤:1、抽取样本,计算抽样指标。2、根据给定的极限误差范围估计总体参数的上限和下限。3、计算概率度。4、查表求出概率F(z),并对

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论