抽样推断的一般问题_第1页
抽样推断的一般问题_第2页
抽样推断的一般问题_第3页
抽样推断的一般问题_第4页
抽样推断的一般问题_第5页
已阅读5页,还剩103页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、参数估计假设检验统计方法描述统计推断统计统计估计非参数估计*第5章抽抽样推推断5.1抽样推断断的一般般问题5.2抽样误差差5.3参数估计计5.4样本容量量的确定定*抽样推断断的过程程总体样本随机取样计算出样本的均值、样本比例、样本方差调查总体均值、总体比例、总体方差等推断*5.1抽样推断断的一般般问题5.1.1抽样推断断的概念念和特点点5.1.2抽样推断断的基本本范畴5.1.3抽样分布布*1、概念抽样推断断是在抽抽样调查查的基础础上,根根据样本本的情况况来推断断总体特特征的一一种统计计分析方方法。2、抽样推推断的特特点按照随机机原则抽抽取样本本单位(样品);根据对样样本的调调查对总总体做出出推

2、断;抽样误差差可以事事先计算算并加以以控制。3、抽样推推断的适适用场合合无法进行行全面调调查时;进行全面面调查有有困难或或不必要要时;5.1.1抽样推断断的概念念和特点点*1.抽样框和和抽样单单位(1)总体和和样本总体也称称母体,是所要要研究的的全部单单位组成成的整体体。一般般用表表示总体体包括的的总体单单位数。样本又称称子样,它是从从总体中中随机抽抽取出来来的一部部分单位位组成的的整体。一般用用n表示样本本包括的的总体单单位数。作为推断断对象的的总体是是确定的的,而且且是唯一一的;作作为观察察对象的的样本不不是确定定的,也也不是唯唯一的。5.1.2抽样推断断的基本本范畴*(2)抽样框框:抽样

3、框是是包括全全部总体体单位的的框架,以此代代表总体体,用来从中抽抽取样本本单位,具体表表现形式式有总体体单位(或其集合)的名单或或目录、地图、时间等等。(3)抽样单单位:抽样单位位是构成成抽样框框的基本本要素,它可以以是总体体单位也可以是是总体单单位的集集合。*2.重复抽样样和不重重复抽样样重复抽样样,也叫叫回置抽抽样/放回抽样样,是指指从总体体的个单位位中抽取取一个容容量为n的样本,每次抽抽出一个个单位后,再将将其放回回总体中中参加下下一次抽抽取,这这样连续续抽n次即得到一一个样本本 。不重复抽抽样,也也叫不回回置抽样样/不放回抽抽样,是是指抽中单位不不再放回回总体中中,下一一个样本本单位只

4、只能从余余下的抽样单位位中抽取取。*3.样本容量量和样本本可能数数目样本容量量:一个个样本所所包含的的总体单单位数,用n表示,当样本本容量大大于等于于30时称为大大样本,小于30时称为小样本。样本可能能数目:指按一一定抽样样方法和和一定样样本容量量从总体中中抽取样样本时,所有可可能的样样本个数数,一般般用M表示。*考虑顺序序的重复复抽样的的样本可可能数目目:考虑顺序序的不重重复抽样样的样本本可能数数目:样本可能能数目的的计算*不考虑顺顺序的重重复抽样样的可能能样本数数目:不考虑顺顺序的不不重复抽抽样的可可能样本本数目:客观现象象中常见见的*4.参数和统统计量参数:根根据总体体中各单单位的变变量

5、值计计算的、反映总总体数量量特征的的特征值值。主要要有总体体均值、成数或或比例、方差。统计量:根据样样本中各各单位的的变量值值计算的的、反映映样本数数量特征征的特征征值。主主要有样样本均值值、成数数或比例例、方差差。总体是确确定的、唯一的的,所以以总体参参数也是是确定的的、唯一一的;样样本是随随机的,所以样样本统计计量是随随机变量量。*总体参数数样样本统计计量*样本统计计量的概概率分布布;随机变量量是样本本统计量量:样本均值值,样本比例例,样本本方差等等结果来自自容量相相同的所所有可能能样本;提供了样样本统计计量的分分布特征征,是进进行推断断的理论论基础,也是抽抽样推断断科学性性的重要要依据。

6、5.1.3抽样分布布(samplingdistribution)*抽样分布布的形成成(samplingdistribution)总体计算样本统计量:样本均值、比例、方差样本*1.形成过程程从单位数数为N的总体中中抽取样样本容量量为n的随机样样本,在重复复抽样的的条件下下,共有有Nn个可能的的样本,在不重复抽样样条件下下,共有有PNn个可能样样本;对于每一一个样本本,我们们都可以以计算出出样本的的均值;将所有可可能样本本的样本本均值根根据其取取值形成成概率分分布,即可得到到样本均均值的抽抽样分布布,它是是推断总总体均值值的理论基基础。(一)样样本均值值的抽样样分布*【例】设一个总总体,总总体单位

7、位数N=4。4个单位某某一标志志值的取取值分别别为x1=1、x2=2、x3=3、x4=4。总体的的均值、方差及及分布如如下: 总体分布14230.1.2.3均值和方方差*现从总体体中抽取取n2的简单随随机样本本,在重重复抽样样条件下下,共有有16个样本。所有样样本的结结果为:3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n = 2 的样本(共16个)*计算出各各样本的的均值,并给出出样本均均值的抽抽样分布布:3.53.02.52.033.02.52.01.524.03.53.02.542.542

8、.03211.51.01第二个观察值第一个观察值16个样本的均值(x)x样本均值的抽样分布1.00.1.2.3P (x )1.53.04.03.52.02.5*2.样本均值值的数字字特征*证明:*X= 2.52=1.25总体分布布14230.1.2.3抽样分布P ( X )1.00.1.2.31.53.04.03.52.02.5XxP(x)结论:1.样本均值值的均值值(数学期望望)等于总体体均值;2.样本均值值的方差差等于总总体方差差的1/n。*样本均值值的数学学期望:样本均值值的方差差:不重复抽抽样条件件下:*样本均值值的抽样样分布 = 50 =10X总体分布n= 4抽样分布布Xn=16当总

9、体服服从正态态分布N(,2)时,来自自该总体体的所有有容量为为n的样本的的均值x也服从正正态分布布,且其其数学期期望为,方差为为2/n。即xN(,2/n)*中心极限限定理(central limit theorem)当样本容容量足够够大时(n30),样本均均值的抽抽样分布布逐渐趋趋于正态态分布中心极限限定理:设从均均值为,方差为为2的一个任任意总体体中抽取取容量为为n的样本,当n充分大时时,样本本均值的的抽样分分布近似似服从均均值为、方差为为2/n的正态分分布。一个任意分布的总体X*的分布趋趋于正态态分布的的过程*总体分布布正态分布布非正态分分布大样本小样本正态分布布正态分布布非正态分分布样本

10、均值值的抽样样分布样本均值值的抽样样分布与与总体分分布的关关系*总体(或样本)中具有某某种属性性的单位位与全部部单位总总数之比:不同性别别的人数数与全部部人数之之比合格品(或不合格格品)与全部产产品总数数之比总体比例例表示为为样本比例例表示为为(二)样样本成数数(比例例)的抽抽样分布布*样本比例例的抽样样分布容量相同同的所有有可能样样本的样样本比例例的概率率分布,当样本容量量很大时时,样本本比例的的抽样分分布可用用正态分分布近似。样本比例例的数学学期望:样本比例例的方差差重复抽样样:不重复抽抽样:*5.2抽样误差差5.2.1抽样误差差5.2.2抽样平均均误差 *1、概念抽样误差差是指由由于随机

11、机抽样的的偶然因因素使样样本单位位不足以以代表总总体单位位,而引引起的样样本统计计量和总总体参数数之间的的绝对离离差。()2、影响因因素总体单位位标志值值的离散散程度;样本容量量的大小小(n);抽样方法法(重复复抽样/不重复抽抽样);抽样调查查的组织织方式(简单随随机抽样样/分层抽样样/等距抽样样/整群抽样样)。5.2.1抽样误差差*1、所有可可能样本本统计量量与总体体参数的的平均离离差。2、理论计计算公式式为:上式可以以变换为为:5.2.2抽样平均均误差(标准误误)由此,样样本均值值的抽样样平均误误差就是是样本均均值的标标准差。*3、抽样平平均误差差的计算算公式:(1)重复抽抽样条件件下(2

12、)不重复复抽样条条件下*在总体单单位数很很大的情情况下,可近似似表示为为:*抽样推断断的标准准误差(standarderror)样本统计计量的标标准差,称为统统计量的的标准误误,也称为标准准误差;衡量统计计量的离离散程度度,测度度了用样样本统计计量估计总体参参数的精精确程度度;当总体标标准差未知时,可用样样本标准准差s代替,在重复抽抽样条件件下,样样本均值值的标准准误差为为*可以通过过调整样样本单位位数n来控制抽抽样平均均误差。例如,将样本本容量增增加3倍,则平平均误差差就缩小小一半;而抽样样平均误误差减少少20%,则样本本容量就就需要原原来的1.56倍。*5.3参数估计计5.3.1抽样推断断

13、的内容容5.3.2点估计5.3.3区间估计计*1、参数估估计依据所获获得的样样本数据据,对总总体的数数量特征征进行估估计的推推断方法法称为参参数估计计,即根根据样本本统计量量来估计计总体参参数。参数估计计包括的的内容:如确定定估计值值,确定定估计的的优良标标准;确确定估计计值和被被估计参参数之间间的误差差范围以以及在一一定误差差范围内内所作推推断的可可靠性程程度等。2、假设检检验先对总体体的数量量特征作作某种假假设,再再根据样样本数据据对所作作假设进进行检验验。假设检验验包括的的内容:确定原原假设与与备择假假设;选选择检验验统计量量;确定定显著性性水平;做出决决策。5.3.1抽样推断断的内容容

14、*5.3.2点估计(pointestimate)1、定义:用样本本统计量量的值直直接作为为总体参参数的估估计值,称为为总体参参数的点点估计2、优点:简便、易行3、缺点:没有考考虑抽样样误差的的大小;没有给给出估计计值接近总体体参数的的程度;没有考考虑估计计的概率率保证程程度。*估计量与与估计值值(estimator &estimated value)估计量:用于估估计总体体参数的的样本统统计量的的名称;如样本均均值、样样本比例例(成数)、样本方方差等参数用 表示示,估计计量用表表示估计值:根据样样本资料料得出的的估计量量的具体体取值如果样本本均值x =80,则80就是估计计值*评价估计计量的优

15、优良标准准无偏性:估计量量的数学学期望等等于被估估计的总总体参数数 P( )BA无偏有偏总体参数*有效性:对同一一总体参参数的两两个无偏偏估计量量,有更更小标准准差的估估计量更更有效。AB 的抽样分布 的抽样分布P( )比更有效*一致性:随着样样本容量量的增大大,估计计量的值值越来越越接近被被估计的的总体参参数。大数定律律已经证证明了:样本平平均数和和样本成成数都满满足一致致性:*1、定义:在点估估计的基基础上,指出总总体参数数的上限限和下限限,即指指出总体体参数可可能存在在的区间间范围,并指出出总体参参数落在在这一区区间的置置信水平平。区间估计计的三个个要素:点估计值值总体参数数与点估估计值

16、的的抽样误误差范围围(抽样样极限误误差)置信水平平/概率保证证程度(1-)5.3.3区间估计计*2、区间估估计的一一对矛盾盾:准确性(精度):在点点估计的的基础上上,给出出总体参参数估计的一个个区间范范围,称称为置信信区间,该区间间由样本本统计量加减一一个误差差范围而而得到:样本统计量值 (点估计)置信区间置信下限置信上限*抽样极限限误差抽样极限限误差是是根据统统计研究究任务要要求确定定的可允允许的最最大抽样样误差范范围,它它等于总总体参数数可允许许变动的的上限或或下限与与样本统统计量的的绝对离离差。我们总是是希望估估计的准准确性越越高越好好,即估估计精度度尽可能能的高,也就是是希望置置信区间

17、间越窄越越好,或或者抽样样极限误误差越小小越好。*(2)可靠性性(置信信水平/概率保证证程度):总体体参数落落在置信区区间内的的概率,即样本本统计量量与总体体参数的的误差不超过抽抽样极限限误差的的概率。样本统计计量的抽抽样分布布能够根根据样本本统计量量与总体体参数的接近近程度给给出相应应的概率率度量:两者越越接近概概率越小,差异异越大概概率越大大。*表示为(1-)%为总体参参数落在在区间内内的概率率常用的置置信水平平为99%, 95%,90%相应的为0.01,0.05,0.10置信水平平的表示示(confidencelevel)*抽样推断断时,我我们总是是希望估估计的误误差范围围尽可能能的小,

18、即抽样样精度尽尽可能的的高,并并且估计计的置信信水平也也尽可能的大,但事实实上这两两者是矛矛盾的:在其他他条件不不变的情况下,提高估估计的置置信水平平,就会会增大抽抽样极限限误差(降低估估计的精精度);提高估估计的精精度,就就会减小小置信水平。所所以在区区间估计计中,我我们只能能对准确确性和可可靠性中的一个个提出要要求,来来推求另另一要素素的情况况,事实实上抽样极限误误差与置置信水平平之间存存在一一一对应的的关系,知道其中一个个可以求求另外一一个。准确性与与可靠性性的关系系*标准正态态分布(standardizenormal distribution)标准正态态分布的概率密密度函数数:随机变量

19、量具有均均值为0,标准差差为1的正态分分布;任何一个个一般的正正态分布布,可通通过下面面的线性性变换转转化为标准正正态分布布;标准正态态分布的分布函函数;*标准正态态分布概概率图示示90%的x99.73% 的x95% 的xx一般正态态分布的的密度函函数f(x) =随机变量量X的频率=随机变量量X的均值=随机变量量X的方差= 3.1415926;e =2.71828一般正态态分布概概率图示示*正态分布布函数的的性质图形是关关于x=对称钟形形曲线,且峰值值在x=处;均值和标准差差一旦确定定,分布布的具体体形式也也惟一确确定,不不同参数数正态分分布构成成一个完完整的“正态分分布族”;均值可取实数数轴

20、上的的任意数数值,决决定正态态曲线的的具体位位置;标标准差决决定曲线线的“陡陡峭”或或“扁平平”程度度。越大,正正态曲线线扁平;越小,正正态曲线线越高陡陡峭;当X的取值向向横轴左左右两个个方向无无限延伸伸时,曲曲线的两两个尾端端也无限限渐近横横轴,理理论上永永远不会会与之相相交;正态随机机变量在在特定区区间上的的取值概概率由正正态曲线线下的面面积给出出,而且且其曲线线下的总总面积等等于1。任何一个个一般的正正态分布布,可通通过下面面的线性性变换转转化为标准准正态分分布*【例】计算以下下概率:(1)XN(50,102),求和和(2)ZN(0,1),求和和(3)正态分布布概率为为0.05时,求标标

21、准正态态累积分分布函数数的反函数数值z。正态分布布(例题分析析) *样本均值值概率分分布图示示x90%的样本99.73% 的样本95% 的样本根据中心心极限定定理可知知,*概率度:度量置置信水平平大小的的指标,概率度度大则置置信水平平高,概概率度小小则置信信水平低低。其实质是是以抽样样平均误误差(标标准误差差)为标标准去衡衡量抽样样极限误误差大小小的统计计指标,即抽样样极限误误差为标标准误差差的倍数数。置信水平平与置信信度之间间的关系系可用下下式表达达:*常用的概概率度和和置信水水平的关关系表置信水平 1-/268.27%0.31730.15865190%0.100.051.64595%0.0

22、50.0251.9695.45%0.0550.0275299%0.010.0052.5899.73%0.00270.001353*3.区间估计计的方法法方法一:根据据给定的的抽样极极限误差差,求置置信水平平F(Z)(1)抽取样本本,计算算岩本统统计量,如计算算样本平平均数或或样本成成数作为相应总总体参数数的估计计值,如果缺少少总体方方差或均均方差资资料,还还应计算样样本方差差或均方方差代替替;(2)根据给定定的抽样样极限误误差,估估计总体体参数的的上、下下限;(3)计算抽样样平均误误差或估估计标准准误差;(4)将抽样极极限误差差除以抽抽样平均均误差求求出概率率度Z值,再根根据Z值查“正态态分布

23、概概率表”求出相相应的置置信水平平F(Z)。*方法二:根据给给定的置置信水平平要求,来推算算抽样极极限误差差,然后进行区间估估计。(1)抽取样样本,计计算岩本本统计量量,如计计算样本本平均数数或样本本成数作为相相应总体体参数的的估计值值,如果缺少少总体方方差或均均方差资资料,还应计计算样本本方差或或均方差差代替;(2)根据给给定的置信度F(Z)要求,求求得概率率度Z值;(3)计算抽样样平均误误差u;(4)根据概概率度Z和抽样平平均误差差来推算算抽样极极限误差差,再根根据抽样极限限误差求求出被估估计总体体参数的的上下限限,对总总体参数数做区间间估计。*每包重量(克)包数组中值149以下10148

24、.51485-1.832.414915020149.52990-0.812.815015150150.575250.22151以上20151.530301.228.8合计1001503076例某外贸公公司出口口一种茶茶叶,规规定每包包规格不不低于150克,现用不重复复抽样方方法从中中随机抽抽取1%进行检验验,抽检检结果如如表所示:*要求:(1)抽样极极限误差差为0.2克,估计计该批茶茶叶每包包平均重重量的区区间及其其概率保保证程度度;(2)茶叶包包装合格格率的误误差范围围不超过过6%,估计包包装合格格率的区区间及其其概率保保证程度度;(3)要求以以95.45%的概率保保证程度度,估计计该批茶茶

25、叶每包包平均重重量的区区间;(4)要求以以95.45%的概率保保证程度度,估计计该批茶茶叶的包包装合格格率的区区间。*(1)上限=150.3+0.2=150.5克下限=150.3-0.2=150.1克*查概率表表:该批茶叶叶每包平平均重量量落在区区间150.1,150.5克内,概概率保证证程度为为97.91%。*(2)上限70%+6%76%下限=70%-6%64%查概率表表:该批茶叶叶的包装装合格率率落在区区间64%,76%内,概率率保证程程度为81.32%。*(3)上限=150.3+0.1734=150.47克下限=150.3-0.1734=150.13克以95.45%的概率保保证程度度估计

26、该该批茶叶叶每包平平均重量量在区间间150.13,150.47内。*(4)上限=70%+9.12%79.12%下限=70%-9.12%61.88%以95.45%的概率保保证程度度估计该该批茶叶叶包装合合格率的的区间为为61.88%,79.12%。*总体均值值的区间间估计-数理统计计模式【例】某种零件件的长度度服从正正态分布布,从某某天生产产一批零零件中按按重复抽抽样方法法随机抽抽取9个,测得得其平均均长度为为21.4cm。已知总总体标准准差为=0.15cm。试估计计该批零零件平均均长度的的置信区区间,置置信水平平为95%。该批零件件平均长长度的置置信区间间在21.302cm21.498cm之间

27、。解:已知N(,0.152),n=9, 1- = 95%,z/2=1.96 总体均值 在1-置信水平下的置信区间为*置信区间间与置信信水平的的理解总体参数数的真值值是固定定的,而而用样本本构造的的区间则则是不固固定的,因此置置信区间间是一个个随机区区间,它它会因样样本的不不同而变变化,而而且不是所所有的区区间都包包含总体体参数;实际估计计时只抽抽取一个个样本,此时所所构造的的是与该该样本相相联系的一定置置信水平平(比如95%)下的置信信区间,一个特定定的区间间总是“包含”或或“绝对对不包含含”参数数的真值值,不存存在“以以多大的的概率包包含总体参参数”的的问题。我们无法法知道这这个样本本所产生

28、生的区间间是否包含总体体参数的的真值,我们只只能希望望这个区区间是大大量包含含总体参参数真值的的区间中中的一个个,但它它也可能能是少数数几个不不包含参参数真值值的区间中中的一个个;*如果用某某种方法法构造的的所有区区间中有有95%的区间包包含总体体参数的真值,5%的区间不不包含总总体参数数的真值值,那么么,用该该方法构构造的区间称称为置信信水平为为95%的置信区区间;置信水平平只是告告诉我们们在多次次估计得得到的区区间中大大概有多多少个区间包含含了参数数的真值值,而不不是针对对所抽取取的这个个样本所所构建的的区间而言言的。*从均值为为185的总体中中抽出n=10的20个样本构构造出总总体均值值

29、的20个置信区间间我没有抓抓住参数数!点估计值值*假设检验验(hypothesis test)先对总体体的参数数(或分布形形式)提出某种种假设,然后利利用样本信息判判断假设设是否成成立的统统计方法法。假设检验验的步骤骤:提出原假假设H0;确定适当当的检验验统计量量;给定显著著性水平平;计算检验验统计量量的值发发生的概概率(P值)或计计算给定定显著性性水平下下的临界界值;作出统计计决策。*决策依据据逻辑上运运用反证证法,统统计上依依据小概概率原理理;样本统计计量越大大或P值越小,则越倾倾向于拒拒绝原假假设在这么小小的概率率下竟然然得到了了这样的的一个样样本,表表明这样样的样本本经常出出现。*.因

30、此我们们拒绝假假设= 50. 如果这是总体的真实均值样本均值值m= 50抽样分布布H0这个值不像我们应该得到的样本均值 .20假设检验验图示*P-值原假设为为真条件件下,抽抽样分布布中大于于或小于于样本统统计量的的概率。/ 2 / 2 Z拒绝拒绝H0值临界值计算出的样本统计量计算出的样本统计量临界值1/2 P 值1/2 P 值*5.4样本容量量的确定定5.4.1样本容量量确定的的两难5.4.2简单随机机抽样条条件下样样本容量量的确定定5.4.3总体参数数的预先先估计5.4.4确定样本本容量时时需考虑虑的因素素*5.4.1样本容量量确定的的两难样本容量量较大,收集的的信息就就相对多多,从而而估计

31、精精度较高高,但进进行观测测所投入入的费用用、人力力及时间间就比较较多;样本容量量较小,则投入入的费用用、人力力及时间间就相对对节约,但收集集的信息息也较少少,从而而估计精精度较低低;所以,精精度和费费用对样样本量的的影响和和要求是是矛盾的的,不存存在既使使精度最最高又使使费用最最省的样样本量。反映精度度的指标标为抽样样极限误误差,其其中的概概率度Z与置信水水平相关关,只有有抽样平平均误差差与样本本量有关关。*费用与样样本量的的关系:费用与n的关系用用费用函函数来表表示的,简单随随机抽样样的条件件下,通通常表现现为:其中:C为总费用用;c0为固定费费用,c1为与样本本量有关关的可变变费用。抽样

32、平均均误差与与样本量量的关系系:结论:当当样本量量较小时时,增加加相同的的费用估估计精度度的提高高较明显显,当样样本量较较大时,增加相同同的费用用估计精精度的提提高效果果不好。*样本容量量的影响响因素1、总体变变异程度度(、)2、抽样极极限误差差(允许许误差范范围)3、置信水水平(置置信度、概率保保证程度度)4、抽样方方法(重重复抽样样、不重重复抽样样)5、抽样组组织方式式(简单单随机抽抽样、分分层抽样样、等距距抽样、整群抽抽样)。*1、估计总总体均值值时样本本容量的的确定重复抽样样不重复抽抽样5.4.2简单随机机抽样条条件下样样本容量量的确定定其中:以上求出出的样本本量为必必要样本本量,即即

33、最小样样本量,不能整整除时不不采用四四舍五入入的方法法,而是是采用取取大的临临近整数数的方法法。*重复抽样样与不重重复抽样样条件下下样本容容量的变变换:由于重复复抽样下下的公式式比不重重复抽样样下的公公式要简简单得多多,所以对不重重复抽样样必要样样本单位位数的确确定经常常遵循如如下思路路确定:首先计计算重复复抽样条条件下的的必要样样本单位位数,记记为n0;然后判断是是否成成立,如如果成立立,则取取n=n0,否则,对n进行修正,修修正公式式为:*【例】拥有工商商管理学学士学位位的大学学毕业生生年薪的的标准差差大约为为2000元,假定定想要估估计年薪薪95%的置信区区间,希希望允许许误差为为400

34、元,应抽抽取样本本容量为为多大的的样本?*解:已知=2000,=400,1-=95%,z/2=1.96则即应抽取取97人作为样样本。*重复抽样样不重复抽抽样2、估计总总体比例例时样本本容量的的确定其中:*【例】根据以往往的生产产统计,某种产产品的合合格率约约为90%,现要求求允许误误差为5%,在求95%的置信区区间时,应抽取取多少个个产品作作为样本本?解:已知p=90%,1-=95%,Z/2=1.96,=5%应抽取的的样本容容量为:应抽取139个产品作作为样本本。*1.如果有历历史资料料,可利利用历史史资料代代替;如如果有若若干个可可供选择的历史史资料,应采用用数值最最大的一一个;成成数方差差

35、在完全全缺乏资资料的情况况下,用用0.25代替;2.假如没有有可供替替代的历历史资料料,可以以通过组组织试验验性的抽抽样取得替代资资料:首首先确定定一个可可以承受受的样本本量n0,调查后后用样本方差代代替总体体方差进进行计算算,如果果精度跟跟可靠性性达到要要求,则则调查结束束;否则则,计算算为达到到精度要要求所需需样本量量n,再补抽抽n-n0个单位进进行调查查;4.没有同类类调查的的经验,时间等等各方面面条件又又不允许许进行预预调查,则只能能通过定定性分析析来确定定总体变变异系数数。5.4.3总体方差差的预先先估计*其中,C为变异系系数,r为相对误误差。将计算样样本容量量的公式式变形得得:*1.研究问题题的重要要性。对对于决策策比较重重要的问问题样本本量要大大一些;2.所研究问问题目标标量的个个数。如如果所研研究的问问题目标标量较多多,样本本量应适适当放大大;3.调查表或或调查问问卷的回回收率;4.有效样本本数;5.资源限制制:调查查项目的的经费、时间要要求以及及调查人人员的限限制。5.4.4确定样本本容量时时需要考考虑的其其它因素素*5.5其它参数数估计与与假设检检验内容容5.5.1一个总体体均值5.5.2两个

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论