第四章-参数估计_第1页
第四章-参数估计_第2页
第四章-参数估计_第3页
第四章-参数估计_第4页
第四章-参数估计_第5页
已阅读5页,还剩85页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章_参数估计4.1几种常见的概率分布4.2参数估计4.3用Excel进行参数估计4.4上机实验四用Excel进行参数估计【实例描述】据卫生部网站消息,卫生部、工业和信息化部、农业部、国家工商行政管理总局、国家质量监督检验检疫总局发布公告,公告规定了婴幼儿配方乳粉中三聚氰胺的限量值为1mg/kg,高于1mg/kg的产品一律不得销售。现国家质检局对某企业当天生产的婴幼儿配方乳粉进行三聚氰胺的监测,监测结果如下:(单位mg/kg)

0.85 0.92 1.01 1.21 0.68 0.96 0.89 0.76根据监测结果,该企业当天生产的婴幼儿配方乳粉是否合格,能否上架呢?4.1几种常见的概率分布4.1.1总体分布4.1.2统计量与统计量的分布4.1.1总体分布所谓参数是指描述总体特征的固定的数值,也叫总体参数(populationparameter)或总体目标量,常用希腊字母来表示。例如总体的均值μ、方差σ2、总体的比例π等都是参数。总体参数虽然是固定的,但一般是未知的。4.1.1总体分布1.二项分布在每次试验中有2种可能结果的二项分布无疑是应用最广的连续型随机变量的概率分布,这种概率分布有以下特点:每次试验只有对立的两类结果,如生与死、男与女、阴与阳等。其中某一类结果发生的概率π为一个常数。不管进行多少次,任何一次试验的结果的概率是固定的;试验是独立的,即每次试验的结果不影响任何其他试验的结果。4.1.1总体分布设以同性别、同月龄的小白鼠每四头A、B、C、D为一组,各鼠接种某菌,假如接种后经过一定时间每鼠生存的概率π=2/5,则死亡概率为1-π=3/5。在随机抽样中各组生存鼠数X有0,1,2,3,4五种情况。假定任何一鼠的生与死不影响其他鼠的生与死(即相互独立),几个相互独立事件同时发生的概率等于各独立事件的概率之积(概率的乘法定律);同一组内任何两种组合不可能同时发生(即互不相容),几个互不相容的事件中,任一事件发生的概率等于这几个事件的概率之和(概率的加法定律)。4.1.1总体分布五种情况分别如下:

各种情况分别出现的概率:

A

B

C

D

0生

(3/5)4

1生3死

4(3/5)³*(2/5)

2生2死

6(2/5)²*(3/5)²

3生1死

4(2/5)³*(3/5)

4生

生生

(2/5)44.1.1总体分布得生存鼠数X为0,1,2,3,4五种情况的概率依次为下列二项式的展开的各项:(3/5+2/5)4=(3/5)4+4(3/5)³*(2/5)+6(2/5)²*(3/5)²+4(2/5)³*(3/5)+(2/5)4写成分布律的形式,见表4-2。表4-2鼠生存分布律4.1.1总体分布二项分布的名称由此而得。并且,上面的二项式展开后各项的系数为:=n!/x!*(n-x)!.式中为n只鼠中有x只生存鼠的组合数(系数)。总结二项分布的一般原理为:在同一条件下,重复做n次独立实验,每次有两个对立的结果,事件a发生或不发生。如果a发生的概率为π,不发生的概率为1-π,则在n次实验中a发生x次的概率为:Pn(X)=πx(1-π)n-x=n!/x!(n-x)!πx(1-π)n-x。从以上一般原理可知,二项分布的实用条件为:(1)实验中只有对立的两类结果,其中某一类结果发生的概率π为一个常数。(2)n次实验相互独立。(3)求n次实验结果中恰好发生x次的概率Pn(X)。4.1.1总体分布例4-1:一名学生在没有参加学习的情况下想凭运气通过一个小测验,小测验有10道选择题,每题有5个答案,其中只有1个是正确的。学生对于每个问题都是猜测答案。(1)学生1道题都没有答对的概率是多少?(2)学生猜对2道题目的答案的概率是多少? 4.1.1总体分布解:(1)1道题都没有答对的概率可由下面公式计算:(2)猜对2道题目的答案的概率:

4.1.1总体分布2.正态分布正态分布是统计学和抽样的理论基础,在统计中具有极其重要的理论意义和实践意义,主要表现如下:(1)客观世界中有许多随机现象都服从或近似服从正态分布。这些随机变量的共同特点是与平均数比较接近的数值出现次数较多,而与平均数相差较大的数值出现的次数较少,即“中间大,两头小”。(2)正态分布具有很好的数学性质。根据中心极限定理,很多分布的极限是正态分布,在抽样时有些总体虽然不知其确定的分布,但随着样本容量的增大,很多统计量可以看作近似正态分布的。(3)尽管经济管理活动中的有些变量是正偏斜的,但这些丝毫不影响正态分布在抽样应用中的地位。4.1.1总体分布举一个近似正态分布的实例。某专业96个学生某次高等数学考试成绩资料如表4-3所示。经过整理作直方图如图4-1所示。表4-3某专业96名学生高等数学成绩4.1.1总体分布由图4-1可看出96名学生高等数学成绩的分布是中间大两头小。如果学生人数增多,成绩的分组间隔缩小,图形就逐渐转化为分布密度曲线。这样曲线底下的总面积恰好是1。图4-196名学生成绩直方图4.1.1总体分布我们取一组样本容量较大的数据,它的分布形状比较有规则。用同样的方法,在这组数据的直方图上画曲线,呈现出的是一个特别对称且单峰的钟形。4.1.1总体分布所得到的这条曲线叫做正态曲线。具有这样曲线作为密度曲线的分布称为正态分布或高斯分布。正态曲线的概率公式:4.1.1总体分布正态分布具有很多分布函数很难同时具备的优良性质。(1)这条正态曲线关于直线对称,并且在对称轴两侧,曲线由凹变凸的转折点,即拐点的横坐标为。均值把曲线的中心确定下来,而标准差决定曲线的形状。如图4-2图4-2不同标准差的正态分布曲线4.1.1总体分布(2)当样本容量足够大时,样本近似地服从一个正态分布。而对于任何的正态分布而言,大约有68%的观测值落在距平均值一个标准差的范围内;95%的观测值落在距平均值两个标准差的范围内;99.7%的观测值落在距平均值三个标准差的范围内。这一规律被称为68-95-99.7规则,或是“3σ”准则。图4-3正态分布的“3σ”准则4.1.1总体分布特别地,当,,,这时我们称这样的分布为标准正态分布。它是一种最简单的正态分布,我们以后就用标准正态分布来解决问题。4.1.1总体分布正态分布是一种概率分布,是具有两个参数μ和σ2的连续型随机变量的分布,第一参数μ是遵从正态分布的随机变量的均值,第二个参数σ2是此随机变量的方差,所以正态分布记作N(μ,σ2)。遵从正态分布的随机变量的概率规律为取

μ邻近的值的概率越大

,而取离μ越远的值的概率越小;σ越小,分布越集中在μ附近,σ越大,分布越分散。正态分布的密度函数的特点是:关于μ对称,在μ处达到最大值,在正(负)无穷远处取值为0,在μ±σ处有拐点。它的形状是中间高两边低,图像是一条位于x轴上方的钟形曲线,曲线和x轴所围面积正好是1,如图4-4。当μ=0,σ2

=1时,称为标准正态分布,记为N(0,1)。当μ=0,σ=0.5的正态分布密度曲线如图4-5。4.1.1总体分布0-2-424μ=0σ=0.5图4-4标准正态分布密度曲线图4-5服从N(0,0.25)的正态分布图4.1.1总体分布3.t分布样本统计量的抽样分布,特别是小样本条件下的抽样分布,并不完全服从正态分布。在实际工作中,往往σ是未知的,常用s作为σ的估计值,称为t变换t=,统计量t值的分布称为t分布。4.1.1总体分布

t分布有如下特征:(1)以0为中心,左右对称的单峰分布;(2)t分布是一簇曲线,其形态变化与n(确切地说与自由度ν)大小有关。自由度ν越小,t分布曲线越低平;自由度ν越大,t分布曲线越接近标准正态分布(u分布)曲线,如图所示。t=自由度为1、5、∞的t分布4.1.2统计量与统计量的分布

1.样本均值的抽样分布例4-2:设一个总体,含有4个元素(个体),即总体单位数N=4。4个个体分别为x1=1、x2=2、x3=3、x4=4,总体的均值,方差。4.1.2统计量与统计量的分布现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果如表4-4所示。计算出各样本的均值,如表4-5。3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n=2的样本(共16个)表4-4所有可能的样本3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值

16个样本的均值(x)表4-5各样本的均值4.1.2统计量与统计量的分布通过以上数据计算可得,各样本均值的平均数μ=2.5,方差σ2=0.625。X图4-5样本均值的抽样分布1.00123P(X)1.53.04.03.52.02.54.1.2统计量与统计量的分布2.样本均值的抽样分布与中心极限定理当总体服从正态分布N~(μ,σ2)时,来自该总体的所有容量为n的样本的均值也服从正态分布,的数学期望为μ,方差为σ2/n。即~(μ,σ2/n)。中心极限定理:设从均值为、方差为

2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布。抽样分布与总体分布的关系如图4-6所示。4.1.2统计量与统计量的分布总体分布正态分布非正态分布大样本(n>=30)小样本(n<30)正态分布正态分布非正态分布图4-6总体分布与抽样分布的关系4.2参数估计4.2.1点估计4.2.2区间估计4.2.3必要抽样容量的计算4.2.1点估计点估计:用一个值或点来估计未知参数的值,进而对总体进行推断。

1.点估计的应用特征: (1)用样本的统计量直接作为总体参数的估计值。例如:用样本均值直接作为总体均值的估计;用两个样本均值之差直接作为总体均值之差的估计等。 (2)没有给出估计值接近总体参数程度的信息。 (3)点估计的方法有频率替换法、矩估计法、顺序统计量法、最大似然法、最小二乘法等。4.2.1点估计2.判断点估计的优劣标准 (1)无偏性 (2)一致性 (3)有效性4.2.2区间估计区间估计用区间来估计位置参数的值,并对总体进行推断。在理论与实际应用中,不仅需要知道总体参数的近似值,还需要知道这种估计的精度是多少。为此,要求由样本构造一个以较大的概率包含真实参数的一个范围或区间,这种带有概率的区间称为置信区间,通过构造一个置信区间对未知参数进行估价的方法称为区间估计。4.2.2区间估计1.置信度和置信区间所谓置信度,也叫置信水平,它是指特定个体对待特定命题真实性相信的程度。在抽样对总体参数作出估计时,由于样本的随机性,其结论总是不确定的。因此,采用一种概率的陈述方法,也就是数理统计中的区间估计法,即估计值与总体参数在一定允许的误差范围以内,其相应的概率有多大,这个相应的概率称作置信度。通常表示为(1-,其中为是总体参数未在区间内的比例,称为显著性水平。常用的置信水平值有99%、95%、90%,相应的为0.01、0.05、0.10。4.2.2区间估计统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间。划定置信区间的两个数值分别称为置信下限(lowerconfidencelimit,lcl)和置信上限(upperconfidencelimit,ucl),如图4-7所示。4.2.2区间估计图4-7置信区间样本统计量(点估计)置信区间置信下限置信上限4.2.2区间估计2.总体均值的区间估计 区间估计的一般步骤如下: 第一步,确定待估参数和置信水平。置信水平由1-α给出,置信水平越高,则置信区间越宽。 第二步,取定估计量,并找出估计量的抽样分布。 第三步,利用估计量的抽样分布求出置信区间。4.2.2区间估计1)方差已知的大样本总体均值区间估计当总体服从正态分布且σ2已知,样本均值的抽样分布仍是正态分布,其数学期望为总体均值μ,方差为。估计用的随机变量为:。对于事先给定的小概率α,有:

这样我们就得到在置信水平下,总体均值的置信区间:4.2.2区间估计在表4-1中,列出了3个常用的置信水平。如,如果置信水平是1-=95%,则显著性水平=0.05,/2=0.025,查表就可得到。于是我们得到一个置信度为的置信区间,即:。表4-13个常用的置信水平与4.2.2区间估计

例4-3:某商场欲考察其客户的年龄结构,随机从其客户中抽取40人,计算出此40人的平均年龄岁,已知客户年龄分布近似正态分布,标准差为7.2岁,试求该公司所有客户的平均年龄的95%的置信区间。4.2.2区间估计解:已知总体服从正态分布,n=40,样本均值,标准差=7.2。查标准正态分布表,在置信水平95%下。所以总体平均数的置信下限为:==34.3总体平均数的置信上限为:==38.7于是,置信水平为95%,该公司所有客户平均年龄的置信区间的上限和下限分别是34.3和38.7。4.2.2区间估计(2)方差未知的大样本总体均值区间估计当总体服从正态分布且σ2未知,且在大样本的条件下,则需用样本方差S2代替σ2

,这时我们仍可以用公式求在置信水平1-α下,总体均值的置信区间:4.2.2区间估计例4-4:某商业银行为了改善窗口服务质量,调查每笔存取款业务的平均服务时间,随机抽取70样本,每次所占用时间的样本数据如下(单位:分钟)2.13.12.42.62.73.72.91.83.13.62.22.52.83.53.742.61.932.33.32.63.72.63.23.23.42.12.82.52.12.23.32.242.93.522.53.54.42.433.23.62.93.22.62.72.12.62.123.33.23.42.93.32.93.13.123.12.73.45.52.82.32.62.6已知总体服从正态分布,求总体平均时间95%的置信区间。4.2.2区间估计解:已知总体服从正态分布σ2未知,样本容量n=70,通过对样本进行计算得样本均值=2.90,样本标准差s=0.65,用公式求得在置信水平95%下,总体均值μ的置信区间为:[2.90±1.96*0.65/]=[2.75,3.05]4.2.2区间估计(3)方差未知的小样本总体均值区间估计当总体服从正态分布且方差σ2未知,且在小样本(n<30)的条件下,求总体均值的置信区间,则需用样本方差S2代替σ2

,这时随机变量组成新的随机变量,即因此,需要用分布来建立总体均值的置信区间。对于给定的置信度1-α及相应的临界值有:这样我们就得到在置信水平1-α下,总体均值μ的置信区间:4.2.2区间估计

例4-5:已知某厂生产A型号的电阻丝的寿命服从正态分布,现从该厂生产的一批A型号的电阻丝成品中随机抽取20件检测,测得其使用寿命(小时)如下:求该批电阻丝平均使用寿命95%的置信区间。20件A型号的电阻丝使用寿命(小时)151815301490147815201505149514881510150014701475148214521493151715251500149515184.2.2区间估计解:已知总体服从正态分布,σ2未知,样本容量n=20为小样本。可以用样本方差S2代替σ2

,用t分布来建立总体均值的置信区间。通过对样本计算,得样本均值=1498.05,样本标准差s=20.38,=2.43。因此,在置信度95%下该批电阻丝平均使用寿命的置信区间为:4.2.2区间估计(4)非正态总体或总体分布未知时大样本总体均值的区间估计当我们面临的总体是非正态分布或总体分布未知时只要样本容量n足够大,由中心极限定理可知,的抽样分布将近似服从正态分布。这时我们仍可以用公式求在置信水平1-α下,总体均值μ的置信区间。①方差σ2已知,在置信水平下,总体均值μ的置信区间。②方差σ2未知,在置信水平下,总体均值μ的置信区间。4.2.2区间估计3.总体比例的区间估计同均值的区间估计一样,总体比例的推断也建立在样本比例的抽样分布基础上。样本比例分布直接来源于二项分布。从理论上说,二项分布是确定置信区间用以估计总体比例的一种恰当的分布,但当样本单位数较大时,概率的计算非常复杂,所以使用二项分布估计总体比例非常困难。根据中心极限定理,随着样本容量的增加,二项分布渐近于正态分布,所以这时可以用正态分布代替二项分布。4.2.2区间估计样本比例抽样分布的数量特征如下:其中为总体比例。样本比例抽样分布的标准差为。在实际估计时,经常使用样本比例代替总体比例。如果已知总体比例值,根据近似标准正态分布,确定围绕值的置信区间是。其中,p为样本比例。4.2.3必要抽样容量的计算确定抽样数目,应考虑以下几个问题:(1)被调查总体的标志变动程度。总体各单位值之间差异程度大,抽样数目就多,反之可以少些。(2)对推断精确度的要求,即被允许的抽样误差范围。在标志变动程度不变的条件下,精确度要求越高,即被允许的误差范围越小,抽样数目就需要增加,反之可以减少。(3)对推断把握程度的要求。在其他条件不变的情况下,要提高抽样的把握程度,抽样数目就需要增加,反之可以减少。(4)抽取调查单位的方式。在其他条件不变的情况下,重复抽样要比不重复抽样抽取的样本多一些。4.2.3必要抽样容量的计算1.总体均值的必要样本单位数的计算在总体均值的区间估计中,置信区为。从公式中可以看出,从允许抽样极限误差到均值的距离实际上为置信区间长度的1/2,这段距离表示在一定的置信度1-α下,用样本均值估计总体均值时所允许的最大绝对误差,即抽样极限误差,它表示抽样误差的可能范围,又称允许误差。4.2.3必要抽样容量的计算如果用Δ表示抽样极限误差,则;那么样本容量n的大小则为。4.2.3必要抽样容量的计算2.总体比例的必要样本单位数的计算比例估计同均值估计相同,也存在一个必要样本容量问题,也受极限误差、置信水平的制约。对于比例估计来讲,其必要样本容量的计算公式为 (其中为总体比例)。同总体比例区间估计相同,必要抽样容量的计算也经常用样本比例代替总体比例。4.3用EXCEL进行参数估计4.3.1用Excel进行总体均值区间估计4.3.2用Excel进行总体比例区间估计4.3.3用Exce计算l必要抽样容量4.3.1用Excel进行总体均值区间估计例4-6:以例4-3中数据为例,利用Excel工作表计算该公司所有客户的平均年龄的95%的置信区间。(1)建立工作表,将数据录入工作表,如图4-8所示。图4-8录入数据4.3.1用Excel进行总体均值区间估计(2)选择单元格A5,在编辑栏中输入“z值”,选择单元格B5,单击插入函数按钮,在插入函数对话框中选择统计函数“NORMSINV”,打开“NORMSINV”函数对话框。如图4-9所示。图4-9“NORMSINV”函数对话框4.3.1用Excel进行总体均值区间估计(3)在函数对话框中,输入“Probability”参数值0.025,单击确定。在单元格B5中返回z值为-1.95996,选择单元格C5,输入公式“=ABS(B5)”,回车,返回结果1.95996。如图4-10所示。图4-10z值的计算4.3.1用Excel进行总体均值区间估计(4)选择单元格A6,在编辑栏中输入“置信下限”;选择单元格A7,在编辑栏中输入“置信上限”。(5)选择单元格B6,输入公式“=B2-C5*B3/SQRT(B1)”;选择单元格B7,输入公式“=B2+C5*B3/SQRT(B1)”。返回结果如图4-11所示。置信水平为95%,该公司所有客户平均年龄的置信区间的上限和下限分别是34.3和38.7图4-11总体均值置信区间的计算结果4.3.1用Excel进行总体均值区间估计例4-7:以例4-4中数据为例,利用Excel工作表计算置信度95%时总体平均时间的置信区间。(1)建立“银行业务服务时间”工作表。(2)分别在单元格A12、A13、A14、A15、A16、A17中输入“样本容量”、“样本均值”、“样本标准差”、“z值”、“置信下限”、“置信上限”,在单元格B12中输入70。如图4-12所示。图4-12“银行业务服务时间”工作表4.3.1用Excel进行总体均值区间估计(3)在单元格B13中插入函数“AVERAGE”,在函数参数对话框中设置参数区域为A1:G10,如图4-13所示。图4-13函数AVERAGE对话框4.3.1用Excel进行总体均值区间估计(4)单击确定按钮,在单元格B13中返回结果2.901429。选择单元格B14,插入函数“STDEV”,在函数对话框中设置参数区域A1:G10,单击确定按钮,在单元格B14中返回结果如图4-14所示。图4-14计算样本均值与标准差图4-14计算样本均值与标准差4.3.1用Excel进行总体均值区间估计(5)选中单元格B15,插入统计函数“NORMSINV”,打开“NORMSINV”函数对话框。在函数对话框中,输入“Probability”参数值0.025,单击确定。返回z值为-1.95996,选择单元格C15,输入公式“=ABS(B15)”,回车,返回结果1.95996。4.3.1用Excel进行总体均值区间估计(6)选择单元格B16,输入公式“=B13-C15*B14/SQRT(B12)”;选择单元格B7,输入公式“=B13+C15*B14/SQRT(B12)”。返回结果如图4-15所示。图4-15总体方差未知的区间估计置信水平为95%,该商业银行平均服务时间的置信区间的上限和下限分别是2.75和3.05。图4-15总体方差未知的区间估计4.3.1用Excel进行总体均值区间估计例4-8:以例4-4中数据为例,利用Excel工作表计算该批电阻丝平均使用寿命95%的置信区间。(1)建立“电阻丝使用寿命”工作表,如图4-16所示。图4-16“电阻丝使用寿命”工作表4.3.1用Excel进行总体均值区间估计(2)选择单元格B7,输入数字20。(3)选择单元格B8,输入“=AVERAGE(A2:E5)”,回车后单元格B8中显示1498.05,为样本均值。(4)选择单元格B9,输入“=STDEV(A2:E5)”,回车后单元格B9中显示20.38,为样本标准差。4.3.1用Excel进行总体均值区间估计(5)选择单元格B10,插入函数“TINV”,打开函数对话框,设置“Probability”参数为0.025,自由度“Deg_freedom”设置为19,如图4-17所示。单击确定按钮后在单元格B10中返回2.43,表示t值。图4-17函数“TINV”对话框4.3.1用Excel进行总体均值区间估计(6)选择单元格B11,输入“=B8-B10*B9/SQRT(B7)”,回车后单元格B11中显示1486.96,为置信区间的置信下限。(7)选择单元格B12,输入“=B8+B10*B9/SQRT(B7)”,回车后单元格B12中显示1509.14,为置信区间的置信上限。在95%的置信度下,该批电阻丝平均使用寿命的置信区间为[1486.96,1509.14]。计算结果如图4-18所示。图4-18小样本总体方差未知的置信区间4.3.1用Excel进行总体均值区间估计

例4-9:国内某航空协会对商务旅行者进行调查,以建立上海浦东机场的通关质量等级。最大可能的等级分是10分。随机抽取了50名商务旅行者作为一个随机样本.每名旅行者都给出上海浦东机场机场的等级分。这50名旅行者样本给出的等级分数据如下:建立上海浦东机场总体平均等级分95%的置信区间。64687763389959783108997454675885869101048986510891078654.3.1用Excel进行总体均值区间估计

解:总体分布未知,方差未知,但样本容量n=50,为大样本,由中心极限定理可知,的抽样分布将近似服从正态分布。在置信水平1-α下,总体均值μ的置信区间为:4.3.1用Excel进行总体均值区间估计(1)建立“旅客评分登记”工作表,如图4-19所示。(2)选择单元格B7,输入50,为样本容量。图4-19“旅客评分登记”工作表4.3.1用Excel进行总体均值区间估计(3)选择单元格B8,输入“=AVERAGE(A1:J5)”,回车后在单元格B8中显示6.98,为样本均值。(4)选择单元格B9,输入“=STDEV(A1:J5)”,回车后在单元格B9中显示2.035301,为样本标准差。(5)选择单元格B10,输入“=ABS(NORMSINV(0.025))”,回车后在单元格B10中显示1.959964,为=0.05时z值。4.3.1用Excel进行总体均值区间估计(6)选择单元格B11,输入“=B8-B10*B9/SQRT(B7)”,回车后单元格B11中显示6.415854,为置信区间的置信下限。(7)选择单元格B12,输入“=B8+B10*B9/SQRT(B7)”,回车后单元格B12中显示7.544146,为置信区间的置信上限。4.3.1用Excel进行总体均值区间估计在95%的置信度下,上海浦东机场总体平均等级分的置信区间为(6.415854,7.544146)。计算结果如图4-20所示。图4-20大样本总体分布、方差未知的置信区间4.3.2用Excel进行总体比例区间估计例4-10:从某厂生产的一批婴幼儿配方奶粉中抽取100袋作为样本进行三聚氰胺检测,检测结果为95袋合格,以95%的置信度估计这批奶粉的合格率。(1)建立“样本比例估计”工作表,如图4-21所示。图4-21建立工作表4.3.2用Excel进行总体比例区间估计(2)在单元格B2中输入样本容量100。(3)在单元格B3中输入“=95/100”,回车后显示95%,为样本合格比例。(4)在单元格B4中输入公式“=SQRT(B3*(1-B3)/B2)”,回车后显示0.021794,为样本标准误差。(5)在单元格D2中输入置信度95%。4.3.2用Excel进行总体比例区间估计(6)在单元格D3中输入公式“=NORMSINV(D2+(1-D2)/2)”,回车后显示1.959964,为计算的z值。(7)在单元格D4中输入“=D3*B4”,回车后显示0.042716。为抽样极限误差。4.3.2用Excel进行总体比例区间估计(8)在单元格D5中输入“=B3-D4”,回车后显示90.73%,为置信区间的下限。(9)在单元格D6中输入“=B3+D4”,回车后显示99.27%,为置信区间的上限。计算结果如图4-22所示。图4-22样本比例区间估计的计算结果图4-22样本比例区间估计的计算结果4.3.3用Exce计算l必要抽样容量例4-11:某区进行居民基本消费情况调查,已知居民平均月基本消费的标准差为50元,要求把握置信度为95%,抽样极限误差为10元,计算应抽取的样本户数。(1)建立“样本容量计算”工作表,如图4-23所示。图4-23“样本容量计算”工作表4.3.3用Exce计算l必要抽样容量(2)在单元格B1、B2中分别输入抽样极限误差为10和置信度95%。(3)选中单元格B3,在编辑栏中输入样本容量计算公式“=NORMSINV(B2)”,回车后单元格B3中显示与置信度相应的z值1.644854。(4)在单元格B4中输入标准差50。(5)选中单元格B5,在编辑栏中输入样本容量计算公式“=(B3^2*B4^2)/B1^2”,回车后单元格B5中显示67.63859。4.3.3用Exce计算l必要抽样容量(6)选中单元格B6,在编辑栏中输入样本容量取整公式“=CEILING(B5,1)”,回车后单元格B6中显示68。计算结果如图4-24所示。置信度为95%,抽样极限误差为10元,应抽取的居民样本户数至少为68户。图4-24必要抽样容量计算4.3.3用Exce计算l必要抽样容量例4-12:抽样调查一批产品的合格率,根据过去的资料,产品的合格率为98%,若要求把握程度为99%,极限误差不超过1%,则应该抽取多大容量的样本?(1)建立“比例样本容量”工作表。在单元格B1、B2、B3中分别输入合格率98%、置信度99%,极限误差1%,如图4-25所示。图4-25“比例样本容量”工作表

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论