第8章 参数估计2012修改(统计学PPT)_第1页
第8章 参数估计2012修改(统计学PPT)_第2页
第8章 参数估计2012修改(统计学PPT)_第3页
第8章 参数估计2012修改(统计学PPT)_第4页
第8章 参数估计2012修改(统计学PPT)_第5页
已阅读5页,还剩68页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第第8 8章章 参数估计参数估计统计学第第8 8章章 参数估计参数估计一、参数估计概述一、参数估计概述二、参数估计的基本方法二、参数估计的基本方法三、总体参数的区间估计三、总体参数的区间估计四、样本容量的确定四、样本容量的确定五、五、ExcelExcel在参数估计中的应用在参数估计中的应用本章学习目标本章学习目标1.了解参数估计的概念与特点。2.掌握参数估计的方法。3.重点掌握总体均值及总体比例的区间估计方法。4.掌握样本容量的确定方法。一、参数估计概述一、参数估计概述(一)参数估计的意义(一)参数估计的意义(二)抽样误差的测定(二)抽样误差的测定 (一)参数估计的意义(一)参数估计的意义也叫

2、抽样估计,就是根据样本统也叫抽样估计,就是根据样本统计量去估计总体参数。计量去估计总体参数。 参数估计参数估计估计量:用于估计总体参数的随机变量。估计量:用于估计总体参数的随机变量。 如样本均值,样本比例、样本方差等 例如: 样本均值就是总体均值的一个估计量估计值:估计参数时计算出来的统计量的具估计值:估计参数时计算出来的统计量的具体数值。即估计量的具体数值。体数值。即估计量的具体数值。 如果样本均值x x =80,则估计量样本均值的估计值为80。总体总体样本样本样本均值x统计量统计量参数是唯一的,但参数是唯一的,但估计量(统计量)是随机变量估计量(统计量)是随机变量,取值是不,取值是不确定的

3、。确定的。同一个参数可以有多个不同的估计值。同一个参数可以有多个不同的估计值。 ?参数参数)()(特点特点1 1、以随机抽样为前提、以随机抽样为前提2 2、以概率估计推断总体参数、以概率估计推断总体参数3 3、存在抽样误差,但可以计算和控制、存在抽样误差,但可以计算和控制作用作用1 1、用于不可能或不必要进行全面调查的、用于不可能或不必要进行全面调查的总体数量特征的估计总体数量特征的估计 2 2、用于全面调查资料的评价和验证、用于全面调查资料的评价和验证 3 3、用于生产过程的质量控制、用于生产过程的质量控制(二)抽样误差的测定(二)抽样误差的测定 是指样本统计量与总体参数之差。主是指样本统计

4、量与总体参数之差。主要包括样本均值与总体均值之间的抽要包括样本均值与总体均值之间的抽样误差,样本比例与总体比例之间的样误差,样本比例与总体比例之间的抽样误差。抽样误差。抽样误差抽样误差抽样误差抽样误差实际抽样误差实际抽样误差 无法一一计算无法一一计算抽样平均误差抽样平均误差可以计算可以计算 抽样极限误差抽样极限误差可以控制可以控制实际抽样误差实际抽样误差 样本估计值与总体参数真实值之间的离差称样本估计值与总体参数真实值之间的离差称为实际抽样误差。为实际抽样误差。 由于在实践中总体参数的真实值是未知的,由于在实践中总体参数的真实值是未知的,因此实际抽样误差是不可知的。因此实际抽样误差是不可知的。

5、 由于样本估计值随样本而变化,因此实际抽由于样本估计值随样本而变化,因此实际抽样误差是一个随机变量。样误差是一个随机变量。)(抽样平均误差抽样平均误差 样本均值的标准差,又称抽样标准误差,简称样本均值的标准差,又称抽样标准误差,简称标准误。用来反映样本均值(或比例)与总体标准误。用来反映样本均值(或比例)与总体均值(比例)的平均差异程度。均值(比例)的平均差异程度。 M2定义公式:抽样平均误差可衡量样本对总体的代表性大小抽样平均误差可衡量样本对总体的代表性大小根据定义公式无法计算抽样平均误差根据定义公式无法计算抽样平均误差nxnp)1 (1NnNnx)1()1 (NnNnp抽样方法抽样方法样本

6、均值的抽样平均误差样本均值的抽样平均误差样本比例的抽样平均误差样本比例的抽样平均误差重置抽样重置抽样不重置抽样不重置抽样数理统计证明,随机抽样的抽样平均误差可以使用以数理统计证明,随机抽样的抽样平均误差可以使用以下公式计算。下公式计算。由上面的公式可知影响抽样误差的因素包括:总体标由上面的公式可知影响抽样误差的因素包括:总体标志值的差异程度;样本容量的大小;抽样方法以及抽志值的差异程度;样本容量的大小;抽样方法以及抽样的组织形式。样的组织形式。应用上述公式,需要注意以下二点:应用上述公式,需要注意以下二点:1 1、当、当N N很大时,很大时, 。若。若NnNnN11 05. 0/Nn一般可忽略

7、有限总体的修正系数一般可忽略有限总体的修正系数 2 2、由于总体方差通常是未知的,一般可用样本方差代替。、由于总体方差通常是未知的,一般可用样本方差代替。如果样本方差未知,可用如果样本方差未知,可用用过去同类现象的全面调查或抽用过去同类现象的全面调查或抽样调查的历史方差资料或实验性调查估计方差替代。若可样调查的历史方差资料或实验性调查估计方差替代。若可用的方差资料有多个,应选择方差值最大的。用的方差资料有多个,应选择方差值最大的。【例例】企业生产某产品企业生产某产品10001000袋,为检验其包装重量情况,检验员袋,为检验其包装重量情况,检验员甲按简单随机重复抽样方法,抽取甲按简单随机重复抽样

8、方法,抽取200200袋,检验乙按不重复抽袋,检验乙按不重复抽样方法抽取样方法抽取100100袋袋, ,样本标准差均为样本标准差均为2 2克,试求两种不同抽样方克,试求两种不同抽样方法下平均包装重量的抽样平均误差。法下平均包装重量的抽样平均误差。解:解:1 1)重复抽样时抽样平均误差)重复抽样时抽样平均误差 2 2)不重复抽样时抽样平均误差)不重复抽样时抽样平均误差1414. 02002nx1897. 0)10001001 (1002)1 (22Nnnx【例】机械厂生产一批零件【例】机械厂生产一批零件100000100000件,现抽取件,现抽取300300件进行检验,发件进行检验,发现有现有9

9、 9 件不合格,试求合格率的抽样平均误差。件不合格,试求合格率的抽样平均误差。解:解:1 1)重复抽样下合格率的抽样平均误差)重复抽样下合格率的抽样平均误差 2 2)不重复抽样下合格率的抽样平均误差)不重复抽样下合格率的抽样平均误差%985.0300%)971%(97)1(%97%1003009300npp%984. 0)1000003001 (300%)971%(97)1 ()1 (Nnnp抽样极限误差抽样极限误差 抽样极限误差,也称抽样允许误差、抽样边际误差。它抽样极限误差,也称抽样允许误差、抽样边际误差。它是指在一定概率下,样本统计量偏离总体参数的最大可是指在一定概率下,样本统计量偏离总

10、体参数的最大可能范围。通常用能范围。通常用“”表示。表示。 最大允许误差是人为确定的,是调查者在相应的置信度最大允许误差是人为确定的,是调查者在相应的置信度下可以容忍的误差水平。下可以容忍的误差水平。 抽样的极限误差通常需要以抽样的平均误差为标准单位抽样的极限误差通常需要以抽样的平均误差为标准单位来衡量,并且把抽样极限误差除以抽样平均误差所得的来衡量,并且把抽样极限误差除以抽样平均误差所得的数值叫做概率度,以测量估计的可靠程度。数值叫做概率度,以测量估计的可靠程度。 若以若以z z表示概率度,则有:表示概率度,则有: xxzppz或或 xxzppz 常用的概率度与概率对照表常用的概率度与概率对

11、照表 概率度概率度z z1 11.651.651.961.962 22.582.583 3置信概率置信概率(z)(z)0.68270.68270.90000.90000.95000.95000.95450.95450.990.990.99730.9973二、参数估计的基本方法二、参数估计的基本方法估估 计计 方方 法法点点 估估 计计区间估计区间估计点估计点估计以样本估计量的实际值直接作为相应总以样本估计量的实际值直接作为相应总体参数的估计值。体参数的估计值。psx,简单,具体明确简单,具体明确无法控制误差,仅适用于对推断的准无法控制误差,仅适用于对推断的准确程度与可靠程度要求不高的情况确程度

12、与可靠程度要求不高的情况(一)点估计(一)点估计 的抽样分布的抽样分布x点估计的最大好处:给出确定的值点估计的最大好处:给出确定的值点估计的最大问题:无法控制误差点估计的最大问题:无法控制误差点估计的评价标准点估计的评价标准点估计的评价标准点估计的评价标准无偏性无偏性有效性有效性一致性一致性 无偏性:无偏性:样本估计量的数学期望应等于被样本估计量的数学期望应等于被估计总体未知参数的真值。估计总体未知参数的真值。无偏无偏有偏有偏无偏性无偏性学生学生成绩成绩 60 70 80 90均值均值 75方差方差 125从中按重复抽样方式抽取人,从中按重复抽样方式抽取人,计算样本的均值及方差计算样本的均值及

13、方差S 。x方差的抽样分布方差的抽样分布A60B70C80D90A6060 60600060 7065255060 807010020060 9075225450B7070 6065255070 70700070 8075255070 9080100200C8080 607010020080 7075255080 80800080 90852550D9090 607522545090 708010020090 8085255090 909000nxxnxxSn22)(1)(221nxxSn5 .62)(22mSSEnn125)(2121mSSEnn12521252125)(21nSE5 .62

14、)(2nSE有有偏偏无无偏偏有效性:有效性:对同一总体参数的两个无偏点估对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效计量,有更小标准差的估计量更有效。 的抽样分布的抽样分布 的抽样分布的抽样分布有效性有效性学生学生成绩成绩 30 40 50 60 70 80 90按随机原则抽选出名学生,并按随机原则抽选出名学生,并计算平均分数和中位分数。计算平均分数和中位分数。样本均值 45 47.5 50 52.5 55 57.5 60出现次数 1 1 2 3 4 4 5样本均值 62.5 65 67.5 70 72.5 75出现次数 4 4 3 2 1 1样本中位数 45 50 55 60

15、 65 70 75出现次数 4 3 8 5 8 3 4中位数的中位数的抽样分布抽样分布平均数的平均数的抽样分布抽样分布emxemExE)()( 一致性:一致性:随着样本容量的增大,估计量随着样本容量的增大,估计量的值越来越接近被估计的总体参数的值越来越接近被估计的总体参数较小的样本容量较小的样本容量较大的样本容量较大的样本容量一致性一致性q 为的无偏、有效、一致估计量;为的无偏、有效、一致估计量;q 为的无偏、有效、一致估计量;为的无偏、有效、一致估计量;q 为的无偏、有效、一致估计量。为的无偏、有效、一致估计量。x1nsp 根据样本估计量以一定的可靠程度推根据样本估计量以一定的可靠程度推断总

16、体参数所在的区间范围。断总体参数所在的区间范围。 在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减抽样误差而得到的 根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量样本统计量样本统计量 (点估计点估计)置信区间置信区间置信下限置信下限置信上限置信上限(二)区间估计(二)区间估计LU区间估计区间估计或称置信水平。为置信度本章不做介绍。区间,的置信区间称单侧置信缺置信上限或置信下限信下限与置信上限。分别称为置信区间的置,的置信区间。的置信度为)为参数,则称()(),有(的两个统计量,对于给定为由样本确定的、,一般地,设总体参数为,11110ULU

17、LULULP置信区间置信区间1.1. 由样本统计量所构造的总体参数的估计区间称为置信由样本统计量所构造的总体参数的估计区间称为置信区间。该区间的两个端点,分别称为置信区间的置信区间。该区间的两个端点,分别称为置信区间的置信下限下限 和置信上限和置信上限 。2.2. 统计学家在某种程度上确信这个区间会包含真正的总统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间。体参数,所以给它取名为置信区间。 3.3. 用一个具体的样本所构造的区间是一个特定的区间,用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参我们无法知道这个样本所产生的

18、区间是否包含总体参数的真值。数的真值。我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个LU置信区间置信区间(95%(95%的置信区间的置信区间) )重复构造出重复构造出 的的2020个个置信区间置信区间 点估计值点估计值1.1. 将构造置信区间的步骤重复很多次,置信区间将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信包含总体参数真值的次数所占的比例称为置信水平水平 2.2. 表示为表示为 (1 - 为是总体参数未在区间内的比例3.3. 常用的置信水平值有常用的置信水平值有 99%, 95%, 90%99

19、%, 95%, 90%相应的为0.01,0.05,0.10置信水平置信水平 1)(ULP即:区间估计优良性评价的基本要求区间估计优良性评价的基本要求 xL均值的抽样分布均值的抽样分布(1 - ) 区间包含了区间包含了 的区间未包含的区间未包含 1 - /2 /21.1.置信度高置信度高2.2.精确度高精确度高U在保证置信度的前提下,尽可能提高精确度。在保证置信度的前提下,尽可能提高精确度。 区间估计的一般步骤区间估计的一般步骤 1.1. 抽取样本,计算估计值抽取样本,计算估计值2.2. 计算抽样平均误差计算抽样平均误差3.3. 根据所要求的置信水平与样本统计量根据所要求的置信水平与样本统计量的

20、分布形式,计算极限误差的分布形式,计算极限误差4.4. 对总体参数作出区间推断对总体参数作出区间推断 三、总体参数的区间估计三、总体参数的区间估计 (一)总体均值的区间估计(一)总体均值的区间估计 (二)总体比例的区间估计(二)总体比例的区间估计(一)总体均值的区间估计(一)总体均值的区间估计 ( (以样本均值服从正态分布为例)以样本均值服从正态分布为例)95% 95% 的样本的样本 -1.96 x +1.96 x99% 99% 的样本的样本 - 2.58 x + 2.58x90%90%的样本的样本 -1.65 x +1.65 xx)/,(2nNx),(22xxzzxx1)(22xxzxzxP

21、),(22xxzxzx 总体方差已知时总体均值的估计总体方差已知时总体均值的估计1.1. 假定条件假定条件总体服从正态分布如果是非正态分布,但 n 302.样本均值服从正态分布,如重复抽样条件下,样本均值服从正态分布,如重复抽样条件下,3.3. 总体均值总体均值 在在1-1- 置信水平下的置信水平下的置信区间为置信区间为抽样极限误差抽样极限误差(不重复抽样))1(22/NnNnzx12/2/znxzPx样本均值的标准误差样本均值的标准误差xxx一家食品生产企业以生产袋装食品为主,为对产量质量进行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产的一批食品中随机抽取了25

22、袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布正态分布,且总体标准差为10克。试估计该批产品平均重量的置信区间,置信水平为95%25袋食品的重量 112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3解:解:已知N(,102),n=25, 1- = 95%,z/2=1.96。 即:该食品平均重量的置信区间在即:该食品平均重量的置信区间在101.44101.44109.28109.28克之间。克之间。

23、(克)到:根据样本数据可计算得36.105nxx【例】【例】某企业生产的灯泡,根据其积累的历史资料,某企业生产的灯泡,根据其积累的历史资料,灯泡使用寿命的方差为灯泡使用寿命的方差为625625小时小时2 2。该企业某一天生产。该企业某一天生产灯泡灯泡1800018000只,从中以简单随机抽样方式抽取只,从中以简单随机抽样方式抽取6060只检测,只检测,其平均寿命为其平均寿命为20002000小时。试以小时。试以95%95%的置信度估计该天生的置信度估计该天生产的全部灯泡的平均寿命范围。产的全部灯泡的平均寿命范围。 分析:分析:在总体方差已知的情况下,虽然不知道灯泡在总体方差已知的情况下,虽然不

24、知道灯泡寿命是否服从正态分布,但由于抽取的样本容量为寿命是否服从正态分布,但由于抽取的样本容量为6060,是一个大样本,根据中心极限定理,样本均值,是一个大样本,根据中心极限定理,样本均值近似服从正态分布,即近似服从正态分布,即 2,xNx解:解:96.1%,951625,2000,60,18000025.02/2zzxnN查标准正态分布表得已知:222. 311800060180006062512NnNnx315. 6222. 396. 12/xxz 即可以用即可以用95%95%的概率保证该天生产灯泡的平均寿的概率保证该天生产灯泡的平均寿命介于命介于1993.6851993.6852006.

25、3152006.315小时之间。小时之间。 总体方差未知时总体均值的估计总体方差未知时总体均值的估计1.1. 假定条件假定条件总体服从正态分布如果是非正态分布,但n 302.样本均值服从样本均值服从t分布,如:分布,如: 重复抽样条件下,重复抽样条件下,3.3. 总体均值总体均值 在在1-1- 置信水平下的置信水平下的置信区间为置信区间为11, 2/1, 2/nntnsxtP抽样极限误差抽样极限误差(不重复抽样))1(21, 2/NnNntxn样本均值的标准误差样本均值的标准误差xx已知某种灯泡的寿命服从正态分布,现从一已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取批灯泡中随机抽取16

26、16只,测得其使用寿命只,测得其使用寿命( (小时小时) )如如下。建立该批灯泡平均使用寿命下。建立该批灯泡平均使用寿命95%95%的置信区间的置信区间16灯泡使用寿命的数据 1510152014801500145014801510152014801490153015101460146014701470解解:已知已知服从服从N N( ( , 2 2) ),n n=16, 1-=16, 1- = 95% = 95%,t t /2/2=2.131 =2.131 。 根据样本数据计算得:根据样本数据计算得: 总体均值总体均值 在在1-1- 置信水平下的置信区间为置信水平下的置信区间为即:该种灯泡平均

27、使用寿命的置信区间为即:该种灯泡平均使用寿命的置信区间为1476.81476.8小时小时1503.21503.2小时小时一家保险公司收集到由一家保险公司收集到由3636投保个人组成的随投保个人组成的随机样本,得到每个投保人的年龄机样本,得到每个投保人的年龄( (周岁周岁) )数据如下表。数据如下表。试建立投保人年龄试建立投保人年龄90%90%的置信区间的置信区间 36个投保人年龄的数据 233539273644364246433133425345544724342839364440394938344850343945484532解:解:已知n=36, 1- = 90%,t/2=1.69。 根据

28、样本数据计算得: 总体均值在1-置信水平下的置信区间为即:投保人平均年龄的置信区间为37.31岁41.69岁5 .39nxx77. 712nxxs注意:注意:当样本容量足够大、总体方差未知而用样本方当样本容量足够大、总体方差未知而用样本方差代替时,由样本均值所构造的差代替时,由样本均值所构造的t t统计量非常接近标统计量非常接近标准正态分布的准正态分布的z z统计量,即统计量,即临界值临界值 也可以通过查标也可以通过查标准正态分布表得到其近似值准正态分布表得到其近似值 。2/t2/z思考:思考:某工厂有某工厂有15001500个工人,用重复抽样的方法抽取个工人,用重复抽样的方法抽取5050个工

29、人作为样本,调查其工资水平如下表:个工人作为样本,调查其工资水平如下表:要求:要求:(1 1)计算样本的平均工资和标准差。)计算样本的平均工资和标准差。(2 2)以)以95.45%95.45%的保证概率估计该工厂平均工资和工资的保证概率估计该工厂平均工资和工资总额的区间。总额的区间。工资水平(元)工资水平(元)1124 1134 1140 1150 1160 1180 1200 1260工人数(人)工人数(人) 4 6 9 10 8 6 4 3总体均值区间估计小结总体均值区间估计小结已知2未知2nzx2nszx2nzx2nzx2nszx2总体分布总体分布样本容量样本容量正态总体正态总体大样本大

30、样本小样本小样本非正态总体非正态总体大样本大样本小样本小样本nstxn1,2(二)总体比例的区间估计(二)总体比例的区间估计假定条件假定条件总体服从二项分布是非标志的总体方差已知 样本容量n30,而且 和 都大于5 样本比例可以由正态分布来近似样本比例可以由正态分布来近似 总体比例总体比例 在在1-1- 置信水平下置信水平下的置信区间为的置信区间为1)1 (2/2/znpzPpn p(1)npp但在实际工作中,但在实际工作中, 往往是未知的,往往是未知的,需要用样本比需要用样本比例例 来代替。来代替。p1在置信度在置信度 下,总体比例下,总体比例 的置信区间为:的置信区间为: 【例】【例】某高

31、校有某高校有教职工教职工10001000人,按人,按随机原则以不重复随机原则以不重复抽样方式抽取抽样方式抽取201201名教职工进行调查,名教职工进行调查,其中表示支持某候其中表示支持某候选人的有选人的有110110人,人,试以试以95%95%的置信标的置信标准估计该候选人的准估计该候选人的全校支持率。全校支持率。解:解:已知 N=1000, n=201, p110/201=54.73% , 1-= 95%查表得 z/2=1.96%16. 6110002011000201)5437. 01 (5437. 096. 11)1 (2/NnNnppzp%)53.60%,21.48(%16.6%37.

32、54pp即:以即:以95%95%的置信度估计该候选人的全校支持率介的置信度估计该候选人的全校支持率介于于48.21%48.21%60.53%60.53%之间。之间。 某城市某城市想要估计下岗想要估计下岗职工中女性所职工中女性所占的比例,随占的比例,随机抽取了机抽取了100100个个下岗职工,其下岗职工,其中中6565人为女性人为女性职工。试以职工。试以95%95%的置信水平估的置信水平估计该城市下岗计该城市下岗职工中女性比职工中女性比例的置信区间例的置信区间解:解:已知 n=100,p65% , 1-= 95%,z/2=1.96即:该城市下岗职工中女性比例即:该城市下岗职工中女性比例的置信区间

33、为的置信区间为55.65%-74.35% 55.65%-74.35% 1995.4.10 1995.4.10今日美国今日美国对对369369名有工作的名有工作的父母的一项调查表明,他们当中有父母的一项调查表明,他们当中有200200名名承认由于工作有约而使得与其子女相处时承认由于工作有约而使得与其子女相处时间过少。间过少。 A.A.求总体中由于工作有约而使得与其子女相求总体中由于工作有约而使得与其子女相处时间过少父母所占的比率的点估计。处时间过少父母所占的比率的点估计。B.B.当置信水平为当置信水平为9595时,边际误差为多大?时,边际误差为多大?C.C.求总体中由于工作有约而使得与其子女相求

34、总体中由于工作有约而使得与其子女相处时间过少父母所占比率的处时间过少父母所占比率的9595置信区间置信区间估计。估计。样本容量样本容量调查误差调查误差调查费用调查费用小样本容量小样本容量节省费用但节省费用但调查误差大调查误差大大样本容量大样本容量调查精度高调查精度高但费用较大但费用较大找出在规定误找出在规定误差范围内的最差范围内的最小样本容量小样本容量找出在限定费找出在限定费用范围内的最用范围内的最大样本容量大样本容量确定样本容量的必要性确定样本容量的必要性四、样本容量的确定四、样本容量的确定 影响样本容量的因素影响样本容量的因素 确确定定方方法法1. 1. 重复抽样条件下:重复抽样条件下:,

35、(22nzzxx边际误差)2222xzn通常的做法是先确定置信通常的做法是先确定置信水平,查找相应的临界值水平,查找相应的临界值z,然后限定边际误差。然后限定边际误差。 2 2未知时,一般采用过去的经未知时,一般采用过去的经验数据;验数据;如果经验数据未知,如果经验数据未知,则应考虑则应考虑s s2 2代替代替 2 2来计算。但来计算。但s2通通常也是个未知数,解决方法有:常也是个未知数,解决方法有:第一,利用历史的样本资料进行第一,利用历史的样本资料进行计算;第二,利用同类型的调查计算;第二,利用同类型的调查资料计算求得;第三,组织试验资料计算求得;第三,组织试验性调查取得数据;第四,若有多

36、性调查取得数据;第四,若有多个不同的值,则取其最大值。个不同的值,则取其最大值。 计算结果通常向上进位计算结果通常向上进位估计总体均值时样本容量的确定估计总体均值时样本容量的确定 ,1222Nnnzzxx2. 2. 不重复抽样条件下:不重复抽样条件下:NnnzNNznx/12222222重复重复2222xzn拥有工商管理学士学位的大学毕业生年拥有工商管理学士学位的大学毕业生年薪的标准差大约为薪的标准差大约为20002000元,假定想要估计年薪元,假定想要估计年薪95%95%的置信区间,希望边际误差为的置信区间,希望边际误差为400400元,应抽元,应抽取多大的样本容量?取多大的样本容量?解解:

37、 :已知 =2000, =400, 1-=95%, z/2=1.96即应抽取即应抽取9797人作为样本人作为样本 xEx某食品厂要检验本月生产的某食品厂要检验本月生产的1000010000袋某产品的重量,袋某产品的重量,根据上月资料,这种产品每袋重量的标准差为根据上月资料,这种产品每袋重量的标准差为2525克。要求克。要求在在95.4595.45的概率保证程度下,平均每袋重量的误差范围的概率保证程度下,平均每袋重量的误差范围不超过不超过5 5克,应抽查多少袋产品?克,应抽查多少袋产品?袋则在重复抽样条件下:克克解:己知1005252, 2,5,25,1000022222222xxznzN袋袋:

38、在不重复抽样的条件下10001.99252510000252100002222222222222zNzNnx(件)重复重复10010000/1001100/1Nnnn)(40045. 033tsnt45. 0214 .102-6 .100,%73.999 . 05 .1019 . 05 .101)(9 . 03 . 03),( 3 . 010033 5 .101, 3%3.7991,100222222瓶片,根据,即来的如果允许误差减少到原之间。量在成品库该药平均每瓶数的概率保证下在片片,解:已知xnsttnsnsxtnxxxxxx某药厂为了检查瓶装药品数量,从成品库随机抽检某药厂为了检查瓶装药

39、品数量,从成品库随机抽检100100瓶,结果平均每瓶瓶,结果平均每瓶101.5101.5片,标准差为片,标准差为3 3片。是以片。是以99.73%99.73%的把握的把握程度推断成品库该种药平均每瓶数量的置信区间,如果允许误程度推断成品库该种药平均每瓶数量的置信区间,如果允许误差减少到原来差减少到原来1 12 2,其他条件不变,问需要抽取多少瓶?,其他条件不变,问需要抽取多少瓶?确确定定方方法法1.1.重复抽样条件下:重复抽样条件下:,122nzzpp2221pzn通常的做法是先确定置通常的做法是先确定置信水平,然后限定边际信水平,然后限定边际误差(一般少于误差(一般少于0.1)。)。计算结果

40、通常向上进位计算结果通常向上进位 通常未知。一般按以下通常未知。一般按以下方法确定其估计值:方法确定其估计值:过过去的经验数据;去的经验数据;试验调试验调查样本的查样本的 ;取方差取方差的最大值的最大值0.25,0.25,即即=0.5=0.52p2ps估计总体比例时样本容量的确定估计总体比例时样本容量的确定 ,1122Nnnzzpp2.2.不重复抽样条件下:不重复抽样条件下:确确定定方方法法NnnzNNznp/11122222重复重复根据以根据以往的生产统计,往的生产统计,某种产品的合格某种产品的合格率约为率约为90%90%,现,现要求边际误差为要求边际误差为5%5%,在求,在求95%95%的的置信区间时,应置信区间时,应抽取多少个产品抽取多少个产品作为样本?作为样本? 解解: :已知=90%,=0.05, Z/2=1.96, =5%应抽取应抽取139139个产品作为样本个产品作为样本p【例】【例】某企业对一批总数为某企业对一批总数为50005000件的产品进行质件的产品进行质量检查,过去几次同类调查所得的产品合格率为量检查,过去几次同类调查所得的产品合格率为9393

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论