六西格玛分析之置信区间_第1页
六西格玛分析之置信区间_第2页
六西格玛分析之置信区间_第3页
六西格玛分析之置信区间_第4页
六西格玛分析之置信区间_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、置信区间置信区间 -1-本资料来源本资料来源置信区间置信区间 -2-置信区间置信区间 -3-Step 8- Data 分析分析Step 9- Vital Few X的选定的选定q 多多变变量量研研究究q 中心中心极极限定理限定理q 假假设检验设检验q 置信置信区间区间q 方差分析,均方差分析,均值检验值检验q 卡方卡方检验检验q 相相关关/回回归归分析分析Step 7- Data 收集收集路径位置路径位置理论课理论课置信区间置信区间 -4-目录目录置信区间置信区间 -5-u抽样估计:抽样估计: 根据样本提供的信息对总体的某些特征进行估计或推断。 估计量或统计量: 用来估计总体特征的的样本指标;

2、 总体参数:待估计的总体指标。 所以对总体数字特征的抽样估计也叫参数估计。所以对总体数字特征的抽样估计也叫参数估计。 可分为:点估计和区间估计。可分为:点估计和区间估计。总体总体样本样本抽取样本抽取样本零假设零假设备择假设备择假设P-valueP-value预测总体特征预测总体特征统计性推断统计性推断总体参数总体参数统计量统计量参数估计参数估计置信区间置信区间 -6-l区间估计区间估计:根据样本估计量以一定可靠程度推断总体参数所在的区间范围。根据样本估计量以一定可靠程度推断总体参数所在的区间范围。这种估计方法不仅以样本估计量为依据,而且考虑了估计量的分布,所以它能给出估计精度,也能说明估计结果

3、的把握程度。利用基于统计学的置信区间来量化样本的不确定性利用基于统计学的置信区间来量化样本的不确定性 置信区间置信区间 -7-设总体参数为设总体参数为 , L、 U为样本确定的两个样本量,为样本确定的两个样本量,对于给定的对于给定的( 0 1),有),有 P( L U ) = 1- 则称(则称( L , U )为参数)为参数的置信度为的置信度为1- 的的置信区间置信区间。该区间的两个端点该区间的两个端点L 、 U分别称为置信下限和置信上限,分别称为置信下限和置信上限, 通称为置信限。通称为置信限。 为显著性水平;为显著性水平; 1- 则称为置信度,则称为置信度, l置信区间的定义置信区间的定义

4、置信区间置信区间 -8- 它表示区间估计的可靠程度或把握程度,也即所估计的区间包含总体真它表示区间估计的可靠程度或把握程度,也即所估计的区间包含总体真实的可能性。实的可能性。 置信度为置信度为1-1-的置信区间也就表示以的置信区间也就表示以1-1-的可能性(概率)包含了未知的可能性(概率)包含了未知总体参数的区间。总体参数的区间。 置信区间的置信区间的直观意义直观意义为:为: 若作多次同样的抽样,将得到多个置信区间,那么其中有的区间包含若作多次同样的抽样,将得到多个置信区间,那么其中有的区间包含了总体参数的真值,有点区间却未包含总体参数的真值。平均说来,包含了总体参数的真值,有点区间却未包含总

5、体参数的真值。平均说来,包含总体参数真值的区间有(总体参数真值的区间有(1-1-)* *100%100%,反之有,反之有* *100%100%的区间未包含总体的区间未包含总体参数真值。参数真值。l置信区间的意义置信区间的意义置信区间置信区间 -9-u绝大多数情况下,我们计算95%的置信区间(CI) u这可解释为 -100中大约95的CI将包含总体参数,或者 -我们95%确信总体参数在此区间内u反观以前,我们看到大约95%的样本平均在总体平均的2倍标准差内 (正态分布时 Z= 2s内的概率约为95%.)u如果我们从一个工程中随机抽取一个样本并计算其平均值时,我们确信其样本的均值包含在总体中的概率

6、是95%. l95%的置信区间的置信区间置信区间置信区间 -10-求参数置信区间时可参考下面的通用格式:求参数置信区间时可参考下面的通用格式: 置信区间置信区间= 统计量统计量K*(标准误差)(标准误差) 这里,统计量这里,统计量 = 均值、方差、均值、方差、Cp等等 K = 基于某统计分布的常数基于某统计分布的常数置信区间反映我们的点估计的样本与样本间的散布置信区间反映我们的点估计的样本与样本间的散布 我们将考虑如下的置信区间:我们将考虑如下的置信区间: 1 1)总体均值)总体均值u u的置信区间;的置信区间; 2 2)总体方差)总体方差的置信区间;的置信区间; 3 3)工程能力)工程能力C

7、pCp的置信区间;的置信区间; 4 4)总体比例)总体比例P P的置信区间;的置信区间;置信区间介绍置信区间介绍置信区间置信区间 -11-1-11-1)总体方差)总体方差已知已知时,正态总体均值的区间估计时,正态总体均值的区间估计xZxZ-+aas( )m/22 x s( ) x 一般公式一般公式 其中其中 x 称为样本均值称为样本均值; 称为对应于称为对应于a/2的的Z Z值值; ; 称为抽样平均误差称为抽样平均误差; ; 称为抽样极限误差称为抽样极限误差( (x)Za/2s( x )Za/2s( x )置信区间置信区间 -12- 例题例题1 某企业从长期实践得知,其产品直径某企业从长期实践

8、得知,其产品直径X X是一个随机变量,服从是一个随机变量,服从标准差为标准差为0.050.05的正态分布。从某日产品中随机抽取的正态分布。从某日产品中随机抽取6 6个,测得其直个,测得其直径分别为径分别为14.814.8,15.315.3,15.115.1,1515,14.714.7,15.115.1(单位:厘米)。(单位:厘米)。在在0.950.95的置信度下,试求该产品直径的均值的置信区间。的置信度下,试求该产品直径的均值的置信区间。 Minitab解法解法 将题中的将题中的6 6个数据输入到个数据输入到MinitabMinitab中的中的C1C1列列路径:统计路径:统计基本统计基本统计单

9、样本单样本ZZ输入相关参数(参考右图)输入相关参数(参考右图)置信区间置信区间 -13-输出结果:输出结果:结论:该产品直径的均值置信区间为(结论:该产品直径的均值置信区间为(14.96, 15.04)cm 平均平均值值变变量量 N 平均平均值值 标标准差准差 标标准准误误 95% 置信置信区间区间C1 6 15.0000 0.2191 0.0204 (14.9600, 15.0400) 当样本容量相当大时,即使总体分布形式未知或总体为非正态分当样本容量相当大时,即使总体分布形式未知或总体为非正态分布,根据定理,样本均值近似服从正态分布,因此估计总体均值的布,根据定理,样本均值近似服从正态分布

10、,因此估计总体均值的方法与上述方法相同;方法与上述方法相同; 大样本情况下,当总体方差未知而用样本方差代替时,由于大样本情况下,当总体方差未知而用样本方差代替时,由于t分分布可用正态分布近似,所以对总体均值的估计也采用上述方法。布可用正态分布近似,所以对总体均值的估计也采用上述方法。 注意注意 置信区间置信区间 -14- 例题例题2 某企业生产某种产品的工人有某企业生产某种产品的工人有10001000人,某日采用不重复抽样人,某日采用不重复抽样从中随机抽取从中随机抽取100100人调查他们的当日产量,样本人均产量为人调查他们的当日产量,样本人均产量为3535件,件,产量的样本标准差为产量的样本

11、标准差为4.54.5件,试以件,试以95.5%95.5%的置信度估计平均产量的的置信度估计平均产量的置信区间。置信区间。 Minitab解法解法 打开打开MinitabMinitab路径:统计路径:统计基本统计量基本统计量单样本单样本ZZ置信区间置信区间 -15-输出结果:输出结果:结论:平均产量的均值置信区间为(结论:平均产量的均值置信区间为( 34.0979, 35.9021 )件)件 平均平均值值 N 平均平均值值 标标准准误误 95.5% 置信置信区间区间100 35.000 0.450 (34.098, 35.902)输入相关参数(参考下图)输入相关参数(参考下图)置信区间置信区间

12、-16-1-21-2)总体方差)总体方差未知未知时,正态总体均值的区间估计(小样本)时,正态总体均值的区间估计(小样本) 一般公式一般公式 其中其中 x 称为样本均值称为样本均值; 称为对应于称为对应于a/2,自由度为自由度为n-1n-1的的的的 t 值值; ; 称为抽样极限误差称为抽样极限误差( (x)ta/2,n-1xtnxtnnn-+-aasms/ ,/ ,2121SSta/2,n-1sn置信区间置信区间 -17- 例题例题3 某食品厂从一批袋装食品中随机抽取某食品厂从一批袋装食品中随机抽取1010袋,测得每袋重量(单袋,测得每袋重量(单位:克)分别为位:克)分别为789789、7807

13、80、794794、762762、802802、813813、770770、785785、810810、806806,要求以,要求以95%95%的把握程度,估计这批食品的平均每袋重量的区间的把握程度,估计这批食品的平均每袋重量的区间范围及其允许误差。范围及其允许误差。 Minitab解法解法 将题中的将题中的1010个数据输入到个数据输入到MinitabMinitab中的中的C1C1列列路径:统计路径:统计基本统计量基本统计量单样本单样本tt置信区间置信区间 -18-输入相关参数(参考右图)输入相关参数(参考右图)输出结果:输出结果:结论:该产品每袋重量的均值置信区间为(结论:该产品每袋重量的

14、均值置信区间为( 778.841, 803.359 )克;)克; 允许误差:允许误差:2.262 2.262 * * 5.419 = 12.26(克)(克) 平均平均值值变变量量 N 平均平均值值 标标准差准差 标标准准误误 95% 置信置信区间区间C1 10 791.10 17.14 5.42 (778.84, 803.36)置信区间置信区间 -19- 一般公式一般公式 (小样本)(小样本)其中其中 s 称为样本标准差称为样本标准差; 称为对应于称为对应于a/2的的Chi-Square值值; ; 称为自由度称为自由度; ;2a/2n-1/scsscaann-1122122SS置信区间置信区间

15、 -20-123257.s16616 116616 116616 116616 116616 1274916616 162605 22105 2202529752././.-csccscs 假设我们获得一个假设我们获得一个16个数据点的样本,得到的标准偏差为个数据点的样本,得到的标准偏差为1.66。自由度自由度()为为16-1 或或 15。 Sigma的的 95% (a a = .05)置信区间是:置信区间是: 置信区间置信区间 -21- 例例题题4 Minitab解法解法 将题中的将题中的1010个数据输入到个数据输入到MinitabMinitab中的中的C1C1列列路径:统计路径:统计基本

16、统计量基本统计量图图形化形化汇总汇总置信区间置信区间 -22-810800790780770760中位数平均值805800795790785780775第一四分位数777.50中位数791.50第三四分位数807.00最大值813.00778.84803.36776.58807.3711.7931.28A 平方0.19P 值0.869平均值791.10标准差17.14方差293.66偏度-0.379718峰度-0.914935N10最小值762.00Anderson-Darling 正态性检验95% 平均值置信区间95% 中位数置信区间95% 标准差置信区间9 95 5% % 置置信信区区间间

17、C C1 1 摘摘要要结论:样本的标准差是结论:样本的标准差是 17.1417.14 , , 总体标准差的总体标准差的95%95%的置信区间在的置信区间在 11.7911.79和和31.7831.78之间。之间。输出结果输出结果置信区间置信区间 -23-Cpn-1CpCpn-11- /2,n-12/2,n-12ccaa Cpn-1CpCpn-11-/2,n-12/2,n-12ccaa229191922989119328519157975192025192.,.,ccCP2.29 CP2.29 Cp3.01这就是说,我们有这就是说,我们有 95% 把握说真实的把握说真实的 Cp 值在值在1.57

18、 和和 3.01之间之间Cp=2.29 (n=20) 的的 95% 置信区间计算如右:置信区间计算如右: /2 -1-n 21,21,1的百分数上限和下限平方分布的的是自由度为和其中acccaa-nn 一般公式一般公式 置信区间置信区间 -24-v我们将定义一个过程,其目标值为我们将定义一个过程,其目标值为7070,USL=100USL=100,LSL=40. LSL=40. v班上的每个人都从一个平均值班上的每个人都从一个平均值=70=70,标准差,标准差=10=10的分布中产生的分布中产生 20 20个随机正态数字个随机正态数字 v假设我们的假设我们的“真实的真实的”Cp = 1.00.C

19、p = 1.00.v产生数据后,先用产生数据后,先用MinitabMinitab计算出计算出CpCp; v再用前面的公式计算再用前面的公式计算 CpCp的的95%95%置信区间;置信区间;v假设班里的人数为假设班里的人数为 50 50,我们期待至少一个,我们期待至少一个 CI CI 包含包含1.00 1.00 v准备发表你的结果准备发表你的结果 置信区间置信区间 -25-100908070605040LSLUSLLSL40目标*USL100样本均值68.7953样本 N20标准差(组内)14.7561标准差(整体)11.4249过程数据Cp0.68CPL0.65CPU0.70Cpk0.65Pp

20、0.88PPL0.84PPU0.91Ppk0.84Cpm*整体能力潜在(组内)能力PPM USL0.00PPM 合计0.00实测性能PPM USL17227.49PPM 合计42730.98预期组内性能PPM USL3154.32PPM 合计9015.42预期整体性能组内整体C C1 1 的的 过过 程程 能能 力力1. 1. 产生产生2020个随机数据,并保存在个随机数据,并保存在C1C12. 2. 求其工程能力求其工程能力置信区间置信区间 -26-80706050中位数平均值75.072.570.067.565.062.560.0第一四分位数60.558中位数68.902第三四分位数79.653最大值87.14563.44874.14260.98972.8228.68916.687A 平方0.39P 值0.346平均值68.795标准差11.425方差130.528偏度0.123551峰度-0.887528N20最小值49.512Anderson-Darling 正态性检验95% 平均值置信区间95% 中位数置信区间95% 标准差置信区间9 95 5% % 置置信信区区间间C C1 1 摘摘要要3. 统计统计 基本基本统计统计量量图图形化形化汇总汇总4.4.求总体标准差的置信区间的上限和下限求总体标准差的置信区间的上限和下限. .置信区间置信区间 -27-总体标

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论