六西格玛之分析阶段 S8 45 置信区间 课件_第1页
六西格玛之分析阶段 S8 45 置信区间 课件_第2页
六西格玛之分析阶段 S8 45 置信区间 课件_第3页
六西格玛之分析阶段 S8 45 置信区间 课件_第4页
六西格玛之分析阶段 S8 45 置信区间 课件_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

置信区间

(ConfidenceIntervals)

置信区间

(ConfidenceIntervals)DefineMeasureAnalyzeImproveControlStep8-Data分析Step9-VitalFewX’的选定

多变量研究

中心极限定理

假设检验

置信区间

方差分析,均值检验

卡方检验

相关/回归分析Step7-Data收集路径位置理论课DefineMeasureAnalyzeImproveCon目录置信区间介绍

总体均值的置信区间总体标准差的置信区间Cp的置信区间置信区间例题目录置信区间介绍抽样估计:

根据样本提供的信息对总体的某些特征进行估计或推断。估计量或统计量:用来估计总体特征的的样本指标;总体参数:待估计的总体指标。所以对总体数字特征的抽样估计也叫参数估计。可分为:点估计和区间估计。总体样本抽取样本零假设备择假设P-value预测总体特征统计性推断总体参数统计量参数估计抽样估计:总体样本抽取样本零假设预测总体特征统计性推断总体区间估计:根据样本估计量以一定可靠程度推断总体参数所在的区间范围。这种估计方法不仅以样本估计量为依据,而且考虑了估计量的分布,所以它能给出估计精度,也能说明估计结果的把握程度。利用基于统计学的置信区间来量化样本的不确定性

区间估计:利用基于统计学的置信区间来量化样本的不确定性设总体参数为θ,θL、θ

U为样本确定的两个样本量,对于给定的α(0<α<1),有P(θL

≤θ≤θ

U)=1-α则称(θL,θ

U)为参数θ的置信度为1-α的置信区间。该区间的两个端点θL、θ

U分别称为置信下限和置信上限,通称为置信限。

α为显著性水平;1-α则称为置信度,

置信区间的定义设总体参数为θ,θL、θU为样本确定的两个样本量,置它表示区间估计的可靠程度或把握程度,也即所估计的区间包含总体真实的可能性。置信度为1-α的置信区间也就表示以1-α的可能性(概率)包含了未知总体参数的区间。置信区间的直观意义为:若作多次同样的抽样,将得到多个置信区间,那么其中有的区间包含了总体参数的真值,有点区间却未包含总体参数的真值。平均说来,包含总体参数真值的区间有(1-α)*100%,反之有α*100%的区间未包含总体参数真值。置信区间的意义它表示区间估计的可靠程度或把握程度,也即所估计的区间包含绝大多数情况下,我们计算95%的置信区间(CI)

这可解释为

100中大约95的CI将包含总体参数,或者我们95%确信总体参数在此区间内反观以前,我们看到大约95%的样本平均在总体平均的2倍标准差内(正态分布时

Z=±2s内的概率约为95%.)如果我们从一个工程中随机抽取一个样本并计算其平均值时,我们确信其样本的均值包含在总体中的概率是95%.

95%的置信区间绝大多数情况下,我们计算95%的置信区间(CI)95%的置求参数置信区间时可参考下面的通用格式:

置信区间=统计量±K*(标准误差)这里,统计量=均值、方差、Cp等K=基于某统计分布的常数置信区间反映我们的点估计的样本与样本间的散布我们将考虑如下的置信区间:1)总体均值u的置信区间;

2)总体方差σ的置信区间;

3)工程能力Cp的置信区间;

4)总体比例P的置信区间;置信区间介绍求参数置信区间时可参考下面的通用格式:置信区间介绍1-1)总体方差已知时,正态总体均值的区间估计1)总体均值的置信区间xZxZ-££+aas()m//22xs()x[一般公式]其中x称为样本均值;

称为对应于a/2的Z值;称为抽样平均误差;

称为抽样极限误差(△x)Za/2s(x)Za/2s(x)1-1)总体方差已知时,正态总体均值的区间估计1)总体均值的[例题1]

某企业从长期实践得知,其产品直径X是一个随机变量,服从标准差为0.05的正态分布。从某日产品中随机抽取6个,测得其直径分别为14.8,15.3,15.1,15,14.7,15.1(单位:厘米)。在0.95的置信度下,试求该产品直径的均值的置信区间。[Minitab解法]①将题中的6个数据输入到Minitab中的C1列②路径:统计→基本统计→单样本Z…③输入相关参数(参考右图)[例题1]某企业从长期实践得知,其产品直径X是④输出结果:⑤结论:该产品直径的均值置信区间为(14.96,15.04)cm

平均值变量N平均值标准差标准误95%置信区间C1615.00000.21910.0204(14.9600,15.0400)当样本容量相当大时,即使总体分布形式未知或总体为非正态分布,根据定理,样本均值近似服从正态分布,因此估计总体均值的方法与上述方法相同;大样本情况下,当总体方差未知而用样本方差代替时,由于t分布可用正态分布近似,所以对总体均值的估计也采用上述方法。[注意]④输出结果:[例题2]

某企业生产某种产品的工人有1000人,某日采用不重复抽样从中随机抽取100人调查他们的当日产量,样本人均产量为35件,产量的样本标准差为4.5件,试以95.5%的置信度估计平均产量的置信区间。[Minitab解法]①打开Minitab②路径:统计→基本统计量→单样本Z…[例题2]某企业生产某种产品的工人有1000人④输出结果:⑤结论:平均产量的均值置信区间为(34.0979,35.9021

)件

平均值

N平均值标准误95.5%置信区间10035.0000.450(34.098,35.902)③输入相关参数(参考下图)④输出结果:平均值1-2)总体方差未知时,正态总体均值的区间估计(小样本)[一般公式]其中x称为样本均值;

称为对应于a/2,自由度为n-1的的t值;称为抽样极限误差(△x)ta/2,n-1SSta/2,n-1sn1-2)总体方差未知时,正态总体均值的区间估计(小样本)[[例题3]

某食品厂从一批袋装食品中随机抽取10袋,测得每袋重量(单位:克)分别为789、780、794、762、802、813、770、785、810、806,要求以95%的把握程度,估计这批食品的平均每袋重量的区间范围及其允许误差。[Minitab解法]①将题中的10个数据输入到Minitab中的C1列②路径:统计→基本统计量→单样本t…[例题3]某食品厂从一批袋装食品中随机抽取10③输入相关参数(参考右图)④输出结果:⑤结论:该产品每袋重量的均值置信区间为(778.841,803.359

)克;

允许误差:2.262*5.419=12.26(克)

平均值变量N平均值标准差标准误95%置信区间C110791.1017.145.42(778.84,803.36)③输入相关参数(参考右图)2)总体标准差的置信区间[一般公式](小样本)其中s称为样本标准差;

称为对应于a/2的Chi-Square值;称为自由度;χ2a/2n-1//scsscaann-££--1122122SS2)总体标准差的置信区间[一般公式](小样本)其中s假设我们获得一个16个数据点的样本,得到的标准偏差为1.66。自由度(为16-1或15。Sigma的95%(=.05)置信区间是:

假设我们获得一个16个数据点的样本,得到的标准[例题4]

用[例题3]的10个数据求标准差的置信区间[Minitab解法]①将题中的10个数据输入到Minitab中的C1列②路径:统计→基本统计量→图形化汇总…[例题4]用[例题3]的10个数据求标准差的置信区间④结论:样本的标准差是

17.14,总体标准差的95%的置信区间在

11.79和31.78之间。③输出结果④结论:样本的标准差是17.14,总体标准差的95%的Cpn-1CpCpn-11-/2,n-12/2,n-12ccaa££

Cpn-1CpCpn-11-/2,n-12/2,n-12ccaa££这就是说,我们有95%把握说真实的Cp值在1.57和3.01之间Cp=2.29(n=20)的95%置信区间计算如右:

3)工程能力Cp的置信区间[一般公式]Cpn-1CpCpn-11-/2,n-12/2,n-12cc我们将定义一个过程,其目标值为70,USL=100,LSL=40.班上的每个人都从一个平均值=70,标准差=10的分布中产生20个随机正态数字假设我们的“真实的”Cp=1.00.产生数据后,先用Minitab计算出Cp;再用前面的公式计算Cp的95%置信区间;假设班里的人数为50,我们期待至少一个CI不包含1.00准备发表你的结果

Cp的置信区间Minitab模拟我们将定义一个过程,其目标值为70,USL=100,LSL=1.产生20个随机数据,并保存在C12.求其工程能力1.产生20个随机数据,并保存在C13.统计→基本统计量→图形化汇总4.求总体标准差的置信区间的上限和下限.3.统计→基本统计量→图形化汇总总体标准差的置信区间

下限Sigma上限样本大小8.689

11.42516.68720CCpBestCase)(WorstCase)p(=-==-=100406*8.6891.15100400.599现在我们可以使用这些估计的上下限来计算Cp的置信区间了

我们看到这是一个包含1.00的实际Cp95%的置信区间

5.求Cp的置信区间6*16.687总体标准差的置信区间CCpBestCase)(Worst4)总体比率(或比例)P的置信区间pZpZ-££+aas()P//22ps()p[一般公式]其中p称为样本比例;

称为抽样极限误差(△p)Za/2s(p)4)总体比率(或比例)P的置信区间pZpZ-££+aas([例题5]

某厂对一批产品的质量进行抽样检验,采用重复抽样抽取样品200只,样本良品率为85%,试计算当把握程度为90%时良品率的区间范围。[公式求法]已知:n=200,p=0.85,1-a=0.90,Za/2=1.645则将上面的数字代入公式中,得总体良品率P的置信度为90%的置信区间为:85%-4.15%≤P≤85%+4.15%;即为(80.85%,89.15%)[例题5]某厂对一批产品的质量进行抽样检验,采1.在班上随机选了10名学员,调查他们考试总成绩的结果参考下面的数据。

求总体均值的95%置信区间。730,640,540,880,710,660,890,910,430,5902.对某公司的未婚员工的月平均收入进行调查的数据如下。求出月平均的

收入的标准差的95%置信区间。(单位元)825,500,450,280,920,1010,590,770,860,740[置信区间的课堂练习]1.在班上随机选了10名学员,调查他们考试总成绩的结果参考置信区间

(ConfidenceIntervals)

置信区间

(ConfidenceIntervals)DefineMeasureAnalyzeImproveControlStep8-Data分析Step9-VitalFewX’的选定

多变量研究

中心极限定理

假设检验

置信区间

方差分析,均值检验

卡方检验

相关/回归分析Step7-Data收集路径位置理论课DefineMeasureAnalyzeImproveCon目录置信区间介绍

总体均值的置信区间总体标准差的置信区间Cp的置信区间置信区间例题目录置信区间介绍抽样估计:

根据样本提供的信息对总体的某些特征进行估计或推断。估计量或统计量:用来估计总体特征的的样本指标;总体参数:待估计的总体指标。所以对总体数字特征的抽样估计也叫参数估计。可分为:点估计和区间估计。总体样本抽取样本零假设备择假设P-value预测总体特征统计性推断总体参数统计量参数估计抽样估计:总体样本抽取样本零假设预测总体特征统计性推断总体区间估计:根据样本估计量以一定可靠程度推断总体参数所在的区间范围。这种估计方法不仅以样本估计量为依据,而且考虑了估计量的分布,所以它能给出估计精度,也能说明估计结果的把握程度。利用基于统计学的置信区间来量化样本的不确定性

区间估计:利用基于统计学的置信区间来量化样本的不确定性设总体参数为θ,θL、θ

U为样本确定的两个样本量,对于给定的α(0<α<1),有P(θL

≤θ≤θ

U)=1-α则称(θL,θ

U)为参数θ的置信度为1-α的置信区间。该区间的两个端点θL、θ

U分别称为置信下限和置信上限,通称为置信限。

α为显著性水平;1-α则称为置信度,

置信区间的定义设总体参数为θ,θL、θU为样本确定的两个样本量,置它表示区间估计的可靠程度或把握程度,也即所估计的区间包含总体真实的可能性。置信度为1-α的置信区间也就表示以1-α的可能性(概率)包含了未知总体参数的区间。置信区间的直观意义为:若作多次同样的抽样,将得到多个置信区间,那么其中有的区间包含了总体参数的真值,有点区间却未包含总体参数的真值。平均说来,包含总体参数真值的区间有(1-α)*100%,反之有α*100%的区间未包含总体参数真值。置信区间的意义它表示区间估计的可靠程度或把握程度,也即所估计的区间包含绝大多数情况下,我们计算95%的置信区间(CI)

这可解释为

100中大约95的CI将包含总体参数,或者我们95%确信总体参数在此区间内反观以前,我们看到大约95%的样本平均在总体平均的2倍标准差内(正态分布时

Z=±2s内的概率约为95%.)如果我们从一个工程中随机抽取一个样本并计算其平均值时,我们确信其样本的均值包含在总体中的概率是95%.

95%的置信区间绝大多数情况下,我们计算95%的置信区间(CI)95%的置求参数置信区间时可参考下面的通用格式:

置信区间=统计量±K*(标准误差)这里,统计量=均值、方差、Cp等K=基于某统计分布的常数置信区间反映我们的点估计的样本与样本间的散布我们将考虑如下的置信区间:1)总体均值u的置信区间;

2)总体方差σ的置信区间;

3)工程能力Cp的置信区间;

4)总体比例P的置信区间;置信区间介绍求参数置信区间时可参考下面的通用格式:置信区间介绍1-1)总体方差已知时,正态总体均值的区间估计1)总体均值的置信区间xZxZ-££+aas()m//22xs()x[一般公式]其中x称为样本均值;

称为对应于a/2的Z值;称为抽样平均误差;

称为抽样极限误差(△x)Za/2s(x)Za/2s(x)1-1)总体方差已知时,正态总体均值的区间估计1)总体均值的[例题1]

某企业从长期实践得知,其产品直径X是一个随机变量,服从标准差为0.05的正态分布。从某日产品中随机抽取6个,测得其直径分别为14.8,15.3,15.1,15,14.7,15.1(单位:厘米)。在0.95的置信度下,试求该产品直径的均值的置信区间。[Minitab解法]①将题中的6个数据输入到Minitab中的C1列②路径:统计→基本统计→单样本Z…③输入相关参数(参考右图)[例题1]某企业从长期实践得知,其产品直径X是④输出结果:⑤结论:该产品直径的均值置信区间为(14.96,15.04)cm

平均值变量N平均值标准差标准误95%置信区间C1615.00000.21910.0204(14.9600,15.0400)当样本容量相当大时,即使总体分布形式未知或总体为非正态分布,根据定理,样本均值近似服从正态分布,因此估计总体均值的方法与上述方法相同;大样本情况下,当总体方差未知而用样本方差代替时,由于t分布可用正态分布近似,所以对总体均值的估计也采用上述方法。[注意]④输出结果:[例题2]

某企业生产某种产品的工人有1000人,某日采用不重复抽样从中随机抽取100人调查他们的当日产量,样本人均产量为35件,产量的样本标准差为4.5件,试以95.5%的置信度估计平均产量的置信区间。[Minitab解法]①打开Minitab②路径:统计→基本统计量→单样本Z…[例题2]某企业生产某种产品的工人有1000人④输出结果:⑤结论:平均产量的均值置信区间为(34.0979,35.9021

)件

平均值

N平均值标准误95.5%置信区间10035.0000.450(34.098,35.902)③输入相关参数(参考下图)④输出结果:平均值1-2)总体方差未知时,正态总体均值的区间估计(小样本)[一般公式]其中x称为样本均值;

称为对应于a/2,自由度为n-1的的t值;称为抽样极限误差(△x)ta/2,n-1SSta/2,n-1sn1-2)总体方差未知时,正态总体均值的区间估计(小样本)[[例题3]

某食品厂从一批袋装食品中随机抽取10袋,测得每袋重量(单位:克)分别为789、780、794、762、802、813、770、785、810、806,要求以95%的把握程度,估计这批食品的平均每袋重量的区间范围及其允许误差。[Minitab解法]①将题中的10个数据输入到Minitab中的C1列②路径:统计→基本统计量→单样本t…[例题3]某食品厂从一批袋装食品中随机抽取10③输入相关参数(参考右图)④输出结果:⑤结论:该产品每袋重量的均值置信区间为(778.841,803.359

)克;

允许误差:2.262*5.419=12.26(克)

平均值变量N平均值标准差标准误95%置信区间C110791.1017.145.42(778.84,803.36)③输入相关参数(参考右图)2)总体标准差的置信区间[一般公式](小样本)其中s称为样本标准差;

称为对应于a/2的Chi-Square值;称为自由度;χ2a/2n-1//scsscaann-££--1122122SS2)总体标准差的置信区间[一般公式](小样本)其中s假设我们获得一个16个数据点的样本,得到的标准偏差为1.66。自由度(为16-1或15。Sigma的95%(=.05)置信区间是:

假设我们获得一个16个数据点的样本,得到的标准[例题4]

用[例题3]的10个数据求标准差的置信区间[Minitab解法]①将题中的10个数据输入到Minitab中的C1列②路径:统计→基本统计量→图形化汇总…[例题4]用[例题3]的10个数据求标准差的置信区间④结论:样本的标准差是

17.14,总体标准差的95%的置信区间在

11.79和31.78之间。③输出结果④结论:样本的标准差是17.14,总体标准差的95%的Cpn-1CpCpn-11-/2,n-12/2,n-12ccaa££

Cpn-1CpCpn-11-/2,n-12/2,n-12ccaa££这就是说,我们有95%把握说真实的Cp值在1.57和3.01之间Cp=2.29(n=20)的95%置信区间计算如右:

3)工程能力Cp的置信区间[一般公式]Cpn-1CpCpn-11-/2,n-12/2,n-12cc我们将定义一个过程,其目标值为70,USL=100,LSL=40.班上的每个人都从一个平均值=70,标准差=10的分布中产生20个随机正态数字假设我们的“真实的”Cp=1.00.产生数据后,先用Minitab计算出Cp;再用前面的公式计算Cp的95%置信区间;假设班里的人数为50,我们期待至少一个CI不包含1.00

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论