双样本置信区间和假设检验_第1页
双样本置信区间和假设检验_第2页
双样本置信区间和假设检验_第3页
双样本置信区间和假设检验_第4页
双样本置信区间和假设检验_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

双样本置信区间和假设检验第1页/共53页第4部分:

双样本置信区间和假设检验第2页/共53页第4部分:双样本置信区间和假设检验目的:目标:比较方差,采用F-检验法、Bartlett检验法和Levene检验法。比较平均值,采用双样本置信区间和假设检验。理解统计重要性和实际重要性之间的区别。本章的目的是使用假设检验来检查两个总体的平均值和方差之间的差异是否存在统计显著性。第3页/共53页位于洗衣机上的传动装置的总高度将影响制动性能。我们所关心的CTQ是总高度,目标值=5.394英寸。有8个不同的固定架用于固定该部件以便加工。您想了解一些什么?

固定架是否为重要的X变量?分析步骤:1.将数据制成图表,并观察差异。

2.使用假设检验和置信区间来确定此差异是否确实存在。3.得出结论。打开Minitab中的文件“lth”

L:\6Sigma\Minitab\Training\Minitab\Session2\lth.mtw举例...第4页/共53页总高度--数据列表第一步--制图数据显示行 设备1 设备2 设备3 设备4 设备5 设备6 设备7 设备8

1 5.390 5.387 5.394 5.388 5.386 5.388 5.388 5.3882 5.389 5.387 5.394 5.389 5.384 5.388 5.389 5.3893 5.390 5.387 5.393 5.388 5.385 5.388 5.388 5.3884 5.389 5.387 5.394 5.390 5.385 5.388 5.388 5.3885 5.388 5.388 5.394 5.389 5.384 5.388 5.388 5.3886 5.391 5.388 5.395 5.392 5.387 5.391 5.391 5.3907 5.391 5.389 5.396 5.391 5.388 5.391 5.392 5.3918 5.391 5.389 5.397 5.391 5.387 5.391 5.391 5.3909 5.391 5.388 5.395 5.391 5.387 5.390 5.389 5.38910 5.389 5.387 5.395 5.390 5.387 5.390 5.389 5.390变量 N 平均值 中值

Tr平均值 标准方差 SE平均值

设备1 10 5.3899 5.3900 5.3900 0.0011 0.0003

设备2 10 5.3877 5.3875 5.3876 0.0008 0.0003

设备3 10 5.3947 5.3945 5.3946 0.0012 0.0004

设备4 10 5.3899 5.3900 5.3899 0.0014 0.0004

设备5 10 5.3860 5.3865 5.3860 0.0014 0.0004

设备6 10 5.3893 5.3890 5.3892 0.0014 0.0004

设备7 10 5.3893 5.3890 5.3891 0.0015 0.0005

设备8 10 5.3891 5.3890 5.3890 0.0011 0.0003第5页/共53页方框图可以提供设备间的差异图设备3和5的

平均值明显不同设备2的标准差

是否不同?从图形中可得出答案。假设检验给出了答案的统计置信度Graph>Boxplot目标值=5.394第6页/共53页观察数据的另一种方式抖动的分布图8765432105.3955.3905.385固定架总高度目标值5.394第7页/共53页采用假设检验法来分析差异是实实在在的还是偶然发生的您想知道什么?1.方差:统计问题--不同固定架方差之间看上去明显的差异是实际存在还是偶然发生的?实际问题--我们是否应该努力制造象2号那样的固定架,以减少方差?2.平均值:统计问题--不同固定架均值之间看上去明显的差异是实际存在还是偶然发生的?实际问题--我们是否应该努力制造象3号那样的固定架,以使它们接近目标值?

第8页/共53页根据您希望比较的内容选择假设检验法采用什么工具确定差异是确实存在,还是偶然发生?比较方差

F检验法(2个方差)

Bartlett检验法(用于正态数据)

Levene检验法(用于非正态数据)比较平均值

双样本t

成对t1.2.第9页/共53页为什么使用假设检验和

置信区间?在六个西格玛项目中,我们使用图形和假设检验来筛选少数关键Xs。假设检验有助于确定差异是确实存在,还是偶然发生。置信区间给出总体值(参数)最可能的取值范围。所有潜在“X”s关键少数

“X”s第10页/共53页为什么使用假设检验和

置信区间?由于所有数据均存在偏差,因此,即使总体是一样的,样本数据也会存在细微差异。让我们来看一看在生成一些随机数据(无规律的数据)时会发生什么情况。1.产生8组随机数据 打开新的工作表: >File>New...>MinitabWorksheet>OK

生成10行数据。保存在c1-c8栏中。 >Calc>Randomdata>Normal 第11页/共53页为什么使用假设检验和

置信区间?2.在一栏中进行叠加。 >Manip>Stack/Unstack>Stack

叠加c1-c8。

将叠加的数据保存在c9。

在10中存储下标。第12页/共53页为什么使用假设检验和

置信区间?3.将数据制图,并寻找差异。 >Graph>Boxplot

制作c9(Y)和c10(X,固定架)的对比图。第13页/共53页为什么使用假设检验和

置信区间?4.

请注意,样本平均值和方差存在着差异,即使所有8组数据都取自同一总体也不例外。第14页/共53页有些统计程序的前提条件是方差相同,而大多数程序对这一假并不敏感,因此,它通常不是我们所关心的问题。如果您利用Minitab进行双样本t检验,它将问您是否假设方差相同。您可以使用方差检验来作出判断。

比较方差何时应该比较方差?如果您对改变了工序,并想确定输出结

果中的方差是否改变,您可以将工序改变

前后的方差进行比较。比较方差--3种方法1. 比较2个方差,假定为正态分布 2. 一次比较多个方差,假定为正态分布。3. 一次比较多个方差,采用非正态数据。F-检验(手动),或Bartlett检验(采用Minitab)Bartlett检验

(Minitab)Levene检验

(Minitab)第15页/共53页手工计算的F-检验(比较2个方差)计算F=s12/s22,其中

s12=两个样本方差中较大的方差,和

s22=两个样本方差中较小的方差如果计算的F值比表格中的F值更大,则否定零假设并接受存在差异举例:比较固定架1和固定架2的方差s1=.00110 固定架1的标准方差s2=.000823 固定架2的标准方差每个样本的容量为10--各自的自由度为9。计算的F=.001102/.0008232=1.79分子的自由度为9、分母的自由度为9的F分布临界值为3.18,由F表格中得出。计算的F值比表格的F值小,因此,无法拒绝方差相等这个零假设。结论:没有足够的证据来以95%的置信度

说明方差已经改变。第16页/共53页F表格分子自由度分子自由度分母自由度第17页/共53页课堂练习:手工计算F-检验

F=s12/s22 其中

s12=

一个分布的方差 (两个样本方差中的较大方差)

s22=另一分布的方差 (两个样本方差中的较小方差)比较固定架7和固定架8的方差s7=.00149 固定架7的标准方差s8=.00110 固定架8的标准方差每个样本的容量为10。分子的自由度是多少?分母的自由度是多少?F表格的临界值是多少?哪个方差值更大,而应置于分子?计算的F是多少?计算的F值是否比表格的F值大?您的结论是什么?您有证据能够以95%的置信度来说明固定架7和固定架8之间的方差不同吗?第18页/共53页方差齐性

Stat>ANOVA>HomogeneityofVarianceBartlett检验法-正态数据

Levene检验法-非正态数据采用Minitab比较方差Ho:12=22=...=k2

p>时无法拒绝HoHa:i2=j2(至少一对)

p<时接受Ha

一般为.05。假设第19页/共53页比较所有8个固定架的方差假设是什么?

Ho:

Ha:单击OK运行命令Stat>ANOVA>HomogeneityofVariance第20页/共53页0.00050.00150.00250.0035西格玛的95%置信区间Bartlett检验法检验统计值:4.298P-值:0.745Levene检验法检验统计值:0.818P-值:0.576因素级别12345678总高度的方差齐性统计结论:我们无法得出8个固定架之间的方差

存在差异的结论。我们在图形中观察到的差异可

能是由于偶然因素而发生的。实际结论:不应该将所有固定架都制造成象设备2

那样来减少方差。方差齐性检验P值>.05,无法拒绝Ho第21页/共53页我们现在转向平均值您希望知道什么?统计问题--固定架之间方差的明显差异是实际存在还是偶然出现的?实际问题--是否应该努力制造3号那样的固定架,以使其均值接近目标值?目标值5.394第22页/共53页现在转向双样本t

单样本比较将一组数据与标准值比较双样本比较

两组数据互相比较BillMarkBillpar第23页/共53页为什么计算置信区间和假设检验?单样本比较将一组数据与标准值比较。双样本比较互相比较两组数据

Ho:m1=m2

或者:

Ho:m1-m2=0如果1-2的置信区间不包括0,则说明m1

和m2之间的差异是显著的。第24页/共53页单击“Graphs”点击两次“OK”运行采用Minitab进行“双样本t”,以比较两个固定架假设是什么?

Ho: Ha:选择Ha

单侧或双侧Stat>BasicStatistic>2-Samplet如果F检验未拒绝

Ho,单击

“AssumeEqualVariance”比较固定架1与固定架3:单击“Boxplotsofdata”第25页/共53页P值

<.05;拒绝Ho

Minitab给出了置信区间和假设检验Ho

和Ha的假设m1-m2的置信区间(不包括0.0)第26页/共53页置信区间的说明平均值差异的最可能估计值为:5.3899-5.3947=-0.0048.实际差异(如果我们包括总体的所有数据)可能大于该值,也可能小于该值。我们有95%的置信度说明实际值在-0.00586和-0.00374之间。这是总体差异的近似值范围(与数据一致的数值)。以这种方式组成的区间中有95%的区间包含实际总体值(您出错的机率是5%。)

0.0不在该区间内,因此,我们可以有力的证明固定架之间的差异确实存在,而不是偶然出现。这意味着我们可以否定2个平均值是相等这一零假设(Ho:m1=m2orm1-m2=0)。第27页/共53页P值<.05;否定HoMinitab给出了置信区间和假设检验固定架1和3的平均值之间确实存在统计差异。固定架是关键X!Ho

和Ha

的假设置信区间(不包括0.0)假设检验的说明

p值小于.05,因此,我们拒绝

Ho,得出结论:2个固定架间差异确实存在,而非偶然发生。

其实,我们有超过99.9%的置信度

相信差异确实存在。计算t的绝对值(|-9.50|=9.50)比表格中自由度为18的值(2.101)大,说明该差异具有统计显著性。第28页/共53页拒绝范围无法拒绝HO表格值(临界值)表格值(临界值)表格值(临界值)表格值(临界值)拒绝范围无法拒绝HO拒绝范围拒绝范围/2/2无法拒绝HO双侧检验单侧右检验单侧左检验注意:备择假设(Ha)决定拒绝范围)单侧和双侧检验Ha:=(不等于)Ha:>(大于)Ha:<(小于)第29页/共53页假设检验双样本t,手工方式...

为了确定统计显著性,将计算的tcalc

与t表格中的t(n1+n2-2,/2)值进行比较。 置信区间

x1是第一个样本的平均值

x2是第一个样本的平均值

n1是样本大小

n2是样本大小

t(n1+n2-2,/2)取自t表格,由自由度

(n1+n2-2),单侧面积 /2决定

sp是合并标准差

sp

是方差的加权平均值。 权数为自由度ni-1。

第30页/共53页计算双样本置信区间并用t检验来比较两个固定架1.固定架1与固定架5的比较置信区间是什么?假设是什么?

Ho: Ha:拒绝标准是什么?可以得出什么结论?2.固定架3与固定架5的比较置信区间是什么?假设是什么?

Ho: Ha:拒绝标准是什么?可以得出什么结论?课堂练习:第31页/共53页统计显著性并非偶然出现的差异。实际重要性差异重要得足以使您采取行动。统计显著性与实际重要性您必须确定具有统计显著性的差异是否具有实际重要性

统计显著性实际重要性

是否

是重要

X可能需要

更多数据

否重要,但不值得改变不是重要X第32页/共53页有关固定架之间差异的结论1. 固定架的方差之间不存在具有统计显著性的差异。图中显示的明显差异可能是偶然出现。2. 固定架1和固定架3的平均值之间存在具有统计显著性的差异。图中所观察到的平均值差异不是偶然出现。注意:通过大量双样本假设检验来比较众多群组(如8个固定架)是不可靠的。共有(8*7)/2=28种可能的假设检验,其中部分差异会由于偶然因素而具有统计显著性。更好的方法是采用方差分析,这将在第7部分介绍。第33页/共53页成对t检验问题:一位操作人员用两种卡钳来进行质量检查。有人问他,两对卡钳是否会影响其检查的准确度。检查员收集了以下数据来回答这一问题:“两个卡钳是否提供同样的测量结果?”

清除Minitab(不要保存!)>Window>Closeallgraphs点击“Data”窗口中的任意位置,然后点击右上角的“X”。在Minitab中打开文件“ttests”L:\6Sigma\Minitab\Training\Minitab\Session2\Ttest.mtw第34页/共53页您的工作表将如下所示:此处键入标题描述性统计VariableNMeanMedianTrMeanStDevSEMeancalip1120.266250.266500.266200.001220.00035calip2120.266000.265500.265900.001760.00051diff120.000250.000500.000400.002010.00058第35页/共53页

为何采用成对t?为何使用?为了降低变异性(部件间的差异)并作出更精确的估测(更小的置信区间)。您希望知道什么?卡钳的测量结果是否相同。何时采用成对检验?对同一件试验单元或在相似条件下进行两次测量。在此例中,对同一部件进行了两次测量。每行数据都有匹配内容时举例:-外罩在喷漆前后的平整度

-话务员在受培训前后的成绩假设

Ho:

1-2=0Ha:

1-2=0Ha:

1-2<0Ha:

1-2>0对于Minitab中的双样本t检验,在各独立栏中输入两次测量结果。第36页/共53页首先将数据绘制成图形差异直方图

(c9)一些差异是正数(卡钳1更高),而一些差异是负数(卡钳2更高)。差异的平均值是否明显不同于0?第37页/共53页首先将数据绘制成图形卡钳2与卡钳1的分布图单击Options添加抖动度第38页/共53页首先将数据绘制成图形卡钳2与卡钳1的分布图单击Frame和Min/Max显示相同的X和Y轴范围第39页/共53页首先将数据绘制成图形卡钳2与卡钳1的分布图具有抖动轴刻度相等均等线卡钳1=卡钳2一些点位于均等线之上和之下。有时卡钳1的测量值更高;有时卡钳2的测量值更高。第40页/共53页下面,利用单样本t检验来检验其差值以比较两个样本的平均值

假设是什么?

Ho: Ha:拒绝的标准是什么?“0”位于C.I.之内;无法拒绝Ho必须使用两种测量方式

的差值来进

单样本t检验我们不能说两个卡钳测量结果的平均值不同Stat>BasicStatistics>1-Samplet置信区间Variable

N

Mean

StDev

SEMean

95.0%CIdiff120.000250.002010.00058(-0.00102,0.00152)第41页/共53页问题

方法平均值的取值范围是什么? 单样本置信区间平均值是否与假设值不同? 单样本假设检验2个平均值之间差异的取值范围 两个平均值之间差异的置是什么? 信区间

两个总体的平均值是否相同? 双样本假设检验对于成对数据,两个样本的平均值 成对t检验,以及差异的是否相同 置信区间。您想知道平均值的哪些内容?第42页/共53页问题说明呼叫中心不可用性的变化范围广,平均值为53%。这导致应答率很低,造成客户不满意。CTQ:

客户关系不可用性测量结果: 每日的不可用时间缺陷:

一日的可用时间>35%单位:

每日,M-F机会:

每日,M-F客户:

呼入的客户课堂练习打开文件CALLCNTRL:6sigma\Minitab\Training\Minitab\Session2\CALLCNTR.mtw使用C2与C6栏中的数据相互比较这三个呼叫中心的不可用性。首先将数据绘制成图形。使用假设检验来确定3个呼叫中心可用性的方差和平均值之间是否存在显著差异。在运行某些例行程序之间,您需要对数据进行“退栈”:>Manip>Stack/Unstack>Unstack在“不可用性”中对数据进行退栈存储在数据栏c14-c16中使用数据栏2中的下标3个呼叫中心1.中心A(24样本)2.中心B(24样本)3.中心C(12样本)第43页/共53页关键概念:-第4部分双样本置信区间和假设检验方差

F-检验是比较2个方差的假设检验在Minitab中,方差检验称为“方差齐性”

Bartlett检验法比较正态数据的方差

Levene检验法比较非正态数据的方差平均值

t-检验用于比较2个数据组的平均值成对t-检验比较数据成对时两个总体的平均值差异置信区间总体参数的取值范围(与数据一致的值)第44页/共53页关键概念:-第4部分双样本置信区间和假设检验

统计风险错误:将实际上相同的东西误认为存在差异(在装配线上拒绝好的部件)风险:产生错误的风险根据惯例,风险为5%(或

=0.05)P值:所观察到的显著性水平。在总体值相同的情况下,观察到存在这么大差异的机率。如果所观察到的显著性水平(“p”)小于可接受的风险(“”),则接受Ha(拒绝Ho)。如果所观察到的显著性水平(“p”)大于可接受的风险(“”),则拒绝Ha(无法拒绝Ho)。第45页/共53页附录第46页/共53页假设检验术语1.零假设(Ho)-不存在变化或差异的命题。如果没有充分的证据拒绝它,就假设这一命题是真的。2.备择假设(Ha)--存在变化或差异的命题。如果拒绝Ho,则认为这一命题是真的。3.一类错误--当Ho实际上为真时而被拒绝所产生的错误,或是接受存在差异、但事实上却没有差异时所犯的错误。4.α风险-出现第一类错误的最大风险或机率。这个机率总是大于零,通常为5%。研究人员决定拒绝Ho所可以接受的最大风险。5.显著水平--同α风险。6.二类错误-当Ho实际上为伪而没有被拒绝所产生的错误,或是接受没有差异、但事实上存在差异时所犯的错误。7.β风险-二类错误出现的风险或机率,或者是说,忽略了问题的有效处理或解决方案。8.显著性差异-用于描述统计假设检验结果的术语,即:差异大得不能合理地归因于偶然因素。

9.功效--统计检验能力,以检查出差异,或正确地拒绝Ho的机率。通常用来确定样本大小是否足以检查出数据之间的差异。10.检验统计值--标准化数值(z、t、F等),代表Ho的可行性,它以已知的方式分布,因此可以确定这种观察值出现的机率。通常,Ho的可行性越高,则检验统计值的绝对值就越小,在这种分布范围内观察到这个值的机率也就越大。第4

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论