




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、双样本置信区间和假设检验概述目的:目的:目标:目标:比较方差,采用 F-检验法、Bartlett检验法和Levene检验法。比较平均值,采用双样本置信区间和假设检验。理解统计重要性和实际重要性之间的区别。本章的目的是使用假设检验假设检验来检查两个总体的平均值和方差之间的差异是否存在统计显著性。位于洗衣机上的传动装置的总高度将影响制动性能。我们所关心的CTQ是总高度总高度,目标值=5.394英寸。有8个不同的固定架用于固定该部件以便加工。您想了解一些什么?固定架是否为重要的固定架是否为重要的X变量?变量?分析步骤:1. 将数据制成图表,并观察差异。 2. 使用假设检验和置信区间来确定此差异是否确
2、实存在。3. 得出结论。打开打开Minitab中的文件中的文件“ lth” L:6SigmaMinitabTrainingMinitabSession 2lth.mtw第一步第一步 - 制图制图数据显示数据显示行设备 1设备 2设备 3设备 4 设备 5设备 6设备 7设备 8 15.3905.3875.3945.3885.3865.3885.3885.388 25.3895.3875.3945.3895.3845.3885.3895.389 35.3905.3875.3935.3885.3855.3885.3885.388 45.3895.3875.3945.3905.3855.3885.3
3、885.388 55.3885.3885.3945.3895.3845.3885.3885.388 65.3915.3885.3955.3925.3875.3915.3915.390 75.3915.3895.3965.3915.3885.3915.3925.391 85.3915.3895.3975.3915.3875.3915.3915.390 95.3915.3885.3955.3915.3875.3905.3895.389 105.3895.3875.3955.3905.3875.3905.3895.390变量N平均值中值Tr平均值标准方差SE平均值设备1105.38995.39005
4、.39000.00110.0003设备2105.38775.38755.38760.00080.0003设备3105.39475.39455.39460.00120.0004设备4105.38995.39005.38990.00140.0004设备5105.38605.38655.38600.00140.0004设备6105.38935.38905.38920.00140.0004设备7105.38935.38905.38910.00150.0005设备8105.38915.38905.38900.00110.0003设备设备3和和5的的平均值明显不同平均值明显不同设备设备2的标准差的标准差是
5、否不同是否不同?从图形中可得出答案。假设检验假设检验给出了答案的统计置信度GraphBoxplot目标值目标值 =5.394观察数据的另一种方式观察数据的另一种方式8765432105.3955.3905.385固定架总高度目标值5.394采用假设检验法来分析差异采用假设检验法来分析差异是实实在在的还是偶然发生的是实实在在的还是偶然发生的1. 方差:方差:统计问题统计问题 -不同不同固定架方差之间看上去明显的差异是实际存在还是固定架方差之间看上去明显的差异是实际存在还是偶然发生的?偶然发生的?实际问题实际问题 - 我们是否应该努力制造象我们是否应该努力制造象2号那样的固定架,以减少方差?号那样
6、的固定架,以减少方差?2. 平均值平均值:统计问题统计问题 -不同不同固定架均值之间看上去明显的差异是实际存在固定架均值之间看上去明显的差异是实际存在还是偶然发生的?还是偶然发生的?实际问题实际问题 - 我们是否应该努力制造象我们是否应该努力制造象3号那样的固定架,以使它们接号那样的固定架,以使它们接近目标值?近目标值? 根据您希望比较的内容选择假设检验法根据您希望比较的内容选择假设检验法比较方差比较方差 F检验法 (2个方差) Bartlett检验法 (用于正态数据) Levene检验法 (用于非正态数据)比较平均值比较平均值 双样本 t 成对t1.2.在六个西格玛项目中,我们使用图形和假设
7、检验来筛选筛选少数关键Xs。假设检验假设检验有助于确定差异是确实存在,还是偶然发生确实存在,还是偶然发生。置信区间置信区间给出总体值(参数)最可能的取值范围。最可能的取值范围。所有 潜在“X”s由于所有数据均存在偏差,因此,即使总体是一样的,样本数据也会存在细微差异。让我们来看一看在生成一些随机数据(无规律的数据)时会发生什么情况。1. 产生产生8组随机数据组随机数据打开新的工作表: File New . . . Minitab Worksheet OK生成10行数据。保存在c1-c8栏中。Calc Random data Normal2.在一栏中进行叠加。在一栏中进行叠加。Manip Sta
8、ck/Unstack Stack叠加c1-c8。将叠加的数据保存在c9。在10中存储下标。3. 将数据制图,并寻找差异将数据制图,并寻找差异。Graph Boxplot制作c9 (Y)和c10 (X, 固定架)的对比图。4.请注意,样本平均值和方差存在着差异,即使所有8组数据都取自同一总体也不例外。有些统计程序的前提条件是方差相同,而大多数程序对这一假并不敏感,因此,它通常不是我们所关心的问题。如果您利用Minitab进行双样本t检验,它将问您是否假设方差相同。您可以使用方差检验来作出判断。 何时应该比较方差?何时应该比较方差?如果您对改变了工序,并想确定输出结果中的方差是否改变,您可以将工序
9、改变前后的方差进行比较。比较方差比较方差 - 3种方法种方法1. 比较2个个 方差,假定为正态正态 分布2. 一次比较多个多个方差,假定为正态正态 分布。3. 一次比较多个多个方差,采用非正态非正态数据。F-检验 (手动),或Bartlett检验(采用Minitab)Bartlett检验 (Minitab)Levene检验 (Minitab)手工计算的手工计算的F-检验检验 (比较2个方差)计算F = s12/s22, 其中 s12 = 两个样本方差中较大的方差,和 s22 = 两个样本方差中较小的方差如果计算的F值比表格中的F值更大,则否定零假设并接受存在差异举例举例: 比较固定架比较固定架
10、1和固定架和固定架2的方差的方差s1 = .00110 固定架1的标准方差s2 = .000823固定架2的标准方差每个样本的容量为10 -各自的自由度为9。计算的F = .001102 / .0008232 = 1.79分子的自由度为9、分母的自由度为9的F分布临界值为3.18 ,由F表格中得出。计算的F值比表格的F值小,因此,无法拒绝方差相等这个零假设。结论:没有足够的证据来以结论:没有足够的证据来以95%的置信度的置信度说明方差已经改变。说明方差已经改变。F表格表格Denom123456789101161.40 199.50 215.70224.60230.20234.00236.802
11、38.90240.50 241.90218.5119.0019.1619.2519.3019.3319.3519.3719.3819.40310.139.559.289.129.018.948.898.858.818.7947.716.946.596.396.266.166.096.046.005.9656.615.795.415.195.054.954.884.824.774.7465.995.144.764.534.394.284.214.154.104.0675.594.744.354.123.973.873.793.733.683.6485.324.464.073.843.693.58
12、3.503.443.393.3595.124.263.863.633.483.373.293.233.183.14104.964.103.713.483.333.223.143.073.022.98114.843.983.593.363.203.093.012.952.902.85124.753.893.493.263.113.002.912.852.802.75134.673.813.413.183.032.922.832.772.712.67144.603.743.343.112.962.852.762.702.652.60154.543.683.293.062.902.792.712.6
13、42.592.54164.493.633.243.012.852.742.662.592.542.49174.453.593.202.962.812.702.612.552.492.45184.413.553.162.932.772.662.582.512.462.41194.383.523.132.902.742.632.542.482.422.38204.353.493.102.872.712.602.512.452.392.35214.323.473.072.842.682.572.492.422.372.32224.303.443.052.822.662.552.462.402.342
14、.30234.283.423.032.802.642.532.442.372.322.27244.263.403.012.782.622.512.422.362.302.25254.243.392.992.762.602.492.402.342.282.24264.233.372.982.742.592.472.392.322.272.22274.213.352.962.732.572.462.372.312.252.20284.203.342.952.712.562.452.362.292.242.19294.183.332.932.702.552.432.352.282.222.18304
15、.173.322.922.692.532.422.332.272.212.16404.083.232.842.612.452.342.252.182.122.08604.003.152.762.532.372.252.172.102.041.991203.923.072.682.452.292.172.092.021.961.91 3.843.002.602.372.212.102.011.941.881.83分子自由度分子自由度分子自由度分母自由度课堂练习课堂练习: 手工计算手工计算F - 检验检验 F = s12/s22其中 s12 = 一个分布的方差(两个样本方差中的较大方差) s22
16、=另一分布的方差(两个样本方差中的较小方差)比较固定架比较固定架7和固定架和固定架8的方差的方差s7 = .00149 固定架7的标准方差s8 = .00110固定架8的标准方差每个样本的容量为10。 分子的自由度是多少?分母的自由度是多少?F表格的临界值是多少?哪个方差值更大,而应置于分子?计算的F是多少?计算的F值是否比表格的F值大?您的结论是什么?您有证据能够以95%的置信度来说明固定架7和固定架8之间的方差不同吗?方差齐性 StatANOVAHomogeneity of Variance Bartlett检验法 - 正态数据 Levene检验法 -非正态数据Ho : 12 = 22 =
17、 . . . = k2 p 时无法拒绝 HoHa : i2 = j2 (至少一对) p ANOVAHomogeneity of Variance0.00050.00150.00250.0035西格玛的95%置信区间Bartlett检验法检验统计值: 4.298P-值 : 0.745Levene检验法检验统计值: 0.818P-值 : 0.576因素级别12345678总高度的方差齐性统计结论:统计结论:我们无法得出8个固定架之间的方差存在差异的结论。我们在图形中观察到的差异可能是由于偶然因素而发生的。实际结论:实际结论:不应该将所有固定架都制造成象设备2那样来减少方差。P值值 .05,无法拒绝
18、无法拒绝 Ho 统计问题统计问题 - 固定架之间方差的明显差异是实际存在还是偶然出现的?固定架之间方差的明显差异是实际存在还是偶然出现的? 实际问题实际问题 - 是否应该努力制造是否应该努力制造3号那样的固定架,以使其均值接近目标值?号那样的固定架,以使其均值接近目标值?目标值5.3940123456785.3855.3905.395fixturetotal ht单样本比较单样本比较将一组数据与标准值比较双样本比较双样本比较 两组数据互相比较Bill MarkBill par单样本比较单样本比较将一组数据与标准值比较。双双样本比较样本比较互相比较两组数据Ho: m m1 = m m2或者:Ho
19、: m m1 - m m2 = 0如果如果m m1- m m2 的置信区间不包括的置信区间不包括0,则说明,则说明m m1 和和 m m2 之间之间的差异是的差异是显著的。显著的。单击单击“ Graphs”点击两次点击两次“ OK”运行运行假设是什么假设是什么?Ho:Ha:选择选择Ha 单单侧侧或或 双侧双侧StatBasic Statistic2-Sample t如果如果F检验未拒绝检验未拒绝Ho ,单击,单击 “ Assume Equal Variance”比较固定架比较固定架1与固定架与固定架3:单击单击“ Boxplotsof data”P值值 .05;拒绝拒绝HoHo 和和 Ha的假
20、设的假设m m1-m m2的置信区间的置信区间 (不包不包括括0.0) 平均值差异的最可能估计值为: 5.3899 - 5.3947 = -0.0048.实际差异实际差异 (如果我们包括总体的所有数据)可能大于该值,也可能小于该值。 我们有95%的置信度的置信度说明实际值在 -0.00586和-0.00374之间。 这是总体差异的近似值范围近似值范围 (与数据一致的数值)。 以这种方式组成的区间中有95%的区间包含实际总体值(您出错的机率是5%。) 0.0不在该区间内,因此,我们可以有力的证明固定架之间的差异确实存在,而不是偶然出现。这意味着我们可以否定2个平均值是相等这一零假设 (Ho: m
21、1 = m2 or m1 - m2 = 0)。P值值(大于大于)Ha: Window Close all graphs点击“ Data” 窗口中的任意位置,然后点击右上角的“ X” 。在在Minitab中打开文件中打开文件“ ttests” L:6SigmaMinitabTrainingMinitabSession 2Ttest.mtw此处键入标题描述性统计描述性统计Variable N Mean Median Tr Mean StDev SE Meancalip1 12 0.26625 0.26650 0.26620 0.00122 0.00035calip2 12 0.26600 0.26
22、550 0.26590 0.00176 0.00051diff 12 0.00025 0.00050 0.00040 0.00201 0.00058为何使用为何使用?为了降低变异性 (部件间的差异) 并作出更精确的估测更精确的估测 (更小的置信区间)。 您希望知道什么您希望知道什么? 卡钳的测量结果是否相同。何时采用成对检验何时采用成对检验?对同一件试验单元同一件试验单元或在相似条件下进行两次测量。 在此例中,对同一部件进行了两次测量。每行数据都有匹配内容时 举例: - 外罩在喷漆前后的平整度 - 话务员在受培训前后的成绩假设假设 Ho: m1 - m2 = 0Ha: m1 - m2 = 0H
23、a: m1 - m2 0对于Minitab中的双样本t检验,在各独立栏中输入两次测量结果。差异直方图 (c9)一些差异是正数(卡钳1更高),而一些差异是负数(卡钳2更高)。差异的平均值是否明显不同于0?卡钳2与卡钳1的分布图单击Options添加抖动度卡钳2与卡钳1的分布图单击Frame 和Min/Max 显示相同的X和Y轴范围卡钳2与卡钳1的分布图 具有抖动轴刻度相等均等线 卡钳1=卡钳2一些点位于均等线之上和之下。有时卡钳1的测量值更高;有时卡钳2的测量值更高。0.2640.2650.2660.2670.2680.2690.2640.2650.2660.2670.2680.269calip
24、1calip2假设是什么假设是什么?Ho:Ha:拒绝的标准是什么拒绝的标准是什么?“0” 位于位于C.I.之内之内;无法拒绝无法拒绝Ho必须使用两种测必须使用两种测量方式量方式的差值来进的差值来进单样本单样本t检验检验我们不能说两个卡钳测量结果的平均值不同我们不能说两个卡钳测量结果的平均值不同StatBasic Statistics1-Sample t置信区间置信区间Variable N Mean StDev SE Mean 95.0 % CI diff 12 0.00025 0.00201 0.00058 (-0.00102, 0.00152)问题方法平均值的取值范围是什么? 单样本置信区间
25、平均值是否与假设值不同?单样本假设检验2个平均值之间差异的取值范围两个平均值之间差异的置是什么? 信区间 两个总体的平均值是否相同?双样本假设检验对于成对数据,数据,两个样本的平均值成对t检验,以及差异的是否相同 置信区间。问题说明问题说明呼叫中心不可用性的变化范围广,平均值为53%。这导致应答率很低,造成客户不满意。CTQ: 客户关系不可用性测量结果测量结果: 每日的不可用时间缺陷缺陷: 一日的可用时间 35%单位单位: 每日, M-F机会机会: 每日, M-F客户客户: 呼入的客户打开文件打开文件CALLCNTRL:6sigmaMinitabTrainingMinitabSession 2
26、CALLCNTR.mtw使用C2与C6栏中的数据相互比较这三个呼叫中心的不可用性。首先将数据绘制成图形。使用假设检验来确定3个呼叫中心可用性的方差和平均值之间是否存在显著差异。在运行某些例行程序之间,您需要对数据进行“退栈”: Manip Stack/Unstack Unstack在“ 不可用性”中对数据进行退栈存储在数据栏c14-c16中使用数据栏2中的下标3个呼叫中心个呼叫中心1. 中心A (24样本)2. 中心B (24样本)3. 中心C (12样本)方差F-检验是比较2个方差的假设检验 在Minitab中,方差检验称为“ 方差齐性” Bartlett检验法比较正态数据的方差 Leven
27、e检验法比较非正态数据的方差平均值 t-检验用于比较2个数据组的平均值 成对t-检验比较数据成对时两个总体的平均值差异置信区间 总体参数的取值范围 (与数据一致的值) 统计风险 错误: 将实际上相同的东西误认为存在差异(在装配线上拒绝好的部件) 风险: 产生错误的风险 根据惯例,风险为5% (或 = 0.05)P值所观察到的显著性水平。在总体值相同的情况下,观察到存在这么大差异的机率。如果所观察到的显著性水平(“ p”)小于可接受的风险(“ ”) ,则接受Ha(拒绝Ho )。如果所观察到的显著性水平(“ p”)大于可接受的风险(“ ”) ,则拒绝Ha(无法拒绝Ho )。 1. 零假设零假设 (
28、Ho) -不存在变化或差异的命题。如果没有充分的证据拒绝它,就假设这一命题是真的。2. 备择假设择假设(Ha) - 存在变化或差异的命题。如果拒绝Ho,则认为这一命题是真的。3. 一类错误一类错误 - 当Ho 实际上为真时而被拒绝所产生的错误,或是接受存在差异、但事实上却没有差异时所犯的错误。4. 风险风险 - 出现第一类错误的最大风险或机率。这个机率总是大于零,通常为5%。研究人员决定拒绝Ho 所可以接受的最大风险。5. 显著水平显著水平-同风险。6. 二类错误二类错误 - 当Ho 实际上为伪而没有被拒绝所产生的错误,或是接受没有差异、但事实上存在差异时所犯的错误。7. 风险风险 - 二类错误出现的风险或机率,或者是说,忽略了问题的有效处理或解决方案。8. 显著性差异显著性差异 - 用于描述统计假设检验结果的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 工作中的闲暇时光与高效时间管理艺术
- 工作中的时间管理与时间节约技巧
- 工业设计的创新与实践案例
- 工作满意度与心理资本的关系研究
- 工控系统中的人机界面优化研究
- 工作流程再造与优化实践
- 工程实践中的智能化应用案例
- 工程机械中的智能自卸车应用
- 工厂防火措施与操作规程
- 工程材料与加工技术
- 中药泡洗(课堂)课件
- 日周月安全检查记录表
- 2022年黑龙江省龙东地区中考地理试题及参考答案
- 混凝土模板支撑工程专项施工方案(140页)
- T∕CADERM 3041-2020 扩展的创伤重点超声评估规范
- 苏教版四年级数学下册试卷(全套)
- 五年级北师大版英语下学期语法填空易错专项练习题
- 100道结构力学弯矩图
- 机械连接扭矩检查记录
- GB_T 24359-2021 第三方物流服务质量及测评(高清-现行)
- 院士专家工作站管理办法
评论
0/150
提交评论