六西格玛管理之方差_第1页
六西格玛管理之方差_第2页
六西格玛管理之方差_第3页
六西格玛管理之方差_第4页
六西格玛管理之方差_第5页
已阅读5页,还剩72页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

方差分析6σChi-square(卡方分析)单-X多个XS单-YRegression(回归分析)ANOVAMeansMediansTests(方差分析)LogisticRegression(逻辑回归分析)Chi-square(卡方分析)MultipleRegression(多元回归分析)2,3,4way…ANOVAMediansTests(方差分析)MultipleLogisticRegression(多元回归分析)Y-Date连续离散连续离散Y-Date离散连续连续离散分析指南P-Vaule>0.05元相关性

<0.05有很大相关性目的

简介One-wayANOVA基本统计模式

确认One-wayANOVA的统计假定

学习不同的探索性分析与图解的技巧

学习如何执行F-test(假设试验)

研究方差比较的统计性检验连续型Y与离散型X方差分析平均值/中位值1LevelX的比较2LevelX的比较+3LevelX的比较研究Stability(若可行)研究Shape研究

Spread研究

Centering研究Stability(若可行)研究Shape研究Spread研究Centering或研究Stability(若可行)研究Shape研究Spread研究Centering分析Roadmap:3个或更多样本+3LevelX的比较研究Stability(若可行)研究Shape研究Spread研究CenteringMinitab焦点或问题是?Descriptive统计与正态检验SPCChartI-MRBartlettTest(F-Test)Ho:σ2A=σ2B

1WayANOVAHo:μA=μB=μC1wayANOVA(SeeMBB)Kruskal-Wallis/MoodsMedians(MedA=MedB=MedC)1WayANOVAIfN>25ortransformed)Kruskal-Wallis/MoodsMedian(MedA=MedB=MedC)Kruskal-Wallis/MoodsMedian(MedA=MedB=MedC)SmallP-Value(<0.5)方差不相等SmallP-Value(<0.5)两个母体的Centering不想等Leven’sTestHo:σ2A=σ2B

是否有任何明显的变化趋势或模式,足以证明资料并非来自单一的母体/流程?资料是否为正态分布?小P-Value(<0.5)值,资料为非正态分布注意样本大小的问题堆叠资料与方差等同性检验正态非正态方差相等方差不相等分析Roadmap方差分析平均值/中位值+3LevelX的比较研究Stability(若可行)研究Shape研究Spread研究Centering在3个或更多的level中,我们使用它们的某些aspects来做相互比较3Levels的范例顾客1,2,&3是否相同的运送时间?HypothesesNullHypothesis(Ho):对三位顾客的送达时间没有不同AlternateHypothesis(Ha):至少有一位顾客的送达时间和另一位顾客的送达时间不同(较高或较低)分析Roadmap:3+Samples+3LevelX的比较研究Stability(若可行)研究Shape研究Spread研究Centering开启ANOVA.MPJ中的工作表3LevelANOVAHo:资料之间是相同的假设Ha:资料之间是不相同的HoHaP>0.05P<0.05分析Roadmap:3+Samples3LevelANOVACust1Cust2Cust325.296926.005628.426826.057828.940027.508524.070026.006327.582524.819926.435627.401825.985125.992724.9209………实际问题比较Customer1,Customer2和Customer3所经历的运送时间的数据资料分析Roadmap:3个或更多样本+3LevelX的比较研究Stability(若可行)研究Shape研究SpreadMinitab焦点或问题是?Descriptive统计与正态检验SPCChartI-MRBartlettTest(F-Test)Ho:σ2A=σ2B

SmallP-Value(<0.5)方差不祥等Leven’sTestHo:σ2A=σ2B

是否有任何明显的变化趋势或模式,足以证明资料并非来自单一的母体/流程?资料是否为正态分布?小P-Value(<0.5)值,资料为非正态分布注意样本大小的问题堆叠资料与方差等同性检验正态非正态和以前前相同同——但只针针对一一个LevelCustomer3的资料料我们应应做何何决定定?我们应应做何何决定定?堆叠您您的资资料…执行方方差Homogeneity(等同同性))检验验,我我们需需要堆堆叠你的资资料,,请使使用::MinitabManipStack/UnstackStackColumns堆叠您您的资资料…StackCustomer25.2969126.0578124.07001………26.0056225.9400226.00632………26.3372325.3565325.78233方差Homogeneity同质检检验我们想想要知知道,,顾客客间的的运送送时间间的方方差是是否相相等(Customer1的方差差=Customer2的方差差=Customer3的方差差)“方差相相等””为AnalysisofVariance(ANONA)中的隐隐藏假假设。。因此,,在继继续执执行前前,我我们须须先检检验此此假设设是否否成立立执行此此额外外的检检验将将预防防您在在某些些情况况下,,做出出不正正确的的结论。。它是是额外外的工工作,,但却却是值值得的的!!!方差Homogeneity检验选择MinitabStatANOVAHomogeneityofvariance来执行行方差差Hogeneity的检验验,选选Park为Response变量,,以Customer为Factors和以前前相同同——但只针针对一一个LevelCustomr1,2,3的资料料分析Roadmap:3个或更更多样样本+3LevelX的比较较研究Stability(若可可行))研究Shape研究Spread研究CenteringMinitab焦点或或问题题是?Descriptive统计与与正态态检验SPCChartI-MRBartlettTest(F-Test)Ho:σ2A=σ2B1WayANOVAHo:μμA=μB=μC1wayANOVA(SeeMBB)Kruskal-Wallis/MoodsMedians(MedA=MedB=MedC)1WayANOVAIfN>25ortransformed)Kruskal-Wallis/MoodsMedian(MedA=MedB=MedC)Kruskal-Wallis/MoodsMedian(MedA=MedB=MedC)SmallP-Value(<0.5)方差不相等等SmallP-Value(<0.5)两个母体的的Centering不想等Leven’sTestHo:σ2A=σ2B是否有任何何明显的变变化趋势或或模式,足足以证明资料并并非来自单一的母体/流程?资料是否为为正态分布布?小P-Value(<0.5)值,资料为非正正态分布注意样本大大小的问题题堆叠资料与与方差等同性检验验正态非正态方差相等方差不相等等One-wayANOVAMinitabStatANOVAOne-wayGraphsANOVATableAnalysisofVarianceSourceDFSSMSFPFactor280.38640.19344.760.000Error8778.1160.898Total89158.502σ2pooled=σ21+σ22+σ233群组的大小小相等群组平均值值相等时,F-test会接近1.00在在本例中中,此F-test相当大若P小于5%,则至少有一一群组的平均均值是不同同的在本例中,我们拒绝H0(所有群组的平平均值是相相等的),因为,至少有一顾顾客的平均均运送时间与与其他顾客客的不同这样大的F-test其发生的可能性是有有的,但概率低于万分之一一此发生的概概率与投币币连续投出10次人头的概概率相当更深入地观观察ANOVAIandMRChartforCycleTimesbyWeek周与周之间间的流程周周期是否有有变异呢?那么一周内内(withinaweek)呢方差分析区分变异的的来源TotalCycleTimeVariationVariationWithinWeekVariationBetweenWeeks=+ΣΣ(yij–y)2=ΣΣ(yij–y)2+n*Σ(yij–y)2=kni=1j=1knki=1j=1i=1-=-因为我们的的F的统计值非非常大,我们知道目目前的总流程周期期的变异来来源主要来来自周与周周之间的变变异One-wayANOVA:CycletimesversusFactorAnalysisofvarianceforCycleTimSourceDFSSMSFPWeek31032.48344.16299.380.000Error96110.361.15Total961142.84Ftest统计值为一一比率:每周间的变变异每周内的变变异F-test与t-testF-test与t-test的关系F=t2让我们对此此进行充分分检验:用用顾客运送送时间资料料或你的投射射器资料,,来执行t-test(twosided)与F-testOne-wayANOVA:CycletimesversusFactorSS或SumoftheSquares将资料的变变异量化计算Epsilon2之值,来检视x的实际显著著性此数值告诉诉我们有多多少总变异异可被x所解释Epsilon2=AnalysisofvarianceforCycleTimSourceDFSSMSFPWeek31032.48344.16299.380.000Error96110.361.15Total961142.84SSforXSSTotal=1032.481142.84=90.34%特定的顾客客是否为一一重要的X?统计上?实际上?Minitab标记为Error的SS是什么?One-wayANOVA:CycletimesversusFactorAnalysisofvarianceforAllcustSourceDFSSMSFPWhichcus280.38640.19344.760.000Error8778.1160.898Total89158.502统计性假设设在指定的Factor中,输出变变量的母体体变异在所所有的Levels上是相同的的(HomogeneityofVariance)-我们以HomogeneityofVariance程序,来检检验此假设设输出的平均均值相互独独立且正态态分布-若使用随机机抽样及适适当的样本本大小,此此假设通常常是成立的的-注意:在化化学流程中中,输出变变量通常不不相互独立立,因此随随机抽样需需经常被考虑虑Residuals(数学模型型的误差))为相互独独立且正态态分布(Mean=0,Variance=常量量))方差差分分析析AnalysisofvarianceforCycleTimSourceDFSSMSFPProduct329.5360.984555.810.000Error345.9980.176Total3735.534信息息量量自自由由度度::f人人的的行行为为数数据据C1C2C3n11,n12…n19n21,n22…n29n31,n32…n39n=9××3=27fT=n-1=27-1=26fA=c-1=3-1=2fe=fT-fA=26-2=24fT=fA+fe=2+24=26ffAfefT产品品信信息息自自由由度度产品品误误差差自自由由度度变异异来来源源信息息量量自由由度度说明明样样品品差异异大大变异异量量化化对每每一一个个变异异来来源源方差差估估计计此统统计计值值用以以决决定定重要要因因子子TypeIError(p-value)方差差分分析析表表与与图图形形One-wayAnalysisofVarianceCentering:MeansMinitabStatOneway注意意,现现在在的的Ha为::至少少有有一一平平均均值值是是不不同的的Tukey’’s检验验协协助助我我们们分析析哪哪一一平平均均值值与与其其他他不相相同同Tukey’’spairwisecomparisonsFamilyerrorrate=0.0500Individualerrorrate=0.0194Criticalvalue=3.37Intervalsfor(columnlevelmean)-(rowlevelmean)12-1.1809-0.0149-2.8188-1.6527-2.2209-1.054923Tukey’’s检验验显显示示对对任任两两平平均均值值实实际际差差异异的的置置信信区区间间例如如,,Customer1与Customer1间的的实实际际差差异异介介于于-1.1809至–0.0149。换换句句话话说说,,实实际际的的差差异异极极有有可可能能非常常接接近近0。Customer1与Customer1或Customer1的差异异非非常常大大,,因因为为我我们们知知道道更更显显著著Centering:MeansMinitabStatOnewayComparisons以上上的的各各种种选选项项你你该该使使用用那那一一种种??建议议使使用用Fisher’’s因为为它它较较宽宽松松换句句话话说说,,您您较较容容易易发发现现两两平平均均值值间间有有差差异异((更更具具统统计计能能力力)),,但您您也也会会有有较较高高的的““falsepositive””风险险((当当真真实实差差异异不不存存在在时时,,您却却倾倾向向于于认认为为有有差差异异))Fisher’’spairwisecomparisonsFamilyerrorrate=0.192Individualerrorrate=0.0500Criticalvalue=2.086Intervalsfor(columnlevelmean)-(rowlevelmean)Fisher’’sABCB–8.186–1.814C–10.186–3.81–4.8500.850D–3.0233.0232.3347.6664.3349.666此矩矩阵阵显显示示平平均均值值间间的的比比较较在一一格格中中的的两两个个数数字字,,为为平平均均值值差差异的的95%置信区区间若此二二数均均为正正值或或负值值,则则平均值值间存存有差差异以小组组形式式来总总结并并报告分析析结果果MainEffectsPlot(主效应应图)MinitabStatMainEffectsPlotANOVA表示平平均值值InteractionsPlots(区间图图)MinitabGrapthInteractionsPolt显示平平均值值标准差差InteractionsPlot(区间图图)MinitabGrapthInteractionsPolt显示平平均值值置信区区间InteractionsPlot分析两种plots有何不不同之之处?其他检检验法法别忘了了仍有有其他他的检检验法法可运运用,,当::-资料为为非正正态分分布-方差不不相等等中位数数(Medians)检验验-Mood’’sMedians检验>检验不不同分分布的的中位位数是是否相相等-Kruskal––WallisMedians检验>假设每每一个个被分分析的的分布布有相相同的的形状状>对很多多分布布而言言,此方法法比Kruskal––Wallis的检验验能力力低>与Mood’’s中位数数检验验一样样的基基本假假设>对更多多的分分布而而言更更具有有检验验能力力,但但较难难应付付outliers(分离点点,非正常常值Moods-MedianTestMinitabStatNonparameltricsMood’’sMedianTestHo:ηηCust1=ηCust2=ηCust3Ha:NotallηηCustare=其中η’sare为母体体中位位数Moods-MedianTestMoodMedianTestMoodmediantestforDeliveryAP-Value!我们应应做何何决定定?MinitabStatNonparameltricsKruskal-WallisHo:ηηCust1=ηCust2=ηCust3Ha:NotallηηCustare=Whereη’’sarethepopulationmediansKruskal-WallisTestKruskal-WallisTestAP-Value!我们应应做何何决定定?单因子子实验验的概概念当输入入变量量(因子)有多个个样本本时,我们实实际上上正在在执行一单单因子子实验验通常我我们想想确认认,因子的的不同同水平平之间间是否否存在在差异异-范例:评估三三家供供应商商的相相同材材料-范例:对5个不同同的焊焊接工工,评估他他们是是否一一致我们开开始讨讨论第第一个个实验验让我们们来看看一看看……单因子子实验验的概概念考虑某某个实实例::一产产品开开发工工程师师,欲欲调查查目前前的5种焊接设设定对对电阻阻式焊焊接系系统的的焊接接强度度的影影响她准备备调查查的范范围介介于15-19Amps之间-她将观观察此此输入入变量量(Factor)的5个levels:15A,16A,17A,18A及19A-对每一一levels测试5个样本本输出::WeldStrength输入::Current此为单单因子子实验验的范范例::X=Currentwith5levels范例Continued下列设设计矩矩阵练习::开启启ANOVA.MPJ中的WeldStrength工作表表,并并执行行dotplot来比较较每一一level的weldstrengths15161718197121419771718251015121822111118191915918192311CurrentWeldStrength资料分分析练练习使用ANOVA.MPJ中的WeldStrength工作表表,分分析weldingexample资料依循roadmap搂分析析并和和邻桌桌商讨讨准备好好在15分钟内内,回回答有有关您您的方方法和和结论论的问问题BB的提示示在某些些合适适情形形下,,属性性资料料利用用此工工具也也能达达成良良好成效效。。请请先先试试用用总结结简介介One-wayANOVA基本本统统计计模模式式确认认One-wayANOVA的统统计计假假定定学习习不不同同的的探探索索性性分分析析与与图图解解的的技技巧巧学习习如如何何执执行行F-test(假设试试验)研究方差差比较的的统计性性检验卡方分分析析6σChi-square(卡方分析析)单-X多个XS单-YRegression(回归分分析)ANOVAMeansMediansTests(方差分分析)LogisticRegression(逻辑回归归分析))Chi-square(卡方分析析)MultipleRegression(多元回回归分析析)2,3,4way……ANOVAMediansTests(方差分分析)MultipleLogisticRegression(多元回归归分析))Y-Date连续离散连续离散Y-Date离散连续连续离散分析指南南P-Vaule>0.05元相关性性<0.05有很大相相关性目的的介绍卡方分析析-独立性检检验的基本概概念连结卡方分析独独立性检检验与MAICroadmap分析RoadmapX数据离散连续卡方分析析逻辑回归归分析方差分析析平均值/中位值回归分析析离散连续Y数据离散连续X数据逻辑回归分析析逻辑回归分析析2,3,4方法…方差分析析/中位值多变量回归分析析离散连续Y数据单一X多个Xs单一X多个Xs多变量分分析(注意:这并不是是Multi-VariStudies)分析Roadmap单一Xvs.单一YX数据离散连续卡方分析析逻辑回归归分析方差分析析平均值/中位值回归分析析离散连续Y数据资料料受雇不受雇合计OldYoung合计301501804523027575380455在此,你你将如何何作决策策?假设设在卡方分分析独立立性检验验中,统统计学家家对大多多数的变变量皆假设为为独立的的,因此此:Ho:资料相相互独立立(不相相关)Ha:资料相相互不独独立(相相关)如果P值<0.05,就拒绝绝Ho理论论我们来看看此范例例…我们想要要知道年龄与受聘间是否独独立所以我们们假设的的内容如如下…-Ho:年龄和受聘间是独立立的-Ha:年龄和受聘间是不独独立的步骤#1我们需将将此两个个变量分分成不同同的level,并制作作观察频率率表:年龄:Old与Young聘雇:受受雇与不不受雇然后:收收集资料料并分析析受雇不受雇OldYoung3015045230步骤#2计算栏与与列的总总和受雇不受雇合计OldYoung合计301501804523027575380455步骤#3制作观察频率率表。也就是说说,如果果这两个个变量相相互独立立,表格格应该是是什么样样的?受雇不受雇OldYoung如何做?制作观察频率率表。也就是说说,如果果这两个个变量相相互独立立,表格格应该是是什么样样的?受雇不受雇OldYoung75×180455=29.6150.3345.33229.67合计180275455合计75380期望频率率:(栏之总和和)×(列之总和和)全部总和和也就是::(%受雇×(%Old)×(面试人数数)步骤#3Continued步骤#3Continued若这两个个变量相相互独立立,期望望频率值值为29.6受雇不受雇OldYoung29.6合计180275455合计75380请完成这这个表格格!步骤#4将实际观观察值减减去期望望值(O-E)受雇不受雇OldYoung30-29.6=0.4合计180275455合计75380-0.33-0.330.33步骤#5将其差平平方(O-E)2受雇不受雇OldYoung0.4××0.4=0.16合计180275455合计75380-0.11-0.11-0.11步骤#4计算相对的的平方差(squareddifference(O-E)2/E受雇不受雇OldYoung016/29.6=0.005合计180275455合计75380-0.00074-0.00240.00048卡方分析:0.0037+0.00074+0.0024+0.00048=0.0073那么?相的平方差差之和为卡方分析分布!102345如果两变量量相互独立立,其差会接近近零-差值越大,变量间越可可能不相互互独立我们将依据据P值来协助我我们做决定定P值分析Roadmap卡方分析-独立性检验验收集资料使用Minitab卡方分析指指令计算P值检查ContingencyTable制定决策用Minitab分析资料StatTablesChisquareTest用Minitab分析资料卡方分析检检验期望值标示示于观察值值下面APValue!注意:观察值和期期望值与您先前所计计算的相等等你的决定是是?用Minitab分析资料卡方分析检检验期望值标示示于观察值

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论