




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
方差分析6σ方差分析6σ1Chi-square(卡方分析)单-X多个XS单-YRegression(回归分析)ANOVAMeansMediansTests(方差分析)LogisticRegression(逻辑回归分析)Chi-square(卡方分析)MultipleRegression(多元回归分析)2,3,4way…ANOVAMediansTests(方差分析)MultipleLogisticRegression(多元回归分析)Y-Date连续离散连续离散Y-Date离散连续连续离散分析指南P-Vaule>0.05元相关性<0.05有很大相关性单-X多个XS单-YY-Date连续离散连续离散Y-Date2目的简介One-wayANOVA基本统计模式确认One-wayANOVA的统计假定学习不同的探索性分析与图解的技巧学习如何执行F-test(假设试验)研究方差比较的统计性检验目的简介One-wayANOVA基3连续型Y与离散型X方差分析平均值/中位值1LevelX的比较2LevelX的比较+3LevelX的比较研究Stability(若可行)研究Shape研究Spread研究Centering研究Stability(若可行)研究Shape研究Spread研究Centering或研究Stability(若可行)研究Shape研究Spread研究Centering连续型Y与离散型X方差分析1LevelX的比较4分析Roadmap:3个或更多样本+3LevelX的比较研究Stability(若可行)研究Shape研究Spread研究CenteringMinitab焦点或问题是?Descriptive统计与正态检验SPCChartI-MRBartlettTest(F-Test)Ho:σ2A=σ2B
1WayANOVAHo:μA=μB=μC1wayANOVA(SeeMBB)Kruskal-Wallis/MoodsMedians(MedA=MedB=MedC)1WayANOVAIfN>25ortransformed)Kruskal-Wallis/MoodsMedian(MedA=MedB=MedC)Kruskal-Wallis/MoodsMedian(MedA=MedB=MedC)SmallP-Value(<0.5)方差不相等SmallP-Value(<0.5)两个母体的Centering不想等Leven’sTestHo:σ2A=σ2B
是否有任何明显的变化趋势或模式,足以证明资料并非来自单一的母体/流程?资料是否为正态分布?小P-Value(<0.5)值,资料为非正态分布注意样本大小的问题堆叠资料与方差等同性检验正态非正态方差相等方差不相等分析Roadmap:3个或更多样本+3LevelX的比5分析Roadmap方差分析平均值/中位值+3LevelX的比较研究Stability(若可行)研究Shape研究Spread研究Centering在3个或更多的level中,我们使用它们的某些aspects来做相互比较3Levels的范例顾客1,2,&3是否相同的运送时间?分析Roadmap方差分析+3LevelX的比较研究6HypothesesNullHypothesis(Ho):对三位顾客的送达时间没有不同AlternateHypothesis(Ha):至少有一位顾客的送达时间和另一位顾客的送达时间不同(较高或较低)HypothesesNullHypothesis(Ho)7分析Roadmap:3+Samples+3LevelX的比较研究Stability(若可行)研究Shape研究Spread研究Centering开启ANOVA.MPJ中的工作表3LevelANOVAHo:资料之间是相同的假设Ha:资料之间是不相同的HoHaP>0.05P<0.05分析Roadmap:3+Samples+3LevelX8分析Roadmap:3+Samples3LevelANOVACust1Cust2Cust325.296926.005628.426826.057828.940027.508524.070026.006327.582524.819926.435627.401825.985125.992724.9209………实际问题比较Customer1,Customer2和Customer3所经历的运送时间的数据资料分析Roadmap:3+Samples3LevelAN9分析Roadmap:3个或更多样本+3LevelX的比较研究Stability(若可行)研究Shape研究SpreadMinitab焦点或问题是?Descriptive统计与正态检验SPCChartI-MRBartlettTest(F-Test)Ho:σ2A=σ2B
SmallP-Value(<0.5)方差不祥等Leven’sTestHo:σ2A=σ2B
是否有任何明显的变化趋势或模式,足以证明资料并非来自单一的母体/流程?资料是否为正态分布?小P-Value(<0.5)值,资料为非正态分布注意样本大小的问题堆叠资料与方差等同性检验正态非正态分析Roadmap:3个或更多样本+3LevelX的比10和以前相同——但只针对一个LevelCustomer3的资料我们应做何决定?我们应做何决定?和以前相同——但只针对一个LevelCustomer311堆叠您的资料…执行方差Homogeneity(等同性)检验,我们需要堆叠你的资料,请使用:MinitabManipStack/UnstackStackColumns堆叠您的资料…执行方差Homogeneity(等同性)检验12堆叠您的资料…StackCustomer25.2969126.0578124.07001……26.0056225.9400226.00632……26.3372325.3565325.78233堆叠您的资料…StackCustomer13方差Homogeneity同质检验我们想要知道,顾客间的运送时间的方差是否相等(Customer1的方差=Customer2的方差=Customer3的方差)“方差相等”为AnalysisofVariance(ANONA)中的隐藏假设。因此,在继续执行前,我们须先检验此假设是否成立执行此额外的检验将预防您在某些情况下,做出不正确的结论。它是额外的工作,但却是值得的!!方差Homogeneity同质检验我们想要知道,顾客间的运14方差Homogeneity检验选择MinitabStatANOVAHomogeneityofvariance来执行方差Hogeneity的检验,选Park为Response变量,以Customer为Factors方差Homogeneity检验选择MinitabStatA15和以前相同——但只针对一个LevelCustomr1,2,3的资料和以前相同——但只针对一个LevelCustomr1,2,16分析Roadmap:3个或更多样本+3LevelX的比较研究Stability(若可行)研究Shape研究Spread研究CenteringMinitab焦点或问题是?Descriptive统计与正态检验SPCChartI-MRBartlettTest(F-Test)Ho:σ2A=σ2B
1WayANOVAHo:μA=μB=μC1wayANOVA(SeeMBB)Kruskal-Wallis/MoodsMedians(MedA=MedB=MedC)1WayANOVAIfN>25ortransformed)Kruskal-Wallis/MoodsMedian(MedA=MedB=MedC)Kruskal-Wallis/MoodsMedian(MedA=MedB=MedC)SmallP-Value(<0.5)方差不相等SmallP-Value(<0.5)两个母体的Centering不想等Leven’sTestHo:σ2A=σ2B
是否有任何明显的变化趋势或模式,足以证明资料并非来自单一的母体/流程?资料是否为正态分布?小P-Value(<0.5)值,资料为非正态分布注意样本大小的问题堆叠资料与方差等同性检验正态非正态方差相等方差不相等分析Roadmap:3个或更多样本+3LevelX的比17One-wayANOVAMinitabStatANOVAOne-wayGraphsOne-wayANOVAMinitabStatANOVA18ANOVATableAnalysisofVarianceSourceDFSSMSFPFactor280.38640.19344.760.000Error8778.1160.898Total89158.502σ2pooled=σ21+σ22+σ233群组的大小相等群组平均值相等时,F-test会接近1.00在在本例中,此F-test相当大若P小于5%,则至少有一群组的平均值是不同的在本例中,我们拒绝H0(所有群组的平均值是相等的),因为,至少有一顾客的平均运送时间与其他顾客的不同这样大的F-test其发生的可能性是有的,但概率低于万分之一此发生的概率与投币连续投出10次人头的概率相当ANOVATableAnalysisofVarianc19更深入地观察ANOVAIandMRChartforCycleTimesbyWeek周与周之间的流程周期是否有变异呢?那么一周内(withinaweek)呢更深入地观察ANOVAIandMRChartfor20方差分析区分变异的来源TotalCycleTimeVariationVariationWithinWeekVariationBetweenWeeks=+ΣΣ(yij
–y)2=ΣΣ(yij
–y)2+n*Σ(yij
–y)2=kni=1j=1knki=1j=1i=1-=-方差分析区分变异的来源TotalCycleVariatio21因为我们的F的统计值非常大,我们知道目前的总流程周期的变异来源主要来自周与周之间的变异One-wayANOVA:CycletimesversusFactorAnalysisofvarianceforCycleTimSourceDFSSMSFPWeek31032.48344.16299.380.000Error96110.361.15Total961142.84Ftest统计值为一比率:每周间的变异每周内的变异因为我们的F的统计值非常大,我们知道目前的One-way22F-test与t-testF-test与t-test的关系F=t2让我们对此进行充分检验:用顾客运送时间资料或你的投射器资料,来执行t-test(twosided)与F-testF-test与t-testF-test与t-test23One-wayANOVA:CycletimesversusFactorSS或SumoftheSquares将资料的变异量化计算Epsilon2之值,来检视x的实际显著性此数值告诉我们有多少总变异可被x所解释Epsilon2=AnalysisofvarianceforCycleTimSourceDFSSMSFPWeek31032.48344.16299.380.000Error96110.361.15Total961142.84SSforXSSTotal
=1032.481142.84
=90.34%One-wayANOVA:Cycletimesve24特定的顾客是否为一重要的X?统计上?实际上?Minitab标记为Error的SS是什么?One-wayANOVA:CycletimesversusFactorAnalysisofvarianceforAllcustSourceDFSSMSFPWhichcus280.38640.19344.760.000Error8778.1160.898Total89158.502特定的顾客是否为一重要的X?One-wayANOVA25统计性假设在指定的Factor中,输出变量的母体变异在所有的Levels上是相同的(HomogeneityofVariance)-我们以HomogeneityofVariance程序,来检验此假设输出的平均值相互独立且正态分布-若使用随机抽样及适当的样本大小,此假设通常是成立的-注意:在化学流程中,输出变量通常不相互独立,因此随机抽样需经常被考虑Residuals(数学模型的误差)为相互独立且正态分布(Mean=0,Variance=常量)统计性假设在指定的Factor中,输出变量的母体变异在26方差分析AnalysisofvarianceforCycleTimSourceDFSSMSFPProduct329.5360.984555.810.000Error345.9980.176Total3735.534信息量自由度:f人人的行为数据C1C2C3n11,n12…n19
n21,n22…n29
n31,n32…n39
n=9×3=27fT=n-1=27-1=26fA=c-1=3-1=2fe=fT-fA=26-2=24fT=fA+fe=2+24=26ffAfefT产品信息自由度产品误差自由度变异来源信息量自由度说明样品差异大变异量化对每一个变异来源方差估计此统计值用以决定重要因子TypeIError(p-value)方差分析AnalysisofvarianceforC27方差分析表与图形One-wayAnalysisofVariance方差分析表与图形One-wayAnalysisofVa28Centering:MeansMinitabStatOneway注意,现在的Ha为:至少有一平均值是不同的Tukey’s检验协助我们分析哪一平均值与其他不相同Centering:MeansMinitabStatO29Tukey’spairwisecomparisonsFamilyerrorrate=0.0500Individualerrorrate=0.0194Criticalvalue=3.37Intervalsfor(columnlevelmean)-(rowlevelmean)12-1.1809-0.0149-2.8188-1.6527-2.2209-1.054923Tukey’s检验显示对任两平均值实际差异的置信区间例如,Customer1与Customer1间的实际差异介于-1.1809至–0.0149。换句话说,实际的差异极有可能非常接近0。Customer1与Customer1或Customer1的差异非常大,因为我们知道更显著Tukey’spairwisecomparisonsF30Centering:MeansMinitabStatOnewayComparisons以上的各种选项你该使用那一种?建议使用Fisher’s因为它较宽松换句话说,您较容易发现两平均值间有差异(更具统计能力),但您也会有较高的“falsepositive”风险(当真实差异不存在时,您却倾向于认为有差异)Centering:MeansMinitabStatO31Fisher’spairwisecomparisonsFamilyerrorrate=0.192Individualerrorrate=0.0500Criticalvalue=2.086Intervalsfor(columnlevelmean)-(rowlevelmean)Fisher’sABCB–8.186–1.814C–10.186–3.81–4.850
0.850D–3.023
3.0232.3347.6664.3349.666此矩阵显示平均值间的比较在一格中的两个数字,为平均值差异的95%置信区间若此二数均为正值或负值,则平均值间存有差异以小组形式来总结并报告分析结果Fisher’spairwisecomparisons32MainEffectsPlot(主效应图)MinitabStatMainEffectsPlotANOVA表示平均值MainEffectsPlot(主效应图)Minita33InteractionsPlots(区间图)MinitabGrapthInteractionsPolt显示平均值标准差InteractionsPlots(区间图)Minit34InteractionsPlot(区间图)MinitabGrapthInteractionsPolt显示平均值置信区间InteractionsPlot(区间图)Minita35InteractionsPlot分析两种plots有何不同之处?InteractionsPlot分析两种plots36其他检验法别忘了仍有其他的检验法可运用,当:-资料为非正态分布-方差不相等中位数(Medians)检验-Mood’sMedians检验>检验不同分布的中位数是否相等-Kruskal–Wallis
Medians检验>假设每一个被分析的分布有相同的形状>对很多分布而言,此方法比Kruskal–Wallis的检验能力低>与Mood’s中位数检验一样的基本假设>对更多的分布而言更具有检验能力,但较难应付outliers(分离点,非正常值其他检验法别忘了仍有其他的检验法可运用,当:-资料为非37Moods-MedianTestMinitabStatNonparameltricsMood’sMedianTestHo:ηCust1=ηCust2=ηCust3Ha:NotallηCustare=其中η’sare为母体中位数Moods-MedianTestMinitabStatN38Moods-MedianTestMoodMedianTestMoodmediantestforDeliveryAP-Value!我们应做何决定?Moods-MedianTestMoodMedianT39MinitabStatNonparameltricsKruskal-WallisHo:ηCust1=ηCust2=ηCust3Ha:NotallηCustare=Whereη’sarethepopulationmediansKruskal-WallisTestMinitabStatNonparameltricsKru40Kruskal-WallisTestAP-Value!我们应做何决定?Kruskal-WallisTestAP-Value!我41单因子实验的概念当输入变量(因子)有多个样本时,我们实际上正在执行一单因子实验通常我们想确认,因子的不同水平之间是否存在差异-范例:评估三家供应商的相同材料-范例:对5个不同的焊接工,评估他们是否一致我们开始讨论第一个实验让我们来看一看……单因子实验的概念当输入变量(因子)有多个样本时,我们实际上42单因子实验的概念考虑某个实例:一产品开发工程师,欲调查目前的5种焊接设定对电阻式焊接系统的焊接强度的影响她准备调查的范围介于15-19Amps之间
-她将观察此输入变量(Factor)的5个levels:15A,16A,17A,18A及19A
-对每一levels测试5个样本输出:WeldStrength输入:Current此为单因子实验的范例:X=Currentwith5levels单因子实验的概念考虑某个实例:一产品开发工程师,欲调查目前43范例Continued下列设计矩阵练习:开启ANOVA.MPJ中的WeldStrength工作表,并执行dotplot来比较每一level的weldstrengths15161718197121419771718251015121822111118191915918192311CurrentWeldStrength范例Continued下列设计矩阵练习:开启ANOVA.M44资料分析练习使用ANOVA.MPJ中的WeldStrength工作表,分析weldingexample资料依循roadmap搂分析并和邻桌商讨准备好在15分钟内,回答有关您的方法和结论的问题资料分析练习使用ANOVA.MPJ中的WeldSt45BB的提示在某些合适情形下,属性资料利用此工具也能达成良好成效。请先试用
BB的提示在某些合适情形下,属性资料利用此工具也能达成良46总结简介One-wayANOVA基本统计模式确认One-wayANOVA的统计假定学习不同的探索性分析与图解的技巧学习如何执行F-test(假设试验)研究方差比较的统计性检验总结简介One-wayANOVA基本统计模式确认47卡方分析6σ卡方分析6σ48Chi-square(卡方分析)单-X多个XS单-YRegression(回归分析)ANOVAMeansMediansTests(方差分析)LogisticRegression(逻辑回归分析)Chi-square(卡方分析)MultipleRegression(多元回归分析)2,3,4way…ANOVAMediansTests(方差分析)MultipleLogisticRegression(多元回归分析)Y-Date连续离散连续离散Y-Date离散连续连续离散分析指南P-Vaule>0.05元相关性<0.05有很大相关性单-X多个XS单-YY-Date连续离散连续离散Y-Date49目的介绍卡方分析-独立性检验的基本概念连结卡方分析独立性检验与MAICroadmap目的介绍卡方分析-独立性检验的基本概50分析RoadmapX数据离散连续卡方分析逻辑回归分析方差分析平均值/中位值回归分析离散连续Y数据离散连续X数据逻辑回归分析逻辑回归分析2,3,4方法…方差分析/中位值多变量回归分析离散连续Y数据单一X多个Xs单一X多个Xs多变量分析(注意:这并不是Multi-VariStudies)分析RoadmapX数据离散连续卡方分析逻辑回归分析方差51分析Roadmap单一Xvs.单一YX数据离散连续卡方分析逻辑回归分析方差分析平均值/中位值回归分析离散连续Y数据分析Roadmap单一Xvs.单一YX数据离散连52资料受雇不受雇合计OldYoung合计301501804523027575380455在此,你将如何作决策?资料受雇不受雇合计OldYoung合计353假设在卡方分析独立性检验中,统计学家对大多数的变量皆假设为独立的,因此:Ho:资料相互独立(不相关)Ha:资料相互不独立(相关)如果P值<0.05,就拒绝Ho假设在卡方分析独立性检验中,统计学家对大多数54理论我们来看此范例…我们想要知道年龄与受聘间是否独立所以我们假设的内容如下…-Ho:年龄和受聘间是独立的-Ha:年龄和受聘间是不独立的理论我们来看此范例…我们想要知道年龄与55步骤#1我们需将此两个变量分成不同的level,并制作观察频率表:年龄:Old与Young聘雇:受雇与不受雇然后:收集资料并分析受雇不受雇OldYoung3015045230步骤#1我们需将此两个变量分成不同的level,并制作观察56步骤#2计算栏与列的总和受雇不受雇合计OldYoung合计301501804523027575380455步骤#2计算栏与列的总和受雇不受雇合计OldYoung合57步骤#3制作观察频率表。也就是说,如果这两个变量相互独立,表格应该是什么样的?受雇不受雇OldYoung如何做?步骤#3制作观察频率表。也就是说,如果这两个变量相互独立,58制作观察频率表。也就是说,如果这两个变量相互独立,表格应该是什么样的?受雇不受雇OldYoung75×180455=29.6150.3345.33229.67合计180275455合计75380期望频率:(栏之总和)×(列之总和)全部总和也就是:(%受雇×(%Old)×(面试人数)步骤#3Continued制作观察频率表。也就是说,如果这两个变量相互独立,表格应该是59步骤#3Continued若这两个变量相互独立,期望频率值为29.6受雇不受雇OldYoung29.6合计180275455合计75380请完成这个表格!步骤#3Continued若这两个变量相互独立,期望频率60步骤#4将实际观察值减去期望值(O-E)受雇不受雇OldYoung30-29.6=0.4合计180275455合计75380-0.33-0.330.33步骤#4将实际观察值减去期望值(O-E)受雇不受雇OldY61步骤#5将其差平方(O-E)2受雇不受雇OldYoung0.4×0.4=0.16合计180275455合计75380-0.11-0.11-0.11步骤#5将其差平方(O-E)2受雇不受雇OldYoung062步骤#4计算相对的平方差(squareddifference(O-E)2/E受雇不受雇OldYoung016/29.6=0.005合计180275455合计75380-0.00074-0.00240.00048步骤#4计算相对的平方差(squareddifferen63卡方分析:0.0037+0.00074+0.0024+0.00048=0.0073那么?相的平方差之和为卡方分析分布!102345如果两变量相互独立,其差会接近零
-差值越大,变量间越可能不相互独立我们将依据P值来协助我们做决定P值卡方分析:那么?相的平方差之和为卡方分析分布!1023464分析Roadmap卡方分析-独立性检验收集资料使用Minitab卡方分析指令计算P值检查ContingencyTable制定决策分析Roadmap卡方分析-收集资料使用Minitab计算65用Minitab分析资料StatTablesChisquareTest用Minitab分析资料StatTablesChisq66用Minitab分析资料卡方分析检验期望值标示于观察值下面APValue!注意:观察值和期望值与您先前所计算的相等你的决定是?用Minitab分析资料卡方分析检验期望值标示于观察值下67用Minitab分析资料卡方分析检验期望值标示于观察值下面>0.05年龄与受聘不相关的此数值告诉您好什么信息?期望值和理论值很接近,则Ho接受用Minitab分析资料卡方分析检验期望值标示于观察值下68另一个范例…受雇不受雇OldYoung4513545230P=0.024<0.05,说明不独立,即有相关联另一个范例…受雇不受雇OldYoung4513545230P69在Minitab中另一种卡方分析检验方法同样资料,但C9栏已取代Margin栏,我们现在有编码为good/bad的资料但我们没有Xfactors缺陷的表,如何使用卡方分析?Profitability.mpj在Minitab中另一种卡方分析检验方法同样资料,但C70此选项要示Minitab为我们制作一个暂时的观测频率表此表仅为完成计算而存在适用于一般表格(未统计出不同情况的总数)此选项要示Minitab为我们制作适用于一般表格(未统计71TabulatedStatisticsRows:YearColumns:Defect01All36246043.0017.0060.00138226043.0017.0060.0025556043.0017.0060.00312951180129.0051.00180.00AllChi-Square=17.893,DF=2,P-Value=0.000期望值观察值Nullhypothesis:year与defects数是相互独立的你觉得呢?注意:该运行Chi-square的选项并不会显示teststatistic的计算过程<0.05不独立TabulatedStatisticsRows:Yea72卡方分析评论卡方分析是本周所学分析工具中最不具洞察力、且较难以理解的工具-可以表现出统计的显著性,但实际显著性(Epslion)呢?使用Minitab的Chi-SquareTest时,您必须有至少5个期望频率来执行计算,否则Minitab会失败您的资料收集必须是随机的-注意其他隐藏因子(X’s)Minitab软件中:只要期望值>1就可积算卡方分析评论卡方分析是本周所学分析工具中最不具洞察力、且较73BB的提示注意您的抽样数目,不可太少
BB的提示注意您的抽样数目,不可太少74回顾介绍卡方分析-研究独立性检验的基本概念连结卡方分析-研究独立性检验与MAICroadmap回顾介绍卡方分析-研究独立性检验的基本概念75额外练习1、测量系统评估StatTablesChi-sguareTest将数据表直接按矩形输入:ABC#Good#Bad2325904543411983操作员与产品鉴别标准之间,是否存在相互关系?P=0.637>0.05说明:Ho成立说明操作员的影响因素不相关,可不考虑如果有,是什么原因造成这种差异?你下一步会做什么?输入数据额外练习1、测量系统评估StatTablesChi-sgu76额外练习2、产品保证(warranty)评估供应商和产品保证缺陷数之间,是否存在相互关系BadGood216273346710424YXABC如果有,是什么原因造成这种差异?你下一步会做什么?P=0.002<0.05说明:Ho不成立说明供应商与产品缺陷有相互关系输入数据额外练习2、产品保证(warranty)评估供应商和产品保证77方差分析6σ方差分析6σ78Chi-square(卡方分析)单-X多个XS单-YRegression(回归分析)ANOVAMeansMediansTests(方差分析)LogisticRegression(逻辑回归分析)Chi-square(卡方分析)MultipleRegression(多元回归分析)2,3,4way…ANOVAMediansTests(方差分析)MultipleLogisticRegression(多元回归分析)Y-Date连续离散连续离散Y-Date离散连续连续离散分析指南P-Vaule>0.05元相关性<0.05有很大相关性单-X多个XS单-YY-Date连续离散连续离散Y-Date79目的简介One-wayANOVA基本统计模式确认One-wayANOVA的统计假定学习不同的探索性分析与图解的技巧学习如何执行F-test(假设试验)研究方差比较的统计性检验目的简介One-wayANOVA基80连续型Y与离散型X方差分析平均值/中位值1LevelX的比较2LevelX的比较+3LevelX的比较研究Stability(若可行)研究Shape研究Spread研究Centering研究Stability(若可行)研究Shape研究Spread研究Centering或研究Stability(若可行)研究Shape研究Spread研究Centering连续型Y与离散型X方差分析1LevelX的比较81分析Roadmap:3个或更多样本+3LevelX的比较研究Stability(若可行)研究Shape研究Spread研究CenteringMinitab焦点或问题是?Descriptive统计与正态检验SPCChartI-MRBartlettTest(F-Test)Ho:σ2A=σ2B
1WayANOVAHo:μA=μB=μC1wayANOVA(SeeMBB)Kruskal-Wallis/MoodsMedians(MedA=MedB=MedC)1WayANOVAIfN>25ortransformed)Kruskal-Wallis/MoodsMedian(MedA=MedB=MedC)Kruskal-Wallis/MoodsMedian(MedA=MedB=MedC)SmallP-Value(<0.5)方差不相等SmallP-Value(<0.5)两个母体的Centering不想等Leven’sTestHo:σ2A=σ2B
是否有任何明显的变化趋势或模式,足以证明资料并非来自单一的母体/流程?资料是否为正态分布?小P-Value(<0.5)值,资料为非正态分布注意样本大小的问题堆叠资料与方差等同性检验正态非正态方差相等方差不相等分析Roadmap:3个或更多样本+3LevelX的比82分析Roadmap方差分析平均值/中位值+3LevelX的比较研究Stability(若可行)研究Shape研究Spread研究Centering在3个或更多的level中,我们使用它们的某些aspects来做相互比较3Levels的范例顾客1,2,&3是否相同的运送时间?分析Roadmap方差分析+3LevelX的比较研究83HypothesesNullHypothesis(Ho):对三位顾客的送达时间没有不同AlternateHypothesis(Ha):至少有一位顾客的送达时间和另一位顾客的送达时间不同(较高或较低)HypothesesNullHypothesis(Ho)84分析Roadmap:3+Samples+3LevelX的比较研究Stability(若可行)研究Shape研究Spread研究Centering开启ANOVA.MPJ中的工作表3LevelANOVAHo:资料之间是相同的假设Ha:资料之间是不相同的HoHaP>0.05P<0.05分析Roadmap:3+Samples+3LevelX85分析Roadmap:3+Samples3LevelANOVACust1Cust2Cust325.296926.005628.426826.057828.940027.508524.070026.006327.582524.819926.435627.401825.985125.992724.9209………实际问题比较Customer1,Customer2和Customer3所经历的运送时间的数据资料分析Roadmap:3+Samples3LevelAN86分析Roadmap:3个或更多样本+3LevelX的比较研究Stability(若可行)研究Shape研究SpreadMinitab焦点或问题是?Descriptive统计与正态检验SPCChartI-MRBartlettTest(F-Test)Ho:σ2A=σ2B
SmallP-Value(<0.5)方差不祥等Leven’sTestHo:σ2A=σ2B
是否有任何明显的变化趋势或模式,足以证明资料并非来自单一的母体/流程?资料是否为正态分布?小P-Value(<0.5)值,资料为非正态分布注意样本大小的问题堆叠资料与方差等同性检验正态非正态分析Roadmap:3个或更多样本+3LevelX的比87和以前相同——但只针对一个LevelCustomer3的资料我们应做何决定?我们应做何决定?和以前相同——但只针对一个LevelCustomer388堆叠您的资料…执行方差Homogeneity(等同性)检验,我们需要堆叠你的资料,请使用:MinitabManipStack/UnstackStackColumns堆叠您的资料…执行方差Homogeneity(等同性)检验89堆叠您的资料…StackCustomer25.2969126.0578124.07001……26.0056225.9400226.00632……26.3372325.3565325.78233堆叠您的资料…StackCustomer90方差Homogeneity同质检验我们想要知道,顾客间的运送时间的方差是否相等(Customer1的方差=Customer2的方差=Customer3的方差)“方差相等”为AnalysisofVariance(ANONA)中的隐藏假设。因此,在继续执行前,我们须先检验此假设是否成立执行此额外的检验将预防您在某些情况下,做出不正确的结论。它是额外的工作,但却是值得的!!方差Homogeneity同质检验我们想要知道,顾客间的运91方差Homogeneity检验选择MinitabStatANOVAHomogeneityofvariance来执行方差Hogeneity的检验,选Park为Response变量,以Customer为Factors方差Homogeneity检验选择MinitabStatA92和以前相同——但只针对一个LevelCustomr1,2,3的资料和以前相同——但只针对一个LevelCustomr1,2,93分析Roadmap:3个或更多样本+3LevelX的比较研究Stability(若可行)研究Shape研究Spread研究CenteringMinitab焦点或问题是?Descriptive统计与正态检验SPCChartI-MRBartlettTest(F-Test)Ho:σ2A=σ2B
1WayANOVAHo:μA=μB=μC1wayANOVA(SeeMBB)Kruskal-Wallis/MoodsMedians(MedA=MedB=MedC)1WayANOVAIfN>25ortransformed)Kruskal-Wallis/MoodsMedian(MedA=MedB=MedC)Kruskal-Wallis/MoodsMedian(MedA=MedB=MedC)SmallP-Value(<0.5)方差不相等SmallP-Value(<0.5)两个母体的Centering不想等Leven’sTestHo:σ2A=σ2B
是否有任何明显的变化趋势或模式,足以证明资料并非来自单一的母体/流程?资料是否为正态分布?小P-Value(<0.5)值,资料为非正态分布注意样本大小的问题堆叠资料与方差等同性检验正态非正态方差相等方差不相等分析Roadmap:3个或更多样本+3LevelX的比94One-wayANOVAMinitabStatANOVAOne-wayGraphsOne-wayANOVAMinitabStatANOVA95ANOVATableAnalysisofVarianceSourceDFSSMSFPFactor280.38640.19344.760.000Error8778.1160.898Total89158.502σ2pooled=σ21+σ22+σ233群组的大小相等群组平均值相等时,F-test会接近1.00在在本例中,此F-test相当大若P小于5%,则至少有一群组的平均值是不同的在本例中,我们拒绝H0(所有群组的平均值是相等的),因为,至少有一顾客的平均运送时间与其他顾客的不同这样大的F-test其发生的可能性是有的,但概率低于万分之一此发生的概率与投币连续投出10次人头的概率相当ANOVATableAnalysisofVarianc96更深入地观察ANOVAIandMRChartforCycleTimesbyWeek周与周之间的流程周期是否有变异呢?那么一周内(withinaweek)呢更深入地观察ANOVAIandMRChartfor97方差分析区分变异的来源TotalCycleTimeVariationVariationWithinWeekVariationBetweenWeeks=+ΣΣ(yij
–y)2=ΣΣ(yij
–y)2+n*Σ(yij
–y)2=kni=1j=1knki=1j=1i=1-=-方差分析区分变异的来源TotalCycleVariatio98因为我们的F的统计值非常大,我们知道目前的总流程周期的变异来源主要来自周与周之间的变异One-wayANOVA:CycletimesversusFactorAnalysisofvarianceforCycleTimSourceDFSSMSFPWeek31032.48344.16299.380.000Error96110.361.15Total961142.84Ftest统计值为一比率:每周间的变异每周内的变异因为我们的F的统计值非常大,我们知道目前的One-way99F-test与t-testF-test与t-test的关系F=t2让我们对此进行充分检验:用顾客运送时间资料或你的投射器资料,来执行t-test(twosided)与F-testF-test与t-testF-test与t-test100One-wayANOVA:CycletimesversusFactorSS或SumoftheSquares将资料的变异量化计算Epsilon2之值,来检视x的实际显著性此数值告诉我们有多少总变异可被x所解释Epsilon2=AnalysisofvarianceforCycleTimSourceDFSSMSFPWeek31032.48344.16299.380.000Error96110.361.15Total961142.84SSforXSSTotal
=1032.481142.84
=90.34%One-wayANOVA:Cycletimesve101特定的顾客是否为一重要的X?统计上?实际上?Minitab标记为Error的SS是什么?One-wayANOVA:CycletimesversusFactorAnalysisofvarianceforAllcustSourceDFSSMSFPWhichcus280.38640.19344.760.000Error8778.1160.898Total89158.502特定的顾客是否为一重要的X?One-wayANOVA102统计性假设在指定的Factor中,输出变量的母体变异在所有的Levels上是相同的(HomogeneityofVariance)-我们以HomogeneityofVariance程序,来检验此假设输出的平均值相互独立且正态分布-若使用随机抽样及适当的样本大小,此假设通常是成立的-注意:在化学流程中,输出变量通常不相互独立,因此随机抽样需经常被考虑Residuals(数学模型的误差)为相互独立且正态分布(Mean=0,Variance=常量)统计性假设在指定的Factor中,输出变量的母体变异在103方差分析AnalysisofvarianceforCycleTimSourceDFSSMSFPProduct329.5360.984555.810.000Error345.9980.176Total3735.534信息量自由度:f人人的行为数据C1C2C3n11,n12…n19
n21,n22…n29
n31,n32…n39
n=9×3=27fT=n-1=27-1=26fA=c-1=3-1=2fe=fT-fA=26-2=24fT=fA+fe=2+24=26ffAfefT产品信息自由度产品误差自由度变异来源信息量自由度说明样品差异大变异量化对每一个变异来源方差估计此统计值用以决定重要因子TypeIError(p-value)方差分析AnalysisofvarianceforC104方差分析表与图形One-wayAnalysisofVariance方差分析表与图形One-wayAnalysisofVa105Centering:MeansMinitabStatOneway注意,现在的Ha为:至少有一平均值是不同的Tukey’s检验协助我们分析哪一平均值与其他不相同Centering:MeansMinitabStatO106Tukey’spairwisecomparisonsFamilyerrorrate=0.0500Individualerrorrate=0.0194Criticalvalue=3.37Intervalsfor(columnlevelmean)-(rowlevelmean)12-1.1809-0.0149-2.8188-1.6527-2.2209-1.054923Tukey’s检验显示对任两平均值实际差异的置信区间例如,Customer1与Customer1间的实际差异介于-1.1809至–0.0149。换句话说,实际的差异极有可能非常接近0。Customer1与Customer1或Customer1的差异非常大,因为我们知道更显著Tukey’spairwisecomparisonsF107Centering:MeansMinitabStatOnewayComparisons以上的各种选项你该使用那一种?建议使用Fisher’s因为它较宽松换句话说,您较容易发现两平均值间有差异(更具统计能力),但您也会有较高的“falsepositive”风险(当真实差异不存在时,您却倾向于认为有差异)Centering:MeansMinitabStatO108Fisher’spairwisecomparisonsFamilyerrorrate=0.192Individualerrorrate=0.0500Criticalvalue=2.086Intervalsfor(columnlevelmean)-(rowlevelmean)Fisher’sABCB–8.186–1.814C–10.186–3.81–4.850
0.850D–3.023
3.0232.3347.6664.3349.666此矩阵显示平均值间的比较在一格中的两个数字,为平均值差异的95%置信区间若此二数均为正值或负值,则平均值间存有差异以小组形式来总结并报告分析结果Fisher’spairwisecomparisons109MainEffectsPlot(主效应图)MinitabStatMainEffectsPlotANOVA表示平均值MainEffectsPlot(主效应图)Minita110InteractionsPlots(区间图)MinitabGrapthInteractionsPolt显示平均值标准差InteractionsPlots(区间图)Minit111InteractionsPlot(区间图)MinitabGrapthInteractionsPolt显示平均值置信区间InteractionsPlot(区间图)Minita112InteractionsPlot分析两种plots有何不同之处?InteractionsPlot分析两种plots113其他检验法别忘了仍有其他的检验法可运用,当:-资料为非正态分布-方差不相等中位数(Medians)检验-Mood’sMedians检验>检验不同分布的中位数是否相等-Kruskal–Wallis
Medians检验>假设每一个被分析的分布有相同的形状>对很多分布而言,此方法比Kruskal–Wallis的检验能力低>与Mood’s中位数检验一样的基本假设>对更多的分布而言更具有检验能力,但较难应付outliers(分离点,非正常值其他检验法别忘了仍有其他的检验法可运用,当:-资料为非114Moods-MedianTestMinitabStatNonparameltricsMood’sMedianTestHo:ηCust1=ηCust2=ηCust3Ha:NotallηCustare=其中η’sare为母体中位数Moods-MedianTestMinitabStatN115Moods-MedianTestMoodMedianTestMoodmediantestforDeliveryAP-Value!我们应做何决定?Moods-MedianTestMoodMedianT116MinitabStatNonparameltricsKruskal-WallisHo:ηCust1=ηCust2=ηCust3Ha:NotallηCustare=Whereη’sarethepopulationmediansKruskal-WallisTestMinitabStatNonparameltricsKru117Kruskal-WallisTestAP-Value!我们应做何决定?Kruskal-WallisTestAP-Value!我118单因子实验的概念当输入变量(因子)有多个样本时,我们实际上正在执行一单因子实验通常我们想确认,因子的不同水平之间是否存在差异-范例:评估三家供应商的相同材料-范例:对5个不同的焊接工,评估他们是否一致我们开始讨论第一个实验让我们来看一看……单因子实验的概念当输入变量(因子)有多个样本时,我们实际上119单因子实验的概念考虑某个实例:一产品开发工程师,欲调查目前的5种焊接设定对电阻式焊接系统的焊接强度的影响她准备调查的范围介于15-19Amps之间
-她将观察此输入变量(Factor)的5个levels:15A,16A,17A,18A及19A
-对每一levels测试5个样本输出:WeldStrength输入:Current此为单因子实验的范例:X=Currentwith5levels单因子实验的概念考虑某个实例:一产品开发工程师,欲调查目前120范例Continued下列设计矩阵练习:开启ANOVA.MPJ中的WeldStrength工作表,并执行dotplot来比较每一level的weldstrengths15161718197121419771718251015121822111118191915918192311CurrentWeldStrength范例Continued下列设计矩阵练习:开启ANOVA.M121资料分析练习使用ANOVA.MPJ中的WeldStrength工作表,分析weldingexample资料依循roadmap搂分析并和邻桌商讨准备好在15分钟内,回答有关您的方法和结论的问题资料分析练习使用ANOVA.MPJ中的WeldSt122BB的提示在某些合适情形下,属性资料利用此工具也能达成良好成效。请先试用
BB的提示在某些合适情形下,属性资料利用此工具也能达成良123总结简介One-wayANOVA基本统计模式确认One-wayANOVA的统计假定学习不同的探索性分析与图解的技巧学习如何执行F-test(假设试验)研究方差比较的统计性检验总结简介One-wayANOVA基本统计模式确认124卡方分析6σ卡方分析6σ125Chi-square(卡方分析)单-X多个XS单-YRegression(回归分析)ANOVAMeansMediansTests(方差分析)LogisticRegression(逻辑回归分析)Chi-square(卡方分析)MultipleRegression(多元回归分析)2,3,4way…ANOVAMediansTests(方差分析)MultipleLogisticRegression(多元回归分析)Y-Date连续离散连续离散Y-Date离散连续连续离散分析指南P-Vaule>0.05元相关性<0.05有很大相关性单-X多个XS单-YY-Date连续离散连续离散Y-Date126目的介绍卡方分析-独立性检验的基本概念连结卡方分析独立性检验与MAICroadmap目的介绍卡方分析-独立性检验的基本概127分析RoadmapX数据离散连续卡方分析逻辑回归分析方差分析平均值/中位值回归分析离散连续Y数据离散连续X数据逻辑回归分析逻辑回归分析2,3,4方法…方差分析/中位值多变量回归分析离散连续Y数据单一X多个Xs单一X多个Xs多变量分析(注意:这并不是Multi-VariStudies)分析RoadmapX数据离散连续卡方分析逻辑回归分析方差128分析Roadmap单一Xvs.单一YX数据离散连续卡方分析逻辑回归分析方差分析平均值/中位值回归分析离散连续Y数据分析Roadmap单一Xvs.单一YX数据离散连129资料受雇不受雇合计OldYoung合计301501804523027575380455在此,你将如何作决策?资料受雇不受雇合计OldYoung合计3130假设在卡方分析独立性检验中,统计学家对大多数的变量皆假设为独立的,因此:Ho:资料相互独立(不相关)Ha:资料相互不独立(相关)如果P值<0.05,就拒绝Ho假设在卡方分析独立性检验中,统计学家对大多数131理论我们来看此范例…我们想要知道年龄与受聘间是否独立所以我们假设的内容如下…-Ho:年龄和受聘间是独立的-Ha:年龄和受聘间是不独立的理论我们来看此范例…我们想要知道年龄与132步骤#1我们需将此两个变量分成不同的level,并制作观察频率表:年龄:Old与Young聘雇:受雇与不受雇然后:收集资料并分析受雇不受雇OldYoung3015045230步骤#1我们需将此两个变量分成不同的level,并制作观察133步骤#2计算栏与列的总和受雇不受雇合计OldYoung合计301501804523027575380455步骤#2计算栏与列的总和受雇不受雇合计OldYoung合134步骤#3制作观察频率表。也就是说,如果这两个变量相互独立,表格应该是什么样的?受雇
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 铁路调车综合实训调车手信号课件
- 铁路运输市场营销宏观环境分析课件
- 中国人的脸课件
- 中国上课课件
- 中医数据库技能培训课件
- 2025年度人力资源项目承接合同样本
- 私人住宅防水施工合同示范
- 碧桂园物业服务合同x
- 2025版保健品供应合同
- 天津财经大学《计算机科学前沿》2023-2024学年第二学期期末试卷
- 期中(试题)-2024-2025学年人教精通版(2024)英语三年级下册
- 2025-2030中国煤焦油杂酚油行业市场发展趋势与前景展望战略研究报告
- 防洪防汛安全教育知识培训
- 2020-2025年中国辽宁省风力发电行业发展潜力分析及投资方向研究报告
- GB 15269-2025雪茄烟
- 规模养殖场十项管理制度
- 2025航天知识竞赛考试题库(含答案)
- 2025中考英语热点话题阅读《哪吒2魔童闹海》
- 劳务派遣劳务外包项目方案投标文件(技术方案)
- 疟疾2025培训课件
- 流行性感冒诊疗方案(2025版)解读课件
评论
0/150
提交评论