西格玛A阶段绿带教材_第1页
西格玛A阶段绿带教材_第2页
西格玛A阶段绿带教材_第3页
西格玛A阶段绿带教材_第4页
西格玛A阶段绿带教材_第5页
已阅读5页,还剩220页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

6Sigma绿带培训-分析阶段

第一章概述(1)多变量分析(2)方差组分分析(3)中心极限定理第二章假设检验(1)假设检验简介(2)均值比较(3)方差比较(4)比例比较(5)样本量选择第三章相关性分析(1)X-Y图(2)相关系数(3)误解分析(4)Minitab练习(抛射器)第四章一般线性回归分析第五章多元回归分析第六章分析阶段路径第七章附录第八章非参量统计(阅)目录DM阶段回顾与试题讲解

多变量分析第一章概述练习制作多变量图多变量图与控制图基本概念及作用多变量分析变异来源分类分析应用数据采集要求使用环境变异的2个来源3种分类多变量分析数据采集抽样要求组内、组间、组外的含义Minitab制作多变量图路径方差组分分析方差组分分析用途分析实例、练习交叉与嵌入的混合结构嵌入结构交叉结构因子的数据结构工具工具三种数据结构及相关分析方法方差组分分析四大用途Minitab进行方差组分分析路径模块目标流程图/鱼骨图筛选DOE因果矩阵与FMEA多变量/方差组分/中心极限定理优化DOE通过优化并控制关键X达到流程优化和控制的目的6Sigma改进过程中的漏斗效应假设检验30-50个X10-15个X8-10个X4-8个关键X3-6个关键X应用环境变异的来源单件产品内部批次内单件产品之间不同批次之间不同操作员之间不同生产设备之间设备生产转换前后不同时间段测量系统的重复性测量系统的再现性校准前后的稳定性不同测量人员之间量程范围内的线性度来自流程的变异来自测量系统的变异变异…………什么是多变量分析?多变量分析:基本概念及作用从多个角度通过图表观察造成流程绩效指标变异的原因观察流程的短期与长期能力间的差距及造成差距的主要原因与方差组分分析一起使用,可以明确流程变异的根本原因

流程绩效指标随流程输入和流程指标变化的图标展示在生产中对当前流程水平进行过程能力分析的手段

流程稳定性的直观观察多变量分析的作用是什么?多变量图R内:单元内部的变化范围R间:单元间的差别R时:不同时间段的差别图为某注塑车间随时间(151821)的不同,注塑强度差异的多变量图R内R外R间多变量分析:多变量图通常在一个图表上展示2-4个X对连续变量Y的影响多变量图与控制图的比较9:0010:0011:0012:00A、单元内的变异是最大来源9:0010:0011:0012:00B、单元间的变异是最大来源9:0010:0011:0012:00C、时间造成的变异最大多变量分析:与控制图的比较有助于发现将流程稳定在最佳条件下的一些有用线索条件:在流程中存在很多变异的情况下,优点:有助于发现造成变异甚至失控的来源优点:可以揭示流程的稳定性与可控性缺点:不能直接发现造成失控的根本原因综合控制图多变量图变异来源变异来自流程的变异1、单件产品内部2、批次内单件产品之间3、不同批次之间4、不同操作员之间5、不同生产设备之间6、设备生产转化前后7、不同时间段8、……来自测量系统的变异1、测量系统的重复性2、测量系统的再现性3、校准前后的稳定性4、不同测量人员之间5、量程范围内的线性度6、……多变量分析:应用环境顺序空间时间来自单单件内内部的的变异,,来自自同一一批次不不同单单件间间的变异异化工厂厂的不不同反反应容器器之间间不同的的设备备或操操作员工工之间间连续续生生产产的的单单件件之之间间不同同的的生生产产安安排排之之间间不同同的的原原料料或或批批次次之之间间固定定间间隔隔的的不不同同时时间间段段,,如如每每小小时时,,班班组组,,日日,,星星期期等等短时时间间间间隔隔(小小时时,,班班组组)与与长长时时间间间间隔隔((日日、、星星期期))的的比比较较等等常见见变变异异来来源源分分类类多变变量量分分析析::应应用用环环境境设备2设备1位置顺序时间1时间1时间间隔常见见的的变变异异来来源源图图示示多变变量量分分析析::应应用用环环境境揭示示常常见见的的变变异异来来源源————产产品品单单元元内内,,单单元元之之间间,,批批次次之之间间,,人人员员,,设设备备,,班班组组,,时时间间,,原原料料,,生生产产调调整整等等。。测量量系系统统的的重重复复性性与与再再现现性性分分析析————理理解解测测量量误误差差的的来来源源。。应用用举举例例多变变量量分分析析::应应用用环环境境如果果要要确确定定是是时时间间因因素素带带来来的的变变异异,,进进行行多多变变量量分分析析时时应应尽尽量量采采用用系统统抽抽样样的方方式式((定定时时或或固固定定间间隔隔采采样样))为了了充充分分暴暴露露问问题题,,应应尽尽量量使使用用长期期数数据据,考考虑虑了了各各个个造造成成变变异异的的因因素素后后,,才才能能客客观观反反映映问问题题的的来来源源,,一一般般要要求求样本本的的方方差差达达到到流流程程总总变变异异的的80%以以上上。抽样样指指导导原原则则::1、、空空间间/位位置置原原因因变变异异——每个单件件上至少少选择两两个位置置2、顺序序—每个批号号或每个个时间段段至少选选取3个个连续生生产的部部件3、时间间因素——至少挑选选20个个固定间间隔的抽抽样时间间段多变量分分析数据据采集要要求多变量分分析:应应用环境境应用Minitab画画多变量量图黑带老王王希望了了解培训训和经历历对员工工生产率率的影响响,根据据与项目目团队的的交流发发现员工工在岗时时间(1-5年年)和培培训项目目(有基基础培训训与专家家培训两两种),,分别为为40和和80小小时。对对工件的的加工时时间用来来衡量生生产率。。部分相关关数据如如图所示示。数据在Minitab文件件multivariate-crossed.maw中。打开文件件按下图图进行练练习。实例操作作多变量分分析:图图形制作作Stat>QualityTools>Multi-VaryChartResponse:TimeFactor1:TrainingHoursFactor2:Experience点击“Options”并选选择所有有三项((包括DisplayindividualDataPoints))OK应用Minitab画多变量量图多变量分析析:图形制制作应用Minitab练习,你你能得出什什么结论??多变量分析析:图形制制作同等经历与培训的员工似乎仍有一定程度的差别:50-80分钟。有一年经验的员工通过培训可最大程度地提高生产率:平均降低约175分钟工作经验的影响:第一年到第三、五年平均降低约40分钟,第三、五年的差别不大多变量分析析:图形制制作再练习一次次,但两个个因子的顺顺序互换Stat>QualityTools>Multi-VaryChartResponse:TimeFactor1:ExperienceFactor2:TrainingHours点击“Options”并选选择所有三三项(包括括DisplayindividualDataPoints)OK应用Minitab练习“多多变量分析析”多变量分析析:练习多变量分析析:练习应用Minitab练习,你你能得出什什么结论??方差组分分分析第一章概概述交叉结构———举例注意内容三种因子数数据结构交叉结构::根据具体体生产运营营情况,有有完全交叉叉的因子关关系嵌入结构::因子间存存在从属关关系交叉与嵌入入混合结构构:交叉与与从属结构构混合的情情形在进行多变变量分析前前应该特别别注意数据据是如何收收集的及因因子之间的的相互关系系在一次MSA分析中中,由3个检验员对对10个部件进行行了MSA分析。要求:3个检验员对对所有10个部件都重复测量对于测量结结果来说,,部件和质检员都是造成偏偏差的来源源由于所有的的检验员和和所有部件件都组合过过,是典型型的交叉结结构其它交叉结结构实例::试验设计计中的全因因子试验模模型方差组分分分析:因子子数据结构构交叉结构———图示11213212122121321212

检验员部件测量次数11213212122121321212

检验员部件测量次数方差组分分分析:因子子数据结构构在超市购买买洗发水,,香皂,罐罐装饮料等等,都可以以发现一个个产品序列列号。产品品的序列号号可以追踪踪到生产日日期和批次次。再生产商内部部,任何一件件产品只能来来自某个批次次,某个生产产线,某班组组,某批原料料。同一批次的产产品只能来自自某个生产线线,可能属某某班组,某批批原料。几个班组可能能只是在某个个生产线工作作(如不同地地域)所有生产线可可能在同时只只处理同一批批原料。这就可能构成成完全嵌入的的从属关系。。嵌入式结构———举例方差组分分析析:因子数据据结构嵌入式结构———图示21122132112121213212121原料批次生产线班组批次单件产品编号可能一样但实际上是不同的方差组分分析析:因子数据据结构因子数据结构构不同,采用用的定量分析析方法就不同同方差组分分析析可用于:识别最大的变变异来源通过对最大变变异来源的消消除达到改善善流程的目的的为改善阶段流流程的优化确确定方向建立更有效的的样本采集计计划交叉结构———采用方差分析(包括固定模模型和随机模模型)的方法法分析通嵌入结构———采用方差组分分析析可以把各个来来源所造成的的变异进行分分离,并计算算出各自为总总体的偏差((以方差计算算)所带来的的份额有多少少方差组分分析析:用途方差组分分析析——举例某化工厂黑带带小张意图减减少洗发水罐罐装量偏差过过大的问题。。罐装是在不不同工厂,不不同设备及有有不同班组的的员工进行。。为了定量了了解上述原因因对罐装量((以克为单位位)变异的影影响,小张分分别到四个工工厂的四个班班组中随机抽抽取了四位操操作员,每位位操作员工作作时抽取三个个样品(每间间隔800个个生产产品))进行了分析析。这是一个典型型的嵌入式结结构,可借助助完全嵌入结构构的方差分析析(即方差组分分分析)定量量研究成果作作为该结果。。文件名称为::shapooweight.mtw.方差组分分析析:分析案例例多变量分析::举例交叉结构分析应用工具之一方差组分分析析:分析案例例班组间变异操作员间变异异内部变异工厂间变异多变量分析结结论方差组分分析析:分析案例例请注意输入顺顺序:从高级开始逐级级下沿进行定量分析析方差组分分析析Minitab应用方差组分分析析:分析案例例NestedANOVA:WeightversusPlant,Shift,Operator,Sample

AnalysisofVarianceforWeight

SourceDFSSMSFPPlant30.74110.24705.7430.011Shift120.51620.04301.3020.249Operator481.58650.03312.5820.000Sample1281.63850.0128Total1914.4824工厂间及操作员之间的变异是造成变异的显著原因。方差组分分析析——举例方差组分分析析:分析案例例VarianceComponents

SourceVarComp.%of

TotalStDevPlant0.00417.260.065Shift0.0013.370.029Operator0.00727.400.082Sample0.01351.970.113Total0.0250.157

ExpectedMeanSquares

1Plant1.00(4)+3.00(3)+12.00(2)+48.00(1)2Shift1.00(4)+3.00(3)+12.00(2)3Operator1.00(4)+3.00(3)Sample1.00(4)各因素对总变异的贡献比例及绝对量。获得上述数据结论的计算方法。方差组分分析析——举例方差组分分析析:分析案例例同一操作员随随时间进行会会有不同的罐罐装量,这是是造成变异的的最大原因不同员工罐装装量有区别,,应研究培训训或操作规程程的制定执行行情况不同工厂罐装装数量有不同同之处,应调调查原因是什什么不同班组之间间没有明显的的区别方差组分分析析——结论方差组分分析析:分析案例例绿带李小姐负负责供应商质质量管理工作作,她需要了了解是否存在在供应商与本本公司之间对对某产品某项项指标的检验验结果是否相相同。由于供供应商来自另另外一个国家家,来料的品品质检验难以以按照交叉检检验的方式进进行。为此,,李小姐要求求供应商在其其两个生产基基地各自选五件产产品,并各随机选选择一个检验验员进行重复复测量。在本本公司也选了五件产产品,也挑选了一位位检验员进行行了重复测量量。结果汇总到文文件nestedr&r.mtw中中。请用多变变量分析及方方差组分分析析进行研究。。然后采用嵌嵌入式R&R(Stat>QualityTools>GageR&RStudy(nested))验证证。多变量分析及及方差组分分分析——练习习方差组分分析析:分析案例例多变量图可以以展示造成变变异的来源方差组分分析析可以定量研研究变异的来来源数据结构决定定了采用的分分析模型(1)交叉结结构:方差分分析、MSA测量系统分分析“Stat<<QualityTools…<<GageStady……或AttributeAgreementAnalysis……”(2)嵌入结结构:方差组组分分析;““Stat<<ANOVA<<FullyNestedANOVA…”方差组分分析析:小结中心极限定理理第一章概述述模块目标产生、处理、、分析数据的的4点小知识识中心极限定理理的三点内容容Minitab制作多变变量图路径产生/处理数据的均值数据比较均值中心极限定理产生/处理数据引入练习求:数据均值求:均值数据的均值总结求:数据标准差求:均值数据的标准差比较标准差中心极限定理样本标准差=样本均值的标准差样本均值=样本均值的均值对于任何分布,样本均值的分布趋向于正态分布Attheendofthischapterthethestudentwillbeableto:本章章结结束束后后,,你你应应能能够够::DescribethebasicmeaningoftheCentralLimitTheorem描述述中中心心极极限限定定理理的的基基本本含含义义Explain(mathematically)howthemeansandvariancesofsamplesfromvariousdistributionsaresimilartoanddifferentfromtheirparentdistribution解释释((从从数数学学上上))各各种种分分布布的的样样本本的的均均值值和和方方差差与与总总体体的的均均值值和和方方差差的的关关系系。。*学习习目目标标用途途1::用途途2::用途途3::置信信区区间间源源自自中中心心极极限限定定理理。。中心心极极限限定定理理和和置置信信区区间间是是推推断断统统计计决决策策的的基基本本工工具具中心心极极限限定定理理是是统统计计推推断断的的基基本本概概念念。。我我们们可可以以通通过过该该定定理理用用样样本本的的数数据据推推断断总总体体的的特特性性中心心极极限限定定理理::定定理理用用途途跟随随老老师师进进行行以以下下练练习习:产生生数数据据::“Calc>RandomData>Normal……””产生生100行行9((n=9))列列随随机机数数,,均均值值=5、、标标准准差差=3叠加加数数据据::“Data<<Stack<<Columns...””产生数数据叠加数数据中心极极限定定理::引入入练习习数据的的均值值———数据的的标准准差——““σ”μ=5.1347σ=2.9483计算数数据的的均值值(μ)、标标准差差(σ)、观观察数数据分分布::“Stat<<BasicStatistics<<GraphicalSummary””中心极极限定定理::引入入练习习“Stat<<BasicStatistics<<DisplayDescriptiveStatistics...”DescriptiveStatistics:数数据值值VariableNN*MeanSEMeanStDev数据值值90005.13470.09832.9483μ=5.1347σ=2.9483中心极极限定定理::引入入练习习产生数数据的的均值值数据据:““Calc<<RowStatistics””从C1-C9列列随机机抓9个数数(每每列1个)),求求平均均值,,从而而得出出一组组平均均值的的数据据中心极极限定定理::引入入练习习计算均均值数数据的的均值值、均均值数数据的的标准准差、、观察察均值值数据据的分分布::“Stat<<BasicStatistics<<GraphicalSummary”均值数数据的的均值值———均值数数据的的标准准差———中心极极限定定理::引入入练习习“Stat<<BasicStatistics<<DisplayDescriptiveStatistics...”DescriptiveStatistics:均均值VariableNN*MeanSEMeanStDev均值10005.13470.09740.9735中心极限定定理:引入入练习比较“μ”与“””;比较较“σ”与“””;已知:μ=5.1347;σ=2.9483;n=9;;所以:结论:(1))样本均均值的均均值=总总体均值值(2)样样本均值值的标准准差=总总体标准准差/组组数的开开方(3)随随着n增增加,对对任何分分布,均均值的分分布越趋趋向正态态分布中心极限限定理::引入练练习按以下步骤进行练习:打开Minitab从“Chi2”产生数据计算C1-C9的均值,将结果存储到C10列:“Calc<<RowStatistics...”叠加C1-C9,将结果存储到C11列:“Data<<Stack<<Columns”建立C10与C11的直方图:“Stat<<BasicStatistics<<GraphicalSummary”或“Stat<<BasicStatistics<<DisplayDescriptiveStatistics...”或“Graph<<Histogram”进行C10和C11的正态性检验1、条件:生成200行;存储在C1-C92、路径:“Calc>RandomData>Chi-Square”练习非正正态分布布的中心心极限定定理中心极限限定理::引入练练习中心极限限定理的的定义中心极限限定理((1)::样本均值值的标准准差=样样本的标标准差/均值的的样本容容量的开开方=

σ=总体的标准差n=均值的样本容量=均值的标准误差中心极限限定理((2)::随着n增增加,对对任何分分布,均均值的分分布越趋趋向正态态分布置信区间间源自中中心极限限定理。。中心极限限定理和和置信区区间是推推断统计计决策的的基本工工具。中心极限限定理是是统计推推断的基基本概念念。我们们可以通通过该定定理用样样本的数数据推断断总体的的特性。。中心极限限定理定定义:第第一部分分此概念对对正态和和非正态态同样成成立如果容量为n的随机样本取自一个均值为μ标准差为σ的分布,则样本的均值将形成一个小的分布,新分布的均值与原分布相同,但标准差将缩小为。总体分布样本分布x-----

μ-----σ-----

某公式揭揭示了““样本均均值”的的变化,比单个个个体观观察的变变化要小小(为样样本容量量的平方方根)SEmean样样本均均值分布布变差,,比原始始总体小小(对任任何n>1的总总体)个体组成成的总体体样本均值值组成的的总体Note注意如果σ未知,样本量大于30,则样本标准差s可以用至上述公式中。那么,标准误差的估计值为:

中心极限限定理定定义:第第一部分分我们常依依赖从测测量系统统(MS)读取取的一个个数据,,此数据据用来估估计“真真实”质质量特性性。可以利用用中心极极限定理理,从同同一部分分读取两两次以上上数据并并取平均均,以减减少测量量系统的的误差。。=+==likewiseRecall:%ContributionofMS=中心极限定理理定义:第一一部分实际应应用测量系统的精精度将提高,,因为样本容容量(重复测测量的次数))的平方根。。这当然不是逃逃避修理量仪仪的借口!跟老师进行以以下练习:从正态分布中中,产生100行9列数数据1、Mean(均值))=50;StandardDeviation(标标准差)=92、将前9列列的均值都储储存在C10;将前9列列的数据都累累叠在C11中心极限定理理定义:第一一部分练习作C10,C11的直方方图,并进行行正态检验,,对比其结果果,可以得到到什么结论??练习:二项分分布结果会怎怎样?产生100行行9列随机机二项分布数数据,Calc/RandomData/Binomial使使用用Trials=20,p=0.3>>求求每行行平均均,存存在C10列Calc>RowStatistics>>将将C1-C9列列累叠叠在C11列Data>Stack>Column,正态态性检检验.>>分分别别作作C10,C11列列的的直直方方图图>>分分别别求求C10,C11列列的的标标准准差差。。比较较两两图图及及其其标标准准差差,,有有何何异异同同??中心心极极限限定定理理定定义义::第第一一部部分分练练习习随着着n增增加加,,对对任任何何分分布布,,均均值值的的分分布布越越趋趋向向正正态态分分布布。。中心心极极限限定定理理定定义义::第第二二部部分分中心极限定理,使我们可以假定:对正态分布,中心极限定理,使我们可以假定:来自任何分布的样本均值分布都近似于正态分布,只要“n”足够大(对于任何分布要求n>30)样本均值本身也是正态分布,且与样本容量无关均值标准误差告诉我们,随着样本容量的增加,样本均值的标准差将减小,将有助于计算置信区间。卡方方分分布布((选选择择自自由由度度=4))指数数分分布布((任任选选均均值值))1)对对各各种种样样本本容容量量,,分分别别预预测测均均值值的的标标准准误误。。2))同同时时生生成成直直方方图图和和描描述述统统计计来来验验证证你你的的预预测测。。3)样样本本容容量量增增加加时时出出现现什什么么现现象象??练习习非非正正态态分分布布的的中中心心极极限限定定理理从下下面面2个个分分布布中中选选择择一一个个分分布布,,重重做做非非正正态态分分布布的的中中心心极极限限定定理理的的练练习习,,使使n分分别别等等于于9,,16,,36。。中心极限限定理定定义:第第二部分分练习分成小组组掷色子子首先进行行单个投投掷,投投掷100次,,将结果果记录到到Minitab.然后进行行五个同同时投掷掷,投掷掷100次,将将平均值值记录到到Minitab.最后进行行十个同同时投掷掷,投掷掷100次,将将平均值值记录到到Minitab.分别作出出三次结结果的直直方图。。分别对三三次结果果进行正正态检验验。展示小组组结论。。中心极限限定理练练习中心极限限定理定定义:第第二部分分练习IntroductionToHypothesisTesting假设检验验简介第二章假假设检检验突破性改善特性化优化定义测量改善分析控制确定原因是否真实。验证解决方案是否有效。确定重大改变发生的时间。假设检验验简介::概念及及作用6Sigma线线路图——假设检检验完成本章章节后,,学员能能够………对抽样对对象总体体的均值值,方差差,比例例进行假假设检验验学习目标标过程A过程B缺陷品之数量为什么进进行假设设检验??两个过程程差异是是否显著著?ProductionLine12168173178183Within(mm)1线和2线生产产的产品品的平均均宽度存存在差异异吗?它真的存存在差异异吗?假设检验验简介::概念及及作用我们对抽抽样中的的数据进进行分析析,区分分很容易易出现的的结果和和很难出出现的结结果。如果很难难出现的的结果出出现了,,我们可可以这样样解释………出现了罕罕见的结结果,或或者事物物并不是是我们想想象的那那样统计推论论指导假设有人人声称报报考音乐乐学院的的女生会会比男生生多;如如果从1000个学生生的抽样样中得到到下列结结果,你你会对以以上声明明的正确确性得出出什么样样的结论论?a)505个个女生??b)980个个女生??505个个女生通常都是是在1000个个学生中中有500个女女学生。。505个女女生跟500非非常相近近,我们们不会支支持报考考音乐学学院的女女生比男男生多的的声明。。980个个女生一般不会会发生1000个学生生中有980个个女生的的情况。。这种情情况有两两种解释释:一是是一般不不会发生生的异常常事件发发生了,,或者是是更让人人信服的的解释,,报考音音乐学院院的女生生的确比比男生更更多的声声明是正正确的。。假设检验验推论举举例假设检验验简介::概念及及作用如果报考考音乐学学院的学学生不存存在性别别上优先先选择抽样结果505outof1000通常的情况况500outof1000显著性区别别假设是………对于一些些未知事实实的陈述或或声明统计假设是是……就对对象总体特特性(例如如均值,方方差和比例例)的声明明或陈述。。在许多问题题中,都需需要对一个参数数的陈述作作出接受或或者否决的的判定。传统的决策策方式是基基于具有高高风险的主主观意识,,统计检验验为我们提提供了一个个客观的解解决方案。。假设检验为为我们的决什么是假设设检验?A、建立立零假设和和备选假设设。B、决定定显著性水水平α。。C、随机机抽取具有有代表性的的样本D、计算P值。E、比较较P值和显显著性水平平,α。。F、得出出结论。假设检验基基本步骤假设检验简简介:概念念及作用假设检验简简介:零假假设与被选选假设零假设与被被选假设实际进行假假设检验时时,假设包包含两个互互补的陈述述,即:零零假设(H0)、备选假假设(H1),备选假假设也叫研研究假设。。例如:H0-氧化物平平均厚度等等于200angstromsH1-氧化物的的平均厚度度不等于200angstroms当检验总体体均值时交货时间::以前,A型产品的的交货时间间平均为39天;改改善措施实实施后,收收集新的数数据。平均均天数为33天。营营运经理称称过程已经经得到了改改善。1、什么是是零假设??2、什么是是备选假设设?零假设与被被选假设::小组讨论论陈述零假设设与被选假假设例一是双边边检验,例例二是单边边检验,为为什么?假设检验简简介:零假假设与被选选假设更多举例练习零假设设与被选假假设根据提供的的例子,陈陈述零假设设和备选假假设练习1:缺缺陷比例———某个产产品有两条条生产线,,你想找出出两条生产产线的缺陷陷率是否不不同。写出出比例的假假设声明::P(A)代表生生产线A的的缺陷率;;P(B)代表表生产线B的缺陷率率H0::H1:练习习2::塑塑料料强强度度————你你将将测测试试塑塑料料A的的样样本本以以确确认认它它的的压压力力强强度度是是否否大大于于30kg/cm2H0:H1:假设设检检验验简简介介::零零假假设设与与被被选选假假设设只要要进进行行假假设设检检验验,,在在决决策策时时就就会会有有风风险险。。两两种种错错误误((风风险险))::I类类错错误误((也也叫叫αα风风险险))::当当零零假假设设正正确确时时,,否否定定零零假假设设的的概概率率II类类错错误误((也也就就ββ风风险险))::当当归归零零检检验验错错误误时时,,肯肯定定零零假假设设的的概概率率假设设检检验验简简介介::风风险险评评估估I类类和和II类类错错误误真实实情情况况决策策零假假设设真真零假假设设伪伪不否否定定零零假假设设否定定零零假假设设H0:被被告告无无罪罪H1:被被告告有有罪罪以下下情情况况是是什什么么类类型型错错误误??当被被告告无无罪罪的的时时候候,,陪陪审审团团得得出出有有罪罪结结论论??当被被告告有有罪罪的的时时候候,,陪陪审审团团得得出出无无罪罪结结论论??当零零假假设设真真时时,,否否定定零零假假设设的的错错误误I类类错错误误发发生生的的概概率率叫叫做做显显著著水水平平,,由由αα代代表表。。常见见水水平平::αα=0.05;;检检出出能能力力是是否否定定错错误误的的零零假假设设的的概概率率Power=1-ββ(TypeII);;检检出出能能力力是是I类类错错误误减减去去II类类错错误误。。I类错错误发发生概概率Power当零假假设假假时,,接受受零假假设的的错误误置信度度Power假设检检验简简介::风险险评估估抽取数数据是是否有有足够够的证证据确确保否否定零零假设设?作作为假假设检检验的的结果果,我我们或或者……1、否否定零零假设设2、无无法否否定零零假设设决定假设检验验简介::假设检检验总结结假设检验验的理解解从假设检检验中得得到两个个结论::1、如如果P值值比α小小就否定定零假设设;声明明应该同同下列陈陈述相似似:“在在α水平平没有足足够的证证据证明明备选假假设是正正确的””。2、如如果P值值比α大大就无法法否定零零假设::声明应应该同下下列陈述述相似::在α水水平没有有足够的的证据证证明备选选假设是是正确的的。解释P值值H0:过程均值值等于目目标值H1:过程均均值不等等于目标标值850851.6目标值样本均值?P-value=0.017被选假设成立假如过程程均值与与目标值值相同,,只有1.7%的机会会得到这这种样本本数据。。选择何种种检验决决定于数数据的分分布类型型和比较较的类型型假设检验验类型假设检验验简介::假设检检验总结结几种常见见的假设设检验1、检验验总体均均值是否否等于目目标值2、检验验两个总总体均值值是否相相等。3、检验验两个以以上总体体均值是是否相等等4、检验验方差是是否相等等5、检检验两个个总体比比率是否否相等6、检验验关联性性(多比比例)TestingofMean………均值比较较第二章假假设检检验情况1检验整体体均值和和目标数数值是否否相等。。第二章假假设检检验对计量型型数据进进行假设设检验时时:抽样样数量n≥30时时,就算算是大抽样数量量n<30时,,就算是是小参数检验验基于总总体的一一些假定定前提((例如,,抽样对对象必须须正态分分布)。。非正态检检验不需需要这种种假定。。可能的话话就选择择参数检检验,非非正态检检验不是是非常有有效。本本章中我我们会讨讨论最常常用的参参数检验验均值比较较:单样样本检验验大样本与与小样本本一个均值值检验::大样本本在下列情情况下,,要用到到单样本本Z检验验(1)检检验整体体的均值值是否与与目标数数值相等等,并且且样本量量大,n≥30(2)总总体标准准差是已已知的或或用样本本标准差差S代替替举例:太太阳能电电池使用新的的抗热黏黏胶将太太阳能电电池固定定在平板板上。黏黏胶必须须有足够够的强度度(目标标平均值值为2.85磅磅),随随机抽取取49个个产品测测量断裂裂强度。。数据在Solar.cell.MTW中。。从样本将将计算出出:Y=2.846;;S=0.100平均断裂裂强度与与目标值值2.85磅是是否有显显著差异异?按照下列列步骤操操作:A)建立立零假设设和备选选假设H0:μ=2.85pounds((平均断断裂强度度等于目目标值))。H1:μ≠2.85pounds(平平均断裂裂强度不不等于目目标值))。B)决定定显著性性水平,α=0.05C)随机机抽取数数据收集集了49个数据据。Y=2.846,s=0.1D)计算算P值::如果零零假设正正确,得得到观察察的抽样样的概率率。使用用Minitab………Select:Stat>BasicStatistics>1-sampleZE)比较较p值和和重要水水平。P-value=0.797,>αα=0.05;;所以我们们不能否否定零假假设。数数据不能能提供足足够的证证据否定定平均强强度等于于2.85磅。。举例分析析均值比较较:一个个大样本本均值检检验收集数据据并计算算P值我们选择1-sampleZ检验验,因为我我们检验的的是一个样样本的均值值和一个特特定值(2.85))是否相等等,且它是是个大样本本(n≥≥30))One-SampleZ:forceTestofmu=2.85vsnot=2.85Theassumedstandarddeviation=0.1VariableNMeanStDevSEMeanforce492.846330.100490.01429Variable95%CIZPforce

(2.81833,2.87433)-0.260.797P-value=0.797,>αα=0.05;所所以我们不不能否定零零假设。数数据不能提提供足够的的证据否定定平均强度度等于2.85磅。。Minitab输出出结论我们现在展展示进行假假设检验的的细节我们在检验验关于抽样样对象均值值的声明由于n>30,,根据中心心极限定理理,抽样均均值的分布布接近正态态分布。由于–1.96<-0.26<+1.96,我我们不能否否定零假设设。Orz=0规格下限规格上限=0.025Defects不合格产品Z=-1.96Z=1.96=2.85=2.85RejectH0RejectH0SampleData:y=2.846orz=-0.26均值比较::一个大样样本均值检检验样本:Y=2.8463s=0.1005n=49由中心极限限定理:=z===-0.26计算算检检验验统统计计量量P值值是是在在假假定定零零假假设设成成立立的的情情况况下下,,因为P的数值大于α=0.05,我们不能够否定关于平均断裂强度等于2.85磅的假设。P值由于是是大样样本((n>30),我们们可以以用S替代代σ,我们们使用用抽样样标准准作为为预测测σ,那么么:均值比比较::一个个大样样本均均值检检验在下列列情况况下,,要运运用单单样本本t检检验……检验抽抽样对对象均均值和和目标标数值值是否否相等等,并并且抽抽样数数量少少σ未知知数据正正态分分布Example:Metalwafer举举例::金属属薄片片问题::A.哪个个更加加合适适?单单边检检验还还是双双边检检验??B.为什什么在在这个个例子子中使使用的的是1samplettest1samplet,,而而不是是1-sampleZtest?小样本本分析析均值比比较::一个个小样样本均均值检检验假设检检验和和重要要水平平建立零零假设设和备备选假假设H0:μ=3cmH1:μ≠3cm决定显显著水水平,α=0.05随机选选择样样本数数据从从18个样样本中中:=3.003S=0.0031注意:因为为t检检验要要求数数据为为正态态,我我们下下一步步是要要进行行正态态检验验我们首首先使使用Anderson-Darling检检验验评估估正态态分布布Stat>BasicStatistic>Normalitytest正态性性检验验P值计计算d)计计算算P值值,使使用Minitab:Stat>BasicStatistics>1-SampletOne-SampleT:ThicknessTestofmu=3vsnot=3VariableNMeanStDevSEMeanThickness183.002940.003100.00073Variable95%CITPThickness(3.00140,3.00448)4.040.001e)因因为为0.001<0.05,,我们们否定定零假假设。。f)数数据据提供供了足足够的的证据据证明明平均均厚度度不等等于3厘米米。均值比比较::一个个小样样本均均值检检验例子中中包括括随机机样本本中的的10个测测量::962925940971952937947951926974,,样本本均值值是否否对目目标值值950具具有代代表性性?假设:H0:μ=950;H1:μ≠950。如果p<0.05,,可以拒拒绝原假设设H0单均值与目目标值比较较1、正态性性检验:Stat>BasicStatistic>Normalitytest2、T检验验:Stat>BasicStatistic>1-sampletOne-SampleT:C1Testofmu=950vsnot=950VariableNMeanStDevSEMeanC110948.50017.0705.398Variable95%CITPC1(936.289,960.711)-0.280.787由于P值值大于临界界置信水平平(本例中中为0.05),或或者说,由由于均值的的置信区间间包含了目目标值,我我们可以做做出下述结结论:我们们没有足够够的证据拒拒绝零假设设。我们没有足足够的证据据拒绝零假假设。是否可以说说零假设是是正确的((总体均值值的真值=950))?不!!但是,我们们通常在假假定零假设设是正确的的情况下执执行操作。。结论均值比较::一个小样样本均值检检验情况2检验两个抽抽样对象的的均值是否否相等第二章假假设检验双对象总体体均值:::大样本双样本Z检检验用于检检验两个抽抽样对象总总体均值,,并且每个个抽样数量量都较大。。Minitab软件件不提供双双样本Z检检验。所以以,我们必必须使用双双样本T检检验。标准双样本本Z检验或或T检验用用于互相独独立的两个个样本。当样本是相相互依赖的的时候我们们要使用成成对T检验验。独立样本::例如,两两个公司的的交货期依赖样本::热处理前前后同一产产品的硬度度均值比较::双样本检检验两个独力大大样本均值值比较当比较来自自两个独立立的大量抽抽样的均值值,使用以以下检验统统计方法::Z=我们在检验验零假设,,μ1=μ2,因此,(μ1-μ2)=0因为虽提供供类的检验验方法类似似单样本Z检验,所所以我们只只用Minitab计计算P值,,并得出结结论。举例—订单单生成某公司有两两个办公室室都生成订订单。为了了确定是否否一个部门门比另一个个的速度更更快,黑带带从每个部部门的80个订单的的“订单时时间”数据据。数据在“Ordergeneration.mtw”A)建立立零假设设和备选选假设。。H0:μofficeA=μofficeBH1:μofficeA≠μofficeBB)确定定显著水水平,αα=0.05C)随机机抽取样样本。OfficeA:n=80y=1.48s=0.45OfficeB:n=80y=1.58s=0.51D)计算算P值UsingMinitab……Stat>BasicStatistics>2-sampletTick“Assumeequalvariance””E)比较较P值和和显著性性水平。。P-value=0.183所所以,我我们不能能否定零零假设。。F)结论论:数据据不能提提供足够够的证据据证明时时间存在在差异。。Two-SampleT-TestandCI:OfficeA,OfficeBTwo-sampleTforOfficeAvsOfficeBNMeanStDevSEMeanOfficeA801.4780.4470.050OfficeB801.5790.5080.057Difference=mu(OfficeA)-mu(OfficeB)Estimatefordifference:-0.10125095%CIfordifference:(-0.250716,0.048216)T-Testofdifference=0(vsnot=):T-Value=-1.34P-Value=0.183DF=158BothusePooledStDev=0.4786Minitab输出均值比较:独独立大样本均均值检验双样本t检验验用于检验两两个均值是否否相等,并且且是小样本抽抽样。使用双双样本t检验验的条件是::1.整体标标准差未知。。2.每个母母体的分布必必须是正态分分布例子将比较两两组均值:下下述数据代表表了来自两个个不同群组的的10个测量量值。Dataisin:LPC(2-samplet).MTW判断两组的均均值是否相同同?1、零假设和和被选假设是是:H0:μ1=μμ2;H1:μ1≠μ22、正态性验验证:Stat>BasicStatistics>Normalitytest检验两个总体体均值:小样样本均值比较:独独立小样本均均值检验如果t>或t<-,则拒绝H03、数据堆叠叠:Data>Stack/Unstack>StackColumns,选选择“StoreSubscriptsin”输出变量在C3中,输出出变量在C4中将变量名加到到堆叠数据中中4、堆叠数据据的等方差检检验:Stat>Basicstatistics>Testforequalvariance5、堆叠数据据的T检验::Stat>BasicStatistics>2-SampletTwo-sampleT-TestandC1:sampleA,sampleBTwo-SampleT-TestandCI:sampleA,sampleBTwo-sampleTforsampleAvssampleBNMeanStDevSEMeansampleA10899.135.811sampleB101093.642.713Difference=mu(sampleA)-mu(sampleB)Estimatefordifference:-194.50095%CIfordifference:(-231.680,-157.320)T-Testofdifference=0(vsnot=):T-Value=-11.04P-Value=0.000DF=17均值比较:独独立小样本均均值检验如果一个抽样样同另一个抽抽样有关,这这两个抽样就就是相关的。。如果你对某一一洗发液对于于治疗脱发的的效果进行陈陈述,你应对对同一群人使使用该洗发液液前后的脱发发情况进行测测量。你需要要成对数据。。如果你对同一一批电脑晶片片在跌落测试试前和测试后后进行测量,,两个测量之之间就存在相相关性。在这些例子中中,我们不是是检验两个不不同的数据集集。相反,我我们需要的是是数据前和后后的区别,来来研究前后差差异是否显著著。相关样本均值比较:总总结成对T检验利用Minitab软软件检验两个个相关的样本本是否相等。。两个相关的样样本必须是随随机抽取的每个抽样整体体都应该整体体呈正态分布布Stat>BasicStatistics>Pairedt练习:一轮胎公司认认为他们新生生产的轮胎的的里程数较竞竞争者的提高高,选择了12部车,用用新轮胎跑1000哩,再用竞争者者的轮胎跑1000哩。。假定里程的的差异服从正正态分布。File:CarMileage.MTWStats>BasicStats>Pairedt练习结论是什么??结论是什么??如果我们将数数据组作两样样本t检验会会如何?双样本T检验验与1Samplet检验有何何不同?均值比较:总总结情况3检验超过两个个的抽样对象象均值是否相相等第二章假设设检验假设检验利用用以下格式进进行:H0:μ1=μ2=μ3=μ4,……,=μn;H1:至少一个个均值与其它它不同均值比较:三三个以上样本本检验单因子方差分分析(OneWayANOVA)ANOVA假假定母体是正态分分布抽样是随机的的每个抽样对象象方差相等每个抽样对象象的随机抽样样数量没有必必要相等。例子:在美国空军学学院进行试验验,确定当地地是否有酸雨雨。分别在学学院的三个地地点测量雨的的酸性。地点点1位较高地地点;地点2为中间地势势;地点3为为低地。测量量的值为PH。各地点的的酸性是否存存在差异?按照以下步骤骤:A))H0:μA=μμB=μC;;H1:至至少少一一个个不不同同;;B))αα=0.05B))随随机机在在各各地地点点分分别别测测量量7个个数数据据。。C))用用Minitab软软件件计计算算P值值。。Stat>ANOVA>One-way…………,,File:Anova(Acidity).MTWOne-wayANOVA:Station1,Station2,Station3SourceDFSSMSFPFactor20.0470.0230.190.832Error182.2600.126Total202.307S=0.3543R-Sq=2.02%R-Sq(adj)=0.00%Individual95%CIsForMeanBasedonPooledStDevLevelNMeanStDev--------+---------+---------+---------+-Station177.31430.4598(-------------*-------------)Station277.42860.2628(-------------*-------------)Station377.35710.3101(-------------*-------------)--------+---------+---------+---------+-7.207.407.607.80PooledStDev=0.3543Minitab输输出出均值比比较::三个个以上上样本本检验验TestingofVariances………方差比比较第二章章假假设检检验学习目目标1、了了解ANOVA定义义、术术语2、一一元、、二元元ANOVA。。4、ANOVA原理理。5、一一元/二元元ANOVA应应用。。情况1单一标标准差差与标标准比比较第二章章假假设检检验“通常常我们们对由由不同同方法法或处处理过过程中中产生生的响响应的的均值值差差异感感兴趣趣。有有时对对数据据的变变异程程度感感兴趣趣。通通过制制程改改善善以减减少过过程的的方法法非常常重要要,即即使没没有改改变均均值。。同样样,两两种或或多种种分析析方法法的变变异也也是感感兴趣趣的话话题。。”例子::可口可可乐装装瓶公公司

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论