版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据相关性分析(上册)数据相关性分析(上册)组织质量可靠性能力提升项目培训教材第三册22让最优秀的企业成为我们的客户科学公正服务价值让我们的客户成为最优秀的企业
广州赛宝认证中心培训部
汪五二电话-mail:wangwe@CEPREI教师自我介绍34课程的形式
课程采用开放式、互动性方式,
教员和学员应充分平等的交流课程采用教师授课、学员提问、
课堂交流相结合的方式重申课堂纪律数据采集计划1
2中心极限定理3假设检验4主要内容多变量分析5置信区间5均值检验61数据采集计划67我常说,当你能够测量你说过的话,并用数字表达出来地时候,你就对它有了一定的了解;但当你无法测量它,无法用数字表达它的时候,你的知识只能是肤浅的,贫乏的不明于计数,而欲举大事,犹无舟楫而欲经于水险也我们依靠上帝。除了上帝,任何人都必须用数据来说话----达尔文--《管子》------戴明8路径位置DefineMeasureAnalyzeImproveControl
数据收集
抽样Step7-Data收集Step8-Data分析Step9-VitalFewx’s选定9本章目录教育目的资料收集理由资料收集程序-Y及
X资料
O.D-选择分析方法-完成资料收集计划-确认必要资源资料收集样式样本一般情况下的收集采集特殊情况下的收集采集
学习目标理解DATA收集计划的概念
理解DATA收集方法及步骤理解抽样(Sample)方法10教育目的□为了正确的做好资料收集计划观察必要的事项。
测定什么
怎样收集资料
测定工序的信赖性怎样确认。
怎样体现资料
怎样分析资料做好计划,成功的概率就高一:一般情况下的数据采集11资料收集的理由
为测定Y决定现水准
收集输入(X’s)变动的情报-通过多次的企业的循环,收集对结果物的输入影响充分的资料-利用现水准,体现改善阶段中工序变化的影响所有的跟好的资料有关!12资料收集程序工序图/特性要因图&C&E距阵(查明非常重要的
X变数
)故障模式影响分析(FMEA)(查明即使必要的管理计划
X变数)查明最终
Y变数和关联
X变数选择分析方法收集资料完成资料收集计划确认必要的资源(有其他必要的要素吗)MeasureAnalyze13Y和
X资料的
O.D变数类型(A/C)O.DX1计数性?????????X2计量型XXXXXXXXY1计量型预定收款循环时间–Lockbox每天报告书中送货单到接收时间14工序图/特性要因图&C&E距阵(查明非常重要的
X变数
)故障模式影响分析(FMEA)(查明即使必要的管理计划
X变数)查明最终
Y变数和关联
X变数选择分析方法收集资料完成资料收集计划确认必要的资源(有其他必要的要素吗)资料收集程序15介绍资料收集对怎样体现资料,使用什么工具做计划对稳定性和能力的决定做计划异常点(outliers)用什么方式适当的处理做计划怎样把握变数间的关系做计划(假设检验)SampleSize(样本的大小)应该多少.16工序图/特性要因图&C&E距阵(查明非常重要的
X变数
)故障模式影响分析(FMEA)(查明即使必要的管理计划
X变数)查明最终
Y变数和关联
X变数选择分析方法收集资料完成资料收集计划确认必要的资源(有其他必要的要素吗)资料收集程序17目的和目标决定是否明确收集目的?要评价的是什么?选择所有的
X,Y后是否做了
O.D?
顾客也是否收集有利资料?企业内已经存在的资料吗?现在的资料够充分吗?定义阶段有没有没查明的其他散布原因?
用收集的资料做什么?怎样划推移图?改善测定方法时可以提高顾客满足度吗?
队中是否只利用可利用的资料?18
决定资料收集范围&样式要容易收集资料和迅速套用一定样式分析资料sheet要符合software(excel或minitab).
经常要保留建议栏。
特殊环境所关联的事件资料收集者所要观察的事项。19收集资料样式最常用的是点检表和(是否记住7种基本工具?)集中图(concentrationdiagrams).利用标准样式对收集的资料和资料收集所有程序可以标准化。
还对以后收集资料有所帮助。
收集的所有资料都应包含核心要素,样式尽可能的越简单越好。20点检表和管理图原因1234567自动帐单★数据输入不一致★EDI顾客★错误的
SEC码价格变化生产量不足定单错误★发票错误★★★★控制图
+检查表
…强力组合21例:点检表22资料收集程序工序图/特性要因图&C&E矩阵(查明非常重要的
X变数
)故障模式影响分析(FMEA)(查明即使必要的管理计划
X变数)查明最终
Y变数和关联
X变数选择分析方法收集资料完成资料收集计划确认必要的资源(有其他必要的要素吗)23团队背景及教育再优秀的计划不实践是没有用的。各队要遵守日常的抽样计划(一开始就想着自己试投是好的)记录所有特记事项资料迅速的输入到数据现况中维持记录
24资料收集计划样本25通用公司(GE):资料格式X’s寻找造成拖车污染/不安全的
X’s注意:表格中已建立编码原则日期:部门:观察员:
流程输入执行检测检查中断其他活动检查区域天气C)收集D)evon#待查P)电话C)顾客D)脏拖车号C)顾客V)供应商产品到达P)水泥路P)污水R)下雨V)供应商B)故障产品
#租约
#时间G)砂石路N)无污水检查员姓名温度D)干燥#M)机械C)计算机间隔
(min.)司机参与检查(Y/N)26联合信号公司(AlliedSignal):资料格式X’sY’sComments(备注)寻找造成纤维断裂的
X’s请注意表格设计如何有助于数据收集者纤维断裂27二:特殊情况下的数据采集DATA收集计划
目的
为了确认CTQ,从VOC收集计划开始、MSA、一次作成工程能力分析,在A阶段里为了确认输出变量Y和输入变量X的关系而作成.
适用可能的工具
DATA收集计划
抽样方法28DATA收集计划对情报的
需求分析DATA提问结果导出DATA收集计划回答的提问是什么?怎么找出对提问的答案以及怎么表现?使用什么样的DATA分析工具?使用这些工具来回答,需要什么种类的DATA?这个DATA在什么样的Process中可以得到?能给这个DATA的人是谁?以最小的努力减少好几个可能性,如何收集资料?29DATA收集方法
1.构成好的提问
2.选定确切地DATA分析记法
3.决定测定方法
4.定义DATA收集Point5.选定没有偏向的DATA收集员,确认他们的兴趣
后教育
6.利用DATA收集样式计划,并检定
7.检讨DATA收集过程,并确认其结果30
第一阶段
:构成好的提问
构成正确的提问是核心,成功数据收集的第一阶段。
-为得到好情报的提问应该是焦点明确而具体.
-明确显示我们找的情报,给予用那情报和结果执行什么
的信赖,让别人帮助我们就很容易.DATA收集Process
第二阶段:
选定确切的DATA分析记法
-很不幸在很多情况因DATA不适合,只能重新收集DATA.
-更糟的时候,面对根据不充分的DATA决定意见的困难.-收集DATA前,一但深思熟虑几分种就可以必免这种困难.31样品抽出是如下的Process.
收集可用DATA的一部分.
使用样品DATA导出结论.
对母集团信用卡帐户的
书面调查件数(N=5,000)平均解决时间
(m)?样品n=100任意选择的调查件数平均解决时间
(X)=1.2日统计性推论
第三阶段:决定测定方法-母集团或样品DATA收集Process
要收集所有的DATA因时间太长而会发生DATA收集上的失误.
抽出母集团中一部分样品,以少的费用得出更好的结果.32抽样
好的样品应具备的条件没有偏向代表性Random性
-抽样是使用少量的DATA也能得到好的答案.
-样品对得出母集团及Process的情报有帮助.
-能代表研究对象的母集团或Process选择样品.
-现实性问题重要.(费用,资源等)抽样简要33有偏向(Bias)的抽样
偏向的种类:
排除:调查中的Process范围的一部分被排除.
认知:DATA收集要员的态度和信念会影响他们所看的和记录.
交互作用:DATA收集过程本身会影响研究对象Process.
运用上:不按标准步骤的情况就是最常见的运用上的偏向.
无应答:决测DATA会产生偏向的结果.DATA漏掉的事实是暗示与其它DATA以任何方式都不同的线索.
推定:统计处理收集的DATA时使用的公式及方法,
可能与特定种类的偏向有关联.34抽样信赖区间测定对全部5,000件不满事项的
解决时间,输出“真正的”平均解决时间...母集团信用卡关联
顾客的不满事项接收
(N=5,000)样品n=100任意选择的不满事项例:对顾客不满事项的平均解决时间?取代表样品推定平均解决时间.或者实际母集团的平均和从样品推定的平均值之间有差吗?35信赖区间意味着,知母数真值的区间推定区间.母集团“真”
平均N=5,000从母集团抽出的样品
(样品的大小
n=100)样品
1的平均样品
2的平均
样品
K的平均
母集团的“真”平均值和从样品推定的平均值之间有差异.抽样信赖区间36单纯任意抽样:构成母集团的各个因子被选样品的概率是一样.
2.
层别任意抽样:把母集团区分几个同质的层后,在各层按单纯任意抽样抽出样品.3.
群别任意抽样:把母集团分为多数集团后,
对按抽样单位选择的群体进行全数调查.
4.
系统任意抽样:时间上或空间上隔一定间隔抽出样品.
抽样方法37母集团XXXXXOXXXXXXOXXXXOXXXXOXXXXXXXXXXXXXOXXXOOOOO样品说明各单位(“O”)被包括样品的概率相同..单纯任意抽样层别任意抽样LMMMMSS层单位大中小LLLLLMMMMMMMMMMMMSSSSSSSSSS层别的范畴或Group
内的任意样品.
各Group的样品大小
一般和其Group的相对大小成比例.母集团样品说明38其它抽样方法
不符合统计学的原则,但经常使用的惯例
固定百分率抽样
:与“经常取10%样品”同样的
“大概判断法”
。
结果为小的母集团总是选择太小的样品,大的母集团总是选择太大的样品。
判断抽样
:让DATA收集要员凭自己的判断选定X
个
“代表性”
样品,就能拿到不偏向的样品。
块抽样
仅凭项目便利集合的理由来选定样品,其结果会产生样品的偏向和非代表性。
举个例子如下:
“从v文件抽出D姓人们的订购记录。”
39DATA收集Process
第4阶段
:定义DATA收集Point
理想的想法,我们要在尽可能不防碍Process作业工序的范围内收集所有的DATA。可这比预想不容易。
第5阶段:选定没有偏向的DATA收集员,
确认他们的兴趣,并教育.
谁来收集DATA,这个问题很重要.
DATA收集员应该是最容易,最快地接近相关事实的人.
例)1920年代和1930年代:“Hawthorne实验”
-劳动生产性和工厂内照明的关系分析40
第6阶段
:设计DATA的收集样式和指南后进行Test.
DATA的记录应容易做.KISS原则
(KeepItSimple,Stupid)
样式是从DATA的记录或解释中不会有失误的可能性而设计.
样式应包括未来的分析,参照,及为了再确认的追加情报.
样式应最大限度明确.
CheckSheet或DataSheet应显示有专业性.
用手制作,线不规则,字不易看清楚的情况,
还有如果给人即兴作成的感觉,
那么容易让收集Data的人不注意.
DATA收集Process
41
第6阶段
:设计DATA的收集样式和指南,
必须进行Test
计划很认真,但是在DATA收集过程中仍有可能发生预想不到的问题.
最常出现的问题如下.对如何作成
DATA收集样式的错误理解而引起的失误.设计样式的人没理解与Process相关的所有变量,发现收集
追加情报的必要性.问题发生的状况下,很难输入DATA,所以收集不完全的DATA.把DATA记录在样式的人,怕收录情报对他们有坏的影响而犹豫,
因此产生的不完全或有偏向的DATA.DATA收集Process42第7阶段:检讨DATA收集过程,
确认其结果.
检讨完成的样式,观察收集过程等,有必要对于DATA收集Process全面的显示.DATA收集员中有一部分理解错误时,应立即进行再教育.**有必要使用已收集的RawData,或利用新收集的Data时,
必须明确地表示Data收集位置、作成者、期间、Data数等Source**
DATA收集Process2多变量分析(Multi-Varistudy)4344培训目的多变量分析概述噪音(Noise)变量的处理多变量分析计划数据收集数据分析最终报告格式注:“Multi-Vari”
这个名词是来自L.A.Seder在1950年1月及3月《工业质量控》杂志上发表的文章“图表诊断(DiagnosiswithDiagrams)”45路径位置DefineMeasureAnalyzeImproveControlStep8-Data分析Step9-VitalFewX’的选定
多变量研究
中心极限定理
假设检验
置信区间
方差分析,均值检验
卡方检验
相关/回归分析Step7-Data收集4630+输入8-104-83-6找到关键的
X’s控制关键的
X’s10-15所有的X’s找出显著因素找出主要因素测量
MEASUREProcessMapsFMEA能力分析Multi-VaristudiesDesignofExperiments(DOE)ControlPlansC&EMatrix分析ANALYZE改善
IMPROVE控制
CONTROLMAIC中的多变量分析47项目跟踪路线图测量分析改进控制ProjectDescriptionProcessMapC&EMatrixPreliminaryFMEAMSACapabilityStudyMulti-VariStudiesDOE(orotherimprovement)Control
PlanHandOff
TrainingFinalCapabilityOwner
Sign-OffFinalProject
Report48什么是多变量分析?初步分析可控及不可控的输入对输出的影响;在不影响流程运行的情况下收集数据;聚焦于:研究不可控的噪音变量(Noise)为什么?噪音变量的变异会长期或不定期地影响流程中心值和变异的大小,导致流程不稳定49多变量分析概述多变量分析是最有用的分析工具之一。目的在于提供改善行动的方向和输入收集数据的方法是“不影响流程”的,即在自然状态下分析流程在短时间內收集数据并分析,以测定流程能力、稳定性、及关键输入变量(KPIV’s)和关键输出变量(KPOV’s),即X’s和
Y’s之间的关系“多变量分析”应该持续到输出变量的所有范围都被观测完为止50为什么需要进行多变量分析?以统计置信度决定流程的能力确认流程变异的可确定因素分析影响流程的一般原因不同班次Shift-to-Shift,不同运行Run-to-Run,不同操作员Operator-to-Operator,不同操作时间Time-to-Time初步了解流程的稳定性提供下一步实验设计(DOE)所需的方向及输入51分析步骤阶段I:执行短期流程能力分析:参考流程改善计划的测量阶段
根据短期流程能力分析的数据和记录,做出进一步深入研究流程的计划阶段II:初步分析可控变量、不可控(噪音)变量及原材料输入变量对输出变量的影响着重分析流程中关键不可控(噪音)变量的影响特性初步了解可控输入及流程输出之间的关系52多变量分析计划的步骤1. 确定目标确认要分析的关键输入和输出变量确认每个变量的测量系统 -聚焦于能确保流程能力的变量4. 确定抽样计划5. 确定数据收集、格式、及纪录的程序6. 确定流程程序及设定7. 成立项目组并培训小组成员8. 清晰地划分责任9. 确定数据分析的方法53变量的选择流程基线
–我们流程目前状况如何确认哪个输入变量影响流程输出Y’sX’s分析的任务是,我们应如何选择
“正确的”
X’s及Y’s?输出数据输入变量54哪个是关键的数据?测量正确的输出
来自于因果矩阵和FMEA的关键
X’s
流程图中有可能遗漏的噪音变量或其他变异来源哪一个
X’s?55主要聚焦点首先研究不可控的噪音变量噪音变量的变异会长期或不定期地影响流程中心值和变异的大小,导致流程不稳定在我们对关键的可控输入变量进行系统化分析前,我们需尽可能地先将噪音变量的变异消除56三种典型的噪音变异来源位置性:地点对地点或人员对人员
同一机器內,端点间的变异
加温室內的温度变异
操作员1和操作员2
之间的变异
区域1和区域2
之间的变异
周期性:批量对批量
不同批量之间的变异
不同批的货品之间的变异时间性:时间对时间
班次间的变异
月中对月末
星期一对星期三57噪音–
其他分析方法对于连续的流程(ContinuousProcesses)测量一段时间內的变异
例如:
在每班次中做四次测量测量短时间间隔的变异例如:班次间的变异测量长时间间隔的变异例如:不同天、周及月的变异对于离散的流程(DiscreteProcesses)测量同一产品的变异例如:对每个烤箱做四次测量测量同一批量的变异例如:每个批量中不同烤箱的变异测量不同批量的变异例如:一个月中不同批量的变异58位置噪音树…还有其他生产同样产品的工厂工厂1型号2型号1型号3…还有其他生产线生产线/出口1生产线/出口2…还有其他模具模具/位置1模具/位置2模具/位置359原材料噪音树批次/批量1批次/批量3批次/批量2区域/货架2区域/货架3区域/货架1供应商A…还有其他供应商位置1位置2位置3…还有在同一区域内的其他位置容器1容器2…还有同一位置内的其他容器60时间噪音树第1月第3月第2月第1年日1日2日3…还有同一周内的其他天班次1班次2周2周3周1周4小时1小时4…还有同一班次内的其他小时61不要忘记有关测量系统分析的问题!对关键的输入及输出执行GR&R确认分析过程依循测量系统分析程序,以取得前后一致且可靠的数据对于某些变量,可能需要建立一个新的测量方法…黑带和绿带们常发现目前未被记录的关键变量切记,一个
“嘈杂”的测量工具会扭曲您对流程变异的真实了解sss观察
实际测量222=+记得下列方程吗(前期课程)?观察到的变异=实际的变异+测量系统的变异62选择变量
–
总结依靠流程图、因果矩阵、FMEA找出变量着重分析项目小组可能遗漏的,潜在的噪音变量考虑
X及Y变量的测量系统63练习
写下您分析的目的
描述一个输出变量和它的测量方法描述一个可控输入变量和它的测量方法描述一个不可控输入变量和它的测量方法
与您的组员讨论您的结果您有15分钟完成此练习64选择数据收集的方法单纯任意抽样:构成母集团的各个因子被选样品的概率是一样.
2.
层别任意抽样:把母集团区分几个同质的层后,在各层按单纯任意抽样抽出样品.3.
群别任意抽样:把母集团分为多数集团后,
对按抽样单位选择的群体进行全数调查.
4.
系统任意抽样:时间上或空间上隔一定间隔抽出样品.
错误的数据收集方法会误导整个项目65要收集多少数据?66如何记录数据?制作标准数据收集表,让每个人在数据收集的过程中使用相同的表确保不同的人用同样方法收集数据清楚地定义数据收集程序帮助解释说明异常点或非预期的结果,备注栏总是包括:不正常的环境状況数据收集者观察的情况便于记录数据为什么使用数据收集表?67建立数据表格时,同时建立电子数据库的格式确保数据便于收集,且易于记录到数据表或电子表格数据表格式的编排方式应该符合分析软件所需的格式(Excel或Minitab)提早计划使您易于整理数据,并能得到更好的数据质量!68数据格式数据能够快速记录到数据库(如:Minitab)记住在表格栏中包含下列项目:ID信息(时间,批次,班次,地点,等.)不可控输入(噪音)流程输入流程输出备注在分析时,我们常会需要数据的时间序列关系,所以务必清楚记录数据的时间69数据收集表
通常使用的表格有检查表和密集图(ConcentrationDiagram)。你必須根据项目的需要设计特定表格
使用标准表格,使数据收集及数据收集程序标准化,也有助不同编辑人员对收集数据的后续整理工作
关键要素:
为每个所要记录的数据准备一个空间明确说明数据收集表上的编码原则(COB=1,GOB=2,等)及格式(MMDDYYYY)
包含备注栏
表格越简单越好
表格编排须符合电子数据库的格式总是拉动设计的表格还记得GE、联合信号公司的表格案例吗?70如何记录数据?使用标准数据收集表能协助您确保数据的一致性同时,建立电子表格使数据输入更快速更一致日期
时间
人员
班次
顾客
定单
供应商
备注94 8:00 Jay 1 A 12587 SDK 94 8:00 Steve 1 B 13004 BANR 94 14:00 Jay 1 C 12955 BANR
在12:30进行了维修94 14:00 Lavonne 1 A 13217 F&F 94 20:00 Mike 2 C 13401 SDK 94 20:00 Marti 2 A 13585 F&F 95 8:00 Lavonne 1 B 13769 F&F
得等Don完成以后95 8:00 Jay 1 C 13953 BANR 95 14:00 Lavonne 1 A 14137 BANR 95 14:00 Steve 1 B 14321 BANR 95 20:00 Mike 2 A 14505 F&F 95 20:00 Marti 2 C 14689 SDK
系统停止20分钟71数据表72数据分析确认稳定性和流程能力探究变量间的关系分解总变异
妥当地处理噪音数据要考虑的问题:流程是否稳定?流程能力是否符合规格的需要?哪些为噪音变量所引起的主要变异来源?哪些为可控变量所引起的主要变异来源?73确认稳定性和流程能力稳定性控制图时间序列图
流程能力CapabilityAnalysis(共有和总体标准差)CapabilitySixpack74您有哪种数据?计数型数据(AttributeData)Yes/No输出:是/否
计数式输出:不良品数输入变量的设定:顾客级别、班次、星期、厂商编号计量型数据(VariableData)
连续型输出:产量、厚度、流程周期
连续型输入:时间、压力、温度、湿度75分析输入及输出的工具
不同操作员
不同机器
不同班次供应商/原材料批次室内温度气压相对湿度原料特性温度压力速度浓度可控输入关键流程输出噪音输入(离散性)噪音输入(连续性)产出量颜色流程工具因果矩阵76识别输入量和输出量流程关键流程输出量噪音(Noise)输入(非连续)范例不同的操作者不同的机器不同的班次噪音输入量(连续)例子房间温度大气压相对湿度原料特性例子温度压力时间可控制输入量工具散点图相关回归工具箱型图主要影响及交互图方差分析,T-检验工具因果矩阵失效模式分析鱼骨图短期流程能力77可控和不可控实际运作中可控的控制这些因素并使这些因素“保持稳定不变”噪音因素我们仅可以通过采用实验进行处理有影响的噪音是不能控制的对响应没有影响的因素实验中可控的因素(右侧完整的闭环)对响应有影响的因素(左侧完整的闭环)记住,噪音被旁观者看在眼里78根据数据类型决定图形及统计分析工具
连续的
Y–
离散的
XBox
plots
盒图DotPlots
点图MainEffectsPlots
主要影响图InteractionPlots
交互作用图DescriptiveStats描述统计EqualVariances
等方差检验T-testsT检验
ANOVA
方差分析
连续
Y–
连续
XScatter
plots
散点图Correlation
相关Regression
回归MultipleRegression
多元回归离散Y–连续X
或
离散Y–离散XBoxplots*
盒图DotPlots*
点图MainEffectsPlots*
主要影响图Scatterplots*
散点图ANOVA*
方差分析(*可能需要将
X和
Y调换!)Chi-Square
卡方检验LogisticRegression
逻辑回归79处理噪音数据异常点(Outlier,与总体背离的数据)盒图,直方图,点图和移动极差图都是识别异常点合适的图形方法谨慎对待异常点:它们可能是由于数据输入错误所造成的,或者它们也许能引导我们去寻找关键的噪音变量若我们能够合理解释异常点的发生原因,则可将其从数据中剔除处理异常点的程序用图形来确认如果我们能够合理解释异常点的发生原因,先将其从数据中剔除,再作分析如果异常点无法被解释,则须分析二次:一次包含异常点,一次不包含异常点-根据结果的不同,加备注80时序图(TimeSeriesPlot)时序图目的:__数据收集点是否与时间有关系Y=F(X)____Minitab指令:Graph>TimeSeriesPlotY=Minutes
Truck.mtwX1=时间X2=?81BoxPlot(盒图)盒须图的目的:_________________________Minitab指令:Graph>BoxPlot Y=MinutesX’s=Day,TruckType,AssemblerTruck.mtw重复每一个变量82盒须图分析*异常点第75百分位
最小观测值(用以设定IQR界限))最大测值(用以设定IQR界限)第
25
百分位
中位数(第
50百分位)83点图(DotPlot)点图的目的:_________________________Minitab指令:Graph>DotPlotwithBYvariables
SPRAYING.MTW84描述统计(DescriptiveStatistics)描述统计目的:_________________________Minitab指令:Stat>BasicStats>GraphicalSummary Y=Thickness1,ByVariable=NozzleSPRAYING.MTW85控制图(ControlCharts)控制图的目的:_________________________Minitab指令:Stat>ControlChart>VariablesChartsfor Individuals>I-MR,等
RationanSubgroups.mtw86主要影响图(MainEffectsPlot)Truck.mtw主要影响图的目的:_________________________Minitab指令:
Stat>ANOVA>MainEffectsPlots
因子Factors:Day,TruckType,Assembler
响应Response=Minutes87交互作用图(InteractionPlots)目的:___________________________________Minitab指令:Stat>ANOVA>InteractionPlots Factors:Day,Assembler RawResponse=Minutes
Truck.mtw88交互作用图(InteractionPlots)若两条线平行,表明无交互作用
其它情況皆为有交互作用存在
89Multi-VariPlots(多变量图)目的:___________________________________Minitab
指令:Stat>QualityTools>Multi-Vari
因子Factors(X):DayandAssembler
响应Response(Y)=Minutes
Truck.mtw90散点图(ScatterPlot)散点图目的:_________________________Minitab指令:Graph>Scatterplot
SCATT39.MTWSupplierCustomer475450425400375350420400380360340320Scatterplot
of
Customer
vs
Supplier91结
论什么是显著的变异来源?
Order#________________ Day ________________ TruckType ________________ AssemblyPerson ________________
后续步骤是?Truck.mtw92收集数据前,建立小组并进行培训小组成员必须一致地遵循抽样计划:可以考虑由你自己执行第一次抽样通过实验运行来测试您的程序注意非正常的操作状况测量和监控主要的关键流程输入记录任何非平常事件尽快将数据登录到数据库工作日志你若不切实执行,再好的计划也无济于事93Multi-Vari计划–总结
要测量什么?使用哪种抽样计划?如何收集数据?
测量程序是否可靠?
如何显示数据?如何分析数据?小组成员对何时做、做什么是否明确?94应用到您的项目目的:
建立您项目第一份Multi-Vari计划草案
程序:确认欲研究的主要输出变量确认欲研究的主要输入变量:可控的及不可控的确认每个输入、输出变量的测量系统,并辨别何者是需要评估的以变异来源为指引确定您的抽样计划(何时、何地收集数据?)列出您用来分析数据的图形工具95检查清单
:阶段
I能力研究1. 按照您所认为“最佳设定”设定流程,并记录关键流程输入变量值(KPIVs)2. 识别合理的方法以建立合理子群组量(K)3. 运行流程一小段时间,以尽可能排除外部变异
目标为收集约K=30个时间点的数据4. 要求小组组员仔细观察并作笔记5. 测量及记录主要流程输出变量值(KPOVs)966. 运行
CapabilitySix-pack
并察看:NormalPlot,HistogramSPCCharts(检查Stability,Accuracy)7. 运行
CapabilityAnalysis(正态)及确认其短期和长期的流程能力指数-完成worksheet8. 诊断平均值的漂移方差的变化9. 按照诊断结果决定改善计划97检查清单
:阶段II-Multi-Vari1. 确定目标2. 确认要分析的KPIV’s及KPOV’s3. 确认每个变量的测量系统 -哪个能确保流程能力?4. 确定抽样计划5. 确定数据收集、格式、及记录的程序6. 流程运行的程序和设定描述7. 组成及培训小组8. 清楚划分责任9. 确定数据分析的方法9810.运行流程和收集数据11.分析数据:
流程是否稳定?是否可控?
什么是影响输出变量的关键噪音变量?
什么是影响输出变量的关键可控变量?12.
用接下来的
DOE
验证结果13.结论14.
报告结果,提出建议99练习目标:确定噪音和可控输入变量对%杂质(Impurities)的影响输出变量:%杂质 规格上限:8%输入变量:可控的:温度,压力不可控的:天,班次,轮班内的时间合理分组:班次分析:能力,能力Sixpack盒型图散点图问题:什么是%杂质重要的基本变量DMMulti-variStudies.mpj,工作表
Multi-vari.mtw100数据采集结果101正态检验102正态概率图103能力Sixpack104流程能力Sixpack105流程能力Sixpack106时间序列图107108盒型图重复每一个变量109盒型图按天,班次,时间分组110主要影响图111不同班次的影响很显著主要影响图-杂质数据均值主要影响图-杂质数据均值114结论什么是可变性显而易见的来源?
天Day ________________
班次Shift ________________
时间Time ________________
温度Temp ________________
压力Pressure ________________
下一步是什么?让我么再次检查主要影响*主要影响图比较每个水平输入的均值.注意-图表比较的是均值而不是方差.这些是否易于解释?将连续输入转化为属性输入变量这种技术允许你使用检验输出变量对输入变量的影响这样允许你使用二项式检验避免线性相关的影响步骤:运行描述统计程序使用编码程序,创建4个类别分别定义为:最小值到Q1Q1到中位数中位数到Q3Q3到最大值对于小样本量,做MedianSplit
创建高和低类别分析使用单向ANOVA的常规方法解释F检验结果从另一个角度看温度和压力温度和压力能够进行编码,让我们看起来他们有些不同让我们通过把他们的值分为四分为数使用描述统计量功能确定4组温度和压力Stat>BasicStatistics>DisplayDescriptiveStatistics
使用编码功能建立两列数据代表温度和压力
Data>Code>NumerictoNumeric描述统计/四分为数连续输入变量编码主要影响图-杂质数据均值主要影响图-编码的vs.不编码的主要影响图-杂质数据均值主要影响图-杂质数据均值1.在不影响流程自然运作的状态下所收集的“X”,其变异范围可能太狹窄2.交互作用存在,但我们只能一次研究一个“X”3.有多元线性相关(Multi-colinearity)和混淆(Confounding)存在
.9.9511.051.1
X=CarWeight(tons)Y=GasMileage(mpg)3025200.511.52
X=CarWeight(tons)Y=GasMileage(mpg)302010YouSee
1313.51414.515
X=AgeofCar(Yrs)Y=SellingPrice(Thousands)642
16142230
X=AgeofCar(Yrs)Y=SellingPrice(Thousands)35255YouSee我们发现...X(Heat)看起来不重要事实上...X(Heat)是重要的并受班次的影响765432137322722HeatYield765432137322722HeatYieldSHIFT12多变量易犯的错误报告结果I.描述目的需测量的输入及输出变量抽样计划流程设定II.稳定性和能力趋势/控制图Capability及CapabilitySixpack分析直方图,Cp,Cpk,sigma合理子群分析III.变量间的显著关系以图形表示(盒须图,散点图,等)统计分析IV.结论V.对后续分析的建议结论数据驱动以图形及统计格式展示非推测或直觉猜想理性思考数据是最有力的证明!!紧跟流程取得数据!从ProcessMap、C&E、和FMEA中得到X’s____________________________________________________________________________________________________________对GB的提示总
结Multi-Vari分析概述噪音变量可视化及分析方法介绍Multi-Vari分析计划确认数据收集方法数据分析范例检查报告格式3中心极限定理129130路径位置DefineMeasureAnalyzeImproveControlStep8-Data分析Step9-VitalFewX’的选定
多变量研究
中心极限定理
假设检验
置信区间
方差分析,均值检验
卡方检验
相关/回归分析Step7-Data收集理论课为了给今后应用统计学打好基础,在概率基础章节后介绍中心极限定理。从严格的数学意义上来讲,中心极限定理内容非常丰富。但我们只介绍与今后应用统计学遇到的两个重要结论:1、样本平均值的标准差性质(独立同分布中心极限定理)其中σsx==均值标准误差个体值的标准差n=平均值的样本数x导引2、样本平均值的分布性质(德莫佛-拉普拉斯中心极限定理)随着样本量的无限增长,无论原来的分布是什么(离散分布或连续分布,正态分布或非正态分布),样本平均值的分布总会趋向于正态分布实际工作中,只要n较大时,我们就可以认为,平均值的分布近似于正态分布。但分布对称时,n=5已经近似得很好;当分布严重偏斜时,n=30也会近似得很好。此定理的严格证明很复杂,不再深入讨论,但我们做出以下例子加深理解其含义:(n-1代表原分布,n=2代表两个同样随机变量的平均值分布;n=5代表5个同样随机变量的平均值分布)从左图上两排看出对于对称分布,5个样本的平均值分布就与正态相似了对于偏斜分布30个样本平均值分布则与正态分布很相近从以下案例进一步了解中心极限定理利用同样的数据画出两种不同的控制图,并仔细比较它们的差异:
打开文件[CENLIMIT.MTW].
分别用下面的两个路径画出个体图和子群大小为5的均值图
均值图路径个体图路径案例切入图形输出个体数据样本平均
仔细比较两个图上的控制上下线(UCL和LCL),有什么不同?个体控制图和
Xbar控制图的差异μ15100102030405060当总体数据具备正态分布时假设你面前有一个大桶,桶里面装有相当多数量的白色纸条,每张纸条上都写有数字,且假定这些数字都来自一个具有特定平均值和标准偏差的正态分布.
1)从中随机抽出9张白色纸条,并把其上面的9个数字求平均,
2)然后把这个平均值写在一张绿色纸条上,
3)把这9张白色纸条放回原来的桶里,
4)把这张绿色纸条放入另外一个桶里,如此重复上面的步骤,直到盛有绿色纸条的桶放满为止。白色纸条代表总体的数据;绿色纸条代表平均值的样本;我们用MINITAB来模拟做这个练习。模拟试题-1让我们用MINITAB产生一些模拟的数据来验证我们的理论。首先用MINITAB产生9列各250个数据,假设这些数据来自一个平均值=70、标准偏差=9的正态分布:则列C1-C9代表白色纸条然后求出各行9个数据的平均值,其结果放在列C10,则C10代表绿色纸条。我们用描述统计的方法求出各列数据的平均和标准偏差。仔细比较C1-C9列与C10列有什么差别?
1、用MINITAB随机产生样本数据分别输入下列信息2、样本平均数计算3、输出:产生10列数据[注意:每次每个人操作产生的数据都不一样]4、描述统计路径5、描述统计结果比较描述性统计:C1,C2,C3,C4,C5,C6,C7,C8,C9,C10
平均值变量NN*平均值标准误标准差最小值下四分位数中位数上四分位数C1250070.6050.5348.43943.53764.92470.89576.690C2250069.6330.6239.84743.52163.09470.17476.382C3250069.6430.5919.34147.78562.61769.06376.286C4250070.2930.5598.84649.31364.74569.70275.834C5250070.7050.6039.54245.84964.11870.67377.782C6250069.3850.5879.28841.39863.23769.28576.174C7250070.2280.5438.58548.88864.44470.58775.767C8250069.8520.5929.35741.97763.09669.82677.060C9250070.1260.5688.98848.10064.02369.87175.867C10250070.0520.1852.93061.50168.16770.47972.1805、描述统计结果比较(续)描述性统计:C1,C2,C3,C4,C5,C6,C7,C8,C9,C10
平均值变量NN*平均值标准误标准差最小值下四分位数中位数上四分位数C1250070.6050.5348.43943.53764.92470.89576.690C2250069.6330.6239.84743.52163.09470.17476.382C3250069.6430.5919.34147.78562.61769.06376.286C4250070.2930.5598.84649.31364.74569.70275.834C5250070.7050.6039.54245.84964.11870.67377.782C6250069.3850.5879.28841.39863.23769.28576.174C7250070.2280.5438.58548.88864.44470.58775.767C8250069.8520.5929.35741.97763.09669.82677.060C9250070.1260.5688.98848.10064.02369.87175.867C10250070.0520.1852.93061.50168.16770.47972.180现在开始比较。样本的散布(C9)和样本平均的散布(C10)进行比较。散布减少了很多.σ=8.988σ=2.9306、直方图结果比较用点图比较频度数则能够更明确的了解散布。7、点图结果比较样本平均值分布的平均值和总体的平均值十分接近;样本平均值分布的标准偏差等于总体的标准偏差除以样本数的平方根;样本平均值的分布十分接近正态分布。8、结论
当总体数据是非正态分布时,若从中随机抽样n个并计算其平均,同样如此反复若干次,然后比较这些平均的散布与这些个体值的散布,你会发现,当n→∞时,x-bar的散布也具有正态分布。为了验证,我们在非正态分布中随机选择一个偏移较大的分布-“Chi-Square分布”,求其x-bar来体会一下中心极限定理。
当总体数据不具备正态分布时模拟试题-21、用卡方分布随机产生9列,每列各有250个数据2、用产生的数据进行点图描绘和正态检验
在这里看到,这是一个很偏移的分布,我们用它来验证中心极限定理C10项是对
C1~C9的平均值的数据统计,同样样本大小为9,其散布明显变得小多了。描述性统计:C1,C2,C3,C4,C5,C6,C7,C8,C9,C10
平均值变量NN*平均值标准误标准差最小值下四分位数中位数上四分位数C125001.9170.1221.9320.0020.5431.2522.602C225002.0380.1121.7680.0030.6021.4533.068C325002.0720.1302.0500.0090.5581.4022.853C425002.0050.1392.2040.0020.5511.3272.875C525001.8540.1091.7260.0090.5341.2832.595C625001.9540.1292.0390.0030.4771.3472.743C725001.9650.1221.9350.0110.5161.4122.759C825002.0740.1382.1780.0110.5971.3792.755C925002.0080.1362.1490.0220.5991.2832.680C1025001.98750.04360.68940.47331.52531.92902.42143、用产生的数据进行描述统计比较
sssxxxn====20920367..0.个体值的分布样本平均的分布
4、点图描绘比较,验证中心极限定理个体值的概率图
样本平均的分布5、正态概率图描绘比较,验证中心极限定理 我们经常依靠从测量系统中得到的一个数值来估计输入或输出变量的值。减小测量系统误差的简易方法就是把两个或更多的读数平均。我们的测量系统的精密度自动增加,增加因子是平均值样本数的平方根,如果我们要想使测量系统的误差减小一半,我们就需要把4次的测量值平均才可以。测量系统MS的改善中心极限定理实际应用4假设检验155156路径位置DefineMeasureAnalyzeImproveControlStep8-Data分析Step9-VitalFewX’的选定
多变量研究
中心极限定理
假设检验
置信区间
方差分析,均值检验
卡方检验
相关/回归分析Step7-Data收集157目录假设检验概要假设检验的核心用语假设检验的定义假设检验的阶段假设检验的应用???158假设检验概要亲爱的
Abby:
你在你的专栏里说妇女怀孕期是266天。这是谁说的?我怀我的孩子用了10个月零5天,这是确信无疑的,因为我精确地知道孩子怀上的那一天。我的丈夫在海军服役,这个孩子不可能在其他任何时间怀上,因为我见到他只一次,只有一个小时,而且在孩子出生之前我再也没有和他见面。
我不饮酒,也不东奔西跑,而且这个孩子不可能不是他的。所以请在报纸上声明收回关于266天怀孕的时间。因为否则我将面临许多的麻烦!
-圣地亚哥读者你将对她说些什么?对他的丈夫说些什么?※一则有趣的故事159250260240230270280290300220平均圣地亚哥的读者平均怀孕时间是266天如果她说怀孕260天,你对她怀疑吗?如果她说怀孕400天,你对她怀疑吗?从哪点起你开始怀疑呢?作一个记号160医生很早就知道孩子自然出生有以下特征…正态分布
平均怀孕时间=天
标准偏差=天161产科医生早就知道:正态分布平均=266天标准偏差=16天162临产期间分布平均
=
__266__标准偏差
=_16_______圣地亚哥的读者,究竟如何呢?163假设检验概要在工业生产中,我们经常希望能够确定某个分布的参数是否就是某个具体数值或是否与其有什么关系。也就是说,我们可能希望要检验这样一个假设,即:某个分布的均值或标准差是否是某些数值,或者两个均值之差是否是零。这些检验就需要使用假设检验方法。实际工作中的例子有:1、制造商希望引进一种新产品。为了能够实现利润,它们需要在今后5周的200小时内生产1200件产品。如果生产一件产品的平均
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 机械投泥手课程设计
- 七年级体育 体育与健康教育第10课教案 人教新课标版
- 九年级体育 考核立定跳远教案 人教新课标版
- 低空经济市场趋势与投资前景分析报告
- 机械加工 课程设计
- 城市更新路径解析:多元实施模式的探讨
- 机械制造技术课程设计
- 机械制图详细课程设计
- 2024年35kv架空线路施工合同质量控制
- 机械专业有多少课程设计
- 中考数学复习专题课件:瓜豆原理之直线型
- GB 18384-2020 电动汽车安全要求
- 腹股沟斜疝护理查房ppt
- 精品堆垛机安装指导书
- PMC生产计划与物料控制实务课件
- 鸡的饲养管理-优质课件
- 人工湿地设计规范标准[详]
- 提灌站项目施工组织设计
- 无损检测英语
- 化学微生物学第7章 微生物转化
- 《少年正是读书时》-完整版PPT课件
评论
0/150
提交评论