spc中级统计分析管理工具课件_第1页
spc中级统计分析管理工具课件_第2页
spc中级统计分析管理工具课件_第3页
spc中级统计分析管理工具课件_第4页
spc中级统计分析管理工具课件_第5页
已阅读5页,还剩163页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中级统计分析SeniorProcessStatisticalAnalysis中级统计分析统计过程分析基础知识统计过程分析数据统计分析目的和作用数据63

60

64

62

63

64

63

62

66

64

60

62

61

65

62

63

66

63

67

64

63

62

65

63

65

61

62

64

63

61平均值:63.1最大值:67最小值:60样本数:30数据统计分析目的和作用数据63

60

64

62数据的分类和特点压力泵的一组读数(Mpa):200,215.3,211.5,218.2,220产品表面刮伤数(处):1,5,3,6,8,101)连续的读数,不一定是整数,一般需要专用的量具、仪器进行测量后读数——计量性的数据2)不连续的数据,自然数,一般通过计数得到,不一定需要专用的量具、仪器来测量——计数性的数据ONOFF数据的分类和特点压力泵的一组读数(Mpa):1)连续的读数,统计分析的关键参数×δ?统计分析的关键参数×δ?中级统计分析中的关键参数计量性数据度量分布位置的参数均值中位数众数度量离散程度的参数标准差极差计数性数据度量分布中的比例度量分布中的比率中级统计分析中的关键参数计量性数据计数性数据中级统计分析技术应用数据类型单样本双样本成对样本多个样本可视化工具圆点图箱式图散布图圆点图等值线Tukey均值多变量散点图直方图箱式图差异分析圆点图茎叶图箱式图位置检验(正态假设)单样本t检验双样本

t检验成对样本t检验方差分析ANOVA位置检验(无分布假设)Fisher检验Tukey末数检验Fisher检验Kruskal-Wallis检验Wilcoxon检验Kruskal-Wallis检验Wilcoxon检验变异检验

单样本Х2检验

F检验

Bartlett(正态)Levene(无分布假设)比例检验

单样本比例双样本比例检验或相关

→P控制图+置信区间比率检验柏松比率检验→→U控制图+置信区间中级统计分析技术应用数据类型单样本双样本成对样本多个样本可视可视化工具VisualizeTools可视化工具计量性数据的分布可视化圆点图:检查并比较分布箱式图:检查并比较分布比较变量的汇总或单个值直方图检查并比较分布茎叶图检查并比较分布计量性数据的分布可视化圆点图:圆点图使用点图估计数据的形状和中心趋势。点图与直方图类似,分为多个区间。但是,具有少量数据时,点图可能比直方图更有用,原因在于:一般情况下,点图比直方图包含的区间更多。每个点都表示单独的观测值(或者少量观测值)。点图对于比较数据组也非常有用。圆点图使用点图估计数据的形状和中心趋势。点图与直方图类似,分点图-单变量示例您为一家洗发精制造商工作,您需要确保瓶盖的紧固程度适当。如果瓶盖扣得过松,则有可能在装运过程中脱落。如果扣得过紧,消费者可能很难打开(尤其是在洗浴过程中)。您随机抽取一些瓶子样本,并检测打开瓶盖所需的扭矩。创建一个点图来评估数据并确定样本与目标值18的接近程度。解释结果大多数瓶盖紧固时的扭矩在14到24之间。只有1个瓶盖很松,扭矩小于11。但是,分布呈正向偏斜,有些瓶盖拧得过紧。许多瓶盖需要大于24的扭矩才能打开,5个瓶盖的扭矩大于33,这几乎是目标值的两倍。点图-单变量示例您为一家洗发精制造商工作,您需要确保瓶盖的点图-多变量示例您的公司在2台机器上生产塑料管件,您想检验管件直径的一致性。您要测量2台机器在3周内生产的管件,每周各测量10个管件。创建一个内部含组(按机器分组每个星期的符号)的点图来检验分布情况。解释结果机器2生产的管件的直径在各周似乎都比较稳定。但是,机器1生产的管件的直径变异性每周都在增加:·

第1个星期的直径范围约为4.3到5.2·

第2个星期的直径范围约为5.0到7.0·

第3个星期的直径范围约为4.9到8.8点图-多变量示例您的公司在2台机器上生产塑料管件,您想箱图——四分位数四分位数是将数据样本分成四个相等部分的值。利用四分位数,可以快速评估数据集的展开和中心趋势–这是了解数据的重要前期步骤。下四分位数(Q1)25%的数据小于等于此值。第二个四分位数(Q2)中位数。50%的数据小于等于此值。上四分位数(Q3)75%的数据小于等于此值。四分位间距下四分位数与上四分位数之间的距离(Q3-Q1);因此,它跨越数据中间部分,即50%。Q1:计算k=(n+1)/4,如果结果是整数,那么Q1=Xk,否则Q1=1/2×(X[INT(k)-1]+X[INT(k)+1])。Q2:计算k=2(n+1)/4,如果结果是整数,那么Q2=Xk,否则Q2=1/2×(X[INT(k)-1]+X[INT(k)+1])。Q3:计算k=3(n+1)/4,如果结果是整数,那么Q3=Xk,否则Q3=1/2×(X[INT(k)-1]+X[INT(k)+1])。IQR:Q3-Q1例如,对于以下数据:7,9,16,36,39,45,45,46,48,51,求:Q1,Q2,Q3,IQR。结果如下:Q1=14.25Q2(中位数)=42Q3=46.50四分位间距=46.50-14.25,或32.25箱图——四分位数四分位数是将数据样本分成四个相等部分的值。利箱图箱线图(也称为方框须线图)可用来评估和比较样本分布。25%25%25%25%最大值:Q3+1.5(Q3-Q1)最小值:Q1-1.5(Q3-Q1)Q3:3rd四分位数Q2:中位数:2nd

四分为数Q1:1st

四分位数异常点:箱图两边的胡须长度不能够超过1.5×(Q3-Q1),超过着两根胡须的观察值使用不同的符号表示箱图箱线图(也称为方框须线图)可用来评估和比较样本分布。25箱图示例-单变量您想要检验地毯产品的总体耐用性。地毯产品的样本放在四所住宅内,然后测量60天后的耐用性。创建一个箱线图来检验耐用性得分的分布情况。该箱线图显示:·

耐用性得分的中位数为12.95·

四分位数间距为10.575到17.24。·

没有出现异常值。·

间距为7.03到22.5。·

中位数上方较长的上部须线和较大的方框表明数据略呈正偏斜分布-分布的右尾长于左尾箱图示例-单变量您想要检验地毯产品的总体耐用性。地毯产品的样箱图示例-多变量绘制前面点图中所用多变量的例子。您的公司2台设备都生产塑料管件,您很关心直径的一致性问题。您要测量每台机器在3周内生产的管件,每周各测量10个管件。创建一个箱线图来检验分布情况。

箱图示例-多变量绘制前面点图中所用多变量的例子。直方图-示例与观察用于检查样本数据的形状和分布情况。直方图将样本值划分为许多称为区间的间隔。条形表示落于每个区间内的观测值的数量(频率)。示例:您为一家洗发精制造商工作,您需要确保瓶盖的紧固程度适当。如果瓶盖扣得过松,则有可能在装运过程中脱落。如果扣得过紧,消费者可能很难打开(尤其是在洗浴过程中)。您随机抽取一些瓶子样本,并检测打开瓶盖所需的扭矩。创建一个直方图来评估数据并确定样本与目标值18的接近程度。直方图-示例与观察用于检查样本数据的形状和分布情况。直方图常见的直方图型态正常型说明:中间高,两边低,有集中趋势.结论:左右对称分配(常态分配),显示制程在正常运转直方图常见的直方图型态直方图缺齿型(凹凸不平型)说明

:高低不一,有缺齿情形。不正常的分配,系因测定值或换算方法有偏差,次数分配不当所形成。结论::稽查员对测定值有偏好现象,如对5、10之数字偏好;或是假造数据。测量仪器不精密或组数的宽度不是倍数时亦有此情况直方图缺齿型(凹凸不平型)直方图切边型(断裂型)

说明:有一端被切断结论:原因为数据经过全检过,或制程本身有经过全检过,会出现的形状。若剔除某规格以上时,则切边在靠近右边形成直方图切边型(断裂型)直方图离岛型说明:在右端或左端形成小岛.结论:

测定有错误,工程调节错误或使用不同原料所引起。一定有异常原因存在,只在去除,即可合乎制和要求,制出合规格的制品直方图离岛型直方图高原型说明:形状似高原状。结论:不同平均值的分配混在一起,应层别之后再做直方图比较直方图高原型直方图双峰型说明:有两个高峰出现.结论:有两种分配相混合,例如两部机器或两家不同供应商,有差异时,会出现此种形状,因测定值受不同的原因影响,应予层别后再作直方图直方图双峰型直方图偏态型(偏态分配)

说明:

高处偏向一边,另一边低,拖长尾巴。可分偏右边,偏左边偏右边:例如,微量成分的含有率等,不能取到某值以下的值时,所出现的形状.偏左边:例如,成分含有高纯度的含有率等,不能取到某值以上的值时,就会出现的形状.结论:尾巴拖长时,应检讨是否在技术上能够接受,工具磨损或松动时,亦有此种现象发生.直方图偏态型(偏态分配)茎叶图-基础该图类似于直方图,只不过它不是使用条形而是使用实际数据值的数字来表示每个区间(行)的频率比直方图更简单,不用计算可以对数据进行重新组织,直方图不可不用电脑可手工直接进行绘制快速可视化

将数据455166756茎叶图-基础该图类似于直方图,只不过它不是使用条形而是使用实茎叶图-示例554549665341585660634591553866603茎叶图-示例5545496653415856作业题如果数字为小数怎么做法呢?601.4601.6598.0601.4599.4600.0600.2601.2598.4599.0601.2601.0600.8597.6601.6599.4601.2598.4599.2598.8茎叶图显示:EX.茎叶图EX.N=20叶单位=0.1015976459804455988959902449599(2)60002960088601022244260166变量平均值最小值中位数最大值EX.599.99597.60600.10601.60作业题如果数字为小数怎么做法呢?茎叶图显示:EX.散布图用于通过相对于一个变量绘制另一个变量来图示说明两个变量之间的关系。散点图也可用于绘制随时间变化的变量。简单形式分组(两组数据)简单+拟合分组+拟合散布图用于通过相对于一个变量绘制另一个变量来图示说明两个变量散布图-简单示例No.12345678910X261014182226303438Y481216202428323640散布图-简单示例No.12345678910X261014散点图+拟合-示例您很关心公司生产的相机电池是否能够很好地满足顾客的需要。市场调查显示,如果两次放电之间等待的时间超过5.25秒,顾客就会变得很不耐烦。您收集了分别使用过不同时间的电池的一个样本,并在每个电池放电后立即测量了其剩余电压(放电后电压),还测量了各电池再次放电之前必须等待的时间(放电恢复时间)。创建一个散点图来检查结果。在5.25秒的临界放电恢复时间处包括一条参考线。散点图+拟合-示例您很关心公司生产的相机电池是否能够很好地满计数型数据的分布可视化条形图饼图计数型数据的分布可视化条形图条形图用于比较数据类别的某种度量。每个条形都可以表示某个类别的计数、某个类别的函数(如平均值、合计或标准差)或某个表格中的汇总值。颜色密度蓝色高红色低红色低蓝色高红色高红色低蓝色低条形图用于比较数据类别的某种度量。每个条形都可以表示某个类别条形图您是一家生产汽车门板的公司的质量工程师。每周都有一些门板因喷漆瑕疵而被拒收。您怀疑时间段与瑕疵类型之间存在一定的关系。创建一个条形图以确定每种喷漆瑕疵的门板拒收数,并按时间段聚类。选择递减顺序以查看按从最大到最小排列的最外层类别。条形图您是一家生产汽车门板的公司的质量工程师。每周都有一些门饼图用于显示每个数据类别相对于整个数据集的比率。饼图用于显示每个数据类别相对于整个数据集的比率。简单假设检验分析BasicHypothesisTestAnalysis简单假设检验分析假设检验基础知识原材料改变前后产品参数是否一致?过程参数改变前后产品质量是否有变化?缺陷分类和比例是否随着某些因素而存在差异?同样的产品不同的生产线生产,只见是否有差异?几条生产线不同的生产班次的产品之间有无变异?……假设检验假设检验基础知识原材料改变前后产品参数是否一致?假设检假设检验的流程定义检验目标声明原假设:H0VSHA选择风险α、β和样本量n收集数据并检验假设检验统计和置信区间计算P值P<α拒绝H0接受HA接受H0拒绝HA假设的类型示例:原假设:H0=5,那么被择假设可能是:单侧:Ha>5或单侧:Ha<5双侧:Ha≠5什么是α、β和P???假设检验的流程定义检验目标选择风险α、β和收集数据并检验统计几个基本概念置信度:估计的可信程度。置信区间:对于随机变量θ,如果θ1(x1,x2,…xn)、θ2(x1,x2,…xn)是来自于样本观测值的两个统计量,存在一个概率1-α,使得P(θ1,θ2)=1-α.那么,随机区间[θ1,θ2]叫做在置信概率1-α上的置信区间。置信概率:1-α区间估计:随机变量θ的置信区间[θ1,θ2]Xbar置信下限置信上限1-αα/2α/2几个基本概念置信度:估计的可信程度。Xbar置信下限置信上限两个风险和P值解释正确结论概率:1-α错误I概率:α错误II概率:β正确结论概率:1-β接受Ho接受HaHo为真Ha为真结论事实第一种风险α:拒真概率第二种风险β:纳假概率宁可让十个罪人脱逃不可让一个好人受罪!P值确定否定假设检验中原假设的适当性。P值范围介于0到1之间。p值越小,错误地否定原假设的概率就越小。进行任何分析之前,请先确定alpha(a)水平。常用值为0.05。如果检验统计量的p值小于alpha,则可否定原假设。由于p值在假设检验中具有不可或缺的作用,因此p值被用于许多统计领域,其中包括基本统计量、线性模型、可靠性和多元分析。关键是要了解每个检验中原假设和备择假设所代表的内容,然后使用p值来帮助做出否定原假设的决定。两个风险和P值解释正确结论错误I错误II正确结论接受Ho接受a&b类错误与客户的关系检验效率E=0.8a

类错误

好的产品被误认为是次品。成本:返工报废虚警b

类错误残次品漏过检验流向客户。成本:。。。。漏报Customer客户a&b类错误与客户的关系检验效率a类错假设检验的选择计数数据计量数据假设检验位置检验变异检验T检验单样本2水平双样本2水平ANOVA检验多样本?水平单样本T双样本T比率检验比例检验单样本X2双样本F假设检验的选择计数数据计量数据假设检验位置检验变异检验T检正态性检验和转换处理正态检验的方法直方图圆点图概率纸手/自动正态转换的方法1/XSQRT(X)Lg(X)BOX-COX自动转换正态性检验和转换处理正态检验的方法BOX-COX自动转换数据的正态转换和应用案例案例分析BOX-COX转换演示及其分析数据的正态转换和应用案例案例分析计量性数据假设检验分类位置检验(正态假设)单样本t检验双样本

t检验成对样本t检验方差分析ANOVA变异检验单样本Х2检验

双样本

F检验Bartlett(正态)

Levene(无分布假设)计量性数据假设检验分类位置检验变异检验抽样的概念总体研究对象的全部为什么我们要抽样?抽样为什么必须随机?抽样误差的可能性。抽样数量的决定基于抽样,我们可以对总体进行推断样本:

总体的一部分-子集©1994Dr.MikelJ.HarryV3.0抽样的概念总体为什么我们要抽样?基于抽样,我们可以对总体进均值相等的假设检验以下的直方图展示两个国家A和B的居民身高两个样本的大小为100,测量单位为英寸国家B的居民平均身高比国家A高吗?CountryA国家ACountryB国家B[inch]英寸60.062.064.066.068.070.072.074.076.078.080.0均值相等的假设检验以下的直方图展示两个国家A假设的特性原假设(Ho):通常描述过程状态提出假设基于证据拒绝或接受备择假设(Ha):通常描述不同使用Minitab©1994Dr.MikelJ.HarryV3.0假设的特性原假设(Ho):备择假设(Ha):©19假设检验有罪无罪案例美国司法系统常被用来作为假设检验的例子。在美国,除非有确凿证据,否则我们只能认为对象无罪。原假设:“此人无罪。”我们需要强有力的证据来说服陪审团。如果真相已知时,假设推断的结果会是什么?Ho:此人无罪Ha:此人有罪假设检验有罪无罪案例美国司法系统常被用来作为假设检验单样本t检验对九个小配件进行了测量。根据历史经验,小配件的测量数据的分布接近于正态,但假设不知道s。为了检验总体平均值是否为5并获得平均值的90%置信区间,需要使用t过程。值4.95.14.65.05.14.74.44.74.6结果:

单样本T:值mu=5与≠5的检验平均值变量N平均值标准差标准误90%置信区间TP值94.78890.24720.0824(4.6357,4.9421)-2.560.034单样本t检验对九个小配件进行了测量。根据历史经验,小配件的测单样本t检验的用途根据刚才的例子,总结一下单样本t检验的使用场合…计量性数据正态分布(近似)单个样本的位置(均值)检验目标值已知单样本t检验的用途根据刚才的例子,总结一下单样本t检验的使用双样本t检验案例为了提高家庭暖气系统的效率,进行了一项旨在评估两种设备功效的研究。安装其中一种设备后,对房舍的能耗进行了测量。这两种设备分别是电动气闸(Damper=1)和热活化气闸(Damper=2)。能耗数据(BTU.In)堆叠在一列中,另外还有一个分组列(Damper),包含用于表示总体的标识符或下标。假设进行了方差检验,并且没有发现方差不等的证据。现在,您要确定是否有证据证明这两种设备之间的差值不为零,以比较出这两种设备的功效。炉子.MTW双样本T检验和置信区间:气闸内置能量消耗,气闸气闸内置能量消耗双样本T平均值气闸N平均值标准差标准误差1409.913.020.4825010.142.770.39差值=mu(1)-mu(2)差值估计:-0.235差值的95%置信区间:(-1.450,0.980)差值=0(与≠)的T检验:T值=-0.38P值=0.701自由度=88两者都使用合并标准差=2.8818双样本t检验案例为了提高家庭暖气系统的效率,进行了一项旨在评双样本t检验的用途根据刚才的例子,总结一下双样本t检验的使用场合…计量性数据正态分布(近似)两个样本的位置(均值)检验双样本t检验的用途根据刚才的例子,总结一下双样本t检验的使用方差分析ANOVAis对平均值比较什么是方差分析?用来确定因变量(“Y”)与单个或多个自变量(“Xs”)间关系的统计显著性的方法,其中(“Xs”)具有两个或多个水平。是确定每一水平的响应变量值的均值是否来自同一总体的一种方法。(它们有所不同吗?)筛选潜在的关键少数“Xs”的方法方差分析ANOVAis对平均值比较什么是方差分析?用来确使用方差分析的三种假设1. 对于因素水平的每一组合,残差值的均值为0.0

这意味着我们所拟合的方程(或模型)正确,没有其它变量影响结果。“观测”值(圆圈)和“预计”值(数组平均值,水平线)间的差额为“残差”。2.残差必须独立,并呈正态分布残差(或误差)即是实际观测的“Y”值和预计的数学模型的“Y”值。残差表明模型何处与数据不相匹配。当比较平均值时,正态性往往不成问题。因为中心极限定理表明,平均值趋向正态分布。当比较变差时,正态性非常重要。(方差齐性:对于正态数据,应用“Bartlett”检验法,对于非正态数据,应用“Levene”检验法)另一个需要关注的问题(除平均值的相等性之外)是方差的相等性。“X”

转变成不同水平时,可能降低变差,提高Z值。可以用Bartlett或Levene检验法来检验方差的相等性。3.方差必须相等(或接近相等) 使用方差分析的三种假设1. 对于因素水平的每一组合,残差值单样本ANOVA分析您设计了一项试验来评估四种试验性地毯产品的耐用性。您将这些地毯产品中每种的一个样本分别铺在四个家庭,并在60天后测量其耐用性。由于您要检验平均值是否相等并评估平均值之间的差异,因此您使用包含多重比较的单因子方差分析过程(堆叠形式的数据)。通常,您会选择适用于数据的一种多重比较方法。但是,此处选择了两种方法来展示Minitab的功能。单因子方差分析:耐用性与地毯来源自由度SSMSFP地毯3146.448.83.580.047误差12163.513.6合计15309.9S=3.691R-Sq=47.24%R-Sq(调整)=34.05%平均值(基于合并标准差)的单组95%置信区间水平N平均值标准差---------+---------+---------+---------+1414.4833.157(-------*-------)249.7353.566(-------*--------)3412.8071.506(-------*-------)4418.1155.435(-------*-------)

---------+---------+---------+---------+

10.015.020.025.0合并标准差=3.691单样本ANOVA分析您设计了一项试验来评估四种试验性地毯产品双样本ANOVA分析作为一位生物学家,您正在研究生活在两个湖中的浮游动物。您在实验室中放置了十二个容器,每六个容器一组分别装有取自两个湖的水。您在每个容器中添加了三种营养补充物质中的一种,30天后对单位体积水中的浮游动物进行计数。您使用双因子方差分析检验总体平均值是否相等,这相当于检验是否有显著证据证明存在交互作用和主效应。双因子方差分析:浮游动物与补充,湖来源自由度SSMSFP补充21918.50959.2509.250.015湖121.3321.3330.210.666交互作用2561.17280.5832.710.145误差6622.00103.667合计113123.00S=10.18R-Sq=80.08%R-Sq(调整)=63.49%平均值(基于合并标准差)的单组95%置信区间补充平均值--+---------+---------+---------+-------143.50(-------*-------)268.25(--------*-------)339.75(--------*-------)

--+---------+---------+---------+-------

30456075平均值(基于合并标准差)的单组95%置信区间湖平均值-----+---------+---------+---------+----可移动的高秤51.8333(----------------*----------------)玫瑰花49.1667(----------------*----------------)

-----+---------+---------+---------+----

42.048.054.060.0Lake1Lake2Lake3双样本ANOVA分析作为一位生物学家,您正在研究生活在两个湖ANOVA的用途根据刚才的例子,总结一下ANOVA检验的使用场合…计量性数据正态分布(近似)两个或以上样本的位置(均值)检验ANOVA的用途根据刚才的例子,总结一下ANOVA检验的使用ANOVA分析特点方差分析将用于检验两个总体平均值相等性的双样本t检验扩展到更一般的比较两个以上平均值相等性的原假设,即相对于它们并非全都相等。允许模型同时具有定性和定量变量。双因子方差分析可在按两个变量或因子对处理进行分类时检验总体均值是否相等。对于此过程,数据必须平衡(所有单元必须有相同数量的观测值),因子必须是固定的。更加灵活、准确,可以分析各因子之间的交互作用。ANOVA分析特点方差分析将用于检验两个总体平均值相等性的练习题根据公司产品特点准备需要的典型数据进行案例分析同一产品两个供应商,针对某一特性进行分析公司内部同一产品不同批次的同一产品特性分析。。。练习题根据公司产品特点准备需要的典型数据进行案例分析单方差卡方检验您在一家制造飞机发动机的高精度部件(包括测量长度必须为15英寸的金属销栓)的工厂任质量控制检验员。安全法规定,销栓长度的方差不得超过0.001in2。以前的分析表明,销栓长度服从正态分布。您收集了100个销栓的样本,并对其长度进行了测量,以便进行假设检验并为总体方差创建一个置信区间。单方差卡方检验您在一家制造飞机发动机的高精度部件(包括测量长单方差检验结果单标准差检验和置信区间:销长度H0:西格玛=0.001Ha:西格玛不<0.001基本统计量变量N标准差方差销长度1000.02670.00071595%置信区间95%单侧置信区间变量方法标准差上限方差上限销长度标准0.03030.000919

调整的0.02950.000869检验变量方法卡方自由度P值销长度标准70.7799.000.014调整的112.64157.570.003结果分析:由于数据来自正态分布总体,因此请参考标准方法。单侧假设检验的p值为0.014。此值足够低,可以否定原假设,并可推断销长度的方差小于0.001。通过考查95%的置信上限,可以使总体方差的估计值更确切,该置信上限提供总体方差可能低于的值。从此分析中应该能推断出,销栓长度的方差足够小,可以满足规范并确保乘客安全。

单方差检验结果单标准差检验和置信区间:销长度95%置信双样本方差检验正态分布:F检验非正态分布的任何连续分布:LEVENE检验双样本方差检验正态分布:F检验双样本方差检验案例为了提高家庭暖气系统的效率,进行了一项旨在评估两种设备功效的研究。安装其中一种设备后,对房舍的能耗进行了测量。这两种设备分别是电动气闸(气闸1)和热活化气闸(气闸2)。能耗数据(气闸内置能量消耗)堆叠在一列中,另外还有一个分组列(气闸),包含用于表示总体的标识符或下标。您要比较两个总体的方差,以便构造用于比较两个气闸的双样本t检验和置信区间。双样本方差检验案例为了提高家庭暖气系统的效率,进行了一项旨在检验结果等方差检验:

气闸内置能量消耗

气闸

95%

标准差

Bonferroni

置信区间

气闸

N

下限

标准差

上限

1

40

2.40655

3.01987

4.02726

2

50

2.25447

2.76702

3.56416

F

检验(正态分布)检验统计量

=

1.19,

p

=

0.558

Levene

检验(任何连续分布)检验统计量

=

0.00,

p

=

0.996对于该能耗示例来说,p值0.558和0.996都大于a的合理选择范围,因此无法否定方差相等的原假设。也就是说,这些数据并未提供足够证据证明两个总体的方差不相等。因此,使用双样本t过程时假定方差相等是合理的。检验结果等方差检验:

气闸内置能量消耗

气闸对于该能耗示关于P值的解释P值,通常称之为可获得的置信水平去跟α比较。P值就是一个指标来衡量样本证据对拒绝假设H0的支持程度。一般地,P值越小则表示拒绝零假设H0的样本证据的分量越重。特别地,P值是导致H0被拒绝的最小α值。任何α值<P值接受H0,任何α值>P值拒绝H0。

P值也是一种从相同样本容量样本中统计试验出来的比例,并且这种样品是从相同的分布中取得的,这种是在假设H0为真的情况下统计试验产生的一个极端值。关于P值的解释P值,通常称之为可获得的置信水平去跟α比较。P综合分析案例GeneralAnalysisCaseStudy综合分析案例综合应用案例分析一名工厂领班选择了五个代表预期测量值范围的部件。每个部件都通过布局检查进行了测量以确定其参考(主要)值。然后,一名操作员将每个部件随机测量了12次。您使用方差分析法从量具R&R研究中获得了过程变异(16.5368)。综合应用案例分析一名工厂领班选择了五个代表预期测量值范围的部部件参考值响应部件参考值响应部件参考值响应122.7365.85109.1122.5365.75109.3122.4365.95109.5122.5365.95109.3122.73665109.4122.3366.15109.5122.53665109.5122.5366.15109.5122.4366.45109.6122.4366.35109.2122.63665109.3122.4366.15109.4245.1487.6

243.9487.7

244.2487.8

245487.7

243.8487.8

243.9487.8

243.9487.8

243.9487.7

243.9487.8

244487.5

244.1487.6

243.8487.7

部件参考值响应部件参考值响应部件参考值响应122.7365.直方图分析结果直方图分析结果单样本的t检验分析单样本T:Biasmu=0与≠0的检验(a=0.05)平均值变量N平均值标准差标准误95%置信区间TPBias60-0.05330.44430.0574(-0.1681,0.0615)-0.930.356请大家计算出t统计量的t值为多少?单样本的t检验分析单样本T:Bias请大家计算出t统计软件综合分析结果软件综合分析结果稳定性研究的结果跟线性的结果有无联系???稳定性研究的结果跟线性的结果有无联系???ANOVA(交叉)法选择了10个代表过程变异预期范围的部件。3名操作员以随机顺序测量这10个部件,每个部件测量3次。1 A 0.291 A 0.411 A 0.642 A -0.562 A -0.682 A -0.583 A 1.343 A 1.173 A 1.274 A 0.474 A 0.504 A 0.645 A -0.805 A -0.925 A -0.846 A 0.026 A -0.116 A -0.217 A 0.597 A 0.757 A 0.668 A -0.318 A -0.208 A -0.17ANOVA(交叉)法选择了10个代表过程变异预期范围的部结果输出包含交互作用的双因子方差分析表

来源自由度SSMSFP部件988.36199.81799492.2910.000操作员23.16731.5836379.4060.000部件*操作员180.35900.019940.4340.974重复性602.75890.04598合计8994.6471删除交互作用项选定的Alpha=0.25结果输出包含交互作用的双因子方差分析表结果输出量具R&R方差分量来源方差分量贡献率合计量具R&R0.091437.76重复性0.039973.39再现性0.051464.37操作员0.051464.37部件间1.0864592.24合计变异1.17788100.00结果输出量具R&R结果输出研究变异%研究变来源标准差(SD)(6*SD)异(%SV)合计量具R&R0.302371.8142327.86重复性0.199931.1996018.42再现性0.226841.3610320.90操作员0.226841.3610320.90部件间1.042336.2539696.04合计变异1.085306.51180100.00可区分的类别数(ndc)=4结果输出研究变异%研究变图标输出图标输出单比例检验使用单比率可计算置信区间并执行比率的假设检验。例如,汽车部件制造商声称,其火花塞的缺陷率低于2%。可以取火花塞的随机样本确定实际缺陷率是否与声称的缺陷率一致。对于比率的双尾检验:H0:p=p0

H1:p≠p0

,其中,p是总体比率,p0是假设值。县地区检察官想竞选州地区检察官职位。她已决定,如果她的党派成员中支持她的人超过65%,她就放弃县检察官职位,而竞选州检察官职位。您需要检验H0:p=.65与H1:p>.65。作为竞选活动管理者,您收集了950名随机选择的党派成员的数据,并发现有560人支持该候选人。您进行了一项比率检验,以确定支持者的比率是否大于必需比率0.65。此外,还构造了95%的置信限,以确定支持者比率的下限。单比率检验和置信区间p=0.65与p>0.65的检验样本XN样本p95%下限精确P值15609500.5894740.5625151.000结果说明什么?p值1.0表示,数据与原假设一致(H0:p=0.65),即支持候选人的党派成员的比率不大于0.65这一必需比率。作为活动管理者,您建议她不要竞选州地区检察官职位。

单比例检验使用单比率可计算置信区间并执行比率的假设检验单比率检验(POISSON)为单样本Poisson过程中事件的发生率和平均发生次数计算置信区间,并进行发生率等于指定值的假设检验。Poisson过程描述某一事件在给定的时间、面积、体积等范围内的出现次数。单比率检验(POISSON)为单样本Poisson过程中单比率检验案例公司A生产电视机,在过去十年中,该公司对每个季度生产的有缺陷屏幕的单元数进行了计数。管理层规定,每季度20个缺陷单元是可接受的最大比率,他们想确定其工厂是否满足这一规定。单样本

Poisson

:

缺陷

A

的检验和置信区间

比率检验

=

20

与比率

<

20

合计出变量

现数

N

出现率

95%

上限

精确

P

值缺陷

A

713

40

17.8250

18.9628

0.001

观测值的

"长度"

=

1。p值为0.001。因此,应否定原假设并推断出,总体缺陷率小于20。通过考查95%的置信上限,可以使总体比率的估计更确切,该上限提供总体缺陷率可能低于的值。从此分析中,有足够的理由相信,每个季度的缺陷屏幕数小于18.9628。从而可以得出结论,公司A生产的电视机满足其季度缺陷规定。单比率检验案例公司A生产电视机,在过去十年中,该公司对每练习题根据公司产品特点准备需要的典型数据进行案例分析供应商改善前后的对比分析公司过程改进前后的对比分析合格率的对比分析练习题根据公司产品特点准备需要的典型数据进行案例分析课程回顾与巩固课程回顾与巩固Q&ATHEENDQ&ATHEEND谢谢各位只要我们脚踏实地,一丝不苟地对待品质,金灿灿的奖杯一定属于我们大家!谢谢各位中级统计分析SeniorProcessStatisticalAnalysis中级统计分析统计过程分析基础知识统计过程分析数据统计分析目的和作用数据63

60

64

62

63

64

63

62

66

64

60

62

61

65

62

63

66

63

67

64

63

62

65

63

65

61

62

64

63

61平均值:63.1最大值:67最小值:60样本数:30数据统计分析目的和作用数据63

60

64

62数据的分类和特点压力泵的一组读数(Mpa):200,215.3,211.5,218.2,220产品表面刮伤数(处):1,5,3,6,8,101)连续的读数,不一定是整数,一般需要专用的量具、仪器进行测量后读数——计量性的数据2)不连续的数据,自然数,一般通过计数得到,不一定需要专用的量具、仪器来测量——计数性的数据ONOFF数据的分类和特点压力泵的一组读数(Mpa):1)连续的读数,统计分析的关键参数×δ?统计分析的关键参数×δ?中级统计分析中的关键参数计量性数据度量分布位置的参数均值中位数众数度量离散程度的参数标准差极差计数性数据度量分布中的比例度量分布中的比率中级统计分析中的关键参数计量性数据计数性数据中级统计分析技术应用数据类型单样本双样本成对样本多个样本可视化工具圆点图箱式图散布图圆点图等值线Tukey均值多变量散点图直方图箱式图差异分析圆点图茎叶图箱式图位置检验(正态假设)单样本t检验双样本

t检验成对样本t检验方差分析ANOVA位置检验(无分布假设)Fisher检验Tukey末数检验Fisher检验Kruskal-Wallis检验Wilcoxon检验Kruskal-Wallis检验Wilcoxon检验变异检验

单样本Х2检验

F检验

Bartlett(正态)Levene(无分布假设)比例检验

单样本比例双样本比例检验或相关

→P控制图+置信区间比率检验柏松比率检验→→U控制图+置信区间中级统计分析技术应用数据类型单样本双样本成对样本多个样本可视可视化工具VisualizeTools可视化工具计量性数据的分布可视化圆点图:检查并比较分布箱式图:检查并比较分布比较变量的汇总或单个值直方图检查并比较分布茎叶图检查并比较分布计量性数据的分布可视化圆点图:圆点图使用点图估计数据的形状和中心趋势。点图与直方图类似,分为多个区间。但是,具有少量数据时,点图可能比直方图更有用,原因在于:一般情况下,点图比直方图包含的区间更多。每个点都表示单独的观测值(或者少量观测值)。点图对于比较数据组也非常有用。圆点图使用点图估计数据的形状和中心趋势。点图与直方图类似,分点图-单变量示例您为一家洗发精制造商工作,您需要确保瓶盖的紧固程度适当。如果瓶盖扣得过松,则有可能在装运过程中脱落。如果扣得过紧,消费者可能很难打开(尤其是在洗浴过程中)。您随机抽取一些瓶子样本,并检测打开瓶盖所需的扭矩。创建一个点图来评估数据并确定样本与目标值18的接近程度。解释结果大多数瓶盖紧固时的扭矩在14到24之间。只有1个瓶盖很松,扭矩小于11。但是,分布呈正向偏斜,有些瓶盖拧得过紧。许多瓶盖需要大于24的扭矩才能打开,5个瓶盖的扭矩大于33,这几乎是目标值的两倍。点图-单变量示例您为一家洗发精制造商工作,您需要确保瓶盖的点图-多变量示例您的公司在2台机器上生产塑料管件,您想检验管件直径的一致性。您要测量2台机器在3周内生产的管件,每周各测量10个管件。创建一个内部含组(按机器分组每个星期的符号)的点图来检验分布情况。解释结果机器2生产的管件的直径在各周似乎都比较稳定。但是,机器1生产的管件的直径变异性每周都在增加:·

第1个星期的直径范围约为4.3到5.2·

第2个星期的直径范围约为5.0到7.0·

第3个星期的直径范围约为4.9到8.8点图-多变量示例您的公司在2台机器上生产塑料管件,您想箱图——四分位数四分位数是将数据样本分成四个相等部分的值。利用四分位数,可以快速评估数据集的展开和中心趋势–这是了解数据的重要前期步骤。下四分位数(Q1)25%的数据小于等于此值。第二个四分位数(Q2)中位数。50%的数据小于等于此值。上四分位数(Q3)75%的数据小于等于此值。四分位间距下四分位数与上四分位数之间的距离(Q3-Q1);因此,它跨越数据中间部分,即50%。Q1:计算k=(n+1)/4,如果结果是整数,那么Q1=Xk,否则Q1=1/2×(X[INT(k)-1]+X[INT(k)+1])。Q2:计算k=2(n+1)/4,如果结果是整数,那么Q2=Xk,否则Q2=1/2×(X[INT(k)-1]+X[INT(k)+1])。Q3:计算k=3(n+1)/4,如果结果是整数,那么Q3=Xk,否则Q3=1/2×(X[INT(k)-1]+X[INT(k)+1])。IQR:Q3-Q1例如,对于以下数据:7,9,16,36,39,45,45,46,48,51,求:Q1,Q2,Q3,IQR。结果如下:Q1=14.25Q2(中位数)=42Q3=46.50四分位间距=46.50-14.25,或32.25箱图——四分位数四分位数是将数据样本分成四个相等部分的值。利箱图箱线图(也称为方框须线图)可用来评估和比较样本分布。25%25%25%25%最大值:Q3+1.5(Q3-Q1)最小值:Q1-1.5(Q3-Q1)Q3:3rd四分位数Q2:中位数:2nd

四分为数Q1:1st

四分位数异常点:箱图两边的胡须长度不能够超过1.5×(Q3-Q1),超过着两根胡须的观察值使用不同的符号表示箱图箱线图(也称为方框须线图)可用来评估和比较样本分布。25箱图示例-单变量您想要检验地毯产品的总体耐用性。地毯产品的样本放在四所住宅内,然后测量60天后的耐用性。创建一个箱线图来检验耐用性得分的分布情况。该箱线图显示:·

耐用性得分的中位数为12.95·

四分位数间距为10.575到17.24。·

没有出现异常值。·

间距为7.03到22.5。·

中位数上方较长的上部须线和较大的方框表明数据略呈正偏斜分布-分布的右尾长于左尾箱图示例-单变量您想要检验地毯产品的总体耐用性。地毯产品的样箱图示例-多变量绘制前面点图中所用多变量的例子。您的公司2台设备都生产塑料管件,您很关心直径的一致性问题。您要测量每台机器在3周内生产的管件,每周各测量10个管件。创建一个箱线图来检验分布情况。

箱图示例-多变量绘制前面点图中所用多变量的例子。直方图-示例与观察用于检查样本数据的形状和分布情况。直方图将样本值划分为许多称为区间的间隔。条形表示落于每个区间内的观测值的数量(频率)。示例:您为一家洗发精制造商工作,您需要确保瓶盖的紧固程度适当。如果瓶盖扣得过松,则有可能在装运过程中脱落。如果扣得过紧,消费者可能很难打开(尤其是在洗浴过程中)。您随机抽取一些瓶子样本,并检测打开瓶盖所需的扭矩。创建一个直方图来评估数据并确定样本与目标值18的接近程度。直方图-示例与观察用于检查样本数据的形状和分布情况。直方图常见的直方图型态正常型说明:中间高,两边低,有集中趋势.结论:左右对称分配(常态分配),显示制程在正常运转直方图常见的直方图型态直方图缺齿型(凹凸不平型)说明

:高低不一,有缺齿情形。不正常的分配,系因测定值或换算方法有偏差,次数分配不当所形成。结论::稽查员对测定值有偏好现象,如对5、10之数字偏好;或是假造数据。测量仪器不精密或组数的宽度不是倍数时亦有此情况直方图缺齿型(凹凸不平型)直方图切边型(断裂型)

说明:有一端被切断结论:原因为数据经过全检过,或制程本身有经过全检过,会出现的形状。若剔除某规格以上时,则切边在靠近右边形成直方图切边型(断裂型)直方图离岛型说明:在右端或左端形成小岛.结论:

测定有错误,工程调节错误或使用不同原料所引起。一定有异常原因存在,只在去除,即可合乎制和要求,制出合规格的制品直方图离岛型直方图高原型说明:形状似高原状。结论:不同平均值的分配混在一起,应层别之后再做直方图比较直方图高原型直方图双峰型说明:有两个高峰出现.结论:有两种分配相混合,例如两部机器或两家不同供应商,有差异时,会出现此种形状,因测定值受不同的原因影响,应予层别后再作直方图直方图双峰型直方图偏态型(偏态分配)

说明:

高处偏向一边,另一边低,拖长尾巴。可分偏右边,偏左边偏右边:例如,微量成分的含有率等,不能取到某值以下的值时,所出现的形状.偏左边:例如,成分含有高纯度的含有率等,不能取到某值以上的值时,就会出现的形状.结论:尾巴拖长时,应检讨是否在技术上能够接受,工具磨损或松动时,亦有此种现象发生.直方图偏态型(偏态分配)茎叶图-基础该图类似于直方图,只不过它不是使用条形而是使用实际数据值的数字来表示每个区间(行)的频率比直方图更简单,不用计算可以对数据进行重新组织,直方图不可不用电脑可手工直接进行绘制快速可视化

将数据455166756茎叶图-基础该图类似于直方图,只不过它不是使用条形而是使用实茎叶图-示例554549665341585660634591553866603茎叶图-示例5545496653415856作业题如果数字为小数怎么做法呢?601.4601.6598.0601.4599.4600.0600.2601.2598.4599.0601.2601.0600.8597.6601.6599.4601.2598.4599.2598.8茎叶图显示:EX.茎叶图EX.N=20叶单位=0.1015976459804455988959902449599(2)60002960088601022244260166变量平均值最小值中位数最大值EX.599.99597.60600.10601.60作业题如果数字为小数怎么做法呢?茎叶图显示:EX.散布图用于通过相对于一个变量绘制另一个变量来图示说明两个变量之间的关系。散点图也可用于绘制随时间变化的变量。简单形式分组(两组数据)简单+拟合分组+拟合散布图用于通过相对于一个变量绘制另一个变量来图示说明两个变量散布图-简单示例No.12345678910X261014182226303438Y481216202428323640散布图-简单示例No.12345678910X261014散点图+拟合-示例您很关心公司生产的相机电池是否能够很好地满足顾客的需要。市场调查显示,如果两次放电之间等待的时间超过5.25秒,顾客就会变得很不耐烦。您收集了分别使用过不同时间的电池的一个样本,并在每个电池放电后立即测量了其剩余电压(放电后电压),还测量了各电池再次放电之前必须等待的时间(放电恢复时间)。创建一个散点图来检查结果。在5.25秒的临界放电恢复时间处包括一条参考线。散点图+拟合-示例您很关心公司生产的相机电池是否能够很好地满计数型数据的分布可视化条形图饼图计数型数据的分布可视化条形图条形图用于比较数据类别的某种度量。每个条形都可以表示某个类别的计数、某个类别的函数(如平均值、合计或标准差)或某个表格中的汇总值。颜色密度蓝色高红色低红色低蓝色高红色高红色低蓝色低条形图用于比较数据类别的某种度量。每个条形都可以表示某个类别条形图您是一家生产汽车门板的公司的质量工程师。每周都有一些门板因喷漆瑕疵而被拒收。您怀疑时间段与瑕疵类型之间存在一定的关系。创建一个条形图以确定每种喷漆瑕疵的门板拒收数,并按时间段聚类。选择递减顺序以查看按从最大到最小排列的最外层类别。条形图您是一家生产汽车门板的公司的质量工程师。每周都有一些门饼图用于显示每个数据类别相对于整个数据集的比率。饼图用于显示每个数据类别相对于整个数据集的比率。简单假设检验分析BasicHypothesisTestAnalysis简单假设检验分析假设检验基础知识原材料改变前后产品参数是否一致?过程参数改变前后产品质量是否有变化?缺陷分类和比例是否随着某些因素而存在差异?同样的产品不同的生产线生产,只见是否有差异?几条生产线不同的生产班次的产品之间有无变异?……假设检验假设检验基础知识原材料改变前后产品参数是否一致?假设检假设检验的流程定义检验目标声明原假设:H0VSHA选择风险α、β和样本量n收集数据并检验假设检验统计和置信区间计算P值P<α拒绝H0接受HA接受H0拒绝HA假设的类型示例:原假设:H0=5,那么被择假设可能是:单侧:Ha>5或单侧:Ha<5双侧:Ha≠5什么是α、β和P???假设检验的流程定义检验目标选择风险α、β和收集数据并检验统计几个基本概念置信度:估计的可信程度。置信区间:对于随机变量θ,如果θ1(x1,x2,…xn)、θ2(x1,x2,…xn)是来自于样本观测值的两个统计量,存在一个概率1-α,使得P(θ1,θ2)=1-α.那么,随机区间[θ1,θ2]叫做在置信概率1-α上的置信区间。置信概率:1-α区间估计:随机变量θ的置信区间[θ1,θ2]Xbar置信下限置信上限1-αα/2α/2几个基本概念置信度:估计的可信程度。Xbar置信下限置信上限两个风险和P值解释正确结论概率:1-α错误I概率:α错误II概率:β正确结论概率:1-β接受Ho接受HaHo为真Ha为真结论事实第一种风险α:拒真概率第二种风险β:纳假概率宁可让十个罪人脱逃不可让一个好人受罪!P值确定否定假设检验中原假设的适当性。P值范围介于0到1之间。p值越小,错误地否定原假设的概率就越小。进行任何分析之前,请先确定alpha(a)水平。常用值为0.05。如果检验统计量的p值小于alpha,则可否定原假设。由于p值在假设检验中具有不可或缺的作用,因此p值被用于许多统计领域,其中包括基本统计量、线性模型、可靠性和多元分析。关键是要了解每个检验中原假设和备择假设所代表的内容,然后使用p值来帮助做出否定原假设的决定。两个风险和P值解释正确结论错误I错误II正确结论接受Ho接受a&b类错误与客户的关系检验效率E=0.8a

类错误

好的产品被误认为是次品。成本:返工报废虚警b

类错误残次品漏过检验流向客户。成本:。。。。漏报Customer客户a&b类错误与客户的关系检验效率a类错假设检验的选择计数数据计量数据假设检验位置检验变异检验T检验单样本2水平双样本2水平ANOVA检验多样本?水平单样本T双样本T比率检验比例检验单样本X2双样本F假设检验的选择计数数据计量数据假设检验位置检验变异检验T检正态性检验和转换处理正态检验的方法直方图圆点图概率纸手/自动正态转换的方法1/XSQRT(X)Lg(X)BOX-COX自动转换正态性检验和转换处理正态检验的方法BOX-COX自动转换数据的正态转换和应用案例案例分析BOX-COX转换演示及其分析数据的正态转换和应用案例案例分析计量性数据假设检验分类位置检验(正态假设)单样本t检验双样本

t检验成对样本t检验方差分析ANOVA变异检验单样本Х2检验

双样本

F检验Bartlett(正态)

Levene(无分布假设)计量性数据假设检验分类位置检验变异检验抽样的概念总体研究对象的全部为什么我们要抽样?抽样为什么必须随机?抽样误差的可能性。抽样数量的决定基于抽样,我们可以对总体进行推断样本:

总体的一部分-子集©1994Dr.MikelJ.HarryV3.0抽样的概念总体为什么我们要抽样?基于抽样,我们可以对总体进均值相等的假设检验以下的直方图展示两个国家A和B的居民身高两个样本的大小为100,测量单位为英寸国家B的居民平均身高比国家A高吗?CountryA国家ACountryB国家B[inch]英寸60.062.064.066.068.070.072.074.076.078.080.0均值相等的假设检验以下的直方图展示两个国家A假设的特性原假设(Ho):通常描述过程状态提出假设基于证据拒绝或接受备择假设(Ha):通常描述不同使用Minitab©1994Dr.MikelJ.HarryV3.0假设的特性原假设(Ho):备择假设(Ha):©19假设检验有罪无罪案例美国司法系统常被用来作为假设检验的例子。在美国,除非有确凿证据,否则我们只能认为对象无罪。原假设:“此人无罪。”我们需要强有力的证据来说服陪审团。如果真相已知

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论