版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Minitab中级应用班MinisterLeeTEL:李国防经历:美国质量协会(ASQ)会员63397902美国质量协会(ASQ)认证质量工程师(CQE)51594中国质量协会会员中国质量协会注册6SIGMA黑带CAQ-BBEC-0600103中国统计局注册统计师(中级)22050524中国质量协会注册中级质量工程师内部讲师培训师目录1.Minitab基本操作2.Minitab基本图表(Graph)3.过程能力分析(SPC)4.测量系统分析(MSA)5.基本统计(BasicStatistics)6.样本大小7.控制图(ControlCharts)什么是Minitab?MINITAB=Mini+Tabulator=小型
+计算机介绍于1972年,美国宾夕法尼亚大学用来作统计分析、教育用而开发,目前已出版Windows用版本Vesion15.1,并且已在工学、社会学等所有领域被广泛使用。MINITAB是为质量改善、教育和研究应用领域提供统计软件和服务的先导,是一个很好的质量管理和质量设计的工具软件,更是持续质量改进的良好工具软件,MINITAB统计软件为质量改善和概率应用提供准确和易用的工具,MINITAB被许多世界一流的公司所采用,包括通用电器、福特汽车、通用汽车、3M、霍尼韦尔、LG、东芝、诺基亚、以及SixSigma???优点以菜单的方式构成,所以无需学习高难的命令文,只需拥有基本的统计知识便可使用。图表支持良好,特别是与Six-sigma有关联的部分陆续地在完善之中。Minitab画面构成Session:直接输入Minitab的命令或显示类似统计表的文本型结果文件的窗口;WorKsheet:用于直接输入数据或可以修改的窗口,具有类似Excel中的spreadsheet功能;ShowHistory窗:储存已使用过的所有命令,并帮助已使用过的命令可重复使用;Graph窗:显示各种统计图表,同时可以打开15个窗口.第二章:操作菜单(Data)操作菜单1、堆栈栏(StackColumns)2、堆栈块(StackBlocksofColumns)3、堆栈行(StackRows)十、取消堆栈(Unstack)1、取消栏堆栈2、取消块堆栈十一、转换栏(TransponseColumns)十二、连接(Concatenate)十三、编码(Code)1、数字到数字(NumerictoNumeric)目录2、数字到文本(NumerictoText)3、文字到文字(TexttoText)4、文字到数据(TexttoNumeric)十四、使用转换表(UseConversionTable)十五、改变数据类型(ChangeDataType)十六、显示数据(DisplayData)目录2.Minitab基本图表(Graph)---散布图---直方图(Histogram)---箱线图(BoxPlot)---条形图(BarChart)---饼图(PieChart)---时间序列图(TimeSeriesPlot)DotPlot:想知道变数间的关联性的时候Histogram:确认数据的散布情况AB44434544443537454544403641414447453746434035414340344350454642424042474244454043Graph/HistogramBoxPlot:确认数据的散布及平均Graph/BoxPlotBarChart:用于分析对比汽车装配厂的车门喷漆环节存在较大的问题,现对一天的喷漆缺陷进行了记录,请用图形对各项缺陷类型的频次进行直观的比较。共有25条记录:划痕、划痕、桔纹、桔纹、色差、划痕、Other、Other、桔纹、桔纹、桔纹、桔纹、划痕、划痕、桔纹、划痕、色差、划痕、桔纹、桔纹、桔纹、桔纹、Other、Other、划痕、划痕、桔纹Graph/BarChartBarChart:用于分析对比PieChart:用于分析对比某移动通信服务商对计费差错原因进行分析,收集了1个月的话单错误的类型,具体数据如下,请用图形直观地显示各种错误类型的构成比例:Graph/PieChart计费类型错 112612无主话单 26950字段解析错 18861长途话单解析错11250电话号码错 5278TimeSeriesPlot:反映数据随着时间变化的趋势与走向供应商使用寿命甲1780甲930甲1400甲1630甲1160甲1150甲1770甲1190甲1030甲1570乙1090乙1000乙880乙1590乙910乙1520乙1270乙1470乙1110乙1290Practice某公司从两家供应商各采购了一批灯泡,分别统计各组样品的使用寿命,试绘制箱线图分析。3.过程能力分析(SPC)---柏拉图(ParetoChart)---因果图(CauseandEffect)---能力分析(Normal)---能力分析(Binomial)---能力分析(Poisson)通过使用Pareto图,您发现部件通常是因为表面瑕疵而遭到拒收。今天下午,您与各个部门的成员召开会议,集体讨论这些瑕疵的潜在原因。Cause-and-Effect:了解潜在原因之间的关系Stat/QualityTools/Cause-and-Effect想要测量AAA型号的B部位的Torque(Spec:25+/-5)
MinitabMenu:Stat/QualityTools/CapabilityAnalysis(Normal)Torque24221437183627211716321731222734212027192416211624182630312134162814321524141614MinitabMenu:Stat/QualityTools/CapabilitySixpack/(Normal计数数据的过程能力分析试对二极管生产线的状况进行过程能力分析;日期样品数量不合格品数量06-01150306-02150406-03150606-04150806-05150606-06150606-07150306-08150406-09150806-10150706-11150906-12150606-131501206-14150306-15150706-161501006-171506日期样品数量不合格品数量06-18150306-19150706-20150406-21150506-22150406-231501206-2415011MinitabMenu:Stat/QualityTools/CapabilityAnalysis/Binomial试对二极管生产线的状况进行过程能力分析;MinitabMenu:Stat/QualityTools/CapabilityAnalysis/Poisson日期样品数量不合格品数量12月18日154312月19日102712月20日136412月21日159512月22日125412月23日1731212月24日11311日期样品数量不合格品数量12月1日120312月2日155412月3日148612月4日150812月5日165612月6日145612月7日158312月8日199412月9日164812月10日133712月11日110912月12日165612月13日1731212月14日196312月15日126712月16日1561012月17日1626Practice不良项目个数不良率累计不良率短路8341.5%41.5%空焊5427.0%68.5%撞件2512.5%81.0%破损126.0%87.0%反向84.0%91.0%其它189.0%100.0%Total200100.0%-1.‘Practice2.某工厂制造一批紫铜管,应用Xbar-R管制图来控制其内径,尺寸单位为m/m,利用数据表之数据(USL=55;SL=50;LSL=45)求得其管制界限并绘图;请判定过程是否稳定?分析制程能力状况?制程是否可用控制用控制图?样组测定值样组测定值X1X2X3X4X5X1X2X3X4X5150504952511453484752512475353455015534849515234645494849164650535153450484949521750524949495464850545018504950495165049525154195249525350747495048522050475053528485046495121524951535095050495153225554515150104951514648235054525049115150494650244751515252125050495251255351515051134949495055下列数据表示某二次电池生产业体焊接后因Leakage所发生的不良品数,并计算了制程能力。样本大小是20.120110119391185831717216162152541454213333122211131不良品数群組不良品数群組通过Minitab分析计数型DATA的二项分布DATA制程能力。PracticePractice下面数据是某PVC地面材料的每单位面积表面所发生的气泡不良数,按照抽样顺序表示,计算了制程能力。120310419293181851737416464151561414213234124201151气泡不良数样本气泡不良数样本通过Minitab分析计数型DATA的泊松分布DATA的制程能力。4.测量系统分析(MSA)---重复性和再现性(GageR&R)---属性测量研究(AttributeAgreementAnalysis)实际制程变异偏倚稳定性线性已观测的制程变异测量系统的变异组内变异组间变异正确度精密度sP2sT2sR&R2sT2=sP2+sR&R2sR&R2=sAV2+sEV2重复性再现性1)制程变异的理解我们所观测制程的变异里包含了实际制程变异和测量系统的变异.假如测量系统的变异比较大时会发生什么样的问题?测量系统验证◎什么是Bias(偏倚)▲Bias=测量值的平均
–基准值(真值)▲%Bias=|Bias|ProcessVariationX100(因製程变異发生的偏倚的百分比)▲%Bias=|Bias|
ToleranceX100(对允许公差的偏倚的百分比)用某个量具对同一个产品测量时所得到的测量值的平均和基准值(真值)之间的差异我们称之为偏倚(Bias)或是不正确度(Inaccuracy),Bias越小时它的正确度会越高.ProcessVariation=6σTolerance=USL-LSL正确度偏差大正确度偏差小LSLUSL测定值真值真值测定值?在Gage的规定的操作范围内比较正确度后进行评价.即,在规定的操作范围内的两个极限区间最少各研讨1次正确度后得到的差值.?Gage通常是在操作范围的下限(或者规格值)比上限它的正确度差.什么是线性(Linearity)?对Gage的操作范围或者Spec范围的正确性.利用Minitab分析测量系统正确度(Accuracy)的分析一名评价者反复10次测量了同一个部品:得到10个测量值.●基准值:0.8,部品的制程变异是0.7.Ho:Bias=0Ha:Bias≠0One-SampleT:xTestofmu=0.8vsmunot=0.8VariableNMeanStDevSEMean95.0%CITPx100.75000.04710.0149(0.7163,0.7837)-3.350.008▲Bias=0.75–0.8=-0.05▲%Bias=|Bias|ProcessVariationX100|-0.05|0.70X100==7.1%P-value=0.008,所以可以认为正确度有问题.Stat>BasicStatistics>1-Samplet?线性(Linearity)比较良好的情况在测量范围全领域基准值和测量平均值一致/没有偏倚正确地测量.在测量范围全领域具有常数倍数的偏倚./虽有偏倚但是因为大小一定所以可以容易调整.基准值基准值测量平均偏倚偏倚测量平均基准值基准值线性(Linearity)的分析①线性不好的情况–测量范围全领域偏倚(正确度)不一定的情况?无法矫正.偏倚基准值偏倚基准值②线性(Linearity)和偏倚(Bias)判定基准③线性(Linearity)差时需要考虑的事项:调查量具测量范围中上部或下部的刻度是否合适检验基准值是否正确检验测量位置是否正确检验测量者是否正确的使用了仪器检验量具磨损与否检验量具校准与否调查量具本身内部设计问题※电子式的话在测量全范围进行再校准.※机械式的话在测量范围中以经常使用的范围为中心进行校准后不允许在其它范围使用.④利用Minitab分析线性测量系统的操作范围内抽样5个部品进行精密的测试之后计算,要反复12次?实行结果?结果解释?Minitab使用方法(Stat?QualityTools?GageLinearityStudy)StdDevStudyVar%StudyVarSource(SD)(6*SD)(%SV)TotalGageR&R0.238941.23058.67Repeatability0.238941.23058.67Part-to-Part2.7457614.140799.62TotalVariation2.7561314.1941100.00Linearity是总制程变异量的13.167%,因此线性是比较差,需要改善.Bias是0.4%,良好.▲Linearity=|倾斜度
|xProcessVariation▲%Linearity=LinearityProcessVariationX100在量具的测量范围内评价测量的一贯性,在量具的测量范围内如果Bias一定的话可以说线性较好.为了评价线性必须要计算Bias.*ProcessVariation=6σ=|倾斜度
|x100%Linearity值如果接近‘0’的话可以判定线性比较好.▲回归模型
:y=a+bxy:Biasx:基准值b:倾斜度◎线性的计算公式?计算GageLinearity统计值22Bias(y)=0.7367-0.13167MasterLinearity=0.13167*14.1941=1.86889%Linearity=13.167%(倾斜度)?计算GageBias统计值平均Bias=-0.2667/5=-0.05333%Bias=(|-0.05334|/14.1941)*100=0.4%⑤线性的计算方法指的是随时间经过时,对同样部品的测量结果的变异程度.随时间的经过如果测量结果互不相同的话这时我们可以认为此测量系统的稳定性缺乏.分析稳定性的方法我们通常用连续型管制图(Xbar–R管制图).目前所有的测量值都在管制界限内,因此可以说此仪器是比较稳定的在管制界限外有测量值或者具有特定的周期或者倾向的话不能说此仪器是稳定的.稳定性(Stability)分析实际制程变异偏倚稳定性线性已观测的制程变异测量系统的变异组内变异组间变异正确度精密度sP2sT2sR&R2sT2=sP2+sR&R2sR&R2=sAV2+sEV2再现性再生性1)制程变异的理解我们所观测制程的变异里包含了实际制程变异和测量系统的变异.假如测量系统的变异比较大时会发生什么样的问题?测量系统验证准备事项短期方法长期方法(通常)测量者数2名3名样本数量5个10个测量次数测量者别各1次测量者别各2次或者3次赋予编号以及随机化对各个样本赋予编号,每次测量都要随机排列.确认测量位置及方法把测量位置标识在样本,让所有的测量者都要熟悉同样的测量方法.选择评价方法虽然迅速但是重复性和再现性被混合可以区分重复性和再现性的误差.可以得到有关误差原因的情报.③为了做GageR&R而采集数据的方法步骤1.选定代表制程长期变动的10个样本2.量测仪器的校正3.让第一个作业者对所有样本任意顺序各做一次量测(BlindMeasurement盲测)4.让第二个作业者按同样地方法实施(所有作业者相同)5.以同样的方法按必要的次数重复量测6.得到的DATA输入Minitab并进行分析GageR&R步骤在Minitab下拉式菜单选:Stat>Qualitytools>GageStudy>GageR&RStudy(Crossed),如下图所示:计量数据分析步骤-2在出现的对话框选下图所示信息:上图信息表示用均值-全距法进行系统分析.考虑交互作用不考虑交互作用计量数据分析步骤-3计量型GageR&R?Minitab分析结果Graph解释RChartby作业者ComponentsofVariationXBarChartby作业者“选定的样本是否如实反映工程的散布?”如果这个值均匀,意味样本没能如实反映工程的散布。“作业者之间是否有差异?”作业者之间最好没有差异。作业者与部品的Interaction“每名作业者对样本是否做不同的量测?”每名作业者对样本的量测值一致为好。By部品By作业者作业者计量型GageR&R?Minitab分析结果Graph解释作业者作业者与部品的InteractionBy作业者By部品RChartby作业者“在全体散布中R&R所占的比重是否充分小?”GageR&R,Repeat,Reprod.的高度越接近0越好。“作业者别重复量测值是否稳定?”注意!!!要是超过RChart的界限,就得调查其原因,并重新量测。“辨别相互不同部品的能力是否充分?”与RChart相反,尽量多超过管制界限为好。(50%以上的点)ComponentsofVariationXBarChartby作业者一个人反复3次测试同样的部件的结果值之间有很大的差异..?即,可判断出重复性上有问题.另外,大部分的测量值都靠近平均的附近,所以可以判断出测量系统的区别上有问题.对个别测量值的图表分析?图表分析结果?Minitab使用方法(Stat?QualityTools?GageRunChart?结果的解释1)有效性(E):正确地判断出合格/不合格的能力E=总次数正确判断出的样品数量2)遗漏概率:P(Miss):把不合格品判定为合格品的概率(第2种Error:β危险率)(样品数×反复次数)P(Miss)=不合格样品的总测量次数误判断为合格的次数误判断为合格的次数=不合格品数×反复次数3)误判断概率P(FA);把合格品判定为不合格品的概率(第1种Error:α危险率)误判断为不合格的次数误判断为不合格的次数=合格品的总测量次数合格样品数×反复次数4)偏差(Bias):判断人员区分合格/不合格的尺度B=P(FA)P(Miss)B=1:没有偏差B>1:判定为不合格的机率比较大B<1:判定为合格的机率比较大统计量适合附带条件下可以使用不合格有效性(E)误判断概率:P(FA)遗漏概率:P(Miss)0.90~1.00.0~0.050.0~0.020.80~0.900.05~0.100.02~0.050.80以下0.10以上0.05以上属性测量研究Ex)为了分析以Go/No-GoGage判定合格/不合格的系数型测试系统选了15EA样品(合格品8个,不合格品7个)之后由3名测试人员反复测了3次后得到了如下的Data.属性测量研究点:对比率的点推定值线:信赖区间的宽度*Graph
解释Practice1.设计室结构设计TEAM想改善CDT与前框的缝隙,测量前为了确认测量system的可信度。实施了GageR&R。对Sample10个两个人2次反复测量.Spec=2.0+/-0.21)%StudyVar和%Tolerance各是多少?2)判断该测量system是否可以采用?3)先改善的部分是反复性还是再现性?理由是什么?5.基本统计(BasicStatistics)---显示描述统计(displaydescriptivestatistic)---单样本Z(1SampleZ)计量样本数>30S已知---单样本T(1SampleT)计量样本数<30S未知---双样本T(1SampleZ)计量---1比率测试(1Proportion)计数---2比率测试(1Proportion)计数---相关分析(Correlation)---正态分布(NormalityTest)单样本比例检定:问题: 某PC生产厂的品质保证部门希望估计其特定PC在购买后六个月内需要回修的比例。该部门最关心的是本厂品牌的PC需要回修的量是否和现在市场上其它所有品牌需要回修的量不同。已经知道这种PC的总回修率为4.5%。程序: 对特定时间段内购买该厂特定PC的消费者进行调查,询问其PC在购买后的六个月内是否需要回修。在被调查的1860人中,有106人回答“是”。实验单位: 在特定时间段内从该厂购买的特定PC。量测标准: 在购买后的六个月内PC是否需要回修。(是或否)数据档案: 没有范例1:PC的回修比例单样本比例检定:该厂生产的所有该机种PC需要回修的真正比例不太可能一定恰好是106/1860=0.057了解我们的估计有多精确是很有帮助的。因此,样本统计量经常以信赖区间的形式出现:估计的误差范围另外,我们知道从样本得出的0.057的回修率确实不同于总的回修率0.045。然而,样本比例是否差得太大,以致得出的结论说样本来自一个回修率
不同于0.045的母体?要回答这样的问题,我们就要进行假设检定:1.Stat?BasicStatistics?1Proportion2.选择SummarizedData3.检验数:18604.成功数:1065.点击Options6.填写Options对话框,其中检定比例填入0.045,并在Alternative项选
notequal。单样本比例:对目标值做比例检定单样本比例检定首先我们注意一下95%的信赖区间。该信赖区间的中心为该品牌PC机回修率的样本估计值(0.057)。如果我们从同一母体中再取一个样本,将得到不同的回修率估计值。如果我们从同一母体中又取了许多样本,根据每个样本的回修率,可以得到各个样本的95%的信赖区间,则这些信赖区间将有95%的机率包含该品牌特定PC的实际回修率。单样本比例
解释信赖区间(CI)TestandCIforOneProportionTestofp=0.045vspnot=0.045ExactSampleXNSamplep95.0%CIP-Value110618600.056989(0.046891,0.068511)0.019单样本比例检定现在,让我们看一看假设检定的输出部分。我们关心的是,决定是否有证据证明我们的样本来自一个回修率不同于0.045的母体。首先,我们必须提出虚无假设和对立假设:在我们的例子中,虚无假设是该品牌的特定PC回修率和所有市面上这种PC的回修率相同。换句话说,我们的样本是从回修率p=0.045的母体中提取的。对立假设是该品牌的这种PC回修率和所有这种PC的回修率不同。该样本是从一个回修率不同于0.045的母体中提取的(因此,p10.045)虚无假设(H0):没有明显变化。假定它是正确的,除非证明有异。你永远不能证明它是正确的,你只是不能拒绝它。对立假设(Ha):我们正在试图说明的是正确的陈述。它通常定义希望的变化方向。对立假设可以是>、<或?。你收集数据,出示证据证明该变化确实发生了。单样本比例
结果解释TestandCIforOneProportionTestofp=0.045vspnot=0.045ExactSampleXNSamplep95.0%CIP-Value110618600.056989(0.046891,0.068511)0.019单样本比例检定我们可以拒绝虚无假设或不拒绝虚无假设。要决定是否应拒绝虚无假设,如果确实是从回修率为0.045的母体中抽取的样本,我们就应可以找到或观察到样本回修率达到0.057高的机率。该机率称为p值。MINITAB列出例题中的p值=0.05。由于0.019<0.05,在?=0.05显著性水准下,我们将拒绝H0(即p=0.057)。这样,我们有足够的证据相信由该厂生产的特定PC回修率不同于全部制造商的回修率。本例中,我们对母体的比例进行推论。用同样的方法,可以推论母体的平均数或变异数。统计显著:如果p值和规定的?一样或比它还小,我们即称该数据在该显著性水准上为
统计显著。显著性水准(?):虚无假设实际为真时拒绝虚无假设的机率。显著性水准一般是在进行
假设检定前规定。一般常将?设为0.05。判定准则:如果p值<?,我们拒绝虚无假设,选择对立假设。单样本比例
结果解释(续)双样本比例检定进行两个比例检定: 用双样本比例检定进行两个比例间是否有差异的假设检定。 H0:P1=P2 Ha:P11P2?????? 式中P1和P2分别是母体1和母体2的成功(统计定义)比例。例: 假定我们在购买新的计算机过程中,想决定是否品牌B的缺点比品牌A少。我们将计算机在相同条件下使用一定时间后收集数据列在下表,决定品牌B的缺点是否比品牌A少。双样本比例品牌A品牌B好122141坏107双样本比例检定Stat>BasicStatistics>2Proportions将数据键入 这是总结后的数据。在品牌A观察总数是122,品牌B为141。 尽管Minitab要求的是成功次数,但我们关心的是失败次数,我们将键入这些数据。因此我们分别键入122和10、141和7。 接下来点击Options,确认你是否正在对>、<或1进行检定。键入?值。结果显示如下:注:双样本比例检定将和1个自由度的关联?2检定提供的答案相同。双样本比例*TestandCIforTwoProportionsSampleXNSamplep1101220.0819672 71410.049645Estimateforp(1)-p(2):0.032321895%CIforp(1)-p(2):(-0.0281330,0.0927767)Testforp(1)-p(2)=0(vsnot=0):Z=1.05P-Value=0.295这意味着什么?双样本比例检定-作业1一项对2000个美国人进行的调查显示,62%的人对现在的婚姻满意。注意62%是样本统计量,它估计的是对其婚姻满意的美国人的实际百分比。一些相关问题:我们对62%的估计有多大信心?有没有证据证明对其婚姻满意的美国人的实际百分比不同于62%?t检定主题:利用Minitab学习分析一个样本平均数和目标值间是否存在显著差异的方法。分析两个样本平均数间是否存在显著差异的方法。决定两个或多个样本的变异数是否存在显著差异的方法。将研究图形、信赖区间和假设检定的使用,以分析一个样本或两个样本的平均数差异。另外对两个或多个样本的变异数中可能差异的分析方法也要进行考虑。必备知识: 数据处理和图形分析,推论统计概论为下面的内容作准备:回归、变异数分析、FactorialDOE及RSM比较两个估计值—集中或分散单样本、双样本t检定程序和变异数齐一性检定程序均应用于连续性的非独立变量(反应)和分类性的独立变量(因素),Minitab中的t检定类别与步骤如下: Stat?BasicStatistics?1-Samplet用于将单样本平均数与目标或历史平均数比较。 Stat?BasicStatistics?Pairedt用以配对找出过大变异。在每列数据与另一列数据成对时使用。 Stat?BasicStatistics?2-Samplet可以对堆栈在单个栏中的独立样本数据进行该检定,辅助的分类变量在另一栏。也可以对分列在两个栏中的数据进行t检定。在双样本t检定中,两个样本是独立的。和成对t检定不同,每组中的数值次序对检定结果不会有差别。MINITAB中的t检定和变异数检定功能概述–t检定Stat?ANOVA?TestforEqualVariances检定变异数相等的假设。只有两个样本时进行F检定;检定时假定数据是常态分配。Bartlett检定和F检定等效,但当样本数大于2时其效果更好;该检定假设数据是常态分配。Levene检定用于两个或多个样本的情况;该检定假定数据是连续的,但不一定符合常态分配。MINITAB中的t检定和变异数检定功能Minitab中的变异数齐一性检定步骤如下:t检定-单样本问题: 乳泉公司怀疑他的一个牛奶供货商为了增加利润在牛奶中加水。牛奶的结冰温度符合常态分配,平均数mu=-0.6°C。牛奶加水会使其结冰温度上升。乳泉想知道自己的怀疑是否正确。供货商往牛奶中加水了吗?程序: 从供货商提供的每十罐卡车中抽一罐卡车作为样本.实验单位: 每次供货中的一瓶牛奶量测: 样本的结冰温度数据档案: Milk.mtw范例1:乳泉公司t检定-单样本虚无假设是样本结冰温度的平均数为没加水的牛奶结冰温度平均数(-0.6°C),
也即目标值。对立假设是我们想证明的怀疑,也即样本结冰温度的平均数不等于--0.6°C。在该情况下,我们试图找到证据,以证明供货商样本的结冰温度平均数比没加水的牛奶结冰温度平均数高得多。1.打开档案Milk.mtwStat?BasicStatistics?1-Samplet对话框中的testmean(检定平均数)是目标值。Alternative(对立平均数)从下拉菜单中选择。选择项为equalto(相等)、greaterthan(大于)或lessthan(小于)。结果如下页。将单样本和目标值比较t检定-单样本t检定的输出首先列出你的虚无假设和对立假设。你应该先检查这些项目以决定陈述是否正确。结果中列出了样本大小以及平均数、标准差和平均标准误。从输出看,P值为0.017.由于P值小于0.05,我们将拒绝虚无假设,而选择对立假设。该供货商的牛奶结冰温度明显高于-0.6°C。我们有了该供货商确实往牛奶中加水的证据。什么是T值?这一例子中的T值或检定统计量实际上是:(平均数-目标值)/平均值的标准误经常将T值和临界值比较。T值越大,p值越小。本例中为单边检定(大于),?=0.5,自由度=10,其临界t=1.83,而T=2.45大出临界t=1.83甚多。解释结果One-SampleT:TempTestofmu=-0.6vsmu>-0.6VariableNMeanStDevSEMeanTemp11-0.594220.007820.00236Variable95.0%LowerBoundTPTemp-0.598492.450.017独立双样本t-检定问题: 笔记型计算机使用的塑料有两种。塑料的断裂强度很重要。每个供货商告诉你塑料强度的标准差为1.0psi。目前的供货商是A,和公司有良好的合作关系。供货商B有一个产品,并称该产品性能高于供货商A的产品。公司的观点是,断裂强度在实际差别上应必须比现在的强度高上1Kg/cm2。是否值得把供货商换为B呢?程序: 从两个供货商提供的塑料中进行随机抽样,然后量测断裂强度。因素水准: 供货商(A和B)实验单位: 相同厚度的塑料样本量测: 断裂强度(Kg/cm2)数据档案: t-2samples.mtw例2:笔记型计算机的塑料断裂强度独立双样本t-检定虚无假设是供货商B与供货商A的塑料样本的断裂强度平均数相等。对立假设是我们想证明的怀疑,也即供货商B比供货商A的塑料样本的断裂强度平均数高,
且高于1.0Kg/cm2。在该情况下,我们试图找到证据,以证明在统计上供货商B比供货商A的塑料样本的断裂强度平均数高,且高于1.0Kg/cm2。1.打开档案t-2samples.mtw
2.Stat?BasicStatistics?2-samplet3.点击Graphs
4.可选择Boxplots/Dotplots进行独立双样本t-检定检定独立双样本t-检定从右图看出供货商B比供货商A的塑料强度高得多。两个供货商的差异显示在上图输出对话窗口的信赖区间中。我们应该换成供货商A吗?95%信赖区间显示真正的差异处应不小于0.63。它不是1.0,p=1.0,所以我们应该不予考虑吗?或者我们不仅应考虑供货商之间的差别,而且还要考虑供货商内部的差别。我们可以用变异数齐一性检定来检定两个供货商样本变异数中的差异。解释结果Two-sampleTforSuppBvsSuppANMeanStDevSEMeanSuppB914.78820.05490.018SuppA1014.09320.09300.029Difference=muSuppB-muSuppAEstimatefordifference:0.695095%lowerboundfordifference:0.6340T-Testofdifference=1(vs>):T-Value=-8.80P-Value=1.000DF=14成对t-检定问题: 消费者小组希望决定现在DIY市场上流行的两款PC在由消费者组装时的难易是否存在差异。为此,记录指定的人员将每款PC组装好所花费的时间。程序: 每个组装人员按随机顺序组装两款PC,记录每个人两次组装所花的时间。因素水准: PC(A和B)实验单位: 人员组装PC量测: 组装花费时间(用分表示)数据档案: t-paired.mtw两款PC的绉装难易有差别吗?注意在本例中,数据是成对的。我们希望进行假设检定,看一看第一款PC组装所花费的时间是否和第二款PC组装所花费的时间不同。例3:PC的组装成对t检定1.Stat?BasicStatistics?Pairedt2.第一个样本:PC_A3.第二个样本:PC_B4.点击Graphs5.选择Histogram你的结论是什么?PairedTforPCB-PCANMeanStDevSEMeanPCB2241.738.691.85PCA2239.508.431.80Difference222.2274.5450.96995%CIformeandifference:(0.212,4.243)T-Testofmeandifference=0(vsnot=0):T-Value=2.30P-Value=0.032蓝点(Ho)显示你所有要比较样本数据的目标值(这时为0,也就是没有差异)。围绕两个数据栏的平均差异的红线是信赖区间。如果样本平均数和目标平均数没有差异,我们预期蓝点会处在信赖区间界限内。现在有充分的证据拒绝虚无假设,并得出结论两款PC组装所花费的时间是有差异(95%CI)。解释输出t-检定、F-检定和随机抽样最后的几点补充成对样本和独立样本成对样本和独立样本可能难以判断。但区分开来很重要,因为每种情况适用不同的统计步骤。成对样本:通常出现在同一标的物中例:同一PC上使用两种牌子的CPU的性能表现情况,时间等因素要适当控制。独立样本:要求是独立随机样本例:测定两种牌子的CPU的性能表现,PCA上用的是一个牌子,PCB上用的是另一个牌子。等变异数和不等变异数在进行双样本t检定时,MINITAB默认值并不假定变异数相等.一般如果错误地假定为变异数齐一性,在估计和检定平均数差异时,你可能被严重地误导。当实际上变异数相等时,如果假定为变异数不等,则我们得到的是一个有些保守的方式,但估计时几乎不损失精度。随机抽样一般进行t检定时,我们假定从常态分配母体中进行随机抽样得到数据。即使分配不是常态的,只要样本是“随机”的,t分配也会给出非常理想的近似值。和非常态分配数据相比,如果得到的是非随机样本,则有较大的顾虑。t检定本课中,为查明一个或两个样本平均数或变异数的差异,我们研究了假设检定、信赖区间和有关图形的使用。单样本t检定目的: 分析单个样本平均数与目标值或历史平均数之间的差异。主要特点: 在只有一个样本并要得出关于样本平均数的结论时使用。双样本t检定目的: 分析两个独立样本平均数之间的差异。主要特点: 当两个样本独立时使用。 可以是等变异数或不等变异数。 数据可在带分组变数的单个栏内,或在两个不同的栏内。成对t检定目的: 分析两个相关样本平均数之间的差异。主要特点: 使用成对数据(常指对同一主体或检验项目的两个量测项)。 观察值的顺序是重要的,每个观察值必须和其相配项在同一列。变异数齐一性检定目的: 分析两个或多个独立样本变异数的差异。主要特点: 经常用以考察许多统计程序要求的等变异数假设是否符合。 数据必须位于单个栏内,分组变量在另一个栏内。可以用于常态数 据(Bartlett检定、F检定)或非常态数据(Levene检定)。总结练习1在制造某种轴孔的过程中,你需要决定过程是否对准目标值。如果轴孔直径平均数为45mm,说明该过程对准目标。你收集了12个轴孔样本,并量测了它们的直径如Journal.mtw。根据这一数据: 1. 该过程生产的轴孔其平均直径是所要的吗?在本周的最后我们将再次讨论以下两个问题: 2. 对于样本大小12和数据中的标准差,检测到和目标值具有0.05mm的实际偏差
的机率是多少? 3. 如果希望获得0.85的检定力(Power),最小的样本大小应为多少?换句话说,要使
检测有85%的成功机会,和目标偏差0.5mm,我们到底需要进行多少次直径量测?练习1:轴孔直径练习2乳泉公司怀疑他的一个牛奶供货商为了增加利润在牛奶中加水。牛奶的结冰温度符合常态分配,平均数=-0.6°C。牛奶加水会使其结冰温度上升。乳泉想知道自己的怀疑是否正确。供货商往牛奶中加水了吗?该例子中,我们用单边对立假设的假设检定解决了这一问题。如果我们用95%的信赖区间处理这一问题,会出现什么?结果会有差异吗?为什么:数据档案是Milk.mtw练习2:乳泉公司练习3你正在考虑购买两种不同的游标卡尺来量测轴径。你想比较两个牌子的游标卡尺以决定它们是否会得到相同的轴径平均量测值。你让10个作业员用这两个游标卡尺量测同一个滚珠轴径。每人一次给一个游标卡尺。记录者清楚的追踪使用的游标卡尺和对应的轴径的量测值。数据保存在Caliper.mtw中。根据这一数据: 1. 两个游标卡尺量测的轴径有差别吗?在讲授过检定力和样本大小一课后,我们将再讨论这一问题: 2. 根据样本大小和标准差,检测出0.5mm平均数有差异的检定力是多少? 3.检测出0.1mm平均数有差异的检定力是多少?练习3:游标卡尺量测轴径装配厂认为供货商送来的轴径高出要求的平均数,从而增加了装配上的困难。他们量测了一个10个轴的样本进行检定。轴的外径量测值(mm)是:45.244.545.446.346.546.745.246.546.645.9轴的外径应为45mm。装配厂的抱怨有理吗?作业1装配厂认为供货商送来的轴径高出要求的平均数,从而增加了装配上的困难。他们量测了一个10个轴的样本进行检定。轴的外径量测值(mm)是:45.244.545.446.346.546.745.246.546.645.9他们把这一含10个轴的样本送回供货商量测,轴的外径量测值(mm)是:45.545.145.446.646.946.546.146.747.146.4两者的量测结果一致吗?假定轴外径的量测顺序相同,因此61.3和62.1都是1号轴的量测值,依次类推。作业2供货商的顾客服务代表决定叫工厂来决定轴径是否符合现在的轴径要求。他向品质经理要现生产产品的两组轴径量测数据。品质部门送给他的数据如下:第9组45.344.745.644.345.4
44.544.245.044.645.1第10组45.344.745.445.045.6
45.245.545.445.445.0就平均而言,这两个组生产的轴径相同吗?
作业3基础统计例题1:求基础统计量开发新的饮食方法的公司为了知道它的效果,把7名主妇为对象做了实验。实验结果他们的体重变化如右侧的值。用什么样的方法了解她们的体重变化。BeforeAfter58.5 60.060.3 54.961.7 58.169.0 62.164.0 58.562.6 59.956.7 54.4Stat/basicstatistics/displaydescriptivestatistics概论相关系数相关和因果关系(Causality)散布图适配线图(FittedLinePlot)简单回归Stat?Regression?Regression能进行简单或多元回归能储存许多计算值Stat?Regression?Fittedlineplot散布图、适配线、方程式和R-squaredStat?Regression?Residualsplots需要在回归或适配线图中储存残差检查数据的基本假设 简单回归虽然相关告诉我们两个变量线性相关的程度,回归(Regression)则可以更精确地定义这种相关。回归的结果提供了一个方程式,用一个(或多个)变量来帮助解释另一个变量的变化。实例叫出YFTC.mtw,选择一个输入并用它预测合格率。本例要在流量和合格率之间进行回归。进入Stat?regression?regression并完成对话窗口。RegressionAnalysis:YieldversusFlow
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 保安班长述职报告范文(7篇)
- 中班第一学期个人计划范文
- 护理服务心得体会
- 中学秋季开学典礼校长致辞(13篇)
- 以感恩为题演讲稿合集7篇
- 洋葱幼儿课件教学课件
- 搜索命令大全
- 实习员工劳动合同-文书模板
- 影响居民健康主要危险因素评估
- 大班诚信课件教学课件
- 广东省垦造水田项目
- 分式方程的解法教学设计与反思(优秀范文5篇)
- C-TPAP体系管理手册
- 大学二级学院(系)财务管理办法(试行)模版
- 新浙教版九年级上册初中数学 4.2 由平行线截得的比例线段 教学课件
- 中国联通通信网络运行维护规程-固定网络设备分册-传输详细
- 《CAXA电子图版》教学设计大纲
- 土木工程专业职业生涯规划(PPT)
- 犬神经障碍性疾病的针灸诊疗
- 一对一谈心谈话记录3篇精选
- 男女有别亲密有间
评论
0/150
提交评论