




已阅读5页,还剩97页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一章Minitab概要第二章管理数据第三章操作和计算数据第四章使用数据分析和质量工具第五章基本操作示例第六章做一个简单分析第七章高级Minitab第八章质量管理和改善第九章实验设计,目录,前言,MINITAB是为质量改善、教育和研究应用领域提供统计软件和服务的先导。是一个很好的质量管理和质量设计的工具软件,更是持续质量改进的良好工具软件。MINITAB统计软件为质量改善和概率应用提供准确和易用的工具。MINITAB被许多世界一流的公司所采用,包括通用电器、福特汽车、通用汽车、3M、霍尼韦尔、LG、东芝、诺基亚、以及SixSigma顾问公司。作为统计学入门教育方面技术领先的软件包,MINITAB也被4,000多所高等院校所采用。MINITAB总部位于StateCollege,PA,USA(美国),在英国和法国设有办事处,在世界各地拥有分销商。MINITAB包括:基础和高级统计回归和方差分析时间序列演示质量的图表模拟和分布灵活的数据导入、导出和操纵SPC(StatisticalProcessControl-统计过程控制)DOE(DesignofExperiments-试验设计)可靠性分析多变量分析样本量和幂计算强大的宏语言MINITAB系统要求运行Windows(r)95/98或者WindowsNT(tm)4,需要16MB内存。处理器为486或以上的个人计算机;如使用486处理器,特别建议采用数学协处理器。完全安装需要35MB的硬盘空间VGA或SVGA显示器,建议最小分辨率为800X600。需要CD-ROM驱动器某些功能需要使用鼠标本教材是为了配合我们LG曙光电子SixSigma活动而编写的,主要着重于对MINITAB软件包的基本操作和运用,没有深入该软件的介绍和运用,更没有跟随新版软件的升级更新。这些需要使用者自己深入钻研。,1-1Minitab系统操作环境简介1-2Minitab的工作步骤1-3关于Minitab的Project文件类型,第一章Minitab概要,Minitab系统操作环境简介,在MINITAB里进行数据分析时,需要使用各种窗口和工具。下面是MINITAB环境下各部分的简介。,各MINITAB窗口作用:会话窗口(Sessionwindow)显示诸如统计报表之类的输出文本。数据窗口(Datawindows)在此可以输入、修改数据和查看每个工作表的数据列。信息窗口(Infowindow)概括了每个打开的工作表。可以从下拉列表框中选择要查看的工作表。历史窗口(Historywindow)记录了所用过的命令。图形窗口(Graphwindows)显示各种图形。一次最多只能打开15个图形窗口。,Minitab的工作步骤,章节标题主要内容2数据管理在数据窗口中输入和修改数据,从文件中导入数据或将数据以文件形式保存,生成规则数据。3操作和计算数据在数据窗口中对数据列进行操作,排序、分组和生成方程式。4运用数据分析从基本的统计到质量管理,运用一系列的分析和质量工具方式。5图形数据生成、修改图形,同时打印并且用各种格式保存图形。6管理会话窗,查看输出文本,并且改变输出文本格式,打印生成报告和用各种格式保存。,进行一个典型的分析往往要经过很多步骤。以下六章讲的就是与此相关的基本分析步骤。每章节主要讲了那一步的一些基本、常见的分析内容。以下是各章节的列表及内容简述。,打开、保存、关闭PROJECT文件,打开一个新的project文件,选择FileNew,按MinitabProject,再按OK.打开一个已有的project文件,选择FileOpenProject.打开一个已有的projectworksheet,选择FileOpenWorksheet.保存一个project文件,选择FileSaveProject关闭一个project文件,你必须打开一个新的project文件,或一个已有的project文件,或者退出。一个MINITABProject文件包含了所有的工作:收集的数据、输出的文本、图形等。当保存一个project文件时,所有的东西都保存下来了。但是一次只能打开一个project文件。Project文件里的各种工作表(data、work-sheet、graph等)可以单独进行处理-可以生成数据、图形,也可以从别的文件中通过拷贝的形式向一个project文件添加数据和图形。Project文件里的大部分窗口的内容都能够单独保存和打印。也可以忽略某些工作表或图形,这样的话,这些工作表和图形便不会保存到project文件中去。每当保存一个project文件时,保存了以下一些内容:一.所有窗口的内容,其中包括:1.每个数据窗口(Datawindow)的数据列。2信息窗口(Infowindow)中的常量、矩阵。3会话窗口(Sessionwindow)和历史窗口(Historywindow)中的所有的文本。4.每个图形窗口(Graphwindow)。二.通过命令FileProjectDescription生成的project文件注解。三.通过命令EditorWorksheetDescriptions生成的对每个工作表的注解。四.每个窗口的大小、位置和状态。,Minitab的工作步骤,在对话框中输入变量MINITAB的对话框和其他软件的对话框没什么两样。其最大的特点就是变量列表框,出现在很多对话框中。变量列表框一般显示的是一些变量列名、常量或矩阵。凡是在能够输入变量的文本框中,均可以输入这些列表框中所显示的。变量列表框的优点是可以准确无误的选择变量名(一般指数据列名)。,变量列表框中的内容即当前工作表的列、矩阵,变量文本框只容纳列。当光标停于其中时,左边的变量列表框仅显示数据表中的各列,Minitab的工作步骤,在对话框中选择变量的几种方法用鼠标选择一个变量1.点击需要填写变量的文本框。2在变量列表框中用鼠标选择一个变量,然后双击此变量。用鼠标选择多个变量1点击需要填写变量的文本框。2点击变量列表框。3点击某个变量,用鼠标拖画数个变量,或者按住Ctrl键点击不连续变量。4点击Select按钮。用键盘选择一个变量1按Tab键进入需要填写变量的文本框。2按F2键,使得变量列表框被激活。3使用上下箭头键,选择变量。4.再按F2键,将所选择的变量便出现在刚才被激活的文本框中了。,2-1数据管理概要2-2在数据窗口中输入数据2-3生成规则数据,第二章数据管理(ManagingData),数据管理概要,1.数据保存在工作表中在MINITAB里,与特定的数据集有关的所有数据都包含在工作表中。一个project文件允许有许多工作表(工作表的个数取决于计算机的内存大小)。一个工作表可以包含三种数据类型-数值型(numeric)、文本型(text)和日期/时间(date/time)型,表现形式为:数据列(columns)、常量(constant)、矩阵(matrices)。可以在多个窗口中察看数据,但大多时候都是在数据窗口中处理数据列。,2.数据的三种类型:数值型(numeric)、文本型(text)、日期/时间型(date/time)数值型数据由数字构成,如:1,2,3,5。文本型数据由以下几种构成:字母、数字、空格和特殊字母如“Testnumber4”日期/时间型数据可以是日期(如Jan-1-2000或者3/13/1999),时间(例如:09:30:22AM),也可以是二者均有(如:5/13/200009:30:25AM).MINITAB将日期和时间以数字的形式存储,但是可以选择任意一种格式来显示。,3.与数据有关的三个窗口A.数据窗口(Datawindow)数据窗口中的内容即为工作表中的数据列。当打开了多个工作表时,每个工作表都有其自己的数据窗口。,数据管理概要,注意:数据窗口不是电子表格尽管数据窗口有行和列,但它不像EXCEL那样的电子表格,它的单元格数量是有限的。而且单元格中的数值只能手工输入或者有命令生成,它不能包含有方程式,它的值不会随其他单元格的值变化而变化。例如:想要C3=C1+C2,首先必须用计算器计算C1+C2的值。如果改变C1的值,若不用计算器再计算的话,C3的值是不会改变的。换而言之,C3不随C1变而变。,在每个数据窗口里,可以:察看处于工作表中的各列数据。输入数值并以多种方式修改。对数据列进行多种操作,包括:改变格式、字体、名字、宽度、注解和列的位置。例:打开FileOpenWorksheetDataMARKETD.MTW,列号,列名,字母T表明是文本列,字母D表明是日期/时间列,行号,数据管理概要,此窗口对当前活动工作表的数据(数据列、常量、矩阵)进行了概括。可以对这些数据进行修改。,B.信息窗口(Infowindow),C.会话窗口(Sessionwindow),打开FileOpenWorksheetDataACID.MTW。选择菜单:DataDisplayData,在Columns,constants,andmatricestodisplay框中选入Acid1Acid2。点击OK。选择WindowSession便能看见会话窗口中的如下内容:DataDisplayRowAcid1Acid210.1230.10920.1090.11130.1100.11040.1090.11050.1120.105,如果是文本列,标志为T,日期列标志为D,其余列为数值型的列,如果要察看另外一个工作表的情况,可以从下拉列表框中选择一个工作表。,在数据窗口中输入数据,在数据窗口中的一个单元格中输入数据,只要点击一下此单元格,然后输入数据,再回车。,输入数据时,该列的数据会自动格式化。当往一空列输入数据时,Minitab会给该列分配一种数据类型:数值型、文本型或者日期/时间型。如果此数据类型不是数值型,Minitab也会在列号后面添加一个标识符加以区分:D表示日期/时间型数据,T表示文本型数据。,每一列单元格一般表示一个变量,在数据窗口中输入数据,一、在一行、一列或者一块单元格中输入数据,1)输入一列数据a.点击数据方向箭头使之朝下b.输入数据,然后按Tab或者Enter键移动当前活动单元格。按Ctrl+Enter组合键,当前活动单元格便跳到了下一列的顶部。,注意:输入完一个值回车之后,当前活动单元格往下移动一格。,数据方向箭头,2)输入一行数据a.点击数据方向箭头使之朝右b.输入数据,然后按Tab或者Enter键移动当前活动单元格。按Ctrl+Enter组合键,当前活动单元格便跳到了下一行的顶部。,注意:输入完一个值回车之后,当前活动单元格往右移动一格。,数据方向箭头,在数据窗口中输入数据,3).输入一块数据a.选择一块区域,使之高亮度显示。b.输入数据,当前活动单元格仅仅在所选区域内移动。c.如果要取消所选区域,可以按箭头键或者用鼠标点击数据窗口的任何地方。,二、生成规则数据,可以按照一定的规则生成数据,如:按顺序生成一简单数据集或按字母顺序生成一列数据。也可以生成规则的日期/时间型数据。最常见的就是在一列中按照一定的顺序生成数据。如:从1到100的所有整数,或者介于1到50之间的所有偶数。尤其是这一列中的每个数可以重复,或者整个队列的数据也可以重复。在变量设计分析中,当输入因子水平时,将数据或序列反复多次是非常有用和简便的。,在数据窗口中输入数据,1).生成简单的数字集1.选择菜单:CalcMakePatternedDataSimpleSetofNumbers.,2.在Storepatterneddatain的文本框中,输入数据列名(此列既可以是新的列,也可以是已经存在的列),此列用来保存所生成的数据。3.在Fromfirstvalue(起始值),Tolastvalue(最终值)和Instepsof(步长,即增量)文本框中输入数字。4.若有必要,也可以在Listeachvalue(每个值显示的次数)和Listthewholesequence(显示整个编列的次数)文本框中输入一个数字。,2).生成规则数据的几个例子,结果,从1到100的所有整数,Fromfirstvalue,Tolastvalue,Instepsof,Listeachvalue,Listthewholesequence,1,100,1,1,1,从10到1的所有偶数,10,1,2,1,1,1,-0.5,-0.4,-0.3,-0.2,-0.1,-0.5,-0.1,0.1,1,11111222223333344444,1,4,1,5,1,11223344551122334455,1,5,1,2,2,3-1改变列的数据类型和格式3-2归类数据并生成相应的子工作表3-3叠加列3-4对数据进行替换3-3使用计算器,第三章操作和计算数据,改变列的数据类型和格式,进行分析之前,有时需要重新组织和安排输入到MINITAB里的数据,如:移动或者删除行和列,将一种数据类型转换成另一种数据类型,或者控制数据窗口中数据的显示方式。还可以基于原始变量之上再创建新的变量。可以合并两列,创建列的子列。一、改变列的数据类型和格式数据有三种类型:数值型、文本型、日期/时间型。一列只能包含一种类型的数据。可以给某一空列分配一种数据类型并且改变某一存在列的数据类型。一旦某一列已经有了一种数据类型的话,还可以为这列指定一种显示格式。当对此列的格式进行修改时,仅仅是改变了它的显示形式而已,并没有改变其真实值。例如:某一单元格有一个数:1.234567。如果你将其现实形式改成为只显示两位小数,数据窗口中的单元格会显示1.23,在图形窗口上那一点的显示也会为1.23,但是所有的计算都仍会使用1.234567,会话窗口的显示形式则由其所使用的分析命令语句决定,而不是数据窗口中的那种显示格式。1).改变列的数据类型给一空列分配一种数据类型A.选择EditorFormatColumnB.选择Numeric,Text,或Data/Time改变一非空列的数据类型A.选择ManipChangeDataTypeB.选择要转换的数据类型.C.填完对话框,然后点击OK.,改变列的数据类型和格式,2).改变数值型和日期/时间型的格式改变数值列中数据的小数位数A.选择一列或多列。这些列必须是空列(无格式)或者以数值型格式存在。B.选择EditorFormatColumnNumericC.选择Fixeddecimalwidth.在decimalplaces文本框中,输入小数的位数,然后点击OK.改变日期/时间列的数据显示形式单个的日期/时间数值可以是日期,时间或者二者兼有。入下列数据是有效的格式:1/1/96,3:04PM,5/23/20005:30PMA.选择一列或者多列。这些列必须是空列(无格式)或者以日期/时间型格式存在。B.选择EditorFormatColumnDate/time.C.从Date/TimeColumnFormat文本框中,选择一种格式,然后点击OK.,归类并且生成相应的子工作表,二、将数据按不同类别归类并且生成相应的子工作表在一个比较大的数据集里面,经常需要对一组数据进行分析或生成图形。如:在某项调查中对女性聚焦,或聚焦于某一季度的销售额。对这些你感兴趣的数据,MINITAB能够另外生成一个子工作表来包含这些数据。可以基于某种条件来分类,或者对于指定的变量的所有组,分割一个工作表。1).按条件分类例:打开FileOpenWorksheetDataMARKET.MTW。可以基于一个或多个条件对数据分类。如:按两种条件创建一个子集季度销售额大于100并且季度广告费用小于15。符合这两个条件的数据行将复到一个新的工作表,原来的工作表仍然没有变动。按条件分类A.选择ManipSubsetWorksheet,Minitab自动为新工作表给一个缺省名,但是可以随意改动。,按Condition,归类并且生成相应的子工作表,B.在Specifywhichrowstoinclude/exclude(指定哪行包括或者不包括)下面,选择Rowsthatmatch(匹配的行),然后点击Condition(条件),弹出一对话框,如图:C.在Condition一栏,输入条件方程式。例如:想要创建只包含销售额大于100的子集,只要输入Sales100。,在此,可以根据条件,选择一系列数学函数,注意:如果在Subset主对话框选择了excluderows的话,上面的方程式所生成的子集包含的数据将会是销售额不大于100的数据。,归类并且生成相应的子工作表,2).将一个变量按组分割成工作表在一个变量里,可以根据所有关键字将一个工作表分割成几组。例如:假设有一个关于销售额的工作表,有两列,sales这一列为一个财政季度所有的收入;Quarter这一列即为季度(1,2,3,4)。如果你是基于变量Quarter来分割工作表,MINITAB会生成四个工作表:第一季度的所有数据,第二季度的所有数据,等等。原来工作表内容不变。将一个变量按组分割成工作表A.选择ManipSplitWorksheet,如果选中了includemissingasaBYlevel,假如在Byvariables文本框中的任意列含有空值,MINITAB会生成另外一个工作表。,B.在Byvariables一栏,输入一列或多列,这些列即为分组条件。然后点击ok.如果选择了多列,对于这些列的每一种组合所得的数据,MINITAB都会为其生成一个新的工作表。例如:假设Year这一列有两个数据:1991,1992;Quarter这一列有四个:1,2,3,4。如果在ByVariables中选择了Year和Quarter,Minitab会生成8个工作表:1991年每个季度一个工作表,1992年每个季度一个工作表。,叠加列,有时候需要将两列合并成一列以便用一条命令对其分析。Minitab能够快速容易的将一列数据叠加于另一列之上。你可以将叠加后的数据用另一列存储而使原来的列保持不便。当叠加列的时候,可以生成一个脚标列标明叠加后的数据是来自于哪一列。脚标还可以用于以后重新分类数据或者生成图形(在图形里数据点因来源于不同的组,显示有所不同)或者将叠加后的数据还原。叠加列A.选择ManipStack/UnstackStack,B.在Stackthefollowingcolumns中,输入想要叠加的列。输入的第一列将会处于第二列之上,第二列叠加在第三列之上。C.在Stockthestackeddatain一栏,输入一新列或者已经存在的列。,输入一新列或者已经存在的列来存储脚标。,对数据进行替换,可以将一个值转换成另外一个值,或者是将一定范围的值转换成另一个值,也可以将一种数值型的数据转换成另一数值型的数据(例如:把1.0到1.9之间的所有数变成1),文本转换成文本,文本转换成数字或者数字转换成文本。把数字型数据编码为文本型数据A.选择ManipCodeNumerictoText,B.在Codedatafromcolumns一栏,输入一列或者多列。C.在Intocolumns,输入一个或者多个新的或已经存在的列。例如:假设没有叫做gender的列,当输入“gender”时,便会创建一个名称为gender的列。D.在位于Originalvalues下方的第一个文本框中,输入一个数值,或者一定范围的值(如1:12表示从1到12).E.在New下方的第一文本框中,输入想要转换成的值。F.另外,由此还可看出,一次可以转换8个数值。,使用计算器,使用计算器可以快速的进行基本的算术运算和复杂的数学函数计算。结果可以保存在某一列中。使用计算器A.选择CalcCalculator。B.在Storeresultinvariable中,输入保存结果的列。C.在Expression中选择变量和各自的函数。也可以通过手动输入表达式。,1.例:打开FileOpenWorksheetDataPULSE.MTW2.选择CalcCalculator3.在Storeresultinvariable中,输入pulseDif。4.在Expression中,输入算式pulse2-pulse1,例子:使用计算器对列进行计算,使用计算器,5.点击OK后结果如所示:,C2,C1,C9,Pulse2,Pulse1,pulseDif,1,88,64,24,2,70,58,12,3,76,62,14,4,78,66,12,5,80,64,16,6,84,74,10,7,84,84,0,4-1概要4-2描述性统计4-3置信区间和平均值测试4-4相关4-5回归4-6分散分析4-7表4-8质量控制,第四章使用数据分析和质量工具,概要,MINITAB提供了许多统计和图表技法来进行数据分析。常用的方法有:基本统计回归方差分析实验计划法管理图质量工具可靠度/残差分析多变量分析时间序列表非参数分析探测数据分析本章将会根据一个例子进行工序能力分析,其中包括:基本统计描述性统计,一样本T检验,相关性回归线性回归方差分析One-wayANOVA表交叉表管理图X-R图,描述性统计,MINITAB提供了两条命令DisplayDescriptiveStatistics和StoreDescriptiveStatistics,这两条命令对每一列进行了计算并且将统计结果存储下来了。这些结果可以从会话窗口中显示出来。显示描述性统计结果A.选择StatBasicStatisticsDisplayDescriptiveStatisticsB.在Variables文本框中,输入想要进行分析统计的数据列.C.另外,还可以选择ByVariables(具体作用参见下例)和Graph按钮。一个描述性统计的例子假如想要对参加脉搏测试的男(sex=1)女(sex=2)学生进行统计。1.打开文件:pulse.mtw。2.选择StatBasicStatisticsDisplayDescriptiveStatistics。3.在Variables一栏,输入Weight。4.选中Byvariables并且在文本框中输入Sex,然后点击OK结果如下:VariableSexNMeanMedianTrMeanStDevWeight157158.26155.00157.6118.64235123.80122.00123.7413.37VariableSexSEMeanMinimumMaximumQ1Q3Weight12.47123.00215.00145.00170.0022.2695.00150.00115.00131.00结果解释在会话窗口中的这段文字对体重进行了描述性的统计。因为选中了Byvariables为sex,所以分别对男生(sex=1)女生(sex=2)进行了描述性统计。从结果可以看出:男生体重(mean意思为平均值)大于女生体重(mean=123.80)。注意:1.ByVariables的意思是对每个关键值(如男和女)分别进行统计计算。2.Graph按钮的作用是以图形(直方图、正态曲线的直方图、点图、盒式图(boxplot)的方式表示统计结果。,置信区间和平均值测试,Minitab提供了一些命令计算一样本或两样本的置信区间以及进行平均值检验。工序能力包括Z-test值、一样本t-test值、两样本t-test和配对t-test.Minitab也提供了概率估计和概率差别的方法。另外,当你不知道所收集的数据是否服从正态分布时,MINITAB又提供了计算置信区间和对中央值进行假设检测的方法。下面是一样本t置信区间和平均值假设检验(假设服从正态分布)的一个例子。计算t置信区间和平均值检验A.选择StatBasicStatistics1-SampletB.在Variables文本框中,输入包含样本的列,Minitab将对样本的每一列进行单个分析。C.以下二者中任选一项:若计算平均值的置信区间,选中Confidenceinterval。若进行假设检验,选中Testmean。D.若想更进一步,还可以使用下面的选项:为置信区间指定一个置信度。缺省值为95%。指定一个原假设检验值。缺省值为:=0通过选择小于()、不等于(),定义选择性假设。,置信区间和平均值测试,T置信区间的一个例子假设根据测得的样本数据(脉搏测验),想要得到平均值95%的t置信区间。1.打开文件PULSE.MTW。2.选择StatBasicStatistics1-Samplet3.在Variables文本框中,输入Pulse1,点击OK。Sessionwindow输出:TConfidenceIntervalsVariableNMeanStDevSEMean95.0%CIPulse19272.8711.011.15(70.59,75.15)结果解释根据输出结果,估计其平均值为72.87,有95%的把握认为真值落在区间(70.95,75.15)。,相关(correlation),使用回归对成对变量计算相关系数和相关性。相关系数是衡量两个变量之间线性关系的程度。其值介于-1与+1之间。如果一个变量随另外一个变量减少而递增的话,那么相关系数为负值;相反的,如果这两个变量同时增加或同时减小,那么相关系数为正。计算两列的相关性A.选择StatBasicStatisticsCorrelationB.在Variables文本框中,输入包含测量数据的列,MINITAB便会计算两两列之间的相关性。,相关(correlation),相关性的一个例子假设要分析学生身高与体重的关系。1.打开文件PULSE.MTW。2.选择StatBasicStatisticsCorrelation3.在Variables文本框中,输入Height和Weight.点击OK。Sessionwindow输出:Correlations:Height,WeightPearsoncorrelationofHeightandWeight=0.785P-Value=0.000结果解释根据输出结果,相关值(r=0.785,P-Value=0.000)表明身高与体重正相关。,回归(regression),回归分析用于找出反应值(Y)与一个或者多个预测值(X)之间的关系。怎样做一个线性回归A.选择StatRegressionRegression。B.在Response文本框中,输入包含反应值(Y)的列。C.在Predictors的文本框中,输入预测值(X)变量。,回归(regression),运行一个简单线性回归的例子假设想要找出体重与身高的关系1.打开文件PULSE.MTW2.选择StatRegressionRegression3.在Response文本框中,输入WEIGHT。在Predictors中,输入Height。然后点击OK。RegressionAnalysis:WeightversusHeightTheregressionequationisWeight=-205+5.09HeightPredictorCoefSECoefTPConstant-204.7429.16-7.020.000Height5.09180.423712.020.000S=14.79R-Sq=61.6%R-Sq(adj)=61.2%AnalysisofVarianceSourceDFSSMSFPRegression13159231592144.380.000ResidualError9019692219Total9151284UnusualObservationsObsHeightWeightFitSEFitResidualStResid972.0195.00161.872.0833.132.26R2561.0140.00105.863.6234.142.38R4072.0215.00161.872.0853.133.63R8468.0110.00141.501.57-31.50-2.14RRdenotesanobservationwithalargestandardizedresidual结果解释P值等于0,表明体重是身高的一个显著性因子,R2等于61.6%表明此模型在反应值中所占的比率。,分散分析(ANOVA),分散分析(ANOVA)把比较两样本总体均值的T-test扩充到比较多于两个均值的test。MINITAB的ANOVA包括一次、二次或者更为复杂的ANOVA模型、等变量检验等。当按照单个变量进行分类时,一个一次ANOVA检验总体均值的相等性。下面我们举一个例子,说明当反应值数据在一列而区分总体的水平值在另一列时,怎样进行数据分析。如果你在工作表中将每个总体的数据置于不同的列,可以运用ONE-WAY命令。怎样做one-wayANOVAA.选择StatANOVAOne-wayB.在Response中,输入包含反应值的列。C.在Factor中,输入包含因子水平的列。一个one-wayANOVA分析的例子1.打开文件PULSE.MTW2.选择StatANOVAOne-way3.在反应值Response中,输入Weight,在Factor中,输入Sex。4.点击Graphs。5.选中Boxplotsofdata和Normalplotofresiduals。点击OK两次后,会话窗内容如下:,分散分析(ANOVA),Boxplotsofdata和Normalplotofresiduals如下:,结果解释分散分析输出结果和盒式图(boxplot)清楚地表明,女性和男性的体重是不一样的。F统计值比较大而p值比较小,表明男女存在统计上显著性差异。女性体重平均值的95%置信区间介限于118和130之间但是对于男性而言,95%置信区间介于155和162之间.,One-wayAnalysisofVarianceAnalysisofVarianceforWeightSourceDFSSMSFPSex1257552575590.800.000Error9025529284Total9151284Individual95%CIsForMeanBasedonPooledStDevLevelNMeanStDev-+-+-+-+-157158.2618.64(-*-)235123.8013.37(-*-)-+-+-+-+-PooledStDev=16.84120135150165,表(table),使用Minitab制表功能,可以将数据以表的形式归纳出来,或者对这些数据进行进一步的分析。也可以进行各种各样的统计,或者进行2检验,也可以进行简单或者复杂的相应的分析。交叉表格可以显示一次,二次,多次表格数据。在这些表格里,包含常量、百分数、统计数据,例如平均,标准偏差,最大值以及相关变量。怎样创建一个统计表格A.选择StatTablesCrossTabulation。B.以下二者任选其一:对于原始数据,在Classificationvariables中,输入两到十个包含原始数据的列。对于频率数据,a.在Classificationvariables中,输入两到十个包含分类数据的列。b.选中Frequenciesarein并且输入包含频率数据的列。,表(table),假设你要对不同程度吸烟者的数量及各所占比率进行统计。1.打开文件PULSE.MTW。2.选择StatTablesCrossTabulation。3.在Classificationvariables中,输入Smokers和Activity。4.选中Columnpercents然后点击OK。TabulatedStatistics:Smokes,ActivityRows:SmokesColumns:Activity0123All1100.0033.3331.1523.8130.432-66.6768.8576.1969.57All100.00100.00100.00100.00100.00CellContents-%ofCol结果解释行表示Smokers变量:1表示经常吸烟者而2表示不常抽者。列表示水平程度:1=轻微,2=中等,3=许多(这里的0水平是因为测量者误输入),轻微抽烟者占1/3,抽烟量最大者占1/4。,一个显示各列百分比的二次表的例子,质量控制,B.以下二者任选其一1.如果子集处于一列,在Singlecolumn中输入数据列。在Subgroupsize中,输入子集尺寸或者子集标志列。2.如果子集处于行中,在Subgroupsacrossrowsof中输入一系列列。如果有必要,可以点击Option,可以作如下选择:如果对于和有一个目标值或者根据以前的数据知道这几个参数,则输入的历史值(总体分布的平均值)和(总体分布的标准偏差)控制Minitab估计和值的方式。对于特殊原因做8个检验。当出现了偏移数据时,使用box-cox转换。,质量控制,X-R图的一个例子一制造车间制造金属固定件,需要估计其工序能力(目标值:2.4克),力求固件的重量变动最小。这些固件5个一包。随机选择20包画出X-R图,估计他们的制造工序管理情况。1.打开文件FASTENER.MTW。2.选择StatControlhartsXbar-R。3.在Singlecolumn中,输入Weights。在Subgroupsize中,输入5。4.在Historicalmean中输入2.4,点击OK。TestResultsforXbarChartTEST1.Onepointmorethan3.00sigmasfromcenterline.TestFailedatpoints:10,质量控制,结果解释特殊原因检验表明只有一包的平均重量处于规格下限以下(低于目标值3个标准偏差-3)。但是又注意到许多点落在中心线以下,表明此工序生产的固件经常低于目标值。质量工程师还得进行另外的特殊原因检验或者重估此工序。,5-1事例背景5-2打开一个工作表5-3从键盘输入数据5-3输入规则数据5-4描述性统计计算5-5算术运算5-6生成散点图5-7计算相关系数,第五章基本操作示例,事例背景,实验背景克隆是单个基因细胞从同一个体繁衍而来。研究人员发现一种单性克隆物(生长快而且质硬的树),这些树某天也许会当作一种能源而取代传统燃料。宾夕法尼亚州立大学的研究人员在两个不同的地方,种植了一些白杨树,一个地方在小溪旁,土质肥沃,灌溉系统好;另一个地方是山地,土壤干燥,呈现沙性。他们以厘米为单位测量直径,以米为单位测量高度;然后把它烘干,测量它的重量。研究人员想知道,他们能否根据直径和高度,预测它的重量。,在这一章里,你可以知道怎样:,一、打开一个工作表二、输入和编辑数据三、保存数据四、基本统计计算五、数学运算六、画数据图七、计算相关系数,打开一个工作表,步骤一、打开一个工作表当你打开Minitab时,便开始了一个新而且空的Project。可以通过多种方式向此Project里添加数据,但是最为普通的方式是打开一个工作表。只不过有一点要注意,打开工作表只是将数据拷贝到此Project里,对于Project里任何数据的变化都不会影响到原始数据。在这一节,使用的数据在文件POPLAR1.MTW里。1.选择文件FILEOpenWorksheet。2.找到子目录DATA。3.点击POPLAR1.MTW,打开。4.如果未见到数据窗口,按快捷键Ctrl+D。,这个工作表包含三个变量,分别为:Diameter,Height,Weight。每个变量包含15个值到目前为止只有这么多。,从键盘输入数据,步骤二、从键盘输入数据到目前为止只有这么多数据,但是又从现场收集到了5行数据,需要通过键盘来输入。1.将光标放到第16行。数据窗口应当为下面式样:,2.确保数据方向箭头向右.3.从左到右输入以下数据:1.522.90.074.515.270.733.174.930.443.334.890.52,Enter,Enter,Enter,Enter,Enter,Enter,Enter,Enter,Enter,Enter,Enter,Ctrl,Enter,Ctrl,Enter,Ctrl,Enter,Ctrl,Enter,Ctrl,+,+,+,+,+,数据方向箭头,输入规则数据,步骤三、输入规则数据一般是在数据窗口中通过键盘输入数据,但是当数据按照一定的规则时,还有一个简便的办法输入。现在要创建一个新的变量来标明所测数据值是来自于土壤肥沃、排水系统好的地方(记为1)还是来自于干燥多沙的地方(记为2)。这个新的变量叫做Site,将包含10个“1”,然后是10个“2”。选择CalcMakePatternedDataSimpleSetofumbers。保存数据于:在Storepatterneddatain中输入Site。Minitab自动分配一个新的变量给第一个空列。在这里是C4。为了标明开始和结束顺序,在Fromfirstvalue中输入1,在Tolastvalue中输入2。,既然有10个1和10个2,在Listeachvalue中,输入10,然后点击OK。新生成的数据如下:,描述性统计计算,步骤四、描述性统计计算Minitab提供了许多基本统计方法进行数据分析,例如描述性统计、t检验、z检验以及相关性。对于两个不同地方的树,应当分别生成统计表对三个变量Diameter、Height和Weight进行说明。选择StatBasicStatisticsDisplayDescriptiveStatistics。在变量列表框中,点击Diameter然后拖曳鼠标使Diameter、Height、Weight高亮度显示,然后点击Select。选中Byvariable,输入Site。通过Minitab对不同地方的树在直径、高度、重量上分别生成统计结果。点击Graphs。,5.选中Boxplotofdata,然后点击OK两次。,描述性统计计算,DescriptiveStatistics:Diameter,Height,WeightbysiteVariablesiteNMeanMedianTrMeanStDevDiameter1102.5982.3202.6040.9162103.0283.2503.0411.284Height1104.0984.1204.1751.1032104.2554.8654.3511.254Weight1100.30900.20500.28630.25282100.3990.3800.3560.366VariablesiteSEMeanMinimumMaximumQ1Q3Diameter10.2901.0604.0902.1203.24520.4061.1804.7701.4884.053Height10.3491.8505.7303.5184.85320.3962.2005.5402.7755.143Weight10.08000.02000.78000.15750.460020.1160.0301.1100.0630.648,从盒式图(boxplot)可以判断出,地方2的树比地方1的树大。会话窗口的文本输出包含以下信息:在地方2三个变量都显示出比较大的平均值和中央值。而且,变量Weight相对其尺寸来说有一个比较大的标准偏差。在地方2,最小重量只有0.03kg而最大值是1.11kg,这表明一部分白杨树生长得很好,可是其他的仅仅只是活着而已。,2,1,5,4,3,2,1,site,D,i,a,m,e,t,e,r,BoxplotsofDiameterbysite,2,1,1.0,0.5,0.0,site,W,e,i,g,h,t,BoxplotsofWeightbysite,2,1,6,5,4,3,2,site,H,e,i,g,h,t,BoxplotsofHeightbysite,算术运算,步骤五、进行算术运算现在的任务是估计树的重量。根据以前的工作,研究人员发现树的重量和直径平方与高度之积有关。手头有直径和高度的数据,利用计数器计算新的变量。计数器将输入的方程式结果计算出来并保存于指定的变量。1.选择CalcCalculator。2.将新的变量命名为D2H,表示直径的平方与高之积。在Storeresultinvariable中,输入D2H.3.在Expression中,键入C1*2*C2,点击OK。,计算结果显示如下:,生成散点图,步骤六、生成散点图研究人员得出在重量与D2H之间存在一种关系。通过散点图,可以验证这一点。1.选择GraphPlot。2.在Y中,输入Weight.3.在X中,输入D2H然后点击OK。,图形窗口输出结果:,由此可以看出,Weight和D2H之间存在正的线性关系,也就是说,D2H增加的话,Weight也同样增加。图上出现了一个不正常点:有一棵树只有很小的重量,但D2H值却相当高。现在将其忽略,但以后还得进一步检查。下一步是计算这二者的相关性并且将其量化。,不规则点,计算相关系数,步骤七、计算相关系数从散点图知随着D2H增长,WEIGHT也同样增长,现在通过计算相关系数找出这两个变量的具体关联性。1.选择StatBasicStatisticsCorrelation.2.在Variables中,输入Weight和D2H,点击OK。,会话窗口输出:PearsoncorrelationofWeightandD2H=0.913P-Value=0.000相关系数是两个变量之间线性关系的度量,其值介于-1和+1之间,此处,相关系数为正的0.913,接近于1,从而把散点图中所表示的关系量化了。说明变量WEIGHT和D2H之间存在很强的线性关系。,第六章做一个简单分析,背景宾夕法尼亚州立大学的研究者们种植了成百上千的白杨树并且在一系列受控条件下让其生长.三年后,抽取一批为样本,以厘米为单位测量其直径、以米为单位测量其高度、千克为单位称其干重。前面知道,在干重与D2H之间存在相近的关系。但是到底是一种怎样的关系呢?这些快速生长、质地坚硬的树,将来某一天也许会作为燃料或者化学物质的一种选择。作为数据分析员,知道了直径和高度的测量值之后,能否可靠的预测出树的产量。步骤一.打开文件POPLAR2.MTW。步骤二.做一个简单的回归分析在上一个示例结尾,我们知道随着D2H增加,Weight也增加。由D2H的值预测Weight的一种方法是使用简单的回归命令。选择StatRegressionRegression在Response中,输入Weight。在Predictors中,输入D2H。不妨还做一系列残差分析图,以便找出潜在的问题。点击Graphs。,在ResidualsforPlots下,点击Standardized。在ResidualsPlots,点击Histogramofresidu
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 人教部编版八年级上册第二单元 近代化的早期探索与民族危机的加剧第5课 甲午中日战争与列强瓜分中国狂潮教案设计
- 2024中建港航局春季招聘200人笔试参考题库附带答案详解
- 胆囊切除术的护理常规
- 2024中国船舶集团有限公司所属单位岗位合集笔试参考题库附带答案详解
- 人教版一年级下册7. 找规律教学设计
- 六年级下信息技术教学设计-我的兴趣爱好-吉教版
- 《圆的面积(二)》(教学设计)-2024-2025学年北师大版小学数学六年级上册
- 大气环境生态信息法规重点基础知识点
- 2025年河南省周口市项城市两校联考中考一模道德与法治试题(原卷版+解析版)
- 【RGF国际招聘】2024年薪酬观察报告-新加坡篇
- 【人教版】《劳动教育》五上 劳动项目三《制作扇子》 课件
- 第一单元:复习与提高(单元复习课件)-沪教版二年级数学下册
- 扶壁式挡土墙设计毕业设计
- 分子诊断技术在新生儿败血症中的应用
- DB32∕T 948-2006 公路桥梁钢结构焊接质量检验规程
- 《建筑照明术语标准 JGJT119-2008》
- 公司管理架构及岗位职责
- 2024年中华人民共和国企业所得税年度纳税申报表(带公式)20240301更新
- 2024年遂宁市中考物理真题试卷(含答案解析)
- 商业综合体物业管理服务标准
- 湖北省武汉市武昌区七校2023-2024学年九年级下学期期中数学试题
评论
0/150
提交评论