excel统计数据分析应用讲解_第1页
excel统计数据分析应用讲解_第2页
excel统计数据分析应用讲解_第3页
excel统计数据分析应用讲解_第4页
excel统计数据分析应用讲解_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Excel数据处理六西格玛管理方法给我们的组织带来了管理上新的认识,其中包含了如方差分析、假设检验、回归分析、基本统计等大量的数理工具,但问题也随之而来,那就是大量的数据处理,这时我们就会想到用软件来帮助完成大量的运算。现在应用于这一方面的软件很多,如MINITAB、SPS、SAS等,但是大多为英文软件,在这里我要介绍的就是用EXCEL的数据分析与规划求解来帮助您进行简单的数据分析。EXCEL的数据分析工具为中文界面,操作简单,在一定程度上能给予大家帮助。第一节加载宏EXCEL的数据处理除了提供了很多的函数外,另外还有两个功能就是数据分析和规划求解,但这两个工具必须加载相应的宏后才能使用,操作步骤为工具〉加载宏,出现如图1-1的对话框,选择分析工具库和规划求解,点击确定,后在工具菜单栏内出现了这两个分析工具。图1-1第二节随机数据与基本分析在上一节通过加载宏在工具栏内增加了两个数据分析库,数据分析与规划求解,在本节将介绍数据分析工具库中的随机数生成器和描述统计。操作工具〉数据分析,出现如图2-1的对话框,对话框包含了方差分析、相关系数、协方差分析等十几种分析工具,但一般处理对象为简单的数据。图2-1在对话框内选择随机数发生器,将出现如图2-2的对话框,对话框提供了相应的随机数产生及存储的条件命令,具体如下:图2-21.变量个数:需要形成几组数据。2.随机数个数:每组数据包含的数据个数。3.分布:选择随机形成的数据期望服从的概率分布类型,包括均匀分布、正态分布、二项分布、离散分布等。4.参数:输入不同分布的参数,如正态分布要求提供平均值及标准偏差。5.随机数基数:输入随机数的基数。6.输出选项:选择输出区域将使随机数据在同一工作表的制定位置放置,选择新工作表组将使随机数据放置在同一工作薄的新工作表中,选择新工作薄将生成一个新的工作薄来存储数据或分析结果,以上选择将出现在后续的各种分析工具对话框中,操作意义相同。操作工具〉数据分析,在对话框内选择描述统计,将出现如图2-3的对话框,对话框的内容解释如下:图2-31.输入区域:输入数据所在的区域,可以包含数据的标志,注意分析的数据单个总体应包含在一列或一栏中。2.分组方式:提供了两种选择,如果单个数据总体在同一行内,请选择逐行,如果在列中,则选择逐列。3.在选取数据区域时如果选择了数据标志,请选择标志位于第一行。4.输出选项:前三项内容如前所述,后四项选择内容供选择数据分析的内容。示例,用随机数发生器生成3组正态数据,每组数据容量为20,数据的平均值为5,标准偏差为0.2,并对形成的数据作描述性统计。选择数据分析工具库的随机数发生器,在对话框中变量个数栏输入3,在机数个数栏选择20,分选择正态分布,参数平均只栏输入5,标准偏差栏输入0.2,基数输入0,结果如图2-4,确定后再工作表中输出结果如图2-5,其中的列标志为提前输入。随布类型下拉表中随机数图2-4图2-5选择数据分析工具库中的描述统计对上述形成的数据进行分析,在对话框中输入区域选择随机数据所在的表格区域,分组方式按要求为逐列,因为包含标志所以选择标志位于第一行,选择输出位置及汇总统计,均值置信度为95%及最大和最小值。选择如图2-6所示,单击确定,输出如图2-7的分析结果,注意其中的众数由于不存在而显示为#N/A。图2-6图2-7第三节方差分析在数据分析工具库中提供了3种基本类型的方差分析:单因素方差分析、双因素用:无重复试验和可重复试验的方差分析,本节将分别介绍这三种方差分析的应单因素方差分析在进行单因素方差分析之前,须先将试验所得的数据按一定的格式输入到工作表中,其中每种水平的试验数据可以放在一行或一列内,具体的格式如图3-1,图中每个水平的试验数据结果放在同一行内。图3-1数据输入完成以后,操作工具〉数据分析,选择数据分析工具对话框内的单因素方差分析,出现如图3-2的对话框,对话框的内容如下:1.输入区域:选择分析数据所在区域,可以选择水平标志,针对图3-1的数据进行分析时选取(绿色)和黄色区域。2.分组方式:提供列与行的选择,当同一水平的数据位于同一行时选择行,位于同一列时选择列,本例选择行。3.如果在选取数据时包含了水平标志,则选择标志位于第一行,本例选取。4.α:显著性水平,一般输入0.05,即95%的置信度。图3-25.输出选项:按需求选择适当的分析结果存储位置。按图3-2输入选项后,对图3-1的数据分析的结果如图3-3所示。图3-3双因素无重复试验方差分析与单因素方差分析类似,在分析前需将试验数据按一定的格式输入工作表中,如图3-4所示:图3-4数据输入完成以后,操作工具〉数据分析,选择数据分析工具库中的双因素无重复方差分析,出现如图3-5的对话框,对话框的内容如下:1.输入区域:选择数据所在区域,可以包含因素水平标志。2.果数据输入时选择了因素水平标志,请选择标志按钮。3.显著性水平α:根据实际情况输入,一般选择0.05。4.输出选项:按需要选择分析结果存储的位置。图3-5分析图3-4中的数据,对话框如图3-5输入,分析结果输出如图3-6:图3-6双因素可重复方差分析双因素可重复方差分析与双因素无重复方差分析数据输入的区别在于对重复试验数据的处理,如图3-7所示,就是将重复试验的数据叠加起来。图3-7数据输入完成以后,操作工具〉数据分析,选择数据分析工具库中的双因素可重复方差分析,出现如图3-8的对话框,对话框的内容基本与双因素无重复方差分析相同,区别在于每一样本的行数选项,在此输入重复试验的次数即可。3-8若须对图3-7所示数据进行方差分析时,按图3-8的显示输入即可,在输入区域选择数据所在区域及因素水平标志,在每一样本的行数处输入3,即每种组合重复3次试验,显著性水平选择0.05。在输出选项中可以按照需求选择分析结果储存的位置。选择确定以后分析结果如图3-9所示。图3-9第四节相关分析与协方差分析EXCEL数据分析工具库中提供了多因素数据的两两对应得相关分析与协方差分析,分析结果分别为相关系数矩阵和协方差矩阵。相关系数分析在进行分析前先将数据按图4-1的格式输入EXCEL工作表中,并对输入的数据进行相关分析和协方差分析。图4-1操作工具〉数据分析,在出现的数据分析工具栏中选择相关系数,将出现如图4-2的对话框,对话框内容如下:1.输入区域:选取图4-1数据表中的绿色和黄色区域,表示标志与数据。2.分组方式:根据数据输入的方式选择逐行或逐列,此例选择逐列。3.由于数据选择时包含了标志,所以要勾选标志位于第一行。4.根据需要选择输出的位置。图4-2将信息按图4-2输入对话框后,选择确定,输出结果如图4-3所示。图4-3协方差分析数据输入依图4-1例,在数据分析内选择协方差,出现的对话框及输入方法与相关系数分析相同,输入完成确定后,分析结果如图4-4所示。第五节假设检验假设检验是我们常用的数据分析工具,其方法是运用统计工具对设定的H0原假设做出判断,在EXCEL的数据分析工具库中,主要包括F检验、t-检验和z-检验3种,其中t-检验又根据两个样本间的方差情况分为等、异方差检验。F检验双样本方差分析为了能进行分析,先用随机数发生器在EXCEL工作表内生成两组服从正态分布的数据,注意标志为另外输入,生成的数据如图5-1所示。5-1在数据分析工具库中选择F-检验双样本方差分析,出现如图5-2的对话框,对话框的内容及对生成的数据分析操作如下:1.变量1的区域:在数据表中选择第一变量的区域,本例为$A$1:$A$21。2.变量2的区域:在数据表中选择第二变量的区域,本例为$B$1:$B$21。从上述选择可以看出,分析对象的两个变量可以具有不同的样本量。3.如果在选择变量1区域和变量2区域时,包含了数据的标志,则选择标志框。4.显著性水平α:一般选择0.05或0.01,本例选择0.05。5.输出选项:根据需要选择分析结果存储的位置。进行上述输入过程后,产生分析结果于相应得工作表位置,如图5-3,可以也可以根据F计算值与临界值的比较来判定,其中若P值小于0.05或F计算值大于临界值,则说明两样本的方差存在显著差异,根据其中的P值判断,反之则认为两样本间的方差差异不具备统计显著性。图5-2图5-3t-检验双样本等方差或异方差检验t-检验双样本等方差或异方差检验主要检验两个样本的均值差异显著性,其中前者条件为两个样本的方差相等,后者条件为不相等,其操作流程基本相同,现仅以双样本等方差分析为例对图5-1产生的数据进行分析。在数据分析数据库中选择t-检验双样本等方差检验,出现如图5-3的对话框,对话框内容及分析的输入内容如下:图5-31.变量1、2区域的输入与F检验相同。2.假设平均差,若输入0则原假设为两样本均值无显著差异。3.如果在选择数据是包含标志,则选择标志复选框。4.输入显著性水平。按以上操作后输出内容如图5-4。可以根据其中的P值判断,也可以根据t计算值与临界值的比较来判定,其中若P值小于0.05或t计算值大于临界值,则说明两样本的均值存在显著差异,反之则认为两样本间的均值差异不具备统计显著性。图5-4t-检验双样本平均差检验双样本平均差检验区别于上述两种检验的特点在于,两个样本的总体方差已知,由于这点的局限性,其实际运用意义不大。其功能对话框如图5-5,对话框内容区别于t-检验就是对已知两个样本方差的输入。图5-5第十节回归与规划求解回归分析在试验设计数据处理有非常重要的作用,例如正交设计、均匀设计、配方设计、复合设计都需要通过回归分析来寻找因素与响应变量间的关系,而EXCEL的数据分析工具库中就提供了回归分析的工具。通过回归分析,一般会得响应变量间的拟合方程,那么怎样根据拟合方程来确定最优试验条件工具库中的规划求解工具。到因素与呢?这时就可以使用数据分析回归分析在进行回归分析为了解某指标Y与因素X1、X2之间的据结果输入EXCEL表中如图10-1。前,须将试验结果数据按规定的格式输入EXCEL表格中。现假设影响关系,进行了10次试验,试验数图10-1试验数据输入完成后,在数据分析工具库中选择回归,出现如图10-2的对话框,对话框内容如下:图10-21.Y值输入区域:选择响应变量试验结果数据所在的区域,可以包含标志。2.X值输入区域:选择因素取值数据所在的区域,可以包含标志。.3.如果选择数据时包含了标志则选择标志复选框。4.如果强制拟合线通过坐标系原点则选择常数为零复选框。5.置信度:分析置信度,一般选择95%。6.输出选项:根据需要选择分析结果输出的位置。7.残差选项:根据需要可选择分析结果中包含残差和标准残差以及残差图与线形拟合图。8.如果希望输出正态概率图则选择响应得复选框。为了分析图10-1中的数据,按图10-2的内容输入对话框中,分析的数据结果如图10-3、10-4,图形结果如图10-5、10-6所示。图10-3图10-4图10-5图10-6规划求解假设现经试验设计及数据分析后得出,某试验指标Y与变量X1、X2之间的回归-46X*X-13X-35X,且拟合很好,现需确定最优的12拟合方程为Y=150+20X+30X212212试验条件。根据要求用极值法确定最优条件,可得方程组如下:20-46X-26X=02130-46X-70X=012首先在EXCEL工作表中设计输入如图10-7的内容,其中C3=B3,B2=20-46*D3-26*D2,B3==30-46*,D2、D-70*D33为求解值放置的单元格。其中C3=B3的意义是选择B3中的公式为目标函数,另外的函数为约束条件。图10-7选择

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论