实验报告6-SAS方差分析_第1页
实验报告6-SAS方差分析_第2页
实验报告6-SAS方差分析_第3页
实验报告6-SAS方差分析_第4页
实验报告6-SAS方差分析_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

实验报告实验项目名称方差分析所属课程名称现代统计软件实验类型验证性实验实验日期2014-10-11班级学号姓名成绩实验概述:【实验目的及要求】掌握使用SAS进行单因素方差分析和双(多)因素方差分析的方法。【实验原理】SAS软件的操作方法及原理【实验环境】(使用的软件)SAS9.1实验内容:【实验方案设计】一、用INSIGHT作方差分析二、用“分析家”作方差分析三、用ANOVA过程和GLM过程进行方差分析【实验过程】(实验步骤、记录、数据、分析)【练习6-1】某公司研制出了A、B、C、D四种新型生产设备,让6个工人分别操作相同的时间,统计他们生产的零件的数量如表6-3(lx6_1.xls)所示。试在0.01的显著水平下检验这四种设备在单位时间生产的零件数量是否存在显著差异。表6-3四种新型生产设备生产的零件的数量A754650567348B475065724649C485052464965D684849635170结果中显示了不同生产设备的盒形图。可以看出,B和D标准差的差异不显著(菱形的高度差异不大),A和C标准差的差异显著,四者的均值间有一定的差异,但此差异是否显著则需进一步的方差分析。拟合模型的一般信息列名型变量信息,即type为列名型的,有4个水平,提供参数信息,并且约定,P_2、P_3、P_4、P_5分别为A、B、C、D的标识变量(也称哑变量)。给出响应变量均值关于自变量不同水平的模型方程,其中,标识变量取值:根据标识变量的取值,容易求出各农田的平均产量:给出模型拟合的汇总信息,其中:(1)响应变量type的均值=55.6667;(2)根均方误差=10.3755;(3)判定系数R2=0.0733,较小。其值越大,说明自变量的信息对说明因变量信息的贡献越大,即分类变量取不同的值对因变量的影响越显著。方差分析表从方差分析表可以看出,p值大于0.05(显著水平),所以不能拒绝原假设,即不同设备的产量无显著差异,也即四种新型设备的产量无显著差异。II型检验,它是方差分析表的细化,因为本例是单因素的,所以这一行与上图的“Model”一行相同。参数估计表,其中有关于不同设备产量差异的估计和检验:(1)根据标识变量规定的方法,Intercept后的估计58.1667是对应设备D的产量的样本均值,其后的t检验是检验总体均值是否为0。这里p值<0.0001<0.01=α,故总体均值显著非0。(2)设备A后的估计-0.1667是设备A与设备D的产量均值之差的估计值,其后的t检验也是检验这三个产量均值之差是否为0。由于p值的绝对值为0.9781>0.01,所以设备A与设备D的产量没有显著差异,即设备A与设备D的产量无显著差异。(3)设备B后的估计-3.3333是设备B与设备D的产量均值之差的估计值,其后的t检验也是检验这两个产量均值之差是否为0。由于p值的绝对值为0.5841>0.01,所以设备B与设备D的产量没有显著差异,即设备B与设备D的产量无显著差异。(3)设备C后的估计-6.5000是设备C与设备D的产量均值之差的估计值,其后的t检验也是检验这两个产量均值之差是否为0。由于p值的绝对值为0.2908>0.01,所以设备V与设备D的产量没有显著差异,即设备C与设备D的产量无显著差异。残差和预测值的散点图,这个图可以帮助校验模型的假定。从图中看出,残差有大体相同的散布,它表明等方差的假设没有问题。p值大于0.01,不能拒绝原假设,表明可以认为残差是正态分布的【练习6-2】某学校对大一到大四的学生身高进行调查,分别在各系取男生和女生各8人,调查结果如表6-4所示(lx6_2.xls)所示。年级和性别之间无交互作用,试在0.01的显著水平下判断:(1)不同年级的学生平均身高是否有显著差异;(2)男生和女生的平均身高是否有显著差异.表6-4学生身高数据年级性别身高大一男生175169173182165172175176女生165164160167158172162165大二男生168175179185169172174176女生163156162173180163168164大三男生172183172170169167173168女生162165158156163170162166大四男生182175168173175172168180女生156158165164168173167162(1)结果中显示了不同年纪的盒形图。可以看出,大三、大四和大一标准差的差异不显著(菱形的高度差异不大),四者的均值间有一定的差异,但此差异是否显著则需进一步的方差分析。拟合模型的一般信息列名型变量信息,即grade为列名型的,有4个水平,提供参数信息,并且约定,P_2、P_3、P_4、P_5分别为大二、大三、大四、大一的标识变量(也称哑变量)。给出响应变量均值关于自变量不同水平的模型方程,其中,标识变量取值:根据标识变量的取值,容易求出各年纪的平均身高:给出模型拟合的汇总信息,其中:(1)响应变量grade的均值=168.8906;(2)根均方误差=7.0400;(3)判定系数R2=0.0270,较小。其值越大,说明自变量的信息对说明因变量信息的贡献越大,即分类变量取不同的值对因变量的影响越显著。方差分析表从方差分析表可以看出,p值大于0.01(显著水平),所以不能拒绝原假设,即不同年纪的身高无显著差异,也即四个年纪的学生身高无显著差异。II型检验,它是方差分析表的细化,因为本例是单因素的,所以这一行与上图的“Model”一行相同。参数估计表,其中有关于不同农田产量差异的估计和检验:(1)根据标识变量规定的方法,Intercept后的估计168.7500是对应大一的身高的样本均值,其后的t检验是检验总体均值是否为0。这里p值<0.0001<0.01=α,故总体均值显著非0。(2)大二后的估计1.6875是大二与大一的身高均值之差的估计值,其后的t检验也是检验这三个产量均值之差是否为0。由于p值的绝对值为0.5004>0.01,所以大二与大一的产量没有显著差异,即大二与大一的学生身高无显著差异。(3)大三后的估计-1.5000是大三与大一的身高均值之差的估计值,其后的t检验也是检验这两个产量均值之差是否为0。由于p值的绝对值为0.5490>0.01,所以大三与大一的身高没有显著差异,即大三与大一的身高无显著差异。(3)大四后的估计0.3750是大四与大一的身高均值之差的估计值,其后的t检验也是检验这两个产量均值之差是否为0。由于p值的绝对值为0.8807>0.01,所以大四与大一的身高没有显著差异,即大四与大一的身高无显著差异。残差和预测值的散点图,这个图可以帮助校验模型的假定。从图中看出,残差有大体相同的散布,它表明等方差的假设没有问题。p值大于0.01,不能拒绝原假设,表明可以认为残差是正态分布的(2)结果中显示了不同年纪的盒形图。可以看出,男生和女生标准差的差异不显著(菱形的高度差异不大),两者的均值间有一定的差异,但此差异是否显著则需进一步的方差分析。拟合模型的一般信息列名型变量信息,即sex为列名型的,有2个水平,提供参数信息,并且约定,P_2、P_3分别为男生和女生的标识变量(也称哑变量)。给出响应变量均值关于自变量不同水平的模型方程,其中,标识变量取值:根据标识变量的取值,容易求出各性别的平均身高:给出模型拟合的汇总信息,其中:(1)响应变量sex的均值=168.8906;(2)根均方误差=5.2309;(3)判定系数R2=0.44494,较小。其值越大,说明自变量的信息对说明因变量信息的贡献越大,即分类变量取不同的值对因变量的影响越显著。方差分析表从方差分析表可以看出,p值小于0.01(显著水平),所以拒绝原假设,即不同性别的身高有显著差异II型检验,它是方差分析表的细化,因为本例是单因素的,所以这一行与上图的“Model”一行相同。参数估计表,其中有关于不同性别身高差异的估计和检验:(1)根据标识变量规定的方法,Intercept后的估计164.2813是对应女生的身高的样本均值,其后的t检验是检验总体均值是否为0。这里p值<0.0001<0.01=α,故总体均值显著非0。(2)男生后的估计1.6875是男生与女生的身高均值之差的估计值,其后的t检验也是检验这三个产量均值之差是否为0。由于p值的绝对值为<0.01,所以男生与女生的身高有显著差异残差和预测值的散点图,这个图可以帮助校验模型的假定。从图中看出,残差有大体相同的散布,它表明等方差的假设没有问题。p值大于0.01,不能拒绝原假设,表明可以认为残差是正态分布的【练习6-3】某家上市公司有若干下属子公司,公司主要经营三种业务。公司总裁为了解下属公司的经营状况,从下属公司中随机抽出了四家公司,并调查了每家公司在这三种主营业务上的连续两个季度的利润率,调查结果如表6-5(lx6_3.xls)所示。表6-5四家子公司的主营业务利润率(%)公司1公司2公司3公司4主营业务1季度110.35-2.89-5.045.29季度24.470.302.61-3.44主营业务2季度111.254.851.829.76季度27.925.120.561.93主营业务3季度1-6.55-9.06-9.67-2.81季度2-4.32-3.48-12.43-4.08试进行用双因素方差分析并回答以下问题:(1)各子公司的利润率是否有显著的差异(2)各主营业务的利润率是否有显著的差异(3)不同子公司在各主营业务上的利润率是否有所差别datazy3;keepWorkComponyProfit;doWork='主营业务1','主营业务2','主营业务3';doCompony='公司1','公司2','公司3','公司4';doC='1','2';inputProfit@;output;end;end;end;cards;10.354.47-2.890.30-5.042.615.29-3.44 11.257.924.855.121.820.569.761.93 -6.55-4.32-9.06-3.48-9.67-12.43-2.81-4.08;run;进行有交互作用的双因子方差分析:procglmdata=zy3;classWorkCompony;modelProfit=WorkComponyWork*Compony;run;(1)由上图可知,因素Work的p值<0.0001<0.05,因此有显著性差异,所以各子公司的利润率有显著的差异(2)因素Compony的p值<0.05,因此有显著性差异。所以各主营业务的利润率有显著的差异。(3)因素A与B的交互作用(Work*Compony)的p值>0.05,因此没有显著性差异,所以不同子公司在各主营业务上的利润率没有差别【小结】了解使用SAS进行单因素方差分析和双(多)因素方差分析的方法。主要包括用INSIGHT作方差分析、用“分析家”作方差分析、用ANOVA过程和GLM过程进行方差分析。指导教师评语及成绩:评语:成绩:指导教师签名:批阅日期:实验报告说明1.实验项目名称:要用最简练的语言反映实验的内容。要求与实验指导书中相一致。2.实验类型:一般需说明是验证型实验还是设计型实验,是创新型实验还是综合型实验。3.实验目的与要求:目的要明确,要抓住重点,符合实验指导书中的要求。4.实验原理:简要说明本实验项目所涉及的理论知识。5.实验环境:实验用的软硬件环境(配置)。6.实验方案设计(思路、步骤和方法等):这是实验报告极其重要的内容。概括整个实验过程。对于操作型实验,要写明依据何种原理、操作方法进行实验,要写明需要经过哪几个步骤来实现其操作。对于设计型和综合型实验,在上述内容基础上还应该画出流程图、设计思路和设计方法,再配以相应的文字说明。对于创新型实验,还应注明其创新点、特色。7.实验过程(实验中涉及的记录、数据、分析):写明上述实验方案的具体实施,包括实验过程中的记录、数据和相应的分析(原程序、程序运行结果、结果分析解释)。8.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论