SAS实验-相关与回归分析_第1页
SAS实验-相关与回归分析_第2页
SAS实验-相关与回归分析_第3页
SAS实验-相关与回归分析_第4页
SAS实验-相关与回归分析_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

学生实验报告学生实验报告学生姓名学号同组人实验工程相关与回归分析必修操作性实验实验地点0505实验仪器台号指导教师董成武实验日期及节次一、实验目的及要求:1、目的学会和掌握参数估计与假设检验2、内容及要求学会用SAS作总体均值、方差估计,以及单样本均值、方差比例检验,双样本均值、方差、比例的比拟和配对样本均值比拟检验等操作二、仪器用具:仪器名称规格/型号数量备注计算机1SAS软件1三、实验方法与步骤:步骤一、运行SAS软件,新建各题要用到的数据集;步骤二、新建数据集后,输入analyst命令或在点击解决方案—分析—分析家,进入分析员应用环境;步骤三、在分析员应用环境翻开新建的数据集;步骤四、再根据各题要求,点击统计选项来分析。四、实验结果与数据处理:1.下面是某地一年级的12位女生的体重(kg)和肺活量(L)的数据试求肺活量对体重的回归方程。体重424246464650505052525858肺活量2.552.22.752.42.82.813.413.13.462.853.53〔1〕对肺活量和体重进行相关分析。绘制体重与肺活量的散点图,计算其相关系数。并对输出结果进行解释。①将数据保存至EXCEL文件,导入数据,得到数据集;②在INSIGHT环境中调入数据,绘制体重与肺活量的散点图,如下图。③在INSIGHT环境中利用多元进行分析,得出体重与肺活量的相关系数。“单变量统计量〞中提供了每个变量的5个统计量,分别为数量、均值、标准差、最小值和最大值。“相关系数举证〞中那么提供了变量间的相关系数,体重〔weight〕和肺活量(pulmonary)的相关系数为0.7495〔2〕判断体重和肺活量两变量的关系,拟合肺活量对体重的方程,对回归系数进行解释和对回归系数进行检验,绘制残差图。①用insight视图下的分析来拟合肺活量对体重的方程;得到简单线性回归方程为对回归系数进行解释和对回归系数进行检验:上表提供模型拟合的汇总度量,肺活量的均值是2.9025,模型的,说明肺活量变异的大约56%可以由体重来说明。从方差分析表中可以看到,P值小于,所以拒绝原假设接受备择假设,所以这一模型拟合数据较好。绘制残差图:〔3〕对体重为57kg的女生的肺活量进行估计,翻开数据集直接在weight(体重)最下方输入57,得到预测值。所以体重为57kg的女生的肺活量的估计值是3.3535。〔4〕并求出肺活量期望值的95%的可信区间。由上图表可知,肺活量期望值的95%的区间为[2.6392,3.1658]。2、利用dst.fitness数据集,拟合多元线性方程〔以OXYGEN变量为因变量〕。〔1〕拟合多元线性方程的方程。①用编程拟合多元线性回归,编程如下:Procregdata=dst.fitness; ModelOXYGEN=ageweightruntimerstpulserunpulsemaxpulsegroup;run;②提交这一程序后可得到如下的输出:这一输出与简单线性回归的输出时完全相仿的,只是进入回归的自变量有7个。从参数的估计值容易得到拟合的回归为:OXYGEN=-0.21043AGE–0.073700WEIGHT–2.680931RUNTIME–0.001829RSTPULSE–0.372725RUNPULSE+0.305364MAXPULSE-0.073612GROUP+101.824147〔2〕判断方程是否存在共线性和异方差?如果方程存在共线性,怎样用逐步回归法进行变量筛选拟合回归方程〔保存模式的显著性水平为0.15〕。从参数估计检验局部可以看出,变量AGE、WEIGHT、RSTPULSE和GROUP的回归系数,不能拒绝它们为0的原假设。在这里须小心地看待这些检验,因为它们都是在其他变量参加回归的前提下进行显著性检验的,完全可能因为自变量间存在较强的相关而掩盖它们对回归的奉献,所以在剔除不显著的回归变量时必须逐个进行。①用编程方法判断方程是否存在共线性Procregdata=dst.fitness;ModelOXYGEN=ageweightruntimerstpulserunpulsemaxpulsegroup/collinvif;run;②提交这一程序后可得到如下的输出:由检测结果可知,方差膨胀因子最大只有8.83077,并没有超过10,这说明不存在共线性问题。③用编程的方法做逐步回归法进行变量筛选拟合回归方程。Procregdata=dst.fitness;ModelOXYGEN=ageweightruntimerstpulserunpulsemaxpulsegroup/selection=stepwise;run;④提交这一程序后可得到如下的输出:在输出报告中,提供了进入回归变量逐次改变后回归方差分析和拟合的信息。在报告的最后,利用逐步回归法挑选,变量RUNTIME、AGE、RUNPULSE和MAXPULSE四个变量进入回归。所有进入回归的变量在0.15的水平下是显著的。〔3〕检验样本中是否存在强影响点。①用编程的方法作回归CookD诊断:Procregdata=dir.fitness;ModelOXYGEN=ageweightruntimerstpulserunpulsemaxpulsegroup/r;run;②提交这一程序后可得到如下的输出:CookD统计量大于4/n说明是一个有影响的观测。在这里,n=31,所以当CookD统计量大于4/31=0.129时,说明存在强影响点。由上图可知,存在大于0.129的点,即检验样本中存在强影响点。五、讨论与结论花费了一定的时间完场此份实验报告,证明课堂上所学的与实际应用之间存在着差距。在相关与回归

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论