回归分析及其SAS过程_第1页
回归分析及其SAS过程_第2页
回归分析及其SAS过程_第3页
回归分析及其SAS过程_第4页
回归分析及其SAS过程_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

回归分析及其SAS过程一、回归分析回归分析是研究一个变量与一组变量之间关系的重要手段。回归分析中主要解决的问题有:

1.建立回归模型并进行显著性检验;

2.进行回归诊断;

3.回归预测。最为普遍使用于进行一般线性回归模型的拟合分析过程。二、回归分析过程在SAS/STAT中有多种回归分析的过程,主要有:1.REG2.GLM通用线性模型(GeneralLinearModel)用最小二乘法拟合,既可处理连续变量又可处理离散型变量。其主要功能有:建立二次响应面回归模型,并对之进行分析以确定1)建立一般线性回归模型,包括简单回归、多重线性回归、多项式回归及加权回归;3.NLIN借助于迭代法对用户自行选定的回归表达式拟合非线性回归模型。4.RSREG最优响应因子水平,还可进行岭回归分析.2)进行方差分析。1.可处理多个Model语句;2.提供多达9种模型选择方法;3.对线性及多变量假设进行检验;4.作数据或统计量的散点图;5.可进行回归诊断并给出相应统计量;可利用相关阵或协方差阵作为建立模型的数据,并可将它们输出到SAS数据集中;三、REG过程的主要功能

回归预测,并估计预测值,残差、学生化残差,可信限等,并可将它们输出到SAS数据集中。四、简单程序实例例1用一批儿童的身高及体重的实测数据,建立如下线性回归模型:

WEIGHT=a+b×HEIGHT+

式中:WEIGHT反应变量,HEIGHT回归变量,

a

,b待估参数,

误差DATAclass;INPUTname$heightweightage@@;CARDS;Alfre69.0112.514Joyce51.350.511PROCREG;MODELweight=height;PLOTweight*height;RUN;五、交互方式运行REG过程谓交互方式:指在调用REG过程语句且用Model语句完成了一个模型后,若此时是用RUN运行的,则可再执行其他相关语句,而并不需要再次调用REG过程

1.简介:优点是:当以交互方式运行时,可以先拟合一个模型对模型进行分析、诊断,甚至修改(可以增减变量),再拟合,再诊断。这种方式节约计算机运行时间。PROCREGDATA=CLASS;VARheightage;MODELweight=height;RUN;DELETEheight;ADDage;PRINT;RUN;如在上模型中,删去height变量,增加age变量,重新拟合注意:MODEL语句只定义了一个自变量,因此向模型增加变量时,必须保证最终模型中最多只能有一个自变量2.REG中的交互语句1)ADD变量1[变量2⋯]向模型中增加变量;2)DELETE变量1[变量2⋯]删去原拟合模型中有关变量;3)MTEST对多重因变量进行多变量拟合;4)PRINT输出有关模型的有关信息;5)REFIT重新拟合模型;6)TEST进行F检验;7)OUTOUTOUT=SAS数据集关键字=⋯

;产生一个SAS数据集,并给出相应统计量的期望值、残差等3.实例PROCREGDATA=CLASS;MODELweight=ageheight;RUN;DELETEage;PRINT;RUN;六、REG过程中模型的选择(8种,仅介绍3种)前进法开始时,模型中尚无变量。其工作方式为:对每一个尚不在模型内的自变量,按一定的显著水平,根据其一旦进入模型的贡献大小,逐个引入方程,直至方程外无对模型有显著贡献的自变量。因此要事先规定显著水平。MODEL因变量=自变量1自变量2⋯

/selection=⋯

;1.Forword

:前进法在“slentry=”中可按自己需要选择不同显著水平,如0.1,0.2等,若不指定此选项,则显著水平为0.5;格式语句:MODEL因变量=自变量1自变量2⋯

/selection=Forword

slentry=;2.Backword:后退法后退法先建立包含全部自变量的回归模型,然后按一定的显著水平,从模型中逐个剔除对模型影响的显著水平小于选定值的变量。

格式语句:MODEL因变量=自变量1自变量2⋯/

selection=Backword

slstay=;用slstay=来指定显著水平。若不指定此选项,默认显著水平为0.1

;逐步法是在前进法基础上进行的修正。方法是:当利用前进法选进变量时,若模型中已有变量,则逐步法将模型内的所有变量进行逐个检验,看其是否由于新变量的引入而对模型的贡献变的不显著,若是将其从模型中剔除。若无,则保留。如此,直至方程外再无对模型有显著影响的变量,而方程内所有变量对方程均显著。3.Stepwise(逐步法)逐步法一般要规定两个显著水平,即选入水平及剔除水平,且应规定剔除水平低于选入水平,否则将导致无一变量被选进方程的结局。格式语句:MODEL因变量=自变量1自变量2⋯/

selection=stepwiseslentry=slstay=;在“slentry=”后和

“slstay=”后分别表上自己选定的显著水平,缺省值为0.15。前进法与后退法各有利弊,前者较多适用于用户希望只选择少数变量的情况,而后者则较多适用于用户希望多数变量留在模型中的情况。七、与模型选择有关的选择项MODEL因变量=自变量1自变量2⋯/选择项1.INCLUDE=n

表示在MODEL语句中的前n个自变量必须进入模型,至于其余自变量,则按

selection=定义的方式进行剔选。

2.NOINT

此选择项表示拟合无常数项(截距)的回归模型选择项中除了“selection=”外还有一些相关的选择项。表示当模型中含有s个自变量时停止模型的进一步选择。是对STEPWISE选择项,此选择项表示模型拟合时从前s个自变量开始。不指定时默认从0开始3.STOP=s4.START=s八、有关结果的屏幕输出选择项1.CLI

输出每个个体观测值的95%上、下限2.CLM

输出每个观测因变量期望值的95%上、下限3.R

输出每个个体预测值、残差及标准差。4.P

输出每个个体观测值、预测值、残差等若已选择CLI、CLM及R,则无需再选择PVIF

输出用于诊断变量间相关性的方差膨胀系数;COLLINCOLLINOINT实现共线性诊断10.I

输出

矩阵11.XPX

输出

矩阵输出参数估计的协方差矩阵7.STB

输出标准化偏回归系数矩阵;8.CORRB

输出参数估计的相关矩阵9.COVB应用实例例1对肺活量适应性预测的研究变量如下:AGR:年龄;

WEIGHT:体重;RUNTIME:跑的时间OXY:耗氧量;

RSTPULSE:静态心率;RUNPULSE:跑动时心率;MAXPULSE:最高心率;DATAA;INPUTageweightoxyruntimerstpulse

runpulse

maxpulse;CARDS;PROCREG;MODELoxy=ageweightruntimerstpulse

runpulse

maxpulse/selection=stepwisestb

covb

corrb;RUN;例2对美国1790~1970年间每隔10年的人口数据建立模型,并打印个体预测值、期望值及95%上、下限以及残差、标准误差。DATAPOP;INPUTpop@@;RETAINyear1780;year=year+10;说明变量

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论