SAS第三十三课逐步回归分析_第1页
SAS第三十三课逐步回归分析_第2页
SAS第三十三课逐步回归分析_第3页
SAS第三十三课逐步回归分析_第4页
SAS第三十三课逐步回归分析_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

#/12程序的输出包括所有只含一个变量的6种回归,含2个变量的15种回归,……。总共有63种不同形式的回归模型。例如,含2个自变量按R2第二个大值选择回归模型为,R2=0.76142381,拟合的回归模型为oxygen=93・0888—O・0735mnp“he—3・1402runtime若对每种变量个数,只要保留R2最大的两种情况,可在model语句中加入选项best=2,即提交procregdata二fitness;modeloxygen=ageweightrstpulsemaxpulserunpulseruntime/selection二rsquarebbest=2;run;这N二:31RegressionModelsforDependentVariable:OXYGENNumberinModel11R-square0.743380100.15838344ParameterRUNTIME-3.3106EstimatesIntercept82.421882.4582AGEWEIGHTRSTPULSEMAXPULSERUNPULSE-0.206820.7642469388.4623-0.1504-3.204020.7614238193.0888-0.0735-3.140230.81109446111.7-0.2564-0.1309-2.825430.8099884480.90080.3542-0.3751-2.970240.8368181598.1479-0.19770.2705-0.3481-2.7676表33.4只保留R2最大两种情况的逐步回归分析结果通过上面的逐步回归分析,我们已经得到回归模型的自变量个数确定时的最优子集或次优子集,但问题是我们到底应该选择几个自变量的回归模型呢?如上表33.4中的3个自变量、4个自变量、5个自变量、6个自变量的回归模型中哪一个模型呢?一种最简便确定回归模型的自变量个数的方法是Mallows的Cp方法。确定好模型的自变量个数后,根据上表33.4就很容易确定在这个固定自变量数下,最优的自变量组合和相应的参数值估计。以下的程序是对所有可能的回归按C由小到大进行排序并保留其前5种,并绘制C图。PPgoptionsreset二globalgunit=pctcback二whiteborderhtitle=6htext=3ftext二swissbcolors=(back);

title'CpplotwithReferenceLines';procregdata二fitness;modeloxygen=ageweightrstpulsemaxpulserunpulseruntime

/selection二cpadjrsqbest=5;plotcp.*np./chocking二redcmallows二bluevaxis=0to15by2haxis=0to8by1;run;Model语句中的selection=cp选项请求计算Mallows的C统计量。选项adjrsq表示要显示每种回归模型的统计量Adj-R2。选项best=5表示保留Cp值最小的前5种。plot语句中的cp.*np.表达式(注意统计量关键字母后的小圆点)表示Y轴为C值X轴为P值(P值包括截距项)。plot语句的选项chocking=red,表示画Cp=2P_P钟红色参考虚线,其中P是子模型中含截距的参数个数,Pfull是全模型中不含截距的参数个数。Hoching(1976)建议选择满足CW2P—P且CWP的模型。plot语句的选项cmallows=blue,表示画C=P蓝色参考实线,pfullpp其中P是子模型中含截距的参数个数。Mallows(1973)建议考虑所有满足C较小且接近P的模型。这一程序的输出结果见表33.5和见图33-1所示。"表33.5按C由小到大进行排序并保留其前5种逐步回归分析结果pc(p)N=31R-squareRegressionModelsforDependentVariable:OXYGENInAdjustedR-squareVariablesinModel4.766090.8368181540.81171325AGEMAXPULSERUNPULSERUNTIME5.000210.8480018150.81760218AGEWEIGHTMAXPULSERUNPULSERUNTIME6.752590.8369035950.80428431AGERSTPULSEMAXPULSERUNPULSERUNTIME6.827800.81109446―3—0.79010496AGERUNPULSERUNTIMECpplotwithReferenceLinesCQtYGEN=WQF4-C.2S9AJGE-0.0724WBGHT-OjOOCffinSTPULSE+GJ047MAXPULSE-0.3732RUNPULSERUNTIMEP31RsqRtMSE2.3321CQtYGEN=WQF4-C.2S9AJGE-0.0724WBGHT-OjOOCffinSTPULSE+GJ047MAXPULSE-0.3732RUNPULSERUNTIMEP31RsqRtMSE2.3321CP-PPlot十十十CP*PCP-PrCP2P—(Pforftillmod»I)+1图33T带有Mallows和Hocking参考线的Cp散点图

从输出结果可看出,以Mallows的建议为标准,age,maxpulse,runpulse和runtime四个变量进人回归模型时C最小(4.76609),且与P=4+l=5最接近,因为5—4.76609<6—5.00021,所以应该选择Cp=4.76609的模型。以Hocking的建议为标准,Cp=4.76609的模型不满足要求,因为4.76609>2X5—6=4。而C=5.00021的模型满足要求,因为5.00021<2X6—6=6且5.00021V6。而Cp=6.75259的模型:无论以Mallows的建议还是以Hocking的建议都不满足要求。其实我们不必具体计算,只要看图33-1中,表示Cp值大小位置的“+”

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论