实验四 回归分析SAS过程_第1页
实验四 回归分析SAS过程_第2页
实验四 回归分析SAS过程_第3页
实验四 回归分析SAS过程_第4页
实验四 回归分析SAS过程_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、课 时 授 课 计 划课 次序号: 10一、课题:实验四 回归分析SAS过程(1)统计推断与预测二、课型:上机实验三、目的要求:1. 掌握利用SAS建立多元回归方程的方法;2. 能检验所建立回归方程的显著性与方程系数的显著性,能根据实际问题作预测与控制.四、教学重点:会对实际数据建立有效的多元回归模型;能对回归模型进行运用,对实际问题进行预测或控制.教学难点:多元回归模型的建立.五、教学方法与手段:传统教学与上机实验相结合六、参考资料:使用统计方法与SAS 多元统计分析(二版),何晓群编,中国人民大学出版社,2008;应用回归分析(二版),何晓群编,中国人民大学出版社,2007;统计建模与R

2、七、作业:2.3(单) 2.4八、授课记录:第 1 页班次九、授课效果分析:实验四 回归分析SAS过程(1)2学时一、实验目的与要求掌握利用SASPROC REG过程,问题作预测与控制二、实验内容1. PROC REG过程一般格式:PROC REG ;MODEL 因变量=回归变量/ ;其它选择语句 ;OUTPUT OUT=SAS数据集名 关键字名=输出数据集中的变量名;RUN;(1)PROC REG语句此语句是PROC REG集省略此项,SAS系统对最新建立的数据集进行分析(2)MODEL语句中的选项部分第 2 页拟合结果输出的选择在关键词“Model”之后,应指明因变量,等号后依次列出回归变

3、量,每个变量间用空格分开此语句的选项部分提供了最优模型的选择方法与其他拟合结果的输出选项,其中包括:1)选择合适的建立模型方法:SELECTION=name其中“name”可以是 FORWARD(或 RSQUARE、ADJRSQ、CP等之一SELECTION=FORWARD SLENTRY=显著性水平向前选择最优模型法开始,逐个加入自变量,对每一个尚不在方程内的自变量按一定显著性水平,根据其一旦进入模型后对模型的贡献大小逐步引入方程,直自变量进入模型的控制水平,写在选择方法语句之后若省去此句,则SAS系统默认的水平为SLENTRY=0.05SELECTION=BACKWARD SLSTAY=显

4、著性水平向后删除法SLSTAY=0.1SELECTION=STEPWISE SLENTRY SLSTAY=剔除水平第 3 页再对模型内所有就剔除,若无则保留,直至方程内所有变量均显著逐步法有两个控制水平,即选入水平除水平应低于选入水平缺省SLENTRY =0.15 SLSTAY 5SELECTION=RSQUARE在所有可能的回归方程中用准则选择最优模型的方法在每R2一个给定的自变量个数的水平上,p打印出使R达到最大的那个回归2模型的拟合结果pSELECTION=ADJRSQ:修订的 准则选择最优模型法R2pSELECTION=CP: 准则选择最优模型法Cp注意:以上方法只可在选项部分写出其中

5、一种,不可并用2)对模型选取细节的选项DETAILS:对模型选取方法 FORWARD、BACKWARD、STEPWISE,若打印出每一步引入与删除自变量与相关信息选用此项如一个自变量选入模型时的偏 F 值、模型的值与一个自变量R2被剔除时模型值与有关参数估计的信息R2NOINT:取消回归模型的常数项,即拟合过原点的回归方程3)对估计细节内容的选择:在选项部分,还可以选择一个或多个(中间用空格分开)参数估计与拟合残差等相关内容,常用的有:第 4 页 行第 列为 与iji相关系数估计jCOVB:输出估计参数的协方差矩阵,即MSE(XTX) R,无需该选项R:输出有关残差与用于影响性分析的各量,包括

6、拟合值的标准差、残差、学生化残差(残差除以标准差)与Cook距离(度量了输出形式为I:输出矩阵(X X)(X X)T11TTSSE注意:以上选择内容可以与最优模型选择方法并用于 Model 语句的 BACKWARD、FORWARD、STEPWISE的模型选择方法,以上估计细节内容只是最终选择模型的相应结果;对RSQUARE准则,只给出全模型的相应结果;对于ADJRSQ与 CP方法,给出具有最大与 值的模型的相应结果R 2Cap(3)OUTPUT 语句建立SAS的输出结果数据集此语句建立一个与估计内容有关的SAS数据集语句格式为:OUTPUT OUT=SAS 数据集名 关键字名=输出数据集中的变

7、量名;关键字名为需要的统计量名,它们有PREDICTED(或 RESIDUAL(或 R)=name:残差与指定的名称;STUDENT=name:标准化(或学生化)残差;L95M=name:因变量期望值的95%的置信区间的置信下限;第 5 页U95M=name:因变量期望值的95%的置信上限;L95=name:因变量值的95%置信区间的置信下限;U95=name:因变量值的95%的置信区间的置信上限;COOKD (COOK氏D距离,用于影响性分析的统计量;H=name:杠杆量,即,, 是设计矩阵 的x (X X) 1xii ,n xXTTii第 行;iPRESS=name: 组观测值对拟合值的影

8、响;d (p)iiDFFITS=name:用以估计第 组观测值对参数估计的影响;iSTDP=name:期望值的标准误差STDR=name:残差的标准误差;STDI=name:预测值的标准误差;其中等号前的部分为输出语句的关键词,后面的name飞等号前的变量指定一名称以上介绍了一些常用的选项无论选项如何,PROC REG过程的 统计量值与相应的 统pFt计量与 值,复相关系数与其平方值等p2示例例1(书上例2.3)某科学基金会的管理人员欲了解从事研究工作的中、高水平的数学家的年工资额 Y 与他们研究成果(论文、著作等)的质量指标、从事研究工作时间 、能获得资助的指标 为XXX123此按一定设计方

9、案调查了 24 位此类型的数学家,得数据如书上表2.3所示归方程并研究相应的统计推断问题; 与之间的线性回(0,2)Y, ,X X XN123第 6 页( 2 ) 假 设 某 位 数 学 家 的 关 于的 值 为X ,X ,X123,试预测他的年工资额并给出置信度为 95%的(x ,x ,x )7.2)置0信1区02间03解:(1)建立回归模型进行统计推断设 与,X ,XY X X X YX回归模型,1230112233观测值满足, i,24y i x x x 0112i23i3i其中)2(i ,24)相互独立,且 (0,Nii即Y , ( , I) N 021)SAS系统回归分析的proc

10、reg 过程进行统计推断程序:data examp2_3;input y x1-x3;cards;33.2 3.5 9 6.140.3 5.3 20 6.438.7 5.1 18 7.446.8 5.8 33 6.741.4 4.2 31 7.537.5 6.0 13 5.939.0 6.8 25 6.040.7 5.5 30 4.030.1 3.1 5 5.8第 7 页52.9 7.2 47 8.338.2 4.5 25 5.031.8 4.9 11 6.443.3 8.0 23 7.644.1 6.5 35 7.042.8 6.6 39 5.033.6 3.7 21 4.434.2 6.2

11、 7 5.548.0 7.0 40 7.038.0 4.0 35 6.035.9 4.5 23 3.540.4 5.9 33 4.936.8 5.6 27 4.345.2 4.8 34 8.035.1 3.9 15 5.0run;proc reg data=examp2_3;/* 调用回归分析的reg过程 */model y=x1-x3/i; /* 模型因变量y,自变量x1、x2、x3,输出Hessian矩阵*/run;2)由方差分析表进行统计推断Analysis of Variance 方差分析表第 8 页Sum ofMeanSquareSourceDFSquaresF Value方差来源P

12、r F自由度平方与(SS) 均方(MS)F =MSR/MSE 检验p值0p0Modelp-1=3SSR=627.81700MSR=SSR/3=209.27233 F =68.12 |t|参数DFErrort Value参数估计值t标准差估计值s()0kkkp P (|t |t |)H0k0kIntercept.0001x111117.846931.103130.321521.288942.001880.329570.037118.923.358.660.0032x2 X1=3.5 5.3 5.1 5.8 4.2 6 6.8 5.5 3.1 7.2 4.5 4.9 86.5 6.6 3.7 6.

13、2 7 4 4.5 5.9 5.6 4.8 3.9; X2=9 2018 33 31 13 25 30 5 47 25 11 23 35 39 21 740 35 23 33 27 34 15; X3=6.1 6.4 7.4 6.7 7.5 5.9 6 4 5.8 8.3 5 6.4 7.6 7 54.4 5.5 7 6 3.5 4.9 4.3 8 5; Y=33.2 40.3 38.7 46.8 41.4 37.5 39 40.7 30.1 52.9第 20 页38.2 31.8 43.3 44.1 42.8 33.6 34.2 48 38 35.9 40.4 36.8 45.235.1;

14、X=ones(24,1),X1,X2,X3; b,bint,r,rint,stats=regress(Y,X); b,bint,stats ,rcoplot(r,rint);b =17.84691.10310.32151.2889bint =13.6711 22.02280.41570.24410.66631.79060.39891.9116置信区间均不包含0,回归参数检验显著。stats =0.9109 68.11920.00003.0722个数据外,其余残差的置信区间均包含0点,第3、12、19个点视为异常点.例2.4)利用上例2.3关于数学家年工资额 以与研Y究成果质量指标、从事研究工作

15、时间 、获得资助指标 的观测XXX123第 21 页数据进一步检验:(1)对线性回归模型Y,检验是否有; XXX011223313(2)检验的交叉乘积项对 的综合影响是否显著X ,X ,X2Y13解:(1)约简模型Y假设检验 X(XX )30c122proc reg过程检验程序:data examp2_4;input y x1-x3;cards;33.2 3.5 9 6.140.3 5.3 20 6.438.7 5.1 18 7.446.8 5.8 33 6.741.4 4.2 31 7.537.5 6.0 13 5.939.0 6.8 25 6.040.7 5.5 30 4.030.1 3.

16、1 5 5.852.9 7.2 47 8.338.2 4.5 25 5.031.8 4.9 11 6.443.3 8.0 23 7.644.1 6.5 35 7.0第 22 页42.8 6.6 39 5.033.6 3.7 21 4.434.2 6.2 7 5.548.0 7.0 40 7.038.0 4.0 35 6.035.9 4.5 23 3.540.4 5.9 33 4.936.8 5.6 27 4.345.2 4.8 34 8.035.1 3.9 15 5.0run;data aa;set examp2_4;z=x1+x3;/* 约简模型的新自变量z*/run;proc reg da

17、ta=aa;model y=z x2;回归模型 */run;/* 建立因变量Y,自变量Z、x2的约简约简模型的方差分析The REG ProcedureModel: MODEL1第 23 页Dependent Variable: yAnalysis of VarianceSum ofMeanSquareSourceValueModelDFSquaresFPr F3-1=2627.38353313.691F =106.46 p |t|t参数估计值t标准差估计值s()0kkkp P t |t H0kk0Intercept117.89290第 24 页1.956849.14.0001z11.2034

18、50.318650.189120.03556,说明6.368.96.0001x21 FModelp-1=6634.85098105.8085033.06不大Error |t|DF第 27 页参数参数估计值t标准差估计值s()0kkkp P (|t |t |)H0kk0Intercept126.524768.900472.98x10.008411.20393-0.02324-0.095190.00437-0.020442.012440.286291.538360.027030.314230.60 x20.55761-0.08x30.93621-0.06z10.951410.16z20.87350.0510.94890.051-0.07z30.050510.042691.180.25300.05说明每个参数对 的影响不显著

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论