数据分析习题题答案_第1页
数据分析习题题答案_第2页
数据分析习题题答案_第3页
数据分析习题题答案_第4页
数据分析习题题答案_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第2章 习 题一、习题(1)回归模型yx1 i1 x ii 15,i02 i2调用proc reg过程, 得到参数估计的相关结果:Error t?Value Pr?|t|Intercept 1x1x211由此输出得到的回归方程为:yXX 3.45261 0.49600 0.0092012X1和月收入X2对化妆品的3.46521可以理解为该化妆品作为一种销售数量有着显着影响。0加一个一个单位,改化妆品的销售数量将增加个单位。同理,当购买该化妆品的人均月收入固定时,购买该化妆品的人数每增加一千人,该化妆品的销售数量将增加个单位。n p2的无偏估计,所以 的估计值是.2是2(2)调用proc reg

2、过程, 得到方差分析表:Analysis of VarianceDF Squares Square F Value Pr?F3Corrected Total 由此可到线性回归关系显着性检验:H1H 0:002 2/(p 5679.47,检验的p值的统计量 /(n p) 的观测值F F0pp F(F) 0.00010H 00SSRSST53845另外, 描述了由自由变量的线性关系函R 2R 20.998953902数值所能反映的Y的总变化量的比例。 R 2这些结果均表明Y与X1,X2之间的回归关系高度显着。,利用参数估计值得(3)若置信水平 ,由t 2.17881到对对的置信区间分别为: ,0,

3、 12,即()3.45216 2.1781 2.43065 3.4516 5.29420,:, 即0.49600 2.1781 0.00605 0.49600 0.013181:, 即0.00920 2.1781 0.0009681 0.00920 0.00212(4)首先检验X1对Y是否有显着性影:假设其约简模型为:y x ii 15,i02 i2由观测数据并利用proc reg过程拟合此模型求得:SSE Rf 15 2 13( ) 484.88137RSSE FfR 15 3 12( ) 56.88357SSE(R) SSE(F) (ff )求得检验统计量的值为:由FRFSSE(F)/ f

4、F F90.3 /F0pp F(P FF) 0.05)( 0H 000由此拒绝原假设,所以x2对Y有显着影响。同理检验X2对Y是否有显着性影:假设其约简模型为:y x1 i1 ii 15,i0由观测数据并利用proc reg过程拟合此模型求得:SSE Rf 15 2 13( ) 31872RSSE FfR 15 3 12( ) 56.88357SSE(R) SSE(F) (ff )求得检验统计量的值为:由FRFSSE(F)/ fF F/F0pp F(P F( F) 0.05)0H 000由此拒绝原假设,所以x2对Y有显着影响。检验X1、x2交叉项对Y是否有显着性影:假设其全模型为:y x1 i

5、1 x x x ii 15,i02 i23 i1 i2检验X1、X2的交互作用是否显着即检验假设H是否能被拒:003绝。由观测数据并利用proc reg过程拟合此模型求得:SSE Ff15 4 11( ) 56.72FSSE Rf 15 3 12( ) 56.88357RSSE(R) SSE(F) (ff )求得检验统计量的值为:由FRFSSE(F)/ fF F0/Fpp F(P F)( 0.0317) 0.138 0.05H000X1*X2对Y进交叉项。(5)关于Y的预测:y对于给定的 的预测0值:y3.45261 0.49600 220 0.00920 2500 135.5730yX X(

6、 T )1为了得到 的95%的置信区间,我们需要知道:0VariableyInterceptx1x2yMSEy的置信度为95%的置信区间2500)T由x0为:y t (12) 1 x (X X)1x TT0135.5726 2.1788 2.28180135.5726 4.9716即(130.6010,140.5442)(6)利用proc reg过程可根据要求输出学生化残差:Obs y predict resid student h1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 利用学生化残差,检验模型误差项的正态性假定的合理性:1 频率检验法:学生化残差中有 10/1

7、5=(约)落在(-1,1)内;有 13/15=(约)落在(,)内;有 15/15=1(约)落在(-2,2)内。由此可见,学生化残差在上述各区间内的频率与N(0,1)分布的相应概率相差均不大,因此模型误差项的正态性假定是合理的。正态QQ图利用proccapability直接作出学生化残差的正态QQ图,如下所示:r q( , )iiObsRQ238101112131415再利用 proc corr得到学生化残差与相应标准正态分布的分位数的pearson相关系数矩阵。可以看出学生化残差与相应标准正态分布的分位数的相关系数为?|r|Q为了进一步验证模型假设的合理性,利用proc gplot的做出的几个残差图:们认为相应的线性回归模型以及误差的独立正态分布的假设是合理的。二、习题回归模型yx1 i1 x ii 15,i02 i2调用proc reg过程, 得到参数估计的相关结果:Parameter Standard t?Valu Pr?|Variable DF Estimateet|1x1x211调用proc reg过程, 得到方差分析表:Analysis of VariancePr?FCorrectedTotal根据上述回归模型,画出学生化残差正态QQ图以及Y的拟合值的残差图如下所示:残

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论