数据分析习题题答案_第1页
数据分析习题题答案_第2页
数据分析习题题答案_第3页
数据分析习题题答案_第4页
数据分析习题题答案_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第2章习题一、习题(1)回归模型yi01Xi1调用procreg过程,ParameterEstimatesVariableDFParameterEstimateStandardErrort?ValuePr?>?|t|Intercept1x11<.0001x21<.00012Xi2i,i1,2,15得到参数估计的相关结果由此输出得到的回归方程为:y3.452610.49600X10.00920X2由最后一列可以看出,使用化装品的人数X1和月收入X2对化装品的销售数量有着显着影响.0346521可以理解为该化装品作为一种必需品每个月的销售量.当购置该化装品的人数固定时,月收入没增

2、加一个一个单位,改化装品的销售数量将增加个单位.同理,当购置该化装品的人均月收入固定时,购置该化装品的人数每增加一千人,该化装品的销售数量将增加个单位.2号是2的无偏估计,所以2的估计值是.(2)调用procreg过程,得到方差分析表:AnalysisofVarianceSourceDFSum?ofSquaresMeanSquareFValuePr?>?FModel35384517948<.0001Error11CorrectedTotal1453902由此可到线性回归关系显着性检验:H0:120H1:1,2至少有一个为0的统计量FSSR/(P1)吧的观测值Fo5679.47,检验

3、的p值SSE/(np)MSEPoPho(FFo)0.0001另外R2SSR538450.9989,R2描述了由自由变量的线性关系函SST53902数值所能反映的Y的总变化量的比例.R2越大,说明线性关系越明显这些结果均说明Y与X1,X2之间的回归关系高度显着.2.17881,利用参数估计值得(3)假设置信水平0.05,由t0.975(12)到0,1,2的置信区间分别为:对0,3.452162.17812.430653.45165.2942,即(1.8426,8.7458)对1:0.496002.17810.006050.496000.01318,即(0.48282,0.50198)2:0.00

4、9202.17810.00096810.009200.0021,即(0.0071,0.00113)(4)首先检验X1对Y是否有显着性影:假设其约简模型为:yi02xi2i,i1215由观测数据并利用procreg过程拟合此模型求得:SSER)484.88137fR15213SSE(F)56.88357fR15312SS旦R)SSE(F).(fRfF)求得检验统计量的值为:SSE(F)/fF484.8813756.88357F090.356.88357/12p.ph0(FF0)P(F(1,13)F0)0.05由此拒绝原假设,所以x2对Y有显着影响.同理检9XX2对Y是否有显着性影:假设其约简模型

5、为:yi01xi1i,i1,2,15由观测数据并利用procreg过程拟合此模型求得:SSER)31872fr15213SSEF)56.88357fr15312SSESSE(F).(fRfF)求得检验统计量的值为:SSE(F)/fF3187256.88357F056.88357/12p°pH0(FF0)P(F(1,13)F0)0.05由此拒绝原假设,所以x2对Y有显着影响检验X1、x2交叉项对Y是否有显着性影:假设其全模型为:yi01xi12xi2凶凶2iJ1215检验XI、X2的交互作用是否显着即检验假设H0:30是否能被拒绝.由观测数据并利用procreg过程拟合此模型求得:SS

6、E(F)56.72fF15411SSE(R)56.88357fR15312SSE(R)SSE(F).(fRfF)求得检验统计量的值为:SSE(F)/fF0.031756.8835756.7256.72/11P0Ph0(FF.)RF(1,11)0.0317)0.1380.05由此接受原假设,也即X1*X2对Y无显着影响,即模型中没有必要引进交叉项.(5)关于Y的预测:对于给定的X1,X2的值(220,2500),由回归方程可以得到y0的预测值:y03.452610.496002200.009202500135.573TV1为了得到y0的95%勺置信区间,我们需要知道(XX):X'XInv

7、erse,ParameterEstimates,andSSEVariableInterceptx1x2yInterceptx1x2y由x°(1,220,2500)T,MSE4.74030,求得y的置信度为95%勺置信区间为:yt0.975(12).MSE1xT(XTX)1X0135.57262.17882.2818135.57264.9716即(130.6010,140.5442)(6)利用procreg过程可根据要求输出学生化残差:Obsypredictresidstudenth1162212032234131567616978181929116105511252122321314

8、41410315212利用学生化残差,检验模型误差项的正态性假定的合理性:频率检验法:学生化残差中有10/15=约落在-1,1内;有13/15=约落在,内;有15/15=1约落在-2,2内.由此可见,学生化残差在上述各区间内的频率与N0,1分布的相应概率相差均不大,因此模型误差项的正态性假定是合理的.正态QC®利用proccapability直接作出学生化残差的正态QCCS,如下所示:从图像可以看出,散点明显分布在一条直线上,那么进一步说明学生化残差来自正态总体分布.通过sas计算得到八,qObsRQ123456789101112131415再利用proccorr得到学生化残差与相应

9、标准正态分布的分位数的pearson相关系数矩阵.可以看出学生化残差与相应标准正态分布的分位数的相关系数为<,所以学生化残差与相应标准正态分布的分位数显着相关.Pearson?相关系数,N?二15当H0:?Rho=0?时,Prob?>?|r|RQR<.0001Q<.0001为了进一步验证模型假设的合理性,利用procgplot的做出的几个残差图:由这些残差图可知,它们均没有明显的趋势,结合以上分析的结果我们认为相应的线性回归模型以及误差的独立正态分布的假设是合理的.二、习题回归模型yi0iXii2Xi2i,i1,2,15调用procreg过程,得到参数估计的相关结果:P

10、arameterEstimatesVariableDFParameterEstimateStandardErrort?ValuePr?>?|t|Intercept1<.0001x11<.0001x21调用procreg过程,得到方差分析表AnalysisofVarianceSourceDFSum?ofSquaresMeanSquareFValuePr?>?FModel2<.0001Error28CorrectedTotal30根据上述回归模型,画出学生化残差正态QQ®以及Y的拟合值的残差图如下所示:从图中可以看出,学生化残差图明显不在同一条直线上,求得学

11、生化残差与相应标准正态分布的分位数的相关系数为<,与1相差较大.另外拟合值的图像也说明Y与X1和X2不能满足线性关系.2对因变量Y做Box-Cox变换,对不同的值,利用sas系统中的prociml过程计算SSE,Z的值,给出SSE,Z随变化的曲由图可知SSE,z:在0.31时取得最小值,因此Box-Cox变换中取,记变换后的因变量为YY,对拟合后的变量重新做线性回归,得到以下结果:从图中可以看出,无论是学生化残差的正态QQ图还是变换后因变量YY的拟合值都有明显的改观.而且求得学生化残差与相应标准正态分布的分位数的相关系数到达了,并且检验p值小于差分析,认为YY与XX1、XX2之间的线性关系较为合理.拟合YY与X1、X2的线性回归模型,其方差分析以及参数估计如下所YY2.848300.41940X10.0405X2AnalysisofVarianceSourceDFSum?ofSquaresMeanS

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论