版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、摘要,本文通过利用spss,eviews,以及matlab等数学软件对已知数据进行处理,首先用箱图进行分析,进而检测出了强影响点,得出杠杆值。其次,从回归残差的直方图与附于图上的正态分布曲线相比较,来验证正态分布。最后,从相关系数观察变量之间是否线性相关,由相关系数矩阵来检验自变量是否多重共线性。关键词:线性回归分析线性相关关系强影响点杠杆值残差分析多重共线性一.问题重述根据所给的数据作如下的回归分析:要求:1.检测强影响点,并求出杠杆值.2 .正态性检验.3 .相关性检验.4 .自变量的多重共线性检测,若有多重共线性,试消除,再建模.5 .,分析模型的合理性分析.6 .预测Xo=(470,8
2、1,82,50,13,7,225),时丫的预测值.2 .问题分析这是一个关于线性回归分析的问题,题目中我们对强影响点,杠杆值,正态性检验.相关性检验,.自变量的多重共线性检测,残差的自相关性等问题进行了分析,如何寻找各变量之间的关系,建立模型是至关重要的,对此,我们利用spss,eviews,以及matlab等数学软件对已知数据进行处理,寻找各变量之间的关系,建立符合要求的函数模型。3 .模型假设各变量的数据与所给的表格中的信息一致。4 .定义与符号说明AV表示全部样本的预测值Ayi(i)表示把第i个样本删掉的预测值Pii表示为P的主对角元,成为杠杆值五.模型的建立与求解3,12,34问题一:
3、检测强影响点,并求出杠杆值.用spss软件做如下的箱图可直观的得到有三个强影响点,分别为600-由上图可以看出标记为3,12,34的点为强影点,图二它们的cook's值为:n八(yiyyi(i)C二Cook距离为:iA2y(p1)822.2361926.24597p=x(xTx)AxT=5.067391.05067l.06487.i.05375上面的矩阵对角线上的数字即为这几个变量的cook's值。问题二.正态性检验.NormalP-PPlotofRegressionStandardizedResidual1.0bppmucdrcepxDependentVariable:丫0.
4、8一0.60.40.20.00.00.20.40.60.8Obser§dzCumProb1.0图三为观测量累计概率图,图的纵坐标为ExpectedCumulativeProbability(期望累计概率分布),横坐标为ObservedCumulativeProbability(观测累计概率分布)图中的斜线对应着一个均值为0的正态分布。如果图中的散点密切地散布在这条斜线附近,说明随机变量残差名服从正态分布,从而证明样本确实是来自于正态总体。如果偏离这条直线太远,应该怀疑随机变量总的正态性。由上述散点图可知,40个散点大致散布于斜线附近,因此可以认为残差分布基本上是正态的。Histogr
5、amDependentVariable:丫vcneugQrF4201.112Mean=-2.64E-16Std.Dev.=0.92N=40RegressionStandardizedResidual图四从回归残差的直方图与附于图上的正态分布曲线相比较,可知道服从正态分布分布不是明显地服从正态分布。问题三.相关性检验NormalP-PPlotofX1NormalP-PPlotofX20.00.20.40.60.81.0bppmucdorceDXE0.00:00.20.40.60.8.0ObservedCumProbObservedCumProbNormalP-PPlotofX4NormalP-P
6、PlotofX3bppmucdAtcepxE0.60.40.2_0.8bppmucdeTceDXE0.60.40.20.8ObservedCumProbNormalP-PPlotofX5ObservedCumProb1.01D-bppmucdarcepxE0.00.8-0.6-0.4-0.20.00.20.40.60.8ObservedCumProb1.0由上面六个P-P图可得X1,X2,X3,X4,X5,X6者B是线性的问题四.自变量的多重共线性检测,若有多重共线性,试消除,再建模.(1)检测自变量之间存在多重共线性CorrelationsYX1X2X3X4X5X6PearsonCorrel
7、ationf1.000.773783644191-030,745X17731.000,465一452-045-025,614X2,783.4651.000307.105,102,539X3.644.452.3071.000709045.439X4,191,105旬091W0-005170X5-030-025.102.0451.000-034X6745,614.439I.170-0341000Sig.(1-tailed)Y.DOO.000Tooo119427.DOO-X1000,001.002.391,438000X20Q0.001.027.259,266,000X3000.002,027477
8、,390002X4119.391,259.477J89147X542743fi266.3904S9417X6000.000.000.00.2.147417nr*40404014040WX140-40404040二I40X244)4040404040ACX340-40404040.1j40X444)404040404040X54040叩404Q4040Xfi44)40404040404D图五由图五中的相关系数矩阵可以看出,各变量相互之间的相关系数较高,证明确实存在多重共线性。(2)消除多重共线性采用逐步回归的办法,去检验和解决多重共线性问题。分别做Y对的一元回归,结果如图六所示:ModelSum
9、marModelRRSquareAdjustedRSquareStd.ErroroftheEstimate1.783a.614.60483.9542.909b.827.81856.9533.950c.902.89443.4924.963d.928.91937.885aRedictors:(Constant),X2b.Redictors:(Constant),X2,X1cPredictors:(Constant),X2,X1,X3d. Predictors:(Constant),X2,X1,X3,X4e. DependentVariable:Y图六ModelUnstandardizedCoeff
10、icientsStandardizedCoefficientstSig.BStd.ErrorBeta1(Constant)216.43834.0866.350.000X23.675.473.7837.771.0002(Constant)120.40627.1494.435.000X22.536.362.5416.997.000X12.496.370.5226.751.0003(Constant)47.51624.9681.903.065X22.357.279.5038.452.000X11.911.304.4006.297.000X31.728.330.3095.239.0004(Consta
11、nt)-.52225.660-.020.984X22.233.245.4769.101.000X12.003.266.4197.540.000X31.733.287.3106.032.000X44.6201.310.1623.528.001Coefficientsaa.DependentVariable:Y图七ModelBetaIntSig.PartialCorrelationCollinearityStatisticsTolerance1X1.522a6.751.000.743.783X3.446a5.679.000.682.906X4.109a1.081.287.175.989X5-.11
12、1a-1.100.279-.178.990X6.434a4.159.000.564.6532X3.309b5.239.000.658.783X4.161b2.484.018.382.978X5-.073b-1.063.295-.174.983X6.210b2.302.027.358.5053X4.162c3.528.001.512.978X5-.087c-1.689.100-.275.980X6.139c1.927.062.310.4864X5-.083d-1.869.070-.305.980X6.094d1.420.165.237.463ExcludedVariablesea.Predict
13、orsintheModel:(Constant),X2bPredictorsintheModel:(Constant),X2,X1c. PredictorsintheModel:(Constant),X2,X1,X3d. PredictorsintheModel:(Constant),X2,X1,X3,X4e. DependentVariable:Y图八表中显示逐步回归过程所建立的模型中剔除掉的变量后各种变量之间的具体数值。CoefficientsaUnstandardizedStandardizedCoefficientsCoefficients95%ConfidenceIntervalfo
14、rBModelBStd.ErrorBetatSig.LowerBoundUpi)erBound1(Constant)216.43834.08份6.350.000147.434285.442X23.675.473.7837.771.0002.7174.6322(Constant)12(.40627.14.94.435.00065.397175.415X22.536.362.5416.997.0001.8023.270X12.496.370.5226.751.0001.7473.2453(Constant)4.51624.9(»81.903.065-3.12198.153X22.357.
15、279.5038.452.0001.7912.922X11.911.304.4006.297.0001.2962.527X31.728.330.3095.239.0001.0592.3964(Constant)-.52225.66»0-.020.984-52.61551.571X22.233.245.4769.101.0001.7352.732X12.003.266.4197.540.0001.4642.543X31.733.237.3106.032.0001.1502.316X44.6201.310.1623.528.0011.9617.279a.DependentVariable
16、:Y新加入X7后各参数的t检验显著,选择保留,再加入其他新变量逐步回归,问题五.模型的合理性分析.问题六.预测X0=(470,81,82,50,13,7,225)t时Y的预测值.CoefficientsaModelUnstandardizedCoefficientsStandardizedCoefficientstSig.BStd.ErrorBeta1(Constant)9.12226.562.343.733XI1.805.281.3776.420.000X22.153.259.4598.298.000X31.683.281.3015.981.000X44.2061.284.1483.275.002X5-1.9991.140-.077-1.753.089X6.170.133.0831.285.208a.DependentVariable:Y由Coefficient知,y=9.122+1.805*X1+2.153*X2+1.683*X3+4.206*X4-1.999*X5+
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《污水处理工艺》课件
- 乡村振兴意义规划
- 《连续油管技术》课件
- 《名仕商务中心》课件
- 几百几十数乘以一位数综合作业题带答案
- 医疗安全与不良事件
- 乙肝感染手术的处理
- 影响因素及异常发育Influencingfactors
- 音乐照护健康评估-老年康体指导 初 级 -1729700396438
- 《透析血液通路》课件
- 微景观制作课件
- 2023学年西藏省重点中学英语九上期末考试试题含解析
- 三位数除两位数的除法练习题
- 小学心理健康教育人教六年级下册目录生命只有一次教学设计
- 小学劳动课教案三年级上册5篇
- 2021版特种设备目录
- 五年级上册美术课件-第4课 未来的交通工具丨赣美版
- 最新爆破安全规程
- 主题班会课防盗
- 支委会委员选举计票单
- 近三年无重大违法违规情况的说明
评论
0/150
提交评论