回归分析大作业-北航_第1页
回归分析大作业-北航_第2页
回归分析大作业-北航_第3页
回归分析大作业-北航_第4页
回归分析大作业-北航_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

应用数理统计应用数理统计 第一次课程论文第一次课程论文 学号: 姓名: 2012年11月 北京航空航天大学应用数理统计论文 摘要 I 摘要 农业是我国国民经济的基础,对我国的经济和社会发展至关重要。本论文 以1978- 2010年间我国农业总产值及相关指标的数据为依据,采用多元线性回归分析的 方法对农业总产值的可能影响因素进行了分析,并通过逐步回归建立了较为理 想的线性回归模型。 关键词关键词: 农业总产值;播种面积;农机总动力;有效灌溉面积;化肥施用总量;受灾面 积;从业人数 北京航空航天大学应用数理统计论文 Abstract III Abstract: Agriculture is the foundation of our national economy, which is vital to the development of our economy and society. This research analyzes the possible factor influencing gross agricultural output value using Multiple linear regression method, and acquire an relatively ideal linear regression model by stepwise regression. Key words: gross agricultural output value; sown area; Total power of agricultural machinery; effective irrigation area; amount of chemical fertilizer; affected area; number of employees. 北京航空航天大学应用数理统计论文 目录 目录 摘要I Abstract:II 第1章 引言.1 第2章 数据的采集与整理.3 第3章 数据处理及结果分析.4 3.1 数据处理4 3.2 结果分析5 (1)逐步回归过程分析:5 (2) 异方差分析:.7 (3) 多重共线性分析:.8 第4章 模型分析与讨论.9 第5章 建议.10 参考文献11 北京航空航天大学应用数理统计论文 第1章 引言 1 第1章 引言 中国是一个农业大国,总耕地面积142439万亩,约占世界的7%,居世界第四 位。农业基础的稳固对中国经济的高速发展起着十分重要的作用。因此探索制 约农业发展的关键因素并以此为基础提出促进农业发展的有效方法成为了当前 农业研究领域。本研究选取的指标解释如下: (1)农业总产值(单位:亿元) 农业总产值是一个国家或地区农业生产的总规模和总水平的反映,在此我 们以其作为模型分析的因变量来研究不同自变量对它的影响。 (2)农作物总播种面积(单位:千公顷) 农作物总播种面积是指实际播种或移植有农作物的总面积,显然它与农业 总产值具有一定相关性,在此作为一个自变量。 (3)农用机械总动力(单位:万千瓦) 农用机械总动力指用于农业生产的各种动力机械的动力总和。包括耕作机 械、收获机械、排灌机械、植物保护机械等,对农业产量有一定影响。 (4)有效灌溉面积(单位:千公顷) 有效灌溉面积指具有一定的水源,地块比较平整,灌溉工程或设备已经配 套,在一般年景下,当年能够进行正常灌溉的耕地面积。在一般情况下,有效 灌溉面积应等于灌溉工程或设备已经配备、能够进行正常灌溉的水田和水浇地 面积之和。它是反映我国耕地抗旱能力的一个重要指标。 (5)化肥施用总量(单位:万吨) 化肥施用总量指本年内实际用于农业生产的化肥数量,包括氮肥、磷肥、 钾肥和复合肥,是直接影响农业产量的一个重要指标。 (6)受灾面积(单位:千公顷) 受灾面积是指由于自然灾害影响而使农作物产量减少一成的地区的总面积 。显然其对农业总产值有一定影响。 (7)从业人数(单位:万人) 从业人数是指从事农业生产的人口总数,是农业生产规模的度量。 北京航空航天大学应用数理统计论文 第2章 数据的采集与整理 3 第2章 数据的采集与整理 通过查阅中国统计年鉴2011,获得了1978至2010年间农业统计的相关数据 。以农业总产值为因变量,农作物总播种面积、农用机械总动力、有效灌溉面 积、化肥施用总量、受灾面积及从业人数等六个因素为自变量,将所得数据整 理见表2-1,具体符号说明见表2-2 表2-1 各年份相关数据 年份农业总产 值/亿元 农作物总播种面 积/千公顷 农用机械总动力/ 万千瓦 有效灌溉面积/ 千公顷 化肥施用总 量/万吨 受灾面积/ 千公顷 从业人数/ 万人 19781117.515010411749.9449658845080728318 19801454.114638014745.744888.11269.45002529122 19852506.414362620912.544035.91775.84436531130 19904954.314836228707.747403.12590.33847438914 19915146.414958629388.647822.128051992558814900730308.448590.12930.25133238699 19936605.114774131816.648727.93151.94882737680 19949169.214824133802.548759.13317.95504636628 199511884.614987936118.149281.23593.74582435530 199613539.815238138546.950381.43827.94699134820 199713852.515396942015.651238.53980.75342734840 199814241.915570645207.752295.64083.75014535177 199914106.215637348996.153158.44124.34998035768 200013873.615630052573.653820.34146.45468836043 200114462.815570855172.154249.44253.85221536399 200214931.515463657929.954354.94339.44694636640 200314870.115241560386.554014.24411.65450636204 200418138.415355364027.954478.44636.63710634830 200519613.415548868397.855029.34766.23881833442 200621522.315214972522.155750.54927.74109131941 200724658.115346476589.656518.35107.84899230731 200828044.215626682190.458471.752393999029923 200930777.515861487496.159261.45404.44721428890 201036941.116067592780.560347.75561.73742627931 表2-2 符号说明 变量符号 y农业总产值/亿元 x1农作物总播种面积/千公顷 x2农用机械总动力/万千瓦 x3有效灌溉面积/千公顷 x4化肥使用总量/万吨 x5受灾面积/千公顷 x6从业人数/万人 第3章 数据处理及结果分析 3.1 数据处理 将原始数据输入到统计分析软件IBM SPSS Statistics 20中进行逐步回归分析,所得结果列于表3-1至3-3。 表3-2 方差分析表 模型平方和df均方FSig. 回归1880183252.2101 1880183252.21 0 365.255.000b 残差113246845.623225147583.892 1 总计1993430097.83323 回归1907072167.3222 953536083.661231.875.000c 残差86357930.511214112282.4052 总计1993430097.83323 回归1937326296.1453 645775432.048230.207.000d 残差56103801.688202805190.0843 总计1993430097.83323 回归1929158302.1332 964579151.067315.164.000e 残差64271795.700213060561.7004 总计1993430097.83323 a. 因变量: y b. 预测变量: (常量), x2 c. 预测变量: (常量), x2, x6 d. 预测变量: (常量), x2, x6, x4 e. 预测变量: (常量), x6, x4 表3-1 模型汇总 更改统计量模型RR 方调整 R 方标准 估计的误 差 R 方更改F 更改df1df2Sig. F 更改 1.971a.943.9412268.829.943365.255122.000 2.978b.957.9532027.876.0136.539121.018 3.986c.972.9681674.870.01510.785120.004 4.984d.968.9651749.446-.0042.912120.103 a. 预测变量: (常量), x2 b. 预测变量: (常量), x2, x6 c. 预测变量: (常量), x2, x6, x4 d. 预测变量: (常量), x6, x4 e. 因变量: y 北京航空航天大学应用数理统计论文 第3章 数据处理及结果分析 5 表3-3 系数 非标准化系数标准系数共线性统计量模型 B标准 误差试用版 tSig. 容差VIF (常量)-5222.1661119.176-4.666.000 1 x2.395.021.97119.112.0001.0001.000 (常量)6848.6334825.3551.419.170 x2.378.020.92919.194.000.8811.1352 x6-.329.129-.124-2.557.018.8811.135 (常量)16339.2184922.8733.319.003 x2.131.077.3221.706.103.03925.353 x6-.732.162-.275-4.509.000.3772.652 3 x44.3251.317.5853.284.004.04422.561 (常量)21898.4233854.9735.681.000 x6-.950.105-.357-9.080.000.9901.0104 x46.522.291.88222.410.000.9901.010 a. 因变量: y 由上述计算结果可以得出,通过逐步分析获得的最优模型为:y=21898.423 +6.522x4- 0.95x6。最终模型的复相关系数R=0.984,决定系数R2=0.968,说明回归方程显 著。 3.2 结果分析 (1)逐步回归过程分析: 此次逐步回归选定的标准为偏F统计量概率值(即各表中的sig.),当sig. 0.05时选入相应变量,当sig.0.1时剔除相应变量。SPSS给出的回归过程如下 表。 表3-4 输入移去的变量 模型输入的变量移去的变量方法 1x2. 步进(准则: F- to-enter 的概率 = .100)。 2x6. 3x4. 4. x2 a. 因变量: y 表3-5 已排除的变量 共线性统计量模型Beta IntSig.偏相关 容差VIF最小容差 x1.126b1.476.155.307.3352.987.335 x3.130b.445.661.097.03131.779.031 x4-.023b-.140.890-.030.1049.653.104 x5-.032b-.559.582-.121.8161.225.816 1 x6-.124b-2.557.018-.487.8811.135.881 x1.139c1.877.075.387.3332.999.313 x3.409c1.545.138.327.02836.214.026 x4.585c3.284.004.592.04422.561.039 2 x5-.002c-.042.967-.009.7721.295.772 x1.087d1.314.204.289.3083.246.039 x3.170d.695.496.157.02441.303.0213 x5-.032d-.729.475-.165.7401.351.036 x1.089e1.282.215.275.3083.246.308 x3.297e1.668.111.349.04522.396.045 x5-.049e-1.135.270-.246.8001.250.800 4 x2.322e1.706.103.356.03925.353.039 a. 因变量: y b. 模型中的预测变量: (常量), x2 c. 模型中的预测变量: (常量), x2, x6 d. 模型中的预测变量: (常量), x2, x6, x4 e. 模型中的预测变量: (常量), x6, x4 显然,由于x2与y高度相关,所以逐步回归的第一个模型将x2选入,随后根 北京航空航天大学应用数理统计论文 第3章 数据处理及结果分析 7 据偏F概率值的大小依次选入或剔除变量。 (2) 异方差分析: SPSS输出的残差分析结果如下。由表3- 6可知,标准化残差值基本在3之间,说明数据稳定,无奇异值。由标准化残差 直方图和P-P图可知,残差分布基本符合正态分布特征。 表3-6 残差分析 极小值极大值均值标准 偏差N 预测值756.7131632.2914249.929158.40924 残差-2165.1435308.709.0001671.65424 标准 预测值-1.4731.898.0001.00024 标准 残差-1.2383.035.000.95624 a. 因变量: y 图3.1 标准化残差直方图 图3.2 标准化残差标准P-P图 (3) 多重共线性分析: 由表2- 3中给出的VIF值可知,在逐步回归分析中建立的这四个模型中,第三个模型存 在较为严重的多重共线性问题(VIF2=25.353,VIF4=22.561,均大于10).第四 个模型在剔除了变量x2后,多重共线性问题消失。由此推测,第三个模型较第 四个模型更为显著的现象(R3R4)可能是由于多重共线性导致的 北京航空航天大学应用数理统计论文 第4章 模型分析与讨论 9 第4章 模型分析与

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论