




已阅读5页,还剩6页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
盐城师范学院毕业论文(设计)1多元线性回归模型的概念及基本假设1.1多元线性回归模型的概念 多元线性回归模型是用两个或两个以上的解释变量来解释因变量的一种模型。设为因变量,为k个用来说明的被称为解释变量的不同变量,其中恒等于1,则 (1)式称为多元线性回归模型。其中,为随即扰动项;参数称为回归系数。若令,则(1)式可用矩阵形式表示为: (2)式。1.2多元线性回归模型的基本假设1.2.1 随机扰动项的数学期望为零即,这意味着为线性回归模型(2)的总体回归函数。1.2.2 随机扰动项的方差相等即,也称为同方差性。1.2.3 随机扰动项和解释变量不相关数学表达式为:。1.2.4 解释变量之间不存在多重共线性所谓多重共线性是指解释变量之间存在完全或近似完全的线性相关。1.2.5 随机扰动项为服从正态分布的随机向量2多元线性回归模型的参数估计 要想确定多元线性回归模型,则必须估计出回归系数的值。在回归分析中,使用最广泛的方法是最小二乘法,一般称为普通最小二乘法,即使残差平方和最小的回归系数的估计。设与总体回归模型(1)式对应的样本回归模型为: (4)式,或用矩阵表示为:,其中为总体回归系数的最小二乘估计,为残差向量。根据最小二乘法的定义,在线性样本回归模型中,使残差平方和最小的回归系数的估计称为最小二乘估计。即使最小的。其中是的转置。为使最小,可将看作是的函数,则其关于的一阶偏导数必须为零,即,因此得到方程,所以。虽然计算过程十分复杂,但是在如今的计算机时代可以运用相关的统计软件(如Eviews3.0)对回归系数进行估计。3回归系数及回归方程的显著性检验3.1 回归系数的显著性检验 运用上面的计算方法或者通过计算机的运行可以得出回归系数的估计,但所估计的回归系数在给定的显著性水平下是否具有显著性呢?这需要给予相应的显著性检验,通常是构造统计量。那么在进行检验过程中需遵循以下四个步骤:提出原假设和备择假设:原假设,备择假设;作统计量:,其中为的标准差;根据样本数据和原假设计算统计量的值;将统计量的值与临界值相比较,若的绝对值大于临界值,则需拒绝原假设,说明显著不为零。反之,则需接受原假设,说明显著为零。3.2回归方程的显著性检验 在已知回归系数的条件下,还需对整个回归方程进行显著性检验。在对整个回归方程进行显著性检验时通常是构造统计量,类似的,检验时仍需四个步骤:提出原假设和备择假设:原假设,备择假设;作统计量:,其中SSR为残差平方和,SSE为回归平方和,(k-1),(n-k)分别为SSR,SSE的自由度;根据样本数据和原假设计算统计量的值;将统计量的值与临界值相比较,若的值大于临界值,则需拒绝原假设,说明回归方程显著。反之,则需接受原假设,说明回归方程不显著。4多元线性回归模型的应用4.1 城乡居民收入差距的因素分析及数据收集4.1.1 影响城乡居民收入之比的因素分析影响城乡居民收入差距的因素有多种,本文考虑了七种相关的因素:a. 城乡二元结构系数() 一般是指以社会化生产为主要特点的城市经济和以小生产为主要特点的农村经济并存的经济结构,我国城乡二元经济结构主要表现为:城市经济以现代化的大工业生产为主,而农村经济以典型的小农经济为主。不同的生产对象必然会导致收入的差距的产生。b.城镇化水平() 指一个地区城镇化所达到的程度,简单地说就是城市人口在总人口中的比例。它是区域经济发展程度的重要标志。一个地区城镇化水平越高,则城乡居民收入差距就越小;反之,就会越大。c.人均GDP增长率() 常作为衡量经济发展状况的指标,是重要的宏观经济指标之一,将一个国家核算期内(通常是一年)实现的国内生产总值与这个国家的常住人口相比进行计算,得到人均国内生产总值。再将各年的人均国内生产总值进行环比计算。人均GDP增长率越高,则居民收入就越高;反之,则越低。d.财政支农比率() 是指政府为巩固农业的基础地位和促进整个国民经济的协调稳定发展,通过财政投入、农业税收、财政补贴等政策手段,实现对农业的指导、鼓励、帮助和管理。显然财政支农比率越高,农民的收入就越高,城乡居民收入差距就越小;反之,差距则会越大。e.农村金融发展水平() 农村金融在我国一般是指在县及县以下地区提供的存款、贷款、汇兑、保险、期货、证券等各种金融服务,其发展目的是促进农村经济发展。从而,农村金融发展水平越高,农村经济发展就越好,农民的收入就越高,城乡居民收入差距就越小;反之就会越大。f.产业结构() 是指各产业的构成及各产业之间的联系和比例关系,目前分为第一、二、三产业。第一产业仅包括农、林、牧、渔业;第二产业包括采矿业、制造业、电力、燃气及水的生产和供应业、建筑业;第三产业包括除第一、第二产业之外的其他各行业部门。若产业结构协调发展,城乡居民收入差距就会缩小,反之,就会扩大。g.就业结构() 就业结构又称社会劳动力分配结构,一般是指国民经济各部门所占用的劳动数量、比例及其相互关系。这一结构考察的是就业人口在国民经济各部门的分布,在产业结构中说到,若产业结构越协调,则就业人口在各部门的分布就越均衡,从而城乡居民收入差距就越小,反之,就会越大。4.1.2 数据收集本文讨论的重点是城乡居民收入差距的影响因素,即城乡居民收入差距代表了因变量,各影响因素就是自变量。城乡居民收入差距和各影响因素的数据均以黑龙江统计年鉴与新中国55年统计资料汇编中的1978年至2008年的相应数据为准。各项具体数据如表4-1所示。表4-1 黑龙江省城乡收入差距及其影响因素数据年份城乡居民收入之比(%)城乡二元结构系数(%)城镇化水平(%)人均GDP增长率(%)财政支农比率(%)农村金融发展水平(%)产业结构(%)就业结构(%)19782.653.6335.910.3714.5119.8376.547.3619792.43.0837.35.3217.2820.7276.351.1219802.052.6438.516.8417.620.137553.2219811.892.4139.42.1617.9929.0374.754.719821.832.339.97.4817.6133.2874.455.7419831.341.974110.3717.3929.1471.556.0119841.622.034214.0315.5433.437357.0319851.862.5342.910.7413.0339.8778.358.7919861.742.343.911.9610.4935.5276.959.119871.882.6544.912.2811.6540.828060.2619881.823.0445.92010.1242.6582.961.5119892.133.7346.912.8610.6645.3485.160.5419901.592.274812.1710.7828.9277.660.419911.892.814913.918.4636.518261.8219921.722.7650.115.678.8426.5982.663.2319931.913.1151.323.738.5317.4983.461.8319941.862.4852.432.798.2216.028163.2119951.912.5453.723.05815.1781.463.2219961.732.4353.818.148.3114.6681.364.119971.772.6253.911.778.1815.7582.764.6819981.895.17543.3910.3419.3984.551.3819992.126.354.22.758.629.0386.851.1620002.297.2851.99.459.4823.4687.849.7920012.386.9352.47.318.9122.9787.249.4820022.546.7752.67.29.123.78749.6220032.667.4152.611.57.3425.3587.648.7220042.496.5552.817.027.8427.4687.551.6920052.57653.115.957.132.3887.654.0120062.595.9953.512.437.5934.6187.954.8220072.485.2253.913.86834.958756.320082.385.0855.417.588.6232.5986.956.61 数据来源:黑龙江统计年鉴与新中国55年统计资料汇编4.2 模型建立与数据处理4.2.1 建立模型根据多元线性回归模型的定义,在经济学上研究一个变量的变化受多个因素的影响时,往往会考虑建立多元线性回归模型进行研究分析。综上所述,可以以城乡居民收入之比(%)Y为因变量,各影响因素为解释变量建立多元回归模型为:,其中,是回归系数,表示在其他影响因素保持不变的情况下,变化一单位时城乡居民收入之比(%)平均变动的单位数。为常数项,为随机扰动项。4.2.2 数据处理本文通过计量经济学软件Eviews3.0和EXCEL进行分析,输出结果见表4-2和表4-3。 表4-2 运行结果(一)Dependent Variable: YMethod: Least SquaresDate: 05/02/12 Time: 12:20Sample: 1978 2008Included observations: 31VariableCoefficientStd. Errort-StatisticProb. C0.3697552.0000200.1848760.8549X1-0.1391330.131882-1.0549820.3024X2-0.0372820.018274-2.0401470.0530X30.0124810.0066791.8688610.0744X4-0.0185760.027536-0.6745990.5067X5-0.0023080.004856-0.4754150.6390X60.0977200.0298713.2714370.0034X7-0.0680290.032470-2.0951260.0474R-squared0.841845 Mean dependent var2.063871Adjusted R-squared0.793711 S.D. dependent var0.361512S.E. of regression0.164195 Akaikin focriterion-0.557884Sum squared resid0.620083 Schwarz criterion-0.187822Log likelihood16.64720 F-statistic17.48961Durbin-Watson stat1.229259 Prob(F-statistic)0.000000表4-3 运行结果(二) 变量间的相关性YX1X2X3X4X5X6X7Y1X10.7911X20.2440.5621X3-0.143-0.2640.2701X4-0.317-0.513-0.912-0.3841X5-0.039-0.041-0.200-0.1690.0821X60.6280.8240.8450.084-0.8530.0041X7-0.672-0.6880.1440.593-0.2080.092-0.1851由表4-2可得多元线性回归方程 (0.184876)(-1.054982)(-2.040147)(1.868861)(-0.674599)(-0.475415) (3.271437)(-2.095126) 其中是拟合优度,值用来检验是否存在自相关,对回归方程检验,检验是要检验总体回归方程是否显著,并对每个参数检验,检验是要检验是否对某个存在线性相关关系。不太接近于1,表明数据线性拟合程度不高,,这又说明了回归方程是显著的,产生矛盾。再看表4-3,观察相关系数矩阵,发现城镇化水平和二元结构系数、财政支农比率和二元结构系数、城镇化水平和产业结构、财政支农比率和城镇化水平、产业结构和财政支农比率之间的相关系数都非常高,初步断定自变量间可能存在多重共线性。4.2.3 逐步回归逐步回归的基本思想是逐个引入自变量,每次引入对影响最显著的自变量,并对方程中的老变量逐个进行检验,把变为不显著的变量逐个从方程中剔除掉,最终得到的方程中既不漏掉对影响显著的变量,也不包含对影响不显著的变量。将每个解释变量带回原回归方程,继续用计量经济学Eviews3.0先选出一个最优的解释变量(结果见表4-4)。表4-4 回归结果分析(一)变量检验经济意义0.626024显著合理0.059396显著合理0.020455显著合理0.100342显著合理0.001522不显著合理0.394210显著不合理0.451586显著合理表中结果表明、5个解释变量通过了检验并且经济意义也比较合理,但就拟合优度而言第一个回归方程是最优的,所以选择第一个为基本回归方程。将选出了的继续引入其他解释变量,用Eviews3.0选出另外的解释变量(结果见表4-5)。表4-5 回归结果分析(二)变量检验经济意义0.685144显著合理0.630701不显著合理0.636901显著合理0.626063不显著不合理0.627827不显著不合理0.657041显著合理表中结果很显然引入之后,都通过了检验并且经济意义也同样合理,但就拟合优度而言的回归方程是最优的,所以选择第一个和第二个为基本回归方程。在基础上继续重新引入其他解释变量,用Eviews3.0选出其他的解释变量(结果见表4-6)。表4-6 回归结果分析(三)变量检验经济意义0.738091显著不合理0.737417显著不合理0.688727显著合理0.756753不显著合理0.692028不显著不合理表中结果很明显,在引入之后,拟合优度进一步提高,检验也是显著地,经济意义也合理。同理将三个解释变量也引入回归方程。同理在基础上得出如表4-7所示的结果。表4-7 回归结果分析(四)变量检验经济意义0.739643不显著合理0.752217显著不合理0.793687显著合理0.711294显著不合理 由表4-7结果可知在基础上增加变量后,拟合优度明显提高,同样通过了检验,其经济意义也是合理的。再将四个解释变量引入回归方程。同理在基础上得出如表4-8所示的结果。表4-8 回归结果分析(五)变量检验经济意义0.810116不显著合理0.800245不显著合理0.806465不显著不合理由表4-8结果显示,在基础上增加变量后虽然拟合优度再一次的提高,但是检验未能通过并且的经济意义也不合理。因而最后的回归结果为表4-9所示。 表4-9 运行结果(三)Dependent Variable: YMethod: Least SquaresDate: 05/02/12 Time: 15:53Sample: 1978 2008Included observations: 31VariableCoefficientStd.Errort-StatisticProb. C-1.5295081.099218-1.3914510.1759X10.0831400.0359702.3113480.0290X2-0.0574620.012569-4.5717080.0001X5-0.0091490.004241-2.1574240.0404X60.0770220.0211783.6369220.0012R-squared0.793687 Mean dependent var2.063871Adjusted R-squared0.761946 S.D. dependent var0.361512S.E. of regression0.176385 Akaikeinfo criterion-0.485609Sum squared resid0.808900 Schwarz criterion-0.254321Log likelihood12.52694 F-statistic25.00546Durbin-Watson stat0.738860 Prob(F-statistic)0.000000表4-9可见,样本决定系数=0.794,且=25.005,显著性值0.000,通过检验,拟合优度良好。同时,由表7可知所有系数的估计值都通过了检验且经济意义均合理,最后得到最优的回归方程:。4.3 运算
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 佛山建筑改造施工方案
- 统编版(2024)道德与法治七年级下册第一单元 珍惜青春时光 单元测试卷(含答案)
- 公墓焚烧房施工方案
- 饲养池施工方案
- 中级葡萄酒知识培训课件
- 2025届浙江省宁波市北仑区重点达标名校中考生物模拟试卷含解析
- 中国黄金回购合同范例
- 个人独资出资协议合同范例
- 学期安全教育与培训计划
- 高危地区保安人员的培训需求计划
- 2024年09月宁夏宁夏黄河农村商业银行系统社会招考笔试历年参考题库附带答案详解
- 团队赋能培训
- 2025年广东广州市黄埔区第二次招聘社区专职工作人员高频重点提升(共500题)附带答案详解
- 第一单元第2课《人工智能应用》说课稿 2023-2024学年浙教版(2023)初中信息技术八年级下册
- 2025年写人要抓住特点
- 数字化转型赋能制造业企业高质量发展
- 深筋膜徒手松解疗法
- 皮肤病学测试题含参考答案
- 《社会支持理论》课件
- 人工智能教育应用的伦理风险及其应对方案
- 幼儿园大班健康活动《爱护眼睛保护视力》课件
评论
0/150
提交评论