线性回归模型在工业生产总值预测中应用_第1页
线性回归模型在工业生产总值预测中应用_第2页
线性回归模型在工业生产总值预测中应用_第3页
线性回归模型在工业生产总值预测中应用_第4页
线性回归模型在工业生产总值预测中应用_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、南 昌 工 程 学 院毕 业 设 计 (论 文) 理学系 系(院) 信息与计算科学 专业论文题目 多元回归模型及其在工业生产总值预测中的应用研究学生姓名 班 级 学 号 指导教师 多元回归模型及其在工业生产总值预测中的应用研究Multiple regression model and its application in industrial production prediction总计 论 文 26 页 表 格 7 个 插 图 2 副摘 要 经济指标预测是一项具有挑战性的研究工作。本文利用多元回归模型研究经济指标影响因素,并为资源优化配置提供一定参考意见。以中国各省制造业工业生产总值为研究

2、对象,依据背景知识选取七个自变量:朔料制品、水泥、玻璃、原煤、生铁、粗钢、钢筋、盘条,建立多元线性回归模型。再通过观测获取n组观测数据,应用最小二乘法求出回归参数估计值。运用回归方程的显著性检验,回归系数的显著性检验,多重共线性检验,异方差检验等检验方法法删除不符合线性关系的自变量或得到更符合实际关系的多元线性模型。关键词:工业生产总值,多元回归模型,资源优化配置,经济预测。AbstractEconomic index prediction is a challenging research work. In this paper, using multivariate regression

3、model of factors influencing economic index, and optimal allocation of resources to provide a certain reference. In China manufacturing industry gross industrial production as the research object, based on the background knowledge of selected seven variables: Schaumburg material products, cement, gl

4、ass, coal, pig iron, crude steel, rebar, wire rod, established a multiple linear regression model. Through observation to obtain the N groups of observation data, the application of the least squares method to get regression parameter estimation. Application of significance test of regression equati

5、on the significance test of regression coefficients, the multicollinearity of inspection, testing for heteroscedasticity test method to delete not consistent with the linear relationship between variables or get more accord with real relationship in the multivariate linear model.Key word: Gross indu

6、strial production; multiple regression model;optimize the allocation of resources;economic forecasting.目 录 TOC o 1-3 h z u HYPERLINK l _Toc326224939摘 要 PAGEREF _Toc326224939 h - = 1 * ROMAN I -HYPERLINK l _Toc326224940Abstract PAGEREF _Toc326224940 h - = 2 * ROMAN II -HYPERLINK l _Toc326224941第一章 引言

7、 PAGEREF _Toc326224941 h - 1 -HYPERLINK l _Toc3262249421.1 工业生产总值简介 PAGEREF _Toc326224942 h - 1 -HYPERLINK l _Toc3262249431.2回归分析思想 PAGEREF _Toc326224943 h - 2 -HYPERLINK l _Toc326224944第二章 多元线性回归模型 PAGEREF _Toc326224944 h - 3 -HYPERLINK l _Toc326224945第三章 多元线性回归的参数估计 PAGEREF _Toc326224945 h - 5 -HY

8、PERLINK l _Toc3262249463.1 参数的最小二乘估计 PAGEREF _Toc326224946 h - 5 -HYPERLINK l _Toc3262249473.2 最小二乘估计的性质 PAGEREF _Toc326224947 h - 6 -HYPERLINK l _Toc326224948第四章 模型的检验及修正 PAGEREF _Toc326224948 h - 7 -HYPERLINK l _Toc3262249494.1 回归方程的显著性 PAGEREF _Toc326224949 h - 7 -HYPERLINK l _Toc3262249504.2 回归系

9、数的显著性 PAGEREF _Toc326224950 h - 8 -HYPERLINK l _Toc3262249514.3 多重共线性检验 PAGEREF _Toc326224951 h - 9 -HYPERLINK l _Toc3262249524.4 异方差检验 PAGEREF _Toc326224952 h - 11 -HYPERLINK l _Toc3262249534.5异方差的修正方法 PAGEREF _Toc326224953 h - 12 -HYPERLINK l _Toc326224954第五章 回归拟合度 PAGEREF _Toc326224954 h - 14 -HY

10、PERLINK l _Toc3262249555.1 决定系数 PAGEREF _Toc326224955 h - 14 -HYPERLINK l _Toc3262249565.2 决定系数的性质和修正决定系数 PAGEREF _Toc326224956 h - 15 -HYPERLINK l _Toc326224957第六章 工业生产总值预测模型分析 PAGEREF _Toc326224957 h - 17 -HYPERLINK l _Toc3262249586.1 SPSS简介 PAGEREF _Toc326224958 h - 17 -HYPERLINK l _Toc3262249596

11、.2模型建立和数据搜集 PAGEREF _Toc326224959 h - 17 -HYPERLINK l _Toc3262249616.3基于SPSS的回归分析实现 PAGEREF _Toc326224961 h - 19 -HYPERLINK l _Toc3262249626.4统计检验 PAGEREF _Toc326224962 h - 19 -HYPERLINK l _Toc3262249636.5异方差检验及修正 PAGEREF _Toc326224963 h - 21 -HYPERLINK l _Toc3262249646.6 模型意义 PAGEREF _Toc326224964

12、h - 22 -HYPERLINK l _Toc326224965结 论 PAGEREF _Toc326224965 h - 24 -HYPERLINK l _Toc326224966参 考 文 献 PAGEREF _Toc326224966 h - 25 -第一章 引言随着科学技术的进步和社会的发展,在处理工业、经济、农业和医学等方面的问题的时候,需要研究影响问题的多个因素是如何作用于实际问题的,以及这些因素相互之间的关系。也就是因为实际问题大都是多因素影响的,所以我们主要致力于研究如何用多元回归分析解决问题。多元回归分析是一种综合分析方法,它依靠统计软件能很方便的对问题进行分析,所以随着电

13、子计算机技术的普及,它的应用越来越广泛。1本文先对工业生产总值和回归分析的思想进行简要介绍,然后描述了如何通过最小二乘法建立多元回归模型,再通过回归方程显著性、回归系数显著性、多重共线性检验和异方差检验等显著性检验法对求得的多元回归模型进行检验最后得到最终模型。本文主要是先阐述多元回归分析的理论知识,然后运用这些知识应用到具体的问题中。用SPSS软件求出工业生产总值预测的回归模型。通过该模型就可以知道在我国主要的制造业哪个行业对工业生产总值影响最重,哪个行业对工业生产总值影响最轻。如此在进行资源分配时就可以优先对影响重的行业优先分配。本文参考了许多相关的书籍和文献,但由于作者的水平有限,本文存

14、在一些纰漏,希望能得到完善。1.1 工业生产总值简介工业生产总值是以货币的形式表现出在一个报告期内工业企业的产品的总量,它是在国家一年终了时进行工业产品统计中是很重要的一项指标,可以使政府从数值上了解一个地区的工业生产规模、一个地区经济繁荣程度,如果这项指标出现错误将会影响到国家对工业产品一年增加值以及工业产品销售率等指数的计算。因此对工业生产总值进行预测是一件非常重要、有意义的事,如果我们能够做好对一个地区的工业生产总值的预测有助于政府制定国民经济发展计划,合理分配有限资源。5 当我们在计算工业生产总值时根据所用的价格不同,可以分为不变价工业生产总值和现价工业生产总值。所谓不变价工业生产总值

15、就是在计算各个不同时期的工业生产总值时,对某一种产品先选定曾经某一个时期的工业产品的价格作为标准,而其他时期的这种产品也以这个标准计算其生产总值,我们把这个标准叫做不变价。采用不变价计算工业生产总值可以使我们计算现在和将来的价格有一个恒定的比较标准,消除了价格变动的影响;现价工业生产总值则是在计算工业生产总值时,采用计算的当年产品实际销售价格计算工业生产总值。工业生产总值的构成包括:成品价值、对外加工费收入、自制半成品、在产品期末期初差额价值。1.2回归分析思想多元回归分析思想是一种在现实生活中应用性很强的思想。它是人们依靠已掌握的知识和经验通过定性分析寻找出与要研究的问题有关的变量,再通过收

16、集大量的数据,用数理统计的方法对这些数据进行观测,并应用一定的方法来确定各变量之间的关系的科学方法。因为现实生活问题大多涉及多个影响因素,所以这种思想经常用到。9回归问题根据变量之间是否存在线性关系可以分为线性回归和非线性回归,又根据变量的数量可以分为一元回归和多元回归,而我们所研究的实际问题大多都是多元非线性回归,而我们并没有合适的方法直接对多元非线性回归进行研究,因此我们要找到合适的模型和方法将多元非线性回归转变为多元线性回归。7回归分析预测时先对所要研究的经济预测对象进行定性分析,找出研究对象的一个或多个影响因素,再去掉那些对经济问题影响很小的因素,留下影响大的因素。然后引进待定系数b,

17、建立待定回归方程。最后搜集研究对象及其影响因素的数据,再对这些数据进行定量分析,求出待定系数b,最后得到预测回归模型。6第二章 多元线性回归模型我们可以把一元线性回归看作是多元线性回归的一个特例,其模型一般形式是:。多元线性回归是描述一个因变量和多个自变量的关系。我们可以设已知自变量和因变量y,多元线性回归模型的一般形式是: 2-4 (2.1) 公式中的,是回归系数,它们是待估计参数,u是随机变量。因为我们进行回归分析需要N组观测值()k=1,2,3N.给出回归分析系数的估计值,则多元样本回归函数为: (2.2)回归残差为因变量与其估计值的差: 。 (2.3) 将上面所说的N组观测值代入方程则

18、可得N个方程,如下:其中是N个相互独立且服从同一正态分布的随机变量。设, , , 则矩阵方程为:。模型假设由于现实动力系统错综复杂,很难建立相应的多元回归模型,如果我们建立的模型存在错误则最后得到的结果很难保证它的价值和有效性,当我们用这些错误的模型应用到实际问题中进行预测时,就会做出错误的决断。为了保证所建立的模型的准确性,需要对模型做如下假设:20因变量和自变量存在线性关系:,是随机误差项。2. 随机误差项 的方差的大小与k无关,为一个常数。, k=1,2,N成立。3. ,k=1,2,N成立。即各组的观测值的随机误差项的数学期望为零。4. 随机误差项服从正态分布。5. 对不同组的数据求得的

19、随机误差项是线性不相关的,即。6. 对每一个解释变量与任何一个随机误差项都是线性不相关, 即 。第三章 多元线性回归的参数估计3.1 参数的最小二乘估计与一元线性回归方程的参数估计原理是一样的,多元线性回归方程的未知参数,的估计方法也可以用最小二乘估计法。所谓最小二乘估计法,就是寻找出,的估计值,使,的离差平方和最小,那么,满足条件 8 (3.1)可以求得回归参数,的最小二乘估计值,。 因为Q是关于,的非负二次函数,它的最小值总是存在的,应该满足下列方程组:引进参数估计量,解释变量回归值,回归残差.然后把样本数据代入回归方程可得:则回归残差项的向量为:残差平方和的向量为: 。求对,的偏导数得:

20、 。整理得: 当的逆矩阵存在时,最小二乘估计可以表示为: 。10-123.2 最小二乘估计的性质多元回归分析的最小二乘估计的性质有以下几点:线性,即估计量为随即变量Y的线性函数.在多元线性回归中,回归系数的估计量 ,根据模型假设知道,X是固定的矩阵,故与Y是线性关系。 无偏性,即与B是无偏估计。 , 和是无偏估计。. 在满足和的条件下,B的线性函数的最小方差线性无偏估计为 , 是任一(p+1)维常数向量。 .说明估计值与残差值u是不相关的。 当满足时,,和独立。第四章 模型的检验及修正面对实际问题中错综复杂的关系的研究,我们并不能事先判断变量y与变量之间是否有线性关系。在进行回归参数估计前,用

21、方程去拟合因变量y与自变量的关系,这只是我们经过定性分析做出的假设,而定性分析的自主性很强,所以这样得到的回归方程很可能存在错误,并不能作为最终的结果。因此在我们求出线性回归方程后,为了消除一些错误的变量给回归方程带来的影响,我们还需要对方程进行显著性检验。4.1 回归方程的显著性 多元线性回归方程的显著性检验就是进行模型总体显著性检验,要看从整体上是否对随机变量y有影响。我们可以做出假设 13如果H0被接受,则表明因变量y与自变量的线性回归模型没有意义。通过总离差平方和分解法,可以构造对H0进行检验的统计量。 (4.1)我们引进三个新的变量,。并设置为:总的偏差平方和: 回归平方和: 残差平

22、方和: 平方和分解式可简写为: 构造F检验统计量 15,16 (4.2)对于给定的显著水平a,当F值大于临界值时,拒绝H0,回归方程显著,即x与y有显著的线性关系。4.2 回归系数的显著性 本节主要研究每个自变量是否对应变量y的影响显著,这就需要对每个自变量进行显著性假设:, j=1,2,p若接受H0j,则不显著;若拒绝,则显著。设,令,i,j=0,1,p,可知,由此可构造统计量t 15,16其标准差 (4.3)当成立,统计量服从n-p-1的t分布。给定显著性水平a,当,拒绝假设,对y影响显著;当,接受假设,对y影响不显著。4.3 多重共线性检验多重共线性的介绍: 如今我们所研究的经济问题复杂

23、性很高,各个因素之间都可能存在线性或非线性关系。如果只是关注因变量和自变量的线性关系还不能说明问题的复杂性,因为除了因变量和自变量存在线性关系,自变量之间也存在线性关系,这就是多重共线性。多元线性回归模型的矩阵形式为,我们对自变量X的基本假定是矩阵的各列向量是线性无关的。即,相当于。当假定不满足时,我们称该模型存在多重共线性,多重共线性有两种:完全多重共线性,即, 不存在不完全多重共线性 ,即, 对角线元素比较大。在实际问题中大多是这种情况。多重共线性检验方法一. 直观判断法: 1. 观察求得的参数的最小二乘估计值,如果发现这些估计值不符合我们所研究的实际情况或经济理论,那么该模型就可能存在多

24、重共线性。2. 当我们改变样本的观测值,增加或者减少变量,观察参数的估计值随着的变化,变化明显就说明该模型存在多重共线性。3. 通过观察回归方程的系数与其相对应的单相关系的正负符号,如果它们的符号相反,则该模型存在二. 单相关系数矩阵法该方法比较简单,就是先计算出两个自变量之间的相关系数,再将计算出的结果制作成一张矩阵表。当两个自变量的相关系数r0.8时,一般可以判定该模型存在多重共线性。三. t检验法首先求出每个系数的方差,然后用它的平方根即标准差除回归系数,得 (4.4) 给出一定的置信水平a,将计算值与从t分布表上查到的理论值进行比较.当计算值的绝对值,则该回归系数通过显著性检验,它不会

25、引起多重共线性;当计算值的绝对值,该系数没有通过显著性检验,它会引起多重共线性。 四. 辅助回归模型检验 将模型的每个解释变量对其他变量进行回归,在计算出拟合优度当某个拟合优度比较大,则该解释变量xi与其他解释变量存在共线性。多重共线性的克服和处理方法:当得到的回归方程存在多重共线性,则我们应该想方法消除或者减轻导致存在多重共线性的解释变量的影响。处理方法有: 删减变量法,就是根据以下几点原则删除多元回归方程的某个自变量。 eq oac(,1). 这个自变量应该是与因变量之间的相关系数最小的。 eq oac(,2). 在求得的相关系数中,删除相关系数高的自变量中的一个。 eq oac(,3).

26、 当某个自变量xi的回归系数与其单相关系正负符号相反,应该删除这个自变量。eq oac(,4). 对于没有通过t检验的自变量的回归系数所对应的自变量应该删除。 变换模型形式法假设自变量和线性相关,原模型形式为:模型滞后一期得:两式相减得: 令 ; ; ; ; 则上式可写为: (4.5)与的共线性将减弱。4.4 异方差检验在前面模型假设中提出了六条基本假设,当模型符合上述六条假设时。应用最小二乘法求得的参数估计量是无偏的、有效的。但在研究实际经济问题时,很难完全满足着六条基本假设。当违背了第二项基本假设,那么应用最小二乘法求得的参数估计量就可能不是无偏的、有效的,甚至我们都不能求得参数估计量。这

27、里我们要研究模型违背了上述第二条基本假设的问题,我们称这个为异方差性问题。异方差性的后果:21一. 参数估计量非有效 对参数估计量进行无偏性和有效性的证明中,当模型出现异方差性,其最小二乘法参数的估计量仍然具有无偏性,但是不具有有效性。 因为在有效性的证明中利用了同方差性条件,I为n阶单位矩阵。所以参数估计量不再具有有效性。 二变量的显著性检验失去意义 在多元线性回归模型的显著性检验的t检验中,构造的统计量t中包含有随机误差项共同的方差,并且有t 统计量服从t(n-p-1) 分布。如果出现了异方差性, t检验就没有意义了。采用其它检验也是如此。 三. 模型的预测失效 在预测值的置信区间a中包含

28、有随机误差项共同方差。所以当模型出现异方差性时,它的预测功能将失效。 异方差性的检验 异方差性检验就是检验随机误差项的方差和解释变量、观测值之间的相关性。检验法有以下几种: G o l d f e l d Qu a n d t 检验, 把按绝对值的大小分为两组,参照分组把模型的观测值分为两组。用 ,分别表示样本容量。在这两组中,分别用最小二乘法,求出两组样本的误差项方差估计和,当假设 成立时, 的绝对值小的一组的与的绝对值大的一组的进行比较,应该有,用和定义F统计量: 该统计量F在误差项方差一定的零假设下,服从F分布。对给定的显著性水平, 当,拒绝零假设,也就是异方差性存在。当 ,接受零假设,

29、即随机误差项为同方差。 图示法检验首先假设不存在异方差性,对模型进行最小二乘法估计,因为残差是可以看成误差项的估计,做出解释变量与残差平方的散点图, 根据图形的类型来判断异方差是否存在。图形如下: 图(1):异方差检验示意图图( a )中,与x之间没有可观察到的系统模式,表明模型中不存在异方差。图( c )表明与变量x之间存在线性关系,图( b )、( d )、( e )表明与x间存在比较复杂的关系。如果残差的平方 与x间呈现( b )( e )中的任意一种关系, 则数据中可能存在异方差。4.5异方差的修正方法加权最小二乘法:加权最小二乘法就是对原模型进行加权以消除模型存在的异方差性,使原模型

30、变成一个新的模型,在对这个新模型采用最小二乘法估计其参数。设线性回归模型:; 即随机误差项的方差与解释变量存在线性相关性, 则可以用 去除原模型, 使之变成如下形式的新模型: t=1,2n (4.6)对该模型有:即新模型存在同方差性。于是可以用最小二乘法估计其参数,得到关于参数,是无偏的、有效的估计量。这就是加权最小二乘法,在这里权就是 。第五章 回归拟合度所谓的回归拟合度检验就是对我们已经制作好的预测模型进行检验,并比较它们的预测结果与实际发生情况的吻合程度。结果与实际的吻合程度就是求得的回归直线与观测到的样本数据的拟合程度。拟合度可以判断一个回归模型所得到的结果的好坏,拟合度越高结果就越好

31、,因此我们要得到好的结果就要将得到的多个预测模型同时进行检验比较,我们要选的就是其中拟合度最高的。一条回归直线的拟合度主要取决于两个方面:1.取决于回归直线的选择,这个是由所选取的参数估计方法决定的;2.取决于所观测的样本数据分布决定的。我们求回归方程时用的是最小二乘估计法,这就意味着参数估计方法是确定的,而上面说过拟合度取决于回归直线的选择和样本数据的分布,因此回归拟合度就取决于样本数据的分布了。样本数据的分布其实是由变量的关系而决定的,所以回归拟合度可以检验变量关系的真实性,判断模型的假设是否成立。当回归拟合度比较差的时候,这个回归模型得到的结果就不符合我们的要求,因此我们就要对原模型进行

32、修改、完善,将拟合度较差的模型变成拟合度好的回归模型。195.1 决定系数为了将因变量的实际观测值y和它的样本平均值的离差中分解出由自变量决定的那部分,我们将总离差分成两个部分:1.因变量的理论回归值和它的的样本平均值的离差,这部分是能够由回归直线解释的。2.因变量的实际观测值y和它的理论回归值的离差,这部分是不能够由回归直线解释的。对实际观测值y进行离差分解有: (5.1)将上式两边平方并求和得:设: 总离差平方和,残差平方和 ,回归平方和 ,则 两边除以SST得: (5.2)当SSR在SST中占得比重越大,样本观测点和样本回归直线离得越近。决定系数就是反应自变量对因变量决定程度的指标,用表

33、示: (5.3)5.2 决定系数的性质和修正决定系数eq oac(,1) 决定系数具有非负性 由于 , ,分子和分母都是平方和,不可能是负数,因此 。eq oac(,2)决定系数的取值范围是:。当所有观测值都在回归直线上的时候,这时;当观测值不是都在回归直线上的时候,则,这时;当自变量与因变量无关时,y的总离差全部归于残差平方和,则,这时=0。所以。eq oac(,3)决定系数即是样本观测值的函数,也是一个统计量。 因为决定系数的大小受到自变量的个数的影响,当含有不同个数的自变量的回归模型进行拟合程度比较时,我们应该对拟合决定系数进行调整。一般常用方法为:对,将分子和分母分别除以各自的自由度,

34、这样将变成均方差比,就可以消除自变量的个数对拟合度的影响。综上,调整后的决定系数为: (5.4)第六章 工业生产总值预测模型分析6.1 SPSS简介SPSS是由三位美国斯坦福大学研究生在20世纪60年代末研制的世界上最早的一款统计分析软件。该款软件能够研制成功是非常有深远意义的,它也是具有相当多并且齐全的功能,世界上许多使用者纷纷就SPSS的各种齐全的功能以及各功能的高效率处理问题能力给予了很高的评价与称赞。SPSS软件操作界面、输出结果的界面最大的特点就是看上去非常美观并且结构很简洁。为了让非统计专业人员和那些统计知识不是了解很深的使用者也能很好的使用该软件,它借鉴了Windows的窗口方式

35、来展示各种管理和数据分析方法的功能,使用对话框展示各种功能选择项。要使用该软件来进行科研工作,使用者只需要掌握一定的统计分析原理并拥有基本的Windows操作技能就可以。为了方便数据的传输,SPSS软件的数据接口是很通用的规格而且数据采用类似EXCEL的方式输入与管理,这样能很方便的从其他数据库中读入数据。 6.2模型建立和数据搜集本研究以制造业工业生产总值为对象,根据背景知识选取如下因变因素,以下对各变量进行设置:y为工业总产值(单位:亿元)x1为塑料制品产量(单位:万吨)x2为水泥产量(单位:万吨)x3为平板玻璃产量(单位:万重量箱)x4为生铁产量(单位:万吨)x5为粗钢产量(单位:万吨)

36、x6为钢筋产量(单位:万吨)x7为盘条产量(单位:万吨)u为随机误差项。并建立模型: (6.1)数据搜集:该数据主要是中国制造业主要工业产品,并按地区分组统计,选取中国这些产品一年的产量。由于西藏地区生产的工业产品较少,所以没有列出。具体数据见下表:表(1):中国2007年制造业工业产品统计数据地区工业总产值(当年价格)塑料制品(万吨)水泥(万吨)平板玻璃(万重量箱)生铁(万吨)粗钢(万吨)钢筋(万吨)盘条(线材)(万吨)全国10591.983305.23136117.2553918.0747651.6348928.810275.487919.02北京331.9232.661168.6235.

37、22780.51810.76296.34416.3天津204.8240.9614.79186.061435.41602.13185.1964.14河北376.27137.379758.2810031.7610523.0110569.291335.431171.84山西258.4913.442780.91971.913727.642506.36372.93465.82内蒙古124.346.052871.171395.721260.091040.36100.9676.63辽宁680.18159.33893.21941.214057.594140.27246.94453.91吉林94.5721.97

38、1903.81850.76545.66599.6730.5969.16黑龙江175.4114.061645.06490.21374.11436.05184.533.3上海600.5772.46959.44744.531790.362081.5823.2178.48江苏1425.76327.3711849.786856.113802.154721.471577.49949.47浙江875.07768.8810548.512917.53238.08577.23131.63183.74安徽173.27111.175402.23472.561517.71663.61501.04257.69福建253.

39、94106.664500.11867.12477.88588.82289.47222.27江西56.0912.955008.54686.641047.361306.81496.39332.42山东1736.69315.4715023.895175.614906.674406.911090.68638.12河南797.9121.699471.363619.931974.952275.39556.84660.1湖北126.5853.715638.852178.341679.791778.17226.99178.93湖南425.5623.255683.281518.121247.761331.793

40、37.18224.3广东923.24754.459799.576123.03755.251154.03444.76284.86广西175.5321.714350.48530.34639.3765.67288.06207.22海南2.032.25633.327.6818.844.546.540.67重庆84.8522.683000.05254.18328.38358.3649.76102.41四川364.483.516375.62495.791470.731415.34492.78195.91贵州28.317.962059.062.5363.19349.36176.45118.83云南37.24

41、16.113568.53329.81202.78883.85228.43183.61陕西181.625.143175.491175.08365.55396.27318.9453.67甘肃52.4110.321540.21591.89592.78602.898.84140.53青海1.220.27436.8592.9590.09114.711.317.54宁夏16.232.02817.3661.8246.250.3637.775.08新疆7.4639.471479.28113.66391.82446.85148.06142.086.3基于SPSS的回归分析实现SPSS是一款专用统计软件,在建立数

42、学模型之后,本文采用SPSS实现数学模型求解。在SPSS中输入各变量,并为各变量设置名称。然后点击Analyze Regression Linear进入线性回归对话框,在左边源变量栏中选定变量Y,使之进入Dependent栏,选定变量,单击按钮使之进入Independent栏。如图:14,17,18图(2):在SPSS软件中将选定变量输入图示6.4统计检验用spss计算得到如下结果:表(2):模型摘要ModelRR SquareAdjusted R SquareStd. Error of the EstimateDurbin-Watson1.993(a).987.983245.843471.7

43、39表(3):方差分析ModelSum of Squares dfMean SquareFSig.1Regression105371311.469715052901.628249.095.000(a) Residual1390297.2462360439.011 Total106760408.73430 表(4):回归系数ModelUnstandardized CoefficientsStandardized CoefficientstSig.Collinearity StatisticsBStd. ErrorBetaToleranceVIF1(Constant)-2.21147.145-.0

44、47.963 塑料制品x1.989.452 .3172.187.039.02737.136 水泥x2.036.024.4601.535.138.006158.735 平板玻璃x3-.055.059-.281-.979.338.007145.382 生铁x4.013.154.058.083.934.001858.839 粗钢x5.004.173.020.026.981.0011170.54 钢筋x6.456.366.4411.262.220.005216.267 盘条x7-.016.495-.012-.033.975.004242.790由此可得: (6.2)决定系数; 调整决定系数; 该方程的

45、决定系数比较高,因此该模型的拟合度较好。,该线性回归方程显著。6.5异方差检验及修正用SPSS对模型进行异方差检验,如图:图(3):在SPSS中对变量进行异方差检验图示最后可得残差绝对值和各自变量的相关系数为:0.59, 0.47, 0.287, 0.489, 0.513,0.416, 0.547不相等,说明存在异方差,需要用加权最小二乘估计。用SPSS可得到最优权重为3.000。进行加权分析最后可得结果:表(5):模型摘要ModelRR SquareAdjusted R SquareStd. Error of the EstimateDurbin-Watson11.000(a)1.0001.

46、000.085931.581表(6):方差分析ModelSum of SquaresdfMean SquareFSig.1Regression2587.0887369.57550065.439.000(a) Residual.17022.007 Total2587.28830 表(7):回归系数ModelUnstandardized CoefficientsStandardized CoefficientstSig.Collinearity StatisticsBStd. ErrorBetaToleranceVIF1(Constant)-13.0133.488-3.733.001 塑料制品x1

47、.841.096.2648.823.000.003314.686 水泥x2.020.011.2602.103.047.0005366.476 平板玻璃x3-.017.019-.084-.866.395.0003333.757 生铁x4-.008.019-.038-.440.664.0002602.303 粗钢x5.080.021.3703.836.001.0003255.656 钢筋x6.405.055.3937.408.000.001984.360 盘条x7-.217.104-.163-2.090.048.0002131.465由上表可知:决定系数; 修正决定系数; 方程的决定系数较高,而决

48、定系数越高,模型拟合度就越好,因此该模型的拟合度很好;,模型总体显著,即全部自变量总体与因变量存在线性关系。此时的多元线性回归方程为: (6.3)6.6 模型意义本文通过选取工业生产总值和塑料制品、水泥、平板玻璃、生铁、粗钢、钢筋、盘条的产量,经过回归分析和统计检验,最后得到回归方程: 由上述多言回归模型可知:所选取的各工业产品每增加一个单位的产量,工业生产总值就增加相应系数数值的产量。而平板玻璃产量系数是负值则工业生产总值就相对减少相应系数数值的产量。这可能是由于国家所采取的经济政策或者其它的因为地区特殊性的原因造成的。由模型知自变量塑料制品产量和钢筋产量系数的绝对值最大,因此它们对工业生产

49、总值的影响也最大。当我们要最高的提高全国各地区工业生产总值的指标时,可以尽量加大塑料制品和钢筋的生产,而对于系数最小的生铁,我们可以适当的减少对其生产的投资。这样,我们在进行资源的配置时,可以优先考虑对各地区纸塑料制品和钢筋制造的投资,这样就能够达到资源的优化配置。结 论本文以预测工业生产总值为背景,简约的介绍了回归分析思想。运用定性分析选取有关变量后,建立多元回归模型,再应用最小二乘法求得参数估计。为了防止所求得的模型是有效和有意义的,我们通过回归方程的显著性、回归系数的显著性、多重共线性检验、异方差检验等检验方法对其进行检验,再运用适当的方法对不符合实际情况的模型进行调整。通过拟合度分析,

50、我们可以知道得到的模型与实际情况的吻合程度。对拟合度过小的模型进行调整,使调整后的模型更符合实际。本文选取工业生产总值和塑料制品、水泥、平板玻璃、生铁、粗钢、钢筋、盘条的产量为变量,应用SPSS软件,以前面的所论述的知识为理论基础求得关于预测工业生产总值的数学模型。该模型可以为制定国民经济发展计划提供理论指导,并达到资源的优化配置作用。参 考 文 献1 HYPERLINK /views/specific/3004/JourDetail.jsp?dxNumber=100179932574&d=AD1652118BF623D48AF67FAACD3886BD&s=%E5%A4%9A%E5%85%8

51、3%E5%9B%9E%E5%BD%92%E6%A8%A1%E5%9E%8B&ecode=utf-8多元回归模型在区域经济预测中的应用J,赵广华,刘炜,中国商贸,2009. 2 HYPERLINK /views/specific/3004/JourDetail.jsp?dxNumber=100156669901&d=110FD965F0FD1361C33D3F12BCDBCEBB&s=%E5%A4%9A%E5%85%83%E5%9B%9E%E5%BD%92%E6%A8%A1%E5%9E%8B&ecode=utf-8多元回归模型分析与设计实现J,曲俊华,倪家明,中国电力教育,2007,第S1期3

52、HYPERLINK /views/specific/3004/JourDetail.jsp?dxNumber=100194896124&d=5E9C2C256487E964ED16864125214366&s=%E5%A4%9A%E5%85%83%E5%9B%9E%E5%BD%92%E5%88%86%E6%9E%90%E6%A8%A1%E5%9E%8B&ecode=utf-8多元混合数据回归分析方法J,傅惠民,岳晓蕊,航空动力学报,2011,第1期4 HYPERLINK /views/specific/3004/bookDetail.jsp?dxNumber=000008067068&d=47

53、A1BEF750C8C256F44ED75DFEB077C5&fenlei=1301080104数学建模方法导引与案例分析M, 汪冬华,浙江大学出版社, 2011.025 HYPERLINK /views/specific/3004/JourDetail.jsp?dxNumber=100164558170&d=98079D9A0637E460E50536C79213547B&s=%E5%B7%A5%E4%B8%9A%E7%94%9F%E4%BA%A7%E6%80%BB%E5%80%BC%E9%A2%84%E6%B5%8B&ecode=utf-8国内工业生产总值的时间序列模型研究J, 梁鑫,谢佳

54、利,荣小军,广西科学,2008,第1期6概率论与数理统计M,陈希孺编著.合肥:中国科学技术大学出版社,1992.5 7应用统计学M, 卢秀娟主编.北京:科学出版社,2005.2 8概率论与数理统计M,廖玉麟主编.上海:复旦大学出版社,1995.7 9HYPERLINK /kns50/detail.aspx?dbname=CJFD2005&filename=NCJJ200508006&filetitle=%e5%86%9c%e5%9c%b0%e6%b5%81%e5%8a%a8%e7%9a%84%e5%bd%b1%e5%93%8d%e5%9b%a0%e7%b4%a0%e5%88%86%e6%9e%90%e2%80%94%e2%80%94%e4%bb%a5%e5%90%89%e6%9e%97%e7%9c%81%e5%bb%b6%e8%be%b9%e5%9c%b0%e5%8c%ba%e7%9a%84%e5%86%9c%e5%9c%b0%e8%bd%ac%e5%8c%85%e4%b8%ba%e4%be%8b o 农地流动的影响因素分析以吉林省延边地区的农地转包为例 相似度 104%农地流动的影响因素分析以吉林省延边地区的农地转包为例J, 李明权, 闫新华,HYPERLINK /kns50/Navi/Bridge.aspx?DBCode=CJFD&Li

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论