第三部分线性回归分析_第1页
第三部分线性回归分析_第2页
第三部分线性回归分析_第3页
第三部分线性回归分析_第4页
第三部分线性回归分析_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第第3 3部分部分 线性回归分析线性回归分析案例3.1 用PPI预测CPI案例3.2 预测人均GDP案例3.3 城镇居民消费支出与可支配收入的关系研究案例3.4 促销对相对竞争力的影响研究案例3.5上市公司财务指标的线性回归分析 案例3.1 用PPI预测CPI 国家统计局定期公布各类价格指数。其中,消费者比较关心的主要是消费者价格指数(CPI),我国称之为居民消费价格指数。而生产者则比较关心生产者价格指数(PPI),我国称之为工业品出厂价格指数。 CPI是反映一定时期城乡居民所购买的生活消费品价格和服务项目价格变动趋势和程度的相对数,是对城市居民消费价格指数和农村居民消费价格指数进行综合汇总计

2、算的结果。该指数可以观察和分析消费品的零售价格和服务项目价格变动对城乡居民实际生活费支出的影响程度。此外,还具有以下几个方面的作用(1)用于反映通货膨胀状况。 通货膨胀的严重程度是用通货膨胀率来反映的,它说明了一定时期内商品价格持续上升的幅度。通货膨胀一般以消费价格指数来表示,即(2)用于反映货币购买力变动。 货币购买力是指单位货币能够购买到的消费品和服务的数量。消费价格指数上涨,货币购买力下降,反之则上升,因此,消费价格指数的倒数就是货币购买力指数,即%100基期消费价格指数基期消费价格指数报告期消费价格指数通货膨胀率 (3)用于反映对职工实际工资的影响。 消费价格指数的提高意味着实际工资的

3、减少,消费价格指数下降则意味着实际工资的提高。因此,利用消费价格指数可以将名义工资转化为实际工资。具体做法是:%1001消费价格指数货币购买力指数消费价格指数名义工资实际工资 (4)用于缩减经济系列 通过缩减经济序列可以消除价格变动的影响,其方法是将经济序列除以消费价格指数。 PPI是反映一定时期全部工业产品出厂价格总水平的变动趋势和程度的相对数,包括工业企业售给本企业以外所有单位的各种产品和直接售给居民用于生活消费的产品。该指数可以观察出厂价格变动对工业总产值及增加值的影响。 合理预测CPI和PPI未来的走势,无论是对消费者还是生产者都具有重要的参考价值。 表3.1.1是2001-2007年

4、间我国的居民消费价格指数(CPI)和工业品出厂价格指数(PPI)。这些指数都是以上年为100而计算的百分比数字。 需要分析的问题: 1.对CPI和PPI之间的关系进行分析,并在此基础上建立预测模型,对居民消费价格指数进行预测。 2.对所建立的模型进行详细讨论。案例分析 回归分析是一种经典的统计技术,它主要用于对所关注变量(因变量)的预测,尤其适合于截面数据。 运用回归分析进行预测时,首先应对变量之间的关系进行分析,并根据这种关系建立一定的预测模型。在根据样本数据对所建立的模型进行检验后,确立模型是否恰当,之后才能进行预测。(一)CPI和PPI之间关系的分析 变量之间关系的分析对回归模型的初步选

5、择十分有用。描述变量之间关系的方法就是散点图,而测度变量之间关系强度的方法则是相关系数。根据CPI与PPI数据绘制的散点图如下所示: 从散点图可以看出,CPI与PPI之间具有一定的线性相关关系,也就是说,随着PPI的上涨,CPI也随之上涨。 两者之间的相关系数及其显著性检验结果如下: 检验结果表明,CPI 与PPI之间的线性关系显著。(二)CPI与PPI之间的线性回归分析及预测 由于CPI与PPI之间具有显著的线性关系,因此,可建立一元线性回归模型,用PPI来预测CPI。将CPI作为因变量,PPI作为自变量,由SPSS得到的回归结果如下所示:根据上述各表可知,CPI与PPI之间的一元线性回归方

6、程为: 。这表明,PPI每上涨1%,CPI平均上涨0.818%。 从回归方程拟合优度来看,在CPI取值的总波动中,有78.8%是由CPI与PPI之间的线性关系引起的,而用PPI来预测CPI的平均预测误差为3.383%。残差自相关检验的统计量为1.577,对应与n=17、观测值n=17临界值的上限为 ,由于1.5771.38,没有证据表明与序列之间存在自相关关系。 xy818.0272.1938.1Ud 从模型的检验结果来看,F检验的P值接近于0,表明两者之间有显著的线性相关关系。 从图3.1.2可以看出,残差的分布并非完全随机,有少数个别残差的取值较大,这可能意味着存在一定的异方差现象,但不是

7、很严重。从图3.1.3和图3.1.4可以看出,模型的随机误差项基本上符合正态分布。 上述分析表明,我们所建立的CPI与PPI之间的一元回归模型基本上是合理的,可用于预测。表3.1.6是用该回归方程得到CPI的预测值、残差、标准化残差以及的置信区间和预测区间。图3.1.5是预测的效果图。案例3.2 预测人均GDP 国内生产总值(GDP)是按市场价格计算的一个国家(或地区)所有常住单位在一定时期内生产活动的最终结果。 GDP有价值形态、收入形态和产品形态。 从价值形态看,它是所有常住单位在一定时期内生产的全部货物和服务价值超过同期投入的全部非固定资产货物和服务价值的差额,即所有常住单位的增加值之和

8、; 从收入形态看,它是所有常住单位在一定时期内创造并分配给常住单位和非常住单位的初次收入之和; 从产品形态看,它是所有常住单位在一定时期内最终使用的货物和服务价值减去货物和服务进口价值。 在实际核算中,国内生产总值有三种计算方法,即生产法、收入法和支出法。三种方法分别从不同的方面反映了国内生产总值及其构成。 GDP在地区层次上称为地区生产总值,一个地区的人均GDP是该地区生产总值除以年末总人口。一般而言,一个地区的人口数相对稳定,而地区生产总值的规模则受多种因素的影响。那么,怎样预测一个地区的人均GDP水平呢?表3.2.1给出了我国2006年各地区的人均GDP、进出口总额、固定资产投资、社会消

9、费品零售总额和年末总人口等几个变量。 需要分析的问题: 1.建立多元线性回归模型,对人均GDP水平进行预测。 2.对所建立的回归模型进行详细讨论。二、案例分析 在我们所研究的多个变量中,总有一个是特别关注的,这个变量称为因变量。而其他变量都被看做影响这一变量的因素,称为自变量。 如果我们研究的目的想利用多个自变量来预测因变量,那么需要解决的问题包括:(1)因变量与多个自变量之间是什么样的关系?(2)如何根据它们之间的关系建立一个合适的模型?这个模型是否合理?是否每个自变量都有必要放进回归模型中?如何剔除多余的自变量?(3)如何根据这一模型进行预测?这些都是统计中的多元回归技术。 如果我们假定因

10、变量与自变量之间是线性关系,就属于多元线性回归问题。(一)各变量之间关系的分析 了解各变量之间的关系对建立模型很有帮助。表3.2.2给出了各个变量之间的相关系数及其显著性检验结果。图3.2.1给出了散点图矩阵。 从表3.2.2可以看出,除人均GDP与年末总人口之间的线性关系不显著外,其他各相关系数均在0.01和0.05的显著性水平上显著。但有些相关系数的数值不高,表明线性关系并不是很强。从散点图矩阵也可以清楚地看出这一点。(二)人均GDP的多元线性回归分析 我们首先作人均GDP与4个自变量的线性回归,由SPSS得到的结果如表3.2.3表3.2.5所示。 从回归结果可以看出,虽然F检验表明线性关

11、系显著,但在回归系数的检验中,进出口总额和固定资产投资所对应的回归系数均未通过检验。这可能意味着模型中存在多重共线性。因此,有必要对自变量进行筛选。由SPSS得到的逐步回归结果如表3.2.6表3.2.8所示。 从逐步回归结果可以看出,提供了4个可供选择的回归模型,并给出了每个模型的拟合优度检验统计量、方差分析表以及参数的估计和检验结果。在每个模型中,固定资产投资这个变量均被剔除。 从预测的角度而言,这4个模型均可用。但从回归系数来看,进出口总额的回归系数很小,表明其在预测中的作用不大。因此,这里我们最终选择模型4,其回归方程为社会消费品零售总额年末总人数161. 7825. 4246.2067

12、8 y 根据上述方程得到的人均GDP的有关预测结果如表3.2.9所示。其中给出了人均GDP的点预测值、残差、95%的置信区间和预测区间。案例3.3 城镇居民消费支出与可支配收入的关系研究 人均可支配收入指个人收入扣除向政府缴纳的个人所得税、遗产税和赠与税、不动产税、人头税、汽车使用税以及交给政府的非商业性费用等以后的余额。个人可支配收入被认为是消费支出的最重要的决定性因素。表3.3.1是2008年全国31省、市、自治区的人均可支配收入和消费支出数据。 需要解决的问题: 可支配收入与消费支出是否存在定量关系,分析可支配收入对消费支出的决定作用。二、案例分析 (一)消费支出与可支配收入的关系及其模

13、型 要分析可支配收入与消费支出之间的关系,可首先通过散点图来判断他们之间可能存在的关系及其强度。图3.3.1就是这两个变量之间的散点图。 图3.3.1表明,可支配收入和消费支出之间存在着很强的线性关系,所以我们考虑建立两者之间的线性模型来反映他们之间的关系。以消费支出为因变量,以可支配收入为自变量,运用spss软件建立线性模型,所得结果如3.3.23.3.4所示。 从模型的主要统计量来看,模型的 和调整后的 都达到了0.9以上,说明模型拟合程度较高。表3.3.22R2R 表3.3.3显示,模型显著性检验的P值接近于0,在0.05的显著性下,模型的线性关系是显著的。表3.3.3表3.3.4 表3

14、.3.4给出了模型相关参数估计和检验的结果。在0.05的显著性水平下,回归系数是显著的。所以得到的最终模型为:消费支出=0.665X可支配收入+随机误差项 上面的建模过程是建立在一些假定条件基础之上的,这些假定包括模型的随机误差项无自相关性、正态性、不存在异方差现象。其中表3.3.2中的DW值表明,模型的随机误差项有很弱的自相关性,为了进一步证实模型的合理性,我们需要对模型的随机误差性的正态性和方差齐性进行检验。(二)模型的合理性检验 首先,对随机误差项的正态性进行检验。图3.3.2和图3.3.3分别是模型残差的直方图和P-P图。从这两个图直观地分析,模型正态性的假定是成立的。为了更客观地对这

15、个假定进行验证,对模型的残差作非参数的K-S检验,所得结果如表3.3.5所示。图3.3.4 模型标准化残差的散点图 模型残差项的K-S检验,验证了我们的主观判断。即模型随机误差项的正态性假定是成立的。 其次,对模型随机误差项的方差齐性进行检验。从图3.3.4来看,绝大部分残差值都落在了两个标准差范围的带状区域内。模型随机误差项的方差齐性检验是成立的。 通过上面的分析可知,在本案例中我们建立的可支配收入与消费支出的模型是合理的,可以用人均可支配收入来预测人均消费支出。案例3.4 促销对相对竞争力的影响研究 在如今的超市经营中,各种各样的促销活动繁多。毋庸置疑,各大超市进行促销活动的目的是要增加销

16、售量,增加本企业的市场竞争力。但是究竟促销行为对增强企业竞争力的贡献有多大呢?这一直是企业一个极为关注的问题。一家美国的超市市场连锁店想要研究促销对相对竞争力的影响,因此收集了其在美国15个州中与竞争对手相比的促销费用数据(竞争对手费用=100),以及相对销售额数据(竞争对手销售额=100)。其具体的数据如表3.4.1所示。需要分析的问题: 1.依据上面的数据,定性描述促销对相对竞争力的影响。 2.选择合适的模型,从定量的角度分析促销对提高相对竞争力的影响作用。二、案例分析(一)相对促销费用与相对销售额之间关系的分析 研究两个数值型变量之间的关系,往往先从他们之间的散点图做直观的分析,然后再选

17、择合适的模型进行描述。在本案例中,相对促销费用和相对销售量的散点图如下所示: 从图3.4.1来看,相对促销量和相对销售额之间存在明显的线性关系。为确切描述两者之间的关系,需要对相对促销费用与相对销售额做相关性检验,得到的结果如下表所示: 从表3.4.2的检验结果来看,相对促销费用与相对销售额之间存在显著的线性关系。在统计中,当两个数值型自变量之间存在线性关系时,我们往往考虑采用线性回归的方法进行分析。(二)相对促销费用与相对销售额的线性回归分析 由上面的分析可知,相对促销费用和相对销售额之间存在明显的线性关系,所以考虑以相对促销费用为自变量,以相对销售额为因变量建立线回归模型。回归的结果如表3

18、.4.3和表3.4.4所示。 由表3.4.3和表3.4.4的结果可知,在显著性水平为0.05的前提下,模型本身及回归系数的显著性均通过了检验,最终得到的回归方程为: 相对销售额=-7.927+1.149相对促销费用从得到的回归方程来看,促销有利于提高企业的竞争力,提高相对销售额。在其他因素保持不变的条件下,相对促销费用每提高1个百分点,则相对销售额度会相应提高1.149个百分点。(三)模型的合理性检验 回归模型是建立在一些假定的基础上的,这些假定主要包括残差的正态性、独立性、同方差性。在我们建立模型之后,如果模型的残差符合原来这些假定的前提,则表明模型是有效的、合理的,否则模型就有问题。为了验

19、证模型的合理性,需要对其残差做正态性、自相关性和异方差性检验,检验的结果见表3.4.53.4.7。 在0.05的显著性水平下,表3.4.5显示模型残差的正态性通过检验。表3.4.6中的Durbin-Watson值为1.282,显示模型残差存在弱的自相关性。和调整的均达到了0.9以上,说明相对促销费用的变动很好的解释了相对销售额的变动。表3.4.7显示模型的异方差性检验通过,该模型不存在异方差现象。综合各种因素考虑,我们可以认为所建立的回归模型是合理的。案例3.5上市公司财务指标的线性回归分析 反映上市公司的财务指标有多个,如偿债能力、盈利能力、成长性等。本案例旨在以股民所关心的盈利能力为出发点

20、分析各财务指标之间的关系。表3.5.1是分地区上市公司的财务指标数据。 需要分析中的问题: 1.上市公司各财务指标之间的内在关系。 2.选择合适的指标来反映并预测上市公司的盈利能力。案例分析 分析各个指标变量之间的相互关系时,相关系数往往是我们初始解读数据的一个有效工具。所以,我们先用软件计算各个指标变量之间的相关系数,并对各个相关系数的显著性进行检验,得到的结果如表3.5.2所示。 从表3.5.2可以看出,在显著性水平为0.05的前提下,除了现金流量与盈利能力的线性关系不显著外,其他各变量与盈利能力的线性关系都是显著的,其中与市盈率之间的相关系数达到了0.8以上。 为了选择合适的指标来反映和

21、预测上市公司的盈利能力,考虑以盈利能力为因变量,以其他各个变量为自变量对表3.5.1中的数据进行多元线性回归分析。 由于此处解释变量的个数比较多,而且从表3.5.2中各指标变量之间的相关系数分析,一些解释变量之间存在较强的线性关系,容易产生多重共线性,从而导致我们所建立的线性模型失真。所以需要先对解释变量之间是否存在多重共线性进行检验,得到的结果如表3.5.3所示。 从表3.5.3可以看出,存在多个条件指数其值在10以上,甚至有的条件指数达到了将近70,这说明解释变量之间存在较强的多重共线性。由于解释变量之间存在多重共线性,所以在选择建立回归模型的方法时,就不能选择引入全部解释变量的方法,而是

22、逐步回归的方法。(一)上市公司财务指标之间的逐步线性回归分析 以营利能力为因变量,其他各个变量为自变量,对表3.5.1中的数据进行逐步回归得到的结果如表3.5.43.5.7所示。 表3.5.4发映了该线性模型的解释力度。从中可以看出,模型最终的解释变量为市盈率,该线性模型的线性部分可以解释被解释变量80%以上的信息,说明该模型的拟合度较好。 表3.5.5给出了整个模型线性关系统计上的显著性检验结果。在显著性水平为0.05的前提下,模型的线性关系是显著的,表明所建立的模型是有意义的。 表3.5.6给出了模型的最终结果,并对回归系数进行了显著性检验。在显著性水平为0.1的前提下,解释变量的回归系数均是显著不为零的。模型的最终结果为: 平均盈利能力得分=8.407+0.843平均市盈利得分+随机误差项 该模型的意义是,如果公司的平均市盈利得分提高1分,在其他因素不变的情况下,平均市盈利能力就能平均提高0.843分。 由于上面所做的分析都是建立在回归分析基本假定的基础上完成的,起初的基

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论