食品价格和CPI的关系_第1页
食品价格和CPI的关系_第2页
食品价格和CPI的关系_第3页
食品价格和CPI的关系_第4页
食品价格和CPI的关系_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、摘要本文根据题目的要求建立了2011年CPI(Consumer Price Index)相关问题的模型,根据互联网上搜集到的相关最新数据,从食品价格这一侧面研究其与CPI的关系。本文在评估及预测的过程中,采用了MATLAB软件编程、EXCEL数据分析等手段,对两个问题所建立的四个模型进行了误差分析,并对模型作出了评价和改进。针对问题一,本文探究了食品价格对CPI的影响。根据网上搜集的最新数据,对2011年1月至7月各月份影响CPI变化的八项指标()进行分析,利用EXCEL数据分析,最终选取了与CPI相关性最高的食品价格来研究其与CPI的关系。建立了模型一:一元线性回归模型,采用最小二乘的方法,

2、利用MATLAB 对数据进行预测,得到的回归系数b0=63.3867和b1=0.3759都在置信区间内。并且绘制了残差图,剔除了误差均值置信区间不过零点的数据,从而拟合出线性模型。模型二在模型一的基础上,对1到7月的数据作二次多项式拟合,结果显示所有数据的误差均值置信区间均含零点,说明模型拟合的精确度较高。二次多项式回归模型已具备较好的拟合度,我们又对所猜想的对数函数关系进行了拟合,发现关系不显著,所以舍弃此种模型。针对问题二,本文建立了模型三,模型三采用灰色模型中的GM(1,1)预测模型来预测CPI的未来走势。首先级比判断,判断利用此模型的合理性;再对模型进行合理的数学公式推导,得出预测模型

3、公式;最后对得出的模型进行残差、相对误差、级比偏差检验。通过检验可以得到,灰色模型对CPI的趋势预测具有较好的拟合(例如我们采用此模型得到7月份CPI同比增长6.4688%,而实际值为6.5%),与实际值基本吻合。对2011年8月份的CPI指数预测为同比增长6.768%。由于模型三的数据量太少,进而我们从网上获得更多的数据进行预测。因此建立了模型四,与模型三不同,模型四采用时间序列模型中二次指数平滑法,引入加权系数,在对模型进行合理的演算推导后,借助于MATLAB软件,对问题一中的数据进行拟合分析,作出相应的预测,并用平均残差对预测进行检验,所得结果基本和实际值接近(例如7月份预测值为106.

4、56,而实际值为106.5)。在此基础上对未来作出预测,其结果为2011年8月CPI为106.56,2011年9月CPI为106.8。关键词 一元线性回归模型 一元二次多项式回归模型 拟合 时间序列模型二次指数平滑 灰色GM(1,1)预测模型 一、问题重述1.1问题的基本情况与背景 CPI指数,及消费者物价指数,是反映与居民生活有关的产品及劳务价格统计出来的物价变动指标,也往往是市场经济活动与政府货币政策的一个重要参考指标。当CPI指数上升时,表明通货膨胀率上升,消费者的生活成本提高,货币的购买力减弱;相反,当CPI指数下降时表明通货膨胀率下降,亦即消费者的生活成本降低,货币的购买能力增强。

5、2011年国家统计局发的数据显示,一季度,居民消费价格指数同比上涨。其中,城市上涨,农村上涨。月份居民消费价格同比上涨,创下新高,超出市场很多人的预期。而“破望”的石头,更加引发了市场的担忧。当前,国家通过各种价格干预的努力,维护市场稳定,已经取得部分成效。的高低直接影响着居民的生活水平,因此,准确的分析并及时的对CPI做出合理的预测,对国家制定相应的经济政策,实行宏观调控,稳定物价,保证经济的正常平稳发展具有重要意义。1.2问题的提出问题一:选择某个侧面(如银行存贷款利率、石油价格等),收集相关数据,研究其与CPI的关系(鉴于时效性,请注意使用的数据必须是2011年的数据);问题二:建立相关

6、数学模型并预测CPI的走势。(鉴于时效性,注意所建立的数学模型必须用到2011年1-7月的数据);问题三:针对日益增加的CPI,请你给政府写建议报告。二、问题分析CPI是对固定消费品价格的衡量,主要反映消费者支付商品和劳务的价格变化情况,也是一种度量通货膨胀水平的工具,是一个与基期100相比较的数值。CPI指标十分重要,而且具有启示性,必须慎重把握,为能够给国家政府在今后制定相关措施和银行适当调整存贷款利率提供一定科学可靠的依据需对CPI进行合理的研究以及对其今后的走势作出科学的预测。问题一属于数据统计分析的数学问题,此类问题一般采用统计回归、插值、拟合等能得到自变量与因变量确切的函数关系的数

7、学模型来解决。本文需要选择一个侧面并且从其入手来研究其与CPI之间的关系,根据2011年全国城乡居民消费支出调查数据以及有关部门的统计数据,按照制度规定对CPI权数构成进行了相应调整。其中食品在其构成部分中权重较大,见下表()且食品价格居调整力度之大的第二位。无论从数据比例还是消费现实来看,食品类价格如何直接关系CPI走势如何,关注了食品价格就相当于关注了CPI整体,而解决了“食品领涨”因素,也就基本解决了持续上涨的CPI走势。所以本文选择食品价格这一侧面来研究其与CPI之间的关系。CPI能够在一定程度上反映当前市场经济活动,是政府制定相关政策来规范国家整体经济活动和改善居民生活水平的一个参考

8、指标,所以如果能对CPI作出合理的预测,政府就能采取一定的措施来防患于未然。问题二属于对事件预测的数学模型,一般的预测模型有时间序列、统计回归、灰色预测模型等。由于本文中对CPI的预测和时间具有紧密联系,故而本文采用了与时间关联度较高的灰色预测模型和时间序列模型。模型采用灰色GM(1,1)预测模型,通过对最近一年的数据进行分析和拟合,得出预测值,并把预测值和原始值相比较,计算残差,相对误差,级比偏差,来检验模型的偏差。模型时间序列模型,由于历史数据对未来值的影响是随时间间隔的增长而递减的,故我们对各期观察值依时间顺序进行加权平均作为预测值,也就是指数平滑法。又由于时间序列的变动存在一定的直线趋

9、势,用一次指数平滑法进行预测,存在一定的滞后偏差,因此我们采用二次指数平滑法。通过选用最初几期实际值作为初始值依次进行预测。三、问题假设1.假设所查数据真实可靠。2.假设在所预测的时间范围内不发生能影响CPI正常变化的重大事件,如金融危机、流行性疾病、能影响某种或某类相关物品价格飙升的灾难性事件等。3.假设在所预测的时间范围内国家政府不采取能影响CPI正常走势的相关措施和制定相关法规。四、符号定义与说明:一元线性回归模型中的回归系数:二次多项式回归模型中的回归系数:回归系数估计值:决定系数(表示拟合的精确程度):显著性水平(其值越小,置信水平越高):CPI指数原数据:灰色模型中的级比值 :对源

10、数据一次累加后的数据值:灰色模型中的数据矩阵:灰色模型中的向量:参数向量:参数向量估计值:生成数列:模型还原数列:为时期次指数平滑值:为加权系数:为时期CPI实际值:为时期CPI预测值五、模型的建立与求解第一部分 准备工作(一)数据的处理从2011年1月起,我国CPI开始计算以2010年为对比基期的价格指数序列。调整基期,是为了更容易比较。因为对比基期越久,价格规格品变化就越大,可比性就会下降,为了便于数据分析与使用,我们选择2011年1月至2011年7月CPI和食品价格同比增长数据来研究两者之间的关系。(见表1)。日期食品CPI2011.01110.3104.92011.02111104.9

11、2011.03111.7105.42011.04111.5105.32011.05111.7105.52011.06114.4106.42011.07114.8106.5表1 食品价格和CPI同比增长数据表 图1 2011年食品价格与CPI走势图其中2011年8月后数据缺失属于预测范围,不考虑2011年之前数据。从上表的月度数据可以看出CPI于食品价格的变动趋势具有高度一致性,大致能够呈现同增同减的高度相关性,猜测其可能具有线性关系,但具体的函数关系仍需进一步分析。问题二中我们只选择2010年之后数据进行CPI走势的预测,因为在今后5年中CPI指数是以2010年为基期的,且在预测中我们已假设在

12、所预测的时间范围内不发生能影响CPI正常走势的重大事件。(二)模型的预测准备本文先以时间的角度来分析其二者之间的关系,为了能更加直观的观测食品价格与CPI之间所呈现的关系,作出从2011年1月至2011年7月这7个月CPI和食品价格同比增长的变化态势图,见图(连续曲线为CPI)。图1 CPI和食品价格月度数据的变化态势从上图中可以看出在2011年前5个月中,食品价格与CPI走势几乎重合,表明它们具有高度相关性,但是在后几个月时间段内两条曲线中间有较大空隙,变动方向完全相同,并且食品价格在上方,表明食品价格变动引起CPI变化,但是CPI还受到其他因素的影响,所以它们没有重合。但是能够看出存在一定

13、的同增同减关系,可能有线性函数关系,但是若具体来讨论两者之间的关系,需只作出仅含两者的图形,本文作出两者所得相关数据的同比增长散点图,见图2图2 CPI和食品价格指数散点图从图中可以看出CPI和食品价格可能存在线性关系,但曲线有慢慢趋于平稳的趋势,故猜测还可能具有抛物线与对数的函数关系。在问题一的统计回归模型中将会从这三个方面来考虑。第二部分 问题一模型的建立与求解第二部分 问题一模型的建立与求解(一) 模型:一元线性回归模型记构成CPI因素中的食品价格为自变量,CPI为因变量,表1中的样本数据为,绘制散点图(见图1),可以直观地看出与大致呈线性关系,所以采用一元线性回归模型:用MATLAB统

14、计工具箱的lsline函数能够绘制出数组和按照最小二乘法得到的拟合直线(见图1)。计算结果可以整理成表1:回归系数回归系数估计值回归系数置信区间=63.386755.5409 71.2326=0.37590.3059 0.4458=63.3867+0.3759=0.9745,=190.9343,=0 表2 一元线性回归模型计算结果由计算结果可以看出F的统计量比较大,并且p的值为0.回归系数的置信区间都不含零点,说明回归模型的自变量和截距两项对因变量的影响都显著。并且决定系数比较接近1,说明回归模型的拟合精确程度比较高。故本文分析各个数据的误差均值置信区间。再用regress进行线性回归分析的计

15、算之后,用MATLAB统计工具箱函数rcoplot绘制残差图形(见图2)。图2 所建线性模型的残差图从图中可以看出第2个数据的误差均值置信区间不含零点,故而将其剔除后再来验证两者的线性关系。同理可以将计算结果整理如下表3:回归系数回归系数估计值回归系数置信区间=65.453461.4565 69.4503=0.35780.3222 0.3933=65.4534+0.3578=0.9949,= 780.4692 ,=0表3 一元线性回归模型计算结果从表中依然可以看出统计量的值依旧不是很理想,这也是符合实际情况额,因为CPI虽然和食品价格具有高度相关性,但是还有多种因素与之一起来影响CPI。下面来

16、考虑它们之间是否具有二次函数关系。再用regress进行线性回归分析的计算之后,用MATLAB统计工具箱函数rcoplot绘制残差图 形(见图3)。图3 所建线性模型的残差图剔除第2个数据后,仍发现第4个数据的误差均值置信区间不含零点,故而再将其剔除后再来验证两者的线性关系。同理可以将计算结果整理如下表4:回归系数回归系数估计值回归系数置信区间=64.921562.7298 67.1131=0.36230.3429 0.3818=64.9216+0.3623=1.0e+003x0.001,= 3.5070x1.0e+003,=0表4 一元线性回归模型计算结果再一次用regress进行线性回归分

17、析的计算之后,用MATLAB统计工具箱函数rcoplot绘制残差图 形(见图4)。图4 所建线性模型的残差图(一) 模型:一元二次多项式回归模型同模型设置相同变量,建立二次多项式回归模型:用MATLAB统计工具箱得到拟合曲线(见图3)。计算结果可以整理成表2:回归系数回归系数估计值回归系数置信区间= -68.1521-1.0701 0.9337= 2.7099-0.0151 0.0205= -0.0104-0.0001 0.0001=-0.0104+2.7099-68.1521=0.9753,= 78.9774,=0.0006由计算结果得知统计量并非很大,回归模型的拟合精确程度不是太高。故本文

18、分析各个数据的误差均值置信区间。在用regress进行线性回归分析的计算之后,用MATLAB统计工具箱函数rcoplot绘制残差图形(见图4)。 从图中可以看出第1,2个数据的误差均值置信区间不含零点,并且第二个数据误差很大,故而将其剔除后再来验证两者的线性关系。同样用MATLAB统计工具箱(源代码见附录2)分别得到拟合曲线(图5)和残差图(图6),并将最终结果整理成表4。有计算结果得知统计量很大,的值为0.0003(非常接近于0),并且从图中可以看出所有数据的误差均值置信区间均包含零点,说明二次多项式回归模型是显著的。决定系数接近1,说明回归模型的拟合精确程度比较高。回归系数回归系数估计值回

19、归系数置信区间= -29.2188-541.3179 482.8803= 2.0375-7.0480 11.1230= -0.0074-0.0477 0.0328=-0.0074+2.0375-29.2188=0.9954,= 326.6218,=0.0003表4 二元多项式回归模型计算结果得到的曲线拟合图形和残差图如下:图5 CPI和食品价格的二元多项式回归模型拟合曲线图6 所建二元多项式回归模型的残差图二次多项式回归模型已具备较好的拟合度,我们又对所猜想的对数函数关系进行了拟合,发现关系不显著,所以舍弃此种模型。由所建立的模型可以得知,食品价格与CPI具有高度相关性,且增减情况一致,有模型

20、得知,食品价格和CPI的变化情况不会符合二次曲线的右半部分,这说明食品价格和CPI不会无限制的增加,只会在一定范围内变动。第三部分 问题二模型的建立和求解(一)模型:灰色预测模型为了预测CPI未来的走势情况,此问题模型采用灰色预测模型,即GM(1,1)模型。通过对2011年1月到2011年7月的CPI同比数据进行研究来最终得到未来一段时间内CPI的值。具体模型建立与求解过程如下(在求解过程中所需用到的MATLAB源代码见附录3)。第一步:级比检验建立全国2011年1月至2011年7月CPI指数数据时间按序列如下:=(104.9,104.9,,106.5),其中序列中各数据由表1即可查得。并由此

21、求得级比: 1.利用上式,可求得=(1.0000,0.9953,1.0009,0.9981,0.9915,0.999)2.级比判断当中的所有的值都在,才能用灰色模型求解,此时误差较小,是的长度范围即为(0.9915 ,1.0009),可以看出都在此范围内。第二步:建立GM(1,1)模型1.对源数据做一次累加2.构造数据矩阵B和向量Y, 3.计算 ,可以求得a =-0.0030,b= 104.3912。 4.模型求解求得:5.求生成数列和模型还原值令,可求的,其中取: 。由,可求出:第三步:模型的检验模型的各种检验指标值的检验结果如表5序号年份原始值预测值残差相对误差级比偏差12011.1104

22、.9104.900-22011.2104.9104.86760.03240.0003-0.003032011.3105.4105.18590.21410.00200.001742011.4105.3105.5052-0.20520.0019-0.004052011.5105.5105.8254-0.32540.0031-0.001162011.6106.4106.14700.25340.00240.005472011.7106.5106.46880.03120.0003-0.0021然后分别对模型的残差、相对误差、级比偏差进行比较。计算公式如下: 预测2011年8月的CPI为:106.7677

23、预测2011年9月的CPI为:107.0885通过上表可得残差大部分都控制在残差<0.2的范围内,达到一般要求,级比偏差控制在级比偏差<0.01,达到了较高的要求。从以上数据可得该模型的精确度较高,可进行预测分析。为了验证此模型的合理性,本文在假设2011年7月CPI同比增长数据未知的情况下通过此模型预测其为6.4688%,与实际值6.5%相差在做能接受的范围内。故而采用以上模型,我们对2011年8月份进行预测得到8月份同比增长6.768%。(二) 模型:时间序列模型中二次指数平滑法为了更好地预测CPI未来的走势情况,此问题模型采用时间序列模型中的二次指数平滑法,收集更多的数据,利

24、用2010年1月到2011年7月的数据进行分析。其计算公式为: (1) (2)式中为一次指数的平滑值;为二次指数的平滑值。当时间序列,从某时期开始具有直线趋势时,类似趋势移动平均法,可用直线趋势模型 (3) (4)进行预测。首先,在进行加权系数的选择时,由式(1)可以看出,的大小规定了在新预测值中新数据和原预测值所占的比重。值越大,新数据所占的比重就愈大,原预测值所占的比重就愈小,反之亦然。若把式(1)改写为 则从上式可看出,新预测值是根据预测误差对原预测值进行修正而得到的。的大小则体现了修正的幅度,值愈大,修正幅度愈大;值愈小,修正幅度也愈小。如果时间序列波动不大,比较平稳,则应取小一点,如

25、(0.10.5)。以减少修正幅度,使预测模型能包含较长时间序列的信息;如果时间序列具有迅速且明显的变动倾向,则应取大一点,如(0.60.8)。使预测模型灵敏度高一些,以便迅速跟上数据的变化。综合数据可以得知,时间序列波动不大,故选取=0.2。 初始值和都取序列的首项数值,即=101.5,计算,列于下表。年份tCPI一次平滑值二次平滑值的估计值2010.11101.5101.5101.52010.22102.7101.74101.55101.982010.33102.4101.87101.61102.22010.44102.8102.06101.7102.52010.55103.1102.271

26、01.81102.832010.66102.9102.39101.93102.972010.77103.3102.57102.06103.222010.88103.5102.76102.2103.462010.99103.6102.93102.34103.662010.1010104.4103.22102.52104.12010.1111105.1103.6102.74104.672010.1212104.6103.8102.95104.862011.113104.9104.02103.16105.092011.214104.9104.19103.37105.232011.315105.410

27、4.44103.58105.52011.416105.3104.61103.79105.642011.517105.5104.79103.99105.792011.618106.4105.11104.21106.232011.719106.5105.39104.45106.56表6 计算结果由matlab程序运行得到拟合图(程序见附录4)。图7 实际值与预测值的拟合图由此可得,由公式(4)结合matlab程序得,t=19时于是得t=20时直线趋势方程为预测2011年8月的CPI为预测2011年9月的CPI为由表6中可以看出,利用此模型预测值偏差最大的为0.72,最小的为0.04,且算出其平均参

28、差为0.077237,相比灰色预测模型中平均参差0.082556略微较小,说明赋予时间数据权重后模型得到了很好的改进,但是两者相差不大,故改进效果有限。两者偏离程度在允许范围之内,故皆可以采用。六、模型的优缺点分析(一)问题一模型的优缺点分析优点:统计回归模型是数据统计分析中一个重要的模型,通过利用最小二乘法对数据进行拟合从而得到因变量与自变量的函数关系。本文中选择与CPI变化趋势密切的食品价格这一侧面来分析两者关系,具有一定的代表性。本文选取了最新的2011年1月到7月各月份的数据来讨论食品价格与CPI之间的联系,是建立在一定置信水平上的较为简单的模型,所以此模型处理数据较少,计算过程简单但

29、是有一定的可靠程度。另外本文通过散点图观测分别讨论了两者线性和非线性的关系,最终选取较好模型来解决此问题。缺点:本文所讨论的仅是一个侧面与CPI之间的联系,选取的数据有限,范围狭窄,故而应用中有一定的局限性,不利于模型的推广。(二)问题二模型的优缺点分析1.灰色预测模型的优缺点优点:灰色预测模型能够对时间因素依赖性强的数据能够较好的预测,对原有数据参考较为重要的未来预测,以及对在特定时区内发生事件的未来时间分布情况做出研究将“随机过程”当作“灰色过程”, “随机变量”当作“灰变量”依据目前已有的数据对未来的发展趋势做出预测分析。缺点:灰色预测模型仅能做短期预测,且只考虑时间因素,以原来已有数据

30、为参考值,但不能合理的对其他因素综合预测。2.时间序列模型的优缺点优点:模型二采用时间序列模型中的二次指数平滑法,加入了加权系数,使得不同时期对未来数据的影响权重有所不同,符合一般系统的动态性,更加切合实际。缺点:模型仅仅只是从数据上进行预测,并未深入考虑影响这些数据的内在原因,加入的加权系数存在一定的主观因素,对模型的预测值存在一定的影响。七、模型的改进和推广(一)模型的客观评价本文经过仔细观察,认真分析,最终选取与CPI具有高度相关性的食品价格这一侧面来分析两者之间的联系,采用数据统计中的回归分析的方法进行考虑,经过两次建立数学模型,最终得到了两者拟合度较高的二次多项式回归模型,说明食品价

31、格领涨CPI,但两者皆不可能无限制增长,仅在二次函数单调增部分之内变动,且较符合实际情况。由于选取一个侧面考虑,范围较为狭窄,不利于模型的推广。在预估CPI未来走势时,本文首先采用灰色GM(1,1)预测模型,此模型中时间的影响程度较大,能够从以往的时间来推测未来一段时间内的走势情况。但是未考虑各时间数据的权重,而且只能预测较短时间内的CPI,针对这种缺点,我们接着采用了时间序列中的二次指数平滑法赋予时间数据在预测中的权重来改进模型,最终结果较优。(二)模型的改进1.问题一模型改进方面,选择侧面时应该考虑非CPI构成中的一些因素来研究两者关系,观察侧面的变化将会给CPI带来何种影响。或者应该选择

32、若干个侧面,先单独分析,后综合分析,来得出应该如何分配各因素的权重而达到最终改变CPI值的结论。2.问题二的模型仅是以时间的变化来考虑预测值的走势,并未加入能够影响CPI的一些因素,比如说其构成成分的权重问题,银行利率调整问题,国家宏观政策的调控问题,随机发生的能够影响到CPI重大变化的事件问题。(三)模型的推广1.统计回归模型能推广至研究两者之间确实存在函数关系的因素中,比如:施肥量与作物产量,2.灰色预测模型和时间序列预测模型能够推广至仅需短期预测且与时间有紧密联系的的工业,经济,环境和社会等领域,特别是依据目前已有的数据对未来的发展趋势做出预测分析的事件。参考文献1陈东彦 李冬梅 王树忠

33、,数学建模,北京:科学出版社,2007。2董臻圃,数学建模方法与实践,北京:国防工业出版社,2006。3章绍辉,数学建模,北京:科学出版社,20104姜启源,数学模型(第三版),北京:高等教育出版社,。5邓薇,MATLAB函数速查手册(修订版),北京:人民邮电出版社,2010附录文件1.求解一元线性回归模型中的MATLAB命令X=ones(size(x),x;b,bint,r,rint,stat=regress(y,X),figure(1),plot(x,y,'k+'),axis(98,125,98,110),lsline,title('CPI和食品价格的一元线性回归模型'),xlabel('食品价格'),ylabel('CPI'),figure(2),rcoplot(r,rint)2.求解一元二次多项式回归模型中的MATLAB指令X=ones(size(x),x.2,x;b,bint,r,rint,stat=regress(y,X),figure(1),plot(x,y,'k+',98:.1:125,polyval(b(end:-1:1),98:.1:125),'k'),axis(98,125,98,110),title('CPI和食

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论