食品价格变动分析及预测模型_第1页
食品价格变动分析及预测模型_第2页
食品价格变动分析及预测模型_第3页
食品价格变动分析及预测模型_第4页
食品价格变动分析及预测模型_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、食品价格变动分析及预测模型摘 要 本文主要对北京、上海和西安三个城市的主要食品价格进行了分析与预测。 针对问题一,由于题目所给的主要食品种类较多,首先将其进行分类。以近期50个城市主要食品每十天平均价格的涨跌幅为指标,利用SPSS软件,采用系统聚类法中的最小距离法,将涨跌幅变化相近的食品分为一类,得到六个分类,分别为:豆角,黄瓜,西红柿,大白菜,油菜,其它食品;根据分类结果以及北京、上海和西安三个城市的主要食品的平均价格数据,利用Excel对三个城市的每类食品的平均价格绘制折线图,分析得到三个城市的每类食品价格变动特征间的差异(见文中表1)。针对问题二,由于三个城市数据量较少,利用灰色系统可以

2、利用少量数据进行短期预测的特点,借鉴灰色系统GM(1,1)模型。利用问题一所得到的分类,对三个城市的六类食品2014年812月份的价格进行预测。六类食品分别以豆角,黄瓜,西红柿,大白菜,油菜,猪肉为代表,取其17月每月的平均价格数据为原始数列,利用MATLAB软件编程计算出112月每类食品的预测价格,根据预测的数据利用Excel绘制折线图,分析得到2014年812月份,三个城市六类食品中豆角、黄瓜、西红柿、油菜、猪肉的价格走势均是下降的;大白菜的价格走势是上升的。上海市油菜的价格走势是上升的,北京市和西安市油菜的价格走势是下降的。 针对问题三,首先采用50个城市主要食品每十天的平均价格数据,利

3、用主成分分析法,分析得出27种主要食品中对居民消费水平影响较大的有13种,分别为第8、9、15、16、17、19、20、21、22、23、24、25、27种食品。得出结论:可以通过监测尽量少的食品种类价格相对准确地计算、预测居民消费者价格指数。其次根据所查询到北京、上海和西安三个城市的每类食品的平均价格数据,运用主成分分析法,分析得出对居民消费影响较大的食品种类个数分别为4种、6种、7种。由此可知,在相同的精度下,不同城市的食品的主成分的种类以及种类数目不一致。最后对模型进行了评价与推广。关键词 谱系聚类法;灰色预测模型;主成分分析法;MATLAB软件 一、问题重述全国居民消费价格指数是根据与

4、居民生活有关的产品及劳务价格统计出来的物价变动指标,通常作为观察通货膨胀水平的重要指标,反映居民家庭购买生活消费品和支出服务项目费用价格变动趋势和程度的相对数。其目的在于观察居民生活消费品及服务项目价格的变动对城乡居民生活的影响,为各级党政领导掌握居民消费状况,研究和制定居民消费价格政策、工资政策以及为新国民经济核算体系中有消除价格变动因素的不变价格核算提供科学依据。食品价格是居民消费价格指数的重要组成部分,食品价格波动直接影响居民生活成本和农民收入,是关系国计民生的重要战略问题。2000年以来,我国城镇居民家庭食品消费支出占总支出的比重一直维持在36%以上。在收入增长缓慢的情况下,食品价格上

5、涨将使人民群众明显感到生活成本增加,特别是食品价格上涨将降低低收入群体的生活质量。为监测食品价格的实际变化情况,国家统计部门将会定期统计每个城市主要食品价格变动情况。 请根据附件所给资料,并自行查找上海、北京和西安等城市的相关资料,建立数学模型解决以下问题:1.根据相关统计网站的数据,分析三个城市主要食品价格变动特征间的差异。2.分别给出三个城市2014年8-12月份食品价格走势的预测结果。3.目前统计部门需要监测大量食品价格变动情况以计算居民消费者价格指数变动情况,能否仅仅通过监测尽量少的食品种类(这里,食品种类是指附件1表格中的商品名称,可以认为每一种商品名称即为一种食品种类)价格即能相对

6、准确地计算、预测居民消费者价格指数?在同样精度要求下,三个城市所选取的食品种类以及种类数目是否一致?二、问题分析针对问题一:该问题讨论的是三个城市主要食品价格变动特征间的差异。价格变动可以用价格的涨跌幅来衡量。首先以近期全国50个城市主要食品平均价格变动情况的数据为基础,利用系统聚类法,根据食品价格的跌涨幅对27个主要食品进行分类。分类完成后,找出三个城市的各类主要食品价格数据,利用Excel绘制三个城市的每类食品价格走势图,分析其差异。针对问题二:该问题讨论的是预测三个城市2014年8-12月份的食品价格走势。由于食品种类较多,故利用问题一所得分类,只预测每类中代表食品的价格走势即可。利用查

7、找到的三个城市2014年前7个月的食品价格数据,采用灰色预测模型,对8-12月份的食品价格进行预测,进而得到价格的走势。针对问题三:该问题讨论的是能否仅仅通过监测尽量少的食品种类价格即能相对准确地计算、预测居民消费者价格指数。由于食品价格变动在居民消费者价格指数中起重要作用,且居民消费者指数反映的是价格的变动情况,因此食品价格变动越大,居民消费者价格指数变动越大。利用主成分分析法,找出27种主要食品中对跌涨幅变动贡献率较大的主要食品,即可用这些食品的价格来计算和预测居民消费者价格指数。三、基本假设1. 假设数据真实、有效;2. 预测食品价格时不考虑突发状况(如自然灾害等)对食品价格波动的影响;

8、3. 问题一中食品零售价格每十天的平均价格与食品日平均价格的偏差很小,可以忽略不计;4. 食品的分类是按价格的涨跌来划分的,可假设每一种食品的价格走势与每一类的价格走势相同。四、符号表示 第个样品和第个样品之间的距离 第类与第类的距离 上海市每类代表食品的原始数据 北京市每类代表食品的原始数据 西安市每类代表食品的原始数据 上海市每类代表食品数据的均方差比值 北京市每类代表食品数据的均方差比值 西安市每类代表食品数据的均方差比值 协方差矩阵的特征值五、模型建立与求解本文根据题目所给数据及查询到的数据,对北京、上海和西安三个城市主要食品价格变动进行分析与预测,并对三个城市主要食品进行了主成分分析

9、。5.1谱系聚类法并采用最短距离对食品价格变动进行分类由于该题数据样本容量较大,不利于模型的建立。因此为了使问题简单化,本模型使用谱系聚类法根据样品之间的相似程度对样品进行了分类,使所要讨论的样品容量减少,便于问题的解决。对于个样品的多元观测数据(1):,可将每个样品看成维空间的一个点,个样品组成维空间的个点,则在维空间可定义一种距离,根据两个样品之间距离的大小来衡量它们的相似程度。设表示第个样品和第个样品之间的距离,则有:(1)时,样品和样品恒等;(2)对于一切的和,;(3);(4)。本模型采用欧氏距离来衡量样品两两之间的相似程度。欧氏距离为:。采用最短距离来对样品进行的分类,用表示类,用表

10、示与的距离,则最短距离为:,其中,。利用谱系聚类法对样品的分了大致过程如下:(1)将个样品开始时作为个类,计算出两两之间的欧氏距离,构成一个对称距离矩阵;(2)选择最小的非零元素,设为,则将与合并为一个新类,记为;(3)计算新类与其他类的距离:(,)接下来将中第行及第列用(2)中的公式合并成一个新行新列,新行新列对应于,所得的矩阵记为。(4)对重复上述对的2、3两步作法,得如此下去,直到所有的元素并为一类为此。该模型把样品按照127的顺序进行了编号,以27种主要食品的本期价格与上期价格相比涨跌百分比为指标,看出各个指标之间的测量值相差比较大。因此需要对这些指标进行标准化,使用标准化后的数据进行

11、距离的计算。利用SPSS软件对食品进行分类的过程中就已经使数据进行了标准化。由此,为了直观明了的反映出分类的结果,利用SPSS软件绘出了以27种主要食品的本期价格与上期价格相比涨跌百分比为指标进行分类的谱系图如下:图1样品分类谱系图由谱系图知,可对27种食品进行不同的分类。因此可以将27种主要食品分为6类,具体分类结果见下表:表1 主要食品分类表类别序号第1类24第2类22第3类23第4类19第5类20第6类1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、21、25、26、27由上述分类表知27种食品的分类情况为:第1类:豆角;第2类:黄瓜;第3类:西

12、红柿;第4类:大白菜;第5类:油菜;第6类:大米(粳米)、面粉(富强粉)、面粉(标准粉)、豆制品(豆腐)、花生油(压榨一级)、大豆油(5L桶装)、菜籽油(一级散装)、猪肉(五花肉)、猪肉(后腿肉)、牛肉(腿肉)、羊肉(腿肉)、鸡(白条鸡)、鸡(鸡胸肉)、鸭(白条鸭)、鸡蛋(散装鲜鸡蛋)、活鲤鱼、活草鱼、带鱼、芹菜、土豆、苹果、香蕉。根据聚类分析所得到的食品分类以及三个城市1月1日至4月10日每十天的食品价格数据,分别分析三个城市中这六类食品的价格变动情况。对于第一类食品豆角,三个城市的价格变化趋势如下图(以每十天为一时期):图2 豆角的价格变化趋势 从上图可以看出,三个城市的豆角价格均在春节前

13、后有明显波动。其中,北京市的豆角价格从春节开始上涨,大约在2月10日左右达到最高,随后开始下降。上海市与西安市的豆角价格则是在从1月初开始上涨,在春节前达到最高,春节之后价格开始回落。在4月初,三个城市的豆角价格均回落至1月初的水平。对于第二类食品黄瓜,三个城市的价格变化趋势如下图:图3 黄瓜的价格变化趋势 从上图可以看出,北京市黄瓜的价格变动最大,经历了两次大范围起伏。北京的黄瓜价格第一次大范围变动是在春节前,在春节达到最高,随后开始下降。从2月20日开始又大规模上涨,3月初又开始大规模下降。上海和西安的黄瓜价格受春节影响也有一定的上涨,但总的来说比较平稳。在4月初三个城市的黄瓜价格均已回落

14、至1月初水平。对于第三类食品西红柿,三个城市的价格变化趋势如下图:图4 西红柿的价格变动趋势 由上图可以看出,北京市西红柿价格波动不大,只是在3月中旬有所下降,之后仍有较微小的波动。上海的西红柿价格在春节前缓慢上升,春节后开始下降,之后在2月份中旬,西红柿的价格又有一些较小的回升,但在3月上旬过后,西红柿的价格有逐渐下降。西安市从1月初至3月10日的西红柿价格一直处于缓慢上升阶段,但在3月10日之后有一个明显的下降,在3月底下降至最低,几乎恢复至1月初的价格水平,随后又开始上升。对于第四类食品大白菜,三个城市的价格变化趋势如下图:图5 大白菜的价格变动趋势图 由上图可得,2月10日前,北京市、

15、上海市、西安市的大白菜价格受春节影响,变化趋势相似总体均呈上涨状态。相比之下,北京市与西安市大白菜价格的上涨幅度较大,上海市变化较为平稳。4月初,上海市与西安市的大白菜价格均呈明显上升趋势,相反,由于3月下旬的价格上涨,北京市4月初的大白菜价格趋于平稳。对于第五类食品油菜,三个城市的价格变化趋势如下图:图6 油菜的价格变化趋势由上图可得,西安市与北京市的油菜价格变化趋势基本一致,上海市油菜价格则处于平稳状态。西安市与北京市的价格变化受春节的影响,有明显的一次价格上升,随后开始下降。不同之处在于,西安市的价格在下降过程中有两次趋于稳定的时期,分别为3月中旬和4月上旬,而北京市两次趋于稳定的时期分

16、别为3月上旬和3月下旬。从第六类食品中取猪肉为代表,得到三个城市的价格变化趋势如下图:图7 猪肉的价格变化趋势图 从上图可得,三个城市的猪肉价格总体都趋于稳定,其中西安市的猪肉价格从2月下旬开始下降,从3月初又逐渐上升,随后从3月中旬开始逐步下降。综上所述,可得出三个城市每类食品之间的价格变动差异为:表2 三个城市每类食品的价格波动差异表产品类型北京上海西安第一类(豆角)较其他城市波动最剧烈,34时期急剧上升,45时期急剧下降与其他城市相比波动很平稳相比其他城市,波动比较平缓第二类(黄瓜)较其他两个城市波动非常剧烈波动很平稳与上海一样,波动很平稳第三类(西红柿)波动较小波动最小与其他城市相比,

17、波动较大第四轮(大白菜)波动较小波动微小较其他城市波动剧烈第五类(油菜)波动很剧烈波动平稳与北京一致,波动也很剧烈第六类(猪肉)波动很平稳波动很平稳价格有微小波动5.2 三个城市主要食品价格预测模型由于本文中查询到的数据量比较少,而灰色系统理论对样本量的多少没有过分的要求,因此为了预测出短期的每类食品的价格,建立灰色系统模型。其中灰色系统理论建模的主要任务是根据具体灰色系统的行为特征数据,利用不多的数据中的显隐信息,寻找因素之间或因素与自身的数学关系。灰色模型是利用离散随机数经过生成变为随机性被显著削弱而且比较有规律的生成数,建立的微分方程形式的模型通常采用的办法是离散模型,建立一个按时间作逐

18、段分析的模型。灰色预测是指利用 GM 模型对系统行为特征的发展变化规律进行估”。(2)主要以灰色系统理论中的GM(1,1)模型来进行处理。GM(1,1)表示模型是1阶计预测。实质上是将“随机过程”当作“灰色过程”,“随机变量”当作“灰变量的,且只含有1个变量。建立灰色系统GM(1,1)模型的步骤为:已知参考数据列为,由于每类食品的价格均为正数,即所参考的数列为非负数列。做累加生成可以使非负的摆动与非摆动的数列或任意无规律性的数列转化为非减的、递增的数列,可以适当的增强数据间的规律性。所以首先给原始数列即参考数列做一次累加生成数列,其中,的灰导数为。其次令为数列的紧邻均值数列,则对作紧邻均值生成

19、,其中,故经计算有的紧邻均值数列为:。然后建立灰微分方程 ,和为参数。将代入中有令 , , (参数列),称为数据向量,为数据矩阵,为参数向量,则GM(1,1)模型可以表示为矩阵方程。其中参数列由最小二乘法估计满足 。可得其白化方程的解为 ,。且 ,。利用所知数据可以通过求出生成数列值求出相应的模型还原值。模型建立与求解之后要对模型进行适当的检验,这里采用残差检验与相对误差检验以及原始数据方差与残差方差的均方差比值、小误差概率进行检验。其中残差为,相对误差为。均方差比值为,其中,。利用以上灰色系统GM(1,1)模型的建立与求解问题的步骤,检验值的计算方法,在MATLAB中编出程序,解答下列问题。

20、由模型中对27种主要食品分为6类知,在进行对三个城市2014年812月份食品价格走势的预测时,只需要对每类进行预测即可。在取数据时,由于所查询的数据在每月的每个时期都不同,所以为了计算的方便,这里所用的初始数据取每月销售价的平均值。5.2.1三个城市第一类食品豆角的预测模型以每个城市一月到七月每月豆角的平均价格为原始数列,由此可以得到上海、北京、西安三个城市豆角价格的原始数列分别为利用MATLAB软件即可计算出三个城市每个时期豆角价格预测值与对预测值进行检验的指标值(程序见附录),具体数值见下表:表3 所求预测值与数据检验指标值表城市数值名称1月2月3月4月5月6月7月上海实际值7.788.2

21、47.925.884.433.533.83预测值7.788.607.115.874.854.013.32残差00.360.810.01-0.42-0.480.51相对误差0-0.040.10-0.09-0.140.13北京实际值10.0013.0011.309.009.208.107.60预测值10.0012.5611.2410.059.008.057.20残差00.440.06-1.050.200.050.40相对误差00.0340.005-0.1170.0220.0060.052西安实际值17.117.616.2712.48.865.734.87预测值17.118.8314.6411.38

22、8.856.885.35残差0-1.231.631.020.01-1.15-0.48相对误差0-0.070.10.080-0.20-0.10其中三个城市的均方差比值分别为:,。由上表可以看出相对误差总体是比较小的,均方差比值也都比较小。虽然模型对于豆角预测出的价格与实际价格是有一定差别的,但差别不大,因此可以用此模型对豆角812月份的价格进行预测。利用MATLAB软件得到812月的豆角价格预测值分别为:表4 豆角812月份价格预测表城市8月9月10月11月12月预测值上海2.742.261.871.551.28北京6.445.775.164.624.13西安4.163.232.511.951.

23、52由豆角812月份的预测值可以看出三个城市豆角的价格是逐渐降低的。5.2.2三个城市第二类食品黄瓜的预测模型以每个城市一月到七月每月黄瓜的平均价格为原始数列,由此可以得到上海、北京、西安三个城市黄瓜价格的原始数列分别为利用MATLAB软件即可计算出三个城市每个时期黄瓜价格预测值与对预测值进行检验的指标值(程序见附录),具体数值见下表:表5 所求预测值与数据检验指标值表城市数值名称1月2月3月4月5月6月7月上海实际值3.784.33.662.952.572.452.54预测值3.784.123.633.202.812.482.18残差00.180.03-0.25-0.24-0.030.36相

24、对误差00.0420.008-0.085-0.093-0.0120.142北京实际值11.5213.5312.119.2010.008.105.83预测值11.5213.6011.7910.218.857.676.63残差0-0.070.32-1.011.150.43-0.80相对误差0-0.0050.027-0.1090.1150.0540.138西安实际值6.529.539.174.802.682.873.03预测值6.5210.087.385.413.962.902.13残差00.551.790.611.280.030.90相对误差0-0.0570.195-0.126-0.481-0.0

25、090.2986其中三个城市的均方差比值分别为:,。由上表可以看出相对误差总体是比较小的,均方差比值也都比较小。虽然模型对于黄瓜预测出的价格与实际价格是有一定差别的,但差别不大,因此可以用此模型对黄瓜812月份的价格进行预测。利用MATLAB软件得到812月的黄瓜价格预测值分别为:表6 黄瓜812月份价格预测表城市8月9月10月11月12月预测值上海1.921.691.491.311.16北京5.754.984.313.743.24西安1.561.140.840.620.45由黄瓜812月份的预测值可以看出三个城市黄瓜的价格虽月份增加是逐渐降低的。5.2.3三个城市第二类食品西红柿的预测模型以

26、每个城市一月到七月每月西红柿的平均价格为原始数列,由此可以得到上海、北京、西安三个城市西红柿价格的原始数列分别为利用MATLAB软件即可计算出三个城市每个时期西红柿价格预测值与对预测值进行检验的指标值(程序见附录),具体数值见下表:表7 所求预测值与数据检验指标值表城市数值名称1月2月3月4月5月6月7月上海实际值0.971.060.981.151.121.331.65预测值0.970.931.031.141.251.391.53残差00.13-0.050.01-0.13-0.060.12相对误差00.1221-0.050.013-0.1161-0.040.073北京实际值6.576.937.

27、536.675.134.034.26预测值6.577.646.775.995.304.694.16残差0-0.710.760.68-0.17-0.660.10相对误差0-0.1040.100.101-0.033-0.160.024西安实际值8.579.939.537.676.134.334.6预测值8.5710.468.767.346.145.144.31残差0-0.530.770.33-0.01-0.810.29相对误差0-0.0540.080.043-0.002-0.19-0.19其中三个城市的均方差比值分别为:,。由上表可以看出相对误差总体是比较小的,均方差比值也都比较小。虽然模型对于西

28、红柿预测出的价格与实际价格是有一定差别的,但差别不大,因此可以用此模型对西红柿812月份的价格进行预测。利用MATLAB软件得到812月的西红柿价格预测值分别为:表8 西红柿812月份价格预测表城市8月9月10月11月12月预测值上海2.362.141.941.751.6北京3.683.262.882.552.26西安3.613.022.532.121.77由西红柿812月份的预测值可以看出三个城市西红柿的价格是随时间逐渐降低的。5.2.4三个城市第四类食品大白菜的预测模型以每个城市一月到七月每月大白菜的平均价格为原始数列,由此可以得到上海、北京、西安三个城市大白菜价格的原始数列分别为利用MA

29、TLAB软件即可计算出三个城市每个时期大白菜价格预测值与对预测值进行检验的指标值(程序见附录),具体数值见下表:表9 所求预测值与数据检验指标值表城市数值名称1月2月3月4月5月6月7月上海实际值0.971.060.981.151.121.331.65预测值0.970.931.031.141.251.391.53残差00.13-0.050.01-0.13-0.060.12相对误差00.122-0.050.013-0.12-0.040.073北京实际值1.331.401.031.211.431.571.60预测值1.331.171.241.321.41.501.60残差00.23-0.21-0.

30、110.030.070.00相对误差00.165-0.21-0.090.0150.0460.000西安实际值1.732.42.032.412.032.673.4预测值1.732.002.172.362.562.783.02残差00.40-0.140.05-0.53-0.110.38相对误差00.167-0.070.021-0.26-0.040.110其中三个城市的均方差比值分别为:,。由上表可以看出相对误差总体是比较小的,均方差比值也都比较小。虽然模型对于大白菜预测出的价格与实际价格是有一定差别的,但差别不大,因此可以用此模型对大白菜812月份的价格进行预测。利用MATLAB软件得到812月的

31、大白菜价格预测值分别为:表10 大白菜812月份价格预测表城市8月9月10月11月12月预测值上海1.691.872.062.282.52北京1.691.801.922.042.17西安3.283.563.874.214.57由大白菜812月份的预测值可以看出三个城市大白菜的价格都是随时间的变化逐渐升高的。5.2.5三个城市第五类食品油菜的预测模型以每个城市一月到七月每月油菜的平均价格为原始数列,由此可以得到上海、北京、西安三个城市油菜价格的原始数列分别为 利用MATLAB软件即可计算出三个城市每个时期油菜价格预测值与对预测值进行检验的指标值(程序见附录),具体数值见下表:表11 所求预测值与

32、数据检验指标值表城市数值名称1月2月3月4月5月6月7月上海实际值1.931.361.641.822.031.942.55预测值1.931.411.581.761.962.182.43残差0-0.050.060.060.07-0.240.12相对误差0-0.040.0370.0330.035-0.120.047北京实际值2.574.004.703.663.202.402.00预测值2.574.594.003.473.022.622.28残差0-0.490.700.190.18-0.22-0.28相对误差0-0.150.1500.0500.055-0.09-0.14西安实际值5.578.65.7

33、5.224.22.92.8预测值5.578.156.425.064.003.152.49残差00.45-0.720.160.20-0.250.31相对误差00.052-0.120.0280.048-0.080.112其中三个城市的均方差比值分别为:,。由上表可以看出相对误差总体是比较小的,均方差比值也都比较小。虽然模型对于油菜预测出的价格与实际价格是有一定差别的,但差别不大,因此可以用此模型对油菜812月份的价格进行预测。利用MATLAB软件得到812月的油菜价格预测值分别为:表12 油菜812月份价格预测表城市8月9月10月11月12月预测值上海2.703.013.353.734.15北京1

34、.991.731.501.311.14西安1.961.551.220.960.76由油菜812月份的预测值可以看出上海油菜的价格随时间是逐渐升高的,而北京与西安两个城市油菜的价格是随时间逐渐降低的。5.2.6第六类食品的预测由于第六类中有食品22种,其中价格的大小差别较大,最小的价格为3.8每千克,最大的价格为66.26每千克。因此为了消除最大值与最小值的影响,这里取价格的中位数来代表第六类的价格整体变化。从所查询的数据知,可以使用猪肉(后腿肉)的价格为原始数列,由此可以得到每个城市猪肉价格的原始数列分别为 利用MATLAB软件即可计算出三个城市每个时期猪肉(后腿肉)价格预测值与对预测值进行检

35、验的指标值(程序见附录),具体数值见下表:表13 所求预测值与数据检验指标值表城市数值名称1月2月3月4月5月6月7月上海实际值16.2416.0315.6915.0615.3515.4815.49预测值16.2415.7415.6515.5615.4615.3815.29残差00.290.04-0.50-0.110.100.20相对误差00.0180.002-0.03-0.000.0060.012北京实际值24.1325.1123.2622.6423.1723.7223.89预测值24.1323.9423.8123.6923.5623.4523.33残差01.17-0.55-1.05-0.3

36、90.270.56相对误差00.046-0.02-0.04-0.010.0110.024西安实际值25.325.1723.9721.5020.3323.1723.18预测值25.323.9123.4923.0722.6722.2821.89残差01.260.48-1.57-2.340.891.29相对误差00.0500.020-0.07-0.110.0380.055其中三个城市的均方差比值分别为:,。由上表可以看出相对误差总体是比较小的,均方差比值也都比较小。虽然模型对于猪肉(后腿肉)预测出的价格与实际价格是有一定差别的,但差别不大,因此可以用此模型对猪肉(后腿肉)812月份的价格进行预测。利

37、用MATLAB软件得到812月的猪肉(后腿肉)价格预测值分别为:表14 猪肉(后腿肉)812月份价格预测表城市8月9月10月11月12月预测值上海15.2115.1215.0314.9514.86北京23.2123.0922.9622.8522.73西安21.5021.1320.7620.3920.04由猪肉(后腿肉)812月份的预测值可以看出三个城市猪肉(后腿肉)的价格都是随时间逐渐降低的。用Excel将上述每类食品的实际值与预测值绘制出图形,可得到以下每类食品的价格走势图(见附录),得到以下结论:(1)前五类食品豆角、黄瓜、西红柿、大白菜、油菜前七个月的实际价格与预测价格误差较小。 (2)

38、812月份,三个城市六类食品中豆角、黄瓜、西红柿、油菜、猪肉的价格走势均是下降的;第四类食品大白菜的价格走势是上升的。第五类食品油菜,上海市的价格走势是上升的,北京市和西安市的价格走势是下降的。5.3 主成分分析模型由于该问题要求用少量的食品种类价格反映居民消费者价格指数的变动情况,即使用少量的变量反映因变量的变化。居民消费者价格指数反映居民家庭购买生活消费品和支出服务项目费用价格变动趋势和程度的相对数,食品消费支出占居民总支出的比重较大,因此用主成分分析法得到27种主要食品中物价变动较大的食品,即可用这些食品作为代表计算、预测居民消费者价格指数。因此为了选择出需要检测的食品种类,这里使用了主

39、成分分析。主成分分析即构造原变量的一系列线性组合,使各线性组合在彼此不相关的前提下尽可能多地反映原变量的信息,它是在降维的思想下产生的处理高维数据的方法(3)。设,为某实际问题所涉及的个随机变量。其协方差矩阵为。协方差矩阵的特征值为,相应的正交单位化特征向量为,。描述了第个主成分提取的信息占总信息的份额,为第个主成分的贡献率。前个主成分的贡献率之和称为,,的累计贡献率,它表明前个主成分,,综合提供,,中信息的能力。其中,为,的第主成分。实际应用中,选取,使前个主成分的累计贡献率达到较高的比例(如80%到90%),这样不但使变量维数降低,而且也不致于损失原始变量中的太多信息。5.3.1 50个城

40、市主要食品的主成分分析本文根据题目所给50个城市主要食品平均价格变动情况数据,分别对27种食品依次进行编号,以每个主要食品各个时期的价格涨跌幅作为一组向量,组成一个27维向量矩阵,即,利用MATLAB软件计算出27种食品的协方差矩阵,进而算出特征值及相应的正交单位化特征向量,其特征值结果为:, ,。由此可知,前三个主成分的累计贡献率为84.00%,因为相对应的特征向量为 相对应的特征向量为相对应的特征向量为故第一主成分为,第二主成分为,第三主成分为。分析各个主成分中的各个向量的权重系数,得到对居民食品消费指数影响大的食品分别是第8、9、15、16、17、19、20、21、22、23、24、25

41、、27种食品,即猪肉(后腿肉)、猪肉(五花肉)、散装鲜鸡蛋、活鲤鱼、活草鱼、大白菜、油菜、芹菜、黄瓜、西红柿、豆角、土豆、香蕉。因此,可以通过监测猪肉(后腿肉)、猪肉(五花肉)、散装鲜鸡蛋、活鲤鱼、活草鱼、大白菜、油菜、芹菜、黄瓜、西红柿、豆角、土豆、香蕉价格相对准确地计算、预测居民消费者价格指数。按照上述步骤,分别对北京市、西安市与上海市的主要食品进行主成分分析。若向量的权重系数的绝对值大于0.10,则认为该向量为一个主成分。5.3.2 北京市的食品主成分分析根据北京市的10种食品价格的涨跌幅,分别对10种食品依次进行编号,以每个主要食品各个时期的价格涨跌幅作为一组向量,组成一个10维向量矩

42、阵,即,利用MATLAB软件计算出10种食品的协方差矩阵,进而算出特征值及相应的正交单位化特征向量,其特征值结果为:,。由此可知, ,前两个主成分的累计贡献率为93.31%,因为相对应的特征向量为相对应的特征向量为故第一主成分为,第二主成分为。分析各个主成分中的各个向量的权重系数,可以得到对北京市居民食品消费指数影响大的食品分别是第6、7、8、10种食品,即大白菜、油菜、黄瓜、豆角。5.3.3西安市的食品主成分分析根据西安市的10种食品价格的涨跌幅,分别对10种食品依次进行编号,以每个主要食品各个时期的价格涨跌幅作为一组向量,组成一个10维向量矩阵,即,利用MATLAB软件计算出10种食品的协

43、方差矩阵,进而算出特征值及相应的正交单位化特征向量,其特征值结果为:,。由此可知,前三个主成分的累计贡献率为87.41%,因为相对应的特征向量为相对应的特征向量为相对应的特征向量为故第一主成分为,第二主成分为,第三主成分为。分析各个主成分中的各个变量的权重系数,可以得到对西安市居民食品消费指数影响大的食品分别是第3、5、6、7、8、9、10种食品,即猪后腿肉、鸡蛋、白菜、青菜、黄瓜、豆角、西红柿。5.3.4上海市的食品主成分分析根据上海市的10种食品价格的涨跌幅,分别对10种食品依次进行编号,以每个主要食品各个时期的价格涨跌幅作为一组向量,组成一个10维向量矩阵,即,利用MATLAB软件计算出

44、10种食品的协方差矩阵,进而算出特征值及相应的正交单位化特征向量,其特征值结果为:, ,。由此可知,前三个主成分的累计贡献率为86.46%,因为相对应的特征向量为 相对应的特征向量为 相对应的特征向量为故第一主成分为,第二主成分为,第三主成分为。分析各个主成分中的各个向量的权重系数,可以得到对上海市居民食品消费指数影响大的食品分别是第1、2、3、4、5、9种食品,即白菜、油菜、黄瓜、豆角、西红柿、粳米。 由对北京市、西安市与上海市的主要食品的主成分分析结果可知,在相同的精度要求下,三个城市所选取的食品种类以及种类数目不一致。六、模型评价与推广6.1 模型评价优点:模型一运用系统聚类法中的最短距

45、离法,根据食品价格的跌涨幅对主要食品进行分类。较为客观。模型二运用灰色预测对三个城市的主要食品价格进行了预测,灰色预测模型能有效地进行短期预测,且对数据没有太大要求,所以得到的预测结果较为真实可靠。模型三的主成分分析法可以用少部分变量来反映原始数据的大部分信息。缺点:模型一仅根据食品均价走势的相似性进行了分类,使得分类指标较为单一,未对各食品之间的内在关联进行过深挖掘,这可能是导致最终分类结果过于不平衡(如每类食品数量差别较大)的原因。模型二中的灰色预测只能产生单调性结果,不能预测出价格的波动情况,与具体情况会有一定差别。模型三利用主成分分析法对食品价格变动进行分析,由于三个城市的数据量太少,

46、分析结果不能很好地反映实际情况。由于三个城市的数据量太少且存在一定偏差,因此得到的结果不够准确。6.2 模型推广 在社会、经济、人口研究中,存在着大量分类研究、构造分类模式的问题。聚类分析为客观地分类提供了可能。聚类分析中存在着大量方法,系统聚类法、快速聚类法、模糊聚类法等,能解决许多实际问题。灰色系统理论已成功应用于工程控制、经济管理、生态系统及复杂多变的农业系统中,有可能对社会、经济等抽象系统进行分析、建模、预测、决策和控制,它有可能成为人们认识客观系统改造客观系统的一个新型的理论工具。主成分分析一个非常重要的应用是解决回归建模的多重共线性问题。参考文献:1范金城,梅长林.数据分析.北京:

47、科学出版社,20022肖新平,毛树华.灰预测与决策方法.北京:科学出版社,20133何晓群.多元统计回归(第三版).北京:中国人民大学出版社,20114西安市物价局主要副食品价格 2014-8-15.4上海市主副食品价格公布 2014-8-15.5中国蔬菜网 2014-8-15.附录1.灰色系统预测程序functionX,c,error1,error2=GM11(X0,k)format long;n=length(X0);X1=; X1(1)=X0(1);for i=2:n X1(i)=X1(i-1)+X0(i);endfor i=1:n-1 B(i,1)=-0.5*(X1(i)+X1(i+1

48、); B(i,2)=1; Y(i)=X0(i+1);endalpha=(B'*B)(-1)*B'*Y'a=alpha(1,1);b=alpha(2,1);d=b/a;c=X1(1)-d;X2(1)=X0(1);X(1)=X0(1);for i=1:n-1 X2(i+1)=c*exp(-a*i)+d; X(i+1)=X2(i+1)-X2(i);end for i=(n+1):(n+k) X2(i)=c*exp(-a*(i-1)+d; X(i)=X2(i)-X2(i-1);endfor i=1:n error(i)=X(i)-X0(i); error1(i)=abs(err

49、or(i); error2(i)=error1(i)/X0(i);endc=std(error1)/std(X0)命令窗口k=?X0=;X,c,error1,error2=GM11(X0,k)2计算协方差矩阵与协方差矩阵的特征值与特征向量R=cov(A)(vd,vm)=eig(R)3.27种食品主成分分析:A=5.92 5.91 5.92 5.93 5.93 5.93 5.94 5.94 5.95 5.95 5.94 5.96 5.96 5.96 5.96 5.96 5.96 5.97 5.98 5.98 5.98;5.48 5.47 5.49 5.49 5.5 5.5 5.48 5.5 5.58 5.6 5.6 5.6 5.61 5.6 5.6 5.61 5.61 5.61 5.62 5.62 5.62;4.5 4.48 4.49 4.49 4.49 4.49 4.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论