安徽省农村居民消费结构的实证研究——基于因子和聚类分析_第1页
安徽省农村居民消费结构的实证研究——基于因子和聚类分析_第2页
安徽省农村居民消费结构的实证研究——基于因子和聚类分析_第3页
安徽省农村居民消费结构的实证研究——基于因子和聚类分析_第4页
安徽省农村居民消费结构的实证研究——基于因子和聚类分析_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 本科课程论文(设计)题 目 安徽省农村居民消费结构的实证研究基于因子和聚类分析 课程名称 多元统计分析(实验) 课程编号 83610106(07) 专 业 数学与经济学交叉培养班学生姓名 杨荣成 学 号 2011211090 成 绩 二一四 年 六 月安徽省农村居民消费结构的实证研究基于因子和聚类分析摘要:安徽省是农业大省,农村人口占全省人口的一半以上,农村居民消费需求的提升和消费结构的改善对于安徽省经济增长具有重要的促进作用。本文基于2012年安徽省农村居民消费结构的数据,运用SAS9.0统计软件,采用多元统计分析中的因子分析和聚类分析方法,对2012年安徽省16个地级市农村居民的消费结构

2、进行实证分析,考察影响消费结构的共同因素,并从分析的结果解读国家对于农村经济发展扶持政策的实行效果以及对安徽省下一步促进农村居民消费结构改善提出相关政策建议。 关键词 农村居民消费结构 因子分析 聚类分析我们知道投资、消费、出口被誉为是拉动GDP增长的“三驾马车”,其中消费是最重要的因素,是拉动经济发展的根本动力,是实现国民经济良性循环的关键,而消费结构是否合理又是消费的关键问题。考察消费结构是研究和衡量居民生活水平、生活质量的一个重要途径。那么究竟什么是合理的消费结构?如何去促进消费结构的合理化呢?这就需要我们去研究影响消费结构的各种因素,从这些因素中总结出一般规律,进而寻求实现合理消费结构

3、的具体方法。自改革开放以来我国在经济、政治体制上的改革直接影响了农村居民生活水平及消费结构。1 消费结构 消费结构是在一定的社会经济条件下,人们(包括各种不同类型的消费者和社会集团)在消费过程中所消费的各种不同类型的消费资料(包括劳务)的比例关系,有实物和价值两种表现形式,在现实生活中则表现为各项生活支出。消费结构首先可以分为宏观消费结构和微观消费结构。宏观消费结构是指整个社会的消费结构,表明总体的消费数量和比例关系,从总体上反映一个国家或一个地区的消费结构状况,而微观消费结构是指某一家庭或个人的消费结构,它从一个消费单元上反映消费结构状况,并成为宏观消费结构的基础。前者的目的是要了解消费资料

4、在不同地区和不同人群的分布,后者的研究目的则是在于掌握居民的生活质量和消费变化的动向。本文主要研究微观消费结构。我国同世界上大多数国家一样都采用消费支出金额分类法研究居民生活消费情况,我国目前的统计年鉴将居民消费支出分为食品消费支出、衣着消费支出、居住消费支出、医疗保健消费支出、交通和通讯消费支出、文教娱乐用品消费支出和其他商品及服务消费支出7大类。2 建立模型及数据来源 因子分析是研究如何以最少的信息丢失将众多原有变量浓缩成少数几个因子,如何使因子具有一定的命名解释性的多元统计分析方法。因子分析模型中,假定每个原始变量由两部分组成:共同因子和唯一因子。共同因子是各个原始变量所共有的因子,解释

5、变量之间的相关关系。唯一因子顾名思义是每个原始变量所特有的因子,表示该变量不能被共同因子解释的部分。原始变量与因子分析时抽出的共同因子的相关关系用因子负荷表示。因子分析最常用的理论模式如下:(j=1,2,3,n,n为原始变量总数)可以用矩阵的形式表示为。其中F称为因子,由于它们出现在每个原始变量的线性表达式中(原始变量可以用表示,这里模型中实际上是以F线性表示各个原始变量的标准化分数),因此又称为公共因子。因子可理解为高维空间中互相垂直的m个坐标轴,A称为因子载荷矩阵,称为因子载荷,是第j个原始变量在第i个因子上的负荷。如果把变量看成m维因子空间中的一个向量,则表示在坐标轴上的投影,相当于多元

6、线性回归模型中的标准化回归系数;U称为特殊因子,表示了原有变量不能被因子解释的部分,其均值为0,相当于多元线性回归模型中的残差。其中,(1)为第j个变量的标准化分数;(2)(i=1,2,m)为共同因素;(3)m为所有变量共同因素的数目;(4)为变量的唯一因素;(5)为因素负荷量。本文的原始数据来源于2013安徽省统计年鉴。3 实证分析结果及分析3.1因子分析 现在利用2012年安徽省16个地级市农村居民家庭平均每人全年消费性支出资料,用因子分析法提取影响居民生活的公共因素,可以对安徽省农村居民生活水平进行综合评价。选取的7个指标是:居民消费支出分为食品消费支出(X1),衣着消费支出(X2),居

7、住消费支出(X3),医疗保健消费支出(X4),交通和通讯消费支出(X5),文教娱乐用品消费支出(X6),其他商品和服务消费支出(X7)。 在做因子分析之前,首先要对原有变量做相关分析,看它是否满足做因子分析的条件。确定是否适合做因子分析的方法一般有三种:(1)计算变量之间的相关系数矩阵,如果相关系数矩阵在进行统计检验中大部分相关系数都小于0.3,那么表明这些变量不适合于进行因子分析。(2)巴特利特球形检验法,此方法采用假设检验法。假设各变量不相关,即相关系数矩阵对角线上值都为1,其他值都为0.统计量由行列式得到,如果显著性概率值小于0.05,则认为假设不成立,各变量相关性较大,适合做因子分析。

8、(3)KMO检验法,KMO检验统计量是用于比较变量间简单相关系数和偏相关系数的指标,KMO值在0-1之间,其值越接近1,表明所有变量之间简单相关系数平方和远大于偏相关系数平方和,就越适合因子分析。一般认为,大于0.7则适合做因子分析。我们为了方便起见只采用了第三种方法,运用SAS9.0统计软件,对16个市的数据进行分析可得KMO值为0.776,根据KMO度量标准可知,适合度符合要求,因此原变量适合进行因子分析。下面进行因子分析,得到如下表1原始数据的特征值和对应因子的贡献率:表1:因子解释原有变量总方差的情况序号特征值方差贡献率累计贡献率14.342217932.764013340.62030

9、.620321.578204601.053640270.22550.845830.524564320.325972890.07490.920740.198591440.020883090.02840.949150.177708350.054382780.02540.974560.123325580.067937800.01760.992170.055387780.00791.0000由该表可知第一个特征值为4.34,累计贡献率为62.03%;第二个特征值为1.58,累计贡献率为84.58%;第三个特征值为0.52,累计贡献率达到了92.07%。根据最小特征值标准,即取大于1的特征值,所以只保留

10、前两个因子。由此得到因子载荷阵如下表2所示:表2:原始数据的因子载荷阵变量因子一因子二X10.84707-0.1903X20.94687-0.05845X30.52618-0.71341X40.602090.74342X50.872680.04326X60.754340.5768X70.87071-0.37732显然该因子载荷阵无法对公共因子做出很好的解释,为了更好地解释两个因子的实际意义,我们采用将原始因子载荷阵实行方差最大正交旋转后得到的正交因子表如下表3:表3:旋转后的因子载荷阵变量第一因子第二因子X10.788240.36390X20.787320.52926X30.85150-0.2

11、4652X40.026060.95629X50.666570.56491X60.248240.91658X70.920710.22978将7个指标按高载荷分成两类,并结合专业知识对各因子给出命名如下:高载荷指标命名因子一X1 食品消费支出X2 衣着消费支出X3 居住消费支出X5 交通和通讯消费支出X7 其它商品及服务消费支出生活基本型因子因子二X4 医疗保健消费支出X6 文教娱乐用品及服务消费支出精神享受型因子 在第一因子中,X1、X2、X3、X5、X7四项指标有较大的载荷,这些指标都是衡量我们生活基本消费的情况,食品、衣着、居住、交通通讯与我们的生活息息相关,所以称为生活基本型因子。在第二因

12、子中,X4、X6两项指标拥有较大的载荷,医疗保健和文教娱乐消费使我们的精神得到放松,我们在这些消费中可以得到幸福满足感,所以称为精神享受型因子。这时可以将原始变量用因子形式表出:X1=0.79*factor1+0.36*factor2X2=0.79*factor1+0.53*factor2X3=0.85*factor1-0.25*factor2X4=0.03*factor1+0.96*factor2X5=0.67*factor1+0.56*factor2X6=0.25*factor1+0.92*factor2X7=0.92*factor1+0.23*factor2 接下来我们来计算因子得分,之

13、前我们所说的因子分析的数学模型是将变量表示为公共因子的线性组合,但往往需要反过来将公共因子表示为变量的线性组合,即: 称该式为因子得分函数,用它对每个变量计算公共因子的估计值,即所谓的因子得分。再以各因子的方差贡献率为权,由各因子的线性组合得到综合评价的指标函数,即因子综合得分。利用SAS统计软件便可很容易得到主因子和因子综合得分如下表4所示:表4:16个地级市农村居民消费结构的主因子及因子综合得分排名地区第一因子得分第二因子得分因子综合得分1铜陵市1.785920.918391.404962马鞍山市-0.554372.761640.90183宣城市1.17130.453620.856144芜

14、湖市1.302120.000890.730715淮南市1.30672-0.825680.370316滁州市0.467820.047620.28337池州市-0.18490.39840.071258合肥市-0.721740.3589-0.24729淮北市-1.107920.84842-0.2488310黄山市-0.511320.02993-0.2736411安庆市0.41987-1.18604-0.2853412亳州市0.16538-1.04133-0.3645213宿州市-0.53887-0.3357-0.4496514六安市-0.49784-0.97014-0.7052415蚌埠市-0.70

15、656-0.83595-0.7633816阜阳市-1.79561-0.62299-1.280673.2 聚类分析聚类分析又称群分析,它是研究变量或样品分类问题的一种多元统计方法,通俗地讲“类”就是具有相似性的元素构成的集合。聚类分析是将一批数据的个案或者变量的诸多特征按照关系的远近进行分类。对于同一样本,采用不同的系统聚类方法的结果大体一致,而类平均法是聚类效果较好、应用比较广泛的一种聚类方法,因此本文采用类平均法进行聚类。运用SAS统计软件可以得到类平均法的谱系聚类图如下图所示:表5是进行聚类分析后的结果:表5 各地级市消费水平分类类别地区第一类马鞍山市第二类铜陵市 宣城市 芜湖市 淮南市第

16、三类滁州市 池州市 合肥市 淮北市 黄山市 安庆市 亳州市 宿州市第四类六安市 蚌埠市 阜阳市表5中各类别所包含的城市数不同,这从形式上不如人为分组整齐,但这恰恰反映了聚类分组的科学性,它避免了人为分组的主观随意性。并且该聚类结果与因子综合得分排名结果的分类情况基本一致。4 综合评价从总体上看,安徽省各地级市农村经济发展呈“阶梯型”结构。在因子综合得分的排序中,排在第一位的是铜陵市,得分为1.40496;而处在最后一位的阜阳市仅为-1.28067,这表明安徽省各地区农村消费水平差距较大。而且只有7个市的因子综合得分大于0,说明安徽省大部分地级市农村居民消费水平处于平均水平之下。 (1)前两类的

17、地级市有铜陵市、马鞍山市、宣城市、芜湖市和淮南市,这五个市中,马鞍山市的第二因子得分达到了2.76164,远高于其它几个市,而第二因子是精神享受型因子,从侧面反映了马鞍山市农村居民消费的恩格尔系数状况,故而会有在聚类分析中马鞍山市单独聚成一类,其它四个市的第一因子得分在全省居于领先地位,说明这四个市的农村居民基本生活水平质量高,农村居民生存问题有了较高的保障。 (2)第三类的地级市大部分在主因子得分中至少有一个因子得分是大于0的,说明这些市的农村居民消费结构还不够完善,只能保证一个因子方面的高消费水平。 (3)第四类的地级市包括了六安市、蚌埠市和阜阳市,它们的主因子得分都是小于0的,说明这些城

18、市的农村居民消费水平比较低、消费结构不完善,这些情况是受到这些地区经济产出水平落后所影响的。5 结束语 从综合评价的结果来看,安徽省绝大部分地区的第一因子得分比第二因子得分要高,这表明生存基本型因子消费在整个消费中占有很大的比重,也就是说农村的恩格尔系数较高,农村居民生活水平有待进一步提高,国家对于农村经济的扶持政策有待完善和出新;精神享受型因子消费在整体消费中占有相对较小的比重,这在一定程度上反映了医疗改革政策在农村实施效果不明显以及农村的文化娱乐场所基础设施较少,社会主义新农村建设面临众多亟待解决的问题。 由此对安徽省下一步改善农村居民消费结构提出几点政策性建议:1、增加农民收入:当前收入

19、增长慢、增收难度大是制约农民扩大消费的最大障碍,而政府制定的惠农政策(免征农业税、农业补贴等)增收空间有限。首先应继续加大“三农”的投入力度,其次拓宽农民务工就业渠道,增加农民就业机会;2、改善农村居民消费观念:农村居民的消费观念落后、消费不科学在一定程度上制约了农村市场的开拓,因此必须引导农村居民科学消费,在鼓励农民吃好、喝好、穿好的同时还要鼓他们积极参与到丰富多彩的精神生活中去,保证物质文明与精神文明同步提升;3、建立健全农村医疗保障制度:如今看病难已成为广大农民们共同面临的一大问题,高额的医疗费用对于收入有限的农民来说不堪重负,切实解决他们的看病问题有利于减少医疗保健消费支出从而更多地投

20、入到其它方面的消费,因而需要国家对农民医疗保健实施补贴政策,及时弥补政策漏洞保障每一位农民的利益。4、加大农村基础设施建设:道路对于农民走出去消费很重要,国家应该增加道路工程方面的支出,与此同时还应增加文化娱乐基础设施的建设,丰富农民的业余生活。参考文献:1任雪松,于秀林.多元统计分析第二版.中国统计出版社 2011.32樊欣,邵谦谦.SAS 8.X经济统计.北京希望电子出版社 2003.23李雪,王莉华.基于聚类和因子分析的农村居民消费结构实证研究 辽宁石油化工大学学报 2008.74安徽省统计局.安徽统计年鉴光盘检索版(2013).中国统计出版社 20135刘艳.吕达劲.安徽省农村居民消费

21、结构及趋势分析.期刊.2011附录1:统计年鉴数据表格安徽省各市农村居民家庭平均每人生活消费现金支出(2012年)单位:元市生活消费食 品衣 着居 住医疗保健交通和通讯文教、娱乐其他商品支出合计用品及服务及 服 务合 肥 市4512.831674.66341.74643.96320.71466.20553.22512.34淮 北 市4406.331628.66367.94621.50423.21473.49457.28434.25亳 州 市4272.031398.72323.561023.34288.42529.33248.87459.79宿 州 市4308.761660.39286.7781

22、4.52324.81418.34366.47437.46蚌 埠 市3908.831625.10295.19775.05247.29364.65250.52351.03阜 阳 市3105.041138.84213.02613.51244.51332.10260.83302.23淮 南 市5269.262035.02482.22922.90248.87486.26359.57734.42滁 州 市5293.092062.79419.97864.43331.38534.96519.59559.97六 安 市4028.821725.50269.08712.97196.95406.09269.43448

23、.80马鞍山市6088.551975.07456.76712.06556.79680.361179.05528.46芜 湖 市5966.962459.36466.51926.95332.44569.82537.40674.48宣 城 市5841.391998.75537.10923.81374.83630.07641.20735.63铜 陵 市6646.232157.97528.261014.79385.501044.22786.01729.48池 州 市5013.041718.38355.22854.41346.93547.22702.34488.54安 庆 市4599.211696.722

24、82.92984.24218.05458.62411.84546.82黄 山 市4495.281722.01299.61754.36361.89447.82395.23514.36附录2:KMO检验程序data data101;input X1-X7;cards;1674.66341.74643.96320.71466.2553.22512.341628.66367.94621.5423.21473.49457.28434.251398.72323.561023.34288.42529.33248.87459.791660.39286.77814.52324.81418.34366.47437

25、.461625.1295.19775.05247.29364.65250.52351.031138.84213.02613.51244.51332.1260.83302.232035.02482.22922.9248.87486.26359.57734.422062.79419.97864.43331.38534.96519.59559.971725.5269.08712.97196.95406.09269.43448.81975.07456.76712.06556.79680.361179.05528.462459.36466.51926.95332.44569.82537.4674.481

26、998.75537.1923.81374.83630.07641.2735.632157.97528.261014.79385.51044.22786.01729.481718.38355.22854.41346.93547.22702.34488.541696.72282.92984.24218.05458.62411.84546.821722.01299.61754.36361.89447.82395.23514.36; proc factor data=data101 method=prinit rotate=v corr msa scree residuals preplot plot

27、; var X1-X7; run;附录3:因子分析及因子得分与因子综合得分计算程序data nx; input group $ x1-x7; n=_n_; cards; 合肥市1674.66341.74643.96320.71466.2553.22512.34淮北市1628.66367.94621.5423.21473.49457.28434.25亳州市1398.72323.561023.34288.42529.33248.87459.79宿州市1660.39286.77814.52324.81418.34366.47437.46蚌埠市1625.1295.19775.05247.29364.6

28、5250.52351.03阜阳市1138.84213.02613.51244.51332.1260.83302.23淮南市2035.02482.22922.9248.87486.26359.57734.42滁州市2062.79419.97864.43331.38534.96519.59559.97六安市1725.5269.08712.97196.95406.09269.43448.8马鞍山市1975.07456.76712.06556.79680.361179.05528.46芜湖市2459.36466.51926.95332.44569.82537.4674.48宣城市1998.75537.

29、1923.81374.83630.07641.2735.63铜陵市2157.97528.261014.79385.51044.22786.01729.48池州市1718.38355.22854.41346.93547.22702.34488.54安庆市1696.72282.92984.24218.05458.62411.84546.82黄山市1722.01299.61754.36361.89447.82395.23514.36; proc print data=nx; run; proc factor data=nx method=prin rotate=orthomax n=2 score out=yd ; var x1-x7; run; proc print data=yd; var factor1 factor2 ; run;data yd; set yd; f=(3.3205707*factor1+2.5998518*factor2)/5.9204225; run; proc sort data=yd; by descending f; run; proc print; run; options ls=80 ps=35; proc plot data=yd; plot factor2*factor1 $ n='*

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论