多元课程论文_第1页
多元课程论文_第2页
多元课程论文_第3页
多元课程论文_第4页
多元课程论文_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

多元统计分析课程论文我国农村居民收入与支出多元统计分析班级:统计1203姓名:李犁学号:13041207242015年7月目录TOC\o"1-5"\h\z\o"CurrentDocument"引言 3\o"CurrentDocument"1.1研究问题的背景 3\o"CurrentDocument"1.2研究问题的目的 3\o"CurrentDocument"分析方法的简单介绍 4\o"CurrentDocument"2.1主成分分析 42.1.1主成分分析的思想 4\o"CurrentDocument"2.1.2主成分分析的几何意义 4\o"CurrentDocument"2.2聚类分析 52.2.1聚类分析的思想 5\o"CurrentDocument"2.2.2聚类分析的过程 5\o"CurrentDocument"农村居民收入的多元统计分析 5\o"CurrentDocument"3.1主成分分析 5\o"CurrentDocument"3.2聚类分析 7\o"CurrentDocument"农村居民支出的多元统计分析 9\o"CurrentDocument"4.1主成份分析 9\o"CurrentDocument"4.2聚类分析 11\o"CurrentDocument"结论 13【摘要】本文主要研究农村居民收入与支出的相关问题,利用spss软件,首先对农村居民收入进行了数据的收集和整理,数据取自中国统计年鉴网络实时数据,利用多元统计分析中的主成分分析,分析影响农村居民收入的几个重要因素。再对其进行聚类分析,按照农村居民不同的收入对30个省、自治区、直辖市进行聚类,分出几个不同的收入等级。然后对农村居民支出情况的数据进行主成分分析,分析影响收入的因素,再对其进行聚类分析,分析不同的支出等级,最后将收入与支出综合分析,大致得出结论,我国实际的居民收入与消费结构还存在一定的不合理。【关键词】农村居民收入农村居民支出主成分分析聚类分析1.引言1.1研究问题的背景我国是发展中的农业人口大国,农业的基础地位和作用比任何国家都重要,小康目标能否全面实现,重点、难点在提高人民收入,要实现农村稳定,农民小康和农业现代化,前提条件就是要保持农民收入的持续稳定的快速发展。2000年,在国家连续三年扩大内需的宏观政策作用下,我国居民消费保持了稳中有旺的运行态势。但是从城乡消费结构来看,农村消费明显不如城市消费活跃。农村消费之所以增长缓慢,主要是因为农村居民收入停滞不前以及受到农村传统消费观念的主导1.2研究问题的目的劳动者报酬收入和家庭主营收入已成为农民收入的主要来源,但是由于我国经济发展的不平衡,各地区的农民收入有着很大不同,另一方面,经济改革使得地区之间、农民内部之间的富裕家庭和贫穷家庭之间的收入差距越来越大。“二元思维”造就了经济发展层面上的“两个中国”-----“城市中国”和“农村中国”,“三农”问题日益突出,“三农”问题的核心是农民问题,即农民利益和平等待遇问题,“三农”是我国的根本问题,建设现代化农业、发展农村经济、增加农民收入,始终是中国政府面临的重大问题如何客观准确的分析这些差异,具有重要的理论和实际意义,因此,本文试图用多元统计分析对我国各地区农民收入来源及消费支出问题进行全面深入的分析。

分析方法的简单介绍2.1主成分分析2.1.1主成分分析的思想主成分分析也称主分量分析,由于多个变量之间往往存在着一定程度的相关性。人们自然希望通过线性组合的方式,从这些指标中尽可能快地提取信息。当第一个线性组合不能提取更多的信息时,再考虑用第二个线性组合继续这个快速提取的过程,直到所提取的信息与原指标相差不多时为止。这就是主成分分析的思想。一般说来,在主成分分析适用的场合,用较少的主成分就可以得到较多的信息量。以各个主成分为分量,就得到一个更低维的随机向量;因此,通过主成分既可以降低数据“维数”又保留了原数据的大部分信息。2.1.2主成分分析的几何意义主成分分析数学模型中的正交变换,在几何上就是作一个坐标旋转。因此,主成分分析在二维空间中有明显的几何意义。假设共有n个样品,每个样品都测量了两个指标(XI,X2),它们大致分布在一个椭圆内如图1所示。事实上,散点的分布总有可能沿着某一个方向略显扩张,这个方向就把它看作椭圆的长轴方向。显然,在坐标系x1Ox2中,单独看这n个点的分量X1和X2,它们沿着x1方向和x2方向都具有较大的离散性,其离散的程度可以分别用的X1方差和X2的方差测定。如果仅考虑X1或X2中的任何一个分量,那么包含在另一分量中的信息将会损失,因此,直接舍弃某个分量不是'降维”的有效办法。,这里

,这里的长轴方向,%是椭圆的短轴方向。旋转公式为Y=X.cos0+Xsin0Y=-X.sin0+Xcos0我们看到新变量Y和Y是原变量%和%的线性组合,它的矩阵表示形式为:Y2」=T'Xcos0sin0)「XY2」=T'X•A AV1一sin0cos0)X其中,T'为旋转变换矩阵它是正交矩阵,即有其中,T'为旋转变换矩阵它是正交矩阵,即有T,=T-1或T,T=I2.2聚类分析2.2.1聚类分析的思想根据距离相近的样品(或变量)先聚成类,距离相远的后聚成类,过程一直进行下去,每个根据距离相近的样品(或变量)样品(或变量)总能聚到合适的类中。2.2.2聚类分析的过程假设总共有n个样品(或变量),第一步将每个样品(或变量)独自聚成一类,共有n类;第二步根据所确定的样品(或变量)“距离”公式,把距离较近的两个样品(或变量)聚合为一类,其它的样品(或变量)仍各自聚为一类,共聚成n-1类;第三步将“距离”最近的两个类进一步聚成一类,共聚成n-2类;……以上步骤一直进行下去,最后将所有的样品(或变量)全聚成一类。为了直观地反映以上的系统聚类过程,可以把整个分类系统画成一张谱系图。所以有时系统聚类也称为谱系分析。农村居民收入的多元统计分析3.1主成分分析利用Spss软件,对农村居民收入情况的数据进行主成分分析,分析结果如图一:相关矩阵a

纯收入工资性收入家庭经营纯收入财产性收入转移性收入相关 纯收入1.000.932-.094.881.768工资性收入.9321.000-.398.865.738家庭经营纯收入-.094-.3981.000-.342-.435财产性收入.881.865-.3421.000.817转移性收入.768.738-.435.8171.000a.此矩阵不是正定矩阵。解释的总方差成份初始特征值提取平方和载入合计方差的%累积%合计方差的%累积%13.65473.08273.0823.65473.08273.0822.94518.89791.9793.2775.53397.5124.1242.488100.0005-3.088E-16-6.177E-15100.000提取方法:主成份分析。公因子方差初始提取纯收入1.000.853工资性收入1.000.901家庭经营纯收入1.000.197财产性收入1.000.901转移性收入1.000.803提取方法:主成份分析。成份矩阵a成份1纯收入.924工资性收入.949家庭经营纯收入-.444财产性收入.949转移性收入.896提取方法:主成份。成份矩阵a成份1纯收入.924工资性收入.949家庭经营纯收入-.444财产性收入.949转移性收入.896提取方法:主成份。a.已提取了1个成份。第一个主成分中的4个变量在0.05水平上都是显著的,相关系数越大,说明该主成分受该指标的影响也越大,因此,决定第一个主成分prinl大小的主要是x1、x2、x3、x4第一个主成分即可反映农村居民收入情况。3・2聚类分析通过以上主成分分析可得出:第一主成分得分prinl=0.484576X+0.519507X+0.506076X+0.489065X;12 3 4第二主成分得分prin2=0.690316X+0.212978X—0.260739X—0.640406X;12 3 4综合得分E=0.8080prin1+0.1133prin2;其中,0.8080为第一主成分贡献率,0.1133为第二主成分贡献率。对数据进行聚类分析,可得出结果如图四:图四聚类分析结果1

NCL --Clu^ter^Joined—-H-87654321o9876543210987654321222222222211111111113G86-UUNCL --Clu^ter^Joined—-H-87654321o9876543210987654321222222222211111111113G86-UU91O496533-uuO52671_uu1222241112121118-H-7542BBBBBBBnDLLLBLBBLLLLLLLBLLLLLLoooooooocccocoocccccccoccccccOB2510.00001.00.22S80.0521OB2820.00001.00■21340.0577OB29■i.:0.00001.0010110.0710B1520.00001.0017220.07130B21■L:0.00011.0014110.0876OB2020.00011.0012710.1001CL2E30.00011.0010253:60J17&OB22冬0.00011.009220.1337CL274o.oooa'.999641iz:00.160B3030.000258612.50.16U30B2450.0002^.9995511.90.1735OBIO20.0002.999&340.192CL2Z50.0005.9884564:40.2004OBI220.0003.9984510.2242CL2430.0005.9974193:40.2553OB2760.0008.987■■&715.50.2896CL1770.0015.995•罚47.00.-S259CL1550.0018.9837458.备0/8794CL1413o.oosa.98815815.00.4098OBS40.0014.987165.21:g0.4120B1830.002^.98516710.Z0.5341CL1290.0070.97813712.30.575Z0B11Z0.0035.9741440.7770Bt3-100.0070.967,871-.541415:10.8467CL11:浏0.0654.90Z.960-3J57.S'50.7i.oauCL950.0229.879.瑚-2.9眼811.81.3备160B17240.0335.845.89g-1.673;88.01.7496CL3.餐0.4359.409.756-4.019.476.13.04310B9300.408a.000.0000.0019.46.0761FREQSPRSQRSQERS0CCC P野 PST2D'ist由聚类分析结果1可以看出:当NCL为2时,半偏R2(SPRSQ)较大,0.4359,说明RSQ在从NCL为3到2的过程中减少了0.4359,说明NCL为3时为最优,再看CCC值,由于CCC无正数,所以忽略,再看PSF,当PSF在NCL=3时达到峰值73.8,最后看PST2,在NCL=3时增加到NCL=2的增加量最多,因此,将其分为3类。图五聚类分析结果20B10B110B206100B190B30B60B150B50E210B140B180B200B13OB250B3C0B16OB250B3C0B160K22OB23-I0B23-H0B26-ij0B24——0B27——0B17 咿——0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 45 5.0 5.5 6.0 6.5第一类为高收入地区:上海第二类为中等收入地区:北京、浙江、天津、江苏、广东第三类为低收入地区:河北、辽宁、山东、黑龙江、吉林、海南、江西、湖南、广西、福建、山西、安徽、内蒙、西藏、新疆、河南、四川、贵州、青海、陕西、宁夏、云南、甘肃、湖农村居民支出的多元统计分析4.1主成份分析对数据中的农村居民支出数据进行spss主成分分析结果如下:图六相关矩阵的特征值公因子方差初始提取合计1.000.992食品1.000.830衣着1.000.781居住1.000.717家庭设备1.000.773交通通信1.000.829文教娱乐1.000.888医疗保健1.000.678其他1.000.909提取方法:主成份分析。图七主成分分析特征向量解释的总方差成份初始特征值提取平方和载入合计方差的%累积%合计方差的%累积%17.39682.18282.1827.39682.18282.1822.4905.44087.6233.3674.07391.6964.2753.05094.7465.2152.39397.1396.1251.38798.5267.075.83899.3648.057.636100.0009I3.008E-16I3.342E-15I100.000提取方法:主成份分析。prinl=0.352914X+0.346487X+0.351498X+0.369305X+12 3 40.344809X+0.354944X+0.363822X+0.343825X5 6 7 8X1-x8与prin1-prin8之间的相关系数如图所示:图八相关系数矩阵成份矩阵a成份1合计.996食品.911衣着.884居住.847家庭设备.879交通通信.910文教娱乐.942医疗保健.823其他.953提取方法:主成份。a.已提取了1个成份。相关瓶阵合计4. □氏口口衣著居住家庭设备交通通信交教娱乐医疗保健其他相关 舍计1.000.936.843.855.367.906.931.324.945^2-. □氏□□.9361.000.695.713.348.306.335.632.393衣着.040.6951.000.672776.044.048.679.037居住.055.713.6721.000.701709785759731家庭设备.367.843.776.7011.000717.315.607.325密通通信.906.806.8447097171.000.340701.002交教螟乐.931.835.843.785.015.0401.000728.004医疗保健.324.682.679.759.6077017281.000759其他.945.893.837.731.325.382.3847591.000弛.(单侧)合计.000.000.000.000.000.000.000.000氏□□.000.000.000.000.000.000.000.000衣著.000.000.000.000.000.000.000.000居住.000.000.000.000.000.000.000.000家底设备.000.000.000.000.000.000.000.000密通通信.000.000.000.000.000.000.000.000交教娱乐.000.000.000.000.000.000.000.000医疗保健.000.000.000.000.000.000.000.000其他.000.000.000.000.000.000.000.000第一个主成分中的8个变量在0.05水平上都是显著的,相关系数越大,说明该主成分受该指标的影响也越大,因此,决定第一个主成分prinl大小的主要是x1、x2、x3、x4、x5、x6、x7、x8第一个主成分即可反映农村居民收入情况。由于只抽取了一个变量,所以无法旋转此解。4.2聚类分析通过以上主成分分析可得出:第一主成分得分prinl=0.352914X+0.346487X+0.351498X+0.369305X+第一主成分得分12 3 40.344809X+0.354944X+0.363822X+0.343825X综合得分E=0.8955prin1;其中,0.8955为第一主成分贡献率。对数据进行聚类分析,可得出结果:图九聚类分析结果1

NUL—UlustErsJoined-u-HHbUaw®H!SUtHKUUUU附西1芸Dist29OB26OB27■20.00001.0048E40.003网0B4OBI60.0000T.00初E40.00S627CL29OB280.00001.00■23E44:00.005226CL280B2S30.0000T.0016E44.30.006525OBE0B8■20.00001.0057E30.017724081^.OB29'20.0000T.00'丽E30.01923OBI4OBI7■20.00001.00酒E30.0241四0B3OB2220.0000T.0022E30.026121CL26OB3040.00001.0016E334J0.02S220CL240B2130.0000T.0012E34.70.085619OB25CLZ740.00001.0093711160.041918CL250B730.0000T.00766010.00.04S417CL21CL1980.00011.00406819.00.0558160B5OB2020.0000T.0040420.060115CL22CL2050.00011.00撇411:30.065414OBI5OBI820.0001T.00物90.077218OBI0B11■20.00011.00⑶940.0918住CL16g40.0004.999:204019:80.144111CL170B2490.0003.999166516.70.1485100B2CL1840.0003.9991506^2.60.16009CL130B18点、0.0007.98812208.30.24218CL1?CL1460.002468321.80,32547OHIO0Bf3■20.0011.9846720.15536CL15CL11140.0080.986:猴0^803461淋L勰此5CLIOCL8100.01S2.973.9730.01■226'35.70.56584CL5CL6*40.085i.888.953冏.674.70.92073CL9CL750.0261.862.907-1.784.242.61.12212CL3CL4290.4301.432.769-4.821.S84.0恚45531CL20B9<300.4317.000.0000.00■^1.35.0891由聚类分析结果1可以看出:当NCL为2时,半偏R2(SPRSQ)较大,0.4301,说明RSQ在从NCL为3到2的过程中减少了0.4301,说明NCL为3时为最优,再看PSF,当PSF在NCL=3时达到峰值84.2,最后看PST2,在NCL=3时增加到NCL=2的增加量最多,因此,将其分为3类。图十聚类分析结果20B1—.QB11—I I0019 0B10 0013 0B2——□B6-1 —ass-n—007」005-10020-T~l001<3-i_|~0017J~0B15—|0B18—1~一0B3-10022-*10012-I002940021」00410316I0023%00-30」0025-032610027L0023」0B2J——009 0.00.51.03.05.00.00.51.03.05.0第一类为高消费地区:上海第二类为中等消费地区:北京、浙江、广东、江苏、福建第三类为低消费地区:天津、辽宁、黑龙江、吉林、内蒙、广西、江西、湖北、山东、湖南、河北、四川、安徽、宁夏、海南、山西、河南、贵州、新疆、陕西、甘肃、青海、云南5.结论本次研究主要研究分析了我国各地区农村居民家庭人均收入与消费支出的统计特性。通过大量的统计数据,我们不难发现,我国实际的居民收入与消费结构还存在一定的不合理。通过对我国居民收入水平聚类分析以及主成分分析发现,我国居民收入差距并没有得到明显的改善;同时对比消费支出统计分析结果发现高收入地区不一定对应高消费水平,例如福建省为低收入地区,而其消费水平为高水平,天津市为高收入水平地区,其消费水平却为低水平。尽管各省份存在贫富差距是市场经济的结果,但是对于经济增长起到了一定的促进作用.不过贫富差距必须维持在一个适当的“度”上,差距过大会引发诸多的危害,尤其是不合理因素造成的贫富差距过大,不仅使得社会心理被扭曲,产生诸多的社会安全问题。另外,我们要着重分析一下调整中低收入分配的重要性.基于本文的统计分析,我们知道,我国大多数省市还处于中低收入水平,从分析结果中可以看出,收入水平低的居民消费量与收入量的比例要远远大于高收入群体,消费差距再通过乘数效应对经济拉动作用的差距是巨大的。所以应该在保证人民收入稳定的基础上,还要进一步的提高各个阶段的消费能力,缩小贫富差距。附录1参考文献张九军.中国农村居民家庭收入来源和烧沸支出的多元统计分析二十一世纪的中国城镇居民收入与支出的多元统计分析报告何晓群.多元统计分析黄燕,吴萍.SAS统计分析及应用

附录26-28分地区农村居民人均消费支出(2013年)单位:元消费支出地区合计食品衣着居住家庭设备及用品交通通信文教娱乐医疗保健其他全国6625.52495.5438.31233.6387.1796.0485.9614.2174.9北京13553.24695.91172.92387.0898.21452.21330.91167.1449.1天津10155.03539.7927.61403.4599.11816.2750.4732.6386.0河北6134.11963.3458.01266.8382.6792.3399.0696.0176.1山西5812.71920.7471.81206.0288.2699.1502.5559.0165.4内蒙古7268.32583.5564.71111.6302.31106.5555.2831.2213.3辽宁7159.02518.9584.21279.3299.4850.3632.9789.5204.4吉林7379.72438.5535.21288.4273.1961.2691.4968.6223.4黑龙江6813.62397.7551.11120.9288.7809.3601.4839.2205.2上海14234.75334.6770.72260.4693.71718.7963.71990.9501.9江苏9909.83283.2685.11788.7556.41420.81022.3809.9343.4浙江11760.24190.9848.11933.8564.91891.11048.0943.9339.5安徽5724.52269.7335.21138.9390.4540.9376.7551.7121.0福建8151.23600.8483.61418.4483.4806.3592.8481.7284.3江西5653.62389.1308.61163.1323.9587.6356.4401.3123.8山东7392.72553.7493.41409.6438.11040.5571.7738.8146.8河南5627.71938.5481.81043.9416.0616.0408.1603.7119.7湖北6279.52308.5347.71415.7425.0605.9407.4624.4144.9湖南6609.52537.0342.31438.3420.3640.0426.3638.3167.1广东8343.53736.6309.21337.9474.11041.0685.3502.0257.5广西5205.62084.7170.91360.5281.1516.3276.2413.4102.5海南5465.62625.0181.0937.7291.5589.2354.5362.2124.4

重庆5796.42539.0411.0674.4474.3581.8443.3535.9136.7四川6308.52665.0467.3986.8446.6665.0385.8557.4134.5贵州4740.22036.2254.2980.8272.4489.7301.4302.3103.2云南4743.62097.6211.4906.3258.8589.9241.1352.985.5西藏3574.01938.9370.6189.7273.1522.863.671.5143.9陕西5724.21821.3385.11206.2344.1581.0463.8776.4146.5甘肃4849.617

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论