SAS实验报告模板_第1页
SAS实验报告模板_第2页
SAS实验报告模板_第3页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2009年广东省各市经济统计分析——〈〈数据分析与统计软件》实验报告伍思敏(进修)11020201、问题背景与数据描述自广东省委省政府提出建设“幸福广东”之后,如何加快全省经济的升级转型,如何促进全省各市的城乡区域协调发展,以及如何统筹全省经济社会协调发展成为全社会关注的热点。首先,我们必须了解全省21个地级市的基本经济情况,找出现行经济的不足,才能做出科学的决策。我们通过分析各市的社会经济的8项统计指标,来研究各市的经济运行情况。根据〈〈广东年鉴2010》的资料,给出有关的数据,见表1。表12009年广东省各市社会经济统计数据地区生产总值/亿元人均生产总值/元农林牧渔业总产值/亿元工业总产值/亿元全社会固定资产投资/亿元出口总额/亿美元社会消费品零售总额/亿元城镇单位在岗职工平均工资/元,州9138.2189082295.6211376.762659.85374.053615.7749519深圳8201.329277215.4815416.241709.151619.792567.9446723珠海1038.666988951.622405.04410.51177.83404.4631764汕头1035.8720385104.711531.10291.9040.16661.9625389,弗山4820.9080686195.0311711.281470.56245.781408.7834106韶关578.7519549133.42599.23356.505.79278.3628276河源-405.501392886.86604.68198.1514.13139.5023803悔州519.2912558179.38351.11162.986.71267.9824097惠州1414.7035819147.913005.14758.97171.49491.1025786汕尾390.0413363111.22319.60289.439.48282.06232383763.915660125.316071.111094.08551.67959.0742585“山1566.416230477.774057.97545.61177.36549.7636165江门1340.8832139193.092933.26492.0779.49562.0724304阳江527.2722132200.16504.56239.4912.30305.3821439湛江1156.6716647397.681028.79393.2313.65559.9423944«名1231.2519979385.381098.13180.015.32591.0524255肇庆862.0022415256.811179.01462.7720.30275.7826174清远861.5922796158.712024.06841.2414.15303.5628379潮州480.181868161.35581.07162.9818.70207.8921293揭阳816.0914159149.611153.29393.5025.25341.4619881云浮_344.5114276144.91324.32240.196.16117.91219132、统计分析方法与SAS^现为了研究各市的经济情况,我们利用基本的描述性统计、因子分析、聚类分析等方法来进行多角度的分析,并用SAS完成统计分析任务。2.1数据准备和处理为便于分析和说明,在下面的中文和程序中,我们将使用以下变量来表示各经济指标,如表所示:表2变量符号地区生产总值/亿元人均生产总值/元农林牧渔业总产值/亿元工业总产值/亿元全社会固定资产投资/亿元出口总额/亿美元社会消费品零售总额/亿元城镇单位在岗职工平均工资/元regionx1x2x3x4x5x6x7x8datacity;inputregion$x1-x8;cards;guangzhou9138.2189082295.6211376.762659.85374.053615.7749519shengzhen8201.329277215.48guangzhou9138.2189082295.6211376.762659.85374.053615.7749519shengzhen8201.329277215.4815416.241709.151619.792567.9446723shantou1035.8720385104.711531.10291.9040.16661.9625389foshan4820.9080686195.0311711.281470.56245.781408.7834106shaoguan578.7519549133.42599.23356.505.79278.3628276heyuan405.501392886.86604.68198.1514.13139.5023803meizhou519.2912558179.38351.11162.986.71267.9824097huizhou1414.7035819147.913005.14758.97171.49491.1025786shanwei390.0413363111.22319.60289.439.48282.0623238dongguan3763.915660125.316071.111094.08551.67959.0742585zhongshan1566.416230477.774057.97545.61177.36549.7636165jiangmen1340.8832139193.092933.26492.0779.49562.0724304yangjiang527.2722132200.16504.56239.4912.30305.3821439zhanjiang1156.6716647397.681028.79393.2313.65559.9423944maoming1231.2519979385.381098.13180.015.32591.0524255zhaoqing862.0022415256.811179.01462.7720.30275.7826174qingyuan861.5922796158.712024.06841.2414.15303.5628379chaozhou480.181868161.35581.07162.9818.70207.8921293jieyang816.0914159149.611153.29393.5025.25341.4619881zhuhai1038.666988951.622405.04yunfu240.196.16117.9121913344.5114276144.91324.32410.51177.83404.4631764run;2.2描述性统计分析为了对数据的基本情况有一个初步的了解,我们首先进行单变量分析。利用MEANSE±2.2描述性统计分析为了对数据的基本情况有一个初步的了解,我们首先进行单变量分析。利用MEANSE±程计算各个变量的描述性统计量,程序如下:procmeansdata=citymaxdec=2meanstdmaxmincvskew;varx1-x8;~Irun;MEANS过程计算每个变量的均值、标准差、最大最小值、极差、变异系数和偏度。maxdec=2表示输出统计结果保留2位小数,结果如表3所示。表3MEANS过程VariableMeanStdDevMaximumMinimumRangeCoeffofVariationSkewnessx11928.292500.519138.21344.518793.70129.682.20x235721.9027212.7092772.0012558.0080214.0076.181.13x3160.57104.55397.6815.48382.2065.110.92x43251.234313.2515416.24319.6015096.64132.671.91x5635.87629.142659.85162.982496.8798.942.12x6170.93361.771619.795.321614.47211.653.57x7709.13860.813615.77117.913497.86121.392.62x828715.868484.2049519.0019881.0029638.0029.551.41根据表3的结果,可以得出以下结论:(1)除了x8(城镇单位在岗职工平均工资)的CV(变异系数)不是很大外,其他各个变量的CV都在50以上,其中x1(生产总值)、x4(工业总产值)、x6(出口总额)、x7(社会消费品零售总额)的CV都在100以上,这说明全省21个地级市在以上几个方面存在很大的差异,从极差可以具体看大各市间的差别,各市的发展很不平衡。(2)x8(城镇单位在岗职工平均工资)的CV(变异系数)为29.55,是所有变量中变异系数最小的,说明虽然职工的工资跟城市的发展水平有关,但其增长的幅度与城市经济发展是不相应的,城市发展了,职工并没有享受到更多的发展成果。进一步可以考虑8个变量之间的相关系数,程序如下:proccorrdata=city;|varx1-x8;|run;|COR对程给出变量两两之间的相关系数和显著概率(p值),如表4所示:从表4可看出很多变量之间的相关系数都在0.7以上,且显著性检验的p值都很小,这表明各变量间存在较强的相关性,它们反映的信息有所重叠,因此考虑降低维数,用较少的变量来考虑各市的经济情况。表4PearsonCorrelationCoefficients,N=21Prob>|r|underH0:Rho=0x1x2x3x4x5x6x7x8x11.000.85538<.0001-0.007210.97520.94793<.00010.95323<.00010.77392<.00010.97853<.00010.89577<.0001x21.00000-0.218120.34220.90767<.00010.82766<.00010.721780.00020.79809<.00010.89720<.0001x31.00000-0.140730.54290.030770.8946-0.374740.09420.094880.6825-0.199090.3869x41.000000.89387<.00010.82924<.00010.87906<.00010.86331<.0001x51.000000.626170.00240.94154<.00010.87574<.0001x61.000000.676340.00080.74948<.0001x71.000000.85083<.0001x81.000002.3因子分析采用因子分析的方法来实现对数据的降维处理,将8个经济指标综合为几个综合因子来进行研究。程序如下:procfactordata=city;varx1-x8;runFACTO起程计算得到数据相关矩阵的特征值、方差贡献率和累计方差贡献率如表5所示:表5相关矩阵的特征值、方差贡献率EigenvaluesoftheCorrelationMatrix:Total=8Average=1EigenvalueDifferenceProportionCumulative16.4.0.76280.762821.0.0.15060.913430.0.0.03870.952140.0.056787550.02260.974750.0.069655560.01550.990260.054403710.033312180.00680.997070.021091530.018227830.00260.999680.002863700.00041.0000从中可看出,相关矩阵的前两个特征值分别为6.和1.,对应两个公共因子的累计方差贡献率已达0.9134,因此2个公共因子所代表的信息已经能够很充分反映原变量。下面指定2个公共因子来进行因子分析。procfactordata=cityn=2;varx1-x8;run;|文档来源为:从网络收集整理.word版本可编辑.欢迎下载支持

利用主成分法,FACTOR程计算了两因子模型的因子载荷矩阵,以及对每个变量的共同度,如表6和表7所小:表6因子载荷矩阵FactorPatternFactor1Factor2x10.980720.14549x20.92406-0.09964x3-0.141930.96569x40.96972-0.01969x50.937970.21731x60.82517-0.34588x70.936640.26360x80.94260-0.06342表7公共因子解释的方差和变量的共同度VarianceExplainedbyEachFactorFactor1Factor26.10266561.2044074FinalCommunalityEstimates:Total=7.307073x1x2x3x4x5x6x7x80.9829730.8638100.9527050.9407490.9270110.8005340.9467750.892515表7指出两个公共因子所解释的方差分别为6.1026656和1.2044074,而且每个变量的共同度都在0.8以上,表明该因子模型对原来每个变量的解释能力都较强,可以较好地代表原变量。但表6因子载荷矩阵中,第一个公共因子Factorl在x3以外的变量上的因子载荷基本都在0.9附近,而第二个公共因子Factor2在x3以外的变量上的因子载荷都小于0.4,且出现较多负值。这样难对公共因子做出合理的解释,因此接下来对因子载荷矩阵进行旋转,并计算因子得分。procfactordata=cityn=2rotate=varimaxscoreout=scoreout;varx1-x8;|run;表8旋转后因子载荷矩阵RotatedFactorPatternFactor1Factor2x10.991430.00672x20.90100-0.22806x3-0.005300.97605x40.95741-0.15529x50.959160.08381x60.76860-0.45803x70.964320.12984x80.92443-0.19480文档来源为:从网络收集整理.word版本可编辑.欢迎下载支持.从表8可以看出,此时两个公共因子的意义已经比较明显:第一公共因子Factorl在x1(生产总值)、x2(人均生产总值)、x4(工业总产值)、x5(全社会固定资产投资)、x6(出口总额)、x7(社会消费品零售总额)、x8(城镇单位在岗职工平均工资)上都有大于0.75的正载荷,可以解释为综合生产力;第二公共因子Factor2在x3(农林牧渔业总产值)上的载荷为0.97605,可以解释为农业生产力。利用因子模型,可以计算出每个地区在这两个公共因子上的得分,得分数据包含在scoreout中。下面利用SORE程对数据集scoreout按照公共因子进行排序:procsortdata=scoreoutout=f1;"|bydescendingfactor1;procsortdata=scoreoutout=f2;bydescendingfactor2;run;根据输出数据集f1和f2的结果,我们得到按照综合生产力和农业生产力输出的排序,如下表9所示。表9各市按照公共因子得分排序序号地区Factor1序号地区Factor21广州2.7832341湛江1.9489442深圳2.426192广州1.8485933佛山1.2614643茂名1.8028944东莞0.7400454肇庆0.768155中山0.1381675佛山0.3868066珠海-0.086486阳江0.3291127惠州-0.116977江门0.2872938江门-0.214368梅州0.1619899湛江-0.251439清远0.09796510清远-0.2609910揭阳0.02865711茂名-0.2876111惠州-0.1083712肇庆-0.3584112云浮-0.109213汕头-0.4482813韶关-0.1997214韶关-0.5162214汕尾-0.3255915阳江-0.5960315汕头-0.345216揭阳-0.6083516河源-0.5793517梅州-0.6538717潮州-0.7640418汕尾-0.6935718中山-0.8821719云浮-0.7355119珠海-1.1448920河源-0.7452520东莞-1.3329821潮州-0.7757521深圳-1.86889从表9可以得出以下结论:广州、深圳和佛山在Factorl上的得分位居前三位,说明这三个市的综合生产力很强,云浮、河源和潮州在Factorl上的得分排在最后三位,说明三市的综合生产力很差,工业很落后。湛江、广州和茂名在Factor2上的得分位居前三位,说明这三个市的农业生产力很强。湛江和茂名都是全省面积、人口大市,从事农业生产的基础较强,而广州农业生产力强主要是由于有较强的农业的深加工能力。珠海、东莞和深圳在Factor2上的得分排在最后三位,说明这三市的农业生产力很差,这与这三个城市的历史有密切关系,珠海和深圳作为经济特区,从设立其就决定了其工业城市的地位,农业不是其发展方向;东莞则由于地理位置和政府管理体系的关系,一直以发展工业为主,大量的土地用于建设厂房和工业园区,农业发展受到很大的限制。2.4聚类分析在得到各市的因子得分后,我们希望对各市依据生产能力进行分类。首先,我们按照两个公共因子的得分,通过CLUSTER程进行聚类分析,并用TREEM程绘制聚类谱系图,程序如下:procclusterdata=scoreoutmethod=wardouttree=otstandardpseudocccvarfactor1factor2;idregion;proctreedata=othorizontal;run;表10聚类过程NCLClustersJoinedFREQSPRSQRSQERSQCCCPSFPST2Tie20meizhoujieyang20.00021.00..212.19zhanjianmaoming20.0003.999..209.18shantoushaoguan20.0003.999..207.17heyuanchaozhou20.0004.999..193.16jiangmenqingyuan20.0005.998..188.15shanweiyunfu20.0006.998..180.14CL20yangjian30.0009.997..1623.813CL18CL1540.0014.995..1403.112zhuhaizhongsha20.0015.994..131.11huizhouCL1630.0018.992..1243.710CL14CL1160.0069.985..80.88.19CL13CL1760.0069.978..67.210.08CL10zhaoqing70.0087.969..58.94.27CL12dongguan30.0102.959..54.96.86CL9CL8130.0352.924..36.513.55guangzhofoshan20.0557.868..26.4.4shengzheCL740.0982.770.822-1.519.016.83CL5CL1940.1457.624.731-2.215.05.22CL4CL6170.2529.372.444-1.011.221.81CL3CL2210.3716.000.0000.00.11.2从表10可得到几个分类判别依据:RSQ统计量。当NCL>4时,RSQ逐渐减少,改变不大,当NCL=4时,RSQ=0.77;当NCL=3时,RSQ=0.624,减少较多,因此按照RSg计量分为四个类比较合适。SPRS诳计量。SPRS诳计量最大和次大分别为1,2和3,因此按照SPRS僦计量分为二、三和四个类比较合适。PST2统计量。当NCL<6时,PST2统计量最大和次大分别为21.8和16.8,对应NCL=2NCL=4分成三或五个类比较合适。综合以上,用WAR映把21个市分为四类比较合适。proctreedata=othorizontalgraphicsn=4out=k44;copyfactor1factor2;run;procsortdata=k44;bycluster;|procmeansdata=k44;bycluster;varfactor1factor2;run;分类结果为:分类所含城市Factor1Factor2平均分标准差平均分标准差第一类汕头,韶关,汕尾,云浮,河源,潮州,梅州,揭阳,阳江,惠州,江门,清远,肇庆-0.5170.2195-0.0580.4064第二类湛江,茂名-0.2700.02561.87590.1033第三类深圳,珠海,中山,东莞0.80451.1361-1.3070.4176第四类广州,佛山2.02231.07611.11771.0336从聚类结果来看,类的划分基本反

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论