多元统计课程设计(参考范本)课件_第1页
多元统计课程设计(参考范本)课件_第2页
多元统计课程设计(参考范本)课件_第3页
多元统计课程设计(参考范本)课件_第4页
多元统计课程设计(参考范本)课件_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 2012年河北省国民经济发展的数理分析2012年河北省国民经济发展的数理分析 1.问题的提出1.1 课题背景为加强多元统计分析课程的实践教学力度,培养和提升学生运用SPSS,SAS等统计软件解决实际统计问题的能力,本次实验主要内容为各小组成员分别选取某一省份下各市地区(不少于10个省辖地区)2012/2013年度的社会经济发展指标,通过省份统计年鉴及其他途径收集相关数据(不少于10个经济发展指标),在此基础上,运用多元统计分析课程中所学的聚类分析、主成分分析和因子分析三大分析方法,建立相关数学模型;对选取省份2013/2014年度的社会经济发展状况作出综合分析。最后撰写实验报告,对所研究结果

2、作出整理,提交任课老师,作为课程学习能力评价的依据。实验报告内容要求如下:(1)给出数学模型的简单推导。(2)给出模型求解的基本步骤。(3)给出数据获取来源、三大分析的实验结果、经济发展情况分析和相关建议。1.2 课题目的采用聚类分析,对所选省份各市区的经济发展情况进行分类,分析各市区间的经济发展差异,得到各行政区域的经济发展状况的层级分类结果和经济类型划分结果,并对此做出简单的经济分析和统计意义阐释,达到分析所选省份区域经济发展差异,给出相关区域规划和经济政策制定建议的研究目标。运用主成分和因子分析,提取能综合解释所选省域地区经济发展的因素,并据此对各地区社会经济发展状况进行分类、比较和综合

3、评价,给出具体数量关系表达式,并讨论所选综合指标间的相关性;对模型结果做出合理化解释和经济发展建设相关建议。达到系统展现省域社会经济发展状况,为政府决策者统筹区域规划提供参考依据的目的。2.问题的分析引言:本小组成员打算借鉴汪潘义和王骑运用因子分析和聚类分析方法分析安徽省区域经济差异的经验,准备选取河北省2012年度11个地级市地区的经济发展状况相关指标和数据,分别利用聚类分析、主成分分析和因子分析三大分析方法建立经济综合评价的统计模型,借此系统展现省域社会经济发展状况全貌,分析所选省份区域经济发展差异,给出相关区域规划和经济政策制定建议的研究目标。2.1 课题模型假设假设1:本文为使问题研究

4、系统化,全面化;根据所学的宏观经济学课程知识,我们知道一个经济系统主要由投资、消费、储蓄、政府财政税收与购买等几大经济部门因素组成,为此本小组将影响河北省的社会经济发展的经济指标因素假定分为四大类部门层次进行综合考虑-政府财政税收因素,居民收入储蓄因素,消费因素,投资因素,以及考虑人口因素的综合核心指标因素-人均GDP,主要从宏观层面分析河北省(省域)国民经济发展情况。假设2:为保证实验结果的真实性和可靠信度,便于结果的经济分析和统计意义阐释,本小组成员的数据援引皆来自于河北省相应年度的统计年鉴,认为数据质量是可靠准确的,其次在数据指标的可比性和口径一致性上,我们认为各地级市地区间的同类指标具

5、有可比性,且统计测算口径保持一致。假设3:聚类分析结果得到的经济类型具有区分度和可比性,主成分和因子分析得到的因子成分具有经济意义,便于统计阐释。 2.2 课题指标选取 依据2.1节的假设1;根据宏观经济学经济系统运行机制涉及的部门经济变量,我们特别选取了以下经济变量指标作为经济综合分析评价的参考值,并将变量参数符号做出如下约定和说明详情见表1: 表1 河北省经济指标变量的数学模型参数含义因素层次变量设定指标意义备注宏观核心 X1人均地区生产总值地区生产总值与人口数的比值(元/人),一个国家或地区的所有常住单位,在一定时期内,通常是一个季度或一年,生产的全部最终产品和劳务的价值政府财政税收 X

6、2 地方财政预算收入 地方财政年度收入(万元) X3 地方财政支出地方财政年度支出(万元) 居民收入储蓄 X4 在岗职工平均工资在岗职工工资总额与在岗职工平均人数的比值(元),衡量区域居民工资性收入水平 X5城乡居民储蓄年末余额包括城镇居民储蓄存款和农民个人储蓄存款两部分(亿元),衡量消费和投资潜力 X6城镇居民人均可支配收入反映居民家庭全部现金收入能用于安排家庭日常生活的那部分收入,衡量居民生活水平 X7 农村居民人均纯收入 农村居民家庭全年总收入中,扣除经营费用支出、缴纳税款和上交承包集体任务金额以后剩余的,可直接支配的那一部分收入(元)社会投资 X8 固定资产投资总额 以货币表现的建造和

7、购置固定资产活动的工作量,反映固定资产投资规模、速度、比例关系和使用方向的综合性指标(亿元)。 X9 外商直接投资额外商直接投资,衡量经济开放程度(万美元) X10交通运输、仓储和邮政业投资总额高铁建设和电子商务业发展的相关指标(万元) X11 批发和零售业投资总额 实体商务居民消费指标(万元) X12 金融机构存款年底余额包括本外币,反映企业和个人投资储备(亿元) X13 金融机构贷款年底余额包括本外币,反映实际企业和个人投资规模(亿元)社会消费 X14 社会消费品零售总额 反映国内消费品和零售市场的总规模,也反映居民和社会集团对实物商品消费需求的总量和变化趋势(亿元) X15 居民消费价格

8、总指数 反映与居民生活有关的产品及劳务价格统计出来的物价变动指标,可以用来观察和分析消费品的零售价格和服务价格变动对城乡居民实际生活费支出的影响程度(选择某一年的消费价格为基期100) 备注:图表指标说明 指标选取说明考量: (1)宏观核心:GDP作为少数几个能评价国家或地区国民经济发展情况的综合性核心指标,理应纳入河北省国民经济发展综合分析评价中来,考虑到各地级市区的人口变量差异,为此本小组选择了人均GDP作为经济变量综合性分析指标,以消除人口因素在结果分析中的影响(如经济总量大和教育医疗等消费水平高的地区人口相对也较多,特别是省会城市),确保结果统计分析的可靠性和各地区经济指标评价的相对可

9、比性,当然在进行后续的统计结果分析时,应注意GDP这一综合指标与其他指标几乎都存在一定相关性的经济机制原理,在做出结果分析结论时,应仔细论证其与其他指标间的相关性强弱,从而避免统计信息的重复交叉,简化和准确提炼各市区经济发展的区域性差异和地区经济优势。 (2)政府财政税收:在财政税收方面,本小组选取的是地方财政预算收入与实际支出两个指标,以此来衡量和评价政府作为经济主体,在市场经济运行中的购买支配和收入能力,之所以选取预算收入指标而非决算指标,我们认为政府作为经济主体,有其天然的垄断特点和调控主体责任的特殊性,其经济行为带有一定的前置性,政府一般在财政预算制度框架下实施经济行为,其市场经济行为

10、一般是按预算方案做出决策,为此在进行国民经济综合评价时,我们在财政税收这一部门因素上选取的是预算收入而非决算指标,支出为实际指标,另外为简化分析,我们未另行严格论证和分析一般财政预算收入、总财政预算收入、财政预算收入在统计口径上的区别,假定地方财政预算收支这一财政税收统计口径具有相对可比性,忽略各地区间财政税收核算范围的区别,这与2.1节的模型假设2是一致的。 (3)居民收入储蓄:考虑到居民储蓄是投资、消费的潜在动力和储备,与其他两部门因素具有相关性,以及我国作为世界上高储蓄率国家之一的现实(某一程度上反映了社会保障水平的高低),我们决定引入城乡居民储蓄年末余额这一经济指标,由于我国金融制度和

11、相关产业发展与西方发达国家相比有一定的差距性,国民收入一般以工资性、劳务性收入为主,为此,我们主要选取在岗职工平均工资来衡量各地区居民收入差距和社会保障水平高低;最后考虑到国家的新型城镇化和城乡一体化建设的国家政策方针和战略布局,我们有必要分别选取城镇居民和农民人均可支配收入指标,以此来分析各市区城乡居民收入差据和可支配的个人消费和投资潜力差距。(4)社会投资:考虑到我国各省市均以房地产投资为支柱产业的现实,在投资部门因素上,我们引进以货币表现的建造和购置固定资产活动的工作量,反映固定资产投资规模、速度、比例关系和使用方向的综合性指标固定资产投资总额,随着我国对外开放程度日益加大,经济总量增长

12、,经济产品质量提升,我国对外的经济贸易量逐年上升,国内企业走出去态势良好,外商投资环境改善,上海自贸区成立,外商企业引进和投资额度力度加大,国内企业海外投资和进出口额度也同步成为经济增长点,一路一带基金设立和亚投行筹建等国家海外开拓战略相继推行,为此有必要将各市区的外商直接投资额指标纳入经济发展评价和分析之中(考虑到河北省的分市区的进出口总额指标缺失,故选择了从外商投资额来衡量各市区的经济开发程度,略有指标统计分析和阐释上的不足)。随着我国高铁建设和电子商务业的高速发展,批发和零售业和交通运输、仓储和邮政业投资总额是反映实体商贸经济活跃和投资水平的重要指标,自然有必要纳入。最后考虑到国家金融改

13、革步伐加快,互联网金融日益活跃于市场之中,为此本小组引入金融机构存贷款年底余额两个指标作为衡量地区金融杠杆实力带动投资、消费和经济发展的考量因素。 (5)社会消费:本小组在衡量社会需要和居民消费水平的相关指标中,主要选取的是社会消费品零售总额和居民消费价格总指数(CPI)两大指标,以此来比较河北省各市区消费品的零售价格和服务价格变动对城乡居民实际生活费支出的影响程度和社会保障实际水平区域差异和零售市场活跃和规模程度差异,当然这两个指标在进行统计分析时,应重点结合客货运量等相关性较强的经济指综合分析评价。 2.3 课题模型方法和求解方案 在2.1和2.2节的模型假设和指标选取分析基础,下面我们分

14、别给出利用聚类分析、主成分分析和因子分析三大分析方法建立具体、初步的经济综合评价统计模型的解决方案。 2.3.1 基于聚类分析 (1)思想与原理:根据研究对象的特征对研究对象进行量化分类的多元统计分析技术的总称,它直接比较各事物之间的性质,将性质相近的归为一类,将性质差别较大的归入不同的类。根据样本的多指标(变量)、多个观察数据,通常那根据定义的各种距离来定量地确定样品、指标之间存在的相似性或亲疏关系,并据此连结这些样品或指标,归成大小类群,构成分类树状图或冰柱谱系图。 (2)主要方法种类:从研究的分类对象角度,通常将聚类分析分为Q型聚类和R型聚类,Q型聚类是对样品进行分类处理,R型聚类是对变

15、量进行分类处理,从计算量大小角度,通常分为系统聚类法和K均值快速聚类法。具体方法介绍如下表2: 表2 聚类分析相关方法系统聚类Methoeds聚类方法用法Between-groups linkage类间平均链锁法SPSS系统默认方法Within-groups linkage类内平均链锁法Nearest neighbor最短距离法Furthest neighbor最长距离法Centroid clustering重心法结合欧氏距离平方法Median clustering中间距离法结合欧氏距离平方法Wards method离差平方和法 结合欧氏距离平方法 快速聚类MacQueen methodK均值

16、聚类法 结合欧氏距离平方法 (3)模型方法方案设计 整体思路:本文打算以Q型聚类分析技术(对样品、个案分类)进行分类,分别进行系统和快速聚类,在系统聚类上,集中选取最短、最远和离差平方和法进行系统聚类,比较分类差异,选取合理的系统分类结果,k均值分类主要是结合欧氏距离平方法,给出指定类数的分类结果,便于统计结果分析和经济差异阐述。距离测量技术选择Squared Euclidean distance(欧氏距离平方,即两观察单位间的距离为其值差的平方和,该技术用于Q型聚类)。 相关数学模型推导: 1.样品相似性的度量 欧几里得距离(q=2): 2.为克服欧氏距离受量纲影响,应对原始指标做标准化变换

17、,通常选取Z变换(又叫Z得分) 其中:为相应指标的均值,为相应指标的标准差。 3.聚类分析引用方法:最短距离法:定义类 与 之间的距离为两类最近样品的距离,即为 设类 与 合并成一个新类记为 ,则任一类与的距离为 最长距离法:定义类 与 之间的距离为两类最近样品的距离,即为 设类 与 合并成一个新类记为 ,则任一类与的距离为 Ward法:设n个样品分成k类 用表示中的第i个样品, 表示 中样品的个数, 是的重心,则的样品离差平方和为 如果 与 合并成一个新类记为 ,类内离差平方和分别为: 它们反应了各自类内样品的分散程度,如果 与 这两类相距较近,则合成后所增加的离散平方和应较小;否则,应较大

18、。于是定义 与之间的平方距离为: 其中, ,可以证明类间距离的推倒公式为 K均值聚类(1) 将所有样品分为K个初始类;(2) 通过欧氏距离将某一样品划入离中心最近的类中,对获得样品和失去样品的类,重新计算中心指标。(3) 重复迭代,直到所有样品都不能再分配为止。 基于SPSS软件的模型求解主要步骤:进入SPSS13.0 for windows分析程序,选择AnalyzeClassifyHierarchical Cluster,进行系统聚类分析(Hierarchical Cluster Analysis),引入的变量是X1至X15。以地区为个案标识,采取对样品(个案)进行聚类。聚类方法使用分别采

19、用最短、最远和离差平方和法和K均值聚类法,距离测量技术选择Squared Euclidean distance(Euclidean距离平方,即两观察单位间的距离为其值差的平方和,该技术用于Q型聚类,然后在相关统计量,选项按钮中,分别勾选想要设置和输入的结果(如聚类成员、树状图、相关性矩阵,聚类距离,聚类类数等),最后分别得到不同聚类方法和聚类类数的输出结果。输出结果的统计分析与经济评价 最后结合河北省经济发展实际,对输出结果做出统计分析和经济评价。输出结果见第四章,统计分析和评价见第五章。 2.3.1 基于主成分分析 (1)思想与原理:利用降维思想,通过线性变换方式,将多指标转化为少数几个综合

20、指标,以克服指标间的相关性、重叠性,保留原数据的大部分信息,降低分析的难度。 (2)模型方法及数学推导(援引教材p95-97): 设是p维随机向量,均值E(X)=协方差阵D(X)=,用X的p个向量(即p个指标向量)作线性组合(即综合指标向量)为: 其中方程组满足: (3)模型方法方案设计 基于SPSS模型求解主要步骤: 1. 数据标准化 进入SPSS13.0 for windows分析程序,录入原始数据,点击分析-描述统计-描述-勾选将标准化得分另存为变量的复选框即可。 2.进行因子分析,相关分析,关联度分析,得到相关系数阵和因子载荷矩阵和R的特征根。 在SPSS窗口中选择AnalyzeDat

21、a ReductionFactor菜单项,调出因子分析主界面,并将变量移入Variables框中,其他均保持系统默认选项,单击OK按钮,执行因子分析过程 3.计算特征向量矩阵 将因子载荷阵中的数据输入SPSS数据编辑窗口,分别命名为a1和a2,.ai,点击菜单项中的TransformCompute,调出Compute variable对话框,在对话框中输入等式:z1=a1 / SQRT(),计算第一个特征向量。点击OK按钮,即可在数据编辑窗口中得到以z1为变量名的第一特征向量。再调出Compute variable对话框,在对话框中输入等式: z2=a2 / SQRT(),计算第二个特征向量。

22、点击OK按钮,即可在数据编辑窗口中得到以z2为变量名的第二特征向量,以此类推,得到特征向量阵。 4.计算主成分矩阵,获得主成分公式和综合得分排序(本部分操作基于Excel 2007完成,详情见第四章4.2.3节)由累计方差贡献率确定主成分的个数(m),再利用公式得到综合得分并排序. (4)建模方案流程 确定初始指标 收集整理原始数据 标准化数据处理 相关因子(指标)分析 多重共线性诊断 主成分回归方程 输出结果的统计分析与经济评价 最后结合河北省经济发展实际,对输出结果做出统计分析和经济评价,输出结果见第四章,统计分析和评价见第五章。 2.3.1 基于因子分析 (1)原理与思想:因子分析模型是

23、主成分分析的推广。它也是利用降维的思想,由研究原始变 量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几 个综合因子的一种多变量统计分析方法,相对于主成分分析,因子分析更倾向于 描述原始变量之间的相关关系;它是根据相关性大小把原始变量分组,使得同组内的变量之间相关性较高,而不同组的变量间的相关性则较低。每组变量代表一个基本结构,并用一个不可观测的综合变量表示,这个基本结构就称为公共因子。对于所研究的某一具体问题,原始变量就可以分解成两部分之和的形式,一部分是少数几个不可测的所谓公共因子的线形函数,另一部分是与公共因子无关的特殊因子。 (2)模型方法步骤及数学推导: 因子分析

24、是一种降维,简化数据的技术。它通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个“抽象”的变量来表示其基本的数据结构,这几个抽象的变量就是因子。每一个变量都可以表示成公共因子的线性函数与特殊因子之和,即 式中的称为公共因子,称为的特殊因子。该模型可用矩阵表示为: 其中 且满足:(1); (2)即公共因子与特殊因子是不相关的;(3),即各个公共因子不相关且方差为1;(4),即各个特殊因子不相关,方差不要求相等。 模型中的称为因子“载荷”,是第i个变量在第j个因子上的负荷,如果把变量看成m维空间中的一个点,则表示它在坐标轴上的投影,因此矩阵A称为因子载荷矩阵。 (3)模型方

25、法方案设计 基于SPSS模型求解主要步骤: 由于因子分析与主成分分析求解步骤十分类似,这里只做简要说明:(援引教材p121-1258(1)原始数据标准化(2)标准化阵的相关系数阵(3)特征根i及相应的特征向量;(4)根据前k个主分量累计贡献率大小,确定因子个数;(5)初始因子载荷阵A; (6)若公因子的含义不清楚,不便于实际解释时,将初始因子阵作旋转处理,直到达到要求; (7)根据因子载荷大小说明因子具体含义 1. 录入原始数据,点击分析-描述统计-描述-勾选将标准化得分另存为变量的复选框即可,然后在SPSS窗口中选择AnalyzeData ReductionFactor,调出因子分析主界面,

26、并将11个经济指标标准化变量移入Variables框中。2. 点击Descriptives按钮,展开相应对话框,选择Initial solution复选项。给出各因子的特征值、各因子特征值占总方差的百分比以及累计百分比,单击继续按钮,返回主界面。3.点击Extraction按钮,设置因子提取的选项,。在Method下拉列表中选择因子提取的方法,SPSS提供了七种提取方法可供选择,一般选择默认选项,即“主成分法”。在Analyze栏中指定用于提取因子的分析矩阵,分别为相关矩阵和协方差矩阵。在Display栏中指定与因子提取有关的输出项,如未旋转的因子载荷阵和因子的碎石图。在Extract栏中指定

27、因子提取的数目,有两种设置方法:一种是在Eigenvalues over后的框中设置提取的因子对应的特征值的范围,系统默认值为1,即要求提取那些特征值大于1的因子;第二种设置方法是直接在Number of factors后的矩形框中输入要求提取的公因子的数目。4.若初始公因子的含义不清楚,不便于实际解释时,我们接着做以下操作:点击Rotation按钮,设置因子旋转的方法。这里选择Varimax(方差最大旋转),并选择Display栏中的Rotated solution复选框,在输出窗口中显示旋转后的因子载5.点击得分按钮,设置因子得分的选项。选中Save as variables复选框,将因子

28、得分作为新变量保存在数据文件中。选中Display factor score coefficient matrix复选框,这样在结果输出窗口中会给出因子得分系数矩阵。单击Continue按钮返回主界面荷阵。单击继续按钮,返回主界面。6. 最后单击OK(确定)按钮,得到因子分析过程结果。 输出结果的统计分析与经济评价最后结合河北省经济发展实际,对输出结果做出统计分析和经济评价,输出结果见第四章,统计分析和评价见第五章。 3 数据的收集与处理3.1 数据的收集根据2.2节的指标选取分析,相关指标可以较为全面反映全国各省、直辖市的经济发展状况,上网查询河北省统计年鉴2013,收集河北省2012年度河

29、北省的国民经济发展相关数据,编辑Excel工作表,得到表3如下: 表3 河北省国民经济发展原始指标数据 3.2 数据的处理 为消除运用欧氏距离进行三大统计分析时易受到原始指标变量量纲的影响,故进行Z标准变换(保留4位有效数字),得到表4如下: 表4 河北省国民经济发展标准化指标数据 4 模型的求解结果 引言:由于在第二章中,已经详细介绍了模型方法求解的方案设计,并给出了有关基于SPSS操作求解的具体步骤,故在本章,本文将直接简要的给出三大多元统计方法建模的有关SPSS求解的运行输出结果图表,而不再赘述有关操作。为便于后续统计模型的分析,在此先给出原始数据的描述性统计信息 表5 河北省国民经济发

30、展指标数据描述性统计 描述统计量N极小值极大值均值标准差人均地区生产总值(元)X111302589657456200.0022015.681地方财政预算收入(万元)X21150734330109361515238.00785810.068地方财政支出(万元)X311160809549031413100512.271065845.348在岗职工平均工资(元)X411328004583839179.824389.769城乡居民储蓄年末余额(亿元)X511316.032094.85792.5691618.10928城镇居民人均可支配收入(元)X611184412487220931.842441.01

31、4农村居民人均纯收入(元)X7115546106987817.221782.870固定资产投资总额(万元)X81163994963673334817050040.459669352.770外商直接投资额(万美元)X9111202012138452771.4532784.846交通运输、仓储和邮政业投资总额(万元)X101115113533500661240849.27897347.318批发和零售业投资总额(万元)X11111049361535343598453.27419337.423金融机构存款年底余额(亿元)X1211532.415294.241591.49351477.73532金融机

32、构贷款年底余额(亿元)X1311300.61823069.18941036.488536845.7427303社会消费品零售总额(亿元)X14113501916841.28510.831居民消费价格总指数X1511101.9103.4102.736.4717有效的 N (列表状态)11 4.1 聚类分析统计模型 4.1.1 系统聚类 4.1.1.1 Ward法: 4.1.1.3 最远距离法 完整联结群集成员案例5 群集4 群集3 群集1:石家庄市1112:承德市 2223:张家口市2224:秦皇岛市3225:唐山市 4316:廊坊市 2227:保定市 5438:沧州市 5439:衡水市 322

33、10:邢台市 22211:邯郸市 543 4.1.1.2 最短距离法:单个联结群集成员案例5 群集4 群集3 群集1:石家庄市1112:承德市 2223:张家口市2224:秦皇岛市2225:唐山市 3336:廊坊市 2227:保定市 4428:沧州市 4429:衡水市 22210:邢台市 22211:邯郸市 542 4.1.2 快速聚类 4.1.2.1 K均值聚类快速聚类聚类成员案例号省辖市聚类距离1石家庄市1.0002承德市 4595960.1533张家口市41706749.2234秦皇岛市42780068.7975唐山市 3.0006廊坊市 42957403.2747保定市 2148551

34、0.1898沧州市 21467340.7559衡水市 43735987.90010邢台市 41900985.44711邯郸市 22815611.777最终聚类中心间的距离聚类123411.659E76786157.2442.695E721.659E71.031E71.038E736786157.2441.031E72.063E742.695E71.038E72.063E7 4.2 主成分分析与因子分析统计模型 4.2.1因子分析初步分析(采取主成分法) 4.2.2因子分析修正(进行因子旋转,采取最大方差旋转) 成份转换矩阵成份121.900.4362-.436.900提取方法 :主成分分析法。

35、 旋转法 :具有 Kaiser 标准化的正交旋转法。 4.2.3 模型评价结果主成分分析 因子最大方差旋转分析 5 模型结果的统计分析与经济评价 5.1 聚类分析统计模型 从4.1节的模型求解结果中,我们可以看到,本文为了使聚类结果具有可比性、统计分析更为可靠,在模型求解方案中,特别分别采取了系统聚类和K均值快速聚类法对河北省11个地级市区的经济类型划分和区域差异进行了聚类分析,其中系统聚类法下也采取了三种常用的方法最长、最短距离法和ward法。以便于比较和甄选合适的类数,使之更具统计分析价值,便于统计阐释和贴近河北省区域经济发展实际情况,比较4.1.1和4.1.2相关聚类结果,我们可以看到将

36、河北省11个地级市区的区域经济划分为四类较为合理,在最短,最远和均值聚类结果中,若分为四类,运用不同聚类方法得到的聚类结果基本保持一致,另外查阅相关河北省区域经济评价研究文献,发现大部分学者也是将河北省的区域经济类型按行政11个地级市划分为四大类,为了更为精确分析其区域经济类型划分,特将系统和K均值快速聚类结果分析分别总结如下: 表6 聚类最终划分结果(系统聚类) 聚类方法 ward 最近 最远文献参考分类 第一类 石家庄,唐山 石家庄 石家庄 唐山 第二类承德,张家口,廊坊,邢台承德,张家口,秦皇岛,廊坊,衡水,邢台承德,张家口,秦皇岛,廊坊,衡水,邢台石家庄、秦皇岛、沧州、廊坊 第三类秦皇

37、岛,衡水 唐山 唐山邯郸、承德、张家口 第四类保定,沧州,邯郸保定,沧州,邯郸邯郸,保定,沧州保定、衡水、邢台分类最终距离划分指标角度唐山和石家庄在零售业,固定资产投资,社会消费品总额上有差距(石高于唐),其他各项指标唐高于石,但总体二者在11市区内均居前列。主要考虑人均GDP(得分降序排列) 表7 聚类最终划分结果(系统聚类) 第一类 石家庄 第二类保定,沧州,邯郸 第三类 唐山 第四类承德,张家口,廊坊,衡水,邢台,秦皇岛邯郸市在保,沧、邯一类中,人均GDP较低,为全省第七,但城乡居民和政府收入较高,固投和外商及交通业投资在全省前列,社会零售实体经济居于三者中间位置,外商投资额仅次于省会石

38、家庄,经济开放程度高。总体而言,三者各项经济发展指标均在河北省11市区中等水平。承德、张家口、衡水、邢台各项指标均处于全省市区后列,区域经济发展水平较落后,经济实力偏弱。秦皇岛和廊坊在不同聚类方法中争议较大,值得分析;两者的CPI水平均在全省前列,说明其物价水平对居民消费生活水平较大影响,人均GDP和工资水平相仿,但居民可支配收入和政府收支方面,廊坊均高于秦皇岛,实体经济的零售,交通投资方面,廊坊也明显好于秦皇岛。当然由于独特的近海和靠近经济强市唐山的地理优势,秦皇岛的经济开放程度高于廊坊,外商投资额高,且居河北省第三。 由表6.7比较和分析,可以看出最远,最近和K均值聚类法的分类结果差距不大

39、,而ward法是在数据已经标准化的情况下得到的结果,我们可以认为ward法的分类结果误差大,与河北省区域经济实际类型和差异不符,不予考虑,我们认为K均值由于和最远、最近聚类结果一致程度高,故最后选取K均值聚类结果来进行分析。 第一、三类:石家庄市作为河北省会城市,是全省的政治、经济、文化中心,经济水平位列全省之首,综合经济实力突出,两者在聚类分析结果中-最终聚类距离中,二者相对最近,可以认为二者差异不大,可以划为同一级别经济发展水平城市。在零售业,固定资产投资,社会消费品总额方面,石家庄高于同等水平的唐山市。但在交通运输和人均GDP和居民收入方面略逊于有北方工业重镇之称的唐山市,而唐山市由于其

40、工业城市的经济地位,其交通运输业的投资额度与河北省其余市区相差较大,是石家庄的近两倍,交通物流经济因素强劲,总体而言,石家庄借助政策资源优势大力发展以房地产等建筑也为主的固定资产投资和强劲的零售商品中转业务(全国铁路、公路、邮政、通讯的重要枢纽。国务院批准定位的华北地区重要商埠,市场覆盖华北、东北、西北的广大地区,是中国北方重要的商品集散地和物流中心),作为其经济增长和发展的主力。而唐山借助传统的工业基础实力和外商投资力度来带动产业经济发展(能源资源丰富,原煤、石油、钢材、发电量产量在全省均名列前茅,,二者宏观核心指标人均GDP均位居第一、二位,其区域经济综合实力强劲,是带领河北省其他周边城市

41、发展的主力。第二类:保定,沧州,邯郸,属于中等水平城市,各项指标处于河北11市区中间位置,属于经济发展相对均衡区。三市都是河北省传统的工业区,传统工业改造要求高,经济效率相对较低,产业结构层次低,对经济的全面发展产生一定的制约,应加大交通运输和金融资金等资源的投入,培育较好的交通、资源条件,寻找新的经济增长点,发展的潜力较大,在三市中又以邯郸作为中原地区的重要枢纽,市境内京广铁路、京深高速公路等纵贯南北。金融机构存贷款均高于其他两个城市,其发展潜力更为突出。第四类:承德,张家口,廊坊,衡水,邢台,秦皇岛,属于河北经济欠发达地区,经济综合实力偏弱,其中北部承德、张家口市的经济发展水平和经济实力比

42、较弱,是相对贫困地区。基础薄弱,资源优势不明显,缺乏明显的经济增长活力。秦皇岛,廊坊虽平均工资较高,但其的固定资产,交通运输业和零售等实体经济投资额严重不足,这与我国现实的以投资拉动GDP的经济主流发展模式不符,因此也在K均值聚类分析中划为了综合实力薄弱地级城市区。这也很好解释了实验结果与文献参考分类的差异性,在秦皇岛、廊坊的类型划分上不同聚类方法是存在争议,依据有关文献和国家政策介绍,廊坊市借助明显的区位优势大力发展服务业,近年第三产业对经济增长的贡献率为34.8%,服务业营业收入在全省列第三位,其他服务业、房地产业和金融保险业发展迅速,被新闻媒体评为“中国二十佳投资区”之一。那么这里以其实

43、体经济投资额度不足为统计指标分析考量,而将其划为与承德,张家口为同一类区域经济类型城市时值得商榷的,这里可能与本文选择的经济指标的质量好坏有一定的关系,指标是否具有很多的解释力度和统计代表性有待后续的进一步探讨。这里暂且给出这一初步分类和统计分析,并以此做出上述的11各地级城市区域经济类型的划分和经济综合实力评价。5.2 主成分和因子分析统计模型 由4.3.2节的模型结果,可以借助主成分分析和因子分析的综合得分评价思想分别给出有关地级城市综合经济实力的评价如下:(1) 主成分分析: (2)因子最大方差旋转分析: 综合得分综合排名主成分分析YNO.X辖区/符号0.7561685583石家庄市-0

44、.97531763811承德市-0.9425965210张家口市0.0356845425秦皇岛市1.3020294761唐山市0.9345157182廊坊市-0.0173161116保定市-0.0859783967沧州市-0.7947900089衡水市-0.5441714448邢台市0.3317566664邯郸市综合得分综合排名主成分分析FNO.X辖区/符号-0.0329324155石家庄市-0.1794559368承德市-0.1824147089张家口市0.0193477943秦皇岛市0.4613625582唐山市-0.0330867866廊坊市0.104045854保定市0.4718340

45、371沧州市-0.1996270410衡水市-0.30315832211邢台市-0.1258893047邯郸市 根据上述两表可看出各个市的经济综合水平,从主成分和因子分析综合评价结果比较中可以看出,由于唐山市各项水平居高,优越的地理位置,合理的经济结构,市场发育程度高,为此在两种分析的综合排名名次变动幅度不大,说明其经济发展在河北省具有绝对性优势。而在聚类分析中,和唐山市几乎处于同一水平的石家庄,其综合评价排名不够稳定,可能与其宏观核心指标人均GDP未能远超除唐山外的其他地级城市(如廊坊、保定等),而沧州市由主成分分析排名第7上升为因子分析中的第1位,这可能是由于因子旋转作用,将人均GDP这一指标的评分力度拉大(沧州市人均GDP居河北省之首)。承德。张家口、衡水、邢台排名差异不大,其总体经济综合实力属于河北省经济发展不发达地区。 简而言之,主成分综合得分评价与聚类分析结果一致性

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论