版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
空间计量经济学简介
ABriefIntroductiontoSpatialEconometrics2024/4/121Topics空间计量经济学的基础空间滞后模型计量分析空间误差模型计量分析地理加权回归模型分析空间计量经济分析软件包:GeoDa+SAM+ArcGIS+R(SpDep)+Lesage(SET)+Spacestat+Winbugs空间计量的应用研究案例2024/4/122天行健,君子以自强不息;地势坤,君子以厚德载物。Definition:
Whatisspatialeconometrics?简单地说,空间计量经济学(SpatialEconometrics)就是空间经济的计量。即:是以空间经济理论和地理空间数据为基础,以建立、检验和运用经济计量模型为核心,运用数学、统计学方法与计算机技术对经济活动的相互作用(空间自相关spatialdependence)和空间结构(空间异质性spatialheterogeneity)问题进行定量分析,研究空间经济活动或经济关系数量规律的一门经济学学科。2024/4/123天行健,君子以自强不息;地势坤,君子以厚德载物。Definition:
Whatisspatialeconometrics?一般认为,与其具有密切关系的学科主要是空间统计学(SpatialStatistics)、计算经济学(computationalEconomics)和地理信息系统(GeographicInformationSystem,GIS)。数据驱动(data-driven)和模型驱动(model-driven);时间序列(timeseries)分析转向空间数据(spatialdata)分析。2024/4/124天行健,君子以自强不息;地势坤,君子以厚德载物。空间数据分析空间数据(spatialdata)也可以成为地理数据,是以不同的方式和来源获得的数据,如地图、统计数据等,这些数据都具有能够确定空间位置的特点。百度百科:空间数据是指用来表示空间实体的位置、形状、大小及其分布特征诸多方面信息的数据,是一种用点、线、面以及实体等基本空间数据结构来表示人们赖以生存的自然世界的数据,以坐标和拓扑关系的形式存储。空间数据的拓扑关系2024/4/125天行健,君子以自强不息;地势坤,君子以厚德载物。空间数据分析数据分析包括探索阶段和证实阶段空间数据分析分为两类:探索性空间数据分析(exploratoryspatialdataanalysis,ESDA)和确认性空间数据分析(affirmablespatialdataanalysis,ASDA)。前者对应空间统计方法,后者对应空间计量模型。空间数据分析的一般程序:首先用探索性空间数据分析直观地描述空间数据,直接探索隐藏在数据中的关系、模式和趋势等,获得问题的理解和相关知识(发现问题);然后运用空间计量经济学方法更深入地研究所发现的问题,并为相关理论提供经验证据(研究问题)。2024/4/126天行健,君子以自强不息;地势坤,君子以厚德载物。探索性空间数据分析:箱线图2024/4/127天行健,君子以自强不息;地势坤,君子以厚德载物。探索性空间数据分析:直方图2024/4/128天行健,君子以自强不息;地势坤,君子以厚德载物。探索性空间数据分析探索性空间数据分析(ESDA)是一种具有识别功能的空间数据分析方法,将统计学和现代图形计算技术结合起来,用直观的方法展现空间数据中隐含的空间分布(随机、分散、聚集)、空间模式(时空关联)以及空间相互作用等特征。“让数据自己说话”两类工具:第一类,全局空间相关性,一般用Moran指数I(Moran,1950)、Geary指数C(Geary,1954)来测度;第二类,局部空间相关性,一般用G统计量、Moran散点图和LISA来测度。2024/4/129天行健,君子以自强不息;地势坤,君子以厚德载物。全域空间相关性全域空间自相关(GlobalSpatialAutocorrelation)是从区域空间的整体上刻画区域创新活动空间分布的集群情况。在许多实证研究中,Moran’sI和Geary’sC是常用方法,已在大量文献中出现,尤其是前者。Moran’sI是最早应用于全局聚类检验的方法(Cliff和Ord,1973)。因此,以下重点介绍常用的Moran’sI指数的计算及检验过程。2024/4/1210天行健,君子以自强不息;地势坤,君子以厚德载物。全域空间相关性检验与分析Moran’sI定义如下:
其中,,,表示第个地区的观测值(如专利数),
为地区总数(如省域),为二进制的邻近空间权值矩阵,表示其中的任一元素,采用邻近标准或距离标准,其目的是定义空间对象的相互邻近关系。
2024/4/1211天行健,君子以自强不息;地势坤,君子以厚德载物。全域空间相关性检验与分析Moran’sI指数取值一般在-1到1之间。大于0表示正相关,代表相邻地区的类似特征值出现集群(Clustering)趋势,接近于1时表明具有相似的属性聚集在一起(高值与高值、低值与低值);小于0表示负相关,接近于-1时表明具有相异的属性聚集在一起(高值与低值、低值与高值);若为接近于0,则表示属性是随机分布的,或者不存在空间自相关。2024/4/1212天行健,君子以自强不息;地势坤,君子以厚德载物。全域空间相关性检验与分析对于Moran指数I,可以用标准化统计量Z来检验n个区域是否存在空间自相关关系,Z的计算公式为如果Moran’sI的正态统计量的Z值均大于正态分布函数在0.05(0.01)水平下的临界值1.65(1.96),表明区域创新在空间分布上具有明显的正向相关关系。2024/4/1213天行健,君子以自强不息;地势坤,君子以厚德载物。全域空间相关性检验与分析Geary系数C计算公式如下
式中:C为Geary系数;其他变量同上式。
Geary系数C的取值一般在[0,2]之间,大于1表示负相关,等于1表示不相关,而小于1表示正相关。2024/4/1214天行健,君子以自强不息;地势坤,君子以厚德载物。局部空间自相关检验与分析局部空间自相关分析方法包括3种:
空间联系的局部指标(localindicatorsofspatialassociation,LISA));
G统计量
;
Moran散点图。
Anselin(1995)提出了局部Moran指数,定义为:可进一步写成式中:和是经过标准差标准化的观测值。
局部Moran指数局部Moran指数检验的标准化统计量为正的局部Moran指数Ii,表示一个高值被高值所包围(高-高),或则是一个低值被低值所包围(低-低)。负的局部Moran指数Ii,表示一个高值被低值所包围(高-低),或则是一个低值被高值所包围(低-高)。
G统计量类似的,Getis和Ord(1992)开发了一个Geary指数的局部聚类检验,称为Gi指数(Gistatistic)全局G统计量的计算公式为对每一个区域单元的统计量为
对统计量的检验与局部Moran指数相似,其检验值为
显著的正值表示在该区域单元周围,高观测值的区域单元趋于空间集聚,而显著的负值表示低观测值的区域单元趋于空间集聚,与Moran指数只能发现相似值(正关联)或非相似性观测值(负关联)的空间集聚模式相比,具有能够探测出区域单元属于高值集聚还是低值集聚的空间分布模式。Moran散点图以(Wz,z)为坐标点的Moran散点图,常来研究局部的空间不稳定性,它对空间滞后因子Wz和z数据对进行了可视化的二维图示。全局Moran指数,可以看作是Wz对于z的线性回归系数,对界外值以及对Moran指数具有强烈影响的区域单元,可通过标准回归来诊断出。由于数据对(Wz,z)经过了标准化,因此界外值可易由2-sigma规则可视化地识别出来。MoranscatterplotMoran散点图的4个象限,分别对应于区域单元与其邻居之间4种类型的局部空间联系形式:
第一象限(高一高,标记为HH):它表示一个高经济水平的区域被其它高经济水平的区域包围;或者说,一个高经济水平的区域和它周围的经济区域他们有较小的空间差异程度;
第二象限(低一高,标记为LH):它表示高经济水平的区域包围着一个低经济水平的区域,也就是说该区域的经济水平相比较周围邻居是比较低的,意既该区域经济的空间差异的程度是比较大的;。
第三象限(低一低,标记为LL):它表示该区域和它周围的其他区域都是低经济水平的区域,也就是说这个区域的经济水平是比较低的,表现为这个区域和它的邻居区域经济的空间差异程度是比较小的;
第四象限(高一低,标记为HL):它表示一个区域是高经济水平,而周围其他的区域是低经济水平,也就是这个区域的经济水平是比较高的,而且这个区域经济是有比较大的的空间差异程度的。
与局部Moran指数相比,其重要的优势在于能够进一步具体区分区域单元和其邻居之间属于高值和高值、低值和低值、高值和低值、低值和高值之中的哪种空间联系形式。并且,对应于Moran散点图的不同象限,可识别出空间分布中存在着哪几种不同的实体。将Moran散点图与LISA显著性水平相结合,也可以得到所谓的“Moran显著性水平图”,图中显示出显著的LISA区域,并分别标识出对应于Moran散点图中不同象限的相应区域。
空间权值矩阵的确定
在讨论空间依赖性和空间异质性问题之前,首先需要做的工作是量化样本数据的区位因素(quantitativerepresentationofspatialrelationships)。在区域经济管理研究中,将空间效应因素引入经济管理过程的研究,建立空间计量经济模型进行空间统计分析时,一般要用空间权值矩阵(WeightsMatrix)来表达空间相互作用。对位置的量化一般依据“距离”而定:空间距离和经济距离2024/4/1226天行健,君子以自强不息;地势坤,君子以厚德载物。空间距离的形式1、相邻距离(Contiguity)-A“neighbor”isdefinedbasedoncommonbordersorcommoncorners.根据地图上所研究区域的相对位置,决定哪些是相邻的,并用“0-1”表示,即“1”表示空间单元相邻,“0”表示空间单元不相邻。对于一个具有n个空间单元的系统,相邻矩阵W是一个nⅹn稀疏的0-1矩阵,对角线为0(习惯上,空间单元不与自身相邻),相邻元素为1。2024/4/1227天行健,君子以自强不息;地势坤,君子以厚德载物。(1)(2)(3)(5)(4)(6)2024/4/1228天行健,君子以自强不息;地势坤,君子以厚德载物。空间距离的形式几种相邻关系:(1)线性相邻(Linearcontiguity)(2)“车”相邻Rookcontiguity–commonborders.(3)“象”相邻Bishopcontiguity–commoncorners.(4)“后”相邻Queencontiguity–commonbordersandcommoncorners.2024/4/1229天行健,君子以自强不息;地势坤,君子以厚德载物。LinearContiguity(1)(2)(3)(4)(5)ModellingspaceBinarycontiguitymatrices(rook,queen)wi,j=1ifiandjareneighbors,0otherwise
Neighborhoodclasses(first,second,etc)W=空间距离的形式2、有限距离与负指数距离Distance–Aneighborisdefinedbasedonitsdistance(pointtopoint,centroidtocentroid)fromeachspatialunit.欧氏距离(Euclideandistance):是在n维空间中两个点之间的真实距离。在二维和三维空间中的欧氏距离的就是两点之间的距离。
二维的公式:ρ=sqrt((x1-x2)^2+(y1-y2)^2)三维的公式:ρ=sqrt((x1-x2)^2+(y1-y2)^2+(z1-z2)^2)2024/4/1234天行健,君子以自强不息;地势坤,君子以厚德载物。空间距离的形式2、有限距离与负指数距离Distance–Aneighborisdefinedbasedonitsdistance(pointtopoint,centroidtocentroid)fromeachspatialunit.有限距离(Pace,1997):令dij表示两个区域之间的欧氏距离(EuclideanDistance),dmaxi表示最大的空间相关距离,对于区域i若dij≤dmaxi,则Wij=1,否则Wij=0。同样W的对角线元素Wij=0。负指数距离(Anselin,1988):W=exp(-βdij),dij表示两个区域之间的欧氏距离(EuclideanDistance),β为预先设定的参数。2024/4/1235天行健,君子以自强不息;地势坤,君子以厚德载物。Modellingspace在ArcGIS中,定义空间权重的方法有:(1)以距离的倒数为权重(1/d);(2)以距离平方的倒数为权重(1/d2)等。InversedistanceweightsmatricesW=经济距离的形式如在研究收入差距时,两个区域的经济距离是其中,Zi、Zj是两个区域的居民收入。其他距离:K个最邻近k-NearestNeighbors–Usesdistancebutcountsonlythe“k”nearestneighbors.2024/4/1237天行健,君子以自强不息;地势坤,君子以厚德载物。2024/4/1238天行健,君子以自强不息;地势坤,君子以厚德载物。2024/4/1239天行健,君子以自强不息;地势坤,君子以厚德载物。2024/4/1240天行健,君子以自强不息;地势坤,君子以厚德载物。空间权值矩阵空间权值矩阵(SpatialWeightsMatrix)是一种与被解释变量的空间自回归过程相联系的矩阵。在实际的区域分析中,该矩阵的选择设定是外生的,原因是n×n维的W包含了关于区域i和区域j之间相关的空间连接的外生信息,不需要通过模型来估计得到它,只需通过权值计算出来就行了。2024/4/1241天行健,君子以自强不息;地势坤,君子以厚德载物。空间权值矩阵的基本原理
W中对角线上的元素被设为0,而表示区域i和区域j在空间上相连接的原因。为了减少或消除区域间的外在影响,权值矩阵被标准化(Row-standardization)行元素之和为1。对于变量x,这种转换意味着定义成空间滞后变量的仅仅表示邻近观测值的加权平均数。2024/4/1242天行健,君子以自强不息;地势坤,君子以厚德载物。空间权值矩阵的基本原理
可用矩阵表示如下:2024/4/1243天行健,君子以自强不息;地势坤,君子以厚德载物。基于邻近概念的空间权值矩阵根据相邻标准,为:式中,;或。基于邻近概念的空间权值矩阵(ContiguityBasedSpatialWeights)有一阶邻近矩阵和高阶邻近矩阵两种。2024/4/1244天行健,君子以自强不息;地势坤,君子以厚德载物。2024/4/1245天行健,君子以自强不息;地势坤,君子以厚德载物。2024/4/1246天行健,君子以自强不息;地势坤,君子以厚德载物。基于邻近概念的空间权值矩阵一阶邻近矩阵(theFirstOrderContiguityMatrix)是假定两个地区有共同边界时空间关联才会发生,即当相邻地区i和j有共同的边界用1表示,否则以0表示。一般有Rook邻近和Queen邻近两种计算方法(Anselin,2003)。Rook邻近定义为仅有共同边界来定义邻居,而Queen邻近则除了共有边界邻区外还包括共同顶点的邻居。由此可见,基于Queen邻近的空间矩阵常常与周围地区具有更加紧密的关联结构(拥有更多的邻区)。2024/4/1247天行健,君子以自强不息;地势坤,君子以厚德载物。基于邻近概念的空间权值矩阵当然,如果假定区域间公共边界的长度不同(如10km和100km)其空间作用的强度也不一样,则还可以通过将共有边界的长度纳入权值计算过程中,使这种邻近指标更加准确一些。2024/4/1248天行健,君子以自强不息;地势坤,君子以厚德载物。基于邻近概念的空间权值矩阵空间矩阵不仅仅局限于第一阶邻近矩阵,也可以计算和使用更高阶的邻近矩阵。Anselin&Smirnov(1996)提出了高阶邻近矩阵的算法,其目的是为了消除在创建矩阵时出现的冗余及循环。二阶邻近矩阵(theSecondOrderContiguityMatrix)表示了一种空间滞后的邻近矩阵。也就是说,该矩阵表达了邻近地区的相邻地区的空间信息。2024/4/1249天行健,君子以自强不息;地势坤,君子以厚德载物。基于邻近概念的空间权值矩阵当使用时空数据并假设随着时间推移产生空间溢出效应时,这种类型的空间权值矩阵将非常有用。在这种情况下,特定地区的初始效应或随机冲击将不仅会影响其邻近地区,而且随着时间的推移还会影响其邻近地区的相邻地区。当然,这种影响是几何递减的。可以看出,邻近空间权值矩阵因其对称与计算简单而最为常用,适合于测算地理空间效应的影响。2024/4/1250天行健,君子以自强不息;地势坤,君子以厚德载物。K值最邻近空间矩阵
(K-NearestNeighborSpatialWeights)Anselin(2003)介绍了一种K值最邻近空间矩阵。之所以提出这种距离矩阵,主要是因为一般使用的基于门槛距离(ThresholdDistance)的简单空间矩阵常常会导致一种非常不平衡的邻近矩阵结构。譬如,在空间单元的面积相差甚大的情况下,就会出现小一些的地理单元具有很多邻近单元,而较大的地理单元则可能很少有邻近单元,甚至没有邻近单元而成为“飞地”。2024/4/1251天行健,君子以自强不息;地势坤,君子以厚德载物。K值最邻近空间矩阵
(K-NearestNeighborSpatialWeights)在这种情况下,考虑K—最近邻居是一种可供选择的常用方法,这也是创建空间距离权值矩阵的第二种选择。一般在给定空间单元周围选择最邻近的4个单元(亦可选4个以上,根据实际的空间关联情况由研究者确定),来计算K值最近邻居权值的大小。2024/4/1252天行健,君子以自强不息;地势坤,君子以厚德载物。基于距离的空间权值矩阵
根据距离标准,为:基于距离的空间权值矩阵(DistanceBasedSpatialWeights)方法是假定空间相互作用的强度是决定于地区间的质心距离或者区域行政中心所在地之间的距离,是一种在实践应用中常用的空间权值矩阵。2024/4/1253天行健,君子以自强不息;地势坤,君子以厚德载物。基于距离的空间权值矩阵
在这种情况下,不同的权值指标随距离dij的定义而变化(如大城市圈、公路之间的距离),其取值取决于选定的函数形式(如距离的倒数或倒数的平方,以及欧氏距离等)。当然,还需要定义一个门槛距离,超过了某给定的门槛距离则区域间的相互作用可以忽略不计。2024/4/1254天行健,君子以自强不息;地势坤,君子以厚德载物。基于距离的空间权值矩阵
如果输入的时空数据库中有x、y经纬度坐标数据,可以通过x、y坐标计算两点(两个地区的质心)之间的距离而获得空间权值矩阵。坐标的度量有欧氏距离(EuclideanDistance)和弧度距离(ArcDistance)两种,度量坐标系上任意两点间的距离可以通过具有地理坐标(x坐标、y坐标)的变量的点来计算。值得注意的是,对于经过投影的地理坐标只能计算欧氏距离,而未经投影的经纬坐标适合于计算弧度距离。2024/4/1255天行健,君子以自强不息;地势坤,君子以厚德载物。经济社会空间权值矩阵
除了使用真实的地理坐标计算地理距离外,还有包括经济和社会因素的更加复杂的权值矩阵设定方法。比如,根据区域间交通运输流、通讯量、GDP总额、贸易流动、资本流动、人口迁移、劳动力流等确定空间权值,计算各个地区任何两个变量之间的距离。2024/4/1256天行健,君子以自强不息;地势坤,君子以厚德载物。空间权值矩阵的选择
从理论上来看,较之邻近矩阵,距离矩阵在空间效应测算中应该是比较科学和理想的一个指标。但是,在实际应用中,这种方法实行起来比较困难,原因有二:一是社会经济距离的实际统计数据难以获得;二是模型中权值的计算是外生的。当然,基于经济、社会因素的权值计算方法更加接近区域经济的现实,因而在数据可得和模型结构清晰的情况下,可以考虑选择这种类型的权值。2024/4/1257天行健,君子以自强不息;地势坤,君子以厚德载物。空间权值矩阵的选择
尽管二进制的空间邻近权值矩阵并非适用于所有的空间计量经济模型,但是,处于某些情况下的实用性,空间统计学家在构建空间计量模型时的首选就是从二进制的邻近矩阵开始的。一般是先从空间邻近的最基本二进制矩阵开始,逐步选择确定空间权值矩阵。2024/4/1258天行健,君子以自强不息;地势坤,君子以厚德载物。空间权值矩阵的选择
关于各种权值矩阵的选择,没有现成的理论根据,一般可考虑空间计量模型对各种空间权值矩阵的适用程度,检验估计结果对权值矩阵的敏感性,最终的依据实际上就是结果的客观性和科学性。本研究所有具体应用中涉及的空间邻近矩阵的计算,主要采用Anselin(1999,2003)研制开发的空间统计分析软件GeoDa095i,直接生成邻近矩阵来测算并确定地区之间的空间效应。2024/4/1259天行健,君子以自强不息;地势坤,君子以厚德载物。空间滞后算子Wy
一个与空间相邻性相关的基本概念是空间滞后算子(spatiallagoperator)------isaspatiallylaggedvalueofthevariabley------Incaseofarow-standardizedW,Wyistheaveragevalueofthevariable
用标准化W乘以由空间相关变量所组成的向量y,可得出向量Y*=W•y2024/4/1260天行健,君子以自强不息;地势坤,君子以厚德载物。二、应用实例
中国大陆30个省级行政区人均GDP的空间关联分析。根据各省(直辖市、自治区)之间的邻接关系,采用二进制邻接权重矩阵,选取各省(直辖市、自治区)1998—2002年人均GDP的自然对数,依照公式计算全局Moran指数I,计算其检验的标准化统计量Z(I),结果如下表所示。年份IZP19980.50010.49984.50350.000019990.50694.55510.000020000.51124.59780.000020010.50594.55320.000020020.50134.53260.0000
从表中可以看出,在1998-2002年期间,中国大陆30个省级行政区人均GDP的全局Moran指数均为正值;在正态分布假设之上,对Moran指数检验的结果也高度显著。这就是说,在1998-2002年期间,中国大陆30个省级行政区人均GDP存在着显著的、正的空间自相关,也就是说各省级行政区人均GDP水平的空间分布并非表现出完全的随机性,而是表现出相似值之间的空间集聚,其空间联系的特征是:较高人均GDP水平的省级行政区相对地趋于和较高人均GDP水平的省级行政区相邻,或者较低人均GDP水平的省级行政区相对地趋于和较低人均GDP水平的省级行政区相邻。
选取2001年我国30个省级行政区人均GDP数据,计算局部Gi统计量和局部Gi统计量的检验值Z(Gi),并绘制统计地图如下。
检验结果表明,贵州、四川、云南西部3省的Z值在0.05的显著性水平下显著,重庆的Z值在0.1的显著性水平下显著,该4省市在空间上相连成片分布,而且从统计学意义上来说,与该区域相邻的省区,其人均GDP趋于为同样是人均GDP低值的省区所包围。由此形成人均GDP低值与低值的空间集聚,据此可认识到西部落后省区趋于空间集聚的分布特征。
东部的江苏、上海、浙江三省市的Z值在0.05的显著性水平下显著,天津的Z值在0.1的显著性水平下显著。而东部上海、江浙等发达省市趋于为一些相邻经济发展水平相对较高的省份所包围,东部发达地区的空间集聚分布特征也显现出来。
以(Wz,z)为坐标,进一步绘制Moran散点图可以发现,多数省(直辖市、自治区)位于第1和第3象限内,为正的空间联系,属于低低集聚和高高集聚类型,而且位于第3象限内的低低集聚类型的省(直辖市、自治区)比位于第1象限内的高高集聚类型的省(直辖市、自治区)更多一些。
上图进一步显示了30个省级行政区人均GDP局部集聚的空间结构。可以看出,从人均GDP水平相对地来看:高值被高值包围的高高集聚省(直辖市)有:北京、天津、河南、安徽、湖北、江西、海南、广东、福建、浙江、山东、上海、江苏;低值被低值包围的低低集聚省(自治区)有:黑龙江、内蒙古、新疆、吉林、甘肃、山西、陕西、青海、西藏、四川、云南、辽宁、贵州;被低值包围的高值省(直辖市)有:重庆、广西、河北;被高值包围的低值省份只有湖南。空间依赖、空间异质性
传统的统计理论是一种建立在独立观测值假定基础上的理论。然而,在现实世界中,特别是遇到空间数据问题时,独立观测值在现实生活中并不是普遍存在的(Getis,1997)。对于具有地理空间属性的数据,一般认为离的近的变量之间比在空间上离的远的变量之间具有更加密切的关系(Anselin&Getis,1992)。正如著名的Tobler地理学第一定律所说:“任何事物之间均相关,而离的较近事物总比离的较远的事物相关性要高。”(Tobler,1979)Firstlawofgeography:Everythingisrelatedtoeverythingelse,butnearthingsaremorerelatedthandistantthings(Tobler,1979).2024/4/1269天行健,君子以自强不息;地势坤,君子以厚德载物。空间依赖、空间异质性
地区之间的经济地理行为之间一般都存在一定程度的SpatialInteraction,SpatialEffects:(SpatialDependenceandSpatialAutocorrelation)。一般而言,分析中涉及的空间单元越小,离的近的单元越有可能在空间上密切关联(Anselin&Getis,1992)。然而,在现实的经济地理研究中,许多涉及地理空间的数据,由于普遍忽视空间依赖性,其统计与计量分析的结果值得进一步深入探究(Anselin&Griffin,1988)。2024/4/1270天行健,君子以自强不息;地势坤,君子以厚德载物。空间依赖、空间异质性可喜的是,对于这种地理与经济现象中常常表现出的空间效应(特征)问题的识别估计,空间计量经济学提供了一系列有效的理论和实证分析方法。一般而言,在经济研究中出现不恰当的模型识别和设定所忽略的空间效应主要有两个来源(Anselin,1988):空间依赖性(SpatialDependence)和空间异质性(SpatialHeterogeneity)。2024/4/1271天行健,君子以自强不息;地势坤,君子以厚德载物。空间依赖性空间依赖性(spatialdependence)可以定义为观测值及区位之间的一致性(Anselin,2000)。空间依赖性(也叫空间自相关性)是空间效应识别的第一个来源,它产生于空间组织观测单元之间缺乏依赖性的考察(Cliff&Ord,1973)。2024/4/1272天行健,君子以自强不息;地势坤,君子以厚德载物。空间依赖性空间依赖不仅意味着空间上的观测值缺乏独立性,而且意味着潜在于这种空间相关中的数据结构,也就是说空间相关的强度及模式由绝对位置(格局)和相对位置(距离)共同决定。空间相关性表现出的空间效应可以用以下两种模型来表征和刻画:当模型的误差项在空间上相关时,即为空间误差模型SEM;当变量间的空间依赖性对模型显得非常关键而导致了空间相关时,即为空间滞后模型SLM(Anselin,1988)。2024/4/1273天行健,君子以自强不息;地势坤,君子以厚德载物。空间异质性
空间异质性(spatialheterogeneity)或空间差异性,指地理空间上的区域缺乏均质性,存在发达地区和落后地区、中心(核心)和外围(边缘)地区等经济地理结构,从而导致经济社会发展和创新行为存在较大的空间上的差异性。空间异质性(空间差异性),是空间计量学模型识别的第二个来源。2024/4/1274天行健,君子以自强不息;地势坤,君子以厚德载物。空间异质性
空间异质性反映了经济实践中的空间观测单元之间经济行为(如增长或创新)关系的一种普遍存在的不稳定性。区域创新的企业、大学、研究机构等主体在研发行为上存在不可忽视的个体差异,譬如研发投入的差异导致产出的技术知识的差异,这种创新主体的异质性与技术知识异质性的耦合将导致创新行为在地理空间上具有显著的异质性差异,进而可能存在创新在地理空间上的相互依赖现象或者创新的局域俱乐部集团。2024/4/1275天行健,君子以自强不息;地势坤,君子以厚德载物。空间异质性
对于空间异质性,只要将空间单元的特性考虑进去,大多可以用经典的计量经济学方法进行估计。但是当空间异质性与空间相关性同时存在时,经典的计量经济学估计方法不再有效,而且在这种情况下,问题变得异常复杂,区分空间异质性与空间相关性比较困难。空间变系数的地理加权回归模型(GeographicalWeightedRegression,GWR)是处理空间异质性的一种良好的估计方法。2024/4/1276天行健,君子以自强不息;地势坤,君子以厚德载物。空间依赖性及集群的识别与检验
将空间依赖性考虑进来以后,在建立模型进行创新分析研究之前,一般必须先进行空间相关性的预检验如果空间效应在发挥作用,则需要将空间效应纳入模型分析框架之中,并采用适合于空间计量经济模型估计的方法进行估计如果没有表现出空间效应,则可直接采用一般估计方法(如OLS)估计模型参数。2024/4/1277天行健,君子以自强不息;地势坤,君子以厚德载物。空间依赖性及集群的识别与检验
在引入空间变量或者经过空间过滤的空间计量模型建立之后,其效果的好坏还需要通过空间相关检验进行判断,一般可通过对真实值和模型估计值之间的残差进行空间相关性检验实现。如果参数经过检验在空间上没有表现出相关性,则表明在引入空间变量或者经过考虑了空间效应后的模型已经成功地处理了空间相关性。2024/4/1278天行健,君子以自强不息;地势坤,君子以厚德载物。空间计量经济模型及估计技术
空间计量经济学是计量经济学的一个分支,研究的是在横截面数据(Cross-sectionalData)和面板数据(PanelData)的回归模型中如何处理空间交互作用(空间自相关)和空间结构(空间非均匀性)(Anselin,1988)。最近发展起来的空间统计学和空间计量经济学不仅解决了标准统计方法在处理空间数据时的失误问题,更重要的是为测量这种空间联系及其性质、并在建模时明确地引入空间联系变量以估算与检验其贡献提供了全新的手段(应龙根,宁越敏,2005)。2024/4/1279天行健,君子以自强不息;地势坤,君子以厚德载物。空间计量经济模型及估计技术
实际上,早在1970年代欧洲就展开了空间计量经济学研究,并将它作为一个确定的领域。Paelinck&Klaassen(1979)定义了这个领域,包括:空间相互依赖在空间模型中的任务;空间关系不对称性;位于其他空间的解释因素的重要性;过去的和将来的相互作用之间的区别;明确的空间模拟。Anselin(1988)将空间计量经济学定义为:处理由区域科学模型统计分析中的空间所引起的特殊性的技术总称。换句话说,空间计量经济学研究的是明确考虑空间影响(空间自相关和空间不均匀性)的方法。2024/4/1280天行健,君子以自强不息;地势坤,君子以厚德载物。空间常系数回归模型及估计技术
空间计量经济学模型有多种类型(Anselin,etal.2004)。我们介绍纳入了空间效应(空间相关和空间差异)、适用于截面数据的空间常系数回归模型,包括空间滞后模型(SpatialLagModel,SLM)与空间误差模型(SpatialErrorModel,SEM)两种,以及空间变系数回归模型——地理加权回归模型(GeographicalWeightedRegression,GWR)。适用于时间序列和截面数据合成的空间面板数据计量经济学模型将在以后予以介绍。2024/4/1281天行健,君子以自强不息;地势坤,君子以厚德载物。ThespatiallagmodelLaggedvaluesintime:yt-kLaggedvaluesinspace:problem(multi-oriented,twodirectionaldependence)SeriouslossofdegreesoffreedomSolution:thespatiallagoperator,Wy空间滞后算子Wy
一个与空间相邻性相关的基本概念是空间滞后算子(spatiallagoperator)------isaspatiallylaggedvalueofthevariabley------Incaseofarow-standardizedW,Wyistheaveragevalueofthevariable
用标准化W乘以由空间相关变量所组成的向量y,可得出向量Y*=W•y2024/4/1283天行健,君子以自强不息;地势坤,君子以厚德载物。应用GeoDa计算空间滞后算子Wy
2024/4/1284天行健,君子以自强不息;地势坤,君子以厚德载物。空间滞后模型SLM空间滞后模型(SpatialLagModel,SLM)主要是探讨各变量在一地区是否有扩散现象(溢出效应)。其模型表达式为:参数代表可估计的空间自回归系数,以测量y对周边或相邻空间观察值的影响;参数反映了自变量对因变量的影响,空间滞后因变量是一内生变量,反映了空间距离对区域行为的作用;为正态分布的随机误差向量。2024/4/1285天行健,君子以自强不息;地势坤,君子以厚德载物。空间滞后模型SLM区域行为受到文化环境及与空间距离有关的迁移成本的影响,具有很强的地域性(Anselinetal.,1996)。由于SLM模型与时间序列中自回归模型相类似,因此SLM也被称作空间自回归模型(SpatialAutoregressiveModel,SAR)。2024/4/1286天行健,君子以自强不息;地势坤,君子以厚德载物。空间误差模型SEM
空间误差模型(SpatialErrorModel,SEM)的数学表达式为:式中,为随机误差项向量,为n*1阶的截面因变量向量的空间误差系数,为正态分布的随机误差向量。2024/4/1287天行健,君子以自强不息;地势坤,君子以厚德载物。空间误差模型SEMSEM中参数反映了自变量X对因变量y的影响。参数衡量了样本观察值中的空间依赖作用,即相邻地区的观察值y对本地区观察值y的影响方向和程度。存在于扰动误差项之中的空间依赖作用,度量了邻近地区关于因变量的误差冲击对本地区观察值的影响程度。由于SEM模型与时间序列中的序列相关问题类似,也被称为空间自相关模型(SpatialAutocorrelationModel,SAC)。2024/4/1288天行健,君子以自强不息;地势坤,君子以厚德载物。广义空间模型SACAnselin给出了空间计量分析中空间线性模型的通用形式,包括空间滞后条件和空间相关误差结构,如注意:W1可以等于W22024/4/1289天行健,君子以自强不息;地势坤,君子以厚德载物。估计技术鉴于空间回归模型由于自变量的内生性,对于上述两种模型的估计如果仍采用OLS,系数估计值会有偏或者无效,需要通过IV、ML或GLS、GMM等其他方法来进行估计。Anselin(1988)建议采用极大似然法ML估计空间滞后模型(SLM)和空间误差模型(SEM)的参数。2024/4/1290天行健,君子以自强不息;地势坤,君子以厚德载物。空间变系数回归模型及估计
就目前国内外的研究来看,大多直接假定横截面单元是同质的,即地区或企业之间没有差异。假定区域之间的经济行为在空间上具有异质性的差异可能更加符合现实。传统的OLS只是对参数进行“平均”或“全域”估计,不能反映参数在不同空间的空间非稳定性。空间变系数回归模型(SpatialVarying-CoefficientRegressionModel)中的地理加权回归模型(GeographicallyWeightedRegression,GWR)是一种解决这种问题的有效方法。2024/4/1291天行健,君子以自强不息;地势坤,君子以厚德载物。空间变系数回归模型及估计
2024/4/1292天行健,君子以自强不息;地势坤,君子以厚德载物。
地理加权回归模型GWR假定有,的一系列解释变量观测值,及一系列被解释变量的全局线性回归模型表示为:地理加权回归是对全局线性回归模型的一种扩展,它将数据的地理空间位置纳入到回归参数之中。2024/4/1293天行健,君子以自强不息;地势坤,君子以厚德载物。
地理加权回归模型GWR扩展后的GWR模型如下:在扩展的GWR模型中,特定区位的回归系数不再是利用全部信息获得的假定常数,而是利用邻近观测值的子样本数据信息进行局域(Local)回归估计而得的、随着空间上局域地理位置变化而变化的变数。2024/4/1294天行健,君子以自强不息;地势坤,君子以厚德载物。
地理加权回归模型GWR式中,系数的下标j表示与观测值联系的阶待估计参数向量,是关于地理位置的k+1元函数。GWR可以对每个观测值估计出k个参数向量的估计值,是第i个区域的随机误差,满足零均值、同方差、相互独立等球形扰动假定。
2024/4/1295天行健,君子以自强不息;地势坤,君子以厚德载物。
地理加权回归模型GWR实际上,以上模型可以表示为在每个区域都有一个对应的估计函数,其对数似然函数可以表示为:2024/4/1296天行健,君子以自强不息;地势坤,君子以厚德载物。
地理加权回归模型式中,为常数,。由于极大似然法(ML)的解不是唯一的,Hastie和Tibshirani(1993)认为用该方法求解是不恰当的。Tibshirani和Hastie(1987)提出了局域求解法,原理与方法如下:对于第s个空间位置,任取一空间位置与其位置邻近,构造一个简单的回归模型:2024/4/1297天行健,君子以自强不息;地势坤,君子以厚德载物。
地理加权回归模型GWR式中,每个为常数且为GWR模型中的近似值,通过考虑与点相邻近的点来校正经典回归模型中的解。一个基本的方法就是采用加权最小二乘法(WLS),寻找合适的使得下式最小:2024/4/1298天行健,君子以自强不息;地势坤,君子以厚德载物。地理加权回归模型GWR式中,为位置和之间的空间距离,为空间权值。令为的估计值,可得GWR模型在空间位置上的估计值。对上式求的一阶偏导数,并令其等于0,可得:2024/4/1299天行健,君子以自强不息;地势坤,君子以厚德载物。地理加权回归模型式中,为的对角线矩阵。可以看出,的GWR估计值是随着空间权值矩阵的变化而变化的,因此的选择至关重要,一般由观测值的空间(经纬度)坐标决定。2024/4/12100天行健,君子以自强不息;地势坤,君子以厚德载物。地理加权回归模型实际研究中常用的空间距离权值计算公式有三种(LeSage,2004)。(1)高斯距离权值(GaussianDistance)(2)指数距离权值(ExponentialDistance)(3)三次方距离权值(TricubeDistance)2024/4/12101天行健,君子以自强不息;地势坤,君子以厚德载物。地理加权回归模型其中为第i个区域与第j个区域间的地理距离,
为标准正态分布密度函数,q为观测值i到第q个最近邻居之间的距离,为距离向量的标准差,为衰减参数(窗宽)。2024/4/12102天行健,君子以自强不息;地势坤,君子以厚德载物。地理加权回归模型在空间权值矩阵中,d和θ非常关键。如果d较大,则局域模型的解越趋向于全域模型的解;如果d等于所研究空间任意两点间的最大距离,则全域和局域两个模型将相等,反之则相反。若θ趋于无穷大,任意两点的权重将趋于1,则被估计的参数变成一致时,GWR就等于以OLS估计的经典线性回归;反之,当带宽变得很小时,参数估计将更加依赖于邻近的观测值。计算适当的窗宽或衰减函数的原理方法很多,最小二乘法仍然是一般常用的方法,其原理是:2024/4/12103天行健,君子以自强不息;地势坤,君子以厚德载物。地理加权回归模型式中,是用窗宽θ计算所得的的拟合值。
2024/4/12104天行健,君子以自强不息;地势坤,君子以厚德载物。空间计量经济学的研究步骤
StepsinestimationEstimateOLSStudytheLMErrorandLMLagstatisticswithideallymorethanonespatialweightsmatricesThemostsignificantstatisticguidesyoutotherightmodelRuntherightmodel(S-ErrorS-Lag)2024/4/12105天行健,君子以自强不息;地势坤,君子以厚德载物。空间模型SLM、SEM的选择判断地区间创新产出行为的空间相关性是否存在,以及SLM和SEM那个模型更恰当,一般可通过包括Moran’sI检验、两个拉格朗日乘数(LagrangeMultiplier)形式LMERR、LMLAG及其稳健(Robust)的R-LMERR、R-LMLAG)等形式来实现。由于事先无法根据
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 游泳中的安全意识个人防溺水决心书
- 烈酒代理销售合同
- 旅行社旅游服务合同的售后服务
- 2024劳务派遣合同范本简单
- 2024承包停车场合同范文
- 森林改培的社会参与和合作机制考核试卷
- 房屋防震维修合同范例
- 牛肉产品购销合同模板
- 歌曲录制制作合同模板
- 物流公司调度合同范例
- 人教统编版高中语文必修下册第八单元(单元总结)
- 钻井地质设计
- 动作分析-动素分析
- 教育局长在高中教学工作会议上讲话稿:推动高中教学工作快速优质发展
- 购买食物需要注意--完整课件PPT
- 政治经济学计算题
- 2022年国家电网招聘(其他工学类)考试题库(真题导出版)
- 小学教学常规检查表
- 商业空间设计课件PPT
- 个人财务管理系统的设计与实现--论文
- 小学六年级英语上册《Unit 1 How can I get there》教案
评论
0/150
提交评论