最新ARCGIS空间统计分析_第1页
最新ARCGIS空间统计分析_第2页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、ARCGIS空间统计分析 ARCGIS空间统计分析空间统计分析 ARCGIS空间统计分析 空间统计工具功能 功能领域功能领域工具集工具集工具工具 地理分布测 量 度量地理分 布 平均中心、中心要素、标准距离、 方向分布(标准差椭圆)、线性方 向平均值 地理模式分 析 分析模式平均最近邻、空间自相关 (Morans I)、高/低聚类 (Getis-Ord General G) 地理聚类分 析 聚类分布制 图 聚类和异常值分析 (Anselin Local Morans I)、热点分析 (Getis-Ord Gi*) 回归分析空间关系建 模 普通最小二乘法、探索性回归、地 理加权回归 ARCGIS

2、空间统计分析 ARCGISARCGIS“空间统计空间统计”工具箱概述工具箱概述 工具集描述 分析模式 这些工具可用于评估要素(或与要素关联的值)是形 成一个聚类空间模式、离散空间模式还是随机空间模 式。 聚类分布 制图 这些工具可用于识别具有统计显著性的热点、冷点或 空间异常值。 度量地理 分布 这些工具可以解决以下问题:中心在哪里?形状和方 向如何?这些要素的离散程度如何? 空间关系 建模 这些工具可利用回归分析来建立数据关系模型,也可 以构建空间权重矩阵。 渲染 这些工具可用于渲染分析结果。 工具 这些实用工具可执行多种杂项功能:计算面积、评估 最小距离、导出变量和几何、转换空间权重文件和

3、采 集重合点。 ARCGIS空间统计分析 注意: ARCGIS ARCGIS“空间统计空间统计”工具箱工具箱, ,只 要分析中涉及距离(对于空间统计总 是如此),就应使用 投影坐标系(投影坐标系(而 不是基于度、分、秒的 地理坐标系地理坐标系) 对数据进行 投影。 ARCGIS空间统计分析 1.ARCGIS空间统计任务 汇总某分布模式的关键特征。 标识具有统计显著性的空间聚类(热点/ 冷点)和空间异常值。 评估聚类或分散的总体模式。 对空间关系建模。 ARCGIS空间统计分析 1.1汇总关键特征 问题工具示例 中心在哪里? 平均中心或中位 数中心 人口中心在哪里以及它如何随时间变化? 哪个要素

4、的地理 位置最便利? 中心要素 应将新建的支持中心定址在哪里? 主导方向或方位 是什么? 线性方向平均值 冬季的主要风向是什么? 在此地区如何确定断层线的方位? 要素的分散程度、 密集程度或融合 程度如何? 标准距离或方向 分布 (标准差椭圆) 哪个犯罪团伙所涉及的地域最大? 哪种疾病菌株的分布范围最广? 根据动物选择的生活地点,各物种会达到什么样的 融合程度? 是否存在定向趋 势? 方向分布 (标准差 椭圆) 残骸现场的方位在哪里?残骸的集中区域在哪里? ARCGIS空间统计分析 1.2标识具有统计显著性的聚类 问题工具示例 热点在哪里?冷点在哪 里?聚类的集中程度如 何? 热点分析 (Ge

5、tis-Ord Gi*) 或 聚类和异常值分析 (Anselin Local Morans I) 富裕区与贫困区之间最清 晰的界限在哪里?哪里是 生物多样性和栖息地质量 最高的地方? 异常值在哪里? 聚类和异常值分析 (Anselin Local Morans I) 在济南的哪里我们会找到 异常的消费模式? 如何可以实现最有效的 资源调配? 热点分析 (Getis-Ord Gi*) 哪里的糖尿病发病率异常 高? 哪里的厨房火灾占住宅火 灾的比例高于预期值? 白天发生的犯罪案件与夜 晚发生的犯罪案件是否具 有相同的空间模式? 哪些位置与问题发生位 置相距最远? 热点分析 (Getis-Ord G

6、i*) 应将避难场所设置在哪里? ARCGIS空间统计分析 1.3评估整体空间模式 问题工具示例 各空间特征之间是否存 在差异? 空间自相关 (Global Morans I) 哪一类犯罪的空间集中性最高? 或平均最近邻 哪些植物物种的分布在整个研究区 域中最为分散? 空间模式是否随着时间 推移发生变化? 空间自相关 (Global Morans I) 富裕区和贫困区是否或多或少地出 现空间上的隔离? 是否突然出现药品购买高峰? 或高/低聚类 (Getis-Ord General G) 随着时间推移,该疾病是保持固定 在同一个地理位置,还是扩散到邻 近的地方? 抑制措施是否有效? 空间过程彼此

7、之间是否 类似? 多距离空间聚类分析 (Ripleys K 函数) 该疾病的空间模式是否反映出高危 人群的空间模式? 商业入室盗窃的空间模式是否偏离 商业场所的空间模式? 数据是否在空间上相关? 空间自相关 (Global Morans I) 回归残差是否表现出具有统计显著 性的空间自相关? ARCGIS空间统计分析 1.41.4关系建模关系建模 问题工具示例 是否存在相关性?关系的稳固 程度如何?这种关系在整个研 究区域中是否一致? 普通最小二乘法 (OLS) 教育程度与收入之间是什么关系?这种关系在整个研 究区域中是否一致? 和地理加权回归 (GWR) 破坏财产行为与入室盗窃之间是否存在明

8、确的关系? 患病几率是否会随着接近水要素而增加? 哪些因素可能导致发生特定的 结果?还有什么地方可能有类 似的反应? 普通最小二乘法 (OLS) 有哪些关键可变因素可以解释森林火灾频发的原因? 和地理加权回归 (GWR) 哪些人口特征导致了较高的公共交通工具使用率? 应保护哪些环境以促进濒危物种的再引入? 缓解措施会在哪里最有效? 普通最小二乘法 (OLS) 孩子会在哪些方面始终保持高的考试分数?似乎要与 哪些特征联系在一起?每个特征分别在哪些方面最为 重要? 和地理加权回归 (GWR) 哪些因素与高于预期的交通事故发生比例相关?在每 个事故高发地点,哪些因素是最强的预测因子? 模式可能会发生

9、什么样的变化? 可以做哪些准备工作? 普通最小二乘法 (OLS) 911 报警电话的热点在哪里?哪些可变因素可有效预测 通话量?鉴于对未来的预测,对应急资源的预期需求 有哪些? 和地理加权回归 (GWR) 为什么此位置会成为热点?为 什么此位置会成为冷点? 热点分析 (Getis-Ord Gi*)、 为什么在某些特定区域癌症发病率如此高? 普通最小二乘法 (OLS) 为什么在一些地区的识字率很低? 和地理加权回归 (GWR) 美国是否有持续发生年轻人早逝的地方?原因是什么? ARCGIS空间统计分析 2.“空间统计空间统计”分析工具分析工具 空间统计工具箱包含一系列用于分析空间分 布、模式、过

10、程和关系的统计工具。尽管空 间统计和非空间统计(传统统计方法)在概 念和目标方面可能存在某些相似性,但空间 统计具有其固有的独特性,因为它们是专门 为处理地理数据而开发的。与传统的非空间 统计分析方法不同,空间统计方法是将地理 空间(邻域、区域、连通性和/或其他空间关 系)直接融入到数学逻辑中。 ARCGIS空间统计分析 2.“空间统计空间统计”分析工具分析工具 “分析模式”工具集中的工具都采用推论 式统计,它们以零假设为起点,假设要素 或与要素相关的值都表现成空间随机模式。 然后它们再计算出一个 p p 值值用来表示零假 设的正确概率(观测到的模式只不过是完 整空间随机性的许多可能版本之一)

11、。在 制定特定决策时可能需要高置信度的数据, 这时,计算概率就可能很重要。 ARCGIS空间统计分析 2.12.1“分析模式分析模式”工具集工具集 工具描述 多距离空间聚类 分析(Ripleys K 函数) 确定要素(或与要素相关联的值)是否显示某 一距离范围内统计意义显著的聚类或离散。 平均最近邻 根据每个要素与其最近邻要素之间的平均距离 计算其最近邻指数。可从结果 窗口访问结果。 高/低聚类 使用 Getis-Ord General G 统计可度量高值或低 值的聚类程度。可从结果 窗口访问结果。 空间自相关 根据要素位置和属性值使用 Global Morans I 统 计量测量空间自相关性

12、。可以从结果 窗口访问 结果。 ARCGIS空间统计分析 2.22.2“分析模式分析模式”工具中各方法的工作原理工具中各方法的工作原理 (计算方法)与结果分析(计算方法)与结果分析 ARCGIS空间统计分析 2.2. 2.2. 1.1. 平平 均均 最最 近近 邻邻 的的 计计 算算 ARCGIS空间统计分析 2.2.1 2.2.1 平均最近的相邻要素平均最近的相邻要素 “平均最近邻”工具将返回五个值:平均观 测距离、预期平均距离、最近邻指数、z 得 分和 p 值。 ARCGIS空间统计分析 2.2.1 2.2.1 平均最近的相邻要素平均最近的相邻要素 z 得分和 p 值结果是统计显著性的量度

13、,用来判断是否拒 绝零假设。对于“平均最近邻”统计,零假设指明要素是 随机分布的。 “最近邻指数”的表示方式是“平均观测距离”与“预 期平均距离”的比率。预期平均距离是假设随机分布中的 邻域间的平均距离。如果指数小于 1,所表现的模式为聚 类;如果指数大于 1,则所表现的模式趋向于离散或竞争。 平均最近邻方法对“面积”值非常敏感(面积参数值的 细微变化都能导致结果产生巨大变化)。因此,“平均最 近邻”工具最适用于对固定研究区域中固定研究区域中不同的要素进行比 较。可对研究区域面使用“计算面积”工具以获得面积参 数值。 ARCGIS空间统计分析 2.2.22.2.2高高/ /低聚类低聚类(Get

14、is-Ord General G) (Getis-Ord General G) 的计算的计算 ARCGIS空间统计分析 2.2.22.2.2高高/ /低聚类低聚类(Getis-Ord General G) (Getis-Ord General G) 的的 计算计算 ARCGIS空间统计分析 2.2.22.2.2高高/ /低聚类低聚类(Getis-Ord General G) (Getis-Ord General G) 的的 计算计算 ARCGIS空间统计分析 2.2.22.2.2高高/ /低聚类低聚类(Getis-Ord (Getis-Ord General G)General G) “高/低

15、聚类”工具可返回 5 个值: General G 观测值、General G 期望 值、方差、z 得分及 p 值。 ARCGIS空间统计分析 2.2.2 2.2.2 高高/ /低聚类低聚类(Getis-Ord (Getis-Ord General G)General G) 输入字段应包含多种非负 值。如果输入字 段包含负值,将显示错误消息。此外,此统 计数学方法要求待分析的变量存在一定程度 的变化;如,如果所有输入都是 1 便无法求 解。如果要使用此工具分析事件数据的空间 模式,应考虑聚合事件数据。 z 得分和 p 值是统计显著性的量度,用来判 断是否拒绝零假设。对于此工具,零假设表 示与要素

16、相关的值随机分布。 ARCGIS空间统计分析 2.2.2 2.2.2 高高/ /低聚类低聚类(Getis-Ord (Getis-Ord General G)General G) “高/低聚类”工具可返回 5 个值: General G 观测值、General G 期望 值、方差、z 得分及 p 值。 ARCGIS空间统计分析 2.2.32.2.3多距离空间聚类分析(多距离空间聚类分析(Ripleys K Ripleys K 函数)的函数)的 计算计算 ARCGIS空间统计分析 2.2.3 2.2.3 多距离空间聚类分析多距离空间聚类分析(Ripleys K (Ripleys K 函函 数数)

17、) 确定要素(或与要素相关联的值)是否显示某一距离范围内统 计意义显著的聚类或离散。 ARCGIS空间统计分析 2.2.3 2.2.3 多距离空间聚类分析多距离空间聚类分析(Ripleys K (Ripleys K 函数函数) ) 确定要素(或与要素相关联的值)是否显示某一距离范围内统 计意义显著的聚类或离散。 ARCGIS空间统计分析 2.2.3 2.2.3 多距离空间聚类分析多距离空间聚类分析(Ripleys K (Ripleys K 函数函数) ) 工具输出是一个包含以下字段的表:ExpectedKExpectedK 和 ObservedKObservedK 分 别包含 K 预期值和 K

18、 观测值。DiffKDiffK 字段包含 K 观测值与 K 预 期值的差值。如果指定了置信区间选项,则附加字段 LwConfEnvLwConfEnv 和 HiConfEnvHiConfEnv 也将包含在输出表中。这些字段包含工具的每个迭 代(由距离段数量参数指定)的置信区间信息。K 函数还可以创建 图层汇总结果。 如果特定距离的 K 观测值大于 K 预期值,则与该距离(分析规模) 的随机分布相比,该分布的聚类程度更高。如果 K 观测值小于 K 预期值,则与该距离的随机分布相比,该分布的离散程度更高。如 果 K 观测值大于 HiConfEnv 值,则该距离的空间聚类具有统计学 上的显著性。如果

19、K 观测值小于 LwConfEnv 值,则该距离的空间 离散具有统计学上的显著性。 启用以图形方式显示结果参数可以创建汇总工具结果的折线图。预 期结果以蓝线表示,而观测结果则以红线表示。观测线在预期线之 上表明数据集在该距离内表现为聚类。观测线在预期线之下表明数 据集在该距离内表现为离散。折线图以图层方式创建。 ARCGIS空间统计分析 2.2.3 2.2.3 多距离空间聚类分析多距离空间聚类分析(Ripleys K (Ripleys K 函数函数) ) 工具输出是一个包含以下字段的表:ExpectedKExpectedK 和 ObservedKObservedK 分 别包含 K 预期值和 K

20、 观测值。DiffKDiffK 字段包含 K 观测值与 K 预 期值的差值。如果指定了置信区间选项,则附加字段 LwConfEnvLwConfEnv 和 HiConfEnvHiConfEnv 也将包含在输出表中。这些字段包含工具的每个迭 代(由距离段数量参数指定)的置信区间信息。K 函数还可以创建 图层汇总结果。 如果特定距离的 K 观测值大于 K 预期值,则与该距离(分析规模) 的随机分布相比,该分布的聚类程度更高。如果 K 观测值小于 K 预期值,则与该距离的随机分布相比,该分布的离散程度更高。如 果 K 观测值大于 HiConfEnv 值,则该距离的空间聚类具有统计学 上的显著性。如果

21、K 观测值小于 LwConfEnv 值,则该距离的空间 离散具有统计学上的显著性。 启用以图形方式显示结果参数可以创建汇总工具结果的折线图。预 期结果以蓝线表示,而观测结果则以红线表示。观测线在预期线之 上表明数据集在该距离内表现为聚类。观测线在预期线之下表明数 据集在该距离内表现为离散。折线图以图层方式创建。 ARCGIS空间统计分析 2.2.42.2.4空间自相关空间自相关 (Global Morans I) (Global Morans I) 的的 计算计算 ARCGIS空间统计分析 2.2.42.2.4空间自相关空间自相关 (Global Morans I) (Global Moran

22、s I) 的的 计算计算 ARCGIS空间统计分析 2.2.42.2.4空间自相关空间自相关(Global (Global Morans I)Morans I) “空间自相关”工具将返回五个值:Morans I 指 数、预期指数、方差、z 得分及 p 值。 用 z 得分或 p 值指示统计显著性时,如果 Morans I 指数值为正则指示聚类趋势,如果 Morans I 指数值为负则指示离散趋势。Global Morans I 工具通过计算 z 得分和 p 值来指示您 是否可以拒绝零假设。此种情况下,零假设表示要 素值随机分布于研究区域中。 ARCGIS空间统计分析 2.2.5 2.2.5 z

23、z 得分得分和和p p 值值 大多数统计检验在开始时都首先确定一个零假设。模式分析工 具(“分析模式”工具集和“聚类分布制图”工具集)的零假 设是完全空间随机性 (CSR),它或者是要素本身的完全空间随机 性,或者是与这些要素关联的值的完全空间随机性。模式分析 工具所返回的 z 得分和 p 值可以判断出是否可以拒绝零假设。通 常,运行其中一种模式分析工具,同时希望 z 得分和 p 值会指明 可以 拒绝零假设,因为此工具将表明:要素(或与要素关联的 值)会表现出具有统计显著性的聚类或分散,而不是随机模式。 只要在空间数据中发现聚类这样的空间结构,就证明某些基础 空间过程在发挥作用。 p 值表示概

24、率。是所观测到的空间模式由某一随机过程创建的概 率。当 p 很小时(足够小?),意味着所观测到的空间模式不太 可能产生于随机过程(小概率),因此您可以拒绝零假设。 Z 得分是标准差的倍数。如返回的 z 得分为 +2.5,我们就会说, 结果是 2.5 倍标准差。z 得分和 p 值都与标准正态分布相关联。 ARCGIS空间统计分析 2.2.5 2.2.5 z z 得分得分和和p p 值值 在正态分布的 尾部出现非常 高或非常低的 z 得分(负 值),这些得 分与非常小的 p 值相关。当 得到很小的 p 值以及非常高 或非常低的 z 得分时,就表 明观测到的空 间模式不太可 能反映出零假 设 (CS

25、R) 所表 示的理论上的 随机模式。 ARCGIS空间统计分析 2.2.5 2.2.5 z z 得分得分和和p p 值值 z z 得分(标准差)得分(标准差)p p 值(概率)值(概率)置信度置信度 +1.65 0.1090% +1.96 0.0595% +2.58 0.0199% ARCGIS空间统计分析 2.2.5 2.2.5 z z 得分得分和和p p 值值 结果高/低聚类空间自相关 p 值不不具有统计学 上的显著性。 不能拒绝零假设。要素属性值的空间分布很有可能是随机空间过程 的结果。也就是说,所观测到的值的空间模式很可能是完全空间随 机性的众多可能结果之一。 p 值具有具有统计学上

26、的显著性,且 z 得 分为正值。 可以拒绝零假设。如果基础 空间过程是完全随机的,则 数据集中高高值的空间分布与 预期的空间分布相比在空间 上的聚类程度更高。 可以拒绝零假设。如果基础空间过程 是完全随机的,则数据集中高值和/ 或低值的空间分布在空间上聚类的程 度要高于预期。 p 值具有具有统计学上 的显著性,且 z 得 分为负值。 可以拒绝零假设。如果基础 空间过程是完全随机的,则 数据集中低低值的空间分布与 预期的空间分布相比在空间 上的聚类程度更高。 可以拒绝零假设。如果基础空间过程 是随机的,则数据集中高值和低值的 空间分布在空间上离散离散的程度要高于 预期。离散的空间模式通常反映某种

27、 类型的竞争过程:具有高值的要素排 斥具有高值的其他要素;类似地,具 有低值的要素排斥具有低值的其他要 素。 ARCGIS空间统计分析 2.3 2.3 “聚类分布制图聚类分布制图”工具集工具集 工具描述 聚类和异常值分析 给定一组加权要素,使用 Anselin Local Morans I 统计量来识别具有统计显著性 的热点、冷点和空间异常值。 热点分析 如果给定一组加权要素,使用 Getis-Ord Gi* 统计识别具有统计显著性的热点和 冷点。 “聚类分布制图”工具可通过执行聚类分析来识别具有统计显著 性的热点、冷点和空间异常值的位置。当根据一个或多个聚类的 位置需要执行行动时,“聚类分布

28、制图”工具集的用途特别明显。 ARCGIS空间统计分析 2.3.12.3.1“聚类和异常值分析聚类和异常值分析(Anselin Local Morans I)”(Anselin Local Morans I)”的的 计算计算 ARCGIS空间统计分析 2.3.1“聚类和异常值分析聚类和异常值分析(Anselin Local Morans I)”的计算的计算 ARCGIS空间统计分析 2.3.1“聚类和异常值分析聚类和异常值分析(Anselin Local Morans I)”的计算的计算 ARCGIS空间统计分析 2.3.1“聚类和异常值分析聚类和异常值分析(Anselin Local Mor

29、ans I)” 给定一组加权要素,使用 Anselin Local Morans I 统计量来识别具有统计显著性的热点、冷点和空间异 常值。 正值 I 表示要素具有包含同样高或同样低的属性值 的邻近要素;该要素是聚类的一部分。负值 I 表示要 素具有包含不同值的邻近要素;该要素是异常值。在 任何一个实例中,要被视为具有统计学上的显著性的 聚类和异常值,要素的 p 值必须足够小。 ARCGIS空间统计分析 2.3.1“聚类和异常值分析聚类和异常值分析(Anselin Local Morans I)”的计算的计算 基于欧氏距离或者曼哈顿距离的计算需要投影数据来准确测量距 离。 对于线和面要素,会在

30、距离计算中使用要素质心。对于多点、折 线 (polyline) 或由多部分组成的面,使用所有要素部分的加权平均 中心来计算质心。点要素的加权项是 1,线要素的加权项是长度, 而面要素的加权项是面积。 输入字段应包含多种值。此方法要求待分析的变量存在一定程度 的变化;如果所有输入都是 1 便无法求解。 如果要素的 z 得分是一个较高的正值,则表示周围的要素拥有相 似值(高值或低值)。输出要素类中的 COType 字段会将具有统计 显著性(0.05 的显著水平)的高值聚类表示为 HH,将具有统计学 显著性(0.05 的显著水平)的低值聚类表示为 LL。 如果要素的 z 得分是一个较低的负值(如 -

31、1.96),则表示有一 个具有统计显著性(0.05 的显著水平)的空间异常值。输出要素类 中的 COType 字段将指明要素是否是高值要素而四周围绕的是低值 要素 (HL),或者要素是否是低值要素而四周围绕的是高值要素 (LH)。 ARCGIS空间统计分析 2.3.2 2.3.2 热点分析热点分析 (Getis-Ord Gi(Getis-Ord Gi* *) )的计算的计算 ARCGIS空间统计分析 2.3.2 2.3.2 热点分析热点分析 (Getis-Ord Gi(Getis-Ord Gi* *) )的计算的计算 为数据集中的每个要素返回的 Gi* 统计就是 z 得分。 对于具有显著统计学

32、意义的正的 z 得分,z 得分越高, 高值(热点)的聚类就越紧密。对于统计学上的显著性 负 z 得分,z 得分越低,低值(冷点)的聚类就越紧密。 此工具使用 z 得分和 p 值为输入要素类中的每个要素 创建一个新的输出要素类。如果对于“输入要素类”应 用了选择集,则只会对所选要素进行分析,且在“输出 要素类”中也将仅显示所选要素。 ARCGIS空间统计分析 2.3.2 2.3.2 热点分析热点分析 (Getis-Ord Gi(Getis-Ord Gi* *) )的计算的计算 z 得分基于随机化零假设进行计算。 基于欧氏距离或者曼哈顿距离的计算需要投影数据 来准确测量距离。 对于线和面要素,会在

33、距离计算中使用要素质心。 对于多点、折线 (polyline) 或由多部分组成的面,使 用所有要素部分的加权平均中心来计算质心。点要素 的加权项是 1,线要素的加权项是长度,而面要素的 加权项是面积。 输入字段应包含多种值。此统计数学方法要求待分 析的变量存在一定程度的变化。 ARCGIS空间统计分析 2.4 2.4 度量地理分布工具集度量地理分布工具集 工具描述 中心要素 识别点、线或面要素类中位于最中央的要素。 方向分布 创建标准差椭圆以汇总地理要素的空间特征: 中心趋势、离散和方向趋势。 线性方向平均 值 识别一组线的平均方向、长度和地理中心。 平均中心 识别一组要素的地理中心(或密度中

34、心)。 中位数中心 识别使数据集中要素之间的总欧氏距离达到最 小的位置点。 标准距离 测量要素在几何平均中心周围的集中或分散的 程度。 ARCGIS空间统计分析 2.4.1 2.4.1 中心要素中心要素 识别点、线或面要素类中位于最中央的要素。 工具执行过程中会首先对数据集中每个要素质心与其 他各要素质心之间的距离计算并求和。然后,选择与 所有其他要素的最小累积距离相关联的要素(如果指 定权重,则为加权),并将其复制到一个新创建的输 出要素类中。 中心要素工具用于创建一个包含了处于最中央位置的 要素的新的要素类。 ARCGIS空间统计分析 2.4.2 2.4.2 方向分布方向分布( (标准差椭

35、圆标准差椭圆) ) 测量一组点或区域的趋势的一种常用方法 便是分别计算 x 和 y 方向上的标准距离。 这两个测量值可用于定义一个包含所有要 素分布的椭圆的轴线。由于该方法是由平 均中心作为起点对 x 坐标和 y 坐标的标 准差进行计算,从而定义椭圆的轴,因此 该椭圆被称为标准差椭圆。利用该椭圆,您 可以查看要素的分布是否是狭长形的,并 因此具有特定方向。 ARCGIS空间统计分析 2.4.2 2.4.2 方向分布方向分布( (标准差椭圆标准差椭圆) ) 测量一组点或区域的趋势的一种常用方法便是分别 计算 x 和 y 方向上的标准距离。这两个测量值可 用于定义一个包含所有要素分布的椭圆的轴线。

36、由 于该方法是由平均中心作为起点对 x 坐标和 y 坐 标的标准差进行计算,从而定义椭圆的轴,因此该 椭圆被称为标准差椭圆。利用该椭圆,您可以查看 要素的分布是否是狭长形的,并因此具有特定方向。 ARCGIS空间统计分析 2.4.2 2.4.2 方向分布方向分布( (标准差椭圆标准差椭圆) ) ARCGIS空间统计分析 2.4.2 2.4.2 方向分布方向分布( (标准差椭圆标准差椭圆) ) ARCGIS空间统计分析 2.4.2 2.4.2 方向分布方向分布( (标准差椭圆标准差椭圆) ) 标准差椭圆工具可为每个案例(案例分组字段参数)都创建 一个包含椭圆面的新输出要素类。这些椭圆面的属性值包

37、括 平均中心的 X 和 Y 坐标、两个标准距离(长轴和短轴)以 及椭圆的方向。字段名分别为字段名分别为 CenterXCenterX、CenterYCenterY、 XStdDistXStdDist、YStdDist YStdDist 和和 RotationRotation。如果提供了案例分组 字段,同时也会将此字段添加到输出要素类。 基于欧氏距离或者曼哈顿距离的计算需要投影数据来准确测 量距离。 如果要素的基础空间模式集中于中心且朝向外围的要素较少 (一种空间正态分布),则一个标准差椭圆面约包含聚类中 68 的要素,两个标准差约包含聚类中 95 的要素,三 个标准差约包含聚类中 99 的要素

38、。 “旋转”输出字段中的值表示从顶点开始按顺时针方向顺时针方向对长 轴测量的旋转度。 ARCGIS空间统计分析 2.4.2 2.4.2 方向分布方向分布( (标准差椭圆标准差椭圆) ) 案例分组字段用于在进行分析前将要素分组。如果指定了案 例分组字段,会首先根据案例分组字段值对输入要素进行分 组,然后再计算每组的标准差椭圆。案例分组字段可以是整 型、日期或字符串类型。 可以根据可选的权重字段进行标准差椭圆计算(例如,获取 按严重程度衡量的交通事故的椭圆)。“权重字段”应为数 字。 对于线和面要素,会在距离计算中使用要素质心。对于多点 、折线 (polyline) 或由多部分组成的面,使用所有要

39、素部 分的加权平均中心来计算质心。点要素的加权项是 1,线要 素的加权项是长度,而面要素的加权项是面积。 地图图层可用于定义输入要素类。在使用带有选择内容的图 层时,分析只会包括所选的要素。 ARCGIS空间统计分析 2.4.2 2.4.2 方向分布方向分布( (标准差椭圆标准差椭圆) ) 应用应用: : 在地图上标示一组犯罪行为的分布趋势可以确定该 行为与特定要素(一系列酒吧或餐馆、某条特定街 道等)的关系。 在地图上标示地下水井样本的特定污染可以指示毒 素的扩散方式,这在部署减灾策略时非常有用。 对各个种族或民族所在区域的椭圆的大小、形状和 重叠部分进行比较可以提供与种族隔离或民族隔离 相

40、关的深入信息。 绘制一段时间内疾病爆发情况的椭圆可建立疾病传 播的模型。 ARCGIS空间统计分析 2.4.3 2.4.3 线性方向平均值线性方向平均值 一组线要素的趋势可通过计算这些线的平均角度进行度量。 用于计算该趋势的统计量称为方向平均值。尽管统计量本身 被称为方向平均值,但它实际上用于测量方向或方位。 许多线状要素指向某一方向(它们都具有一个起点和一个终 点)。这类线通常可表示移动对象(例如飓风)的路径。而 其他线状要素(例如断层线)则没有起点和终点。这些要素 则被认为具有方位而不具有方向。例如,断层线可能具有西 北-东南方位。 ARCGIS空间统计分析 2.4.3 2.4.3 线性方

41、向平均值线性方向平均值 ARCGIS空间统计分析 2.4.3 2.4.3 线性方向平均值线性方向平均值 输入必须是线要素类。 输出线要素的属性值包括罗盘角的 CompassACompassA(以正北为基 准方向按顺时针旋转)、方向平均值的 DirMeanDirMean(以正东 为基准方向按逆时针旋转)、圆方差的 CirVarCirVar(用于指示 线方向偏离方向平均值的程度)、平均中心 X 和 Y 坐标 的 AveXAveX 和 AveYAveY,以及平均长度的 AveLenAveLen。如果指定了 案例分组字段,它还将被添加至输出要素类。 与标准差测量类似,圆方差值指示方向平均值矢量表示输

42、入矢量集的好坏程度。圆方差范围为 0 至 1。如果所有输 入矢量具有完全相同(或非常相似)的方向,则圆方差将 很小(接近于 0)。当输入矢量方向跨越整个罗盘时,圆 方差将很大(接近于 1)。 ARCGIS空间统计分析 2.4.3 2.4.3 线性方向平均值线性方向平均值 案例分组字段用于对要素进行分组,以进行独立的 线性方向平均值计算。当指定了“案例分组字段” 时,会首先根据案例分组字段值对输入线要素进行 分组,然后为每个组创建输出线要素。案例分组字 段可以为整型、日期型或字符串型。 执行方向测量时,工具只会考虑线要素的第一个点 和最后一个点,而不会考虑沿线的所有折点。 地图图层可用于定义输入

43、要素类。在使用带有选择 内容的图层时,分析只会包括所选的要素。 ARCGIS空间统计分析 2.4.4 2.4.4 平均中心平均中心 平均中心是研究区域中所有要素的平均 x 坐标和 y 坐标。平均中心对于分析追踪分 布的变化,以及比较不同类型要素的分布非 常有用。 ARCGIS空间统计分析 2.4.4 2.4.4 平均中心平均中心 ARCGIS空间统计分析 2.4.4 2.4.4 平均中心平均中心 平均中心是一个根据输入要素质心的平均 x 和 y 值构造的点 。 平均中心点要素的 x 值和 y 值是输出要素类中的属性。这些 值存储在 XCOORD 和 YCOORD 字段中。 案例分组字段用于将要

44、素进行分组以独立计算平均中心。当指 定了“案例分组字段”时,会首先根据案例分组字段值对输入 要素进行分组,然后计算每个组的平均中心。案例分组字段可 以为整型、日期型或字符串型。 尺寸字段是输入要素类中的任意数字字段。平均中心工具将计 算该字段中所有值的平均值,并将结果包括在输出要素类中。 对于线和面要素,会在距离计算中使用要素质心。对于多点、 折线 (polyline) 或由多部分组成的面,使用所有要素部分的 加权平均中心来计算质心。点要素的加权项是 1,线要素的加 权项是长度,而面要素的加权项是面积。 地图图层可用于定义输入要素类。在使用带有选择内容的图层 时,分析只会包括所选的要素。 AR

45、CGIS空间统计分析 2.4.5 2.4.5 中位数中心中位数中心 中位数中心工具是一种对异常值反应较为稳健的中心 趋势的量度。该工具可标识数据集中到其他所有要素 的行程最小的位置点。 中位数中心工具可指定权重字段。您可将权重视为与 每个要素关联的行程个数(例如,如果要素的权重为 3.2,则行程数将为 3.2)。加权中位数中心是所有 行程的距离之和最小的位置点。 ARCGIS空间统计分析 2.4.5 2.4.5 中位数中心中位数中心 用于计算中位数中心的方法是一个迭代过程, 由 Kuhn 和 Kuenne (1962) 提出,之后在 Burt 和 Barber (1996) 中进一步概括。在

46、算法的每个步骤 (t) 中,都会找到一个候选 “中位数中心”(Xt, Yt),然后对其进行优化, 直到其表示的位置距数据集中的所有要素(或 所有加权要素)(i) 的“欧式距离”d 最小。 ARCGIS空间统计分析 2.4.5 2.4.5 中位数中心中位数中心 平均中心和中位数中心均是中心趋势度量。但是,中 位数中心工具的算法受数据异常值的影响较小。 中位数中心要素的 x 值和 y 值是输出要素类中的属 性。这些值存储在 XCOORD 和 YCOORD 字段中。 案例分组字段用于将要素进行分组以独立计算中位数 的中心。当指定了“案例分组字段”时,会首先根据 案例分组字段值对输入要素进行分组,然后

47、计算每个 组的中位数中心。案例分组字段可以为整型、日期型 或字符串型,并将以属性形式显示在输出要素类中。 将对“属性字段”参数中指定的所有字段计算数据中 位数。 地图图层可用于定义输入要素类。在使用带有选择内 容的图层时,分析只会包括所选的要素。 ARCGIS空间统计分析 2.4.6 2.4.6 标准距离标准距离 度量分布的紧密度可以提供一个表示要素相 对于中心的分散程度的值。该值表示距离, 因此,可通过绘制一个半径等于标准距离值 的圆在地图上体现一组要素的紧密度。标准 距离工具用于创建圆面。 ARCGIS空间统计分析 2.4.6 2.4.6 标准距离标准距离 ARCGIS空间统计分析 2.4

48、.6 2.4.6 标准距离标准距离 标准距离工具可为每个案例创建包含以平均值为中心的圆面 的新要素类。绘制每个圆面时使用的半径均等于标准距离。 每个圆面的属性值即为其标准距离值。 案例分组字段用于在进行分析前将要素分组。如果指定了案 例分组字段,会首先根据案例分组字段值对输入要素进行分 组,然后再计算每组的标准距离圆。 可以根据可选的权重字段进行标准距离计算(例如,获得按 工作人员衡量的企业标准距离)。“权重字段”应为数值。 如果输入要素的基础空间模式集中于中心且朝向外围的要素 较少(一种空间正态分布),则一个标准差圆面约包含聚类 中 68 的要素;两个标准差圆约包含聚类中 95 的要素 ;三

49、个标准差约包含聚类中 99 的要素。 地图图层可用于定义输入要素类。在使用带有选择内容的图 层时,分析只会包括所选的要素。 ARCGIS空间统计分析 2.52.5“空间关系建模空间关系建模”工具集工具集 工具描述 生成网络空间权 重 使用网络数据集构建一个空间权重矩阵文件 (.swm),从而在基础网络结构方向定义要素 空间关系。 生成空间权重矩 阵 构建一个空间权重矩阵 (.swm) 文件,以表示 数据集中各要素间的空间关系。 地理加权回归 执行“地理加权回归 (GWR)”,这是一种用于 建模空间变化关系的线性回归的局部形式。 普通最小二乘法 执行全局“普通最小二乘法 (OLS)”线性回归 可

50、生成预测,也可为一个因变量针对它与一 组解释变量关系建模。 ARCGIS空间统计分析 2.5.1 2.5.1 生成网络空间权重生成网络空间权重 创建网络空间权重工具可查找网络上的每一个点,并可以距 离或时间为单位量化所有其他要素之间的邻域。任何两个要 素的所得到的邻域求解结果还会考虑障碍和/或限制(例如道 路封闭)。这些邻域关系使用稀疏矩阵法存储为小字节小字节二进 制格式。 ARCGIS空间统计分析 2.5.1 2.5.1 生成网络空间权重生成网络空间权重 此工具的输出是空间权重矩阵文件 (.swm)。 需要指定空间关系的概念化选项的工具将接 受空间权重矩阵文件;为空间关系的概念化 参数选择

51、GET_SPATIAL_WEIGHTS_FROM_FILE ,并且为权重矩阵文件参数指定使用此工具 创建的空间权重文件的完整路径名。 此工具的设计初衷是仅用来处理输入要素类 点数据。 ARCGIS空间统计分析 2.5.22.5.2生成空间权重矩阵生成空间权重矩阵 空间权重矩阵是数据空间结构的一种表现形 式。它是对数据集要素之间存在的空间关系 的一种量化。 通过创建权重来量化数据要素之间的关系的 策略有两种:二进制或可变权重。对于二进 制策略(固定距离、K 最近邻域或邻接), 要素或者是邻域 (1),或者不是 (0)。对于 权重策略(反距离或无差别的区域),邻近 要素有不同量级的作用(或影响),

52、并通过 计算权重来反映该变化。 ARCGIS空间统计分析 2.5.22.5.2生成空间权重矩阵生成空间权重矩阵 此工具会报告所生成的空间权重矩阵文件的特征:要素数量 、连通性以及最小相邻要素数、最大相邻要素数和平均相邻 要素数。 在使用基于距离的“空间关系概念化”时,数据应采用投影 坐标系(而不是地理坐标系)。 唯一 ID 字段与运行此工具后所获得的要素关系关联。 空间关系的概念化参数的面邻接选项( CONTIGUITY_EDGES_ONLY 和 CONTIGUITY_EDGES_CORNERS)仅 对面要素有效。 相邻要素的数目参数可以覆盖“空间关系反距离或固定距离 概念化”的阈值距离参数。

53、如果指定的阈值距离为 10 英里 ,相邻要素数目为 3,则所有要素都至少会接收 3 个相邻要 素(即使必须增加该阈值才能找到它们)。只有在未达到最 小相邻要素数时,才增加距离阈值。 ARCGIS空间统计分析 2.5.3 2.5.3 普通最小二乘法普通最小二乘法 (OLS)(OLS) 执行全局“普通最小二乘法 (OLS)”线性回归可生 成预测,也可为一个因变量针对它与一组解释变量 关系建模。 此工具的主要输出为写入结果窗口的 OLS 汇总报表,还可以选择将此报表与其 他图表一起写入您所指定的输出报表文件。 ARCGIS空间统计分析 2.5.3 2.5.3 普通最小二乘法普通最小二乘法 (OLS)

54、(OLS) “OLS 回归”工具生成的输出包括以下内容: ARCGIS空间统计分析 2.5.3 2.5.3 普通最小二乘法普通最小二乘法 (OLS)(OLS) 评估模型性能评估模型性能。R 平方的倍数和校正 R 平方值都可以用来测 量模型性能。可能值的范围从 0.0 到 1.0。由于“校正 R 平方”值与数据相关,更能准确地测量出模型性能,能够反 映模型的复杂性(变量数),因此“校正 R 平方”值始终要 比“R 平方的倍数”值略小。为模型额外添加一个解释变量 可能会增大“R 平方的倍数”值,但可能会减小“校正的 R 平方”值。 评估模型是否具有显著性评估模型是否具有显著性。联合联合 F F 统

55、计量统计量和联合卡方统计量联合卡方统计量 均用于测量整个模型的统计学显著性。只有在 Koenker (BP) 统计量(见下图)不具有统计学上的显著性时,“联合 F 统 计量”才可信。如果 Koenker (BP) 统计量具有显著性,应 参考“联合卡方统计量”来确定整个模型的显著性。这两种 测试的零假设均为模型中的解释变量“不”起作用。对于大 小为 95% 的置信度,p 值(概率)小于 0.05 表示模型具有 统计学上的显著性。 ARCGIS空间统计分析 评估模型中的每一个解释变量:系数、概率、稳健概率和方差膨胀因 子 (VIF)。每个解释变量的系数既反映它与因变量之间关系的强度, 也反映它与应

56、变量之间关系的类型。当与系数关联的符号为负号时, 该系数与因变量为负关系。当与系数关联的符号为正号时,该系数与 因变量为正关系。系数的单位与其关联的解释变量的单位相同。系数 反映了相对于与因变量关联的解释变量的每 1 个单位变化因变量所 发生的预期变化,并保持所有其他解释变量不变。使用 T 测试来评 估某个解释变量是否具有统计学上的显著性。零假设是指所有的意图 和目的的系数值为零,因此零假设对于模型“没有”帮助。当概率或 稳健概率(p 值)很小时,系数实际为零的几率也会很小。如果 Koenker 测试具有统计学上的显著性,应使用稳健概率来评估解释变 量的统计学显著性。对于具有统计学上显著性的概

57、率,其旁边带有一 个星号 (*)。如果理论/常识支持某解释变量(与统计学上显著的系 数相关)与因变量的有效关系,关系模型主要为线性模型,且该变量 对模型中所有其他解释变量而言不是冗余变量,则该变量对回归模型 而言是很重要的。VIFVIF 用于测量解释变量中的冗余。一般来说,与大 于 7.5 的 VIF 值关联的解释变量应逐一从回归模型中移除。 2.5.3 2.5.3 普通最小二乘法普通最小二乘法 (OLS)(OLS) ARCGIS空间统计分析 2.5.3 2.5.3 普通最小二乘法普通最小二乘法 (OLS)(OLS) 评估稳定性评估稳定性。Koenker (BP) Koenker (BP) 统

58、计量统计量(Koenker 的标准化 Breusch-Pagan 统计量)是一种测试,用于确定模型的解释变量 是否在地理空间和数据空间中都与因变量具有一致的关系。如果 模型在地理空间中一致,由解释变量表示的空间进程在研究区域 (进程稳定)各位置处的行为也将一致。如果模型在数据空间中 一致,则预测值与每个解释变量之间关系的变化不会随解释变量 量值(模型没有异方差性)的变化而变化。假设要对犯罪情况进 行预测,其中一个解释变量为收入。如果对收入中位值小的位置 的预测比对收入中位值大的位置的预测更准确,则模型的异方差 性就会出现问题。该测试的零假设为所测试的模型稳定。对于大 小为 95% 的置信度,p

59、 值(概率)小于 0.05 表示模型具有统 计学上的显著异方差性和/或不稳定性。如果该测试的结果具有 统计学上的显著性,需参考稳健系数标准差和概率来评估每个解 释变量的效果。具有统计学上显著不稳定性的回归模型通常很适 合进行地理加权回归 (GWR) 分析。 ARCGIS空间统计分析 2.5.3 2.5.3 普通最小二乘法普通最小二乘法 (OLS)(OLS) 评估模型偏差评估模型偏差。Jarque-BeraJarque-Bera统计量用于指示残差(已观测/已 知的因变量值减去预测/估计值)是否呈正态分布。该测试的 零假设为残差呈正态分布,因此,如果为这些残差建立直方图, 这些残差的分布将与典型钟

60、形曲线或高斯分布相似。当该测试 的 p 值(概率)较小(例如,对于大小为 95% 的置信度,其 值小于 0.05)时,回归不会呈正态分布,并指示您的模型有 偏差。如果残差还存在统计学上显著的空间自相关,则偏差可 能是模型指定错误(该模型的某个关键变量缺失)的结果。从 错误指定的 OLS 模型得到的结果是不可信的。如果尝试构建 非线性关系模型、数据的某些异常值存在影响或者存在很强的 异方差性也可进行统计学上显著的 Jarque-Bera 测试。 评估残差空间自相关评估残差空间自相关。始终对回归残差运行空间自相关 (Morans I) 工具可确保回归残差在空间上随机分布。高残差 和/或低残差(模型

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论