![地理系统要素间的相关分析与回归分析_第1页](http://file3.renrendoc.com/fileroot_temp3/2021-12/23/658f7f66-b9b8-4ee4-bed9-0bd83dd0ddda/658f7f66-b9b8-4ee4-bed9-0bd83dd0ddda1.gif)
![地理系统要素间的相关分析与回归分析_第2页](http://file3.renrendoc.com/fileroot_temp3/2021-12/23/658f7f66-b9b8-4ee4-bed9-0bd83dd0ddda/658f7f66-b9b8-4ee4-bed9-0bd83dd0ddda2.gif)
![地理系统要素间的相关分析与回归分析_第3页](http://file3.renrendoc.com/fileroot_temp3/2021-12/23/658f7f66-b9b8-4ee4-bed9-0bd83dd0ddda/658f7f66-b9b8-4ee4-bed9-0bd83dd0ddda3.gif)
![地理系统要素间的相关分析与回归分析_第4页](http://file3.renrendoc.com/fileroot_temp3/2021-12/23/658f7f66-b9b8-4ee4-bed9-0bd83dd0ddda/658f7f66-b9b8-4ee4-bed9-0bd83dd0ddda4.gif)
![地理系统要素间的相关分析与回归分析_第5页](http://file3.renrendoc.com/fileroot_temp3/2021-12/23/658f7f66-b9b8-4ee4-bed9-0bd83dd0ddda/658f7f66-b9b8-4ee4-bed9-0bd83dd0ddda5.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、中国石油大学(华东)地球科学与技术学院中国石油大学(华东)地球科学与技术学院1学习目标:学习目标:l理解地理要素相关的含义理解地理要素相关的含义l掌握地理相关程度的度量方法,可用掌握地理相关程度的度量方法,可用C语言语言实现实现l掌握理解地理回归的含义和作用,可用掌握理解地理回归的含义和作用,可用C语语言实现回归模型的建立言实现回归模型的建立l掌握并理解地理系统的空间趋势面分析掌握并理解地理系统的空间趋势面分析计 量 地 理 学 - 第五章 地理系统要素间的相关分析与回归分析中国石油大学(华东)地球科学与技术学院中国石油大学(华东)地球科学与技术学院25.1 地理要素间的相关分析地理要素间的相
2、关分析5.2 地理要素间的回归分析地理要素间的回归分析5.3 地理系统的空间趋势面分析地理系统的空间趋势面分析计 量 地 理 学 - 第五章 地理系统要素间的相关分析与回归分析中国石油大学(华东)地球科学与技术学院中国石油大学(华东)地球科学与技术学院31 1、地理要素相关的含义、地理要素相关的含义2 2、地理要素相关程度的度量、地理要素相关程度的度量3 3、相关系数的显著性检验、相关系数的显著性检验4 4、多要素见相关程度的度量、多要素见相关程度的度量1 1、地理要素相关的含义、地理要素相关的含义l 地理预测的需求地理预测的需求预测预测是当代地理学的重要内容。地区自然要素的变化的预测,地是当
3、代地理学的重要内容。地区自然要素的变化的预测,地理环理环境各要素在人类活动干预下的变化的预测,地区或城市经济系统要境各要素在人类活动干预下的变化的预测,地区或城市经济系统要素的预测,区域或城市人口预测等等,都在现代地理研究中占有重要地素的预测,区域或城市人口预测等等,都在现代地理研究中占有重要地位。地理要素的预测对于人类社会活动、生产活动、生活等方面的意义位。地理要素的预测对于人类社会活动、生产活动、生活等方面的意义是显而易见的。报准一次特大洪水,可以使洪水区人民的生命财产少受是显而易见的。报准一次特大洪水,可以使洪水区人民的生命财产少受许多损失;漏报一次台风,会造成台风所经地区工农业生产的巨
4、大损失,许多损失;漏报一次台风,会造成台风所经地区工农业生产的巨大损失,预测,也成为避免一个地区或一个国家经济紊乱和比例失调的手段。预预测,也成为避免一个地区或一个国家经济紊乱和比例失调的手段。预先对区域经济发展的远景作出科学的估计,可以使地区经济稳定地、协先对区域经济发展的远景作出科学的估计,可以使地区经济稳定地、协调地向前发展。调地向前发展。 计 量 地 理 学 - 第五章 地理系统要素间的相关分析与回归分析中国石油大学(华东)地球科学与技术学院中国石油大学(华东)地球科学与技术学院41 1、地理要素相关的含义、地理要素相关的含义 预测对于地理学理论研究的意义也是明显的。预测研究必须深入探
5、讨地预测对于地理学理论研究的意义也是明显的。预测研究必须深入探讨地理系统各要素之间的数量关系,否则预测容易流于猜测;预测研究还必理系统各要素之间的数量关系,否则预测容易流于猜测;预测研究还必须探寻地理系统的动态规律。开展预测研究,正是把地理学研究推向新须探寻地理系统的动态规律。开展预测研究,正是把地理学研究推向新阶段的杠杆阶段的杠杆 地理预测,是以地理系统分析为基础的,预测往往是分析的结果和分析地理预测,是以地理系统分析为基础的,预测往往是分析的结果和分析结果的扩展、伸延;预测的结果,往往又为地理系统分析提供新的信息。结果的扩展、伸延;预测的结果,往往又为地理系统分析提供新的信息。从方法论看,
6、这是一个有从方法论看,这是一个有“反馈反馈”的系统分析过程(如下图所示)。在的系统分析过程(如下图所示)。在地理预测中,经常使用的方法是概率统计方法、投入地理预测中,经常使用的方法是概率统计方法、投入- -产出方法和模型,产出方法和模型,以及其它运筹学、最优化模型。以及其它运筹学、最优化模型。计 量 地 理 学 - 第五章 地理系统要素间的相关分析与回归分析中国石油大学(华东)地球科学与技术学院中国石油大学(华东)地球科学与技术学院51 1、地理要素相关的含义、地理要素相关的含义l 地理要素相关地理要素相关 设设x和和y为两种地理要素为两种地理要素.若若y严格地随着严格地随着x的变化而变化,如
7、的变化而变化,如图(图(a)所示,所示,所有观测点均落在直线或曲线上,则称为所有观测点均落在直线或曲线上,则称为完全相关完全相关,或称,或称函数关系函数关系。若。若观测点在散点图中均落在直线或曲线两旁,如观测点在散点图中均落在直线或曲线两旁,如图(图(b)所示。则表示两个所示。则表示两个要素之间具有相关关系,因此也称为要素之间具有相关关系,因此也称为统计相关统计相关。在地理问题中,许多要。在地理问题中,许多要素间都具有这种关系。素间都具有这种关系。 所有的观测点,如果在散点图中分布状态散乱无所有的观测点,如果在散点图中分布状态散乱无规律可循,如规律可循,如图(图(c)所示。则表示这两个要素之间
8、相互独立,没有依存所示。则表示这两个要素之间相互独立,没有依存关系。关系。计 量 地 理 学 - 第五章 地理系统要素间的相关分析与回归分析地理要素关系图地理要素关系图 中国石油大学(华东)地球科学与技术学院中国石油大学(华东)地球科学与技术学院61 1、地理要素相关的含义、地理要素相关的含义l 地理要素相关地理要素相关 所谓所谓相关相关,是指两个或两个以上变量间相互关系是否密切是指两个或两个以上变量间相互关系是否密切。在研究这种。在研究这种关系时并不专指哪一个是自变量,哪一个是因变量,而视实际需要确定。关系时并不专指哪一个是自变量,哪一个是因变量,而视实际需要确定。相关分析仅限于两个或两个以
9、上变量具有相关关系者,其主要目的是计相关分析仅限于两个或两个以上变量具有相关关系者,其主要目的是计算出表示两个或两个以上变量间相关程度和性质。地理系统中绝大多数算出表示两个或两个以上变量间相关程度和性质。地理系统中绝大多数的要素间是具有相关关系的,故相关分析在地理学中早为人所注意,并的要素间是具有相关关系的,故相关分析在地理学中早为人所注意,并得到了广泛的应用。所谓得到了广泛的应用。所谓地理相关地理相关,就是应用相关分析法来研究各地理就是应用相关分析法来研究各地理要素间的相互关系和联系强度的一种度量指标要素间的相互关系和联系强度的一种度量指标。 地理相关的类型:地理相关的类型:计 量 地 理
10、学 - 第五章 地理系统要素间的相关分析与回归分析中国石油大学(华东)地球科学与技术学院中国石油大学(华东)地球科学与技术学院72、地理要素相关程度的度量、地理要素相关程度的度量由于地理相关基本类型的不同,因而度量地理相关程度的指标也各异,现由于地理相关基本类型的不同,因而度量地理相关程度的指标也各异,现分述如下:分述如下:l简单直线相关程度的度量简单直线相关程度的度量在一般情况下,当探讨两个地理要素间为直线相关时,就要研究在一般情况下,当探讨两个地理要素间为直线相关时,就要研究它们之间的它们之间的相关程度和相关方向相关程度和相关方向。所谓相关程度,就是要研究它。所谓相关程度,就是要研究它们之
11、间的相互关系是否密切;所谓相关方向,又可分为两种,即们之间的相互关系是否密切;所谓相关方向,又可分为两种,即正相关和负相关正相关和负相关。正相关是表示两个要素之间呈同方向变化的相。正相关是表示两个要素之间呈同方向变化的相关,也就是关,也就是y值随值随x的增加而变大或随的增加而变大或随x的减少而变小;负相关是的减少而变小;负相关是表示两个要素之间呈反方向变化的相关,即表示两个要素之间呈反方向变化的相关,即y值随值随x的增加而变小的增加而变小或随或随x的减少而变大。而用量度量直线相关程度和方向的指标,的减少而变大。而用量度量直线相关程度和方向的指标,就是相关系数。公式如下:就是相关系数。公式如下:
12、yyxxxyiiiilllnyynxxnyxxyyyxxyyxxr )()( )()()(222222221xnxlxx221ynylyy yxnxylxy1计 量 地 理 学 - 第五章 地理系统要素间的相关分析与回归分析中国石油大学(华东)地球科学与技术学院中国石油大学(华东)地球科学与技术学院8 利用上式计算的相关系数,具有下列三点性质:利用上式计算的相关系数,具有下列三点性质: 1)相关系数的分布范围,介于)相关系数的分布范围,介于 -1r1 2)当相关系数为正值时,表示两个要素(或变数)之间为正相关,相)当相关系数为正值时,表示两个要素(或变数)之间为正相关,相 关系数为负值,表示两
13、个要素(或变数)之间为负相关。关系数为负值,表示两个要素(或变数)之间为负相关。 3)相关系数的绝对值)相关系数的绝对值| r |越大,表示两个要素间相关程度越密切。越大,表示两个要素间相关程度越密切。l顺序(等级)相关系数顺序(等级)相关系数rs与前述相关系数一样,它也是描述两要素之间相关程度的一种统与前述相关系数一样,它也是描述两要素之间相关程度的一种统计指标,不过在计算方法上,与前述相关系数的计算有所不同。计指标,不过在计算方法上,与前述相关系数的计算有所不同。等级相关系数是将两要素的样本值按数值的大小顺序排列位次,等级相关系数是将两要素的样本值按数值的大小顺序排列位次,以各要素样本值的
14、位次代表实际数据而求得的一种统计量。实际以各要素样本值的位次代表实际数据而求得的一种统计量。实际上,它是位次分析方法的数量化。上,它是位次分析方法的数量化。 设两个要素设两个要素x和和y有有n对样本值,令对样本值,令R1代表要素代表要素x的序号的序号(或位次或位次),R2代表要素代表要素y的序号(或位次),的序号(或位次), 代表要素代表要素x和和y的同一组样本位次差的平方,那么要素的同一组样本位次差的平方,那么要素x和和y之间的等级相关系数之间的等级相关系数被定义为:被定义为:2212)(iiiRRd计 量 地 理 学 - 第五章 地理系统要素间的相关分析与回归分析16122nndris中国
15、石油大学(华东)地球科学与技术学院中国石油大学(华东)地球科学与技术学院9l简单非线性相关程度的度量简单非线性相关程度的度量地理系统两要素间的关系许多是线性的,但也有许多要素间的关系不地理系统两要素间的关系许多是线性的,但也有许多要素间的关系不是线性关系。例如,大城市近年来的人口增长、作物叶面积与气温的是线性关系。例如,大城市近年来的人口增长、作物叶面积与气温的关系、市中心到市区各部分的距离与相应地区人口密度之间的关系等关系、市中心到市区各部分的距离与相应地区人口密度之间的关系等等,都表现为非线性关系。等,都表现为非线性关系。 在探讨两个地理要素间的直线相关程度时,既要研究它们之间的相关在探讨
16、两个地理要素间的直线相关程度时,既要研究它们之间的相关程度,又要注意它们之间的相关方向。但是,当研究简单非线性相关程度,又要注意它们之间的相关方向。但是,当研究简单非线性相关程度时,因曲线方向不像直线方向那样固定,所以只能探讨其相关程程度时,因曲线方向不像直线方向那样固定,所以只能探讨其相关程度而不能探讨其相关方向。度而不能探讨其相关方向。 表示简单非线性相关程度的统计量,通常用相关指数表示简单非线性相关程度的统计量,通常用相关指数Ryx来度量。相关来度量。相关指数的性质,随相关曲线形状的不同而异。相关指数的性质如下:指数的性质,随相关曲线形状的不同而异。相关指数的性质如下: 1)相关指数的分
17、布范围介于相关指数的分布范围介于0到到1之间之间 2)相关指数的数值越大,两个要素间的曲线相关程度越密切。当)相关指数的数值越大,两个要素间的曲线相关程度越密切。当 Ryx =1,表示两个要素间为完全曲线相关;当,表示两个要素间为完全曲线相关;当Ryx= 0时,表示两时,表示两 个要素间为完全无曲线相关个要素间为完全无曲线相关。 计 量 地 理 学 - 第五章 地理系统要素间的相关分析与回归分析中国石油大学(华东)地球科学与技术学院中国石油大学(华东)地球科学与技术学院103)相关指数必大于或至少等于用同一批资料所求得的相关系数的绝对)相关指数必大于或至少等于用同一批资料所求得的相关系数的绝对
18、 值,即值,即Ryx | r |。 4) Rxy的性质与上述情况基本相同,但在通常情况下,的性质与上述情况基本相同,但在通常情况下, Ryx 与与Rxy不相不相 等,仅当完全相关或完全无关时,两者才相等。等,仅当完全相关或完全无关时,两者才相等。 计 量 地 理 学 - 第五章 地理系统要素间的相关分析与回归分析l多要素相关与相关矩阵多要素相关与相关矩阵 如果问题涉及到如果问题涉及到 等等n个要素,则对其中任何两个要素个要素,则对其中任何两个要素xi和和xj ,我们都,我们都可以按照前面的公式计算它们之间的相关系数可以按照前面的公式计算它们之间的相关系数rij,这样就可得到多要素的相关系,这样
19、就可得到多要素的相关系数矩阵:数矩阵: nxxx,21nnnnnnrrrrrrrrrR 212222111211 显然,由公式容易知道:显然,由公式容易知道: 1 1)rii = 1(i = 1,2,n n),即每一个要素即每一个要素xi与其自身的相关程度最大;与其自身的相关程度最大; 2 2)rij = rji,即第,即第i个要素个要素xi对第对第j个要素个要素xj的相关程度,与第的相关程度,与第j个要素个要素xj对对第第i个要素个要素xi的相关程度相等。的相关程度相等。 中国石油大学(华东)地球科学与技术学院中国石油大学(华东)地球科学与技术学院113 3、相关系数的显著性检验、相关系数的
20、显著性检验 当要素之间的相关系数求出之后,还需要对所求得的相关系数进行检验。当要素之间的相关系数求出之后,还需要对所求得的相关系数进行检验。这里的相关系数是根据要素之间的样本值计算出来的,它随着样本数的多少这里的相关系数是根据要素之间的样本值计算出来的,它随着样本数的多少或取样方式的不同而不同,因此它只是要素之间的或取样方式的不同而不同,因此它只是要素之间的样本相关系数样本相关系数,只有通过,只有通过检验,才能知道它的可信度。检验,才能知道它的可信度。 一般情况下,相关系数的检验,是在给定的置信水平下,通过查相关系数一般情况下,相关系数的检验,是在给定的置信水平下,通过查相关系数检验的临界表完
21、成的。检验的临界表完成的。 在表中,左边的在表中,左边的f值称为自由度,其数值为值称为自由度,其数值为f = n - 2,这里的,这里的n是样本数;上是样本数;上方的方的代表不同的置信水平;表内的数值代表不同的置信水平下相关系数代表不同的置信水平;表内的数值代表不同的置信水平下相关系数 = 0的临界值,即的临界值,即r ;公式;公式 的意思是当所计算的相关系数的意思是当所计算的相关系数r的的绝对值大于在绝对值大于在水平下的临界值水平下的临界值r时,两要素不相关(时,两要素不相关( = 0 )的可能性)的可能性只有只有 。 一般而言,当一般而言,当 时,则认为两要素不相关,这时的样本相关系数就时
22、,则认为两要素不相关,这时的样本相关系数就不能反映两要素之间的关系。不能反映两要素之间的关系。 |rrp1 . 0|rr 计 量 地 理 学 - 第五章 地理系统要素间的相关分析与回归分析中国石油大学(华东)地球科学与技术学院中国石油大学(华东)地球科学与技术学院124 4、多要素间相关程度的测定、多要素间相关程度的测定 偏相关系数的计算与检验偏相关系数的计算与检验 地理系统是一种多要素的复杂的巨系统,其中一个要素的变化必然影响地理系统是一种多要素的复杂的巨系统,其中一个要素的变化必然影响到其它各要素的变化,因此它们之间存在着不同程度的相关关系。在多要到其它各要素的变化,因此它们之间存在着不同
23、程度的相关关系。在多要素所构成的地理系统中,当我们研究某一个要素对另一个要素的影响或相素所构成的地理系统中,当我们研究某一个要素对另一个要素的影响或相关程度时,把其它要素的影响视为常数(保持不变),即关程度时,把其它要素的影响视为常数(保持不变),即暂不考虑其它要暂不考虑其它要素的影响,而单独研究那两个要素之间的相互关系的密切程度时,则称为素的影响,而单独研究那两个要素之间的相互关系的密切程度时,则称为偏相关。所以度量偏相关的统计量,称为偏相关系数偏相关。所以度量偏相关的统计量,称为偏相关系数。l 偏相关系数偏相关系数,可以利用单相关系数来计算。假设有三个要素,可以利用单相关系数来计算。假设有
24、三个要素x1、 x2 、x3其其两两间单相关系数矩阵为:两两间单相关系数矩阵为: 1 1 1 323123211312333231232221131211rrrrrrrrrrrrrrrR计 量 地 理 学 - 第五章 地理系统要素间的相关分析与回归分析中国石油大学(华东)地球科学与技术学院中国石油大学(华东)地球科学与技术学院13 因为相关系数矩阵是对称的,故在实际计算时,只要计算因为相关系数矩阵是对称的,故在实际计算时,只要计算 即即可。在偏相关分析中,常称这些单相关系数为可。在偏相关分析中,常称这些单相关系数为零级相关系数零级相关系数。 对于上述三个要素对于上述三个要素x1、x2 、x3
25、,它们之间的偏相关系数共有三个,它们之间的偏相关系数共有三个,即即 (下标中点后面的数字,代表计算偏相关系数时,保持不(下标中点后面的数字,代表计算偏相关系数时,保持不变量,如变量,如 表示表示x3保持不变),其计算公式分别如下:保持不变),其计算公式分别如下: 131223 rrr123213312 rrr312r)1)(1 (223213231312312rrrrrr)1)(1 (223212231213213rrrrrr)1)(1 (213212131223123rrrrrr上面三个式子表示三个偏相关系数,称为上面三个式子表示三个偏相关系数,称为一级偏相关系数一级偏相关系数。 计 量 地
26、 理 学 - 第五章 地理系统要素间的相关分析与回归分析 若有四个要素若有四个要素x1、x2 、x3 、x4 ,则有六个偏相关系数,即:,则有六个偏相关系数,即:它们称为它们称为二级偏相关系数二级偏相关系数,其计算公式分别如下:,其计算公式分别如下: 123413241423231424133412rrrrrr、)1)(1 (232423143243143123412rrrrrr)1)(1 (223422142342142132413rrrrrr)1)(1 (224322132432132142314rrrrrr)1)(1 (213421241341241231423rrrrrr)1)(1 (
27、214321231431231241324rrrrrr)1)(1 (212421321241321341234rrrrrr中国石油大学(华东)地球科学与技术学院中国石油大学(华东)地球科学与技术学院14计 量 地 理 学 - 第五章 地理系统要素间的相关分析与回归分析 如果所考虑的要素多于四个时,则可以依次考虑,计算三级甚至更多如果所考虑的要素多于四个时,则可以依次考虑,计算三级甚至更多级偏相关系数。对于偏相关系数,它具有下述性质:级偏相关系数。对于偏相关系数,它具有下述性质: 1)偏相关系数分布的范围)偏相关系数分布的范围-1到到1之间。之间。 2)偏相关系数的绝对值越大,表示偏相关程度越大
28、。)偏相关系数的绝对值越大,表示偏相关程度越大。 3)偏相关系数的绝对值必小于或最多等于由同一资料所求得的复相关)偏相关系数的绝对值必小于或最多等于由同一资料所求得的复相关系数,即系数,即 。 |312231 rRl 偏相关系数系数的显著性检验偏相关系数系数的显著性检验 :偏相关系数的显著性检验,一般采用:偏相关系数的显著性检验,一般采用t检验检验法,其统计量为:法,其统计量为:在上式中,在上式中, 为偏相关系数,为偏相关系数,n为样本数,为样本数,m为自变量个数为自变量个数 计算出计算出t值后,查值后,查t分布表,可得出不同显著水平上的临界值分布表,可得出不同显著水平上的临界值t,若,若t
29、t(n-m-1)则表示偏相关显著。则表示偏相关显著。 11234123412mnrrtmmmr3412 中国石油大学(华东)地球科学与技术学院中国石油大学(华东)地球科学与技术学院15 复相关系数的计算与检验复相关系数的计算与检验 严格来说,以上的分析都是揭示两个要素间的相关系数,或者是在其它严格来说,以上的分析都是揭示两个要素间的相关系数,或者是在其它要素固定的情况下来研究两要素间的相关关系的。但实际上,一个要素的变要素固定的情况下来研究两要素间的相关关系的。但实际上,一个要素的变化往往受多种要素的综合作用和影响,而单相关或偏相关分析的方法都不能化往往受多种要素的综合作用和影响,而单相关或偏
30、相关分析的方法都不能反映各要素的综合影响。要解决这一问题,就必须采用研究几个要素同时与反映各要素的综合影响。要解决这一问题,就必须采用研究几个要素同时与某一个要素之间的相关关系的复相关分析法。所谓复相关就是研究几个要素某一个要素之间的相关关系的复相关分析法。所谓复相关就是研究几个要素同时与某一个要素之间的相关关系,而度量复相关程度的指标,可以用复相同时与某一个要素之间的相关关系,而度量复相关程度的指标,可以用复相关系数来测定。复相关系数又可利用单相关系数和偏相关系数求得,当然还关系数来测定。复相关系数又可利用单相关系数和偏相关系数求得,当然还可用回归法和行列式法求得。可用回归法和行列式法求得。
31、l 复相关系数复相关系数,可以利用单相关系数和偏相关系数来计算,设,可以利用单相关系数和偏相关系数来计算,设y为因变量,为因变量,x1、x2,xk为自变量,则将为自变量,则将y与与x1、x2,xk之之间的复相关系数记为间的复相关系数记为 。其计算公式如下其计算公式如下 : 计 量 地 理 学 - 第五章 地理系统要素间的相关分析与回归分析kyR12当有两个自变量时:当有两个自变量时: )1)(1 (12122112yyyrrR中国石油大学(华东)地球科学与技术学院中国石油大学(华东)地球科学与技术学院16计 量 地 理 学 - 第五章 地理系统要素间的相关分析与回归分析当有三个自变量时:当有三
32、个自变量时: )1)(1)(1 (1212321221123yyyyrrrR一般地,当有一般地,当有k个自变量时:个自变量时: )1 ()1)(1 (12)1(1221221123kykyykyrrrR对于复相关系数而言,其性质可以概括为:对于复相关系数而言,其性质可以概括为: 1)复相关系数介于)复相关系数介于0到到1之间;之间; 2)复相关系数越大,则表明变量之间的相关程度越密切;)复相关系数越大,则表明变量之间的相关程度越密切; 3)复相关系数必大于或至少等于单相关系数的绝对值;)复相关系数必大于或至少等于单相关系数的绝对值; l 复相关系数的检验复相关系数的检验 对复相关系数的显著性检
33、验,一般采用对复相关系数的显著性检验,一般采用F检验法。其统计量公式为:检验法。其统计量公式为: kknRRFkyky11212212其中,其中,n为样本数,为样本数,k(第一自由度第一自由度)为自变量个数。为自变量个数。 若若 ,则表示复相关在置信度水平,则表示复相关在置信度水平 上显著。上显著。 ) 1,(01. 0knkFF01. 0中国石油大学(华东)地球科学与技术学院中国石油大学(华东)地球科学与技术学院171 1、引言、引言2 2、地理回归分析的意义和作用、地理回归分析的意义和作用3 3、一元地理回归模型的建立、一元地理回归模型的建立4 4、多元地理回归模型的建立、多元地理回归模型
34、的建立1 1、引言、引言 在经济分析和企业管理中,经常要遇到各种各样的变量,他们之间有在经济分析和企业管理中,经常要遇到各种各样的变量,他们之间有些关系密切,有些关系不太密切,例如空调、电风扇的需求量与气候有关,些关系密切,有些关系不太密切,例如空调、电风扇的需求量与气候有关,气温越高,空调电风扇的需求量就会增加,商品价格提高了,其销售量也气温越高,空调电风扇的需求量就会增加,商品价格提高了,其销售量也会受影响,居民收入增加也会引起一些商品的需求量增加等等。一般来说,会受影响,居民收入增加也会引起一些商品的需求量增加等等。一般来说,变量之间关系大致可以分成二类,变量之间关系大致可以分成二类,一
35、类为确定性关系一类为确定性关系,即一个变量被其他,即一个变量被其他变量唯一确定。变量唯一确定。 例如例如X 表示某商品的数量,表示某商品的数量,Y 表示该商品的单价,则其总价表示该商品的单价,则其总价Z 为为Z = = XY 另一类为非确定性关系另一类为非确定性关系,即一个变量与其他变量之间有一定的关系,即一个变量与其他变量之间有一定的关系,但是这一关系又不是完全确定的。但是这一关系又不是完全确定的。计 量 地 理 学 - 第五章 地理系统要素间的相关分析与回归分析中国石油大学(华东)地球科学与技术学院中国石油大学(华东)地球科学与技术学院181 1、引言、引言 例如,原煤的产量与其投资额、电
36、力消耗量、火药消耗量以及木材消耗例如,原煤的产量与其投资额、电力消耗量、火药消耗量以及木材消耗量有关,但即使将影响原煤产量的这四个变量因素完全确定,原煤的产量仍量有关,但即使将影响原煤产量的这四个变量因素完全确定,原煤的产量仍有高有低。这是因为影响其原煤产量的高低远不止以上四个因素,其他因素有高有低。这是因为影响其原煤产量的高低远不止以上四个因素,其他因素例如采煤技术水平、管理水平例如采煤技术水平、管理水平等等都影响着原煤的产量,故投资额、电等等都影响着原煤的产量,故投资额、电力消耗量、火药消耗量以及木材消耗量四个因素与原煤产量有关系,但又不力消耗量、火药消耗量以及木材消耗量四个因素与原煤产量
37、有关系,但又不能完全确定其原煤产量。能完全确定其原煤产量。 例如,家庭的食品支出与家庭收入、家庭的人口数有关,但是对家庭人例如,家庭的食品支出与家庭收入、家庭的人口数有关,但是对家庭人口、收入相同的家庭,其食品支出也不尽相同。这是因为还有其他因素,例口、收入相同的家庭,其食品支出也不尽相同。这是因为还有其他因素,例如不同地区、城市、农村、南方、北方的家庭用于食品的支出不同,另外传如不同地区、城市、农村、南方、北方的家庭用于食品的支出不同,另外传统习惯也影响着家庭对食品支出的多少。故家庭食品的支出与家庭收入、家统习惯也影响着家庭对食品支出的多少。故家庭食品的支出与家庭收入、家庭人口数也是属于不确
38、定的关系。庭人口数也是属于不确定的关系。计 量 地 理 学 - 第五章 地理系统要素间的相关分析与回归分析中国石油大学(华东)地球科学与技术学院中国石油大学(华东)地球科学与技术学院19 上述这种不确定关系中,通常我们称原煤产量、家庭食品支出为因上述这种不确定关系中,通常我们称原煤产量、家庭食品支出为因变量,在计量经济模型中称为变量,在计量经济模型中称为被解释变量被解释变量,而投资额、电力消耗、,而投资额、电力消耗、家庭收入、家庭人口等称为自变量,在计量经济模型中称为家庭收入、家庭人口等称为自变量,在计量经济模型中称为解释变量解释变量,而其他因素例如技术水平、管理水平、地区、习惯也对上述的被解
39、释变而其他因素例如技术水平、管理水平、地区、习惯也对上述的被解释变量有影响,但大多数是在研究的目标中未予控制或难于控制的量有影响,但大多数是在研究的目标中未予控制或难于控制的随机因素随机因素,因此被解释变量受到两方面的影响,一方面受到解释变量因此被解释变量受到两方面的影响,一方面受到解释变量x1 1 ,x2 2, x k 的影响,这部分可表为函数的形式的影响,这部分可表为函数的形式f(x1, x2, x k),另一方面),另一方面则为一些随机因素所致,它们可视为随机误差。建立上述变量间的关系,则为一些随机因素所致,它们可视为随机误差。建立上述变量间的关系,需用下面介绍的回归分析方法。回归分析在
40、理论上和应用上也都是极为重需用下面介绍的回归分析方法。回归分析在理论上和应用上也都是极为重要的。要的。 计 量 地 理 学 - 第五章 地理系统要素间的相关分析与回归分析中国石油大学(华东)地球科学与技术学院中国石油大学(华东)地球科学与技术学院202 2、地理回归分析的意义和作用、地理回归分析的意义和作用 地理系统各要素之间的相互关系,可通过大量的观测、试验或实验取地理系统各要素之间的相互关系,可通过大量的观测、试验或实验取得一定的地理数据,然后用数理统计的方法,寻找出隐藏在随机性后面的得一定的地理数据,然后用数理统计的方法,寻找出隐藏在随机性后面的统计规律,而后用回归方程来表达。统计规律,
41、而后用回归方程来表达。 应当注意,虽然函数关系与相关关系是两类不同类型的变量之间的关应当注意,虽然函数关系与相关关系是两类不同类型的变量之间的关系,但它们之间并系,但它们之间并无严格的界限无严格的界限。相关关系的变量之间尽管没有确定性的。相关关系的变量之间尽管没有确定性的关系,但在大量数据条件下,从一定的统计意义上来看,它们之间可能存关系,但在大量数据条件下,从一定的统计意义上来看,它们之间可能存在着某种类型的函数关系。因而可以借助于函数关系的数学表达式来表达。在着某种类型的函数关系。因而可以借助于函数关系的数学表达式来表达。而变量之间的函数关系,从理论上说是完全精确的函数关系,但是如果对而变
42、量之间的函数关系,从理论上说是完全精确的函数关系,但是如果对某种函数关系的变量作多次测定,由于有误差存在,所得数据有时并不绝某种函数关系的变量作多次测定,由于有误差存在,所得数据有时并不绝对相同,因而它们之间的关系就变成了非确定性了。严格来讲,对相同,因而它们之间的关系就变成了非确定性了。严格来讲,回归分析回归分析就是处理变量之间具有相关关系的一种数理统计方法就是处理变量之间具有相关关系的一种数理统计方法。计 量 地 理 学 - 第五章 地理系统要素间的相关分析与回归分析中国石油大学(华东)地球科学与技术学院中国石油大学(华东)地球科学与技术学院21 实际上,回归分析和相关分析都是研究和处理变
43、量之间相互关系的一实际上,回归分析和相关分析都是研究和处理变量之间相互关系的一种数理统计方法,但它们之间既有联系,又有区别。在研究对象和内容上种数理统计方法,但它们之间既有联系,又有区别。在研究对象和内容上两者是相同的,相关分析主要是研究要素之间联系的密切程度,并没有严两者是相同的,相关分析主要是研究要素之间联系的密切程度,并没有严格的自变量和因变量之分;而回归分析则主要是研究要素之间联系的数学格的自变量和因变量之分;而回归分析则主要是研究要素之间联系的数学表达形式,因而就有自变量和因变量之分,从而就可由自变量的取值来预表达形式,因而就有自变量和因变量之分,从而就可由自变量的取值来预测、延长或
44、插补和控制因变量的取值,所以回归分析尚有地理预测的性质测、延长或插补和控制因变量的取值,所以回归分析尚有地理预测的性质。 回归分析的主要内容回归分析的主要内容 v 从一组地理数据出发,确定这些要素之间的定量数学表达形式,即从一组地理数据出发,确定这些要素之间的定量数学表达形式,即回归模型;回归模型;v 根据一个或几个要素的值来预测或控制另一个要素的取值;根据一个或几个要素的值来预测或控制另一个要素的取值; v 从影响某一个地理过程的许多要素中,找出哪些要素是主要的,哪从影响某一个地理过程的许多要素中,找出哪些要素是主要的,哪些是次要的,这些要素之间又有什么关系。些是次要的,这些要素之间又有什么
45、关系。 回归分析所研究的地理数学模型,根据要素的多少可以分为一元地理回归分析所研究的地理数学模型,根据要素的多少可以分为一元地理回归模型和多元地理回归模型。回归模型和多元地理回归模型。 计 量 地 理 学 - 第五章 地理系统要素间的相关分析与回归分析中国石油大学(华东)地球科学与技术学院中国石油大学(华东)地球科学与技术学院223 3、一元地理回归模型的建立、一元地理回归模型的建立 现代地理学研究的对象是多层次多要素的复杂系统,其要素之间的相现代地理学研究的对象是多层次多要素的复杂系统,其要素之间的相互关系,既有线性的,也有非线性的。因此地理要素之间的回归分析模型,互关系,既有线性的,也有非
46、线性的。因此地理要素之间的回归分析模型,既有线性回归模型,也有非线性回归模型既有线性回归模型,也有非线性回归模型。 在回归分析中,我们一般使用地理系统分析(绪论中所讲过的计量地在回归分析中,我们一般使用地理系统分析(绪论中所讲过的计量地理学中使用的方法之一),它是把复杂的地理系统由大系统分解为次一级理学中使用的方法之一),它是把复杂的地理系统由大系统分解为次一级的系统、各级分系统或子系统,有时直至分解为一个输入与一个输出的简的系统、各级分系统或子系统,有时直至分解为一个输入与一个输出的简单系统,进而对地理要素间数量关系进行分析,求出在地理系统背景之下单系统,进而对地理要素间数量关系进行分析,求
47、出在地理系统背景之下的两个要素之间的输入的两个要素之间的输入- -输出参数。输出参数。 一元地理回归模型所处理的问题,是解决两个要素之间的定量关系。一元地理回归模型所处理的问题,是解决两个要素之间的定量关系。两个要素之间的数量关系,有的是线性关系,有的是非线性关系。这样就两个要素之间的数量关系,有的是线性关系,有的是非线性关系。这样就提出一个重要问题,即如何正确地分析与判断要素之间的关系是线性回归提出一个重要问题,即如何正确地分析与判断要素之间的关系是线性回归模型还是非线性回归模型,在非线性回归模型中的曲线又属于哪种类型?模型还是非线性回归模型,在非线性回归模型中的曲线又属于哪种类型?因此,只
48、有首先判断出回归方程类型,然后才能正确地求出回归模型的参因此,只有首先判断出回归方程类型,然后才能正确地求出回归模型的参数。数。 计 量 地 理 学 - 第五章 地理系统要素间的相关分析与回归分析中国石油大学(华东)地球科学与技术学院中国石油大学(华东)地球科学与技术学院23 (1 1)一元线性回归模型)一元线性回归模型计 量 地 理 学 - 第五章 地理系统要素间的相关分析与回归分析 由于地理要素是系统中的要素,所以要求地理系统中全部要素对于两由于地理要素是系统中的要素,所以要求地理系统中全部要素对于两个我们所考虑的因素的作用,都能用两要素之间的关系加以反映。而无法个我们所考虑的因素的作用,
49、都能用两要素之间的关系加以反映。而无法用两要素关系来反映的部分(常称为用两要素关系来反映的部分(常称为“剩余项剩余项”或误差),要设法使之尽可或误差),要设法使之尽可能地小。这样的思想,可以从三个方面来实现。能地小。这样的思想,可以从三个方面来实现。 、对于各项预测而言,都会有两要素关系无法表示的部分。假如我、对于各项预测而言,都会有两要素关系无法表示的部分。假如我们把第们把第k k次预测的剩余项或误差记为次预测的剩余项或误差记为ek,则我希望每次预测的误差中最大的,则我希望每次预测的误差中最大的误差达到最小,即:误差达到最小,即: 、或者,我们希望历次预测的误差绝对值的总和达到最小,即:、或
50、者,我们希望历次预测的误差绝对值的总和达到最小,即: 、使误差的平方和达到最小,即:、使误差的平方和达到最小,即: 虽然前两种思想是直观而易于接受的,但计算过程很繁琐;以最后一虽然前两种思想是直观而易于接受的,但计算过程很繁琐;以最后一种所表示的思想最常用,这一思想就是所谓的种所表示的思想最常用,这一思想就是所谓的最小二乘法最小二乘法,它在地理预测,它在地理预测中,有很广泛的使用。中,有很广泛的使用。 min maxkkeminiiemin2iieQ中国石油大学(华东)地球科学与技术学院中国石油大学(华东)地球科学与技术学院24 设有两个地理要素和,设有两个地理要素和,x为自变量,为自变量,y
51、是因变量。则,是因变量。则,一元线性回归模一元线性回归模型型的基本结构形式为:的基本结构形式为: 上式中,上式中,a、b为待定参数;为待定参数; ,为为n组观测组观测 、 , 的下标;的下标; 为随机变量。如果记为随机变量。如果记 、分别为参数、分别为参数a、b的拟合值,则一元线的拟合值,则一元线性回归模型可表达为:性回归模型可表达为: 上一个式子代表上一个式子代表x和和y之间相互关系的拟合直线,常称为之间相互关系的拟合直线,常称为回归直线回归直线;是回归;是回归系数,也就是直线的斜率;是系数,也就是直线的斜率;是y的估计值,也称为的估计值,也称为回归值回归值。 回归值回归值 与实际观测值与实
52、际观测值yi之差,刻划了之差,刻划了yi与与 的偏离程度,也就是观测的偏离程度,也就是观测值与回归值之间的误差大小,通常总希望它们的误差值与回归值之间的误差大小,通常总希望它们的误差ei的平方和为最小,的平方和为最小,即:即: bxayn , , 2 , 1),(11yx),(22yx),(nnyxabxbaybyyymin)( )(121212niiiniiiniibxayyyeQ计 量 地 理 学 - 第五章 地理系统要素间的相关分析与回归分析中国石油大学(华东)地球科学与技术学院中国石油大学(华东)地球科学与技术学院25(a)参数参数a、b的最小二乘估计的最小二乘估计 根据取极值的必要条
53、件,有根据取极值的必要条件,有: : niiiiniiixbxaybQbxayaQ110)(20)(2即即: : niiiiniiixbxaybxay110)(0)(上述方程组可以进一步写成上述方程组可以进一步写成: : niniiiiniininiiiyxxbxayxbna112111计 量 地 理 学 - 第五章 地理系统要素间的相关分析与回归分析中国石油大学(华东)地球科学与技术学院中国石油大学(华东)地球科学与技术学院26xxxyniiniiininiiniininiininiiiininiiniininiininiiiininiiniininiininiiiiniiniiiniini
54、iniiiLLxxyyxxxxxxyxxyyxyxxxxxyxxyyxyxxxxxyxyxxyyxxnxnxyxnyxnyxnyxxnxyxnyxb1211211211111211211111211211112212121121)()(2 2 2 2)(1或者或者 xxxyniiniininiiiiiniiniiniiiLLxnxnyxyxxnxyxnyxb21121121121)(1)(1xbya计 量 地 理 学 - 第五章 地理系统要素间的相关分析与回归分析中国石油大学(华东)地球科学与技术学院中国石油大学(华东)地球科学与技术学院27(b)回归模型估计的误差回归模型估计的误差 当一元线
55、性地理回归模型求出之后,它的效果如何,它所揭示的地理当一元线性地理回归模型求出之后,它的效果如何,它所揭示的地理规律性强不强,用它来进行地理预测精度如何?所有这些问题都需要进一规律性强不强,用它来进行地理预测精度如何?所有这些问题都需要进一步作出分析。步作出分析。 由线性回归模型所估计的值由线性回归模型所估计的值 往往与实际观测值往往与实际观测值y不完全一致,所以反不完全一致,所以反映在散点图上的观测值映在散点图上的观测值y和由和由x值所估计的值值所估计的值 常不吻合,而散布在回归直常不吻合,而散布在回归直线的附近,这种误差就是由于用线性回归模型由值估计的值时所产生的误线的附近,这种误差就是由
56、于用线性回归模型由值估计的值时所产生的误差。这种误差,称为差。这种误差,称为回归方程估计误差回归方程估计误差。 如果把估计值如果把估计值 看作是各个看作是各个x值所对应的各个值所对应的各个y值的均值,并以标准差值的均值,并以标准差的形式来估计其误差的大小,则称为的形式来估计其误差的大小,则称为标准估计误差标准估计误差(也称为(也称为剩余标准差剩余标准差)。)。记作记作S,其计算公式为:,其计算公式为: yyy2)(12nyySni计 量 地 理 学 - 第五章 地理系统要素间的相关分析与回归分析中国石油大学(华东)地球科学与技术学院中国石油大学(华东)地球科学与技术学院28(c)一元线性回归模
57、型显著性检验一元线性回归模型显著性检验 回归模型建立后,需要对模型的可信度进行检验,以鉴定模型的质量。回归模型建立后,需要对模型的可信度进行检验,以鉴定模型的质量。线性回归模型的显著性检验是借助于线性回归模型的显著性检验是借助于检验检验来完成的。来完成的。 计 量 地 理 学 - 第五章 地理系统要素间的相关分析与回归分析中国石油大学(华东)地球科学与技术学院中国石油大学(华东)地球科学与技术学院29 在回归分析中,在回归分析中,y的的n次观测值次观测值y1 1、y2 2,yn之间的差异,可以用观测之间的差异,可以用观测值值yi与其平均值与其平均值 的离差平方和来表示,它被称为的离差平方和来表
58、示,它被称为总的离差平方和总的离差平方和,记为,记为: : 从上图可以看出,每一个观测点的离差可以分解为:从上图可以看出,每一个观测点的离差可以分解为:可以证明:可以证明: yniiyyyyLS12)(总)()(yyyyyyUQyyyyyyyyyyLSniiniiiniiiiniiyy )()( )()()(12121212总上式中,上式中, 称为称为误差平方和误差平方和,或,或剩余平方和剩余平方和,而,而U称为称为回归平方和回归平方和。 niiiyyQ12)(xyxxiniiniibLLbxxbxbabxayyU2221212)( )()(计 量 地 理 学 - 第五章 地理系统要素间的相关
59、分析与回归分析中国石油大学(华东)地球科学与技术学院中国石油大学(华东)地球科学与技术学院30 可以证明下式中的交叉项:可以证明下式中的交叉项: 从公式可以看出,当从公式可以看出,当U对对Lyy的贡献越大时,的贡献越大时,Q的影响就越小,回归模型的的影响就越小,回归模型的效果就越好。这样,就可以由统计量效果就越好。这样,就可以由统计量 衡量回归模型的效果,显然衡量回归模型的效果,显然F越大,就意味着模型的效果越佳。事实上,统计越大,就意味着模型的效果越佳。事实上,统计量量 ,在显著水平,在显著水平 下,若下,若 ,则认为回归方程效果在此水平,则认为回归方程效果在此水平下显著。下显著。 0)(2
60、1niiiiyyyyniiiiniiniiiniiiiniiyyyyyyyyyyyyyyyyLS112121212)(2)()( )()()(总2nQUF) 2, 1 (nFF)2, 1(nFF计 量 地 理 学 - 第五章 地理系统要素间的相关分析与回归分析中国石油大学(华东)地球科学与技术学院中国石油大学(华东)地球科学与技术学院31 一元非线性地理回归模型一元非线性地理回归模型 在许多实际地理问题中,有时两个要素之间的关系并不是线性关系,而在许多实际地理问题中,有时两个要素之间的关系并不是线性关系,而是某种非线性关系,这时我们选择适当的类型曲线比选直线更符合地理实是某种非线性关系,这时我
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 信用卡申请书
- 生态安全与珍稀动物保护的国际合作
- 班组中新员工的培训与融入策略
- 武警义务兵退伍申请书
- 2025年店铺合租共同经营合同模板
- 2018-2024年中国互联网+蛋糕行业市场发展现状调研及投资趋势前景分析报告
- 2025年热气项目可行性研究报告
- 用电安全培训教育及宣传推广策略研究报告
- 2025年聚乙稀塑料薄膜项目投资可行性研究分析报告
- 腌腊肉项目投资立项报告
- 住院精神疾病患者自杀风险护理
- 2024义务教育道德与法治课程标准(2022版)
- 浙江省大学生职业生涯规划大赛赛前辅导课件
- 部编四下语文《口语交际:转述》公开课教案教学设计【一等奖】
- 仓库每日巡查制度
- 学校教育数字化工作先进个人事迹材料
- 2024中国AI应用开发者生态调研报告-易观分析
- 2024鲁教版七年级下册数学第七章综合检测试卷及答案
- 2024年辽宁医药职业学院单招职业适应性测试题库含答案
- 企事业单位公建项目物业管理全套方案
- 《电线电缆介绍》课件
评论
0/150
提交评论