




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、上机实习内容2 几种常见的统计指标与参数 一、描述地理数据集中趋势的指标 1、 平均数(Mean) (1) 算术平均数(Arithmetic mean) 简单算术平均数(Simple arithmetic mean) 设有n个地理数据nxxxx,321?,其算数平均数x可按下式计算: ?niinxnnxxxxx13211? 练习1 求上海市1873-1940年100年内的年平均降水量的简单算术平均数。 /*调用Excel中的average()函数求样本的简单算数平均数*/ 注意: 样本的简单算术平均数易受极端值的影响,如有以下样本资料: 表1-1 13个样本的属性值 样本序号 1 2 3 4
2、5 6 7 8 9 10 11 12 13 属性值 5 7 5 4 6 7 8 5 4 7 8 6 20 全部资料的简单算术平均数约为7.08,实际上大部分数据(有10个)不超过7,如果去掉第13个属性值20,则剩下的12个数的平均数为6。 加权算术平均数(Weighted arithmetic average) 设有n个地理数据nxxxx,321?,其权重系数分别为nffff,321?,其加权算术平均数x可按下式计算: ?niiniiinnnffxfff f fxfxfxfxx11321332211? 练习2 根据黄土高原西部地区某山区县的人工造林地调查的分组数据求其加权算术平均数。 表1-
3、2 某县人工造林地面积的统计分组数据 (单位:ha) 分组序号 1 2 3 4 5 6 7 8 9 10 11 组中值 0.5 1.5 2.5 3.5 4.5 5.5 6.5 7.5 8.5 9.5 10.5 频数 25 96 136 214 253 286 260 203 154 85 24 /*运用Excel中的相对引用功能和求和sum()函数*/ 494.524962524*5.1096*5.125*5.0?x (2) 几何平均数(Geometric mean) 设有n个地理数据nxxxx,321?,其几何平均数gx可按下式计算: nnigxxxxx?21 练习3 一位投资者持有一种股票
4、,1997-2000年收益率如下表,计算该投资者在这四年内的平均收益率。 年份 1997 1998 1999 2000 表1-3 投资者4年的收益率 收益率 1.045 1.02 1.035 1.054 /*调用Excel中的geomean()函数求样本的几何平均数*/ 038.1054.1*035.1*02.1*045.14? 2、 中位数(Median) 将各个数据从小到大排列,居于中间位置的那个数就是中位数。 (1) 未分组资料的中位数 当地理数据项数n为奇数时,变量按大小顺序排列,第21?n位数是中位数em,即 21?nexm 练习4 求某地9年年平均气温的中位数。 表1-4 某地9年
5、年平均气温表 (单位:) 4.8 5 4.5 3.9 4.7 5.1 4.4 4.6 5.2 计算步骤: 对原始数据序列排序 /*运用Excel中的排序功能*/ 3.9 4.4 4.5 4.6 4.7 4.8 5 5.1 5.2 根据公式求得中位数 7.45219?xxme 当地理数据项数n为偶数时,变量按大小顺序排列,第2n项与第2n+1项的平均数为中位数em,即 )(21122?nnexxm 练习5 求某地8年季节性冻土深度的中位数。 表1-5 某地8年季节性冻土深度 (单位:mm) 50 51 53.5 53 53.6 52 57 58 计算步骤: 对原始数据序列排序 /*运用 Exce
6、l中的排序功能*/ 50 51 52 53 53.5 53.6 57 58 根据公式求得中位数 25.53)535.53(*21)(21)(215412828?xxxxme (2) 分组资料的中位数 对于分组的资料,可按下式计算中位数 mmmeefhfnLM)2(1? 式中,n为样本大小,meL为中位数所在组的下限值,1?mf为中位数所在组的前一组的累积频数,mf为中位数所在组的频数,h为组距。 练习6 求上海市1873-1940年100年内的年平均降水量的分组资料的中位数。 计算步骤: 首先求出分组资料的累积频数,如表 组序 组上限 组下限 频数 累积频数 1 649.7 768.7 1 1
7、 2 768.7 887.7 7 8 3 887.7 1006.7 16 24 4 1006.7 1125.7 27 51 5 1125.7 1244.7 22 73 6 1244.7 1363.7 14 87 7 1363.7 1482.7 8 95 8 1482.7 1601.7 3 98 9 1601.7 1720.7 2 100 由样本的大小(数据个数,为100)和累积频数可知,中位数所在的分组为累积频数小于51的分组,即中位数在第4组。 则根据公式可求出该分组资料的中位数为 293.112127119*)242100(7.1006?eM 有没有更简单的方法?直接调用Excel中的me
8、dian()函数。 3、 众数(Mode) 众数是一个地理观测系列中出现频数(次数)最多的数。 (1)未分组资料的众数 根据每一个数据出现的频数大小直接确定众数。 练习7 求如下数据序列的众数。 序号 1 2 3 4 5 6 7 8 9 属性值 161 73 163 165 74 76 72 73 169 根据目视结果可知,属性值73出现了两次,其他属性值只出现一次,因此该数据序列的众数为73。 /*当样本较大时,可先运用Ecxel中的排序功能对数据排序,再确定众数*/ (2)分组资料的众数 对于分组的资料,可按下式计算众数oM hfffLMmmmmoo?111 式中, moL为众数所在组的下
9、限值,1?mf为众数所在组的前一组的频数,1?mf为众数所在组的后一组的频数,h为组距。 练习8 求上海市1873-1940年100年内的年平均降水量的分组资料的众数。 计算步骤: 组序 组上限 组下限 频数 1 649.7 768.7 1 2 768.7 887.7 7 3 887.7 1006.7 16 4 1006.7 1125.7 27 5 1125.7 1244.7 22 6 1244.7 1363.7 14 7 1363.7 1482.7 8 8 1482.7 1601.7 3 9 1601.7 1720.7 2 根据频数分布表可知众数所在组为第4组。 则根据公式可求出该分组资料的
10、众数为 6.10751192216227.1006?eM 有没有更简单的方法?直接调用Excel中的mode()函数。 /*在调用mode()函数时,若样本中无重复属性值,则函数出错*/ 二、描述地理数据分散趋势的指标 1、极差(Range) 2、离差(Deviation) 每一个地理数据与平均值的差。 xxdii?),2,1(ni? /*缺点:离差会得到一系列的数据,不便于两个样本的比较。 如:我国辽宁省朝阳县和宁夏回族自治区固原县两地多年平均降水量资料如下表,分别计算两地多年平均降水量的离差,得到结果如下 表2-1 两地多年平均降水量及离差 (单位:mm) 年份 1961 1962 196
11、3 1964 1965 1966 1967 1968 1969 1970 朝阳 年降水量 412 633.7 608 606.3 520.5 436.2 402.7 371.9 692.8 526.3 离差 -109.04 112.66 86.96 85.26 -0.54 -84.84 -118.34 -149.14 171.76 5.26 固原 年降水量 732.4 412.5 373.4 766.4 475.9 619.2 515.6 501.1 352.6 434.2 离差 214.07 -105.83 -144.93 248.07 -42.43 100.87 -2.73 -17.23
12、-165.73 -84.13 由表可得到每个地区的多年平均降水量波动情况,但两个地区的多年平均降水量变动幅度大小很难比较*/ 4、 离差平方和(Sum of squares) 各数据的离差平方后再相加。 目的:一是为了消除正负号;二是使离散程度更清楚。 ?niiniixxd1212)( /*调用Excel中的devsq()函数求样本的离差平方和*/ 5、 方差(variance) 各离差平方和除以其数据的个数。 对于总体方差2?,其计算公式为 ?niixxn122)(1? /*调用Excel中的varp()函数求总体方差*/ 对于样本的方差2S,其计算公式为 ?niixxnS122)(11 /
13、*调用Excel中的var()函数求样本的方差*/ /*式中1?n称为自由度。其含义可做如下解释。设一个样本含有n个变量,从理论上讲n个变量都同样用来计算方差,每一ix与x比较就有n个离差。但均值本身也是从样本资料中 估算出来的,即由每一个变量各贡献n1而组成,如每一个变量与x作一次比较,这无形中 就等于各个变量与其自身的n1做比较,因此每一离差比独立比较时要稍微减小些,表面上虽有n个比较,但实质上仅相当于1?n个独立比较。所以,在估计方差时,用1?n来除。*/ 6、 标准差(Standard deviation) 标准差为方差的算术平方根。 总体的标准差计算公式为 nxxnii?12)(?
14、/*调用Excel中的stdevp()函数求总体的标准差*/ 样本的标准差计算公式为 1)(12?nxxSnii /*调用Excel中的stdev()函数求样本的标准差*/ 7、 变异系数(Variation coefficient) 标准差与均值的比值。 当两个系列数值的单位不同或均值相差较大,或它们的标准差相同时,就不能简单地用标准差的绝对值来比较不同均值时随机系列的离散程度。 变异系数vC的计算公式为 1)(112?nxxxxSCniiv 三、描述地理数据分布特征的指标 1、 偏度系数(Coefficient of skewness) 描述了地理数据分布的不对称性,刻画了以平均值为中心的偏向情况,其计算公式为 ?niixxng131)(1? 1g0,表示正偏,即均值在峰值的右边;1g=0,表示对称分布。 /*调用Excel中的skew()函数求样本的偏度系数*/ 2、 峰度系数(Coefficient of kurtosis) 描述了地理数据在均值附近的集中程度,其计算公式为 3)(1412?xxngini 标准正态分布的峰度系数2g=0;2g0,表示地理数据分布的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025办公室租赁合同范本参考
- 2025二手车买卖合同全国正式版
- 2025石油化工管道工程监理安全环保合同
- 2025室内涂料分包合同样本
- 《绿色生活由我启动》课件
- 2025医疗器械采购销售合同模板
- 电子银行承兑合同协议
- 电脑服务外包合同协议
- 电影股权转让合同协议
- 玉林农村建房合同协议
- DB33-1036-2021《公共建筑节能设计标准》
- 岩芯鉴定手册
- 快速排序算法高校试讲PPT
- 甘肃历史与甘肃文化
- 工程勘察设计收费标准
- 高边坡施工危险源辨识及分析
- SAP航空行业数字化转型解决方案(优秀方案集)
- 江苏工业企业较大以上风险目录
- 《村卫生室管理办法(试行)》课件(PPT 49页)
- 监理质量评估报告(主体分部)
- 锅炉爆炸事故演练方案(模板)
评论
0/150
提交评论