




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第4章 数据(shj)的概括性度量1集中趋势的度量2离散程度的度量3偏态与峰态的度量共五十一页4.1集中趋势(qsh)的度量一组数据向其中心值靠拢的倾向和程度测度集中趋势就是寻找数据一般水平的代表值或中心值不同类型的数据用不同的集中趋势测度值低层次数据的集中趋势测度值适用于高层次的测量数据,反过来,高层次数据的集中趋势测度值并不适用于低层次的测量数据选用(xunyng)哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类型来确定集中趋势 (位置)共五十一页4.1.1 分类数据:众数集中趋势的测度值之一出现次数最多的变量值不受极端值的影响(yngxing)可能没有众数或有几个众数主要用于定类
2、数据,也可用于定序数据和数值型数据共五十一页1.根据第三章例3.3中的数据,计算众数(zhn sh)2.根据第三章例3.5中的数据,计算众数3.数值型分组数据的众数算例某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105110110115115120120125125130130135135140358141064381630404650合计50共五十一页4.1.2 顺序数据:中位数和分位数1.中位数集中趋势的测度值之一排序后处于中间位置上的值不受极端值的影响主要(zhyo)用于定序数据,也可用数值型数据,但不能用于定类数据各变量值与中位数的离差绝对值之和最小,即共五十一页计
3、算公式未分组数据的中位数数值型分组数据的中位数共五十一页原始数据: 24 22 21 26 20位 置: 1 2 3 4 5中位数的计算(j sun)排 序:20 21 22 24 26原始数据: 10 5 9 12 6 8位 置: 1 2 3 4 5 6排 序: 5 6 8 9 10 12中位数=(8+9)/2=8.5共五十一页某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105110331101155811512081612012514301251301040130135646135140450合计 50 中位数的位置(wi zhi)=50/2=25,即中位数在12012
4、5这一组,L=120,Sm 1 = 16,U=125,Sm + 1 = 20,fm = 14,d=5,根据中位数公式得:共五十一页2.四分位数人们经常会将数据划分为4个部分,每一个部分大约(dyu)包含有1/4即25的数据项。QLQMQU25%25%25%25%1.集中趋势的测度(c du)值之一2.排序后处于25%和75%位置上的值3.不受极端值的影响4.主要用于定序数据,也可用于数值型数据,但不能用于定类数据共五十一页四分位数(位置(wi zhi)的确定)未分组数据(shj):组距分组数据:下四分位数(QL)位置 =N+14上四分位数(QU)位置 =3(N+1)4下四分位数(QL)位置 =
5、N4上四分位数(QL)位置 =3N4共五十一页甲城市家庭对住房状况评价的频数分布回答类别甲城市户数 (户)累计频数 非常不满意 不满意 一般 满意 非常满意2410893453024132225270300合计300计算甲城市家庭(jitng)对住房满意状况评价的四分位数解:下四分位数(QL)的位置为: QL位置(300)/475 上四分位数(QL)的位置为: QU位置(3300)/4225从累计频数看, QL在“不满意(mny)”这一组别中; QU在“一般”这一组别中。因此 QL 不满意 QU 一般共五十一页原始数据: 23 21 30 32 28 25 26排 序: 21 23 25 26
6、 28 30 32位 置: 1 2 3 4 5 6 7 QL= 23N+17+1QL位置 =4=4= 2QU位置 =3(N+1)43(7+1)4 = 6QU = 30数值(shz)型未分组数据的四分位数共五十一页原始数据: 23 21 30 28 25 26排 序: 21 23 25 26 28 30位 置: 1 2 34 5 6QL= 21+0.75(23-21) = 22. 5QL位置 =N+14=6+14= 1.75QU位置 =3(N+1)43(6+1)4= 5.25QU = 28+0.25(30-28) = 28.5共五十一页数值(shz)型分组数据的四分位数(计算公式)上四分位数:
7、下四分位数: 共五十一页计算50 名工人(gng rn)日加工零件数的四分位数某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105110110115115120120125125130130135135140358141064381630404650合计50QL位置(wi zhi)50/412.5QU位置350/437.5共五十一页4.1.3 数值型数据:平均值1.集中趋势(qsh)的测度值之一2.最常用的测度值3.一组数据的均衡点所在4.易受极端值的影响5.用于数值型数据,不能用于定类数据和定序数据共五十一页均值(jn zh)(计算公式)设一组数据(shj)为:X1 ,X2
8、 , ,XN 简单均值的计算公式为设分组后的数据为:X1 ,X2 , ,XK 相应的频数为: F1 , F2, ,FK加权均值的计算公式为共五十一页简单(jindn)均值(算例)原始数据:10591368加权均值(jn zh)(算例4.7)共五十一页加权均值(权数对均值的影响)甲乙两组各有10名学生(xu sheng),他们的考试成绩及其分布数据如下 甲组: 考试成绩(X):0 20 100 人数分布(F):1 1 8 乙组: 考试成绩(X ): 0 20 100 人数分布(F ):8 1 1X甲01+201+1008n10i=1Xi 82(分)X乙08+201+1001n10i=1Xi 12
9、(分)共五十一页均值(数学(shxu)性质)1.各变量值与均值(jn zh)的离差之和等于零 2. 各变量值与均值的离差平方和最小共五十一页几何(j h)平均数(概念要点)1. 集中趋势的测度值之一2. N 个变量值乘积的 N 次方根3. 适用于特殊的数据4. 主要(zhyo)用于计算平均发展速度5. 计算公式为6. 可看作是均值的一种变形共五十一页几何(j h)平均数(算例)【例4.10】一位投资者持有一种股票,2001-2004年收益率分别(fnbi)为4.5%、2.1%、25.5%、1.9%。计算该投资者在这四年内的平均收益率。平均收益率108.0787%-1=8.0787%共五十一页4
10、.1.4众数、中位数和均值的比较(bjio)1.众数、中位数和均值的关系对称分布 均值= 中位数= 众数左偏分布均值 中位数 众数右偏分布众数 中位数 均值共五十一页数据类型和所适用的集中趋势测度值数据类型定类数据 定序数据定距数据定比数据适用的测度值众数中位数均值均值四分位数众数调和平均数众数中位数几何平均数四分位数 中位数四分位数众数共五十一页4.2 离散程度(chngd)的度量数据分布的另一个重要特征离中趋势的各测度值是对数据离散程度所作的描述反映各变量值远离其中心值的程度,因此也称为离中趋势从另一个侧面说明了集中(jzhng)趋势测度值的代表程度不同类型的数据有不同的离散程度测度值共五
11、十一页4.2.1 分类(fn li)数据:异众比率1.离散程度的测度(c du)值之一2.非众数组的频数占总频数的比率3.计算公式为 4. 用于衡量众数的代表性共五十一页异众比率(算例)根据(gnj)表中的数据,计算异众比率某城市居民关注广告类型的频数分布 广告类型人数(人)频率(%) 商品广告 服务广告 金融广告 房地产广告 招生招聘广告 其他广告1125191610256.025.54.58.05.01.0合计200100解: 在所调查的200人当中,关注非商品广告的人数占44%,异众比率(bl)还是比较大。因此,用“商品广告”来反映城市居民对广告关注的一般趋势,其代表性不是很好 Vr =
12、 200 - 112200 = 1 - 112 200 = 0.44 = 44%共五十一页4.2.2 顺序数据:四分位差1.离散程度的测度值之一2.也称为内距或四分间距3.上四分位数与下四分位数之差 QD = QU - QL4.反映了中间(zhngjin)50%数据的离散程度5.不受极端值的影响6.用于衡量中位数的代表性共五十一页四分(s fn)位差(定序数据的算例)根据表中的数据,计算(j sun)甲城市家庭对住房满意状况评价的四分位差甲城市家庭对住房状况评价的频数分布回答类别甲城市户数 (户)累计频数 非常不满意 不满意 一般 满意 非常满意241089345302413222527030
13、0合计300解:设非常不满意为1,不满意为2, 一般为3, 满意为 4, 非常满意为5 已知 QL = 不满意 = 2, QU = 一般 = 3四分位差: QD = QU - QL= 3 2 = 1共五十一页4.2.3 数值型数据(shj):方差和标准差1.极差1. 一组数据的最大值与最小值之差2. 离散程度的最简单测度值3. 易受极端值影响(yngxing)4. 未考虑数据的分布7891078910未分组数据 R = max(Xi) - min(Xi).=组距分组数据 R 最高组上限 - 最低组下限5. 计算公式为共五十一页2. 平均差1. 离散程度(chngd)的测度值之一2. 各变量值与
14、其均值离差绝对值的平均数3. 能全面反映一组数据的离散程度4. 数学性质较差,实际中应用较少5. 计算公式为未分组数据(shj)组距分组数据共五十一页平均差(计算过程(guchng)及结果)某厂按月收入水平分组的组距数列(shli)如表中前两列,计算平均差。共五十一页3.方差和标准差离散程度的测度值之一最常用的测度值反映了数据的分布反映了各变量值与均值的平均差异根据(gnj)总体数据计算的,称为总体方差或标准差;根据(gnj)样本数据计算的,称为样本方差或标准差4 6 8 10 12X = 8.3共五十一页总体(zngt)方差和标准差(计算公式)未分组数据(shj):组距分组数据:未分组数据:
15、组距分组数据:方差的计算公式标准差的计算公式共五十一页总体标准差(计算过程(guchng)及结果)根据表中的数据(shj),计算工人日加工零件数的标准差某车间50名工人日加工零件标准差计算表按零件数分组组中值(Xi)频数(Fi)(Xi- X )2(Xi- X )2Fi105110110115115120120125125130130135135140107.5112.5117.5122.5127.5132.5137.5358141064246.49114.4932.490.4918.4986.49204.49739.47572.45259.926.86184.90518.94817.96合计5
16、03100.5共五十一页样本(yngbn)方差和标准差(计算公式)未分组数据(shj):组距分组数据:未分组数据:组距分组数据:方差的计算公式标准差的计算公式注意:样本方差用自由度n-1去除!共五十一页样本方差自由度一组数据中可以自由取值的数据的个数当样本数据的个数为 n 时,若样本均值x 确定(qudng)后,只有n-1个数据可以自由取值,其中必有一个数据则不能自由取值例如,样本有3个数值,即x1=2,x2=4,x3=9,则 x = 5。当 x = 5 确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自由取值,比如x1=6,x2=7,那么x3则必然取2,而不能取其他值样本方差用自
17、由度去除,其原因可从多方面来解释,从实际应用角度看,在抽样估计中,当用样本方差去估计总体方差2时,它是2的无偏估计量共五十一页样本(yngbn)方差与标准差(算例)原始数据: 10 5 9 13 6 8共五十一页方差(fn ch)(简化计算公式)样本(yngbn)方差总体方差共五十一页方差(数学(shxu)性质)各变量值对均值的方差小于对任意值的方差设X0为不等于X的任意数,D2为对X0的方差,则共五十一页4.相对位置的度量(1)标准分数给出某一个值在一组数据中的相对位置可用于判断一组数据是否有离群点用于对变量(binling)的标准化处理计算公式为共五十一页(2)经验(jngyn)法则当一组
18、数据对称分布时,经验法则表明约有68%的数据在平均数1个标准差的范围之内约有95%的数据在平均数2个标准差的范围之内约有99%的数据在平均数3个标准差的范围之内共五十一页(3)切比雪夫不等式在任何数据集中(jzhng),与平均数超过K倍标准差的数据占的比例至多是1/K2。共五十一页4.2.4 相对离散程度:离散系数1.标准差与其相应的均值之比2.消除了数据水平高低和计量单位的影响3.测度(c du)了数据的相对离散程度4.用于对不同组别数据离散程度的比较5. 计算公式为共五十一页离散(lsn)系数(实例和计算过程)例4.14共五十一页数据类型和所适用的离散程度测度值数据类型定类数据 定序数据定距数据或定比数据适用的测度值异众比率四分位差 方差或标准差 异众比率 离散系数(比较时用) 平均差 极差 四分位差 异众比率共五十一页4.3 偏态与峰态的度量(dling)偏态与峰度分布(fnb)的形状扁平分布尖峰分布偏态峰度左偏分布右偏分布与标准正态分布比较!共五十一页4.3.1 偏态及其测度数据分布偏斜程度的测度偏态系
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五商铺物业委托管理合同(含社区健康管理与医疗支持)
- 二零二五年校园环境卫生管理与绿化合同
- 二零二五年度农村土地承包经营权与农村社会保障合作合同
- 二零二五年度夜店酒吧员工安全协议与安全教育培训费用合同
- 2025年度电动车买卖协议模版
- 二零二五年度知识产权法律风险管理顾问合同
- 二零二五年度武汉房屋租赁合同物业管理约定
- 二零二五年度摩托车第三者责任保险合同
- 《物流系统分析》课件 项目九-任务三 (一)车辆路径优化模型1
- 2025年包头a2货运资格证模拟考试
- 2024年低压电工资格考试必考题库及答案(共415题)
- 小儿高热惊厥课件
- 投资学基础(第2版)教案
- 突发事件及自救互救学习通超星期末考试答案章节答案2024年
- 青少年无人机课程:第一课-马上起飞
- 《静脉治疗护理技术操作规范》测试题考试试题及答案
- 芙蓉镇足球协会成立申请书
- 锅炉安装改造维修质量保证体系文件(手册+程序文件+表格+工艺文件汇编)-符合TSG 07-2019特种设备质量保证管理体系
- 铡草机设备更新项目资金申请报告-超长期特别国债投资专项
- 学习课程方案、课程标准心得体会
- SN-T 5370-2022 进出口危险货物检验规程 锂电池移动电源
评论
0/150
提交评论