数据集位置的测度课件_第1页
数据集位置的测度课件_第2页
数据集位置的测度课件_第3页
数据集位置的测度课件_第4页
数据集位置的测度课件_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二节 数据集位置的测度一、平均指标的概念和作用二、算术平均数三、调和平均数四、几何平均数五、众数六、中位数七、各种平均数之间的相互关系第1页,共50页。一、平均指标的概念和作用第2页,共50页。一、平均指标的概念和作用平均指标的作用:可用于同类现象在不同空间条件下的对比可用于同一总体指标在不同时间的对比可作为论断事物的一种数量标准或参考可用于分析现象之间的依存关系和进行数量上的估算。第3页,共50页。二、算术平均数第4页,共50页。二、算术平均数算术平均数的基本公式第5页,共50页。算术平均数(计算公式)设一组数据为:X1 ,X2 , ,XN 简单算术平均数的计算公式为设分组后的数据为:X1

2、 ,X2 , ,XK 相应的频数为: F1 , F2, ,FK加权算术平均数的计算公式为第6页,共50页。简单算术平均数(算例)原始数据:10591368第7页,共50页。加权算术平均数(算例)某车间50名工人日加工零件均值计算表按零件数分组组中值(Xi)频数(Fi)XiFi105110110115115120120125125130130135135140107.5112.5117.5122.5127.5132.5137.5358141064322.5562.5940.01715.01275.0795.0550.0合计506160.0【例3.7】根据下表数据,计算50 名工人日加工零件数的均

3、值第8页,共50页。加权算术平均数(权数对均值的影响) 甲乙两组各有10名学生,他们的考试成绩及其分布数据如下 甲组: 考试成绩(X ): 0 20 100 人数分布(F ):1 1 8 乙组: 考试成绩(X ): 0 20 100 人数分布(F ):8 1 1X甲01+201+1008n10i=1Xi 82(分)X乙08+201+1001n10i=1Xi 12(分)第9页,共50页。算术平均数(数学性质) 2. 如果每个变量值 都加或减任意数值A,则,平均数也要增多或减少这个数A。 1. 算术平均数与总体单位数的乘积等于总体各单位标志值的总和。第10页,共50页。算术平均数(数学性质) 3.

4、 如果每个变量值都乘以或除以任意数值A,则平均数也要乘以或除以这个数A。 5. 各变量值与均值的离差平方和最小4. 各变量值与均值的离差之和等于零。第11页,共50页。算术平均数的不足算术平均数易受极端变量值的影响,使得平均数代表性变小;而且受极大值的影响大于受极小值的影响。当组距数列为开口组时,由于组中值不易确定,使平均数的代表性不很可靠。第12页,共50页。三、调和平均数第13页,共50页。调和平均数(概念)调和平均数又称为“倒数平均数”,它是各个变量值倒数的算术平均数的倒数。 计算公式为第14页,共50页。调和平均数(算例:由平均数计算)某日三种蔬菜的批发成交数据蔬菜名称批发价格(元)

5、Xi成交额(元) m=Xi Fi成交量(公斤)Fi甲乙丙1.200.500.801800012500640015000250008000合计3690048000【例3.9】某蔬菜批发市场三种蔬菜的日成交数据如下表,计算三种蔬菜该日的平均批发价格第15页,共50页。调和平均数特点:数列中各标志值不能为零;受极端值影响,并且受极小值的影响大于受极大值的影响,但比算术平均数受极端值的影响要小。第16页,共50页。四、几何平均数第17页,共50页。几何平均数(概念要点) 几何平均数又称“对数平均数”,它是若干项变量值连乘积开其项数次方的算术根。 变量本身是比率形式时,当各项变量值的连乘积等于总比率时,

6、适宜用几何平均数计算平均比率。(工农业总产值平均发展速度,企业股票年均收益率等)。第18页,共50页。几何平均数(简单几何平均数)其计算公式为可以用对数形式表示为第19页,共50页。几何平均数(简单几何平均数算例)【例3.11】我国某工业产品19942019年期间产量资料如下表,计算产品平均发展速度。某工业产品产量平均发展速度计算表年份产品产量(亿吨)逐年发展速度(X)(各年产量为前一年的) 逐年发展速度的对数(lgX) 1993199420192019201920199.8010.5410.8010.8711.1611.41107.6102.5100.6102.7102.22.03192.0

7、1072.00252.01152.0094合计10.0660第20页,共50页。几何平均数(简单几何平均数算例)平均发展速度:用对数计算第21页,共50页。几何平均数(加权几何平均数)其计算公式为可以用对数形式表示为第22页,共50页。几何平均数(算例)【例3.12】投资银行43年的利率分配为:1年为3,4年为5,8年为8,10年为1020年为15。计算平均年利率。某投资银行平均年利率计算表年利率发展速度()X年份f年利率发展速度的对数(lgX) f lgX 10310510811011514810202.01282.02122.03342.04142.06072.01288.084816.2

8、67220.414041.214合 计4387.9929第23页,共50页。几何平均数(算例)43年的平均年利率为11.2617第24页,共50页。几何平均数(特点)数列中标志值不能为零或负;受极端值影响较算术平均数和调和平均数要小,较稳健;适用于反映特定现象的平均水平,即现象的总体标志值不是各单位标志值的总和,而是各单位标志值的连乘积。第25页,共50页。五、众数第26页,共50页。众数(概念要点)集中趋势的测度值之一出现次数最多的变量值不受极端值的影响可能没有众数或有几个众数总体的单位数较多,且分配集中,不呈均匀分布,众数才有意义第27页,共50页。众数(众数的不唯一性)无众数原始数据:

9、10 5 9 12 6 8一个众数原始数据: 6 5 9 8 5 5多于一个众数原始数据: 25 28 28 36 42 42第28页,共50页。品质数列或单项数列的众数(算例)某城市居民关注广告类型的频数分布 广告类型人数(人)比例频率(%) 商品广告 服务广告 金融广告 房地产广告 招生招聘广告 其他广告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合计2001100【例3.13】计算众数解:这里的变量为“广告类型”,这是个定类变量,不同类型的广告就是变量值。我们看到,在所调查的200人当中,关注商品广告的人数最多

10、,为112人,占总被调查人数的56%,因此众数为“商品广告”这一类别,即 Mo商品广告第29页,共50页。品质数列或单项数列的众数(算例)【例3.14】解:这里的数据为定序数据。变量为“回答类别”。甲城市中对住房表示不满意的户数最多,为108户,因此众数为“不满意”这一类别,即 Mo不满意甲城市家庭对住房状况评价的频数分布回答类别甲城市户数 (户)百分比 (%) 非常不满意 不满意 一般 满意 非常满意24108934530836311510合计300100.0第30页,共50页。组距数列的众数(要点及计算公式)1. 众数的值与相邻两组频数的分布有关2. 公式假定众数组的频数在众数组内均匀分布

11、3. 相邻两组的频数相等时,众数组的组中值即为众数Mo第31页,共50页。组距数列的众数(要点及计算公式)4. 相邻两组的频数不相等时,众数采用下列近似公式计算第32页,共50页。组距数列的众数(算例)某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105110110115115120120125125130130135135140358141064381630404650合计50【例3.15】第33页,共50页。众数的特点是位置平均数,只考虑总体分布中最频繁出现的变量值,不受极端值和开口组的影响,增强了其代表性;当分布数列中无明显的集中趋势而呈均匀分布时,无众数;当变量数列不

12、等距分组时,众数不易确定。第34页,共50页。六、中位数和分位数第35页,共50页。中位数(概念要点)集中趋势的测度值之一排序后处于中间位置上的值Me50%50%不受极端值的影响各变量值与中位数的离差绝对值之和最小,即第36页,共50页。未分组数据的中位数(计算公式)未分组数据:第37页,共50页。未分组数据的中位数 (5个数据的算例)原始数据: 24 22 21 26 20排 序: 20 21 22 24 26位 置: 1 2 3 4 5中位数 22第38页,共50页。未分组数据的中位数 (6个数据的算例)原始数据: 10 5 9 12 6 8排 序: 5 6 8 9 10 12位 置: 1

13、 2 3 4 5 6位置N+126+123.5中位数8 + 928.5第39页,共50页。品质数列或单项数列的中位数(计算方法)1. 位置公式:2.计算各组的累计频数3.根据中位数的位置找出中位数第40页,共50页。单项数列的中位数(算例)某厂工人日产零件中位数计算 按日产零件分组(件)工人数(人)向上累计频数向下累计频数26313234364131014271883132754728080775753268合计80【例3.16】从向上累计和向下累计中可以找到累计频数有40的那一组的标志值为34,即Me34件第41页,共50页。品质数列的中位数(算例)【例3.17】解:中位数的位置为: 300

14、/2150从累计频数看,中位数的在“一般”这一组别中。因此 Me一般甲城市家庭对住房状况评价的频数分布回答类别甲城市户数 (户)累计频数 非常不满意 不满意 一般 满意 非常满意2410893453024132225270300合计300第42页,共50页。组距数列的中位数(要点及计算公式)根据位置公式确定中位数所在的组假定中位数组的频数在该组内均匀分布采用下列近似公式计算:Sm-1 中位数所在组以前各组的累计次数(向上累计);Sm+1 中位数所在组以后各组的累计次数(向下累计)。第43页,共50页。组距数列的中位数(计算公式几何证明)某班统计学学习成绩成绩(Xi)人数(Fi)向上累积频数向下累计频数60以下60707080809090100371093310202932322922123【例3.18】某班统计学成绩如下表,计算中位数中位数组为7080分第44页,共50页。组距数列的中位数(计算公式几何证明)第45页,共50页。组距数列的中位数(算例)某车间50名工人日加工零件数分组表按零件数分组频数(人)向上累积频数向下累计频数10511011011511512

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论