




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计学原理第四章平均指标与变异指标第一节平均指标的概念和作用一、平均指标的概念同类社会经济现象在一定时间、地点条件下所达到的一般水平的综合指标。概括地描述统计分布的一般水平或集中趋势的数值。特点:代表性、抽象性平均指标=总体标志总量/总体单位数二、平均指标的作用(一)可以了解总体次数分布的集中趋势(二)可以对若干同类现象在不同单位、地区间进行比较研究(三)可以研究某一总体某种数值的平均水平在时间上的变化,说明总体的发展过程和趋势(四)可以分析现象之间的依存关系(五)平均指标可作为某些科学预测、决策和某些推算的依据众数中位数平均数位置平均数数值平均数
算术平均数调和平均数几何平均数第二节平均指标公式中,1、简单算术平均数
适用于未分组资料,用总体各单位标志值加总得到标志总量除以总体单位总量而得。计算公式为:代表算术平均数。
表示各单位标志值。表示总体单位数。一、算术平均数(mean)应用:资料未分组,各组出现的次数都是1。5名学生的学习成绩分别为:75、91、64、53、82。则平均成绩为:一、算术平均数(mean)按家庭人口数分组(人)家庭数1234550150300200100合计800某村800个家庭人口数根据以下资料计算某村平均家庭人口数?2、加权算术平均数
(Weightedmean)
①根据单项数列计算加权算术平均数计算公式:应用条件:单项式分组,各组次数不同。例:某车间20名工人加工某种零件资料:
按日产量分组(件)x工人数(人)f日产总量xf
14
2
28
15
4
60
16
8
128
17
5
85
18
1
18合计
20
319求平均日产量②根据组距数列计算加权算术平均数应用条件:组距式分组,各组次数不同。按日产量分组(公斤)工人数f组中值x日产总量xf20—30
10
25
25030—40
70
35
245040—50
90
45
415050—60
30
55
1650合计
200
—
8400例:某车间200名工人日产量资料:求平均日产量权数对均值的影响
甲乙两组各有10名学生,他们的考试成绩及其分布数据如下
甲组:
考试成绩(x): 020100
人数分布(f):118
乙组:考试成绩(x): 020100
人数分布(f):811在组距数列中,均值大小不仅受组中值大小的影响,也受权数的影响,因此()A.当组中值较大且权数较大时,均值接近组中值大的一方B.当组中值较小且权数较小时,均值接近组中值小的一方C.当组中值较大而权数较小时,均值接近组中值大的一方D.当组中值较小而权数较大时,均值接近组中值小的一方E.当各组的权数相同时,权数对均值的大小没有影响
3、是非标志的平均数
是非标志:当总体单位某种品质标志的具体表现为“是”与“非”或“有”与“无”两种情况。
是非标志x单位数f比重
1
0
合计
N
1
平均数的计算:把具有某种特征的用“1”表示,不具有该种特征的用“0”表示。例:某工厂生产某种产品合格率为95%,不合格率为5%,求是非标志平均数。3、算术平均数的数学性质(1)算术平均数与标志值个数的乘积等于各标志值的总和。简单算术平均数:加权算术平均数:(2)各个标志值与其算术平均数的离差之和等于零。简单算术平均数:加权算术平均数:(3)各标志值与算术平均数离差的平方和为最小值。4、算术平均数特点
1)集中趋势的最常用测度值2)一组数据的均衡点所在3)易受极端值的影响4)用于数值型数据,不能用于定类数据和定序数据二、调和平均数例:一个人步行两里,走第一里时速度为每小时10里,走第二里时为每小时20里,则平均速度为?二、调和平均数1.简单调和平均数:标志值的倒数的算术平均数的倒数。 菜场上有1元钱起售的蔬菜,若某人早上用1元钱购买了一种蔬菜共3斤,每斤0.33元;中午降价时又用1元钱买了4斤,每斤0.25元;晚上削价处理又用1元钱买了5斤,每斤0.2元。试问蔬菜平均每斤多少钱?速度
x行走里程
m所需时间
20
1
15
2
10
3
合计
6
2.加权调和平均数缺少总体单位数计算公式:例班组平均劳动生产率x实际工时产品产量(件)m一
10
100
1000二
12
200
2400三
15
300
4500四
20
300
6000五
30
200
6000合计
—1100
19900车间投入量产出量合格率
%x一
1000
800
80二
800
720
90三
720
504
70例:某企业生产某种产品需经过三个连续作业车间才能完成。三、几何平均数(geometricmean)
1、简单几何平均数2、加权几何平均数应用条件:资料未分组(各变量值次数都是1)。计算公式:应用条件:资料经过分组,各组次数不同。计算公式:年份累计存款额本利率%第1年105%第2年105%第3年108%………第10年112%例:将一笔钱存入银行,存期10年,以复利计息,10年的利率分配是第1年至第2年为5%、第3年至5年为8%、第6年至第8年为10%、第9年至第10年12%,计算平均年利率?设本金为本利率x年数f
105%
2
108%
3
110%
3
112%
2合计
10平均年利率=8.77%三种平均数之间的关系H≤G≤X四、众数(mode)1.定义:众数是指社会现象总体中最普遍出现的标志值。1)一组数据中出现次数最多的变量值2)适合于数据量较多时使用3)不受极端值的影响4)一组数据可能没有众数或有几个众数众数(不惟一性)无众数
原始数据:10591268一个众数
原始数据:65
9855多于一个众数
原始数据:252828
3642422.众数的确定1)单项式分配数列:出现次数最多的标志值2)组距式分配数列:由组距数列确定众数,先确定众数组,再通过一定的公式计算众数的近似值。4、单项式数列
不同品牌饮料的频数分布
饮料品牌频数比例百分比(%)
可口可乐旭日升冰茶百事可乐汇源果汁露露15119690.300.220.180.120.183022181218合计501100解:这里的变量为“饮料品牌”,这是个分类变量,不同类型的饮料就是变量值所调查的50人中,购买可口可乐的人数最多,为15人,占总被调查人数的30%,因此众数为“可口可乐”这一品牌,即
Mo=可口可乐按日产量分组(件)工人数(人)20152130222023104)组距式数列确定众数的公式下限公式:
上限公式:
例:年人均纯收入(千元)农户数(户)5以下2405—64806—711007—87008—93209以上160合计3000农户年人均收入众数计算表判断法则1、当众数相邻的两组次数相等时,则众数组的组中值就是众数;2、当众数组前一组的次数较多,后一组的次数较少时,则众数在众数组内靠近他的下限;3、当众数组后一组次数较多,前一组的次数较少时,则众数在众数组内靠近他的上限。五、中位数(median)
1、中位数的含义:将总体各单位按其标志值大小顺序排列起来居于中间位置的那个数。2、确定中位数的方法(1)由未分组资料确定中位数排序找中间位置中位数?
【例】
9个家庭的人均月收入数据原始数据:
15007507801080850960200012501630排序:
75078085096010801250150016302000位置:1234
56789中位数1080中位数?【例】:10个家庭的人均月收入数据排序:
660
75078085096010801250150016302000位置:
1234
56789101、未分组资料确定中位数的方法:将总体各单位的标志值按照大小顺序排列当总体单位数n为奇数时:当总体单位数n为偶数时:(2)分组数列确定中位数
——
累计频数到50%所对应的变量值例:按日产量分组(件)x工人数(人)f累计次数向上累计向下累计20101080221525702430555526258025合计80——定序数据的中位数解:中位数的位置为
300/2=150
从累计频数看,中位数在“一般”这一组别中中位数为
Me=一般甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数
非常不满意不满意
一般
满意非常满意
2410893
4530
24132225270300合计300—(3)由组距数列确定中位数计算公式例年人均纯收入(千元)农户数(户)向上累计次数5以下2402405—64807206—7110018207—870025208—932028409以上1603000合计3000—(1)计算累计次数(2)确定中位数组(3)根据中位数计算公式计算中位数中位数位次:2、单项式分组资料确定中位数当为奇数时:,当为偶数时,3、组距式分组资料确定中位数下限公式: 上限公式:六、众数、中位数和平均数的比较
1、区别:1)
三者的含义不相同;2)
三者的计算(确定)方法不同;3)对数据的“灵敏度”和“概括能力”不同。2、联系:(1)
三者都是作为反映总体一般水平(或集中趋势)的平均指标:(2)
三者之间存在着一定的数量关系,A.在对称的正态分布条件下:算术平均数等于众数等于中位数:B.在非对称正态分布的情况下,众数、中位数和平均数三者的差别取决于偏斜的程度,偏斜的程度越大,它们之间的差别越大。
3众数、中位数、和算术平均数和的关系对称分布左偏分布右偏分布众数、中位数和算术平均数数量关系的经验公式为:算术平均数和众数的距离约等于算术平均数与中位数距离的三倍:七、其他分位数1、四分位数(quartile)
1)能够将总体单位按标志值大小等分为四部分的三个数值。(排序)2)不受极端值的影响3)主要用于顺序数据,也可用于数值型数据,但不能用于分类数据QLQMQU25%25%25%25%
(例题分析)解:QL位置=(300+1)/4=75.25QU位置=3×(300+1)/4=225.75
从累计频数看,QL在“不满意”这一组别中;QU在“一般”这一组别中四分位数为
QL
=不满意
QU
=一般甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数
非常不满意
不满意一般
满意非常满意
2410894
4430
24132226270300合计300—数值型数据的四分位数【例】:10个家庭的人均月收入数据排序:
660
75078085096010801250150016302000位置:1234
5678910数据类型与集中趋势测度值数据类型和所适用的集中趋势测度值数据类型定类数据定序数据定距数据定比数据适用的测度值※众数※中位数※均值※均值—四分位数众数调和平均数—众数中位数几何平均数——四分位数中位数———四分位数———众数第二节分布的离中趋势一、变异指标的含义与作用1.定义:变异指标以平均数为中心,总体各单位标志值的差异大小范围或离差程度的指标。变异指标值越大,表明总体各单位标志的变异程度越大。2.作用:(1)衡量平均指标的代表性。(2)研究总体标志值分布偏离正态的情况。(3)进行抽样推断等统计分析的一个基本指标。
二、极差(全距)(range)1、一组数据的最大值与最小值之差2、易受极端值影响3、未考虑数据的分布7891078910
R
=max(xi)-min(xi)4、计算公式为例:5名学生的成绩为50、69、76、88、97。分位差
1)剔除了部分极端值计算的类似于极差的指标。
2)内四分位间距:QR=Q3-Q13)四分位差:QD=(Q3-Q1)/2三、平均差标志值与其算术平均数离差平均值。实质:以算术平均数为中心,各标志值距平均数的平均距离。第一组第二组XX-|X-|XX-|X-|20-404050-101025-353551-9930-303052-8835-252553-7750-101056-44701010600075151562228525257111119030307212121206060731313合计280合计76四、方差与标准差(varianceandstandarddeviation)方差:各变量值与其均值离差平方的平均数。(一)数量标志的方差与标准差标准差:方差的平方根,也称均方差。1、数量标志的方差与标准差计算,其计算公式为:资料未分组:资料已分组:例:求产量的标准差日产量(件)209221230241269合计20练习:日产量(公斤)工人数f组中值x20—301025288030—407035343040—50904581050—6030555070合计200—12190趣味问题故事情节有六评委对表演者A,B进行评分。以平均成绩多少作为取胜标准。六个评委依次对表演者的评分如右。评委1~5都一致认为表演者A更优秀,结果取胜的是B!!!评委表演者A表演者B171682888539591476735575567090
(1)变量的方差等于变量平方的平均数减去变量平均数的平方。2、方差与标准差的数学性质即:
(2)变量对算术平均数的方差小于对任何常数的方差。
(3)变量线性变换的方差等于变量的方差乘以变量系数的平方。(二)是非标志的方差与标准差是非标志的平均数为P。标志值x单位数f10合计N由于标准差有良好的数学性质,它的应用最为广泛。例:某工厂生产某种产品合格率为95%,不合格率为5%,求是非标志的方差及标准差。方差与标准差系数如果每月工资500元或1000元,你会感觉差距如何?如果每月工资10000元或10500元,你又感觉差距如何?五、变异系数
(coefficientofvariation)1.标准差与其相应的均值之比2.对数据相对离散程度的测度3.消除了数据水平高低和计量单位的影响4.用于对不同组别数据离散程度的比较5.计算公式为变异系数某管理局所属8家企业的产品销售数据企业编号产品销售额(万元)x1销售利润(万元)x21234567817022039043048065095010008.112.518.022.026.540.064.069.0【例】某管理局抽查了所属的8家企业,其产品销售数据如表。试比较产品销售额与销售利润的离散程度变异系数结论:计算结果表明,v1<v2,说明产品销售额的离散程度小于销售利润的离散程度v1=536.25309.19=0.577v2=32.521523.09=0.710东方制造公司和西京自来水公司股票的报酬率及其概率分布情况详见下表,试计算两家公司的风险性大小。东方制造公司和西京自来水公司股票报酬率的概率分布经济情况该种经济情况发生的概率(pi)报酬率(Ki)西京自来水公司东方制造公司繁荣0.2040%70%一般0.6020%20%衰退0.200%-30%比较两个公司职工的平均工资水平哪个更均衡。月工资额(元)甲公司人数乙公司人数1000以下1000~15001500~20002000以上10201555102510合计5050练习:1、原点矩:是K阶动差的一般形式,公式为:一、原点矩和中心矩
一阶E(X)=
二阶E(X2)=第四节偏度和峰度
2、中心矩:如果把原点移动到算术平均数的位置,就可以得到一个以频数分配各组标志值对平均数的K阶中心动差,即称中心矩。
二、偏度(一)概念变量数列偏斜程度的指标,分布不对称的方向和程度偏态系数=0为对称分布偏态系数>0为右偏分布偏态系数<0为左偏分布(二)计算公式左偏分布右偏分布偏态分布的形状三、峰度(一)概念要点
1、变量数列顶部扁平程度的测度
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年数字文化产业商业模式创新与数字博物馆数字化展览内容策划策略报告
- 2025年沉浸式文化旅游演艺项目策划与运营策略报告
- 夏季小儿腹泻护理课件
- 2025商铺租赁合同模板2
- 小学数学教学设计培训
- 疾病成本法与人力资本法应用分析
- 新生儿溶血症护理方法
- 肾性骨病治疗和护理
- 开放的珠江三角洲26753799
- 云南省陆良县八中2024-2025学年生物高二第二学期期末综合测试试题含解析
- 安徽省天一大联考2025年高三最后一卷化学试题及答案
- 2025届上海市普通中学三校联考生物高二下期末达标测试试题含解析
- 尊重学术道德遵守学术规范学习通超星期末考试答案章节答案2024年
- 2024年江苏武进经济发展集团招聘笔试参考题库含答案解析
- 300t汽车吊起重性能表
- 《实验室安全教育》课程教学大纲(本科)
- 部编版六年级下册语文作业本参考答案
- 牙髓炎护理查房【版直接用】课件
- 刺激性药物外渗后处理(3)
- 铁塔CRM系统立项操作流程
- 鄂尔多斯婚礼课程
评论
0/150
提交评论