




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2023/2/41同济大学经济与管理学院
柯华应用统计学2023/2/42本章教学目标:度量中心(集中)趋势的指标度量离散程度(变异性)的指标度量偏斜程度的指标度量两种数值变量关系的指标掌握利用Office软件计算各种统计指标第3章统计数据的描述度量2023/2/43§3.1度量集中趋势的平均指标平均指标是说明社会经济现象一般水平
的统计指标,反映标志值分布的集中趋势
平均指标按计算方式可分为数值平均数和位置平均数两大类2023/2/44——是根据总体各单位所有标志值计算出的平均数。包括算术平均数、几何平均数。(一)算术平均数(ArithmeticMean)算术平均数的基本公式一.数值平均数
2023/2/45
(1)简单算术平均数算术平均数的计算
n—总体单位总数;xi—第i
个单位的标志值。
xi
—第i组的代表值(组中值或该组变量值);
fi—第i组的频数。(2)加权算术平均数
2023/2/46单项数列分组数列2023/2/47使用Excel函数求加权算术平均数利用Excel“数学和三角函数”中的SUMPRODUCT函数可以方便地计算出分组数据的加权算术平均数。语法规则:格式:SUMPRODUCT(<区域1>,<区域2>,…)功能:返回两个或多个区域中对应元素乘积之和。
例:利用比特啤酒公司各销售点分组频数分布数据,求各销售点的平均销售量。
2023/2/48(二)几何平均数(GeometricMean)当统计资料是各时期的发展速度等前后期的两两环比数据,要求每时期的平均发展速度时,就需要使用几何平均数。几何平均数是n个数连续乘积的n次方根。1.简单几何平均数
2.加权几何平均数fi—各比率出现的频数
2023/2/49例:某公司原料成本随时间增长的情况如下表求原料成本的平均年增长率。解一:解二:
年平均增长率=1.0688-1=6.88%
2023/2/41050%decrease100%increase算术平均数:几何平均数:2023/2/411使用Excel求几何平均数可以使用Excel统计函数中的GEOMEAN函数返回几何平均数语法规则:格式:GEOMEAN(<区域或数组1>,<区域或数组2>,…)功能:返回所有参数中数据的几何平均数。
2023/2/412位置平均数是根据总体标志值所处的特殊位置确定的一类平均指标。包括中位数和众数两种。(一)中位数(Median)——将总体各单位标志值按由小到大的顺序排列后处于中间位置的标志值称为中位数,记为Me
。中位数是一种位置平均数,不受极端数据的影响。当统计资料中含有异常的或极端的数据时,中位数比算术平均数更具有代表性。比如有5笔付款:9元,10元,10元,11元,60元付款的均值为20元,显然这并不是一个很好的代表值,而中位数
Me
=10元则更能代表平均每笔的付款数。二.位置平均数2023/2/413使用Excel的统计函数返回未分组数据的中位数可以使用Excel统计函数中的MEDIAN函数返回未分组数据的中位数。格式:MEDIAN(<区域或数组1>,<区域或数组2>,…)功能:返回所有参数中数据的中位数。
0123456789100123456789101214Median=5Median=52023/2/414分组数据中位数的确定
对于分组数据的统计资料,中位数要用插值法来估算。
(1)计算各组的累计频数;
(2)确定中位数所在的组
——是累计频数首次包含中位数位次Σf/2的组。其中:L—中位数所在组的下限;
Sm-1—中位数所在组前一组的累计频数;
fm—中位数所在组的频数;
d—中位数所在组的组距。
2023/2/415例:计算下表数据的中位数解:Σf/2=27.5,中位数在“15-25”的组中,
2023/2/416(二)众数(Mode)——是总体中出现次数最多的标志值,记为M
0。众数明确反映了数据分布的集中趋势,也是一种位置平均数,不受极端数据的影响。但并非所有数据集合都有众数,也可能存在多个众数。在某些情况下,众数是一个较好的代表值。例如在服装行业中,生产商、批发商和零售商在进行生产和存货决策时,更感兴趣的是最普遍的尺寸而不是平均尺寸。又如,当要了解大多数家庭的收入状况时,也要用到众数。
2023/2/417未分组数据众数的确定在数据量很大的时候,可以使用Excel统计函数中的MODE函数返回众数。格式:MODE(<区域或数组1>,<区域或数组2>,…)功能:返回所有参数中数据的众数。
01234567891011121314Mode=92023/2/418分组数据众数的确定对于分组数据的统计资料,众数也要用插值法来估算。(1)确定众数所在的组对于等距分组,众数组是频数最高的组;(2)使用以下插值公式计算其中:L—众数组的下限Δ1—众数组与前一组的频数之差Δ2—众数组与后一组的频数之差
d—众数组的组距Δ1Δ2众数Ld2023/2/419例:计算下表数据的众数解:众数组是“15-25”的组,则
2023/2/420三.算术平均数和位置平均数间的关系1.频数分布呈完全对称的单峰分布,算术平均数、中位数和众数三者相同0xf(Me,M0)0xfMeM00xfMeM02.频数分布为右偏态时,众数小于中位数,算术平均数大于中位数3.频数分布为左偏态时,众数大于中位数,算术平均数小于中位数2023/2/421补充习题补充题:某地区私营企业注册资金分组资料如下,求该地区私营企业注册资金的平均数、中位数和众数。2023/2/422
答案Σf/2=143/2=71.5,中位数所在“100~150”的组,众数组为“100~150”的组,2023/2/423四分位数(Quartile)(概念要点)1.
集中趋势的测度值之一2. 排序后处于25%和75%位置上的值
3.不受极端值的影响
4.可用于定序数据,也可用于数值型数据,但不能用于定类数据QLQMQU25%25%25%25%2023/2/424未分组数据四分位数的确定规则1
如果结果是整数,四分位数等于那个整数位置的数据。规则2
如果结果是半数(如2.5,3.5等),四分位数等于相邻有序数据的平均数。规则3
如果结果既不是整数又不是半数,结果取最接近的整数,并选数据。下四分位数(QL)位置=N+14上四分位数(QU)位置=3(N+1)42023/2/425数值型未分组数据的四分位数
(7个数据的算例)原始数据:
2321 3032 282526排序:2123
2526283032位置:1 23 4567QL=237+1QL位置=4=4=2QU位置=3(N+1)43(7+1)4==6QU=302023/2/426数值型未分组数据的四分位数
(6个数据的算例)原始数据:
2321 30 282526排序:212325262830位置:1 2 3 4 56QL=23QL位置=N+14=6+14=1.75QU位置=3(N+1)43(6+1)4==5.25QU=282023/2/427
Excel中四分位数的计算过程
2023/2/428原始数据:
2321 30 282526排序:212325262830位置:1 2 3 4 56QL=23+0.25*(25-23)=23.5QL位置=N-14=QU位置=3(N-1)4=4.75QU=26+0.75(28-26)=27.51+数值型未分组数据的四分位数
(6个数据的算例)2.251+2023/2/429数值型分组数据的四分位数
上四分位数:
下四分位数:
2023/2/430QL位置=50/4=12.5QU位置=3×50/4=37.5表某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105~110110~115115~120120~125125~130130~135135~140358141064381630404650合计50—数值型分组数据的四分位数
【例】根据第三章表中的数据,计算50名工人日加工零件数的四分位数2023/2/431五数汇总和箱线图Median(Q2)XmaximumXminimumQ1Q3Example:25%25%25%25%12304557702023/2/432右偏Right-Skewed左偏Left-SkewedSymmetric五数汇总和箱线图2023/2/433上次课简要回顾频数分布表及其他图表类型集中趋势的度量指标加权算术平均数中位数众数四分位数五数汇总2023/2/434x频数要分析总体的分布规律,仅了解中心趋势指标是不够的,还需要了解数据的离散程度或差异状况。几个总体可以有相同的均值,但取值情况却可以相差很大。
变异指标就是用来表示数据离散程度特征的。变异指标主要有:极差、平均差、标准差、变异系数和Z值。
§3.2度量离散程度的指标2023/2/435【案例】道格拉斯公司应如何选择供应商道森公司和克拉克公司是道格拉斯公司的两家供货商。两家供货商都表示大约需要10个工作日交付定货。下表是两家供应商定货交付时间的历史数据。今后道格拉斯公司应选择哪家供应商供货?2023/2/436一.极差(Range)极差也称全距,是一组数据的最大值和最小值之差,通常记为R。显然,一组数据的差异越大,其极差也越大。极差是最简单的变异指标,它广泛应用于产品质量管理中控制质量的差异,一旦发现超过控制范围,就采取措施加以纠正,以保证产品质量的稳定。但极差有很大的局限性,它仅考虑了两个极端的数据,没有利用其余数据的信息,因而是一种比较粗糙的变异指标。
2023/2/438D4andD3arefromTable(n=5)2023/2/440UCL=8.232024681234567DayLCL=0R=3.894_Conclusion:Variationisincontrol2023/2/441二、四分位差
1. 离散程度的测度值之一2. 也称为内距或四分间距3. 上四分位数与下四分位数之差
QD
=QU-QL4. 反映了中间50%数据的离散程度不受极端值的影响用于衡量中位数的代表性2023/2/442二、四分位差Median(Q2)XmaximumXminimumQ1Q3Example:25%25%25%25%1230455770Interquartilerange=57–30=272023/2/443三.平均差平均差是各数据与其均值离差绝对值的算术平均数,通常记为A·D。
平均差越大,反映数据间的差异越大。但由于使用了绝对值,其数学性质很差,因而很少使用。
2023/2/444四.方差(Variance)和标准差(StandardDeviation)方差和标准差是应用得最为广泛的变异指标。标准差是方差的算术平方根,也称均方差或根方差。
应注意总体方差、标准差与样本方差、标准差是有区别的。1.总体方差(PopulationVariance)和总体标准差(PopulationStandardDeviation)总体方差是各总体数据与其均值差平方的均值,记为
2,总体标准差记为。2023/2/4452.样本方差与样本标准差样本方差记为
S
2,样本标准差记为
S,在推断统计中,它们分别是总体方差和标准差的优良估计。其中:n为样本容量,Xi为样本观察值为样本均值。
2023/2/446未分组数据方差和标准差的计算方差和标准差的手工计算非常烦琐,只要求掌握以下两种方法。⑴使用计算器的统计功能(SD或STAT功能)⑵使用Excel的统计函数 ①VARP(<区域或数组1>,<区域或数组2>,…)
功能:返回所有参数中数据的总体方差。 ②STDEVP(<区域或数组1>,<区域或数组2>,…)
功能:返回所有参数中数据的总体标准差。 ③VAR(<区域或数组1>,<区域或数组2>,…)
功能:返回所有参数中数据的样本方差。 ④STDEV(<区域或数组1>,<区域或数组2>,…)
功能:返回所有参数中数据的样本标准差。
2023/2/447分组数据的方差与标准差如果得到的是分组的频数分布数据,则方差与标准差的公式如下:其中Xi
是第i
组的组中值或标志值。
2023/2/448变异系数在对上海和南京两地居民生活质量调查发现,上海居民平均月收入1800元,标准差为180元;南京居民平均月收入1200元,标准差为100元。问两地居民收入差距哪个更大?2023/2/449Z值通常,Z值小于-3.0或大于+3.0时,认为数据中含有极端值2023/2/450是非标志的平均数和标准差在对社会经济现象进行分析时,经常要将总体的所有单位按是否具有某种属性划分为两组,即“是”与“非”的两组。如将学生按性别分组,将产品按合格与否分组。又如在民意调查中,将被调查者按是否支持某位侯选人或是否赞成某项政策分为两组等等。
2023/2/451(1)比例的概念——比例是指具有某种性质或属性的单位数占总体全部单位数的比重(也称成数),记为P。N1——总体中具有某一属性的单位数;N——总体单位总数。如产品中的次品率;全部人口或某单位职工中男、女的比率;某地区全部家庭中高(如月收入≥10000元)、中、低(月收入≤1000元)收入家庭各占的比重等。
2023/2/452(2)比例的平均数要计算比例的平均数,需要将是非标志的标志表现进行量化处理。记1—代表具有某种属性的标志表现0—代表不具有该属性的标志表现N1——总体中具有该属性的单位数N0——总体中不具有该属性的单位数N——总体单位总数则由加权算术平均数的计算公式,比例的平均数为可知,比例的平均数就是其本身。
2023/2/453(3)比例的方差和标准差,由分组数据方差的计算公式:当P=0.5时,成数的标准差达到最大值,即
2023/2/454总体分布的特征不仅与均值和变异指标有关,而且与分布的偏斜程度有关,如对称分布、右偏分布
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 领导风格的马工学分析试题及答案
- 行业比较与投资比例试题及答案复习
- 鲁教版英语七上Unit 7 Im more outgoing than my sister Section B (单元整体+课时教学设计)2
- 把握趋势基金从业资格试题及答案
- 先进制造技术的应用及案例分享
- 2025至2030年中国一次性采便棒行业投资前景及策略咨询报告002
- 2025至2030年中国U型钉枪数据监测研究报告
- 2025至2030年中国PVC杯墊数据监测研究报告
- 2025至2030年中国PVC内齿套管行业发展研究报告
- 2025至2030年中国PTFE覆膜滤袋行业投资前景及策略咨询研究报告
- 甘肃省平凉市各县区乡镇行政村村庄村名明细
- 吊装安全技术交底记录
- 排水工程监理规划
- 《中华人民共和国职业分类大典》电子版
- 《艺术学概论考研》课件艺术本体论-表现论
- 离婚前规则观后感
- 行业标准:TSG T7007-2016 电梯型式试验规则
- 生产计划与物料管理PMC
- (完整)架空乘人装置(猴车)使用说明书
- 动态血糖监测新PPT课件
- 草种人工劳务补播技术实施方案
评论
0/150
提交评论