版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、12022-6-24第第1 1章的简要回顾章的简要回顾p统计学分类和基本术语l描述统计和推断统计l总体、样本、参数、统计量p数据的度量和收集l定类、定序、定距、定比l数据的不同收集方法22022-6-24在获得原始数据资料之后,需要使用一定的方法对数据进行整理和综合,目的是从大量的原始数据资料中提炼所需要的信息,使之可以提供概要信息并能反映对象总体的基本数量特征,便于人们的理解和使用。表格和图形是整理和反映统计资料的主要工具2.1 分类数据的图表2.2 数值数据的整理2.3 数值数据的图表2.4 交叉表2.5 图表汇总和制作原则第第2 2章章 统计表和统计图统计表和统计图32022-6-24数
2、据类型及图示数据类型及图示数据类型与显示数据类型与显示数值型数据数值型数据分类数据分类数据分组数据分组数据汇总表汇总表茎茎叶叶图图条条形形图图圆圆形形图图环环形形图图直直方方图图箱箱线线图图折折线线图图原始数据原始数据时序数据时序数据线线图图雷雷达达图图多元数据多元数据交交叉叉表表帕帕累累托托图图频数分布表频数分布表42022-6-242.1 2.1 分类数据的图表分类数据的图表汇总表汇总表 汇总表列出了一系列分类数据的频率、总数或百分比,可以看出不同类数据间的区别 1000美元用途的汇总表52022-6-24条形图条形图在条形图中,每个条代表一个分类,其长度表示该分类的总数、频率或百分比 2
3、.1 2.1 分类数据的图表分类数据的图表62022-6-24圆形图圆形图用来表示总体各部分在总体中所占的结构比率。已婚孤寡或离婚单身已婚孤寡或离婚单身某企业员工的婚姻状况72022-6-24定序数据的图示定序数据的图示环形图环形图(由(由 Excel Excel 绘制的环形图)绘制的环形图)8%36%31%15%7%33%26%21%13%10% 非常不满意 不满意 一般 满意 非常满意 甲乙两城市家庭对住房状况的评价甲乙两城市家庭对住房状况的评价82022-6-24帕累托图帕累托图在帕累托图中,不同类别的数据根据其频率降序排列的,并在同一张图中画出累积百分比图。帕累托图可以体现帕累托原则:
4、数据的绝大部分存在于很少类别中,极少剩下的数据分散在大部分类别中。这两组经常被称为“至关重要的极少数”和“微不足道的大多数”。帕累托图能区分“微不足道的大多数”和“至关重要的极少数”,从而方便人们关注于重要的类别。帕累托图是进行优化和改进的有效工具,尤其应用在质量检测方面。 92022-6-24帕累托图(续)帕累托图(续) 表是一家大型注模公司的数据,该公司制造计算机键盘、洗衣机、汽车和电视机的塑料器件。表中数据是三个月中所有有缺陷计算机键盘的数据。 原因频数百分数频数黑点4136.53破损1,03916.43喷射2584.08顶白83413.19划痕4426.99缺料2754.35银条413
5、6.53缩水3715.87喷雾痕2924.62扭曲变形1,98731.42汇总6,324100.01*102022-6-24帕累托图(续)帕累托图(续)有序汇总表原因频率百分比累积百分比扭曲变形1,98731.4231.42破损1,03916.4347.85顶白83413.1961.04划痕4426.9968.03黑点4136.5374.56银条4136.5381.09缩水3715.8786.96喷雾痕2924.6291.58缺料2754.3595.93喷射2584.08100总计6,324100.01112022-6-24帕累托图(续)帕累托图(续)帕累托图122022-6-24帕累托图(续
6、)帕累托图(续)帕累托图的制作帕累托图的制作数据为例介绍帕累托图的制作方法,如所示。(1)在B2:C11中输入原始数据;(2)根据“频数”有高到低排序(如列F所示),同时计算累积百分比(如列H所示)(3)按住“Ctrl”健,选中如图2.7中所示的列E,列G和列H,然后点击“图表向导”,在弹出的对话框中点“自定义类型”,然后选择“两轴线-柱图”图表类型,根据向导就能生成如图2.7所示的帕累托图。132022-6-242.2 2.2 数值数据的整理数值数据的整理排序排序没有排序的数据很难看出数据的整体范围。排序是把数据从小到大(或从大到小)进行排列茎叶图用于显示未分组的原始数据的分布由“茎”和“叶
7、”两部分构成,其图形是由数字组成的以该组数据的高位数值作树茎,低位数字作树叶b茎叶图类似于横置的直方图,但又有区别l直方图可大体上看出一组数据的分布状况,但没有给出具体的数值l茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息 142022-6-24 (实例)(实例)117 122 124 129 139 107 117 130 117 122 124 129 139 107 117 130 122 125 108 131 125 117 122 133 126 122 125 108 131 125 117 122 133 126 122 118 108 110 11
8、8 123 126 133 134 122 118 108 110 118 123 126 133 134 127 123 118 112 112 134 127 123 119 127 123 118 112 112 134 127 123 119 113 120 123 127 135 137 114 120 128 113 120 123 127 135 137 114 120 128 124 115 139 128 124 121124 115 139 128 124 121【例例2.3】某生产车间50名工人日加工零件数如下(单位:个)。试采用单变量值对数据进行分组。 152022-6
9、-24未分组数据未分组数据茎叶图茎叶图(茎叶图的制作)(茎叶图的制作)162022-6-24未分组数据未分组数据箱线图箱线图(箱线图的制作)(箱线图的制作)l用于显示未分组的原始数据或分组数据的分布l箱线图由一组数据的5个特征值绘制而成,它由一个箱子和两条线段组成其绘制方法是:首先找出一组数据的5个特征值,即最大值最大值、最最小值小值、中位数中位数M Me e 和两个四分位数四分位数(下四分位数Q QL L和上四分位数Q QU U)连接两个四分(位)数画出箱子,再将两个极值点与箱子相连接 172022-6-24未分组数据未分组数据单批数据箱线图单批数据箱线图 (箱线图的构成)(箱线图的构成)1
10、82022-6-24未分组数据未分组数据单批数据箱线图单批数据箱线图 (实例)(实例)192022-6-24分布的形状与箱线图分布的形状与箱线图202022-6-241.1.频数分布表频数分布表例:例:2002年1月比特啤酒公司 60个销售点的啤酒销售量 (单位:桶)487152533641695847605329417281374358684273625944515347665952344973294716395843294652384680585167545758634940546158664750 2.2 数值数据的整理数值数据的整理212022-6-24比特公司啤酒销售量的分组统计比特
11、公司啤酒销售量的分组统计销售量(桶)销售点数量(频数)频率(%)101911.7202935.0303958.340491626.750592033.36069915.0707946.7808923.3合计60100 分组统计整理后,将杂乱无章的60个原始数据压缩到8组,清晰地反映了更多的有用信息。 222022-6-24 比特公司啤酒销售量的分布特征比特公司啤酒销售量的分布特征比特公司啤酒销售量的频数分布 232022-6-24统计各组中的单位数(频数),并按一定顺序排列 频数分布表可以反映总体的分布特征,是最有用的整理统计资料的方法频数分布表的构成要素分组形成的组别组别;各组中的总体单位数
12、(频数频数);各组频数与总频数之比(频率频率)。 1.1.频数分布表(续)频数分布表(续)242022-6-24统计分组的类型统计分组的类型按品质(分类)标志分组按品质(分类)标志分组目的在于揭示总体内部的性质和结构特点按数量(数值)标志分组按数量(数值)标志分组按某一数量标志的不同取值范围将总体划分为若干组。目的在于揭示总体内部的数量差异及其数量分布特征。 252022-6-24品质(分类)数列频数分布表品质(分类)数列频数分布表 按品质标志分组的频数分布表例:例:某企业职工人数统计表性别(分组)人数(频数)比率(%)(频率)男52656.08女41243.92合计938100 262022
13、-6-24数量(数值)数列频数分布表数量(数值)数列频数分布表 按数量标志分组的频数分布表 1.1.单项数列单项数列 以每一变量值为一组,适用于取值不多的离散型变量。例例:某企业职工家庭人口分组统计表家庭人口(分组) 职工户数(频数) 比率(频率%) 1 7 2.7 2 38 14.9 3 105 41.2 4 54 21.2 5 31 12.2 5 人以上 20 7.8 合 计 255 100 272022-6-24 2. 2. 组距数列组距数列每组包含某一区间内的变量值适用于连续型变量和取值很多的离散型变量,组距数列是最重要的频数分布表 例:某企业职工工资的分组统计例:某企业职工工资的分组
14、统计月 工资 (分 组)人 数 (频数 )比 率 (频率 %)1000 以 下15014.51000 150018517.91500 200025624.72000 300026225.33000 350012011.63500 4000545.24000 以 上80.8合 计1035100 数量(数值)数列频数分布表(续)数量(数值)数列频数分布表(续)282022-6-24组距数列的编制组距数列的编制在编制组距数列时,需要解决如何分组、分组数量、组距、组限等问题组距数列中的几个基本概念组距数列中的几个基本概念重叠组限重叠组限相邻组的上下限重合。适用于连续型变量。但各组上、下限中有一个不包含
15、再内。通常按“上限不在内”处理,即组区间是 a, b)的形式。注意:注意:Excel在制作频数分布表时采用的是“上限在内”的规则。不重叠组限不重叠组限相邻组的上下限不重合。适用于离散型变量 292022-6-24例:离散型变量的分组(不重叠组限)例:离散型变量的分组(不重叠组限)销售量(桶)销售点数量(频数)相对频数(%)101911.7202935.0303958.340491626.750592033.36069915.0707946.7808923.3合计60100比特公司啤酒销售量的分组统计 302022-6-24 某车间某车间5050名工人日加工零件数分组表名工人日加工零件数分组表按
16、零件数分组按零件数分组频数(人)频数(人)频率(频率(% %)105105 109109110110 114114115115 119119120120 124124125125 129129130130 134134135135 1391393 35 58 8141410106 64 46 6101016162828202012128 8合计合计5050100100312022-6-24例:连续型变量的分组例:连续型变量的分组( (上限不在内上限不在内) )月工资(分组)人数(频数)比率(频率%)1000 以下15014.51000150018517.91500200025624.72000
17、300026225.33000350012011.635004000545.24000 及以上80.8合 计1035100某企业职工工资的分组统计某企业职工工资的分组统计 322022-6-24组距数列的编制(续)组距数列的编制(续)分组分组等距分组等距分组适用于数据基本呈单峰对称分布,或数据分布比较均匀的情况异距分组异距分组适用于数据的分布状态极度偏斜的情况,实际应用中采用哪种分组方法应根据数据的分布特点和统计分析的需要决定 雇工人数雇工人数企业数企业数百分比百分比1194537.5%20993125.8%1001992319.2%2004991512.5%500 及以上65.0%合计120
18、100%332022-6-24有些现象中各类型的数值差异很大,其标志值呈几何级数变化,则组距就应按几何级数确定例例:某市零售商店年营业额分组统计某市零售商店年营业额分组统计年营业额(万元)商店数百分比(%)10 以下205674.041010051518.5510010001465.26100010000481.7310000 以上120.43合计2777100% 组距数列的编制(续)组距数列的编制(续)分组分组342022-6-24组距数列的编制(续)组距数列的编制(续)分组分组分组的数量和组距应根据对象的特点和分析的需要决定。l分组的数量通常应在 515 之间分组过多则难以反映总体的数量分
19、布特征;分组过少则会丢失许多重要的统计信息l组距:通常由组数和极差联合确定组的数目极差组距 352022-6-24实际应用中分组的数量和组距应根据对象的特点和分析的需要决定。如果分组是为了揭示数据的分布规律,则分组不能过多和过少。通常应在515 之间。在绘制直方图时可以参照下表:即参照以下经验公式: 分组数 = 1+3.322 lg n 样本容量 n 参考分组数 2050 56 51100 78 101200 89 201500 910 5011000 1011 1000以上 1120分组的数量分组的数量362022-6-24使用使用 Excel 制作频数分布表制作频数分布表利用 Excel
20、的 FREQUENCY 函数语法规则:格式:格式:FREQUENCY(,) 接收区间各组上限值组成的一列区域功能:功能:返回各组的频数。使用【工具】“数据分析”“直方图”功能 372022-6-24统计图可以形象、直观、生动、简洁地显示数据的特征。常用的统计图有以下几种:2.1.2.1.折线图折线图 通常用来描述时间序列数据,用以表示某些指标随时间的变化趋势。制作折线图时应正确选择坐标轴轴的刻度。对同样的统计资料,延伸或压缩某一坐标轴可能传达不同的甚至是误导的印象。 2 2 统计图统计图382022-6-24 失业人数统计图过分压缩了过分压缩了Y Y轴轴392022-6-24失业人数统计图过分
21、压缩了过分压缩了X X轴轴402022-6-24折线图(续)折线图(续)折线图也可用来表示离散型数据的累积频数分布折线图也可用来表示离散型数据的累积频数分布和累积概率分布和累积概率分布 00.20.40.60.81012345678910累积概率 y (年) x n = 10,p = 0.3的二项分布累积概率折线图412022-6-242.2 2.2 面积图面积图面积图可以直观地表示时间序列各组成部分的变化情况年 份199719981999200020012002民用产品380396432420460480能源400400360440520608工业原料780726770430400450信息
22、产业440680840130014001670 0%10%20%30%40%50%60%70%80%90%100%199719981999200020012002百百分分比比信信 息息 产产 业业工工 业业 原原 料料能能 源源民民 用用 产产 品品100 90 80 70 60 50 40 30 20 10 0 百分比(%) 1997 1998 2000 2001 1999 2002 (年) 某地区各产业增加值的变化情况422022-6-242.3 2.3 柱形图、条形图和直方图柱形图、条形图和直方图柱形图、条形图和直方图是使用的最为广泛的统计图表。通常将横向绘制的柱形图称为条形图,而将各柱
23、形之间没有间隔的称为直方图,但在Office中将直方图和柱形图统称为柱形图。(1)(1)柱形图柱形图主要用于表示时间序列数据 各类进口商品的变化情况432022-6-24(2)(2)直方图直方图比特公司啤酒销售量的频数分布用以表示数据的频数分布规律442022-6-242.7 2.7 频数多边形频数多边形频数多边形是直方图的另一种表现形式,是由直方图顶端中点(各组的组中值)连线而成,其中两边都要连接到横轴上的某点,以便通过覆盖的面积反映总频数。当希望在一个图上比较两种频数分布的特征时,就需要使用频数多边形 某学院男、女学生体重的频数分布情况体重/kg4545555565657575858595
24、女学生1350422552男学生02868926020 02040608010035455565758595105体重频数女女学学生生男男学学生生体重/kg 频数 452022-6-242.8 2.8 曲线图曲线图用于描述连续型变量的分布特征 Office 中曲线图的绘制中曲线图的绘制方法一:使用“平滑线散点图”绘制方法二:将折线图转换为曲线图右击折线后选择“数据系列格式”,在“图案”标签下选“平滑线”复选框,就将折线图转换为曲线图。 462022-6-24 经济管理中几种常见的频数分布曲线经济管理中几种常见的频数分布曲线 正态分布曲线正态分布曲线这是客观事物数量特征上表现得最为普遍的一类频数
25、分布曲线。如人的身高、体重、智商,钢的含碳量、抗拉强度,某种农作物的产量等等。Source: wikipedia472022-6-24 偏态曲线偏态曲线右偏(正偏)左偏(负偏) 例如收入和财富的频数分配曲线就是右偏的,大量财富都集中在极少数富豪手中,而多数人则是低收入者。 此外,在产品质量管理中也普遍存在这种现象,如多数次品都集中出在少数工人手中;次品也大都出在少数几道工序上。这就要求在管理和控制上需要突出重点、抓住关键因素。 按其长尾拖向哪一方又可分为右偏(正偏)和左偏(负偏)两类。482022-6-24 J J 形曲线形曲线其典型的应用分别是经济学中的供给曲线和需求曲线。供给曲线(正 J
26、形)表现为随着价格的增加,供给量以更快的速度增加;需求曲线(倒 J 形)表现为随着价格的增加,需求量以更快的速度减少。供给和需求曲线的交点即供求平衡点。 正 J 形倒 J 形492022-6-24 U U形曲线形曲线人和动物的死亡率、设备的故障率等通常都服从于 U 形曲线分布。 U形曲线 又称生命曲线或浴盆曲线502022-6-242.9 2.9 对数图对数图l人们经常对时间序列变量的相对变化率而不是绝对数值的变化感兴趣,如各种经济变量的环环比发展速度比发展速度。此时若要用统计图直观反映增长率等现象的变动趋势,就需要使用对数图l对数图是以时间为横轴,以10为底的对数比率刻度为纵轴的折线图。可以
27、通过对数图中各线段的斜率比较各时期增长率的大小考虑以下统计数据:512022-6-24对数图可以直观反映时间序列的环比变化趋势对数图可以直观反映时间序列的环比变化趋势可以在Office图表类型中选择自定义类型中的“对数图”,也可通过将一般折线图纵轴“坐标轴格式” 中的“刻度”设为“对数刻度”来绘制对数图522022-6-24例:某公司总成本和劳动成本的增长例:某公司总成本和劳动成本的增长该公司总成本和劳动成本每年增加相同的数量,因而用绝对数据作图时两条线是平行的,不小心可能会得出劳动成本占总成本固定比例的误解。实际上第1年占40%,第6年占60%。使用对数图就可以清晰反映劳动成本有更高的增长率
28、。532022-6-24对数图反映了劳动成本增长率大于总成本增长率例:某公司总成本和劳动成本的增长例:某公司总成本和劳动成本的增长542022-6-242.10 2.10 交叉表交叉表(1)列联表列联表表示两类变量的结果。横轴表示一类变量,纵轴表示另一类变量。值位于横纵轴的交叉处,称为单元。根据列联表结构类型,每横纵轴组合单元包含频率,总值的百分比,横行的百分比,或列的百分比。 基金目标与风险列联表为了深入研究风险和目标间的任何可能关系,可以基于百分比制作列联表。先基于以下三条转换结果为百分比:(1 1)数据总值)数据总值;(2 2)横行总值)横行总值;(3 3)纵行总值)纵行总值。表2.17
29、,2.18和2.19分别汇总了这些百分比。 表2.17显示41.29%的共同基金是高风险,其中增长基金57.28%,39.62%的增长基金是高风险基金。表2.18显示69.17%的增长基金是高风险,3.33%是低风险。表2.19显示95.95%的高风险基金是增长基金,仅6.48%的低风险基金是增长基金。表格揭示增长基金是风险基金的可能性更大,而价值基金则更有可能是低风险基金。 562022-6-242.10 2.10 交叉表交叉表( (续续) )(2)并行条形图 572022-6-24 设有n组样本S1,S2,Sn,每个样本测得P个变量X1,X2,Xp,要绘制这P个变量的雷达图,其具体做法是多变量数据多变量数据雷达图雷达图(雷达图的制作)(雷达图的制作)582022-6-24多变量数据多变量数据雷达图雷达图 (实例)(实例)表表2-12 19972-12 1997年城乡居民家庭平均每人生活消费支出年城乡居民家庭平均每人生活消费支出项项 目目城镇居民城镇居民农村居民农村居民 食品食品 衣着衣着 家庭设备用品及服务家庭设备用品及服务 医疗保健医疗保健 交通通讯交通通讯 娱乐教育文化服务娱乐教育文化服务 居住居住 杂项商品与服务
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【正版授权】 ISO/TS 7815-1:2025 EN Intelligent transport systems - Telematics applications for regulated commercial freight vehicles (TARV) using ITS stations - Part 1: Secure vehicle in
- 精馏塔苯甲苯课程设计
- 统计信源熵课程设计
- 移动通信秒表课程设计
- 泵与泵站课程设计概要
- 2024招聘考试高频考点题库试题含答案
- 线描狗狗创意课程设计
- 山地自行车行业销售工作总结
- 自然教育课程设计大赛
- 学校班主任的食品安全教育策略计划
- 胁痛中医临床路径
- 16种(卡特尔)人格测评试题及答案
- 蛋鸡养殖场管理制度管理办法
- 螺内酯在肾脏病中的应用演示教学
- 市政工程计量与计价讲义
- 建筑工程设计过程控制流程图
- 小孩出生后视力发展过程
- X62W万能铣床
- 供应商年度审核计划及现场审核表
- 环甲膜穿刺ppt课件
- 装配基础知识要点
评论
0/150
提交评论