统计数据整理与显示_第1页
统计数据整理与显示_第2页
统计数据整理与显示_第3页
统计数据整理与显示_第4页
统计数据整理与显示_第5页
已阅读5页,还剩96页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计数据整理与显示2023/3/9第一页,共一百零一页,2022年,8月28日本章内容第一节统计数据整理概述第二节统计分组与频数分布数列第三节统计数据的显示第四节EXCEL在数据整理应用示例2023/3/9第二页,共一百零一页,2022年,8月28日第一节统计数据整理概述

一、统计数据整理的含义与要求二、统计数据整理的步骤三、统计数据的预处理2023/3/9第三页,共一百零一页,2022年,8月28日包括对原始数据的整理和对次级数据的整理。一、统计数据整理的含义与要求(一)统计数据整理的含义对原始数据而言,统计整理由反映总体单位特征的标志表现转化为反映总体综合特征的统计指标。对次级数据而言,整理时通过新的分组、重新计算或调整,使之满足本次调研目的需要。2023/3/9第四页,共一百零一页,2022年,8月28日统计研究过程数据搜集数据整理数据分析(二)统计数据整理的意义统计数据整理是统计研究过程的中间环节,发挥着承上启下的作用。(三)统计数据整理的要求科学性条理性充分性2023/3/9第五页,共一百零一页,2022年,8月28日二、统计数据资料整理的步骤制定统计整理方案数据显示(统计图表)数据处理(分组和汇总)数据的预处理(审核筛选)数据的保存与公布2023/3/9第六页,共一百零一页,2022年,8月28日统计整理方案是统计整理过程的工作安排。主要内容:一是确定总体资料的处理方法,如何分组,用何种形式整理;二是确定通过整理要得到哪些指标;三是确定整理资料的显示形式。讨论:要研究某市中学生参加体育活动与身体素质的关系,从全市抽取1000名中学生进行调查,取得了有关资料。你认为需要用哪些指标,才能达到研究目的?2023/3/9第七页,共一百零一页,2022年,8月28日三、统计数据的预处理在正式处理之前的前期准备工作,主要包括:数据审核数据筛选数据排序2023/3/9第八页,共一百零一页,2022年,8月28日审核内容原始数据次级数据完整性准确性完整性时效性

观察检查计算检查审核方法1、数据审核逻辑检查适用性准确性抽样复查2023/3/9第九页,共一百零一页,2022年,8月28日数据筛选就是根据需要找出符合特定条件的某类数据。2、数据筛选数据筛选形式:手工、运用计算机程序筛选内容:一是将符合特定条件的数据保留;二是剔除有明显错误的数据和不符合要求的数据。2023/3/9第十页,共一百零一页,2022年,8月28日

数据排序作用:发现数据的变化趋势,找到解决问题的线索;有助于对数据检查纠错,为分类或分组提供依据;有时可直接利用排序结果作分析。

数据排序类型:定类数据——按类排序:按字母顺序定量数据——按序排序:升序或降序数据排序是按一定顺序将数据排列。3、数据排序2023/3/9第十一页,共一百零一页,2022年,8月28日第二节统计分组与频数分布数列

一、统计分组

二、频数分布数列2023/3/9第十二页,共一百零一页,2022年,8月28日(一)统计分组的概念例如:企业按经济类型分组:国有企业

集体企业个体企业

其它企业考试按考分分组:60分以下(不及格)60~70分(及格)70~80分(中等)80~90分(良好)90~100分(优秀)一、统计分组2023/3/9第十三页,共一百零一页,2022年,8月28日

统计分组是在总体内部进行的一种定性分类,把总体划分为一个个性质不同,范围更小的总体。

统计分组有两个方面的含义,即:统计分组对总体而言即将总体区分为性质不同的若干组成部分是“合”即将性质相同的总体单位合为一组是“分”对总体单位而言2023/3/9第十四页,共一百零一页,2022年,8月28日(二)统计分组的作用

1.划分社会经济现象的类型;分类前25%33%分类后25%42%2023/3/9第十五页,共一百零一页,2022年,8月28日

2.研究总体的内部结构和比例关系;按考分分组学生人数比重%50~6060~7070~8080~9090~100合计这五个组反映了学生考试成绩的不同类型,统计各组人数后,可以计算出比重,反映出学生成绩的构成情况。2023/3/9第十六页,共一百零一页,2022年,8月28日企业按商品销售额分组(万元)企业单位数(个)流通费用率(%)

400以下400~500500~600600~800800~10001000以上

3101587213.8413.0912.6611.9411.2310.28结论:统计分组是对总体认识深化的手段,它是一切统计研究的基础,应用于统计工作的全过程,是统计研究的基本方法。

某地区45个商业企业销售额和流通费用率分组资料分析:销售额的规模和流通费用率的关系。

3.揭示社会经济现象之间的相互依存关系。2023/3/9第十七页,共一百零一页,2022年,8月28日分组标志是在统计分组时所采用的标志,是分组的标准和依据。选择分组标志的原则有:

必须根据统计研究的目的选择分组标志。

(三)统计分组的要求必须选择能够反映现象本质的分组标志。

要结合现象所处的具体历史条件选择分组标志。统计分组的关键是选择合适分组标志和正确划分各组界限。讨论:在研究企业规模的大小和企业经济效益的关系时,采用什么标志分组反映企业规模比较好?根据企业研究目的和企业的类型选择分组标志,如企业的类型可以分为劳动密集型、资本密集型和技术密集型,可以分别采用职工人数、资产总额和劳动成果等标志作为分组标志。2023/3/9第十八页,共一百零一页,2022年,8月28日(四)统计分组的种类按分组标志的性质不同分按品质标志分组按数量标志分组按分组标志的多少及排列不同分简单分组复合分组2023/3/9第十九页,共一百零一页,2022年,8月28日(1)简单分组:即对总体只按一个标志进分组。例如:企业按经济类型分组国有企业

集体企业个体企业

其它企业男生女生学生按性别分组2023/3/9第二十页,共一百零一页,2022年,8月28日(2)复合分组:即对同一总体同时按两个或两个以上标志层叠起来进行的分组。学生按年级、性别分组一年级二年级男生女生男生女生例如:2023/3/9第二十一页,共一百零一页,2022年,8月28日统计分组体系:是根据统计分组的要求,对同一总体进行多种不同分组而形成的体系,体系中的各种分组相互联系、相互补充,以加深对总体的认识。分组体系有平行分组体系和复合分组体系两种。2023/3/9第二十二页,共一百零一页,2022年,8月28日平行分组体系:对同一总体选择两个或两个以上的标志分别进行简单分组,就形成平行分组体系。工业企业平行分组体系图例:全国工业企业按轻重工业分按企业生产规模分按经济类型分轻工业重工业特大型企业大型企业中型企业小型企业国有工业企业集体工业企业其他工业企业2023/3/9第二十三页,共一百零一页,2022年,8月28日复合分组体系:对同一总体选择多个复合分组,组成的分组体系就是复合分组体系。复合分组与复合分组体系例:货运量总计铁路公路中央地方中央地方水路中央地方货运量总计铁路公路中央地方中央地方2023/3/9第二十四页,共一百零一页,2022年,8月28日(3)按品质标志分组

品质标志分组就是用反映事物的属性、性质的标志进行分组。国民经济按产业分组:第一产业第二产业第三产业人口按性别分组:男性女性

品质标志分组一般比较简单,但是有的分组标志的表现却较复杂,不易划分各组,如产品按用途分组、商品零售额按城乡分组、工业部门的细分类等,为此有关部门制定了相应的统计分类标准。用文字来表示各组性质上的差别2023/3/9第二十五页,共一百零一页,2022年,8月28日数量标志分组,即变量分组。例如,按考分分组(分)用数量来表示各组性质上的差别60以下60~7070~8080~9090~100(4)按数量标志分组

即通过数量的变化来区分各组质的差别,而不是单纯的数量差别。即要以什么样的数量作为划分标准。是单项式或是组距式?如果是组距式分组还要确定组距、组数、等距或不等距、组限等内容第一,明确分组的目的,.第二,采用适当的分组形式,注意:2023/3/9第二十六页,共一百零一页,2022年,8月28日(一)频数分布概念和种类

在统计分组的基础上列出各组的总体单位数的数列,或频数分布数列。反映了总体单位在各组的分布情况。如:频数分布:按性别分组男生女生合计按考分分组

50~6060~7070~8080~9090~100合计频数(人)

频率(%)20306040501005人数(人)

频率(%)103010151850236420100二、频数分布数列(次数分布)2023/3/9第二十七页,共一百零一页,2022年,8月28日频数分布数列的构成要素构成要素各组的名称或变量值各组频数或频率(次数或比重)频数:频率:即分布在各组的单位数。即各组单位数在总体单位数中所占的比重。2023/3/9第二十八页,共一百零一页,2022年,8月28日品质数列分布数列种类单项式变

量数列

组距式变数列

变量数列等距数列不等距数列频数分布数列的种类2023/3/9第二十九页,共一百零一页,2022年,8月28日按品质标志分组所形成的分配数列称为品质分布数列。组的名称为分类数据和定序数据的表现。按职业分组人数(人)

频率(%)运动员演员歌手导演组合41563213.350.020.010.06.7合计30100例:品质分布数列某年中国前30位名人职业频数分布表组的名称为:分类数据表现2023/3/9第三十页,共一百零一页,2022年,8月28日

(先确定分组,再汇总出各组频数,即单位数)资料:某年中国名人前30位的职业运动员演员运动员演员歌手导演演员歌手演员演员演员演员歌手演员演员运动员运动员导演演员演员演员组合组合演员歌手歌手演员演员歌手导演中国30位名人职业频数汇总表职业运动员演员歌手导演组合合计划记号频数41563230品质分布数列的编制将此表整理后即得到下一页的频数分布表2023/3/9第三十一页,共一百零一页,2022年,8月28日一般来说品质数列较容易编制,它通常能准确地反映总体的分配特征,一旦分组标志确定以后,其分布数列的形式是唯一的。说明:(1)对汇总表加以整理,去掉划记号的过程,计算出各组的频率,就得到某年中国前30位名人职业频数分布表;(2)划记号属于手工汇总方法。汇总各组单位数也可以用计算机进行汇总。(方法见本章附录部分)按职业分组人数(人)

频率(%)运动员演员歌手导演组合41563213.350.020.010.06.7合计30100某年中国前30位名人职业频数分布表2023/3/9第三十二页,共一百零一页,2022年,8月28日(二)变量数列的编制1、单项式变量数列的编制单项式变量数列(单项数列)指每个组只用一个变量值编制的次数分布数列。应用条件:变量值变动范围不大的离散型变量。某些取整数的连续型变量(如年龄),如果变量值的种数不多时,也可编制单项式数列。

2023/3/9第三十三页,共一百零一页,2022年,8月28日【例】己知某车间有24名工人,其某日的日产量(件)分别是:20,23,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23。要求:编制变量数列。分析:日产量计量单位为件,属于离散型变量,且变量值变化范围不大,只有7种,因此适合编制单项式变量数列。编制方法:先找出日产量的具体变量值,每种变量值为一组,分为7组,然后汇总出各组的人数。即得到单项数列。日产量(件)X工人数(人)f202122232425263564321合计242023/3/9第三十四页,共一百零一页,2022年,8月28日2、组距式变量数列的编制组距式变量数列指每个组的变量值用一个区间来表现所编制的次数分布数列。(组距数列)应用条件:变量为连续变量,或变量不同取值个数较多的离散变量。2023/3/9第三十五页,共一百零一页,2022年,8月28日例如:企业按人数分组

499及以下

500~9991000~29993000及以上工人按工资分组

600~700700~800800~12001200~1500(人数为离散型变量)(工资额为连续型变量)2023/3/9第三十六页,共一百零一页,2022年,8月28日

1~499500~9991000~29993000~3499

600~700700~800800~12001200~1500组限:组距分组中,每一区间两端的值为组限。每一组中的最大变量值称为上限,每组最小变量值称为下限。工人按工资分组:企业按人数分组:连续组距(重叠组限)不连续组距(不重叠组限)组距式分组中的有关概念(人数为离散型变量)(工资额为连续型变量)重叠组限在统计时遵循“上限不在内”的原则。2023/3/9第三十七页,共一百零一页,2022年,8月28日组限的划分方法不重叠组限重叠组限(只适用于离散型变量)(适用于连续型变量和离散型变量)企业按人数分组:

499及以下500~9991000~29993000及以上(不重叠组限)企业按人数分组:

500以下500~10001000~30003000及以上(重叠组限)例如:若第一组出现“×××以下”或最末组出现“×××以上”字样的组称为开口组,否则称为闭口组。2023/3/9第三十八页,共一百零一页,2022年,8月28日组数:是指在组距分组中,将全部变量值划分为多少组(分组的数目)。全距:所有变量值中的最大值与最小值之差。组距:是指每组变量值的变动范围。组距=本组上限–

前组上限(通用公式)组距=

本组上限–

本组下限(重叠式组限)组距与组数的关系:2023/3/9第三十九页,共一百零一页,2022年,8月28日组中值

组中值是指组距数列中各组上限和下限之间的中点数值。注意:组中值用来代表各组标志值的平均水平,假定一组内各个标志值呈均匀分布。考生按成绩分组

50~6060~7070~8080~9090~100

55

75

658595组中值人数51518102

2023/3/9第四十页,共一百零一页,2022年,8月28日首组组中值=首组上限–相邻组组距的一半=末组下限+相邻组组距的一半末组组中值50–10/2100+10/2例如:.首组:末组:按考分分组组中值

50~605560~706570~807580~908590~1009550以下100以上45105开口组组中值的确定2023/3/9第四十一页,共一百零一页,2022年,8月28日组距数列的编制步骤及注意问题:己知某年某连锁超市50个网点商品销售额的数据如下(单位:百万元):

7.412.629.02.012.47.014.817.515.018.218.715.512.826.017.38.314.712.03.56.825.019.36.44.011.98.513.214.517.115.613.44.59.520.015.76.011.423.014.216.721.016.013.610.013.95.05.810.516.322.0要求根据上述资料编制变量数列,反映不同销售水平的网点分布情况。【例】2023/3/9第四十二页,共一百零一页,2022年,8月28日第一,将所有变量值排序,计算全距R;第二,确定组数及组距;注意:按实际惯例,组数一般确定在10个以内。分析:销售额计量单位为百万元,属于连续型变量,且变量值变化范围较大,因此适合编制组距式变量数列。2023/3/9第四十三页,共一百零一页,2022年,8月28日也可按经验公式确定组数:美国统计学家Sturges提出的经验公式来确定。根据这一公式,可以得出如下表的组数参考标准:分组组数参考表n15~2425~4445~8990~179180~359k56789根据这两种方法,本例资料可确定为7组左右。2023/3/9第四十四页,共一百零一页,2022年,8月28日确定组数及组距的原则:一是要根据现象的性质和特点确定;二是要根据原数据的分布特征及集中趋势确定;三是要注意组数既不能太多,也不能太少,要以体现组间差异与反映总体分布特征为标准。当组数确定了,组距也随之确定。在确定时组数和组距两者要联系考虑。组距通常以5或10的整数倍为宜。

R≤组数(K)×组距(d)2023/3/9第四十五页,共一百零一页,2022年,8月28日具体要以客观反映总体分布特征为原则,当变量分布比较均匀时,可采用等距数列;当变量分布很不均匀,或者变量分布具有某种自身特殊规律时,应该采用异距数列。例如,对人口疾病或死亡率研究中的年龄分组就必须采用异距分组:1岁以下可按月分组;1~10岁按年分组;11~20岁按5年分组;21~60岁按10年分组;60岁以上按5年分组。

确定组距有两种形式,即等距数列和异距数列。2023/3/9第四十六页,共一百零一页,2022年,8月28日第三,确定组限;1、对于离散变量,相邻组组限可以间断,也可重叠;对于连续变量,相邻组组限必须重叠;2、在汇总时采用“上组限不计入”原则;3、首末两组可使用“××以下”及“××以上”的开口组。组限的表示方法结合上述各项原则要求,本数据资料采用等距数列、开口组、组数为6个组。具体形式如下表:2023/3/9第四十七页,共一百零一页,2022年,8月28日第四,汇总出各组单位数,整理成频数分布表。

销售额(百万元)划记号网点数5以下5~1010~1515~2020~2525以上410161343合计—50设计汇总表手工汇总汇总后整理某连锁超市50个网点商品销售额频数分布表

销售额(百万元)网点数(个)频率(%)5以下5~1010~1515~2020~2525以上410161343820322686合计501002023/3/9第四十八页,共一百零一页,2022年,8月28日524854614736515843396947496843475954684653342820384173475178【例】某汽车公司1月全国30家经销单位汽车销售情况根据上表的资料,对这30家经销单位按销售量(辆)分组,编制频数分布表。2023/3/9第四十九页,共一百零一页,2022年,8月28日

[分析]汽车销售量为离散变量,变量值的种类数较多,所以适合编制组距数列。

1、确定组数,根据Sturges提出的经验公式:

2、确定组距:

3、确定组限:(将确定组距和组限步骤结合考虑)

4、编制频数分布表2023/3/9第五十页,共一百零一页,2022年,8月28日汽车销售频数分布表

销售量(辆)频数(家)频率(%)20—2930—3940—4950—5960—6970—79

2410842

6.713.333.326.713.36.7合计30

100.02023/3/9第五十一页,共一百零一页,2022年,8月28日按顺序列出的各组变量值及相应的频率,即成为变量的频率分布。按考分分组人数(人)频率(%)50~6060~7070~8080~9090~100

51518102103036204合计50100例:

注意:任何一个频率分布都必须满足两个条件:一是各组频率≥0;二是各组频率之和等于100%。(三)频率分布2023/3/9第五十二页,共一百零一页,2022年,8月28日累计频数与累计频率分布

1.向上累计:是指将各组次数或频率由变量值低的组向变量高的组累计,以表明各组上限以下的单位数有多少,以及这些单位数占总体单位数的比重(频率)有多大。2.向下累计:是指将各组次数或频率,由变量值高的组向变量值低的组逐组累计,以表明各组下限以上的单位数有多少,以及这些单位数占总体单位数的比重(频率)有多大。累计分布有向上累计和向下累计两种:例:

.2023/3/9第五十三页,共一百零一页,2022年,8月28日按考分分组人数(人)频率(%)50~6060~7070~8080~9090~100

51518102103036204合计50100某班“统计学”考分分布数列向上累计频数频率(%)52038485010407696100——向下累计频数频率(%)5045301221009060244——向上累计:如,第一组说明60分以下有5人,占学生总数的10%;第二组说明70分以下有20人,占学生总数的40%。向下累计:如,第五组说明90分以上有2人,占学生总数的4%;第四组说明80分以上有12人,占学生总数的24%。2023/3/9第五十四页,共一百零一页,2022年,8月28日根据频数分布数列资料,横轴表示变量值,纵轴表示各变量值出现的次数。在坐标系中找出相应的点,然后将各点顺次连接,所形成的形状。对这些形状进行分类,就形成了次数分布的基本形态。(四)频数(次数)分布的基本形态

频数分布有三种基本形态:

钟型分布、U型分布和J型分布。.

2023/3/9第五十五页,共一百零一页,2022年,8月28日钟型分布的特征是中间变量值出现的次数多,两端变量值(即大的变量值和小的变量值)出现的次数少,即“中间大,两头小”。1.钟型分布:fx钟型分布(正态分布)即其分布曲线形如一口古钟,故称钟型分布例如,如人的身高、体重、职工工资、农作物亩产量、市场价格、学生的考分等现象都属于钟型分布,又分为以下两种:正态分布和偏态分布。2023/3/9第五十六页,共一百零一页,2022年,8月28日正态分布:

中间变量值分布的次数最多,两侧变量值分布的次数随着与中间变量值距离的增大而渐次减少,并且围绕中心变量值两侧呈对称分布。偏态分布:当变量值存在极大值时,次数分布曲线会较正态分布向右延伸,这种分布称为右偏分布。右偏分布当变量值存在极小值时,次数分布曲线就会较正态分布向左延伸,这种分布称为左偏分布。左偏分布xffx2023/3/9第五十七页,共一百零一页,2022年,8月28日它与钟型分布正好相反,其特点是:越靠近中间变量值分布次数较少;越靠近两端变量值分布的次数较多,呈现出“中间小、两头大”的特征。2.U型分布:U型分布xfU型曲线又称生命曲线或浴盆曲线,人和动物的死亡率近似服从U型曲线分布2023/3/9第五十八页,共一百零一页,2022年,8月28日其分布特征呈现“一头大、一头小”的特征,即形如字母J字。J型分布有两种类型,即:正J型分布与反J分布。3.J型分布:

x反J型分布xff正J型分布常见的例子是西方经济学中的供给曲线如正J型,随着价格的增加,供给量在不断增加;需求曲线如反J型,随着价格的增加,需求量在不断减少。

2023/3/9第五十九页,共一百零一页,2022年,8月28日第三节统计数据的显示

一、统计表

二、统计图

2023/3/9第六十页,共一百零一页,2022年,8月28日一、统计表1、统计表的概念狭义:以纵横交叉的线条所形成的表格来表现统计整理资料的形式。广义:包括统计工作各个阶段中所用的一切表格,如调查表、整理表、分析表。

2023/3/9第六十一页,共一百零一页,2022年,8月28日第三章数据分布特征的描述

第三节统计表与统计图2、统计表的作用能使统计资料条理化;简明、易懂,节省篇幅;便于比较,便于计算;便于检查完整性和正确性。2023/3/9第六十二页,共一百零一页,2022年,8月28日横

行标题总标题纵栏标题指标数值主词宾词3、统计表的构成

2023/3/9第六十三页,共一百零一页,2022年,8月28日4、统计表的种类统计表按主词的分组情况可分为三种:⑴简单表:对主词不分组的统计表。按总体单位名称或时间排列。如

我国三个城市的人口数(1990年7月1日0时)城市人口数(人)较1982年7月1日0时增长%北京市

10819407

17.21天津市

8785402

13.15上海市

13341896

12.50我国1998-2002拥有电话户数(万户)年份固定电话移动电话

1998

8742

2386

1999

10872

4330

2000

14483

8453

2001

18037

14522

2002

21442

206622023/3/9第六十四页,共一百零一页,2022年,8月28日⑵分组表:主词进行简单分组的统计表。

(按一个标志分组)某班学生按考试成绩分组表按成绩分组(分)学生数(人)比率(%)60以下60~7070~8080~9090~10026151255.015.037.530.012.5合计40100.02023/3/9第六十五页,共一百零一页,2022年,8月28日⑶复合表:主词进行复合分组的统计表。

(主词按两个或两个以上标志层叠分组)按技术等级、性别分人数(人)高级男女中级男女初级男女

86264481614710245合计

219某企业技术人员情况统计表2023/3/9第六十六页,共一百零一页,2022年,8月28日按月工资分组按性别分(人)按级别分小计男女小计技工学徒工300以下300~400400~500500~600600~700700以上416221510516101184310124214162215105024585414181020合计724032722448宾词栏的简单设计宾词栏的复合设计按月工资分组按级别分(人)总计技工学徒工小计男女小计男女性别和级别并列2023/3/9第六十七页,共一百零一页,2022年,8月28日(1)总标题应注明时间、总体范围和内容;(2)数据计量单位相同时,可放在表的右上角标明,不同时应放在每个指标后或单列出一列标明;(3)表中的上下两条横线一般用粗线,其他线用细线;(4)通常情况下,统计表的左右两边不封口;(5)表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一;(6)对于没有数字的表格单元,一般用“—”表示;(7)必要时可在表的下方加上注释。科学、实用、简练、美观5、统计表的设计要求2023/3/9第六十八页,共一百零一页,2022年,8月28日二、统计图统计图的特点:直观、醒目、易于理解统计图是用点、线条、面积等方法描述、显示统计数据的一种形式。注意:统计图是根据实际资料按比例画出的。现在大多是利用计算机软件制作的。组成:坐标系、图形、图例2023/3/9第六十九页,共一百零一页,2022年,8月28日2023/3/9第七十页,共一百零一页,2022年,8月28日统计图的基本类型2023/3/9第七十一页,共一百零一页,2022年,8月28日1、条形图(barChart)(1)用宽度相同的条形的高度或长短来表示各类别数据的图形(2)有单式条形图、复式条形图等形式(3)主要用于反映分类数据的频数分布(4)绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图2023/3/9第七十二页,共一百零一页,2022年,8月28日2、饼图(pieChart)(1)也称圆形图,是用圆形及圆内扇形的角度来表示数值大小的图形;(2)主要用于表示总体或样本中各组成部分所占的比例,对于研究结构性问题十分有用;(3)绘制圆形图时,总体中各部分所占的百分比用园内的各个扇形角度表示,这些扇形的中心角度,是按各部分数据百分比占360度的相应比例确定的。第七十三页,共一百零一页,2022年,8月28日3、环形图(annularchart)(1)环形图中间有一个“空洞”,总体中的每一部分数据用环中的一段表示;(2)环形图与圆形图类似,但又有区别:圆形图只能显示一个总体各部分所占的比例;环形图则可以同时绘制多个总体的数据系列,每一个总体的数据系列为一个环。(3)环形图可用于结构比较研究;(4)环形图主要用于展示分类和顺序数据。8%36%31%15%7%33%26%21%13%10%

非常不满意

不满意

一般

满意

非常满意

甲乙两城市家庭对住房状况的评价第七十四页,共一百零一页,2022年,8月28日4、直方图(histogram)(1)用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的面积来表示各组的频数分布;(2)在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图;(3)直方图下的总面积等于1。第七十五页,共一百零一页,2022年,8月28日140150210某电脑公司销售量分布的直方图190200180160170频数(天)25201510530220230240第七十六页,共一百零一页,2022年,8月28日直方图与条形图的区别:(1)条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的;(2)直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义;(3)直方图的各矩形通常是连续排列,条形图则是分开排列;(4)条形图主要用于展示分类数据,直方图则主要用于展示数值型数据。第七十七页,共一百零一页,2022年,8月28日5、折线图(frequencypolygon)(1)折线图也称频数多边形图;(2)是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉;(3)折线图的两个终点要与横轴相交,具体的做法是第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴;折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的。第七十八页,共一百零一页,2022年,8月28日140150210某电脑公司销售量分布的折线图190200180160170220230240频数(天)25201510530第七十九页,共一百零一页,2022年,8月28日顺序数据的频数分布表【例】在一项城市住房问题的研究中,研究人员在甲乙两个城市各抽样调查300户,其中的一个问题是:“您对您家庭目前的住房状况是否满意?1.非常不满意;2.不满意;3.一般;4.满意;5.非常满意。甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)百分比(%)向上累积向下累积户数(户)百分比(%)户数(户)百分比(%)

非常不满意

不满意

一般

满意

非常满意24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562510合计300100.0————第八十页,共一百零一页,2022年,8月28日顺序数据的频数分布表乙城市家庭对住房状况评价的频数分布回答类别乙城市户数(户)百分比(%)向上累积向下累积户数(户)百分比(%)户数(户)百分比(%)非常不满意不满意一般满意非常满意21997864387.033.026.021.312.7211201982623007.040.066.087.3100.030027918010238100.093.060.034.012.7合计300100.0————第八十一页,共一百零一页,2022年,8月28日顺序数据的图示—累计频数分布图243001322252700100200300400

非常不满意

不满意

一般

满意

非常满意累积户数(户)(a)向上累积27616830300750100200300400

非常不满意

不满意

一般

满意

非常满意累积户数(户)(b)向下累积甲城市家庭对住房状况评价的累积频数分布第八十二页,共一百零一页,2022年,8月28日6、茎叶图(stem-and-leafdisplay)(1)用于显示未分组的原始数据的分布(2)由“茎”和“叶”两部分构成,其图形是由数字组成的(3)以该组数据的高位数值作树茎,低位数字作树叶(4)树叶上只保留一位数字(5)对于n(20n300)个数据,茎叶图最大行数不超过L=[10×lg(n)](6)茎叶图类似于横置的直方图,但又有区别直方图可观察一组数据的分布状况,但没有给出具体的数值茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息第八十三页,共一百零一页,2022年,8月28日未分组数据—茎叶图第八十四页,共一百零一页,2022年,8月28日未分组数据—扩展的茎叶图第八十五页,共一百零一页,2022年,8月28日7、箱线图(boxplot)(1)用于显示未分组的原始数据的分布;(2)箱线图由一组数据的5个特征值绘制而成,它由一个箱子和两条线段组成;(3)其绘制方法是:首先找出一组数据的5个特征值,即最大值、最小值、中位数Me和两个四分位数(下四分位数QL和上四分位数QU)连接两个四分(位)数画出箱子,再将两个极值点与箱子相连接。第八十六页,共一百零一页,2022年,8月28日未分组数据:单批数据箱线图

(箱线图的构成)中位数4681012QUQLX最大值X最小值简单箱线图第八十七页,共一百零一页,2022年,8月28日单批数据箱线图最小值141最大值237中位数182下四分位数170.25上四分位数197140150160170180190200210220230240某电脑公司销售量数据的箱线图第八十八页,共一百零一页,2022年,8月28日分布的形状与箱线图

对称分布QL中位数

QU左偏分布QL中位数

QU右偏分布QL

中位数

QU不同分布的箱线图第八十九页,共一百零一页,2022年,8月28日11名学生各科的考试成绩数据课程名称学生编号1234567891011英语经济数学西方经济学市场营销学财务管理基础会计学统计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论