版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第3章数据的整理与显示第3章数据的整理与显示3.1数据的预处理3.2统计分组与频数分布3.3统计图3.4统计表学习目标1、了解数据预处理的内容和目的2、掌握统计分组的方法3、掌握品质数据的整理与图示方法4、掌握数值型数据的整理与图示方法5、用Excel作频数分布表和统计图6、合理使用统计表和统计图3.1
数据的预处理1、数据审核2、数据筛选3、数据排序一、数据审核数据审核—原始数据
(rawdata)审核的内容完整性审核应调查的单位或个体是否有遗漏调查项目或指标是否填写齐全准确性审核内容是否真实反映客观实际情况是否有错误:逻辑检查、计算检查数据的审核—二手数据
(secondhanddata)
适用性审核数据的来源、口径以及有关的背景材料数据是否符合自己分析研究的需要时效性审核最新的数据确认是否必要做进一步的加工整理二、数据筛选数据筛选
(datafilter)
对审核中发现的无法纠正错误,或者有些数据不符合调查的要求而又无法弥补时,就要对数据进行筛选。数据筛选的内容包括将某些不符合要求的数据或有明显错误的数据予以剔除将符合某种特定条件的数据筛选出来。数据筛选
(datafilter)用Excel进行数据筛选
7名学生的考试成绩数据
【例3-1】7名学生统计学原理考试成绩数据(单位:分)。请找出平时成绩等于80分的学生,卷面成绩最高的前两名学生,卷面成绩大于70小于85的学生;平时成绩和考勤成绩大于80,或者总成绩大于85分的学生。三、数据排序数据排序
(datarank)1、数据排序就是按一定顺序将数据排列,其目的是为了便于研究者通过浏览数据发现一些明显的特征或趋势,找到解决问题的线索。2、排序有助于对数据检查纠错,以及为重新归类或分组等提供依据3、在某些场合,排序本身就是分析的目的之一4、排序可借助于计算机完成数据排序
(datarank)1、分类数据的排序字母型数据,有升序、降序之分。汉字型数据,可按首位拼音字母排列,也可按笔画多少排序。2、数值型数据的排序递增排序:设一组数据为x1,x2,…,xn,递增排序后可表示为:x(1)<x(2)<…<x(n)递减排序:可表示为:x(1)>x(2)>…>x(n)数据排序
(方法)【例3-2】仍以表3-1为例,计算总成绩并按总成绩的递增顺序排序。7名学生的考试成绩数据
3.2统计分组与频数分布一.统计分组分布数列一、统计分组的定义及方法
(一)统计分组的定义
统计分组指的是根据统计研究的目的和客观现象的内在特点,按照一定的标志把被研究总体划分为若干个性质不同但又有联系的组。统计分组可以使资料系统化、科学化、条理化,从而得出能够反映事物总体特征的资料。(二)统计分组的方法(1)按品质标志分组按品质标志进行分组,就是按研究对象的某种属性特征分组,能直接反映事物间质的差别,给人以明确、具体的概念。例如,人口按性别、民族、职业、文化程度等分组;企业按所有制分为国有、集体、联营、股份合作、其他等组。
(二)统计分组的方法
(2)按数量标志分组
按数量标志分组,指选择反映事物数量差异的数量标志作为分组标志进行分组,例如,按学生人数分组、按人均消费水平分组、按产量分组等。
某车间工人产量分组表单项式分组组距式分组二、频数分布频数分布的概念
频数分布是在分组的基础上,把总体的所有单位按组归并排列,形成总体中各个单位在各组件的分布,又称分布数列。
分布数列的两个要素:
1、总体按其标志所分的组
2、组的次数或频数
(一)品质数列的编制方法分类频数比例百分比比率ABCDE(1)列出各类别(2)计算各类别的频数(3)生成频数分布表分类频数比例百分比比率ABCDE1、品质数列的编制方法【例3-3】一项主要针对高校教师的调查在某学校展开,调查者随机抽取了100名教师调查其文化程度。调查结果如下所示,试用Excel编制一张频数分布表。
制作频数分布表Excel某高校100名教师文化程度频数分布表2、分类汇总的方法【例3-4】如果我们已经建立了一张某高校部分人事统计表,如表所示。试按部门进行分类汇总。3、数据透视表
(pivottable)(1)可以对数据表的重要信息按使用者的习惯或分析要求进行汇总和作图(2)形成一个符合需要的交叉表(列联表)(3)注意:数据源表中的首行必须有列标题数据透视表的编制方法
【例3-5】仍以上题例,若按性别统计各部门的工资总额,建立一个交叉式的复合分组统计表,可使用数据透视表功能。(二)变量数列的编制方法
分类频数比例百分比比率ABCDE分组方法分组方法等距分组异距分组单变量值分组组距分组1、单项式分组
(要点)1.将一个变量值作为一组2.适合于离散变量3.适合于变量值较少的情况单项式数列编制方法【例3-6】某班级50名同学某科目如下。试采用单变量值对数据进行分组。某班级50名同学某科目成绩频数分布表2、组距式数列编制方法1、将变量值的一个区间作为一组2、适合于变量值较多的连续变量3、遵循“不重不漏”的原则4、可采用等距分组或不等距分组~~~~~组距分组1.下限(lowlimit)
:一个组的最小值2.上限(upperlimit)
:一个组的最大值3.组距(classwidth)
:上限与下限之差4.组中值(classmidpoint)
:下限与上限之间的中点值下限值+上限值2组中值=
组距分组步骤1、确定组数:可以按美国学者斯特杰斯(H·A·Sturges)提出的经验公式来确定2、确定组距:组距(ClassWidth)是一个组的上限与下限之差.
组距=(最大值-最小值)÷组数3、统计出各组的频数,并整理成频数分布表。频数分布表的编制
(例题分析)【例3-7】某小学图书馆2015年9月至2016年1月120天的入馆登记人数,试对数据进行分组。频数分布表的编制步骤1、确定组数:确定组距:
组距=(99-21)÷10=7.8104.用Excel制作频数分布表
统计出各组的频数,每个组数据满a≤x<b(上限值不在内)。
excel的计数规则是a<x≤b某小学图书馆入馆登记人数频数分布表某小学图书馆入馆登记人数频数分布表
为了统计分析的需要,有时需要观察某一数值以下或某一数值以上的频数(或频率)之和,就需要在分组的基础上计算出累积频数(或频率)。从变量值小的一方向变量值大的一方累加频数(或频率),称为向上累积;从变量值大的一方向变量值小的一方累加频数(或频率),称为向下累积。某小学图书馆入馆登记人数频数分布表3.3统计图一、条形图和柱形图
条形图(barchart)和柱形图(columnchart)都可以用来表示一组或几组分类相关的数值,用宽度相同的条形的高度或长短来表示数据多少。◆条形图将用来表示类别的条形柱放在纵轴上◆柱形图将用来表示类别的条形柱放在横轴上【例3-8】一家市场调查公司为研究不同品牌手机的市场占有率,对随机抽取的一家手机销售连锁店进行了调查。调查员在某天对100名顾客购买手机的品牌进行了记录。根据原始数据整理得到频数分布表(见下表所示),试利用该资料绘制条形图。不同品牌手机分布的条形图不同品牌手机分布的柱形图二、饼图和环形图
饼图(piechart)是用圆内扇形的面积或角度来表示数值大小的统计图形,用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例。饼图主要用来研究结构性,一般只能显示一个总体或样本的构成情况。
环形图(doughnutchart)与饼图类似,但可以同时绘制多个总体或样本的数据构成情况,有利于进行比较研究。不同品牌手机分布的饼形图1.饼图2.环形图【例3-9】某服装店三家分店2016年二季度营业额所占比重如下表所示,根据资料绘制环形图。
某服装店三家分店营业额所占比重(%)
某服装店三家分店营业额所占比重环形图三、折线图(lineplot)
对于时间序列数据可以通过绘制折线图来反映事物发展变化的规律和趋势。折线图可以显示随时间而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势。在折线图中,类别数据沿水平轴均匀分布,所有值数据沿垂直轴均匀分布。三、折线图
【例3-10】2000-2014年我国三次产业的产值情况数据如下表所示,试绘制折线图。三、折线图2000-2014年我国三次产业产值的折线图四、直方图直方图(histogram)又称质量分布图,是用矩形的宽度和高度(即面积)来表示频数分布的图形。在直方图中,一般用横轴表示数据类型,纵轴表示分布情况,矩形的宽度表示各组的组距,对于等距分组的数据,矩形的高度表示各组的频数。
但不等距分组数据,要用矩形的面积表示各组的频数分布,或根据频数密度(密度=频数÷组距)来绘制直方图,就可以准确地表示各组数据的分布特征。
无论是等距分组数据还是不等距分组数据,用矩形面积来表示各组频数分布更合适,因为这样可使直方图下的总面积等于1。在直方图中实际上是用矩形的面积来表示各组的频数分布。直方图与条形图的区别1、条形图是用条形的长度表示各类别频数的多少,其宽度(表示类别)则是固定的2、直方图是用面积表示各组频数的多少,矩形的高度表示各组的频数或百分比,宽度表示各组的组距,其高度与宽度均有意义3、直方图的矩形是连续排列,条形图则是分开排列
入馆人数分布直方图五、二维散点图
2DScatterplots1.展示两个变量之间的关系2.用横轴代表变量x,纵轴代表变量y,每组数据(xi
,yi)在坐标系中用一个点表示,n组数据在坐标系中形成的n个点称为散点,由坐标及其散点形成的二维数据图
小麦单产与温度的数据两个变量间的关系—二维散点图
(2DScatterplots)
小麦单产与温度数据散点图六、气泡图
(bubblechart)1.显示三个变量之间的关系2.绘制时将一个变量放在横轴,一个变量放在纵轴,第三个变量用气泡的大小来表示。
小麦单产与降雨量、温度的数据
小麦单产与降雨量和温度的气泡图七、雷达图
(radarchart)1.也称为蜘蛛图(spiderchart)2.显示多个变量的图示方法3.假定各变量的取值具有相同的正负号,总的绝对值与图形所围成的区域成正比4.可用于研究多个样本之间的相似程度多变量数据—雷达图
(例题分析)【例3-11】2014年我国城乡居民家庭平均每人各项生活消费支出构成数据如表。试绘制雷达图2014年我国城乡居民平均每人生活消费支出构成(%)
2014年我国城乡居民平均每人生活消费支出构成雷达图3.4统计表一、统计表的结构二、统计表的构成三、统计表的编制原则一、统计表的结构二、统计表的分类
(一)简单表省级区划名称地级区划数地级市河北省1111山西省1111辽宁省1414吉林省98黑龙江省1312
我国部分省行政区划单位:个数据来源:根据《中国统计年鉴2015》整理所得。
(二)简单分组表按成绩分组学生数(个)比重(%)60以下3660-7091870-80122480-90204090以上612合计50100
某班50名同学统计学期末考试成绩分组表(三)复合分组表
项
目博士硕士合计
哲
学68036744354
经济学22622402126283
法
学2803365
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 潮流计算的仿真课程设计
- 四年级数学(小数加减运算)计算题专项练习与答案汇编
- 潮州拜神风俗研究报告
- 测量温度课程设计
- 测量快递件重量课程设计
- 测量仪器管理工作方案
- 测绘项目工期安排方案
- 仲恺农业工程学院《回归分析》2021-2022学年第一学期期末试卷
- 测绘单位目标考核方案
- 测温监控维修方案
- 艾滋病职业防护培训
- 全科医生转岗培训结业考核模拟考试试题
- 2025年高考数学专项题型点拨训练之初等数论
- 上海市浦东新区2024-2025学年六年级上学期11月期中数学试题(无答案)
- 吃动平衡健康体重 课件 2024-2025学年人教版(2024)初中体育与健康七年级全一册
- 通信技术工程师招聘笔试题与参考答案(某世界500强集团)2024年
- 2024至2030年中国节流孔板组数据监测研究报告
- 2024年第九届“学宪法、讲宪法”活动知识竞赛测试题库及答案
- 2024年四川省宜宾市中考地理试卷(含答案与解析)
- 黑龙江省哈尔滨市师大附中2024-2025学年高一上学期10月阶段性考试英语试题含答案
- 电力设备预防性试验规程
评论
0/150
提交评论