任务3:数据整理_第1页
任务3:数据整理_第2页
任务3:数据整理_第3页
任务3:数据整理_第4页
任务3:数据整理_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1统计学基础统计学基础2/58n 3.1 数据整理的程序数据整理的程序n 3.2 数据的分组数据的分组n 3.3 频数分布频数分布n 3.4 统计表和统计图统计表和统计图学 习 目 标任务三 数据整理与显示数据整理与显示3/58l数据整理的程序数据整理的程序l数据预处理数据预处理l数据分类或分组数据分类或分组l数据的汇总和图表显示数据的汇总和图表显示 编码编码 审核审核排序排序筛选筛选完整性、准确性、完整性、准确性、时效性时效性3.1 3.1 数据整理的程序数据整理的程序 任务三任务三 数据整理与显示数据整理与显示4/583.2 3.2 数据的分组数据的分组 任务三任务三 数据整理与显示数据整

2、理与显示l 3.2.1 3.2.1 统计分组的概念统计分组的概念l 3.2.2 3.2.2 品质数据分组品质数据分组l 3.2.3 3.2.3 数值型数据分组数值型数据分组l 3.2.4 3.2.4 统计分组的形式统计分组的形式学习要点学习要点重点重点5/58n统计分组的原则统计分组的原则 p应体现各组之间的性质差别应体现各组之间的性质差别p坚持互斥和穷尽的原则坚持互斥和穷尽的原则互斥,即各组间互不重叠,每个单位只能归于某一组;互斥,即各组间互不重叠,每个单位只能归于某一组;穷尽,即所有组可覆盖总体,总体中的每个单位都有组可归;穷尽,即所有组可覆盖总体,总体中的每个单位都有组可归;p能反映总体

3、的分布特征能反映总体的分布特征n统计分组:统计分组:根据研究的目的,选择合适的分组标志将根据研究的目的,选择合适的分组标志将 原始数据分成若干个不同的组别。原始数据分成若干个不同的组别。 任务三任务三 数据整理与显示数据整理与显示3.2.1 3.2.1 统计分组的概念统计分组的概念 任务三任务三 数据整理与显示数据整理与显示3.2.1 3.2.1 统计分组的概念统计分组的概念6/58学生考试成绩分组学生考试成绩分组q45分-54分q55分-64分q65分-74分q75分-84分 任务三任务三 数据整理与显示数据整理与显示3.2.1 3.2.1 统计分组的概念统计分组的概念学生考试成绩分组学生考

4、试成绩分组q60分以下q60-70分q70-80分q80-90分q90-100分不合适不合适合适合适7/58n分组标志的类型:分组标志的类型: 品质标志和数量标志品质标志和数量标志n分组标志的选择分组标志的选择 任务三任务三 数据整理与显示数据整理与显示3.2.1 3.2.1 统计分组的概念统计分组的概念品质标志品质标志数量标志数量标志性别、专业、学历、性别、专业、学历、年龄、成绩、工资、年龄、成绩、工资、文字表文字表示示数字表示数字表示8/58 任务三任务三 数据整理与显示数据整理与显示3.2.3 3.2.3 数值型数据分组数值型数据分组n数值型数据分组有两种形式:数值型数据分组有两种形式:

5、 单项式分组和组距式分组单项式分组和组距式分组 n单项式分组(要点)单项式分组(要点) l用一个变量值作为一组用一个变量值作为一组l适合于变量值较少的离散变量适合于变量值较少的离散变量 任务三任务三 数据整理与显示数据整理与显示3.2.3 3.2.3 数值型数据分组数值型数据分组9/58按家庭成员人数分组(人)按家庭成员人数分组(人)家庭数(个)家庭数(个)1234及及4以上以上合计合计离散型变离散型变量量一个变一个变量值作量值作为一组为一组变量值较少变量值较少 任务三任务三 数据整理与显示数据整理与显示3.2.3 3.2.3 数值型数据分组数值型数据分组10/58n组距分组组距分组 (要点要

6、点)l用变量值的一个区间作为一组用变量值的一个区间作为一组l适合于连续变量和变量值较多的离散变量适合于连续变量和变量值较多的离散变量 任务三任务三 数据整理与显示数据整理与显示3.2.3 3.2.3 数值型数据分组数值型数据分组11/58按成绩分组(分)按成绩分组(分)人数(人)人数(人)比重比重(%)60以下以下76.3660701919.0970802828.1880903426.36901002220.00合计合计110100.00连续型变连续型变量量变量变量值的值的一个一个区间区间作为作为一组一组不管变量值多还是少不管变量值多还是少 任务三任务三 数据整理与显示数据整理与显示3.2.3

7、 3.2.3 数值型数据分组数值型数据分组12/58按加工量分组(件)按加工量分组(件)频数(人)频数(人)频率(频率(%)15以下以下15-2020-2525-3030-3535-4040-4545以上以上5820332311734.557.2718.1830.0020.9110.006.362.73合计合计110100.00离散型变离散型变量量变量变量值的值的一个一个区间区间作为作为一组一组变量值较多变量值较多 任务三任务三 数据整理与显示数据整理与显示3.2.3 3.2.3 数值型数据分组数值型数据分组13/58l组距式分组的几个要素组距式分组的几个要素l 组数组数l 组距组距l 组限组

8、限l 组中值组中值 任务三任务三 数据整理与显示数据整理与显示3.2.3 3.2.3 数值型数据分组数值型数据分组14/58u 组组 数数根据经验根据经验, ,组数在组数在515515为宜为宜美国学者斯特斯基于美国学者斯特斯基于19261926年提出了一种计算组年提出了一种计算组数数 的参考公式的参考公式2lglg1nKKn为组数,为组数,为数据个数为数据个数 任务三任务三 数据整理与显示数据整理与显示3.2.3 3.2.3 数值型数据分组数值型数据分组15/58在等距数列中,可以根据极差和事先确定的组数在等距数列中,可以根据极差和事先确定的组数推算推算:组数最小值最大值 u 组组 距距 组距

9、宜取组距宜取整数整数 每组上限和下限之间的每组上限和下限之间的差额差额 任务三任务三 数据整理与显示数据整理与显示3.2.3 3.2.3 数值型数据分组数值型数据分组组距组距16/58组组 限限下限:一个组的最小值下限:一个组的最小值 上限:一个组的最大值上限:一个组的最大值重叠组限:重叠组限:用同一变量值作为相临两组的上下限;使用重叠用同一变量值作为相临两组的上下限;使用重叠 组限时,坚持组限时,坚持“上限不在内上限不在内”的原则的原则不重叠组限:不重叠组限:用顺序两个变量值作为相邻两组的上限和下限用顺序两个变量值作为相邻两组的上限和下限u 组组 限限 每个组的最大值和最小值每个组的最大值和

10、最小值 任务三任务三 数据整理与显示数据整理与显示3.2.3 3.2.3 数值型数据分组数值型数据分组17/58重叠组限重叠组限按零件数分组(件)按零件数分组(件)人数(人)人数(人)110110以下以下3 3110-115110-1155 5115-120115-1208 8120-125120-1251414125-130125-1301010130-135130-1356 6135135以上以上4 4合计合计5050按零件数分组(件)按零件数分组(件)人数(人)人数(人)109109以下以下3 3110-114110-1145 5115-119115-1198 8120-124120-1

11、241414125-129125-1291010130-134130-1346 6135135以上以上4 4合计合计5050不重叠组限不重叠组限 离散型变量离散型变量 任务三任务三 数据整理与显示数据整理与显示3.2.3 3.2.3 数值型数据分组数值型数据分组18/58重叠组限重叠组限按成绩分组(分)按成绩分组(分)人数(人)人数(人)6060以下以下3 360-7060-707 770-8070-80181880-9080-90141490-10090-1008 8合计合计5050按成绩分组(分)按成绩分组(分)人数(人)人数(人)5959以下以下3 360-6960-697 770-79

12、70-79181880-8980-89141490-10090-1008 8合计合计5050不重叠组限不重叠组限 连续型变量连续型变量 任务三任务三 数据整理与显示数据整理与显示3.2.3 3.2.3 数值型数据分组数值型数据分组19/58u 组组 中中 值值222邻组组距下限缺上限组的组中值邻组组距上限缺下限组的组中值下限上限组中值 任务三任务三 数据整理与显示数据整理与显示3.2.3 3.2.3 数值型数据分组数值型数据分组20/58u 数值型数据分组数值型数据分组实例实例 任务三任务三 数据整理与显示数据整理与显示3.2.3 3.2.3 数值型数据分组数值型数据分组21/58 简单分组、

13、平行分组或复合分组简单分组、平行分组或复合分组n统计分组的形式统计分组的形式按一个标志分组按一个标志分组按两个或两个以上标志分组按两个或两个以上标志分组 任务三任务三 数据整理与显示数据整理与显示3.2.4 3.2.4 统计分组的类型统计分组的类型l平行分组体系平行分组体系l 简单分组简单分组l复合分组体系复合分组体系 一个问题同时按两个或多个标志层叠分一个问题同时按两个或多个标志层叠分组,就称为复合分组。复合分组形成的组,就称为复合分组。复合分组形成的系列就叫复合分组体系。系列就叫复合分组体系。对同一总体的几个简单分组按某一个规对同一总体的几个简单分组按某一个规定排列起来就构成一个平行分组体

14、系。定排列起来就构成一个平行分组体系。 任务三任务三 数据整理与显示数据整理与显示3.2.4 3.2.4 统计分组的类型统计分组的类型统计分组的基本原则?统计分组的基本原则?数值型数据(变量)分组的方式有哪两种?离散数值型数据(变量)分组的方式有哪两种?离散变量与连续变量适合采用哪种分组方式?变量与连续变量适合采用哪种分组方式?组距式分组中,组限设置方式有哪两种组距式分组中,组限设置方式有哪两种 ?离散变?离散变量与连续变量适合采用哪种?量与连续变量适合采用哪种?23/583.3 3.3 频数分布频数分布 任务三任务三 数据整理与显示数据整理与显示l 3.3.1 3.3.1 频数分布的概念频数

15、分布的概念l 3.3.2 3.3.2 频数分布的编制频数分布的编制l 3.3.3 3.3.3 频数分布的常见形式频数分布的常见形式l 3.3.4 3.3.4 统计分组与频数分布的统计分组与频数分布的Excel操作操作 学习要点学习要点重点重点24/58 任务三任务三 数据整理与显示数据整理与显示3.3.1 3.3.1 频数分布的概念频数分布的概念 任务三任务三 数据整理与显示数据整理与显示3.3.1 3.3.1 频数分布的概念频数分布的概念频数频数落在各类别中的数据个数。落在各类别中的数据个数。频率频率是某一类别数据的频数占总体单位个数的比例,通是某一类别数据的频数占总体单位个数的比例,通常用

16、百分数(常用百分数(%)表示,各组频率之和等于)表示,各组频率之和等于1或或100%。 n频数分布频数分布 ,把频数以表格的形式全部列出来。,把频数以表格的形式全部列出来。n频数分布的两个要素频数分布的两个要素 l总体分组总体分组l各组的频数各组的频数 25/58按成绩分组(分)按成绩分组(分)人数(人)人数(人)比重比重(%)60以下以下76.3660701919.0970802828.1880903426.36901002220.00合计合计110100.00 任务三任务三 数据整理与显示数据整理与显示3.3.1 3.3.1 频数分布的概念频数分布的概念频数频数频率频率分分 组组频数频数分

17、布表分布表26/58n累积频数和累积频率累积频数和累积频率l累积频数累积频数(cumulative frequencies)(cumulative frequencies): 各组别频数的逐级累加各组别频数的逐级累加l累积频率累积频率(cumulative percentages)(cumulative percentages): 各类别频率各类别频率( (百分比百分比) )的逐级累加的逐级累加 任务三任务三 数据整理与显示数据整理与显示3.3.1 3.3.1 频数分布的概念频数分布的概念l累积方法有两种:向上累积、向下累积累积方法有两种:向上累积、向下累积 任务三任务三 数据整理与显示数据整

18、理与显示3.3.1 3.3.1 频数分布的概念频数分布的概念 变量值变量值小小的一方向变的一方向变量值量值大大的一方累加的一方累加 变量值变量值大大的一方向变的一方向变量值量值小小的一方累加的一方累加27/58人数(人)人数(人)比重(比重(%)很不满意很不满意较不满意较不满意一般一般较满意较满意很满意很满意1462564424731282212合计合计200100甲地对某通讯公司服务的满意程度甲地对某通讯公司服务的满意程度 任务三任务三 数据整理与显示数据整理与显示3.3.1 3.3.1 频数分布的概念频数分布的概念28/58人数人数(人)(人)比重比重(%)向上累积向上累积向下累积向下累积

19、人数人数(人)(人)比重比重(%)人数人数(人)(人)比重比重(%)很不满意很不满意不满意不满意一般一般较满意较满意满意满意146256442473128221214761321762007386688100200186124682410093623412合计合计200100甲地对某通讯公司服务的满意程度甲地对某通讯公司服务的满意程度 任务三任务三 数据整理与显示数据整理与显示3.3.1 3.3.1 频数分布的概念频数分布的概念29/583.3.2 3.3.2 频数分布的编制频数分布的编制 任务三任务三 数据整理与显示数据整理与显示l计算各组的频数计算各组的频数 l总体分类或分组总体分类或分组

20、编制频数分布的步骤:编制频数分布的步骤: l形成频数分布表形成频数分布表 30/583.3.2 3.3.2 频数分布的编制频数分布的编制 任务三任务三 数据整理与显示数据整理与显示例例3-3-1 分类数据频数分布的编制分类数据频数分布的编制例例3-3-2 顺序数据频数分布的编制顺序数据频数分布的编制例例3-3-3 数值型数据频数分布的编制数值型数据频数分布的编制31/583.3.3 3.3.3 频数分布的类型频数分布的类型 任务三任务三 数据整理与显示数据整理与显示频数分布图频数分布图:横轴是总体分组横轴是总体分组 纵轴是频数或频率纵轴是频数或频率 频数分布主要形态频数分布主要形态: 钟形分布

21、钟形分布 J形分布形分布 U形分布形分布 32/583.3.4 3.3.4 常用常用ExcelExcel操作操作 任务三任务三 数据整理与显示数据整理与显示在在Excel中分组并形成频数分布的途径有中分组并形成频数分布的途径有4种:种: 1 1分类汇总分类汇总2 2数据透视表数据透视表4 4数据分析数据分析直方图直方图3函数函数“FREQUENCY”教材教材 P48, P48, 综合练习题(综合练习题(1 1). .(2 2)33/58课堂作业课堂作业34/583.4 3.4 统计表和统计图统计表和统计图 任务三任务三 数据整理与显示数据整理与显示n 3.4.1 3.4.1 统计表统计表 统计

22、表的构成、种类、应注意的问题统计表的构成、种类、应注意的问题n 3.4.2 3.4.2 统计图统计图 常用统计图及其适用条件常用统计图及其适用条件n 3.4.3 Excel 3.4.3 Excel的绘图操作的绘图操作 学习要点学习要点35/58 任务三任务三 数据整理与显示数据整理与显示 任务三任务三 数据整理与显示数据整理与显示3.4.1 3.4.1 统计表统计表统计资料的两种表现形式:统计资料的两种表现形式: 统计表统计表和和统计图统计图l统计表是以纵横交叉的线条绘制出的用以统计表是以纵横交叉的线条绘制出的用以 表现数据资料的表格。表现数据资料的表格。 任务三任务三 数据整理与显示数据整理

23、与显示3.4.1 3.4.1 统计表统计表36/582011年年末人口数及其构成年年末人口数及其构成单位:万人单位:万人指标指标年末数年末数比重比重%全国总人口全国总人口134735100.0其中:城镇其中:城镇6907951.3乡村乡村6565648.7其中:男性其中:男性6906851.3女性女性6566748.7其中:其中:0-14岁岁2216416.515-59岁岁9407269.860岁及以上岁及以上1849913.7其中:其中:65岁岁及以上及以上122889.1l统计表的构成统计表的构成横栏横栏标题标题总标题总标题纵栏纵栏标题标题数字数字资料资料 任务三任务三 数据整理与显示数据

24、整理与显示3.4.1 3.4.1 统计表统计表37/58简单汇总表简单汇总表分组表分组表l统计表的种类统计表的种类 任务三任务三 数据整理与显示数据整理与显示3.4.1 3.4.1 统计表统计表l 简单分组表简单分组表l 复合分组表复合分组表l 交叉分组表交叉分组表38/58l合理安排统计表的结构合理安排统计表的结构l总标题内容应满足总标题内容应满足3W 要求要求l数据计量单位相同时,可放在表的右上角标明,不同时应放在每个数据计量单位相同时,可放在表的右上角标明,不同时应放在每个指标后或单列出一列标明指标后或单列出一列标明l表中的上下两条横线一般用粗线,其他线用细线表中的上下两条横线一般用粗线

25、,其他线用细线l通常情况下,统计表的左右两边不封口通常情况下,统计表的左右两边不封口l表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一点的位数应统一l对于没有数字的表格单元,一般用对于没有数字的表格单元,一般用“”表示表示l必要时可在表的下方加上注释必要时可在表的下方加上注释n绘制统计表的注意事项绘制统计表的注意事项 任务三任务三 数据整理与显示数据整理与显示3.4.1 3.4.1 统计表统计表39/58 任务三任务三 数据整理与显示数据整理与显示3.4.2 3.4.2 统计图统计图n统计图是指利用几何图形(点、

26、线、面、形)或其统计图是指利用几何图形(点、线、面、形)或其 他图形来表现研究对象的特征、内部结构、他图形来表现研究对象的特征、内部结构、 相互关系等的一种图形相互关系等的一种图形 。n选择统计图时应考虑数据的类型选择统计图时应考虑数据的类型40/58n常用的统计图常用的统计图圆形图或称饼图圆形图或称饼图条形图或柱形图条形图或柱形图直方图直方图茎叶图茎叶图箱线图箱线图曲线图曲线图散点图散点图 任务三任务三 数据整理与显示数据整理与显示3.4.2 3.4.2 统计图统计图 任务三任务三 数据整理与显示数据整理与显示3.4.2 3.4.2 统计图统计图41/58 任务三任务三 数据整理与显示数据整

27、理与显示3.4.2 3.4.2 统计图统计图42/58圆形图圆形图条形图条形图 任务三任务三 数据整理与显示数据整理与显示3.4.2 3.4.2 统计图统计图43/58图表向导图表向导 插入插入-图表图表 任务三任务三 数据整理与显示数据整理与显示3.4.2 3.4.2 统计图统计图44/58选择所选择所需图形需图形 任务三任务三 数据整理与显示数据整理与显示3.4.2 3.4.2 统计图统计图45/58l饼图饼图 (pie Chart)l也称圆形图,用圆形及圆内扇也称圆形图,用圆形及圆内扇 形的角度来表示数值的大小,形的角度来表示数值的大小, 表示总体或样本中各组成部分表示总体或样本中各组成

28、部分 所占的比例。所占的比例。l 适合显示研究对象的内部结构适合显示研究对象的内部结构 任务三任务三 数据整理与显示数据整理与显示3.4.2 3.4.2 统计图统计图46/58饼图饼图 任务三任务三 数据整理与显示数据整理与显示3.4.2 3.4.2 统计图统计图47/58l条形图条形图 (bar Chart)l用宽度相同的条形的高度或长短来表示用宽度相同的条形的高度或长短来表示各类别数据的大小各类别数据的大小l条形图可以横置或纵置,纵置时也称为条形图可以横置或纵置,纵置时也称为柱形图。柱形图。l有简单条形图和复式条形图等形式。有简单条形图和复式条形图等形式。 任务三任务三 数据整理与显示数据

29、整理与显示3.4.2 3.4.2 统计图统计图48/58柱状图柱状图 任务三任务三 数据整理与显示数据整理与显示3.4.2 3.4.2 统计图统计图49/58条形图条形图 任务三任务三 数据整理与显示数据整理与显示3.4.2 3.4.2 统计图统计图50/58l环形图环形图(annular chart)l环形图中间有一个环形图中间有一个“空洞空洞”,总体中的每,总体中的每一部分数据用环中的一段表示一部分数据用环中的一段表示l环形图可用于结构比较研究环形图可用于结构比较研究 任务三任务三 数据整理与显示数据整理与显示3.4.2 3.4.2 统计图统计图l环形图与圆形图类似,但又有区别环形图与圆形

30、图类似,但又有区别p圆形图只能显示一个总体各部分所占的比例圆形图只能显示一个总体各部分所占的比例p环形图则可以同时绘制多个总体的数据系列,环形图则可以同时绘制多个总体的数据系列,每一个总体的数据系列为一个环每一个总体的数据系列为一个环51/58甲乙两地对某通讯公司服务的满意程度甲乙两地对某通讯公司服务的满意程度 甲地甲地区区乙地区乙地区环形图环形图 任务三任务三 数据整理与显示数据整理与显示3.4.2 3.4.2 统计图统计图 任务三任务三 数据整理与显示数据整理与显示3.4.2 3.4.2 统计图统计图52/58 l茎叶图茎叶图 任务三任务三 数据整理与显示数据整理与显示3.4.2 3.4.

31、2 统计图统计图53/58l箱线图箱线图l箱线图(箱线图(Box-plotBox-plot)又称为盒须图、盒式图或箱形图。因型状)又称为盒须图、盒式图或箱形图。因型状如箱子而得名。在各种领域也经常被使用,常见于品质管理。如箱子而得名。在各种领域也经常被使用,常见于品质管理。l箱线图提供了一种只用箱线图提供了一种只用5 5个点对数据集做简单总结的方式。这个点对数据集做简单总结的方式。这5 5个点包括中位数、上四分位数、下四分位数、最大值和最小值。个点包括中位数、上四分位数、下四分位数、最大值和最小值。l最适宜提供有关数据的位置和分散的参考,尤其在不同的母体最适宜提供有关数据的位置和分散的参考,尤其在

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论