多媒体教学课件统计学数据的整理图表_第1页
多媒体教学课件统计学数据的整理图表_第2页
多媒体教学课件统计学数据的整理图表_第3页
多媒体教学课件统计学数据的整理图表_第4页
多媒体教学课件统计学数据的整理图表_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章 统计整理本章重点与难点1统计整理的工作内容与程序;2统计分组的概念、作用,统计分组方法;3分配数列的概念、构成要素与种类;4变量数列的编制方法与编制技术;5统计图表的编制技术及其应用。其中,变量数列的编制方法是本章学习中的难点。一、统计整理的概念 统计整理就是按照统计研究的目的和要求,对所搜集的原始资料进行分组、汇总,使资料条理化、系统化的工作过程。对已整理过的初级资料进行再整理,也属于统计整理。统计整理是统计调查的继续,是统计分析的前提和基础,在整个统计工作中,发挥着承上启下的作用。第一节 统计整理概述 二、统计整理的工作内容 1、数据的预处理对调查得来的材料进行审核; 2、数据分组

2、按照综合表的要求进行分组; 分组是统计整理的关键; 3、数据汇总对各单位的标志值或指标进行汇总或做必要的加工计算; 4、编表将汇总整理的结果编制成统计表; 5、存档做好统计资料的系统积累工作。 三、统计整理的工作程序 1制订统计整理方案 2审核调查资料 3对调查资料进行分组、汇总和计算 4整理后的统计数据的再审核 5将整理结果编制成统计表或绘制成统计图 第二节 统计分组 统计分组是根据统计研究的目的,结合研究对象的特点,将统计总体按照一定的标志区分为若干组成部分的统计方法。一、 统计分组的概念 总体的差异性是统计分组的客观依据;统计分组的目的在于把同质总体中的差异性揭示出来。 二、统计分组的作

3、用 (1) 划分现象的类型类型分组 例表24(P43)(2)揭示现象内部结构结构分组 例表25(P43)(3)分析现象之间的依存关系分析分组 例表26(43)揭露社会经济现象的类型,反映各类型的特点。 类型分组 类型2000年2001年2002年2003年农业13 873.614 462.814 931.5 14870.1林业936.5938.81 033.51239.9牧业 7 393.17 963.18 454.69538.8渔业 2 712.62 815.02 971.13137.6合计24 915.826 179.627 390.829691.8例单位:亿元说明社会经济现象的内部结构。

4、 结构分组 年份2000200120022003第一产业16.415.815.314.6第二产业50.250.150.452.5第三产业33.434.134.333.1合计100.0100.0100.0100.0例我国国内生产总值构成(%)研究经济现象之间的依存关系。 分析分组 耕作深度分组(cm)地块数平均收获率(斤/亩)10-12 740012-141046014-161654016-1818-2012 5620680例某乡某种农作物的耕作深度与收获率的关系 三、统计分组的原则 1组内同质、组间异质原则 2穷尽原则 3互斥原则四、 统计分组的种类 (1)按分组标志的多少分 : 对社会经济现

5、象需要从各方面进行观察和分析研究,需要采用一系列相互联系、相互补充的标志对现象进行多种分组,这些分组结合起来构成一个体系,叫做分组体系。 简单分组 按一个标志对总体进行分组复合分组 按两个或两个以上标志对同一总体进行分组 四、 统计分组的种类 (2)按分组标志的性质分 : 品质分组 按品质标志进行的分组。 变量分组 按数量标志进行的分组五、统计分组的方法1. 品质(标志)分组方法 按品质标志分组,即选择反映事物属性差异的品质标志作为分组标志进行分组。 2. 变量(数量标志)分组的方法 变量分组,即选择反映事物数量差异的数量标志进行分组,确定各组在数量上的差别,并通过数量上的变化来区分各组的不同

6、类型和性质差异。 包括: 单项式分组 组距式分组 对于组距式分组来说,根据各组组距是否相等,又分为: 等距分组各组组距都相同的变量分组;例表3-13. 异距分组各组组距有差异的变量分组; 例3-14. 组距式分组的假定条件变量在各组内的分布是均匀变化的。 组距式分组的原则不重复、不遗漏 在重叠式分组中一般有“上限不在内”的原则。变量分组的相关概念:组限组距两端的数值。分为上限和下限。 组距某一组的上限和下限的距离,分等距和异距。全距分组数列中最大值的上限与最小值的下限之差。组中值组的上限和下限的中间值。 按组限的完备程度不同,分:开口式分组:最低组与最高组不封口。例:成绩60分以下,90分以上

7、。闭口式分组:例40-60分,90-100分。 组距=上限-下限第三节 分配数列 一、分配数列的概念和种类 统计总体按照某一标志分组以后,用以反映总体各单位在各组的分配情况的统计数列,称分配数列,又可称次数分配,或次数分布。 1.概念 例月工资分组(元)工人数(人)占总数比重(%)2000 以下210 39.62000-2500187 35.32500 以上133 25.1合 计530100.0 组别(变量) 次数(频数) 频率(比率)2.种类一、分配数列的概念和种类 以分组标志特征不同分为:品质数列变量数列例 某班学生的性别构成情况 按性别分组绝对数人数比重(%)男30 75女10 25合计

8、40100 组别 次数 频率 品质数列 变量数列 单项变量数列(单项数列) 按每个变量值分别列组编制数列,适用于不连续变量或变量能以整数表示,其变动范围不大时。 组距变量数列(组距数列) 按组距分组编制数列。适用于连续变量或变量可用小数表示,其变动范围较大时。 单项数列见例如下: 某厂第二季度工人平均日产量 工人平均日产量(件)工人人数(人)2 103 154 305 406 20合计115从另一角度看,变量数列分为: 连续变量数列 可有小数,采取组距式。 非连续变量数列 整数,采取单项式或组距式 (例:一个地区的企业按职工人数分组)。 1、整理数据资料,确定全距 对于一个杂乱无章的原始资料,

9、把标志值按大小顺序排列后所得的最大值与最小值之差就是全距。 2.确定变量数列的形式 确定变量数列的形式,也就是确定变量数列是编制单项式数列还是组距式数列。二、变量数列的编制方法 3.确定组数和组距 在编制等距数列的情况下,组数、组距和全距存在下列关系: 原则:(1)要尽可能反映出总体单位的分布情况及集中趋势;(2)要尽可能区分出组与组之间性质上的差异。考试成绩(分)人数(人)56-60 2 60-10038合计40例若将考试成绩仅分为不及格与及格两组,则可编成如下组距数列: 某班学生统计学考试成绩表若把上表改变为如下统计表,则基本上能准确反映总体的分布特征。某班学生统计学考试成绩表考试成绩(分

10、)人数(人)比重(%)50-60 2 5.060-70 7 17.570-8011 27.580-9012 30.090-100 8 20.0合计40100.04.确定组限和组中值 关于组限问题 当组距组数确定后,只需划分各组数量界限,便可编制组距数列。一般来讲,组限应是决定事物性质的数量界限,具体划分时应注意以下几点:第一,组限确定应当有利于表现各变量值实际分布的规律性。 第二,最小组下限要略低于最小变量值,最大组上限要略高于最大变量值。 第三,如果变量值相对集中,无特大或特小极端值时,则采用闭口式;反之,如果变量值相对比较分散时,则采用开口式。例已知组距为5,组数为7,最大值39,最小值5

11、,怎样分组?按分法(c)较合适(a)(b)(c)1-53-85-10 5-10 8-1310-1510-1513-1815-2015-2018-2320-2520-2523-2825-3025-3028-3330-3530-3533-3835-40上组限不在内适用于越大越好的变量,如产值。 适用于越小越好的变量,如成本。下组限不在内对连续变量,组数也要连续。在登记次数时,习惯上遵守:对不连续变量,组与组间是间断的。 关于组中值问题闭口式分组的组中值求法: 关于组中值问题开口式分组的组中值求法: 三、累计频数与累计频率 向上累计次数(上限)即较小制累计。每一组的累计次数表示小于该组上限(变量)值

12、的次数共有多少。 向下累计次数(下限)即较大制累计。每一组的累计次数表示大于该组下限(变量)值的次数共有多少。例考分次 数向上累计次数(上限)向下累计次数(下限)人数(人)比率(%)人数(人)比率(%)人数(人)比率(%)50-60 2 5.0 2 5.040100.060-70 7 17.5 9 22.538 95.070-8011 27.520 50.031 77.580-9012 30.032 80.020 50.090-100 8 20.0 40100.0 8 20.0合计40100.0-某班统计学考试成绩次数分配四、 次数分布的特征 1.次数分布的表示方法 表示法 即用统计表来表示次

13、数分布。 图示法 即用统计图来表示次数分布直方图折线图曲线图直方图(或次数分配曲线图)仍以上例考试成绩数据,画成如下直方图: 405060708090100110若组距不等的话,先计算频数密度,然后据此画直方图:按工人年龄分组(岁)组距人数(人)标准组距人数( 人)频数密度=频数/组距15-20 5 1717 3.420-25 5 2828 5.625-30 5 4040 8.030-35 5 7070 14.035-4510 65 32.5 6.545-50 5 1010 2.0合 计 -230- -直方图例10152025303540455055折线图在直方图的基础上连接各条形顶边的中点成

14、折线图。如下图红笔围成的,即为次数分配曲线图: 405060708090100110折线图还可用来表示累计次数分布(仍以上例数据):曲线图是组数趋向于无限多时折线图的极限描 绘,是一种理论曲线。向下累计向上累计2.次数分布的主要类型 一般次数分布呈正态分布曲线,或称正态曲线 钟型分布 Y Y 右偏型(上偏型) 左偏型(下偏型) X X 很多是偏态分布曲线,或称偏态曲线 还有其他形态J型分配曲线U型分配曲线双峰曲线第四节 统计表 一 统计表的结构和内容 例分组总产值(万元)职工人数(人)劳动生产率(元/人)P123大型中型小型合计 2005年某月某公司各企业劳动生产率统计表 单位_横栏标题 主词

15、宾词总标题纵栏标题数据资料(指标数值)从形式上看:统计表由总标题、横行标题、纵栏标题、指标数值构成。从内容上看:统计表由主词和宾词两部分构成。主词说明总体或总体的分组。宾词用哪些指标数值来说明总体或总体的分组。 二 统计表的特点 开口式上下有基线编号:主词一般按A、B、C,宾词按1、2、3有计量单位表中不允许有空格:若不需要此资料则用“-”;暂缺某资料则用“”三 统计表的分类简单表总体未分组 分组表总体按一个标志进行分组复合表总体按二个或二个以上标志进行复合分组某年某公司所属两企业自行车合格品数量表厂别合格品数量(辆)甲厂 5000乙厂 7000合 计 12000例某年某地区工业增加值和职工人数项目增加值(万元)职工人数(人)内资企业 大型9 750 13 800 中型8 600 45 000 小型4 200 10 050外商投资经营企业 大型7 300

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论