第三章【统计整理】_第1页
第三章【统计整理】_第2页
第三章【统计整理】_第3页
第三章【统计整理】_第4页
第三章【统计整理】_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章统计整理第三章统计整理第三章第三章 统计整理统计整理第一节第一节 统计整理概述统计整理概述第二节第二节 统计分组统计分组第三节第三节 统计汇总和统计表统计汇总和统计表第四节第四节 次数分布次数分布一、统计整理概念第一节第一节 统计整理概述统计整理概述二、统计整理的步骤 (一)统计整理方案包括(一)统计整理方案包括: 1、正确选择分组标志及分组方法、正确选择分组标志及分组方法 2、确定汇总指标与综合表、确定汇总指标与综合表 3、确定统计汇总的形式、确定统计汇总的形式 4、确定数据审查的内容、确定数据审查的内容(二)对统计资料进行审核、检查、订正(二)对统计资料进行审核、检查、订正 1、对原

2、始资料审核的内容包括、对原始资料审核的内容包括 (1)准确性:审核的重点)准确性:审核的重点 (2)及时性)及时性 (3)完整性)完整性 2、对次级资料审核的内容包括、对次级资料审核的内容包括 (1)准确性)准确性 (2)完整性)完整性 (3)适用性)适用性 (4)时效性)时效性(三)对统计资料进行分组、编码和汇总(三)对统计资料进行分组、编码和汇总(四)编制统计表、绘制统计图(四)编制统计表、绘制统计图(五)系统积累资料(五)系统积累资料第二节第二节 统计分组统计分组 分组标志是划分数据的标准或依据分组标志是划分数据的标准或依据 什么是分组标志什么是分组标志选择分组标志的原则选择分组标志的原

3、则1.根据研究的目的和任务选择根据研究的目的和任务选择2.选择最能反映现象本质的标志选择最能反映现象本质的标志3.根据现象所处的历史条件和经济条件选择根据现象所处的历史条件和经济条件选择(一一)正确选择分组标志正确选择分组标志 步骤步骤1.选择分组标志选择分组标志2.划分各组界限划分各组界限按品质标志分组按品质标志分组按数量标志分组按数量标志分组确定组与组之确定组与组之间的数量界限间的数量界限关键关键 存在问题存在问题1、分组太多、分组太多2、组与组之间的、组与组之间的 界限不明显界限不明显品质标志品质标志:性别、职业、所有制等:性别、职业、所有制等。如不同品牌饮料市场占有率如不同品牌饮料市场

4、占有率饮料品牌饮料品牌人数人数百分比百分比(%)(%)可口可乐可口可乐旭日升冰茶旭日升冰茶百事可乐百事可乐汇源果汁汇源果汁露露露露15151111 9 9 6 6 9 930302222181812121818合计合计5050100100数量标志:年龄、产量、利润等。数量标志:年龄、产量、利润等。 含义含义:以一个变:以一个变 量值作为一组。量值作为一组。按照数量标志,可以进行单项式分组、组距式按照数量标志,可以进行单项式分组、组距式分组。分组。含义含义:将变量划分为:将变量划分为若干区间,在各个区若干区间,在各个区间内将总体进行分组间内将总体进行分组的方式。的方式。单项式分组单项式分组组距式

5、分组组距式分组单项式分组单项式分组表表3 35 5 某社区家庭户拥有孩子数情况表某社区家庭户拥有孩子数情况表 孩子数(个)孩子数(个)户数户数百分比(百分比(% %)0 01 12 23 315015020020010010050503030404020201010合计合计500500100100组距式分组组距式分组表表3 37 7 某工厂工人完成生产定额情况表某工厂工人完成生产定额情况表 按成绩分组(分)按成绩分组(分) 工人数(个)工人数(个)百分比(百分比(% %)6060以下以下606070 0707080808080909090100901001 11111161621211 12

6、22222323242422 2合计合计5050100100 1.简单分组:对总体按简单分组:对总体按一个标志一个标志分组分组2.平行分组体系:将几个简单分组平平行分组体系:将几个简单分组平 行排列而形成的分行排列而形成的分 组体系组体系会计二班全体学生(会计二班全体学生(3636人)人)按性别分组按性别分组按民族分组按民族分组按年龄分组按年龄分组男男生生2323人人女女生生1313人人汉汉族族3232人人男男生生 4 4人人1616岁岁以以上上2626人人1616岁岁以以下下1010人人平行分平行分组体系组体系 1.复合分组:对总体按两个或两个以上复合分组:对总体按两个或两个以上 标志分组标

7、志分组 注意:注意: (1)组内的进一步细分组内的进一步细分 (2)先按主要标志分组先按主要标志分组 (3) 分组标志不宜太多,否则分组标志不宜太多,否则 组数太多太复杂组数太多太复杂 2.复合分组体系:几个复合分组组成的复合分组体系:几个复合分组组成的 分组体系分组体系会计二班全体学生(会计二班全体学生(3636人)人)男生(男生(2323)女生(女生(1313)1616岁岁以以上上1717人人1616岁岁以以下下3 3人人复合分复合分组体系组体系汉族汉族(20)(20)蒙族蒙族(3)(3)1616岁岁以以上上 6 6人人1616岁岁以以上上 2 2 人人1616岁岁以以上上 1 1人人16

8、16岁岁以以上上2 2人人1616岁岁以以上上1 1人人汉族汉族(10)(10)蒙族蒙族(3)(3)1616岁岁以以上上 4 4人人第三节第三节 频数分布频数分布iiifffN频率一、次数分布的概念和种类(一)次数分布的概念(一)次数分布的概念次数次数:又称为频数,分配在各组的单位数:又称为频数,分配在各组的单位数频率频率:各组次数与总次数的比率(比重):各组次数与总次数的比率(比重)次数分布次数分布表表3 37 7 某工厂工人完成生产定额情况表某工厂工人完成生产定额情况表按销售额分按销售额分组(万元)组(万元)频数频数f f频率频率f/ff/f252530303030353535354040

9、40404545454550504 46 615159 96 610.010.015.015.037.537.522.522.515.015.0合计合计4040100.0100.0(二)分配数列的种类(二)分配数列的种类分配数列分配数列变量数列变量数列品质数列品质数列组距变量数列组距变量数列单项变量数列单项变量数列异距数列异距数列等距数列等距数列等距分组等距分组表表3 37 7 某工厂工人完成生产定额情况表某工厂工人完成生产定额情况表 按成绩分组(分)按成绩分组(分) 工人数(个)工人数(个)百分比(百分比(% %)6060以下以下606070 070708080808090909010090

10、1001 11111161621211 12 22222323242422 2合计合计5050100100异距分组异距分组表表3 38 8 某地区人口年龄分布情况某地区人口年龄分布情况 人口年龄分组人口年龄分组 人口数(万人)人口数(万人)百分比(百分比(% %)2 2岁以下(婴儿组)岁以下(婴儿组)2 27 7岁(幼儿组)岁(幼儿组)7 71818岁(学龄儿童组)岁(学龄儿童组)18185555岁(劳动力人口组)岁(劳动力人口组)5555岁以上(老年组)岁以上(老年组) 1 1 6 6 12 12 24.6 24.6 8.1 8.1 1.9 1.9 11.6 11.6 23.2 23.2 4

11、7.6 47.6 15.7 15.7 合计合计51.751.7100100组距数列中的相关概念组距数列中的相关概念每组变量取值范围的中点数值 指分组的数目各组变量值之间的最大距离, 上下限之差最大变量值与最小变量值之差指每组两端表示各组界限的变量值,各组的最小值为下限,最大值为上限缺下限:缺下限:缺上限:缺上限:组中值的计算组中值的计算2下限上限组中值销售额(万销售额(万元)元)商店数商店数(个)(个)每百元商品销售每百元商品销售额中支付的流通额中支付的流通费(元)费(元)50以下以下50100100200200300300以上以上102030251514.211.410.19.28.5上组限

12、上组限U下组限下组限L如:组距如:组距d=U-L=100-50=50(万元)(万元)如:组中值如:组中值=(U+L)/2 =(100+200)/2=150(万元)(万元)组距组距=全距全距组数组数全距全距=最大值最大值-最小值最小值二、变量数列的编制q对于连续变量,相邻组组限必须重叠;对于连续变量,相邻组组限必须重叠;q对于离散变量,相邻组组限可以对于离散变量,相邻组组限可以间断间断,也可,也可重叠重叠;q遵循遵循“上限不在其内上限不在其内”原则;原则;q当有极大值或极小值时,首末两组可使用当有极大值或极小值时,首末两组可使用“以下以下”及及“以上以上”的开口组。的开口组。7878898992

13、9266668080525277779696636382828080757548487474636371718888909067677171888856566060727255557575848477776666909073737878848466665959636380809090747466668181707066667474828275758080818166667878v 组限组限频数频数比重比重%60以下以下51060701122708016328090132690分以上分以上510合计合计50100%累计频数(频率)累计频数(频率) 从变量值低的组开始向变量值高从变量值低的组开始向

14、变量值高的组累计,说明某一组上限以下各的组累计,说明某一组上限以下各组的累计频数(频率)。组的累计频数(频率)。 从变量值高的组开始向变量值低从变量值高的组开始向变量值低的组累计,说明某一组下限以上各的组累计,说明某一组下限以上各组的累计频数(频率)。组的累计频数(频率)。三、次数分布特征(一)次数分布的表示方法(一)次数分布的表示方法1、表示法、表示法向上累计向上累计向下累计向下累计 4040个企业按产品销售收入分组表个企业按产品销售收入分组表按销售收入分按销售收入分组(万元)组(万元)企业数企业数( (个个) )频率频率(% %)向上累计向上累计向下累计向下累计企业数企业数频率频率企业数企

15、业数频率频率100100以下以下100100110110110110120120120120130130130130140140140140以上以上5 59 912127 74 43 312.512.522.522.530.030.017.517.510.010.07.57.5合计合计4040100.0100.05142633374012.535.065.082.592.5100.04035261473100.087.565.035.017.57.52、图示法、图示法(1)直方图)直方图(2)折线图)折线图(3)曲线图)曲线图次数次数分组分组直方图与折线图直方图与折线图(一)次数分布的特征(一

16、)次数分布的特征1、钟形分布、钟形分布54321第四节第四节 统计表统计表按照一定结构和顺序设计的表格按照一定结构和顺序设计的表格列标题列标题行标题行标题数字资料数字资料总标题总标题2008年浙江省各地市年浙江省各地市GDP 单位:亿元单位:亿元地市地市GDP第一产业第一产业第一产业第一产业 第一产业第一产业杭州杭州4781.164781.16178.64178.642389.382389.382213.142213.14宁波宁波3964.053964.05167.36167.362196.682196.681600.011600.01温州温州2424.292424.2976.6876.681

17、286.761286.761060.851060.85嘉兴嘉兴1815.31815.3105.52105.521085.291085.29624.49624.49湖州湖州1034.891034.8982.6382.63593.56593.56358.7358.7绍兴绍兴2222.952222.95116.65116.651329.121329.12777.18777.18金华金华1681.851681.8589.6189.61903.07903.07689.17689.17义乌义乌493.33493.3315.2815.28223.46223.46254.59254.59衢州衢州580.055

18、80.0561.7161.71317.85317.85200.49200.49舟山舟山490.25490.2549.1849.18226.44226.44214.63214.63台州台州1965.271965.27133.54133.541037.471037.47794.26794.26丽水丽水505.68505.6855.2655.26245.85245.85204.57204.57全省合计全省合计21486.9221486.921095.431095.43 11580.3311580.338811.168811.16q计量单位一致时应放在表右上角;计量单位一致时应放在表右上角;q表的上、

19、下端用粗线或双线封口,左右两表的上、下端用粗线或双线封口,左右两端一般不封口;端一般不封口;q数据栏不能有空白,不应有数字用数据栏不能有空白,不应有数字用-表示。表示。第五节第五节 统计图表统计图表以点、线条、面积等方法描述、以点、线条、面积等方法描述、显示统计数据的形式显示统计数据的形式图图1:1978-2008年温州市年温州市GDP统计分布的类型钟型分布、钟型分布、U U型分布、型分布、 J J型分布型分布钟型分布钟型分布:特征是特征是“两头小,中间大两头小,中间大”。 (如考试成绩分布)(如考试成绩分布)U U型分布:型分布:特征是靠近中间的变量值分布的次数少,特征是靠近中间的变量值分布

20、的次数少,靠近两端的变量值分布的次数多,其形状靠近两端的变量值分布的次数多,其形状宛如英文字母宛如英文字母U U。(如闲暇时间分布)(如闲暇时间分布)J J型分布型分布:特征是次数随着变量值的增大而增多或随特征是次数随着变量值的增大而增多或随变量值的增大而减少,其形状宛如英文大变量值的增大而减少,其形状宛如英文大写字母写字母J J。(如供给和需求曲线)(如供给和需求曲线)图图2:运动项目柱形图运动项目柱形图图图3:学生成绩直方图学生成绩直方图人均纯收入(元)人均纯收入(元)练习题n5.统计分配数列(统计分配数列( )n都是变量数列都是变量数列 都是品质数列都是品质数列 是变量数列或品质数列是变量数列或品质数列 是是统计分组。统计分组。n7.将将25个企业按产值分组而编制的变量数列中,变量值是(个企业按产值分组而编制的变量数列中,变量值是( )n产值产值 企业数企业数 各组的产值数各组的产值数 各组的企业数。各组的企业数。n11.划分连续变量的组限和划分离散变量的组限时,相邻组的组划分连续变量的组限和划分离散变量的组限时,相邻组的组限(限( )n必须重叠必须重叠 前

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论