统计学3数据的整理和展示_第1页
统计学3数据的整理和展示_第2页
统计学3数据的整理和展示_第3页
统计学3数据的整理和展示_第4页
统计学3数据的整理和展示_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章数据的整理和展示统计调查统计整理统计分析统计工作的三个中心阶段

第一节统计数据的整理一、数据整理的概念和作用统计整理是指根据统计研究的目的,将统计调查所得的原始资料(也称初级资料)进行科学的分类和汇总;或对已经加工的综合资料(也称次级资料)进行再加工,为统计分析准备系统化的、条理化的综合资料的工作过程。

统计整理是统计调查的继续、统计分析的前提。二、统计整理的步骤(一)设计和编制统计资料的整理方案。(二)对原始资料进行审核。(三)用一定的组织形式和方法,对原始资料进行排序、分组、汇总和计算。(四)对整理好的资料再一次进行审核,改正在汇总过程中发生的各种差错。(五)编制统计图表。(六)统计数据的积累和保管。三、统计整理的组织方式

1、逐级整理2、集中整理3、逐级整理与集中整理相结合主要方法分组汇总统计表统计图汇总手工汇总计算机汇总四、统计整理的方法第二节、统计分组

一、统计分组的概念统计分组是根据统计研究的目的和研究对象的特点,将统计总体各个单位按照一定的标志划分为若干性质不同的部分或组。

统计分组的两方面涵义:

对总体而言,是“分”,即将总体中的各个个体按照它们的差异性区分为若干部分;

对个体(总体单位)而言,是“合”,即将性质相同的个体组合起来。

即对总体实行异质分解,对总体单位实行同质组合。即组内同质性,组间差异性分组分组前分组后25%33%42%(1)划分社会经济现象的类型二、作用:例:按所有制性质划分,我国现有8种经济类型:国有经济;集体经济;私营经济;个体经济联营经济;股份制经济;外商投资经济;港澳台投资经济

(2)揭示社会经济现象的内部结构和比例关系例:上海市按GDP计算的三次产业结构(%)1980年 1990年1996年 1997年GDP 100 100100100 第一产业 3.2 4.3 2.5 2.3 第二产业 75.7 63.8 54.5 52.2 第三产业 21.1 31.9 43.0 45.5 (3)研究现象之间的依存关系例:某地农民家庭按收入分组的恩格尔系数按收入分组(元)<200<300<400<500<600<800<1000恩格尔系数(%)64.960.256.754.450.549.943.6

(1)科学性原则(2)完整性原则(穷尽原则)——即应使总体中的每一单位都应有组可归,或者说各分组的空间足以容纳总体所有的单位。(3)互斥原则(不相容性)——即总体中任一单位只能归入某一组。

三、统计分组的原则和方法1、统计分组的原则

2、统计分组的方法统计分组的关键在于正确选择分组标志。(1)分组标志的选择——原则是:1)从研究目的出发选择分组标志;2)选择最能反映现象本质特征的分组标志;3)根据事物所处的具体历史条件和经济条件选择分组标志。(2)分组方法(统计分组的种类)1)、按分组标志的性质不同,分为品质分组(或称属性分组)和数量分组(或称变量分组)。

品质分组——按品质标志进行的分组。数量分组——按数量标志进行的分组。、按分组的作用和任务不同,分为类型分组、结构分组和分析分组。

类型分组——将复杂现象分为若干性质不同部分的分组。结构分组——表明总体结构的分组。分析分组——分析现象间依存关系的分组。2)、按采用分组标志多少不同的分组方法

简单分组——对总体各单位只采用一个标志进行分组。

平行分组体系——对总体各单位同时采用两个或两个以上的标志进行并列分组。(表3-4)

复合分组——对总体各单位同时采用两个或两个以上的标志进行层叠分组。(表3-5)四、统计分类标准化和国民经济中常用的统计分组

第三节次数分布一、次数分布数列的概念和种类1、次数分布数列的概念

在统计分组的基础上,将总体中的所有单位按组归类整理,形成总体中各个单位数在各组间的分布,叫做频(次)数分布,将各组组别与次数依次编排而形成的数列叫做次数分布数列,简称为分布数列。次数分布(分布数列)是一种重要的分组资料,反映总体单位在各组的分布状态。基本形式:分组单位数(频数)频率合计………100次数分布频率分布一、次数分布数列的概念和种类2、次数分布数列的种类按分组标志特征的不同,分布数列可以分为两种:品质分布数列与变量分布数列。(1)品质分布数列

(2)按数量标志分组则应按照研究目的及研究对象的特点确定相应的组数,划分相应的组限。按数量标志分组即变量分组,有两种:

单项式分组——单项式分组即将某一变量的每一个变量值作为一组。组数及组限是明确的。*单项式分组组距式分组变量分布数列的分类见P56图示*

组距式分组——在连续变量或变量值较多的情况下,可采用组距分组。它将全部变量值依次分为若干个区间,并将这个区间的变量值作为一组。

①连续型变量——相邻两组的上、下限采用同限,且遵循“下闭上开”(即上限不在内)的原则。“上限在不内”原则:在连续组距式分组中,以同一个数值作为相邻两组共同的界限,统计上规定,凡是总体某一个单位的变量值是相邻两组的界限值,这一个单位归入作为下限值的那一组内。②离散型变量——相邻两组的上、下限间断,且采用差数为“1”的形式。

——相邻两组的上、下限重叠。下限,上限:组距式分组的每一组变量值中,其最小值为下限,最大值为上限。组限:相邻两组的界限。间断组距式分组:组限不相连的组距式分组。连续组距式分组:组限相连(或称相重叠的),即以同一数值作为相邻两组的共同界限的组距式分组。离散型变量,可间断组距式分组,也可连续组距式分组。连续型变量,只能采用连续组距式分组。开口式分组——第一组缺下限、最末组缺上限闭口组——各组上下限齐全组距:上下限之间的距离。连续式分组的组距计算公式:组距=本组上限–本组下限间断式分组的组距计算公式:组距=本组上限–本组下限+1 等距分组:标志值在各组保持相等的组距,即各组的标志值变动都限于相同的范围。一般用于标志值变动比较均匀的场合。异距分组:各组的组距不相等。开口组的组距:以相邻组的组距为本组的组距。组中值:上下限之间的中点数值称为组中值,组中值的计算公式:计算平均指标或进行其它统计分析时,常以组中值来代表各组标志值的平均水平。组数组数=全距/组距组数——依经验确定,一般分为3~7组。缺下限开口组组中值=该组上限-1/2邻组组距,缺上限开口组组中值=该组下限+1/2邻组组距。闭口组组中值=(上限+下限)÷2

二、变量数列的编制1、单项变量数列的编制

适用于变量值个数不多的离散型变量第一步:将调查获得的原始资料按数值大小依次排列第二步:确定各组的标志值和组数。第三步:计算各组的次数和频率。第四步:按变量值大小顺序编制单项变量数列。二、变量数列的编制2、组距变量数列的编制适用于标志值比较多的离散型变量和连续性变量

第一步:将调查获得的原始资料按数值大小依次排列起来,并确定最大值、最小值和全距。R(全距)=最大值-最小值。第二步:确定组数和组距。第三步:确定组限和组限的表示方法。第四步:计算各组次数和频率,编制成组距数列。【例】某生产车间50名工人日加工零件数如下(单位:个):117122124129139107117130122125108131125117122133126122118108110118123126133134127123118112112134127123119113120123127135137114120128124115139128124121107108108110112112113114115117

117117118118118119120120121122

122122122123123123123124124124125125126126127127127128128129130131133133134134135137139139采用单变量值分组形成的频数分布表某车间50名工人日加工零件数分组采用组距式分组形成的频数分布表三、次数分布的特征对称分布右偏分布左偏分布正J型分布反J型分布U型分布图3-1.2.3几种常见的次数分布*某地企业规模分组表按职工人数分组企业个数频率(%)200人以下11.7200—29935.0300—39958.3400—4991626.7500—5992033.3600—699915.0700—79946.7800人以上23.3合计60100.0*P70习题、累计频数与累计频率

累计频数(或频率)可以是向上累计频数(或频率),也可以是向下累计频数(或频率)。

向上累计频数(或频率)分布,其方法是先列出各组的上限,然后由标志值低的组向标志值高的组依次累计频数(或频率)。某组向上累计频数表明该组上限以下的各组单位数之和是多少,某组向上累计频率表明该组上限以下的各组单位数之和占总体单位数的比重。

向下累计频数(或频率)分布,其方法是先列出各组的下限,然后由标志值高的组向标志值低的组依次累计频数(或频率)。某组向下累计频数表明该组下限以上的各组单位数之和是多少,某组向下累计频率表明该组下限以上的各组单位数之和占总体单位数的比重。

累计频数(或频率)分布曲线,可用以研究财富、土地和工资收入的分配是否公平。这种累计分布曲线最早由美国洛伦茨博士提出的,故又称洛伦茨曲线图。其绘制方法如下:

1.将分配的对象和接受分配者的数量均化成结构相对数并进行向上累计2.纵轴和横轴均为百分比尺度,纵轴自下而上,用以测定分配的对象(如一国的财富、土地或收入等),横轴由左向右用以测定接受分配者(如一国的人口)。3.根据计算所得的分配对象和接受分配者的累计百分数,在图中标出相应的绘示点,连接各点并使之平滑化,所得曲线即所要求的洛伦茨曲线。第四节:统计数据的图表展示从统计图表获取信息用统计图表表达信息统计图表进入寻常百姓家对《青年报》2007年2月15日的调查带有统计数字的文字随处可见,如3天近百个咨询电话,50余热心人将牵手空巢老人零点公司最新调查显示,独生子女夫妻流行分居过年截至2006年底,全国657个城市中,已经有512个城市建立了廉租住房制度,占城市总数的77.9%对《青年报》的调查(续)统计图表主要在财经&证券版

一、统计表1、统计表的概念和作用统计调查所取得的原始资料,经过整理,得到说明社会现象及其发展过程的数据,把这些数据按一定的顺序排列在表格上,就形成了统计表。广义的统计表包括统计工作各个阶段中所用的一切表格:调查表,汇总整理表,计算分析表。狭义的统计表专指分析表和容纳各种统计资料的表格,也就是通常所说的统计表。2、统计表的结构可以从表式和内容两个方面来认识。1.从表式上看,统计表是由纵横交叉的线条组成的一种表格,表格包括总标题、横行标题、纵栏标题和指标数值四个部分。2.从内容上看,统计表由主词栏和宾词栏两个部分组成。主词栏是统计表所要说明的总体及其组成部分;宾词栏是统计表用来说明总体数量持征的各个统计指标。统计表的结构表2-51997~1998年城镇居民家庭抽样调查资料项目单位1997年1998年一、调查户数二、平均每户家庭人口数三、平均每户就业人口数四、平均每人全部收入五、平均每人实际支出#消费性支出非消费性支出六、平均每人居住面积户人人元元元元平方米378903.191.835188.544945.874185.64755.9411.90390803.161.805458.345322.954331.61987.1712.40资料来源:《中国统计摘要1999》,中国统计出版社,1999,第79页。注:1.本表为城市和县城的城镇居民家庭抽样调查材料。2.消费性支出项目包括:食品、衣着、家庭设备用品及服务、医疗保健、交通和通讯、娱乐教育文化服务、居住、杂项商品和服务。行标题总标题列标题数字资料附加统计表的制作要求(1)(1)统计表的各种标题,特别是总标题的表达应该十分简明、确切,概括地反映出表的基本内容,总标题还应该标明资料所属的地点和时间。(2)统计表的内容要扼要而不庞杂,无论主词(即统计表所要说明的总体及其分组)还是宾词(即用来说明主词的各种统计指标)分组层次不宜过多,为使统计表长宽适中,必要时,可将主词与宾词互换位置。(3)表中数字应填写整齐,对准位数。表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一.当数字为0或因数小可略而不计时,要写上0;当缺乏某项资料时,用符号“…”表示;无数字的空格,用符号“―”表示。统计表的制作要求(2)(4)统计表中必须注明数字资料的计量单位。当全表只有一种计量单位时,可以把它写在表的右上方;当表中需要分别注明不同单位时,横行的计量单位,可专设“计量单位”一栏,纵栏的计量单位,要与纵栏标目写在一起,用小字标写。(5)统计表的表式,一般是“开口”式的,即表的左右两端不划纵线;表的上下端基线通常要划粗线,其余用细线表示。(6)必要时,统计表应加注说明或注解。例如某些指标有特殊的计算口径,某些资料只包括一部分地区,某些数字是由估算来插补的等等,都要加以说明。此外还要注明统计资料的来源,以便查考。说明或注解一般写在表的下端,说明或注解不宜太多。

二、统计图

统计图是用几何学的点、线、面或具体事物的形象所构成的用来描述统计资料的图形。【例】某生产车间50名工人日加工零件数如下(单位:个):1171221241291391071171301221251081311251171221331261221181081101181231261331341271231181121121341271231191131201231271351371141201281241151391281241211、直方图(Histogram):用矩形的宽度和高度来表示频数分布的图形。高度表示每一组的次数,宽度表示各组的组距。等距分组表表2-6某车间50名工人日加工零件数分组表按零件数分组频数(人)频率(%)105—110110—115115—120120—125125—130130—135135—140358141064610162820128合计50100频数(人)1512963105110115120125130135140日加工零件数(个)我一眼就看出来了,大多数人的日加工零件数在120~125之间!图2-1某车间工人日加工零件数的直方图2、折线图折线图也称频数多边形图是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来形成的多边形图折线图的两个终点要与横轴相交,做法是:第一个矩形的顶部中点和最后一个矩形顶部中点分别通过竖边中点连接到横轴折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的1512963105110115120125130135140日加工零件数(个)频数(人)折线图的绘制图2-4某车间工人日加工零件数的折线图2、折线图3、曲线图:在作直方图时,如果数据不断增多,组距不断缩小,直方图中的矩形将逐渐变窄,顶端将渐渐珠连使折线接近于一条光滑曲线,这条曲线称为次数分布曲线,或称为次数密度曲线,近似于概率密度曲线。次数分布曲线的三种类型:钟型分布曲线,U型分布曲线和J型分布曲线。

次数分布曲线的三种类型对称分布右偏分布左偏分布正J型分布反J型分布U型分布图2-9几种常见的频数分布4、条形图(Barchart)用宽度相同的条形的高度或长短来表示数据变动的图形。图2.1某城市居民关注不同类型广告的人数分布表3-8某城市居民关注广告类型的频数分布广告类型人数(人)比例频率(%)商品广告服务广告金融广告房地产广告招生招聘广告其他广告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合计20011005、饼图也叫圆形图(Piechart):

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论