版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一节统计数据的收集第二节统计数据的整理第三节统计数据的显示
第二章统计数据的收集、整理与显示
第一节统计数据的收集
一、统计数据收集的含义和要求
二、统计数据收集方案设计三、统计数据收集方式
四、统计数据收集方法五、问卷设计
统计数据收集,就是按照统计研究的目的和任务,运用各种科学有效的方式和方法,有针对地收集反映客观现实的统计数据的活动过程。统计数据收集是整个统计活动的基础阶段,通常也称为统计调查阶段。统计数据收集的基本要求:准确性、及时性和完整性。准确性是统计数据收集的核心,及时性是统计数据信息价值的体现,完整性则是统计指标计算和统计分析的需要。一、统计数据收集的含义和要求统计数据的收集四环节统计数据收集方案内容
二、统计数据收集方案设计确定数据收集目的
设计数据收集方案
开展数据收集活动
评估数据收集质量
数据收集目的数据及其类型
数据收集对象和观测单位观测标志和调查表
数据收集方式与方法
数据所属时间和数据收集期限
数据收集地点数据收集的组织
统计数据收集方案用来指导整个统计数据收集工作的纲领性文件,是统计设计在统计数据收集阶段的具体化统计数据收集方案是为开展统计调查而制定的计划,是调查工作顺利进行的保证。调查方案设计的好坏直接影响到调查数据的质量。不同调查任务的数据收集方案在具体内容和形式上会有一定的差别,但包括的主要内容大体是一致的。
统计数据收集方案一般包括以下八个方面的内容:基本内容:⒈数据收集目的;2.数据及其类型;3.数据收集对象和观测单位;4.观测标志和调查表;5.数据收集方式与方法;(为什么调查)(向谁调查)(调查什么)(如何调查)基本内容:6.数据所属时间和数据收集期限;7.数据收集的地点;8.数据收集的组织。(何时调查)把所要观测的标志按逻辑顺序列在一定形式的表格内,就称为调查表(登记表、记录表或问卷)调查表观测标志是根据数据收集目的所确定的调查项目。
调查项目要明确、易懂,避免引起误会或出现差错单一表一览表是指一张调查表只填写一个观测单位的标志表现。是一张调查表可以同时填写多个观测调查单位的标志表现。调查表10教师教学科研调查表姓名性别年龄学历职称专业所讲课程发表论文11教师登记表姓名性别年龄职称学历专业单一表、一览表的应用:①看项目的多少,调查项目多时一般用单一表,反之则用一览表;②看提供单位与观测单位是否一致,一致时常用单一表,不一致时用一览表。课堂讨论:中华牙膏用户市场调查方案设计(一)统计调查方式
所谓统计调查方式,就是运用合适的统计调查手段去收集统计调查对象总体的全部或部分个体的原始数据,也即通过对调查对象总体的全部或部分个体的有关标志特征进行调查或观测的方式来获取统计数据。常用的统计调查方式有普查、抽样调查、重点调查等几种,其中抽样调查最为常用。三、统计数据收集方式统计调查方式:
1、普查
普查是根据特定的统计研究目的而专门组织的一次性的全面调查,用以收集所研究现象总体的全面资料(即总体中的所有个体都是观测单位)。普查的组织方式一般有两种:一是建立专门的普查机构,配备一定数量的普查人员,对观测单位直接进行登记。如我国历次的人口普查等。二是利用观测单位的原始记录和核算资料,颁发调查表,由观测单位按要求填报。如物资库存普查等。普查特点1.为特定目的专门组织的非经常性全面调查2.通常是一次性或周期性的3.一般需要规定统一的标准调查时间4.数据的规范化程度较高5.应用范围比较狭窄总体
2、抽样调查
抽样调查是一种非全面调查,就是从总体中抽取样本,以样本推断总体。根据抽取样本的方式不同,抽样调查可分为概率抽样和非概率抽样两类。
概率抽样是按照随机原则抽取样本,即总体中的每个个体都有已知的、非零的概率被抽取到样本中来。概率抽样从抽样方法上看,可以分为重复抽样和不重复抽样的两种。概率抽样从抽样组织形式上看,可分为简单随机抽样,分层抽样,等距抽样,整群抽样和多阶段抽样五种。概率抽样能够计算抽样误差。
非概率抽样是凭人们的主观判断或根据便利性原则来抽取样本,这时,总体中每个个体被抽取的可能性是难以用概率来表示和计算的。非随机抽样调查又有任意抽样、典型抽样、定额抽样和流动总体抽样等几种。非概率抽样不能计算抽样误差。
3、重点调查
重点调查也是一种非全面调查,是对数据收集对象总体中的部分重点个体进行观测的统计调查方式。所谓重点个体(重点单位),是就调查标志而言,指那些在总体标志总量中占有绝大比重的少数个体(单位)。这些重点个体,虽然只是总体全部个体中的一小部分,但就调查标志而言却有举足轻重的作用。
这些重点单位在全部单位中只是一部分,但它们在所研究现象的总量中却占有绝大比重,因而对它们进行调查就能够反映全部现象的基本情况。例如,要了解全国钢铁生产的增长情况,只要对全国为数不多的大型钢铁企业的生产情况进行调查,就可以掌握我国钢铁生产的基本情况了。
重点调查的单位可以是一些企业、行业、也可以是一些地区、城市。此种调查方式的优点是,所投入的人力、物力少,而又较快地搜集到统计信息资料。一般来讲,在调查任务只要求掌握基本情况,而部分单位又能比较集中反映研究项目和指标时,就可以采用重点调查。
在下列问题中为了得到数据,采用什么调查?为了买校服,了解每个学生衣服的尺寸。商检人员在某超市检查出售的饮料的合格率。对占全市工业总产值五分之一的六个大型企业进行调查,以了解全市工业总产值的基本情况。(二)实验方式
所谓实验方式,就是运用自然科学的试验法,通过观测人为安排条件下试验产生的各种结果并加以记录的方式来获取数据,或通过人为安排条件下的试验来探求某个或某些因素对所研究事物的数量影响程度和作用方式,凭借实验结果来揭示所考察因素与所研究事物之间的数量因果关系。
1、实验的原则
运用实验方式需要遵循下列两个原则:均衡分散性原则和整齐可比性原则。
均衡分散性原则:是指所进行的试验应能把所观测的因素及其状态均衡地分散在因素与状态的所有各种可能的配合之中,以保证试验结果具有较强的代表性。
整齐可比性原则:是指试验考察某个因素的各个状态对所研究事物影响的效应时,其他因素应保持不变的状态,以便保证在该因素各个状态的效应之中能最大限度地排除其他因素的干扰,从而能对所考察因素不同状态的效应进行比较。
2、常用的实验设计(1)完全随机试验。即采用纯随机抽样方式,将各试验观测个体随机地安排到所要试验的因素状态配合之中。(2)随机区组试验。即当各试验观测个体之间存在较大差异而将影响到试验结果时,先将试验观测个体进行分类,一个类作为一个区组,使类内个体之间的差异充分小,然后将区组中的各试验观测个体随机地分配到各个所要试验的因素状态配合之中。
2、常用的实验设计(3)拉丁方试验。所谓拉丁方就是将一组元素编排成行与列相等且每个元素在各行各列都出现一次且只出现一次的正方形方格。(4)正交试验。正交试验是利用正交表来安排试验。所谓正交表就是由1、2、3、4等字码元素构成的、任意两列的同行元素对都形成出现次数相同的完全对的矩阵表。
(三)数据收集误差
数据收集误差观测性误差代表性误差也叫登记性误差或调查性误差,它是在调查观测的各个环节因工作粗心或被观测者不愿很好配合而造成的所收集数据与实际情况不符的误差,包括计量错误、记录错误、计算错误、抄写错误、汇总错误、计算机输入误差等工作误差,以及被调查者不愿或难以提供真实情况的误差,有时还存在调查人员弄虚作假的误差和各种人为因素干扰的误差。这部分误差通常是人为造成的,通过对统计调查资料的严密审核,是可以发现并加以更正的。观测性误差则可能存在于任何统计调查。因样本不能完全代表总体而产生的估计结果与总体真实数量特征不符的误差。根据样本不能完全代表总体的原因不同,代表性误差又分为系统性代表性误差和偶然性代表性误差两种。代表性误差系统性误差偶然性误差系统性误差,是由于抽样框(用以抽取样本的名录)不完善、抽样时违反随机原则、被调查者无回答等因素引起的误差。也叫抽样误差或偶然性误差,是由于抽样的随机性引起的样本结构与总体结构不完全相符而产生的估计结果与总体真值不一致的误差,这种误差在随机抽样中不可避免,但可以计算和控制。偶然性误差只存在于抽样调查。
统计数据收集方法,是指获取被调查对象数据的渠道或途径,常用的方法有直接观察法、通讯法、采访法、登记法等几种。
四、统计数据收集方法直接观察法通讯法是由调查人员到现场对被调查对象进行计量、点数和登记,或对实验结果进行观察和记录,直接取得第一手数据的方法。是调查组织者(例如政府统计部门)把调查表(例如统计报表或调查问卷)邮寄或电子传送给被调查者,被调查者按要求填写后返回给调查组织者的一种数据收集方法。采访法又称询问法,是由调查人员对被调查者进行询问,根据被调查者的答复来收集数据的方法。询问法可分为:面谈调查法是指调查人员同被调查者面对面交谈,当面听取意见,询问有关问题,搜集数据的方法。电话调查法指调查人员利用电话同受访者进行语言交流,从而获得信息的一种调查方式。邮寄调查法是一种标准化调查,指调查者将印制好的调查问卷或调查表格,通过邮政系统寄给选定的被调查者,由被调查者按要求填写后,按约定的时间寄回的一种调查方法。登记法是指当事人根据有关法制法规规定,在开展某些活动或发生某事时,主动到有关机构进行登记,填写有关表格,提供有关统计信息。
(一)问卷的概念与结构
问卷是依据统计研究目的和要求,按照一定的理论假设设计出来的、由一系列问题、项目、备选答案及说明所组成的、向被调查者收集资料的一种工具。问卷按是否由被调查者自己填写可分为自填式问卷和代填式问卷两种。自填式问卷:由被调查者自己填答。代填式问卷:是由调查人员根据被调查者的口头回答来填写。
五、问卷设计问卷的基本结构调查问卷包括以下四个部分:引言问候语问候语常常以短信的方式出现,旨在向被调查者说明调查的目的、意义,放在问卷开头。填写说明即填表须知、交表时间、地点及其他事项说明。问卷编号
问卷的基本结构
被调查者基本情况通常放在问卷的最后,主要是有关被调查者的一些背景资料,该部分所包含的各项问题,可使研究者根据背景资料对被调查者进行分类比较分析。问题和答案该部分是调查问卷的核心,包括了所要调查的全部问题,以及这些问题的所有可供选择的答案。结束语问卷的基本结构
引言
(问候语)村民同志:您好!我们是中国村情调查组成员,今天来调查了解您家2010年的生产和生活情况,目的是研究当前中国农村经济与社会发展中的成绩和问题,为党和政府制定政策提供依据。调查结果不记名、不涉及单个问卷的内容,只是用于全都资料的综合统计。因此,不会影响您家的救济和纳税,也不会给您家带来任何麻烦。谢谢合作!中国社会科学院社会学研究所
2012年1月问卷的基本结构
引言
(填写说明)填写要求:1.请您在所选择答案的题号上画圈2.对只许选择一个答案的问题只能画一个圈;对可选多个答案的问题,请在你认为合适的答案上画圈3.需填写数字的题目在留出的横线上填写4.对于表格中选择答案的题目,在所选的栏目内画勾5.对注明要求您自己填写的内容,请在规定的地方填上您的意见问卷的基本结构
引言
(问卷的编号)1.用于识别问卷、调查者、被调查者姓名和地址等2.便于校对检查、更正错误问卷的基本结构(二)问题的设计
1.问题的种类根据调查内容不同,问题可分为事实性问题、意见性问题和解释性问题。事实性问题:要求被调查者依据现有事实来做出回答,不必提出主观看法。如“您使用什么品牌的牙膏?意见性问题:用于了解被调查者的意见、看法、评价、态度、要求和打算等。如“你喜欢××牌的牙膏吗?”解释性问题:用于了解被调查者行为、意见、看法等产生的原因,了解个人内心深层的动机。如“你为什么要购买××牌的牙膏?”根据回答方式不同,问题可分为开放式问题和封闭问题。开放式问题:也称为自由回答式问题,是指不提供备选答案而需要被调查者自由做出回答的问题。封闭式问题:是指已列出所有可能答案以供选择的问题。开放式问题如:你认为中国当前最重要的问题是什么?封闭式问题请问您目前有出国打算吗?A.是B.否(二)问题设计原则不要直接提社会上禁忌的和敏感性的问题所列问题必须符合客观实际情况问题要尽量精简问题必须是被调查者有能力回答的问题设计原则问题的排列要讲究逻辑性问题不能带有诱导性和倾向性问题的内容要单一问题的语言要简单易懂、标准规范
2.问卷设计原则(1)问题的安排应具有逻辑性
(2)保证答案具有穷尽性和互斥性在实际问卷设计中,设计者常常遇到这样的情况:有些问题的答案如果要将它们全部列出,即使不是不可能也是十分困难的。可以采取列几个主要答案,然后加上一项“其他”。
(3)每一项答案都应有明显的填答标记,答案与答案之间要留下足够的空格。
(4)被调查者熟悉的、简单易懂的问题放在前面,比较生疏、较难回答的问题放在后面。
(5)把能引起被调查者兴趣的问题放在前面,把容易引起被调查者紧张和顾虑的问题放在后面。
(6)把开放式问题放在问卷的结尾部分。
(7)先问行为方面的问题,再问态度方面的问题,最后问有关个人的背景资料。
总的来说,问卷不宜太长,问题不宜太多,一般以回答者能在20分钟时间内完成为宜。第二节统计数据的整理
一、统计数据整理的含义与要求
二、统计数据整理的步骤三、统计分组四、分布数列
所谓统计数据整理,简称统计整理,是指根据统计研究的目的,对统计收集到的数据进行科学的加工处理,使之系统化、条理化和综合化,成为能反映研究对象总体数量特征和满足统计分析需要的统计数据的过程。
一、统计数据整理的含义与要求意义:统计整理是统计工作过程中的中间环节,在整个统计研究过程中,统计数据整理起着承上启下的作用,既是数据收集的继续,又是数据分析的前提,因此要十分强调其科学性、条理性和充分性。
科学性:就是数据整理的分组和汇总必须科学合理,注意质的界限,符合客观事实;
条理性:就是数据整理的过程要层次分明,条理清楚,逻辑关系严密;
充分性:就是运用各种数据整理方法和技术,通过多角度、多方位的加工处理,使整理的结果尽量充分地体现出数据中包含的有用信息,最大程度地满足统计分析的需要。①整理方案设计②数据预处理③统计分组④统计汇总⑤编制统计图表统计数据整理的步骤:资料的准确性、及时性、完整性、注意分组标志的选择整理方案的设计主要是以数据收集方案为基础,围绕统计分析目的,确定需要的统计分组,需要汇总计算的统计指标,数据处理的方法与工具(例如采用什么数据处理软件),以及数据显示的形式等内容。数据预处理是统计整理的先前步骤,是在统计分组、汇总前对原始数据所做的必要工作,包括数据审核、数据筛选和数据排序等。统计分组和汇总是统计整理的关键步骤,就是要根据统计研究的目的和研究对象的特点,通过科学选择分组标志和科学确定分组界限,将观测的个体及其原始数据进行归类,借助必要的数据处理方法和工具,汇总计算出有关统计指标。整理数据的显示是表现统计整理结果的步骤,就是要将统计分组和汇总后的数据,用适当的统计表、统计图显示出来,直观、准确、清楚地表达出研究对象总体的有关数量特征,便于开展统计分析。二、统计数据整理的步骤整理方案的设计数据预处理整理数据的显示统计分组和汇总
整理数据的保存与公布
整理数据的显示是表现统计整理结果的步骤,就是要将统计分组和汇总后的数据,用适当的统计表、统计图显示出来,直观、准确、清楚地表达出研究对象总体的有关数量特征,便于开展统计分析。(一)统计分组的含义与性质
统计分组就是根据统计研究的目的和事物本身的特点,选择一定的标志(一个或多个),将研究现象总体划分为若干性质不同的组或类的一种统计研究方法。
三、统计分组
统计分组具有以下一些重要的性质:首先,统计分组兼有分与合的双重功能,是分与合的对立统一;其次,统计分组必须遵循“穷尽原则”和“互斥原则”,即现象总体中的任何一个个体都必须而且只能归属于某一个组,不能出现遗漏或重复出现的情况。对总体而言,是“分”,即将总体区分为性质相异的若干部分。
对总体单位而言,是“合”,即将性质相同的个体组合起来,在同一组内则保持着相同的性质。
统计分组的目的是要在同质性的基础上研究总体的内在差异性,即尽量体现出分组标志的组间差异而缩小其组内差异。分组分组前分组后25%33%42%(二)统计分组的种类
1.统计分组按照分组标志的多少不同,可以分为简单分组与复合分组。
简单分组是指对总体只按一个标志进行分组,只反映总体某一方面的分布状况和内在结构。
复合分组则是指对总体同时按两个或两个以上的标志进行层叠式的分组。
某车间50名工人日加工零件数分组表按零件数分组频数(人)频率(%)110以下110-114115-119120-124125-129130-134135以上358141064610162820128合计50100简单分组就是各个组按一个标志分组形成的。复合分组则是各个组按两个以上的标志分组形成的。按学历和性别分组人数本科50
男10
女40硕士150
男80
女70
2.统计分组按分组标志的性质不同,可以分为品质分组和数量分组。
品质分组也叫属性分组,是指总体按某一个或某几个品质标志进行分组,反映事物属性差异
。
如人口按性别分组、人口按职业分组数量分组也叫变量分组,是指总体按某一个或某几个数量标志进行分组,反映事物数量差异
。如:看管机器台数分组(0,1,2,3,4,…)又如:按月工资(元)分组(600~650,650~700,700~750,…)对大学生月生活费支出情况进行分组研究:按家庭收入水平分组;按城乡分组;按性别分组;按年龄分组。人口按出生地进行分组研究北方人;南方人;北京人人口按种族进行分组研究白种人;黑种人;黄种人以上分组是否遵循统计分组原则?(一)分布数列的概念与种类
在统计分组的基础上,将总体中的所有个体按组归类排列,并计算出各组的个体数,就形成为频数分布。四、分布数列(一)分布数列的概念与种类分配在各组的个体数,称为频数或次数,各组频数或次数之和称为总频数或总次数,各组频数与总频数之比称为频率。将各组的频数或频率按分组的一定顺序加以排列,就形成为分布数列。分布数列按分组标志的性质不同可以分为两种:即按品质标志分组的品质分布数列和按数量标志分组的变量分布数列。四、分布数列月工资分组(元)工人数(人)占总数比重(%)1000以下21039.61000-200018735.32000以上13325.1合计530100.0
组别(变量)次数(频数)频率(比率)四、分布数列统计分组所形成的各个组各组的频数或频率构成要素分类变量数列品质数列组距式数列单项式数列异距式数列等距式数列品质数列的编制中国体育代表团在悉尼奥运会上获金牌的项目射击射击体操体操乒乓球举重乒乓球羽毛球举重乒乓球羽毛球举重举重跳水跳水跳水乒乓球跳水射击体操羽毛球柔道柔道举重田径羽毛球跆拳道获金牌项目金牌数占总数比例跳水5枚0.1786举重5枚0.1786乒乓球4枚0.1429羽毛球4枚0.1429体操3枚0.1071射击3枚0.1071柔道2枚0.0714田径1枚0.0357跆拳道1枚0.0357(二)变量数列的编制
1.单项式数列的编制
2.组距式数列的编制四、分布数列变量分布数列又有单项式数列和组距式数列之分
家庭按儿童数分组学生按月支出分组0300---4001400---5002500---600变量数列的编制单项式数列以一种变量值表示一个组的变量数列变量是离散型变量变量的不同取值个数较少编制条件:同时具备【例】某车间有20名工人看管机器台数的资料是:2,3,5,2,4,5,2,5,4,3,5,4,5,2,4,4,3,2,4,3,要求根据以上资料编制变量数列。编制结果如下:按看管机器台数分组(台)X工人数(人)f23455465合计20组距式数列是以一个变量区间表示一个组的变量数列,变量值处于一个区间范围的个体属于同一个组。
按考试成绩分组(分)学生人数(人)60以下60~7070~8080~9090以上3714206合计50组距式分组中的一些概念组限上限下限各组变量区间的最大值各组变量区间的最小值组距上限与下限之差组距=上限-下限
组中值每一组中点位置的数值组中值=(上限+下限)÷2开口组缺少上限数值或下限数值的组注意开口组以相邻组的组距作为该组的组距,确定其下限或上限,再计算组中值。缺下限开口组的组中值
=上限-邻组组距值/2缺上限开口组的组中值
=下限+邻组组距值/2某地区100个百货商店月销售额与流通费用情况销售额(万元)商店数(个)每百元商品销售额中支付的流通费(元)50以下50~100100~200200~300300以上102030251514.211.410.19.28.5上组限U下组限L如:组距d=U-L=100-50=50(万元)如:组中值x=(U+L)/2=(100+200)/2=150(万元)组距式分组中的一些概念等距分组异距分组例如60分以下60—70分70—80分80—90分90分以上组中值为(60+50)÷2=55组中值为(90+100)÷2=95各组组距相等的分组称为等距分组。各组组距不全相等的分组称为异距分组。上限不在内原则
等距分组不等距分组工资收入分组(元)年龄分组(岁)800---10000---141000---120014--601200---140060以上间断式分组凡是组限不相连,以整数位断开的分组,称为间断组距式分组。连续式分组凡是组限相连,即相邻组上、下限重叠,称为连续式分组。60分以下60—70分70—80分80—90分90分以上300以下301—400人401—500人501—600人601人以上间断式分组连续式分组组距数列指每个组的变量值是用一个区间来表现的变量数列变量是连续变量;或:变量不同取值个数也较多的离散变量。
编制条件:等距数列异距数列变量值变动区间的长度相等变量值变动区间的长度不完全相等等距数列和异距数列的选择当标志值分布比较均匀时,组距数列的编制应采用等距分组,即各组组距相等。当标志值分布很不均匀时,组距数列的编制应采用异距分组,即各组组距不相等。需要用频数密度(频数密度=频数/组距)反映频数分布的实际状况编制等距数列适用于总体单位的标志值变动比较均匀的情况实例己知某班50个学生统计学期末考试成绩如下,单位(分)435256606363656868697274757575767676767777787980818182828383848484858686868889898990949599100100,要求编制变量数列。组距数列的编制原始数据计算组中值排序确定组限计算变异全距确定组数、组距汇总各组单位数制作组距数列统计表编制步骤或内容判断变量并选择分组标志进行分组编制步骤:⒈求变异全距⒉确定组距及组数确定组距的原则:要能区分各组的性质差异要能反映总体资料的分布特征为方便计算,尽可能为5或10的整数倍R=组距(d)×组数(n)编制等距数列在实际操作中,可以先确定组数,组数的确定参考经验公式:n=1+3.33lgN(N为单位数)3、确定组限对于离散变量,相邻组组限可以间断,也可重叠;对于连续变量,相邻组组限必须重叠;符合“上组限不计入”原则;首末两组可使用“××以下”及“××以上”的开口组。组限的表示方法编制等距数列最低组限数据的最小值最大组限数据的最大值4、计算各组次数5、制作组距数列
按考试成绩分组(分)学生人数(人)60以下60~7070~8080~9090以上3714206合计50某班统计学考试成绩表等距分组表(使用开口组)某车间50名工人日加工零件数分组表按零件数分组频数(人)频率(%)110以下110-114115-119120-124125-129130-134135以上358141064610162820128合计50100(三)频率分布
按顺序列出各组的组别及相应的频率,就构成频率分布。频率分布可以比频数分布更好地体现出总体分布特征。在频数分布的基础上,将各组频数依次累计,就形成累计频数分布。各组累计频数与总频数之比,就形成累计频率分布。四、分布数列累计频数(频率)
从变量值低的组开始,将各组频数(频率)逐次向变量值高的组累计,说明某一组上限以下各组的累计频数(频率)。向上累计向下累计
从变量值高的组开始,将各组频数(频率)逐次向变量值低的组累计,说明某一组下限以上各组的累计频数(频率)。累计(频数)频率人均月消费性支出(元)家庭数(户)频率(﹪)累计频数累计频率(﹪)250~300300~350350~400400~500500~600600以上410161343820322686合计50100人均月消费性支出(元)家庭数频率(﹪)累计频数累计频率(﹪)向上累计向上累计250~300300~350350~400400~500500~600600以上41016134382032268641430434750828608694100合计50100——人均月消费性支出(元)家庭数(户)频率(﹪)累计次数累计频率(﹪)向上累计向下累计向上累计向下累计250~300300~350350~400400~500500~600600以上410161343820322686414304347505046362073828608694100100927240146合计50100————第三节统计数据的显示
一、统计表二、统计图
(一)统计表的概念
经过汇总整理的统计数据,按一定的顺序排列在相应的表格内,就形成为统计表。广义上看,任何用以反映统计资料的表格都是统计表。统计表是表现统计资料的最常用的形式,也是统计分析的重要工具。一、统计表(二)统计表的结构统计表的结构:可以从表式和内容两个方面来认识。
从表式上看,统计表是由纵横交错的线条所构成的一种表格,包括总标题、横行标题、纵栏标题和指标数值四个部分。从内容上看,统计表由两部分组成:主词和宾词。此外,有些统计表还有补充资料、资料来源、注释、填表单位、填表人和填表日期等内容。一、统计表表格包括总标题置于表的正上方
横行标题置于表的左方
纵栏标题置于表的右上方
指标数值置于横行与纵栏交叉处从内容上看:统计表由主词列在横行标题的位置(表的左侧)宾词列在纵栏标题的位置(表的左侧)总标题:即统计表的名称,它扼要地说明该表的基本内容,并指明时间和范围。置于统计表格的正上方。横行标题:即横行的名称,一般放在表格的左方。纵栏标题:即纵栏的名称,一般放在表格的右上方。指标数值:列在橫行和纵栏的交叉处,用来说明总体及其组成部分的数量特征,它是统计表格的核心部分。主词:是统计表所要说明的总体及其组成部分,一般列在表的左方。宾词:是统计表用来说明总体数量特征的各个统计指标,一般列在表的右方。贵州省2010年地区生产总值按三次产业分
地区生产总值(亿元)比上年增长率(%)
第一产业625.0313.59
第二产业1800.121.90
第三产业2177.077.3
合计4602.1615.45纵栏标题指标数值
主词
宾词横行标题总标题2005~2006年城镇居民家庭抽样调查资料项目单位2005年2006年
一、调查户数二、平均每户家庭人口数三、平均每户就业人口数四、平均每人全部收入五、平均每人实际支出#消费性支出非消费性支出六、平均每人居住面积户人人元元元元平方米378903.191.835188.544945.874185.64755.9411.90390803.161.805458.345322.954331.61987.1712.40资料来源:《中国统计摘要2006》,中国统计出版社,2006,第79页。注:1.本表为城市和县城的城镇居民家庭抽样调查材料。
2.消费性支出项目包括:食品、衣着、家庭设备用品及服务、医疗保健、交通和通讯、娱乐教育文化服务、居住、杂项商品和服务。横行标题总标题纵栏标题指标数值附加(三)统计表的种类
统计表按照主词是否分组,以及分组标志多少,可以分为未分组表、简单分组表和复合分组表三种。
(3)复合分组表:主词按两个或两个以上标志分组的统计表。
(1)未分组表:主词未经任何分组的统计表。即主词只按一定顺序罗列总体中每个个体的名称,或者将主词按时间顺序简单排列,也称一览表。
(2)简单分组表:主词只按一个标志分组的统计表。(四)统计表的设计总的要求:简练、明确、实用、美观,便于比较。统计表的设计应注意如下事项:1、线条绘制:我国的统计表上、下两端以粗线绘制,表内纵横线以细线绘制,表格的左右两端一般不划线,采用开口式。2、统计表形状:应设计成由纵横交叉组成的长方形表格,长宽之间应保持适当的比例。3、合计栏的设置:纵栏合计应列在最后一行,横行合计应列在最后一栏。4、标题设计:统计表的总标题,横行、纵栏标题应用简练而又准确的文字表述统计资料的内容。5、指标数值:表中数字应该填写整齐、对准位数。当数字小可忽略不计时,可写上“0”;当缺某项数字资料时,可用符号“…”;不应有数字时用符号“—”表示。6、计量单位:统计表必须注明数字资料的计量单位。全表只有一种单位,就写在表的右上角;有多种计量单位,专设计量单位一栏,或在每个指标后用小字加以注明。7、统计表数字上下位置要对齐。相同数字应全部写上,不能用“同上”等方法表示。8、注解或资料来源:统计表的实际材料,应注明出处。资料不齐或另行推算的,应在表下注明。
统计图是指利用各种图形表现统计资料的形式,是以圆点的多少、直线的长短、曲线的起伏、条形长短、柱状高低、圆饼面积等图形来表现数据的手法。
二、统计图如何用图来表示数据?(一)直方图:用直方形的宽度和高度来表示频数分布的图形,即在直角坐标系上,以横轴表示变量,以纵轴表示频数或频率,以各个宽度为组距、高度为频数或频率的直方块矩形所构成的图形。(二)折线图:在直方图的基础上,将各组直方形顶边线的中点(即由组中值与频数或频率确定的坐标点)用直线连接起来,就形成为折线图。二、统计图直方图的绘制频数(人)1512963105110115120125130135140日加工零件数(个)图3-5某车间工人日加工零件数的直方图我一眼就看出来了,大多数人的日加工零件数在120~125之间!
折线图的制作
折线图也称频数多边形图,是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉。折线图的两个终点要与横轴相交,具体的做法是:起点通常放在距左边最低组半个组距的横轴上,终点通常放在距右边最高组半个组距的横轴上。1512963105110115120125130135140日加工零件数(个)频数(人)折线图的绘制图3-6某车间工人日加工零件数的折线图(三)曲线图:当变量数列的分组数较多、组距较小时,折线图就变成了平滑的曲线图。二、统计图曲线图的绘制
当变量数列的组数无限时,折线便表现为一条平滑曲线。曲线图的绘制方法与折线图基本相同,只是在连接各组次数坐标点时应当用平滑曲线。1512963105110115120125130135140日加工零件数(个)频数(人)曲线图的绘制图3-6某车间工人日加工零件数的折线图(四)累计曲线图:根据累计频数或累计频率分布数列,可以绘制累计分布图。它以分组变量为横轴,以累计频数或累计频率为纵轴,以各组的上限(下限)与累计频数或累计频率为坐标点,平滑连接各点即成向上(向下)累计曲线。
累计曲线图的绘制
累计频数(频率)分布图分为向上累计频数(频率)分布图和向下累计频数(频率)分布图。不论是向上累计还是向下累计均以分组变量为横轴,以累计频数(频率)为纵轴。向上累计曲线是在直角坐标系上将各组组距的上限与其相应的累计频数(频率)构成坐标点,依次用折线(或光滑曲线)相连,即是向上累计曲线。
累计曲线图的绘制
对于向下累计频数分布图,在直角坐标系上将各组组距下限与其相应累计频数(频率)构成坐标点,依次用折线(或光滑曲线)相连,即是向下累计分布曲线图。对称分布右偏分布左偏分布正J型分布反J型分布U型分布几种常见的曲线图洛伦茨曲线
统计学家洛伦茨利用累计百分数曲线.作为测度社会收入分配平均程度的方法,这种曲线就称为洛伦茨曲线。在现代西方经济著作中,经济使用这种曲线来描述一国的收入分配平均程度。运用洛伦茨曲线分析收入分配公平程度的方法:是利用两组对应的累计百分比资料的关系构成一个正方形图,来观察分析起分配的公平程度。其中以家庭(或人数)累计百分数为X轴,收入累计百分数为Y轴。当所有家庭具有相同收入时,X的取值
洛伦茨曲线与Y的取值相同,这时X与Y的关系表先为原点(0,0)至点(100,100)的对角线,故这条直线,即正方形的对角线称为绝对公平分配直线。反之,当社会财富集中在极少数人手中,称为完全分配不均。事实上,一个国家或地区的收入分配非绝对公平,也非绝对不公平,而是介于两者之间。实际分配情况由洛伦茨曲线表示,它一般表现为基尼系数
一条下凸的曲线,下凸的程度越大,收入分配就越不平均。为了准确地测定收入分配的平均程度,意大利经济学家基尼依据洛伦茨曲线,提出了计算收入分配平均程度的指标,即基尼系数G。
洛伦茨曲线
如何定量地反映一国贫富差距的状况,国际上通用的是用基尼系数来测量和判断。基尼系数是国际上最常用的分析收入分配格局的方法,它是在对居民按照收入水平高低进行排队和等分的基础上,绘制洛伦兹曲线图,然后根据图中的有关部分面积进行计算的。
洛伦茨曲线图基尼系数的计算公式为:
SA代表绝对公平直线与洛伦茨曲线围成的弓形面积。SA+SB为绝对公平直线的直角三角形面积。当SA=0时,G=0,表示分配绝对公平,当SB=0时,G=1,表示收入分配完全的不平均。实际的基尼系数一般介于二者之间,即G的取值范围是:0≤G≤1,国际上通常将基尼系数定在0.3~0.4之间,作为个人收入差异程度合理的范围。
从衡量收入分配的基尼系数来看,我国的收入差距从改革开放初期的0.20,迅速扩大到目前的0.53左右。国际上认为,基尼系数小于0.2为高度平均,0.2—0.3表示比较平均,0.3—0.4表示相对合理,0.4—0.5表示收人差距较大,大于0.6为高度不平均,通常以0.4作为警戒线。
目前我国已经从一个平均主义的国家,转变为贫富悬殊的国家,已超过了警戒线。与国际比较,已超过了发达国家,接近了中等收入国家。据2004年联合国人类发展报告中的基尼系数显示:中国已高达0.45—0.53,高于美、法、日、英、德、韩等国的0.3—0.4,接近俄罗斯、新加坡、伊朗的0.46—0.43,低于巴西、智利、墨西哥的0.55—0.59。课练
某班学生统计学考试成绩(分)如下:93507885667163835295787285788290805595677285777090707669588980616799
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 专业化物流管理与服务承包协议书版A版
- 2025年度农业现代化项目合作种植养殖合同范本3篇
- 2025年度健康医疗大数据分析与应用服务合同4篇
- 2025年度剧本改编委托创作合同样本3篇
- 2025年度商务写字楼租赁及商务配套服务合同4篇
- 2024版设备与集成服务采购合同
- 2025年度航空航天器材定制厂家合同样本3篇
- 2024年金融投资与咨询服务合同标的及投资领域
- 二零二五年度老旧小区改造安置房交易协议范本3篇
- 2024矿物资源勘探技术与咨询服务协议版
- 资本金管理制度文件模板
- 2025年生产主管年度工作计划
- 2025年急诊科护理工作计划
- 高中家长会 高二寒假线上家长会课件
- 违规行为与处罚管理制度
- 个人教师述职报告锦集10篇
- 四川省等八省2025年普通高中学业水平选择性考试适应性演练历史试题(含答案)
- 《内部培训师培训》课件
- 《雷达原理》课件-3.3.3教学课件:相控阵雷达
- 西方史学史课件3教学
- 2024年中国医药研发蓝皮书
评论
0/150
提交评论