统计数据的收集、整理_第1页
统计数据的收集、整理_第2页
统计数据的收集、整理_第3页
统计数据的收集、整理_第4页
统计数据的收集、整理_第5页
已阅读5页,还剩106页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计数据的收集、整理

与显示第一节统计数据的搜集第二节统计数据的整理第三节统计数据的显示目录统计整理统计调查客观现象数量表现统计总体数量特征统计研究的程序统计研究目的统计设计推断分析描述分析第一节统计数据的收集一、统计数据的搜集方法1.统计数据搜集的概念根据统计研究预定的目的和任务,运用科学的方法与手段,有计划、有组织地向客观实际采集数据的过程。从统计工作过程的阶段性看,统计数据的搜集处于统计工作过程的基础阶段。

指直接从各调查单位搜集的用来反映个体特征的数据资料搜集原始数据资料的统计活动过程统计数据收集要求:准确、及时、全面、系统统计数据收集的要求准确性—搜集的资料要符合客观实际情况。及时性—时效性。及时上报各项统计资料以满足各种需要。完整性—全面性。即在规定时间内对调查资料毫无遗漏地搜集起来。系统性—资料符合事物的逻辑,不能杂乱无章。2.统计数据搜集的方式一种是直接向调查对象搜集反映调查单位的统计数据(或称原始资料)一种是搜集已经加工、整理过的、说明总体现象的数据(一般称为二手资料)。

3.统计数据的分类(1)调查数据通过调查方法获得的数据通常是对社会现象而言通常取自有限总体(2)实验数据通过实验方法得到的数据通常是对自然现象而言也被广泛运用到社会科学中前者是社会经济数据的主要来源,后者是自然科学数据的主要来源。本书着重讨论取得社会经济数据的方式和方法。对于调查数据的搜集,通常称为统计调查。搜集的是调查对象的原始资料。常用的方法有直接观察法、报告法(通讯法)、采访法、实验调查设计等。4.统计数据的搜集方法二、统计调查方式调查方式是指组织收集调查数据的形式与方法普查全面报表抽样调查重点调查典型调查周期性调查一次性调查普查抽样调查重点调查典型调查全面调查非全面调查连续(经常性)调查不连续调查定期报表专门调查调查范围调查时间组织形式统计调查方式常用的统计调查方式统计调查方式普查典型调查重点调查抽样调查统计报表调查(一)普查(census)普查:是专门组织的一种全面调查,它主要是用以搜集某些不能或不宜用定期报表搜集的统计资料。对国情国力的调查一般采用普查。普查的特点:〈一〉是一种非经常性的全面调查;〈二〉比任何一种调查形式更能掌握大量、详细、全面的统计资料。普查的基本形式1、设立专门的普查机构,配备一定的普查人员,对调

查单位直接进行登记,如历次全国人口普查就是采

用这种形式;2、另一种是利用企事业单位的原始记录和核算资料,

设计一系列调查表,这些基层报告单位根据普查的

要求自行填报,如全国科技人才普查即是如此。普查应该注意的问题(1)要规定统一的标准时点;(2)严格设定必需的调查项目;(3)尽可能地缩短普查登记期限;(4)按一定的周期进行同类普查。我国进行的普查主要有人口普查,每10年进行一次,末尾数字为“0”的年份进行农业普查,每10年进行一次,每逢“6”的年份进行经济普查,每5年进行一次,每逢“3”和“8”的年份进行包括工业普查第三产业普查建筑业普查基本单位普查我国的普查(二)抽样调查抽样调查:是一种非全面调查,抽样调查可以分为概率抽样和非概率抽样。概率抽样是按随机原则从调查对象中抽取一部分单位作为样本进行观察,然后根据样本数据去推算调查对象的总体特征。

总体样本随机原则随机原则:在抽选样本时排除主观因素的影响(不是有意识的抽选某些单位),使每个单位都有一定的机会被抽中。等概率抽样:抽样时每个单位被选中的概率相等。不等概率抽样:抽样时每个单位被选中的概率不等。概率抽样和非概率抽样概率抽样:也称随机抽样,是按照随机原则抽选样本的抽样方式,抽样时每个样本单位被选中的概率是已知。概率抽样中可以对抽样误差进行控制。目的是推断总体。在我国,习惯上将概率抽样称为抽样调查。不满足概率抽样要求的抽样都被归为非概率抽样。非概率抽样单个单位被选中的概率是不可知的,不能从概率意义上控制抽样误差。目的是描述总体。有放回抽样和无放回抽样有放回抽样:也称为重复抽样,在一个

单位被选入样本后,记录其编号,然后又

将其放回总体中继续参与随后的抽样过程。特点:n次抽样独立进行、各单元入样概率相等。无放回抽样:也称为不重复抽样,在一个单位被选入样本后,不再放回总体参与随后的抽样过程。特点:n次抽样关联进行、各单元入样概率不相等。抽样方法的不同,关系到样本数量的计算不同,估计无常的控制不同抽样调查(广义)非概率抽样概率抽样不等概率抽样等概率抽样按抽样原则重复抽样不重复抽样按抽样方法抽样调查概率抽样非概率抽样方便抽样判断抽样配额抽样雪球抽样简单随机抽样系统抽样分层抽样整群抽样多阶段抽样抽样推断过程图示总体样本随机抽样样本数据特征以一定概率推断总体数据特征描述统计方法推断统计方法〈一〉样本单位按随机原则抽取,排除了主观因素对选样的影响。〈二〉根据部分调查的实际资料对调查对象总体的数量特征作出估计。〈三〉抽样误差可以事先计算并加以控制。抽样调查的特点:

抽样调查的适用场合:

〈一〉不可能或不必要进行全面调查的社会现象,采用抽样调查;〈二〉对普查资料进行必要的修正。优点能用较少的人力、物力和时间达到全面调查的目的调查资料的准确性较高、受人为干扰的可能性较小抽样调查的优点:

(三)重点调查重点调查:在调查对象中,只选择一部分重点单位进行的非全面调查。重点单位:它们在所研究现象的标志总量中却占有绝大的比重,在总体中具有举足轻重的作用。对这些单位进行调查,能够从数量上反映整个总体在该标志总量方面的基本情况。特点:可以了解较详细的情况,但无法对现象总体的数量特征作出准确的推算,也无法测算调查误差。适用场合:当调查任务只要求掌握基本情况,而部分单位又能比较集中地反映研究的项目,宜采用重点调查。(四)定期报表制度统计报表制度:依照国家有关法规,自上而下地统一布置,以一定的原始记录为依据,按照统一的表式,统一的指标项目,统一的报送时间和报送程序,自下而上地逐级地定期提供统计资料的一种调查方式。

统计报表的主要特点:〈一〉报表资料的来源是建立在各个基层单位的原始记的基础上;〈二〉由于统计报表是逐级上报和汇总的,各级领导部门能获得管辖范围内的报表资料;〈三〉是一种经常性的(连续性)调查,调查项目相对稳定,有利于积累资料,并进行动态对比分析。统计报表调查的优点(1)在报表实施范围内,各报告单位按期报送,可保证调查资料的全面性、连续性和及时性;(2)统计报表调查事先已作为一种制度布置到基层报告单位,要求各单位根据原始记录和统计台账提供报表所需的资料,从而保证了资料来源的可靠性和准确性;(3)由于统计报表调查是逐级整理上报,统计资料可以使各级地方政府和部门及时了解和掌握本地区、本部门的基本情况。统计报表调查的局限性1、涉及的范围广、内容多,花费的人力、物力较多;2、在统计法制不健全、执行不严的情况下,统计报表调查在逐级上报过程中容易受到有关人员主观因素的干扰,从而影响资料的准确性;3、统计报表中的指标项目相对固定,当被研究现象变化较快时,统计报表缺乏应有的灵活性。三、统计调查体系统计调查体系:一个国家开展统计调查方法和制度的总称。

我国的统计调查体系:建立以必要的周期性的普查为基础,经常性的抽样调查为主体,同时辅之以重点调查、科学推算和部分全面报表综合运用的统计调查方法体系。统计推算是以已掌握的各种统计数据为基础,根据事物之间的内在联系或发展规律,对被研究现象数量特征做出估算或测算的一种间接统计调查方式。统计推算四、统计调查方案设计(一)调查方案的结构一份完整的调查方案,应该包括以下基本内容:1.调查目的;2.调查对象、调查单位和报告单位;3.调查项目与调查表;4.调查时间、调查方式与方法;5.调查的组织工作。6.调查报告的撰写调查对象就是根据调查目的确定的、在某种性质上相同的许多个体单位所组成的集合。调查单位:就是调查对象范围内的各个个体单位。调查单位与报告单位是两个不同的概念。调查单位是调查项目的承担者,而报告单位则是负责向调查研究机构提供所需统计资料的基层单位。调查单位与报告单位有时是同一个单位,有时则是不同的单位。调查项目:就是反映调查单位特征的变量。在确定调查项目时必须注意如下几个问题:调查项目的含义必须明确,不能模棱两可;考虑取得资料的可行性,有些调查项目虽然需要,但在现有条件下难以取得资料的则不应列入;调查项目的答案应满足完备性和互斥性。如果要求选择回答,则必须列出所有可能的答案,以免出现重复或遗漏;确定不同时期同类调查的调查项目时,前后时期的调查项目应互相衔接,以便进行动态比较分析。调查表:是指把所要调查的项目按照一定的结构和顺序排列后形成的表格。它是调查项目的表现形式,也是向调查单位取得原始统计资料的重要工具。利用调查表进行调查,能够条理清晰地填写需要搜集的资料,也便于调查结束后对资料进行整理。根据一份表格上容纳调查单位的多少,调查表可以分为一览表和单一表。一览表是指一份表格上可以登记两个及两个以上调查单位有关调查项目的调查表;单一表是指一份表格上只登记一个调查单位有关调查项目的调查表。调查时间:是指调查资料所属的时间。问卷调查问卷(Questionnaires)又称问卷表,是以书面的形式,按照设计好的顺序,由一系列问题和相应的备选答案组成的表格。

X

XX调查问卷Q1:××××?□

1.A2.B3.C4.D5.E(if………,then……)Q2:××××?□

1.A2.B3.C4.D5.E·····················五、二手资料的主要来源渠道刊登我国年度宏观数据的刊物主要是国家、地区和行业或部门的年鉴。例如,《中国统计年鉴》、《中国统计摘要》、《中国经济年鉴》、《中国农村统计年鉴》、《中国城市统计年鉴》、《中国社会统计年鉴》、《中国人口统计年鉴》、《中国劳动统计年鉴》、《中国工业经济统计年鉴》、《中国财政年鉴》、《中国金融年鉴》以及全国各省、市、自治区、直辖市、新疆生产建设兵团的统计年鉴等。

对于某些特定行业的数据,如证券业数据,我们可以从各证券报、中国证券监督管理委员会、上海证券交易所、深圳证券交易所、各证券公司等单位的网站数据库和出版发行的刊物中取得有关数据。各上市公司的季报、半年报、年报中的各种数据属于公开数据,可以直接使用,但如果存在后续的补充报告,在使用时应该及时调整。对于未公开的微观经济数据,由于涉及企业的内部机密或个人的隐私权,我们在采用有关数据时一定要征得相关单位和个人的同意,在发表研究成果时还应尽量避免直接公布原始数据。刊登世界各国宏观数据的刊物主要由联合国统计司(UNSD)、世界银行(WB)、国际货币基金组织(IMF)、世界贸易组织(WTO)、世界卫生组织(WHO)、国际能源机构(IEA)、国际清算银行(BIS)、欧盟统计局(EUROSTAT)、亚洲开发银行(ADB)、国际电信联盟(ITU)等国际性组织编制出版。有些使用面广的资料,在取得版权后,由我国有关机构翻译成中文出版。例如《世界经济年鉴》、《世界发展报告》、《国外经济统计资料》等。图书与互联网Internethttp//WWW.中国统计年鉴2001中国人口统计年鉴中国市场统计年鉴世界发展报告世界经济年检工业普查数据中国统计出版社次级数据的来源国家统计资料行业协会信息资料图书资料计算机信息网络国际组织

主要是公开出版或报道的数据,有些是未公开出版的数据。在我国,公开出版或报道的社会经济数据主要来自国家和地方的统计部门以及各种报刊媒介。应注意数据的含义、计算口径和计算方法,避免误用或滥用;注意次级数据的时间性,不能用过时的数据;应充分搞清这些数据的来源和可靠程度;应注明数据的出处,以尊重他人的劳动成果。

使用二手数据需要注意的问题第二节统计数据的整理一、数据整理概述

1.数据整理的含义:对统计调查所搜集到的各种数据进行分类和汇总,又称为汇总性整理。统计调查统计整理统计分析统计工作数据整理的意义统计调查所搜集的反映个体的原始资料是分散的,不是集中的;是零碎的,不是系统的。根据这些资料。人们难以从总体上分析和认识社会经济现象的数量表现。至于某些已经加工的综合资料,则往往由于资料在分组方法、总体范围或指标涵义、口径、计算方法等方面不同,而不能满足统计分析的要求,也必须先通过统计整理,才能据以从总体上分析社会经济现象的数量表现。通过统计整理:

1.原始资料或次级资料变为综合资料,能够反映总体特征;

2.发现和弥补调查工作的遗漏与不足,提高资料的准确性统计资料整理的基本步骤资料的审核资料的分类(分组)资料的汇总结果显示(图或表)设计整理方案统计资料整理的内容说明:1.统计整理前必须对资料进行审核;

2.选择最基本、最重要的指标对资料进行加工整理。

(1)如何对所要研究的总体进行统计分组;(2)确定描述总体数量特征的统计指标体系。二、统计分组基本理论

1.统计分组的概念根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把被研究的总体划分为若干个不同性质的组,称为统计分组。品质标志或数量标志25%33%42%例1:从业人员按文化程度分组小学毕业中学毕业(含中专)大学毕业文盲或识字不多小学毕业中学毕业(含中专)大专毕业大学及大学以上

例2:某商场把服装分为①男装、女装、童装。

②成年装(男女装)

儿童装(男女装)(√)(×

)统计分组的性质和种类2、性质分与合、反映本质差异、可能掩盖差异、关键是分组标志的选择和分组界限的确定种类按分组标志的多少不同简单分组复合分组按分组标志的性质不同品质标志分组数量标志分组简单分组就是各个组按一个标志分组形成的。复合分组则是各个组按两个以上的标志分组形成的。按品质标志分组按品质标志分组,就是选择反映事物属性差异的品质标志作为分组标志,并在品质标志的变异范围内划定各组界限,将总体划分成为若干个性质不同的组成部分。例如:人口总体按性别,分为男、女两组;再如:企业总体按所有制,分为全民、集体、合营、个体等组。

按数量标志分组按数量标志分组,就是选择反映事物数量差异的数量标志为分组标志,并在数量标志的变异范围内划定各组界限,将总体划分为性质不同的若干组成部分。例如,居民家庭按子女数分组,可分为0人(无子女)、1人、2人、3人;等等。

例1为了了解某地区银行存款的构成,可以选用存款性质、期限两个标志分别进行分组:按存款性质分组企业存款储蓄存款财政性存款按存款期限分组活期存款定期存款简单分组存款同时按其性质及期限分组企业存款活期定期储蓄存款活期定期财政性存款活期定期例2企业职工按工龄分组:

5年以下

5~10年

10~15年

15~20年

20年以上品质标志分组数量标志分组三、统计分组的原则和方法

1.统计分组的原则:穷尽原则:使总体中的每一个单位都应有组可归,或者说各分组的空间足以容纳总体所有的单位。互斥原则:就是在特定的分组标志下,总体中的任何一个单位的只能归属于某一组,而不能同时或可能归属于几个组。2、统计分组的方法

统计分组的关键在于选择分组标志和划分各组界限。

(1)选择分组标志——统计分组的核心问题分组标志是将总体区分为各个性质不同的组的标准或依据。选择分组标志的原则是:结合一定的历史条件或经济条件,根据统计研究的目的和任务,选用那些最能反映现象本质特征的标志作为分组标志。如:工业企业的分类——规模分类、部门分类例:经调查,某地年末货币流通量为15.3亿元,比上年增加4.5亿元。为了宏观调控,有必要对本地区货币流通量分布状况进行调查。有两种资料整理结果:按地区分组上期本期增减%甲县乙县丙县丁县360002400028000200005200034000410002600044.441.746.730.0合计10800015300041.7(1)(2)按行业结构分组上期本期增减%集团单位库存现金农民手持现金城镇居民手持现金其他流动人口手持现金27000430003100070003500071000370001000029.665.019.042.6合计10800015300041.7(2)选择分组种类简单分组分组体系

主要根据研究任务及对象特点来选择,前者简单,后者更全面、深入,但复杂。品质标志分组数量标志分组单项式分组组距式分组主要根据研究任务来选择。(根据数量变动的特征不同来选择)①单项式分组与组距式分组就具体的分组形式而言,如果变量的变异较小,我们可以将每个变量值单列一组,这种分组称为单项式分组。如果变量的变异较大,则可以把变量的整个的取值范围依次划分为若干个区间,一个区间内的所有变量值归为一组。区间的最大值称为上限,最小值称为下限,上限与下限之差为组距,即组距=区间的最大值(上限)-区间的最小值(下限)……(1)这样的分组称为组距式分组。单项式分组A.将一个变量值作为一组B.适合于离散变量C.适合于变量值较少的情况这种方法通常只适用于离散型变量且变量值较少的情况。组距分组A.将变量值的一个区间作为一组B.多用于连续变量C.适合于变量值较多的情况D.必须遵循“不重不漏”的原则单项式分组:一个变量值列为一组。如:对居民家庭按家庭人口数进行分组:

1人2人3人4人5人及以上组距式分组:若干个变量值列为一组。如:A、企业的工人按日B、工人按工资水平分组(连)产零件数分组(离)

50-60300-40060-70400-50070-80500-60080-90600-70090以上700-800适用于离散型变量,且变量值不多时。适用于连续型变量,且变量值变化范围大时。一定要遵循“不重不漏”的原则。“不重”指一项数据只能分在其中的某一组,不能在其他组中重复出现。习惯上规定“上限不在内”。“不漏”即所有数据都能分在其中的某一组,不能遗漏。因此,如果数据中的最大值和最小值与其他数据相差悬殊,可采用“**以下”及“**以上”。对离散型数据,可采用相邻两组组限间断的办法解决“不重”的问题(如105-109,110-114,115-119等)

间断型对连续型数据,往往采用相邻两组组限重叠,根据“上限不在内原则”解决“不重”问题(如[105,110),[110,115),[115,120)等)

连续型间断型:指前一组的上限与后一组的下限,两值紧密相连而不相重复。组距=下组下限-本组下限=本组上限-前组上限连续型:指相邻两组中,前一组的上限和后一组的下限数值重合。组距=上限-下限等距分组表(上下组限重叠)等距分组表(上下组限间断)等距分组表(使用开口组)②等距式分组与异距式分组按总体内各组组距是否完全相等,数量标志分组又可以分为等距式分组与异距式分组。

等距式分组适用于总体各单位的变量值由小到大呈现均匀变化的情况。

异距式分组则适用于总体各单位的变量值由小到大呈现不均匀变化的情况。各种分组举例如下表:

等距分组和不等距分组工资收入分组(元)年龄分组(岁)800---10000---141000---120014--601200---140060以上③组距式分组相关指标的计算组数和组距

在实际操作中,可以先确定组数,组数的确定参考经验公式:

n=1+3.33lgN(N为单位数)连续组距分组的组距=本组上限–本组下限间断式组距且等距分组的条件下:组距=本组上限–前组上限或=本组下限–前组下限 或=本组上限–本组下限+1组中值的计算组中值=(上限+下限)÷2=下限+组距/2=上限-组距/2

(连续型组限)组中值=(本组下限+下一组下限)÷2=本组下限+组距/2=下组下限-组距/2

(离散型组限)开口组的组限与组中值在编制组距式分组时,使用“ⅩⅩ以上”“ⅩⅩ以下”这样不确定组距的组,称为开口组。开口组的组距是以相邻组的组距为本组的组距。缺下限开口组的组中值

=上限-邻组组距/2缺上限开口组的组中值

=下限+邻组组距/2四、频数分布(一)频数分布的基本概念1、在统计分组的基础上,可以将总体所有的单位按某一标志进行归类排列,并计算其相应出现的次数,这样得到的分布称为频数分布或次数分布。2、通过对零乱的、分散的原始资料进行有次序的整理,形成一系列反映总体各组之间单位分布状况的数列,即分布数列3、分布数列的两个元素总体按某标志所分的组;若总体按数量标志分组,分组标志在各组有不同的数量表现,形成标志值数列,亦称变量,一般用x表示;各组所出现的单位数,即频数,亦称次数,用f表示。4、频率频数(frequency):每个组中的数据个数,也称次数。频率(relativefrequency):组频数/总数据个数。

fi:第i组频数频率分布的性质频率在0到1之间各频率之和等于1频数密度与频率密度:

(A)频数密度=频数/组距

(B)频率密度=频率/组距(二)变量数列的编制方法【例3.3】某生产车间50名工人日加工零件数如下(单位:个)。试采用单变量值对数据进行分组。117122124129139107117130122125108131125117122133126122118108110118123126133134127123118112112134127123119113120123127135137114120128124115139128124121步骤:1、确定全距2、确定组数3、确定组距4、计算频数5、编制表格五、累计频数与累计频率累计频数(率)分布分为向上累计和向下累计两种。向上累计是将各组频数(率)曲线标志值低的组向标志值高的组依次累计,说明至某组上限以下的各组频数(率)累计分布状况。向下累计是将各组频数(率)由标志高的组向标志值低的组依次累计,说明至某组下限以上各组频数(率)累计分布状况。某班统计学考试成绩次数分布第三节

统计数据的显示一、统计表1、统计表的定义对统计调查所获得的原始资料进行整理,可得到说明社会现象及其发展过程的数据,把这些数据按一定的顺序排列在表格上,这种表称为统计表。广义上看,任何用以反映统计资料的表格都是统计表。统计表是表现统计资料的最常用的形式,也是统计分析的重要工具。2、统计学的结构统计表的结构从外表形式看,由总标题、横行标题和纵栏标题、指标数值等部分构成。此外有些统计表在表下还增列补充资料、注解、附记、资料来源、某些指标的计算方法、填表单位、填表人员以及填表日期等。总标题是表的名称,用以概括统计表中全部统计资料的内容。一般写在表的上端中部。横行标题是横行的名称,在统计表中通常用来表示各组的名称,它代表统计表所要说明的对象,一般写在表的左方。纵栏标题是纵栏的名称,在统计表中通常用来表示统计指标的名称。一般写在表的上方。指标数值列在各横行标题与各纵栏标题的交叉处。统计表中任何一个数字的内容由横行标题和纵栏标题所限定。横行标题总标题纵栏标题指标数值附加统计表的结构从内容可以分为两个组成部分:一部分是统计表所要说明的总体,它可以是各个总体单位的名称、总体的各个组,或者是总体单位的全部,这一部分习惯上称为主词。另一部分则是说明总体的统计指标,包括指标名称和指标数值,这一部分习惯上称为宾词。2005年我国三次产业增加值及增长情况表总标题纵栏标题主词宾词指标数值统计表的种类

统计表根据主词是否分组以及分组程度不同,可分为:

1、简单表,是指对总体未作任何分组而形成的统计表,可以有两种形式:一是按总体单位名称排列的统计表;二是按时间顺序排列的统计表。

2、分组表,是指总体仅按一个标志分组而形成的统计表。

3、复合表,是指总体按两个或两个以上标志进行复合分组而形成的统计表。年份国内生产总值(亿元)1996199719981999200067884.674462.678345.282067.589403.61、我国近年来国内生产总值资料:2、1999年日均创国内生产总值:按产业和行业分组国内生产总值(亿元)第一产业第二产业工业建筑业第三产业交运仓储邮电通信业批发零售贸易餐饮业其他39.6110.795.814.943.2合计224.4简单表复合表按产业分组国内生产总值(亿元)第一产业第二产业第三产业39.6110.774.1合计224.4分组表统计表根据宾词设计分组,可分为:

1、宾词简单排列。宾词不进行任何分组,按一定顺序排列在统计表上。

2、宾词分组平行排列。宾词栏中各分组标志彼此分开,平行排列

3、宾词分组层叠排列。统计指标同时有层次地按两个或两个以上标志分组,各种分组层叠在一起。3、1999年日均创国内生产总值:按产业和行业分组国内生产总值(亿元)比重(%)第一产业第二产业工业建筑业第三产业交运仓储邮电通信业批发零售贸易餐饮业其他39.6110.795.814.943.217.749.386.513.533.016.525.258.3合计224.4100宾词简单排列3、各地区社会商品零售总额(单位:亿元)按地区分组按商品性质和用途分组按城乡分组按经济类型分组消费品零售总额农业生产资料销售额城镇乡村国有集体个体其他北京天津合计宾词分组平行排列5、某市近年从业人员分布表:年份三次产业第一产业第二产业第三产业小计男女小计男女小计男女1997199819992000总计宾词分组层叠排列统计表的设计原则:科学、实用、美观、简练。标题简明扼要,满足3W要求(When,Where,What)。结构合理,长宽比例要适当。统计表为“开口式”;表的上下两条横线一般用粗线,其他线用细线,线条要少。数据计量单位相同时,可放在表的右上角标明,不同时应放在每个指标后或单列出一列标明。表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一。对于没有数字、缺某项或免填的表格单元,应使用特定符号标出。必要时可在表的下方加上注释。二、统计图1.直方图

·用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的面积来表示各组的频数分布

·在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图(Histogram)。

·直方图下的总面积等于1频数(人)1512963105110115120125130135140日加工零件数(个)直方图下的面积之和等于1某车间工人日加工零件数的直方图2、折线图

·折线图也称频数多边形图(Frequencypolygon)·是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉

·折线图的两个终点要与横轴相交,具体的做法是第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的1512963105110115120125130135140日加工零件数(个)频数(人)折线图下的面积与直方图的面积相等1!某车间工人日加工零件数的折线图3、曲线图当变量值非常多,变量数列的组数无限增多时,折线便近似地表现为一条平滑的曲线。曲线图是组数趋向于无限多时折线图的极限描绘,是一种理论曲线。它实质上是对应于连续变量的次数或比率分布的函数关系图。曲线图的绘制方法与折线图基本相同,只是连接各组次数坐标点的线段应当用平滑曲线而不用折线。

4、累计曲线图小于式累积频数折线图(Less-thanCumulativeFrequencyPolygon)根据向上累计的频数(或频率)与各组的上组限作X-Y散点图,并延伸到x轴。图中的数据点表示小于某个数值(x轴)的数据个数或频率。大于等于式累积频数折线图(More-thanorEqualCumulativeFrequencyPolygon)根据向下累计的频数(或频率)与各组的下组限作X-Y散点图,并延伸到x轴。图中的数据点表示大于等于某个数值(x轴)的数据个数或频率。洛伦茨曲线图累计频数(频率)分布曲线,可用于分析社会财富、土地和工资收入等的分配是否公平的问题。该曲线图是由美国洛伦茨博士提出,故称为洛伦茨曲线。

某国家收入所得的分配情况按收入所得水平分组

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论