第2章统计数据搜集与整理_第1页
第2章统计数据搜集与整理_第2页
第2章统计数据搜集与整理_第3页
第2章统计数据搜集与整理_第4页
第2章统计数据搜集与整理_第5页
已阅读5页,还剩99页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章统计数据收集、整理与显示1主要内容2.1统计数据的收集2.2统计数据的整理2.3统计数据的显示——统计表和统计图2统计数据是通过统计实践活动所获得的能够说明现象总体的属性或数量表象或内在关系的表现,是统计实践活动的成果。3统计数据的种类按是否可以直接用数字表示,分为定性数据和定量数据按是否经过加工处理,分为原始数据和综合数据按时间状况,分为截面数据和时序数据4定性数据—说明事物的品质特征的,不能用数值表示,其结果通常表现为类别。定量数据—说明事物的数量特征,是用数值来表示的,其结果表现为具体的数字。原始数据—说明总体单位特征的数据,主要产生于统计调查阶段。也称为标志值。综合数据—说明总体数量特征的数据,主要产生于统计整理和分析阶段。截面数据—是同一时间点或时间段的数据时序数据—是不同时间点或时间段的数据

5§2.1统计数据的收集

一、原始数据的收集统计数据收集是根据统计研究的目的要求,采用科学的形式和方法,有计划、有组织地获取所研究变量数据的过程。在社会经济统计中,统计数据收集也称为统计调查。它是进行统计数据整理和分析的必要前提。对统计数据收集的基本要求:准确性、及时性。6统计数据的分类按照获取途径不同,统计数据可以分为直接来源的原始数据和间接来源的次级数据。原始数据是直接对各调查单位进行观察登记或通过实验来收集的数据。次级数据亦称二手数据,是从统计年鉴、报刊、互联网或有关部门业务资料中获取经过加工整理的数据。71.统计调查的组织形式8就范围不同划分而言全面调查:对调查对象中的所有单位无一例外地进行调查。直接获得总体数据。优点:资料齐全、能够满足各级政府领导管理需要;不存在代表性误差。缺点:耗费大,易产生登记性误差。应用:搜集重要的、基础性数据。非全面调查:对调查对象中的一部分进行调查。获得样本数据。优点:耗费小(人财物时间),不易产生登记性误差。缺点:存在代表性误差。应用:广泛。9(1)统计报表统计报表是以基层单位的原始记录为依据,按国家有关法规的规定,自上而下地统一布置任务,按统一的表式、统一的项目、保守时间和程序,自下而上地定期提供基本统计资料的一种调查方式。

统计报表的种类

按报送周期:日报、旬报、月报、年报、年报 按调查范围:全面统计报表和非全面统计报表

特点

是国家重要的定期统计报告制度; 自上而下统一布置,自下而上定期提供; 费时、费力。

优点和缺点

优点:全面性、稳定性、连续性、可比性

曾经是我国数据收集的主要方式 缺点:耗费大、数据质量差、基层负担重10(2)普查概念:对调查对象中所有总体单位都进行调查,目的是为了详尽地了解重要的国情国力。目前,我国政府开展的普查主要有人口普查、第三产业普查、工业普查、农业普查,这些普查都是每10年进行一次,分别在逢0、3、5、7的年份实施;基本单位普查每5年进行一次,在逢1、6的年份实施。

11普查应该注意:统一规定普查的标准时间和统一的普查期限,以避免由于时间变动使资料重复和遗漏。统一规定普查内容和指标解释,不得任意改变或增减项目。同类普查,各次调查的项目应尽可能一致,以便于历史资料的对比研究。同类普查应尽可能按周期进行,以便观察现象发展变化的过程和规律。12(3)抽样调查抽样调查是总体中随机抽取一部分单位作为样本进行调查,并根据样本资料来推断总体数量特征的一种非全面调查方法。广义的抽样包括概率抽样和非概率抽样。概率抽样也称随机抽样,是指按照随机原则从总体中抽取部分单位构成样本。非概率抽样也叫非随机抽样,是指从研究目的出发,根据调查者的经验或判断,从总体中有意识地抽取若干单位构成样本。非概率抽样常用的方式主要有方便抽样和判断抽样。13方便抽样是指不考虑抽样的概率,纯粹以便于取得样本的方式进行抽样。判断抽样是指研究人员根据经验、判断和对研究对象的了解,有目的地选择一些单位作为样本进行调查的抽样方式。14概率抽样和非概率抽样是性质不同的两种抽样类型,在调查中采用何种抽样类型,取决于研究问题的性质、使用数据要说明的问题、调查对象的特征、调查费用、调查时间等多方面的因素。统计上所说的抽样一般都是指概率抽样,即指随机抽样调查。本教材若无特别说明,抽样均指概率抽样,抽样调查也即对随机样本的调查。15常用的概率抽样方式

(了解)简单随机抽样,也称为纯随机抽样,是一种最基本的抽样形式。这种抽样方式无须对总体单位进行任何划分或排队,只需对总体单位进行编号,利用抽签法、随机数表或计算机随机取数法等完全随机地直接从总体中抽取样本单位,每个总体单位入样的概率是相等的。16分层抽样(类型抽样)(了解)概念首先将总体单位按某一标志分层(分类、分组);然后在各层按随机抽样的方法分别抽出各层的样本。特点:分层抽样在层内是抽样调查,层间是全面调查;分层抽样保证了样本中包含有各种特征的抽样单位,样本结构与总体结构比较相近,从而可以提高估计的精度。适用于类别间差异比较大的情况;不仅能够用样本推断总体,还可以用各子样本推断相应子总体的特征,深化对总体的认识。17等距抽样(机械抽样或系统抽样)(了解)概念:首先将总体单位按某一标志排队, 然后计算抽样间隔距离,后在第一个抽样距离内确定抽样起点r, 最后抽取样本单位(或样本点)构成样本(按固定的间隔和排队顺序)。关键:1)排队(选择排队标志,可与调查标志有关,也可与调查标志无关); 2)确定抽样起点(即第一个样本单位)。18无关标志排队等中距抽样(了解)等距抽样据以排队的标志与调查内容无关。抽样起点可随机确定,,完全遵循了随机原则,不会产生系统偏差。抽样效果近似简单随机抽样,注意:抽样间隔现象的周期长度整数。否则所抽取的样本有系统偏差。

这种周期有时是比较隐蔽的。如工人交班时间、地块中农作物垅长、社区住户调查中门牌号码(楼层)。19有关标志排队等距抽样(了解)特点:将总体单位按某一有关标志排队的结果。排队后,就所要调查的标志来看,总体单位也大致呈顺序排队。抽样起点不宜随机确定。20半距起点等距抽样(中心系统等距抽样)(了解)——在第一个抽样距离中的一半为抽取起点r。优点:样本代表性高。局限性:限制了抽样的随机性受到限制;而且只能抽取一个样本。抽样效果:理论上接近分层抽样的效果。21对称等距抽样(了解)在第一个抽样距离内随机地确定抽样起点;然后以组界为对称点两两对称地抽取样本单位(或样本点)。如下图所示(符号

表示样本单位的位置):22整群抽样(集团抽样)(了解)概念:首先将总体单位划分为R个群;然后按随机的原则不重复地抽出r个群构成样本,在抽中群中进行全面调查。特点:简化了抽样组织工作,便于实施调查和组织管理。。缺点:样本单位在总体中过于集中,样本代表性较差,抽样误差较大。适用:群间差异不大,而群内差异较大的情况。23(4)重点调查概念重点调查——是指在调查对象中选择一部分重点单位进行调查,用以反映总体基本情况的非全面调查方法。重点单位是指就所要调查的标志而言,标志值所占比重较大的少数总体单位。24

重点调查的特点(1)调查目的主要用于掌握总体基本情况;(2)调查单位的选取有客观标准。 适用范围(1)适用于现象总量在各总体单位之间的分布极不均衡,客观上存在重点单位的情况;(2)既可以用于一次性调查,也可用于经常性调查。25(5)典型调查(了解)

典型调查的概念典型调查——是在对调查对象有一定了解基础上,有意识地选择少数典型单位进行的非全面调查方法。

典型调查的特点 调查目的是为了深入研究某一问题; 调查单位是根据调查目的有意识地选取的。

调查结果不能用于推断总体

作用 弥补全面调查的不足; 用于研究新生事物; 在一定条件下,用来推算总体数值。(划类选典)划类选典分类与典型调查方法的结合可以用于推断总体26调查单位构成目的与总体的关系重点调查重点单位了解总体基本情况不宜推断总体典型调查有意识选择典型单位了解生动具体资料划类选典可以推断总体,但不能计算和控制误差

抽样调查按随机原则抽取部分单位推断总体可计算和控制误差三种非全面调查的比较(了解)272.统计数据收集的基本方法(1)直接观察法直接观察法是调查人员深入现场对调查单位进行直接观察、记录和计量。(2)报告法报告法是指被调查者按照调查者的要求,根据自己的实际情况如实填报调查内容,以信函、传真、计算机网络等方式向调查者报送数据的方法。(3)访问法访问法也称采访法、询问法,是由调查人员提问、被调查者回答来获取数据的方法。访问方式也是多样的,可以集团座谈,也可以个别访问;可以街头访问,入户访问;也可以面谈访问、电话访问等。除了以上几种传统的调查方法以外,随着计算机网络技术的普及,电子邮件调查法、WED站点调查法、计算机电话辅助调查等以互联网络为平台进行调查的方法应运而生,其应用范围日益广泛。283.统计误差概念统计数据与客观现象真实数值之间的差异按来源不同登记性误差和代表性误差登记性误差是指在调查、汇总过程中由于观察、测量、登记、计算等方面的差错或被调查者提供虚假、错误资料而造成的误差。这种误差在任何一种调查形式中都可能产生.代表性误差是非全面调查所特有的,是指由于所调查的部分单位与总体在结构上不完全相同,用部分单位的数据推断总体数量特征所产生的误差。29抽样误差和非抽样误差统计误差还可分为抽样误差和非抽样误差。抽样误差是一种随机的代表性误差,是由于抽样的随机性引起的样本估计量与总体参数之间的误差。对于任何一个随机样本,这种误差都无法避免,但可以计算和控制。非抽样误差是相对于抽样误差而言的,是指除随机抽样以外之外的各种原因引起的统计数据与客观真实值之间的差异,既包括各种登记性误差,也包括代表性误差中的非随机误差,无论是概率抽样还是非概率抽样,或是全面调查,都有可能产生非抽样误差。30二、统计调查方案(一)确定调查目的为什么调查,解决什么问题(二)确定调查对象、调查单位和填报单位

调查对象是所要调查事物的全体,由许多个别单位构成,即统计总体。调查单位是所要调查的具体单位,是调查项目的具体承担者,即总体单位。前者确定调查范围,后者明确具体向谁调查。

调查单位要与调查的填报单位或报告单位相区别。(三)确定调查项目调查项目是具体的调查内容,是调查单位具有的特征,由一系列品质标志和数量标志构成。31(四)调查表与问卷设计为了便于调查和汇总,应该把调查项目按一定顺序排列在表格中,这就是调查表。一个调查单位填写一份的调查表称为单一表,若干个调查单位填写一份的调查表称为一揽表。(五)确定调查组织形式和方法明确调查的组织形式和收集数据的具体方法。(六)确定调查时间确定调查时间一是指确定调查的标准时间,即调查资料所属的时间,二是指调查期限,即整个调查工作从开始到结束的时间,包括调查登记的时间、数据处理的时间、数据分析的时间。(七)确定其它事项包括确定调查机构、培训计划、是否需要试点、经费预算、资料报送程序和方法、数据公布时间等。32三、次级资料的收集次级资料的收集通常称为文案调查,是指利用单位内部和外部的各种信息和情报资料,对所需数据资料进行调查;也称为间接调查、桌面调查和二手资料调查。这种调查不受时空限制,可以获得实地调查难以取得的大量历史资料。次级资料包括内部资料和外部资料。内部资料主要指企业或单位内部相关的数据或档案。外部资料指通过统计部门、信息咨询机构、电台和电视台、图书和报刊杂志、互联网络等渠道公布的有关资料。33§2.2统计数据的整理统计整理是指根据统计研究的需要,将统计调查阶段所搜集到的大量个体资料进行科学的分类汇总、加工处理,或对已经经过加工的次级资料再加工,使之系统化、条理化,以符合统计分析的需要,成为能够反映事物总体特征的综合资料的过程。内容数据处理:分类、汇总、表现(制表)数据管理:输入、贮存、更新、输出步骤审核原始资料、数据的分类汇总数据的表现、数据保管和发布

原始数据的整理一般是分类和汇总性的整理,次级资料的整理主要是分组。34一、统计分组1、概念统计分组就是根据统计研究的需要,将总体中的所有单位按照一定的标志分为若干部分或组别的方法。

对总体——分;

对个体——合。突出组与组之间的差异、抽象组内各单位差异2、作用

划分总体类型、反映现象内部结构和比例关系、揭示现象间的相互依存关系3、原则

科学性、完备性、互斥性

354、统计分组的种类

按标志的性质分为品质标志分组和数量标志分组。品质标志分组是从属性上区分各种类型组,其关键是界定各类型的性质差异。数量标志分组是从某个变量的数量差异上区分各种类型组,其关键是证券划分各组界限。

按分组标志多少分为简单分组和复合分组。简单分组按一个标志对总体单位进行分组,它只反映总体某一方面的类型和结构特征。复合分组按两个或以上标志对总体单位进行重叠分组,复合分组还可以显示结构的层次,说明总体内部类型的主从关系。

36二、分布数列---统计分组整理的基本结果1.分布数列的概念将总体各单位按某个标志分成若干组,列出各组的总体单位数或各组单位数在总体单位数中所占的比重,这样形成的数列称为分布数列。它表明总体单位在各组的分布状况。

次数(频数)是分布在各组的单位数。频率是各组单位数在总体单位数中所占的比重。372.分布数列的种类

(1)品质数列是按品质标志分组形成的分布数列

38表2-1某公司职工文化程度状况文化程度工人数比重(%)小学4008初中150030高中260052大学50010合计5000100品质标志39性别是品质标志性别人数(万人(比重(%)男6362950.98女6118149.02合计124810100.00表2-2某年中国人口状况402、变量数列

是按数量标志分组而形成的分布数列,定量数据。41变量数列单项式变量数列组距式变量数列42(1)单项式变量数列以一个变量值作为一组的变量序列是单项式变量数列。适合于离散变量

——取值可以一一列举适合于变量值较少,变动幅度不大的情况43表2—7某企业日产量

日产量工人数107011100123801315014100合计80044将变量值的一个区间作为一组的变量数列是组距式变量数列每一组两端的值称为组限,各组最小值称为下限,最大值称为上限。适合于连续变量,也适合于变量值较多、变化幅度大的情况(离散变量)相邻两组间的上下组限可以重叠也可以不重叠。一般来说,离散变量采用不重叠组形式,连续变量采用重叠组形式。区间的长度称为组距开口组、开口数列等距数列、异距数列(2)组距式变量数列45表2—8某班学生考试成绩次数表成绩(分)学生人数向上累计向下累计60以下225460-7015175270-8019363780-9015511890-1003543合计54————组限重叠46等距数列表2-10某车间50名工人日加工零件数分组表按零件数分组频数(人)频率(%)105~110110~115115~120120~125125~130130~135135~140358141064610162820128合计50100组限重叠47表2-11某车间50名工人日加工零件数分组表按零件数分组频数(人)频率(%)105~109110~114115~119120~124125~129130~134135~139358141064610162820128合计50100组限间断48开口数列表2-12某车间50名工人日加工零件数分组表按零件数分组频数(人)频率(%)109~以下110~114115~119120~124125~129130~134135~以上358141064610162820128合计50100适合数据集有极端值的情况49组距的计算组限重叠组距=本组上限-本组下限组限间断组距=本组上限-上组上限=下组下限-本组下限据此可以判断等距与不等距数列50开口数列?组中值:各组上下限的中点值。当组内变量值均匀分布或对称分别时,组中值可作为组变量值的代表值。组中值的计算51确定分组形式3.编制变量数列的步骤确定组数确定组距确定组限排序计算频数表现现象的度、规定的界限体现分布的集中趋势考虑到习惯、便于对比52某月啤酒公司60个销售点的销量487152533641695847605329417281374358684273625944515347665952344973294716395843294652384680585167545758634940546158664750单位:桶

excel53啤酒销售量的分布数列(表2-3)销售桶数销售点数频率(%)19以下11.720—2935.030—3958.340—491626.750—592033.360—69915.070—7946.780以上23.3合计60100.0544.累计次数分布551.向上累计

次数的累计从变量值较小的组相变量值较大的组累计,反映小于该组上限的次数或百分数总共有多少。2.向下累计

次数从变量值较大的组向变量值较小的组累计,反映大于该组下限的次数或百分比总共有多少。56某班学生考试成绩次数表成绩(分)学生人数向上累计向下累计60以下225460-7015175270-8019363780-9015511890-1003543合计54————57定序数据频数分布表【例2.2】在一项城市住房问题的研究中,研究人员在甲乙两个城市各抽样调查300户,其中的一个问题是:“您对您家庭目前的住房状况是否满意?1.非常不满意;2.不满意;3.一般;4.满意;5.非常满意。

表2-5甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)百分比(%)向上累积向下累积户数(户)百分比(%)户数(户)百分比(%)

非常不满意

不满意

一般

满意

非常满意24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562510合计300100.0————58定序数据的图示—累计频数分布图243001322252700100200300400

非常不满意

不满意

一般

满意

非常满意累积户数(户)(a)向上累积27616830300750100200300400

非常不满意

不满意

一般

满意

非常满意累积户数(户)(b)向下累积图2-3甲城市家庭对住房状况评价的累积频数分布595.次数分布类型和次数分布图(1)次数分布类型钟型分布——中间多、两头少对称分布——如正态分布左偏分布(负偏)右偏分布(正偏)U型分布两头大,中减少J型分布一头大,一头小60频数分布的类型U型分布正J型分布反J型分布对称分布右偏分布左偏分布612.3统计表和统计图2.3.1统计表1.统计表的概念表现经过整理的统计数据按一定结构和顺序排列而成的表格统计数据最规范的表现形式

2.统计表的构成标题——总标题、横行标题、纵列标题横行、纵列数字资料表外附加6263表2-122007年我国城乡居民家庭人均收入及恩格尔系数家庭人均可支配收入恩格尔系数(%)绝对额(元)指数(1978=100)农村居民4140.4734.443.1城镇居民13785.8752.336.3总标题纵列标题数据横行标题资料来源:《中国统计年鉴2008》注释:表外附加(表脚)63表2—131999年世界500强企业中利润额最高的前五个行业总标题横

题数

料纵列标题资料来源:《中国国情国力》2000年第10期表外附加主词宾词6465家庭人均可支配收入恩格尔系数(%)绝对额(元)指数(78=100)农村居民2366.4503.847.7城镇居民6859.6416.338.2家庭人均可支配收入恩格尔系数(%)绝对额(元)指数(78=100)农村居民3254.9624.545.5城镇居民10493.0607.436.72005年2001年家庭人均可支配收入恩格尔系数(%)绝对额(元)指数(78=100)农村居民3587.0670.743.0城镇居民11759.5670.735.82006年65分组年份家庭人均可支配收入恩格尔系数(%)绝对额(元)指数(78=100)农村居民20012005200620072366.43254.93587.04140.4503.8624.5670.7734.447.745.543.043.1城镇居民20012005200620076859.610493.011759.513785.8416.3607.4670.7752.338.236.735.836.3我国农村和城镇居民家庭人均可支配收入及恩格尔系数联合国粮农组织针对该系数提出具体标准:即恩格尔系数在59%以上为贫困,在50-59%之间为温饱,在40-50%之间为小康,在30-40%之间为富裕,低于30%为最富裕。

66年份农村居民城镇居民人均可支配收入(元)指数(78=100)恩格尔系数(%)人均可支配收入(元)指数(78=100)恩格尔系数(%)20012005200620072366.43254.93587.04140.4503.8624.5670.7734.447.745.543.043.16859.610493.011759.513785.8416.3607.4670.7752.338.236.735.836.567统计表按主词是否分组及分组标志的多少:简单表:对总体未进行任何分组;简单分组表:对总体仅按一个标志进行分组;复合表;对总体按两个及以上的标志进行重叠分组。1994——1997年城乡居民家庭人均收入单位:元简单表68

表2—2某城市居民关注广告类型的频数分布1001200合计56.025.54.58.05.01.00.5600.2550.0450.0800.0500.01011251916102

商品广告服务广告金融广告房地产广告招生招聘广告其他广告频率(%)比例人数(人)广告类型简单分组表:69某地区工业企业产值统计表复合表:70列联表又称为交叉表,是由两个以上的变量进行交叉分类的频数分布表对于定类数据的描述和分析,通常采用列联表进行交叉分析。列联表是由两个以上的变量进行交叉分类的频数分布表。列联表就是复合分组表。列联表,P35性别月平均通信费(元)50以下50~60。。。合计男女合计表x某校300为学生性别与通信费列联表71总标题内容应满足3W要求(whatwherewhen)要合理安排统计表的结构数据计量单位相同时,可放在表的右上角标明,不同时应放在每个指标后或单列出一列标明表中的上下两条横线一般用粗线,其他线用细线通常情况下,统计表的左右两边不封口表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一对于没有数字的表格单元,一般用“——”表示必要时可在表的下方加上注释4.统计表的设计规则7273制作频数分布表用图形显示数据列出各类别计算各类别的频数2.3.2统计图次数分布图73定性数据整理—频数分布表【例】为研究广告市场的状况,一家广告公司在某城市随机抽取200人就广告问题做了邮寄问卷调查,其中的一个问题是“您比较关心下列哪一类广告?”1.商品广告;2.服务广告;3.金融广告;4.房地产广告;5.招生招聘广告;6.其他广告。广告类型人数(人)比重(%)商品广告服务广告金融广告房地产广告招生招聘广告其他广告1121651910256.025.54.58.05.01.0表2-9某城市居民关注广告类型的频数分布74定性数据的图示—柱形图柱形图是用宽度相同的条形的高度或长短来表示数据变动的图形柱形图有单式、复式等形式在表示定性数据的分布时,是用柱形图的高度来表示各类别数据的频数或频率绘制时,各类别可以放在纵轴,又称为条形图,也可以放在横轴,称为柱形图75定类数据的图示—条形图人数(人)5191610211204080120

商品广告

服务广告

金融广告

房地产广告

招生招聘广告

其他广告广告类型

图2-7某城市居民关注不同类型广告的人数分布76定量数据——直方图用矩形的宽度和高度来表示频数分布的图形,在平面直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图。直方图要求各组具有相同的组距,这样每一组的矩形面积就与该组的次数完全对应。异距数列作直方图时,应将不等组距调整为等距组。直方图下任何一个矩形所占面积的百分数与其频率值相同。77表2-10某车间50名工人日加工零件数分组表按零件数分组频数(人)频率(%)105~110110~115115~120120~125125~130130~135135~140358141064610162820128合计5010078分组数据—直方图频数(人)1512963105110115120125130135140日加工零件数(个)图2-2某车间工人日加工零件数的直方图79表2-14某车间50名工人日加工零件数的异距分组表按零件数分组频数(人)频率(%)105—110110—115115—120120—125125—135135—1403581416(=10+6)4610162832(=20+12)8合计5010080频数(人)1512963105110115120125135140日加工零件数(个)次数怎么增加了?直方图的面积之和不等于总次数图2-4根据表2—14某车间工人日加工零件数的异距分组表所作直方图10681找出标准组距:该例为5频数密度=频数/组距=16/10=1.6

标准组距的频数=5×1.6=8按标准组距的次数8作直方图。异距数列作直方图时,应将不等组距调整为等组距。调整的方法是:以标准组距乘以频数密度(频数密度=频数/组距)得到标准组距的频数,再按标准组距的次数作直方图。82105110115120125140直方图的面积之和等于总次数图2-5根据表2—14某车间工人日加工零件数异距分组表按标准组距所作直方图13513088频数(人)1512963日加工零件数(个)83直方图与条形图的区别条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的;直方图是可用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义;直方图的各矩形通常是连续排列,条形图则是分开排列。84折线图折线图也称频数多边形图(Frequencypolygon)是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉折线图的两个终点要与横轴相交,具体的做法是第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的851512963105110115120125130135140日加工零件数(个)频数(人)折线图下的面积与直方图的面积相等!图2-3某车间工人日加工零件数的折线图86曲线图曲线图是用一条光滑的曲线表示次数分布;当直方图的组距无限缩小时,折线图就成了曲线图曲线图是折线图的理论图8788茎叶图茎叶图是反映原始数据的图形。它由茎和叶两部分构成。通过茎叶图,可以看出数据的分步形状及数据的离散状况,如分布是否对称,数据是否集中,是否有离群点等等。绘制茎叶图关键是设置好树茎。制作茎叶图时,首先把一个数字分成两部分,通常是以该数据的高位数值作为树茎,而且叶上只保留该数值的最后一个数字。如125分成125,12分成12,前部分是树茎,后部分是树叶。茎叶图类似于横置的直方图,与直方图相比,茎叶图既能够给出数据的分布状况,又能够给出每一个原始数据。而直方图虽然能够很好的显示数据的分布,但不能保留原始数值。在应用方面,直方图通常适用于数据量大的情况,茎叶图通常适用于小批量数据。89141156215205196191187181177173143158218206197192187182177173144159223207197194188182178174149160225208198194188183178174150160226209198195188184178174152161228210200195189185179175153161233210201196189186179175153162233211202196189186179175154163234211203196190187180176155163234213203196190187180176165164237214171172172172167168166168165168171172173165170172某电脑公司某年4个月销售量90某电脑公司某年4个月销售量91圆形图也称饼图,是用圆形及园内扇形的面积来表示数值大小的图形主要用于表示总体中各组成部分所占的比例,对于研究结构性问题十分有用在绘制圆形图时,总体中各部分所占的百分比用园内的各个扇形面积表示,这些扇形的中心角度,是按各部分百分比占3600的相应比例确定的例如,关注服务广告的人数占总人数的百分比为25.5%,那么其扇形的中心角度就应为3600×25.5%=91.80,其余类推92

其他广告1.0%

房地产广告8.0%

商品广告56.0%

金融广告4.5%

服务广告25.5%

招生招聘广告5.8%图2-8某城市居民关注不同类型广告的人数构成93【例】在一项城市住房问题的研究中,研究人员在甲乙两个城市各抽样调查300户,其中的一个问题是:“您对您家庭目前的住房状况是否满意?1.非常不满意;2.不满意;3.一般;4.满意;5.非常满意。

表2-10甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)百分比(%)向上累积向下累积户数(户)百分比(%)户数(户)百分比(%)

非常不满意

不满意

一般

满意

非常满意24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562510合计300100.0———

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论