统计学基础:第2章 统计数据的搜集、整理与显示_第1页
统计学基础:第2章 统计数据的搜集、整理与显示_第2页
统计学基础:第2章 统计数据的搜集、整理与显示_第3页
统计学基础:第2章 统计数据的搜集、整理与显示_第4页
统计学基础:第2章 统计数据的搜集、整理与显示_第5页
已阅读5页,还剩94页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章统计数据的搜集整理和显示第一节统计数据的搜集第二节数据整理第三节频数分布第四节数据显示第一节统计数据的搜集一、统计数据搜集的基本理论与方法概念与方案设计等二、统计调查的组织形式分类与几种重要的调查形式三、统计调查体系四、统计调查方案设计五、统计调查误差一、统计数据搜集基本理论与方法(一)统计数据搜集的概念1、定义:统计数据搜集是根据统计研究预定的目的和任务,运用科学的调查方法与手段,有计划、有组织地向客观实际采集数据的过程。2、统计数据搜集的方式有两种:根据研究的目的,搜集已经加工、整理过的、说明总体现象的资料(一般称为二手资料)。在引用二手数据时,应注明来源,以尊重他人的劳动成果。直接向调查对象搜集反映调查单位的统计资料(一般称为原始资料)。(二)调查数据与实验数据调查数据:通过统计调查获得的数据实验数据:在实验中控制实验对象而搜集到的数据。一般来讲,自然科学领域中常运用实验方法来获得数据。1.直接观察法2.报告法(通讯法)3.采访法口头询问、自填式4.登记法5.实验设计实验设计的原则1.重复性原则2.随机化原则3.双盲原则其它方法:如卫星遥感法、计算机辅助电话调查(如CATI系统)等(三)统计数据的搜集方法对于一些自然现象,往往通过实验设计获得。比如,化学家们通过实验了解不同元素结合后产生的变化,医学家们通过实验验证新药的疗效。(实验设计也被运用于社会科学中。)2012年4月左右,科学家首次利用先进的高清卫星测绘技术,对生活在南极大陆的帝企鹅种群进行了数量统计,结果显示,南极帝企鹅的数量剧增为大约59.5万只,远远超过之前所估计的27万至35万。二、统计调查的组织形式统计报表普杳抽样调查重点调查典型调查周期性调查一次性调查普查抽样调查重点调查典型调查全面调查非全面调查连续(经常性)调查不连续调查定期报表专门调查调查范围调查时间组织形式统计调查形式领会概念(一)普查是一种专门组织的、一次性的全面调查。它主要是用以搜集某些不能或不宜用定期报表搜集的统计资料。对国情国力的调查一般采用普查。例如,我国人口普查、工业普查、第三产业普查、经济普查普查的特点(1)是非经常性调查(2)是全面调查普查的组织方式(1)专门组织的普查机构派出调查人员,直接登记。(2)利用调查单位的原始记录和资料,发一定的调查表格,由调查单位填报。(二)统计报表制度统计报表制度是依照国家有关法规,自上而下地统一布置,以一定的原始记录为依据,按照统一的表式,统一的指标项目,统一的报送时间和报送程序,自下而上地逐级地定期提供统计资料的一种调查方式。特点:见P18局限性:(1)花费的人力物力较大(2)层层上报过程中,容易受到人的主观因素的影响,若统计法制不健全,又没有其他核算手段相配合,难保准确性。(3)社会经济现象日新月异的状况,无法体现。(三)抽样调查抽样调查是一种非全面调查。它是按随机原则从总体中抽取一部分单位作为样本进行观察,然后根据样本指标值去推算调查对象的总体指标的一种调查。这里所讲的抽样,一定要遵循随机原则,也称为概率抽样。但在实际工作中,有时抽取样本时并不遵循随机原则,此时的抽样即为非概率抽样。在非概率抽样时,不能使用样本的调查结果对总体的相应参数进行估计。*抽样调查是一种非常重要的统计调查,抽样调查有多种组织形式,如简单随机抽样、类型抽样、等距抽样、整群抽样阶段抽样等。抽样调查的特点(1)按随机原则从全部总体中抽选样本单位。随机原则:每个单位有相同的中选可能性;每个单位的中选不中选不是主观所决定的。(2)根据部分实际资料对全部总体的数量特征作出估计。(3)抽样推断的误差可以事先计算,并加以控制。(4)*是运用概率的估计方法。例如:通过抽样推断得出,厦大学生的平均月支出在(420,470)元上的可靠性为90%。抽样调查遵遁的原则随机原则最大抽样效果原则提高抽样估计精确度与节省调查费用是一对矛盾抽样调查的适用范围(1)不可能或不必要进行全面调查的社会现象。无限总体的调查。破坏性的产品质量检验。总体单位数过大。没必要全面调查,如城乡居民家计调查、民意测验等。特殊情况,如战备物资调查、矿产调查等(2)对普查资料进行必要的修正。(四)重点调查重点调查是指在调查对象中,只选择一部分重点单位进行的非全面调查。所谓重点单位,这些单位在全部单位中只是一部分,但它们在所研究现象的标志总量中却占有绝大的比重,在总体中具有举足轻重的作用。对这些重点单位进行调查,能够从数量上反映整个总体在该标志总量方面的基本情况。例如,为了掌握全国钢铁生产的基本情况,可以选出鞍钢、宝钢、首钢、马钢、武钢等几个大型钢铁企业调查。(五)典型调查有意对若干有代表性的单位进行调查研究。属于专门组织的非全面调查,带有一定的主观性。三、统计调查体系我国建立以必要的周期性的普查为基础,经常性的抽样调查为主体,同时辅之以重点调查、科学推算和部分全面报表综合运用的统计调查方法体系。(1994年,国务院批转了国家统计局《关于建立国家普查制度改革统计调查体系的请示》)一些改革*:2003年年底,国家决定对普查制度进行重大改革,把原有的基本单位普查、工业普查和第三产业普查加以合并,并增加建筑业普查,形成经济普查,每隔五年进行一次。2005年3月,国务院办公厅印发通知,决定合并原有的农调队、城调队和企调队组建由国家统计局垂直管理的各级调查总队,提升其级别并作为国家统计局的派出机构。目前除西藏以外,国家统计局在全国30个省份已组建完成其直属的调查总队。今后,还将组建建市级调查队和县级调查队。*抽样调查远未真正成为调查体系主体!目前的抽样调查远未真正成为整个调查体系的主体。造成该现象的原因主要有以下几点:首先,在以统计数字作为政绩考核和资源配置主要依据的体制下,各级政府必须全面了解和掌握自己所分管的层次或单位的统计数据,而以抽查部分样本来推算总体为特征的现行抽样调查方法难以满足这一需要。在现行统计体制下,尽管从全社会看,抽样调查肯定比全面报表调查节省人力、物力和财力,但对于统计部门来说,布置定期报表并不需要支付费用,而采用抽样调查则反而要增加自身的支出。这不能不影响到统计部门推广抽样调查的积极性。原来的抽样调查主要由三支调查队负责,三支调查队又按照其工作范围分别组建,缺乏有力的协调,大家都只考虑自己范围内的事,对于进一步推广抽样调查,扩大抽样调查应用的范围也是不利的。一些有关抽样调查的技术问题包括抽样方案设计、抽样框的建设、样本的轮换等还有待进一步研究与改进。四、统计调查方案的设计1、确定调查的任务与目的解决为什么(why)调查?2、确定调查对象、调查单位和填报单位(报告单位)解决向谁(who)调查?由谁来具体提供资料?例1:调查福建省乡镇企业经营状况。调查对象:全省所有的乡镇企业,调查单位:每个乡镇企业,填报单位:每个乡镇企业。例2:调查目的是为了掌握全国炼钢设备情况。调查对象:全国所有炼钢设备,调查单位:每台炼钢设备,填报单位:具有炼钢设备的每个冶金企业。注意:调查单位与报告单位,有时是一致的,有时不一致。类比:调查对象——总体调查单位——总体单位3、确定调查项目解决向调查单位调查什么(what)?调查项目就是调查中所要登记的调查单位的特征,即调查单位所承担的基本标志,它由一系列品质标志和数量标志所构成。4、调查表格和问卷的设计调查表格有两种1.单一表:项目较多时,一个调查单位一张表。2.一览表:多个调查单位填写在一张表上。问卷:5、确定调查时间(when)两种涵义:调查时间和调查期限调查时间:是指调查资料所属的时间时点现象─规定标准时刻,时期现象─规定现象的起止时间。调查期限:是进行调查工作的时限,包括搜集资料和报送资料的工作所需的时间,应尽可能缩短。6、确定调查的组织实施计划7、调查报告的撰写五、统计调查误差衡量统计调查数据的准确性,以进一步评价统计调查的质量分为抽样误差和非抽样误差抽样误差:产生于概率抽样中,由于随机性的原因导致样本无法充分代表总体,由此而产生的误差。抽样误差可以估算并加以控制。非抽样误差:各种形式的调查均可能产生这种误差。如无回答误差、计量误差等。习题1.某市组织一次物价大检查,要求12月1日至12月15日全部调查完毕。这一时间规定是

。2.调查几个铁路枢纽,了解我国铁路货运量的基本情况和问题,这种调查方式属于()

A抽样调查B重点调查C普查

D典型调查

3.要对某工厂生产设备拥有量进行调查,则()

A调查对象——某工厂

B调查单位——该厂每一台设备

C报告单位——该厂每一台设备

D调查方法——重点调查

E调查时间——某一天或某一天的某时刻4.抽样调查和重点调查的主要区别是()A原始资料来源不同B取得资料的方法不同C调查的单位数多少不同D抽取调查单位的方式方法不同5、某灯泡厂为了掌握该厂的产品质量,拟进行一次全厂的质量大检查,这种检查应当选择()A、统计报表B、重点调查C,典型调查D、抽样调查6、下列统计调查中,调查单位和填报单位一致的是()A、工业企业设备普查B、零售商店调查C、人口普查D、高校学生健康状况调查E、工业企业普查7、某企业为测试某种缆绳的拉力,采用()搜集相关数据资料

A、报告法 B、采访法 C、实验设计法 D、直接观察法8、划分全面调查与非全面调查的标志是()

A、资料是否全面 B、调查单位是否为全部

C、调查时间是否连续 D、调查项目是否齐全

第二节数据整理主要内容数据整理的概念、内容和程序统计分组分组的概念、原则、种类分组的方法组限、组数、组距和组中值等概念一、数据整理的概念、内容和程序*概念两种整理汇总性整理:对统计调查所搜集到的各种数据进行分类和汇总。综合性整理:对现成资料的整理。数据整理是统计分析的前提,在统计研究中起承前启后的作用。内容和程序内容:设计方案;汇总并计算有关指标;描述整理的结果。程序:1.资料的审核2.分组和汇总3.形成各项统计指标、编制统计图表4.资料的积累、保管和公布

二、统计分组(一)统计分组的概念和种类1、定义:根据统计研究的目的和客观现象的内在特点,按照某个标志或几个标志把研究的总体划分为若干性质不同的部分(或组)的一种统计方法。2.兼有“分”和“合”的双重含义:对于现象总体,是“分”;对于单位,是“合”。对于分组标志,是“分”,对于其他标志,是“合”。选择分组标志后,突出了一种差异,同时掩盖了其他差异。3.分组原则穷尽(不漏):每一个单位必须能归属于某一组。例如,对西藏民族学院学生按民族分为:藏族和汉族两组,则可能会漏了一些其他民族的学生。正确应该分为:藏族、汉族、其他三组。互斥(不重):每一个单位只能归入一个组,不能同时归属于几个组。例如,某商场把服装分为男装、女装和童装三类,就不符合互斥原则。若先把服装分为成年与儿童两类,然后再分为男女两组,就符合互斥原则。4.统计分组的种类(1)按分组标志的性质不同,分为品质分组和数量分组。(2*)按分组的作用不同,分为类型分组、结构分组和分析分组。(3)按分组标志的多少,分为简单分组和复合分组。简单分组就是对总体按一个标志进行分组,它只能从某一方面说明和反映事物的分布状况和内部结构。对同一总体选择两个或两个以上的标志进行简单分组,排列起来,即成为平行分组体系。复合分组:对同一个总体选择两个或两个以上的标志层叠进行分组,就形成复合分组体系。例:简单分组按性别分组按工龄分组女男10年以上0——5年5——10年例:平行分组对工业经济总体的研究,可以进行以下平行分组。工业经济总体(1)按轻、重工业分:轻工业重工业(2)按经济类型分:国有集体私营┆(3)按地区分:华北地区东北地区┆例:复合分组按经济类型分组

例如某工厂职工构成概况如下:职工人数构成表单位:人城乡个体企业其他经济类型企业全民所有制企业集体所有制企业重工业轻工业重工业轻工业重工业轻工业重工业轻工业性别职工类别男女合计技术工辅助工合计*例:类型、结构、分析分组类型分组:某年1—7月全国工业总产值单位:亿元结构分组:我国国民生产总值产业构成变化情况(以GDP为100)分析分组:某地区商业利润率与流通费用率依存关系表(二)统计分组的方法统计分组的关键问题是“正确地选择分组标志”与“划分各组界限”。这里主要介绍品质分组与数量分组。*分组标志的选择原则(1)应根据研究的目的与任务选择分组标志。例如,同一个工人总体,有多种不同分组方法。如果研究学历对收入的影响时,应选择“文化程度”作为分组标志。如果研究资历对收入的影响时,则应选择“工龄”作为分组标志。(2)要选择能够反映事物本质或主要特征的标志。例如,研究职工生活水平的高低情况时,可以用“职工的工资水平”作为分组标志,也可以用“职工家庭成员平均收入水平”作为分组标志。应该选择后者作为分组标志。(3)要根据现象的历史条件变化来选择分组标志。例如,前面讲到研究职工生活水平问题,如果要列出“职工生活贫困户”一组,则“贫困户”的标准就随历史条件变化而变化,而且不同地区标准也不相同。中国贫困线标准1、按品质标志分组按品质标志分组就是用反映事物的属性、性质的标志分组,它可以将总体单位划分为若干性质不同的类型。例如,职工可以按性别、民族、文化程度、技术等级、籍贯等标志分组。又如企业可以按所有制形式、隶属关系、地区,大中小型等标志分组。品质标志分组一般比较容易,但有些情况比较复杂,为此,国家统计局及有关部门,统一制定各种分类目录与规定标准。例如:《工业部门分类目录》、《工业产品目录》《大中小型工业划分标准》等。2、按数量标志分组两个要点:分组能够反映事物质的差别。采取适当的分组形式,确定适当的组距、组限。分类:单项式分组组距式分组(又有以下两种分类方式)分类一:间断组距式分组和连续组距式分组分类二:等距分组与异距分组(1)单项式分组与组距式分组若离散型变量变动幅度小,则可依次将每一个变量值作为一组,即单项式分组。当离散型变量数值很多,且变动幅度很大时,应用组距式分组,即将全部的变量值划分为若干区间,各个变量值则按其大小确定所归属的区间。连续型变量由于不能一一列举它的变量值,不能作单项式组,只能是组距分组。例:1.农村家庭按拥有小孩数分组(表1):2.企业按工人人数分组(表2)3.工人按工资分组(表3)表1表2表3(2)间断组距式分组和连续组距式分组组限:组距式分组中,每一组的两端值。起始值为下限,结束值为上限。若相连的两组的组限不相连的,称为间断组距式分组。若相连的两组的组限重叠的,称为连续组距式分组。连续型变量只能采用连续组距式分组;离散型变量既能采用间断组距式分组,也能采用连续组距式分组。统计上规定,如果总体某一个单位的变量值是相邻两组的界限值,则这一个单位归入作为下限值的那一组内,即所谓的“上限不在内”原则。例如,70分不归入60~70分组,而归入70~80分组。(3)等距分组与异距分组组距:区间的长度。等距分组:标志值在各组保持相等的组距,即各组的标志值变动都限于相同的范围。一般用于标志值变动比较均匀的场合。优点:便于各组单位数和标志值的直接比较;便于计算各项综合指标;便于绘制统计图。异距分组:各组的组距不相等。应用场合:标志值分布很不均匀的场合。标志值相等的量具有不同意义的场合。标志值按一定比例发展变化的场合。例:异距分组应用场合第一,标志值分布很不均匀的场合。例如,学生成绩如果密集于60~80分之间,而其它分数段人数稀少,则为了减少信息损失,可以60~80分之间组距取5分,其它取组距10。比如,50以下、50~60、60~65、65~70、70~75、75~80、80~90、90以上。第二,标志值相等的量具有不同意义的场合。例如,生命的每一个月对于新生婴儿和对于成年人是大不一样的,所以在按年龄分组进行人口疾病研究时,采用不等距分组。即1岁以下按月分,1~10岁按年分,11~20岁按5年分,21岁以上按10或20年分等等。第三,标志值按一定比例发展变化的场合。例如,大城市里商店的销售额差别很大,年销售额从5万到5000万,可采用公比为10的不等距分组:5万以下,5~50万,50~500万,500~5000万元。(4)几个概念:组限、组数、组距和组中值组限第一组的下限略小于实际变量值的最小值,最后一组的上限略大于实际变量值的最大值。组距:区间的长度。连续组距式分组组距:组距=上限-下限间断组距式分组组距:组距=本组上限-前组上限(或)=本组下限-前组下限(或)=本组上限-本组下限+1

“开口组”(只有上限或只有下限的组)的组距:参照相邻组确定。几个概念(续)组数:组距大,组数就少;组距小,组数就多经验公式:n=1+logN/log2(n:组数;N:总体单位数)组中值:在计算平均指标或进行其他统计分析时,常以组中值来代表各组的平均水平。组中值=(上限+下限)/2开口组组中值的计算参照相邻的组。“XX以上”组的组中值

=下限+邻组组距/2“XX以下”组的组中值

=上限-邻组组距/2750125017502250第三节频数分布主要内容:基本概念变量数列的编制累计频率与累计频数频数分布图的类型(一)频数分布的基本概念1.频数分布:在统计分组的基础上,将总体的所有的单位按组归类整理,并计算各组的单位数,形成一系列反映总体各组之间单位数分布状况的数字,称为频数分布(次数分布),也叫分布数列。品质数列变量数列2.分布数列的两个要素总体按某标志所分的组各组所出现的单位数(频数)(二)变量数列的编制编制变量数列时,一般采用组距式分组。一般步骤如下:1、进行分组等距还是异距?标志值的变动范围有多大,分为多少组合适?组距是多少?2、确定次数,即每一组出现的总体单位数。3、一般来讲,还要计算每一组的频率,对于异距分组,还要计算频数或频率密度。频数和频率(密度)频数和频率(1)频数:又称次数。分布在各组的单位个数。(2)频率:各组的频数与频数之和的比值。频率的性质?频数密度和频率密度(异距分组时使用,为的是消除组距对频数的影响)(1)频数密度=频数/组距,即单位组距的频数。(2)频率密度=频率/组距,即单位组距的频率。517.527.53020100(三)累计频数(率) 1.向上累计:由标志值低的组向标志值高的组依次累加频数(率)。各组向上累计频数表明该组上限以下的单位数之和。各组向上累计频率表明该组上限以下的单位总数占总体单位数的比重。29203240522.550801002.向下累计:由标志值高的组向标志值低的组依次累加频数(率)。各组向下累计频数表明该组下限以上的单位数之和。各组向下累计频率表明该组下限以上的单位总数占总体单位数的比重。4038312081009577.55020例:变量数列的编制某电脑公司2002年前四个月各天的销售量数据(单位:台)。试对数据进行分组。

步骤1、确定组数:根据Sturges提出的经验公式得组数n为:2、确定各组的组距: 组距=(237-141)÷10=9.6103、用Excel制作频数分布表等距分组表在Excel中的操作方法*品质数列的编制?列出各类别计算各类别的频数制作频数分布表例:一家市场调查公司为研究不同品牌饮料的市场占有率,对随机抽取的一家超市进行了调查。调查员在某天对50名顾客购买饮料的品牌进行了记录,如果一个顾客购买某一品牌的饮料,就将这一饮料的品牌名字记录一次。

旭日升冰茶可口可乐旭日升冰茶汇源果汁露露

露露旭日升冰茶可口可乐露露可口可乐

旭日升冰茶可口可乐可口可乐百事可乐旭日升冰茶

可口可乐百事可乐旭日升冰茶可口可乐百事可乐

百事可乐露露露露百事可乐露露

可口可乐旭日升冰茶旭日升冰茶汇源果汁汇源果汁

汇源果汁旭日升冰茶可口可乐可口可乐可口可乐

可口可乐百事可乐露露汇源果汁百事可乐

露露可口可乐百事可乐可口可乐露露

可口可乐旭日升冰茶百事可乐汇源果汁旭日升冰茶不同品牌饮料的频数分布饮料品牌频数百分比(%)可口可乐1530旭日升冰茶1122百事可乐918汇源果汁612露露918合计50100对称分布右偏分布左偏分布正J型分布反J型分布U型分布几种常见的频数分布习题1.已知某连续变量数列,其末组为开口组,下限为500,又知其邻组的组中值为480,则末组组中值的近似值为()

A520B510C500D4902.统计分组标志的选择确定,是至关重要的事,因为分组标志一经确定()

A总体各单位所有标志都抽象化了。

B不但突出了现象总体在此标志下的差异,也把总体在其他标志下的差异暴露了。

C就突出了现象在此标志下的性质差异,而掩盖了总体在其他标志下的差异。

D就掩盖了现象在此标志下的性质差异,而把总体在其他标志下的差异统统表现出来。3.某管理局对其所属企业的生产计划完成百分比采用如下分组,正确的()

A80——89%B80%以下C90%以下D85%以下

90——99%80.1——90%90——100%85——95%

100——109%90.1——100%100——110%95——105%

110%以上100.1——110%110%以上105——115%4.次数密度消除了()

A组数过多、组距过小的影响B组距因素的影响

C各组频率的影响D总体各单位标志值不均匀的影响5.学龄前儿童按年龄分组为:末满1周岁、1-2岁、3-6岁。这里()

A年龄是分组

标志 B年龄是离散型变量

C儿童是分组标志 D第一组的组中值是0.5岁

E第二组的组中值是1.5岁6.请看以下资料:某地区的同行业企业按劳动生产率分组如下:下列判断,那些是正确的()

A单位总量——企业数(19),产量(93200),工人数(1160)

B标志——产量、工人数和劳动生产率

C标志——产量、工人数、劳动生产率和企业数

D标志总量——产量(93200),工人数(1160)

E标志总量——产量(93200),工人数(1160)和企业数(19)7.以下哪些通常是呈钟形分布?()

A居民个人智商的分布

B全国在校大学生人数的地区分布

C小麦按产量分布

D人口按年龄的死亡率分布

E高血压患病率按年龄分布第四节数据显示主要内容:统计表统计图一、统计表统计表—定义和结构定义广义:任何用以反映统计资料的表格,或统计工作过程中的一切表格。狭义:统计资料经过整理、汇总按一定的规则排列在表格上,这种表格称为统计表。结构(1)从表式上看:总标题,横行标题,纵栏标题,指标数值。(2)从内容上看:主词栏,宾词栏。(例)统计表—分类按主词分组情况分类:简单表、分组表、复合分组表。P41主词:所要说明的总体及其组成部分按宾词的设计分类:宾词简单排列,宾词分组平行排列,宾词分组层叠排列。宾词:说明总体数量特征的各个统计指标主词简单表主词罗列各指标的名称主词简单表主词由研究总体各单位清单组成的一览表主词简单表也可以是主词由时间顺序组成的编年表等主词分组表主词分组表主词复合分组表主词复合分组表宾词简单排列宾词分组平行排列宾词分组层叠排列统计表—设计统计表设计总的要求是:简练、明确、实用、美观,便于比较。统计表的设计应注意如下事项:1.线条的绘制。表的上下端应以粗线绘制,表内纵横线以细线绘制。表格的左右两端一般不划线,采用“开口式”。2.合计栏的设置。统计表各纵列若需合计时,一般应将合计列在最后一行,各横行若需要合计时,可将合计列在最前一栏或最后一栏。3.标题设计。统计表的总标题,横栏、纵栏标题应简明扼要,以简练而又准确的文字表述统计资料的内容、资料所属的空间和时间范围。统计表—设计4.指标数值。表中数字应该填写整齐,对准位数。当数字小可略而不计时或缺某项数字资料时,可用符号“…”表示;不应有数字时用符号“—”表示。免填的用“×”表示。5.计量单位。统计表必须注明数字资料的计量单位。当全表只有一种计量单位时,可以把它写在表头的右上方。如果表中各行的指标数值计量单位不同,可在横行标题后添一列计量单位。6.注解或资料来源。必要时,在统计表下应加注解或说明。以便查考。二、统计图1Excel用于表示变量数列分布的统计图主要有:直方图、折线图、曲线图和累计曲线图等。注意:累计曲线图也可用于表示由定序数据所形成的品质数列。直方图在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率。依据各组组距的宽度与相应频数的高度绘成一个个矩形,即成为直方图。直方图—绘制某电脑公司销售量分布的直方图我一眼就看出来了,销售量在170~180之间的天数最多!折线图折线图也称频数多边形图是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉折线图的两个终点要与横轴相交,具体的做法是第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴折线图与直方图所表示的频数分布是一致的折线图—绘制某电脑公司销售量分布的折线图向下累计图:90分以上有20%向上累计图:70分以下有22.5%累计曲线图—累计频率(数)图累计曲线图—洛伦茨曲线图AB基尼系数=A/(A+B)2011胡润财富报告洛伦茨曲线()

A是一种频率分布曲线

B计算收入的结构相对数是绘制曲线的基础

C与绝对平等线包围的面积越大,表示分配越不公平

D与绝对平等线包围的面积越大,表示分配越公平

E利用它可以计算恩格尔系数雷达图10个地区人口自然增长率统计图2Excel用于表示品质数列分布的统计图主要有:由定类数据所形成的品质数列:柱形图(条形图)、饼图(圆形图)、环形图;对由定序数据所形成的品质数列,还可以使用累计曲线图和环形图。条形图用宽度相同的条形的高度或长短来表示各类别数据的图形有单式条形图、复式条形图等形式主要用于反映定类数据的频数分布绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图条形图—图示直方图与条形图的区别条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义直方图的各矩形通常是连续排列,条形图则是分开排列条形图主要用于展示品质数列,直方图则主要用于展示变量数列饼图也称圆形图,是用圆形及园内扇形的面积来表示数值大小的图形主要用于表示总体或样本中各组成部分所占的比例,对于研究结构性问题十分有用绘制圆形图时,总体中各部分所占的百分比用园内的各个扇形面积表示,这些扇形的中心角度,是按各部分数据百分比占3600的相应比例确定的饼图—图示(例题分析)环形图环形图中间有一个“空洞”,总体中的每一部分数据用环中的一段表示环形图与圆形图类似,但又有区别圆形图只能显示一个总体各部分所占的比例环形图则可以同时绘制多个总体的数据系列,每一个总体的数据系列为一个环环形图可用于结构比较研究环形图主要用于展示定类和定序数据环形图—图示(例题分析)8%36%31%15%7%33%26%21%13%10%

非常不满意

不满意

一般

满意

非常满意

甲乙两城市家庭对住房状况的评价例:中美关系调查统计图3Excel用于显示由数量标志值形成的,并且未经分组的原始数据的分布的统计图有:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论