版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计学Statistics1第二章统计数据的收集与整理第一节统计数据收集2一、收集资料的方式概括起来分为直接方式和间接方式(一)统计资料的直接收集主要包括统计调查和试验设计(二)统计资料的间接收集通过各种渠道收集第二手资料3(一)统计资料的直接收集1.统计调查4总体(1)普查普查(Census)是专门组织的一次性的全面调查。
特点:其他调查方式不能替代;涉及面广、准确度要求高、时效性强,必须统一领导、统一要求、统一行动。
组织原则:规定标准时点;确定普查期限;规定调查项目;选择普查的时期;
用途:对没有必要经常调查的项目;其他调查方法达不到既定精度的情况。5今后,我国的普查将规范化、制度化,即每逢末尾数字为“0”的年份进行人口普查,每逢“3”的年份进行第三产业普查,每逢“5”的年份进行工业普查,每逢“7”的年份进行农业普查,每逢“1”或“6”的年份进行统计基本单位普查67
第六次全国人口普查主要目的:人口普查是一项重大的国情国力调查。组织开展第六次全国人口普查,将查清十年来我国人口在数量、结构、分布和居住环境等方面的变化情况,为科学制定国民经济和社会发展规划,统筹安排人民的物质和文化生活,实现可持续发展战略,构建社会主义和谐社会,提供科学准确的统计信息支持。
内容:人口和住户的基本情况,内容包括:性别、年龄、民族、受教育程度、行业、职业、迁移流动、社会保障、婚姻生育、死亡、住房情况等。
时间:标准时点是2010年11月1日零时。7主要目的是全面调查了解第二产业和第三产业的发展规模及布局,了解产业组织、产业结构、产业技术的现状以及各生产要素的构成,进一步查实服务业、战略性新兴产业和小微企业的发展状况,摸清各类单位的基本情况,全面更新覆盖国民经济各行业的基本单位名录库、基础信息数据库和统计电子地理信息系统。
第三次全国经济普查的标准时点是2013年12月31日,2014年12月16日公布普查结果。891011(2)抽样调查抽样调查(SamplingSurvey):按照随机原则从总体中抽取一部分调查单位进行观察,用以推断总体。特点:按照随机的原则抽取调查单位;由抽查结果从数量上推断总体;对总体推断的准确性和可靠性有概率保证。12用途:不可能进行全面调查的情况下;可以进行全面调查但经济上不合算的情况下;时间紧迫的情况下;检查修正普查和全面调查的结果;对生产过程进行质量控制。13(3)重点调查重点调查(Key-pointSurvey):从调查对象中选取一部分对全局具有决定作用的重点单位进行调查。特点:调查单位少、经济,对重点单位之外的其他单位可进行抽样调查作为对总体调查的补充。所谓重点调查单位,是指这些被调查的总体单位中数目不多,所占比重不大,但其调查的标志值却在总量中占有很大比重,在总体中具有举足轻重的作用。(20/80法则,即帕累托法则)14(4)统计报表(制度)StatisticalReportForms
按照国家统一规定的表格形式,定期地、自上而下布置,自下而上填报统计资料的一种调查形式。
特点:已经形成一种制度;可以组织全面、非全面调查。
类型:国家统计报表、业务统计报表、地方统计报表;半月报、月报、季报、半年报、年报。
用途:用于搜集全面的基本情况,也为重点调查等非全面调查所采用。
15(5)典型调查(课外)典型调查(ModelSurvey):选取少数具有代表性的单位进行深入细致的调查,以把握总体的特征。特点:属于社会调查方法;可以取得第一手数据资料和文字资料、资料具体生动,便于总结经验教训。关键:选好典型——典型调查的质量保证。16典型调查方式有两种:一是“解剖麻雀”式调查,它在调查对象总体单位之间的差异较小时适用。二是“划类选典”式的调查,它在调查对象总体各单位之间的差异较大时适用。注意事项:1)正确地选择典型单位;2)注意点与面的结合;3)必须将定性分析与定量分析结合起来。172.试验设计科学试验是进行科学研究的重要手段,在许多学科中几乎都起着积极的作用。统计中的试验设计是科学试验研究的组成部分之一。试验设计,包括五个相互关联的环节,分别是:方案设计方案实施数据采集数据分析优化生产
18(二)统计资料的间接收集凡不是通过直接的统计调查和试验,而是从其他各种渠道搜集的第二手资料,我们把它总称为统计资料的间接收集。
间接资料的来源大体包括:统计年鉴、统计摘要、统计资料汇编、统计台账、统计公告、报纸、杂志、网上资料等。19数据的搜集方法询问调查访问调查观察实验电话调查邮寄调查观察座谈会个别深访实验数据的搜集方法20二、收集资料的方法
数据资料的收集方法可以分为初级资料收集方法和次级资料收集方法或称文案资料。(一)初级资料收集方法1.访问法
访问法是按所拟调查事项,有计划地通过访谈询问方式向被调查者提出问题,通过他们的回答来获得有关信息资料的方法。
按访问内容的传递方式不同,可分为:
面谈调查、电话调查、邮寄调查、留置调查、日记调查和网上调查等方法。212.观测法观测法是指调查者通过直接观测、跟踪和记录被调查者的情况来收集资料的一种调查方法。3.报告法
报告法是由报告单位根据原始记录和核算资料,按照统计机关颁发的统一的表格和要求,按一定的报送程序提供资料的方法。22(二)次级资料收集方法
次级资料又称二手资料,是指他人为了自己的研究目的而调查、整理的资科。1.根据研究项目的内容判别所需资料的类型2.寻找资料的来源3.对次级资料的查找4.对查找的资料进行甄别、清理、补充23准确性和可靠性是统计工作的生命!
三、统计数据的质量问题24(一)真值与相对真值客观现象的实际数量水平可理解为两层意思:一是真值,即客观现象真正存在的数量状态,是唯一的,但往往不易取得;二是相对真值,它是根据事先确定下来的统计方案,正确实施该方案的各项规定而应该取得的值。25真值与相对真值之间存在的差异应该以不影响统计认识为前提,否则说明统计方案存在问题。真值与相对真值可以作为观测数据质量评估的参照数。26(二)统计调查误差调查误差是指经过调查所获得的统计数值与被调查对象实际数值之间的差别。调查误差有两种:一种是登记性误差一种是代表性误差登记误差是由于调查过程中各有关环节工作的失误而造成的。例如,调查方案中有关规定或解释不清楚而产生歧义,或计算错误、抄录错误,或汇总错误以及不真实填报等。代表性误差是由于非全面调查只观察总体一部分单位,这部分单位不能完全反映总体的性质而产生的误差。27登记性误差产生的三个原因:1)由于数据调查准备工作不充分而引起的误差;2)数据收集阶段产生的误差;3)资料整理过程中产生的误差。28
统计的整个工作过程就是对数据的加工过程,从原始数据的收集开始,经过整理、显示、样本信息的获取到总体数量规律性的科学推断,都有一个减少误差、提高数据质量的问题。也就是说,统计数据的质量控制问题是贯穿于统计全过程的重要问题,因此,加强统计数据质量的管理要体现在统计研究的全过程。
29第二章统计数据的收集与整理第二节统计数据整理30数据整理的含义
数据整理又称统计整理是指根据统计研究的任务与要求,对搜集来的各种原始资料进行科学的分类和汇总,为统计分析提供系统化、条理化的综合资料的工作过程。统计资料整理在统计工作中处于中间阶段,它是统计调查的继续,是统计分析的前提,起着承前启后的作用。31数据整理的程序(课外)(一)对调查资料的审核
审核的内容主要有资料的准确性、及时性、完整性和适用性等几个方面。发现问题,及时纠正。这是统计资料处理工作中一个十分重要的问题,必须认真对待。逻辑审查计算审查人机同审32(二)统计分组与汇总(前提和基础)按照资料整理的要求进行分组汇总,计算各组单位数和总体单位数,计算各组指标和综合指标。(三)编制统计表或绘制统计图统计汇总的结果一般通过统计表或统计图的形式表现出来,以简明扼要、生动形象地表达社会经济现象的数量表现和数量关系。33一、统计分组的含义统计分组是根据研究任务的需要和事物内在的特点,将统计总体按照一定的标志划分为若干组成部分的一种统计方法。总体中的各单位在某一(些)方面是相同的(即同质性),而在其他许多方面则是不同的(即差异性),统计分组的目的是把不同性质的单位分开,把性质相同的单位合在一起。因此,统计分组同时具有两方面的含义:两层含义对个体是“合”对总体是“分”34分组标志的选择统计分组的关键在于正确选择分组标志,这是统计分组的核心问题。1.完备性——各组之和等于总体之和2.互斥性——一个单位只能归到某一个组3.分组标志的一致性35统计分组的种类(课外)(一)品质标志分组和数量标志分组按照分组标志的性质不同可分为品质标志分组和数量标志分组1、品质标志分组就是按事物的质量属性分组。2、数量标志分组就是按照事物的数量特征分组36(二)简单分组与复合分组统计分组按分组标志的多少可以分为简单分组与符合分组1、简单分组,就是对研究现象按一个标志进行分组。2、复合分组,就是按两个或两个以上的标志对总体单位进行重叠分组。37某校教师按性别、职称复合分组表组别人数(人)比重(%)男性教授副教授讲师助教女性教授副教授讲师助教924184030126322564542.21.88.318.313.857.81.410.125.720.6合计218100.038二、分布数列在统计分组基础上,将总体中所有单位按组归类整理,形成总体中各个单位数在各组间的分布,叫做次数分布,又称分布数列。分配数列将组别与次数按一定的顺序排列所形成的数列。次数分布在各组的单位数叫次数,又称频数。比率各组次数与总次数之比叫比率,又称频率。39某车间工人按日产量分组表日产量(件)工人数(人)人数比重(%)2021222324251020305040305.5611.1116.6727.7722.2216.67合计180100.00组别次数(频数)比率(频率)40(一)分布数列的种类品质数列单项式数列变量数列等距数列组距数列异距数列分布数列一个变量值就代表一组。在变量值不多且变化幅度不大的情况下采用。两个变量值确定一组。在变量值较多,变动范围较大的情况下采用。按品质标志分组编制的分布数列按数量标志分组编制的分布数列各组组距相等各组组距不等41某班学生按性别分组表性别人数人数比重(%)男女152537.562.5合计40100.042某车间工人按日产量分组表日产量(件)工人数(人)人数比重(%)2021222324251020305040305.5611.1116.6727.7722.2216.67合计180100.00组别次数(频数)比率(频率)43某班40名学生英语测验成绩分组表成绩(分)学生数(人)比重(%)60以下60~7070~8080~9090以上27121545.0017.5030.0037.5010.00合计40100.0044(二)分布数列的编制组数即分得的组的数目,K。组限确定每组距离的数值,分下限和上限。下限毎组起点数值。上限毎组终点数值。组距即毎组的距离,i,等于上限与下限之差。组中值即各组中点的数值。开口组上、下限只有一个的组。闭口组上限和下限都齐全的组。45组中值的计算闭口组组中值=(上限+下限)/2上限-邻组组距/2(只有上限)开口组组中值=下限+邻组组距/2(只有下限)
组距=上限-下限全距=最大值-最小值46变量数列的编制例题课本64页6.某班45名学生“统计学”考试成绩从低分到高分排列~~471.将原始资料按其数值大小重新排列找出最小值最大值计算全距全距R=99-50=49482.确定变量数列的形式1.编制单项式数列还是组距数列,取决于所研究变量的类型和变量变动的幅度;2.编制等距数列还是异距数列,主要取决于现象的特点和研究目的。3.案例中的数据特点:1)波动范围大,数据多组距数列;2)变动均匀等距数列493.确定组距和组数对组距和组数,不能机械地规定先确定什么。从原则上讲,都应力求符合实际,能够反映总体分布的特点。斯透奇斯规则”(Sturges'rule):K=1+3.322lgn=1+3.322*lg45=6.49组数与组距(i)的关系是:
i=R/K=49/6.49≈7.55~~7或8两者成反比变化本例中采用组距为10,组数为5504.确定组限1.组限最好用整数表示;2.应使第一组下限不大于资料中的最小变量值,最末组上限不小于资料中的最大变量值;3.对于连续变量,应采用重叠组限,并且习惯上按照“上限不在本组内”原则处理;而离散变量变量两种方法都可以。本例中的组限分别为:60以下,60~70,70~80,80~90,90以上.51某班45名学生统计测验成绩分组表成绩(分)学生数(人)比重(%)60以下60~7070~8080~9090以上69169513.332035.562011.11合计45100.005.计算各组单位数,编制变量数列52例题50株树苗的高度的测量结果(单位:厘米)154133116128851001051461189711013111910393108100111130104135113122115103901081141278712710811210011712110513612310889941398211311010911811512653用Excel演示频数(Frequency)汇总54向上累计与向下累计(补充)向上累计:是指从变量值小的组向变量值大的组累计,又称为较小制累计;向下累计:是指从变量值大的组向变量值小的组累计,又称为较大制累计。55表某班40名学生按成绩分组表成绩(分)次数向上累计向下累计学生数(人)比率(%)学生数(人)比率(%)学生数(人)比率(%)60以下60~7070~8080~9090以上2818935204522.57.52102837405257092.51004038301231009575307.5合计40100--------56第二章统计数据的收集与整理第三节统计数据表现形式571.统计表统计表的概念广义:统计工作各阶段所用的一切表格。狭义:表现经过整理的统计数据的表格。统计数据最规范的表现形式。58(一)统计表的结构统计表从形式上看由以下四个部分构成。
总标题:即表的名称,用以概括说明统计表中的全部内容。
横行标题:说明横行各组的名称。
纵栏标题:说明纵栏内容的名称。
指标数值:即统计表中的数字资料。59我国2000年国内生产总值组别增加值(亿元)比重(%)第一产业第二产业第三产业14628449352987916.350.333.4合计89442100.0
指标数值60统计表从内容上来看,由以下两个部分构成。主词:即组的名称宾词:说明总体特征的各项指标61我国2000年国内生产总值组别增加值(亿元)比重(%)第一产业第二产业第三产业14628449352987916.350.333.4合计89442100.0
主词宾词62(二)统计表的种类统计表按分组情况不同,可分为:简单表:是统计总体未经任何分组的统计表。简单分组表:是指统计总体仅按一个标志进行分组
的统计表。复合分组表:是指统计总体按两个以上标志进行重
叠分组的统计表。表例见课本63二、统计图条形图(Barchart)
条形图常用于描述离散型数据的情况,是我们经常见到的一种图形,它是用宽度相等而高度为频数(率)来表示各类数据的大小。
绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图64
例2.3.1某高校2005年各院教师在国内核心杂志上发表论文情况,如表2.3.5所示65条形图(Barchart)
解:由表2.3.5中的数据应用Excel软件中的“插入”功能中的“图表”功能绘成的条形图如图2.3.2所示。
66直方图(Histogram)
直方图表征数据的频数分布特征,它与条形图在形式上有类似之处,都是用条形来表示数据特征,但直方图中的条形之间是没有间隔的。
直方图一般表示数值型数据,用面积表示频数的大小。等距数列一般以组距为底,频数为高;异距数列应将频数换算成统一的单位组距频数。67例2.3.2某连锁企业2010年度各分公司完成销售计划如表2.3.6所示,试绘制直方图。68直方图(Histogram)
解:应用Spss软件中的“Gragh”功能绘制的直方图,如图2.3.3所示。69异距分组绘制直方图例题:居委会想调查某小区常住人口的年龄分布情况,得到下表的数据:小区常住人口年龄分布数列年龄人数频数密度0-20150.7520-3030330-40454.540-4551计算单位组距频数,即频数密度=频数/组距黑板作图70圆形图又称饼图,是用圆形及圆内扇形的面积来表示数值大小的图形主要用于表示总体中各组成部分所占的比例,对于研究结构性问题十分有用在绘制圆形图时,总体中各部分所占的百分比用圆内的各个扇形面积表示,这些扇形的中心角度,是按各部分百分比占3600的相应比例确定的。饼分图(Piechart)
71例2.3.3某课题组为了科学评价某高校学科建设项目的绩效,对构建的学科建设绩效评估指标权重进行了问卷调查,累计发放问卷调查表243份,回收有效问卷223份,其中,教授占65%,研究员占1%,副教授占12%,副研究员占1%,讲师占20%,助教占1%,则样本职称分布如图2.4.4所示。72洛伦茨曲线是20世纪初美国经济学家、统计学家洛伦兹(M.E.Lorentz)绘制成的描述收入和财富分配性质的曲线,洛伦兹曲线如图2.3.5所示。洛伦茨曲线73洛伦茨曲线
为了更准确地反映收入分配的变化程度,20世纪初意大利经济学家基尼(Gini)根据洛伦茨曲线,提出了计算收入分配公平程度的统计指标,称为基尼系数。其公式为:
联合国有关组织规定:G小于0.2表示收入绝对平均,在0.2~0.3之间表示比较平均,在0.3~0.4之间表示相对合理,在0.4~0.5之间表示收入差距较大,大于0.6表示收入差距悬殊。基尼系数0.4为国际警戒线,超过了0.4则应采取措施缩小收入差距。
74
箱形图也称箱线图,是由一组数据的最大值、最小值、中位数和两个四分位数5个特征值绘制的一个箱子和两条线段的图形。如图2.3.6所示。
箱形图(Boxplot)75箱形图(Boxplot)不同箱形形状可反映出不同的分布特征,如图2.3.7所示。
76箱形图(Boxplot)
例2.3.42010年10月—12月某高校经济管理学科共有10篇博士学位论文需要评审,分别请该领域8位专家进行审稿,论文得分数据如表2.3.7所示。77
解:应用Spss软件中的“Gragh”功能绘制的各博士学位论文得分情况的箱形图,如图2.3.8所示。箱形图(Boxplot)图2.4.810篇博士学位论文得分的箱形图
78第二章统计数据的收集与整理第四节统计数据特征描述79综合指标的分类指标可以分为五类:第一类—总量指标第二类—相对指标第三类—平均指标第四类—变异指标第五类—形状指标反映集中趋势反映离中趋势反映数据形态80一、总量指标总量指标的含义总量指标又称统计绝对数,是反映社会经济现象发展的总规模、总水平的综合指标。总量指标是最基本的综合指标。总量指标不仅反映现象的总规模或总水平,而且也表现为总量之间的绝对差数。如:某镇上年粮食总产量为42万吨、总人口数为56000人、地区生产总值为67200万元等,这些指标都是总量指标。如:某市地区生产总值今年比上年增加3200万元,这一指标也是总量指标。81总量指标的分类(课外)1、按照反映现象总体内容的不同总体单位总量:是指总体内所有单位的总数。总体标志总量:是指总体中各单位标志值之和。例如:要对某公司的全体职工进行调查,则:该公司的职工总人数
总体单位总量工资总额
总体标志总量归纳总结:对一个特定的统计总体而言,总体单位总量只有一个,而总体标志总量可以有若干个;总体单位总量一般是离散变量,而总体标志总量可以是离散变量,也可以是连续变量。822、按照反映时间状况的不同时期指标时点指标指反映某种社会经济现象在一段时间发展变化结果的总量指标,它反映的是一段时间连续发生的变化过程。如产品产量、商品销售量、工业增加值等均属时期指标。指反映社会经济现象在某一时间点上状况的总量指标。如年末人口数、月末商品库存量、年末大牲畜存栏头数等均属时点指标。时期指标和时点指标分别具有哪些特点?83归纳总结:1、时期指标具有可加性,连续的各个时期的数量相加的结果表明现象在更长时期内的累计总量。如:产量。而时点指标相加无实际意义,如:全国人口数、出勤率。2、时期指标数值的大小与时期的长短有直接关系,对同一现象,时期越长,指标数值越大,如,一年的产品生产量肯定大于一个月的生产量。而时点指标的数值大小与时间间隔长短无直接关系,如年末人口数不一定大于年初人口数。3、时期指标数值一般是通过经常性调查取得,即进行连续不断登记、汇总而得到的。而时点指标的数值一般是通过一次性调查取得。即对某一时刻的数据进行登记、汇总而得到。时期指标和时点指标的特点84(一)社会总产品
社会总产品也称总产出。它是指一个国家或地区在一定时期(如一年)内全部生产活动的总成果,当以货币表现时,即为全部生产活动成果的价值总量。(二)增加值
增加值是企业或部门在一定时期(如一年)内从事生产经营活动所增加的价值。它是总产出减去中间投入后的余额,因此,从价值构成看,它包括全部新创造的价值和物质消耗中本期固定资产折旧。85(三)国内生产总值(GDP)指一定时期内在一个国家(或地区)境内生产的最终产品与服务的市场价值总和。是一个市场价值概念衡量的是最终产品和服务的价值是在一国(或地区)范围内生产的是在一定时间内生产的理解GDP86(1)GDP是一个市场价值概念现实经济中不同种类产品和服务的实物量不能直接加总;不经过市场交易的价值就不构成GDP的组成部分。(2)GDP衡量的是最终产品和服务的价值最终产品和服务:直接出售给最终消费者;中间产品和服务:被企业当做投入品继续生产。87(3)GDP是在一国(或地区)范围内生产的指定范围内的产品和服务的价值才能计入某国或某地区的GDP。GNP:国民生产总值,是一国(或地区)的成员在一
定时期内生产的最终产品和服务的市场价值总和。外国人中国人中国全球中国人88(4)GDP是在一定时间内积累的流量:在一定时期内发生的某种经济变量变动的数值;存量:在一定时点上存在的某种经济变量的数值。89(5)国内生产总值的计算方法生产法:增加值=总产出-中间投入国内生产总值=国民经济各部门增加值之和收入法:国民各部门增加值=劳动者报酬+固定资产折旧+生产税净额+营业盈余支出法:国内生产总值=总消费+总投资+净出口例4.1:课本第71页90二、相对指标(一)相对指标的含义相对指标也称相对数,它是用两个有联系的指标进行对比的比值来反映现象数量特征和数量关系的综合指标。相对指标的计量形式:
—无名数(系数、倍数、百分数、千分数等)
—有名数(强度、密度和普遍程度)91(二)相对指标的种类及其计算方法计划完成程度相对指标(%)结构相对指标(%)(课外)比例相对指标比较相对指标(%)强度相对指标动态相对指标相对指标的种类92
1、计划完成程度相对指标=
分子项数值减分母项数值的差额则表明执行计划的绝对效果。(1)
计划数为绝对数时
可直接用上述计算公式,如42页例题2.4.2
93例某企业某产品产量计划要求增长10%,同时该种产品单位成本计划要求下降5%,而实际产量增长了12%,实际单位成本下降了8%,则计划完成程度指标为:计算结果表明,产量计划完成程度大于100%,说明超额完成计划。而单位成本计划完成程度小于100%,说明实际成本比计划成本有所降低,也超额完成了成本降低计划。(2)计划数为相对数942、结构相对指标=
结构相对指标是在资料分组的基础上,以总体总量作为比较标准,求出各组总量占总体总量的比重,以反映总体内部组成情况的综合指标。
全国农林牧渔业总产值构成(按当年价格计算)(%)年份农业林业牧业渔业199858.03.528.69.9199957.53.628.510.4200055.73.829.710.8200155.23.630.410.8953、比例相对指标=
比例相对指标是总体中不同部分数量对比的相对指标,用以分析总体范围内各个局部、各个分组之间的比例关系和协调平衡状况。例如:我国第四次人口普查结果为:男性584,949,922人,女性548,732,579人,则男女比例=:1我国第六次人口普查结果为:1.05:1964、比较相对指标=
比较相对指标是不同空间(国家、地区、企业等)的同类现象数量对比而确定的相对指标,用以说明某一同类现象在同一时间内各单位发展的不平衡程度,以表明同类事物在不同条件下的数量对比关系。可以是两个总量指标对比,也可以是两个相对指标对比,还可以是两个平均指标对比;可以是不同国家对比,也可以是不同地区不同单位对比,还可以是与标准水平或平均水平的对比。如43页例题2.4.3975、强度相对指标=
强度相对指标是由两个性质不同而又有联系的现象的总量指标对比的比值,用来反映现象的强度、密度或普遍程度。如:人口密度、人均国民生产总值等强度相对指标可以用来反映国民经济及社会发展基本情况;强度相对指标可以用来反映经济效益情况;强度相对指标可以用来反映生产条件和公共设施的配备情况;在计算强度相对指标时,可有正指标和逆指标之分,其实质是分子、分母互换位置。正指标是指数值大小与现象的强度、密度和普遍程度成正比例,逆指标是指数值大小与现象的强度、密度和普遍程度成反比例。强度相对指标中的人均指标不是平均指标,平均指标是总体的标志总量和总体单位总量的对比。如65页题7986、动态相对指标=
动态相对数又称发展速度,表示同类事物的水平报告期与基期对比发展变化的程度。一般用百分数表示。通常将作为比较标准的时期称为基期,与基期相比较的时期称为报告期,也叫计算期。99六种相对指标的比较不同时期比较动态相对指标强度相对指标不同现象比较不同总体比较比较相对指标同一总体中部分与部分比较部分与总体比较实际与计划比较比例相对指标结构相对指标计划完成相对指标同一时期比较同类现象比较100平均指标的含义
1、概念:平均指标反映同类现象的一般水平,是总体内各单位参差不齐的标志值的代表值,也是对变量分布集中趋势的测定。可以从三方面理解:
——计算平均指标的各个单位是同质的;
——将总体各单位之间量的差异抽象化;
——用一个指标表示总体各单位一般水平三、平均指标101平均数的概念数据集中区变量x1022、平均指标的种类
数值平均数
位置平均数
算术平均数众数调和平均数中位数几何平均数
103习题:1.计算下列数据的平均数:1541331161288510010514611897
110
131
119
103
93
1082.计算右表中工人的平均日产量。日产量(件)工人数(人)202122232425102030504030合计180某车间工人按日产量分组表104设一组数据为:X1,X2,…,XN简单算数平均数计算公式为(1)简单算术平均数的计算方法(一)算术平均数105[原始数据:10 5 9 13 6 8]简单算术平均数的计算方法106设分组后的数据为:X1,X2,…,XK相应的频数为:F1,F2,…,FK加权均值的计算公式为(2)加权算术平均数的计算方法107权数(Weighted),是分布数列中的频数或频率。对求平均数具有权衡轻重的作用,是影响平均数变动的两个因素之一(另一因素是变量值)。权数例(1)(2)(3)X456合计频数频率(%)10201025.050.025.040100.0X456合计频数频率(%)20402025.050.025.080100.0X456合计频数频率(%)20101050.025.025.040100.0
平均数=5
平均数=5
平均数=4.75
频数变、频率不变频数变、频率变108
甲乙两组各有10名学生,他们的考试成绩及其分布数据如下
甲组:考试成绩(X): 020100人数分布(F):118乙组:考试成绩(X): 020100人数分布(F):811X甲0×1+20×1+100×8n10i=1Xi82(分)X乙0×8+20×1+100×1n10i=1Xi12(分)单项式分组数据的加权平均数计算109
某车间50名工人日加工零件均值计算表按零件数分组组中值(Xi)频数(Fi)XiFi105~110110~115115~120120~125125~130130~135135~140107.5112.5117.5122.5127.5132.5137.5358141064322.5562.5940.01715.01275.0795.0550.0合计—506160.0【例】根据下表中的数据,计算50名工人日加工零件数的均值组距式分组数据的加权平均数计算如46页例题2.4.7110(3)算术平均数的数学性质1)各变量值与均值的离差之和等于零2)各变量值与均值的离差平方和最小111例:市场上有三种等级的某种蔬菜,一级为1元/斤(
),二级为1.5元/斤(
),三级为2元/斤(
)。
●若每种分别买1元,平均价格为多少?
(每种的购买金额相同的情况)●若每种分别买10、20、30元,平均价格为多少?112●若每种分别买1元,平均价格为多少?
(每种的购买金额相同的情况)●若每种分别买10、20、30元,平均价格为多少?113调和平均数是各个标志值倒数的算数平均数的倒数。
集中趋势的测度值之一均值的另一种表现形式易受极端值的影响如果组距数列有开口组,则平均值的代表性差(二)调和(倒数)平均数
——是算术平均数的变形形式114115表某日三种蔬菜的批发成交数据蔬菜名称批发价格(元)
Xi成交额(元)XiFi成交量(公斤)Fi甲乙丙1.200.500.801800012500640015000250008000合计—3690048000【例】某蔬菜批发市场三种蔬菜的日成交数据如下表所示,计算三种蔬菜该日的平均批发价格116例题:某集团公司下属甲、乙、丙三个子公司计划完成程度资料及实际增加值资料如表所示,计算平均计划完成程度。计划完成程度(%)实际增加值(万元)甲乙丙11098106132127.4149.8————409.2表某集团计划完成程度资料表104.57%117(三)几何平均数当几个变量值的连乘积等于总比率或总速度时,必须用几何平均数的形式来计算平均比率和平均速度。它是几个变量值连乘积的n次方根。如47页例题2.4.9118
例:设有一组数据:110%,110%,120%,120%,
120%,125%,计算几何平均数。119[例]某工商银行某项投资年利率是按复利计算的,20年的利率分配如表所示,计算20年的平均年利率。投资年利率分组表年限年利率(%)本利率(%)xi年数(个)fi第1年51051第2年至第4年81083第5年至第15年1511511第16年至第20年181185合计——2020年的平均年利率:即20年的平均年利率为114.14%—1=14.14%120例题:某批产品的生产要经过四道工序,且要经过四次检验,第一次检验合格率为95%,第二次检验合格率为96%,第三次检验合格率为98%,第四次检验合格率为98%,求平均合格率。121例:某批产品的生产要经过四道工序,且要经过四次检验,四次检验次品率分别为5%、2%、4%、2%,求平均次品率。1)先计算合格率2)计算合格率的连乘积3)开4次方根,计算平均合格品率4)平均次品率=1-平均合格品率122◆调和平均数与算术平均数的区别凡是掌握被平均指标的分母资料时,用算术平均法。凡是掌握被平均指标的分子资料时,用调和平均法。平均指标分子:标志总量分母:总体单位总数=123价格(元)3.32.52.0合计销售量(斤)34512算术平均求某种商品三种零售价格的平均价格调和平均价格(元)3.32.52.0合计销售额(元)10101030124例:求95%、93%、90%的几何平均数◆几何平均数等于对数的算术平均125Me50%50%(四)中位数(MEDIAN)中位数的概念
把总体单位的某一数量标志的各个数值,按大小排列,处于中点位置的标志值,就是中位数。126未分组数据:组距分组数据:(1)中位数位置的确定127(2)未分组数据的中位数的计算128原始数据:
2422212620排序: 2021222426位置:123 45中位数22[例]未分组数据的中位数129原始数据:105 91268排序: 56891012位置: 123 456位
置N+126+123.5中位数8+928.5[例]未分组数据的中位数130【例】根据下表数据,计算甲城市家庭对住房满意状况评价的中位数解:中位数的位置为:
300/2=150从累计频数看,中位数的在“一般”这一组别中。因此
Me=一般表甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数非常不满意不满意一般满意非常满意2410893453024132225270300合计300—(3)分组数据的中位数1)单项式分组数据的中位数如50页例题2.4.12131A根据位置公式确定中位数所在的组B采用下列近似公式计算:
2)
组距式分组数据的中位数132表某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105~110110~115115~120120~125125~130130~135135~140358141064381630404650合计50—【例】根据右表数据,计算50名工人日加工零件数的中位数[例]分组数据的中位数如51页例题2.4.13133(五)众数(MODE)(1)众数的概念:总体中出现次数最多的标志值无众数原始数据:10591268一个众数
原始数据:65
9855多于一个众数
原始数据:252828
364242(2)众数的性质:不唯一性134众数对描述衣物尺码数据中心位置尤为有用虽然9.625是样本平均数,但是号码为10的鞋穿的人最多,10是众数。在购买决策中,应该购买更多号码为众数的鞋,平均值在这种情况下没有意义了。135表某城市居民关注广告类型的频数分布
广告类型人数(人)比例频率(%)商品广告服务广告金融广告房地产广告招生招聘广告其他广告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合计2001100【例】根据下表数据,计算众数。解:
Mo=商品广告136【例】根据下表数据,计算众数。解:
Mo=不满意表甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)百分比(%)非常不满意不满意一般满意非常满意24108934530836311510合计300100.0137MoMoMo(3)分组数据的众数138139表某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105~110110~115115~120120~125125~130130~135135~140358141064381630404650合计50—【例】计算50名工人日加工零件数的众数140(六)各种平均数的适用范围及其相互关系无论是自然现象还是社会现象,很多变量的分布都表现为接近平均数的标志值居多,远离平均数的标志值较少,也即多数标志值以平均数为中心密集地分布在它的两侧,呈现出向心力作用下的集中趋势。141几种数值平均数的比较算术平均数优点:①容易理解,便于计算;②算术平均数的性质缺点:①易受极值影响;②在偏斜分布和U形分布中,不具有代表性。调和平均数优点:①不能直接计算算术平均数情况下代替办法。
缺点:①易受极值影响;②有“0”值时不能计算几何平均数优点:受极端值的影响较算术平均数小
。缺点:①有“0”或负值时,计算出的几何平均数就会成为负数或虚数
;②仅适用于具有等比或近似等比关系的数据142位置平均数位置平均数的应用范围及代表性都较差143算术平均数、众数、中位数的关系正态分布144正偏分布(右偏分布)负偏分布(左偏分布)据经验,在分布偏斜程度不大的情况下,不论右偏或左偏,三者存在一定的比例关系,即众数与中位数的距离约为算术平均数与中位数的距离2倍,用公式表示为:,
左偏分布是尾巴在左的,受极值影响,均值会被拉到最左边,而众数和中位数位置平均数不受影响。当均值大于中位数时,为右偏分布当均值小于中位数时,为左偏分布145平均指标的计算运用原则1.必须在同质总体中计算或应用平均指标;2.用组平均数补充说明总平均数;3.用变量数列补充说明总平均水平;4.将平均指标与离散指标结合起来分析。146四、变异指标(极差、平均差、标准差、方差和离散系数)标志变异指标的含义和种类
标志变异指标的含义
标志变异指标是反映变量分布离散趋势、反映总体的差异性,即总体中各单位标志值差别大小的程度。
作用:
——是平均数代表性大小的评价尺度;
——测量经济活动的均匀性或节奏性;
——揭示总体变量分布的离中程度。147极差平均差方差和标准差变异系数(离散系数):标准差系数变异指标的种类:1481.概念:即全距R2.特点
(1)易受极端值影响
(2)未考虑数据的分布7891078910未分组数据
R
=max(xi)-min(xi)组距分组数据
R=最高组上限-最低组下限3.计算公式为(一)极差(Range)
149
所谓标准差就是总体各单位的标志值与平均数离差平方的算术平均数的平方根。
标准差的平方称为方差。(1)最常用离散程度的测度值之一(2)反映了各变量值与均值的平均差异(3)根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差(二)方差和标准差(Variance&Standarddeviation)
含义及计算方法150简单计算:加权计算:简单计算:加权计算:方差的计算公式标准差的计算公式方差和标准差
总体方差与标准差的计算151简单计算:加权计算:简单计算:加权计算:方差的计算公式标准差的计算公式方差和标准差
样本方差与标准差的计算如55页例题2.4.16152表某车间50名工人日加工零件标准差计算表按零件数分组组中值(Xi)频数(Fi)(Xi-X)2(Xi-X)2Fi105~110110~115115~120120~125125~130130~135135~140107.5112.5117.5122.5127.5132.5137.5358141064246.49114.4932.490.4918.4986.49204.49739.47572.45259.926.86184.90518.94
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2022年妇女节美容院促销活动方案
- 世界各地美食文化介绍与探索
- 健康食品市场的发展趋势分析研究报告
- 幼儿有趣体能课程设计
- 小学生美术简单课程设计
- 提升写作水平的课程设计
- 《从《红色》分析外国剧目改编中的舞台氛围营造》
- 巧匠课程设计怎么样
- 西师版六年级下册数学教学计划
- 2024-2030年中国污水处理行业发展趋势投资规划分析报告
- 李商隐诗歌《锦瑟》课件
- 世界文化遗产-乐山大佛课件
- 2022小学一年级数学活用从不同角度解决问题测试卷(一)含答案
- 博尔赫斯简介课件
- 2021年山东交投矿业有限公司招聘笔试试题及答案解析
- 施工单位资料检查内容
- 大气课设-酸洗废气净化系统
- 学校校庆等大型活动安全应急预案
- 检测公司检验检测工作控制程序
- 高血压病例优秀PPT课件
- 精密电主轴PPT课件
评论
0/150
提交评论