




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计学第一章总论第一节
统计与统计学第二节统计学的基本概念
学习要点及目标1.理解统计的含义,明确统计工作、统计资料和统计学三者之间的关系;2.了解统计学的产生和发展过程;3.掌握统计学的研究对象、方法、统计工作过程及统计的职能和作用;4.领会描述统计和推断统计的区别与联系;5.理解统计学中几个最基本的概念。【引导案例】
在信息高度发达的今天,每个现代人几乎每天都能从电视、网络以及报刊杂志等各种渠道接触到大量的统计数据。例如:国家统计局最新发布的《2009年国民经济和社会发展统计公报》显示:
2009年我国国内生产总值(GDP)为335353亿元,比上年增长8.7%;全年居民消费价格总体水平(CPI)比上年下降0.7%;全年实现工业增加值134625亿元,比上年增长8.3%;全年社会消费品零售总额125343亿元,比上年增长15.5%;全年货物进出口总额22072亿美元,比上年下降13.9%。
……
当你听到或阅读到这些统计数据时,你是否会思考这样一些问题:统计数据对我们的生活有用吗?这些统计数据是如何得来的?统计数据与我们将要学习的统计学之间有着怎样的关系?等等。要想准确的回答这些问题,我们就需要了解“什么是统计”以及“统计能解决哪些问题”。第一节统计与统计学
一、统计的含义“统计”一词在不同的场合具有不同的含义。统计的含义归纳起来为:统计工作、统计资料和统计学。
1.统计工作,即统计实践活动,是人们对客观事物的数据资料进行收集、整理和分析的工作活动的总称。
2.统计资料,是统计工作的成果,它的表现形式为各种统计表、统计图、统计报告、统计公报、统计年鉴等。
3.统计学,即统计理论,是指统计工作实践的理论概括和科学总结。
※统计工作、统计资料和统计科学之间有着密切的联系。统计工作是基础,统计工作与统计资料之间是过程和成果的关系、统计工作与统计学之间是实践和理论的关系。三者共同构成一个整体,就是通常所说的“统计”。什么是统计学?
统计学是一门收集、整理、显示和分析统计数据的方法论科学,其目的是探索数据的内在数量规律性,以达到对客观事物的科学认识。因此,我们也称统计学为“数据的科学”。二、统计学的产生与发展“统计”一词起源已久,其涵义在历史上屡有变化,并存在着一定的传播和演变过程。在我国古代,仅仅具有数字总计的意思,就这个涵义而言,已有四五千年的历史了。但就国际上通用的统计(Statistics)一词的语源而论,最早出自于欧洲中世纪拉丁语的status这个词根,原意是指状态或状况。由于这个词根组成意大利语stato,表示国家的概念,以及表示关于各国的国家结构和国情这方面知识的总称。统计作为一门科学有近400年的历史。
在原始社会里,人类最初的一般计数活动,蕴藏着统计萌芽。随着奴隶制国家的产生,统治阶级为了对内统治和对外战争,需要征兵征税,开始了人口、土地和财产的统计。封建社会,统计已略具规模。封建君主和精明的政治家日益意识到统计对于治国强邦的重要作用。封建社会末期,特别是进入资本主义社会以后,社会生产力迅速发展,社会分工日益深化,交通、航运、贸易日趋发达,国际市场逐步形成。统计逐步成为社会分工中的一个独立部门和专业。
统计实践经过封建社会末期的丰富和发展,客观上需要从理论上加以概括与总结,于是统计学应运而生。从17世纪下半叶开始,欧洲出现了一些统计理论著述,众多学者开始总结丰富的统计实践经验。由于这些统计学者所处的历史条件不同,研究的领域不同,形成了不同的统计学派。主要的统计学派有:1.国势学派,亦称记述学派
产生于17世纪的德国,代表人物是康令(H.Conring,1606—1681年)、阿亨瓦尔(G.achenwall,1719—1772年),代表作是《近代欧洲各国国势学概论》。他们在德国的大学开设了“国势学”的课程。国势学派把统计学理解为,国家重要事项的记述,他们搜集大量的实际资料,分门别类地记述国家组织、土地、人口、军队、居民职业、宗教、资源财产等社会经济情况,注重了事件的文字记述,缺乏数量的分析。由此对比后人所认为的统计学,国势学派所理解的统计学是不符合要求的,存在着名不符实的缺陷。然而“统计学”一词就是从“国势学”演变而来的。2.政治算术学派
产生于17世纪的英国,代表人物是威廉·配第(W.Petty,1623—1687年),代表作是《政治算术》。该书运用大量的数据资料,对英国、荷兰、法国的政治事项、社会结构、经济状况、军事力量等国情国力首次进行了解剖分析。这种运用具体的数字、重量、尺度等方法,对社会经济等现象及其相互关系作系统的数量运算与对比分析,为统计学的创立奠定了方法论基础。该学派成功地将经济理论和统计分析方法结合在一起,形成了既不同于数学又不同于政治经济学的新学科。因此,马克思称威廉·配第为“政治经济学之父”,在某种程度上说,他也是统计学的创始人。
政治算术学派的另一代表人物是约翰·格朗特(JohnGraunt,1620—1674年)。在他的论著《对死亡率公报的自然观察和政治观察》中,首次通过大量观察研究发现了一系列人口统计规律:新生儿性别比例;死亡率男性高于女性;一般疾病和事故的死亡率较稳定,而传染病的死亡率波动较大;编制了初具规模的“生命表”,对年龄死亡率与人口寿命进行了分析。尽管该学派的学者运用统计学的理论与方法,但却都没有使用“统计学”这个名称。3.数理统计学派
产生于19世纪的比利时,代表人物是阿道夫·凯特勒(A.Quetelet,1796—1874年),著有《社会物理学》、《概率论书简》等著作,他将法国古典概率理论引入到统计学中,认为无论是自然现象还是社会现象都有规律可循,一切事物都受大数定律支配。统计学是可应用于任何学科研究的方法,并开创性地应用了许多统计方法。到了19世纪60年代,凯特勒把统计学发展过程中的三个主要源泉,即国势学派、政治算术学派和古典概率学派加以结合,使之成为近代应用数理统计学。其后,由葛尔登(F.Galton,1822—1911年)、皮尔生(K.Pearson,1857—1936年)、戈塞特(W.S.Gosset,1876—1937年)和费雪尔(R.A.Fisher,1890—1962年)等统计学家,经过多方面的研究,提出并发展了相关与回归、假设检验、分布和t分布等理论,使数理统计学逐渐成为一门独立的学科。4.社会统计学派
产生于19世纪的后半叶,其先驱者是德国大学教授克尼斯(K.G.A.Knies,1821—1897年),主要代表人物为恩格尔(C.L.E.Engel,1821—1896年)和梅尔(G.V.Mayr,1841—1925年)。该学派认为,统计学的研究对象是社会现象的数量方面,描述社会现象内部的联系和相互关系以及发展规律。统计应当包括资料的搜集、整理以及对其的分析研究。社会统计学派认为,全面调查,包括人口普查和工农业调查,居于重要地位;以概率论为理论基础的抽样调查,在一定的范围内具有实际意义和作用。社会统计学派在理论上比政治算术学派更加完善,在时间上比数理统计学派更早成熟,因此在国际统计学界有较大的影响。三、统计学的特点及分科
(一)统计学的研究对象及特点
1.统计学的研究对象是指统计研究所要认识的客体,一般地说,统计学的研究对象是客观事物的总体数量特征和数量关系,以反映其发展过程及规律性。
2.统计学研究对象的特点
(1)数量性(2)总体性(3)具体性(二)统计研究的基本方法
1.大量观察法
2.统计分组法
3.统计指标法
4.模型推断法(三)统计学的分科从统计教育的角度,统计学大致有以下两种分类:
1.描述统计和推断统计(从统计方法的构成角度分)2.理论统计和应用统计(从统计方法的研究和应用角度分)1.描述统计和推断统计(1)描述统计
——是用图形、表格和概括性的数字对数据进行描述的统计方法。具体内容包括:统计数据的收集与整理、数据的显示方法、数据分布特征的描述与分析方法。(2)推断统计
——是根据样本信息对总体进行估计、假设检验、预测或其他推断的统计方法。具体内容包括:参数估计和假设检验。
※二者关系:描述统计是推断统计的前提,推断统计是描述统计的延伸和发展。2.理论统计与应用统计(1)理论统计——是利用数学原理研究统计学的一般理论和统计方法。(2)应用统计——研究统计学在各领域的具体应用。四、统计工作程序
一个完整的统计工作过程一般可分为以下四个主要阶段:
(一)统计设计——统计工作的先导是指根据统计研究对象的性质和研究目的,对统计工作的各个方面和各个环节的通盘考虑和安排。
(二)统计调查——统计工作的基础
是根据统计方案的要求,采用各种调查组织形式和调查方法,有组织、有计划地对所研究总体的各个单位进行观察、登记、准确,及时地搜集原始资料的过程。
(三)统计整理——沟通统计调查和统计分析的纽带和桥梁
是根据统计研究的目的,对调查阶段搜集的原始资料,按照一定标志进行科学的分组和汇总。
(四)统计分析——统计工作的目的和归宿
是指对统计资料,应用各种统计分析方法,从静态和动态方面进行基本的数量分析,认识和揭示所研究的现象的本质和规律性。五、统计的职能和作用
(一)统计的职能
1.信息职能——统计的基本职能
2.咨询职能——统计信息职能的延续和深化
3.监督职能——统计信息职能、咨询职能基础上的进一步拓展
(二)统计的作用1.统计是社会认识的一种有力武器2.统计是编制计划的基础、是执行计划的依据3.统计是经济管理的手段六、统计的法制化建设
统计工作要顺利进行,必须建立相应的统计管理体制,加强统计的法制化建设,科学地组织统计工作。我国《统计法》于1984年1月1日颁布施行,1987年2月国家统计局发布《中华人民共和国统计法实施细则》,1996年5月15日发布《关于修改“中华人民共和国统计法”的决定》,对我国统计法的基本内容作了具体规定。它是在发展社会主义市场经济条件下统计活动的规范和准绳。为在市场经济体制条件下统计职能的发挥提供了法律上的保证。第二节统计学的基本概念
一、统计总体与总体单位统计为正确认识客观现象,必须从总体角度进行观察,这就产生了统计总体的概念。(一)统计总体简称总体,是指根据一定的研究目的,统计所要研究的、客观存在的,并在某一共同性质基础上结合起来的许多个别事物组成的整体叫做统计总体。(二)总体单位构成统计总体的每个独立的个别事物称为总体单位,简称单位或个体。统计总体有无限总体和有限总体之分。总体单位能明确确定,总体范围能够明确划分,因而总体单位数目有限的是有限总体。例如,企业总数、职工总数、人口总数等。反之,则是无限总体。例如,在连续大量生产的某种小件产品,其产量是无限总体。二、标志与指标
(一)标志
是说明总体单位属性或特征的名称。例如,某企业全体职工作为一个总体,每一位职工就是总体单位。
标志可分为品质标志和数量标志两种。品质标志表示事物质的特征,是不能用数值表示的。例如,职工的性别、民族、工种等。数量标志是表示事物量的特征,是可以用数值表示的。如职工的“工资额”、“工龄”、“年龄”等。
(二)指标
亦称统计指标,是说明现象总体量的特征的概念及通过统计实践活动可得到指标的具体数值的总称。统计指标有两种使用方法,
一是进行统计设计或理论研究时所实用的仅有数量概念而没有具体数字的统计指标。
二是统计指标有指标名称和指标数值构成。标志和指标的区别和联系1.标志与指标的主要区别:
(1)标志是说明总体单位特征的,而指标是说明总体特征的;
(2)标志有不能用数值表示的品质标志与能用数值表示的数量标志,然而不论什么指标,则都是用数值表示。
2.标志与指标的主要联系:(1)有些统计指标的数值是从总体单位的数量标志值汇总得到的,如一个县的粮食实际入库总量是所属各乡村粮食实际入库量的汇总数,一个工业主管局的总产值是所属各企业总产值的总和等等;(2)指标和数量标志之间存在着变换关系,当研究目的改变,原来的总体如变为总体单位,则相应的统计指标就变为数量标志了,反之亦然。
三、变异、变量和变量值
要理解这些概念,必须先搞清什么是不变标志和可变标志。统计中反映总体单位特征的标志很多,如果按其具体表现是否有差异来看,可分为不变标志与可变标志。当某一标志的具体表现在各个总体单位上都相同时,则为不变标志。可变标志是指其具体表现在总体各个单位上不尽相同的那些标志。可变标志在总体各个单位具体表现上的差别就是变异。
变量,就是可变的数量标志,如工人家庭人口数、工人的工资等就是变量。变量的数值表现就是变量值。例如,工人家庭人口数具体表现为1人,2人、3人、4人等,又如,工人的月工资额,表现有6000元、7500元、7800元、8900元等,就是变量值。
统计总体的三个主要特点
1.同质性
它是指总体中的各个单位必须具有某种共同的属性或标志数值。同质性是总体的根本特征,只有个体单位是同质的,统计才能通过对个体特征的观察研究,归纳和揭示出总体的综合特征和规律性。
2.大量性它是指总体中包括的总体单位有足够的多数。总体是由许多个体在某一相同性质基础上结合起来的整体,个别或很少几个单位不能构成总体。总体的大量性,可使个别单位某些偶然因素的影响,表现在数量上的偏高、偏低的差异相互抵消,从而显示出总体的本质和规律性。
3.差异性(或称变异性)
它是指总体的各单位之间有一个或若干个可变的品质标志和数量标志,从而表现出的差异。四、统计指标体系
是指由若干个相互联系的统计指标所构成的有机整体,用以说明所研究的总体现象各方面的相互依存和相互制约的关系。社会经济统计指标体系可以分为两大类:基本统计指标体系和专题统计指标体系。基本统计指标体系是反映和研究国民经济与社会发展及其各个组成部分基本情况的指标体系,分为三个层次:最高层是反映整个国民经济与社会发展的统计指标体系,是由社会统计指标体系、经济统计指标体系、科技统计指标体系3个子系统构成。中间层则是各个地区和各个部门的统计指标体系,它是最高层统计指标体系的横向分支和纵向分支,是为了满足本地区和本部门的社会经济管理、检查、监督的需要而设置的指标体系。第三个层次是基层统计指标体系,是指各种企业和事业单位的统计指标体系。它既要满足本企业和本单位的管理和监督的需要,同时也要满足中间层和最高层建立统计指标体系的需要。
专题统计指标体系是针对社会经济的某一个专门问题而制定的统计指标体系。例如,经济效益指标体系、小康生活水平指标体系、和谐社会指标体系等。
统计指标体系按其功能不同,可分为描述统计指标体系、评价统计指标体系和预警统计指标体系。描述统计指标体系全面反映客观事物的状况、运行过程和结果。评价统计指标体系是比较、判断客观事物的运行过程和结果正常与否,它是根据不同分析评价的需要而建立的。预警统计指标体系是对客观事物的运行进行监测,并根据指标值的变化,预报即将出现的不正常状态、突发事件及某些结构性障碍等。在这三种指标体系中,描述统计指标体系是最基本的指标体系,它是建立、评价预警统计指标体系的基础。本章小结统计有三种含义:即统计工作、统计资料和统计学;统计学的研究对象是客观事物的总体数量特征和数量关系,以反映其发展过程及规律性;统计学的理论和方法是从统计实践活动中产生和发展起来的,形成了不同的统计学派:国势学派、政治算术学派、数理统计学派、社会统计学派等;统计研究的基本方法主要有:大量观察法、统计分组法、统计指标法、统计模型推断法。统计工作过程分为:统计设计、统计调查、统计整理和统计分析等阶段;统计的职能包括:信息职能、咨询职能与监督职能;统计学的基本概念有:统计总体和总体单位、标志和指标、变量和变量值、统计指标体系等。统计学
第二章
统计数据的收集第一节
统计数据的计量和类型第二节统计数据的间接来源第三节统计数据的直接来源学习要点及目标
1.了解统计数据的计量尺度和类型;2.掌握统计数据的间接来源和直接来源;3.了解统计调查的概念和分类;4.掌握统计调查的组织形式和具体调查方法;5.学会设计统计调查方案和调查问卷。第一节
统计数据的计量和类型一、统计数据的计量尺度(一)定类尺度(二)定序尺度(三)定距尺度(四)定比尺度(一)定类尺度定类尺度也称类别尺度或列名尺度,是最粗略、最低层次的计量尺度。它是按照某一品质标志将总体划分为若干部分或组,对属性相同的总体单位进行计量的方法。
(二)定序尺度定序尺度又称顺序尺度,是一种初级尺度。它是按照某一品质标志将总体划分为若干个等级有序的部门或组,对相同等级的总体单位进行计量的方法。(三)定距尺度定距尺度也称间隔尺度。它是按照某一数量标志将总体划分为若干个顺序排列的部分或组,对事物类别或次序的间距的测量,其结果表现为数值。(四)定比尺度定比尺度也称比率尺度,是统计测量中的最高层次。它是在定距尺度的基础上,先确定相应的比较基数,然后将两种相关的数加以对比而形成的相对数(或平均数),用于反映现象的结构、比重、速度、密度等数量关系的方法。
四种计量尺度属性比较表测定层次特征运算功能举例1.定类尺度分类计数产业分类2.定序尺度分类、排序计数、排序企业等级3.定距尺度分类、排序有基本测量单位计数、排序加减学生成绩差异4.定比尺度分类、排序有基本测量单位有绝对零点计数、排序加减、乘除商品销售额二、统计数据的类型(一)按不同计量尺度对事物计量的结果不同分为:
1.定类数据2.定序数据3.定距数据4.定比数据(二)按数据的表现形式,统计数据可分为定性数据定量数据(三)按收集方法不同,统计数据可分为观测数据试验数据(四)按被描述对象与时间之间关系,统计数据可分截面数据时间序列数据第二节统计数据的间接来源(一)统计年鉴1.《中国统计年鉴》2.《国际统计年鉴》3.《地方统计年鉴》4.《中国县(市)社会经济统计年鉴》5.《中国金融年鉴》6.《中国人口统计年鉴》7.《中国统计摘要》(二)有关期刊1.《中国经济数据分析》2.《经济预测分析》
……(三)有关网站1.中国统计信息网2.国研网3.中国经济信息网4.中国经济时报网
……第三节统计数据的直接来源
一、统计调查的概念统计调查是根据统计工作的任务和要求,采取科学的调查方法,有目的、有组织、有计划地向调查对象搜集资料的过程。
※统计调查必须做到准确性、及时性、系统性和完整性二、统计调查的分类(一)按被研究总体的范围不同,可分为全面调查非全面调查全面调查是对调查对象所包括的所有调查单位都进行调查。例如,要了解全国人口情况,就要对全国进行人口调查非全面调查是只对调查对象的部分调查单位进行调查。例如,抽取某手表厂的部分产品,对产品质量进行检验的抽样调查(二)按调查登记时间的连续性不同,可分为连续调查非连续调查连续调查也称经常性调查,它是随着被研究对象的发展变化,连续不断地进行登记。例如,对历年奥运会情况的调查非连续调查也称一次性调查,它是间隔一段相当长的时间所进行的登记。其获得的资料说明了现象在某一时刻或某一时间点上的数量。例如,2000年的全国人口普查(三)按组织形式的不同,可分为统计报表制度专门调查统计报表制度是国家统计部门和业务主管部门为了定期取得系统、全面的基本统计资料而采用的一种搜集资料的方式,目的在于掌握经常变动的、对国民经济有重大意义的指标的统计资料。专门调查是为了了解和研究某种情况而专门组织的统计调查,包括普查、重点调查、典型调查和抽样调查等。三、统计调查的组织方式(一)统计报表1.统计报表的涵义及其特点2.统计报表作用3.统计报表的主要种类(二)普查1.普查的涵义2.普查的特点(1)普查是一种专门调查形式(2)普查是一种全面调查形式(3)普查是一种一次性调查形式3.普查应注意的几个问题(三)抽样调查抽样调查是一种非全面调查,它是按照随机原则,从总体中抽取一定数量的单位进行调查,根据调查的结果推断总体的一种调查方法。特点:(1)按随机原则抽取样本(2)用样本指标推断全及总体指标(3)抽样误差可预先计算和控制(4)可节省大量人、财、物力和时间(四)重点调查重点调查是在调查对象中选择一部分重点单位进行的调查,是一种非全面调查。这里的“重点单位”是指拥有的标志量占调查总体标志总量的绝大比重的少数或个别单位。
特点:(1)重点单位的选择具有客观性(2)调查的目的在于了解总体的基本情况
(五)典型调查典型调查是根据调查目的和要求,在对所研究总体全面分析的基础上,有意识地从总体中选取若干个具有典型意义的或具有代表性的单位进行深入调查研究的一种调查方式。特点:(1)典型单位的选取带有人的主观意识(2)调查的目的在于深入了解总体的某一局部的情况四、统计调查的具体方法(一)直接观察法(二)报告法(三)询问调查法(四)实验法五、统计调查方案的设计——“4W1H”(一)确定调查目的(二)确定调查对象和调查单位(三)确定调查项目(四)确定调查时间和调查期限(五)制定调查工作的组织实施计划六、调查问卷的设计(一)问卷的基本结构(二)主题问句类型(三)问卷设计的基本要求
例:中华牙膏用户市场调查方案
一、调查目的:
为了了解中华牙膏市场销量情况和客户状况,特展开此次中华牙膏用户市场调查。
二、调查对象:所有牙膏用户。
三、调查单位:每一位牙膏用户。
四、报告单位:
调查员。
五、调查项目及调查问卷:见附表。
六、调查时间:2006年10月
七、调查地点:
各大商场牙膏销售柜台前。
八、调查方式:随机抽样调查。
九、调查方法:采访法。
十、调查工作的组织实施计划:此项调查由中华牙膏厂市场部组织领导和宣传,湖北师范大学学生协助调查,预算经费为30000元。结果只作为中华厂进行生产设计的参考,不公开发表。附:中华牙膏调查问卷1、你用过中华牌牙膏吗?
(二项选择)
(1)用过(2)没用过2、你认为中华牌牙膏怎么样?
(多项选择)
(1)很好(2)好(3)较好
(4)一般(5)较差(6)很差3、你所用过的牙膏有哪些?
(多项选择)
a
洁银b
两面针c黑妹d
中华
e
黑人f佳洁士
g高露洁h雕牌
4、你对我厂生产的中华牌牙膏有什么意见?
——————————。(开放式问题、自由回答)本章小结
●统计数据的计量尺度●统计数据的类型●数据的直接来源●统计调查方法●统计调查方案●调查问卷统计学第三章统计数据的整理与显示第一节统计数据的预处理第二节统计分组和次数分配第三节统计数据的显示学习要点及目标
1.了解统计整理工作的一般步骤;2.理解统计分组的概念、原则、关键以及统计分组的具体方法;3.掌握分配数列的编制方法;4.理解次数分布的概念及其类型;5.明确统计数据的两种显示方式——统计表和统计图的相关知识;6.掌握统计表和统计图的编制(绘制)方法。统计整理工作的一般步骤确定统计整理方案统计数据的预处理数据分组、汇总和计算数据的显示——统计表和统计图
第一节统计数据的预处理一、数据的审核二、数据的筛选三、数据的排序数据审核的要点(一)对于通过调查取得的原始数据,应主要审核数据的完整性和准确性。(二)对于通过其他渠道取得的二手数据,应着重审核数据的适用性和时效性。第二节统计分组和次数分配一、统计分组二、次数分布和分配数列一、统计分组(一)统计分组的概念统计分组是根据统计研究目的和客观现象的内在特点,按照选定的某个或几个标志,将被研究的总体数据分成若干部分或组的一种统计分析方法。
※统计分组是统计整理的最基本方法。(二)统计分组的原则☆在统计分组时,必须保证总体单位“在同组内的同质性”和“不同组间的差异性”☆所选标志要能够保证统计总体单位可以分别归类且无遗漏(三)统计数据分组的关键※正确选择分组标志和科学划分各组界限。1.选择分组标志应遵循的原则(1)根据统计研究的目的选择分组标志;(2)选择能够反映现象最关键、最本质的特征作为分组标志;(3)从现象所处的具体条件出发选择分组标志。2.科学划分各组界限选定分组标志后,还要在分组标志(变量)变异的范围内,科学地划定各个相邻组之间的性质界限和数值界限。(四)统计分组方法和分组体系1.统计分组方法根据分组标志的不同特征,统计总体可以按品质标志分组,也可按数量标志分组。(1)按品质标志分组(2)按数量标志分组(1)按品质标志分组表3-1
某班学生按性别分组资料按性别分组人数(人)比重%
男生女生30206040
合计50100例如:将某班学生按性别可分为男生、女生两个组,性别作为分组标志,属于列名尺度。例如:将某企业职工按文化程度分组,文化程度作为分组标志属于顺序尺度。
表3-2某企业职工按文化程度分组资料按文化程度分组人数(人)比重%
硕士以上硕士本科大专大专以下6309060114210302038
合计300100
(2)按数量标志分组a.单项式分组b.组距式分组a.单项式分组按每个具体变量值对总体进行的分组,每组只有一个变量值。
例如:某班学生按年龄分组时,采取单项式分组。
表3-3
某班学生按年龄分组资料按年龄分组人数(人)比重(%)17181920216141893122836186合计50100※单项式分组适用于变量值不多且分布比较集中的离散型变量。
b.组距式分组是按变量值的一定区间对现象总体所进行的分组。等距分组不等距分组※组距式分组适用于变量值较多、且分布比较分散的离散型变量和所有连续型变量。等距分组表3-4
某班学生按统计学考试成绩分组资料按考试成绩分组人数(人)比重%60以下60~7070~8080~9090~10031020125620402410合计50100例如:某班学生按统计学考试成绩分组时,采取等距分组。
2.统计分组体系(1)简单分组和平行分组体系例如:对某班学生分别按性别分组和按年龄分组,并平行排列就构成平行分组体系。按性别分组男生女生按年龄分组17岁18岁19岁20岁21岁(2)复合分组和复合分组体系例如:对某校学生总体可先按本(专)科分组,然后再按性别进行复合分组,就构成复合分组体系。高校学生总体本科专科男生女生男生女生二、次数分布和分配数列(一)次数分布(二)分配数列(三)次数分配的图示法(四)次数分配的类型——几种常见的次数分布曲线(一)次数分布1.含义在对总体进行分组的基础上,将总体中所有单位按组归类整理,形成总体各单位在各组间的分布,叫做次数分布或频数分布。2.次数:指分布在各组中的总体单位数,又称频数。(※各组频数之和等于总频数即总体单位数)3.频率:是各组次数与总次数的比值,又称比重。(※各组频率之和等于1或100%)(二)分配数列1.含义将以分组标志确定的组别依次排列,同时列出各组的次数或频率所形成的数列,称次数分布数列或频数分布数列,又称分配数列。2.分配数列的构成要素(1)分组标志及各组名称(或变量值);(2)各组的单位数(次数、频数)或比重(频率)。3.分配数列的种类与编制方法依分组标志不同分为:(1)品质数列
a.单项数列(2)变量数列
b.组距数列(1)品质数列的编制步骤品质数列的手工编制步骤是:①选择并列举品质标志的标志表现作为品质数列的各个组;②汇总并计算各组单位数或比重。※(2)变量数列的编制步骤①将原始资料按数值大小依次排列,计算全距(全距=最大变量值-最小变量值);②根据变量的类型确定分组方法(单项式分组或组距式分组);③确定组数:组数的确定应以能够显示数据的分布特征和规律为目的(组数一般应在5-15之间);④确定组距:组距是一个组的上限与下限之差,在等距数列中可用公式计算组距,即
组距=(最大值-最小值)÷组数⑤确定组限:第一组的下限要小于或等于最小变量值,最后一组的上限要大于最大变量值(注意:“上限不在本组内”);⑥汇总出各组的单位数,计算频率并整理成频数分布表。变量数列的编制
(例题分析)【例3.1】某百货公司连续40天的商品销售额如表3-5,试对数据进行适当的分组并编制频数分布表。表3-5某百货公司连续40天的商品销售额(单位:万元)41252947383430384340463645373736454333443528463430374426384442363737493942323635某百货公司日商品销售额的频数分布表
按日商品销售额分组(万元)频数(天)频率(%)25~30410.030~35615.035~401537.540~45922.545~50615.0合计40100组距数列的几个重要概念
1.组数:总体按标志所分成的组的数量。2.组限:表示各组界限的变量值。3.下限:一个组的最小值。4.上限:一个组的最大值。5.组距:各个组的上限与下限之差。6.组中值:下限与上限之间的中点值。累计次数和累计频率在编制变量数列时,往往不仅要列出各组的次数,还要计算出截止某一组为止的总次数,这个总次数称为累计次数(或累计频数);将各组累计次数除以总次数,即得到累计频率。向上累计:是将各组次数和频率由变量值低的组向变量值高的组累计;向下累计:是将各组次数和频率由变量值高的组向变量值低的组累计。(三)次数分配的图示法1.品质数列次数分布图——柱形图(或条形图)2.单项数列次数分布图——折线图3.组距数列次数分布图——次数分布直方图和折线图分组数据的图示
(直方图的绘制)我一眼就看出来了,销售额在35~40万元之间的天数最多!某百货公司日商品销售额分布的直方图分组数据的图示
(折线图的绘制)某百货公司日商品销售额分布的折线图(四)次数分配的类型对称分布右偏分布左偏分布正J型分布反J型分布U型分布几种常见的次数分布曲线第三节统计数据的显示一、统计表二、统计图一、统计表(一)统计表的概念把经过汇总整理得出的系统化的统计数据资料,按一定顺序填列在一定的表格内,形成的就是统计表。(二)统计表的构成表头——统计表的名称行标题——统计表的第一列(类别名称、时间等)列标题——统计表的第一行(指标名称)数字资料——指标的具体数值表外附加——资料来源、指标注释、必要的说明等(二)设计和使用统计表时的注意事项设计和使用统计表的要求是:“科学、实用、简练、美观”。应注意以下几点:1、要合理安排统计表的结构;2、表头一般应包括表号、总标题和表中数据的单位等;3、表中的上下两条横线一般用粗线,中间的其他线要用细线;统计表的左右两边不封口;列标题之间用竖线分开、而行标题之间通常不必用横线;表中数据一般右对齐;对于没有数据的表格单元一般用“—”表示,一张填好的统计表不应当出现空白单元格;4、必要时可在表的下方加上注释,特别要注意注明资料的来源。二、统计图
统计图是以点、线、面积、形状等方法描述、显示统计数据的形式,是统计数据直观的表现形式。主要有条形图、直方图、折线图、饼图、环形图、散点图等。(一)条形图和柱形图用宽度相同的条形的高度和长短来表示数据多少的图形。用来表示类别的条形柱放在纵轴上,称为条形图;放在横轴上称为柱形图。某企业职工文化程度的构成图(二)直方图用于显示连续变量的次数分布。某车间工人月工资额分布直方图(三)折线图用来揭示现象动态发展变化的规律和趋势、检查计划执行情况。我国城乡居民消费水平折线图(四)饼图用圆形及圆内扇形的角度来表示数值大小的图形,主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例。常用于结构性问题的研究。某企业职工文化程度的构成(五)环形图环形图可以同时绘制多个总体或样本数据的内部构成情况,有利于进行比较研究。
甲、乙两个班级学生期末统计学考试的成绩的比较
(六)散点图用二维坐标展示两个变量之间关系的一种图形。本章小结1.数据整理之前要对数据进行预处理,包括数据的审核、筛选和排序。2.统计分组和次数分配是统计整理的核心,整理的结果形成的分配数列。3.分配数列由两个要素构成,一是组别,二是各组次数或频率。4.常见的次数分布类型有正态分布、偏态分布、U型分布和J型分布。5.统计表和统计图是统计数据的两种重要的显示方式。统计学第四章综合指标第一节总量指标第二节相对指标第三节平均指标第四节标志变异指标第五节偏态系数和峰度系数学习要点及目标
1.掌握总量指标的含义、种类、计算方法和应用条件;2.掌握相对指标的含义、种类、计算方法和应用条件;3.掌握平均指标的含义、种类、特点、计算方法和应用场合;4.掌握标志变异指标的含义、种类、特点、计算方法和应用场合。
第一节
总量指标一、总量指标的含义和作用(一)总量指标的含义总量指标是反映某种社会经济现象在一定时间、地点和条件下达到的总规模或总水平的统计指标。总量指标通常用绝对数表示,所以也称为绝对指标或绝对数。(二)总量指标的作用1.总量指标是认识社会经济现象的起点。2.总量指标能够为制定政策、编制计划、实行社会经济管理提供依据。3.总量指标是计算相对指标和平均指标的基础。二、总量指标的基本分类(一)总量指标按其反映的内容不同,分为总体单位总量和总体标志总量
1.总体单位总量是用来表示一个总体中所包含的总体单位总数,表示总体本身的规模大小。例如,要调查了解某市工业企业的经营情况,则该市工业企业总数就是总体单位总量。
2.总体标志总量是反映统计总体中各单位某一数量标志值的总和,表示总体某一数量特征的总量指标。如上例中,该市工业企业实现的产品销售额、利税总额、职工工资总额、职工人数等就是总体标志总量。
※对于一个固定的总体,总体单位总量只有一个,而总体标志总量却有许多个。二、总量指标的基本分类(二)总量指标按其反映的时间状况不同,可分为时期指标与时点指标
1.时期指标也称流量指标,是表明社会经济现象在一段时期内发展过程的总量指标。例如:一定时期的产品产量、工资总额、商品销售额等都是时期指标。
2.时点指标也称存量指标,是表明现象在某一时点(瞬间)上所处状况的总量指标。例如:某一时间点上(如年末、季末、月末等)的人口数、设备台数、商品库存量、固定资产价值,商业银行存款余额等都是时点指标。3.时期指标与时点指标的区别(1)时期指标具有可加性,而时点指标不具有可加性;(2)时期指标和时点指标与所属时间的关系不同;(3)时期指标是通过连续登记取得,而时点指标则通过间断登记取得。二、总量指标的基本分类(三)总量指标按其计量单位不同,分为实物指标、价值指标和劳动指标
1.实物指标是反映现象的使用价值,根据事物的属性和特点,采用实物计量单位计量的总量指标。
2.价值指标是以货币为单位来计量的总量指标,反映社会经济现象的价值量,如国民生产总值、工业增加值、销售收入、产品成本等。
3.劳动指标是以劳动时间为单位计算的总量指标。如“工时”、“工日”等。实物指标的计量单位(1)自然单位(2)度量衡单位(3)标准实物单位(4)复合单位(5)双重单位三、计算和使用总量指标应注意的问题1.要明确总量指标的含义和计算范围;2.总量指标的计算必须建立在同度量的基础之上。
第二节
相对指标一、相对指标的含义和作用(一)相对指标的含义相对指标又称相对数,它是两个有联系的统计指标的比值,是说明社会经济现象之间数量对比关系的统计指标。例如:如我国2009年国民经济和社会发展统计公报称,全年国内生产总值同比增长8.7%,人口自然增长率为5.05‰,居民消费价格指数为99.3%,城镇居民人均可支配收入17175元,城镇居民家庭恩格尔系数为36.5%等,这些都是相对指标。(二)作用1.反映现象的内部结构、比例关系、普遍程度、普及程度和速度。2.使无法直接对比或直接对比没有意义的事物取得可以对比的基础。3.是进行经济管理、绩效考核和经济活动分析的重要工具。二、相对指标的表现形式(一)有名数用分子和分母的双重单位表示,主要用以表现事物的强度、密度和普遍程度。
如:人口密度用“人/平方公里”表示,城市人口拥有公共汽车用“辆/万人”表示等。(二)无名数无名数是一种抽象化的数值,常以系数、倍数、成数、百分数、千分数、翻番数、百分点等表示。关于翻番数两个相比较的数值中,如果一个数是另一个数的倍,则m是番数。如:十七大报告中提出了全面建设小康社会新的更高要求,“到2020年实现人均国内生产总值比2000年翻两番”。2000年我国人均国内生产总值为7858元,则2020年的人均国内生产总值应达到31432元()。三、相对指标的种类和计算方法相对指标的种类结构相对指标比例相对指标比较相对指标动态相对指标强度相对指标计划完成相对指标(一)结构相对指标
结构相对指标又称结构相对数,是说明总体内部各个组成部分在总体中所占比重的相对指标。其计算公式为:
例如:某班有50名学生,男生30人,女生20人,则男生比重为60%,女生比重为40%。※结构相对数是描述总体特征的重要指标,它既可以说明总体内部构成状况,还可以用来分析总体内部构成的变化,反映事物发展变化的过程及趋势。(二)比例相对指标
比例相对数反映一个统计总体内部各个组成部分之间数量对比关系的相对指标。常用系数和倍数表示。其计算公式为:例如:2005年末我国开展了全国人口1%的抽样调查工作。2005年12月31日零时,全国总人口130628万人,其中男性67309万人,女性63319万人,则男性对女性的人口性别比例=67309÷63319=106:100(以女性为100)(三)比较相对指标(横向对比)
反映同一时期的同类现象在不同地区、部门和单位之间数量对比关系的相对指标,可以说明同类现象在同一时间内各地区发展的不均衡程度。通常用百分数或系数表示。分子和分母是同类指标且可以互换位置。计算公式:例如:2004年美国人均国内生产总值37610美元,中国人均国内生产总值为1100美元,则美国人均GDP是中国的34.2倍(37610÷1100=34.2)。(四)动态相对指标
动态相对指标又称发展速度,是反映同类指标数值在不同时间对比关系的相对数。用以说明现象发展变化的方向和程度。通常用百分数表示。一般情况下,把作为比较基础的时期叫做基期,而把用来与基期对比的时期叫做报告期。计算公式:(五)强度相对指标
强度相对指标是反映两个性质不同但有联系的统计指标之间数量对比关系的相对指标。用来反映现象的强度、密度和普遍程度。计算公式:强度相对数一般采用复名数形式,由分子指标和分母指标的计量单位组成,如人均国民生产总值“元/人”,人口密度“人/平方公里”、某城市家庭汽车普及率“辆/百户”等。有的强度相对数用次数、倍数、系数、百分数或千分数表示,如资金周转次数、流通费用率、人口出生率、死亡率等。强度相对数的两种形式(1)正指标:是指标数值大小与现象的发展程度或密度成正向变化的强度相对指标。即指标数值越大,现象的发展程度或密度越高,反之则越低。(2)逆指标:是指标数值大小与现象的发展程度或密度成反向变化的强度相对指标。即指标数值越大,现象的发展程度或密度越低,反之就越高。
【例】某地区2007年总人口为1200万人,有60000个零售商业机构,则该地区零售商业网点密度指标是多少?解:零售商业网点密度指标是衡量一个国家或地区商业发展水平的统计综合指标,可以用以下两种方法计算。(1)正指标:说明:平均每万人拥有50个零售商业机构。(2)逆指标:说明:每个零售商业机构为200人服务。(六)计划完成相对指标
计划完成相对数也称计划完成百分比,是某项统计指标在某一时期内的实际完成数与计划任务数的比值。表明某一现象在一定时间计划的完成程度,用来检查、监督计划的执行情况,通常用百分数(%)表示。其计算公式为: 式中:分子和分母在指标含义、计算口径、计算方法、计量单位以及时间空间范围等方面应完全一致,且分子和分母不允许互换。1.计划数为绝对数(1)短期计划完成情况检查
a.计划完成情况检查【例】某企业2009年产品计划产量100万台,全年实际生产105万台。则
b.计划执行进度检查【例】某企业2009年计划产量100万台,至第三季度末已生产了80万台,则2.计划数为相对数
当计划任务数为相对数,而且以提高(或降低)百分数表示时,则不能以实际提高(或降低)百分数与计划提高(或降低)百分数直接对比,应在原有基数100%的基础上提高(或降低)才能对比。【例】某企业本年产量计划比上年提高10%,实际提高了15%,则:
计算结果表明,该企业本年产量超额4.55%完成计划。3.计划数为平均数
当计划任务为平均数时,计划完成程度的计算公式为:※需要说明的是,在分析计划完成情况时,要注意计划任务数的性质差异。凡是计划指标是以最低限额规定的,如产品产量、利润、销售额等指标,计划完成相对数等于或大于100%,才算完成或超额完成计划;反之,凡是计划完成相对数是以最高限额规定的,如原材料消耗、单位成本、流通费用等,其计划完成相对数等于或小于100%,才算完成或超额完成计划。
四、正确运用相对指标的原则(一)可比性原则(二)多种相对指标结合运用的原则(三)相对指标同总量指标结合运用的原则
第三节
平均指标
平均指标又叫平均数,是同质总体中各单位某一数量标志值(变量值)在具体时间、地点、条件下达到的一般水平,是反映总体某一数量标志值分布集中趋势的重要指标。测度总体分布的集中趋势也就是寻找数据一般水平的代表值或中心值。平均数按其计算方法的不同,可分为数值平均数和位置平均数。一、数值平均数(一)算术平均数算术平均数也称均值,是同一总体内总体标志总量与总体单位总量之比。算术平均数是数据集中趋势的最主要测度值,在统计学中具有重要的地位。其基本的计算公式为:1.简单算术平均数
适用于根据未分组数据计算平均指标。即已知总体各单位的标志值,可直接将各单位的标志值相加得出总体标志总量,再除以总体单位数,求出平均数,这种方法计算出来的平均数称为简单算术平均数。计算公式为:
简写成式中:为算术平均数;为总体各单位变量值;n为总体单位数;为总和符号(读为“西格玛”)。
2.加权算术平均数
适用于根据分组资料计算平均指标。如果掌握的资料是经过分组整理后的单项数列或组距数列,并且每组次数不相同时,计算平均数应采取加权算术平均数的方法。具体方法是:(1)将各组变量值分别乘以各组变量值出现的次数求得各组的标志总量,并加总得到总体标志总量;(2)将各组的次数相加得到总体单位总数;(3)最后用总体标志总量除以总体单位总数,即得到加权算术平均数。计算公式为:
简写成
式中:表示各组变量值;为各组次数(或频数),k为组数。【例】某车间100名工人日产零件数资料如表4-2所示,要求:计算该车间工人的平均日产量。表4-2按日产零件数分组的工人人数资料日产量(件)
工人数(人)
日总产量(件)6570758085102540187650175030001440595合计1007435解:该车间工人的平均日产量实际上,我们还可以将公式(4-2)变形为如下形式,即
(公式4-3)
※当我们掌握的资料不是各组变量值出现的次数,而是频率时,可以直接用公式(4-3)计算算术平均数。3.算术平均数的数学性质
性质1:各变量值与其算术平均数的离差之和等于零。简单算术平均数为:加权算术平均数为:性质2:各变量值与其算术平均数的离差平方和最小。简单算术平均数为:
加权算术平均数为:(二)调和平均数
调和平均数是总体各单位变量值倒数算术平均数的倒数,又称为倒数平均数。习惯上用H表示。
——调和平均数法适用于只有各组变量值和各组标志总量,而缺少总体单位数时计算平均指标。调和平均数的计算方法有简单调和平均数和加权调和平均数两种。1.简单调和平均数
变量值倒数简单算术平均数的倒数。简单调和平均数适用于总体中各组标志总量相等的情况。其计算公式为:
2.加权调和平均数加权调和平均数:变量值倒数加权算术平均数的倒数。其计算公式为:
※加权调和平均数实际上是加权算术平均数的一种变形。
【例】已知某公司甲种商品在三个市场上的销售价格和销售额资料如表4-5所示,试计算甲种商品在三个市场上的平均销售价格。
表4-5甲种商品平均价格计算表解:甲种商品的平均销售价格为
市场价格(元/件)销售额(元)
销售量(件)
ABC2.002.502.40600005000060000300002000025000合计三)几何平均数1.概念:几何平均数是n个变量值连乘积的n次方根。
——适用于对比率数据的平均,而且各比率的乘积等于总的比率。主要用于计算平均速度或平均比率。2.几何平均数的计算(1)简单几何平均数——适用于未分组的原始资料
(其中:∏为连乘符号)(2)加权几何平均数——适用于分组资料
二、位置平均数(一)众数
1.含义众数是一组数据中出现次数最多的变量值,用表示。
2.众数的特点(1)众数适合在数据量较多时使用;(2)众数是一个位置代表值,它不受极端值的影响;(3)一组数据可能没有众数或有多个众数(众数的不唯一性);(4)主要用于测度分类数据的集中趋势,当然也适用于顺序数据和数值型数据集中趋势的测度值。3.众数的计算方法(1)未分组数据、分类数据和顺序数据的众数——观察次数,出现次数最多的数据就是众数;(2)单项式分组数据——观察次数,出现次数最多的变量值即为众数;(3)组距式分组数据确定众数如果所掌握的资料是组距数列,则需要先通过观察次数找到出现次数最多的数据所在的组,假定变量值在众数所在组以及众数所在组前后两组呈均匀分布,然后,按照比例法计算众数的近似值。组距数列计算众数公式为:
式中:L表示众数所在组的下组限;∆1表示众数所在组与下一组次数之差;∆2表示众数组次数与上一组次数之差;i表示众数所在组的组距。(二)中位数
1.中位数的含义一组数据排序后,处于中间位置上的那个变量值,用表示。
2.中位数的特点(1)中位数是一个位置代表值,不受极端值的影响;(2)主要用于顺序数据,也可用数值型数据,但不能用于分类数据;(3)各变量值与中位数的离差绝对值之和最小,即3.中位数的计算方法(1)未分组数据计算中位数根据未分组数据计算中位数时,要先对数据进行排序,然后确定中位数的位置,最后确定中位数的具体数值。中位数位置的确定公式为:,式中:n为数据个数。
n为奇数中位数=
n为偶数(2)分组数据计算中位数①确定中位数的位置=;②计算累计次数;③根据中位数的位置,对照累计次数数列判断中位数所在组;④对于单项数列中位数所在组对应的变量值即为中位数;对于组距数列可按以下近似公式计算中位数。
式中:N/2:表示中位数所在位置;L:表示中位数所在组的下组限;Sm-1表示中位数所在组以下各组的累积次数;fm表示中位数所在组的次数;i表示中位数所在组的组距。(三)四分位数
一组数据排序后处于25%和75%位置上的值,称为四分位数,也称四分位点。四分位数是通过三个点将全部数据等分为四部分,其中每部分包含25%的数据。很显然,中间的四分位数就是中位数,因此通常所说的四分位数是指处在25%位置上的数据(下四分位数)和处在75%位置上的数值(上四分位数)。设下四分位数为,上四分位数为,对于未分组的原始数据,各四分位数的位置分别为:
如果位置是整数,那么四分位数就是该位置对应的值;当四分位数的位置不是整数时,可根据四分位数的位置,按比例分摊四分位数两侧数值的差值。三、众数、中位数和均值之间的关系
对于同一组数据计算的众数、中位数、均值三者之间具有以下关系:1.在对称的次数分配和统计分布中,众数、中位数和均值都是同一数值。即;2.在右偏分布(正偏分布)中,众数最小、中位数适中,均值最大,即<<;3.在左偏分布(负偏分布)中,众数最大,中位数适中,均值最小,即<<四、均值、中位数、众数的应用场合
1.当数据呈对称分布或接近对称分布时,三个代表值相等或接近相等,这时我们应选择均值作为集中趋势的代表值;
2.当数据分布偏斜程度较大时,由于均值易受数据极端值的影响,我们可以考虑选择众数或中位数这样的位置代表值,这时它们的代表性要比均值好。
第四节
标志变异指标
集中趋势表示的是分布的中心位置或一般水平的代表值,用平均指标来测度;而离散程度反映的则是分布离散和差异程度,用离散指标或标志变异指标来测度。
——平均指标对一组数据的代表程度取决于该组数据的离散水平。离散指标值愈大,说明总体各单位变量值分布的离散趋势越高,平均数对该组数据的代表性愈低;反之,离散指标值愈小,说明总体各单位变量值分布的离散趋势越低,平均数对该组数据的代表性愈高。
——标志变异指标(离散指标)是衡量社会经济活动的稳定性、均衡性以及风险程度的重要指标。描述数据离散程度的测度值主要有:极差、内距、平均差、方差和标准差、离散系数等。一、极差
也称全距,是一组数据最大值减去最小值之差,它是数据离散或差异程度的最简单测度值,即:
显然,数据的分散程度越大,极差就越大。极差的计算很简单,但它易受极端值的影响,因为它利用了数据两端的信息。极差的计算未考虑数据的分布情况。
二、内距
也称四分位差,是两个四分位数之差,即内距=上四分位数-下四分位数=
※内距反映了中间50%数据的离散程度,其数据越小,说明中间的数据越集中;数值越大,说明中间的数据越分散。此外,由于中位数处于数据的中间位置,因此,内距的大小在一定程度上也说明了中位数对一组数据的代表程度。内距不受极端值的影响。三、平均差
各变量值与其算术平均数离差绝对值的平均数,称为平均差,用表示。根据掌握资料的不同平均有以下两种计算方法。
1.对于未分组资料的计算公式为:
2.对于已分组资料的计算公式为:
四、方差和标准差方差:是各变量值与其均值离差平方的算术平均数。标准差:是方差的正平方根,又称均方差。特点:1.反映数据离散程度最常用的测度值;2.反映了数据的分布特征;3.反映了各变量值与均值的平均差异;4.根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差。(一)总体的方差和标准差方差的计算公式标准差的计算公式对于未分组数据:对于分组数据:(其中k为分组的组数)对于未分组数据:对于分组数据:(二)样本方差和标准差方差的计算公式标准差的计算公式对于未分组数据:对于未分组数据:对于分组数据:对于分组数据:注意:样本方差和标准差用自由度n-1去除!样本方差
自由度一组数据中可以自由取值的数据的个数。当样本数据的个数为n
时,若样本均值
x确定后,只有n-1个数据可以自由取值,其中必有一个数据则不能自由取值例如,样本有3个数值,即x1=2,x2=4,x3=9,则
x=5。当
x=5
确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自由取值,比如x1=6,x2=7,那么x3则必然取2,而不能取其他值。样本方差用自由度去除,其原因可从多方面解释,从实际应用角度看,在抽样估计中,当用样本方差去估计总体方差时,它是的无偏估计量五、离散系数(变异系数)
离散系数是一组数据的标准差与相应的均值之比,是测度数据离散程度的相对指标。用于对不同组别数据离散程度的比较。消除了数据水平高低和计量单位的影响。离散系数的计算公式为:或式中:表示总体离散系数;表示样本离散系数。※离散系数大的说明该组数据的离散程度也大,离散系数小的说明该组数据的离散程度也小。【例】某投资者想购买在上海证券交易所上市的股票A和股票B中的一种。从前几个月两种股票的收盘价格可以发现两者的标准差差别很大,=2元,=8元,两种股票收盘价格的平均数分别为=4元,=80元,问:若投资者欲选择风险小的股票投资,应该购买哪种股票?
解:该题需要计算两种股票的离散系数来测量和比较两种股票的风险。
从离散系数看,一段时期以来股票A比股票B的市场价格波动要大。因此,若投资者欲选择风险小的股票投资,应该购买股票B。六、各种测度值应用的场合
反映数据离散程度的各个测度值,适用于不同类型的数据。对于顺序数据,主要是用内距来测度其离散程度;对于数值型数据,主要用方差或标准差来测度其离散程度;当需要对不同总体或样本数据的离散程度进行比较时,则使用离散系数。
第五节
偏态系数和峰度系数
集中趋势和离散程度是数据分布的两个重要特征,但要全面了解数据分布的特点,我们还需要知道数据分布的形状是否对称、偏斜的程度以及分布的扁平程度等。偏态和峰度就是对分布形状的测度。一、偏态及偏态系数
偏态是对数据分布偏斜方向及程度的测度。其测度值称为偏态系数,用SK来表示。对于分组数据计算偏态系数,可采用下面的公式:(SK是离差三次方的平均数再除以标准差的三次方)
1.当分布对称时,离差三次方后正负离差可以相互抵消,因此SK的分子等于0,即SK=0;
2.当分布不对称时,,就形成了正或负的偏态系数SK
(1)当SK>0时,表示正偏离差值较大,判断为正偏或右偏。(2)当SK<0时,表示负偏离差值较大,判断为负偏或左偏。
SK的数值越大,表示偏斜的程度越大。
二、峰度及峰度系数
峰度是对数据分布平峰或尖峰程度的测度。其测度值为峰度系数,记为K。(K是用离差四次方的平均数再除以标准差的四次方减去3)峰度通常是与标准正态分布相比较而言的。1.如果一组数据服从
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 7.1回望成长课件- -2024-2025学年统编版道德与法治九年级下册
- 瑜伽面料采购合同范本
- 金秀瑶族自治县2025届四年级数学第二学期期末学业水平测试试题含解析
- 贵州省贵阳市2024-2025学年小升初常考易错数学检测卷含解析
- 跨部门协作推动质量持续改进的关键
- 学生暑假工合同范本
- 枣庄科技职业学院《国际贸易实务英语》2023-2024学年第二学期期末试卷
- 武汉工程科技学院《景观生态学实验》2023-2024学年第二学期期末试卷
- 青岛滨海学院《无机化学与放射性化学》2023-2024学年第二学期期末试卷
- 2025届苏州市沧浪区四下数学期末学业水平测试试题含解析
- 2025年江苏扬州市仪征市众鑫建设开发有限公司招聘笔试参考题库附带答案详解
- 大象版四年级下册《科学》全套教学课件
- 部编高教版2023·职业模块 中职语文 2.《宁夏闽宁镇:昔日干沙滩今日金沙滩》 课件
- 安全环保职业健康法律法规清单2024年
- 2023年高考语文全国乙卷《长出一地的好荞麦》解析
- 金蝶K3 Cloud 产品安装指南
- 五防、后台调试报告
- VISIO图标大全(完整版)
- 医疗、预防、保健机构医师聘用证明表(共1页)
- 清铃揿针介绍
- 东方要略(1-完整版)
评论
0/150
提交评论