应用统计学(微课版-第2版)全书教案1-8章全_第1页
应用统计学(微课版-第2版)全书教案1-8章全_第2页
应用统计学(微课版-第2版)全书教案1-8章全_第3页
应用统计学(微课版-第2版)全书教案1-8章全_第4页
应用统计学(微课版-第2版)全书教案1-8章全_第5页
已阅读5页,还剩127页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《应用统计学》教案张敏主编PAGEPAGE7第1章绪论教学内容1.1统计的产生与发展1.2统计研究概述1.3统计学的基本概念1.4Excel简介教学要求1.了解统计活动的产生与发展,培养人文素养。2.了解统计学的主要学派及统计学发展的新动向,激发创新意识。3.掌握统计的含义、特点和作用,树立科学态度。4.掌握统计学的基本概念,理解经济、社会发展的相关数据。教学重点统计学的含义、特点和作用;统计学的几组基本概念教学难点统计学的几组基本概念的联系和区别教学方法课堂讲授、多媒体教学、课堂讨论、案例分析、课堂练习课时数2课时(讲授2课时)导入案例2020年国民经济和社会发展统计公报1.1统计的产生与发展1.1.1统计活动的产生与发展统计活动是随着人类社会经济的发展,治国和管理的需要而产生和发展起来的,至今已有四五千年的历史。1.1.2统计学的产生和发展从统计学发展的历史来看,产生过较大影响的主要有以下四个流派:1.政治算术学派2.国势学派3.数理统计学派4.社会统计学派1.1.3统计学发展的新动向1.统计学与各学科的结合越来越紧密2.应用统计的研究越来越受到重视3.统计学与计算机科学、信息科学的结合越来越紧密1.1.4统计学的学科体系现代统计学是一门多分支的科学。根据研究的侧重点不同将统计学科划分为理论统计学和应用统计学两个大类,统计学学科体系如图1.1所示。图1.1统计学学科体系1.2统计研究的特点、方法和作用1.2.1统计的含义所谓统计,顾名思义就是统而计之,即汇总分析。具体指根据研究目的和要求,运用科学的方法,对客观事物或人类实践活动的数据资料进行调查、整理、分析的过程。统计学则是研究如何对社会总体的数量特征和规律进行描述、推断、认识的一门学科。1.统计活动统计活动也称为统计实践、统计工作,是指根据统计目的及要求,利用科学的方法,对所研究客观事物或者活动的数据资料进行调查、整理、分析的过程。统计调查、统计整理和统计分析是基本的统计活动,所提供的统计资料包括原始统计资料、整理结果和分析结论。统计活动一般按照统计设计、统计调查、统计整理、统计分析和统计资料的开发利用这几个阶段依次进行,如图1.2所示。图1.2统计活动示意图2.统计资料统计资料是统计活动的成果或产品,既包括调查得到的原始资料,也包括整理和分析而成的系统的统计资料,通常以调查表、统计表、统计图的形式提供。3.统计学统计学是关于统计理论和方法的科学,是研究如何对社会总体的数量特征和规律进行描述、推断、认识的一门学科。统计学是统计实践活动经验的科学总结,从理论上和方法上指导统计实践活动。上述三种不同的理解是相互联系,不可分割的。一方面,统计实践活动为我们描述、推断、认识事物的统计规律提供必不可少的统计资料;另一方面,统计实践活动又需要正确的统计理论和方法作指导。统计学对于推动统计实践活动的深化和发展具有重要指导意义;与此同时,不断发展的统计学又是统计实践活动的结晶,是统计实践活动经验提炼、升华的结果。统计理论来源于统计实践活动,统计实践检验统计理论,并对统计理论的发展不断提出新的需求。统计理论源于统计实践,又高于统计实践。统计实践、统计资料和统计理论,三者相互联系,相互作用,密不可分。1.2.2统计学的研究对象及特点1.统计学的研究对象统计学的研究对象是指统计研究所要认识的客体,它决定着统计科学的研究领域以及相应的研究方法。一般来说,统计学的研究对象是客观事物的总体数量特征和数量关系,以反映其发展过程及规律性。2.统计学研究对象的特点(1)数量性(2)总体性(3)具体性1.2.3统计研究的基本方法统计学是一门方法论的科学。人们在无数统计实践经验的基础上,经过逐步概括和总结,形成了一系列专门的统计方法,构成一个统计方法体系,如图1.3所示。图1.3统计方法体系图1.2.4统计的作用与职能随着社会主义市场经济体制的逐步建立和完善,统计职能将越来越重要。统计已由单纯的统计信息搜集整理职能转变为信息、咨询、监督三大职能。统计部门已成为社会经济信息的主体部门和国民经济核算的中心,成为国家重要的咨询和监督机构。统计的作用主要体现在信息、咨询、监督三大功能上。具体表现为:①为党和政府各级领导机构决策和宏观调控提供资料;②为企业、事业单位经营管理提供依据;③为社会公众了解情况,参与社会经济活动提供资料;④为科学研究提供资料;⑤为国际交往提供资料。1.3统计学的基本概念1.3.1统计总体与总体单位统计总体简称总体,是指在某种共性的基础上由许多个别事物结合起来的整体。构成总体的个别事物叫总体单位。总体是统计研究的具体对象,是客观存在的且可以准确界定的存在。例如,在工业普查中,“工业企业”就是一个总体,它是由所有从事工业生产活动的企业所组成的,其中每一个工业企业都是一个总体单位,“从事工业生产活动”是所有工业企业都具有的共性。界定某一现象是否为统计总体可以从以下三方面来考虑。(1)同质性。(2)大量性。(3)1.3.2标志标志是说明总体单位所具有的属性或数量特征的名称。每个总体单位从不同方面考察都具有许多属性和特征。标志分为品质标志和数量标志两种。品质标志表明总体单位属性方面的特征,例如工人的性别、设备的种类、企业的经济类型等。数量标志表明总体单位数量方面的特征,例如工人的工龄、工资、企业生产设备的能力、职工人数、产品产值等。由此可见,品质标志只能用文字、语言来描述,如工人的性别是男或女;而数量标志是用数值来进行表示的,如工人的工龄是5年、10年等,其标志具体表示为年数。1.3.3统计指标与指标体系1.统计指标统计指标是反映统计总体数量特征的概念和数值。统计指标由两项基本要素构成,即指标名称和指标数值。统计指标按其所反映的数量特点不同,可以分为数量指标和质量指标。数量指标反映的是现象总规模、总水平、总工作量,其数量大小一般会随着总体范围的扩大而增加,一般用绝对数的形式表示。统计指标的特点如下。(1)数量性。(2)综合性。(3)具体性。2.指标体系单个统计指标只反映总体某一个数量特征,说明现象某一方面的情况。客观现象是错综复杂的,要反映其全貌,描述现象发展的全过程,只靠单个统计指标是不够的,因此需要建立统计指标体系。统计指标体系是一系列相互联系的统计指标所组成的有机整体,用以反映所研究现象各方面相互依存、相互制约的关系。1.3.4统计指标与标志的区别与联系1.统计指标和标志的区别首先,指标和标志的概念明显不同,标志是说明总体单位属性的,一般不具有综合的特征;指标是说明总体的综合数量特征的,具有综合的性质。其次,统计指标分为数量指标和质量指标,它们都是可以用数量来表示的;标志分为数量标志和品质标志,它们不是都可以用数量来表示,品质标志只能用文字表示。2.统计指标和标志的联系统计指标数值是由各单位的标志值汇总或计算得来的。数量标志可以综合为数量指标和质量指标,品质标志只有对它的标志表现所对应的单位加以总计才能形成统计指标。总体单位的某一标志往往是总体某一统计指标的名称。总体单位与总体之间存在着转换关系,标志与指标也可以进行转换,即在研究目的不同的情况下,当原来的总体变为总体单位时,相应的指标也就变成数量标志了;反之亦然。1.3.5统计数据1.变量与变量值在统计中,说明现象的某一数量特征的概念也被称为变量,变量的具体取值是变量值。统计数据就是统计变量的具体表现。根据变量值连续与否,变量可分为离散型变量和连续型变量。根据变量的取值确定与否,变量还可分为确定性变量和随机变量。2.数据的类型(1)类别数据和数值数据按照所采用的不同计量尺度,可以将统计数据分为类别数据和数值数据。类别数据根据取值是否有序通常分为无序类别数据和有序类别数据两种。数值数据也称为定量数据或数量数据,是按数字尺度测量的观察值,其结果表现为具体的数值。(2)观测数据和实验数据按照统计数据的收集方法,可以将其分为观测数据和实验数据。观测数据是通过调查或观测收集到的数据,这类数据是在没有对事物人为控制的条件下得到的,有关社会经济现象的统计数据几乎都是观测数据。(3)截面数据和时间序列数据按照被描述的现象与时间的关系,可以将统计数据分为截面数据和时间序列数据。。1.4Excel统计软件简介1.4.1Excel统计软件功能分析Excel是一个设计精良、功能齐全的办公软件。它除了具有常用的办公功能,如通过电子表格的形式对数字数据进行组织和计算;将数字数据转化为可视化的图表和数据库管理功能外,还是一个十分强大而且非常易用的数据统计和预测工具。Excel的统计功能分为基本描述统计和预测两个部分。描述性统计可通过Excel提供的统计函数或加载宏来完成。1.4.2Excel【数据分析】工具的安装Excel提供了多个统计计算函数,包括各种描述性统计量的计算函数、概率分布函数、估计和检验的函数等。此外,还提供了【数据分析】工具,其中包含多种基本统计方法的计算。在使用之前,需要安装【数据分析】工具。Excel2010版本的具体安装步骤如下所示。(1)在Excel工作表界面中点击【文件】【选项】。(2)在弹出的对话框中选择【加载项】,并在【加载项】下选择【分析工具库】。(3)点击【转到】,单击【确定】,即可完成安装。课程思政目标:统计学中有众多统计学者的事迹及统计故事,利用这些事件对学生进行思想政治教育,可以陶冶他们的情操,使其心灵得到净化。细细品味统计学者的励志故事及其思想,可以“品出”他们的伟大人格和高尚情操,从而培养学生追求科学真理的坚定信念,树立正确的人生观和世界观。从历史事件是非曲直的背后,引导学生如何做事、如何做人,培养他们正确的人生价值取向。统计是静止的历史,历史是流动的统计。统计虽然不能创造历史,但用数字真实记录了历史的发展。作为一项社会实践,也是一部人类生活和斗争的历史,更是社会文明积累的结果。统计学发展史中蕴含着大量做人的道理,统计学的发展和完善是众多统计学者和研究者孜孜不倦不断探索的结果,了解统计发展史,有利于培养学生对知识不断追求的毅力;知识无国界,知识的多样性,随着统计工具的完善,大量的统计问题可以直观形象地展示出来,不同工具的应用可培养学生的审美能力和审美情趣,让学生在学习的过程中感受美、体会美,进而在生活中创造美。第2章统计数据的收集与整理教学内容2.1统计调查的基本问题2.2统计调查的方式和方法2.3统计调查方案与问卷设计2.4统计数据整理2.5统计数据的显示2.6Excel在统计整理中的应用教学要求1.了解统计调查的意义、基本原则、种类;2.掌握统计调查的方式、方法;3.了解统计调查方案的内容、问卷设计的方法,培养实事求是的专业素养;4.掌握统计数据整理内容和步骤;掌握变量数列编制方法;5.掌握统计资料的显示方法,能熟练制作统计图表,强化实践能力、培养耐心细致的工作作风,树立高度的社会责任感。教学重点统计调查的方式、方法;统计数据整理的内容和步骤;变量数列的编制方法教学难点变量数列的编制方法教学方法课堂讲授、多媒体教学、课堂讨论、案例分析课时数4课时(讲授4课时)导入案例Staples连锁零售商店数据的收集与整理2.1统计调查的基本问题2.1.1统计调查的意义统计调查是统计工作的第一阶段,是整个统计工作的基础一环。只有做好统计调查,才能对统计整理和统计分析产生积极的影响。统计调查的全面性、准确性与及时性,是衡量统计调查工作质量的重要标志,是对统计调查的基本要求。2.1.2统计调查的基本原则进行统计调查时,必须遵循以下基本原则。1.实事求是,如实反映2.及时反映,及时预报3.数据与实际情况相结合2.1.3统计调查的种类根据不同的调查目的与要求以及调查对象的特点,选择合适的调查种类,这是统计调查的重要任务。统计调查可以从不同的角度进行分类。1.全面调查与非全面调查2.连续调查与非连续调查3.直接调查、凭证调查、采访调查与问卷调查2.2统计调查的方式和方法2.2.1统计调查的方式1.普查普查是为了特定目的而专门组织的一次性全面调查,用来调查属于一定时点上或一定时期内的社会现象总量。普查是一种一次性的全面调查,它涉及面广、工作量大、时间性强、耗费多、组织工作复杂,因此普查工作必须统一指挥,严密组织,妥善安排。普查有如下几个特点。(1)普查具有周期性。(2)必须规定统一的标准时点。(3)确定统一的普查期限。(4)规定普查的项目与指标。2.抽样调查抽样调查是一种非全面调查,抽样调查分为概率抽样和非概率抽样。概率抽样有以下几个特点。(1)经济性好。(2)时效性强。(3)适用面广。(4)准确性高。抽样调查主要适用于以下场合。(1)对一些不可能或没必要进行全面调查的社会现象,采用抽样调查。(2)对普查资料进行必要的修正。由于普查涉及面广,工作量大,容易产生登记误差,即出现重复登记或遗漏现象。3.重点调查重点调查是在调查对象中选择一部分重点单位进行的一种非全面调查,它是一种不连续的调查。所选择的重点单位虽然数目不多,但它们的标志总量在总体总量中却占有较大比重。和抽样调查不同的是,重点调查取得的数据只能反映总体的基本发展趋势,不能用以推断总体,因而也只是一种补充性的调查方法,目前主要是在一些企业集团的调查中运用。4.典型调查典型调查是根据调查的目的与要求,在对被调查对象进行初步分析的基础上,有意识地选择若干具有典型意义的或有代表性的单位进行的调查。典型调查可以分为两种:一是对个别典型单位进行详细的调查研究,称为解剖麻雀式典型调查;二是依据调查研究目的与任务的相关标志,把现象总体划分为不同的类型,然后从中选择出典型单位进行研究,称为划类选典式典型调查。典型调查具有以下的主要作用。(1)补充全面调查的不足。(2)在一定的条件下可以验证全面调查数据的真实性。5.统计报表制度统计报表制度是根据国家有关法规,自上而下地统一布置,按照统一规定的表格形式、统一的指标项目、统一的报送时间和报送程序,自下而上逐级汇总上报的一种调查方式。国家利用统计报表制度定期得到国民经济与社会发展情况的基本统计资料,是国家取得调查资料的主要方法之一。统计报表制度具有以下特点。(1)报表资料的来源是建立在各个基层单位的原始记录的基础上,基层单位可利用其资料对生产、经营活动进行监督管理。(2)由于统计报表是逐级上报和汇总的,各级领导部门能获得管辖范围内的报表资料,了解本地区、本部门的经济和社会发展情况。(3)由于统计报表属于连续性调查,调查项目相对稳定,有利于积累资料,并进行动态对比分析。2.2.2统计调查的方法1.初级资料收集方法(1)访问法访问法是按所拟调查事项,有计划地通过访谈询问方式向被调查者提出问题,通过他们的回答来获得有关信息资料的方法。(2)观测法观测法是指调查者通过直接观测、跟踪和记录被调查者的情况来收集资料的一种调查方法,它具有目的性、计划性和系统性。观测法可代替直接发问的方法。(3)实验法实验法是一种特殊的观察调查方法,是指在所设定的特殊实验场所、特殊状态下,对调查对象进行实验以取得所需资料的一种调查方法。2.次级资料的主要来源(1)统计年鉴(2)有关期刊(3)有关网站2.3统计调查方案与问卷设计2.3.1统计调查方案1.调查任务与目的设计调查方案的首要工作是要明确调查的任务与目的,要搜集哪些资料,要解决哪些问题,达到什么要求。2.调查对象、调查单位与报告单位(1)调查对象。调查对象是需要进行调查的某个社会经济现象的总体,是由性质相同的许多调查单位组成的。(2)调查单位。调查单位是所要调查现象总体中组成的各个个体,也就是调查对象中所要调查的具体单位。调查单位的确定,取决于调查目的与调查对象。(3)报告单位。报告单位又叫填报单位,是指按照调查方案的要求负责向上级报送调查结果的单位。3.调查项目与调查表(1)调查项目。调查项目是指作为调查内容规定下来的调查单位的特征,又称标志。(2)调查表。调查项目确定以后,必须将这些项目编制成调查表。4.调查时间与地点调查时间主要包括两个方面:一方面是指调查资料所属的时间范围(时点或时期)。在通常的情况下,调查地点与调查单位所在地是一致的,但有时也存在不一致的现象。5.调查组织实施方案调查方案中还应当对本次调查的组织实施问题作出妥善安排。这些问题包括调查的组织领导机构、宣传教育、人员培训、文件印刷、经费筹措与开支办法、调查资料的报送程序与报送方式、调查结果公布的时间等。2.3.2问卷设计1.问卷的类型、结构与设计程序(1)问卷的类型(2)问卷的基本结构调查问卷通常由前言、主体和结语三部分组成。前言部分列于问卷的前面,用来说明调查目的、内容和要求,请被调查者给予合作等。它包括标题、问候语、填写说明、问卷编号等。主体部分是问卷的核心部分,主要包括调查的主要内容以及一些答题的说明。问卷的主题部分又分为两部分:一是被调查者的背景资料,即关于个人的性别、年龄、婚姻状况、收入等问题;二是调查的基本问题。通常我们把这两部分分开。结语部分是调查的一些基本信息,如调查时间、地点、调查员姓名、被调查者的联系方式等信息的记录。(3)问卷设计的程序问卷设计的程序如图2.1所示。图2.1问卷设计的程序2.调查问题的设计(1)调查问题的种类根据调查内容不同,问题可以分为事实性问题、意见性问题和解释性问题。(2)调查问题设计的基本要求问卷问题的设计要清楚明了,通俗易懂,易于回答,同时能体现调查目的,便于答案的汇总、统计和分析。具体要求如下。=1\*GB3①所列出的问题必须符合客观实际情况=2\*GB3②一份问卷中的问题不宜太多,要有利于数据处理=3\*GB3③调查问题要考虑被调查者的回答能力,避免出现专业性很强的问题=4\*GB3④避免直接提禁忌的和敏感性的问题,如有要做技巧化处理=5\*GB3⑤问题提问要保持中立,不能带有诱导性和倾向性=6\*GB3⑥问题的内容要单一,一般只包含一个询问的内容=7\*GB3⑦问题的语言要清晰易懂,用语的定义必须清楚明确=8\*GB3⑧问题的排列要讲究逻辑性,先易后难,先事实性问题,后意见性问题和解释性问题3.调查问题答案的设计(1)调查问题答案的设计形式=1\*GB3①二元选择式=2\*GB3②多元选择式=3\*GB3③顺位式=4\*GB3④程度评价式(量表形式)★利克特量表★\o"语义差异量表"语义差异量表★\o"数值分配量表"数值分配量表=5\*GB3⑤比较式=6\*GB3⑥自由回答式(2)调查问题答案的设计原则=1\*GB3①穷尽原则。=2\*GB3②互斥原则。=3\*GB3③版面清楚。2.4统计数据的整理2.4.1统计数据整理概述1.统计数据整理的含义所谓统计数据的整理是指根据统计研究的目的和任务,将统计调查搜集的大量杂乱的原始资料进行分组和汇总,为统计分析提供系统化、条理化的综合统计资料的工作过程。2.统计数据整理的内容和步骤(1)统计审核(2)统计分组(3)统计汇总(4)编制统计表和绘制统计图(5)统计数据资料的积累、保管和公布2.4.2统计分组为了分析统计资料,必须先对统计资料进行分组。1.统计分组的原则2.统计分组的方法统计分组如何进行取决于选择的分组标志是什么、有多少以及各组的分组标志取值如何,由此产生不同的分组方法。(1)按标志的种类分组总体单位的各个标志区分为品质标志和数量标志。(2)按标志的数量分组按标志的数量分组,可分为简单分组和复合分组。表2.1简单分组与简单分组体系性别职工人数年龄职工人数职务职工人数男50040岁以下500管理人员100女40040岁以上400其他人员800合计900合计900合计900(a) (b) (c)如表2.2所示,都是复合分组,形成一个复合分组体系。表2.2复合分组与复合分组体系性别和年龄职工人数职务和性别职工人数男40岁以下300管理人员男7040岁以上200女30女40岁以下200其他人员男43040岁以上200女370合计900合计900(b)复合分组时,分组标志越多,组数就成倍增加,各组的总体单位就会减少。因此进行复合分组设计时,要选择适当数量的分组标志。(3)按变量值的表现形式分组按变量值的表现形式,可分为单项式分组和组距式分组。单项式分组一般适用于变动范围不大的离散型变量。例如大学生按照年龄进行分组,由于年龄取值为整数,且大学生的年龄相对来说比较集中,因此可以设计成单项式分组。如某地区家庭人口数统计的分组资料采用的是单项式分组,如表2.3所示。表2.3单项式分组大学生年龄(岁)人数家庭人口数家庭数1830013001970024002018003430021120041000225005500合计4500合计6500(a) (b)组距式分组适用于连续型变量或者变动范围较大的离散型变量。例如全国人口按照年龄分组时,从0岁到100多岁,取值范围大,不宜采用单项式分组,而应采用组距式分组;资产总额是连续型变量,只能采用组距式分组,如表2.4所示。表2.4组距式分组全国人口年龄(岁)人数(亿人)工业企业资产总额(万元)企业数(家)0~61.54000以下30007~153.04000~6000400016~595.06000~8000200060~993.08000~100001000100以上0.510000以上600合计13.0合计10600(b)在组距式分组中,每组包括许多变量值,每一组变量值中,其最小值为下限,最大值为上限。凡是组限不相连的,称为间断型组距式分组,如表2.4(a)所示。凡是组限相连(或称相重叠的),即以同一个数值作为相邻两组的共同界限,称为连续型组距式分组,如表2.4(b)所示。连续型变量只能采用连续型组距式分组。在连续型组距式分组中,存在以同一个数值作为相邻两组共同的界限,根据统计分组的“互斥”原则,凡是总体中某一个单位的变量值是相邻两组的界限值,这一个单位归入作为下限值的那一组内,亦称“上限不包括在内”原则。例如,表2.4(b)中,6000这个数值应该归入6000~8000组内,而不能归入4000~6000组内。(4)按组距是否相等分组组距指的是每组上限与下限之间的距离。按数量标志进行组距式分组,还可分为等距分组和不等距(或称异距)分组。3.组距式分组中相关指标的计算(1)组距的计算统计分组中,组距式分组较为复杂。按数量标志进行组距式分组时,需要科学设计组数()、组距()和组限。通常按照标志值从小到大的顺序分成第一组、第二组……最末组,组距是各组标志值的变动范围,该组标志值的最小值称为组下限,最大值称为组上限。既有上限也有下限的组称为闭口组,缺少下限或者缺少上限的组称为开口组。对于闭口组(有下限和上限),组距的计算公式为组距(i)=组上限(u)-组下限(l) (2.1)采用组距式分组时,如果变量中存在极小值或极大值时,可以设计成“××以下”或“××以上”的开口组形式。在等距数列中可假定开口组的组距与其他组相等。在异距数列中,开口组的组距可根据全数列的变动规律来确定,若数列无规律可循时,则以相邻组的组距为准。例2.1极端值,一般设计成异距分组形式,如表2.5所示。五个组分别表示不及格、及格、中等、良好和优秀。表2.5学生成绩分组表学生成绩(分)人数组距(分)60以下31060~7061070~80111080~90101090~100510合计35—第一组为开口组,组距为邻近组组距,即组距为10。因此表2.5所示的分组在统计分析时按照等距分组对待。例2.2将表2.4中全国人口按年龄分组资料转换成连续式组限,并计算各组组距,如表2.6所示。表2.6人口分组表全国人口年龄(岁)间断式组限全国人口年龄(岁)连续式组限人数(亿人)组距(岁)0~60~71.577~157~163.0916~5916~605.04460~9960~1003.040100以上100以上0.540合计合计13.0—(2)组数的计算美国学者斯特杰斯(H.A.Sturges)总结出等距分组时确定组距和组数的经验公式:全距(R)= (2.2)组数(k)=1+3.322lgN (2.3)组距(i)= (2.4)式(2.3)中,N为总体单位数。根据以上经验公式,可以求得确定组数的参考标准,见表2.7。表2.7组数的参考标准N<5050~100101~200201~250>250k3~678910~20为了计算分析的方便,组距最好是5或者10的倍数,组限的末位数最好是0或者5,并且要求第一组下限≤最小变量值,最末组上限>最大变量值,以确保每一个总体单位都能归到相应的组内。例2.3调查取得某区30家企业2020年工业增加值的计划完成程度,见表2.8,试进行组距式分组。表2.8计划完成程度原始资料(%)8183859092959799100101103105105108110112113113114115116117118118119120121125128129解:全距(R)=最大变量值-最小变量值=129%-81%=48%。组数(k)=1+3.322lgN=1+3.322lg30≈5.9,取整数6。组距(i)=全距/组数=48%/6=8%,取10%,组数调整为5。第一组下限取80%,各组设计如下。第一组,80%~90%;第二组,90%~100%;第三组,100%~110%;第四组,110%~120%;第五组,120%~130%。(3)组中值的计算组距式分组时各组的分组标志从组下限变化到组上限,组中值是指各组分组标志值的平均数,假设分组标志值的变化是均匀的,则组中值的基本计算公式是 (2.5)按照间断式组限分组时,需要转换成连续式组限后再计算组中值。闭口组时采用上式计算,开口组时需要采用以下近似算法。第一组为××以下,缺少下限,则组中值=组上限- (2.6)最末组为××以上,缺少上限,则组中值=组下限+ (2.7)(4)频数和频率在统计分组的基础上,将总体所有单位按某一标志归类排列,称为频数分布,或次数分布,也称为分布数列。频数(次)用f表示。频率反映了各组频数的大小对总体所起作用的相对强度,它是各组频数与总体单位总和之比,计算公式为频率 (2.8)频率有如下两个性质。(1)任何频率都是介于0和1之间的一个数,即0≤≤1(2.9)(2)各组频率之和等于1,即 (2.10)例2.4某企业职工按月工资分组的资料如表2.9所示,各组的频率见表中第三列。表2.9企业职工工资资料月工资(元)x职工人数(人)fi所占比重(%)700以下606700~90015015900~1200240241200~1600500501600以上505合计1000100(5)累计频数与累计频率编制向上累计频数(或频率)分布的方法是:由标志值小的组向标志值大的组依次累计,向上累计频数表明某组上限以下的各组单位数之和是多少,向上累计频率则表明某组上限以下的各组单位数之和占总体单位数的比重。例2.5根据表2.9的资料,分别进行向上累计和向下累计。具体计算结果如表2.10所示。表2.10企业职工工资累计数表月工资(元)频数频率向上累计向下累计频数频率频数频率700以下600.06600.0610001.00700~9001500.152100.219400.94900~12002400.244500.457900.791200~16005000.509500.955500.551600以上500.0510001.00500.05合计10001.00————累计频数具有两个特点:①第一组的累计频数等于第一组本身的频数;②最后一组的累计频数等于总体单位数。累计频率同样也具有两个特点:①第一组的累计频率等于第一组本身的频率;②最后一组的累计频率等于1。2.4.3变量数列的编制统计调查所收集的原始资料,是比较分散、凌乱的,无法显示现象总体的本质特征。一般来说,对所收集的资料按标志值大小进行排序,再观察各标志值分布是否均匀,决定是否采用等距分组。下面结合实例具体说明变量数列的编制过程。例2.6某班40名学生的统计学考试成绩如下,根据下面的资料,试编制一个变量数列,来反映该班学生统计学考试成绩的分布状况。89568382987568857388749475837793809581828279829234837484857665868564886558828073解:第一步,对以上的数据按大小排序,结果如下。34565864656568737374747575767779808081828282828283838384858585868888899293949598上述数据可以反映出资料的某些特征:该班统计学考试成绩分布在34~98分之间,最高分为98分,最低分为34分,全距R==98-34=64(分)。第二步,计算组数和组距。组数(k)=1+3.322lgN=1+3.322lg40≈6.32,取整数6。组距(i)=全距/组数=64/6≈10.67,取整数10。第三步,需要指出的是,根据经验,由公式(2.3)求出的组数,当数据较少时,往往过多,当数据较多时,则往往过少。所以该公式只能作为参考之用。结合以上分析,可编制如下变量数列,见表2.11。表2.11学生按成绩分组表成绩(分)学生数(人)(频数)所占比重(%)(频率)60以下37.560~70410.070~80922.580~901947.590以上512.5合计40100.02.4.4统计汇总1.统计汇总的组织形式对规模较大、级别较多的统计工作,需要选择统计汇总组织形式,统计汇总有以下三种组织形式。(1)逐级汇总(2)集中汇总(3)综合汇总2.统计汇总技术统计汇总的工作量一般很大,为了高效率、高质量、经济地完成该项工作,需要根据不同的情况选用合适的统计汇总技术。统计汇总技术一般区分为人工汇总、机械汇总和计算机汇总三种。2.5统计资料的显示2.5.1统计表1.统计表的结构从形式上看,统计表主要由总标题、横行标题、纵栏标题和指标数值四个部分组成。从内容上看,统计表包括主词和宾词两个部分。统计表结构的一般形式如表2.12所示。2.统计表的种类(1)统计表按作用不同分为调查表、整理表和分析表。调查表用于搜集原始资料,是调查单位的统计表;整理表是用于表现统计汇总或整理的表格;分析表是对统计整理的结果再进一步计算得到的最终结果。整理表和分析表往往结合在一起。(2)按照原始资料是否分组和分组的程度,统计表分为简单表、简单分组表和复合分组表三种。简单表是指主词没有经过任何分组的统计表。简单表的主词只是按总体各个单位简单排列或只按时间顺序简单排列,如表2.13所示。表2.132020年我国主要社会经济活动表指标计量单位数量国内生产总值亿元1015986财政收入亿元180270财政支出亿元247850粮食万吨66949外商直接投资亿元10000出口总额亿元179326简单分组表是指主词按一个标志分组的统计表。可以按品质标志分组,也可以按数量标志分组,如表2.12就是按照产业划分的国内生产总值表。复合分组表是指对原始资料进行了复合分组,如表2.14所示,对企业职工人数按照性别和年龄两个标志进行了复合分组,得到复合分组统计表。分组既可以在横行标题上体现,也可以在纵栏标题上体现,或者两者都有。如表2.15是表2.14资料的另一种表现形式,能更简便地表现统计结果,且便于汇总。表2.14企业职工人数统计表性别年龄人数男30岁以下50030~50岁60050岁以上300女30岁以下20030~50岁30050岁以上100合计2000表2.15企业职工人数统计表性别不同年龄人数合计(人)30岁以下30~50岁50岁以上男5006003001400女200300100600合计70090040020002.5.2统计图统计图是显示统计数据的直观、形象的方法,统计图有二维平面图、三维立体图等,具体有柱形图、折线图、饼形图、散点图等。根据所反映的统计数据的特点,选择合适的统计图。反映总体分布的统计图主要有次数和频率分布直方图、折线图、曲线图,累计次数和累计频率折线图、曲线图等。在计算机运用日益普及的今天,统计图表的制作都可以借助计算机来完成。不仅专门的统计软件,普通的办公系统Excel也具有该功能。2.6Excel在统计整理中的应用2.6.1分布数列的整理分析在Excel中有两类方法可以实现分布数列的编制:第一,使用相关的函数,如Frequency函数;第二,应用【直方图】分析工具,【直方图】分析工具还可以进行向上累计,并能直接绘出直方图。但是,【直方图】分析工具与Frequency函数在编制分布数列时,并不符合统计分组的“上限不在内”原则,在实际应用时必须进行调整。2.6.2实例应用1.实例的数据描述根据抽样调查,某月某市50户居民购买消费品支出(单位:元)资料如下:83015801050163011801170101011901080132088012101100125010301230860126010101380123014601070136087012608101350105013101100117013701270115013801130930125012701180108012001420141015101140142011601250对其按800~900、900~1000、1000~1100、1100~1200、1200~1300、1300~1400、1400~1500、1500~1600、1600以上,分为9个组来编制一个分布数列,以反映该月该市居民购买消费品支出的分布状况。2.实例的操作步骤使用Frequency函数编制,主要步骤如下。(1)新建Excel工作簿,命名为“某月某市50户居民购买消费品支出分布情况”,并将样本数据和相关文字输入到工作表中。如图2.14所示,A、B、C列为原始输入数据。样本数据排成一列,本例中为A2:A51单元格区域,图2.14中未完全显示出来。(2)选定单元格区域,本例中选定的区域为D2:D10,单击【公式】菜单,选择【插入函数】选项,弹出【插入函数】对话框。在“选择类别”中选择“统计”,在“选择函数”中选择“FREQUENCY”,如图2.15所示。图2.14数据输入图2.15【公式】下【插入函数】对话框(3)点击【确定】,打开“FREQUENCY”对话框,输入待分组数据A2:A51,与分组标志即分组上限899、999、1099、1199、1299、1399、1499、1599、1699,如图2.16所示。(4)按“Ctrl+Shift+Enter”组合键,在最初选定单元格区域内得到频数分布结果,在本例中为D2:D10,如图2.17所示。图2.16“FREQUENCY”对话框图2.17频数分布结果使用直方图分析工具编制,主要步骤如下。(1)输入数据。如图2.18所示,A、B、C列为原始输入数据。样本数据排成一列,最好对数据进行排序,本例中为A2:A51单元格区域,图2.18中未完全显示出来。列出分组上限和分组情况。(2)单击【数据】菜单,选择【数据分析】选项;打开【数据分析】对话框,从“分析工具”列表中选择“直方图”选项,如图2.19所示。图2.18原始数据输入图2.19【数据分析】对话框(3)打开“直方图”对话框,确定输入区域、接收区域和输出区域,如图2.20所示。“输入区域”输入待分析数据区域的单元格引用,若输入区域有标志项,则选中“标志”复选框;否则,系统自动生成数据标志。“接收区域”输入接收区域的单元格引用,该框可为空,则系统自动利用输入区域中的最小值和最大值建立平均分布的区间间隔的分组。本例中输入区域为$A$2:$A$51,接收区域为$B$2:$B$10。在“输出”选项中可选择输出去向,本例中选择“输出区域”为$D$1。选择“柏拉图”可以在输出表中同时按降序排列频数数据;选择“累积百分率”可在输出表中增加一列累积百分比数值,并绘制一条百分比曲线;选择“图表输出”可生成一个嵌入式直方图。图2.20“直方图”对话框(4)单击【确定】按钮,在输出区域单元格可得到频数分布,如图2.21所示。图2.21直方图分析结果(5)将条形图转换成标准直方图。在直方图上按右键,选“设置数据系列格式-系列选项”,将“间隙宽度”设置为0,如图2.22所示。图2.23为直方图分布数列编制最终结果。图2.22设置数据系列格式图2.23频数分布结果课程思政目标:数据是统计学的基本元素,也是后续统计描述和统计推断的基础,统计调查是获得数据的主要途径之一。在讲授统计调查基本方法和基本步骤时,可融入毛泽东《寻乌调查》的案例,以培养学生实事求是的科学精神。毛泽东曾说过“没有调查,就没有发言权”。毛泽东对中国革命的思考都是基于对现实的调查。1930年5月开始,在当时严酷的战争环境下,毛泽东先后在寻乌、兴国、长岗乡、才溪乡等地就中国农村和城镇的现状进行了深入调查,这些调查结果为制定农村包围城市的革命道路提供了有力的依据。还可融入1936年美国总统大选中《文学文摘》和盖洛普预测案例,让学生通过案例掌握抽样方法及缺失数据对预测结果的影响,培养学生严谨细致的做事风格。研究来不得半点含糊。如果《文学文摘》在调查时能充分考虑到样本的偏差及对预测结果的影响,如果在对调查结果进行整理时能仔细考虑缺失问卷产生的原因,并及时采取相应的补救措施,也不可能导致《文学文摘》随后销声匿迹的凄凉结果,这说明做事要严谨细致。课程思政目标:统计整理就是采用合适的统计图表把收集到的数据展示出来。在学习此模块各类图表的使用场合及制作步骤的同时,教师可不失时机,在课堂上通过关注现实问题,培养学生高度的社会责任感和使命感。统计用数字记录社会生活,数字就是一面镜子,社会生活如何,镜子就照出什么样的结果。通过对石油、电力等自然资源历年数据的整理、展示和分析,引导学生关注能源危机问题,充分理解开发利用新能源、新动力的积极意义,深刻体会生态文明的重要性;采用柱状图、雷达图和折线图对城乡经济结构进行比较分析,有助于学生理解城镇化的必要性。诸如此类现实问题均可让学生通过统计整理练习而知晓。第3章数据分布特征描述教学内容3.1总量指标3.2相对指标3.3平均指标3.4变异指标3.5Excel在描述统计中的应用教学要求1.理解总量指标的概念、作用及种类;2.掌握六种相对指标的概念和计算;3.掌握数值平均数和位置平均数的计算方法;4.了解平均差的含义,掌握标准差、方差的计算和运用;5.掌握标志变异系数的计算方法;6.能用以上指标对社会经济现象进行简单分析。教学重点总量指标的概念及种类;相对指标的概念和计算;数值平均数和位置平均数的计算方法;平均差的含义、标准差和方差的计算;标志变异系数的计算教学难点六种相对指标的区别;数值平均数和位置平均数的计算教学方法课堂讲授、课堂讨论、案例分析、课堂练习、上机操作课时数8课时(讲授6课时+课堂练习1课时+上机操作1课时)导入案例平均工资的计算3.1总量指标3.1.1总量指标的概念和作用1.概念总量指标是指反映社会经济现象在一定时间、地点、条件下发展的总规模、总水平的综合指标,又称统计绝对数指标。2.作用第一,总量指标是反映一个国家、地区或一个企业的人力、物力、财力状况和加强宏观经济管理与企业经济核算的基本指标。第二,总量指标是计算相对指标和平均指标的基础指标。3.1.2总量指标的种类1.总体总量和标志总量总量指标按其说明内容的不同,可分为总体总量和标志总量。总体总量是总体内所有单位的总数,它反映总体本身规模的大小。标志总量是总体内各单位某标志值的总和,它反映总体所研究的某一标志规模的大小。2.时期指标和时点指标时期指标和时点指标的不同点如下。(1)时期指标在数量特征上表现为可以将各时期值累计相加,反映的是在这一时间段内社会经济现象发展的规模和水平;而时点指标在数值上相加没有多大的经济意义,仅表现为在某一时刻该社会经济现象所达到的规模和水平。(2)时期指标的数值可以连续统计,如生产部门一月生产的产品为该部门每天生产产品的总和;而时点指标则采用不连续的、间断的登记方法取得,如月末的物资库存数为上月库存数经过一月该物资进出后所达到的实际数。(3)时期指标数值的大小与社会经济现象总体活动时间长短有直接关系,时间越长,其值越大;而时点指标数值的大小与社会经济现象总体活动时间长短无直接关系,如年末的库存数不一定大于月末库存数。3.实物指标、价值指标和劳动量指标总量指标按其计量单位不同,可分为实物指标、价值指标和劳动量指标。3.1.3计算和运用总量指标的原则(1)(2)计算实物总量指标时只有同类的才能相加。(3)使用统一计量单位。(4)总量指标和相对指标、平均指标要结合运用。3.2相对指标3.2.1相对指标的概念和表现形式1.相对指标的概念相对指标是指所研究的社会经济现象中用两个相互联系的总量指标进行对比来反映事物之间数量联系程度的一种统计指标。2.相对指标的表现形式相对指标的表现形式有两种:有名数和无名数。3.2.2相对指标的种类及计算方法根据所研究的指标的性质和目的不同,可以将相对指标分为结构相对数、比例相对数、比较相对数、强度相对数、计划完成相对数和动态相对数等六种。1.结构相对数其计算公式为 (3.1)通过结构相对数,既可以反映总体内部各部分所处的地位及其所起的作用,也可以进一步分析研究现象的发展变化趋势。例3.1某班共有60名学生,其中女生28名,男生32名,求女生和男生在班级人数中所占的比重。解:根据式(3.1)可得女生所占的比重男生所占的比重2.比例相对数其计算公式为 (3.2)例3.2某地区2020年工业总产值为2100.9亿元,其中轻工业产值为1208.2亿元,重工业产值为892.7亿元。求轻工业和重工业产值的比例关系。解:根据式(3.2)可得轻重工业产值的比值=比例相对数也可以反映总体内部的结构状况,总体内部结构合理,则各部分的比例关系协调,就有利于事物的发展。它同结构相对数的差异只是对比方式不同,侧重点不同而已。3.比较相对数其计算公式为 (3.3)例3.32020年江苏地区的税收收入为14064.52亿元,上海地区的税收收入为13052.72亿元,求江苏、上海两地税收收入的比较相对数。解:根据式(3.3)可得两地税收收入比较相对数=计算结果表明,江苏地区的税收收入是上海地区税收收入的1.08倍。计算比较相对数时,分子、分母指标的含义、口径、计算范围和计算单位必须一致。4.强度相对数强度相对数是两个性质不同但有一定联系的总量指标之间的对比,用来表明某一现象在另一现象中发展的强度、密度和普及程度。其计算公式为 (3.4)例3.4某城市人口700万人,有大学65所,求大学密度的正指标和逆指标。解:根据式(3.4)可得大学密度正指标(所/万人)大学密度逆指标(万人/所)正指标的数值越大,表示大学密度越大;逆指标的数值越大,表示大学密度越小。前者从正方向说明现象的密度,后者从反方向说明现象的密度。在实际工作中,一般选择其中一个指标进行计算。5.计划完成相对数其基本计算公式为 (3.5)(1)任务数以绝对数或平均数形式表现。计划指标与实际指标都用总量指标或平均指标表示,其计算公式同计划完成程度指标基本公式(3.5)。例3.5某公司某年计划产品销售额为600万元,该年实际完成650万元,求产品销售额完成相对数。解:根据式(3.5)可得销售额计划完成相对数超额的绝对值=650-600=50(万元)(2)计划完成相对数的派生公式。根据指标性质的不同,派生公式有不同的表达形式。①对于产量、产值增长百分数,计算公式可写成计划完成相对数 (3.6)②对于产品成本降低百分数,计算公式可写成计划完成相对数 (3.7)例3.6某企业计划劳动生产率2020年比2019提高8%,实际提高10%,又企业2019年某种产品单位成本为800元,2020计划规定比2019年下降8%,实际下降6%。试计算该企业2020年与2019年相比劳动生产率计划和成本计划完成情况。解:根据公式(3.6)及公式(3.7)可计算得到劳动生产率提高的计划完成相对数成本降低的计划完成相对数计算结果表明企业2020年实际劳动生产率为计划的101.85%,即超过预期目标,超过了1.85个百分点。2020年实际成本为计划的102.17%,即成本控制并没有达到预期的目标,尚欠2.17个百分点。6.动态相对数动态相对数,是指某一社会经济现象在不同时期两个数值对比的比率。它反映该现象在时间上的发展变化方向和程度,也称为发展速度和指数。其计算公式为动态相对数 (3.8)例3.7某地区2020年工业增加值为120亿元,2019年工业增加值为109亿元,求2020年该地区工业增加值的发展速度。解:根据式(3.8)可得动态相对数计算结果表明,该地区工业增加值增长较快。3.3平均指标3.3.1平均指标的概述1.平均指标的概念平均指标又称统计平均数,简称平均数,是用以反映社会经济现象总体各单位某一数量标志在一定时间、地点条件下所达到的一般水平的综合指标。2.平均指标的特点根据平均指标的概念,可以看出它具有如下三个特点。(1)同质性(2)代表性(3)抽象性3.平均指标的作用(1)可以反映总体各单位变量分布的集中趋势,用来作为评判事物的标准和依据。(2)可以用来比较同类现象在不同单位的发展水平,以说明生产水平、经济效益或工作质量的差距。(3)用来比较同一单位的同类指标在不同时期的发展状况。(4)可用来分析现象之间的依存关系。4.平均指标的种类可以从不同角度对平均数进行分类。(1)从时间上分静态平均数和动态平均数。(2)从范围上分总平均数和组平均数,在抽样统计中区分全及平均数和样本平均数。(3)从计算方法上分算术平均数、调和平均数、几何平均数、众数和中位数。3.3.2数值平均数1.算术平均数算术平均数(arithmeticmean)是将一组数据的总和除以这组数据的项数所得的结果。它是最常用的数值平均数。(1)简单算术平均数根据未分组的数据计算算术平均数时,其计算公式为 (3.9)式中,为n项数据平均数;xi为第i个单位的标志值(i=1,2,…,n);n为总体单位数;为各单位标志值的总和。例3.8某生产班组5名工人月生产零件数量分别为700、750、800、680、820件,求工人月生产零件的平均水平。解:根据式(3.9)得通过计算可知,工人平均的月产量为750件。(2)加权算术平均数计算公式为 (3.10)式中,xi为数列中第i组的标志值或各组的组中值(对组距式分组数列而言);fi为数列组第i组的频数;为各组的频率;n为分组后的组数。例3.9表3.1车间工人的日产量日产量x(件)工人数f(人)日总产量xf2210220211123126246242711297294116合计601488解:根据式(3.10)可得当收集整理的资料为组距式数列时,则用各组的组中值代表各组标志值来计算加权算术平均数。例3.10经调查某企业100名工人的月工资如表3.2所示,求其平均工资。表3.2某企业100名工人的工资情况月工资(元)人数f(人)组中值x(元)工资总额xf1000~1200101100110001200~1400251300325001400~1600351500525001600~1800201700340001800~200010190019000合计100—149000解:100名工人的月平均工资为例3.11某集团所属10家企业产值计划完成情况的组距变量数列如表3.3所示,求该集团10家企业产值计划平均完成程度。表3.3集团内10家企业产值计划完成情况计划完成程度(%)企业数计划任务数f

(万元)组中值x(%)实际完成数(万元)90~10031009595100~1105800105840110以上2100115115合计101000—1050解:该集团产值计划平均完成程度为例3.12表3.4某厂服装产量情况熟练程度人均产量x(件/人)工人数f

(人)总产量(件)非熟练工300350105000熟练工5401150621000合计—1500726000解:该服装厂的总人均产量为2.调和平均数调和平均数(harmonicmean)也称“倒数平均数”。变量的调和平均数是该变量的各个变量值的倒数()的算术平均数的倒数。在统计工作中往往将调和平均数的计算形式作为算术平均数的变形来使用。其计算公式为 (3.11)式中,式(3.11)称为加权调和平均数公式。特殊地,当mi()全部相等时,加权调和平均数简化为简单调和平均数。一定条件下,加权算术平均数和加权调和平均数存在如下关系: (3.12)例3.13表3.5由表3.4变化而来,根据表3.5求该厂上月人均服装产量。表3.5某厂服装产量情况熟练程度人均产量x(件/人)总产量m(件)工人数(人)非熟练工300105000350熟练工5406210001150合计-7260001500解:该服装厂的总人均产量为例3.14某企业生产甲、乙、丙三种产品的单位成本及总成本的资料如表3.6所示。试求该企业三种产品的平均单位成本为多少?表3.6某企业三种产品的成本分析资料产品名称单位成本x(元/千克)总成本m(元)产品产量(千克)甲10100001000乙20800004000丙25750003000合计—1650008000解:由于单位成本计算方法为单位成本所以要求该企业三种产品的平均单位成本应该采用调和平均数,即三种产品的平均单位成本为3.几何平均数几何平均数(geometricmean)是个变量值连乘积的次方根,它反映现象增长率的平均水平。几何平均数同样有简单几何平均数和加权几何平均数两种形式。几何平均数用于计算平均发展速度、平均合格率、平均本利率等相对数的平均数,这些相对数的连乘积具有实际意义,即是总发展速度、总合格率、总本利率。简单几何平均数适合于未分组数列,其计算公式为 (3.13)式中,xi表示第个单位标志值;n表示变量值项数;表示连乘符号。加权几何平均数适合于分组数列,其计算公式为 (3.14)式中,fi表示第i个单位标志值对应的权数;其他符号意义同公式(3.13)。例3.15某企业产品的加工要依次经过前后衔接的五道工序。本月该企业各加工工序的合格率分别为88%、85%、90%、92%、96%,求这五道工序的平均合格率。解:本例中,后一道工序的合格率是在前一道工序合格品的基础上计算的,因此各工序的合格率具有环比的性质,企业产品的总合格率等于各工序合格率之连乘积。所以,求五道工序的平均合格率应该采用几何平均数的计算公式,即所求的平均合格率应为4.算术平均数、调和平均数和几何平均数的关系从数量关系的角度考虑,如果用同一资料(变量各值不相等)计算以上三种平均数,其结果是算术平均数大于几何平均数,而几何平均数又大于调和平均数。当所有的变量值都相等时,这三种平均数则相等。它们的关系可用不等式表示:≤≤。3.3.3位置平均数1.众数众数(mode)是一种根据位置确定的平均数,它是指在总体单位中,标志值出现次数最多的那个数值,用符号表示。不同类型的数列,众数有不同的确定方法。(1)单项式数列众数的确定这种情况众数的确定比较简单,通过比较数列中标志值出现次数最多的值就是众数。例如,由表3.7可以看出,在某班大学生年龄中,22岁的人数最多,为24人,故22为众数。表3.7某班大学生年龄分布状况年龄(岁)人数(人)2042162224235合计39=SUM(ABOVE)(2)组距式数列众数的计算其下限公式为 (3.15)其上限公式为 (3.16)式中,L为众数所在组(即次数最多的那组)的下限;U为众数所在组(即次数最多的那组)的上限;是众数组次数与其前一组(指与众数组相邻的变量值较小的组)次数之差;是众数组次数与其后一组(指与众数组相邻的变量值较大的组)次数之差;d为众数组的组距。例3.17经调查某地区100名居民的月工资如表3.8所示,求众数。表3.8某地区100名居民的工资情况月工资(元)人数f(人)1200~1400101400~1600251600~1800351800~2000202000~220010合计100解:根据表3.8可知,众数组是“1600~1800”这一组,所以或可以发现,采用上限公式和下限公式计算得到的结果是一致的。(3)众数的特点众数具有如下特点。=1\*GB3①众数所代表的经济现象一般水平不受极端值的影响。这样当标志值存在异常情况时,众数的代表性得到增强。=2\*GB3②众数存在明显的集中趋势。因此当总体单位标志值表现出平均分布的特征时,众数就失去了意义。2.中位数中位数(median)是指将数据由小到大排列后位置居中的数值,用符号Me表示。中位数的确定仅取决于它在分布数列中的位置,因此不受极大值或极小值的影响。像众数一样,中位数也是一种位置平均数。分组数列的中位数对分组数列,中位数的确定步骤分为两步。=1\*GB3①确定中位数所在组。其方法为:首先确定变量数列中点位置;然后计算累计频数,当其值达到或超过时,该组即为中位数所在组。=2\*GB3②寻求该组组距中的某一具体值为中位数。其计算公式为 (3.17)或采用公式: (3.18)式中,为所求中位数;L为中位数组的下限(累积频数达到/2的组即为中位数所在组);U为中位数组的上限;d为中位数组组距;为中位数所在组的频数;为数列频数的总和;为向上累计至中位数所在组前一组(即变量值小于中位数组下限的各组频数的累计数)止的频数;为向下累计至中位数所在组后一组(即变量值大于中位数组上限的各组频数的累计数)止的频数。例3.19经调查某地区100名居民的月工资如表3.9所示,求中位数。表3.9某地区100名居民的工资情况月工资(元)人数f(人)向上累计频数向下累计频数1200~140010101001400~16002535901600~18003570651800~20002090302000~22001010010合计100——解: 根据表3.9中计算得到的累计频数可知,中位数所在组是“1600~1800”这一组,所以或由以上计算结果可知,两者得到的结果一致。3.4标志变异指标3.4.1标志变异指标概念和作用测定离散程度的指标称为标志变异指标。标志变异指标的作用主要体现在以下两个方面。1.可以说明平均数的代表程度平均数是数据分布中心和一般水平的代表值,其代表性强弱取决于变量的变异程度大小。数据分布越分散、离散程度越大,平均数的代表性就越小;反之,数据分布越集中,离散程度越小,平均数的代表性就越大。2.可以测定现象变动的均衡性和稳定性数据之间差异越大,说明变量的稳定性或均衡性越差;反之,数据之间的差异越小,说明变量的稳定性或均衡性越高。3.4.2标志变异指标的测定根据不同的度量方法,可以将标志变异指标分为全距、平均差、标准差及变异系数。1.全距全距(range)是指一组数据中最大值()与最小值()之差,以此来衡量数据变动的总体范围,一般用R表示全距。全距也称为极差。一般说来,全距越小,表明标志值变动越集中;全距越大,表明标志值变动越分散。全距的计算公式如下。对于未分组数列: (3.19)对于组距式数列:R=最高组的上限-最低组的下限 (3.20)例3.20解: =90-42=48(件)由全距的计算公式可以看到,全距受总体中两端极值的影响,与其他值无关,因此不能全面反映标志值的差异程度。尤其在存在极小值和极大值的情况,分析误差较大。因此在实际中全距的应用并不多。2.平均差平均差(averagedeviation)是各个数据与其均值的离差绝对值的算术平均数,反映各个数据与其均值的平均差距,通常用A.D表示。平均差也有两种形式:简单平均差和加权平均差。简单平均差适合于未分组数列,其计算公式为 (3.21)例3.21已知A、B两组学生的成绩如表3.10所示,试分别计算其平均差。表3.10学生成绩资料表A组B组|-||-|70964157817458238018679819合计20—40解:A、B两组学生的算术平均数采用简单算术平均数公式,计算可得=79分,=79分,则由以上计算可知,虽然A、B两组学生的平均成绩相同,但B组计算得到的平均差大,则表明其平均成绩的代表性要较A组差。加权平均差适合于分组数列,其计算公式为 (3.22)例3.22某车间100名工人的日产量资料如表3.11所示,试计算其平均差。表3.11工人日产量资料表日产量(件)工人数(人)f组中值x离差绝对值|-||-|f10以下8521.6172.810~20161511.6185.620~3040251.66430~4024358.4201.640以上124518.4220.8合计100——844.8解:根据资料,这100名工人日产量的算术平均数为则100名工人日产量的平均差为由以上计算可知,总的平均日产量与各组平均日产量之间的平均离差为8.448件。3.标准差标准差(standarddeviation)是指总体各单位标志值与其算术平均数离差平方的算术平均数的平方根,又称均方差。一般用符号表示,其平方称为方差(variance)。总体方差通常用表示。标准差是最重要的变异指标,在统计推断、统计预测、回归分析等许多统计分析中得到广泛应用。根据掌握的资料不同,标准差也有两种形式:简单标准差和加权标准差。简单标准差适合于未分组数列,其计算公式为 (3.23)加权标准差适合于分组数列,其计算公式为 (3.24)对于未分组数列,方差的计算公式为 (3.25)对于分组数列,方差的计算公式为 (3.26)例3.23某组四名学生成绩如表3.12所示,试计算其标准差。表3.12某组四名学生成绩资料学生编号成绩x离差离差平方170-981278-1138239486749合计——140解:根据表3.12所示的资料,应采用简单标准差公式来计算。4名学生成绩的算术平均数为(分)由式(3.23)有例3.24某工厂生产的蓄电池使用寿命如表3.13所示,试计算其标准差。表3.13蓄电池使用寿命资料使用寿命(小时)数量f(个)组中值x离差加权离差平方1000以下2900-6428243281000~120081100-44215629121200~1400161300-2429370241400~1600351500-42617401600~18002317001585741721800~200012190035815379682000以上421005581245456合计100——6743600解:蓄电池的平均使用寿命由加权算术平均数计算得到,其值为由公式(3.24)有在平均水平相等的情况下,通过计算标准差,可以用来比较两个同类社会经济现象平均数的代表性:标准差越大,表明标志变动程度越大,平均数的代表性越弱;标准差越小,表明标志变动程度越小,平均数的代表性越强。4.标志变异系数变异系数是以相对数形式表示的变异指标,一般用V表示。变异指标也称为离散系数,它是通过变异指标中的全距、平均差或标准差与平均数对比得到的。常用的是标准差系数。标准差系数的计算公式为 (3.27)例3.25甲品牌的灯泡平均寿命是1200小时,标准差为258小时;乙品牌的灯泡平均寿命是1150小时,标准差为206小时。试比较这两种品牌灯泡使用寿命的离散程度。可见,甲品牌灯泡使用寿命的标准差系数较大,说明其离散程度较大。3.5Excel在描述统计指标中的应用3.5.1描述统计分析工具数据分析工具库中含有多个分析工具,其中描述统计工具用来生成描述所给数据的标准统计量,包括平均值、标准误差、中位数、众数、标准差、方差、峰度、偏度、最小值、最大值、总和、观测数和置信度等。描述统计分析工具相对于输入公式或通过“插入函数”命令对数据进行描述统计分析,更加简单且容易操作。具体来说,只需要执行“数据分析”命令,然后在分析工具库中选择“描述统计”工具即可。3.5.2实例应用1.实例的数据描述例3.262020年我国31个地区人口数资料如表3.14所示。试用“描述统计”分析工具对其进行分析。表3.142020年全国各地区人口统计(单位:万人)地区总人口地区总人口地区总人口北京2189山东10153安徽6103天津1387河南9936福建4154河北7461湖北5775青海592山西3491湖南6644新疆2585内蒙古2405广东1260江西4519辽宁4259广西5013云南4721吉林2407海南1008西藏365黑龙江3185重庆3205陕西3953上海2487四川8367宁夏720江苏8475贵州3856甘肃2502浙江64572.实例的操作步骤(1)新建Excel工作簿,命名为“2020年全国各地区人口描述统计分析”,并将样本数据和相关文字输入到工作表中,如图3.1所示(数据未完全显示)。(2)单击【数据】选项卡中的【数据分析】按钮,随即弹出【数据分析】对话框,在【分析工具】一栏中选择【描述统计】选项,如图3.2所示,然后单击【确定】按钮。图3.1数据输入图3.2【数据分析】对话框(3)在【描述统计】对话框中,单击“输入区域”文本框后的折叠按钮,然后选中单元格区域B1:B32,因为输入区域的数据是按列排列的,所以“分组方式”选择“逐列”;因为“输入区域”包含了标志项,所以选中“标志位于第一行”复选框;单击“输出区域”单选按钮,在右侧的文本框中输入单元格C1;选中“汇总统计”、“平均数置信度”、“第K大值”、“第K小值”复选框,并在“平均数置信度”右侧输入所需要的置信度,这里设置为默认值“95%”(后面第四章抽样推断中会介绍);在“第K大值”、“第K小值”右侧输入所需要的K值,这里设置为默认值“1”,如图3.3所示。(4)单击【确定】按钮,得到描述统计计算结果,如图3.4所示。图3.3【描述统计】对话框图3.4描述统计输出结果3.实例的结果分析从图3.4的输出结果,我们很容易地看出对2020年全国各地区人口描述统计结果,包括描述人口数集中趋势的指标——平均值、众数和中位数,描述人口数离中趋势的指标——极差(可由最值求得)、方差和标准差,以及描述人口数分布形态的指标——偏度和峰度。“平均值”即均值,反映了全国各地区人口的平均水平;“标准误差”为均值的标准差;“众数”即出现次数最多的标志值,由于本例中31个标志值互不相同,所以没有众数;“标准差”为总体标准差;“方差”为总体方差;峰度的值小于零,表示人口分布更分散,分布呈扁平状态;偏度的值大于零,说明分布呈正偏斜,即大部分标志值是大于平均值的。课程思政目标:唯物辩证的科学思维;理性实证的谨慎探索;社会经济热点选题中的爱国主义情怀、社会主义制度自信第4章抽样推断教学内容4.1统计抽样的一般问题4.2抽样推断的相关基本概念4.3参数估计4.4抽样误差4.5抽样调查的组织方式及其误差的计算4.6样本数目的确定4.7Excel在参数估计中的应用教学要求1.理解不同种类抽样推断的基本原理;2.理解统计量与统计分布、重置抽样

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论