




已阅读5页,还剩39页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第21章 统计与统计数据第四部分统计 -共6章 第二十一章 统计与统计数据 第二十二章 统计调查 第二十三章 统计数据的整理与显示 第二十四章 数据特征的测度 第二十五章 时间序列 第二十六章 统计指数考试目的:测查应试人员是否掌握统计中的一些基本概念,包括统计、统计工作、统计数据、。统计学、统计指标的含义等,统计数据及其计量尺度:统计数据的分类。本章教材结构:第一节 统计的含义第二节 统计数据的计量尺度第三节 统计数据的类型第四节 统计指标及其类型第一节 统计的含义考试内容:统计的含义,统计工作、统计数据。统计学的含义。统计一般有三种不同的含义: 1.统计工作,即统计实践活动,是指利用科学的方法,收集、整理、分析和提供有关社会现象的数字资料工作的总称。2.统计数据,是统计工作活动过程中所取得的反映国民经济和社会现象的数字资料以及与之相关的其他资料总称。是统计工作的成果或“产品”。 3.统计学,是关于收集、整理、分析和解释统计数据的科学,是一门认识方法论性质的科学。【例题1:课后题第7题】统计一词的含义是( )A统计工作 B 统计数据 C统计调查 D 统计学 E 统计监督答案:ABD第二节 统计数据的计量尺度考试内容:定类尺度,定序尺度,定距尺度,定比尺度。统计尺度按照由低级到高级、由粗略到精确的标准分为:定类尺度、定序尺度、定距尺度和定比尺度。统计尺度含义特点定类尺度按照客观现象的某种属性对其进行分类或分组,各类各组之间的关系是并列、平等而且互相排斥的。(1)定类尺度是最粗略、计量层次最低的计量尺度。(2)定类尺度作为代码的数值不反映各类的优劣、量的大小或顺序,不可以区分大小或进行任何数学运算。(3)对定类尺度的计量结果,可以计算每一类或组中各元素或个体出现的频数。定序尺度定序尺度是对客观现象各类之间的等级差或顺序差的一种测度。(1)定序尺度可以将研究对象分为不同的类别,而且可以反映各类的优劣、量的大小或顺序。注意教材举的例子。(2)定序尺度比定类尺度精确一些,但只是测度了类别之间的顺序,而未测量出类别之间的精确差值。(3)计量结果只能比较大小,不能进行加、减、乘、除。定距尺度对现象类别或次序之间间距的测度(1)定距尺度不但可以用数字表示现象各类别的不同和顺序大小的差异,还可以用确切的数值反映现象之间在量方面的差异。(2)反映现象规模水平的数据必须以定距尺度计量,例如产品产量、人口数、国内生产总值等(3)结果可以进行加减。定比尺度在定距尺度的基础上,确定相应的比较基数,然后将两种相关的数加以对比而形成的相对数。(1)反映现象的结构、比重、速度、密度等数量关系(2)定比尺度的计量结果可以进行加、减、乘、除等数学运算【例题2:课后题第8题】统计数据的计量尺度包括()。A.科学尺度 B.定类尺度 C.定序尺度 D.定距尺度 E.定比尺度答案:BCDE【例题3】按低级到高级、粗略到精确顺序排列的数据计量尺度是()。 A定比尺度、定距尺度、定类尺度、定序尺度 B定序尺度、定比尺度、定类尺度、定距尺度 C定类尺度、定序尺度、定距尺度、定比尺度 D定类尺度、定距尺度、定序尺度、定比尺度 答案:C 【例题4:2004年多选题】以定距尺度计量的统计数据可以进行()运算。A.加B.减C.乘D.除E.比较大小答案:ABE【例题5:2007年单选题】将学生成绩分为优、良、中、及格和不及格五类,所采用的计量尺度是()。A定比尺度 B定类尺度 C定序尺度 D定距尺度答案:C第三节 统计数据的类型考试内容:统计数据的不同类型。一、分类数据、顺序数据和数值型数据按照所采用的计量尺度,可以讲统计数据分为分类数据、顺序数据和数值型数据。1.分类数据分类数据,是由定类尺度计量形成的,表现为类别,通常用文字表述,但不区分顺序。2.顺序数据顺序数据,是由定序尺度计量形成的,表现为类别,通常用文字表述,但有顺序。3.数字型数据数值型数据,是由定距尺度和定比尺度计量形成的,说明的是现象的数量特征,通常用数值来表现。二、定型数据和定量数据1.定型数据(品质数据)分类数据和顺序数据都说明的是事物的品质特征,是不能用数值表示的,通常用文字表述,其结果变现为类别,也可统称为定型数据。2.定量数据(数量数据)数值型数据说明的是现象的数量特征,通常用数值来表现,也可称为定量数据。【例题8:课后题第9题】按照所采用的计量尺度,统计数据可以分为( )A分类数据 B 实验数据 C顺序数据 D第二手数据 E 数值型数据答案:ACE【例题9:课后题第10题】分类数据和顺序数据统称为( )A定性数据 B 品质数据 C 定量数据 D第二手数据 E数值型数据答案:AB【例题10:09年多选题】下列变量中,通常属于数值型变量的有( )。 A.商品销售额 B.上班出行方式 C.家庭收入 D.居住地区 E.年龄 答案:ACE 解析:如果一个变量由数值型数据来记录就称为数值型变量。例如产品产量、商品销售额、零件尺寸、年龄、时间等。第四节 统计指标及其类型考试内容:统计指标的含义,统计指标的分类。一、统计指标的含义对统计指标通常有两种理解和使用方法:一是统计指标是用来反映现象总体数量状况的基本概念。二是统计指标是反映现象总体数量状况的概念和数值。二、统计指标的分类:统计指标按照其所反映的内容或其数值表现形式,可以分为:总量指标;相对指标和平均指标。类型内容教材例子总量指标(反映现象总规模,通常以绝对数表现)时期指标反映现象在一段时期内的总量,时期指标可以累积,从而可以得到长时间内的总量。产品产量;能源生产总量;财政收入;商品零售额时点指标反映现象在某一时刻上的总量,不能累积,各时点数累积之后没有实际意义。年末人口数、科技机构数、股票价格相对指标(两个绝对数之比)相对数表现形式:比例和比率经济增长率;物价指数;全社会固定资产投资增长率平均指标(平均数或均值)反映的是现象在某一空间或时间上的平均数量状况人均国内生产总值;人均利润;【例题11:2007年、2008年单选题】统计指标按其所反映的内容或其数值表现形式,可以分为总量指标、相对指标和()。A.比例指标 B.比率指标 C.平均指标 D.变异指标答案:C【例题12:2005年、2003年单选题】经济增长率指标属于()A.总量指标B.相对指标 C.平均指标 D.时点指标答案:B【例题13:2005年多选题】下列统计中,属于相对指标的有()A.城镇登记失业率 B.人均居民个人卫生支出 C.居民消费价格指数D.第三产业贡献率 E.人口自然增长率答案:ACDE【例题14:2007年多选题】下列指标中,属于相对指标的有()。A经济增长率 B物价指数 C股票价格 D土地面积 E商品零售额答案:AB【例题15:2008年单选题】财政收入这一统计指标属于( )A相对指标 B 时期指标 C 时点指标 D平均指标答案:B【例题16:2008年多选题】下列总量指标中,累积后没有实际意义的有()A、股票价格指数 B、煤炭生产总量 C、财政收入 D、商品零售额 E、年末人口数答案:AE第22章 统计调查考试目的:测查应试人员是否掌握统计调查的概念和作用、种类,各种统计调查方式的特点和应用场合,抽样的一些基本概念和各种抽样方法,搜集第二手数据的方法,统计数据的误差来源、对统计数据的质量要求等。本章教材结构:第一节 统计调查的概念第二节 统计调查的方式第三节 统计数据搜集的方法第四节 统计数据的质量第一节 统计调查的概念与种类考试内容:统计调查的概念和作用,统计调查的种类。一、统计调查的概念与作用1.含义统计调查,是按照预定的目的和任务,运用科学的统计调查方法,有计划有组织的搜集数据信息资料的过程。2.分类统计调查包括搜集第一手统计数据和搜集第二手统计数据两种。(1)第一手统计数据第一手统计数据,即原始统计数据,是指从各个调查单位搜集的、尚待汇总整理的个体统计数据,这些个体数据需要通过汇总、整理,形成反映总体特征的综合数据。它是统计活动所取得的初级统计数据,是原始的统计信息。(2)第二手统计数据第二手统计数据,指已经经过加工整理的统计数据,能够在一定程度上说明总体现象。它包括开始用于其他研究目的,但本次研究仍可利用的资料;为对比分析所利用的历史数据、外地区外部门的资料等。统计调查搜集的主要是第一手统计数据。二、统计调查的种类(一)按调查对象的范围不同,分为全面调查和非全面调查1.全面调查全面调查是对构成调查对象的所有单位进行逐一的、无一遗漏的调查,包括全面统计报表和普查。2.非全面调查非全面调查,是对调查对象中的一部分单位进行调查,包括非全面统计报表、抽样调查、重点调查和典型调查等。全面调查由于调查的单位多、组织工作量大,所以需费大量的人力、财力。因此在不影响统计研究目的实现的条件下,常常采用非全面调查。(二)按调查登记的时间是否连续,分为连续调查和不连续调查1.连续调查连续调查,是为了观察总体现象在一定时期内(通常是一年内)的数量变化,它要求随着调查对象的发展变化,连续的进行调查登记。连续调查的资料是说明现象的发展过程,目的是为了解社会现象在一段时期的总量。2.不连续调查不连续调查,是间隔一个相当长的时间(通常是一年以上)所作的调查,一般是为了对总体现象在一定时点上的状态进行研究。如生产设备拥有量、耕地面积等等,这些指标的数值在短期内变化不大,不需要连续登记,通常是隔一段时间登记其某时刻或某一天的数量。第二节 统计调查的方式考试内容:统计的含义,统计工作、统计数据。统计学的含义。重点调查和典型调查与抽样调查的区别1.抽样调查是随机的抽取调查单位,可以根据抽样结果推断总体的数量特征;2.重点调查和典型调查的单位不是随机抽取的,具有一定的主观性,调查结果不能推断总体。调查方式含义特征、分类及应用场合普查为某一特定目的而专门组织的一次性全面调查,主要用于收集处于某一时点状态上的社会经济现象的基本全貌。特点:1.普查通常是一次性的或者周期性的;2.一般需要规定统一的标准调查时间,以避免调查数据的重复或遗漏,保证普查结果的准确性。3.数据一般比较准确,规范化程度较高,可以为抽样调查或其他调查提供基本的依据。4.使用范围比较窄,只能调查一些最基本及特定的现象。抽样调查从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种非全面调查1.经济性:是抽样调查的一个显著优点。2.时效性强:可以迅速、及时的获得所需要的信息。3.适应面广:可用于全面调查能够调查的现象,也能调查全面调查所不能调查的现象,特别适合特殊现象的调查。如:产品质量检验、农产品试验、医药的临床实验。4.准确性高:误差往往较小在实际应用中,抽样方法主要有两种:概率抽样和非概率抽样。(1)概率抽样:是最理想、最科学的抽样方法。能保证样本数据对总体参数的代表性,而且它能够将调查误差中的抽样误差限制在一定范围内。概率抽样包括以下形式:简单随机抽样,是最基本的形式,是完全随机的选择样本。分层抽样 整体抽样 等距抽样,又称作系统抽样(2)非概率抽样不是依据随机原则选取样本。如街头拦截的方便抽样,调研者主观选择样本单元的判断抽样等。容易实施、成本较低,但不适于推断总体的项目。统计报表按照国家有关法规的规定,自上而下地统一布置,自下而上地逐级提供基本统计数据的一种调查方式1.按调查对象范围的不同分为全面报表和非全面报表。目前的大多数统计报表都是全面报表。2.按报送周期长短,分为日报、月报、季报、年报等3.按报表内容和实施范围不同分为国家的、部门的、地方的统计报表重点调查从调查对象的全部单位中选择少数重点单位进行调查重点调查所选择的重点单位虽然只是全部单位中的一部分,但就调查的标志值来说在总体中占绝大比重,调查这一部分单位的情况,能够大致反映被调查对象的基本情况。重点调查的适用范围很广,当调查目的只要求了解基本状况和发展趋势,不要求掌握全面数据,而调查少数重点单位就能满足需要时,采用重点调查就比较适宜。典型调查选择一个或几个有代表性的单位进行全面深入的调查。1.弥补全面调查的不足2.在一定条件下可以验证全面调查数据的真实性。典型调查的目的是通过典型单位来描述或揭示事物的本质和规律,是一种定性调查研究,其着眼点不在数量特征上,因此不认为它是一种统计调查也是可以的。【例题17:2006年多选题】与普查相比,抽样调查具有()的特点A.适应面广 B.经济性 C.耗费大量的人力、物力、财力 D.时效性强 E.周期性答案:ABD【例题18:2009年多选题】相对于普查而言,抽样调查的特点包括( )。A经济性 B时效性强 C适应面广 D周期性 E准确性高答案:ABCE【例题19:2006年单选题】能够根据样本结果推断总体数量特征的调查方式是()A.重点调查B.抽样调查 C.典型调查D.所有非全面调查答案:B【例题20:2009年单选题】为了解全国煤炭企业的生产安全状况,找出安全隐患,专家根据经验选择10个有代表性的企业进行深入细致的调查。这类调查方法属于()。 A专家调查 B重点调查 C系统调查 D典型调查 答案:D 解析:典型调查是从调查对象的全部单位中选择一个或几个有代表性的单位进行全面深入的调查。【例题21:2003年单选题】普查规定统一的标准调查时间是为了( )。A.确定普查从这一时间开始 B.使普查制度化、标准化C.确定调查的起止时间 D.避免调查数据的重复和遗漏答案:D【例题22:2008年多选题】下列调查方式中,属于非全面调查的有()A、重点调查 B、抽样调查 C、典型调查 D、普查 E、全面报表答案:ABC第三节 统计数据搜集的方法考试内容:第一手统计数据的搜集方法,包括直接观察法、报告法、采访法、登记法、电话访问法、网络调查法和试验设计法的概念、特点和主要应用。第二手统计数据的来源以及使用时须注意的问题。一、搜集第一手统计数据的方法搜集调查对象的原始数据,常用的方法有直接观察法、报告法、采访法等。应根据调查目的与被调查对象的具体特点,选择合适的调查方法。1.直接观察法 我国的农产量抽样调查常用这种方法。2.报告法 我国现行的统计制度采用的就是这种方法3.采访法 分为口头询问法和被调查者自填两种。4.登记法 我国的人口出生和死亡的统计以及流动人口的统计5.电话访问法 目前,在国外流行的有中心控制电话访谈法和电脑辅助电话访谈法(CATI)。6.网络调查法7.实验设计法二、搜集第二手数据方法第二手统计数据的主要来源有公开的出版物、未公开的内部调查等。在我国公开出版或报道的社会经济统计数据主要来自国家和地方的统计部门以及各种报刊媒介,另外报纸、杂志、广播、电视、历史文献,网络等也是获得第二手数据的重要渠道。利用间接来源的统计数据,必须注意几个问题:1.要评估第二手数据的可用价值。2.要注意指标的含义、口径、计算方法是否具有可比性。3.注意弥补缺失数据和进行质量检查。4.引用统计数据时,一定要注明数据的来源,既方便他人查找核对,也是尊重他人或劳动成果和知识产权的要求。【例题23:2007年多选题】使用第二手统计数据,必须注意()。A.引用数据时一定要注明数据来源B.要评估第二手统计数据的可用价值C.指标的含义、口径、计算方法是否具有可比性D.对不完整的历史数据要根据需要和可能设法进行适当的补充E.不能纠正存在问题的历史数据答案:ABCD【例题24:2005年单选题】从使用者角度看,从()中取得的统计数据是第二手统计数据。A.经济普查 B.农产量抽样调查 C.中国人口统计年鉴 D.固定资产投资月度统计报表答案:C第四节 统计数据的质量考试内容:统计数据的误差、误差的来源,登记性误差和代表性误差的含义、区别,统计数据的质量要求及检查。一、统计数据的误差及误差的来源统计数据误差通常是指统计数据与客观现实之间的差距,误差有登记性误差和代表性误差。1、登记性误差-调查过程中由于调查者或被调查者的人为因素所造成的误差。从理论上讲,登记性误差是可以消除的。(1)调查者造成的误差:调查方案中有关的规定或解释不明确导致的填报错误、抄录错误、汇总错误等(2)被调查者造成的:因人为因素干扰形成的有意虚报或瞒报调查数据,这种误差在统计调查中应予以特别重视。2、代表性误差-在用样本数据进行推断时所产生的随机误差。无法消除,但事先可以进行控制或计算。产生原因:(1)抽取样本时没有遵循随机原则;(2)样本结构与总体结构存在差异;(3)样本容量不足等;【例题25:2005年单选题】抽样时,由于样本容量不足造成的误差与因为()造成的误差,都属于代表性误差。A.被调查者有意虚报 B.数据汇总错误 C.填报错误 D.没有遵循随机原则答案:D【例题26:2008年多选题】代表性误差形成的原因主要有()A、抽样没有遵循随机原则 B、有意虚报、瞒报 C、抄录错误D、样本容量不足 E、样本结构与总体存在差异答案:ADE二、统计数据的质量要求及检查(1)精度 最低的抽样误差或随机误差(2)准确性 最小的非抽样误差或偏差(3)关联性 满足用户决策、管理和研究的需要(4)及时性 在最短的时间里取得并公布数据(5)一致性 保持时间序列的可比性(6)最低成本 在满足以上标准前提下,以最经济的方式取得数据第23章 统计数据的整理与显示考试目的:测查应试人员是否掌握数据整理在整个统计分析过程中的地位和作用,统计数据的整理和显示方法,统计表的基本结构和设计要求,并能够合理运用统计表来显示数据。本章教材结构:第一节 品质数据的整理与显示第二节 数值型数据的整理与显示第三节 统计表第一节 品质数据的整理与显示考试内容:适用于分类数据的整理与显示方法。频数与频数分布的含义,比例、百分比和比率的计算方法,分类数据频数分布表的编制方法,条形图的作用、特点和绘制方法,圆形图的作用、特点和绘制方法。适用于顺序数据的整理与显示方法。累积频数和累积百分比的计算方法,顺序数据累积频数分布表的编制方法。一、分类数据的整理与显示(一)频数与频数分布1、频数的含义:频数也称次数,是落在各类别中的数据个数。2、频数分布(次数分布):各个类别及其相应的频数全部列出来就是频数分布或称次数分布。3、频数分布表:频数分布用表格的形式表现出来就是频数分布表。4、分类数据进行整理时常用的指标如下:(1)比例:是指在一个总体当中,各个部分的数量占总体数量的比重,通常反映整体的构成或者整体结构。各部分比例之和等于1。【例题1-课后题第4题】比例是一个总体中各个部分的数量占总体数量的比重,各部分的比例之和( )A 大于1 B 小于1 C 等于1 D 等于100答案:C(2)百分比:将比例乘以100就是百分比或百分数。用%表示,它表示100个分母中拥有多少个分子。当分子的数值很小而分母的数值很大时,也可以用千分数来表示比例。如人口的出生率、死亡率、自然增长率等(3)比率:各不同类别的数量的比值,可以是一个总体中各不同部分的数量对比。由于比率不是总体中部分与整体之间的对比关系,因而比值可能大于1。为方便起见,比率可以不用1作为基数,而用100或其他便于理解的数作为基数。比如:人口的性别比就用每100名女性人口所对应的男性人口来表示。【例题2:2004年单选题】根据第5次人口全国普查的结果,我国男性占总人口的51.63%,女性占总人口的48.37%,那么人口的性别比例应该为()。A.100:106.74 B.93.67:100 C.106.74:100 D.100:93.67答案:C解析:如果用1作为基数表示性别比例:51.63:48.37=1.0674:1如果用100作为基数表示性别比例:106.74:100在经济和社会问题的研究中,经常使用比率。比如经济学中的积累和消费之比;国内生产总值中第一、二、三产业产值之比等。比率也可以是同一现象在不同时间或空间上的数量之比。如:某年的国内生产总值与上年的国内生产总值进行对比,得出经济增长率;一个地区的国内生产总值同另一地区的国内生产总值进行对比,反映两个地区的经济发展水平差异。【例题3:2007年单选题】计算我国国内生产总值中的第一、二、三产业产值之比,是采用了计算()的数据整理方法。A.比例 B.均值 C.比率 D.百分比答案:C(二)分类数据的图示分类数据的图示方法,包括条形图和圆形图。(1)条形图是用宽度相同的条形的高度或长短来表示数据变动的图形。绘制时,各类别可以放在纵轴,称为条形图。各类别放在横轴,称为柱形图。(2)圆形图也称饼图,是用圆形及圆内扇形的面积来表示数值大小的图形。圆形图主要用于表示总体中各组成部分所占的比例,对于研究结构性问题十分有用。 【例题4:2005、2007年多选】下列各项中,适用于分类数据的整理和显示的方法有()A.累积频数 B.比例 C.百分比 D.比率 E.累积频率答案:BCD【例题5:2004年多选题】2001年底,我国共有博物馆1458个,其中综合性博物馆769个,历史类博物馆521个,艺术类博物馆57个,自然科技类博物馆19个,其他类型博物馆92个。这一构成应通过绘制()来显示。A.条形图 B.累积频数分布图 C.圆形图 D.直方图 E.折线图答案:AC解析:上述资料给出的是分类数据,应使用条形图或圆形图来表示。【例题6:09年单选题】分类数据的图示方法主要有圆形图和()。 A条形图 B直方图 C累积分布图 D茎叶图 答案:A 【例题7:课后题第9题】在对分类数据进行整理时,落在各类别中的数据个数被称为( )A 频数 B 指数 C 次数 D 百分比 E 比例答案:AC【例题8:课后题第10题】以下指标中,( )是对分类数据进行整理时常用的指标。A 频数 B 比例 C 极差 D 百分比 E 比率答案:ABDE(二)顺序数据的整理与显示分类数据的整理和显示方法也适用于顺序数据,但适用于顺序数据的整理与显示的某些方法如累积数和累积频率不适用于分类数据。1.累积频数和累积频率(1)累积频数:指各类别的频数逐级累加起来。其方法有两种:向上累积:从类别顺序的开始一方向类别顺序的最后一方累加频数(数值型数据则是从变量值小的一方向变量值大的一方累加频数)。向下累积:从类别的最后一方向开始一方累加频数(数值型数据则是从变量值大的一方向变量值小的一方累加频数)(2)累积频率或百分比。将各类别的百分比逐级累加起来,也有向上累积和向下累积两种方法。2.顺序数据的图示顺序数据与分类数据的图示方法基本相同。另外包括累积频数分布图。【例题9:课后题第12题】计算累积频率的两种方法是()。A.加权 B.简单平均 C.向上累积 D.开方 E.向下累积答案:CE【例题10:多选题】下列各项当中,适用于顺序数据但是不适用于分类数据的方法()。A.累积频率 B.比例 C.百分比 D.比率 E.累积频数答案:AE第二节 数值型数据的整理与显示考试内容:适用于数值型数据的整理与显示方法。数据的分组的含义和作用,数据分组的方法,上限、下限、组距、组中值的含义,组中值的作用和计算方法,数据分组的具体步骤,根据原始数据进行适当的分组并编制频数分布表,直方图和折线图的绘制方法,直方图与条形图的区别。一、数据的分组1.数据分组的含义:数据分组是根据统计研究的需要,将数据按照某种标准划分成不同的组别。分组后再计算出各组中出现的次数或频数,形成一张频数分布表。2.数据分组的方法分组的方法有单变量值分组和组距分组两种。(1)单变量值分组是把每一个变量值作为一组,这种分组方法通常只适合于离散变量且变量较少的情况。(2)组距分组是将全部的变量值,划分为若干个不同的区间。适合于连续变量或变量值较多的情况。采用组距分组需要经过以下几个步骤:第一步,确定分组的组数确定分组组数时的要求:划分的组数既不应太多也不应太少组数的确定,要尽量保证组间资料的差异性与组内资料的同质性;采用的分组办法,要能够充分显示客观现象本身存在的状态。第二步,对原始资料进行排序。第三步,求极差。极差值=最大观察值-最小观察值第四步,确定各组组距。组距=根据上式计算出来的组距,可能带有小数,为了编表和计算方便,也是审美习惯使然,最好把它取成接近于5除尽的一个数。组距与组数成反比例关系,组数越多,组距越小,组数越少,组距越大。组距是每组观察值的最大差,即每组的上限值与下限值之间的差。用公式表示就是:组距某组上限值该组下限值或:某组上限值=该组下限值+组距某组下限值=该组上限值-组距第五步,确定组限。组限是组与组之间的界限,或者是每组观察值的变化范围。一个组的最小值称为下限;最大值称为上限。上限值与下限值的差值称为组距上限值与下限值的平均数称为组中值。即:确定组限时应注意:第一组的下限值应比最小的观察值小一点,最后一组的上限值应比最大的观察值大一点。特别需要或不得已的情况除外,最好不要使用开口组。 组限应取得美观些,按数字偏好,组限值应能被5除尽,且一般要用整数表示。第六步,确定各组观察值出现的频数。为解决“不重”的问题,统计分组时习惯上规定“上组限不在内”,即当相邻两组的上下限重叠时,恰好等于某一组上限的观察值不算在本组内,而计算在下一组内。 第七步,制作频数分布表。二、数值型数据的图示1.直方图直方图是用矩形的宽度和高度来表示频数分布的图形。直方图中,实际上用矩形的面积表示各组的频数分布。直方图与条形图不同:(1)条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别是)则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,因此其高度与宽度均有意义。(2)由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。2.折线图(也称为频数多边形图)折线图也称频数多边形图,它是在直方图的基础上,把直方图顶部的中点用直线连接起来,再把原来的直方图抹掉就是折线图。【例题11:2004年单选题】一批数据分别为“6070”、“7080”、“8090”、“90100”四组,按统计表分组的习惯规定,90这一数值应归在()这一组中。A.“6070” B.“7080” C.“8090” D.“90100”答案:D【例题12:2007年单选题】对一组数据进行分组,各组的组限依次是“1020”、“2030”、“3040”、“4050”、“5060”、“6070”。在以上这组数据中,50这一数值()。A.由于恰好等于组限,不需要分在某一组中 B.分在“5060”一组中C.分在“4050”一组中 D.分在“4050”或“5060”任意一组中都可以答案:B解析:注意“上限不在内”的规定。【例题13:2008年单选题】将一批数据进行分组,各组的组限依次为“100-120”、“120-130”“130-140”“140-150”“150-160”,按统计分组的规定,140这一数值( )A不计算在任何一组 B分在“140-150”这一组C分在“130-140”这一组 D分在“130-140”或“140-150”均可答案:B【例题14:2006年、2008年单选题】对数据实行等距分组的情况下,组距与组数的关系是()。A.无任何关系 B.反比关系 C.正比关系 D.组距总是组数的5倍答案:B解析:组距=极差/组数【例题15:2006年多选题】直方图与条形图的区别在于()。A.直方图的各矩形通常是分开排列 B.直方图用面积表示各组频数的多少C.直方图的各矩形通常是连续排列 D.直方图的矩形高度与宽度均有意义E.直方图的矩形高度有意义而宽度无意义答案:BCD【例题16:课后题第14题】组距分组适用于下列情况()A.离散变量 B.变量值较少 C.连续变量 D.变量值较多 E.分类数据答案:CD【例题17:课后题第15题】在组距分组中,确定分组组数的时候要求()。A.组数尽可能少 B.组数尽可能多 C.尽量保证组间资料的差异性D.尽量保证组内资料的同质性 E组数应能被5除尽答案:CD解析:组数不能太多也不能太少;组限值应能被5除尽。所以ABE均错误。【例题18:课后题第3题】为解决“不重”的问题,统计分组时习惯上规定( )A不重不漏 B组限值应能被5除尽 C下组限不在内 D 上组限不在内答案:D第三节 统计表考试内容:统计表的作用,统计表的基本构成,统计表的设计要求,能够合理地设计和使用统计表。一、统计表的构成 1.统计表是用于显示统计数据的基本工具2.构成:统计表一般由四个主要部分组成,即表头、行标题、列标题和数字资料,必要时可以在统计表的下方加上表外附加。(1)表头应放在表的上方,它所说明的是统计表的主要内容。(2)行标题和列标题通常安排在统计表的第一列和第一行,它所表示的主要是所研究问题的类别名称和指标名称,通常也被称为“类”。(3)表外附加通常放在统计表的下方,主要包括资料来源、指标的注释和必要的说明等内容。二、统计表的设计设计统计表时要注意以下几点:第一,要合理安排统计表的结构。第二,表头一般应包括表号、总标题和表中数据的单位等内容。第三,表中的上下两条横线一般用粗线,中间的其他线要用细线。通常情况下,统计表的左右两边不封口,列标题之间一般用竖线隔开,而行标题之间通常不必用横线隔开。总之,表中尽量少用横竖线。表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一。对于没有数字的表格单元,一般用“-”表示,一张填好的统计表不应出现空白单元格。第四,在使用统计表时,必要时可在表的下方加上注释。特别要注明资料来源,以表示对他人劳动成果和知识产权的尊重。【例题19:2004年、2005年】通常情况下,设计统计表要求()。A.没有数字的单元格应空白 B.左右两边应封口 C.表中数据一般是右对齐D.列标题之间一般用竖线隔开 E.行标题之间不必用横线隔开答案:CDE【例题20:2007年多选】通常情况下,设计统计表要求()。A.没有数字的单元格应空白 B.左右两边不封口 C.表中数据一般是右对齐D.列标题之间一般用竖线隔开 E.行标题之间不必用横线隔开答案:BCDE第24章 数据特征的测度考试目的:测查应试人员是否掌握数据特征测度的意义,数据的特征可以从哪些方面进行描述,集中趋势和离散程度的含义,集中趋势和离散程度各测度值的计算方法、不同方法的特点和应用场合。本章教材结构:第一节 集中趋势的测度第二节 离散程度的测度第一节 集中趋势的测度考试内容:众数的含义、计算方法、特点和应用范围;中位数的含义、计算方法、特点和应用范围;算术平均数的含义、特点、应用范围,算术平均数在统计中的重要地位,简单算术平均数和加权算术平均数的计算方法;几何平均数的含义,简单几何平均数的计算方法和主要用途。集中趋势是指一组数据向某一中心值靠拢的倾向,测度集中趋势也就是寻找数据一般水平的代表值或中心值。集中趋势的测度,主要包括:位置平均数-众数、中位数等数值平均数-算术平均数和几何平均数等【例题1:2004年单选题】以下属于位置平均数的是()。A.几何平均数 B.算术平均数 C.众数 D.极差答案:C解析:众数及中位数均属于位置平均数。一、众数1、涵义:众数是一组数据中出现频数最多的那个数值,用M0表示。2、用众数反映集中趋势,非常直观,不仅适用于品质数据,也适用于数值型数据。众数是一个位置代表值,不受极端值的影响,抗干扰性强。【例题2:课后题第5题】下面是抽样调查的10个家庭住房面积(单位:平方米):55;75;75;90;90;90;90;105;120;150。这10个家庭住房面积的众数为( )A 90 B 75 C 55 D 150答案:A二、中位数1、涵义:把一组数据按从小到大的顺序进行排列,位置居中的数值叫做中位数,用Me表示。中位数将数据分为两部分,其中一半的数据小于中位数,另一半数据大于中位数。2、中位数计算:根据未分组数据计算中位数时,要先对数据进行排序,然后确定中位数的位置,n为数据的个数,其公式为:3、中位数主要用于顺序数据,也适用于数值型数据,但不适用于分类数据,中位数也是一个位置代表值,不受极端值的影响,抗干扰性强。【例题3:2004单选题】2003年,某市下辖六个县的棉花种植面积按规模由小到大依次为800公顷、900公顷、1100公顷、1400公顷、1500公顷、3000公顷,这六个县棉花种植面积的中位数是()公顷。A.1450 B.1250 C.1100 D.1400答案:B解析:n为偶数,中位数是介于数列中间的两个数的算术平均数。 中位数=(1100+1400)/2=1250(公顷)【例题4:2008单选题】某小学六年级8个班的学生人数由少到多依次为34人、34人、34人、34人、36人、36人、37人、37人,其中位数为( )A 34 B 35 C 36 D37答案:B解析:n为偶数,中位数=(34+36)/2=35.【例题5:课后题第8题】下面一组数据为9个家庭的人均月收入数据(单位:元):750;780;850;960;1080;1250;1500;1650;2000;则中位数为( )A 750 B 1080 C 1500 D 2000答案:B解析:n为奇数,中位数位置为5,所对应的数值为1080。三、算术平均数1、涵义:算术平均数是全部数据的算术平均,又称均值,用表示。是集中趋势中最主要的测度值。主要适用于数值型数据,但不适用于品质数据。2、计算公式:(1)简单算术平均数简单算术平均数主要用于处理未分组的原始数据。简单算术平均数的计算公式为:(2)加权算术平均数加权算术平均数主要用于处理经分组整理的数据。加权算术平均数的计算公式为: Xi各组的组中值fi各组的频数3、计算和运用算术平均数注意事项:(1)算术平均数同时受到两个因素的影响:各组数值的大小、各组分布频数的多少。频数在算术平均数中起着权衡轻重的作用。(2)算术平均数易受极端值的影响。极端值的出现,会使平均数的真实性受到干扰。【例题6:2003年单选】集中趋势最主要的测度值是( )。A.众数 B.中位数 C.均值 D.几何平均数答案:C解析:算术平均数也称为均值,是集中趋势最主要的测度值。四、几何平均数1、涵义:n个观察值连乘积的n次方根就是几何平均数。2、计算公式:公式为:几何平均数 3、主要用途:(1)对比率、指数等进行平均(2)计算平均发展速度。【例题7:09年单选】下列指标中,用于描述数据集中趋势,并且易受极端值影响的是()。 A算术平均数 B中位数 C众数 D极差 答案:A 解析:中位数和众数都不受极端值的影响,极差描述数据离散程度,只有选项A算术平均数用于描述数据集中趋势,并且易受极端值。【例题8:08年单选】下列数据特征的测度值中,受极端值影响的是( )A中位数 B 众数 C加权算术平均数 D位置平均数答案:C解析:中位数、众数均属于位置平均数,不受极端值的影响。【例题9:2005年、2007年多选题】下列数据特征的测度值中,易受极端值影响的有()。A.加权算术平均数 B.简单算术平均数 C.极差 D.众数 E.中位数答案:ABC【例题10:2005、2006、2007年单选】下列集中趋势中,适用于品质数据的是()。A众数 B简单算数平均数 C标准差 D加权算术平均数【答案】A【例题11:08年单选】算术平均数与众数、中位数具有共同特点是( )A都适用于分类数据 B都适用于顺序数据 C都不受极端值的影响 D都适用于数值型数据答案:D解析:众数、中位数、算术平均数均适用于数值型数据。【例题12:2007年单选题】某连锁超市6个分店的职工人数有小到大排序后为57人、58人、58人、60人、63人、70人其算术平均数、众数分别为()。A59、58 B61、58 C61、59 D61、70【答案】B【解析】出现频数最多的数值为众数,即58人算术平均数=(57+58+58+60+63+70)/6=61人【例题13:2006年多选题】对于经分组整理的数据,其算术平均数会受到( )等因素的影响。A各组数值的大小 B各组分布频数的多少 C组数 D数据个数 E.极端值答案:ABE【例题14:2008年多选】下列统计指标中,可以采用算术平均数方法计算平均数的有()A、产品产量 B、可支配收入 C、产品合格率 D、销售额 E、考试分数答案:ABDE解析:C属于相对指标,适用几何平均数方法计算平均数。【例题15:2009年多选】适于测度顺序数据的指标有( )。 A离散系数 B. 中位数 C众数 D. 均值 E标准差 答案:BC 第二节 离散程度的测度考试内容:数据离散程度的含义,测度数据离散程度在描述数据特征中的作用;极差的含义和计算方法;标准差和方差的含义、计算方法和应用;离散系数的含义、作用、计算方法和具体应用。离散程度是指数据之间的差异程度或频数分布的分散程度。集中趋势的测试值是对数据一般水平的一个概括性变量,它对一组数据的代表程度,取决于该组数据的离散水平。数据的离散程度越大,集中趋势的测试值对该组数据的代表性就越差,离散程度越小,其代表性就越好。离散程度的测度,主要包括极差、方差和标准差、离散系数等。一、极差1、含义:极差是最简单的变异指标。它就是总体或分布最大的标志值与最小的标志值之差,又称全距,用R表示。2、计算公式:3、极差反映的是变量分布的变异范围或离散幅度,在总体中任何两个单位的标志值之差都不可能超过极差。极差计算简单,含义直观,运用方便。但它仅仅取决于两个极端值的水平,不能反映其间的变量分布情况,同时易受极端值的影响。二、标准差和方差1、含义:方差:总体所有单位标志值与其平均数离差之平方的平均数。标准差:方差的平方根,用表示。2、计算:(1)未整理的原始数据 (2)用于分组数据标准差和方差是应用最广泛的统计离散程度的测度方法。三、离散系数(标准差系数)1、极差、标准差、方差都是反映数据分散程度的绝对值,其数值大小受到变量值水平高低和计量单位的影响。2、为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离散系数。离散系数通常是就标准差来计算的,因此也称标准差系数。它是一组数据的标准差与其相应的算术平均数之比,是测度数据离散程度的相对指标,用表示。离散系数主要是用于比较对不同组别数据的离散程度。离散系数大的说明数据的离散程度也就大,离散系数小的说明数据的离散程度也就小。【例题16:2009年单选题】离散系数比标准差更适用于比较两组数据的离散程度,这是因为离散系数 ( )。A不受极端值的影响 B不受数据差异程度的影响C不受变量值水平或计量单位的影响 D计算更简单答案:C【例题17:2008年单选题】标准差系数是一组数据的标准差与其相应的()之A算数平均数 B极值 C众数 D几何平均数答案:
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 山西铁道职业技术学院《口腔病理学》2023-2024学年第二学期期末试卷
- 延安大学《热力学基础》2023-2024学年第一学期期末试卷
- 江苏省南京市溧水区第二高级中学2024-2025学年全国高三期末大联考语文试题试卷含解析
- 湖北省鄂州市2025年三年级数学第二学期期末监测模拟试题含解析
- 九江理工职业学院《用户界面设计与评价》2023-2024学年第二学期期末试卷
- 山西省忻州市静乐县2025届小升初必考题数学检测卷含解析
- 中南大学《植物生物技术概论》2023-2024学年第二学期期末试卷
- 江苏省盐城市东台实验中学2024-2025学年初三下学期适应性月考卷(一)语文试题含解析
- No k ia战略基础知识
- 一呼百应招商手册
- 光学系统的像差理论和像质评价课件
- 浙江省杭州市九年级下学期语文4月学情诊断模拟试卷
- 财务管理案例分析(雀巢并购徐福记)
- 2023届高三语文复习:散文训练-茅盾散文
- 【灌溉系统】-基于单片机的智能灌溉系统
- 中国急性胰腺炎诊治指南课件
- 2022年高考真题-英语(新高考II卷)
- 外科学心肺脑复苏
- 课堂教学存在的问题及解决对策
- 职业卫生档案管理规范教材培训课件
- GB/T 4857.9-2008包装运输包装件基本试验第9部分:喷淋试验方法
评论
0/150
提交评论