统计学期末重点整理_第1页
统计学期末重点整理_第2页
统计学期末重点整理_第3页
统计学期末重点整理_第4页
统计学期末重点整理_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学期末重点整理题型:单选;多选;简答;计算。简答题:1、指标和标志之间的关系:指标与标志的关系如同总体与单位的关系,指标是由标志过渡而来的。通过实际调查取得了反映个体单位的标志表现,再对这些标志表现加以综合就形成了相应的指标。尽管品质标志的标志表现不是数量,但对其累计可获得反映总体单位数的统计指标。数量指标的标志表现是数值,对这些数值进行综合就可以得出反映总体标志总量的统计指标,当然也可以获得总体单位数指标。2、统计分组:数值型数据分组类型、特点、应用场合:频数分布主要有三种类型:即钟形分布、U形分布、J型分布。(1)钟型分布:特征是“两头小,中间大”即靠近中间的变量数值频数多,靠近两头的变量数值频数少。具体称为正态分布、正偏态分布、负偏态分布。许多社会经济和自然总体的频数分布都趋向于正态分布,如农作物的单位面积产量、零件的公差、人的身高、纤维强度等都服从正态分布。(2)U型分布:形状跟钟形分布相反,靠近中间的变量值频数少,靠近两端的变量值频数多,形成“两头大,中间小”的U字形。例如,人口死亡率分布就是这种分布。(3)J型分布:一种是正J型分布,即频数随着变量值的增大而增多;另一种是反J型分布。经济学中供给曲线随着价格的提高,供给量以更快的速度增加,呈现出正J型;而需求曲线则表现为随着价格的提高,需求量以较快的速度减少,呈现反J型。3、均值、中位数、众数的特点、关系和应用条件:(1)均值X:就是算数平均数,是集中趋势的最主要测度值,也是应用最广泛的一种平均数。(2)众数Mo:是指一组数据中出现次数最多的变量值,用Mo表示。众数是一个位置代表值,它不受数据中极端值的影响。从变量分布的角度看,众数是具有明显集中趋势点的数值,一组数据分布的最高峰点所对应的数值即为众数。众数也可以不存在,也可以有多个。出现最多次数的变量值即为众数。在实际生活中,众数的应用场合比较有限,例如,在农贸市场上,某种商品的价格常以众数为代表值。(3)中位数Me:是一组数据按从小到大的顺序后,处于中间位置上的变量值,用Me表示。中位数将全部数据等分为两部分,中位数可以反映出一组数据的中心位置,数据的集中趋势。中位数是一种位置平均数,个别极端值的变化不会影响中位数的数值,所以中位数具有稳健性。当一组数据中含有极端值时,用中位数反映该组数据的一般水平可避免极端数值对平均数的影响。【中位数位置=(n+1)/2。(n为数据的个数。当n为奇数时,处在中间位置上只有一个变量值,则该变量值就是中位数;当n为偶数时,处在中间位置上有两个变量值,则这两个变量值的简单平均数就是该数据的中位数)】(4)均值与众数、中位数和平均数,反映一组数据的集中趋势,作为一组数据的代表值,但就其意义、特点和应用上是有差异的。如果仅从数量上考察,三者的关系取决于频数分布的状况,关系如下:①当数据具有单一众数且频数分布对称时,均值与众数、中位数三者完全相同,即X=Mo二Me。②当频数分布呈现右偏态时,说明数据存在最大值,必然拉动均值向极大值一方靠,则三者之间的关系为X>Me>Mo。③当频数分布呈现左偏态是,说明数据存在最小值,必然拉动均值向极小值一方靠,而众数和中位数由于是位置平均数,不受极端值的影响,因此,三者的关系为X<Me<Mo。4、时间序列编制原则;编制时间序列的目的是通过同类现象在不同时间上的数值对比来反映现象的发展过程及其规律性,因此,保证序列中数据之间的可比性,就成为编制时间序列应遵守的的基本原则。(1)时间长短应尽量统一。(2)总体范围应该一致。(3)指标的经济内容应该一致。(4)计算口径应该统一。5、各时间序列特点;时间序列按其构成要素中统计数据的表现形式,分为绝对数时间序列、相对数时间序列和平均数时间序列。其中绝对数时间序列是基本序列,相对数时间序列和平均数时间序列是派生序列。(1)绝对数时间序列。把一系列反映现象总量规模的同类数据按时间先后顺序排列而成的数列,成为绝对数时间序列,它反映了现象在各期达到的绝对水平。按照总量指标所反映现象的时间状态不同,绝对数时间序列又分为时期序列和时点序列两类。A时期序列。当序列中的数据是反映现象在各段时间内发展过程的总量时,就成为时期序列。特点:①序列中各个数据是可以相加的,即相加具有一定的经济意义。由于时期序列中每个数据是表现现象在一段时间内发展变化的累计总量,所以相加后的数值就表现现象在更长一段时期内发展变化的累计总量。②序列中每一个数据的大小与所属的时间长短有直接的联系。③序列中每个数据,通常是通过连续不断的登记而取得的。B时点序列。当序列中的数据是反映现象在某一时点上所处的数量状态是,称该序列为时点序列。特点:①序列中各个数据是不能相加的,相加不具有实际经济意义。由于时点序列中每个数据都是表明某一时点上瞬间现象的总量,相加以后无法说明属于哪一时点上的数量。②数列中数据的大小与其间隔长短没有直接联系。③序列中的每个数据,通常都是间隔一定时期通过一次性登记取得的。(2)相对数时间序列。把同一系列同类的相对数按时间顺序排列而成的序列,成为相对数时间序列。它反映现象对比关系的发展变化情况,说明社会经济现象的比例关系、结构、速度的发展变化过程。(我国的经济增长率、城镇居民的恩格尔系数都是相对数时间序列)特点:在相对数时间序列中,各个数据也是不能相加的。(3)平均数时间序列。把一系列同类的平均数按时间顺序排列而成的序列,称为平均数时间序列。它反映现象一般水平的发展趋势。(城镇居民家庭人均可支配收入即为平均数时间序列)特点:在平均数时间序列中,各个数据相加也没有意义。6、增长量类型及其关系;增长量是时间序列中的报告期水平与基期水平之差,用于描述客观现象在观察期内增长的绝对量。若两者之差为正数,表示增长;若为负数,则表示下降。增长量二报告期水平一基期水平由于采用的基期不同,增长量有逐期增长量和累计增长量之分。A逐期增藏量:是报告期水平与前一时期水平之差,表示报告期比前一时期增长的绝对数量;B累计增长量:是报告期水平与某一固定时期水平之差,说明报告期比某一固定时期增长的绝对数量。关系:整个观察期内,各逐期增长量之和等于最末期的累积增长量。逐期(环比)增长量=al-a0,a2-a1,……, an-an-1累计(定基)增长量=al-a0,a2-a0,……,an-a0①一定时期累计增量等于该时期逐期增量之和:(al-a0)+(a2-al)+…+(an-an-1)=an-a0②相邻两期累计增量之差等于相应的逐期增量7、发展速度的类型及其关系:发展速度。发展速度是同一个事情在两个不同时期发展水平对比的结果,用于描述现象在观察期内的相对发展变化程度,说明报告期水平是基期水平的百分之几或若干倍。当发展速度的计算结果大于100%,表明现象发展水平上升,反之,表明现象发展水平下降。由于采用的基期不同,发展速度可分为环比发展速度和定基发展速度。A环比发展速度:是报告期水平与前一期水平之比,说明现象逐期发展变化的程度。B定基发展速度:是报告期水平与固定时期水平之比,说明现象在整个观察期内总的发展变化程度。环比发展速度与定基发展速度之间的关系:①观察期内各个环比发展速度的连乘积等于最末期的定基发展速度。②相邻两个定基发展速度的比值等于相应时期的环比发展速度。因此,可以根据一种发展速度去推算另一种发展速度。8、综合指数编制原理:A综合问题:引入同度量因素同度量因素:是使不同度量的现象过渡到可以同度量的媒介因素。选择同度量因素的标准:同度量因素与指数化指标之间的客观联系。具体表现为两者相乘具有实际的意义。同度量因素的作用:一是同度量作用;二是权数作用。B对比问题:为了反映指数化指标的变动,必须将同度量因素固定在同一时期上不变。指数化指标的分子和分母分别为报告期和基期资料。同度量因素的分子和分母必须为同一时期的资料,可以是报告期资料也可为基期资料或其他时期资料,但使用不同时期的资料编制的综合指数意义不同。C总结:综合指数编制的基本原理是:首先引入同度量因素,解决多种事物不能加总的综合问题;其次固定同度量因素,使综合总量的对比只反映指数化指标的变化。9、指数体系概念及其作用:A广义指数体系。从广义上说,指数体系是由若干个经济上具有一定联系的指数所构成的一个整体。B狭义指数体系。从狭义上说,指数体系是指不仅具有一定联系,而且保持一定数量对等关系的三个或三个以上的指数所构成的一个整体。作用:A可以进行因素分析。根据指数体系中各指数之间相对数和绝对数的关系,可以从相对数和绝对数两个方面分析各因素变动对所研究现象的影响,即进行指数因素分析。B可以进行指数之间的相互推算。单选/多选:第一章:基本概念:1、统计总体:是统计调查对象的全体,它是由客观存在的、具有某种共同特性的许多个体构成的整体,简称总体。(统计总体具有三个特征,即同质性、大量性和变异性)2、总体单位:构成统计总体的个体叫做总体单位,简称单位。3、样本:按照一定的概率从总体中抽取一部分单位的集合。(样本又被成为子样,,总体也被称为母体。)4、统计标志:是表明总体单位特征的名称,简称为标志。5、(1)标志按其反映的单位特征不同,分为品质标志和数量标志。A品质标志:表明单位的属性特征,其标志表现一般用文字或语言表述。(如学生的“性别”是一个品质标志,该标志的具体表现“男”或“女”就是用文字表述的)B数量标志:表明单位的数量特征,其标志表现都用数值表述。(例如“年龄”是一个数量标志,其标志的具体表现“21”“22”等就是用数值表述的)(2)标志按其标志表现形式的变异情况,分为不变标志和可变标志。A不变标志:若在一个总体中所有单位的某一特征的具体表现都相同,该特征就是一个不变标志。(在教师总体中,职业这一特征就是一个不变标志,其具体表现都是“教师”)B不变标志:若在一个总体中的所有单位的某一特征的表现不尽相同,该特征就是一个可变标志。(在教师总体中,职级工资就是一个可变标志,其具体表现可能是“1300元”、“1400”)6、统计指标:两种解释:一是统计指标是用来反映总体数量状况的基本概念。二是统计指标是反映总体数量状况的概念和数值。I、统计指标按其数值表现形式不同,可分为总量指标、相对指标和平均指标三种。(1)总量指标:反映现象总数量的统计指标,以绝对数形式表现,故又称为绝对数,如年底总人口、国内生产总值。总量指标按其所反映的时间状况不同又可分为时期指标和时点指标。A时期指标:又称时期数,它反映的是现象在一段时间内的总量,如产品总量、总产值、商品零售额。通常可以积累,从而得到更长时间区间内的总量。B时点指标:又称时点数,它反映的是现象在某一时刻上的总量,如年底人口数、年底商品库存额。通常不能在时间纵向上积累,但有时可在空间横向积累。(2)相对指标:是两个绝对数纸币,以相对数形式表示,亦称相对数,如经济增长率、股票价格指数等。(3)平均指标:所反映的是现象在某一空间或时间上的平均数量状况,以平均数形式表现,亦称平均数或均值,如人均消费水平、某种股票一周平均价格等。II、统计指标按其所反映的数量特点不同,可分为数量指标和质量指标。(1)数量指标:在外延上反映现象的总规模或总水平,其表现形式就是总量指标或绝对数。(2)质量指标:在内涵上反映现象的平均水平或比较联系程度,其表现形式就是平均数或相对数。例如,职工平均工资、人口密度、工人出勤率。III、统计指标按其计数单位的特点,可分为实物量指标和价值量指标。(1)实物量指标:是以实物单位计量的指标。(实物单位,是依据事物的实物形态及性能特点,由国家统一规定的计量单位。例如,以米、公斤、台、千瓦时等计量的指标)(2)价值量指标:是以货币单位计量,反映事物价值量的指标。(例如,2005年我国工业全年完成工业增加值72186亿元,我国进出口额14219亿美元)7、统计指标体系:就是由若干单个指标所组成,并能反映现象复杂性和联系性的统计指标群。(1)指标体系按其反映的内容范围不同,可以分为宏观指标体系和微观指标体系。A宏观指标体系:指反映全国范围社会经济现象数量特征和数量关系的指标体系。B微观指标体系:指反映基层单位运行和经营管理情况的指标体系。(2)指标体系按其作用的不同,可以分为基本指标体系和专题指标体系。A基本指标体系:是指反映社会经济基本情况的主要指标所构成的指标体系。B专题指标体系:是指反映某方面社会经济问题的指标体系。第二章:统计数据的搜集1、数据的计量尺度:根据计量学的一般分类方法,按照对事物计量的精确程度,可将所采用的计量尺度从低级到高级、从粕略到精确分为定类尺度、定序尺度、定距尺度和定比尺度.。采用不同的计量尺度可以得到不同类型的统计数据,而不同类型的统计数据又适用于不同对的统计分析方法。(一)定类尺度:它是按照事物的某种属性对其进行平行的分类或分组的一种测度。又称类别尺度或列名尺度;计量层次最低;对事物进行平行的分类;各类别可以指定数字代码表示;使用时必须符合类别穷尽和互斥的要求;数据表现为“类别”具有二或#的数学特性。特征:①只能区分事物的类别,但无法比较类间的大小,也就是说定类尺度只有二或#的数学特征。②对事物的区分必须符合穷尽和互斥的要求。③对定类尺度的数据进行分析的统计量主要是频数或者频率。(二)定序尺度:是对事物之间等级顺序差别的一种测度。也称顺序尺度;对事物分类的同时给出各类别的顺序;比定类尺度精确;未测量出类别之间的准确差值;数据表现为“类别”,但有序;具有>或<的数学特性特征:①不仅能够区分事物的类型,而且能够比较类间的优劣和顺序,不仅具有二或#的数学特征而且有了>或〈的数学特征。②对事物的区分要求符合穷尽和互斥③对定序尺度的数据进行分析的统计量主要是频数和累积频数(频率和累积频率)。(三)定距尺度:是对事物类别或者次序之间间距进行的一种测度。也称间隔尺度;对事物的准确测度;比定序尺度精确;数据表现为“数值”没有绝对零;具有+或-的数学特性特征:①不仅能够区分事物的类别、进行排序、比较大小,而且还可以精确地计量大小的差异。②没有绝对零点,即可以以任意一个0为起点。这里的0表示一个数值,即0水平,而不是没有或不存在。(四)定比尺度:是对事物之间比值的一种测度。也称比率尺度;对事物的准确测度;与定距尺度处于同一层次;数据表现为“数值”有绝对零点;具有X或+的数学特性特征:①除了能够区分类别、排序、比较大小、求出大小差异外,还可以计算两个测度值之间的比值②具有绝对定点,即0表示没有或不存在,是一个没有具体意义的数值。2、数据的类型:A分类数据:只能归于某一类别的非数字型数据,是由定类尺度计量形成的。B顺序数据:只能归于某一有序类别的非数字型数据,是由定序尺度计量形成的。C数值型数据:按定距和定比计量尺度测量的观察值。3、变量及其类型:变量是在统计中,说明现象某种特征的概念。A分类变量:说明事物类别的一个名称。如:性别是一个分类变量,其变量值为男或女;手机品牌也是一个分类变量,其变量值是松下、飞利浦等。B顺序变量:说明事物有序类别的一个名称。如:商品质量等级是一个顺序变量,其变量值可以为一等品、二等品等;受教育水平也是顺序变量,其变量值可以为小学及一下,初中等。C数值型变量:说明事物数字特征的一个名称。数值型变量的取值就是数值型数据:如收入、温度、年龄、失业人口等,这些变量可以取不同的数值。数值变量根据其取值的不同,又可以分为离散变量和连续变量。4、数据的直接来源:调查(是取得社会经济数据的重要手段)观察(是调查者在现场对被调查者的情况直接观察、记录以获得资料的方法);实验(取得自然科学数据的主要手段)。5、统计调查的组织方式:普查、抽样调查、统计报表、重点调查和典型调查等。6、统计数据的误差:登记性误差(人为因素造成的误差,存在于所有的调查之中,有抽样框误差、回答误差、无回答误差、调查员误差、测量误差);代表性误差(由于抽样随机性带来的误差;由样本量的大小和总体的变异性造成的)7、频数分布类型和编制过程:(见简答题)8、加权算术平均数:算术平均数在统计学中具有重要的地位,是集中趋势的最主要度量值。9、为什么计算离散系数:离散系数是反映一组数据相对差异程度的指标,它是标准差与均值的比值,通常又称为标准差系数,用V表示。标准差与其相应的均值之比;对数据相对离散程度的测度;消除了数据水平高低和计量单位的影响;用于对不同组别数据离散程度的比较。是无量纲化处理。10、样本均值抽样分布理论:①在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布②一种理论概率分布③推断总体均值u的理论基础11、点估计的优劣标准:①无偏性②一致性③有效性④均方误差准则12、假设的陈述方式:A假设检验:先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程B一种是当总体分布类型已知,所涉及到的是分布中所包含的几个未知参数的假设检验,这种假设检验叫参数假设检验。另外一种是除上述假设检验以外的其它假设检验,称为非参数假设检验。C原假设:研究者想收集证据予以反对的假设;又称“0假设”总是有符号二,W或2;表示为H0,H0:u=某一数值,指定为符号=,>或<。D备选假设:研究者想收集证据予以支持的假设;也称“研究假设”总是有符号#,〈或>;表示为H1,H1:u<某一数值,或口>某一数值例如,H1:u<10cm,或u>10cmE提出假设:①原假设和备择假设是一个完备事件组,而且相互对立(在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立)②先确定备择假设,再确定原假设③等号“二”总是放在原假设上④因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)13、理解a、B的关系:A第I类错误(弃真错误):原假设为真时拒绝原假设,第I类错误的概率记

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论