中级统计师考试统计方法笔记_第1页
中级统计师考试统计方法笔记_第2页
中级统计师考试统计方法笔记_第3页
中级统计师考试统计方法笔记_第4页
中级统计师考试统计方法笔记_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计方法笔记第一章统计和数据第一节:统计含义一、什么是统计学●统计是用来处理数据,是关于数据一门学问。1、统计学:是用以搜集数据、分析数据和由数据得出结论一组概念、标准和方法。2、统计分析数据方法分为:(1)描述统计(2)推断统计描述统计:是研究数据搜集、处理和描述统计学方法。其内容包含怎样取得研究所需要数据,怎样用图表形式对数据进行处理和展示,怎样经过对数据综合、概括与分析,得出所关心数据特征。推断统计:是研究怎样利用样本数据来推断总体特征统计学方法。内容包含参数估量和假设检验两大类;推断统计包含:(1)参数估量(2)假设检验二、统计应用(一)统计应用领域统计是适适用于全部学科领域通用数据分析方法,是一个通用数据分析语言。第二节、数据类型一、变量与数据变量特点是从一次观察到下一次观察会出现不一样结果,把观察数据统计下来就是数据。二、数据类型(一)定性变量(数据)与定量变量(数据)(1)定性变量定性变量观察结果称为定性数据。定性变量特点:只反应现象属性特点,不能说明详细量大小和差异;●定性变量包含分类变量和次序变量。●分类变量:只反应现象分类特征变量称分类变量。分类变量没有数值特征,所以不能对其数据进行数学运算。分类变量观察结果就是分类数据;分类数据只能用来区分事物,不能用来表明事物之间打下、优劣关系。●次序变量:假如类别具备一定次序,这么变量称为次序变量。次序变量不但能用来区分客观现象不一样类别,而且还能够表明现象之间大小、高低、优劣关系。次序变量观察结果就是次序数据。次序数据最主要特征在于不论它数据是用数值表示还是文字表示,都存在一定客观次序,一定能够按照大小、高低、优劣进行排序。次序即使能够比较大小,却无法计算相互之间大小、高低或优劣距离,不能用来反应事物在数量上差异,所以,从本质上将,次序数据依然是定性数据一个;2、定量变量定量变量也称为数值变量,定量变量观察结果称为定量数据。定量变量特点:能够用数值表示其观察结果,而且这些数值具备明确数值含义,不但能分类而且能测量出来详细大小和差异。数值型数据特征在于它们都是以数值形式出现,有些数值型数据只能够计算数据之间绝对差(绝对距离),而有些数值型数据不但能够计算数据之间绝对差,还能够计算数据之间相对差(相对距离)。显然,数值型数据计量功效要远大于前面介绍两种定性数据,其计量精度也远远高于定性数据,所以在统计研究中,数值型数据有着最广泛用途。由数值型数据特点决定了对数值型数据能够利用多个不一样数学方法进行计算,从而给统计学各种分析方法应用奠定了基本数据基础,在统计学研究中对数值型数据研究是定量分析主要内容。(二)观察数据和试验数据不论是哪一类数据,依照获取数据方法不一样,都能够分为观察数据和试验数据。观察数据可能是全方面数据也可能是样本数据,试验数据通常都是样本数据。1、观察数据:是对客观现象进行实地观察所取得数据,在数据取得过程中通常没有些人为控制和条件约束。观察是取得数据最主要方法。很多社会经济问题不适合应用试验方法,职能经过向实际做调查得到数据,用各种调查方法得到数据都属于观察数据。2、试验数据:通常是在科学试验环境下取得数据,在试验中,试验环境是受到严格控制,数据产生一定是某一约束条件下结果。在自然科学研究中试验方法应用非常普遍,所以,自然科学研究中所用数据多为试验数据。第三节数据起源于搜集数据方法一、数据起源从使用者角度看,统计数据资料起源主要有两种渠道:(1)是经过直接调查或试验取得原始数据,这是统计数据直接起源,通常称之为原始或第一手统计数据;(2)是他人调查数据,并将这些数据进行加工和汇总后公布数据,通常称之为次级数据或第二手简练统计数据。一切简练统计数据都是从原始、第一手数据过渡而来。(一)数据直接起源——原始数据搜集数据最基本形式就是进行统计调查或进行试验活动,统计调查或进行试验就是统计数据直接起源。1、统计调查:是依照统计研究预定目标,要求和任务,利用科学方法,有计划、有组织地向客观实际搜集资料过程。经过统计调查得到数据,通常称为观察数据。2、试验法:是直接取得统计数据主要起源。经过试验法得到数据就是试验数据。经过有意识地改变或控制一些输入变量,观察其余输出变量改变,从而达成对事物本质或相互联络认识。为了观察对输入变量控制是否造成了输出变量改变,在试验中往往需要将研究对象分两个组,一个试验中,一个对照组,对试验组输入变量加以控制和改变,而对照组则不加控制,依照两组输出结果,能够看到输入变量对输出影响。利用试验法要注意是:(1)首先试验组和对照组产生应该是随机;(2)其次试验组合对照组还应该是匹配;(二)数据间接起源——次级数据(1)公开出版统计数据:主要来自官方统计部门和政府、组织、学校、科研机构。如《中国统计年鉴》、《人口普查资料汇编》、《北京市统计年鉴》、《世界发展汇报》、某大学、科研机构公布研究数据、专业调查咨询机构公布调查结果数据,各种媒体和图书中公布统计数据等;(2)还未公开发表统计数据:如各企业经营报表数据、专业调查咨询机构未公开公布调查结果数据。假如公开引用未公开发表数据需要征得数据全部者同意,同时要为自己公布数据负责。恰当利用间接数据,需要注意一下几点:①是否了解并正确了解简练数据中变量含义、计算口径、计算方法、以预防误用错用他人数据;②引用间接数据时要注明数据起源,尊重他人劳动结果和知识产权;二、搜集数据方法统计调查是依照调查目标与要求,利用科学调查方法,有计划、有组织地搜集统计数据资料过程。(1)普查:是专门组织一次性全方面调查,用来调查属于一定时点上或一定时期内社会现象总量。他适于搜集一些不能或不宜于定时全方面统计报表搜集统计资料,以摸清重大国情、国力。特点:它是一个全方面调查,具备资料包含范围全方面、详尽、系统优点;缺点:它是一次性专门调查,因为普查工作量大,耗资也多,时间周期较长,通常不宜经常举行。(2)抽样调查:是一个非全方面调查,它是按照随机标准从总体中抽取一部分单位作为样本进行观察研究,以抽取样本指标去推算总体指标一个调查。随机标准要求全部调查单位都有一定概率被抽取。特点:①样本单位按随机标准抽取,排除了主观原因对选取样本单位影响;②能够依照部分调查实际资料对调查对象总体数量特征进行推断,从而达成对调查总体认识。③在抽样调查中会存在抽样误差,不过这个误差能够事先计算并加以控制;优点:既能节约人力、物力、财力,又能够提升资料时效性,而且能取得比较正确全方面统计资料,具备许多优点。抽样方法主要有两种:概率抽样和非概率抽样;(1)概率抽样:是依照一个已知概率随机选取被调查者。从理论上讲,概率抽样是最科学抽样方法,它能确保抽出来部分单位(样本单位)对总体单位代表性,而且它能将抽样误差限制在一定范围之内。惯用概率抽样形式为:①简单随机抽样:是最基本形式,是完全随机地选择样本。②分层抽样:是首先将总体分成不一样层(或组),然后在每一层内进行抽样。③整群抽样:是将一组被调查者视为一个抽样单位,每次抽取时抽出来是一组(群),而不是一个个体单位。调查者将对被抽中某个居委会中美甲每户进行调查。④系统抽样:又称等距抽样,是在总体名目框中每隔一定距离抽选一个被调查者。(2)非概率抽样:是没有完全按照随机标准选取样本单位。缺点:理论上讲,不能确保抽出来部分单位(样本单位)对总体单位代表性;不能由样本特征准确地推断总体特征;优点:方法简单、经济,所以也是人们惯用方法。(三)统计报表:是按照国家统一要求调查要求与文件(指标、表格形式、计算方法等)自上而下地提供统计资料一个调查方式。国家利用它定时地取得全社会国民经济和社会发展情况基本统计资料,是国家取得调查资料方法之一。按照报送范围,统计报表有全方面报表和非全方面报表之分:全方面报表:要求调查对象汇总每一个单位均要填报;非全方面报表:要求一部分调查单位填报;按照报送周期,统计报表主要有月报、季报、年报组成。月报内容简单,时效性强,年报则内容比较全方面;统计报表内容:(1)表式:是由国家统计部门依照研究任务和目标而专门设计制订统计报表表格,用于搜集统计资料,它是统计报表制度主体。(2)填表说明:它是对统计表统计范围、指标等作出要求,详细有:填报范围、指标解释、分类目录、其余关于事项要求;优点:对于大型、国有企业来说,利用统计表搜集数据,具备时间快、成本低优点;(对于小型、非国有经济单位,则难以全方面采取统计报表调查。)(四)重点调查:是在调查对象中选择一部分对全局具备决定性作用重点单位进行一个非全方面调查。特点:这些重点单位即使数目不多,但它们所研究现象总量在总体总量中占据绝大部分;●当调查任务只要求掌握事物基本情况与基本发展趋势,而不要求掌握全方面准确资料,而且在总体中确实存在着重点单位时,进行重点调查是比较适宜。●优点:重点调查能够节约人力、财力、而且及时,所以当调查任务只要求掌握事物基本情况时,采取重点调查为好。(五)经典调查:是一个非全方面调查,是依照调查目标与要求,在对被调查对象进行全方面分析基础上,有意识地选择若干具备经典意义或有代表性单位进行调查。经典调查作用:(1)补充全方面调查不足(2)在一定条件下能够验证全方面调查数据真实性。●特点:经典调查具备灵活机动、经过少数经典即可取得深入详实统计资料优点,不过易受人们主观认识上影响,必须同其余调查结合起来使用,才能防止出现片面性。第二章数据描述第一节用图表展示定性数据定性数据包含分类数据和次序数据,它们图表展示方法剧本相同,通常能够分为频率分布表和图形来描述;一、生产频数分布表定性数据本身就是对事物一个分类,所以,只要先把全部类别都列出来,然后统计处每一类别频数,就是一张频数分布表。二、定性数据图形表示有:(1)饼图(2)条形图(3)环形图●饼图是利用圆形及圆内扇形面积来表示数值大小图形。●条形图是用宽度相同条形高度或长度来表述数据多少图形。●假如想比较不一样变量之间结构差异,能够经过环形图来实现。第二节用图表展示定量数据定性数据图示表示方法,也都适适用于定量数据。但定量数据还有一些特定图示方法,它们并不适适用于定性数据。一、生产频数分布表●生成定量数据频数分布表步骤:(1)对数据进行分组,通常一组个数在5-15之间;(2)确定组距(所谓组距指每个组变量值中最大值和最小值之差。大值称为上限,小值称为下限。组距=上限-下限)(3)统计出各组频数及频数分布表●在确定组距时应掌握标准:(1)要考虑各组划分是否能区分总体内部各个组成部分性质差异。(2)要能准确地清楚地反应总体单位分布特征。●在确定组距时,在研究现象变动比较均匀情况下,能够采取等距分组;而当研究现象变动很不均匀时,通常采取不等距分组。●频数:是指频数分布表中落在某一特定类别数据个数。●在统计各组频数时,恰好等于某一组组限时,则采取上限不在内标准,即将该频数计算在与下限相同组内。二、定量数据图形表示惯用来表述定量数据统计图形:直方图、折线图和散点图。另外还有茎叶图、箱线图等;(一)直方图它横坐标代表变量分组,纵坐标代表各变量值出现频数。(二)折线图利用线段升降来说明现象变动一个统计图,它主要用于表示现象分配情况,现象在时间上改变和两个现象之间依存关系等。(三)散点图第三节用统计表来表示数据统计表五个组成部分:(1)表头:放在表上方,说明表主要内容;(2)行标题:放在第一行,表示所研究问题类别名称(3)列标题:放在第一列,表示所研究问题指标名称(4)数字资料(5)表外附加:通常放在统计表下发,用来说明资料起源、指标注释和必要说明等内容。通常情况下,统计表左右两边不能封口。第四节用数字来概括数据数据分布特征:(1)集中趋势,即一组组数据数值向其中心值靠拢程度(2)离散程度,即一组数据各个数值远离其中心趋势和程度一、定性数据数字特征定性数据主要是计数,比较简单,对定性数据集中趋势惯用方法就是计算百分比、中位数和众数;(1)百分比(2)中位数:它是数据按照大小排列之后位于中间那个数。假如样本量为偶数,则是中间两个数平均。(3)众数:就是数据中出现次数或出现频率最多数值。在定性数据中因为统计是频数,所以众数用得多些。二、定量数据数字特征反应数据集中趋势水平度量:平均数、中位数、众数和分位数等反应数据离散程度差异度量:(1)极差(2)四分位差(3)标准差(4)方差(一)水平度量1、平均数:也称均值,是把某一组数据进行算术平均,用以表述某一事物平均水平,它在统计中也叫均值。2、中位数:它是数据按照大小排列之后位于中间那个数。假如样本量为偶数,则是中间两个数平均。3、众数:就是数据中出现次数或出现频率最多数值。在定性数据中因为统计是频数,所以众数用得多些。4、用哪个值代表一组数据●平均数在实际应用中较多,但主要确定是更轻易受少数极端数值影响,对于严重偏态分布数据,平均数代表性较差;●中位数和众数提供信息不像平均数那样多,但它们也有优点,比如不受极端值影响,具备统计上稳健性,当数据为偏态分布,尤其是偏斜程度较大时,能够考虑选择中位数和众数,这时它们代表性比平均数好。(二)差异度量1、极差:又称全距,是一组数据中最大值和最小值之差。缺点:不过它仅仅受最大值和最小值影响,不能反应一组数据变量分布情况,而且它非常轻易受数据中极端值影响,不能准确描述数据分散程度。极差是从一个范围反应数据差异程度,比较粗略。2、方差与标准差为了能反应数据中每一个观察值和平均水平差异程度就必须引入方差和标准差(1)方差试讲各个变量值和其平均值离差平方平均数作为样本数据,它反应了样本中各个观察值到其均值平均离散程度。(2)标准差是方差平均根,它与方差相比更具量纲性,而且与变量值计量单位相同,使用范围也比喻差更广泛。●方差用表示,总体标准差用表示,样本标准差用表示,离散系数用表示,标准分数用表示。●在一个统计样本中,其标准差越大,说明它各个观察值分布越分散,它趋中程度就越差。反之,其标准差越小,说明它各个观察值分布越集中,它趋中程度就越好。●标准差大小会受到数据本身数值大小影响。两个数列标准差相同,不过两数列差异程度却不一样。为了更准确地反应差异程度,要计算离散系数。3、离散系数:是将一组数据标准差除以其均值,用来测度数据离散程度相对数。为了更准确地反应研究现象差异程度,我们要计算离散系数。4、标准分数:是变量值与其平均数离差除以标准差值,用以测定某一个数据在该组数据中相对位置。标准分数最大用途能够吧两组数据中两个不一样均值、不一样标准差数据进行对比,以判定它们在组中位置。比如:某男176CM,某女170CM,两位同学相对身高更高一些?我们了解到男生身高均值172,标准差2.8女生身高均值是164,标准差2.5某男身高标准分数:Zi=Xi-X/S=176-172/2.8=1.43某女身高标准分数:Zi=Xi-X/S=170-164/2.5=3.2显然某女在女生中身高要高于某男在男生中身高。第三章参数估量依据样本数据对总体数据特征进行估量、判断过程就是统计推断。统计推断包含参数估量和假设检验;第一节抽样分布一、总体分布于总体参数总体分布:是总体中全部观察值所形成分布。因为总体中观察值是有差异,能够视为随机变量,假如我们用X表示,X分布就是总体分布。总体参数:是对总体特征某个概括性度量。总体参数指标有:(1)总体平均数()(2)总体方差()(3)总体百分比()等。二、统计量与抽样分布●统计量是样本函数。组成统计量函数中不能包含未知原因。●因为样本是从总体中随机抽取,样本具备随机性,由样本数据计算出来统计量也是随机。所以在抽取样本前,理论上统计量是一随机变量;●由样本统计量所形成概率分布就是抽样分布,如样本均值分布,样本百分比分布等。●样本统计量指标有:(1)样本均值()(2)样本方差()(3)样本百分比()●统计量概率分布组成了推断总体参数理论基础。(一)关于样本均值抽样分布:(1)设总体共有个元素,从中随机抽取一个容量为样本,在重置抽样时,共有种抽法;在不重复抽样时,共有个样本。(2)样本均值抽样分布就是指全部可能抽出来样本分布。(3)样本均值均值就是总体均值,即。(4)重置抽样时,样本均值标准差为总体标准差,即;不重置抽样时,样本均值方差为。(5)当总体服从正态分布时,样本均值一定服从正态分布,即有:~时,~。(6)若总体为未知非正态分布时,只要样本容量足够大(通常要求≥30),样本均值仍会靠近正态分布,其分布期望值为总体均值,样本方差为总体方差。(7)假如总体不是正态分布,当为小样本时(通常<30),样本均值分布则不服从正态分布。(二)关于样本百分比抽样分布:(1)当样本容量比较大时,样本比率近似服从正态分布,且有数学期望就是总体比率,即。(2)在重置抽样时,方差为。(3)在不重置抽样时,方差为。(4)在重置抽样时,分布为~(5)在不重置抽样时,分布为~三、关于统计量标准误差:(1)统计量标准误差也称标准误,它是指样本统计量分布标准差。标准误差是用于衡量样本统计量离散程度。在参数估量中,用于衡量样本统计量与总体参数之间差距一个主要尺度;(2)样本均值标准误计算公式为:(3)当总体标准差未知时,可用样本标准差代替计算,这时计算标准误差称为估量标准误差。(4)样本百分比标准误计算公式为:(5)当总体百分比方差未知时,可用样本百分比方差代替。第二节参数估量参数估量:就是用样本统计量去估量未知总体参数。一、点估量与区间估量用样本统计量估量总体参数两种方法:(1)点估量(2)区间估量●惯用点估量有:(1)用样本均值估量总体均值(2)用样本百分比估量总体百分比(3)用样本方差估量总体方差(比如:你花510元情况,你能够说花500元情况,不过付款却要付510;)●区间估量:就是依照估量可靠程度要求,利用随机抽取样本统计量值确定能够覆盖总体参数可能区间一个估量方法;区间估量是包含样本统计量在内一个区间,该区间通常是由样本统计量加减估量标准误差得到。关于区间估量:(1)标准正态分布(0,1)均值为0,标准差为1。(2)标准化公式为:(观察值-均值)÷标准差(3)以68.27%置信水平推断总体参数置信区间为:(4)以95.45%置信水平推断总体参数置信区间为:(5)以99.73%置信水平推断总体参数置信区间为:(比如:经常说这个人有1.7-1.8米高,有70-80斤)二、评价估量量标准有:(1)无偏性(2)有效性(3)一致性●无偏性是指估量量抽样分布期望值等于被估量总体参数。、、分别是总体均值、总体百分比、总体方差无偏估量量。●有效性是指估量量方差尽可能小。对同一个总体参数两个无偏估量量,有更小方差估量量更有效。●一致性是指一个大样本给出估量量要比一个小样本给出估量量更靠近总体参数。样本均值是总体均值一个一致估量量。三、一个总体均值区间估量:(1)在对总体均值进行区间估量时,需要考虑总体是否为正态分布、总体方差是否已知、用于估量样本是大样本()还是小样本()等情况。(2)大样本情况下,总体服从正态分布,总体方差已知,总体均值在置信水平下置信区间为(3)大样本情况下,总体服从正态分布,总体方差未知,总体均值在置信水平下置信区间为(4)小样本情况下,总体服从正态分布,总体方差已知,总体均值在置信水平下置信区间为(5)小样本情况下,总体服从正态分布,总体方差未知,总体均值在置信水平下置信区间为四、一个总体百分比区间估量在大样本条件下,若,,则二项分布可用正态分布近似,在置信水平下置信区间为。●样本量与置信水平成正比关系,与总体方差成正比,与允许估量误差平方成反比。●假如总体百分比值不知道能够用样本百分比代替,或者取=0.5,使得达成最大。第四章假设检验假设检验:是依据样本信息推断未知总体参数,而假设检验是先对总体参数或分布形式提出某种假设,然后利用样本信息和相关统计量分布特征去检验这个假定,做出是否拒绝原来假设结论。第一节假设检验基本理论怎样进行假设检验小概率事件:是指在一次事件中几乎不可能发生事件,通常称为“显著性水平”,用表示。●显著性水平通常取值为=0.05或=5%。假设检验过程:(1)提出原假设和备择假设(2)确定检验统计量(3)确定显著性水平(4)依照数据计算检验统计量值和与这个统计量值对应概率值值,并进行决议●原假设也称为零假设,记为;备则假设也称为备选假设,记为。●在对总体均值进行检验时,大样本应用正态分布检验,计算统计量,小样本通惯用分布检验,计算统计量。●拒绝正确零假设错误称为第一类错误或弃真错误();当备选假设正确时反而说零假设正确错误称为第二类错误或取伪错误()。对假设检验总结:(1)假设检验依据是小概率原理(2)小概率标准在抽样前依需要确定(3)假设检验结果只能是拒绝或不拒绝原来假设,而不能证实原假设成立(4)统计假设检验结果不是绝对正确关于总体均值假设检验:(1)在对总体均值进行假设检验时,采取什么检验统计量,取决于所抽检样本是大样本()还是小样本(),还需要考虑总体是否为正态分布、总体方差是否已知等情况。(2)大样本情况下,当总体方差已知时,总体均值检验统计量为:(3)大样本情况下,当总体方差未知时,总体均值检验统计量为:(4)小样本情况下,当总体均值服从正态分布,总体方差已知时,总体均值检验统计量为:(5)小样本情况下,当总体均值服从正态分布,总体方差未知时,总体均值检验统计量为:总体百分比检验三种基本形式:(1)双侧检验:,(2)左侧检验:,(3)右侧检验:,●总体百分比假设检验,在大样本时,样本百分比会近似服从正态分布,所以检验统计量仍用统计量,其基本形式为:第五章相关分析与回归分析对现象之间数量关系研究,统计上是从两个方面进行:首先分析现象之间关系亲密程度——相关分析另首先是找出现象之间数量改变依存关系——回归分析第一节相关分析一、相关关系:是存在着亲密联络但又不是严格、确定关系。相关分析主要内容包含以下几个方面:(1)确定现象之间有没有关系,这是相关分析起点,只有存在相关依存关系,才有必要进行深入分析。(2)确定相关关系表现形式,只有判明了现象之间相关关系详细表现形式,才能利用对应回归分析方法深入分析现象之间数据依存关系,假如把曲线相关误认为是直接相关,按直线相关来分析,便会出现认识上偏差,造成错误结论。(3)测定相关关系亲密程度。现象之间相关关系是一个不严格数量关系,所以给人感觉是涣散,相关分析就是要从这种涣散数量关系中,判定其相关关系亲密程度。二、相关关系描述——散点图●对于两个变量X和Y,经过观察或试验,我们能够得到其若干组数据,记为(Xi,Yi)(i=1,2,…..n),将这些数据按X值由大到小(或由小到大)以序列表表示,即组成相关表。●经过相关表能够粗略地看出两个变量之间存在着相关关系,而且二者之间是改变方向是一致,即存在着正相关。●将一一对应(Xi,Yi)描点于坐标系上,即组成散点图,又称为相关图。(一)相关形态分为:(1)线性相关:若变量Y和变量X相关关系表现为线性组合,或绘制散点图近似地表现为一条直线或直线带;(2)非线性相关:若Y和X是非线性组合,或绘制散点图近似地表现为一条曲线,则称之为非线性相关或曲线相关。(二)相关方向分为:(1)正相关:当两个变量变动方向总体上相同,即一个变量增加,另一个变量也对应地增加,或一个变量降低,另一个变量也对应地降低,两个变量之间关系属于正相关。(2)负相关:当两个变量变动方向总体上相反,即一个变量增加,另一个变量也对应地降低,两个变量之间关系属于负相关。●正相关是两个变量变动方向总体上相同,负相关是两个变量变动方向总体上相反。三、相关程度测定(一)相关系数计算相关系数:是测定变量之间关系亲密程度量,它能够以数字准确地描述变量之间相关程度。Pearson相关系数是反应定量变量之间相关程度;Spearman等级相关系数是反应定序变量Pearson相关系数是用来度量两个定量变量X与Y之间线性相关程度。相关系数具备以下性质:(1)取值范围为-1≤≤1。r>0表明与之间存在正线性相关关系;r<0表明与之间存在负线性相关关系;r值越靠近1(或-1)就越正(或负)相关,越靠近0就越不相关。r=1或r=-1表明与之间为完全相关关系(实际上就是函数关系)(2)具备对称性。与之间相关系数和与之间相关系数相等。(3)r数值大小与和数据原点及计量尺度无关。改变和数据原点或计量尺度,并不改变r数值大小。(4)r仅仅是与之间线性关系一个度量,它不能用于描述非线性关系。折旧意味着=0只表示两个变量之间不存在线性相关,并不表明变量之间没有任何关系。(5)r即使是两个变量之间线性关系一个度量,却不一定意味着与一定有因果关系。依照经验可将相关程度分为以下几个情况:当|r|≥0.8时,可视为高度相关;当0.5≤|r|<0.8时,可视为中度相关;当0.3≤|r|<0.5时,视为低度相关;当|r|<0.3时,说明两个变量之间相关程度较弱。(二)相关系数检验检验步骤:(1)确定原假设(2)计算统计量t值(3)利用其对应概率值进行判断,假如概率值小于或等于指定显著性水平(通常a=0.05),则我们能够拒绝原假设,接收备择假设,即两变量之间存在线性相关关系。第二节一元线性回归分析●相关分析意在测度变量之间关系亲密程度,它所使用测定工具就是相关系数。回归分析是考查若干自变量X与因变量Y之间数量改变规律统计方法和技术。回归分析主要内容:(1)从样本数据出发,确定变量之间数学关系式;(2)估量回归模型参数(3)对所确定关系式进行各种统计检验,并从影响某一特定变量很多变量中找出影响显著变量。●回归方程拟合程度分析最惯用指标是判定系数。取值范围在[0,1],=1时,拟合是完全,即全部观察值都在直线上。越靠近于0,回归直线拟合程度越差。●估量标准误差也是说明回归直线拟合程度指标,越小,依照回归方程进行预测就越准确。第六章时间序列分析时间序列:是指反应社会、经济、自然现象数据按时间先后次序统计形成数列。时间序列两个组成要素:(1)现象所属时间(2)对应不一样时间统计指标数值第一节时间序列分析指标一、增加量分析时间数列增加量分析主要有:增加量和评价增加量分析。(一)发展水平:是时间数列中对应某个时期(或时点)指标数值,说明现象在各个时期(或时点)上所达成规模和水平,通惯用符号Yt(t=1,2…,n)表示,其中t表示所对应时间。(二)增加量:是指时间数列中两个不一样时期发展水平之差,反应社会经济现象汇报期比基期增加或降低数量,即:增加量=汇报期水平-基期水平因为采取基期不一样,增加量有以下两种:①逐期增加量:它是汇报期水平与前一期水平之差,说明汇报期比前一时期增加绝对数量。能够表示为:y2-y1,y3-y2,…yn-yn-1②累计增加量:它是汇报期水平与某一固定时期水平之差,它说明本期比某一固定时期增加绝对数量,也说明某一较长时期内总增加量。二者关系:逐期增加量之和等于对应时期累计增加量。(三)平均增加量:是某种社会经济现象在一定时期内平均每期增加(或降低)绝对数量。通惯用累计增加量除以增加时期数目计算。二、增加率分析反应时间序列增加率指标主要有:发展速度、增加速度、平均发展速度和平均增加速度;(一)发展速度:是表明现象发展程度动态相对自次奥,它是两个不一样时期发展水平对比结果。发展速度=汇报期水平/基期水平*100%因为采取基期不一样,发展速度可分为环比发展速度和定基发展速度。环比发展速度:是汇报期水平与前一期水平之比,反应现象逐期发展改变情况;定基发展速度:是汇报期水平与某一固定时期水平之比,表明现象在较长时期内总发展改变速度,又称总速度;环比发展速度与定基发展速度存在以下关系:(1)环比发展速度连乘积等于对应定基发展速度。(2)相邻时期两个定基发展速度相除商,等于对应环比发展速度。(二)增加速度增加速度是表明现象增加程度动态相对指标。它是增加量与基期水平结果。其计算公式:增加速度=增加量/基期发展水平增加速度与发展速度有着亲密关系,二者只相差一个基数,即:增加速度=增加量÷基期发展水平=发展速度-1(三)平均发展速度和平均增加速度平均发展速度是一定时期内各个环比发展速度平均数,它说明某种现象在一定时期内逐期平均发展改变程度。平均增加速度是各个环比增加速度平均数,但它不是依照各个环比增加速度计算,而是依照平均发展速度计算。它说明某种现象在一个较长时期内逐期平均增加改变程度。平均发展速度和平均增加速度关系:平均增加速度=平均发展速度-1第二节长久趋势分析一、时间数列影响原因分解●时间数列四个影响原因:(1)长久趋势(2)季节变动(3)循环变动(4)不规则变动(一)长久趋势:是指时间数列在一段长时期变动,若将其用图形表示,可得一长线趋势,将其分解,其中长久趋势原因就可画出趋势图,如趋势图是直线,则称为直线趋势,若趋势线是曲线,则依照其曲线形式称为某种曲线趋势,如二次曲线趋势、长久趋势等。(二)季节变动:季节变动是时间数列有季节性原因而引发周期性变动,许多经济领域时间数列都受这种变动支配。当反应时间数列数据时按照周、月、即时间间隔统计时,季节变动很显著。(三)循环变动:是以年度统计时间数列所表现出来某种周期性变动。如一些经济活动序列表现出以8年或9年为一个周期循环,这种循环通常也称为商业周期。(四)不规则变动:是时间数列除去长久趋势、季节变动和循环变动止呕余留下来变动;这种变动细分为两个类型:一是严格随机变动,它是由许多细小原因综合引发;二是不经常出现一些孤立或不规则、但却是强有力突发性活动。如政治动荡,战争暴发,大自然灾害产生影响。上述四种原因改变组成事物在一定时期变动,它们是怎样相互结合与相互作用,通常有两种分解形式:加法模式和乘法模式。加法模式是假定四种变动原因是相互独立,则时间数列各期发展水平是各个影响原因相加总和;乘法模式是假定四种变动原因存在着某种相互影响关系,互不独立。所以,时间数列各期发展水平是各个影响原因相乘之积。二、长久趋势分析方法(1)回归方程法:就是利用回归分析法,将试讲作为解释变量,建立现象随时间改变趋势方程。首先要确定趋势形态,最惯用方法是先画散点图。若散点图属直线趋势形态,可拟合直线方程,若为曲线形态,则可拟合曲线方程;还能够依照动态分析指标判断,若时间数列逐期增加量近似一个常量,则趋势近似一条直线;若时间数列中二级增加量大致相同,则趋势近似一条抛物线;若时间数列中各环比发展速度大致相同,则趋势近似一条指数曲线。直线趋势方程通常公式:式中:表示时间数列长久趋势;表示时间数列中指标所属时间;、为待定参数。(2)简单移动平均法:是一个用来测定时间数列长久趋势最基本方法。它将时间数列数据逐项移动,依次计算包含一定骑术序时平均数,形成一个新时间数列方法。(3)指数平滑法:是对时间数列由近及远采取具备逐步衰减性质加权处理,对移动平均法做出了改进;依照指数平滑次数不一样,指数平滑法又一次指数平滑、二次指数平滑等;一次平滑法:也称简单指数平滑法,简记为SES第三节季节变动分析季节变动三个特点:(1)季节变动每年重复进行(2)季节变动按一定周期进行(3)每个周期改变强度大致相同季节变动方法:一是不考虑长久趋势季节指数法;二是考虑长久趋势回归方程法消除法;一、不考虑长久趋势——季节指数法季节指数法:是一个经过计算各月(或季)季节指数(又称季节比率),来反应季节变动一个分析方法。季节比率计算方法是:首先计算出各年同期发

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论