相关数列分析_第1页
相关数列分析_第2页
相关数列分析_第3页
相关数列分析_第4页
相关数列分析_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一页,共五十三页,2022年,8月28日13.1相关分析13.1.1相关关系的概念现象间的关系有两种类型:1.函数关系。指现象之间存在着严格的依存关系,即变量之间依一定的函数形式形成的一一对应的关系称为函数关系。2.相关关系。又称统计关系,是指两个变量之间存在某种依存关系,但变量y并不是由变量x唯一确定的,它们之间没有严格的一一对应关系。2第二页,共五十三页,2022年,8月28日13.1.2相关关系的种类1.按相关关系涉及的因素多少,可分为单相关与复相关。2.按相关关系的表现形式,分为直线相关和曲线相关。3.按相关关系的变动方向,分为正相关和负相关。4.按相关关系是否涉及有关影响因素,分为因相关和自相关。3第三页,共五十三页,2022年,8月28日13.1.3简单相关系数相关分析的内容主要是研究现象之间有无关系,相关关系的表现形式和密切程度。相关分析的方法主要有相关图表和相关系数等。当变量y与变量x之间具有线性相关时,可用简单相关系数测定它们之间的密切程度。计算公式为:4第四页,共五十三页,2022年,8月28日简单相关系数r的取值范围为

-1≤r≤1其中,为x与y变量的协方差,为x变量的标准差,为y变量的标准差,、分别表示变量y和x的n个数据的平均值。5第五页,共五十三页,2022年,8月28日当r<1时,则x与y之间为负相关,r>1时,则x与y之间为正相关。当r=1时,则x与y是完全正相关,r=-1时,则x与y是完全负相关。在这两种情形下,两个变量之间的关系是函数关系。当r=0时,则x与y之间不存在线性相关关系,但有可能存在非线性相关关系。通常有下列判别标准:

r<0.3,无相关;

0.3≤r<0.5,低度相关;

0.5≤r<0.8,中度相关;

r≤0.8,高度相关。[例13.1]6第六页,共五十三页,2022年,8月28日需要指出的是,测定简单相关系数时,x与y两个变量是对等的关系,即所研究的两个变量不分彼此,谁作x,谁作y都可以;两个变量只能算出一个相关系数,其值大小反映两变量之间的密切程度;计算相关系数要求两个变量必须都是随机的。7第七页,共五十三页,2022年,8月28日13.1.4相关指数简单相关系数只适用于两个变量间的直线相关的测定。而不适用于曲线相关和复相关的测定。若要测定曲线相关或复相关的紧密程度,则需要先进行回归分析,求出回归方程后,再由自变量x求出因变量y的估值,用下列公式计算相关指数(R):(―1≤R≤1)8第八页,共五十三页,2022年,8月28日相关指数是一种广义的相关系数,线性相关与曲线相关,单相关与复相关均可应用。对于简单线性相关而言,相关指数与相关系数是一致的。但是对于曲线相关与复相关而言,相关指数与简单相关系数在含义上是不同的。9第九页,共五十三页,2022年,8月28日13.1.5时间数列自相关时间数列自相关是指某个变量(y)自身随时间不同,其数值在前后时期之间表现出一定的依存关系。或者说,任一具体时期的数值都和它前一期或前几期的数值之间存在一定的联系。研究时间数列本身的相关关系,对于分析社会经济现象发展变化的规律性和进行预测,具有重要的意义。时间数列自相关也有正相关与负相关,直线相关与曲线相关,简单相关与复相关等不同的形态。下面着重介绍简单的直线自相关,即本期与前期或某一期数值相关。10第十页,共五十三页,2022年,8月28日设为y数列t期的数值,为y数列t-i期的数值,I可以为1,亦可为2,3,4……等等,但必须固定递推期。则自相关系数计算公式为:[例13.2]11第十一页,共五十三页,2022年,8月28日13.2一元线性回归13.2.1一元线性回归模型如果两个变量之间存在相关关系,并且一个变量(自变量)的变化会引起另一个变量(因变量)按某一线性关系变化,则两个变量间的关系可用一元线性回归模型描述:

y=a+bx+e式中:a、b为回归系数,a为回归直线的截距,b为回归直线的斜率,e是误差项。一元线性回归模型具有以下特点:12第十二页,共五十三页,2022年,8月28日1.两个变量y、x之间必须存在着真实的线性相关关系;2.两个变量y、x之间不是对等的关系,一个是因变量,一个是自变量。3.因变量y是随机变量,自变量x是非随机变量,是给定的数值。4.回归系数b有正负之分,b为正值,则x与y之间正相关;b为负值,x与y之间负相关。13第十三页,共五十三页,2022年,8月28日13.2.2一元线性回归模型的参数估计一元线回归模型的a、b参数,通常采用最小二乘法估计。其要求是误差项e的平方和最小,即:按照这一要求,要导出下列求解a、b参数的标准方程组:14第十四页,共五十三页,2022年,8月28日求解可得:如果先做相关分析,后做回归分析,则a、b参数:[例13.4]15第十五页,共五十三页,2022年,8月28日13.2.3回归模型的评价与检验1.拟合程度的测定。因变量y的各个观测值点聚集在回归直线周围的紧密程度,称为回归直线对样本数据点的拟合程度。通常用可决系数来表示。计算公式为:16第十六页,共五十三页,2022年,8月28日称为回归平方和;为离差平方和;其中:为剩余平方和(残差平方和)三者的关系可表示为:17第十七页,共五十三页,2022年,8月28日可决系数的取值区间为[0,1]。实际上,可决系数

是线性相关系数r的平方,因此,相关系数又可用下列公式求得:

r的正负号与回归系数b的正负号相同,越接近于1,表明回归直线对样本数据点的拟合程度越高。可决系数

的实用计算式为:18第十八页,共五十三页,2022年,8月28日19第十九页,共五十三页,2022年,8月28日2.估计标准误差。又称剩余标准差,它是评价回归直线代表性大小或实际值与估计值误差大小的综合性指标。计算公式为:由估计标准误差sy和因变量y的平均值,可计算相对标准误差:20第二十页,共五十三页,2022年,8月28日3.回归系数b的显著性检验。回归系数b是一个估计值,若y与x之间不存在线性关系,则回归系数b不具有显著性,所建立的回归方程是不能利用的。回归系数b的显著性检验采用t检验。其统计量为:21第二十一页,共五十三页,2022年,8月28日根据给定的显著水平α(通常α

=0.05)和自由度,n-2,查t分布表得到临界值,若>

,则回归系数b具有显著性,若<,则回归为系数b不具有显著性,即b与0的差异是不显著的。4.回归方程的显著性检验。回归方程显著性检验是检验整个回归方程是否具有显著性,判断y与x之间是否存在真实的线性相关,亦即对相关系数r进行检验。回归方程的显著性检验采用F检验。首先计算回归方程的F统计量,计算公式为:22第二十二页,共五十三页,2022年,8月28日然后,根据给定的显著水平α(通常α=0.01或0.05)及自由度(1,n—2)查F分布表得到临界值F。若F>Fα,则回归方程的回归效果是显著的;F<

,则回归方程的回归效果是不显著的。23第二十三页,共五十三页,2022年,8月28日需要说明的是,对于一元线性回归方程而言,t检验和F检验只要作任意一个检验即可。因为只有一个自变量,回归系数b具有显著性,则相关系数r必定具有显著性。但是,在多元回归分析中,二者之间并不是等价的。24第二十四页,共五十三页,2022年,8月28日13.2.4一元线性回归模型的应用一元线性回归模型通过各种检验评价之后,则可利用回归模型进行有关问题的分析、预测和控制。其应用有以下几个方面:1.边际分析和弹性分析。一元线性回归模型中的回归系数b就是平均边际变化率,它能说明x增加一个单位y能增加多少个单位。而要说明x增减1%,y能增减百分之几,则可用下列公式测定平均弹性系数(E)。25第二十五页,共五十三页,2022年,8月28日2.临界点或平衡点分析。当一元线性回归模型中的x、y是一种收支关系时,并且是根据横截面样本数据建立的回归模型,则可用来测定收支相等的临界点。即:y=a+bx

令x=y,则3.利用回归模型进行预测。将自变量的预测值代人回归模型可求得因变量的预测值。作为与相对应的的预测值就是点预测。亦可用利余标准差和一定的置信概率进行区间预测。26第二十六页,共五十三页,2022年,8月28日当y为正态分布,n较大,自变量x的预测值离样本均值不远时,可用构建预测区间。(概率为95%,z为1.96,概率为95.45%,z为2)。当n较小(n<30)时,并且不远离时,需用t分布构建预测区间。即。(概率为95%,t为2;概率为99%,t为3)。4.利用回归模型进行控制。所谓控制,是指预测的反问题,就是说,如果我们要求y在确定范围内取值,那么应该把自变量x控制在什么数值上或取值范围内。27第二十七页,共五十三页,2022年,8月28日13.3多元线性回归

13.3.1多元线性回归模型设y为因变量,

为自变量,并且自变量与因变量之间为线性关系时,则多元线性回归模型为:其中,

为常数项,

为回归系数,又称偏回归系数。28第二十八页,共五十三页,2022年,8月28日如果两个自变量

同一个因变量y呈线性相关时,可用二元线性回归模型描述:建立多元线性回归模型时,为了保证回归模型具有优良的解释能力和预测效果,应首先注意自变量的选择,其准则是:(1)自变量对因变量必须有显著的影响,并呈密切的线性相关;29第二十九页,共五十三页,2022年,8月28日(2)自变量与因变量之间的线性相关必须是真实的,而不是形式上的;(3)自变量之间应具有一定的互斥性,即自变量之间的相关程度不应高于自变量与因变量之间的相关程度。(4)自变量应具有完整的统计数据,其预测值容易确定。30第三十页,共五十三页,2022年,8月28日13.3.2多元线性回归模型的参数估计用最小二乘法求解参数。以二元线性回归模型为例,求解回归参数的标准方程组为:解此方程组可求得

的数值。亦可用下列矩阵法求解:31第三十一页,共五十三页,2022年,8月28日亦即:32第三十二页,共五十三页,2022年,8月28日13.3.3多元线性回归模型的检验与评价1.拟合程度的测定。多重可决系数

,它是在因变量的总变化中,由回归方程解释的变动(回归平方和)所占的比重,越大,回归方程对样本数据点拟合的程度越强,所有自变量与因变量的关系越密切。计算公式为:33第三十三页,共五十三页,2022年,8月28日其中:2.估计标准误差。即因变量y的实际值与回归方程求出的估计值之间的平均误差,估计标准误差越小,回归方程拟合程度越强。34第三十四页,共五十三页,2022年,8月28日其中k为多元线性回归方程中自变量的个数。3.回归方程的显著性检验。即检验整个回归方程的显著性,或者说评价所有自变量与因变量的线性关系是否密切。通常采用F检验,F统计量的计算公式为:35第三十五页,共五十三页,2022年,8月28日根据给定的显著水平α,自由度(k,n-k-1)查F分布表,得到相应的临界值Fα,若F>Fα,则回归方程具有显著意义,回归效果显著;F<

Fα,则回归方程无显著意义,回归效果不显著。4.回归系数的显著性检验。检验回归模型中各个回归系数是否具有显著性,以便使模型中只保留那些对因变量有显著影响的因素。检验时先计算统计量ti,然后根据给定的显著水平α,自由度n-k-1查t分布表,得临界值tα或tα/2,t>tα或tα/2,则回归系数bi与0有显著差异,反之,则与0无显著差异。统计量t的计算公式为:36第三十六页,共五十三页,2022年,8月28日其中Cij是多元线性回归方程中求解回归系数矩阵的逆短阵的主对角线上的第j个元素。对二元线性回归而言,可用下列公式计算:37第三十七页,共五十三页,2022年,8月28日其中:38第三十八页,共五十三页,2022年,8月28日5.多重共线性判别。多重共线性是指在多元线性回归方程中,自变量之间有较强的线性关系,这种关系若超过了因变量与自变量的线性关系,则回归模型的稳定性受到破坏,回归系数估计不准确。需要指出的是,在多元回归模型中,多重共线性是难以避免的,只要多重共线性不太严重就行了。判别多元线性回归方程是否存在严重的多重共线性,可分别计算每两个自变量之间的可决系数,若>或接近于

,则应设法降低多重共线性的影响。其办法主要是转换自变量的取值,如变绝对数为相对数或平均数,或者更换其他的自变量。39第三十九页,共五十三页,2022年,8月28日5.D.W检验,当回归模型是根据动态数据建立的,则误差项e也是一个时间序列,若误差序列诸项之间相互独立,则误差序列各项之间没有相关关系,若误差序列之间存在密切的相关关系,则建立的回归模型就不能表述白变量与因变量之间的真实变动关系。D.w检验就是误差序列的自相关检验。首先计算误差序列统计量d(D.w值):(0≤d≤4)40第四十页,共五十三页,2022年,8月28日然后根据给定的显著水平α,自变量个数k和样本数据个数n,查D.W分布表,得到下限值dL和上限值du,用下列原则作出判别:(1)du<d<4-du

无自相关;(2)0<d<dL

存在正自相关;(3)4-dL<d≤4

存在负相关;(4)dL≤d≤du

难以判定;(5)4-du

≤d≤4-dL

,难以判定。41第四十一页,共五十三页,2022年,8月28日13.3.4多元线性回归模型的应用1.因素分析。因素分析是多元线性回归模型的—个重要应用,利用多元线性回归模型可以进行多因素分析。一是利用回归系数揭示变量间的结构关系,并能揭示主次因素;二是利用弹性系数揭示各个自变量的变动对因变量的影响程度,利用多元线性回归模型测定弹性系数

的计算公式为:(i=1,2,……,k)42第四十二页,共五十三页,2022年,8月28日2.预测。利用多元线性回归模型进行预测,首先应确定各个自变量的预测值,然后代入回归模型中求因变量的点预测值或预测区间,其预测区间的建立与与一元线性回归模型相同。3.控制。通过给定被解释变量(因变量)的目标值来控制解释变量(自变量)的取值.

[例13.5]43第四十三页,共五十三页,2022年,8月28日13.4非线性回归13.4.1非线性回归模型

在实际问题研究中,变量之间的关系不一定都是线性关系,而是表现为某种曲线关系。1.指数曲线:

。两边取对数得:44第四十四页,共五十三页,2022年,8月28日2.对数曲线:3.双曲线:4.幂函数:

两边取对数得:45第四十五页,共五十三页,2022年,8月28日5.高次方程:可转化为多元线性回归形式:

6.柯柏——道格拉斯函数:,两边取对数得:7.S曲线:,46第四十六页,共五十三

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论