实验室分析预测方法汇总_第1页
实验室分析预测方法汇总_第2页
实验室分析预测方法汇总_第3页
实验室分析预测方法汇总_第4页
实验室分析预测方法汇总_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

实验室分析预测方法汇总目录1.1.1 常规分析方法 11.1.2 趋势外推预测方法 21.1.3 回归预测方法 71.1.4 时间序列预测方法 91.1.5 计量经济学方法 111.1.6 灰色预测方法 161.1.7 组合预测方法 18

简要介绍实验室中用到的方法的基本原理,分析方法中主要介绍贡献率、占比、拉动率,预测方法中主要介绍趋势外推预测方法、回归预测方法、时间序列预测方法、灰色预测方法、计量经济学方法以及组合预测方法。常规分析方法在实验室的预中提供了9种常规的分析方法,主要包括同比增长、环比增长、贡献率、占比、拉动率、平均增速计算等方法,下面主要介绍贡献率、占比、拉动率的计算。贡献率已知总量序列,其中每个元素对应一个包含个分量的向量,记为,总量序列的每个元素为各分量的和,则每个分量的贡献率为:(3-SEQ(3-\*ARABIC17)占比已知总量序列,其中每个元素对应一个包含个分量向量,记为,总量序列的每个元素各分量的和,则每个分量的占比为:(3-SEQ(3-\*ARABIC18)拉动率已知总量序列,其中每个元素对应一个包含个分量向量,记为,总量序列的每个元素各分量的和,则每个分量的拉动率为:(3-SEQ(3-\*ARABIC19)趋势外推预测方法各种不同的指标,由于所受影响因素的不同,不同时间的影响程度不同,因而其时间序列的变化规律不同,不同时间的时间序列也会表现出各自不同的特征,一般说,一个时间序列的影响因素,难予一一分析,但从其作用效果,可以划分为四种变动:趋势变动(或长期变动趋势,T),季节变动(S),循环变动(或周期变动,C),不规则变动(I)。任何一个时间序列总是表现为上述几种变动的不同组合的总结果Y,可用乘法模型Y=T*S*C*I或加法模型Y=T+S+C+I表示。在预测技术中,一般将不规则变动视为干扰,必须设法将其排除或过滤掉,而将趋势性变动特征反映出来,以预测时间序列的长期变化的主要趋势,必要时也应将季节性或周期性特征反映出来。时间序列的不同特征,要用不同的方法才能反映出来;或者说,究竟应采用那种方法来对时间序列的未来值进行预测比较适当,则应首先认识清楚时间序列的变动特征,根据不同的特征,选择不同的预测方法。进行趋势预测时,必须注意的一个关键性问题是可比性,包括时间方面的可比性和指标方面的可比性:时间可比性是指时间序列的各个时期,时距的时间长短必须保持一致,如长短不一、参差不齐或有缺失,应首先做必要的调整或计算(插值)处理。指标可比性是指指标的内容(即指标统计口径)、计算方法、计量单位,应该前后一致、可比。价格要用可比价(不能用现行价),才能真正反映工业发展规模水平。时间序列预测,不需要考虑指标与各影响因素的横向联系,不需要利用其他任何数据和外部情况资料,计算简单,是一种简便易行的预测方法。滑动平均设时间序列为{xt},t=1,2,…,T,定义MS(xt)=(3-SEQ(3-\*ARABIC20)为序列{xt}的跨度为S的滑动平均,简记为MS。滑动平均MS有如下性质:(1)MS对直线序列“透明”。即若{xt}满足xt=a+bt,t=S+1,S+2,…,T,则滑动平均序列仍是直线MS(xt)=MS(xt)(a+bt)=(3-SEQ(3-\*ARABIC21)(2)若输入序列{xt}是周期为S的序列,即满足xt+S=xt则跨度为S的对称滑动平均值为常数。(3)若{xt}为独立同分布序列,方差为,则平滑序列的方差为。以上三个性质表明,MS能压缩随机波动、分离周期因素、保持数据趋势。采用移动平均技术平滑数据时,跨度S的选择非常关键。S值越小,表明近期的数据越重要,平滑后的序列yt=MS(xt)对数据变化的反映速度也快,但平滑的效果较差,yt可能还是波动剧烈。反之,S值越大,平滑效果越好,yt曲线就越光滑,但对数据变化的反映速度较慢,因此,S值的选择无法兼顾,应视具体情况而定。一般情况下,如果原始序列中含有大量随机成分,或者序列的基本发展趋势变化不大,则S应取大一些,如果原始序列是有趋势性或阶跃型特点的数据,为使平滑后的序列尽量保持趋势性或阶跃型特点,S值就取小一些。设yt是序列xt的跨度为S1的滑动平均,再对yt做跨度为S2的滑动平均,就称为对原时间序列xt做跨度为S1×S2的二阶滑动平均,类似地可定义3阶、4阶等高阶对称滑动平均。滑动平均用于预测时,是令MS(xt)为xt+1的预测值,即(3-SEQ(3-\*ARABIC22)一般来说滑动平均方法只适用于具有水平趋势的时间序列,如果统计序列具有不断增大(或减小)的趋势,用滑动平均方法预测的结果往往出现明显的滞后现象,误差较大。指数平滑对时间序列x1,x2,…,xT,其指数平滑公式为yt=βxt+(1-β)yt-1(3-SEQ(3-\*ARABIC23)其中β(0,1)是平滑系数。对{yt}继续做指数平滑,就是对原时间序列{xt}的高次平滑。取y0=x1,根据上述递推公式(3-23)可以得到(3-SEQ(3-\*ARABIC24)上式表明,指数平滑方法利用了所有的历史数据,它其实是加权的滑动平均法,β为平衡系数,0<β<1。由于0<1-β<1,所以上式中的权系数随着指数的增加而递减,这就是“指数平滑”的由来。指数平滑公式中对较早的数据赋以较小的权重,对最新的数据赋以最大的权重,避免了滑动平均方法中只利用最近的有限个观测数据的缺点,体现了预测中“近大远小”的思想。H-P滤波H-P滤波是一种时间序列在状态空间中的分解方法,相当于极小化波动方差的线性滤波。进行H-P滤波分解的目的是分离统计序列的波动成分与趋势成分。对于时间序列{xt},t=1,2,…,T而言,H-P滤波是选择满足下式的趋势成分St(3-SEQ(3-\*ARABIC25)其中,λ是趋势当中各种变化程度的权重。λ的最优选取是:(3-SEQ(3-\*ARABIC26)式中,分别是时间序列当中趋势成分和周期成分的标准差。一般情况下,如果采用年度数据,选取平滑性系数λ=100;如果采用季度数据,λ=1600;如果采用月度数据,λ=14400。得到趋势成分St以后,可以进一步获得周期成分为:(3-SEQ(3-\*ARABIC27)具体做法是:构造T×T的矩阵A其中a=6λ+1,b=-4λ,d=λ+1,e=5λ+1,f=-2λ,滤波之后的序列就是增长趋势预测方法(1)指数曲线模型指数曲线模型为xt=aebt,a>0,b>0(3-SEQ(3-\*ARABIC28)上式两端同时取对数得lnxt=lna+bt(3-SEQ(3-\*ARABIC29)上式可以看作序列lnxt对时间序列t的一元线性回归,利用公式(3-30)可以容易地估计出lna和b:(3-SEQ(3-\*ARABIC30)(2)非齐次指数模型非齐次指数模型为xt=c+aebt(3-SEQ(3-\*ARABIC31)虽然上述模型只是比指数曲线模型多了一个非零常数c,但两个模型却有很大差异,非齐次指数模型无法象指数曲线模型那样通过函数变换而转化成线性模型,所以估计参数的方法也不是常规的最小二乘法,而是如下的代数求解方法。将样本序列{xt}分成个数相等的三段(不能等分时,可以抛弃前面的一、两个数据),每段有n=T/3个数据,记每段数据的和分别为S1,S2,S3,则非齐次指数模型的系数a,b,c的估计值为:(3-SEQ(3-\*ARABIC32)(3)逻辑斯谛模型逻辑斯谛模型的形式为(3-SEQ(3-\*ARABIC33)对上式两端取倒数,就可以转化成非齐次指数曲线模型,所以系数的估计可以借助非齐次指数曲线模型的方法,即先对xt取倒数,再将1/xt分成个数相等的三段,记每段数据的和分别为S1,S2,S3,则逻辑斯谛模型的系数a,b,c的估计值为:(3-SEQ(3-\*ARABIC34)(4)龚帕兹模型龚帕兹模型的形式为(3-SEQ(3-\*ARABIC35)对上式两端取对数,就可以转化成非齐次指数曲线模型,所以系数的估计可以借助非齐次指数曲线模型的方法,即先对xt取对数,再将lnxt分成个数相等的三段,记每段数据的和分别为S1,S2,S3,则龚帕兹模型的系数a,b,c的估计值为:(3-SEQ(3-\*ARABIC36)回归预测方法回归分析预测就是基于事物之间这种相互关系的一种数理统计预测方法。回归分析预测中,先要对预测对象(因变量)进行定性分析,确定影响变化的一个或多个因素(自变量),然后通过预测对象和影响因素的多组观察值建立起适当的回归预测模型,才能进行预测。回归预测包括线性回归和分析那些回归。一元线性回归预测一元线性回归预测模型的数学表达式是一元线性方程yt=a+bxt+εt(3-SEQ(3-\*ARABIC37)式中yt为预测对象,即因变量或被解释变量;xt为影响因素,即自变量或解释变量;εt为随机误差项或回归余项,它是一个白噪声过程,即εt满足Eεt=0,;a,b为待估计的回归系数。式(3-37)表示事物y主要受一个因素x的影响,而且这种影响是呈线性关系的。但是事实上,自变量与因变量的关系并不完全是一条直线,而只是近似一条直线,称为回归直线。对于预测对象y,相关因素x,假定已经收集到T对历史数据:(y1,x1),(y2,x2),(y3,x3),…,(yT,xT)如果经回归分析得到回归预测模型如式(2.1)所示,则系数a,b的估计值为(3-SEQ(3-\*ARABIC38)用式(3-38)确定的建立的一元线性回归预测模型具有最小的误差平方和,其物理意义是各样本点与回归直线的纵向距离的平方和最小。多元线性回归预测当预测对象y受到多个因素x1,x2,…,xm影响时,如果各个影响因素xj(j=1,2,…,m)与y的相关关系可以用线性模型近似地表示,这时可以建立多元线性回归模型来进行分析和预测。假定因变量y与自变量xj(j=1,2,…,m)之间的关系可表示为(3-SEQ(3-\*ARABIC39)式中T为样本总数;b0,bj(j=1,2,…,m)为模型回归系数;εt为除自变量xj(j=1,2,…,m)的影响之外,对yt产生影响的随机变量,即随机误差。该结论基于如下的假设:(1)随机误差εt的期望值为零,E(εt)=0,(t=1,2,…,T);(2)方差的期望值为一常数σ2,E()=σ2,(t=1,2,…,T);(3)各随机误差项是互不相关的,即协方差的数学期望值为零,E(εt,εt’)=0,(t≠t',t,t'=1,2,…,T)。当以上假设得到满足时,式(3-39)便称为多元线性回归预测模型,和一元线性回归预测模型一样,多元线性回归预测模型建立时也采用最小二乘法估计模型参数。非线性回归预测非线性曲线的类型有多种,经济因素之间的影响也是多样的,因此,在预测过程中首先应该根据后者的散点图样,选定一种或多种适合的曲线类型,再利用样本数据通过参数估计,构成所选的曲线预测模型。实际上,大多数非线性模型都可通过简单的相应的非线性变换转化为线性模型,然后再应用前述的线性模型建模,例如:(1)幂函数曲线回归模型y=axb(3-SEQ(3-\*ARABIC40)令y'=log(y),x'=log(x),则原模型可转化为标准的一元线性回归模型y'=a'+bx'。(2)指数曲线回归模型y=aebx(3-SEQ(3-\*ARABIC41)令y'=log(y),则原模型可转化为标准的一元线性回归模型y'=log(a)+bx。(3)对数曲线回归模型y=a+bln(x)(3-SEQ(3-\*ARABIC42)令x'=log(x),则原模型可转化为标准的一元线性回归模型y=a+bx'。(4)双曲线回归模型(3-SEQ(3-\*ARABIC43)令y'=1/y,x'=1/x,则原模型可转化为标准的一元线性回归模型y'=a+bx'。(5)S曲线回归模型(3-SEQ(3-\*ARABIC44)令y'=1/y,x'=e-x,则原模型可转化为标准的一元线性回归模型y'=a+bx'。(6)多项式自回归模型y=b0+b1x+b2x2+…+bmxm(3-SEQ(3-\*ARABIC45)令xi=xi,(i=1,2,…,m),则原模型可转化为标准的多元线性回归模型时间序列预测方法自回归模型AR(p)自回归模型AR(p)是最常用的一种时间序列线性模型,它能描述“当前”时刻的数据与此前若干数据之间的线性依赖关系。设时间序列{xt},t=1,2,…,T为平稳零均值序列(平稳的含义是,对序列中任意取两段不相交的子序列,其均值、方差是基本相同的),xt是它的前期值和随机项的线性函数xt=φ1xt-1+φ2xt-2+…+φpxt-p+εt(3-SEQ(3-\*ARABIC46)称该时间序列为p阶自回归模型,记作xt~AR(p)。系数φ1,φ2,…,φp为自回归参数,是模型的待估参数。随机项εt是白噪声序列,而且与xt-1,xt-2,…,xt-p不相关。AR(p)模型形式简单、直观,而且便于建模与预报。当样本充分大时,随着阶数p的提高,AR(p)模型还可以逼近后面将会介绍的ARMA等模型,因此,AR(p)模型应用非常广泛。滑动平均模型MA(q)若时间序列{xt}为它的当前与前期的误差项和随机项的线性函数xt=εt-θ1εt-1+θ2εt-2+…+θqεt-q(3-SEQ(3-\*ARABIC47)则称该时间序列为q阶滑动平均序列,记作xt~MA(q)。系数θ1,θ2,…,θq为滑动平均参数,是模型的待估参数。该模型的估计比较复杂,这里不在细述。自回归滑动平均模型ARMA(p,q)由式(4-31)知,AR(p)模型要求εt为白噪声,有时,残差量εt虽不是白噪声,但能由白噪声的线性组合表示,即xt-φ1xt-1-φ2xt-2-…-φpxt-p=εt-θ1εt-1+θ2εt-2+…+θqεt-q(3-SEQ(3-\*ARABIC48)上式即为ARMA(p,q)模型,记为xt~ARMA(p,q)。自回归求和滑动平均模型ARIMA(p,d,q)线性模型所描述的对象是平稳序列,而实际数据往往不能满足这个条件,例如不少序列在一定时段内常呈增长或下降趋势,不能用ARMA模型描述,但这些序列通过差分运算可产生新的平稳序列。针对这种序列可以建立自回归求和滑动平均模型ARIMA模型,这种准线性模型能够模拟含有多项式趋势的非平稳序列,但理论基础和建模手段又都基于ARMA模型。设{xt}为非平稳序列,也就是说其中任意两个子序列的均值或方差是不等的,令wt=xt=(1-B)xt=xt-xt-1(3-SEQ(3-\*ARABIC49)其中B为平移算子,即Bxt=xt-1。如果新序列{wt}为平稳序列,就称{xt}为经一次差分运算后平稳的准平稳序列,称为差分算子。有些序列可能需要经过多次差分才能成为平稳序列,一般地称为d阶差分算子(d为正整数)。如果非平稳序列{xt}经过d阶差分后产生平稳序列{wt},则称{xt}为ARMA序列的d阶求和序列,记作xt~ARIMA(p,d,q)。xt可形式地表示为,t>d(3-SEQ(3-\*ARABIC50)由此可见,ARIMA模型是ARMA模型的推广,对于{xt}建立ARIMA(p,d,q)模型,就是对xt做d阶差分后,对wt=xt建立ARMA(p,q)模型;对{xt}进行建模和预测,则是先对{wt}建模或预测后再转化为对{xt}的处理。时间序列分析方法的优点是:时间序列分析理论已经比较成熟,也有很多现成的工具软件,应用起来比较简便;主要根据过去的负荷值来推算未来的负荷,不需要天气、湿度、经济等相关资料,因此在一些相关因素的预测值和某些常数难以得到时,不失为一种可行的方法。缺点是:对数据的要求较高,用于建立ARIMA模型的数据应该是平稳的时间序列,即要求序列的任意片段的期望和方差基本上是常数,如果不满足此要求,就要先对原始数据序列做函数变换(例如对数变换)、差分等加工处理,待满足平稳性要求后,才能建立时间序列模型;不能方便地考虑天气情况等对负荷有重要影响的相关因素。虽然经济、天气等因素对电力负荷的影响很大,但是对超短期的负荷序列来说,如果认为这些因素在很短的时间内没有剧烈的变化,就可以认为这些因素的影响已经蕴涵在负荷数据里,在对负荷数据建模预测时,模型中已经包括了相关因素的影响,所以在没有同期的经济、天气等资料时,可以只对负荷进行分析,暂时不考虑相关因素的影响。计量经济学方法计量经济学是经济科学的一个分支,它是统计学、经济理论和数学的结合,理论模型的设定、样本数据的采集,则必须以对经济理论、对所研究的经济现象的透彻认识为基础;即使是设计数学方法较多的模型参数估计、模型的检验等,单靠数学知识也是难以完成的。可以将计量经济学的思想和方法应用到电力负荷预测工作中,具体就是将经济指标和用电指标作为一个相互影响的整体,建立多方程联立模型,同时预测经济和电力。协整理论与格兰杰因果分析高铁梅.计量经济分析方法与建模-EViews应用与实例.清华大学出版社,2006.一个时间序列根据序列的数字特性,比如均值、方差和协方差等与采样时间的关系分为平稳时间序列和非平稳时间序列。当序列的数字特征等是不随时间的变化而变化的,时间序列在各个时间点上的随机性服从一定概率分布,称这种时间序列为平稳序列。平稳时间序列可以通过时间序列过去时间点上的信息,建立模型拟合过去信息,进而预测未来的信息。常用的模型有自回归模型AR(p)、移动平均模型MA(q)和ARMA(p,q)。当序列的数字特征是随着时间的变化而变化,即序列在各个时间点上的随机规律是不同的,称这种时间序列为非平稳时间序列。非平稳时间序列难以通过序列已知的信息去掌握时间序列整体上的随机性,因此在运用非平稳时间序列建模时需要采取一定的方法进行处理。(1)协整理论协整理论及其方法是1987年Engle和Granger提出的一种非平稳时间序列建模的理论方法EngleR.F.,C.W.J.Granger.Co-integrationanderrorcorrection:representation,estimation,andtesting.Econimetrica,1987,55:251-276.。Engle和Granger认为虽然一些序列是非平稳的,但是两个或多个非平稳时间序列的线性组合可能是平稳的,假如这种平稳的线性组合存在,这些非平稳(有单位根)时间序列之间被认为有协整关系,这种平稳的线性组合称为协整方程。下面给出协整的定义:EngleR.F.,C.W.J.Granger.Co-integrationanderrorcorrection:representation,estimation,andtesting.Econimetrica,1987,55:251-276.维向量的分量间被称为阶协整,记为,如果满足:(1),要求每个分量;(2)存在非零列向量,使得。称是协整的,向量称为协整向量。需要说明的是:作为对非平稳变量之间关系的描述,协整向量不是唯一的;协整变量必须具有相同的单整阶数;最多可能存在个线性无关的协整向量;协整向量之间存在共同趋势成分,在数值上成比例。协整检验有两种方法:一种是基于回归残差的协整检验,如CRDW(cointegrationregressionDurbin-Watson)检验、DF检验和ADF检验;另一种是基于回归系数的完全信息协整检验,如Johansen协整检验。(2)Granger因果关系在电力与经济关系分析中,需要判断相互之间是否存在着相互影响关系,即判断一个变量的变化是否是另一个变量变化的原因,在1969年Granger提出了一个判断因果关系的检验方法——Granger因果检验(Grangercausalitytests)。在给定的一个信息集中,至少包含,如果利用的过去比不利用它时可以更好地预测,称为的Granger原因。格兰杰单向因关系是指如果是的格兰杰因,而不是的格兰杰因,则称是的单向格兰杰因。格兰杰双向因关系是指如果是的格兰杰因,而也是的格兰杰因,则称存在与间的双向格兰杰因。用模型表示为:如果、为平稳序列,可表示为:(3-SEQ(3-\*ARABIC51)为白噪声,存在以下情况:①如果,,则、相互独立;②如果,,,则是的因;③如果,,,则是的因;④如果,,,则、互为因果。协整和误差修正模型ARMA模型要求时间序列是平稳的,如果不平稳,通常采用差分方法消除序列中的非平稳趋势,使得序列平稳化后建立模型,这就是ARIMA模型,但变换后的序列没有直接的物理意义,使得化为平稳序列后所建立的时间序列模型不便于解释。1987年Engle和Granger提出的协整理论为非平稳序列的建模提供了另一种途径。虽然一些变量本身是非平稳的,但是这些变量的线性组合却有可能是平稳序列,这种平稳的线性组合被称为协整方程且可被解释为变量之间的的长期稳定的均衡关系。例如,消费和收入都是非平稳时间序列(基本上都以指数速度上升),但是具有协整关系,假如它们不具有协整关系,那么长期消费就可能比收入高或低,于是消费者便会非理性地消费或积累储蓄。k个序列x1t,x2t,…,xkt的每个序列是非平稳的,如果存在一个非零的k维向量β=(β1,β2,…,βk)使得k个序列的线性组合序列β1x1t+β2x2t+…+βkxkt是平稳的,即组合序列的期望和方差不随时间t变化,就称这k个序列是协整的,向量β又称为协整向量。需要注意的是:协整向量可能不唯一,但最多可能存在k-1个线性无关的协整向量,协整的序列之间具有共同的趋势成分,在数量上成比例。与协整相对应的,对单独的非平稳序列xt来说,如果必须经过至少d次差分之后才能平稳,就称序列{xt}是d阶单整的,称平稳序列为0阶单整序列。Engle和Granger提出的协整检验方法就是对k个序列x1t,x2t,…,xkt建立多元回归方程,并对回归方程的残差进行单位根检验。从协整理论的思想来看,自变量和因变量之间存在协整关系。也就是说,因变量能被自变量的线性组合所解释,两者之间存在稳定的均衡关系,因变量不能被自变量所解释的部分构成一个残差序列,这个残差序列应该是平稳的。因此,检验一组变量之间是否存在协整关系等价于检验回归方程的残差序列是否是一个平稳序列。下面以两个变量为例介绍误差修正模型的思想。基于协整理论,Engle和Granger用两步法建立了如下的误差修正模型(ErrorCorrectionModel,ECM):∆yt=β0+β1∆xt+αecmt-1+εt(3-SEQ(3-\*ARABIC52)其中的ecmt-1称为误差修正项,它就是协整检验时的回归残差,即先建立模型yt=k1xt+εt(3-SEQ(3-\*ARABIC53)得到估计值后,就可以得到误差修正项ecmt=yt-xt。误差修正模型(5-52)的含义是:因变量yt的变动∆yt是由较稳定的长期趋势β0+β1∆xt和短期波动ecmt-1所决定的,短期内系统对均衡状态的偏离程度的大小直接导致波动振幅的大小,从长期看,ecmt-1起到引力线的作用,将非均衡状态拉回到均衡状态。自回归分布滞后模型如果一个内生变量yt只被表示成同一时点的外生变量xt和内生变量的滞后项yt-1的函数,这就是自回归分布滞后模型(AutoregressiveDistributedLag,ADL)yt=β0+β1yt-1+β2xt+β3xt-1+εt(3-SEQ(3-\*ARABIC54)自回归分布滞后模型中每个变量的滞后项可以反映它们的长期影响。通过一定的数学变换,可以证明式(5-52)和式(3-54)是等价的,因此可以直接对一些非平稳的序列建立自回归分布滞后模型,无须分两步建立误差修正模型。向量自回归模型(VAR)向量自回归模型是AR(p)模型在多维空间的推广Xt=Φ1Xt-1+Φ2Xt-2+…+ΦpXt-p+εt(3-SEQ(3-\*ARABIC55)其中的k维向量序列Xt=(x1t,x2t,…,xkt)是k个标量序列,εt是一个k维白噪声。上述模型可以用方程组表示如下:可以发现上述方程组中k个方程是相互解耦的,每个方程都是可以单独估计的自回归分布滞后模型,所以这里不再赘述模型的估计过程。VAR模型可以较好地反映序列的变化趋势,比较适用于长期预测。向量误差修正模型(VEC)向量误差修正模型(VectorErrorCorrection,VEC)是误差修正模型(5-52)的向量形式,也可以认为VEC模型是含有协整约束的VAR模型,多应用于具有协整关系的非平稳时间序列建模。如果k个变量{x1t,x2t,…,xkt}之间存在一个协整关系,也就是说,存在非零向量β1,β2,…,βk,使得{x1t,x2t,…,xkt}的线性组合序列是平稳的。则误差修正项就是ecmt=β1x1t+β2x2t+…+βkxkt(3-SEQ(3-\*ARABIC56)把序列ecmt作为一个新的序列加入到原序列的差分序列中,对{∆x1t,∆x2t,…,∆xkt,ecmt-1}建立VAR模型,就得到原始序列的VEC模型。灰色预测方法灰色系统理论在灰色系统理论中,将各类系统分为白色、黑色和灰色系统。“白”指系统的信息完全已知,“黑”指信息完全未知,“灰”则指信息部分已知、部分未知,或者说信息不完全。对灰色信息不是从统计规律的角度应用大量样本进行研究,而是采用数据生成的方法,将杂乱无章的原始数据整理成规律性强的生成序列再作研究。在工程技术、社会、经济、农业、工业、环境、电力等各种系统中经常会遇到信息不完全的情况,如参数(或因素)信息不完全,结构信息不完全等等。对于电力负荷系统,虽然供电机组、电网容量、生产能力、某些主要产品耗电情况信息是已知的,但是,影响负荷的其他很多因素,象天气情况、行政与管理政策的变化、地区经济活动、市场经济中大用户生产计划等是难以确切知道的,因此,电力负荷系统可以看作是一个灰色系统。灰色系统理论认为任何随机过程都是在一定幅值范围、一定时间内变化的灰色量,称随机过程为灰色过程,在处理技术上,灰色过程是通过原始数据的整理来寻找数的规律的,这叫数的生成。而基于概率统计的随机过程,则是按统计规律、先验规律来处理问题,这种处理建立在大样本基础上,要求数据越多越好。事实上,即使有了大样本量也不一定能找到规律,即使有了统计规律也不一定是典型的,而非典型的过程(如非平稳、非高斯分布等)是难以处理的,而灰色过程则无此限制,事实上,将许多历史数据作累加处理后便出现了明显的指数规律。这是由于尽管客观系统表象复杂,数据零乱,但它总是有整体功能的,总是有序的,因此它必然潜藏着某种内在规律,关键在于要用适当的方式去挖掘、利用它。比如说数据数据处理后呈现出指数规律,这是由于大多数系统都是广义的能量系统,而指数规律便是能量变化的一种规律。由于生成的数据序列有了较强的规律,有可能对变化过程做长时间的描述,因此有可能建立微分方程模型。灰色预测方法灰色预测是用GM(1,1)进行的定量预测:GM(1,1)模型是最常用的一种灰色模型,它是由一个只包含单变量的一阶微分方程构成的模型,是电力负荷预测的一种有效模型。设原始数据序列为x(0)=[x(0)(1),x(0)(2),…,x(0)(T)]生成如下一阶累加生成序列x(1)=[x(1)(1),x(1)(2),…,x(1)(T)]其中x(1)(k)=。由于序列x(1)具有指数增长规律,而一阶微分方程的解恰是指数增长形式的解,因此可以认为x(1)序列满足下述一阶线性微分方程模型(3-SEQ(3-\*ARABIC57)根据导数定义,有若以离散形式表示,微分项可写成根据灰色理论,式(3-57)中的x(1)值只能取时刻k和k+1的平均值,即(x(1)(k+1)+x(1)(k))/2。因此,式(3-57)可改写成x(0)(k+1)+a(x(1)(k+1)+x(1)(k))/2=u,k=1,2,…,T-1记用最小二乘法得到A的最小二乘近似解(3-SEQ(3-\*ARABIC58)将所求得的代回原来的微分方程,有解之得(3-SEQ(3-\*ARABIC59)令x(1)(1)=x(0)(1),将上式改写成离散形式(3-SEQ(3-\*ARABIC60)式(3-59)、(3-60)称为GM(1,1)模型的时间响应函数模型,它是GM(1,1)模型灰色预测的具体计算公式,对此式再做累减还原,得原始数列x(0)的灰色预测模型为(3-SEQ(3-\*ARABIC61)灰色预测方法的特点是适应性强、应用面广,主要应用于原始数据不多的中长期预测,如果原始数据较多,最好只使用最新的少量数据建立灰色模型,在不同的时刻建立不同的灰色模型向后预测,不要用所有的原始数据只建立一个灰色模型预测,这样会减少新信息对预测结果的影响,不符合原始信息对预测结果影响的“远大近小”原则。灰色预测模型还有一个特点是,如果向后预测的步数太多,预测值的增长速度将很快稳定下来,未来都以同样的速度稳定增长。组合预测方法客观实际中的非线性系统,往往内部结构复杂、输入输出变量众多,采用单个的模型或部分的因素和指标仅能体现系统的局部,多个模型的有效组合或多个变量的科学综合能显著地提高预测精度与模拟评价效果。为了表达和书写的方便,下面从组合预测的角度来描述模型综合的方法和类型。设{xt},(t=1,2,…,T)为观测值序列,对xT+l,(l=1,2,…,L)用J个不同的预测模型得到的预测值为(j),(j=1,2,…,J),则组合模型为:(3-SEQ(3-\*ARABIC62)式中wj,(j=1,2,…,J)为第j个模型的权重,为保持综合模型的无偏性,wj应满足约束条件,下面介绍确定权重的各种方法。算术平均法wj=1/J,j=1,2,…,J(3-SEQ(3-\*ARABIC63)该法对全部模型平等对待,通常在对各模型重要性缺乏了解时常用。方差倒数法(3-SEQ(3-\*ARABIC64)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论