时间序列分析_第1页
时间序列分析_第2页
时间序列分析_第3页
时间序列分析_第4页
时间序列分析_第5页
已阅读5页,还剩124页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、时间序列分析时间序列分析内容提纲n时间序列分析基本概念n时间序列因素分解n时间序列分析方法n平稳时间序列分析n非平稳时间序列分析1 时间序列分析基本概念n定义 按照时间先后顺序把随机事件变化发展的过程记录下来就构成了一个时间序列。 对时间序列进行观察、研究,找寻它变化发展的规律,预测它将来的走势就是时间序列分析。1.1 特征统计量n均值 n方差n自协方差n自相关系数)(xxdFEXttt)()()(22xdFxXEDXttttt)(),(ssttXXEstCovstDXDXstCovst),(),(1.2 平稳时间序列定义n满足如下条件的序列称为平稳序列(1)概率分布函数不随时间的平移而变化,

2、即:(2)期望值、方差和自协方差是不依赖于时间的常数,即:),(),(mktmtkttXXCovXXCovmttDXDX)()(mttXEXE),.,(),.,(2121mtmmtXXXPXXXP1.3 平稳性的检验(图检验法) n时序图检验 n根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界、无明显趋势及周期特征n自相关图检验 n平稳序列通常具有短期相关性。该性质用自相关系数来描述就是随着延迟期数的增加,平稳序列的自相关系数会很快地衰减向零1.4 纯随机序列的定义n纯随机序列也称为白噪声序列,它满足如下两条性质 Tsts

3、tststCovTtEXt, 0,),()2(, )() 1 (2(常数)常数标准正态白噪声序列时序图 白噪声序列的性质 n纯随机性 n各序列值之间没有任何相关关系,即为 “没有记忆”的序列 n方差齐性 n根据马尔可夫定理,只有方差齐性假定成立时,用最小二乘法得到的未知参数估计值才是准确的、有效的00kCov(k), )0(2 CovDXt2 时间序列因素分解n2.1时间序列的组合成份 长期趋势(T) 是指时间序列随时间的变化而逐渐增加或减少的长期变化的趋势。季节变动(S) 是指时间序列在一年中或固定时间内,呈现出的固定规则的变动。 循环变动(C) 是指沿着趋势线如钟摆般地循环变动,又称景气循

4、环变动(business cycle movement) 。不规则变动(I) 是指在时间序列中由于随机因素影响所引起的变动。 2.1 时间序列的组合成份2.2 时间序列的组合模型加法模型 假定时间序列是基于4种成份相加而成的。长期趋势并不影响季节变动。若以Y表示时间序列,则加法模型为Y=T+S+C+I乘法模型 假定时间序列是基于4种成份相乘而成的。假定季节变动与循环变动为长期趋势的函数。该模型的方程式为ICSTYn趋势分析目的n有些时间序列具有非常显著的趋势,我们分析的目的就是要找到序列中的这种趋势,并利用这种趋势对序列的发展作出合理的预测 n常用方法n趋势拟合法n平滑法3 时间序列分析方法3

5、.1 趋势拟合法n趋势拟合法就是把时间作为自变量,相应的序列观察值作为因变量,建立序列值随时间变化的回归模型的方法 n趋势拟合法常用的模型n线性趋势模型n可线性化的曲线趋势拟模型n不可线性化的曲线趋势拟模型(1) 线性趋势模型n适用条件n长期趋势呈现出线形特征n模型结构 就是消除随机波动的影响之后该序列的长期趋势。)(, 0)(ttttIVarIEIbtaxbtaTt例3.1拟合澳大利亚政府19811990年每季度的消费支出序列 (2) 可线性化的曲线趋势拟合模型n可线性化的曲线趋势模型是指时间序列随着时间的推移呈现曲线变动趋势,但在估计这些趋势方程时,可以把它们转化成线性关系利用估计线性趋势

6、模型的方法估计其参数。最常用的可线性化的曲线趋势模型有n二次曲线模型n指数曲线模型n对数曲线模型2tbtaTtttabT bIntaTt二次曲线模型n二次曲线趋势模型:n二次曲线趋势模型的线性形式:其中:2tbtaTt2tbtaTt2tbtaTt22tt 例3.2: 对上海证券交易所每月末上证指数序列进行模型拟合 指数曲线模型n指数曲线趋势模型:n指数曲线趋势模型的线性形式:其中ttabT tbaTtInbbInaaInTTtt,对数曲线模型n对数曲线趋势模型:n对数曲线趋势模型的线性形式:其中bIntaTtt baTtIntt (3) 不可线性化的曲线趋势模型常用的不可线性化的曲线趋势模型有

7、:n修正指数模型n龚铂兹趋势模型n皮尔曲线模型ttbcaTtbcateTttbcaT1趋势模型判断的方法 以上列出了一些基本的长期趋势型接下来的问题是我们在实际应用中如何根据实际观测值选择合适的趋势模型。特别当时间序列呈现出曲线趋势时很难做出决断因为曲线趋势模型的种类很多。下面就介绍两种判断模型类型的方法:图形识别法与差分法(1)图形识别法n 图形识别法是通过时间序列的散点图或趋势图来判断趋势。散点图或趋势图是以时间t为横轴,以时间序列中的实际观测值为纵轴的图形根据此图形观测其变化曲线与各类函数曲线模型的图形进行比较,以便选择较为合适的趋势模型。n 这种方法非常简单、直观。但由干许多曲线模型的

8、图形较相似此时通过这种直观的图形识别法就不容易判断、当然,我们可以选几种曲线模型,然后通过计算每一仲的精度指标来确定。(2)差分法n根据序列的差分结果来选择模型:1. 一阶差分相等或大致相等,选择线性模型2. 二阶差分相等或大致相等,选择二次曲线模型3. 一阶差比率相等或大致相等,选择指数曲线模型4. 一阶差分的一阶差比率相等或者大致相等,选择修正指数曲线模型5. 对数一阶差分的一阶比率相等或者大致相等,选择龚铂兹曲线模型趋势拟合步骤n第一步 确定趋势拟合模型的类型.n第二步 参数估计.n第三步 模型检验与参数检验.n第四步 模型优化.n第五步 利用模型预测第二步 参数估计n线性模型利用最小二

9、乘估计n可线性化模型首先转换为线性模型再利用最小二乘估计.n不可线性化模型利用三和值法或非线性最小二乘法第三步 模型检验n利用方差分析表n检验包括:模型的显著性检验(F检验),偏回归系数的显著性检验(t检验)第四步 模型优化n优化准则:选择估计精度最高的,(使SSE 和 MAPE达到最小的)nSSR是回归平方和nSSE是误差平方和nMAPE是平均绝对百分误差例3.3 线性趋势模型n某商场需要预测2001年512月2002年112月的29寸彩电的销售量。所选预测方法为趋势预测法。n具体步骤如下:(一)确定趋势模型的类型 1.图形识别2计算一阶差分n结合此时间序列的趋势图可以选用线性趋势模型作为预

10、测模型:n用最小二乘法估计参数 btaTt得到线性趋势方程:)月记为年111999(9718. 45015.126tTt例3.4 可线性化趋势模型 某电器生产厂家希望预测20002003年的生产量现手头上有该电器生产厂家 1991 1999年的年生产量的数据,如下表(一)确定预测模型1.画电器生产厂家历年生产量的趋势图详见下图 根据曲线图形的形状,可以初步确定为二次曲线趋势和修正指数曲线趋势模型两种、但到底取哪一种,通过图形无法作出准确的判断,此时需进一步计算其差分来确定其曲线趋势线的函数表达形式。2. 计算差分,差分结果见下表n 综合趋势图及数据的差分特点,选用二次曲线趋势模型作为预测模型比

11、较好。即设预测模型的数学表达式为:(二)利用最小二乘法得到参数的估计值以及预测模型:2ctbtaTt269048. 047143.1004762. 0ttTt例3.5 不可线性化的趋势模型n某公司某产品 19812001年的销售量资料见下表,请根据历史数据建立合适的模型,并对20022005年该公司该产品的销售量进行预侧。 (一)确定摸型n画该公司某产品的销售量的趋势图,趋势图见下图n 从图形上可以看出,该公司某产品的销售量大致呈一条“S”型曲线变动。有三个模型适合刻画这条曲线,它们是修正指数曲线模型、龚琅兹曲线模型及皮尔曲线模型。到底用哪一个曲线模型进行预测,最好把三个模型都估计出来,然后选

12、择估计精度最高的模型。 (二)参数估计 (1)利用三和值法估计得到初值 (2)利用非线性最小二乘估计法,通过迭代得到估计值(三)模型优化3.2 季节效应分析n例3.6 北京某一著名烤鸭店位于商业区,销售额一直不错。为了能把这种势头保持下去,在每一个年末都必须确定下一年的经营目标,为此,该店经理希望能提前预测下一年每月的销售额。该烤鸭店 19992002年的销售额(单位;百万元)见下表 . 从时序图可以明显地看出时序特点为:无趋势但呈明显的季节性变动。 例3.7 请根据熊猫公司在1992 2001年的季度利润额预测该公司在 2002年14季度的利润额.数据如下 以上时间序列的共同特点是:存在季节

13、性变动。n季节性变动是指由于自然条件、社会条件的影响,客观现象在一年内随着季节的变动而产生的周期性变动。n这种变动是年复一年重复出现的(如水果的出口额、冰淇淋的销售量等)。n当然要观察某一现象的时间序列是否存在季节性变动,首先必需具有记录此现象变动的以月度或以季度为单位的时序数据。 n 如何对具有季节性变动的现象作出预测,经常采用如下几种模型: (1)无趋势的季节性乘法预测模型; (2)无趋势的季节性加法预测模型; (3)带趋势的季节性加法预测模型; (4)带趋势的季节性乘法预测模型;4 平稳时间序列分析n方法性工具 nARMA模型 n平稳序列建模n序列预测 4.1 方法性工具n差分运算n延迟

14、算子n线性差分方程差分运算n一阶差分n 阶差分 n 步差分pk1tttxxx111tptptpxxxkttkxx延迟算子n延迟算子类似于一个时间指针,当前序列值乘以一个延迟算子,就相当于把当前序列值的时间向过去拨了一个时刻 n记B为延迟算子,有 1,pxBxtppt延迟算子的性质n n n n n ,其中 10B为任意常数cxcxBcxcBttt,)()(111)(ttttyxyxBnttnxxBiniinnnBCB0) 1()1 ()!( !ininCin模型nAR模型(Auto Regression Model) nMA模型(Moving Average Model) nARMA模型(Au

15、to Regression Moving Average model)AR模型的定义n具有如下结构的模型称为 阶自回归模型,简记为n特别当 时,称为中心化 模型tsExtsEDExxxxtsstttptptpttt, 0, 0)(,)(0)(0222110,p)(pAR00)(pARMA模型的定义n具有如下结构的模型称为 阶自回归模型,简记为n特别当 时,称为中心化 模型q)(qMA0)(qMAtsEDExstttqqtqtttt, 0)(,)(, 0)(022211ARMA模型的定义n具有如下结构的模型称为自回归移动平均模型,简记为n特别当 时,称为中心化 模型),(qpARMAtsExts

16、EDExxxtsstttqpqtqttptptt, 0, 0)(,)(0)(00211110,00),(qpARMAARMA模型相关性特征模型自相关系数偏自相关系数AR(P)拖尾P阶截尾MA(q)q阶截尾拖尾ARMA(p,q)拖尾拖尾平稳序列建模步骤n计算样本相关系数,观察特点n模型识别n参数估计n模型检验n模型优化n序列预测建模步骤平平稳稳非非白白噪噪声声序序列列计计算算样样本本相相关关系系数数模型模型识别识别参数参数估计估计模型模型检验检验模模型型优优化化序序列列预预测测YN计算样本相关系数n样本自相关系数n样本偏自相关系数nttkntkttkxxxxxx121)()(DDkkk模型识别n

17、基本原则选择模型拖尾P阶截尾AR(P)q阶截尾拖尾MA(q)拖尾拖尾ARMA(p,q)kkk模型定阶的困难n因为由于样本的随机性,样本的相关系数不会呈现出理论截尾的完美情况,本应截尾的 或 仍会呈现出小值振荡的情况n由于平稳时间序列通常都具有短期相关性,随着延迟阶数 , 与 都会衰减至零值附近作小值波动n当 或 在延迟若干阶之后衰减为小值波动时,什么情况下该看作为相关系数截尾,什么情况下该看作为相关系数在延迟若干阶之后正常衰减到零值附近作拖尾波动呢? kkkkkkkkkk模型定阶经验方法n95的置信区间n模型定阶的经验方法n如果样本(偏)自相关系数在最初的d阶明显大于两倍标准差范围,而后几乎9

18、5的自相关系数都落在2倍标准差的范围以内,而且通常由非零自相关系数衰减为小值波动的过程非常突然。这时,通常视为(偏)自相关系数截尾。截尾阶数为d。22Pr0.9522Pr0.95kkknnnn拟合模型识别n自相关图显示延迟3阶之后,自相关系数全部衰减到2倍标准差范围内波动,这表明序列明显地短期相关。但序列由显著非零的相关系数衰减为小值波动的过程相当连续,相当缓慢,该自相关系数可视为不截尾 n偏自相关图显示除了延迟1阶的偏自相关系数显著大于2倍标准差之外,其它的偏自相关系数都在2倍标准差范围内作小值随机波动,而且由非零相关系数衰减为小值波动的过程非常突然,所以该偏自相关系数可视为一阶截尾 n所以

19、可以考虑拟合模型为AR(1)例4.1美国科罗拉多州某一加油站连续57天的OVERSHORT序列 序列自相关图序列偏自相关图拟合模型识别n自相关图显示除了延迟1阶的自相关系数在2倍标准差范围之外,其它阶数的自相关系数都在2倍标准差范围内波动。根据这个特点可以判断该序列具有短期相关性,进一步确定序列平稳。同时,可以认为该序列自相关系数1阶截尾n偏自相关系数显示出典型非截尾的性质。n综合该序列自相关系数和偏自相关系数的性质,为拟合模型定阶为MA(1) 例4.2n1880-1985全球气表平均温度改变值差分序列 序列自相关图序列偏自相关图拟合模型识别n自相关系数显示出不截尾的性质n偏自相关系数也显示出

20、不截尾的性质n综合该序列自相关系数和偏自相关系数的性质,可以尝试使用ARMA(1,1)模型拟合该序列参数估计n待估参数n 个未知参数n常用估计方法n矩估计n极大似然估计n最小二乘估计2pq211, ,pq 例4.1续n确定美国科罗拉多州某一加油站连续57天的OVERSHORTS序列拟合模型的口径 n拟合模型:MA(1)n估计方法:条件最小二乘估计n模型口径ttBx)82303. 01 (40351. 4929.2178)(2D例4.2续n确定1880-1985全球气表平均温度改变值差分序列拟合模型的口径 n拟合模型:ARMA(1,1)n估计方法:条件最小二乘估计n模型口径119 . 0407.

21、 0003. 0ttttxx016. 0)(2D模型检验n模型的显著性检验n整个模型对信息的提取是否充分n参数的显著性检验n模型结构是否最简模型的显著性检验n目的n检验模型的有效性(对信息的提取是否充分)n检验对象n残差序列n判定原则n一个好的拟合模型应该能够提取观察值序列中几乎所有的样本相关信息,即残差序列应该为白噪声序列 n反之,如果残差序列为非白噪声序列,那就意味着残差序列中还残留着相关信息未被提取,这就说明拟合模型不够有效假设条件n原假设:残差序列为白噪声序列n备择假设:残差序列为非白噪声序列0120,1mHm:mkmHk,:至少存在某个1, 01检验统计量nLB统计量221(2)()

22、 ( )mkkLBn nmnk参数显著性检验n目的n检验每一个未知参数是否显著非零。删除不显著参数使模型结构最精简 n假设条件n检验统计量mjHHjj10:0:10)()(mntQamnTjjjj例4.1续:对OVERSHORTS序列的拟合模型进行检验 n残差白噪声检验n参数显著性检验检验参数t统计量P值结论均值2.750.0004显著10.600.0001显著延迟阶数LB统计量P值结论62.150.6772模型显著有效129.050.61711例4.2续:对1880-1985全球气表平均温度改变值差分序列拟合模型进行检验 n残差白噪声检验n参数显著性检验检验参数t统计量P值结论16.340.

23、0001显著2.50.0007显著延迟阶数LB统计量P值结论65.280.2595模型显著有效1210.300.424711模型优化n问题提出n当一个拟合模型通过了检验,说明在一定的置信水平下,该模型能有效地拟合观察值序列的波动,但这种有效模型并不是唯一的。n优化的目的n选择相对最优模型 例4.3:拟合某一化学序列序列自相关图序列偏自相关图拟合模型一n根据自相关系数2阶截尾,拟合MA(2)模型n参数估计n模型检验n模型显著有效 n三参数均显著 ttBByield)31009. 032286. 01 (17301.512拟合模型二n根据偏自相关系数1阶截尾,拟合MA(1)模型n参数估计n模型检验

24、n模型显著有效 n两参数均显著 Byieldtt42481. 0126169.51问题n同一个序列可以构造两个拟合模型,两个模型都显著有效,那么到底该选择哪个模型用于统计推断呢? n解决办法n确定适当的比较准则,构造适当的统计量,确定相对最优AIC准则n最小信息量准则(An Information Criterion) n指导思想n似然函数值越大越好 n未知参数的个数越少越好 nAIC统计量)(2)ln(2未知参数个数nAICSBC准则nAIC准则的缺陷n在样本容量趋于无穷大时,由AIC准则选择的模型不收敛于真实模型,它通常比真实模型所含的未知参数个数要多 nSBC统计量)(ln()ln(2未

25、知参数nnSBC例4.3续n用AIC准则和SBC准则评判例3.3中两个拟合模型的相对优劣 n结果nAR(1)优于MA(2)模型AICSBCMA(2)536.4556542.2011AR(1)535.7896540.2866序列预测n线性预测函数n预测方差最小原则10titiixC x minleDleDtt5 非平稳时间序列分析n差分运算nARIMA模型nAuto-Regressive模型差分运算的实质n差分方法是一种非常简便、有效的确定性信息提取方法nCramer分解定理在理论上保证了适当阶数的差分一定可以充分提取确定性信息n差分运算的实质是使用自回归的方式提取确定性信息 diitiditd

26、tdxCxBx0) 1()1 (差分方式的选择n序列蕴含着显著的线性趋势,一阶差分就可以实现趋势平稳 n序列蕴含着曲线趋势,通常低阶(二阶或三阶)差分就可以提取出曲线趋势的影响 n对于蕴含着固定周期的序列进行步长为周期长度的差分运算,通常可以较好地提取周期信息 例5.1 【例1.1】1964年1999年中国纱年产量序列蕴含着一个近似线性的递增趋势。对该序列进行一阶差分运算 考察差分运算对该序列线性趋势信息的提取作用 1tttxxx差分前后时序图n原序列时序图n差分后序列时序图例5.2n尝试提取1950年1999年北京市民用车辆拥有量序列的确定性信息差分后序列时序图n一阶差分n二阶差分例5.3n

27、差分运算提取1962年1月1975年12月平均每头奶牛的月产奶量序列中的确定性信息 差分后序列时序图n一阶差分n1阶12步差分过差分 n足够多次的差分运算可以充分地提取原序列中的非平稳确定性信息n但过度的差分会造成有用信息的浪费 例5.4n假设序列如下 n考察一阶差分后序列和二阶差分序列 的平稳性与方差 ttatx10比较n一阶差分n平稳n方差小n二阶差分(过差分)n平稳n方差大111tttttaaxxx21122ttttttaaaxxx212)()(tttaaVarxVar22126)2()(ttttaaaVarxVarARIMA模型结构n使用场合n差分平稳序列拟合n模型结构tsExtsEVarEBxBtsstttttd, 0, 0)(,)(0)()()(2,ARIMA 模型族nd=0ARIMA(p,d,q)=AR

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论