版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
时间序列分析
从统计学的内容来看,统计所研究和处理的是一批有“实际背景”的数据,尽管数据的背景和类型各不相同,但从数据的形成来看,无非是横剖面数据和纵剖面数据两类(或者叫做静态数据和动态数据)。横剖面数据是由若干相关现象在某一时点上所处的状态组成的,它反映一定时间、地点等客观条件下诸相关现象之间存在的内在数值联系。研究这种数据结构的统计方法是多元统计分析。纵剖面数据是由某一现象或若干现象在不同时刻上的状态所形成的数据,它反映的是现象以及现象之间关系的发展变化规律性。研究这种数据的统计方法就是时间序列分析。时间序列分析是用随机过程理论和数理统计学的方法,研究随机数据序列所遵从的统计规律,以用于解决实际问题。
由于在大多数的问题中,随机数据都是依照时间先后顺序排列的,故称为时间序列。它包括一般统计分析,统计模型的建立与推断,以及关于随机序列的最优预测、控制和滤波等。
时间序列分析在第二次世界大战前就已应用于经济预测。二次大战中和战后,在军事科学、空间科学、气象预报和工业自动化等部门的应用更加广泛。近年来多维时间序列分析的研究有所进展。第一节
时间序列分析的一般问题一、时间序列的含义从统计意义上讲,所谓时间序列就是将某一个指标在不同时间上的不同数值,按照时间的先后顺序排列而成的数列。这种数列由于受到各种偶然因素的影响,往往表现出某种随机性,彼此之间存在着统计上的依赖关系。一、时间序列的含义例1、国际航线旅客客票数.图1给出某国际航空公司1949—1960年间客票月总数(单位:千张)的时间序列曲线.直观上看,每年有一次大的峰值和一次小的降值.并且逐年不断增加。一、时间序列的含义例2,图2是我国铁路客流员的统计曲线,记录了1971—1981年客票月总数.从铁路客流量的时间序列曲线上可见,每年都有一次较大的峰值,大约是在1、2月份,也就是每年的春节前后有一次最大的峰值.时间序列分析的任务就是根据以往的数据找出变化规律,预报将来的客流量。
一、时间序列的含义如表1中列出的是某地电风扇1994年到1996年间各月的销售量(单位:万台),按时间顺序排成一个数列,就是一个时间序列。相对于时间的数据图如图1所示。电风扇月销售售量数据图按时间次序排排列的随机变变量序列X1,X2,…,Xi,…,XN(1.1)称为时间序列列。如果用x1,x2,…,xi,…,xN(1.2)分别表示随机机变量X1,X2,…,Xi,…,XN的观察值,则则称(1.2)是时间序序列(1.1)的N个观观测样本,这这里N为观测测样本的个数数。从系统意义上上看,时间序序列就是某一一系统在不同同时间(地点点、条件等)的响应。这这个定义从系系统运行的观观点出发,不不仅指出时间间序列是按一一定顺序排列列而成的;这这里的“一定定顺序”既可可以是时间顺顺序,也可以以是具有各种种不同意义的的物理量,如如代表长度、、温度,速度度或其它单调调递增地取值值的物理量。。可见,时间间序列只强调调顺序的重要要性,而并非非强调必须以以时间顺序排排列。例如:材料裂裂纹长度与其其承受的压力力有关,将材材料裂纹长度度按其所受压压力周期数排排列,也是一一个时间序列列(见表2),其散点图图见图2。材料裂纹长度度与其承受的的压力时间序列是所所研究系统的的历史行为的的客观记录,,因而它包含含了系统结构构特征及其运运行规律。时间序列分析析是根据观察察数据的特点点为数据建立立尽可能合理理的统计模型型,然后利用用模型的统计计特性去研究究和认识系统统的结构特征征(如周期波波动的周期、、振幅、趋势势的种类等);揭示其运运行规律,进进而用以预测测、控制其未未来行为;修修正和重新设设计系统(如如改变其周期期、参数),,使之按照新新的结构运行行。时间序列的一一个目的是用用变量过去的的观测值来预预测同一变量量的未来值。。综上所述,时时间序列具有有如下特点::序列中的数据据或数据点的的位置依赖于于时间,即数数据的取值依依赖于时间的的变化,但不不一定是时间间t的严格函函数。每一时刻上的的取值或数据据点的位置具具有一定的随随机性,不可可能完全准确确地用历史值值预测。前后时刻(不不一定是相邻邻时刻)的数数值或数据点点的位置有一一定的相关性性,这种相关关性就是系统统的动态规律律性。从整体上看,,时间序列往往往呈现某种种趋势性或出出现周期性变变化的现象。下面看一个时时间序列的数数据例子。我我们希望能够够从这个数据据找出一些规规律,并且建建立可以对未未来的销售额额进行预测的的时间序列模模型。例1.某企业从1990年1月到2002年12月月的销售数据据(单位:百百万元)。该该数据有按照照时间顺序的的按月记录,,共156个个观测值。数数据如下。二、时间序列列的分解图1某企业从1990年1月月到2002年12月的的销售数据图图(单位:百百万元)图1就是由该该数据得到的的一个时间序序列图。从这这个点图可以以看出。总的的趋势是增长长的,但增长长并不是单调调上升的;有有涨有落。大大体上看,这这种升降不是是杂乱无章的的,和季节或或月份的周期期有关系。当当然,除了增增长的趋势和和季节影响之之外,还有些些无规律的随随机因素的作作用。这个只有一种种随着时间变变化的变量((销售额)的的序列一般称称为纯粹时间序列列(puretimeseries)。时间序列的组组成部分从例1可以看看出,该时间间序列可以有有三部分组成成:趋势(trend)、季节(seasonal)成分和无法用用趋势和季节节模式解释的的随机干扰(disturbance)。例1数据的销销售额就可以以用这三个成成分叠加而成成的模型来描描述。一般的的时间序列还还可能有循环或波动(Cyclic,orfluctuations)成分;循环模模式和有规律律的季节模式式不同,周期期长短不一定定固定。比如如经济危机周周期,金融危危机周期等等等。一个时间序列列可能有趋势势、季节、循循环这三个成成分中的某些些或全部再加加上随机成分分。因此,如果要要想对一个时时间序列本身身进行较深入入的研究,把把序列的这些些成分分解出出来、或者把把它们过滤掉掉则会有很大大的帮助。如果要进行预预测,则最好好把模型中的的与这些成分分有关的参数数估计出来。。对例1的时间间序列通过软软件进行分解解,则可以轻轻而易举地得得到该序列的的趋势、季节节和误差成分分。下面的图2表表示了去掉季季节成分,只只有趋势和误误差成分的序序列的一条曲曲线。图3用用两条曲线分分别描绘了纯纯趋势成分和和纯季节成分分。图4用两两条曲线分别别描绘了纯趋趋势成分和纯纯误差成分。。这些图直观观地描述了对对于带有几种种成分的时间间序列的分解解。图2去掉季节成分分,只有趋势势和误差成分分的例1的时时间序列图3例1的时间序序列分解出来来的纯趋势成成分和纯季节节成分两条曲曲线。图4例1的时间序序列分解出来来的纯趋势成成分和纯误差差成分两条曲线三、时间序列列的主要分类类1.按所研究的对对象的多少分分,有一元时间序列列和多元时间序列列。前面例子中,,我们所研究究的只是某种种商品销售量量这一数列,,即为一元时时间序列;但但是,如果我我们所研究的的对象不仅仅仅是这一数列列,而是多个个变量,如是是按年、月顺顺序排列的气气温、气压、、雨量数据,,每个时刻t对应着多个个变量,则这这种序列为多多元时间序列列。多元时间间序列不仅描描述了各个变变量的变化规规律,而且还还揭示了各变变量间相互依依存关系的动动态规律性。。2.按时间的连续续性可将时间间序列分为离散时间序列列和连续时间序列列两种。如果某一序列列中的每一个个序列值所对对应的时间参参数为间断点点,则该序列列就是一个离离散时间序列列;如果某一序列列中的每个序序列值所对应应的时间参数数为连续函数数,则该序列列就是一个连连续时间序列列。我们主要研究究离散时间序序列,并用Xt表示,对于连连续时间序列列,可通过等等间隔采样使使之转化为离离散时间序列列后加以研究究。3.按序列的的统计特性分分有平稳时间序列列和非平稳时时间序列两类类。如果一个时间间序列的概率率分布与时间间t无关,则则称该序列为为严格的(狭狭义的)平稳稳时间序列。。如果序列的的一、二阶矩矩存在,而且且对任意时刻刻t满足:(1)均值为为常数(2)协方差差为时间间隔隔τ的函数则称该序列为为宽平稳时间间序列,也叫叫广义平稳时时间序列,如如图3所示。注意:我们以后所研研究的时间序序列主要是宽宽平稳时间序序列。如果不不明确提出严严平稳,所谓谓的平稳即指指宽平稳。反反之,不具有有平稳性即序序列均值或协协方差与时间间有关的序列列称之为非平平稳序列,如如图1、图2所示。图3列车车运行数量平平稳化后数据据图4.按序列的的分布规律来来分,有高斯型(Gaussian)时间间序列和非高斯型(non—Gaussian)时间序序列。服从高斯分布布(正态分布布)的时间序序列叫做高斯斯型时间序列列,否则叫做做非高斯型时时间序列。本本书所介绍的的模型多数是是假设服从高高斯分布的高高斯型时序模模型。对于一一些非高斯序序列,往往通通过适当变换换,则可近似似地看成是高高斯型时间序序列。四、随机过程程、时间序列列为什么在研究究时间序列之之前先要介绍绍随机过程??因为时间序序列是由相应应随机过程产产生的。我们们从随机过程程的理论来理理解和认识时时间序列的一一般规律。对对时间序列的的认识才会更更深刻。自然界中事物物变化的过程程可以分成两两类。一类是是确定型过程程,一类是非非确定型过程程。确定型过程即即可以用关于于时间t的函数描述的的过程。例如如,真空中的的自由落体运运动过程,电电容器通过电电阻的放电过过程,行星的的运动过程等等。非确定型过程程即不能用一一个(或几个个)关于时间间t的确定性函数数描述的过程程。换句话说说,对同一事事物的变化过过程独立、重重复地进行多多次观测而得得到的结果是是不相同的。。例如,对河流流水位的测量量。其中每一一时刻的水位位值都是一个个随机变量。。如果以一年年的水位纪录录作为实验结结果,便得到到一个水位关关于时间的函函数xt。这个水位函函数是预先不不可确知的。。只有通过测测量才能得到到。而在每年年中同一时刻刻的水位纪录录是不相同的的。随机过程:由由随机变量组组成的一个有有序序列称为为随机过程,,记为{x(s,t),sS,tT}。其中S表示样本空间间,T表示序数集。。对于每一个个t,tT,x(·,t)是样本空空间S中的一个随机机变量。对于于每一个s,sS,x(s,·)是是随机过程在在序数集T中的一次实现现。随机过程简记记为{xt}或xt。随机过程也也常简称为过过程。随机过程一般般分为两类。。一类是离散散型的,一类类是连续型的的。如果一个个随机过程{xt}对任意的tT都是一个连续续型随机变量量,则称此随随机过程为连连续型随机过过程。如果一一个随机过程程{xt}对任意的tT都是一个离散散型随机变量量,则称此随随机过程为离离散型随机过过程。本课程程只考虑离散散型随机过程程。严(强)平稳稳过程:一个个随机过程中中若随机变量量的任意子集集的联合分布布函数与时间间无关,即无无论对T的任何时间子子集(t1,t2,…,tn)以及任何实实数k,(ti+k)T,i=1,2,…,n都有F(x(t1),x(t2),…,x(tn))=F(x(t1+k),x(t2+k),…,x(tn+k))成立,其中F(·)表示示n个随机变量的的联合分布函函数,则称其其为严平稳过过程或强平稳稳过程。严平稳意味着着随机过程所所有存在的矩矩都不随时间间的变化而变变化。严平稳稳的条件是非非常严格的,,而且对于一一个随机过程程,上述联合合分布函数不不便于分析和和使用。因此此希望给出不不象强平稳那那样严格的条条件。若放松松条件,则可可以只要求分分布的主要参参数相同。如如只要求从一一阶到某阶的的矩函数相同同。这就引出出了宽平稳概概念。如果一个随机机过程m阶矩以下的矩矩的取值全部部与时间无关关,则称该过过程为m阶平稳过程。。比如E[x(ti)]=E[x(ti+k)]=<,Var[x(ti)]=Var[x(ti+k)]=2<,Cov[x(ti),x(tj)]=Cov[x(ti+k),x(tj+k)]=ij2<,其中,2和ij2为常数,不随随t,(tT);k,((tr+k)T,r=i,j)变化而变变化,则称该该随机过程{xt}为二阶平平稳过程(协协方差平稳过过程)。该过过程属于宽平平稳过程。如果严平稳过过程的二阶矩矩为有限常数数值,则其一一定是宽平稳稳过程。反之之,一个宽平平稳过程不一一定是严平稳稳过程。但对对于正态随机机过程而言,,严平稳与宽宽平稳是一致致的。这是因因为正态随机机过程的联合合分布函数完完全由均值、、方差和协方方差所惟一确确定。我们简简称二阶平稳稳过程为平稳稳过程。时间序列:随随机过程的一一次实现称为为时间序列,,也用{xt}或xt表示。与随机过程相相对应,时间间序列分类如如下,时间序列中的的元素称为观观测值。{xt}既表示随机机过程,也表表示时间序列列。xt既表示随机过过程的元素随随即变量,也也表示时间序序列的元素观观测值。在不不致引起混淆淆的情况下,,为方便,xt也直接表示随随机过程和时时间序列。随机过程与时时间序列的关关系如下所示示:某河流一年的的水位值,{x1,x2,…,xT-1,xT,},可以看看作一个随机机过程。每一一年的水位纪纪录则是一个个时间序列,,{x11,x21,…,xT-11,xT1}。而在每年年中同一时刻刻(如t=2时)的的水位纪录是是不相同的。。{x21,x22,…,x2n,}构成了了x2取值的样本本空间。例如,要记录录某市日电力力消耗量,则则每日的电力力消耗量就是是一个随机变变量,于是得得到一个日电电力消耗量关关于天数t的函数。而这这些以年为单单位的函数族族构成了一个个随机过程{xt},t=1,2,…365。因为为时间以天为为单位,是离离散的,所以以这个随机过过程是离散型型随机过程。。而一年的日日电力消耗量量的实际观测测值序列就是是一个时间序序列。自然科学领域域中的许多时时间序列常常常是平稳的。。如工业生产产中对液面、、压力、温度度的控制过程程,某地的气气温变化过程程,某地100年的水文文资料,单位位时间内路口口通过的车辆辆数过程等。。但经济领域域中多数宏观观经济时间序序列却都是非非平稳的。如如一个国家的的年GDP序序列,年投资资序列,年进进出口序列等等。为便于计算,,先给出差分分定义。差分:时间序序列变量的本本期值与其滞滞后值相减的的运算叫差分分。差分分为为一阶差分和和高阶差分。。首先给出差分分符号。对于于时间序列xt,一阶差分可可表示为下面介绍两种种基本的随机机过程白噪声(whitenoise))过程白噪声过程::对于随机过过程{xt,tT},如果E(xt)=0,Var(xt)=2,tT;Cov(xt,xt+k)=0,(t+k)T,k0,则称称{xt}为白噪声过过程。白噪声是平稳稳的随机过程程,因其均值值为零,方差差不变,随机机变量之间非非相关。显然然上述白噪声声是二阶宽平平稳随机过程程。如果{xt}同时还服服从正态分布布,则它就是是一个强平稳稳的随机过程程。白噪声源于物物理学与电学学,原指音频频和电信号在在一定频带中中的一种强度度不变的干扰扰声。2.随机游游走(randomwalk)过过程对于下面的表表达式xt=xt-1+ut(2.3)如果ut为白噪声过程程,则称xt为随机游走过过程。“随机游走””一词首次出出现于1905年自然((Nature)杂志第第72卷PearsonK.和RayleighL.的一篇通信信中。该信件件的题目是““随机游走问问题”。文中中讨论寻找一一个被放在野野地中央的醉醉汉的最佳策策略是从投放放点开始搜索索。人们为了根据据时间序列揭揭示所研究现现象的动态规规律性,产生生了一系列分分析研究时间间序列的方法法。最朴素的动态态思想认为现现象的未来行行为与现在的的行为有关,,于是,人们们便用现象的的现在值作为为其下一时刻刻的预测值。。这种方法对对于平稳发展展变化的现象象来说,是可可行的。一、时间序列列数据的采集集对于所研究系系统来说,相相应于时间的的连续性,系系统在不同时时刻上的响应应常常是时间间t的连续函函数。为了数数字计算处理理上的方便,,往往只按照照一定的时间间间隔对所研研究系统的响响应进行记录录和观察,我我们称之为采采样。相应地地把记录和观观察的时间间间隔称为采样样间隔,并用用Δ表示。例如,对某市市场某种水果果的价格每隔隔一天进行一一次记录,则则采样间隔为为一天(Δ==1天或24小时),每每个观察值也也称为采样值值,第k个采采样值为Xk,也就是连续续函数X(t)的值X(t0十kΔ)。如如图4所示。。注意:在对时间序列列X(t)的的采样过程中中,取不同的的采样间隔ΔΔ可以得到不不同的数字时时间序列Xt,t=1,2……。采样样间隔既可以以相等,也可可以不等。我我们这里只讨讨论等间隔采采样,因此,,在本书中将将“采样间隔隔相等”作为为建立时间序序列的一条重重要原则。采样间隔处理理?如前所述,时时间序列包含含了系统的全全部信息,因因而人们可以以藉以研究系系统的动态结结构和运行规规律。但是,,采样得到的的离散时间序序列Xt失去了X(t)在t0+(i-1)Δ和t0+iΔ之间的的值,即这个个区间内系统统的信息在采采样之后丢失失了。显然,,在合理的范范围内,采样样间隔Δ越小小,采样值就就越多,信息息损失就越小小,数据处理理量越大,处处理时间、人人力、财力消消耗越大。相相反,采样间间隔越大,采采样值越少,,处理时间、、人力、财力力消耗越小,,但信息损失失越大。因此此,选择合适适的采样间隔隔是建立时间间序列的关键键,理想的采采样间隔就是是既没有损失失信息,也没没有出现信息息冗余。在实实际中,研究究者只能根据据所研究系统统的具体特性性和经验,在在不过分减少少信息损失和和不过分增加加数据量之间间作出合理选选择。二、离群点的的检验与处理理离群点(Outlier)是指一个个时间序列中中,远离序列列一般水平的的极端大值和和极端小值。。因此,也称称之为奇异值值,有时也称称其为野值。。如图5所描描述的是1949年到1997年间间,我国的人人口自然增长长率(Xt)。从图形中中可以直观地地看出,1960年的人人口自然增长长率大大低于于其它年份的的自然增长率率。从序列来来看,X12(即1960年的观察值值)远离了序序列Xt,我们称X12为离群点。概括地说,是是由于系统受受外部干扰而而造成的。但但是,形成离离群点的系统统外部干扰是是多种多样的的。首先可能是采采样中的误差差,如记录仪仪出现偏误、、工作人员出出现笔误、计计算差错等,,都有可能产产生极端大值值或极端小值值。其次可能是被被研究现象本本身由于受各各种偶然非正正常的因素影影响而引起的的,例如,在在人口死亡序序列中,由于于某年发生了了地震,使得得该年的死亡亡人数急剧增增加,形成了了离群点;在在股票价格序序列中,由于于受某项政策策出台或某种种谣传的刺激激,都会出现现极增、极减减现象,表现现为序列中的的离群点。不论是何种原原因引起的离离群点,对以以后的时间序序列分析都会会造成一定的的影响。从造造成分析中的的困难来看,,统计分析人人员是不希望望序列中出现现离群点的,,离群点会直直接影响模型型的拟合精度度,甚至会得得到一些虚假假的信息。例例如,两个相相距很近的离离群点将在谱谱分析中产生生许多虚假的的频率。因此,离群点点往往被分析析人员看作是是一个“坏值值”。但是,,从获得信息息来看,离群群点提供了很很重要的信息息,它不仅提提示我们认真真检查采样中中是否有差错错,在进行时时间序列分析析前,认真确确认序列,而而且,当确认认离群点是由由于系统受外外部突发因素素刺激而引起起的时候,它它会提供关于于系统稳定性性、灵敏性等等重要信息。。在时间序列分分析中,将离离群点分为四四种类型进行行处理。第一种是加性性离群点(AdditiveOutlier),造成成这种离群点点的干扰,只只影响该干扰扰发生的那一一个时刻T上上的序列值,,即XT,而不影响该该时刻以后的的序列值,XT+1,XT+2,…;第二种是更新新离群点(InnovationalOutlier),造成离群群点的干扰不不仅作用于XT,而且影响T时刻以后序序列的所有观观察值XT+1,XT+2,…,它的出出现意味着一一个外部干扰扰作用于系统统的开始,并并且其作用方方式与系统的的动态模型有有关;第三种是水平平移位离群点点(LevelShiftOutlier),造成这种种离群点的干干扰是在某一一时刻T,系系统的结构发发生了变化,,并持续影响响T时刻以后后的所有行为为,在数列上上往往表现出出T时刻前后后的序列均值值发生水平位位移;第四种是暂时时变更离群点点(TemporaryChangeOutlier),造成这种种离群点的干干扰是在T时时刻干扰发生生时具有一定定初始效应,,以后随时间间根据衰减因因子δ的大小小呈指数衰减减的一类干扰扰事件。检验离群点并并对其进行处处理的方法显然,在得到到时间序列以以后,首先要要检验是否存存在离群点,,如果存在的的话,还需要要进一步判明明在何时出现现了离群点,,以及所出现现的离群点属属于何种类型型。检验离群群点并对其进进行处理的方方法很多,但但归纳起来大大致有两类::一是根据数据据取值进行检检查,如果某某一时刻的数数值超出了一一定的范围,,则认为该点点是一个离群群点,并用一一定的方法进进行剔点(剔剔除离群点)处理;另一类是对数数据进行模型型分析,然后后根据拟合模模型后的剩余余序列计算特特定的统计量量,测出显著著的离群点及及其类型,并并用相应的模模型进行修正正,然后再对对修正模型的的剩余序列重重复上述程序序,依次测出出各个离群点点。关于后一一类分析方法法通常也称为为干预分析法法,有兴趣的的读者可参阅阅有关参考书书目,下面仅仅就前一类方方法作一些简简单介绍。三、缺损值的的补足在采集时间序序列时,有时时会由于仪器器故障,操作作失误,观测测问题等种种种原因,引起起在某些观测测点上未能记记录下来观测测值,这种缺缺少的观测值值称为缺损值值(MissingValue).这种缺损损值在使用次次级资料时也也会出现。当当序列中存在在缺损值时,,就破坏了系系统运行的连连续性,违背背了时间序列列“顺序的重重要性”原则则。严格格地地说说,,我我们们不不能能依依据据一一个个““残残缺缺””的的序序列列进进行行分分析析,,即即使使强强制制性性地地进进行行了了分分析析,,其其结结果果也也是是无无意意义义的的,,可可是是,,由由于于时时间间的的不不可可逆逆性性,,我我们们又又无无法法重重新新观观测测,,因因此此,,我我们们所所能能做做的的就就是是依依据据其其运运动动轨轨迹迹或或变变化化趋趋势势,,运运用用一一定定的的方方法法对对缺缺损损值值进进行行估估计计、、推推测测,,以以补补足足缺缺损损的的数数值值。具体体估估算算、、推推测测方方法法很很多多,,如如增增长长量量推推算算法法、、发发展展速速度度推推算算法法、、比比例例推推算算法法、、平平滑滑法法、、插插值值估估算算法法等等等等,,分分析析人人员员可可根根据据具具体体序序列列选选择择运运用用。。此外外,,在在对对一一序序列列进进行行分分析析之之前前,,还还要要对对序序列列中中的的每每一一个个数数据据的的指指标标口口径径、、计计算算范范围围、、计计算算方方法法、、计计量量单单位位等等进进行行认认真真检检查查,,对对经经济济时时间间序序列列来来说说,,还还必必须须检检查查计计算算价价格格等等方方面面是是否否一一致致。。若若存存在在不不一一致致,,则则要要运运用用科科学学的的方方法法进进行行调调整整,,使使整整个个序序列列中中的的每每一一个个数数据据除除时时间间属属性性不不同同之之外外,,其其所所代代表表的的实实际际意意义义完完全全一一致致。。注意:时间序列列分析不不是做数数学游戏戏,也不不是做数数学练习习,因此此,不能能盲目地地对一个个序列建建立模型型进行分分析。在在建模分分析之前前,对所所研究的的时间序序列进行行认真检检查和科科学地预预处理,,也就是是建立一一个规范范的时间间序列是是十分重重要的,,是做好好时间序序列分析析的基础础。分析析研究人人员千万万不可忽忽视。下面我们们以前述述我国人人口自然然增长率率为例,,简要说说明建立立时间序序列的一一般过程程。就人人口增长长率来说说,它是是报告期期人口的的自然增增减数与与报告期期内平均均人口数数之比。。显然,,相应于于时间的的连续性性,它是是时间‘‘的连续续函数,,但是我我们没有有必要对对每时每每刻的人人口变动动都进行行了解和和掌握。。从一般般管理的的需要和和人口变变动往往往含有周周期性这这一特点点考虑,,该序列列用自然然年度(即1月月至12月)为为采样间间隔,也也叫年度度序列。。既然是是自然年年度序列列,那么么序列中中不仅不不允许出出现其它它间隔(如半年年、五年年等)的的序列值值,而且且年间隔隔也必须须是自然然年度,,而不能能是其它它年度。。时间间隔隔确定之之后,指指标的计计算范围围在同一一序列中中也必须须保持一一致。该该序列习习惯叫““我国人人口数””,实际际上是以以境内为为核算范范围的,,而不是是以领土土内为核核算范围围的。也也就是说说,只是是大陆人人口数,,而不包包括港、、澳、台台地区的的人口数数。因此此,虽然然1997年香香港已经经回归祖祖国,但但是为了了保持序序列值计计算范围围的一致致性,在在计算1997年的人人口自然然增长率率时,不不能包含含香港特特别行政政区的人人口情况况。注意:一一致性就指标的的计算方方法来说说,计算算平均人人口数的的方法很很多,用用各种方方法计算算的结果果也不完完全一致致,在同同一序列列中,各各年的平平均人口口数必须须采用相相同的计计算方法法,本序序列是用用(年初人人口数+年末人人口数)/2来计算的的。至于指标标口径,,也必须须一致。。如出生生人数是是指活产产婴儿数数,即离离开母体体有生命命现象的的活婴数数总和。。凡出生生后有呼呼吸、心心跳、脐脐带蠕动动、随意意肌抽动动等现象象之一者者,皆称称为活产产。出生生后有上上述一种种生命现现象但随随后死亡亡者,也也列入出出生人数数之中,,同时也也计入死死亡人数数之中。。这样,使使序列中中的每个个数据除除时间属属性不同同之外,,其所代代表的实实际意义义完全一一致。根据图5可以看看出,1960年的人人口自然然增长率率极端异异常,从从数值上上看为––4.57‰‰,下面面我们用用第一种种方法来来检测该该序列是是否存在在离群点点。我们对原原序列作作一次指指数平滑滑。设平平滑常数数为“αα=0.3,并并取k=6,根根据(1.2.1)式式,,,,的的数据如如图6所所示。,,第三节确确定定性时序序分析方方法概述述时间序列列预测技技术就是是通过对对预测目目标自身身时间序序列的处处理,来来研究其其变化趋趋势的。。当我们们刚接触触到某一一个观测测序列时时,会觉觉得它是是杂乱无无章,无无规律可可循的。。其实不不然,大大量事实实表明,,一个时时间序列列往往是是以下几几类变化化形式的的叠加或或耦合::(1)长长期趋势势变动。。它是指指时间序序列朝着着一定的的方向持持续上升升或下降降,或停停留在某某一水平平上的倾倾向,它它反映了了客观事事物的主主要变化化趋势。。(2)季季节变动动。即指指一年或或更短的的时间之之内,由由于受某某种固定定周期性性因素(如自然然、生产产、消费费等季节节性因素素)的影影响而呈呈现出有有规律的的周期性性波动。。(3)循循环变动动。通常常是指周周期为一一年以上上,由非非季节因因素引起起的涨落落起伏波波形相似似的波动动。(4)不不规则变变动。通通常它分分为突然然变动和和随机变变动。所所谓突然然变动是是指战争争、自然然灾害或或是其它它社会因因素等意意外事件件引起的的变动。。随机变变动是指指由于大大量的随随机因素素产生的的宏观影影响。根根据中心心极限定定理,通通常认为为随机变变动近似似服从正正态分布布。通常用Tt表示长期期趋势项项,St表示季节节变动趋趋势项,,Ct表示循环环变动趋趋势项,,Rt表示随机机干扰项项。常见见的确定定性时间间序列模模型有以以下几种种类型::其中yt是观测目目标的观观测记录录,如果在预预测时间间范围以以内,无无突然变变动且随随机变动动的方差差较较小,并并且有理理由认为为过去和和现在的的历史演演变趋势势将继续续发展到到未来时时,可用用一些经经验方法法进行预预测,具具体方法法如下::1、移动动平均法法它表明最最近N期期序列值值的平均均值作为为未来各各期的预预测结果果。一般般N取值值范围::5N200。。当历史史序列的的基本趋趋势变化化不大且且序列中中随机变变动成分分较多时时,N的的取值应应较大一一些。否否则N的的取值应应小一些些。在有确定定的季节节变动周周期的资资料中,,移动平平均的项项数应取取周期长长度。选选择最佳佳N值的的一个有有效方法法是,比比较若干干模型的的预测误误差。均均方预测测误差最最小者为为好。当预测目目标的基基本趋势势与某一一线性模模型相吻吻合时,,常用二二次移动动平均法法,但序序列同时时存在线线性趋势势与周期期波动时时,可用用趋势移移动平均均法建立立预测模模型:2、指数数平滑法法3、时间间回归法法4、季节节周期预预测法由于气候候条件、、社会风风俗习惯惯等原因因,许多多预测对对象表现现出明显显的季节节周期波波动。如如蔬菜销销量、服服装、电电风扇的的销售量量,某城城市用电电量,用用水量等等都呈现现出一定定的季节节性波动动。有的的以年度度为周期期,有的的以季度度、月、、日为周周期,总总之这些些序列容容易观察察到它的的周期性性,当周周期性不不甚明显显时,可可用序列列的自相相关函数数来帮助助识别。。季节周期期预测与与上述各各种方法法类似,,首先建建立预测测模型,,常用的的模型有有两种::(i)乘法法型季节节模型(ii)加法型型季节模模型(i)乘乘法型季季节模型型(ii)加法型型季节模模型从总体上上来说,,确定性性时序分分析方法法刻画了了序列的的主要趋趋势,且且直观、、简单,,易于计计算,便便于运用用。但是是,相对对说来,,刻画较较为粗略略,其假假定,尤尤其是对对于时间间函数模模型来说说,比较较严格,,现实问问题很难难完全满满足。9、静夜四无邻邻,荒居旧业业贫。。12月-2212月-22Saturday,December24,202210、雨中黄叶树树,灯下白头头人。。07:27:4507:27:4507:2712/24/20227:27:45AM11、以我独沈久久,愧君相见见频。。12月-2207:27:4507:27Dec-2224-Dec-2212、故人人江海海别,,几度度隔山山川。。。07:27:4507:27:4507:27Saturday,December24,202213、乍见见翻疑疑梦,,相悲悲各问问年。。。12月月-2212月月-2207:27:4507:27:45December24,202214、他乡生生白发,,旧国见见青山。。。24十十二月20227:27:45上午午07:27:4512月-2215、比不了了得就不不比,得得不到的的就不要要。。。十二月227:27上午午12月-2207:27December24,202216、行动出出成果,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 基于二零二四年度的物联网平台搭建合同
- 房屋出租标准合同范本
- 两人合作开店协议书范本
- 宣传推广合同
- 2024年度高档小区停车场车位指标分配合同
- 二零二四年项目总工合同范本
- 新媒体代运营合同模本模板
- 外墙涂料施工合同书模板
- 外墙翻新合同范本
- 2024电梯检验检测行业趋势分析报告
- (整理)通信电源设备安装设计规范.
- 关于农业补贴的调查问卷
- 旅游管理专业三年建设规划
- 湘少版三年级上册单词带音标
- 有机化学中英文命名ppt课件
- 研究发展部-电工、电子类产品硬件开发工程师(年度考核)表
- 公司合同管理工作调研报告.doc
- 匹兹堡睡眠质量指数(psqi)表格
- 公司会议签到表
- (医学课件)上腔静脉综合征
- 俄语视听说基础教程1
评论
0/150
提交评论