




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
构建时间序列模型1预处理时间序列目录了解常用的时间序列模型2分析平稳时间序列3分析非平稳时间序列4时间序列是按照时间排序的一组随机变量,它通常是在相等间隔的时间段内依照给定的采样率对某种潜在过程进行观测的结果。时间序列数据本质上反映的是某个或某些随机变量随时间不断变化的趋势,而时间序列预测方法的核心就是从数据中挖掘出这种规律,并利用其对将来的数据进行估计。时间序列法是一种定量预测方法,亦称简单外延方法,其作为一种常用的预测手段被广泛应用。时间序列分析(TimeSeriesAnalysis)在第二次世界大战前应用于经济预测,在第二次世界大战中和第二次世界大战后,在军事科学、空间科学、气象预报和工业自动化等领域的应用更加广泛。时间序列分析是一种动态数据处理的统计方法。该方法研究随机数据序列所遵从的统计规律,以用于解决实际问题。了解常用的时间序列模型常用的时间序列模型如下表所示。了解常用的时间序列模型模型名称描述组合模型AR模型。以前
p期的序列值
为自变量、随机变量
的取值
为因变量建立线性回归模型MA模型。随机变量
的取值
与以前各期的序列值无关,
建立
与前
q期的随机扰动
的线性回归模型续表。了解常用的时间序列模型模型名称描述ARMA模型。随机变量
的取值
不仅与前p期的序列值有关,还与前q期的随机扰动有关ARIMA模型许多非平稳序列差分后会显示出平稳序列的性质,称这个非平稳序列为差分平稳序列。对差分平稳序列可以使用ARIMA模型进行拟合ARCH模型ARCH模型能准确地模拟时间序列变量的波动性的变化,适用于序列具有异方差性并且异方差函数短期自相关GARCH模型及其衍生模型GARCH模型称为广义ARCH模型,是ARCH模型的拓展。相比ARCH模型,GARCH模型及其衍生模型更能反映实际序列中的长期记忆性、信息的非对称性等性质ARMA模型随机变量
的取值
不仅与前
期的序列值有关,还与前
期的随机扰动有关1预处理时间序列目录了解常用的时间序列模型2分析平稳时间序列3分析非平稳时间序列4针对一个观察值序列,首先要对它的白噪声和平稳性进行检验,这两个重要的检验称为序列的预处理。根据检验结果可以将序列分为不同的类型,对不同类型的序列需采用不同的分析方法。白噪声序列又称纯随机序列,序列的各项之间没有任何相关关系,序列在进行完全无序的随机波动,可以终止对该序列的分析。白噪声序列是没有信息可提取的平稳序列。对于平稳非白噪声序列,它的均值和方差是常数,现已有一套非常成熟的平稳序列的建模方法。通常是建立一个线性模型来拟合该序列的变化,借此提取该序列的有用信息。ARMA模型是常用的平稳序列拟合模型。对于非平稳序列,由于它的均值和方差不稳定,处理方法一般是将其转变为平稳序列,这样即可应用有关平稳时间序列的分析方法,如建立ARMA模型来进行相应的研究。如果一个时间序列经差分运算后具有平稳性,称该序列为差分平稳序列,可以使用ARIMA模型进行分析。预处理时间序列如果时间序列在某一常数附近波动且波动范围有限,即有常数均值和常数方差,并且延迟k期的序列变量的自协方差和自相关系数是相等的,或者说延迟k期的序列变量之间的影响程度是一样的,则称为平稳时间序列。平稳性的基本思想是:决定过程特性的统计规律不随时间的变化而变化。平稳性检验1.平稳时间序列的定义对序列的平稳性有两种检验方法:一种是根据时序图和自相关图的特征进行判断的图检验,该方法操作简单、应用广泛,缺点是带有主观性;另一种是构造检验统计量进行检验,目前常用的方法是单位根检验。①时序图检验根据平稳时间序列的均值和方差都为常数的性质,平稳序列的时序图显示该序列的值始终在一个常数附近随机波动,而且波动的范围有界。如果时序图有明显的趋势性或者周期性,那么序列通常不是平稳序列。预处理时间序列2.平稳性的检验②自相关图检验平稳序列具有短期相关性,这个性质表明,对平稳序列而言,通常只有近期的序列值对现时值的影响比较明显,间隔越远的过去值对现时值的影响越小。随着延迟期数k的增加,平稳序列的自相关系数(延迟k期)会比较快地衰减,最后趋近于0,并在0附近随机波动,而非平稳序列的自相关系数衰减的速度比较慢,这就是利用自相关图进行平稳性检验的标准。③单位根检验单位根检验是指检验序列中是否存在单位根,存在单位根就是非平稳时间序列。预处理时间序列
纯随机性检验1预处理时间序列目录了解常用的时间序列模型2分析平稳时间序列3分析非平稳时间序列4对满足平稳性条件的AR(p)模型的方程,两边取期望,得下式。已知,,所以有,解得下式。
基本概念1.均值平稳AR(p)模型的方差有界,等于常数。基本概念2.方差平稳AR(p)模型的自相关系数呈指数级衰减,始终有非零取值,不会在k大于某个常数之后就恒等于0,这就表明平稳AR(p)模型的自相关系数具有拖尾性。基本概念3.自相关系数(AutocorrelationFunction,ACF)对于一个平稳AR(p)模型,求出延迟k期自相关系数时,实际上得到的并不是与之间单纯的相关关系。因为同时会受到中间k-1个随机变量的影响,所以自相关系数里实际上掺杂了其他变量对与的相关影响。为了单纯地测度对的影响,引入偏自相关系数的概念。基本概念4.偏自相关系数(PartialCorrelationFunction,PACF)截尾是指时间序列的自相关系数或偏自相关系数在某阶段后均为0的性质;拖尾是指自相关系数或偏自相关系数并不在某阶段后均为0的性质。基本概念5.截尾与拖尾具有下式所示结构的模型称为阶自回归模型,简记为AR(p)。即在t时刻的随机变量的取值是前p期的多元线性回归,误差项是当期的随机干扰,为零均值白噪声序列。该模型认为主要是受过去p期的序列值的影响。平稳AR(p)模型的性质如下表所示。AR模型统计量性质统计量性质均值常数自相关系数拖尾方差常数偏自相关系数阶截尾具有下式所示结构的模型称为q阶移动平均模型,简记为MA(q)。即在t时刻的随机变量的取值是前q期的随机扰动的多元线性函数,误差项是当期的随机干扰,为零均值白噪声序列,是序列的均值。该模型认为主要是受过去q期的误差项的影响。平稳MA(q)模型的性质如下表所示。MA模型统计量性质统计量性质均值常数自相关系数阶截尾方差常数偏自相关系数拖尾具有下式所示结构的模型称为自回归移动平均模型,简记为ARMA(p,q)。即在t时刻的随机变量的取值是前p期和前q期的多元线性函数,误差项是当期的随机干扰,为零均值白噪声序列。该模型认为主要是受过去期的序列值和过去期的误差项的共同影响。特别地,当时,是AR(p)模型;当时,是MA(q)模型。ARMA模型平稳ARMA(p,q)模型的性质如下表所示。ARMA模型统计量性质统计量性质均值常数自相关系数拖尾方差常数偏自相关系数拖尾某个时间序列经过预处理,被判定为平稳非白噪声序列后,就可以利用ARMA模型进行建模。计算出平稳非白噪声序列的自相关系数和偏自相关系数,再由AR(p)、MA(q)和ARMA(p,q)模型的自相关系数和偏自相关系数的性质,选择合适的模型。平稳时间序列建模步骤如右图所示。平稳时间序列建模平稳时间序列建模步骤(1)计算自相关系数和偏自相关系数。先计算平稳非白噪声序列的自相关系数和偏自相关系数。(2)ARMA模型识别,也称为模型定阶,由AR(p)、MA(q)和ARMA(p,q)模型的自相关系数和偏自相关系数的性质,选择合适的模型。识别的原则如下表所示。平稳时间序列建模模型自相关系数偏自相关系数AR(p)拖尾p阶截尾MA(q)q阶截尾拖尾ARMA(p,q)p阶拖尾q阶拖尾(3)估计模型中未知参数的值。(4)模型检验。对模型的效果进行评估检验。(5)模型优化。优化模型的参数。(6)模型应用。进行短期预测。平稳时间序列建模1预处理时间序列目录了解常用的时间序列模型2分析平稳时间序列3分析非平稳时间序列4实际上,在自然界中绝大部分的时间序列都是非平稳的。因而对非平稳时间序列的分析更普遍、更重要,据此创造出来的分析方法也更多。对非平稳时间序列的分析方法可以分为确定性因素分解方法和随机时序分析方法两大类。确定性因素分解方法将所有序列的变化都归结为4个因素(长期趋势、季节变动、循环变动和随机波动)的综合影响,其中长期趋势和季节变动的规律性信息通常比较容易提取,而由随机因素导致的波动则非常难以确定和分析,随机信息浪费严重,会导致模型拟合精度不够理想。随机时序分析方法的发展就是为了弥补确定性因素分解方法的不足。根据时间序列的不同特点,随机时序分析方法可以建立的模型有ARIMA模型、残差自回归模型、季节模型、异方差模型等。本小节重点介绍使用ARIMA模型对非平稳时间序列进行建模。分析非平稳时间序列差分运算具有强大的确定性信息提取能力,许多非平稳序列差分后会显示出平稳序列的性质,这时称这个非平稳序列为差分平稳序列。常用的差分运算分为p阶差分运算和k步差分运算两种。阶差分运算。相距p期的两个序列值之间的减法运算称为p阶差分运算。步差分运算。相距期的两个序列值之间的减法运算称为步差分运算。差分运算对差分平稳时间序列可以使用ARIMA模型进行拟合。ARIMA模型的实质就是差分运算与ARMA模型的组合,掌握了ARMA模型的建模方法和步骤以后,对序列建立ARIMA模型是比较简单的。差分平稳时间序列建模步骤如下图所示。ARIMA模型随着交通网络的发展,对于某公交车站点每天某时间段的上车人次的预测可以看作基于时间序列的短期数据预测,预测对象为具体的每天某时间段上车人次。参考差分平稳时间序列建模步骤,对58天内的上车人次数据构建ARIMA模型。公交车站点每天上车人次的部分数据如下表所示。ARIMA模型日期人次日期人次2018/1/13252018/1/63522018/1/23282018/1/73622018/1/33352018/1/83412018/1/43232018/1/93302018/1/53472018/1/10363通过时间序列的时序图和自相关图可以查看时间序列平稳性。使用statsmodels库中的tsa模块的plot_acf函数可以绘制自相关图,其基本使用格式如下。statsmodels.tsa.stattools.plot_acf(x,ax=None,lags=None,*,alpha=0.05,use_vlines=True,unbiased=False,fft=False,missing='none',title='Autocorrelation',zero=True,vlines_kwargs=None,**kwargs)ARIMA模型1.查看时间序列平稳性plot_acf函数常用的参数及其说明如下表所示。ARIMA模型参数名称参数说明x接收array_like。表示时间序列。无默认值lags接收int、array_like。表示滞后值。默认为Nonealpha接收float。表示给定级别的置信区间。默认为0.05unbiased接收bool。表示是否用FFT计算自相关系数。默认为Falsefft接收bool。表示通过FFT计算自相关系数。默认为Falsemissing接收str。表示如何处理缺失值。默认为nonetitle接收str。表示标题。默认为Autocorrelationzero接收bool。表示是否包括0滞后自相关。默认为True原始序列的时序图如下图所示。从图可以看出,时序图显示该序列具有波动递增的趋势,可以判断其是非平稳序列;ARIMA模型原始序列的自相关图如下图所示。从图可以看出,自相关图显示自相关系数(纵坐标)有明显递减趋势,说明序列间具有很强的长期相关性。ARIMA模型单位根检验是指检验序列中是否存在单位根,若存在单位根就表明序列是非平稳时间序列。单位根检验可以检验时间序列的平稳性。使用statsmodels库中的tsa模块的adfuller函数可以对原始序列进行单位根检验,查看序列的平稳性,其基本使用格式如下。statsmodels.tsa.stattools.adfuller(x,maxlag=None,regression='c',autolag='AIC',store=False,regresults=False)ARIMA模型2.单位根检验adfuller函数常用的参数及其说明如下表所示ARIMA模型参数名称参数说明x接收array_like。表示要检验的时间序列。无默认值maxlag接收int。表示最大滞后数目。默认为Noneregression接收str。表示回归中的包含项(c——只有常数项;ct——常数项和趋势项;ctt——常数项和线性二次项;nc——没有常数项和趋势项)。默认为cautolag接收str。表示自动选择滞后数目(AIC——赤池信息准则;BIC——贝叶斯信息准则;t-stat——基于maxlag,从maxlag开始并删除一个滞后直到最后一个滞后长度基于t-statistic显著性小于5%为止;None——使用maxlag指定的滞后)。默认为AICstore接收bool。表示是否将结果实例另外返回到ADF统计信息。默认为Falseregresults接收bool。表示是否将完整的回归结果返回。默认为False对原始序列进行单位根检验,原始序列的单位根检验结果如下表所示。单位根检验统计量对应的p值显著大于0.05,可以将该序列判断为非平稳序列(非平稳序列一定不是白噪声序列)。ARIMA模型ADFcValuep值1%5%10%-0.59-3.574-2.923-2.6000.872使用pandas库中的DataFrame模块的diff()方法可以实现对原始序列进行差分运算,其基本使用格式如下。pandas.DataFrame.diff(periods=1,axis=0)diff()方法常用的参数及其说明如下表所示。ARIMA模型3.对原始序列进行一阶差分参数名称参数说明periods接收int。表示差分周期。默认为1axis接收int、str。表示对行还是列差分。默认为0对原始序列进行一阶差分,并绘制时序图和自相关图。一阶差分之后序列的时序图如下图所示。由图可知,原始序列一阶差分后的趋势呈现一定的波动性,序列属于平稳序列;ARIMA模型一阶差分之后序列的自相关图如下图所示,可查看一阶差分时间序列的平稳性和自相关性。由图可知,自相关系数递减的趋势逐渐趋向于平稳,所以差分后的序列属于平稳序列。ARIMA模型使用statsmodels库中的stats模块的acorr_ljungbox函数可以检测一阶差分后的序列是否为白噪声序列,其基本使用格式如下。statsmodels.stats.diagnostic.acorr_ljungbox(x,lags=None,boxpierce=False,model_df=0,period=None,return_df=None)ARIMA模型4.一阶差分后序列的单位根检验(平稳性)和白噪声检验acorr_ljungbox函数常用的参数及其说明如下表所示ARIMA模型参数名称参数说明x接收array_like。表示时间序列。无默认值lags接收int。表示滞后数目。默认为Noneboxpierce接收bool。表示是否返回Box-Pierce测试结果。默认为Falsemodel_df接收int。表示模型消耗的自由度数。默认为0period接收int。表示季节性时间序列的周期。默认为None对一阶差分后的序列进行单位根检验和白噪声检验。一阶差分之后序列的单位根检验结果如下表所示。单位根检验的结果显示,一阶差分之后的序列的时序图在均值附近比较平稳地波动,自相关图有很强的短期相关性,单位根检验p值小于0.05,所以一阶差分之后的序列是平稳序列。ARIMA模型ADFcValuep值1%5%10%-4.7544-3.57-2.922.600.00006白噪声检验结果如下表所示。白噪声检验的结果显示,p值远小于0.05,所以一阶差分之后的序列是平稳非白噪声序列。ARIMA模型statp值11.350.0007读取训练后ARIMA模型的bic属性值进行模型定阶。模型定阶的过程就是确定p和q。当p和q均小于等于3时,计算ARMA(p,q)中所有组合的BIC(BayesianInformationCriterion,贝叶斯信息准则)信息量,取其中BIC信息量最小的模型阶数。当p值为0、q值为1时,最小BIC值为483.519876。p、q定阶完成。ARIMA模型5.对ARIMA模型定阶①使用statsmodels库中的tsa模块的ARIMA类可以设置时间序列模型的参数,创建ARIMA时间序列模型,其基本使用格式如下。classstatsmodels.tsa.arima_model.ARIMA(endog,order,exog=None,dates=None,freq=N
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 智慧物流技术与实务 教案全套 潘艳君 项目1-6 智慧物流概述-智慧物流的综合应用
- 2025年环保产业园区产业集聚与协同发展中的环保产业绿色技术创新报告
- 2025年工业互联网平台数据清洗算法在智能教育领域的应用对比报告
- 金融与投资行业洞察报告:2025年金融科技在金融衍生品交易中的应用与创新
- 美妆行业个性化定制服务模式在美妆行业市场拓展中的应用报告
- 2025年工业互联网平台RFID技术在智能工厂生产安全风险控制中的应用报告
- 做微商的心得体会经典十四篇
- 无人机传感器技术 8.1.陀螺仪在航空领域及无人机飞控中的应用
- 无人看守设备管理制度
- ktv安全风险管理制度
- 手术通知单模板
- 油气藏类型、典型的相图特征和识别实例
- 《议程设置理论》
- 取力器的设计设计说明书
- 康复医院的设计要点精选
- 10kv高压架空电线防护方案概述
- 铸造厂各岗位职责标准xls
- 整车试验大纲
- 空调维保方案及报价(共3页)
- 电缆厂物料编码规则(共8页)
- (完整)中考英语首字母填词高频词汇
评论
0/150
提交评论