模块10 时间序列挖掘《Python数据挖掘实战》教学课件_第1页
模块10 时间序列挖掘《Python数据挖掘实战》教学课件_第2页
模块10 时间序列挖掘《Python数据挖掘实战》教学课件_第3页
模块10 时间序列挖掘《Python数据挖掘实战》教学课件_第4页
模块10 时间序列挖掘《Python数据挖掘实战》教学课件_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《Python数据挖掘实战》✩精品课件合集《Python数据挖掘实战》

第十章时间序列挖掘二、

时间序列预处理

一、时间序列挖掘概述主要内容三、平稳非白噪声时间序列建模四、非平稳时间序列建模

五、基于Python的ARIMA模型实现一、时间序列挖掘概述

时间序列是按照发生时间顺序进行排序的一组随机变量。宏观上来说,是在不同时刻观测结果的集合,即按照时间发生顺序把随机事件或变量的发展过程、趋势记录下来就构成了一条时间序列。

时序数据挖掘的目的是通过对历史时间序列数据进行观测、分析或研究以寻找其变化发展规律,并用于预测它未来变化的规律或趋势。

时间序列挖掘在诸多行业中广泛应用:金融股市城市交通流量一、时间序列挖掘概述

一、时间序列挖掘概述

时间序列一般包括以下特征:趋势性:时间序列在长时间内呈现出来的上升或下降的趋势。季节性:时间序列在一定时间范围内表现出来的周期性波动。例如,航空业的销售淡季和销售旺季。随机性:时间序列的无规律地、偶然性地随机波动。

一、时间序列挖掘概述

时间序列一般包括以下特征:趋势性:时间序列在长时间内呈现出来的上升或下降的趋势。季节性:时间序列在一定时间范围内表现出来的周期性波动。例如,航空业的销售淡季和销售旺季。随机性:时间序列的无规律地、偶然性地随机波动。

时间序列分为平稳序列和非平稳序列两大类。平稳序列是不存在趋势只存在随机性的序列,非平稳序列则是包含趋势、季节性和随机性的序列。一、时间序列挖掘概述

1.时间序列的类型:

纯随机序列:指序列上的随机变量之间没有任何相关关系,它们完全随机地波动。

平稳非白噪声序列:序列的均值和方差是常数

非平稳序列:序列的均值和方差不为常数,有明显的趋势性或季节性变化。二、时间序列预处理

二、时间序列预处理

二、时间序列预处理

3.平稳性检验(1)

时序图检验

依据是根据平稳序列具有常数均值和常数方差这一性质,主观判断该序列是否具有平稳性。“1950年-1998年北京城乡居民定期储蓄占比”的时序图二、时间序列预处理

3.平稳性检验(2)

自相关图检验

对于平稳序列,随着延迟期数k的增加,平稳序列的自相关系数会比较快的衰减到零,并且在零附近随机波动。而对于非平稳序列,它的自相关系数衰减较慢。。“1950年-1998年北京城乡居民定期储蓄占比”的自相关图二、时间序列预处理

二、时间序列预处理

二、时间序列预处理

三、平稳非白噪声时间序列建模

三、平稳非白噪声时间序列建模

AR模型具有如下性质,三、平稳非白噪声时间序列建模

三、平稳非白噪声时间序列建模

MA(q)模型有如下性质三、平稳非白噪声时间序列建模

三、平稳非白噪声时间序列建模

ARMA(p,q)模型具有如下的性质三、平稳非白噪声时间序列建模

4建模过程

当某个时间序列经过预处理后被判定为平稳非白噪声序列时,就可以利用ARMA(p,q)模型进行建模,主要是确定模型的阶数p和q。具体的步骤如下所示三、平稳非白噪声时间序列建模

三、平稳非白噪声时间序列建模

5模型检验方法

对于一个好的拟合模型来说,其拟合残差项中将不再覆盖任何相关信息,即模型的残差序列是一个白噪声序列,所以对模型的显著性检验就是对残差序列的白噪声检验。

三、平稳非白噪声时间序列建模

5模型检验方法

对于一个好的拟合模型来说,其拟合残差项中将不再覆盖任何相关信息,即模型的残差序列是一个白噪声序列,所以对模型的显著性检验就是对残差序列的白噪声检验。

一般可以通过对序列进行正态性检验和DW检验来判定残差序列是否为白噪声序列。对模型的正态性检验:该方法用于检验残差是否具有正态性,当p值>0.05时认为序列不具有正态性,则拒绝原假设,说明残差序列中还存在相关信息残留。对于模型的DW检验(自相关性):当检验结果靠近0时说明序列正自相关,靠近2时说明不具有太高的相关性,当靠近4时说明具有负自相关性。四、非平稳时间序列建模

非平稳时间是指具有趋势性、季节性和随机性特点的序列,其均值或方差不为常数。目前,非平稳时间序列的分析方法常包括两大类:一是确定性因素分解的时序分析;二是随机时序分析。确定性因素分解的方法是把时间序列的变化归结为长期趋势、季节变动、循环波动和随机波动这四个因素。随机时序分析方法通过差分等运算将非平稳时间序列模型转换为平稳时间序列,然后再使用ARMA等模型进行建模。四、非平稳时间序列建模

四、非平稳时间序列建模

2.ARIMA模型ARIMA模型的实质就是差分运算和ARMA模型的组合。对差分平稳序列做d阶差分后得到一个平稳序列,然后使用ARMA建模,这样的模型称之为“ARIMA(p,d,q)”模型。显然,差分阶数为d=0时,ARIMA模型就退化为ARMA模型五、基于Python的实现

Python的statsmodels.tsa.arima.model模块给出了ARIMA模型的实现类,它的基本语法为:ARIMA(endog,order=(p,d,q))

它的主要参数、属性和函数情况如下表所示。五、基于Python的实现

Python的s

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论