版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Python与财经大数据分析基础第9章使用ARIMA模型预测股票价格——时间序列王彦超教授博士生导师中央财经大学会计学院CONTENTS目录04应用实践01时间序列简介02时间序列处理03时间序列基本性质01时间序列简介时间序列是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列,其实质是反映某个或者某些随机变量随时间不断变化的趋势。常见的时间序列如按秒或分钟更新的股价数据、按天更新的利率数据、按月更新的征信数据以及按年更新的宏观经济数据等。9.1时间序列简介(一)时间序列基本概念datetime模块是Python处理日期和时间的标准库,提供多种处理日期、时间相关的类。不仅支持日期和时间的算法,也能实现有效的属性提取和格式输出,本部分将介绍使用datetime创建时间对象、查看时间对象属性和转换时间格式等方法。9.1时间序列简介(二)datetime模块类名功能说明date日期对象,常用属性有year,month,daytime时间对象,常用属性有hour,minute,seconddatetime日期时间对象,是date和time的结合timedelta时间间隔,即两个时间点之间的长度tzinfo时区信息对象在日常数据分析中,最为常用的是datetime模块的datetime类,因此我们主要介绍datetime类。9.1时间序列简介(三)datetime类02时间序列处理时间序列的缺失值处理一般采用插值方法,使用缺失值周围的两个已知数据点估计丢失的数据点。较为常见的插值方法有基于时间的插值、样条插值和线性插值,一般通过pandas模块的interpolate()函数来实现。9.2时间序列处理(一)时间序列缺失值处理移动是指沿着时间轴将数据前移或后移,在财经金融数据处理中,时常会用到时间滞后。时间滞后是将t期的数据转换为(t-n)期的数据,可以通过shift()函数实现。9.2时间序列处理(二)时间序列数据移动和滞后计算第九章数据分组介绍了groupby()函数,其主要作用是进行数据的分组以及分组后的组内运算,常与agg()和apply()函数搭配使用。这一函数在时间序列数据中也十分常用,同样对时间序列进行分组,之后再进行组内运算,从而获取所需的数据或观察不同组别间的差异。9.2时间序列处理(三)时间序列数据分组时间序列通常由趋势、周期性、季节性、误差构成,其中最经常被分析的是趋势和季节性。时间序列可以被看作是趋势、季节性和误差项的整合,其各个观测值可以是以上成分相加或相乘得到的。9.2时间序列处理(四)时间序列的分解时间序列的分解可以通过statsmodels模块的seasonal_decompose来实现。9.2时间序列处理(四)时间序列的分解
9.2时间序列处理(五)时间序列的平滑在了解时间序列数据之后,我们可以对其进行简单的分析,比如进行描述性统计。这里我们沿用上节数据,基于前序章节内容,可以直接使用describe()函数查看数据的均值方差等。9.2时间序列处理(六)时间序列数据描述性统计03时间序列基本性质研究不同变量之间的相关性,是为了揭示变量之间的因果关系,以更好地预测目标变量,而时间序列的自相关性同样也是研究和利用时间序列的重要性质。所谓“历史可以重演”,即希望找到时间序列所具有的可延续性特征,以帮助我们更好地预测未来。时间序列的自相关性可以通过自协方差、自相关系数等统计量来体现。9.3时间序列基本性质(一)自相关性
Python中statsmodels模块包含的acf()函数可以便捷计算自相关系数。9.3时间序列基本性质(一)自相关性时间序列的平稳性是时间序列研究的基本前提,通过前一节的介绍,我们希望通过自相关性找到时间序列的可延续性特征,并在预测未来时利用该特征,而时间序列的平稳性则是决定该特征能否延续到未来的重要性质。9.3时间序列基本性质(二)平稳性增广迪基·富勒检验(ADF检验)是最常用的单位根检验方法,Python中的arch模块提供了ADF()函数帮助我们便捷地进行ADF检验。9.3时间序列基本性质(二)平稳性KPSS检验可以用于趋势平稳性检验,Python中的statsmodels模块提供了kpss()函数帮助我们便捷地进行KPSS检验。9.3时间序列基本性质(二)平稳性白噪声序列是指序列中任意两个时间点的变量均不相关,序列均值为0、方差为常数,这使得白噪声序列符合平稳时间序列的条件。白噪声序列中没有任何规律,不能用于预测和推断,所以发现一个时间序列为白噪声序列时,说明该时间序列已经失去了继续研究的意义。9.3时间序列基本性质(三)白噪声序列可以通过Ljung-Box检验该序列是否为白噪声序列,Python中statsmodels模块提供了q_stat()完成该检验。9.3时间序列基本性质(三)白噪声序列04应用实践
ARIMA(AutoregressiveIntegratedMovingAverage)模型是一种广泛使用的时间序列分析方法,它可以用于对未来的数据进行预测。ARIMA模型由自回归模型(AR模型)、差分整合模
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 猜想06平行线的证明和三角形内角和定理(易错必刷36题9种题型)原卷版
- 陕西省安康市石泉县江南高级中学人教版高中政治必修一教案512企业的经营与发展
- 福建省三明市第一中学2017-2018学年高二下学期每日一练3数学(理)试题
- 风力发电简介课件
- 山西省太原市2023-2024学年高一下学期7月期末信息技术试题
- 山西太原高三二模文科数学试题
- 福建省宁化市第一中学高三下学期第一次质检模拟试题地理
- 人教部编版八年级语文上册《“飞天”凌空-跳水姑娘吕伟夺魁记》公开课教学课件
- 开学安全教育教案
- MES系统的开发应用
- 教科版五年级科学上册(风的作用) 教学课件
- 盐酸-危险化学品安全标签
- GB/T 699-2015优质碳素结构钢
- GA 260-2009警服多功能服
- FZ/T 01093-2008机织物结构分析方法织物中拆下纱线线密度的测定
- 【食品生产加工技术】甜玉米羹罐头加工技术
- 《服务业区位因素及其变化》优质公开课人教版课件
- 燃气工程施工组织设计
- 头发及头皮知识讲述资料课件
- 新版GMP基础知识培训课件
- 消防安全常识明白纸
评论
0/150
提交评论