




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
乘风破浪,世界就在眼前第八章基于历史数据地气温及降水预测并行计算与大数据研究所目录情景问题提出及分析八.一常见地时间序列模型简介八.二稳序列建模示例(降水预测)八.三非稳序列建模示例(气温预测)八.四八.一情景问题提出及分析TEXTaddhereTEXTaddhereTEXTaddhereTEXTaddhereTEXTaddhereTEXTaddhere近年来,随着类工业化程地不断推,正加速着全球气候地变化。主要表现为全球气温整体升高,区域降水异常以及海冰,积雪融化等气候异常现象。它们每年对我们带来地员,财产损失不可估量。如果能提前预测这些天气异常现象,那么将会挽回不小地损失。因此准确预测未来地天气变得尤为重要,在现行地预报方法主要分两种,一种是以完全模拟真实大气各种物理过程为代表地动力学方法,另一种则是对历史数据行分析为代表地统计学方法。在大气地动力学模拟常常需要大量地计算资源,需要借助大规模地并行计算,而统计学方法则需要大量地历史观测数据,但消耗计算资源相对较少。对于前者,模拟地准确往往取决于初始场质量与对大气所发生地各种物理过程地代表,而后者地精准度往往是受数据质量与所选统计学模型地好坏。在本章将采用统计学方法,结合多年历史数据,采用时序模型,对未来地气温及降水做出预测。八.二常见地时间序列模型简介TEXTaddhereTEXTaddhereTEXTaddhere时间序列分析是概率统计学科应用较强地分支,广泛应用于金融分析,气象水文,信号处理等众多领域。而对时间序列地建模是分析时间序列地关键。在时间序列分析地发展过程,提出了许多具有实际价值地模型,由于本书篇幅有限,下面仅对四种常用地传统时间序列模型行介绍,即AR模型,MA模型,ARMA模型与ARIMA模型。八.二常见地时间序列模型简介TEXTaddhereTEXTaddhereTEXTaddhere模型又称阶自回归(Autoregressive)模型,常记为,它是由数学家耶尔(Yule)为预测市场变化规律在一九二七年提出地,它常用于对稳序列地建模。阶AR模型地表达式如下:其,为常数项,为模型参数,为白噪声序列。模型满足以下条件:一.AR模型八.二常见地时间序列模型简介TEXTaddhereTEXTaddhereTEXTaddhere对于上式,条件一实际上是限制ε_t为均值为零地白噪声序列,条件二规定了前期序列值与当前白噪声无关。AR模型可以理解为当前时刻值等于过去p个时刻值地线组合。如果常数项ϕ_零=零,该序列又称心化地AR(p)模型,形如(八-一)式地式子可引入后移算子行变换得到心化地AR(p)模型,如下式所示。对于一个模型,它当前时刻地值总与之前时刻地值存在联系,因此衡量一个样本数据是否适用于该模型需要衡量前后值地联系,对此我们引入自有关系数与偏自有关系数两个概念。一.AR模型八.二常见地时间序列模型简介TEXTaddhereTEXTaddhereTEXTaddhere自有关系数,是衡量一个变量不同时刻之间有关大小地统计量。设有时间序列,时间间隔之间()数值地自有关系数计算公式如下所示:其,为样本容量,为整个序列地样本均值,为整个序列地样本方差。可以证明(详细证明请参阅时间序列分析有关),对于稳模型其自有关系数随时间间隔地增长呈指数下降趋势,但总不为零,称这种质为拖尾。不难理解模型具有拖尾地原因,以模型为例,可以看到表达式地值仅依赖于前一个时刻地值,但地值又依赖于它地上一个时刻地值,…,这样依次传递下去,之前每一个序列值都对其有影响,这就是其自有关系数总不为零地原因。同时,随着时间推移,这种之前时刻对后续地影响越来越小,表现在自有关系数随着时间间隔地增长呈指数衰减。自有关系数ACF八.二常见地时间序列模型简介TEXTaddhereTEXTaddhereTEXTaddhere自有关系数量化了两个时间间隔之间序列值地有关大小,但这种有关是不"纯净地"。当时,两个序列值之间地自有关系数是否还受其间序列值地影响?对于模型,答案是会地。这是不难理解地,以模型为例,对于时刻地序列值不仅要受时刻地影响,同时也要受到它前一时刻地影响,因此,在计算自有关系数时,这就不是纯粹地与有关,还掺杂了时刻值地影响。为了消除这种影响,再衡量两者地有关大小,引入滞后偏自有关系数,它地定义如下:其,,偏自有关系数PACF八.二常见地时间序列模型简介TEXTaddhereTEXTaddhereTEXTaddhere可以证明,模型地滞后偏自有关系数等于阶模型地第个模型自回归系数地值,对于此值可以利用Yule-Walker方程求解。对于模型,偏自有关系数具有步截尾。所谓步截尾是指对于模型,,总有自有关系数=零。这个质与自有关系数成为了模型地判断与定阶地关键条件。偏自有关系数PACF八.二常见地时间序列模型简介TEXTaddhereTEXTaddhereTEXTaddhere模型又称阶滑动均模型(Movingaverage),通常记为。它是由瓦尔格(Walker)于一九三一年在数学家耶尔提出地自回归模型地基础上所建立地,它主要用于对稳序列地建模。阶滑动均模型地表达式如下所示:其,为常数项,为模型参数,为均值为零地白噪声序列。对于此模型,可以把它理解为当前时刻地序列值等于过去时刻地白噪声值地线组合。二.MA模型八.二常见地时间序列模型简介TEXTaddhereTEXTaddhereTEXTaddhere当时,称此模型为心化地模型,任何一个非心化模型均可以通过位移变转换成为心化地模型,如下式所示:可以证明,地自有关系数具有阶截尾,偏自有关系数具有拖尾,这是确定模型及其阶数地关键条件。二.MA模型八.二常见地时间序列模型简介TEXTaddhereTEXTaddhereTEXTaddhere模型又称自回归滑动均模型(AutoregressiveMovingAverage),简记为,它同样也是由瓦尔格所提出地,它也主要用于对稳序列地建模,表达式如下所示:上述模型各参数意义与模型,模型参数相同。三.ARMA模型八.二常见地时间序列模型简介TEXTaddhereTEXTaddhereTEXTaddhere其时,该模型又称心化地模型,它也是可以通过(八-八)式做移变换得到地,其表达式如下所示:不难看出,该模型实际上就是模型与模型地线组合。当阶数时,该模型退化为模型。当阶数时,该模型退化为模型。三.ARMA模型八.二常见地时间序列模型简介TEXTaddhereTEXTaddhereTEXTaddhere可以证明,模型地自有关系数与偏自有关系数均不截尾也不拖尾。这就是说,此模型通常不能通过观察自有关系数与偏自有关系数图行定阶,往往要通过多次阶数实验,根据一些判定准则,选择出最优。对于一个模型拟合地好坏,往往我们会评估其残差方差地大小。然而,仅仅根据残差方差最小来确定模型阶数以达到最优模型,这是不够全面地,一个模型地好坏还与是否充分提取到其足够地信息与模型参数地个数有关。因此提出了较为描述好坏地信息准则,这里提出两种判定准测,一种是赤池信息准则AIC,另外一种是SBC准则,又称贝叶斯判别准则(BIC)三.ARMA模型八.二常见地时间序列模型简介TEXTaddhereTEXTaddhereTEXTaddhere心化地AIC准则:非心化地AIC准则:心化地SBC(BIC)准则:非心化地SBC(BIC)准则:AIC准则为选择最优模型带来了量化规则,但也有不足处,例如,AIC准则拟合误差提供地信息要受到样本容量地放大。因此提出了较为全面描述模型好坏地SBC信息准则,理论上已经证明,SBC准则是最优模型真实阶数地相合估计。在实际运用过程要合理应用这两种判别准则。三.ARMA模型八.二常见地时间序列模型简介TEXTaddhereTEXTaddhereTEXTaddhere模型,模型以及模型主要适用于对稳时间序列地建模,那么对于非稳时间序列如何行建模呢?在统计学,Cramer分解定理保证了对于适当阶数地差分一定可以提取到序列地确定信息,而差分运算具有强大地信息提取能力,许多非稳序列在行差分运算后往往显示出稳序列地特征。当把非稳序列转化为稳序列之后,这时就可以选择上述三种方法行建模。因为模型其也包含着模型与模型,所以一般称差分运算与模型所组合成地为求与自回归移动均模型(AutoregressiveIntegratedMovingAverage,ARIMA),模型。四.ARIMA模型八.二常见地时间序列模型简介TEXTaddhereTEXTaddhereTEXTaddhere模型地表达式如下:其,为滞后算子,满足;为差分阶数;,它是模型地自回归部分;,它是模型移动均部分,为均值为零地白噪声序列。并且限定当前时刻白噪声值与之前时刻序列值无关,用数学语言表述就是:四.ARIMA模型八.二常见地时间序列模型简介TEXTaddhereTEXTaddhereTEXTaddhere因为模型本质就是通过差分运算后,将非稳序列转化成为稳序列所建立地模型,其质与以上三种稳序列地质相同,故这里不再赘述。四.ARIMA模型八.二常见地时间序列模型简介TEXTaddhereTEXTaddhereTEXTaddhere上述所介绍地时间序列模型地建立与求解步骤主要分为四步行。第一步,模型地稳分析;第二步,模型定阶;第三步,模型参数估计;第四步,模型检验。模型求解步骤八.二常见地时间序列模型简介TEXTaddhereTEXTaddhereTEXTaddhere模型,模型以及模型适用于稳序列模型,而模型适用于非稳序列,因此在建模之前对序列行稳分析。一.模型地稳分析稳时间序列非稳时间序列八.二常见地时间序列模型简介若序列为非稳序列,则通过差分操作后转换为稳序列。现在得到地序列均为稳序列。因此,只需要考虑模型,模型以及模型。这三种模型地自有关系数与偏自有关系数有以下质。二.模型定阶模型定阶自有关系数ACF偏自有关系数PACFAR(p)拖尾p阶截尾MA(q)q阶截尾拖尾ARMA(p,q)拖尾拖尾对于模型,模型,若自有关系数与偏自有关系数呈现出上述表格地质,即可对模型定阶。八.二常见地时间序列模型简介由于样本地随机,以及序列地真实分布不可能完美近乎地于理想模型,在实际操作,这两者不可能完美地截尾,在此阶数之后,其ACF或PACF仍可能会在零附近小幅度振荡。为避免因此定阶带来地为主观,常常给其划分出一个置信区间。在实际应用,如果通过样本所求出地或在阶前明显大于该区间,而阶后明显在该区间内,即可认为或是阶截尾地。当自有关系数与偏自有关系数均为拖尾时,考虑模型为模型,它地阶数可以在一定范围内通过多次实验,取AIC函数或SBC函数(BIC)地最小值所对应地阶数。二.模型定阶八.二常见地时间序列模型简介模型参数估计,即利用序列观测值估计出模型系数使其达到最佳拟合。通常估计方法有三种,分别是:距估计,极大似然估计与最小二乘估计。Python地Statsmodels模块将求解方法行了封装三.模型参数估计八.二常见地时间序列模型简介模型地显著检验主要是检验模型地有效,一个较好地模型应该是充分提取了模型地有用信息,换言之,在模型拟合后地残差序列应该是一个白噪声序列。如果残差信息为非白噪声序列,则说明原序列信息还未提取充分。在这种情况下,一般需要选择其它模型行建模。通常在实际问题,一阶自有关是出现最多地一种序列有关类型,经验表明,如果序列不存在一阶自有关,通常也不会存在高阶自有关。白噪声序列地显著特征是其遵从正态分布与自有关系数为零,因此在残差序列地白噪声检验通常只要检验其分布是否近似服从正态分布,一阶自有关系数是否显著为零即可。四.模型检验八.二常见地时间序列模型简介(一)正态分布地判断分位数图示法(QuantileQuantilePlot)又称QQ图,常用于检测两个数据分布是否相似。统计学可以证明,若数据分布与正态分布非常接近,则数据在QQ图上地点应大致呈现一条直线。因此判断残差序列是否呈正态分布可通过QQ图行判断。(二)自有关系数地判断对于一阶自有关系数是否显著为零地判断可以采用DW检验法。DW检验,又称杜宾-瓦特森检验,常用于检测回归分析地残差向是否存在自我有关。DW检验地统计量表达式如下:四.模型检验八.二常见地时间序列模型简介,;,;,;其,为样本自有关系数。四.模型检验八.三.一读入数据并行预处理TEXTaddhereTEXTaddhereTEXTaddhere对稳序列建模地示例-预测一年后地月累计降水量。在这个示例作训练地降水数据为一零年地逐日数据,在各年相差较小呈周期地波动,因此属稳时间序列地一种。在建模之前首先需要对原始序列数据先行预处理,然后参照之前所示地步骤行建模。(一)数据准备首先创建一个用于本章代码运行地工作目录,在此工作目录下新建一个保存数据文件地文件夹"DATA",将降水,气温资料地所有文件解压到该文件夹下。八.三.一读入数据并行预处理TEXTaddhereTEXTaddhereTEXTaddhere创建一个预处理脚本,并导入本次预处理所需地包(二)数据准备#导入数据处理库importnumpyasnpimportpandasaspd
#导入绘图库importseabornassnsimportmatplotlib.pyplotasplt
#导入相应建模库fromstatsmodels.graphics.tsaplotsimportplot_acf,plot_pacf#ACF与PACFimportstatsmodels.tsa.stattoolsasst#AIC与BIC准则判断fromstatsmodels.tsa.arima_modelimportARMA#ARMA模型fromstatsmodels.graphics.apiimportqqplot#画QQ图fromstatsmodels.stats.stattoolsimportdurbin_watson#计算DW统计量
#设置绘图显示文字体plt.rcParams['font.sans-serif']=['MicrosoftYaHei']八.三.一读入数据并行预处理TEXTaddhereTEXTaddhereTEXTaddhere首先创建一个用于本章代码运行地工作目录,在此工作目录下新建一个保存原始数据文件地文件夹"raw_data",将"房产信息.rar"地所有文件解压到该文件夹下。(三)读取数据,并对数据缺失值,重复值行检查#读取数据fpath='./DATA/甘肃降水数据.csv'data=pd.read_csv(fpath)
print(data.isnull().sum())#查看缺失值个数print(data.duplicated().sum())#查看重复值个数
#预览data八.三.一读入数据并行预处理TEXTaddhereTEXTaddhereTEXTaddhere可以看到,数据无缺失值与重复值。数据读入后被保存为一个数据帧对象,列标签"date"记录着时间,"prec"记录着每日降水量。(三)读取数据,并对数据缺失值,重复值行检查八.三.一读入数据并行预处理TEXTaddhereTEXTaddhereTEXTaddhere在时间序列问题地处理上,通常Pandas地Series对象有较好地支持,其索引保存着时间信息。因此将数据帧对象转换为Series对象。#创建时间序列orig=pd.Series(data.prec.tolist(),\index=pd.to_datetime(data.date.tolist()))①在①处,重新使用地一个构造方法完成对Series对象地创建,这里将数据帧对象所切片地Series对象通过tolist()方法转换为列标传递参数,注意对时间索引地设置上需要使用Pandas地to_datetime()函数将原本字符串保存地时间转换为datetime对象方便后续对时间地处理。(三)读取数据,并对数据缺失值,重复值行检查八.三.一读入数据并行预处理TEXTaddhereTEXTaddhereTEXTaddhere将数据读入完成后,先作图观察其数据特征。由于其数据量较多,散点图比折线图更能体现出数据地分布,指定绘图方法为散点图。#画图预览变化趋势orig.plot(style='k.',figsize=(一六,八),rot=三零)(四)对数据行重采样,并划分训练集可以看到数据随时间变化有周期趋势,但每年又略有不同。相比于逐日降水量,我们更关心地是月累计降水量。八.三.一读入数据并行预处理TEXTaddhereTEXTaddhereTEXTaddhere使用resample()方法对数据行重采样,指定频率为每月。对于采样结果行求与。#数据重采样orig=orig.resample('M').sum()#预览orig.plot(color='blue',figsize=(一六,八))(四)对数据行重采样,并划分训练集八.三.一读入数据并行预处理TEXTaddhereTEXTaddhereTEXTaddhere在此,用二零零零年-二零一零年数据行建模,以二零一一年一二个月降水量作为预报测试,以检验模型地效果。#设置训练集train_X=orig['二零零零-零一-零一':'二零一零-一二-三一’]如果需要看二零零零-二零一零年近十年间降水量地变化,可以采用滑动均地方法行查看。#滑动均smt=train_X.rolling(window=一二)①
#预览plt.figure(figsize=(二四,八))plt.plot(train_X,color='blue',label='原始数据')plt.plot(smt.mean(),color='red',label='滑动均')②plt.legend()(四)对数据行重采样,并划分训练集八.三.一读入数据并行预处理TEXTaddhereTEXTaddhereTEXTaddhere在①处,使用rolling()方法返回一个时间窗口,指定参数window可选定时间窗大小。时间窗口地意义是:选择该时刻所在一定区间地值所求出地统计量来代表这个时刻地值,这个区间地大小就是时间窗大小。由于我们需要查看降水量整体趋势变化,略去季节地影响,这里指定时间窗口大小为一二。在②处,通过mean()方法获得一二个月地滑动均值,并绘制折线图。(四)对数据行重采样,并划分训练集八.三.二时间序列地稳分析TEXTaddhereTEXTaddhereTEXTaddhere该原序列已较为稳,可以直接用于建模。如果要查看序列各阶差分,可以自定义编写一个plot_diff()函数。该函数有两个输入参数series,n。其参数series是一个pandas地series对象,在这里即一个时间序列,n为查看到第几阶差分地序列。时间序列地稳分析defplot_diff(series,n):#画各阶差分预览color_bar=['blue','red','purple','pink']diff_x=seriesforiinrange(n):plt.figure(figsize=(二四,八))plt.title('diff'+str(i+一))diff_x=diff_x.diff(一)①diff_x.plot(color=color_bar[i%len(color_bar)])在①处,使用Pandas提供地diff()方法完成对Series对象地差分,它地主要参数是periods,即求差分间隔,默认为一,即相邻相个元素之间差分。八.三.二时间序列地稳分析TEXTaddhereTEXTaddhereTEXTaddhere完成对plot_diff()函数调用,指定参数n=三,查看三阶以内差分。时间序列地稳分析#查看三阶以内差分plot_diff(train_X,三)八.三.二时间序列地稳分析TEXTaddhereTEXTaddhereTEXTaddhere在①处,使用Statsmodels模块地plot_acf()函数绘制自有关系数图。参数lags=二零指定画出滞后二零阶以内地自有关系数;参数alpha=零.零五指定显著水为零.零五,即置信度为九五%。在②处,使用plot_pacf()函数绘制偏自有关系数图,参数与plot_pacf()函数基本相同。(一)分析自有关系数与偏自有关系数fig=plt.figure(figsize=(一六,八))ax一=fig.add_subplot(二一一)ax二=fig.add_subplot(二一二)
#ACFfig=plot_acf(train_X,lags=二零,alpha=零.零五,ax=ax一)①#PACFfig=plot_pacf(train_X,lags=二零,alpha=零.零五,ax=ax二)②八.三.三模型选择及定阶TEXTaddhereTEXTaddhereTEXTaddhere可以看到,在九五%地置信区间下(蓝色阴影),可以认为总体分布地自有关系数与偏自有关系数均成拖尾,因此模型选定为。(一)分析自有关系数与偏自有关系数八.三.三模型选择及定阶TEXTaddhereTEXTaddhereTEXTaddhere模型定阶选用AIC准则或者BIC准则,通过多次,实验确定其对应函数地最小值为最优阶数。(二)模型定阶#计算判定函数系数大小res=st.arma_order_select_ic(train_X,max_ar=四,max_ma=四,ic=['aic','bic’])①在①处,使用arma_order_select_ic()函数计算判定函数,指定参数max_ar,max_ma选择实验最大阶数,兼顾计算量与判定效果,一般该值取为四,ic指定需要计算哪些判定函数,这里指定计算aic与bic函数。八.三.三模型选择及定阶将计算出地AIC,BIC函数地值通过二维热力图行可视化,并打印最优阶数。(二)模型定阶#绘制AIC热力图ax=sns.heatmap(res['aic'],annot=True,fmt=".二f",ap="rainbow")ax.set_title('AIC')
#查看AIC准则最优阶数res.aic_min_order八.三.三模型选择及定阶将计算出地AIC,BIC函数地值通过二维热力图行可视化,并打印最优阶数。(二)模型定阶#绘制BIC热力图ax=sns.heatmap(res['bic'],annot=True,fmt=".二f",ap="rainbow")ax.set_title('BIC')
#查看BIC准则最优阶数res.bic_min_orderAIC准则与BIC准则所选最优阶数(四,二),因此模型定阶为。八.三.四建立时序模型并预测TEXTaddhereTEXTaddhereTEXTaddhere在对模型定阶完成后,接下来对模型行拟合并预测。(一)拟合模型并检验#拟合模型model=ARMA(train_X,order=(四,二)).fit()①在①处,对模型行建模,通过order参数指定阶数,并通过fit()方法对模型行训练。在对模型定阶完成后,接下来对模型行拟合并预测。#计算模型残差resid=model.resid#画出qq图plt.figure(figsize=(一二,一二))qqplot(resid,line='q',fit=True)#D-W检验plt.title('DW:{}'.format(durbin_watson(resid.values)))八.三.四建立时序模型并预测模型残差与正态分布较为接近,DW值接近于二,可以认为残差序列是一个白噪声序列。可以选用该阶数对模型行建模。要查看模型详细信息,可以使用summary()方法。#查看模型详细信息model.summary()(一)拟合模型并检验八.三.四建立时序模型并预测#预测pred=model.predict(start=零,end=len(train_X)+一一)②在②处,使用predict()方法完成模型地预测,通过start,end参数指定预测起止位置。#查看拟合结果plt.figure(figsize=(二四,八))plt.plot(orig,color='blue',label='观测数据')plt.plot(pred,color='red',linestyle='-.',label='预测')plt.legend(prop={'size':一六})#添加分隔线plt.axvline(x=pd.to_datetime('二零一零-一二-三一'),ls="--",c="green")plt.show()(二)模型预测八.三.四建立时序模型并预测(二)模型预测八.四.一读入数据并行预处理TEXTaddhereTEXTaddhereTEXTaddhere本节将提供一个对非稳序列建模地示例-预测月末最后一天地气温。与前一个示例不同,在这个示例作训练地气温数据为二七日地逐日数据,数据起伏较大无明显规律,属于非稳时间序列。在除了上述示例地处理步骤之外,需额外增加数据差分处理与还原处理。(一)导入所需库,并对其行基本设置#导入数据处理库importnumpyasnpimportpandasaspd
#导入绘图库importseabornassnsimportmatplotlib.pyplotasplt
#导入相应建模库fromstatsmodels.graphics.tsaplotsimportplot_acf,plot_pacf#ACF与PACFimportstatsmodels.tsa.stattoolsasst #AIC与BIC准则判断fromstatsmodels.tsa.arima_modelimportARMA #ARMA模型fromstatsmodels.graphics.apiimportqqplot #画QQ图fromstatsmodels.stats.stattoolsimportdurbin_watson #计算DW统计量
#设置绘图显示文字体plt.rcParams['font.sans-serif']=['MicrosoftYaHei']八.四.一读入数据并行预处理首先创建一个用于本章代码运行地工作目录,在此工作目录下新建一个保存原始数据文件地文件夹"raw_data",将"房产信息.rar"地所有文件解压到该文件夹下。(二)读取数据并行缺失值,重复值检查fpath='./DATA/成都气温数据.csv'
data=pd.read_csv(fpath)
print(data.isnull().sum())print(data.duplicated().sum())
data数据无缺失值,重复值。八.四.一读入数据并行预处理数据温度为开氏温度,而日常使用地是摄氏温度。可以使用map()方法完成温度地换算。(二)读取数据并行缺失值,重复值检查#开氏温标转摄氏温标t=T-二七三.一五data.temp=data.temp.map(lambdax:x-二七三.一五)将数据转换为时间序列。#转换为Series时间序列orig=pd.Series(data.temp.tolist(),\index=pd.to_datetime(data.date.tolist()))orig八.四.一读入数据并行预处理TEXTaddhereTEXTaddhereTEXTaddhere将二零一九年二月一日至二七日气温数据作为训练集建立模型,以二八日数据作为测试集以检验模型预报效果。#划分训练集train_X=orig['二零一九-零二-零一':'二零一九-零二-二七'](三)对数据行重采样,并划分训练集#数据重采样为逐日数据orig=orig.resample('D').mean()
#预览orig.plot(color='blue',figsize=(一六,八))八.四.二时间序列地稳分析原序列并非一个稳序列,因此需要对该序列行稳化。为此,我们对原序列行差分操作。首先画出前三阶地差分结果,以确定一个较为合适地差分阶数。#查看三阶以内差分plot_diff(train_X,三)序列地一阶差分已较为稳,为避免过差分,选定差分阶数。#差分序列train_X_diff一=train_X.diff(一).dropna()八.四.三模型选择及定阶TEXTaddhereTEXTaddhereTEXTaddhere首先创建一个用于本章代码运行地工作目录,在此工作目录下新建一个保存原始数据文件地文件夹"raw_data",将"房产信息.rar"地所有文件解压到该文件夹下。(一)分析自有关系数与偏自有关系数#画ACP与PACFfig=plt.figure(figsize=(一六,八))ax一=fig.add_subplot(二一一)ax二=fig.add_subplot(二一二)
#ACFfig=plot_acf(train_X_diff一,lags=二零,alpha=零.零五,ax=ax一)#PACFfig=plot_pacf(train_X_diff一,lags=二零,alpha=零.零五,ax=ax二)八.四.三模型选择及定阶TEXTaddhereTEXTaddhereTEXTaddhere可以看到,差分后序列地自有关系数与偏自有关系数均成拖尾,因此模型选定为,对于具体阶数通过多次实验选择判别AIC或BIC函数地最小值对应阶数。这里指定最大实验阶数为四。(一)分析自有关系数与偏自有关系数八.四.三模型选择及定阶TEXTaddhereTEXTaddhereTEXTaddhere查看AIC函数。#绘制AIC热力图ax=sns.heatmap(res['aic'],annot=True,fmt=".二f",a
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 45813-2025造纸机械安全要求
- 大数据技术专业教学标准(高等职业教育专科)2025修订
- 老年保健与管理专业教学标准(高等职业教育专科)2025修订
- 2025年中国林业经济行业发展前景预测及投资战略研究报告
- 中国燃气空调行业市场深度评估及投资战略规划报告
- 中国中药保健品行业发展监测及投资战略规划研究报告
- 2024年中国铜蓝矿行业市场调查建议报告
- 中国碳化硅陶瓷异型梁行业发展监测及投资前景展望报告
- 2020-2025年中国蜂胶行业市场前景预测及投资战略研究报告
- 汽车后板簧托板总成项目投资可行性研究分析报告(2024-2030版)
- 2025年陕西、山西、青海、宁夏高考政治试卷真题(含答案解析)
- 3.21 明清时期的科技与文化 课件 2024-2025学年统编版七年级历史下册
- 养老护理员四级考试题库及答案
- 办公室内控管理制度
- 2024-2025 学年八年级英语下学期期末模拟卷 (苏州专用)原卷
- 安徽省宿州市砀山县2023-2024学年八年级下学期期末数学试题
- 子痫与重度子痫的护理
- 2025国开电大《个人与团队管理》形考任务1-10答案
- AI赋能电商新机遇:柞水县电子商务应用技能培训大纲
- 医疗供应链精细化管理保障药品安全与供应策略
- 医院建设项目设计技术方案投标文件(技术方案)
评论
0/150
提交评论