




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、关于入境旅游人数的时间序列分析专业:统计学姓名:佟虹生指导老师:汪小英摘要大众旅游时代的到来,使旅游日益成为现代人类社会主要的生活方式和社会经济活动,旅游业以其强劲的势头成为全球经济产业中最具活力的“朝阳产业”。随着社会生产力不断发展,劳动生产率不断提高,以及人们生活水平的迅速提高和带薪假期的增加,旅游业将持续高速度发展,成为世界最重要的经济部门之一。中国同样如此,有数据统计2014年全国旅游及相关产业增加值占国内生产总值的比重为4.33%。众所周知旅游业是一个存在显著季节效应的行业,如果能对旅游业的客流量作出准确的预测,将会有利于商家更好的把握商机。本文选取入境旅游的客流量作为时间序列,将简
2、单地分析该序列的季节效应,并对序列拟合ARIM砥型,并作出简单的预测。关键词:入境旅游;季节效应;时间序列;ARMIA预测一、引言旅游是在人的基本生活需求得到适度满足后的一种新的消费行为,一种带有浓厚文化内涵的群体活动。人们离开常住地到异国他乡访问的旅行和暂时停留所引起的各种现象和关系的总和。我国拥有丰富的旅游资源,疆域辽阔,既有风景秀丽的江南水乡,也有粗犷豪迈的西北风情;我国拥有悠久的历史文化,目前已经公布了99个国家级历史文化古城,长城、故宫、颐和园等已经被列入世界文化遗产名录;我国还是一个拥有多个民族的国家,各个民族的习俗和风情很容易使人产生很强烈的向往之情。所有这些,都为我国旅游业的发
3、展奠定了一个良好的基础,使得我国吸引了大量的入境游客。入境旅游是指他国居民前来我国的旅游活动,或者是指他国居民进入本国国境以内的旅游活动,入境旅游属于国际旅游。目前入境旅游已成为构成我国旅游业的重要组成部分。时间序列分析(Timeseriesanalysis)是一种动态数据处理的统计方法。该方法基于随机过程理论和数理统计学方法,研究随机数据序列所遵从的统计规律,以用于解决实际问题。因此本文将通过时间序列分析的方法来研究分析中国的入境旅游人数。二、研究方法差分运算具有强大的确定性信息提取能力,许多非平稳序列差分后会显示出平稳序列的性质,这是我们成这个非平稳序列为差分平稳序列。对差分平稳序列可以使
4、用ARIMA真型进行拟合。具有如下结构的模型称为求和自回归移动平均(autoregressiveintegratedmovingaverage),简记为ARIMA(pd,q)模型:式中,;,为平稳可逆ARMAp,q)模型的自回归系数多项式;,为可逆ARMAp,q)模型的移动平滑系数多项式。ARIMA(p,d,q)模型是指d阶差分后自相关最高阶数为p,移动平均最高阶数为q的模型,通常它包含了个独立的未知系数:,°如果该模型中有部分自相关系数或部分移动平滑系数为零,即原ARIMA(p,d,q)模型中有部分系数省缺了,那么该模型称为疏系数模型。疏系数模型一般形式为式中,为非零自相关系数的阶
5、数,为非零移动平滑系数的阶数。在实际操作中,疏系数模型时有应用。ARIMA真型可以对具有季节效应的序列建模。根据季节效应提取的难易程度,可以分为简单季节模型和乘积季节模型。简单季节模型是指序列中的季节效应和其他效应之间是加法关系,即式中,代表序列的长期趋势波动;代表序列的季节性(周期性)变化;代表随机波动。这时,各种效应信息的提取都非常容易通常简单的周期步长差分即可将序列中的季节信息提取充分,简单的低阶差分即可将趋势信息提取充分,提取完季节信息和趋势信息之后的序列就是一个平稳序列,可以用ARM能型拟合。所以简单季节模型实际上就是通过趋势差分、季节差分将序列转换为平稳序列,再对其进行拟合。它的模
6、型结构通常如下:式中,(1) D为周期步长,d为提取趋势信息所用的差分阶数。(2) 为白噪声序列,且,。(3) ,为q阶移动平均系数多项式。(4) ,为p阶自回归系数多项式。但更为常见的情况是,序列的季节效应、长期趋势和随机波动之间有着复杂德尔交互影响关系,简单的ARIMA真型并不足以提取其中的相关关系,这时通常需要采用乘积季节模型。乘积模型的构造原理如下:当序列具有短期相关性时,通常可以使用低阶ARMAp,q)模型提取。当序列具有季节效应,季节效应本身还具有相关性时,季节相关性可以使用以周期为步长单位的ARMAP,Q)模型提取。由于短期相关性和季节效应之间具有乘积关系,所以拟合模型实质为AR
7、MA(p,q)和ARMAP,QQ的乘积。综合前面的d阶趋势差分和D阶以周期S为步长的季节差分运算,对原观察值序列拟合的乘积模型完整的结构如下:式中,该乘积模型简记为。三、对中国入境旅游人数的实证研究本文实证研究所选取的数据是中国入境旅游人数,数据频率为月度,客流量单位为万人,时间跨度从2001年1月至2015年12月,共计180个数据,来源于中经网统计数据库。3.1 原序列以及差分序列的相关检验3.1.1 原序列的平稳检验图3.1原始序列时序图首先画出原始序列的的时序图,进行观察,并结合单位根检验判断它的平稳性,图3.1为原始序列的时序图,表3.1为原始序列的3阶单位根检验结果。number1
8、30012001100100090080070060050001JAN200001JAN200201JAN200401JAN200601JAN200801JAN201001JAN201201JAN201401JAN2016date表3.1原始序列3阶单位根检验结果增广Dickey-Fuller单位根检验滞后RhoPr<RhoTauPr<TauFPr>F零均值0-0.12370.6538-0.120.642110.17170.72230.220.750520.30170.75480.630.852030.31730.75870.780.8810单均值0-28.44290.001
9、3-4.020.00178.170.00101-19.91340.0102-3.440.01096.170.00882-8.68380.1794-2.310.16843.130.27273-6.78220.2846-2.080.25372.730.3758趋势0-63.34600.0005-6.19<.000119.160.00101-49.06450.0005-5.060.000312.960.00102-21.01210.0498-3.200.08745.260.1262增广Dickey-Fuller单位根检验US滞后RhoPr<RhoTauPr<TauFPr>F3
10、-16.19230.1367-2.770.21173.980.3823从时序图中可以观察到这是一个典型的有着上升趋势的非平稳序列,同时单位根检验也印证了我们的判断,从2阶开始p值大于0.05说明原始序列非平稳。同时从时序图中,我们还可以观察到原始序列在上升趋势的同时,还具备明显的周期性,周期长度为12,与常识的认知相符合。所以接下来要考虑对原始序列进行1阶12步差分处理,1阶差分去除原始序列的趋势,1阶差分后的序列进行12步差分提取差分后序列的季节信息即周期性。3.1.2 差分序列的相关检验图3.2差分后序列的时序图我们对1阶12步差分以后的序列进行平稳性和白噪声检验,图3.2为差分后序列的时
11、序图,表3.2为差分后序列的3阶单位根检验结果,表3.3为差分后序列的白噪声检验结果。x_1_124003002001000.-100-20001JAN200001JAN200201JAN200401JAN200601JAN200801JAN201001JAN201201JAN201401JAN2016date增广Dickey-Fuller单位根检验滞后RhoPr<RhoTauPr<TauFPr>F零均值0-212.7480.0001-17.23<.00011-209.2930.0001-10.18<.00012-337.9990.0001-9.06<.00
12、013-697.2170.0001-8.03<.0001单均值0-212.7430.0001-17.18<.0001147.630.0010表3.2差分后序列的3阶单位根检验结果1-209.2950.0001-10.15<.000151.510.00102-338.0060.0001-9.03<.000140.780.00103-697.5660.0001-8.01<.000132.070.0010趋势0-212.7520.0001-17.13<.0001146.760.00101-209.3970.0001-10.12<.000151.220.001
13、02-338.1520.0001-9.00<.000140.530.00103-700.5710.0001-7.99<.000131.890.0010表3.3差分后序列的白噪声检验结果白噪声的自相关检查至滞后卡方自由度Pr卡方自相关620.1560.0026-0.2810.085-0.1550.001-0.0730.0531267.6012<.0001-0.0380.0220.053-0.0170.155-0.4811892.4418<.00010.193-0.1910.177-0.0660.117-0.1042498.5024<.00010.083-0.0410
14、.047-0.1150.079-0.032从1阶12步差分后的序列时序图中不难看出,已经充分地提取了原始序列的趋势,同时差分后的序列也没有明显的周期性,当然差分后序列的3阶单位根检验也印证了我们的判断。再观察差分后序列的白噪声检验结果,发现无论是6阶、12阶、18阶或是24阶,p值都小于0.05,说明差分后的序列为一个非白噪声序列,所以综上,我们可以判断原始序列经过1阶12步差分以后得到一个非白噪声的平稳序列,有分析的价值,考虑到季节效应,可以尝试对差分以后的序列拟合ARIMA真型。3.2 拟合ARIMAf型3.2.1 考虑简单季节模型观察1阶12步差分后序列的自相关系数和偏自相关系数图,图3
15、.3为差分后序列的自相关系数,图3.4为差分后序列的偏自相关系数。图3.3差分后序列的自相关系数自相关砺方星相关住4987,55432101234567S41amD3099.9531?KXXJI*>«*0170445-2SQ79II*D077352225*5970.G&L52I,|*O.:53:5334793翌-J54K10JW3772423017200J0O0711D.K54&45224936-.072551*0,0054646*643351,U0S8327118.非6-0350055025£575507犯皿但厂0.M5319163阑Q.052&am
16、p;61.*。厕M10>51.169209-,015511C映353114515530.15534匚一,*0.M&37712*1482259-48135*+.。.溺故1359Ml30.193:41,f0.102591145;2306-19107II*0/:4744155492230,177171.4M*0J06S1116-204500-.065971*0.10S55617网236QJ17171.*.0.10S7961S工1即IIX543192S6S3B0.GS2S81.口笈2D*125527-.3409111011051221146523。即71-*0.11060222-3S54
17、G4-.114651,*0.110723232464210.D73491.4+.0.111432247962553-.031601*0,111771图3,4差分后序列的偏自相恂自相关滞后相关性-14:87654321()12:J4=67ti911-0.26079充*童*2O.OOS16-3-0.14038*4-008741S-0.09880重查6-0.014207-0,04162*B-0.0291S90.0S567*100.00195110.17073*12-0.4393913-0.C362214-0.1532915-00093216-0.0630S17-0,011661B-0.01657*1
18、9-0.02233200,00713210.0407722-0.11361230.1599624-0.29367自相关图显示延迟12阶自相关系数显著大于2倍标准差范围,这说明差分后序列中仍然蕴含着非常显著的季节效应。延迟1阶、2阶的自相关系数也大于2倍标准差,这说明差分后的序列还具有短期相关性。观察偏自相关图,得到结论基本一致。根据自相关系数和偏自相关系数的性质,可以尝试拟合疏系数模型AR(1,12)、MA(1,2,12)、ARMA;(1,12),(1,2,12),表3,4、表3,5、表3,6分别为3种模型的残差白噪声检验结果。表3.4AR(1,12)的残差白噪声检验结果残差的自相关检查&am
19、p;粉4nfIF分)一1)自相关I亍6i5.330.0017-0.016-0078-0120-0072-CC6:30).013i11212.94100.07匚3-0.0550.008J0.030-0.018(.11)0.15-7表3.5MA(1,2,12)的残差白噪声检验结果残差的自相关检查至滞后卡方自由度Pr卡方自相关66.2430.0013-0.0670.020-0.136-0.058-0.0760.0601211.3890.0802-0.044-0.011-0.009-0.0960.041-0.124表3.6ARMA(1,12),(1,2,12)的残差白噪声检验结果残差的自相关检查至滞后
20、卡方自由度Pr卡方自相关610.3810.0013-0.1360.081-0.156-0.036-0.0810.0571228.5470.0002-0.0390.0050.025-0.0850.072-0.292从以上模型残差的检验结果可以看出,三种模型的残差在滞后6阶的白噪声检验中p值都小于0.05,都不能通过,说明残差在短期还有信息没有提取完全,所以模型拟合效果均不理想。考虑到该序列既具有短期相关性又具有季节效应,而且短期相关性和季节效应使用加法模型无法充分、有效提取,可以认为该序列的季节效应和短期相关性之间具有复杂的关联性。这时,假定短期相关性和季节效应之间具有乘积关系,尝试使用乘积模型
21、来拟合序列的发展。3.2.2 考虑乘积季节模型还是观察1阶12步差分之后序列的自相关系数和偏自相关系数图,两者显示12阶以内的自相关系数和偏自相关系数均不截尾,所以尝11Mg用ARMA1,1)模型提取差分后序列的短期自相关信息。在考虑季节自相关特征,这时考察延迟12阶、24阶等以周期长度为单位的自相关系数和偏自相关系数的特征,自相关系数图(图3.3)显示延迟12阶自相关系数显著非零,但是延迟24阶自相关系数落入2倍标准差范围。而偏自相关系数图(图3.4)显示延迟12阶和延迟24阶的偏自相关系数都显著非零。所以可以认为季节自相关特征是自相关系数截尾,偏自相关系数拖尾,这时以12步为周期的ARMA
22、0,1)12模型提取差分后序列的季节自相关信息。综合前面的差分信息,要拟合的乘积模型为ARIMA(1,1,1)(0,1,1)12表3.7为该模型条件最小二乘下的参数估计。表3.8参数估计条件最小乘估计参估计标t近沸数准似后误值Pr差>|t|MU-0.10.3-00.509927054.615025MA0.840.010<.011,881783.8001193条件最小乘估计参估计标t近洲数准似后误值Pr差>|t|MA0.800.015<.012,888508.90012180AR0.570.14.<.011,6042087700113可以看到,该模型除去常数项不显著
23、外,其余系数都显著非零,所以重新拟合不含常数项的该模型,并观察残差序列的白噪声检验。表3.8为不含常数项的参数估计,表3.9为不含常数项下的残差序列白噪声检验结果。表3.8不含常数项的参数估计条件最小乘估计参数估计标准t值近似Pr>|t|滞后MA1,10.83316().084619.85<.00011MA2,10.80609().0509515.82<.000112AR1,10.56010().126694.42<.00011表3.9不含常数项的残差白噪声检验结果残差的自相关检查工方初才Af甘>于方自相关62.2230-.0.2071840.034-00.004
24、4-0)0.)。12181490-0-002.3.08.0.0,0058074020072067)60,3911100-0-0083.5.500.00.006423791808019)50139从表3.8可以看出不含常数项的模型中所有系数均显著,表3.9则说明不含常数项的模型残差序列均不拒绝为白噪声序列,所以模型拟合成功,得到最终的模型的口径为:将序列拟合值和序列观察值联合作图。图3.5为拟合值和观察值联合图number130012001100100090080070060050001JAN200001JAN200201JAN200401JAN200601JAN200801JAN201001J
25、AN201201JAN201401JAN2016date图3.5拟合值和观察值联合图图中分别作出模型拟合值以及模型拟合在95函信水平下的置信上下限,均以折现连接,图中星星标记未连接的即为实际观测值,可以直观地看出该季节乘积模型对原序列拟合效果良好。3.3 预测利用该模型对2016年的入境旅游人数进行预测,并绘制预测序列的时序图表3.10为2016年每个月度入境旅游人数的预测值(单位:万人)。表3.102016年每个月度入境旅游人数预测(单位:万人)以下变量的预测:xdate预测95%置信限date预测95%置信限2016年1月1112.6791030.02921195.32872016年7月1
26、141.45221007.67161275.23272016年2月986.6735884.49351088.85352016年8月1163.43281025.82391301.04172016年3月1159.30931046.65331271.96522016年9月1131.0711989.8261272.31632016年4月1191.49261071.82491311.16032016年10月1188.12581043.38371332.8682016年5月1124.4214999.34151249.50122016年11月1140.8166992.68611288.94722016年6月
27、1099.2116969.54731228.87592016年12月1181.17521029.74621332.6041从表中不难看出关于2016年中国的入境旅游预测,2月是一个淡季,4月、10月、12月将是旺季,而且整体来看2016年下半年的形式将好于上半年。四、结论本文最终选择的基于季节乘积模型的ARIMA(1,1,1)(0,1,1)12可以较好的拟合中国入境旅游人数,所以商家可以使用该模型对未来中国的入境旅游人数进行预测,把握住商机选择在旺季进行相关的投资,以牟取利润。相关管理部门也可以依据预测值进行管理制度的规划和制定。参考文献1JohnC.hull.RiskManagementan
28、dFinancialInstitutionsM.3rd,NewYork:Wiley,2012.257-436.2王燕.应用时间序列分析M.3rd,北京:中国人民大学出版社,2012.150-202.3贾俊平.统计学M.5th,北京:中国人民大学出版社,2014.71-121.4朱世武.SAS编程技术教程M.2nd,北京:清华大学出版社,2013.83-392.5朱世武.金融计算与建模M.北京:清华大学出版社,2007.15-64.6GeorgeE.P.Box,GwilymM.Jenkins,GregoryC.Reinsel.TimeSeriesAnalysis:ForecastingandCo
29、ntrolM.4th,NewYork:Wiley,2011,123-187.附录原始数据:datenumberdatenumebrdatenumber2001年1月717.152003年7月776.942006年1月998.852001年2月611.412003年8月884.42006年2月871.442001年3月753.262003年9月807.582006年3月1002.982001年4月779.72003年10月854.992006年4月1097.092001年5月707.872003年11月828.422006年5月1002.392001年6月711.782003年12月876.68
30、2006年6月1000.452001年7月745.382004年1月808.732006年7月1090.42001年8月809.142004年2月753.32006年8月1114.772001年9月741.322004年3月855.162006年9月1043.772001年10月757.732004年4月954.712006年10月1138.312001年11月749.712004年5月877.472006年11月1042.092001年12月815.092004年6月893.392006年12月1092.512002年1月740.72004年7月959.032007年1月1022.98200
31、2年2月711.042004年8月971.562007年2月933.092002年3月839.542004年9月917.452007年3月1089.82002年4月807.772004年10月988.182007年4月1151.682002年5月787.922004年11月935.212007年5月1072.552002年6月795.772004年12月989.632007年6月1066.682002年7月849.372005年1月938.062007年7月1149.142002年8月890.682005年2月855.852007年8月1156.822002年9月865.122005年3月10
32、27.772007年9月1123.132002年10月869.572005年4月1024.762007年10月1160.142002年11月841.912005年5月995.142007年11月1109.12002年12月866.122005年6月989.422007年12月1152.222003年1月848.432005年7月1076.112008年1月1080.952003年2月737.62005年8月1067.412008年2月990.772003年3月785.142005年9月988.772008年3月1188.442003年4月564.922005年10月1054.792008年4月
33、1126.512003年5月543.62005年11月990.782008年5月1087.52003年6月652.62005年12月1018.312008年6月1017.21datenumberdatenumberdatenumber2008年7月1105.722011年1月1082.772013年7月1061.562008年8月1076.242011年2月961.052013年8月1080.652008年9月1056.42011年3月1133.782013年9月1053.592008年10月1122.822011年4月1227.672013年10月1135.592008年11月1055.09
34、2011年5月1122.182013年11月1079.282008年12月1095.092011年6月1099.692013年12月1085.952009年1月1033.192011年7月1176.522014年1月1062.862009年2月939.812011年8月1156.282014年2月889.952009年3月1054.072011年9月1109.652014年3月1065.42009年4月1151.442011年10月1176.392014年4月1125.062009年5月10332011年11月1126.272014年5月1062.832009年6月994.722011年12月
35、1170.132014年6月1025.282009年7月1072.042012年1月1060.892014年7月1061.362009年8月1109.192012年2月1020.522014年8月1095.542009年9月1006.372012年3月1150.182014年9月1076.482009年10月1113.542012年4月1178.942014年10月1131.872009年11月1039.562012年5月1097.612014年11月1094.512009年12月1100.672012年6月1080.642014年12月1158.72010年1月1069.712012年7月1
36、105.632015年1月10922010年2月940.342012年8月1128.292015年2月927.132010年3月1132.852012年9月1095.372015年3月1118.582010年4月1186.152012年10月1120.652015年4月1199.272010年5月1134.652012年11月1083.112015年5月1120.62010年6月1088.32012年12月1118.692015年6月1078.622010年7月1150.132013年1月1079.872015年7月1092.152010年8月1171.412013年2月943.082015年8月1119.872010年9月1103.692013年3月1185.392015年9月1133.462010年10月1163.642013年4月1081.342015年10月1181.522010年11月1089.342013年5月1065.252015年11月1146.672010年12月1146.022013年6月1056.232015年12月1171.9SAS实现过程:procimportdatafile="G:trip.xlsx"dbms
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 公司用工聘用合同标准文本
- 分包工程合同8篇
- 买房卖合同标准文本
- 关注行业动态的必要性计划
- 产品全国包销合同标准文本
- 丰台租房合同标准文本
- 评估品牌传播成效的策略计划
- 全职老师合同标准文本
- 电信行业安全隐患排查及治理计划
- 教研成果转化为教学实践计划
- 0-3岁婴幼儿保育与教育知到智慧树期末考试答案题库2024年秋甘肃财贸职业学院
- TDT1075-2023光伏发电站工程项目用地控制指标
- 急诊科运用PDCA循环降低急诊危重患者院内转运风险品管圈QCC专案结题
- 《北京市幼儿园玩具配备目录》
- 2024年四川省南充市中考英语试题含解析
- 2024年山东省德州市中考历史试卷真题(含答案)
- 医务人员职业暴露预防及处理课件(完整版)
- 2024年4s店善意索赔协议书模板
- 2023年材料员《与基础知识》核心考点题库(含详解)
- 常见业务场景网络安全建设VISIO图合集(27个类型)v2023
- 纯碱生产工(初级)考试题及答案
评论
0/150
提交评论