版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、关于入境旅游人数的时间序列分析专业:统计学 姓名:佟虹生指导老师:汪小英摘要大众旅游时代的到来, 使旅游日益成为现代人类社会主要的生活方式和社会经济活动, 旅游业以其强劲的势头成为全球经济产业中最具活力的“朝阳产业”。 随着社会生产力不断发展, 劳动生产率不断提高, 以及人们生活水平的迅速提高和带薪假期的增加, 旅游业将持续高速度发展,成为世界最重要的经济部门之一。中国同样如此,有数据统计 2014 年全国旅游及相关产业增加值占国内生产总值的比重为 4.33%。众所周知旅游业是一个存在显著季节效应的行业, 如果能对旅游业的客流量作出准确的预测, 将会有利于商家更好的把握商机。 本文选取入境旅游
2、的客流量作为时间序列, 将简单地分析该序列的季节效应,并对序列拟合ARIMA更型,并作出简单的预测。关键词:入境旅游;季节效应;时间序列;ARMIA预测一、 引言旅游是在人的基本生活需求得到适度满足后的一种新的消费行为, 一种带有浓厚文化内涵的群体活动。 人们离开常住地到异国他乡访问的旅行和暂时停留所引起的各种现象和关系的总和。我国拥有丰富的旅游资源, 疆域辽阔, 既有风景秀丽的江南水乡, 也有粗犷豪迈的西北风情;我国拥有悠久的历史文化,目前已经公布了 99 个国家级历史文化古城,长城、故宫、颐和园等已经被列入世界文化遗产名录;我国还是一个拥有多个民族的国家, 各个民族的习俗和风情很容易使人产
3、生很强烈的向往之情。所有这些, 都为我国旅游业的发展奠定了一个良好的基础, 使得我国吸引了大量的入境游客。入境旅游是指他国居民前来我国的旅游活动, 或者是指他国居民进入本国国境以内的旅游活动, 入境旅游属于国际旅游。 目前入境旅游已成为构成我国旅游业的重要组成部分。时间序列分析(Time series analysis) 是一种动态数据处理的统计方法。该方法基于随机过程理论和数理统计学方法, 研究随机数据序列所遵从的统计规律,以用于解决实际问题。 因此本文将通过时间序列分析的方法来研究分析中国的入境旅游人数。二、研究方法差分运算具有强大的确定性信息提取能力, 许多非平稳序列差分后会显示出平稳序
4、列的性质, 这是我们成这个非平稳序列为差分平稳序列。 对差分平稳序列可以使用ARIMA真型进行拟合。具有 如 下结 构 的 模 型称 为 求 和 自 回 归 移 动 平均 ( autoregressive integrated moving average ),简记为 ARIMA(p d, q)模型:,式中, ; ,为平稳可逆ARM(A p, q)模型的自回归系数多项式; ,为可逆ARM(A p, q)模型的移动平滑系数多项式。ARIMA(p, d, q)模型是指d阶差分后自相关最高阶数为p,移动平均最高 阶数为q的模型,通常它包含了 个独立的未知系数:,。如果该模型中有部分自相关系数或部分移
5、动平滑系数为零,即原ARIMA(p, d, q)模型中有部分系数省缺了,那么该 模型称为疏系数模型。疏系数模型一般形式为式中, , 为非零自相关系数的阶数, , 为非零移动平滑系数的阶数。在实际操作中,疏系数模型时有应用。ARIMA真型可以对具有季节效应的序列建模。根据季节效应提取的难易程度, 可以分为简单季节模型和乘积季节模型。简单根节模型是指序列中的根节效应和其他效应之间是加法关系,即式中, 代表序列的长期趋势波动; 代表序列的根节性(周期性)变化; 代 表随机波动。这时, 各种效应信息的提取都非常容易。 通常简单的周期步长差分即可将序列中的季节信息提取充分,简单的低阶差分即可将趋势信息提
6、取充分, 提取完季 节信息和趋势信息之后的序列就是一个平稳序列,可以用ARMA®型拟合。所以简单季节模型实际上就是通过趋势差分、季节差分将序列转换为平稳序 列,再对其进行拟合。它的模型结构通常如下:式中,(1) D为周期步长,d为提取趋势信息所用的差分阶数。(2) 为白噪声序列,且,。(3) ,为q阶移动平均系数多项式。(4) ,为p阶自回归系数多项式。但更为常见的情况是,序列的季节效应、长期趋势和随机波动之间有着复杂 德尔交互影响关系,简单的ARIMA真型并不足以提取其中的相关关系,这时通常 需要采用乘积季节模型。乘积模型的构造原理如下:当序列具有短期相关性时,通常可以使用低阶 A
7、RMAp, q)模型提取。当序列具有季节效应,季节效应本身还具有相关性时,季节相关性可以使用 以周期为步长单位的ARMAP, Q)模型提取。由于短期相关性和季节效应之间具有乘积关系,所以拟合模型实质为ARMA(p, q)和ARMA P, Q)的乘积。综合前面的d阶趋势差分和D阶以周期S为 步长的季节差分运算,对原观察值序列拟合的乘积模型完整的结构如下:式中,该乘积模型简记为。三、对中国入境旅游人数的实证研究本文实证研究所选取的数据是中国入境旅游人数, 数据频率为月度,客流量 单位为万人,时间跨度从2001年1月至2015年12月,共计180个数据,来源 于中经网统计数据库。3.1 原序列以及差
8、分序列的相关检验3.1.1 原序列的平稳检验图3.1原始序列时序图首先画出原始序列的的时序图,进行观察,并结合单位根检验判断它的平稳 性,图3.1为原始序列的时序图,表3.1为原始序列的3阶单位根检验结果。number130012001100100090080070060050001JA N2000 01JA N2002 01JAN 200401JAN2006 01JA N200801JAN201001JAN2012 01JA N201401JAN2016date表3.1原始序列3阶单位根检验结果增广Dickey-Fuller单位根检验滞后RhoPr < RhoTauPr < Ta
9、uFPr > F零均值0-0.12370.6538-0.120.642110.17170.72230.220.750520.30170.75480.630.852030.31730.75870.780.8810单均值0-28.44290.0013-4.020.00178.170.00101-19.91340.0102-3.440.01096.170.00882-8.68380.1794-2.310.16843.130.27273-6.78220.2846-2.080.25372.730.3758趋势0-63.34600.0005-6.19<.000119.160.00101-49.
10、06450.0005-5.060.000312.960.00102-21.01210.0498-3.200.08745.260.1262增广Dickey-Fuller单位根检验US滞后RhoPr < RhoTauPr < TauFPr > F3-16.19230.1367-2.770.21173.980.3823从时序图中可以观察到这是一个典型的有着上升趋势的非平稳序列,同时单位根检验也印证了我们的判断,从2阶开始p值大于0.05说明原始序列非平稳。 同时从时序图中,我们还可以观察到原始序列在上升趋势的同时,还具备明显的 周期性,周期长度为12,与常识的认知相符合。所以接下来
11、要考虑对原始序列 进行1阶12步差分处理,1阶差分去除原始序列的趋势,1阶差分后的序列进行 12步差分提取差分后序列的季节信息即周期性。3.1.2 差分序列的相关检验图3.2 差分后序列的时序图我们对1阶12步差分以后的序列进行平稳性和白噪声检验,图 3.2为差分 后序列的时序图,表3.2为差分后序列的3阶单位根检验结果,表3.3为差分后 序列的白噪声检验结果。x_1_12 4003002001000 .-100-20001JA N200001JAN2002 01JA N2004 01JAN 2006 01JA N2008 01JA N201001JAN2012 01JA N201401JAN
12、2016date增广Dickey-Fuller单位根检验滞后RhoPr < RhoTauPr < TauFPr > F零均值0-212.7480.0001-17.23<.00011-209.2930.0001-10.18<.00012-337.9990.0001-9.06<.00013-697.2170.0001-8.03<.0001单均值0-212.7430.0001-17.18<.0001147.630.0010表3.2差分后序列的3阶单位根检验结果1-209.2950.0001-10.15<.000151.510.00102-338.
13、0060.0001-9.03<.000140.780.00103-697.5660.0001-8.01<.000132.070.0010趋势0-212.7520.0001-17.13<.0001146.760.00101-209.3970.0001-10.12<.000151.220.00102-338.1520.0001-9.00<.000140.530.00103-700.5710.0001-7.99<.000131.890.0010表3.3差分后序列的白噪声检验结果白噪声的自相关检查至滞后卡方自由度Pr 卡方自相关620.1560.0026-0.281
14、0.085-0.1550.001-0.0730.0531267.6012<.0001-0.0380.0220.053-0.0170.155-0.4811892.4418<.00010.193-0.1910.177-0.0660.117-0.1042498.5024<.00010.083-0.0410.047-0.1150.079-0.032从1阶12步差分后的序列时序图中不难看出,已经充分地提取了原始序列的趋势,同时差分后的序列也没有明显的周期性,当然差分后序列的3阶单位根 检验也印证了我们的判断。再观察差分后序列的白噪声检验结果,发现无论是 6 阶、12阶、18阶或是24阶
15、,p值都小于0.05,说明差分后的序列为一个非白噪声序列,所以综上,我们可以判断原始序列经过1 阶 12 步差分以后得到一个非白噪声的平稳序列, 有分析的价值, 考虑到季节效应, 可以尝试对差分以后的序列拟合ARIMA真型。3.2 拟合ARIMAf型3.2.1 考虑简单季节模型观察 1 阶 12 步差分后序列的自相关系数和偏自相关系数图,图 3.3 为差分后序列的自相关系数,图 3.4 为差分后序列的偏自相关系数。图3.4差分后序列的偏自相自相关砺方星相关住4 98 7,55432101234567S41amD3099.9531?KXXJI*>«*0170445-2SQ79II
16、*D 077352225*5970.G&L52I,|*O.:53:5334793翌-J54K1 0JW3772423017200J0O0711D.K54&45224936-.072551* *0,0054646*643351,U0S8327118.非6-0350055025£57 5507犯皿但厂0.M5319163阑Q.052&61.*。厕M10>51.169209-,015511C 映353114515530.15534匚一,*0.M&37712*1482259-48135*+.。.溺故1359Ml30.193:41,f0.102591145
17、;2306-19107II*0/ :4744155492230,177171.4 M*0J06S1116-204500-.065971*0.10S55617网236QJ17171.* .0.10S7961S工1即IIX 543192S6S3B0.GS2S81.口笈2D*125527-.3409111011051221146523。即71-*0.11060222-3S54G4-.114651,*0.110723232464210.D73491.4+ .0.111432247 962553-.031601* 0,111771恂自相关滞后相关性-14: 87 6 5 4 3 2 1()12:J 4
18、=6 7 ti 9 11-0.26079充*童*2O.OOS16-3-0.14038*4-008741S-0.09880重查6-0.014207-0,04162*B-0.0291S90.0S567*100.00195110.17073*12-0.4393913-0.C362214-0.1532915-0 0093216-0.0630S17-0,011661B-0.01657*19-0.02233200,00713210.0407722-0.11361230.1599624-0.29367自相关图显示延迟12阶自相关系数显著大于2倍标准差范围,这说明差分 后序列中仍然蕴含着非常显著的季节效应。延
19、迟 1阶、2阶的自相关系数也大于 2倍标准差,这说明差分后的序列还具有短期相关性。观察偏自相关图,得到结 论基本一致。根据自相关系数和偏自相关系数的性质,可以尝试拟合疏系数模型AR (1,12)、MA (1,2,12 )、ARMA; (1,12), (1,2,12 ),表 3.4、表 3.5、表 3.6 分别为3种模型的残差白噪声检验结果。表3.4 AR (1,12)的残差白噪声检验结果残差的自相关 检查自相关防身多度方6i 54 0 -0.000 0 0.3 0 .4 0 00109 31 172 7 6 17 680 2 41110-00-0-2:20 . 0.0.0.0 .00.1.9
20、7 004 0145 5rj v.80 1 1 53 58 7表3.5 MA (1,2,12 )的残差白噪声检验结果残差的自相关检查至滞 后卡方自由 度Pr 卡方自相关66.2430.0013-0.0670.020-0.136-0.058 -0.0760.0601211.3890.0802-0.044-0.011-0.009-0.0960.041-0.124表3.6 ARMA (1,12), (1,2,12 )的残差白噪声检验结果残差的自相关检查至滞 后卡方自由 度Pr 卡方自相关610.3810.0013-0.1360.081-0.156-0.036 -0.0810.0571228.5470
21、.0002-0.0390.0050.025-0.0850.072-0.292从以上模型残差的检验结果可以看出,三种模型的残差在滞后6阶的白噪声 检验中p值都小于0.05,都不能通过,说明残差在短期还有信息没有提取完全, 所以模型拟合效果均不理想。考虑到该序列既具有短期相关性又具有季节效应, 而且短期相关性和季节效应使用加法模型无法充分、有效提取,可以认为该序列 的季节效应和短期相关性之间具有复杂的关联性。这时,假定短期相关性和季节 效应之间具有乘积关系,尝试使用乘积模型来拟合序列的发展。3.2.2 考虑乘积季节模型还是观察1阶12步差分之后序列的自相关系数和偏自相关系数图,两者显 示12阶以内
22、的自相关系数和偏自相关系数均不截尾,所以尝11Mg用ARMA1,1 )模型提取差分后序列的短期自相关信息。在考虑季节自相关特征,这时考察延迟 12阶、24阶等以周期长度为单位的 自相关系数和偏自相关系数的特征,自相关系数图(图 3.3)显示延迟12阶自 相关系数显著非零,但是延迟 24阶自相关系数落入2倍标准差范围。而偏自相 关系数图(图3.4)显示延迟12阶和延迟24阶的偏自相关系数都显著非零。所 以可以认为季节自相关特征是自相关系数截尾,偏自相关系数拖尾,这时以12步为周期的ARMA0,1) 12模型提取差分后序列的季节自相关信息。综合前面的差分信息,要拟合的乘积模型为ARIMA(1,1,
23、1 )(0,1,1 ) 12表3.7为该模型条件最小二乘下的参数估计。 表3.8参数估计条件最小乘估计参估计 标 t 近沸数准似后误值 Pr差>|t|MU-0.10.3 -0 0.5 09927 054 .6 15025MA0.84 0.0 10 <.0 11,881 783 .8 001193条件最小乘估计参估计标t近洲数准似后误值Pr差>|t|MA0.800.015<.012,888508.90012180AR0.570.14.<.011,6042087700113可以看到,该模型除去常数项不显著外,其余系数都显著非零,所以重新拟 合不含常数项的该模型,并观察
24、残差序列的白噪声检验。表3.8为不含常数项的 参数估计,表3.9为不含常数项下的残差序列白噪声检验结果。表3.8不含常数项的参数估计条件最小乘估计参数估计标准误差t值近似Pr > |t|滞后MA1,10.83316 0).084619.85<.00011MA2,10.80609 0).0509515.82<.000112AR1,10.56010 0).126694.42<.00011表3.9 不含常数项的残差白噪声检验结果残差的自相关检查方助甘>于方自相关62 .2 230 - .02 07 18 40 .0 3 4- 0(.0 044-0 )0. )。12 1
25、81490 -0 -0 02.3.08 .0 .0,0058 07 40 20072 06 73)6 0,3 91110 0-0 -0083 .5.5 00 .00 .0064 23 791808 01 9)5 013 9从表3.8可以看出不含常数项的模型中所有系数均显著, 表3.9则说明不含 常数项的模型残差序列均不拒绝为白噪声序列, 所以模型拟合成功,得到最终的 模型的口径为:将序列拟合值和序列观察值联合作图。图3.5为拟合值和观察值联合图number130012001100100090080070060050001JA N2000 01JA N2002 01JAN 200401JAN20
26、06 01JA N200801JAN201001JAN2012 01JA N201401JAN2016date图3.5拟合值和观察值联合图图中分别作出模型拟合值以及模型拟合在95函信水平下的置信上下限,均以折现连接,图中星星标记未连接的即为实际观测值,可以直观地看出该季节乘积模型对原序列拟合效果良好。3.3预测利用该模型对2016年的入境旅游人数进行预测,并绘制预测序列的时序图 表3.10为2016年每个月度入境旅游人数的预测值(单位:万人)。表3.10 2016年每个月度入境旅游人数预测(单位:万人)以下变量的预测:xdate预测95%置信限date预测95%置信限2016年1月1112.6
27、791030.02921195.32872016年7月1141.45221007.67161275.23272016年2月986.6735884.49351088.85352016年8月1163.43281025.82391301.04172016年3月1159.30931046.65331271.96522016年9月1131.0711989.8261272.31632016年4月1191.49261071.82491311.16032016年10月1188.12581043.38371332.8682016年5月1124.4214999.34151249.50122016年11月1140.
28、8166992.68611288.94722016年6月1099.2116969.54731228.87592016年12月1181.17521029.74621332.6041从表中不难看出关于2016年中国的入境旅游预测,2月是一个淡季,4月、 10月、12月将是旺季,而且整体来看 2016年下半年的形式将好于上半年。四、结论本文最终选择的基于季节乘积模型的 ARIMA(1,1,1) (0,1,1) 12可以较好的拟合中国入境旅游人数, 所以商家可以使用该模型对未来中国的入境旅游人数进行预测, 把握住商机选择在旺季进行相关的投资, 以牟取利润。 相关管理部门也可以依据预测值进行管理制度的规
29、划和制定。参考文献1John C.hull.Risk Management and FinancialInstitutionsM.3rd,NewYork:Wiley,2012.257-436.2 王燕 . 应用时间序列分析M.3rd ,北京 : 中国人民大学出版社, 2012.150-202.3 贾俊平 . 统计学 M.5th, 北京 : 中国人民大学出版社 ,2014.71-121.4朱世武.SAS编程技术教程M.2nd,北京:清华大学出版社,2013.83-392.5 朱世武 . 金融计算与建模M. 北京 : 清华大学出版社,2007.15-64.6George E.P.Box,Gwily
30、m M.Jenkins,Gregory C.Reinsel.Time SeriesAnalysis:Forecasting and ControlM.4th,New York:Wiley,2011,123-187.附录原始数据:datenumberdatenumebrdatenumber2001年1月717.152003年7月776.942006年1月998.852001年2月611.412003年8月884.42006年2月871.442001年3月753.262003年9月807.582006年3月1002.982001年4月779.72003年10月854.992006年4月1097.0
31、92001年5月707.872003年11月828.422006年5月1002.392001年6月711.782003年12月876.682006年6月1000.452001年7月745.382004年1月808.732006年7月1090.42001年8月809.142004年2月753.32006年8月1114.772001年9月741.322004年3月855.162006年9月1043.772001年10月757.732004年4月954.712006年10月1138.312001年11月749.712004年5月877.472006年11月1042.092001年12月815.092
32、004年6月893.392006年12月1092.512002年1月740.72004年7月959.032007年1月1022.982002年2月711.042004年8月971.562007年2月933.092002年3月839.542004年9月917.452007年3月1089.82002年4月807.772004年10月988.182007年4月1151.682002年5月787.922004年11月935.212007年5月1072.552002年6月795.772004年12月989.632007年6月1066.682002年7月849.372005年1月938.062007年7月
33、1149.142002年8月890.682005年2月855.852007年8月1156.822002年9月865.122005年3月1027.772007年9月1123.132002年10月869.572005年4月1024.762007年10月1160.142002年11月841.912005年5月995.142007年11月1109.12002年12月866.122005年6月989.422007年12月1152.222003年1月848.432005年7月1076.112008年1月1080.952003年2月737.62005年8月1067.412008年2月990.772003年3
34、月785.142005年9月988.772008年3月1188.442003年4月564.922005年10月1054.792008年4月1126.512003年5月543.62005年11月990.782008年5月1087.52003年6月652.62005年12月1018.312008年6月1017.21datenumberdatenumberdatenumber2008年7月1105.722011年1月1082.772013年7月1061.562008年8月1076.242011年2月961.052013年8月1080.652008年9月1056.42011年3月1133.782013
35、年9月1053.592008年10月1122.822011年4月1227.672013年10月1135.592008年11月1055.092011年5月1122.182013年11月1079.282008年12月1095.092011年6月1099.692013年12月1085.952009年1月1033.192011年7月1176.522014年1月1062.862009年2月939.812011年8月1156.282014年2月889.952009年3月1054.072011年9月1109.652014年3月1065.42009年4月1151.442011年10月1176.392014年4
36、月1125.062009年5月10332011年11月1126.272014年5月1062.832009年6月994.722011年12月1170.132014年6月1025.282009年7月1072.042012年1月1060.892014年7月1061.362009年8月1109.192012年2月1020.522014年8月1095.542009年9月1006.372012年3月1150.182014年9月1076.482009年10月1113.542012年4月1178.942014年10月1131.872009年11月1039.562012年5月1097.612014年11月109
37、4.512009年12月1100.672012年6月1080.642014年12月1158.72010年1月1069.712012年7月1105.632015年1月10922010年2月940.342012年8月1128.292015年2月927.132010年3月1132.852012年9月1095.372015年3月1118.582010年4月1186.152012年10月1120.652015年4月1199.272010年5月1134.652012年11月1083.112015年5月1120.62010年6月1088.32012年12月1118.692015年6月1078.622010年
38、7月1150.132013年1月1079.872015年7月1092.152010年8月1171.412013年2月943.082015年8月1119.872010年9月1103.692013年3月1185.392015年9月1133.462010年10月1163.642013年4月1081.342015年10月1181.522010年11月1089.342013年5月1065.252015年11月1146.672010年12月1146.022013年6月1056.232015年12月1171.9SAS实现过程:proc import datafile ="G:trip.xlsx"dbms =excel out =a; /*2001 年 01 月-2015年12月*/sheet ="sheet1" ;getnames =yes;run ;data a;set a;rename date=t number=x;run ;proc gplot data =a;plot x*t;s
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025届常熟中学高考仿真卷英语试题含解析
- 混凝土搅拌站供应合同协议
- 合同违约责任认定
- 2024年度建筑施工物流合同:工程材料与设备的运输服务
- 企业劳动合同书示例
- 商业街大面积店铺租赁合同范本
- 2024年度洛阳固体废物处理与资源化合同
- 摊位租赁合同模板汇编
- 2024年保姆照顾老人合同书
- 年度趸购电合同范本
- 2.1.1 中国的地形(山脉纵横交织)(课件) 八年级地理 (湘教版)
- 《雁门太守行》复习省公开课一等奖全国示范课微课金奖课件
- 临床医学职业生涯规划
- 幼儿园课程故事开展培训
- 天津市长期护理保险护理服务项目和标准
- 重大版小学英语六年级上册全册教案
- 高考语文一轮复习课件《劝学》《师说》
- 匠心筑梦成就出彩人生-大学生就业指导智慧树知到期末考试答案2024年
- 我国法治建设的历程+高中政治统编版必修三
- 国投集团笔试测评题
- (高清版)DZT 0214-2020 矿产地质勘查规范 铜、铅、锌、银、镍、钼
评论
0/150
提交评论