下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、基于SARIMA和二次曲线模型增值税预测分析江西财经大学涂小青、夏友亮、张运金摘要:增值税税收与一个国家的GDP有密切的关系,可以通过分析增值税的税收情况来反映经济的运行情况。未来更好的把握税收的收入情况,及时掌握国民经济的走势,有必要建立一个有效的预测模型来对税收进行预测,及时为决策者提供可靠及时的数据。在增值税的数据中即包含有随机波动的影响因素,有含有与时间相关的长期趋势,通过两个模型从不同的方面对税收数据进行拟合,最后综合两个模型的预测优势,做出最优的预测。关键字:sarma二次曲线增值税预测Abstract:Valueaddedtaxtaxandacountry'sGDPhas
2、closerelationship,youcananalyzetheATtaxsituationtoreflecttherunningsituationoftheeconomy.Thefuturebettergraspofincometax,tograspthetrendofthenationaleconomy,itisnecessarytoestablishaneffectiveforecastmodeltopredictontaxes,intimeforthedecision-makertimelydata.Inthevalueaddedtaxofdataisabouttheinfluen
3、cefactorsofrandomfluctuation,containsthelong-termtrendsrelatedwithtime,throughthetwomodelsfromadifferentaspectoftaxdatafitting,thelastcomprehensivetwomodelpredictionsadvantage,makethebestprediction.1、前言:如何对未来税收进行合理预测,这是制定未来税收任务应该首先解决的问题。以往对一个地区税收预测主要是通过对重点税源调查,将数据进行整理汇总,来推测出一个地区税收的总收入,这种处理方法工作量大而且缺乏
4、对纳税整体的把握,当一个地区税源比较复杂重点税源企业税收不能占绝对优势时,汇总预测精度往往不够高。而现有很多政策还受计划体制响,税收任务的制定很多时候都是行政式的,不能合理反映事物发展的趋势。一个地区经济发展过程从较长时间看,在市场机制的作用下呈现比较明显的趋势,这为预测提供了依据;从短期看,由于受到宏观政策、市场即期需求变化等不确定因素影响,表现出一定的波动,这对预测造成了困难。目前预测经济运行一般采取的是时间序列方法,比较经典的有灰色理论、多项式曲线、ARIMA模型等,这些模型对经济长期趋势一般把握比较准。在东部个别沿海发达城市已经将时间序列分析方法用作对经济发展指标的预测,并取得了很好的
5、效果。当然在实际应用中选取何种时间序列模型要根据数据本身的特点作出具体分析。2、模型简介:ARIMA模型全称为自回归移动平均模型(AutoregressiveIntegratedMovingAverageModel,简记ARIMA),是由博克思(Box)和詹金斯(Jenkins)于70年代初提出的一著名时间序列预测方法,所以乂称为box-jenkins模型、博克思-詹金斯法。其中ARIMA(p,d,q)称为差分自回归移动平均模型,AR是自回归,p为自回归项;MA为移动平均,q为移动平均项数,d为时问序列成为平稳时所做的差分次数。ARIMA模型的基本思想是:将预测对象随时间推移而形成的数据序列视
6、为一个随机序列,用一定的数学模型来近似描述这个序列。这个模型一旦被识别后就可以从时间序列的过去值及现在值来预测未来值。现代统计方法、计量经济模型在某种程度上已经能够帮助企业对未来进行预测。将预测指标随时间推移而形成的数据序列看作是一个随机序列,这组随机变量所具有的依存关系体现着原始数据在时间上的延续性。一方面,影响因素的影响,另一方面,乂有自身变动规律。ARMA模型(Auto-RegressiveandMovingAverageModel)是研究时间序歹U的重要方法,由自回归模型(简称AR模型)与滑动平均模型(简称MA模型)为基础“混合”构成。ARIMA模型分为以下三种:1. 自回归模型(AR
7、:Auto-regressive)如果时间序歹0yt满足yt=yt-i.yt*其中屯是独立同分布的随机变量序列,且满足:2Var;t-0以及E(;t)=0则称时间序列为服从p阶的自回归模型。自回归模型的平稳条件:滞后算子多项式:,(B)=1®i(B).Bp的根均在单位圆外,即4(B)=0的根大丁1。2. 移动平均模型(MA:Moving-Average)如果时间序歹0yt满足yt=;t-口1-;t_q则称时间序列为服从P阶移动平均模型;移动平均模型平稳条件:任何条件下都平稳。3. 混合模型(ARMA如果时间序歹0yt满足:yt=fyt1.ppyt,4-j_._q则称时间序列为yt服从
8、(p,q)阶自回归滑动平均混合模型。或者记为4(B)yt=9(B)%二次曲线模型是趋势外推法的一种,对丁大量社会经济现象的发展主要是渐进型的,其发展相对丁世界具有一定的规律性。因此,当预测对象依时间变化呈现某种上升或下降的趋势,并且无明显的季节波动,乂能找到一条合适的函数曲线反映这种变化趋势时,就可以用时间t为自变量,时序数值y为因变量,建立模型:y=f(t)当有理由相信这种趋势能够延续到未来时,赋予变量t所需要的值,就可以得到相应时刻时间序列未来值,这就是趋势外推法。它的主要优点是可以揭示事物未来的发展,并定量地估计其功能特性。当y=f(t)是一个以t的二次方为最高次籍的时候,这个多项式模型
9、就是二次曲线模型3、模型的建立1)序列分析从数据的时序图可以明显的看到序列是存在明显的长期趋势,对丁有长期趋势的数据,对其进行差分就可以化非平稳序列为平稳序列,这样就可以进行ARMA模型分析。同时,我们根据常识和现实的数据的波动情况可以知道该序歹0中还含有季节因素的信息。差分之后,先对差分后的序列进行平稳性,白噪声检验,然后再做进一步分从图二中,我们直观看到一阶差分的时序图是平稳性的,为了进一步确认差分后的序列平稳,对其做单位根检验。一阶差分后的数据,虽然是平稳的,但是,我们知道该序列中是蕴含有季节影响因素的,我们为了跟好的做出模型,可以再差分后的序列上进行12阶差分,以提取季节信息。Augn
10、ieiitedDickey-FullerUnitRootTestonDFNullHypothesis:DFhasaunitrootExogenous:ConstantLagLength:11(AutomaticbasedonSIC,WIAXLAG=12)StatisticProb*AugmentedDickey-Fullerteststatistic-3.41443100123Testcriticalvahes:1%level-34S41985%level-280515110%level-2579385"MacKinnon(1996)one-sidedp-values.图三一阶差分后
11、序列df的单位根检验结果从图三的ADF单位根检验结果可以看到,概率P值(0.0123)小丁给定的显著性水平0.05,所以拒绝存在单位根的原假设,即认为序列df是平稳的。ACPACQ-StatProb-0.3260.32E14.6790.000-0.251-0.40C234330.0000072-0.23C24.1690.0000.044-0.16624.43700000.1180.07526.4140.000-0.287-0.20236.132OJOO图四白噪声检验结果看一阶差分的Q统计量的P值,小丁0.05,拒绝1阶差分后的Y序列是白噪声序歹0,即认为对该序歹0进行进一步的分析是有意义的。2
12、) 模型的识别1、SARMA模型做出数据的自相关图和偏自相关图,如图五所示,通过分析及经验可以认为该数据自相关系数拖尾,偏自相关系数12阶截尾,根据一般情况处理,这符合AM(p)模型的特征,并且系数p可以取为12。这里我们取得是12阶,这很可能与数据具有周期性有关系,可能还蕴含有周期波动的信息,我们再建立一个把季节因素考虑进模型的SARIMA模型。AutocorrelationPartialCorrelationACPACQ-SiatProbIIo11-0328-0.328U9710.000II1112-0.200-0412244110.00011匚130.061-0.26224.9420.0
13、0011匚140.054-0.19625.3500.000111|50.1280.05927.6880.0001_116-0.286-C.2S739.5090.00011170.1360037411880.000II|I01300790054430950.0001111=19022544.2320.000UII匚110-0.294-0.20657.1220000匚11J11_111 -0.220-0.49064.3680.00012 07050.351139.51Q.000II1<13-0.2470.07214S.820.000匚11|14-0.1710.060153.310.000II
14、II1口115-0.011-0.09S153.330.0001】11口11600G1-0.117153.910.C00II1170.2000135160.210.000II11119-0.3040.039174.9400001JI11190.0980.01017649Q.00011|it1200.071-0.102177.310.000II|心1210076-0.129178.260.00011】|22-0.2190052186.150.000匚II1|23-01590052190.380.000111240503-0,001232.030.000CII1125-0.1500017236.65
15、0.000匚1C126-0.164-0,141241.250.000id11127-0.050-0.011241.670.00011|i230.064-0.049242.390.0001口1290.160-C139246.900.000II130-0,1730,089252.210.000II111310.051O.OOB252.670.000|11113200280002252.S10.0001T111330.0910029254.310000匚111>34-0.11Z0-0.047259.640.00011JI35-0.11380.046263.160.000111360.3750.
16、023289.530.000图五自相关系数和偏自相关系数2、基丁时间因素长期趋势的回归模型我们从时序图明显的看到该序列与时间具有与时间关系的线性关系,因此,可以通过建立曲线线性回归模型来对该列数据的长期趋势进行拟合,并作出预测。通过对比一次,二次和三次模型的R方和拟合残差,选择R方较大的和残差相对较小的模型是相对最优的。通过表一比较,由丁一次模型的R方是较次的小,同时该模型的拟合残差乂是较大的,所以首先就把这个模型排除掉。接下来比较二次和三次模型的的拟合效果,这两个模型的R方和拟合残差比较接近,不是很好比较得出结论,但是我们从后面的分析可以知道,三次模型中的参数估计有一个是不显著的,没有通过T
17、检验。所以综合得出,二次模型是相对较好的模型一次模型二次模型三次模型R方0.93860.95390.9559Residual2125494159612315284943)模型参数的估计1、Arima模型通过模型的识别,我们选定了MA(12)模型,下一步就是利用序列的观察只确定该模型的口径,即估计模型中未知参数的值。VariableCoefficientStd.Errort-StatisticProb.AR0.2S77190.0732214.0660370.0001AR(2)0.1200660.0781291.5367650.1271AR(3)0.1683170.0748372249104002
18、64AR(4)00700700077527090380303630AR(5)0171361007959821S023000313AR(6)-00261690084485-030975407573AR(D0.0662170.0839500.6696500.5044AR(e)-0.0782820.081585-0.9595160.3393AR®-0.1415840.083949-1.6865570.0944AR(10)-02863390078372-365357900004AR(11)-00S44560.057364-096671303358AR(12)07099050.08798390
19、91600oooooR-squared0.975312Meandependentvar1075.608AdjustedR-sciuared0.972909S.Ddependentvar405.9734ofregression73.39811Akaikeinfocriterion11.69271Sumsquaredresid722985.0Schwaricriterion11Q6423Loglikelihcod-718.7942Hannan-Quinncrlter.11G0301Durbin-Watsonstat1375201InvertedARRoots1.011,89七38i.89-.3BI
20、.54+.85I.54-85i.02+1OOi.02-1.001-.49-.84I-.4S+.84I-,85-.49i-.85+.49i-.93EstimatedARprocessisnonstationaiy图六模型参数估计结果从图六的参数估计结果可以看到,该模型的R方是0.9753,比较大,说明该模型的拟合效果还好。该模型中延迟2、4、6、7、8、和11阶的系数都是没有通过检验,即认为该模型中,这些延迟阶数前得系数是不显著的。因此,我们剔除这些,建立疏系数模型。VariatjieCoefficientStd,ErrorVStatisticProb.AR(1)0.3141280.059194
21、5.3067460.0000AR(3)0.2125270.0594953.5721B80.0005AR(5)0.1621670.07C4222.30278700230AR(10)-0.3197510069140-4.82466300000AR(12)0.7060480.05576210.736490.0000R-squared0.973320Meandependentvar1075.608AdjustedR-squared0.972439S.D.dependentvar405.9734S,E.ofregression00.67855Akaikeinfocriterion11.65800Sums
22、quaredresid781083.5Schwarzcriterion11J7113Loglikelihood-723.5250Hannan-Quinncriter.11J0395Durbin-Watsonstat1.529915InvertedARRoots1.01G7-41i.87+.41I53-.E4I.53+.B4i02-1.00i.02+1OOi-.51+.S5I-51-,85i-,82-.47i-.62+47i-.69EstimatedARprocessisnonstationary图七疏系数模型建立的参数估计结果这个建立的是建立的疏系数模型AR(1,3,5,10,12),这里的A
23、IC和BIC分别为11.675800和11.77113,比前面把全系数模型的AIC和BIC更小,说明这个模型更优,也就是说,在剔除了延迟2、4、6、7、8、和11阶后建立的疏系数模型比全系数模型具有更好的拟合效果。同时,我们看到这两个模型之间的R方的变化时很小的,并且疏系数模型的R方是较大的,符合要求。运用疏系数模型得出的最后的拟合结果方程是:一1(1B)Xt35_10m?,t1-0.314B-0.2125B3-0.162B50.320B-0.706B上面建立的疏系数模型AR(1,3,5,10,12)具有良好的模型解释能力,我们可以通过该模型来拟合这些数据的特征,也可以通过该模型来预测下几期数
24、据。在模型拟合之后,通过分析模型残差图,可以看到,该残差并不是白噪声序歹0,同时通过对该序歹0进行白噪声检验,也可以知道该序歹0是非白噪声序歹0,也就是说,我们通过上面的这个模型所提取的信息还不是很充分的。这也就是说,虽然上面的疏系数模型能够很好的拟合该列数据,但是,对原始序列信息的提取还不是很充分。因此,需要对该模型进行改进。图八疏系数模型AR(1,3,5,10,12)拟合残差图2、SARMA模型由丁前面的建立的疏系数模型AR(1,3,5,10,12)是一个没有考虑到季节影响因素的模型,但是我们通过前面对数据的分析可以知道,该列数据时包含有季节影响因素的信息。为了信息的提取充分,我们把季节因
25、素提取出来在做进一步分析。对差分后的序列在做一次12阶差分,之后再次拟合ARMA模型。我们建立简单季节模型,简单季节模型实际上就是趋势差分,季节差分之后序列即可转化为平稳,再对差分后的平稳序列进行拟合,它的模型结果通常如下:其中D为周期步长,d为提取趋势信息所用的差分阶数AutocorrelationPartialCorrelationACPACQ-StatProb11111II1o二111111III11111111I)111】111111111>1 -0.367-09G799.99100002 0.595-0905145.2700003 -0.220-0.665151.960.000
26、4 -01103-0.364153.340.0005 0.3240.023157.10O.OOQ6 -04080304199.1500007 0.360-02S8206.4500008 -01970248211.6700009 -0.052-0,12121203000010 0.333-0,129227.240.00011 -0.5700.165272.200.00012 0.5B30.006337.25000013 -0.327-0.Q9239257000014 0.419-0056417.5S000015 -0.131012442000000016 -0J510.031423,290.00
27、017 0.351-0.137441.300.00018 -0.4330.0064SB.870.00019 03910138491000020 -0.249-0.098500950.00021 0.1440.00750124000022 0175-002250591000023 -0.3480.018524.630.00024 0.4260.001553.000.00025 -0.389*0.153576.840.00026 0.2540062597.13000027 -0.0710050537930.00028 -010G-005S53977000029 0.2330010598740000
28、30 9288-0.009612,520.00031 0.2660.030624.420.00032 -0173-0.025629.810.00033 0.040000363013000034 0.090-0.00163177000035 -0.206-0019639.19000036 0.2400063650120000厂1匚1I11111zzi11ai匚1匚11u11_1111101011<1111<1011II11111<1111111:.11111LI_iiiiiii1111nii11jii1'1iri匚1匚11111l1匚11=11匚1图九剔除季节和长期趋势
29、的序列YS的自相关图和偏自相关图通过分析,这个序列的偏自相关系数8阶截尾,自相关系数拖尾,我们可以对YS序列做AR(8)模型的拟合。对该序列进行拟合模型的参数的估计结果如图十,该模型中的R方较大,同时,各个参数的T检验都通过了,我们可以得出使用这个模型得出的拟合方程如下:(1-B)(1-B12)=234567814.67B11.00B217.23B319.70B41682B510.45B64.27B70.86B8从结果中,我们也可以看到,该模型拟合的效果是非常好的,因此用该模型对数据进行拟合是很好的解释效果的。variableCoefficientStd.Error1-StatisticPro
30、b74.914050000043503440000032143450000025924390000021767420000018.543200.000015.63988O.OODO12393780.0000-4.6679100062310-10996020.26277617.229660.53602419700250.759912-16.822530772836-10.444960,669278-4,2732310.273227-0.8606510.0634U1JJ-.I.hhrhllrLllJ.XJr111.hlj12345678/IX.ijl.r-lxRRRRRRRRaaaaaaaaR-s
31、quaredAdjustedR-squaredS.EofnegressionSumsquaredresidLoglikelihoodDurbin-WatsonstatInvertedARRoots0.999712Meandependentvar'431.706O0.999694S.Ddependeirtvair245765.84301.708Akaikeinfbcriterion19637882.00E+09Schwarzcriterion19.82779-1130.997Hannan-Quinncriter.19714973.146226.02-1.001-.02+1.001-53-
32、85i潢3+为5i-S7-.50i-G7+.50i-.92-lli-.92+.11iEstimatedARprocessisnonstationaiy图十SARIMA模型拟合参数检验结果这个模型是对ARIMA模型的改进,虽然这两个模型对丁数据的拟合效果是非常好的,但是由丁,ARIMA模型没有把季节的影响因素考虑进模型,没有充分体现出数据的信息,因此才有了,SARIMA模型的建立,那么这个模型对于所有的信息提取就更加的充分了,这可以从这个模型的残差图中看出来。如图H一中是SARIMA模型的拟合残差图,我们对其进行白噪声检验,结果表明这个残差序列是一个白噪声序列,也就是说这个模型对丁数据所包含的信
33、息提取的很充分。同时这个模型对丁数据的拟合效果也是很好的。因此,我们最终选择SARMA模型来描述这个税收数据序列是比较可靠和具有很好的解释能力的。这就是基丁ARIMA模型建立起来的时间序列模型,该模型的表达式为:14.67B11.00B217.23B319.70B41682B510.45B64.27B70.86B8RESID图一季节ARIMA模型的残差序列图2、长期趋势回归模型的建宜二次回归模型参数估计结果如图十二,这个模型的拟合效果的R方是0.954,具有较好的拟合效果,同时模型的各个拟合参数也都通过了检验,即认为这个模型能够很好的对这组税收数据进行解释说明,同时做出预测。VariableC
34、oefficientStdErrort-StatisticProbC313.259327.5697211.362440.0000T6.2702340.S367516.6935380.00000.0444400.006666666651900000R-squared0.S53891Meandependeritvar1014.629AdjustedR-squared0S53203S.D.dependentvar504.5107S.E.ofregression1091392Akaikeinfocriterion12.24478Sumsquaredresid1596123.Schwarzcriteri
35、on12.30872Loglikelihood-835.7674Hannan-Quinncriter.12.27076F-statistic1386.075Durbin-Watsonstat1.452791Prob(F-statistic)0.000000图十二二次模型拟合结果通过回归的拟合,我们可以得出该组税收数据的长期回归曲线方程为:Y=313.259295188+6.27023402026*T+0.044439858198*2可以通过这个回归方程来进行趋势往外推的预测。4)模型的预测1、通过SARIMA模型的预测结果如下:通过SARIMA模型做出的预测如下:800,000600,0004
36、00,000200,000-400,000-600,00050|S'IIl|-!I|75100125-800,000J_25Forecast:YSFActual:YSForecastsample:1137Adjustedsample:22137Includedobservations:116RootMeanSquaredError223508.5MeanAbsoluteError154800.5MeanAbs.PercentError192.9848TheilInequalityCoefficient0.734522BiasProportion0.000007VarianceProportion0.685974CovarianceProportion0.314019YSF±2S.E.图十三SARIMA模型下ys的预测同时也还可以得到YS序列的具体的预测值:表二预测值128-68875.812920073.9613010056.61131-13361.91329229.104133-23473.713459897.97135-88961.2你间136137138139140141142143预测值72453.38-5462.4-71545.1107846.8-86606.833216.1812343.07-27699.8傅间144145146147
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年园林景观工程绿化苗木及草坪种子供应合同3篇
- 采购合同管理表格的策略与实践3篇
- 采购合同管理中的信息化工具3篇
- 采购合同跟单中的问题处理与改进经验3篇
- 采购合同预付款的比例规定3篇
- 采购合同风险评估的理论框架3篇
- 采购合同中的质量保证协议3篇
- 采购合同的签订风险3篇
- 采购合同培训课程大纲3篇
- 采购合同与采购计划的一致性分析3篇
- 医药行业合规培训
- 2024年低压电工资格考试必考题库及答案(共400题)
- 【MOOC】公司金融-江西财经大学 中国大学慕课MOOC答案
- 世界卫生组织人类精液及精子-宫颈粘液相互作用实验室检验手册第五版
- 殡仪馆鲜花采购投标方案(技术方案)
- 2024-2025学年人教版七年级英语上册各单元重点句子
- 消化道大出血应急预案演练
- 光伏项目达标投产实施细则-施工
- 信息技术行业数据安全HSE方案
- 中国的世界文化遗产-英文版
- 系统集成售前技术年终总结
评论
0/150
提交评论