数学建模论文_第1页
数学建模论文_第2页
数学建模论文_第3页
数学建模论文_第4页
数学建模论文_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、建模题目:兰州交通大学招生人数预测班级: 统计1201级队员: 201205505 唐浩彭201205508 刘杰 201205534 栗生衡指导老师:李沐春完成时间:2014年12月18日兰州交通大学招生人数的预测模型摘要大学招生人数的多少是一个极其复杂的非线性过程,它受到各种因素的影响,不仅呈现出非平稳动态随机变化特性,而且各因素间的关系也比较难以确定,因此用简单的线性函数来进行确定性描述结果一般不会太理想。本论文根据兰州交通大学1999-2014年16年的招生人数的相关数据,采用了时间序列分析法确立了招生人数的分析模型,对兰州交通大学未来10年的招生人数进行了分析和预测。时间序列是指同一

2、种现象在不同时间上的相继观察值排列而成的一组数字序列。时间序列预测方法是通过时间序列的历史数据揭示现象随时间变化的规律,并将这种规律延伸到未来,从而对该现象的未来做出预测。首先,本论文对兰州交通大学1999-2014年的招生人数进行了平稳性检验,利用SPSS软件画出了序列的时序图,从时序图上,我们可以看到:从1999-2014年,兰州交通大学的招生人数呈现先快速增长后又趋于稳定的趋势,说明该序列不是一个平稳的时间序列。其次,我们又进行了纯随机性检验,从其序列的自相关图和偏自相关图可以看出该序列不是一个白噪声序列。对于招生人数序列的非确定性分析,我们根据序列的非平稳性进行了2阶差分,2阶差分后的

3、时序图显示其差分后的序列在均值附近比较稳定地波动。又通过SPSS画出二阶差分后的自相关图和偏自相关图,自相关图显示出5阶截尾的性质,而偏自相关图显示出显著的不截尾性质,所以本论文建立了ARIMA(0,2,5)模型,并利用SAS对未来10年兰州交通大学的招生人数作出了预测,发现未来10年兰州交通大学的招生人数趋于稳定,波动不大。对于招生人数序列的确定性分析,我们分别采用了趋势拟合法和平滑法进行建模,但由于历史数据较少,所以趋势拟合法的效果不显著;不过通过平滑法中的移动平均法,我们得到了未来10年兰州交通大学的招生人数,又通过指数平滑法得到了兰州交通大学未来10年招生人数的趋势,与ARIMA(0,

4、2,5)模型的结果基本一致。关键词:时间序列,白噪声序列,ARIMA模型,平滑法,SPSS,SAS一、 问题的提出自从国家1999年实行本科生扩招以来,高考人数在2009年达到了历史最高的1050万人,为了更好地进行招生,兰州交通大学需要对未来10年的招生人数做一个预测。现将兰州交通大学1999-2014年16年的招生人数公布如下:表1:兰州交通大学1999-2014年的招生人数年份19992000200120022003200420052006招生人数20342312267830093616430151745500年份20072008200920102011201220132014招生人数5

5、7885882580352405554578757545630试通过以上数据的分析建立适当的数学模型对兰州交通大学未来10年的招生人数进行预测。二、问题的分析兰州交通大学1999-2014年的招生人数序列很容易让我们想到利用统计学中的时间序列分析法进行求解。时间序列分析法是先对实测数据建立一定的数据模型,并在此基础上进一步分析随机数据的统计特性。时间序列分析法虽然方便实用、可操作性强,但想要建立精度高的时间序列不仅要求对模型参数进行最佳的估计,而且模型阶数也要合适。时间序列由于受到各种偶然或随机因素的影响,具有动态随机变化的性质。从表面上看杂乱无章、毫无规律,但实际上却具有一定的统计规律性。因

6、此,要想对所研究的时间序列建立合适的模型,首先必须了解时间序列的基本统计特性,从而确保时间序列模型的可靠性,并满足一定的精度要求。一般可以从时间序列的平稳性、纯随机性和季节性三个方面去考虑,本论文做的是兰州交通大学招生人数的序列,所以不考虑季节性。首先,我们对兰州交通大学1999-2014年招生人数序列进行了平稳性检验和纯随机性检验,这两个重要的检验称为序列的预处理。对于平稳性检验,我们可以利用SPSS软件画出其序列的时序图,通过时序图我们很容易得到该序列是否具有显著的平稳性。在对纯随机性检验的过程中,我们可以利用SPSS软件画出其序列的自相关图和偏自相关图,由于纯随机性序列意味着序列值彼此之

7、间没有相关性,即过去的行为对将来的发展没有丝毫影响,所以通过序列的自相关图我们可以很容易得到该序列是否具有纯随机性。对于非平稳的时间序列,我们可以运用差分运算构造平稳序列,对于差分后的序列,我们要检验它的纯随机性,对于平稳的白噪声序列我们可以建立ARIMA(p,d,q)模型,对于平稳的非白噪声序列我们可以建立ARMA(p,q)模型。根据经验我们知道,招生人数模型应该是一个非平稳的时间序列,所以我们可以借助SPSS先对兰州交通大学的招生人数序列进行差分运算,再检验它的纯随机性,根据差分后序列的自相关图和偏自相关图判断差分后的序列是否是一个白噪声序列,进而利用SAS构造出ARIMA(p,d,q)模

8、型。除了非确定性因素影响时间序列之外,时间序列还受到一些确定性因素的影响,如长期趋势、循环波动、季节性变化、随机波动。我们可以采用趋势拟合法和平滑法进行确定性分析,对于趋势拟合法,如果长期趋势呈现出线性特征,我们可以用线性模型来拟合;如果长期趋势呈现出非线性特征,我们可以用曲线模型来拟合,如二次型、指数型、S型,进而挑出拟合效果最好的曲线模型;至于平滑法有移动平均法和指数平滑法两种方法,移动平均法其实就是利用前m期的平均值作为该期的预测数据,而指数平滑法可以更好地利用时间序列的历史数据对其未来进行预测,它得出的的结论应该与ARIMA模型得到的结论基本一致。三、基本假设1、假设兰州交通大学的招生

9、人数不受经济因素及社会因素影响;2、假设兰州交通大学的招生人数不受突发事件的影响;3、假设兰州交通大学的招生人数数据可靠。四、符号说明-兰州交通大学招生人数序列n-序列观测期数m-指定延迟期数LB-检验统计量-延迟非零期的样本自相关系数-显著性水平-一阶差分-p阶差分-k步差分B-延迟算子ARMA(p,q)-自回归移动平均模型ARIMA(p,d,q)-求和自回归移动平均模型-平移可逆ARMA(p,q)模型的自回归系数多项式-平移可逆ARMA(p,q)模型的移动平滑系数多项式五、模型的建立与求解5.1时间序列的预处理拿到一个观察值序列,如本论文中的兰州交通大学招生人数序列,首先要对它的平稳性和纯

10、随机性进行检验,这两个重要的检验称为序列的预处理。5.1.1平稳性检验(1) 概率分布数理统计的知识告诉我们分布函数或密度函数能够完整地描述一个变量的统计特征。同样,一个随机变量族的统计特性也完全由他们的联合分布函数或联合密度函数决定。对于兰州交通大学招生人数序列,tT,定义它的概率分布:任取正整数m,任取,T,则m维随机向量(,)的联合概率密度分布记为(,),由这些有限维分布函数构成的全体(,),m(1,2,m),T 就称为的概率分布族。概率分布族是极其重要的统计特征描述工具,但在实际应用中,要得到序列的联合概率分布几乎是不可能的,而且联合概率分布通常涉及非常复杂的数学运算,这些原因使我们很

11、少直接使用联合概率分布进行时间序列的分析。(2) 特征统计量更简单实用的描述时间序列统计特征的方法是研究该序列的低阶距,特别是均值、方差、自协方差和自相关系数,它们也被称为特征统计量。尽管这些特征统计量不能描述随机序列全部的统计性质,但由于它们概率意义明显,易于计算,所以我们主要就是通过这些特征量的统计特性,推断出随机序列的性质。均值=E= 方差=D=E (-)=自协方差 自相关系数(3)平稳性的检验1、时序图检验所谓时序图是一个平面二维坐标图,通常横轴表示时间,纵轴表示序列值。根据平稳时间序列均值和方差均为常数的性质,平稳时间序列的时序图应该呈现出其序列观察值始终在一个常值附近做随机的波动,

12、而且波动的范围有界;若一个序列的时序图显示出明显的趋势性或周期性,那么该序列通常不是平稳的。2、自相关图检验自相关图是一个平面二维坐标悬垂线图,一般横轴为延迟时期数,纵轴为自相关系数,悬垂线表示自相关系数的大小。平稳时间序列具有短期的相关性,该性质用自相关系数来描述就是随着延迟期数的增加,平稳的时间序列的自相关系数会很快地衰减向零;反之,非平稳的时间序列的自相关系数衰减向零的速度通常比较慢,这也是利用自相关图进行平稳性判别的标准。利用SPSS软件绘制19992014年兰州交通大学招生人数序列的时序图如下:图1:19992014年兰州交通大学招生人数序列的时序图从这个时序图可以看到,兰州交通大学

13、招生人数序列呈现出了十分明显的递增上涨的趋势,因此该序列不是一个平稳的时间序列。5.1.2纯随机性检验拿到一个观察值序列之后,首先是判断它的平稳性。通过平稳性检验,序列可以分为平稳序列和非平稳序列两大类。对于非平稳序列,由于它不具有二阶矩平稳的性质,所以对它的统计分析要周折一些;如果序列平稳且序列值彼此之间没有任何相关性,那就意味着该序列是一个没有记忆的序列,过去的行为对将来的发展没有丝毫影响,这种序列我们称之为纯随机序列。从统计分析的角度而言,纯随机序列是没有任何分析价值的序列。(1) 纯随机序列的定义对于兰州交通大学招生人数序列,若满足如下两条性质:1、tT, E为常数;2、,t,sT则称

14、该序列为纯随机序列,也称为白噪声序列。(2) 纯随机性检验纯随机性检验也称为白噪声检验,是专门用来检验序列是否为纯随机序列的方法。我们知道如果一个序列是纯随机序列,那么它的序列值之间应该没有任何相关关系,即满足。这是一种理论上才会出现的理想状况,实际上,由于观察值序列的有限性,导致纯随机序列的样本自相关系数不会绝对为零。所以我们应该考虑样本自相关系数的分布性质,来判断序列的纯随机性质。1、假设条件原假设:延迟期数小于或等于m期的序列值之间相互独立。备择假设:延迟期数小于或等于m期的序列值之间有相关性。该假设条件用数学语言描述为: VS 至少存在某个2、检验统计量(LB统计量)式中,n为序列观测

15、期数;m为指定延迟期数。当检验统计量大于分位点,或该统计量的P值小于时,则可以以1-的置信水平拒绝原假设,认为该序列为非白噪声序列。当检验统计量小于分位点,或该统计量的P值大于时,则认为在1-的置信水平下无法拒绝原假设,认为该序列为纯随机序列。利用SPSS软件绘制19992014年兰州交通大学招生人数序列的自相关图如下:图2:19992014年兰州交通大学招生人数序列的自相关图图2的横坐标表示延迟的期数,纵坐标表示自相关系数。从图2,我们可以看到,兰州交通大学1999-2014年招生人数的自相关系数衰减到零的速度十分缓慢,在延迟了4个时期里,自相关系数的值均为正值,4期之后,其自相关系数变为负

16、值。从自相关图整体上看,自相关系数的图形呈现出非常显著的三角对称性,这是一种具有单调趋势的典型的非平稳的自相关图的模式,这与兰州交通大学1999-2014年招生人数序列的时序图所呈现出的单调递增性的趋势一致。5.2兰州交通大学招生人数序列的随机分析5.2.1差分自回归移动平均模型的流程ARIMA(p,d,q)模型全称为差分自回归移动平均模型,也称为求和自回归移动平均模型,AR是自回归模型,p为自回归系数多项式的项数;MA为移动平均模型,q为移动平均系数多项式项数,d为时间序列成为平稳时所做的差分次数。ARIMA模型是由博克思和詹金斯于70年代初提出的一种十分著名时间序列预测方法,从而该方法也称

17、为博克思-詹金斯法。ARIMA模型的基本思想是:将预测的对象随时间推移而形成的数据序列视为一个随机序列,用一定的数学模型来近似地描述这个序列,而这个模型一旦被识别之后便可以从时间序列的历史值及现在值来预测未来值。对这一随机序列进行差分运算,令其转换为一个平稳的随机序列,运用用平稳随机序列的建模方法进行分析和预测。由于在5.1中我们得到兰州交通大学招生人数是一个非平稳序列,所以画出非平稳序列建模流程图如下:拟合ARMA模型差分运算分析结束白噪声检验平稳性检验获得观察值序列NNYY图3:非平稳序列的建模流程图1、差分运算和延迟算子一阶差分 二阶差分 P阶差分 k步差分 延迟算子类似于一个时间指针,

18、当前序列值乘以一个延迟算子,就相当于把当前序列值的时间向过去拨了一个时刻。记B为延迟算子,有用延迟算子表示差分运算:p阶差分 k步差分 差分方法是一种非常简便、有效的确定性信息提取方法。差分运算的实质是使用自回归的方式提取确定性信息。序列蕴含着显著的线性趋势,一阶差分就可以实现趋势平稳;序列蕴含着曲线趋势,通常低阶(二阶或三阶)差分就可以提取出曲线趋势的影响。足够多次的差分运算可以充分地提取原序列中的非平稳确定性信息,但过度的差分会造成有用信息的浪费,称为过差分。2、ARIMA(p,d,q)模型的构建具有如下结构的模型称为求和自回归移动平均模型,简记为ARIMA(p,d,q)模型: (1)式中

19、,;,为平移可逆ARMA(p,q)模型的自回归系数多项式;,为平移可逆ARMA(p,q)模型的移动平滑系数多项式。式(5.1)可以简记为: (2)式中,为零均值白噪声序列。特别地,当d=0时,ARIMA(p,d,q)=ARMA(p,q),当p=0时, ARIMA(0,d,q)=IMA(d,q),当q=0时, ARIMA(p,d,0)=ARI(p,d),当d=1,p=q=0时, ARIMA(0,1,0)=random walk(醉汉模型)。对兰州交通大学招生人数序列数据进行平稳性检验,可以通过时间序列的散点图进行初步的平稳性判断。如果序列是非平稳的,并存在一定的增长或下降趋势,则需要对数据进行差

20、分处理,然后判断处理后的新序列的平稳性。重复以上过程,直至成为平稳序列。此时差分的次数即为ARIMA模型中的阶数d。对平稳序列还需要进行纯随机性检验,又称白噪声检验,即检验序列是否为白噪声序列。由于样本的随机性,样本的相关系数不会呈现出理论截尾的完美情况,本应截尾的或仍会呈现出小值振荡的情况。同时,由于平稳时间序列通常都具有短期相关性,当样本自相关系数或偏自相关系数在延迟若干阶之后衰减为小值波动时,什么情况下该看作相关系数截尾,什么情况下该看作相关系数在延迟若干阶之后正常衰减到零值附近作拖尾波动呢?这实际上没有绝对的标准,很大程度上依靠分析人员的主观经验。模型定阶的经验方法:如果样本(偏)自相

21、关系数在最初的d阶明显大于两倍标准差范围,而后几乎95的自相关系数都落在2倍标准差的范围以内,而且通常由非零自相关系数衰减为小值波动的过程非常突然。这时,通常视为(偏)自相关系数截尾。截尾阶数为d。如果有超过5%的样本(偏)自相关系数落入2 倍标准差的范围之外,或者是由显著非零的自相关系数衰减为小值波动的过程比较缓慢或者非常连续,这时,通常视为(偏)自相关系数不截尾。3、模型检验模型检验的目的是检验模型的有效性(对信息的提取是否充分),检验对象为残差序列。一个好的拟合模型应该能够提取观察值序列中几乎所有的样本相关信息,即残差序列应该为白噪声序列。反之,如果残差序列为非白噪声序列,那就意味着残差

22、序列中还残留着相关信息未被提取,这就说明拟合模型不够有效。原假设: 残差序列为白噪声序列 备择假设:残差序列为非白噪声序列 :至少存在LB统计量: 参数显著性检验的目的是检验每一个未知参数是否显著非零。删除不显著参数使模型结构最精简。检验统计量4、模型预测在最小均方误差预测原理下,ARIMA模型的预测和ARMA模型的预测方法非常相似。Green函数递推公式 (3)预测值 5.2.2差分自回归移动平均模型的实现1、差分运算从图1兰州交通大学招生人数的时序图中可以看出该招生序列为典型的非平稳序列。对于指数增长的非平稳时间序列,一般方法是对其进行差分运算,来消除线性趋势的影响。因为原始的序列呈现出非

23、线性趋势,所以本论文选择2阶差分。利用SPSS画出二阶差分后的兰州交通大学招生人数的序列时序图如下图所示:图4:兰州交通大学招生人数二阶差分后序列时序图2、白噪声检验利用SPSS画出二阶差分后的兰州交通大学招生人数的序列自相关图如下图所示:图5:兰州交通大学招生人数二阶差分后序列自相关图图4显示,2阶差分后的招生人数序列在均值附近比较稳定地波动。为了进一步确定其平稳性,考察2阶差分后序列的自相关图(如图5)。2阶差分后的自相关图显示,序列有很强的短期相关性,且自相关系数5阶截尾,所以可以初步认为2阶差分后序列平稳。再利用2阶差分后的偏自相关图得到ARIMA(p,d,q)模型中的q参数。利用SP

24、SS画出2阶差分后的偏自相关图如下图所示:图6:兰州交通大学招生人数二阶差分后序列偏自相关图如图6所示,兰州交通大学招生人数二阶差分后的序列偏自相关图显示出显著的不截尾性质,由于自相关图显示出5阶截尾的性质。考虑到前面已经进行的2阶差分运算,可以初步猜测时间序列满足ARIMA(0,2,5)模型,输出结果如下表所示:表2:ARIMA(0,2,5)的模型拟合模型拟合拟合统计量均值SE最小值最大值百分位5102550759095平稳的 R 方.444.444.444.444.444.444.444.444.444.444R 方.945.945.945.945.945.945.945.945.945.

25、945RMSE353.309.353.309353.309353.309353.309353.309353.309353.309353.309353.309MAPE3.623.3.6233.6233.6233.6233.6233.6233.6233.6233.623MaxAPE11.469.11.46911.46911.46911.46911.46911.46911.46911.46911.469MAE179.842.179.842179.842179.842179.842179.842179.842179.842179.842179.842MaxAE636.987.636.987636.98

26、7636.987636.987636.987636.987636.987636.987636.987正态化的 BIC13.054.13.05413.05413.05413.05413.05413.05413.05413.05413.054从表2可知,R方为0.945,接近于1,所以模型ARIMA(0,2,5)是显著的。5.2.3 ARIMA(0,2,5)模型的SAS实现1、拟合模型的构建图7:ARIMA(0,2,5)模型的SAS实现该输出形式等价于:2、短期预测模型拟合好之后,还可以利用该模型对序列进行短期预测。预测命令如下:forecast lead=10 id=t out=out;run;

27、其中,lead是指定预测期数,id是指定身份标识;out是指定预测后的结果存入该数据集。最终利用SAS得到兰州交通大学未来10年的招生人数如表3所示:表3:兰州交通大学未来10年的招生人数利用存储在临时数据集out里的数据,我们绘制出了拟合、预测图,相关命令如下:proc gplot data=out;plot x*t=1 forecast*t=2 /overlay;symbol1 c=black i=join v=star;symbol2 c=red i=join v=none;run;图8:兰州交通大学招生人数的拟合、预测图5.3兰州交通大学招生人数序列的确定性分析模型在自然界中,由确定性

28、因素导致的非平稳,通常显示出非常明显的规律性。从兰州交通大学招生人数序列的时序图(如图1)可以看出,该序列呈现出不平稳的曲线性质。本论文利用趋势分析法和平滑法对兰州交通大学招生人数的序列的确定性因素进行了分析。5.3.1趋势拟合法趋势分析法就是把时间作为自变量,相应的序列观察值作为因变量,建立序列值随时间变化的回归模型的方法。根据兰州交通大学1999-2014年招生人数序列的时序图(如图1)所示,该序列有显著的曲线递增趋势,所以我们尝试使用对数模型、二次项模型、幂模型、S模型、指数模型拟合该序列的趋势。输出结果如下表所示:表4:五种趋势分析法的模型汇总方程模型汇总参数估计值R 方Fdf1df2

29、Sig.常数b1b2对数.77347.709114005522768.584二次.77247.505114.000-517887.331260.412.000幂.75142.117114.000.000134.766S.75142.304114.000143.224-270556.037指数.75041.931114.0001.396E-55.067图9:五种趋势分析法模型汇总的拟合曲线图表4的模型结果表明了各个模型回归方程的显著性,图9的拟合曲线图给出了各个模型的预测值与实际值的差异。由于本论文只选取了1999-2014年兰州交通大学的招生人数,所以五个模型的回归都

30、在0.80以下,即模型拟合不显著。5.3.2平滑法平滑法是进行趋势分析和预测时常用的一种方法。它是利用修匀技术,削弱短期随机波动对序列的影响,使序列平滑化,从而显示出变化的规律。根据所用平滑技术的不同,平滑法又可以具体分为移动平均法和指数平滑法。(1) 移动平均法。要确定移动平均的周期,一般从以下三个方面加以考虑:事件的发展有无周期性;对趋势平滑性的要求;对趋势反映近期变化敏感程度的要求。综合上述三方面的考虑,如果想密切关注序列的短期趋势,就应做期数较小的移动平均。因此,对兰州交通大学招生人数序列可采用4期移动平均法进行预测。建立模型如下:兰州交通大学10年的招生人数预测结果如表5所示:表5:

31、兰州交通大学2015-2024年招生人数序列的预测表年份2015201620172018201920202021202220232024招生人数5681571356955680569256955690568956925692(2) 指数平滑法。 移动平均法实际上就是用一个简单的加权平均数作为某一趋势的估计值。以n期移动平均为例,相当于用近n期的加权平均数作为最后一期趋势得估计值,他们的权重都取为。但在实际生活中,我们会发现对大多数随机事件而言,一般都是近期的结果对现在的影响会大些,远期的结果对现在的影响会小一些。为了更好地反映这种影响,我们将考虑到时间间隔对事件的影响,各期权重随时间间隔增大而

32、呈指数衰减。这就是指数平滑法的基本思想,常用的进行趋势拟合的指数平滑公式有如下两种。 1、简单指数平滑式中,为平滑系数,它满足0<<1。因为所以又等价于简单指数平滑面临一个确定初始值的问题。我们有许多方法可以确定的初始值,最简单的方法就是指定=。平滑系数的值由研究人员根据经验给出。一般对于变化缓慢的序列,常取较小的值,相反,对于变化迅速的序列,常取较大的值。经验表明的值介于0.050.3之间,修匀效果比较好。指数平滑也是一种常用的平滑序列预测方法。假定最后一期的观察值为,那么使用指数平滑法,向前预测1期的预测值为:2、 Holt两参数指数平滑Holt 指数平滑模型与一般指数平滑模型

33、不同的是它对趋势数据直接进行平滑并对原时间数列进行预测。Holt两参数指数平滑适用于对含有线性趋势的序列进行修匀,其基本思想为:设一时间序列有一个比较固定的线性趋势,每一期都递增或递减,则第期的估计值就应该等于第期的观测值加上每一期趋势变动值,由于随机因素的影响,使得每一期的递增或递减的值不会恒定为,它是随时间变化上下波动的一个随机序列。根据Holt两参数指数平滑法的思想,它的平滑公式为: (4)其中,为预测值的平滑系数,为趋势值的平滑系数,并且它们满足条件。平滑系数的选择原则和简单指数平滑的原则一样。利用SPSS软件得到Holt指数平滑模型对兰州交通大学招生人数的拟合如图10所示:图10:兰

34、州交通大学招生人数Holt指数平滑模型拟合图从图10中可以看出:Holt指数平滑模型对于兰州交通大学招生人数的拟合与5.2中利用ARIMA(0,2,5)得到的结论基本一致。六、模型的检验6.1参数的显著性检验参数的显著性检验就是要检验每一个未知参数是否显著非零。这个检验的目的是为了使模型最精简。如果某个参数不显著,即表示该参数所对应的那个自变量对因变量的影响不显著,该自变量就可以从拟合模型中剔除。最终模型将由一系列参数显著非零的自变量表示。检验假设:对于线性拟合模型,记为的最小二乘估计,有在正态分布假定下,第j个未知参数的最小二乘估计服从正态分布: (5)由于不可观测,用最小残差平方和估计:根

35、据正态分布的性质,有 (6) 由式(5)和(6)可以构造出用于检验未知参数显著性的t检验统计量当该检验统计量的绝对值大于自由度为n-m的t分布的分位点,即或者该检验统计量的p值小于或大于时,拒绝原假设,认为该参数显著。否则,认为该参数不显著。这时,应该剔除不显著的参数所对应的自变量重新拟合模型,构造出新的、结构更精炼的拟合模型。利用SAS对拟合后的模型参数进行检验,结果如下表:表6:模型的参数检验结果从表6的结果来看:拟合后的参数检验统计量P值较大,远远大于,即拟合后的模型显著。6.2、模型的显著性检验模型的显著性检验主要是检验模型的有效性。一个模型是否显著有效主要看它提取的信息是否充分。一个

36、好的拟合模型应该能够提取观察值序列中几乎所有的样本信息,换言之,拟合残差项中将不再蕴含任何相关信息,即残差序列应该为白噪声序列。这样的模型称为显著有效模型。反之,如果残差序列为非白噪声序列,那就意味着残差序列中还残留着相关信息未被提取,这就说明拟合模型不够有效,通常需要选择其他模型,重新拟合。所以模型的显著性检验即为残差序列的白噪声检验。原假设和备择假设分别为:检验统计量为LB检验统计量:如果拒绝原假设,就说明残差序列中还残留着相关信息,拟合模型不显著。如果不能拒绝原假设,就认为拟合模型显著有效。利用SAS进行残差序列的白噪声检验,结果如表7所示:表7:残差序列的白噪声检验结果由于12阶延迟下

37、LB统计量的P值显著大于0.05,可以认为这个拟合模型的残差序列属于白噪声序列,即该拟合模型显著有效。6.3、模型的预测根据前面的数据,得到兰州交通大学2015-2024年招生情况如表8所示:表8:兰州交通大学未来10年的招生人数表七、模型的优缺点及改进7.1 模型的优点在解决兰州交通大学招生人数的预测问题时,我们建立了时间序列模型进行分析,从兰州交通大学1999-2014年16年的招生人数进行分析,我们发现该序列是一个非平稳序列,同时也是一个非白噪声序列,即招生人数的历史数据对于兰州交通大学未来10年的招生人数有很强的利用价值。在问题的解决过程中,我们利用了时间序列的相关知识,并充分利用SPSS统计软件画出了兰州交通大学1999-2014年招生人数的时序图和自相关图,又画

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论