毕业设计(论文)-基于MATLAB的国内旅游发展预测.docx_第1页
毕业设计(论文)-基于MATLAB的国内旅游发展预测.docx_第2页
毕业设计(论文)-基于MATLAB的国内旅游发展预测.docx_第3页
毕业设计(论文)-基于MATLAB的国内旅游发展预测.docx_第4页
毕业设计(论文)-基于MATLAB的国内旅游发展预测.docx_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

论文题目:基于matlab的国内旅游业发展预测2基于matlab的国内旅游业发展预测摘要本文主要对国内旅游业市场收入以及发展进行预测和研究,从问题一二的特点出发,分别用一元多项式回归分析、指数模型、多元线性回归、多元非线性回归、灰色理论gm(1,n)以及bp神经网络,预测和分析国内旅游业的市场收入和发展。针对问题一,根据相关数据,首先从简到难分别采取一元多项式回归、指数曲线对往年数据进行拟合,并对未来5年的旅游人数进行预测。为了改进时间模型只考虑了时间这一单一变量的不足以及更好的反映和规划出旅游市场的发展,为此我们引入多元回归的分析,通过分析国内旅游人数,城镇居民人均旅游支出,农村居民人均旅游支出,公路里程,铁路里程相关变量对国内旅游收入的影响,建立多元非线性回归模型和多元线性回归模型,并改进,最后进行统计意义检验和经济意义检验。通过分析,得出农村居民人均旅游支出对国内旅游业市场收入具有显著影响,且国内旅游市场收入在未来几年仍将持续增长,并有蓬勃发展的趋势。针对问题二,在问题一的基础上以及分析相关度后,引入新的影响因素旅行社数量和星级酒店数量,进一步完善对国内旅游业市场的分析和预测,并再次建立多元线性回归模型,对以上影响因素进行参数检验和估计。同时选择合适的影响因素建立灰色理论gm(1,n)模型,然后引进bp神经网络模型,由误差分析的结果可知,bp神经网络模型的预测结果是比较可信的。最后通过比较这些模型的mape(绝对平均误差),并对优缺点给出了客观的评价,进一步从预测和决策的的角度分析和选取对国内旅游收入这一问题适合的模型,并推广到其他领域。本文的亮点是基于matlab建立多种模型进行分析和预测,并进行统计意义检验和经济意义检验,最后用平均相对误差,来衡量各个模型的预测精度。关键字:旅游收入 matlab 多元回归分析 灰色理论gm(1,n) bp神经网络 一、 问题提出1.问题背景:改革开放以来,我国的旅游业呈现蓬勃的发展趋势,旅游业已成为中国社会新的经济增长点,在我国的经济建设中发挥了巨大的作用。随着经济的发展和人民生活水平的进一步提高,相关旅游基础设施建设的完善,大众旅游时代已经悄然而至。农村居民也正在成为整个旅游人群的主要组成部分,我们正迎来“大众旅游”的时代。因此对旅游也经济收入的合理分析和正确预测,对促进旅游业的发展和规划有着十分重要的意义。2.需解决的问题:(1)以国内旅游业为研究对象,收集近21年的相关数据,建立我国国内旅游收入的回归模型,并预测未来5年内国内旅游收入的情况。 (2)考虑其他国内旅游市场收入的影响因素,建立多种定量预测模型。结合若干性能评价指标对这些模型进行对比分析,比较各模型的预测效果。二、 模型假设1. 假设统计的数据真实可信; 2. 假设所建立的模型中,个别偏差太大的数据可据题适当调整;3. 国内旅游的变化主要受本文所研究的若干个因素影响; 4. 旅游业发展相对平稳;5. 社会相对稳定,国家的旅游政策短时间内没有重大变化三、 符号说明第i年的旅游人口数,1994年为第一年国内旅游市场收入旅游人数城镇居民人均支出农村居民人均支出公路里程铁路里程旅游收入回归方程系数四、 问题一的模型与求解4.1 数据的处理和拟合首先,对给定的1994-2014年的原始数据(见附件1),进行初步处理,利用matlab编程(程序见附录2),画出时间与各个因素的散点图并进行拟合,以及残差分析。其中国内旅游人数的时间序列拟合(如error! reference source not found.error! reference source not found.),城镇居民人均旅游支出的时间序列拟合(如图 2图 2 城镇居民人均旅游支出的时间序列拟合),农村居民人均旅游支出的时间序列拟合(如图 3),公路里程的时间序列拟合(如图 4),铁路里程的时间序列拟合(如图 5)。图 1 国内旅游人数的时间序列拟合图 2 城镇居民人均旅游支出的时间序列拟合图 3农村居民人均旅游支出的时间序列拟合图 4 公路里程的时间序列拟合图 5铁路里程的时间序列拟合为了更好的反映个因素和时间的关系,通过拟合曲线,建立各影响因素与时间序列的一元多项式回归模型: 通过matlab求解得到,该模型一元三次多项式,其中为了更好的拟合x4建立一元二次多项式,分别为:最后,将2015年到2019年的时间的序号t中22、23、24、25、26依次分别代入以上各影响因素与时间序列的一元多项式回归模型中利用matlab进行求解,得到未来五年的各个因素的值。见表 1表 1 各影响因素2015-2019年预测值年份20152016201720182019旅游人数4130.24637.75193.45799.56458.2城镇居民人均支出1015.51058.31106.61161.11222.3农村居民人均支出695.9811.9945.91099.31273.5公路里程509.0535.9563.4591.5620.2铁路里程11.912.713.714.816.14.2 一元多项式回归在建立旅游市场的预测模型中,运用回归分析的方法建立回归模型是较为常用的一种方法。回归分析模型主要有线性回归模型和非线性回归模型两大类,在线性模型中叉可分为一元线性回归模型、多元线性回归模型和多项式回归模型。简单的回归分析模型,即一元线性回归模型,是趋势外推模型中最为简单和实用的一种模型,在对旅游收入建立较复杂的多元回归模型之前,先用简单回归分析法对旅游收入的模型预测进行探讨。根据相关数据,绘制出国内旅游收入随时间的散点图进行拟合。(如图 6)建立一元多项式回归模型: 利用matlab自带的拟合工具箱进行多项式拟合,综合预测精度高、分析方便,等因素考虑,通过matlab求解得到,该模型一元三次多项式为:图 6 国内旅游收入时间序列拟合绘制残差图(如图 7),得到残差模 = 1.8365e-11并且由残差图可以很明确的看出,一元三次多项式很好的拟合了原来的数据。图 7 一元三次多项式拟合残差图由该模型预测的2015-2019年的旅游收入如表 2:表 2 一元多项式回归模型预测未来5年旅游市场收入年份/年20152016201720182019收入/亿元37240.944080.851792.460428.870043.44.3 指数模型 根据国内旅游收入时间序列的散点图,大致看出它的发展趋势,符合指数曲线的模型,因此建立指数模型,来拟合数据,然后根据这个模型来预测未来五年的旅游收入情况。1994-2014 年国内旅游市场收入的散点图如图 8图 8 国内旅游市场收入1994-2014年散点图由matlab计算得到回归方程:由该模型预测的2015-2019年的旅游收入如表 3 表 3 指数模型预测2015-2019年国内旅游市场收入值年份/年20152016201720182019收入/亿元3.89334.79925.92227.31409.0392综合以上分析,对旅游市场收入的预测模型研究都是基于一个自变量,即时间序号来进行的,因此都是一元回归模型。通常这些回归模型都具有较好的拟合度,都能用于旅游收入的短期预测,而且通过模型还可以进行诊断分析、异常点检验、强影响点检验等多种更高级的统计分析,和指数模型相同,都可以较好的解决问题,但是随着时间的序列的递增,其预测值一直上升,并且没有考虑其他因素的影响,为此我们引入多个变量,建立多元非线线性规划。4.4 非线性线性回归模型由于旅游业的综合性和易波动性等特征,影响旅游市场收入的因素往往有很多,综合前面的分析我们针对国内旅游市场收入建立多元非线性回归模型:利用matlab(程序见附件1.2)进行求解得到该多元非线性回归模型:从模型可以看出充分的考虑了,各因素对国内旅游市场收入的影响,并结合各因素未来5年的拟合值,分析并结合各因素拟合值,预测未来5年的收入。表 4 多元非线性回归模型年份/年20152016201720182019收入/亿元41510.6652772.0967052.9185052.61107611.07在matlab通过逐步回归分析对5个变量进行引入和移除的动态分析,逐步回归分析如图 9所示:图 9 逐步回归分析通过逐步分析,可以看出相关系数r2=0.996,从拟合优度的角度看,在多元非线性回归中用r2作为修正的可决系数反映模型解释实际问题的能力有多大,其值越接近 1,表明模型的拟合程度就越高。在上述模型中r2=0.996,说明模型的拟合优度非常好。且显著性水平为f=859.51,误差rmse=594.51,在进行综合考虑后,决定保留这5个因素。4.5 多元线性回归模型在考虑多因素的情况下,为了使模型简化,并且利于分析和决策,将非线性模型进行线性分析,并建立旅游收入的多元线性回归模型。设影响因变量的自变量个数为个,多元线性模型是指这些自变量对的影响是线性的,即关系式()其中: 是个未知参数,为常数项, 称为回归系数; 是个可得到精确值并能够控制的一般变量,称为解释变量,称为对自变量 的线性回归函数,是随机误差,通常认为。则,其中,这个模型称为多元线性回归模型。,则上述模型的矩阵形式为:。综上,记为国内旅游收入,国内旅游人数,城镇居民人均旅游收入,农村居民人均旅游收入,公路里程,铁路里程。则建立出5元回归模型,其中是随机误差服从正态分布n(0,),(i=0,15)为回归系数。通过matlab进行求解(程序见附件1.3),得到多元线性回归方程如下:由方程可知,国内旅游人数,农村居民人均旅游支出对国内旅游收入的影响较大,其中旅游人数对旅游收入影响最大,同时可以看出,城镇居民人均旅游支和铁路里程对旅游收入的影响较小,而公路里程对旅游收入是负影响。利用matlab统计工具箱中命令regress求解,得到模型(1)的回归系数估计值及其置信区间(置信水平=0.05)、检验统计量r2,f,p的结果见表 5。表 5 多元线性回归分析系数以及参数表回归系数回归系数估计值回归系数置信区间-3219.63-10727,428810.348,13-3.09-9,37.821,15-18.18-26,-11221.50-1308,1751 r2=0.9965 f=859.5075 p=0 结果分析:stats=0.9965 859.5075 0.0000 353442bint为各系数的置信区间。stats矢量是值分别为相关系数的平方、f值和显著性概率p。相关系数平方值r2=0.9965,说明模型拟合程度较高。显著性概率p=0,小于005,故拒绝零假设,认为模型1中至少有一个自变量的系数不为零,因而从总体上模型1是有意义et的。结果b给出了回归系数的估计值,检查它们的置信区间发现,相应系数的置信区间包含了零点,表明回归变量x2 ,x5对变量y的影响不是太显著,因此从模型中移出次变量。 4.5.1 模型的改进在以上对b的个系数置信区间分析后,以下只研究一下三个因素的影响,即国内旅游人数,农村居民旅游人均支出,公路里程,重新建立多元线性回归模型:利用matlab求解:改进后模型预测的2015-20195年的旅游收入如表 6:表 6 改进后的多元回归分析预测值年份/年20152016201720182019收入/亿元3.89334.79925.92227.31409.03924.5.2 统计意义检验利用matlab统计工具箱中命令regress求解,得到改进后的多元线性回归模型的回归系数估计值及其置信区间(置信水平=0.05)、检验统计量r2,f,p的结果见表 7。表 7多改进后模型的系数以及参数表回归系数回归系数估计值回归系数置信区间-3255.32-4010,-250010.839,115.990.2,11.7-21.06-26,-15 r2=0.9962 f=1499.9137 p=0 由上表可知,相关系数平方值r2=0.9962,r2的值越接近,回归直线对观测值的拟合程度越好,说明模型的拟合程度依然较高,在相关系数平方值基本相等的情况下, f值由原来的859.5075增大到1499.9137。说明模型总体显著性明显增大。从显著性检验的角度看,在显著性水平为0.05 时,p 值均小于0.05,表明通过了t 检验,此模型顺利通过了回归系数的显著性检验。并且可以看出国内旅游人数、农村居民旅游人均支出的增加对国内旅游收入情况具有显著性影响,公路里程则对国内旅游收入有相反的影响效果。4.5.3 经济意义检验根据多元线性回归分析的结果,可得出以下结论:(1)参数x1,即国内旅游人数的系数为正数,说明x1 与国内旅游业市场收入存在正相关,即国内旅游人数越多,我国的国内旅游业市场收入也会随之增加。(2)参数x3,农村居民人均支出的系数为正数,说明x3与国内旅游业市场收入存在正相关,即农村居民人均支出越多,我国的国内旅游业市场收入也会随之增加。从另一个方面进一步说明,城镇居民人均旅游支出相对稳定平缓,而农村居民旅游支出正在持续增长,发展农村旅游业经济建设,更有利于国内旅游业市场收入。(3)参数x4,即公路里程的系数为负数,表明说明x4与国内旅游业市场收入存在负相关,进一步说明我国基础设施建设趋于完善,并且选择公路出行的可替代性高,对国内旅游业市场收入的增长,没有太大的推动作用,但是同时我们应该认识到,公路等基础实施的建设,间接的影响着国内旅游经济的收入。4.6 关联度检验为进一步准确的了解各影响因素对国内旅游市场收入的影响,我们采用关联度检验进行分析。因分辨系数是在(0,1)中取定的实数,一般取=0.5。关联度是各关联系数(k)累加后在n 维空间的平均值。当分辨系数=0.5,认为关联度大于0.6 时可以接受,即通过关联度检验,否则关联程度差些。设参考序列为 比较序列为 关联系数定义为:式中, 为第k点x0与xj的绝对差; 为两级最小差,其中是第一级最小差,表示在xj序列上找各点与x0的最小差;为第二级最小差,表示在各序列中找出的最小差基础上寻求所有序列中的最小差;是两级最大差,其含义与最小差相似。 p称为分辨率, 0p1,一般采用p=0.5。对单位不一,初值不同的序列,在计算关联系数之前应首先进行初值化,即将该序列的所有数据分别除以第一数据,将变量化为无单位的相对数值。关联系数只表示了各个时刻参考序列和比较序列之间的关联程度,为了从总体上了解序列之间的关联程度,必须求出它们的时间平均值,即关联度。因此,计算关联度的公式为: 将数据无量纲化,运用matlab编程(附件1.4)直接算出各因素的关联度。如表 8:表 8 各影响因素的关联度级别12345因素农村居民人均旅游支出国内旅游人数公路里程城镇居民人均旅游支出铁路里程关联度0.83060.78250.77610.76440.7324对表 8分析可知,各影响因素的关联度均大于0.6 时,即通过关联度检验。关联度大小排序为:农村居民人均旅游支出,国内旅游人数,公路里程,城镇居民人均旅游支出,铁路里程。故可知农村居民人均旅游支出国内旅游业的影响最大。通过以上对关联度的分析,为问题二模型的建立以及求解奠定基础。五、 问题二的模型与求解5.1引入新变量考虑其他国内旅游市场收入的影响因素,为此,通过国家旅游局官网和国家统计局 上收集权威收据(below)。在问题一的基础上引入国内旅行社数量和星级酒店数量,来分析这两个因素对国内旅游收入的影响。(1)国内旅行社数量随着旅游业的不断发展,旅行社也开始不断增多,而旅行社也为人们的旅行带来了很大的便利以及优质的旅游体验服务,使得人们不用为旅行计划而烦恼,因而间接的增加了旅游收入,对旅游业的发展有很大的促进作用。表 9 1994-2014年国内旅行社的数量年份1994199519961997199819992000旅行社数量2399280132753995491060707725年份2001200220032004200520062007旅行社数量9222102031199713467146891630317146年份2008200920102011201220132014旅行社数量18140203992278423690249442605426650(2)星级酒店数量 酒店行业是旅游业的重要支柱产业之一,其规模和质量是衡量区域旅游经济发展水平的重要指标,是影响国内旅游收入的总要因素。因此,将星级酒店数量也加入到模型中。表 10 1994-2014年国内星级酒店的数量年份1994199519961997199819992000酒店数量29953720441852015782703510481年份2001200220032004200520062007酒店数量73588880975110888118281275113583年份2008200920102011201220132014酒店数量140991423713991135131280713293128035.2引入新变量的多元线性回归模型在问题一多元线性回归模型的基础上,即对b的个系数置信区间分析后,并结合关联度分析,在考虑三个因素的影响即国内旅游人数,农村居民旅游人均支出,公路里程的基础上,引入旅行社数量和星级酒店这两个因素,并在此利用多元线性回归模型对国内旅游业的经济收入以及发展进行预测分析:因此记旅行社的数量,星级酒店的数量。则再次建立出5元回归模型:,通过matlab进行求解,并代入回归方程,得到多元线性回归方程如下:利用引入新的变量后,在多元回归模型的基础上,对2010-2014年国内旅游收入的实际值与模拟值进行比较,如表 11表 11 引入新变量旅游收入的实际值与模拟值年份/年20102011201220132014实际值12579.819305.422706.226276.130311.9模拟值13319.419614.123218.825865.429340.2利用matlab统计工具箱中命令regress求解并检验,得到该模型的回归系数估计值及其置信区间(置信水平=0.05)、检验统计量r2,f,p的结果见表 12。表 12 参数检验相关系数平方值显著性f对应的概率r2=0.99f=400.41p=0从统计意义分析:相关系数平方值r2=0.99,说明模型拟合程度较高。显著性概率p=0,小于005,故拒绝零假设。从经济意义分析:在引入的新变量旅行社的数量和星级酒店的数量系数均为负,作出以下说明,当旅行社和星级酒店的数量较少时,国内旅游需求较大,旅行社和星级酒店数量的增加会带动旅游收入的增长;但当旅行社和星级酒店的数量增加到一定数量,处于饱和状态时,一味的盲目扩张反而会加剧旅游服务行业的竞争,导致资源的浪费和经济结构分配不合理,不利于国家旅游经济的发展,最终使旅游收入减少。从模型估计结果来看,旅行社和星级酒店数量的增加并不一定使旅游收入增加,因而提高旅游服务的质量,才是国内旅游业健康发展的关键。5.3 灰色理论gm(1, n)模型5.3.1 gm(1,n)模型的建立目前使用最广泛的灰色预测模型就是关于数列预测的一个变量、一阶微分的gm(1,1)模型。它是基于随机的原始时间序列,经按时间累加后所形成的新的时间序列呈现的规律可用一阶线性微分方程的解来逼近。而如果考虑多个相关因素的影响,也就是多个因子变量影响一个行为变量时,我们就应该考虑建立gm(1,n)模型。设为系统特征数据序列,而 为相关因素序列。为的1-ago序列(),为的紧邻生成序列,则称 (7.3.5)为gm(1,n)灰色微分方程。定义为gm(1,n)灰色微分方程的参数列,根据最小二乘法可以得出:式中称为gm(1,n)灰色微分方程的白化方程,也称影子方程。近似时间响应式为:式子里边含有累减还原式为 5.3.2 模型的计算与检验 利用matlab进行求解(程序见附件1.5),建立灰色gm(1,n)灰色微分方程利用灰色预测gm(1,n)模型对2010-2014年国内旅游收入的实际值与模拟值进行比较,如表 13表 13 灰色gm(1,n)模拟值和实际值年份/年20102011201220132014实际值12579.819305.422706.226276.130311.9模拟值14354.319256.629762.935374.637704.03对各个因素进行关联度分析,将数据无量纲化,运用matlab编程直接算出各因素的关联度。如下表 14:表 14 引入新因素后的关联度级别12345因素农村居民人均旅游支出旅行社数量国内旅游人数公路里程星级酒店数量关联度0.83170.82480.78390.77760.7192分析可知,关联度要均大于0.6,关联度大小排序为:农村居民人均旅游支出,旅行社数量,国内旅游人数,公路里程,星级酒店数量。故农村居民人均旅游支出对国内旅游业的影响最大。在综合2010-2014年国内旅游收入的实际值与模拟值进行的比较以及关联度检验的结果,可以看到灰色gm(1,n)模型的预测并不十分理想,其中一个原因是gm(1,n)预测包含一个行为变量和多个因子变量,在预测时首先对每个因子进行预测,在利用结果对行为变量进行预测,这使得因子预测误差一起传递给行为变量预测值,可能产生较大的误差。5.4 bp神经网络的旅游预测模型bp神经网络是误差反向传播的多层前馈网络输人层、隐含层、输出层组成,可以任意精度逼近任意的连续函数,主要应用于非线性建模函数逼近模式分类等力面。bp 网络学习规则的指导思想是:对网络权值和阈值的修正要沿着表现函数下降最快的方向负梯度方向。其中是当前的权值和阈值矩阵,是当前表现函数的梯度,是学习速率。假设三层bp 网络,输入节点:;隐含层节点:;输出接点:;输入节点于隐含层节点间的网络权值为;隐含层节点与输出接点间的的网络权值为,输出接点的期望值为, 模型计算公式如下: 隐含层节点的输出: 输出接点的计算输出:节点的误差输出层:节点权值修正输出层:节点阈值修正隐含层:节点权值修正隐含层:节点阈值修正:为了在matlab中计算的方便,在网络建立之前,需要对数据的大小进行归一化处理。本文采用的是-1,1归一化,利用matlab工具箱中的premnmx()函数把数据归一化为单位方差和零均值,这相当于把原始数据看成服从正态分布。下面是三层bp神经网络模型的原理图:图 10 三层bp神经网络图针对国内旅游收入的影响因素,采用5-14-1模型。输入层为5个神经元,各代表一种影响因素,输出层代表国内旅游业收入。其中输入层结点(5个神经元)分别代表:国内旅游人数、旅行社数量、农村居民人均旅游支出、公路里程、星级酒店数量作为输出结点。从而得到3层前馈反向传播神经网络模型。通过train函数对已生成的网络进行学习训练,如图 11图 11 bp神经网络结构训练参数设置参数:训练次数:net.trainparam.epochs=20000目标误差:net.trainparam.goal=1e-6学习速度:net.trainparam.lr=0.001。图 12 bp神经网络性能对bp神经网络模型进行多次分组训练,各因素数据作为网络输入数据进行下一步的网络训练,利用matlab进行训练预测(程序见附件1.6)得到的预测值,如下表 15表 15 bp神经网络预测值与实际值年份实际值模拟值百分比相对误差19941023.51020.410.00302119951375.71365.360.007519419961638.41631.670.004109219972112.72113.32-0.0002919919982391.22399.10-0.003305519992831.92842.08-0.003596320003175.53189.11-0.004286220013522.43509.910.003544720023878.43896.43-0.004648420033442.33448.58-0.001824620044710.74718.47-0.001649920055285.95298.32-0.002349120066229.76244.30-0.002343620077770.67778.19-0.0009771220088749.38752.27-0.00033984200910183.710186.24-0.00024909201012579.812568.440.00090292201119305.419304.920.00002493201222706.222709.89-0.00016235201326276.126280.96-0.00018481201430311.930313.00-0.000036441图 13预测值与实际值误差比较比较由模型得出的模拟值与实际值(如图 13),并结合所得误差,显然我们可以发现用bp神经网络模型对国内旅游市场收入进行预测是一种非常理想的方法,bp神经网络有很好的自学习性和能很好的反映数据之间的线性无关性,也能方便的用matlab软件对数据进行分析,预测结果比较准确。六、 模型评价6.1 mape评价为了验证以上各种模型的可行性,我们选取2010-2014年的数据,并进行实际值,预测值以及平均绝对误差的比对,见表 16。 表 16 2010-2014年各模型预测值与实际值年份实际国内旅游收入bp神经网络测得值灰色理论测得值多元线性回归测得值201012579.812568.414354.313319.4201119305.419304.219256.619614.1201222706.222709.929762.923218.8201326276.126280.935374.625865.4201430311.930313.037704.029340.2本文用mape(绝对平均误差%)这个参数来评价模型的精确度,其计算公式为:式中:代表模型预测输出值;是实际旅游收入。在这里n取2,i =1,2,3,4,5。用matlab求解(程序见附件1.7)得几个模型的mape值见表 17。表 17 三种模型的绝对平均误差预测模型bp神经网络多元回归分析灰色gm(1,n)mape0.0003380.0362610.261126mape是一个模型预测精确度的评价指标 ,用于评价模型预测值与实际值的相关性。mape值越小,表示模型的预测效果越好。由上表可以看出 ,神经网络模型的预测效果比其他的模型好,说明bp神经网络对国内旅游收入的预测更加合理可行。在本文中针对国内旅游收入各因素的影响,分别从时间序列的角度建立三个模型,以及多变量影响的角度建立了三个模型来对国内旅游市场收入进行预测,这六个个模型各有特点,以下就优缺点再次进行评价。6.2优点一元多项式回归模型和指数模型能较好的就行线性拟合反映数据的走向而多元线性回归模型和多元非线性模型能够充分的体现各影响因素对旅游收入的影响,在多因素决策问题上应用广泛,它能很好的反映不同因素对总体的贡献程度和各因素之间的比重大小。灰色预测gm(1,n)模型通过关联度检验,可以更好的反映各影响因素的关联程度,bp神经网络应用范围更加广泛,能很好的反映数据的特性。以及识别训练样本中相关参数之间的非线性特征,而且有较强的容错性和很强的自适应学习能力。6.3缺点多元回归模型:单因素与预测值之间必须大致是线性关系,灵活性差。对已有数据预测另一单因素准确,但有数据缺失的情况预测效果差。bp网络神经模型:存在局部极小值问题,算法收敛速度慢,隐层单元数目的选取无一般指导原则。关联度分析:该方法只对于问题中一些可以进行量化的因素分析,而不能将与问题相关且不能量化的因素考虑在内。灰色理论gm(1,n)模型:该模型要求未来的数据要和过去的以及现在的数据有相同的发展趋势, 上下波动不能太大,否则会在某一时刻产生较大的偏差。且因子预测误差会传递给行为变量预测值,可能产生较大的误差。七、 模型推广综合以上分析,针对国内旅游收入发展所作的各种模型,可以通过对研究对象的分析,选取适应的模型进行发展趋势的预测,进而这些模型可以推广到对国内旅游需求、旅游人数等进行预测,同时也可应用于各个领域,如国家财政收入、中国的人口预测、工厂的产值预测等。八、 参考文献1 李艳娇, 李瑞敏, 陈经伟. 多元线性回归的matlab实现j. 常熟理工学院学报, 2014(2):49-52.2 包翠莲, 开小明. matlab语言在多元线性回归中的应用j. 安徽教育學院學報, 2005, 23(3):55-56.3 董大校. 基于matlab的多元非线性回归模型j. 云南师范大学学报:自然科学版, 2009, 29(2):45-48.4 陈绍东. 改进的灰色gm(1,n)模型在经济中的预测与应用j. 宜春学院学报, 2010, 32(4):65-66.5 阮氏海宁, 温作民. 基于灰色gm(1,n)的生态旅游市场需求预测研究以越南风雅-格邦国家公园为例j. 绿色科技, 2013(1):238-240.6 夏冰, 陈东彦, 潘状元. 基于bp神经网络的旅游需求预测j. 中国集体经济, 2009(21):144-145.九、 附件1.1中国国内旅游收入1994-2014年相关数据 年份国内旅游收入(亿元)国内旅游人数(百万人次)城镇居民人均旅游支出(元)农村居民人均旅游支出(元)公路里程(万公里)铁路里程(万公里)19941023.5524414.754.9111.785.9019951375.7629464.061.5115.706.2419961638.4640534.170.5118.586.4919972112.7644599.8145.7122.646.6019982391.2695607.0197.0127.856.6419992831.9719614.8249.5135.176.7420003175.5744678.6226.6167.986.8720013522.4784708.3212.7169.807.0120023878.4878739.7209.1176.527.1920033442.3870684.9200.0180.987.3020044710.71102731.8210.2187.077.4420055285.91212737.1227.6334.527.5420066229.71394766.4221.9345.707.7120077770.61610906.9222.5358.377.8020088749.31712849.4275.3373.027.97200910183.71902801.1295.3386.088.55201012579.82103883.0306.0400.829.12201119305.42641877.8471.4410.649.32201222706.22957914.5491.0423.759.76201326276.13262946.6518.9435.6210.31201430311.93611975.4540.2446.3911.18数据来源:中国统计年鉴2015matlab相关程序1.2多元非线性回归模型load(x.mat) %各影响因素数据y=1023.5 1375.7 1638.4 2112.7 2391.2 2831.9 3175.5 3522.4 3878.4 3442.3 4710.7.5285.9 6229.7 7770.6 8749.3 10183.7 12579.8 19305.4 22706.2 26276.1 30311.9; %国内旅游市场收入beta0=ones(5,1);% beta= nlinfit(x,y,model,beta0)beta,r,j= nlinfit(x,y,model,beta0) % r为残差,% nlintool(x,y,model,beta0)stepwise(x,y)1.3多元线性回归方程%未改进前各因素的多元线性回归分析y=1023.5 1375.7 1638.4 2112.7 2391.2 2831.9 3175.5 3522.4 3878.4 3442.3 4710.7 5285.9 6229.7 7770.6 8749.3 10183.7 12579.8 19305.4 22706.2 26276.1 30311.9;x1=524 629 640 644 695 719 744 784 878 870 1102 1212 1394 1610 1712 1902 2103 2641 2957 3262 3611;x2=414.7 464 534.1 599.8 607 614.8 678.6 708.3 739.7 684.9 731.8 737.1 766.4 906.9 849.4 801.1 883 877.8 914.5 946.6 975.4;x3=54.9 61.5 70.5 145.7 197 249.5 226.6 212.7 209.1 200 210.2 227.6 221.9 222.5 275.3 295.3 306 471.4 491 518.9 540.2;x4=111.78 115.7 118.58 122.64 127.85 135.17 167.98 169.8 176.52 180.98 187.07 334.52 345.7 358.37 373.02 386.08 400.82 410.64 423.75 435.62 446.39;x5=5.9 6.24 6.49 6.6 6.64 6.74 6.87 7.01 7.19 7.3 7.44 7.54 7.71 7.8 7.97 8.55 9.12 9.32 9.76 10.31 11.18;x=ones(21,1) x1 x2 x3 x4 x5;b,bint,r,rint,stats=regress(y,x)rcoplot(r,rint);%分析关联度,以及对b的个系数置信区间分析后,只研究以下三个因素的影响y=1023.5 1375.7 1638.4 2112.7 2391.2 2831.9 3175.5 3522.4 3878.4 3442.3 4710.7 5285.9 6229.7 7770.6 8749.3 10183.7 12579.8 19305.4 22706.2 26276.1 30311.9;%g国内旅游人数x1=524 629 640 644 695 719 744 784 878 870 1102 1212 1394 1610 1712 1902 2103 2641 2957 3262 3611;%农村居民人均旅游支出x3=54.9 61.5 70.5 145.7 197 249.5 226.6 212.7 209.1 200 210.2 227.6 221.9 222.5 275.3 295.3 306 471.4 491 518.9 540.2;%公路里程x4=111.78 115.7 118.58 122.64 127.85 135.17 167.98 169.8 176.52 180.98 187.07 334.52 345.7 358.37 373.02 386.08 400.82 410.64 423.75 435.62 446.39; x=ones(21,1) x1 x3 x4;b,bint,r,rint,stats=regress(y,x)%加入旅行社数量,星级酒店数量的因素后,多元线性规划y=1023.5 1375.7 1638.4 2112.7 2391.2 2831.9 3175.5 3522.4 3878.4 3442.3 4710.7 5285.9 6229.7 7770.6 8749.3 10183.7 12579.8 19305.4 22706.2 26276.1 30311.9;%g国内旅游人数x1=524 629 640 644 695 719 744 784 878 870 1102 1212 1394 1610 1712 1902 2103 2641 2957 3262 3611;%旅行社数量x2=3399 2801 3275 3995 4910 6070 7725 9222 10203 11997 13467 14689 16303 17146 18140 20399 22784 23690 24944 26054 26650;%农村居民人均旅游支出x3=54.9 61.5 70.5 145.7 197 249.5 226.6 212.7 209.1 200 210.2 227.6 221.9 222.5 275.3 295.3 306 471.4 491 518.9 540.2;%公路里程x4=111.78 115.7 118.58 122.64 127.85 135.17 167.98 169.8 176.52 180.98 187.07 334.52 345.7 358.37 373.02 386.08 400.82 410.64 423.75 435.62 446.39;% 星级酒店的数量x5=2995 3720 4418 5201 5782 7035 10481 7358 8880 9751 10888 11

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论