数学建模竞赛论文格式模板.doc_第1页
数学建模竞赛论文格式模板.doc_第2页
数学建模竞赛论文格式模板.doc_第3页
数学建模竞赛论文格式模板.doc_第4页
数学建模竞赛论文格式模板.doc_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

承 诺 书我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。我们参赛选择的题号是(从A/B中选择一项填写): B 我们的参赛报名号为(报名网站提供的报名号): 23006025 所属学校(请填写完整的全名): 四川师范大学 参赛队员及联系方式 :1. 姓名: 饶泉 联系方式2. 姓名: 淳黎 联系方式:3. 姓名: 陈红燕 联系方式(以上内容请仔细核对,提交后将不再允许做任何修改。如填写错误,论文可能被取消评奖资格。) 日期: 短期交通流量预测摘要随着交通基础设置建设和智能运输系统的发展,交通规划和交通诱导已成为交通领域研究的热点。对于交通规划和交通诱导来说,准确的交通流量预测是其实现的前提和关键。本题要求我们对城市交通路网中交通路段上的交通流量进行短期预测。本文根据实际情况和问题提出了不同的模型和算法,再通过对各模型间的比较得出最优预测方案。过程如下:首先,我们先进行对数据的处理。由题可知以每15分钟来测量交通流量,一共有3天的数据。理应有288个数据,却只有276个,其中有两个负值数据为异常数据。为了保留数据的完整性,对于缺失数据和异常数据,我们分别使用插补法和平均值填补法来做。方案一:我们使用eview软件来进行时间序列的预测,时间序列预测要求数据必须是平稳的,所以在此之前,先对数据进行ADF检验。通过后才能进行预测,得到预测后的表达式和残差,并对残差进行分析估计,最后对模型进行评价。方案二:我们使用metlab软件来实现BP神经网络模型的预测。BP神经网络的实质是用已给出的数据来推出需要的数据,并将新预测出的数据重新返回输入中,得到误差,一直重复,直到误差到达合理的范围内。在预测之前,我们先得出了误差在合理范围,并且看到已给出数据的真实值与预测值得对比。在确保模型是可用的之后,在进行预测与预测结果的评价。方案三:我们使用spss软件来进行回归分析模型的预测。首先,我们需要先对数据进行相关性检验,如果数据没有相关性,则回归方程就会没有意义。接下来,通过对回归方法的决定性系数检验和方差分析检验,得到最合适方法。之后再进行第四天的预测及预测结果的评价。最后,我们将对每一个模型进行优缺点评价,进而对三种预测方法进行了一个比较,判断出那个模型是最适合这个题目的。并且对文章中所涉及的模型进行推广,使其更便于运用于生活实际中。关键词:平均值填补 时间序列 ADF检测 BP神经网络 多元线性回归1.问题的重述随着交通基础设置建设和智能运输系统的发展,交通规划和交通诱导已成为交通领域研究的热点。对于交通规划和交通诱导来说,准确的交通流量预测是其实现的前提和关键。交通流量预测根据时间跨度可分为长期交通流量预测和短期交通流量预测,长期交通流量预测以小时、天、月甚至年为时间单位,是宏观意义上的预测;短期交通流量预测一般的时间跨度不超过15分钟,是微观意义上的预测。短期交通流量预测是智能运输系统的核心内容和实现其智能化功能的基础平台。短期交通流量预测具有高度非线性和不确定性等特点,并且同时间相关性较强,研究表明,城市交通路网中交通路段上某时刻的交通流量与本路段前几个时段的交通流量有关,并且交通流量具有24小时内准周期的特征。现有3天的交通流量数据(见附件二),假设从第1天0时15分开始,每隔15分钟记录一次该段时间内的交通流量,请预测第4天的交通流量。2.问题分析对于问题要求的根据已给的3天数据来预测第四天的交通流量,并预测评价出模型的优缺点。 首先,题目给出的是三天的数据,以15分钟为一个截点,应该有3x4x24个数据,但实际只有276个数据。另外,数据中还出现了负数的情况,而这显然是不符合实际情况的。所以,我们要对异常数据和残缺数据进行处理。我们运用插补法和平均值填补法来处理数据。对数据进行处理后,我们就需要对第四天的交通流量进行预测。这里我们需要对短期的交通流量进行预测。在短期预测中,我们需要以15分钟为一个时间段,预测未来的的交通流量。在这里,我们运用时间序列预测方法和最后,我们通过对每种预测方法结果的分析,来评价各种方法的优缺点。3.模型假设基本假设:(1) 在观察测量的四天里交通没有突发状况,路况正常。(2) 假设灰色预测模型,神经网络预测模型,时间序列预测模型都是最好的。(3) 假设测量数据误差小对结论影响小,甚至没影响。4.符号说明i一天中,以15分钟为时间段的时间序列编号 5.模型的建立与求解5.1对数据进行处理由题可知以每15分钟来测量交通流量,一共有3天的数据。理应有288个数据,却只有276个,其中的两个负值数据为异常数据。为了保留数据的完整性,对于缺失数据和异常数据,我们分别使用插补法和平均值填补法来做。Step1 缺失数据的处理首先对于缺失数据来说,我们并不知道缺失的数据是随机缺失数据还是非随机缺失数据,所以我们先将数据点作图,观察曲线的趋势,折线图一如下:有图可知,该数据具有明显的周期性。对此,我们选择了插补法进行缺失值的填补,所谓热卡插补法(Hot deck imputation),即对于一个包含缺失值的对象,在完整数据中找到一个与它最相似的对象,然后用这个相似对象的值来进行填补。在这里,我们用与缺失值最相似的前两天同一时段的数据的平均值来代替缺失值。用替换掉缺失值的数据画折线图得到图二:对于异常数据的处理我们直接用平均值填充法,用异常数据的前后两个数据的平均值来代替异常数据,得到完整数据。5.2 方案一的模型建立于求解 为了保证预测结果的准确性,在进行时间序列预测之前,我们还需要对数据进行平稳性检验(ADF检验)。所谓平稳性检验,是指为了防止有时数据的高度相关仅仅是因为二者同时随时间有向上或向下的变动趋势, 并没有真正联系。如果这样,数据中的趋势项,周期项等无法消除, 从而在残差分析中无法准确进行分析.。在这道题中,我们对随着时间变化的交通流量进行了平稳性检验,首先我们使用的是平均差分法,检验结果如下表:ADF检验的Mackinnon临界值分别为-3.464643,-2.876515,-2.574831,t检验统计量值-5.613230,prob值小于0.05,从而能拒绝,表明短期交通流量的差分序列存在单位根,是平稳序列。所以ADF检验,平稳,自相关拖尾,偏自相关截尾,选择AR模型时间序列预测模型的分析与求解参数检验,去掉常数C我们在进行时间序列预测时,是直接使用的eviews软件,软件输出结果如下面 模型检验:残差均在虚线内,即模型可行做预测:静态图,基本拟合时间扩展后的曲线图(expand 1 384),得到第四天中每个时间段的交通流量的预测值,依旧将它与其它第三天的数据一起,画出它的折线图,如下:5.3方案二的模型建立与求解BP网络是一种具有3层或3层以上的阶层型神经网络。它的特点是各层神经元之间无 反馈连接,各层内神经元之间无任何连接,仅相邻层神经元之间有连接。典型BP网络是3 层前馈网络,即输入层、隐层和输出层,各层之间实行全连接,见图1。BP网络的主要思想可概括为训练样本集 和已知的输出样 1 2 ( , , , ) k P P P P k = , 为样本数本集 。训练的目的是求网络的模拟输出 ,通过 1 2 k T (T ,T , T ) = , 1 2 k A A A A = ( , , )减少A与T之间的误差来修改模拟过程的权值,使网络模拟输出值与实际样本值之间的误 差达到最小值。每一次的权值变化和偏差都与网络误差的变化成正比,并以反相传播的 方式传递到每一层。BP网络法由信息的前向传递和误差的正相传播两部分组成2。由于BP网络神经的定义,在对未来时间进行预测前,系统将会先对已知数据进行预测,然后将真实数据与预测数据进行一个对比,并且给出在预测过程中的误差分布,观察这两个图,可以看到误差水平差不多都在0.1左右,较小在合理范围内。而真实值与预测值得差距也较小,所以认为模型的检验是通过了的,是可以继续进行预测的。在BP算法中,我们采用了最速下降梯度法来修改权值,计算公式如下:Wij(n+1)=hiOj+aWij(n)(n为样本数)其中为期望输出,为实际输出,为输出节点数,w(ij)为第ij次网络权值,a为学习率。在实际计算时,我们运用matlab编了一段程序,详见附件一。为了保证预测结果的准确性,我们并没有一次性的预测出所有的数据,而是采用滚动预测的方式,将先预测出来的结果带入到原始数据中,以此来预测接下来的数据,由于数据太多,这一次依旧用与前三天的交通流量的汇总数据来画折线图,用折线图来表示预测的结果,图如下:5.4方案三的模型建立与求解一般来说,回归分析是通过规定因变量和自变量来确定变量之间的因果关系,建立回归模型,并根据实测数据来求解模型的各个参数,然后评价回归模型是否能够很好的拟合实测数据;如果能够很好的拟合,则可以根据自变量作进一步预测。首先建立的回归方程,我们必须要先判断作为自变量的因素与作为因变量的预测对象是否有关,检验相关程度如何,以及这种相关程度的把握性多大,在这里,我们用相关关系的大小来判断自变量和因变量的相关的程度。将自变量时间设为,因变量交通流量设为,在这里我们运用R系数来计算两者之间的相关性系数:表示时间与交通流量的平均数在SPASS软件中我们通过计算得到以下结果:相关性时间交通流量时间Pearson 相关性1.606*显著性(双侧).000N9696交通流量Pearson 相关性.606*1显著性(双侧).000N9696*. 在 .01 水平(双侧)上显著相关。由结果可以看出,交通流量和时间之间的相关性系数为0.606,在(0.5,0.8)的范围内,属于中度相关,可以进行回归分析。回归分析预测的检验回归预测模型是否可用于实际预测,取决于对回归预测模型的检验和对预测误差的计算。回归方程只有通过各种检验,且预测误差较小,才能将回归方程作为预测模型进行预测。根据对图形的判断,我们使用了曲线估计。在对数据进行拟合时,我们发现在对数模型,二次项模型,对数模型,立方模型,指数模型等模型中,立方模型的拟合结果最好,最接近题目给出数据的点分布(详见附录一),所以最后我们决定使用立方模型来回归数据。在检验过程中,我们使用了决定系数检验和方差分析两种检验方式,检验结果如下:模型汇总RR 方调整 R 方估计值的标准误.894.799.79240.229自变量为 VAR00002ANOVA平方和df均方FSig.回归591390.1033197130.034121.810.000残差148886.887921618.336总计740276.99095自变量为 VAR00002。在决定系数检验中,立方模型的R方检验值为79.9%,说明回归拟合模型可以解释交通变量的变化的79.9%,还有20.1是不能解释的。 在方差分析中,方差检验量F值为121.810,它的sig值为0.00。sig值就是显著性,代表着平均值是在百分之几的几率上相等的。一般将sig值与0.05相比较,如果它小于0.05,说明平均值在小于5%的几率上是相等的,而在大于95%的几率上不相等。我们认为平均值相等的几率还是比较小的,说明差异是显著的,从而认为两组数据之间平均值是不相等的。这道题中的sig值大于了0.05,说明模型显著性成立。两个检验结果都在合理的范围内,说明回归分析预测模型的检验是通过了的,所以可以开始检验了。Step3 回归分析预测模型求解 前面已经进行了相关性分析和模型的检验,现在就只需要将数据录入到冉建中,得到回归拟合结果:系数未标准化系数标准化系数tSig.B标准误BetaX-1.6941.518-.534-1.116.267x * 2.198.0366.2625.467.000x * 3-.002.000-5.370-7.529.000(常数)34.83417.0862.039.044结果中的t值是对每一个自变量(logistic回归)的逐个检验,看它的beta值即回归系数有没有意义,后面的sig值则是为了显示t值得显著性。由结果可以看出,除了自变量的系数是不显著的,其他的系数和常数都是显著的,结果可以忍受,得到的回归方程如下:将第四天的时间导入到表达式中,得到未来96个时间点的交通流量。然后将这个预测值和前三天的数据合在一起按,画出折线图四:6.模型的评价方案一时间序列预测模型的评价 一 优点1 时间序列模型预测效果较好,体现出来的周期性强;2 时间序列的操作简单;3 时间序列预测短期数据比较准确;二 缺点1 时间序列AR模型的限制条件保证了模型的最高阶数;2 零均值白噪声序列;限制条件说明当期的随机干扰与过去的序列值无关。方案二BP神经网络模型模型的评价一 优点1 神经网络评价方法是一种比较接近人类思维模式的定量与定性结合的综合评价模型, 不需要对各种评价指标权值做出认为的规定,在学习过程中会自适应调整,评价结果具有客观性。2 BP神经网络具有一定的容错能力。二 缺点1 BP算法相对复杂,等待的时间也较长。2 BP网络的学习和记忆具有不稳定性,对于以前的权值和阈值是没有记忆的。方案三多元回归分析模型的评价一 优点1 回归分析预测模型可以直接给出预测模型的表达式,这样也就可以预测较多的时间点。2 在模型结果中也就是回归方程中直接就可以进行检验,操作方便。二 缺点1 预测的结果非常粗略,难以用于实际的生活实践中进行判断。2 回归预测的处理过程相对来说比较复杂。最后结合在预测过程中,几个模型的操作难易程度,参数检验结果和结果的显示,我们认为,时间序列预测模型是最适合这道题的模型,可以用它来进行接下来的其他时候的预测。7.参考文献121世纪统计学系列教材:应用时间序列分析(第3版) 王燕 中国人民大学出版社 2人工神经网络导论 蒋宗礼 高等教育出版社 3李金海;多元回归分析在预测中的应用J;河北工业大学学报10.附录附件1: 神经网络预测程序%原始数据 %p=load(shuru.txt);%p=p; p=193:288; %t=load(shuchu.txt); %t=t; t=6 33 30 65 54 33 56 9 22 51 47 31 22 9 49 4 44 57 85 77 115 158 165216279241215220192211185185192201155178165198162202240210199221208218235211241240220241242202224184221184216207239226230258232247288243309252271256251222228229172171219195164155118107194.5 159 163.5147.5 101 104 81 8667 43.533 38; % plot(p,t) %数据归一化 pn,minp,maxp,tn,mint,maxt=premnmx(p,t); dx=-1,1; %BP网络训练 net=newff(dx,5,1,tansig,tansig,purelin,traingdx); net.trainParam.show=1000; %每1000轮回显示一次结果net.trainParam.Lr=0.05; %学习速率为0.05 net.trainParam.epochs=3000; %循环10000次 net.trainParam.goal=1e-5; %均方误差 net=train(net,pn,tn); %对原数据进行仿真 an=sim(net,pn); a=postmnmx(an,mint,maxt); %还原仿真得到的数据 %与实际数据对比 x=193:288; newk=a(1,:); figure; plot(x,newk,r-o,x,t,b-+); legend(预测值,实际值); xlabel(时间); ylabel(cpi的值); %对新数据进行预测 pnew=289:296;%预测2012年到2015年数据 pnewn=tramnmx(pnew,minp,maxp);%新数据归一化 anewn=sim(net,pnewn); anew=postmnmx(anewn,mint,maxt)%还原得到预测值附件二:3天的交通流量数据序号交通流量16626436045851764973481798105311151215134514571533164217818521924202921-13223723372442532263827682877299530119311613218433276342473525136193372263821339195401824116642188431494413245167461814720348219492265021651234521975321954230552475623857259582705923260202612436222363202642356518466215672176820969199701977122672217732547424375281762857728578251792888023681266822148321384186852098617687163881998917190170911349212893699441955396489742982599211003210116102521036310471053810691075010860109311051111-7112291133211421115461165011738118261194912064121731221141231821242391252421262331272551282401292111302251312

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论