哈工大中期报告_第1页
哈工大中期报告_第2页
哈工大中期报告_第3页
哈工大中期报告_第4页
哈工大中期报告_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

毕业设计(论文)中期报告:基于深度学习的短时交通流预测技术研究与实现业 生 号 指导教师 日期 哈尔滨工业大学教务处制目录TOC\o"1-5"\h\z\o"CurrentDocument"1.论文工作是否按开题报告预定的内容及进度安排进行 3已完成的研究工作及成果 3数据处理 3数据描述 3交通流量问题定义 3数据预处理 4模型构建 4数据扩展 4交通流量预测模型 5\o"CurrentDocument"实验结果 8\o"CurrentDocument"后期拟完成的研究工作及进度安排 9\o"CurrentDocument"存在的问题与困难 9\o"CurrentDocument"5.论文按时完成的可能性 91.论文工作是否按开题报告预定的内容及进度安排进行开题报告中预定了如下研究内容:针对交通流数据具有的时间临近性、空间邻近性、周期性等特点,使用深度学习方法提取数据特征,对此地区下一时刻的交通流量进行预测,使用MAE、RMSE、尺2评测模型的准确性,研究内容分为三部分:(1)将交通数据转化为时空矩阵,并完成标准化、归一化(2)使用自编码网络提取数据特征,与原数据融合实现数据扩展(3)构建深度学习模型,提取数据时间临近性、空间邻近性、周期性特征预定进度如表所示:表1-1预2019年11月底-2019年12月底定进度安排完成前期调研工作,了解LSTM、SAE、CNN等神经网络特性2019年12月底-2020年1月底将交通数据转化为时空矩阵,完成数据预处理2020年1月底-2020年3月底完成初始模型构建,提取数据特征2020年3月底-2020年4月底结合实验结果,对模型进行参数调优2020年4月底-2020年5月底目前毕业设计已按照开题报告预定的进出初始构建,总体达到了开题时预定的期望。2.已完成的研究工作及成果数据处理数据描述本研究使用的数据集来源于美国加利福1数据集记录了城市附近高速公路的33个站点通流量数据,数据的采样时间间隔为5分钟,如图2-1所示:6MinutesFlow(Veh/5Minutes)01/01/201700:00 350.0 601/01/201700:05 394.0 601/01/20170010 3E3,O 601/01/201700:15 360.0 6撰写毕业论文,准备结题答辩萱完成了数据预处理,数据扩展与预测模型的尼亚运输部的性能测量系统^0忖5)数据库,该自2017年1月1日至2017年7月15日的交数据包含时刻与该时刻对应的车流量等信息,#LanePoints %Observed0.00.0000.0图2-1训练集数据示例实验的训练集包括33539条数据,验证集包括10000条数据,测试集包括10885条数据2.1.2交通流量问题定义设当前时刻t,地点p在当前时刻的交通流量为%(t),在下一时刻的交通流量为%(t+1),p p使用包括地点p在内的n个相邻地点{pIi=1,2,3,...,n}在过去N个时间段(t-N+1,t)的交通i流量数据对地点p的下一时刻的交通流量数据X(t+1)进行预测即为交通流量预测,用数p

学语言表示如下:输入可表示矩阵如下:a-n+1)J(a-n+1)J(t-N+1)2X= ...nxNj(t-N+1)n-1j(t-N+1)n此问题可简化为:j(t-N+2)1j(t-N+2)2...j(t-1)

1

...j(t-1)

2j(t-N+2)...j (t-1)n-1 n-1j(t-N+2)...j(t-1)nnj(t+1)

pj(t)1j(t)2j(t)n-1j(t)n=predict(X)nxN2.1.3数据预处理设共有m设共有m个时间点,te{1,2,...,m},q个地点,pe{1,2,...,q},对输入数据进行分组整合,得到输入矩阵X与标签Y:m1mX11--mm1mX11--m1mXt1tX212X111XY111-mmY1.ttY122Y111Y1222......... ... .X-X1X2...Xt.ppp......... ... .X1X2...Xt.q-1q-1q-1X1X2...Xt.qqq对输入矩阵进行数据归一化2...2......2......2...Xm-1XmY-Y1Y2p...p...p...p...Xm-1XmY1Y2q-1q-1q-1q-1Xm-1XmY1Y2qqqqj-jJ- min—2 22Yt... Ym-1 Ymp pp... ... ... ...Yt ... Ym-1 Ymq-1 q-1 q-1Yt ... Ym-1 Ymq qqJ-Jmaxmin2.2模型构建2.2.1数据扩展由于训练数据有限,为增加训练集数目,提高预测的准确率,使用自编码器对数据进行扩展。自编码器是一种基于神经网络的无监督学习技术,它将输入压缩成潜在空间表征,然后将这种表征重构为输出,是一种数据有损的压缩算法,经过这种有损的数据压缩,可以学习到输入数据中最重要的特征。自编码器由两部分构成:编码器和解码器,编码器将输入压缩为潜在空间表征,解码器将潜在表征重构为输出,本研究使用全连接网络作为编码器和解码器。本研究自编码器结构如图2-2所示(设输入乂为\xjj...jjj]):123 n-2n-1n

图2-2自编码器结构H为压缩后的特征向量,图2-2自编码器结构~rX=X1x2x3...xn-2H=hl ...h1] 0Xn-1 XnH=hl ...h1] 0Xn-1 XnJ...h1X为重构后样本矩阵,qf(x)-s(wx+b)fg(x)-s(Wx+b)gs为编码器激活函数,s为解码器激活函数,输入层和隐藏层之间的权值矩阵为W,f g隐藏层和输出层之间的权值矩阵为W,设经过自编码神经网络后的输出向量为B(x),则将其与归一化的时空矩阵融合在一起,得到融合后的训练集及B(x)]。2.2.2交通流量预测模型整体架构针对交通数据具有的时空特性,本研究从两方面构建模型,分别提取交通数据的时间特征与空间特征,模型的总体架构图如图2-3所示:

hr®产区LSTMhr®产区LSTM1 wLSTMn LSTM图2-3模型总体架构对邻近性特征的获取,本研究使用时间间隔为40分钟的交通数据序列,对周期性特征的获取,本研究使用每天同一时刻,一周的同一时刻的交通数据序列,预测流程如下:将交通数据转化为时空矩阵,经过归一化处理,传入自编码模型中得到扩展数据,通过融合扩展数据与原始数据,得到增强后的数据集,将其传入上图所示的模型中,使用CNN提取数据的空间特征,并使用BILSTM提取数据的时间特征,融合提取到的时空特征,并通过全连接层得到预测结果。对空间邻近性特征的提取城市的交通路网受限于网络本身结构,相邻地区的交通流量相互存在一定影响,空间邻近性特征的获取对于交通流量预测具有重要意义。本研究采用卷积神经网络CNN获取交通数据的空间特征,由于实验数据来源于高速公路网络,以站点标号代替经纬度,反映相关的地理位置信息,更适用于使用一维卷积网络提取特征,故本研究网络结构基于一维卷积网络进行设计,在每个时间间隔t内,将区域p与其临近区域的交通数据整合成一个序列X,作为输入传入卷积层中,在每个卷积层的处理过程可表示如下:ps(n)=f(n)*g(n)=2f(m)g(n-m)m二一8经过i层卷积后,得到结果s,,iGRnxNxy,经过扁平层处理后,得到特征向量口eRnxni,p p使用全连接层降低向量维度,得到该区域的空间位置特征。本研究目前设计了两种CNN网络模式来提取空间特征,方案一和方案二分别如图2-4和图2-5所示:图2-4CNN网络方案一方案一为直接连接模式,经过一系列卷积归一化操作后,将传出数据降维,传入下一模块图2-5CNN网络方案二p图2-5CNN网络方案二p方案二将每一层的输入与该层的输出的连接在一起,增加了网络的稠密度。对时间特征的提取交通数据具有鲜明的时间特性,同一地区前后时间关联性较强,并且会随着时间的推移呈现出一定的周期性变化,本研究拟采用多层双向长短时记忆网络模型(BILSTM),BILSTM由前向LSTM和后向LSTM结合而成,能够获取前后数据的变化规律,从而更有效地提取交通流的时间特征。本研究将X={x0,x1,…,xn}(区域p的N个历史时间交通流作为输入,将时间序列传pppp入模型,BILSTM处理过程如下:TOC\o"1-5"\h\z—► —►h=LSTM(x,h)t tt—1<— <—h=LSTM(x,h)t tt—1—— ——)=g(W—h+W—h+b)

t hythytyLSTM处理过程如下:f=o(Wx+Wh+b)

t xfthft-1fi=o(Wx+Wh+b)

t xiihit-1io=o(Wx+Wh+b)

t xothot-1oc=fc+itanh(Wx+Wh+b)

ttt-1t xcthct-1ch-otanh(c)tt t将多层BILSTM网络中的输出结果y传入全连接层,得到最终的预测结果y。t ?+12.3实验结果将实验结果形象化表示如图2-6和图2-7所示,图2-6为某一时刻所有站点的交通流量,红色折线表示实际流量,蓝色折线表示预测流量。图2-7为某一站点在三小时内的交通流量,红色折线表示实际流量,蓝色折线表示预测流量。图2-6某一时刻所有站点的交通流量900-S00-700600500-40030020010000 3 6 9 121518212427303336图2-7某一站点三小时内的交通流量(计数间隔为5分钟)将不同模型的实验结果进行对比,如表2-1如下:表2-1模型对比结果MAERMSER2SAE22.5996832.7200360.9549491046518688CNNiBILSTM22.42355332.030030.9569004005739206CNN2BILSTM22.66000232.5081250.9554865502915436AECNN1BILSTM21.83085431.3658370.9585459328801831从实验结果可以看出,CNN_BILSTM模型比SAE精确度高,同时,对CNN进行一定的连接改动不会提升预测精度,但经过数据扩展,模型的预测效果有了一定提升。3.后期拟完成的研究工作及进度安排后期拟完成的研究工作如下:调节参数,找到更合适的网络层数,优化模

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论