《基于图神经网络的交通流预测问题研究》11000字_第1页
《基于图神经网络的交通流预测问题研究》11000字_第2页
《基于图神经网络的交通流预测问题研究》11000字_第3页
《基于图神经网络的交通流预测问题研究》11000字_第4页
《基于图神经网络的交通流预测问题研究》11000字_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于图神经网络的交通流预测问题研究摘要:伴随着当前国内汽车市场不断发展,大规模的车辆保有量必然对交通通行效率带来巨大的影响。如何对整体交通网的流量情况进行精确预测已经成为工业界和研究界共同关注的热门问题。当前的舆图应用软件,往往只能准确的给出当前的交通状态,对交通态势的预测并不精确。伴随着人工智能技术的不断发展,由于图神经网络可以解决不规则图上节点的特性的优点,越来越受到研究界的普遍关注。而交通网可以很方便的抽象为图,同时利用图神经网络的方法可以很好的提取交通网的时空特性,从而解决交通流中长期预测的问题。本文调研了图神经网络在交通流预测方向的发展现状,分析比较了现有的模型,选用可行性和准确度较高的模型ASTGCN并使用自己的训练集对算法进行验证,并与STGCN进行前后辈之间的模型结构实现比对,提出对ASTGCN模型融合了STGCN优势点的改进方向。最终,再次训练算法验证了精度。关键词:图卷积神经网络时空分布交通流预测目 录TOC\o"1-1"\t"标题2,1"\h\u1引言………………12图神经网络技术基础介绍……………………42.1图神经网络概述……………42.2交通预测问题…………………62.3不同的数据集与建图方法……………………62.4一些其他应用于交通流预测的图神经网络模型……………73时空图卷积网络模型…………93.1模型结构………………………93.2算法简述………………………103.3模型意义……………………124混合注意力机制的时空图卷积网络…………124.1模型结构……………………124.2注意力机制…………………144.3时空图卷积…………………154.4模型缺陷与改进……………154.5实验…………17参考文献……………………241引言研究背景和意义最近几年,伴随着中国汽车市场的不断发展,截止到2019年,国内每家每户的私家汽车加一块就要有2.4亿辆了。如此大量的车辆必然对交通的通行效率产生巨大影响。城市和高速公路交通拥堵时有发生。如何准确地预测整个交通网络的交通流量这样的问题受到了业界和研究界的热门关注。目前的舆图应用软件,往往只能准确给出当前的交通状况,对交通状况的预测并不准确。常用的交通流预测方法主要是基于传统的时间序列和众包的方法。这些方法可以解决交通流的短期预测问题,但对于中长期预测,往往偏差较大。伴随着人工智能技术的不断发展,图神经网络(GNN)因能解决不规则图上节点的特性而受到越来越多研究者的关注。交通网络可以很容易地抽象为一个图形。同时,利用图神经网络的方法可以提取交通网络的时空特征,从而解决中长期交通流预测问题。伴随着交通行业的不断发展和交通数据的快速增长,学者们希望利用这些数据为城市交通服务,因此智能交通系统成为未来交通系统的研究方向。短时交通流预测作为智能交通领域的研究热门,对交通诱导和路径规划具有重要意义[1]。最近几年,时空预测在大大小小的领域都被应用,其中的一个例子就是交通流预测问题。交通流预测就是,在有路网地图和过去的交通流量的情况下,预测以后的交通速度。如果能做好长期的交通预测,不仅能便利百姓生活中需要的出行规划,更能节省百姓在出门之前决定路线的时间。对于道路的管理机构来说,更全面的预测更多可能性的交通路网状况是重中之重。道路交通流越是随着时间变化就越依赖时间,这是一个逐渐变强的过程,而不是平稳的,举个例子,比如早高峰晚高峰,再比如节假日之类的都会影响到道路的交通速度;而且,道路交通流并不是一板一眼的,现实里的道网比起模型更为复杂错综,具有非欧氏性和方向性。现如今,深度学习也是发展的蒸蒸日上,人们也越来越愿意用深度学习来作为解决交通流预测问题的方法,而图神经网络的发展和走向热点也为建立起道网的空间相关性建模打开了新的一扇门[2]。国内外研究现状 在智能交通领域的研究中,交通流预测问题一直受到许许多多学者的青睐,并提出了许多迥异的研究方法和可行性较高的数种预测模型。一般来说,包括以下两种方法: (1)基于经典统计学的预测模型:在预测交通流量时,模型主要分析历史交通流量数据,并对数据进行线性回归和参数优化。例如,Kumer等人在对输入时间序列做了必要差分的基础上,通过绘制自相关数和偏自相关函数,确定了SARIMA模型的适当阶数,令输入时间序列稳定[4];2017年,Kumar等人提出了一种基于卡尔曼滤波技术的预测方案,需要有限的输入数据。在预测中,只使用前两天的流量观测值。KFT开发的方案能够以预期的精度预测第二天的流量值,同时我们还尝试使用感兴趣日期的历史数据(前两天的流量数据)和实时数据[5]。这种模型主要针对历史数据信息进行交通流预测。该模型方法相对简单,易于操作,可以解决某些情况下的交通拥堵问题。但该模型的应用范围较窄,只能对特定情况下的交通流进行预测,预测精度较差。 (2)基于数据驱动预测模型:该模型以历史交通数据为基础,运用深度挖掘算法分析交通流数据,进而对数据的未来变化趋势进行预测[6]。在深度学习中,人们经常用卷积神经网络来预测交通流。冯宁等人提出了一种St-resnet深度学习的逆方法,利用残差卷积神经网络预测每个区域的流动人口数量[6];Wu等人采用了一种基于卷积神经网络(CNN)的交通标志检测方法,通过支持向量机将原始图像转化为灰度图像,然后利用卷积神经网络进行训练和学习,并采用引导程序的方法提高了检测精度,避免了过拟合的问题[7]。分析了数据驱动预测模型的研究现状,发现这种模型可以通过仿真实验获得预测数据,实验操作相对简单,但不能实时预测交通信息,不能应用于大规模路网交通。 综上所述,大多数模型总是针对单一交通流数据,都没有考虑多个交通流因素。由于交通场景的复杂性和非线性相关性,交通流速度与交通流量之间存在着密切的相关性。因此,只考虑一个交通因子作为数据集预测,在一定程度上降低了交通流预测的准确性。 图神经网络发展方面,传统的神经网络只能对标准规则的网格数据有效地提取部分数据特征,不能很好地处理复杂、非线性的交通数据。在这种情况下,我们需要考虑使用图卷积神经网络。GCN能够处理非线性和不规则的图形数据,对拓扑图形结构数据进行卷积,捕捉图形的结构特征,有效地利用拓扑图,从中提出空间特征以学习[3]。目前,图卷积的主要方法有空域法与谱域法。空域法把卷积核在图上的节点和它的邻域进行应用。Niepert等人提出了一种图卷积神经网络的学习模型,构造了具有离散特征和边属性的拓扑图结构,并对输入局部连接区域进行了操作。实验表明,该方法对图形结构数据的学习是有效的[10];Beck等人提出了一种新的图卷积模型。基于图序列学习问题,将输入变换与门控神经网络相结合,解决了以往工作中参数爆炸的问题,允许节点和边有自己的表示层,该模型在生成AMR图和基于语法的神经机器翻译方面优于强基线[11]。 综上所述,目前的交通流预测只是根据T时刻的交通因素预测未来某一时段(T+1)的交通流,没有考虑通过(T−n)和T的历史时间流预测交通流,即不考虑时间相关性,某种意义上来讲,预测的准确性被降低了很多;大多数卷积神经网络只能处理规则的数据结构,而城市交通流信息是不规则的。采用卷积神经网络进行预测会降低预测精度。主要研究内容本文调研了图神经网络在交通流预测方向的发展现状,分析比较了现有的模型,选用可行性和准确度较高的模型ASTGCN并使用自己的训练集对算法进行验证,提出对ASTGCN模型融合了STGCN优势点的改进方向。最终,再次训练算法验证了精度。近两年关于图神经网络在交通流预测方面的研究越发热门,发展越发迅速。新的模型在改良旧模型缺陷和提高精度之后层出不穷,本人通过对各个模型发展程度的研究对比,吸取平衡经典模型的优劣,选择当前可行性较高的模型进行改良尝试,以提高精度。章节安排本文在交通流预测问题的中长期预测精确度的需求背景下,对现阶段研究者提出的各个模型进行研究和选取改良。在上文的第一章简述了当今图神经网络应用于交通流预测问题的背景和意义,应用过程中产生的各种各样的问题,国内外研究现状以及本文研究的重点内容。第二章中,本文会介绍图神经网络的技术基础,简单介绍目前在交通预测方向前人提出的一些模型和解决问题的方法,以及交通流预测问题的基本解决方式。第三章中,本文会介绍在交通流预测问题中开创了从空间走向时空分布、本文提出改良方向的模型的基础模型STGCN,为第四章最终算法模型的改良奠定基础。第四章中,本文会完整详细的介绍所改良的模型的原型,以及改良的方向,具体实验的过程以及实验的结果。2图神经网络技术基础介绍2.1图神经网络概述 图神经网络是应用于图的神经网络模型的总称。图神经网络分为五类,如图2-1所示,不再文字叙述。图2-1图嵌入与图神经网络的关系 图卷积神经网络是一种利用图卷积的神经网络。由于卷积神经网络(CNN)在图像处理中的成功,卷积运算自然地应用于图数据。目前,GCN在图数据处理方面的地位与CNN在图像处理方面的地位相当。 图卷积网络将卷积运算从传统数据迁移到图数据。举个例子,假如这里有一格图类型的数据,在这个图数据当中有各具特征的n个节点,然后我们把这些节点的特征设置成一个n×D维的矩阵,记为X;则节点间的关系可以表示成一个n×N维的矩阵,记为L,L是一个邻接矩阵。那么,X和L就是模型的输入。对于那些复杂的图神经网络模型来说,图卷积网络是它们的基石。 GCN和RNN也有着相似之处,通过模仿RNN类的结构对时间序列数据进行建模,可以理解GCN建模的空间数据。在每次计算“点”时,RNN将前一时刻“点”的隐层状态和当前时刻“点”的输入发送到同一模型结构中,得到当前时刻“点”的隐层状态和输出。类似地,GCN发送当前点的输入特征、当前点的相邻边的输入特征、当前点的相邻点的输入特征,将当前点相邻点的隐层状态转化为相同的局部传递函数和局部输出函数,得到当前点的隐层状态H和输出嵌入。最后用迭代法得到整个图的表示。 经典卷积网络的局限性在于它不能处理图结构的数据,只能处理固定维数的数据,并且必须对局部输入数据进行排序。图卷积神经网络需要解决的问题是处理序列无序性和维数可变性的数据。2.2交通预测问题交通方面的问题主要包括以下几类,交通拥堵、旅行需求、交通安全、交通监管和自动驾驶[11]。交通预测的目的是根据历史交通数据和交通网络的拓补结构,预测未来的交通状况,如速度、流量和拥挤程度。良好的预测结果可以帮助出行者选择合理的出行路线,为城市管理者提供决策支持,缓解交通拥堵,减少资源浪费。目前,基于图深度学习的交通方面问题基本是关于时空预测的。他们用一种非常相似的方式来形式化他们的预测问题,尽管不同的数学符号和表示,基于图形的交通时空问题还是有一个通用的公式[11]。加入我们把交通网络表示为一张图,记为图G=(V,E,a),对于不同的任务来说,图G可以有向也可以无向,可以有权也可以无权。V代表一组节点,|V|=N表示图中含有N个节点。每个节点代表一个交通对象,可以是一个传感器、一个路段、一个道路交叉口,甚至是一个GPS交叉口。节点之间连通性的边集表示为E。交通数据的格式:交通数据和时间相关,具有时序性;t时刻的交通数据可以记为vt∈Rn×c预测定义:vt−T’+1,v交通流预测问题本质上是时间序列预测问题,时间序列内部的关联即是问题的时间维度;不同的节点之间必然产生空间上的关联,则是问题的空间维度。2.3不同的数据集与建图方法 第一类是传感器数据集。典型的数据集是PEMs美国高速公路数据集,它可以采集道路车辆的速度、交通流量等信息;传感器之间的路段也可以看作节点; 第二类是GPS数据。GPS数据由多条车辆运动轨迹组成,通常包括时间戳、经纬度、速度等信息。每个GPS记录可划分为最近的路段。通过交叉口将一条道路划分为多个路段,建立路段图或交叉口图; 第三类是出租车数据集,可分为出租车订单数据集或共享单车数据集,反映移动方式或出行需求。以往的工作通常将城市划分为若干规则网格,每个网格代表一个区域,然后在每个网格中预测未来的出行需求; 第四类是城市轨道交通数据集,如地铁线路或公交线路的数据集。这种数据集具有固定的站点,通常以单位时间内站点上下车人数为节点特征。2.4一些其他应用于交通流预测的图神经网络模型 基于图神经网络的多元时间序列预测(MTGNN)[15],它基于图神经网络,是第一个在图的方向上进行多元时间序列数据建模的;并通过一种新的图学习模块来学习那些具有空间上的依赖关系的变量,还提出了一种GNN模型来解决无图形结构的数据问题;提出了一种无需预先定义的图形网络训练和图形结构学习框架,且模型的性能超过了当时现有的方法。该模型由四部分组成,图学习层,m个图卷积模块,m个时间卷积模块和一个输出模块,整个算法的流程如图2-2所示。图2-2MTGNN的流程图 动态时空图卷积网络(DGCNN)[13],在深度学习框架DGCNN中引入张量分解运算(layer),将实时交通数据分解为全局分量(稳定且依赖于长期的时空交通关系)和局部分量(捕捉交通流波动);在此基础上设计了一种动态Laplacian矩阵估计器,在图的卷积层实时估计Laplacian矩阵进行流量预测。图2-3DGCNN模型 基于时空同步图卷积网络(STSGCN)[14],在模型ASTGCN基础上,通过设计良好的时空同步建模机制,可以立竿见影地同步捕捉局部时空的复杂相关特性,解决了前者时空特性捕获异步的缺陷。同时,为了能有效地捕捉局部时空图的异质性,模型中在多个不同时间段均设计了module。该模型构造了一个局部时空图,将单个空间图与相邻的时间步长连接成一个图;设计了时空同步图卷积模块(stsgcm)来提取局部时空图的时空相关性;设计了时空同步图连续层(stsgcl),即在不同的时间段部署多个stsgcm来捕获远程时空网络数据的异构性;将多个stsgcl进行叠加,得到长程的时空关系和异质性,得到最终的预测结果。图2-4STSGCN整体架构 以上是近年一些创新性很好精度出色的GCN模型,但由于可操作性与模型理解深度等可行性原因,笔者并没有选择它们作为改良的奠基。但它们在解决交通流问题中仍具有显著地位,故于此单独列出。3时空图卷积网络模型3.1模型结构 STGCN[12]克服了传统的方法依赖于手工部分或者遍历规则的局限性,利用图卷积提取数据的空间特征,而时间特征则通过一维卷积来进行学习。图3-1STGCN的网络结构 STGCN包括两个时空图卷积块和一个输出全连接层。每一个时空卷积块由两个时间门控卷积和中间的一个空间图卷积构成,作为这个模型的网络结构的核心。3.2算法简述网络输入是M个时间步的图的特征向量X∈RM×n×Ci(Ci=1)以及对应的邻接矩阵W∈Rn×n3.2.1时域卷积块和传统的时空模型比起来,这个模型最大的创新之处是时间特征的信息是通过一维卷积学习的。在解决数据量较大的流量预测问题时,大量费时费力的操作往往是复杂的选通机制和迭代训练。另外,因为递归神经网络的状态是非常依赖于前一步骤记录下来的信息的,所以难以捕获到波动情况较强的数据,比如早晚高峰交通流。恰恰相反的,卷积神经网络不会受到过往时间点内预测数据的限制,而且有着较好的并行训练性和耗时性,因此可以更好地捕获数据的波动。时域卷积块如图2-1最右侧所示,于每个节点处输入X∈RM×n×Ci,并在时间维度上进行一维卷积,卷积核为Γ∈RKt×Ci,个数为然后进行GLU激活:Γ∗τX=P⊙σ公式2-2中,P和Q代表GLU的门输入,⊙表示哈达玛积(哈达玛积表示矩阵中元素对应相乘),sigmoid函数门σQ控制的是目前状态中的数个输入P中的哪个与时间元素序列中的构成与动态方差具备相关关系。对于一张完整的时空图:输入X∈RM×n×Ci,输出Y∈3.2.2空域卷积块图卷积最早在图频谱理论中被提到,其中将图卷积定义为信号x和图核Θ的乘积,即Θ∗gx=ΘLx=ΘU∧ 公式2-3中,图傅里叶基U∈Rn×n(n表示图中的顶点个数)是归一化的图拉普拉斯矩阵L=In−D−1以下的切比雪夫多项式和一阶多项式近似都是为了让图卷积运算变的不再那么复杂采用的方法:Θ∗gx=ΘLx≈k=0 其中,Tk空域卷积是在每个时间步的图上进行卷积,但不在时间步之间进行。输入X∈Rn×Ci,按照Y=i=0K−1θ其中Ti(x)=2xTi−1(x)−Ti−2(x),L=2Lλmax−对于一张完整的时空图:输入X∈RM×n×Ci,输出3.2.3输出层依照时域卷积块的一维卷积过程,每当经过一个时空卷积块后,数据在时间维度的长度都会减小2(Kt−1)输出层包括一个全连接层和一个时域卷积层,时域卷积层的卷积核大小范围为Γ∈RM−4(Kt−1)×n×Co,个数为Co,将输出映射到Z∈Rn×Co。全连接层v=Zω+b,其中损失函数是目标值和预测值的距离度量的重要方法:L(v;W其中Wθ是所有可训练参数,v是预测值,vt+13.2.4残差连接残差连接涵盖在了每个时域卷积块与空域卷积块之中。3.3模型意义 由卷积神经网络组成的STGCN是由图卷积和门控时间卷积通过时空模块组成的,以进行时空交通流预测。 由于只采用卷积神经网络,与循环神经网络相比,模型并行训练的效果好,模型中的参数少,因此GPU可以更好地应用。也就是说大规模数据集可以更有效地使用该网络。 这个模型在现实中的交通数据集上测验表现出色,并且在中长期预测方面的效果较为优秀。 奠定了时空分布预测交通流模型的基础。4混合注意力机制的时空图卷积网络4.1模型结构ASTGCN[16]主要由三个独立的部分组成,分别模拟交通流的三个时间特征,即邻近性、日相关性和周相关性。每个独立的部分包括两个部分:时空卷积部分,通过用标准卷积来描述时间特征,用体积来捕获空间特征;时空注意机制,通过加入注意机制,能够有效地捕获流量数据中的时空动态相关性。最终结果由对三个分量的输出结果进行加权融合来得到。STGCN模型缺乏对交通流动态时空关系的关注,因此本模型是在STGCN的基础上加入了注意力机制来捕获数据的动态时空相关性。图4-1ASTGCN的网络结构 框架分为三个部分,分别提取了时间层面邻近、日、周三种依赖特征。邻近部分包含预测时段邻近的T个时段,日时段部分含有预测时段附近几日一致的数个时间元素列,周时段部分含有预测时段附近几周一致的数个时间元素列。这三个部分的结构相同,每部分都由一个全连接层和许多个时空卷积块构成。每个时空块中都有一份注意力模块和卷积模块。模型为了让训练的效果和效率变的更好,采用采用残差连接。最终结果由用一个参数矩阵加权合并三个分量的输出结果进行加权融合来得到。4.2注意力机制4.2.1空间注意力 在空间维度上,即使是不同位置的交通状况也有着互相影响的情况,这具有很强的动态性。所以我们通过注意力机制的特性,自适应地捕获空间维度中各个节点之间的动态关联性。S=V·σ{X·W1·WSi,j'=维度关系:X∈R(N∗C∗T),其中N表示有N个观测点,C表示三种交通特征观测值(流量,速度和时间占有率),T表示输入的T个时间步。W1∈R(T),W2∈R(T),W3∈R(C∗T),V∈R(N∗N),b∈R(N∗N),最终结果S∈R(N∗N)。公式44.2.2时间注意力在时间维度上,即使是交通状况的多个不同时间段之间也存在着相关性,但是在不同情况下,它们的相关性也不尽相同。同理,我们通过注意力机制来自适应地为数据赋予不同权重。 E=V·σ{(X)T·Ei,j'=维度关系:X∈R(N*C*T),其中N表示有N个观测点,C表示三种交通特征观测值(流量,速度和时间占有率),T表示输入的T个时间步。U1∈R(N),U2∈R(C∗N),U3∈R(C),V∈R(T∗T),b∈R(T∗T),最终结果E∈R(T∗T)。公式4-4为softmax4.3时空图卷积4.3.1空间维度图卷积切比雪夫多项式近似:gθ∗Gx=g其中,θ∈R(K)为多项式系数的向量,L=2λ其中λmax为拉普拉斯矩阵的最大特征值,则切比雪夫多项式的迭代关系为:Tkx=2x公式4-7相当于利用卷积核gθ提取0到(K−1)阶邻居的信息。将空间注意力机制应用到该图卷积的过程中即为gθ∗Gx=gθ另外,由于输入数据X的范围是X∈R(N∗C∗T),因此在每个时间步上都要有C个滤波器。4.3.2时间维度标准卷积通过图卷积获取邻域信息,再叠加标准的卷积层,然后进一步合并相邻的时间步信息在时间维度上。 xℎ(r)=ReLU一个总时空块由前文介绍的时空注意力块和卷积块构成。然后对多个时空块进行叠加,就能提取进一步的更大范围的动态时空关联特征。最后,通过一个全连接层,来保证各个部分输出的内容与预测目标的shape和size一致。选取ReLU作为全连接层的激活函数。最后将三种特征的结果融合到一起:Y=Wℎ4.4模型缺陷与改进4.4.1缺陷分析我们对比上文提到的STGCN与ASTGCN,这两个模型有明显的先后与借鉴关系。ASTGCN在STGCN的基础上,在时间方面将时间更细致地分出了三种特征,一天的早晚与平时,一周的平日与周末,这些都是具备着不同特征的时间段。我们知道,这些时间段的交通流量势必存在着不同的特点,比如早晚合平日时段流量更大。STGCN限于当时的模型发展状况则没有考虑到这一点,但是STGCN率先使用了门控卷积(GatedCNN)[17]对时间维度进行处理,而ASTGCN则使用的是一位标准卷积,并使用ReLU激活函数。现在我们来聊聊门控卷积和一维标准卷积有什么区别。门控卷积的结构其实和标准卷积并不存在很大的差别,差就差在在卷积层引入了门控机制。所谓的门控机制,其实就是通过一个门控线性单元(GLU)[17],把卷积层的输出变成了公式4-11,也就是,把一个不带非线性函数的卷积层输出,乘上一个用sigmod激活函数激活过的卷积层输出。 Hl=(Hl−1∗W+b)⊗σ(H 因此,门控卷积和标准卷积的区别就是,输出结果并不是由某某激活函数激活,而是由上面的“门限”限制的结果。门控控制了公式前一个乘数中的哪些信息能传到下一个卷积。虽然,即使不使用门控也依然不影响ASTGCN输出精度更高的结果,但加入门控可以显著提高这个模型的精度。4.4.2改进方法通过将ASTGCN中的时空卷积块内的时间维度一维标准卷积,改为使用门控卷积捕获时间特性(如图4-2),替换了作为训练核心的卷积块,通过这样的调整提高ASTGCN的精度。 图4-2新stBlock块改进后,时间维度门控卷积的输出结果为: xℎ(r)=g公式4-12中,P和Q代表GLU的门输入,⊙表示哈达玛积(哈达玛积表示矩阵中元素对应相乘),sigmoid函数门σQ控制的是目前状态中的数个输入P改进后的模型,本人暂且将其称为“新ASTGCN”,以作后面的表述。4.5实验4.5.1实验数据 实验选用的数据集是由本校指导教师提供的保定市交通流量数据集,共有200个传感器节点,8928个时间节点,总共一周的流量数据。用邻接矩阵表示传感器节点之间的位置关系(如图4-3),经过预处理程序提取有向图(如图4-4)。流量表(如图4-5)则处理储存成npz文件,图4-6为第200个传感器节点(随机抽取示意)的流量示意图。图4-3bdadjMat(部分)图4-4经过预处理后的bdadjMat(部分)图4-5bdgandata(部分)图4-6bd第200个传感器的流量示意图4.5.2数据预处理(1)生成每个批的序列索引方法search_data(),参数:sequence_length:int类型,历史数据的序列长度;num_of_batches:int类型,用于训练的batch的个数;label_start_idx:int类型,预测目标的第一索引;num_for_predict:int类型,每个样本预测的节点数;units:int类型,单位,week为7*24,day为24,recent为1points_per_hour:int类型,每个小时划分的时间段个数该方法对每个batch进行循环,batch的开始索引=预测标签的开始索引-每小时的片段个数(12)*单元时间(周:7*24)*i,batch的结束索引=开始索引+每个样本预测的节点个数,最后返回每个元素都是一个元祖,元祖里存储了开始索引和结束索引的列表。(2)生成四类批数据四类批数据是指week_sample,day_sample,hour_sample和target。方法get_sample_indices(),参数:data_sequence:三维数组的数据序列(数据的shape是(序列长度,顶点数,特征数));num_of_weeks,num_of_days,num_of_hours:int类型,不加赘述;label_start_idx:int类型,预测目标的第一个索引;num_for_predict:int类型,对每个样本预测的数目;points_per_hour:int类型,每个小时的时间片段数,以5分钟为一个时间段,每个小时共划分12个每类批数据调用search_data方法生成索引序列,根据分类,把每个batch的数据合并在一起,返回每类的三维数组数据。(3)生成训练集、测试集、验证集方法read_and_generate_dataset(),参数:graph_signal_matrix_filename:str类型,图信号矩阵的文件名;num_of_weeks,num_of_days,num_of_hours:int类型,不再赘述;num_for_predict:int类型,预测的个数;points_per_hour:int类型,每个小时的节点数,默认12,因为1个小时,每5分钟一个时间段;merge:boolean类型,默认为否,是否将训练集和验证集都用于训练4.5.3实验结果本人分别使用公开的加州高速路网pems数据集中的04和08与保定市数据集进行了训练,预测结果模型评判指标使用平均绝对误差(MAE)和均方根误差(RMSE)如下表4-1,保定数据集预测节点误差曲线图如图4-7和图4-8,流量曲线如图4-9,示意的是随机取样预测第2个节点时预测结果和目标结果的曲线。PEMS04PEMS08BDMAERMSEMAERMSEMAERMSESTGCN25.1538.2918.8829.8710.917.03ASTGCN23.135.6118.8128.598.9513.96新ASTGCN21.832.8216.6325.276.410.29表4-1不同数据集误差值比对表图4-7bd在三种模型上预测的mae值曲线图图4-8bd在三种模型上预测的rmse值曲线图图4-9bd预测流量曲线示意图通过以上图表可以看出,三个数据集的新ASTGCN模型预测误差值相比于原模型均有一定幅度的减小。另外,传感器数较少的数据集预测精度会偏高,保定市交通数据集达到了最为理想的预测效果,在验证了原模型的同时,证实了新模型的可靠性。结论本文调研了图神经网络在交通流预测方向的发展现状,分析比较了现有的模型,选用可行性和准确度较高的模型ASTGCN,并分析了模型的缺点与不足,使用自己的训练集对算法进行验证,提出对ASTGCN模型融合了STGCN优势点的改进方向,使用门控卷积取代一维标准卷积,并再次验证了算法,确定精度有所提升。虽然实验课题基本完成了,但自己的工作做的其实还远远不足。基础知识掌握有限,模型改进创新点不足,实验数据规模较小,实验次数较少。自己距离一个真正的科研人仍具有很大提升空间,希望以后能有机会更多接触科研项目,拓宽自己的视野和水平。参考文献[1]彭文勤.基于深度学习的短时交通流量预测技术研究[D].重庆邮电大学,2020.[2]李小妍.基于图神经网络的交通流量预测[D].电子科技大学,2020.[3]朱凯利.基于BRB和RNN-GCN的交通流预测方法研究与应用[D].哈尔滨师范大学,2020.[4]KumarSV,VanajakshiL.Short-termtrafficflowpredictionusingseasonalARIMAmodelwithlimitedinputdata[J].EuropeanTransportResearchReview,2015,7(3):1-9.[5]KumarSV.TrafficflowpredictionusingKalmanfilteringtechnique[J].ProcediaEngineering,2017,187:582-587.[6]冯宁,郭晟楠,宋超,朱琪超,万怀宇.面向交通流量预测的多组件时空图卷积网络[J].软件学报,2019,30(03):759-769.[7]WuY,LiuY,LiJ,etal.Trafficsigndetectionbasedonconvolutionalneuralnetworks[C]//NeuralNetworks(IJCNN),The2013InternationalJointConferenceon.IEEE,2013.[8]NiepertM,AhmedM,KutzkovK.LearningConvolutionalNeuralNetworksforGraphs.JMLR.org,2016:2014-2023.[9]GravesA,MohamedAR,HintonG.SpeechRecognitionwithDeepRecurrentNeuralNetworks[J].IEEE,2013:6645-6649.[10]DBeck,HaffariG,CohnT.Graph-to-SequenceLearningusingGatedGraphNeuralNetworks[C]//MeetingoftheAssociationforComputationalLinguistics.2018.[11]YeJiexi

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论