版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、. . . . 基于支持向量机的快速路小时交通量预测摘 要快速路交通量具有复杂性和不确定性,对交通量的准确预测是实现智能交通诱导和控制的基础。智能交通能解决道路交通拥堵,减少交通事故,减少大气污染等现实难题,是我国道路交通发展的方向。充分考虑到快速路交通量所具有的非线性,时变性和随机性,提出将支持向量机回归算法应用到快速路小时交通量预测中。根据我国交通情况,利用某快速路小时交通量数据,进行快速路小时交通量预测。仿真研究结果表明,支持向量机泛化能力好,学习速度快,在快速路小时交通量预测中起着重要作用。关键词:小时交通量;交通量预测;支持向量机回归;仿真研究31 / 34AbstractExpre
2、ssway traffic flow has the complexity and uncertainty, the accurate traffic flow forecasting is the foundation to realize intelligent traffic guidance to control.Intelligent transportation can solve traffic congestion, reduce traffic accidents, reduce the realistic problems such as air pollution, is
3、 the direction of our country road traffic development. The expressway traffic flow is nonlinear, time-varying and randomness, the support vector machine (SVM) regression algorithm was applied to expressway hours in traffic flow prediction. According to the traffic situation in our country, use the
4、one of Guangzhous expressways traffic flow data to forecast an hour expressway traffic flow. Simulation results show that the generalization and learning ability of support vector machine (SVM) is well, hours in expressway traffic flow forecasting plays an important role.Keywords: hourly traffic vol
5、ume; traffic flow forecasting; support vector machine regression;simulation research目 录摘要IAbstractII第1章绪论11.1 课题背景11.2研究目的和意义21.3 国外文献综述21.4 本论文主要容3第2章支持向量机理论52.1 支持向量机概述52.2 支持向量机回归与其类型92.3 本章小结9第3章交通流参数与预测方法103.1 交通流基本参数103.2 交通流量数据的采集和特性103.3 交通流预测的方法113.3.1 交通状态预测概述113.3.2 交通量短时预测方法123.4 本章小结13第
6、4章基于支持向量机的小时交通流预测144.1 概述144.2 支持向量机回归的交通信息预测144.3 支持向量机的交通信息预测的具体步骤154.4 本章小结16第5章仿真研究175.1 交通流量预测175.2 本章小结30结论31参考文献32致33第1章 绪论1.1 课题背景城市交通系统是城市经济社会活动的基础设施,城市化的发展和汽车数量的增加导致交通道路通行压力的增加。城市交通的供需矛盾越来越显现,至此引发了日趋严重的交通道路堵塞,严重的环境污染,交通事故频繁发生等问题,造成重大的经济损失。交通堵塞随即引发交通通行效率降低和能耗增加的问题。据研究数据表明,汽车时速从40公里降到10公里时,能
7、源消耗量加倍增大,还严重降低了交通通行效率,同时汽车排放的氮氧化物、一氧化碳等气体加重了环境负荷,造成严重的大气污染和空气质量下降,甚至带来连续数月的雾霾天气。快速路作为现代化交通的标志设施,具有高效、快速、舒适和安全等优势,对促进社会经济发展起到关键的作用。快速路减少了车辆之间的冲突,减少了交通堵塞的现象,提高了道路通行的效率。但是随着社会经济的发展,城市化进程的加快,快速路的交通流量也迅速增加。快速路逐渐出现了严重的交通拥堵的现象,导致快速路通行效率降低,环境污染日益加重等问题,快速路的优势似乎慢慢消退,这种现象影响了人们生活水平的提高和各项事业的现代化进程。随着机动车数量不断地增加,交通
8、流量接近甚至超过道路的通行能力,对于已经建好的城市快速路显然是不能完全容纳的。为了解决机动车与快速路容纳能力之间的矛盾,除了通过行政手段改变交通的运行规律以外,最直接的方法就是修建更多的快速路,以增加道路的容纳水平。但是这需要巨额资金的支持,同时又要占用更多的空间。因此,这种方法并不能从根本上解决上述交通矛盾,那么研究和发展智能交通系统是必经之路。在不断扩建和完善的快速路交通网络的基础上,提高快速路交通网络的现代化管理水平,改造现有的道路运输通行系统,从而提高快速路的通行能力和服务质量。交通控制与诱导是智能交通系统的重要组成部分之一,交通状态的小时交通流量预测是交通控制与诱导的基础。目前的预测
9、方法主要有统计回归法、状态估计法、神经网络法、时间序列法、动态交通分配与交通模拟法等,尤其以神经网络为代表的这种新型人工智能方法。快速路道路交通系统是非线性、时变、不稳定、带有随机性的系统,受到的影响因素很多。神经网络具有较强的自适应能力,可以根据历史数据学习训练,但是神经网络会出现求得局部极小解的问题和过学习问题。支持向量机以结构风险最小化为目标,其具有结构简单、全局最优、小样本推广能力强的优势,能很好地解决非线性、高维数、小样本和局部极小点等问题,克服了神经网络的缺陷,成为机器学习界新的研究热点,已有将其应用于交通流量时间序列预测中。本课题针对快速路交通流量非线性时变的特性,应用历史交通流
10、量数据,提出基于支持向量机的快速路小时交通量预测方法,预测未来交通流量数据,然后根据预测结果进行科学的交通诱导、控制和管理,从而解决快速路交通堵或通行效率逐渐降低的问题。1.2研究目的和意义小时交通流量预测是智能交通系统的基础组成部分,智能交通系统能提高交通运输通行效率,改善交通通行环境,减少自然环境的污染,并最终实现人、车、路的完美配合。利用现代技术获取快速路的小时交通流量,据此进行下一时段的交通流量预测,为下一时段的交通流控制和诱导做好基础。准确的预测结果可以为出行者提供最佳的交通出行路线,科学合理地引导交通出行,减少出行者的时间浪费,从而优化道路资源配置,最大限度地发挥快速路的优势,避免
11、形成交通拥堵,实现快速路交通路网畅通无阻的目的。因此,对交通流量准确、与时的预测对于实现交通流诱导与控制十分关键。目前对小时交通流量预测的方法接近30种,基本可划分为两类:其一是基于确定的数学模型的交通信息预测方法,其二是基于知识的智能模型的交通信息预测方法。数学模型预测方法以数学模型理论为基础,一般情况下能取得较好的结果,但是模型比较简单,不能克服随机的干扰因素对交通流量的影响,就会容易造成很大的误差。后者以BP神经网络预测模型为代表,BP神经网络能在有错误数据的情况下利用结构本身的特性做出准确的预测,但是利用BP神经网络过分强调学习而出现过拟合现象,使模型的泛化能力得不到充分发挥,同时还会
12、出现,欠学习,局部极小点问题。支持向量机回归预测方法采用结构风险最小化,可以避免神经网络的一些缺陷,在解决小样本数据、非线性问题以与高维模式识别方面有很多优势。本文提出基于支持向量机回归预测快速路小时交通流量的方法,利用采集到的快速路交通流量实时数据,预测快速路未来的小时交通流量,解决快速路拥堵和通行效率不高的问题。本课题研究具有重要的实际意义和社会意义,快速路小时交通量预测对城市快速路的发展,避免交通事故频繁发生和防止交通堵塞现象,合理分配交通资源配置和减少自然资源浪费和时间浪费有着深远的影响,这可使城市快速路健康快速发展,为国家的经济高速发展和人们生活水平的提高贡献更大的力量。1.3 国外
13、文献综述 由于交通流量变化发展迅速,并且随机性和不确定性强,规律不明显,导致快速路交通拥堵问题日益明显,智能交通系统越来越受到专家学者们的重视,而交通流量预测对交通控制和诱导起着至关重要的作用。所以,近年来专家学者们开始着力于研究小时交通流量的预测,并取得了重大的成果。文献1主要介绍了道路网短时交通流量预测的基本理论、方法和应用方向。介绍了交通流量的时空特性属性,基本参数等基础知识,介绍了多种交通流量预测方法。文献2主要介绍了目前国外智能交通系统的研究情况,讲述了交通流量预测对于智能交通系统的重要性。列举了几个常用的交通信息检测器和宏观交通信息预测模型和方法。 文献3详细地介绍了支持向量回归算
14、法运用于短时交通量预测的具体做法,从支持向量回归机的选取到交通状态短时预测的方法,再到如何构建预测模型,最后进行仿真分析。从交通检测器中获得某时段交通流量为输入,对应时段的交通流量为输出,选取合适的核函数,对支持向量回归机进行训练。运用已训练的支持向量回归机预测下一时段或者周期的交通流量。文献4介绍了智能交通的特点和优势,由此引申出利用支持向量机来处理短时交通流量预测的问题。文章过实际的案例分析,阐述了支持向量机在交通系统运用中具有可行性和有效性。文献5主要分为两个部分,第一部分介绍了支持向量机的基本知识,让读者明白支持向量机的理论思想。第二部分主要介绍如何通过MATLAB软件来编写程序来实现
15、支持向量机的思想,如实现支持向量机分类算法。通过阅读这篇文章,能学习到基本的MATLAB语言编写的过程。文献6介绍了支持向量机主要有两大功能:支持向量的分类和支持向量机的回归。文献7介绍了短时交通预测的基本原理、预测模型的特性,主要介绍了对其建模的理论基础,特点,可行性进行有效地分析,最后对比和评价各类预测模型。文献8在总结了预测模型的基础上,将基于支持向量机的小时交通流量预测模型的仿真结果与基于BP神经网络的交通流量预测模型仿真结果进行对比,发现在预测精度,泛化能力,收敛时间,最优性方面等方面,基于支持向量机的小时交通流量预测方面更胜一筹。文献9支持向量机通过核函数工作在特征空间中,原问题能
16、在特征空间中获得线性性能,从而便于解决问题。文献10本文介绍了通过支持向量机和BP神经网络进行比较,证明支持向量机在交通量预测的可行性。通过比较可知,支持向量机预测交通流量的方法避免出现过学习和欠学习的现象,而且具有很好的推广能力,比BP神经网络具有更高的预测精度和鲁棒性。1.4 本论文主要容全文一共分为五章,每章主要容的安排如下:第1章 绪论。介绍本文研究交通流量预测的背景知识,简要阐明课题研究的目的和现实意义,讲述了智能交通系统的特点和优势,是我国道路交通发展的必然方向。第2章 支持向量机理论。本章节主要介绍了什么是支持向量机,支持向量机的回归类型有哪些,支持向量机核函数有哪些和他们各自的
17、特点。第3章 交通流参数与预测方法。本章讲述交通流的基本参数,交通流数据采集和特征,以与简要介绍交通流量短时预测的方法。第4章 基于支持向量机的小时交通流量的预测。本章介绍了支持向量机回归的交通信息预测方法的知识,实现训练样本的非线性回归和预测的具体步骤。第5章 仿真研究。利用样本数据使用MATLAB进行编程,然后进行仿真研究,得出交通流量预测结果,把预测结果与实际交通流量进行对比评价,计算出相对误差。第2章 支持向量机理论2.1 支持向量机概述机器学习是计算机科学和人工智能中重要的研究方向。机器学习从众多学科中吸收成果和概念,通过经验改动计算机算法并理解问题的背景、算法和算法中的假定。现代智
18、能技术的重要方向是基于数据的机器学习,研究样本集数据并从中寻找规律,然后利用规律对未来一段时间或周期的数据进行预测,最后根据预测结果进行科学合理的判断,指导人们正确地进行生产和生活。支持向量机是新兴的机器学习方法之一,面对小样本数据时,支持向量机能找出最优的解决方案,使泛化能力达到最优。目前,统计学习理论是对于小样本情况研究学习规律和预测的最佳理论。支持向量机的理论基础是统计学习理论,最初于20世纪90年代由VladimirN.Vapnick等人提出,近年来理论研究和算法实现取得很大的突破,成为克服“维数灾难问题”、“小样本”、“过学习问题”等的重要方法,在人脸检测,手写体数字识别、语音识别等
19、方面都有重大的应用。支持向量机最初为了解决分类问题,其目标是结构风险最小化,结构风险在经验风险和置信围中选择一个折衷,适用于有限样本的情况。对于线性可分的分类问题,通过平分最近点法,把分类问题转化为最优化问题,通过最优化问题的对偶问题求最优解,用最优解构造决策函数。对于线性不可分的分类问题,首先引入惩罚系数,通过平分最近点法,也可把分类问题转变为最优化问题,然后通过最优化问题的对偶问题求得最优解,因此构造决策函数。对于非线性分类问题,则先引进核函数K,把原问题转变为高维空间的线性问题,最后构造核函数。支持向量机将输入空间映射到一个高维空间,在这个空间中找到输入变量与输出变量的线性关系。通过选择
20、合适的核函数就能实现非线性变换后的线性分类,因为没有增加计算复杂度,所以就能达到避免维数灾害的目的。支持向量机的结构与神经网络相似,中间的每个节点对应每一个支持向量,输出的结果是中间节点的线性组合,具体结构如下图2-1所示:图2-1 支持向量机结构图为解决数据分类问题,针对线性可分情况,支持向量机从最优分类面发展而来,引入核函数,在高维空间中,支持向量机能建立最优分类面,两类线性划分的最优超平面如下图2-2所示:图2-2 两类线性划分的最优超平面上图中位于中间的实线平面叫做最优分类面,其附近的虚线面是两类样本集中离最优分类面最近的样本虚线平面,两条虚线之间的距离叫做分类间隔,最优分类线就是要将
21、两类样本分开,并且使分类的间隔达到最大。面对线性回归问题,先对分类线进行标准化处理,使得对线性可分的训练样本集满足下面不等式: (2.1)上式中,。训练样本可分,使分类间隔最大或最小的分类面就是所需要的最优分类面。使分类的间隔达到最大就是提高泛化能力,这是SVM的核心思想之一。设线性函数为:(2.2)上式中,优化问题则为寻找最小的。使得最小。约束条件为:(2.3)如果训练集中有不满足线性可分的样本点,还要在条件中引入松弛变量,因此式和(2-2),可以写成(2.4)约束条件则变为:(2.5)上式中,为惩罚系数,为不敏感损失系数,为变量的上下限。的具体取值为:(2.6)采用对偶原理将上式转化为二次
22、规划问题,构造Lagrange方程: (2.7)上式中,对参数,和的偏导都为零,即为 (2.8)与对偶优化问题:(2.9)约束为:(2.10)其中 其中只有一小部分为零。根据KKT定理,在最优解处(2.11)和 (2.12)在不敏感围,所有样本对应的都为零,而外部点则有或者,处于边界位置时,和都为零,于是和,因而得到(2.13)计算出b的值,进一步得到:(2.14)最后得到:(2.15)2.2 支持向量机回归与其类型支持向量机回归是支持向量机在预测、估计方面的应用。对于非线性回归问题,首先引入核函数,把问题转化为Hilbert空间中的线性回归问题,然后构造决策函数。在确定支持向量机回归的类型、
23、核函数、损失函数以与选取相应的参数后,就可利用支持向量机回归的算法,对实际问题建模,求出最优化问题,最后构造决策函数。根据算法的不同,支持向量机回归的类型主要有-支持向量机回归、-支持向量机回归和最小二乘支持向量机回归等。在支持向量机中,引入核函数是为了建立输入空间到高维空间,常用的核函数有:1、多项式核: (2.16) 其中:、为参数,其中,是任意正整数,。当时,为非齐次多项式核函数,当时,为齐次多项式核函数。2、Sigmoid核: (2.17)其中,、为参数。3、高斯径向基函数: (2.18)此外,还有傅里叶核、B-样条核等。-支持向量机回归、-支持向量机回归所选的损失函数都是-不敏感损失
24、函数,这个定义是当观测值和预测值之差不超过实现给定的时,则认为这时的预测值是无损失的。另外,还有其他损失函数,包括Gauss损失函数、Laplace损失函数、鲁棒损失函数、多项式损失函数分段多项式损失函数等。选择不同的损失函数,所要求解的最有问题的目标函数和约束条件就要发生变化。2.3 本章小结 本章介绍了支持向量机的基本理论,常用的核函数以与回归估计类型。支持向量机是基于统计学习理论,属于机器学习方法在计算机科学和人工智能中的研究领域,是用最优化方法解决机器学习问题的工具。支持向量机通过构造最优超平面,根据结构风险最小化,在确保分类精度的基础上,使学习机器的VC维尽可能降低,从而缩小执行围。
25、第3章 交通流参数与预测方法3.1 交通流基本参数通过对交通流量的实时诱导和控制是智能交通系统研究的根本目的,正确、与时地分配交通流量,从而缓解道路拥堵的情况,使交通网络畅通,高效。因此,如何对交通流量做出正确准确与时的预测,是控制和分配交通流量的前提。交通流具有时间和空间的变化特性,这种时空特性是某空间位置交通流运行状态的定性,定量特征。交通流量的预测实际就是对交通流基本参数的预测,交通流基本参数包括宏观参数和微观参数。宏观参数是指通过整体的道路运行状态特性表现出来,主要包括流量、速度、密度、道路占有率、排队长度等;微观参数是指道路中前后相关车辆间的运行状态特性,其中有车头间距与车头时距。一
26、般情况下,主要选择流量、速度和密度来反映交通流量的运行状态。流量,是指在单位时间通过某一断面的实际车辆数,是描述交通流特征的三大参数之一。流量是随时间和空间变化而变化的,要在道路系统一系列的位置上,搜集流量在时间和空间上数据和变化,为交通量的诱导和控制提供数据参考。速度,是指车辆在单位时间通过的距离,是描述交通流特性的三个基本参数之一。速度有几种,其中包括地点速度、行程速度、行驶速度、临界速度和设计速度。密度,是指在单位长度道路上,某一瞬时所存的车辆数量。密度是瞬时值,随着时间和空间的变化而发生变化。密度也是描述交通流特性的参数之一,应用在划分道路服务水平等方面。3.2 交通流量数据的采集和特
27、性交通流量是无时无刻都在变化的,因此如何获取准确的实时交通流量信息对下一时段或周期的交通流量预测十分重要。当前交通流量数据是预测的依据,所以交通流量数据的采集是交通流量预测的第一步。随着交通科技水平的发展,各种交通信息数据采集设备和技术应运而生。动态交通流量数据采集技术分为固定型采集技术以与移动型采集技术等。固定型采集技术主要是指运用安装在固定地点的交通检测设备对来往的车辆进行采集交通流量信息的方法,这些设备安装在快速路的主干道或者次干道的交叉路口。这种技术以线圈检测为代表,其具有技术成熟,精度高的优点,但是因为只能检测安装设备路段的交通流量信息,所以信息的完备性较差。移动型采集技术是指用安装
28、有检测设备的移动车辆在道路上采集交通流量信息的方法,这种技术以浮动车检测技术为代表,因为能检测到整个路段,所以采集到的交通信息的完备性好,但也存在精度不高的情况。运用交通流检测系统和路段检测器,可获得车辆通行数据资料,在交叉口路口前后分车型交通流信息,然后按照标准车型换算表换算成当前交通流量。由获得的交通流信息可以看出,交通流具有以下特性:1、交通流的时间、空间特性:交通流量在不同的时间或者不同的空间有不同的情况出现,而且同一地点不同时间的交通流也有很大的不同。2、交通流的不确定特性:交通流变化过程是非线性,高维度,非平稳的随机过程,容易受各种因素的影响。例如:本路段过去几个时段或者周期的交通
29、流量,路段上下游的交通流量,天气变化,交通道路通行状况等。此外,旅客会根据实际交通路况来调整行程和路线,交通拥堵的路段也就会随之发生变化。3、交通流的自组织特性:将由系统部决定,系统有序的结构形成与完善叫做自组织。构成交通流的行人和车辆会已实际交通状况来确定他们的行动方式,导致原能最有效的疏导交通的时间增长,而这种集体行为从产生到消失的时间很短暂。所以宏观上交通流量的演化过程存在自组织现象。综合上面的交通流特性可知,交通流是一个巨大而且复杂的网络,每一个因素都会影响着交通流的产生和发展变化。但每一次的变化绝非偶然,而是其部因素相互影响的必然结果,决定着下一时刻的短时交通流的变化。交通流的时空性
30、,随机时变不确定性等特性,呈现出一个错中复杂的交通网络,为交通流预测带来巨大的障碍和困难。因此,交通流的预测方法是世界研究的重要课题之一。3.3 交通流预测的方法3.3.1 交通状态预测概述预测是对客观事物的未来发展状态和变化趋势进行的分析推测,为后来的制定计划和决策提供依据。人们根据事物间的相互联系,应用科学知识和手段从已经掌握的历史资料数据中进行推断。如今,预测已经运用到各种领域,如:经济预测、社会预测、技术预测等领域。按照预测的性质,可以分为定性预测和定量预测:定性预测是以主观认识经验和逻辑判断为主,对事物未来的发展趋势和发展状况进行推测判断。定性预测一般应用于缺乏历史资料的事件,更多的
31、是根据专家经验进行预测。 定量预测是指根据准确、与时、全面的调查统计资料,运用统计方法和数学模型,对事物发展前景的水平、规模做出预测。定量预测和统计的数据资料,资料有密切关系,所以也称为统计预测。常用方法有回归法、时间序列法等。交通流量预测属于社会预测的畴,对社会的发展产生重要的作用。交通管理部门根据城市道路状态进行实时动态管理和控制,为市民交通出行信息服务。准确的道路交通信息预测,对进行科学合理的交通诱导和控制,提高快速路的通行效率,缓解交通拥堵情况,减少环境污染资源浪费有着重要的社会意义。然而,道路交通是一个无时无刻都在变化的复杂巨系统,道路状态预测难度很大。要发挥智能交通诱导与控制的作用
32、,就必须做好交通流量的预测工作。交通流量预测是基于动态获取的交通流量数据的时间序列来预测未来时段交通流量数据。常用流量,速度和占有率等作为反映交通流量状态的参数,因此,交通流量预测实质上是对这些交通流量的参数进行预测。典型的交通流量状态预测以统计分析的方法为基础,比如有历史趋势法、时间序列法等。历史趋势法模型比较简单,但精度较差,无法实时反应交通流量的时间变化特性,在没有准确实时的要求下,可以取得较好的效果。时间序列法相比前者计算简便,易于实时进行更新,便于应用。随着道路交通流量的随机性和非线性更强,后来就出现了支持向量机、神经网络、模糊理论、混沌理论和元胞自动机等非线性系统理论为基础的非线性
33、预测模型。交通流量预测要解决的是从具有随机性和不确定性的交通流量变化中,对采集来的交通流量参数数据进行数据研究分析,找出在规律并建立预测模型和方法,以此来预测未来时段或周期的交通流量变化,其基本流程如图3-1所示:车辆检测器采集的数据交通流量数 据预测模型和方法交通流量状态预 测图3-1 小时交通流量预测流程根据上述交通流量预测的概念,建立的预测模型应该符合如下的要求:1、实时性和准确性。预测模型要具备快速计算能力,且交通流量预测结果满足相对误差要求要求。2、动态反馈性。交通流量一旦发生特殊情况,能与时反馈到计算模型中进行调整。3、可靠性。交通流量预测受到的影响因素多种多样,例如天气的变化,道
34、路施工,交通事故等,因此模型应具有很好的抗干扰能力以与可以通过改变参数来适应时间和空间的变化。3.3.2 交通量短时预测方法交通优化和交通管理和控制的基础不能缺少交通流的预测研究,预测的信息是依据小时、日、月、季度、年为单位进行统计数据,也可能根据当前时段或者周期来预测下一个周期或时段的交通流状态。因此,做好交通流量短时预测非常重要,关系到交通诱导和控制的正常进行。迄今为止,已有很多理论和方法应用于短时短时交通流量预测领域,有基于线性系统理论的预测方法、基于知识发现的智能模型的预测方法、基于非线性系统理论的预测方法、基于组合模型的预测方法、基于交通模拟的预测方法等。上述的交通流预测的模型和方法
35、,各有缺点。基于线性系统理论的预测方法计算复杂性低,操作简单,但对于路况复杂的交通系统则不能满足预测结果的精确性和动态反馈性。基于非线性的系统理论的预测方法体现了交通状态非线性的特征,精确性较高,但计算复杂,理论有待深入。基于知识发现的智能模型有很强的数据处理能力,预测结果令人满意,但计算复杂性高,参数选择困难。基于组合模型的预测方法能结合各种模型的优点,如组合方法不当,预测效果可能反而变差。从目前情况来看,每一种方法都有自己的适用围和条件。对于某种特定的情形,预测结果能获得令人满意的结果,而在其他环境下,预测的结果却差强人意。所以,对于各种环境下的交通流预测,应该是多种方法,相互协调补充的过
36、程。短时交通流预测与其他的预测应用不同,提出了更高的要求,短时交通流预测是在线、实时完成的。一方面,短时交通量预测是为交通诱导和控制提供依据,所以预测模型必须在短时间完成复杂的计算,保证与时对下一时段的交通量进行估计,否则预测结果也是无用的。另一方面,交通流数据的检测、传输也是实时完成的,要从预测系统中获取大量的数据中作出准确性评价,作出科学准确的预测。3.4 本章小结本章对交通流的基本参数流量、速度、密度,进行了简要的叙述,了解到交通流具有时空特性,随机性,不确定性,不可预知性等特性,充分说明交通网络是一个复杂且时变的网络。接着对交通预测的概念进行了说明,对众多的交通流量预测方法进行分类,提
37、出了交通预测模型应具备的要求。最后提出了交通状态短时预测的方法,交通短时预测方法具有实时性、准确性、可靠性等特性,对交通管理和控制有指导的效果,是智能交通的关键技术之一。第4章 基于支持向量机的小时交通流预测4.1 概述第2章所提与的机器学习在交通流预测中主要是回归预测问题,就是从采集到的交通流量数据中找到规律,利用规律对未来交通流量数据进行预测,然后掌握交通流量的变化规律,根据规律采取相应的措施,实行交通诱导和控制。支持向量机和神经网络是众多新算法研究中的热点,都属于机器学习方法的畴。神经网络具有逼近任意非线性函数,容错和自学习的优势,具有强大的并行处理能力,学习能力和自适应能力。但是,神经
38、网络的学习过程过分依赖经验风险最小化原则,在小样本数据的学习过程中容易出现过学习现象,以致于泛化能力低下。此外,神经网络算法容易受到网络结构复杂性和样本复杂性的影响,容易陷入局部极小点和出现“维数灾害”问题。基于支持向量机预测交通信息的思想在于,首先选择非线性映射把样本向量从原空间向量映射到高维特征向量,然后在高维特征空间构造最优的决策函数。采用结构最小化原则,引入决策函数,利用原空间的核函数取代高维特征空间的点积运算。根据算法的不同,用于预测交通量的有-支持向量机、-支持向量机和最小二乘支持向量机(LS-SVM)等。4.2 支持向量机回归的交通信息预测基于支持向量机的预测方法,核心在于利用支
39、持向量机回归的思路。小时交通流量的支持向量机回归预测方法,是支持向量机回归理论在短时交通流预测中的一种应用,在交通状态随机的变化过程中,根据交通流量状态基本参数,结合其他因素,利用历史数据训练支持向量机,寻找出输入与输出之间的规律,建立支持向量机回归预测模型,以预测下一个时段或者周期的交通流量。应用支持向量机预测交通流,先用历史数据来训练支持向量机,从而得到输入与输出之间的相互依赖关系,那么预测时就能给定相应的输入就能得到交通流预测结果。假设给定训练数据样本(x1, y1), , (xl, yl)ÌRn×R。用非线性映射把输入的数据样本从原空间映射到高维特征空间,在高维空间
40、构造最优决策函数,同时引入损失函数,用原空间的核函数取代高维特征空间的点积运算,实现线性回归,即特征空间中构造分类超平面: (4.1)在高维空间的线性回归对应着低维空间非线性回归,定义不敏感损失函数: (4.2)支持向量回归(SVR)问题就找到适当的逼近函数使最小: (4.3)式中:为线性权值向量;是第个输入, 是对应的期望输出;C是复杂度和样本拟合精度的折衷,其值越大则拟合精度越高;不敏感损失函数即回归允许的最大误差,当它的值越大时,支持向量数量越少。这样式子就变成: (4.4)相应的对偶形式为:(4.5)核函数满足Mercer条件,代替,把积式转化成核函数式:(4.6)实现非线性回归核函数
41、,样本对应的输出公式为: (4.7)的计算公式为: (4.8)4.3 支持向量机的交通信息预测的具体步骤 1、对历史交通量数据进行归一化处理,确定合适的嵌入维数m,生成数据集。 2、选择核函数,确定SVM参数。得到样本数据集后,选择径向基函数(RBF)作为核函数,并确定二次规划的优化参数和C。和C对支持向量机算法的学习能力和推广能力有很大的影响。惩罚系数C取值小,训练误差就会增大,惩罚系数取值大,学习精度提高,但模型的泛化能力就变差。因此,选取适当的惩罚系数C对预测模型很重要,适当的C值能减小离群样本的干扰,提高模型的稳定性。不敏感损失函数控制的是模型的预测能力,取值大时,导致学习精度低,推广
42、能力下降。取值小时,就会导预测致模型过于复杂,训练时间变长。因此,可以使用动态调整的方法来确定参数,先用先验知识方法固定其中一个参数,然后用列举法来确定另外一个参数。最后固定已经优化的参数来确定未优化的参数,以最终确定和C。3、 输入数据集,生成预测函数。输入数据集,求得Lagrange乘数和偏置的值,确定预测函数 (4.9)4、预测并进行误差分析。根据生成的预测函数预测未来时段的交通流量信息,并对预测结果进行误差评价分析。如果发现相对误差较大,则需要返回地2步,重新调整SVM的参数。4.4 本章小结本章提出了基于支持向量机回归的交通量预测的方法,支持向量机能较好地解决“小样本”、“维数灾害问
43、题”、“过学习问题”、“局部极小点问题”。接着介绍了如何通过训练数据样本实现非线性回归,确定支持向量机交通信息预测的具体步骤,包括如何选择核函数,确定支持向量机参数,引入损失函数,构造最优超平面,输入历史数据集,生成预测函数结果等问题。第5章 仿真研究借用梁新荣教授的实验数据,使用MATLABR2011a实现基于支持向量机对某快速路小时交通量预测的编程。5.1 交通流量预测选取某快速路作为预测对象,采集2008年6月和8月周一到周五和周末的交通流量数据,一共42天1008个周一到周五数据和20天的480个周末的数据,利用MATLAB软件进行数据仿真得出预测结论。本论文先采用周一到周五(工作日)
44、连续5天的交通流量作为输入进行预测,其中利用数据集的前36天交通数据作为样本集,后6天的数据作为测试集。预测前先对交通流量样本数据进行处理。根据交通调查车型分类与车辆折算系数表5-1进行换算交通流量:表5-1 车辆系数折算表车型小货车中货车大货车特大货 车小客车大客车拖挂车集装箱车折算系数11.52311.533通过折算系数表对当天每个小时各车型的数量进行换算后,综合起来即为当天24小时的交通流量。以1个小时作为交通流量信息预测单位,输入连续5天当天该小时的流通量样本数,预测未来一天该小时的交通流量信息,得出预测结果。再以得到的预测结果与样本集中的交通流量信息进行误差评价分析,从而评估建立的基
45、于支持向量机回归的交通流量预测模型的可行性。预测值的相对误差计算公式: (5.1)为实际值,预测值。以1小时为单位的交通量预测,用MATLAB语言编制m文件程序进行仿真,则有24个m文件程序,现在摘取第11小时的交通量预测的程序进行展示。全天第11个小时的交通量预测程序如下:clcclearclose alltic;%六月数据AA=683 612 490 468 474 581 987 1420 2141 2885 2999 2785 2117 2279 2665 2636 2693 2622 2235 1315 1604 1454 1209 918 %六月2号周一 709 546 462 4
46、65 463 574 937 1159 2110 2983 3203 2820 2065 2445 2755 2968 2985 2845 2366 1665 1954 1893 1514 1137 %六月3号 周二 866 681 516 482 474 567 841 1187 2436 2927 2705 2928 2303 2480 2840 2990 2895 2896 2415 1631 1821 1718 1268 893 %六月4号周三 642 507 435 385 423 495 782 1023 1900 2883 3179 2956 1933 2249 2785 301
47、3 2891 3171 2486 1592 1870 1703 1290 922 %六月5号周四 607 535 446 409 438 512 834 966 1801 2566 2991 2717 1948 2273 2830 3290 2986 3147 2651 1868 2005 1814 1349 936 %六月6号周五 687 567 521 446 483 566 1009 1520 2198 2762 2926 2687 2067 2239 2713 2705 2521 2505 2136 1306 1649 1490 1212 976 %六月9号周一 711 572 463
48、 449 435 563 826 1136 2129 2959 3239 2811 2052 2379 2685 3089 2953 2745 2376 1615 1841 1795 1457 1078 %六月10号周二 811 666 473 451 459 583 946 1273 2474 2915 2803 2803 2210 2438 2783 3029 2964 2926 2379 1609 1898 1724 1252 919 %六月11号周三 683 549 427 375 454 509 720 1005 1874 2685 3202 2970 1937 2211 2797
49、3054 3038 3104 2481 1772 1966 1753 1363 904 %六月12号周四 652 509 482 427 459 527 793 1085 1865 2616 3039 2772 1971 2355 2947 3261 3045 3279 2749 1966 2151 1790 1417 954 %六月13号周五 702 588 540 525 514 633 1014 1511 2267 2989 3082 2881 2152 2332 2751 2758 2751 2759 2319 1515 1614 1574 1339 973 %六月16号周一 758
50、595 493 493 480 598 922 1210 2069 2864 3124 2721 1989 2371 2712 2859 2849 2673 2274 1586 1809 1733 1443 1069 %六月17号周二 798 676 520 467 465 564 924 1254 2319 2943 2804 2823 1921 1452 1768 2510 2732 2603 2007 1701 1850 1826 1342 983 %六月18号周三 746 561 511 416 502 542 900 1010 1866 2763 3246 2942 1922 215
51、4 2808 3185 3035 3211 2684 1872 2047 1883 1518 991 %六月19号周四 725 543 529 504 533 623 915 1132 1966 2637 3069 2786 1993 2336 3000 3384 3136 3366 2904 2036 2170 1861 1423 1021 %六月20号周五 822 709 587 597 566 771 1113 1462 2430 2928 3098 2762 2043 2002 2591 2727 2703 2684 2280 1498 1669 1622 1296 969 %六月23
52、号周一 746 601 511 520 491 708 1007 1268 2110 2862 3166 2774 2020 2432 2803 2971 2906 2814 2354 1696 1912 1876 1504 1157 %六月24号周二 908 724 528 509 478 580 868 1134 2525 3047 2804 2849 2278 2410 2788 3027 2877 2940 2415 1662 1825 1651 1267 944 %六月25号周三 695 545 449 372 468 535 774 1036 1902 2962 3052 2627
53、 1692 2004 2658 3065 3000 3161 2578 1792 2001 1490 1185 903 %六月26号周四 713 524 488 422 473 462 840 1027 1772 2647 2943 2730 2018 2308 2897 3282 3032 3242 2697 1931 2037 1686 1304 975 %六月27号周五 723 577 481 475 515 595 1054 1445 2188 2741 2955 2720 2094 2270 2739 2730 2642 2657 2222 1416 1504 1450 1225 9
54、19 %六月30号周一 615 494 459 404 496 428 628 1426 1861 1608 2284 2225 1904 2304 2870 3230 2856 3358 2574 1802 1979 1663 1235 859 %八月1号周五 690 592 498 467 486 525 972 1408 2101 2717 2839 2666 2152 2210 2546 2521 2519 2482 2239 1365 1511 1382 1178 891 %八月4号周一 674 487 540 459 413 244 787 1172 2075 2887 3209
55、2809 2001 2401 2580 2737 2777 2584 2500 1735 1890 1857 1517 1119 %八月5号周二 905 753 546 511 513 537 887 1176 2313 2983 2705 2925 2294 2442 2904 2901 3083 2869 2500 1737 1987 1817 1394 983 %八月6号周三 759 577 550 419 517 483 792 1014 1915 2942 3315 3119 2039 2263 2836 3066 3088 3181 2610 1825 2019 1859 1421
56、 950 %八月7号周四 713 510 503 498 497 587 844 1036 1922 2652 3136 2819 2040 2394 2982 3450 3116 3367 2753 1919 2122 1742 1404 994 %八月8号周五 745 627 548 251 545 587 1076 1546 2259 2856 3074 2853 2224 2301 2702 2749 2684 2665 2211 1410 1631 1528 1259 949 %八月11号周一 721 617 503 517 522 596 937 1191 2080 2989 3273 2897
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 九年级上学期语文期末模拟考试试卷
- 售后服务部年终总结
- 一年级数学计算题专项练习集锦
- 二年级数学计算题专项练习1000题汇编
- 《数学物理方法》第1章测试题
- 母鸡孵蛋课件教学课件
- 南京航空航天大学《传感器与检测技术》2021-2022学年第一学期期末试卷
- 南京工业大学浦江学院《土木工程制图》2021-2022学年第一学期期末试卷
- 南京工业大学浦江学院《商务礼仪》2022-2023学年第一学期期末试卷
- 淮河新城二期##楼工程施工组织设计
- 河北省衡水市枣强县2024-2025学年九年级上学期10月月考化学试题
- 航空危险品运输练习题练习试题及答案
- 初二体育与健康(400米跑)教学设计
- 《昔日的世界:地质学家眼中的美洲大陆》札记
- 登革热护理查房
- Unit5HouseworkPartA(课件)闽教版英语六年级上册
- 企业管理学宿恺思考题答案
- 思想政治教学工作计划6篇
- 2024年新人教版一年级语文上册全套试卷
- 2024精麻药品培训知识试题库及答案(完整版)
- 年产5万吨高密度聚乙烯聚合工段基本工艺设计
评论
0/150
提交评论