“以智能卡为基础的的推导乘客出行路线”翻译_第1页
“以智能卡为基础的的推导乘客出行路线”翻译_第2页
“以智能卡为基础的的推导乘客出行路线”翻译_第3页
“以智能卡为基础的的推导乘客出行路线”翻译_第4页
“以智能卡为基础的的推导乘客出行路线”翻译_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要:智能卡数据推导乘客的路径选择提供了公共交通运营商的机会,eval-审视你们和改善客运服务。特别是在中断的情况下,当传统的路由选择模型可能是无效的,这是一个优势。本文提出了一种推导基于智能卡数据的乘客选择路线的方法和验证在现实生活中的数据集此方法。该方法推断出正确的路线为约95%在我们的验证样品每天行程,并且还在中断的情况下。此外,它展示了如何这种方法可用于分析和基于荷兰铁路公司,这是最大的客运铁路运营商在荷兰的一个现实生活中的数据集的案例研究评估客运服务。关键词:数据挖掘,预测路径,公共交通,轨道交通,交通需求分析,出行时间可变性。一、引言乘客路径选择信息是公共交通运营商重要的。事实上,在此基础上信息,列车利用率可以计算出来。此外,乘客的expe-rienced旅程可以进行详细的等待时间,在车载时间和数字传送来分析,共同导致乘客服务的度量。大多数乘客路径选择模型是基于效用最大化[1]或遗憾最小化[2]。但是,在中在公共运输系统的时间表或中断的突然变化的情况下,这些模型可能是无效的。为一体,乘客可能不会出行如由于缺乏高达最新信息的预测在现有的模型。其次,迫切需要迅速做出决定,可能会导致意想不到的出行路线。因此,路径选择传统的基于模型可能是不正确的,这些特定网络Ç情况。因此,不同的方法需要分析乘客路径选择和乘客服务在中断的情况下。通过自动售检票系统所产生的新的数据源允许乘客路径选择的一个数据驱动的研究。相较于传统的数据收集方法,如旅游日记和调查,这些新近推出的系统,每天储存所有乘客的旅程,而他们不召回的错误受到影响。研究智能卡中的数据一个很好的概述[3]提供的。我们专注于注册开始和每个完整的旅程结束时这些智能卡系统,因此不要求目标[4]的估计,也没有跳闸[5]的链接。乘客路径选择演绎,这是演绎从智能卡数据的乘客选择路线的问题,以往的研究,包括由Sun等。[6],谁估计乘客的位置随时间的基础上包含原点,并在新加坡地铁系统目标智能卡的数据。他们认为,一个单一的地铁线,估计乘客的位置和等待时间直接从智能卡数据的平台,作为时刻表信息不可用。这是可能的,连续的列车将遵循相同的路径,并且没有转移。根据从伦敦Overground,弗鲁明和赵[7]分析到来行为,赵等人的蚝式智能卡的数据。[8]估配合的基础上,注册地和目的地车站多余的行车时间。路由基于计划时间表及离开等待时间估计第一个合理出发路线上的,而多余的时间估计所述第一个到达的路线上。此外,日下等。[9]通过考虑一个时间表快速传送系统的使用链接的路由的问题。然而,他们选择最长车内的时间,而不是最早出发的路线或最早到达的路由。基于所述最短路径计算生成路线,如[7]。本文的贡献在于提出了路线演绎一种新的方法,并通过额外的数据验证了这种方法的导体检查,导致了在这方面迄今研究的最复杂的公共交通网络之一:荷兰Rail-方式完整的网络。该网络包含连接到多行站和包含几个起点-终点(OD)对不同的地理路线和,作为其结果,是比网络在例如更复杂,[6]和[9]。该方法的验证,可以作为导体检查,提供路径选择部分的信息由智能卡的所有旅途的一个显着的子集。我们的案例研究结果表明,通常由路线选择行为的假设,也就是说,乘客无论是走第一个出发的路线或第一个到达的路线,不持有真正在我们的案例研究。我们区分一个路线生成和路由选择步骤,以下的路线选择模型的传统分裂[10],[11]。我们的结果表明,无论是成功路线扣除同样重要。我们的最佳路线生成方法包含一个正确路线的至少90%在我们的验证样品的旅程。此示例中,最成功的路径选择规则选择正确的路线,95%的样品中的旅程。对于我们的案例研究中,我们展示了如何客运服务,代网络定义中添加的旅行时间,由于增加了车内的时间,传输时间,或等待时间,可与列车降低频率正常及特别日子之间进行比较。路径数据从我们的路线扣除法所得可用于评估和校准统计路径选择模式,例如,类似,或分析乘客服务,例如,提出[12]不同的干扰管理的方法,例如,该有效性在[13]。本文的其余部分安排如下。在第二节中,乘客路径选择演绎的问题进行说明。第三部分提供的可用的数据和之间我们的三步法的链接的概述:(ⅰ)路线生成,(ⅱ)路由选择,和(iii)验证。的方法,这些步骤是在第IV-VI,分别说明。我们的案例研究的数据在第VII节中描述。该结果根据荷兰铁路的数据的情况下研究示于第Ⅷ,其中包括本方法的验证和乘客服务的一个分析的结果。最后,第九部分提供了结论和讨论。二。问题描述本文介绍了基于智能卡和时间表数据推断客运路线的选择方法。这意味着,对于由智能卡的每次行程,其目的是通过重建空间和时间的详细的路线中由相应的乘客所做的时间表。在这里,一个旅程去定义为一个注册的入住和退房时间起点和目的地车站,分别连接。航线是日定义为列车车次连接原点,并通过空间和时间目标的有序集合。火车旅行是一列火车开车从一个站到旁边的这既是一个计划和实现时间表可供选择。旅程的数据不包含在乘客拿着但包含有关它的起源(位置和时​​间)和目的地(地点和时间)唯一信息在路径上的详细信息。由于高频率和荷兰铁路网的密度,一般在从产地到旅途的时间框架内的目的地领先的时间表存在几条航线。在本文中,我们确定如何科幻第二路由在于具有可被实际使用相应的乘客的路线的可能性高的时间表。为此,我们需要(ⅰ)的方法,用于产生一组中的时间表潜在路由该音响吨具有一定的旅程(路线代)和(ii)用于从所述一组可能的路由选择正确的路由规则(路由选择)。我们提出的几种方法路线生成和路由的选择几个规则,因为它不是先验清楚该方法或规则将执行最好的。这些方法和规则在第三节-A和B,分别讨论。线生成方法和路径选择规则的组合被称为路由演绎方法。每个路由扣除方法需要两个数据集(在智能卡的行程和时间表)相关但不直接相连的耦合。因此,它提供的行程和路线之间的联系的第三数据集是需要验证的路线演绎方法。第三节-C讨论了此验证基于导体检查的数据,它提供的智能卡资料和时间表之间所需的链接。图。1.概述路线扣除方法的数据单日的D。三。方法论图。1提供路线扣的过程中的数据的一个特定的d天的概述。输入数据都列在左边:时间表,智能卡数据,并指挥检查这一天,以及早期的天导体检查数据。此外,我们使用了一套路线生成方法m∈M,这将是去定义在第四节网络连接,以及一组路由选择规则s∈S,这是德网络定义的第五部分,从而以下路线生成和路由之间的共同分割选择的路径选择模型[10],[11]。•在第一步,即,路线生成一组路由Rm由每个路线生成方法米产生的基础上,智能卡数据时,实现了时间表,和早期天可能导体检查。生成的所有OD对所有可能的出发时间路线。•在第二个步骤中,路由集合Rm和智能卡的数据作为输入的每个路径选择规则S选择一个路由得到RMSJ在智能卡中的数据每一次旅行学家这是,根据所使用的规则,有被认为是实际用于旅程所述一个高概率的路由。•最后,对于行程j表示使用的至少一个导体检查,的路线生成方法米与路由选择规则S中的性能一起子集由每程的J这个集合确定所述选定路线均方根j是一个可能的路线被测量鉴于导体检查。性能PMS计算为对所有行程j表示使用一个导体校验的平均性能。验证中详细第六节描述。A。路线生成在没有预留座位,如我们的案例研究,并在世界各地的许多城市交通系统的荷兰Rail-路系统的系统,旅程信息不包含有关选择的路线信息。在这些系统中,旅客可以自由选择自己的路线,在一定范围内。其结果是,该组的路由由乘客选择的是未知的,需要建造。基于列车行程信息的运营商的时间表信息,可以构建路由,最好是实现而不是计划的时间表。翻译成一个活动时间表活动网络的最短路径算法,如Dijkstra的证明[14]或贝尔曼–福特[15]和[16]能够迅速找到最低成本路由。然而,磷者是众所周知的不总是沿着一条独特的最小成本路径的旅行。其他路线会更吸引人,因为它们含有较少的传输,是由不同的车辆类型进行,有洛票价,或有一个出发或到达时间,更方便乘客。此外,同样有吸引力的路由可以存在于网络中,与不同的地理路线相关给他们。因此,路由生成方法应该找到一组不同的路线。我们定义了一组不同的方法m∈M在第四节的路线生成步骤。B。路线选择给定一组生成的路由,每个路由选择规则选择这些路由的注册之旅的一个。基于注册的时间和空间维度的旅程,路线选择从所产生的一组路由。可能会有多个通道,fiT这个要求在一个密集的网络。此外,多条路线可以fiT在入住和退房的时间是对于从事其他活动比旅行的出发和到达时间之间的注册,如购物。因此,需要额外的规则选择一个单一的路线的旅程。选择规则去网络网元如何选择一组候选线路的网络连接T内存在旅途的注册时间间隔和其原产地连接到其目的地的一个途径。我们去连接东北和比较不同的选择规则,并调查是否有一个选择的正确路线,为广大的全部路程,单一规则。通过使这些规则依赖于入住时间,退房时间,并在某些情况下,传输的数量,我们的目标是为乘客不同路由的优先级上进行很少的先验假设。其结果是,所得到的路径数据可以被用于分析对不同路线的乘客的偏好。组规则s∈S的代网络定义在第五节在这种性质,我们连接的第二一个重建一个正确的路线,通过分配正确路线的旅程设定在我们的验证旅途中超过95%的测试规则。C。验证Datausedforvalidationaregeneratedbyconductorscheck-inthesmartcardsofpassengersbyusingaMobileChipcardReader(MCL).Theresultingdata,internallyknownasMCLdata,containconductorchecksthatarecentrallystoredandcon-taintime,trainnumber,andsmartcardnumberperconductorcheck.Fig.2showshowMCLdataformthebridgebetweensmartcarddataandtimetableinformation:Thesmartcardnumberandtimeallowfindingthespecificjourneycorrespondingtotheconductorcheck.Thetimeandthetrainnumberoftheconductorcheckenabletheselectionofthespecifictraininthetimetablethepassengerwason.Becauseonlyasubsetofalljourneysischeckedbyaconductor,thesedatacannotbeusedforroutededuction.用于验证数据是由导线产生登记入住旅客的智能卡通过使用移动芯片卡读卡器(MCL)。由此产生的数据,在内部被称为MCL数据,包含了集中存储导体检查和仍包含时间,车次,以及每根导线检查智能卡号码。图。2显示MCL数据是如何形成的智能卡资料和时间表的信息之间的桥梁:智能卡次数和时间允许找到对应的导体检查的具体行程。的时间和导体支票的列车号码启用的时间表的乘客是在特定的火车的选择。因为所有行程的一个子集是由一个导体检查,这些数据不能被用于路由扣除。图。2.指挥校验数据(MCL)链接时间表和智能卡数据。WethereforeusethesedatatovalidatebothroutegenerationmethodsandrouteselectionrulesusingtheMCLdata.Aroutegenerationmethodisvalidatedbydeterminingthepercentageofthecheckedjourneyswherethereexistsamatchingrouteinthegeneratedroutesetthatlinkstheoriginandthedestinationofthejourneywithintheregisteredcheck-inandcheck-outtime.Second,wedefinetheperformanceofarouteselectionruleasthepercentageofthecheckedjourneyswheretheassignedroutematcheswiththeconductorcheck(s)ofthisjourney.Theymatchwhenthetrainnumber(s)andtime(s)oftheconductorcheck(s)ofajourneyarethesameasthoseofthetraintrip(s)intherouteassignedtothisjourney.Aperformanceof100%wouldmeanthatforallcheckedjourneys,allroutesmatchwiththeregisteredconductorchecks’trainnumbersandtimes.因此,我们利用这些数据来验证使用MCL数据两种路线生成方法和路径选择规则。路由生成方法是通过确定检查行程那里存在链接的来源和旅途的登记入住和退房时间内目标所产生的路由集合匹配路由的比例确认。其次,我们定义了一个路径选择规则作为检查的旅程,其中有这次旅程的导体检查(S)指定的路由匹配的百分比的性能。他们匹配当列车号码和一个旅程的导体检查(S)的时间(s)是一样的火车旅行中分配给这个旅程的路线(S)。100%的性能将意味着对所有选中的行程,所有路由匹配注册的导体检查'的车次和时间。Notethatinthisprocedure,threedatasetsarelinkedbasedontime.However,eachofthesedatasetshavetheirownregistrationoftime,andsometimes,evenmultiplebaseclocksexistwithinonedataset,e.g.,theclocksofthecheck-inandcheck-outdevices.Therefore,theassumptionthatthereexistsatruerouteinthetimetablethatmatchestheMCLdata,therouteinthetimetable,andthejourneymaynotbetrue.Aspartofthevalidation,wepayspecificattentiontothepossibleerrorsduetounsynchronizedclocksandpossibleotherregistrationerrorsinthedata,tonotconfusethemwiththeerrorsthatmaybeduetothemethod.注意,在此过程中,三个数据集是基于时间联系在一起。然而,所有这些数据集有自己的报名时间,有时,甚至是多个基础时钟一组数据,如内部存在,签入的时钟和退房设备。因此,存在在该MCL的数据,在时间表的路由匹配的时间表的真实路线的假设,和旅程可能不是真的。作为验证的一部分,我们特别注意,由于不同步的时钟,并在数据可能其他配准误差的可能的错误,从而不与可能是由于该方法中的错误混淆它们。四、路径生成Theobjectiveoftheroutegenerationstepistofindalltime-dependentroutesthatpassengersusetotravelfromanorigintoadestination.AroutesetRODisconstructedperODpaircontainingasetoftime-dependentroutesconnectingtheoriginwiththedestination.Theroutesaregeneratedbasedonthetranslationofthetimetableintoanevent-activitynetwork,asdescribedinSectionIV-A.Wedefinetwotranslationsofatimetableintoanevent-activitynetworkanddiscusstheiradvantagesanddisadvantages.Next,threedifferentalgorithmsforrouteconstructionaredefinedinSectionIV-B.路径生成步骤的目的是找到乘客使用从起点到目的地的行驶所有时间相关的路由。一个路由集棒每含有一组连接与目标的起源时间相关的路线OD对构成。根据时间表成一个事件活动网络的转换产生的途径,如第IV-A中。我们定义一个时间表两个翻译成一个事件,活动网络,并讨论它们的优点和缺点。接着,三个不同的算法路由结构在第IV-B中定义。Thenetworkdefinitiontogetherwiththerouteconstructionalgorithmdefinearoutegenerationmethod.Wewillcomparethefollowingfivecombinationsinourcasestudy:1)BasicNetwork,MinimumCost:BN-MC2)BasicNetwork,ExtendedSearch:BN-ES3)ExtendedNetwork,MinimumCost:EN-MC4)ExtendedNetwork,LearnLinks:EN-LL5)ExtendedNetwork,LearnLinksandMinimumCost:EN-LL-MC与路由结构算法网络定义一起限定一个路线生成方法。我们将在我们的案例研究比较了以下五个结合:

1)基本网络,最小费用:BN-MC

2)基本网络,扩展搜索:BN-ES

3)扩展网络,最小费用:EN-MC

4)扩展网络,了解相关链接:EN-LL

5)扩展网络,了解链接和最低成本:EN-LL-MCA。事件活动网络的定义Thetimetableistranslatedintoanevent-activity-networkN:=(E,A).Thisnetworkisadirectednetwork,whereEdenotesthesetofevents(nodes)inthenetwork,andArep-resentsthesetofactivities(arcs)inthisnetwork.Atimetableexistsofalistoftraintrips.Atripisatrainridebetweentwoconsecutivestationswithadeparturetimeandanarrivaltime.Thisinformationisusedintwowaystoconstructanevent-activitynetwork:theBasicNetwork(BN)andtheExtendedNetwork(EN).时间表被转换成一个事件,活动,网络N:=(E,A)。该网络是一个向网络,其中,E表示在网络中的一组事件(节点),以及AREP-不满在该网络中的活动集(弧)。的时间表存在的车次列表中。旅行是连续两个站出发时间和到达时间之间的火车车程。此信息用于以两种方式来构造事件-活动网络:所述基本网络(BN)和扩展网络(EN)。BasicNetwork:IntheBN,eachnodee∈Erepresentsadepartureoranarrivalofatrain.Thus,eachnodeischaracterizedbyatimeinstantandastation.Thetimeinstantofeventeisdenotedbyt(e),andthestationofeventeisdenotedbys(e).ThesetofarcsAconsistsofasetoftrainarcsAtrainandasetofstationarcsAstation.Eachtraintripinthetimetableisrepresentedbyatrainarc(u,v)∈Atrainfromnodeutonodev.Thesenodesaresuchthats(u)andt(u)arethedeparturestationandtimeofthetraintrip,ands(v)andt(v)arethearrivalstationandtimeofthetraintrip.EachstationarcAstationconnectstwonodesrepresentingconsecutivetimeinstantsatthesamestation.Thus,eacharc(u,v)∈Astationconnectsnodesuandv,whicharesuchthats(u)=s(v)andt(u)<t(v),andforeachothernodewwiths(w)=s(u)=s(v),wehavet(w)<t(u)ort(w)>t(v).Passengerscanusethestationarcstoboardatrain,toleaveatrain,ortotransferfromonetraintoanother.ThelengthsofthearcsaredescribedinSectionIV-B.AnexampleofaBNisshowninFig.3(a).ABNisacompacttranslationofthetimetableintoanetwork,whichbenefitsthespeedoftheshortestpathcomputations.However,aswewilldescribebelow,theinabilitytodistinguishtransfersofpassengersfromonetraintoanotherisamajordisadvantage.ExtendedNetwork:IncontrastwiththeBN,theENallowstodistinguishthetransfersofthepassengers.Therefore,thesetofnodesconsistsoftrainnodesEtrainandstationnodesEstation.IntheExtendedGraph,thecompletepathofatrainexistingoftraintripsanddwellingsinstationsaremodeled.Therefore,trainnodesv∈Etrain,againrepresentingarrivalsanddeparturesoftrains,arecharacterizedbyatimeinstant,astation,andatrainnumber.Stationnodesv∈Estationrepresenttimeinstantsatwhichpassengersboardatraindepartingfromastationoralightfromatrainarrivingatastation.Theboardingtimeisearlierthanthedeparturetimeofthetrain.Thealightingtimeislaterthanthearrivaltimeofthetrain.Stationnodesarecharacterizedbyatimeinstantandastation.扩展路线搜索(专家组):在一个尝试快速找到更多样化的路线,我们使用的是国阵。给定一个起点的源节点的起点站,我们构建了一个新的路线,根据每一个火车弧这样的源节点:对于每一个这样的列车弧,我们找到这列火车的到达车站的最短路径到目的地站,同时禁止这条路线返回原点站。同样,我们构建路由对于所有的火车弧结束在一个汇聚节点的路由到达在目的地站。这种方法的缺点是许多最初选择的火车弧是导致错误的方向,从而导致不可能的路线或不符合要求的路线。在一个试图删除最不可能的路线,同时保持一组不同的路线,我们删除所有占主导地位的路线。统治是基于长度和转让数量。双语对照学习链接(将):将方法构建基于路由的从早期的导线检查。一套火车旅行每外径一对,每一个导体检查,火车之旅在时间表里找到了。接下来,对于每一个这些列车旅行,我们找到最短从原产地到目的地的外径对包括这次火车之旅。导体检查,从而此行,是时间依赖。荷兰铁路有一个循环时间表。因此,我们可以先把所有的发现随时间变化的路由到时间无关的路线,利用周期性的时间表。注意,没有这种路由生成方法和验证的方法,因为只有导体检查从早期使用。五、路线选择在这一步中,为每一个旅程,一个单一的路线是从预先生成的路由组的路由生成导致一步。对于每一个旅程,首先,在所产生的路线集的所有路线这导致从起源到目的地的旅程选择注册的时间范围。多路径的情况下包含在这个集合中,我们考虑以下选择规则:1)第一次分离(FD)2)最早到达(环境)3)最后到达(洛杉矶)4)最少转让(不)5)最大路径长度(MRL)6)选择最少换乘最后到达(STA)我们解释这些规则的例子显示的时间,空间图4。给是一个从站的旅程站在办理登机手续(次)和退房时间(共),有五条路线,从候选路线设置杆,适合与旅程。注意有更多的路线在然而,不是所有的路由都在生成的路由集。路线是由国际扶轮,我=1,。..,5。所有的火车旅行都是箭头为代表。旅行−B1C1,C1−D1进行由不同的车辆出行−比A1B1。因此,他们点缀。图4。五time–space候选路线图一个一个的旅程入住(CI)在A站和B退房(CO)在车站•规则FD选择最接近的路线离开入住,即,R1的时间,从而减少了等待在出发站的时间。规则电针选择最早到达的路线,例如,R1,从而选择最快的选项。•therulela选择到达的时间最接近的路线退房,即,R5。这条路线最大限度地减少等待时间到达车站。这条规则是以最小数量的转让。因为这里有两个直接的路线,即,R3和R4,一条扎断的规则是必要的。这些通用的领带打破规则将是有序的,最好的表演第一,如,FD。因此,我选择R4。•therulemrl选择的路径的最大长度(时间持续)适合在签入和签出旅行的时间,这是R2。这条规则类似于在[9]中的路线选择原则,因此被列入我们的比较。•最后,STA选择R3规则。STA首先选择路线凡之间的差额的总和和路线的到来,连同登记和路线的离开,是不到十分钟,如果多条路线保持,它适用于一般的领带打破规则:它,拉,和FD。如果没有路线,第一次选择后,在签入的所有路由中,将规则应用于所有路由和退房。因此,STA之间的组合规则的MRL和LT。最合适的价值取决于公共交通网络的频率和普通高考和乘客疏散时间。通过评估几个值,我们发现,=10分钟在我们的案例研究中的工作效果很好。六、验证和校准我们讨论了几种路由生成方法(见第四节)和路线选择规则(见第五节),一起通往30个不同的设置为路线演绎,即五路由生成方法与六路由选择规则。由于导体检查的可用性,我们能够评估每一个设置的性能。这些导体检查提供了一个地面真实数据集至少检查一次的旅行的子集。基于列车号和列车员登记时间,我们可以找到一列火车之旅。基于智能卡售票员检查的次数和时间,一个旅程可以选择从智能卡数据,属于这一导体检查。如果列车数的导体检查载在指定的时间间隔内的行程中在检查中,我们得出这样的结论:路线的分配旅行是正确的:售票员检查相匹配的分配路线。在多导体检查的情况下,一个旅程,一个如果所有的导体检查都是正确的匹配指定的路由。我们定义的性能被分配的一个有导体检查的旅行的次数到正确的路线。一个路由是否匹配一个导体检查取决于两个路由生成和路由选择步骤,我们将分别评价。每一个程序的讨论第vi-aB.双语对照验证路由生成一种成功的路由生成方法生成路由集包含为每一个检查的旅程,一个匹配的路线从起源到旅程的目的地,是在签入和签入之间的时间旅程在下面,我们表示所有生成的路由的集合当地确定当地J的路线在当地连接设置旅行中的外径对在旅程的时间框架内。此外,我们使用术语“RJ为各航线的设置连接的时间表,在其内部的旅程时间框架。术语RRG使用外径为所有路由的集合连接的外径对所产生的路由集,不论时间。评估路由生成方法的性能,我们区分以下四种情况。1)匹配的路由中存在生成的路由组RRG。2)匹配的路由中存在的所有路由组3的时间表,但不在当地存在一条路线连接的时间表,对旅程的旅程在它的时间框架内,但这条路线不会产生。3)匹配的路由不在所有路由组RJ存在在时间表。4)匹配的路由中存在生成的路由组RRGOD但不是在当地有一条连接线的路径旅程,但不在它的时间框架内。对于所有的路由生成方法和所有的旅程一个导体检查我们的样本天,我们确定案例适用于所产生的路线。比较匹配的路线在当地发现的设置(案例1),更好的路线生成方法。案例2给出了一个可能的改进的迹象路由生成方法。原则上,案件3和4不应该发生。然而,在我们的数据集,他们确实发生。这主要是由于这样的事实,三个数据集的时钟不同步的,例如,更换巴士服务是不载于时间表。在我们的数据集的智能卡的行程超过10%,在连接的时间表中不存在一条路线原产地和目的地的旅程在登记时间框架。然而,全球智能卡数据的校正,延长检测时间3分钟,减少了时间错误我们的案例研究从10%到不到1.5%。全球登记时间校正并没有改善的结果。路径选择的验证要将数据错误与结果从路径选择规则,我们评估这些规则的基础上旅行的子集,在那里有一个旅程生成的路径集落在当地注册登记和退房时间的旅程。一个性能路由选择规则表示为路由的百分比选一个正确的路线:一条与之相匹配的路线导线检查。七。数据本节介绍了我们的案例研究中所使用的数据:智能卡的数据(见第vii-a),时间表的信息(见第vii-b),并从导线检查数据(见第vii-c)。客运服务的比较和正常的天是基于一个更大的数据集包含所有的旅行,在这些天的智能卡。我们用一个五天荷兰铁路,这是现实生活中的数据样本提供,平均每天1100000人次。选定的五天包含2个常规天和三列车频率降低的特殊日子,由于预期极端恶劣的天气。在特殊的日子里,变化在时间表被传达给乘客的17:00h前一天。一个改变的时间表包含约20%少列车,减少列车的频率50%主干道。减少了时间表由于恶劣天气造成的主要中断和附加效果。虽然很明显,这减少了服务恶劣天气过程中失控情况的概率,这几天火车的准时性显著低于平均。因此,它提供了一个很好的案例研究测试客运航线选择的演绎与演绎在中断情况下分析客运服务。智能卡数据荷兰铁路智能卡系统要求乘客要将智能卡安装到定位于站在开始和结束的每一个旅程,指作为检查和检查。本系统类似于这样的系统实施的地铁,火车和地铁伦敦、东京和汉城。旅程包含智能卡号码,办理登机手续时间,办理登机手续,结帐时间,和一个退房站。我们的数据集包含智能卡支付的所有旅程五天选择。不是所有的荷兰乘客当时铁路正在使用智能卡系统,如智能卡仍处于引进阶段。具体地,大多数年度订阅被排除在该系统之外;因此,经常旅客在我们的数据集所代表的。所有行程中的一个重要部分都是用智能卡进行的,一个重要的行程是由一个导体。因为这个信息的敏感性,我们只能说明我们的数据集包含数百个成千上万的记录。我们不能报告更准确的数字双语对照从数据集,我们选择有一个签入的旅程和一个退房,并没有超过五条路线注册时间间隔内的配件。最后,我们选择至少发生一次,在每一个这些7000个天占95%的所有行程。前两个规则的目标消除旅客忘入或签入。二规则减少了计算时间,同时允许比较每一天的表现,每一天。既不预订座位也不保留特定的火车可在荷兰铁路系统;因此,智能卡数据是唯一的来源,而确切的时间依赖性的旅程问询处双语对照时间表信息火车时刻表包含了所有的火车旅行的到来每站的发车次数和列车数。为我们案例研究,我们使用的实现时间表,包含的到来和出发时间,在五个选定的日子。那里是在30000个到40000个火车旅行连接的每天360站,而且,对于我们的方法,我们也使用一个计划的时间表,以产生一套火车旅行,每外径对在第四节的描述,实现的时间表都没有可为我们提供这些特定天。紧急更换巴士不包含在计划或已实现的时刻表导体检查荷兰铁路公司雇用的指挥者,作为他们的职责,检查乘客的车票的有效性火车站。一张智能卡的有效性检查使用移动芯片的智能卡阅读器(MCL)。装置然后存储智能卡号码、当前时间和火车当前列车数。售票员检查有效性火车上乘客只有一个样本,只有一个这列火车旅行的样本。除了五个选择天,我们的方法进行了评估,将用过的方法30天的导线检查,以产生一组附加路线八。结果在这里,我们比较了不同的路由生成的性能方法(见第四节)和不同的路线选择规则(见第五章)根据已实现的时间表。下一步第viii-b,路线演绎数据进行比较在正常的onroute天和特殊旅客服务乘客的时间和发车等待时间。路径演绎评价第viii-a1提出的路线生成的评价方法。路由选择规则的性能评价部分viii-a2。运输国阵网络平均,50000个5个节点和86000个弧。恩平均为2到三倍大于国阵的,144000个节点和211000个弧。1)评价路线的生成:表中包含的一个有导体检查的旅行的百分比匹配的路由在路由组RRG这是一条路线包含列车运行匹配的导线检查。100%得分将意味着路由生成方法找到一个用一个导体检查正确的路线。因为在我们的数据中观察到的时钟同步误差,我们允许在导体的时间间隔10分钟检查在路线上找到正的列车号。我们的测试路线生成规则得分在75.5%和93.3%。基于连接的路由生成方法最佳性能。该方法允许对传输结合的方法找到正确的路线93.3%的所有旅程的导体检查。这是一个伟大的处理好于基于国阵的方法。性能仅就方法是小于的最小成本方法。一种可能的解释是导体检查不是随机抽样的火车旅行,也不是旅行。要检查是否有可能构建一个更好的路径生成方法,我们专注于最好的表现方法en-ll-mc(第一排在表)。93.3%的旅行支票,一个匹配的路线包含在数据集。因此,对于6.7%的这些旅程,没有这样的路线是发现。对于大多数的6.7%,至少4%的所有旅程有了售票员检查,在时间表里没有找到路线。2.3%,一个路径存在于组中的外径对,但是,这不适合在注册的签入和签出时间。只需0.4%的所有旅程的导体检查,一个匹配的路线可以找到的时间表,但没有包含在生成的路由组RRG。因此,我们估计一种新的路由生成方法的最大增益0.4%多个旅程的匹配路线。然而,两者在新路线的建设,并得出结论没有正确的路线,时钟同步误差影响结果。因此,一个必须小心的结论是0.4%个旅程实际上是缺少的。在任何情况下,我们得出结论只有一个边际改善可以预期不同路径生成方法。一个人可以注意到,没有路线的旅行的百分比在时间表中,不同的生成方法在表一。得出的结论是,存在一个路由在所产生的路由设置是基于导体检查的时间间隔。然而,当没有这样的路线包含在所产生的集合,在时间表中存在一个路线的结论是基于在列车检查的准确时间找到一列火车之旅。由于时钟同步错误,这可能是错误的列车之旅,或在列车之时未发现列车之时检查。结果,没有一条路线的旅程的数目该时间表只能进行估计,从而改变了不同路径生成方法。由于时间同步误差的重大错误,有人可能会怀疑,这一方法是否会更好比最低成本法。虽然en-ll-mc方法发现1%多个旅程的路线,没有保证可以给出这些路线的质量。的优点基于最小成本的路径生成方法与恩,是他们找到了一套广泛的路线,可以容易被视为合理的路线,因为它们是最小的代价给定成本定义的路由。2)评价路线选择:在有多个情况下路线的候选路线,在所产生的路线集,路线根据所讨论的六个选择规则中的一个选择第二节给出了正确的连接路线的数量对于不同的选择规则(行)和不同的一代规则(列)。所提出的百分比是百分比正确地扣除的基础上的子集的子集已知的现有路线的旅程。这是93.3%在en-ll-mc方法路线的旅行,因为这是我们的最佳估计的实际数量的旅程有一个路由匹配的导体检查。我们发现,独立的路由生成方法,选择规则staconsistently表现最好的比较表二列中的性能。虽然有不能保证一个全局选择规则将很好的工作所有的旅程,达到性能稳定,平均而言,95%结合en-mc和en-ll-mc代方法,比任何其他选择规则至少3%。选择规则减少疏散时间和旅行时间,这样FD和EA,普遍表现不佳。加法的路线不一定会导致一个更好的性能:几乎没有任何区别en-mc和en-ll-mc生成方法。事实上,差只是在二位(不在表)。因此,产生更多的路由不一定增加性能:如果所产生的路由设置更大,那么也选择错误路线的概率增加。而且,鉴于我们先前讨论的路线的质量通过我,有人可能会说,en-mc是更好的路径生成方法。请注意,表二是基于93.3%的旅程这一正确的路线是由en-ll-mc代发现方法。对于全部样本的统计规律的表现所有的旅行与导体检查是88%。的分析在路线的一代一步,错过的旅程,上面讨论,表明大多数的12%次旅行的错误被归咎于数据的同步错误不在路径推理方法中的错误。然而,它会很好的确认这一基础上附加数据,例如列车上的应用,将可在荷兰数据在不久的将来铁路。表二给出了平均性能超过所有五天。表三放大到每一天的成绩。我们目前的结果在联合en-ll-mc选择规则,这最佳执行路由生成方法。表三的结果表明,STA选择规则执行所有的日子。在特殊的日子可能会比较好的表现部分解释了这一事实,由于减少列车频率,每一旅程的选择是较小的,因此,选择正确路径的概率更高。规则日2,这是我们最新的日期,有一个非常高分99%。可能,会发现更多的方法有趣的路线与导体的早期天数检查增加。这个问题留给未来的研究。要分析的准确性是否取决于对,我们分配了一个性能得分为每个定义的正确选择路线的百分比。这个分数是按对应的旅行的数目的重量外径对。我们发现,不到2%的所有行程一个外径对性能低于50%。此外,几乎一第三的旅途中有一个完美的得分100%,而超过三分之二的旅程有一个外径对性能90%或以上。请注意,由于这些分数是计算每外径对,他们不能直接与每一个选项的数量进行比较旅程。图5显示了累积的得分每在水平轴上的外径和行程的百分比在垂直轴上的最小得分。整体良好性能是由线的缓慢下降表示。这个完美得分超过30%的行程表示的图(1,0.33),表明33%的旅程有一双100%的性能。分析客运服务的变化基于乘客路径选择的演绎,我们比较正常和特殊天之间的行程时间差异。这比较的基础上所有的全注册智能卡的旅程在这些天。还有,五天是一个非常有限的样本。因此,在这部分的结果是相当的说明这个数据集的可能性比旨在使深远结论。我们评估客运服务的差异在持续时间在一个特殊的日子和一个旅程(旅行时间)之间正常日和路线的时间段差异(路线时间)在特殊天和正常日之间。差异在路线的时间反映延误,由于中断,干扰,和额外的传输。时间差异反映可能增加了乘客的等待时间路线时间增加。可计算行程时间直接从智能卡数据,但路由时间只能是计算后的路线扣除。比较差异在路线和行程时间,我们可以评估的变化旅客物流服务及服务的变化分别。特别是在频率降低,这是很重要的。差异是计算每外径对,以防止变化在矩阵中,使特殊和正常之间的变化天。每外径对的差异是由数量的重量在特殊的日子里,获得平均的变化在特殊的日子里,为所有的旅程服务。比较客运服务在高峰和高峰时段的差异不同的路线时间使用的出发时间的旅程。旅行是分布在15分钟的块,每外径对根据发车时间,要有足够大的号码每单位乘客的比较。我们发现,事实上,特殊的日子里有一个更长的时间旅行时间和较长的路线时间比较,比较定期天。这2个正常的日子没有显著的不同这方面。图6中包含的平均差异图在旅行时间(顶部)和路线时间(底部)为每个三个特殊的日子。基于路径推理的进一步分析显示,较长的旅程时间大多是从较长的结果在出发站等待时间,而等待到达车站的时间是相同的所有天。此外,似乎乘客随着时间的推移学习调整他们的出发时间缩短了时间表,而在同时,守时增加了一点,都导致了更好的客运服务在以后的日子里。九、结论与讨论本文提出了一种客运航线选择的方法智能卡数据的推导。客运航线选择演绎是重要的分析客运服务的条款的旅行时间,这是依赖于路线选择。由于的独特的数据集由导体检查,乘客路径选择演绎可在特定的旅程中验证水平。旅程验证的精度比以前高基于列车容量的验证方法利用[9]。特别是当不是所有乘客的旅行智能卡,验证一个每一个旅程的水平更准确比所有乘客的总水平验证。以我们的知识,这是第一篇论文,包括验证这种方法和具体评估不同的方法路由选择和路由选择。评估的基础上荷兰铁路的现实生活数据集。我们比较了几种路由生成方法的基础上公共交通网络的不同网络配方。我们发现,网络配方强烈影响寻找所有合理路线的能力。虽然没有路线生成方法被称为找到所有合理的路线[

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论