2013数学建模D题_第1页
2013数学建模D题_第2页
2013数学建模D题_第3页
2013数学建模D题_第4页
2013数学建模D题_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2013高教社杯全国大学生数学建模竞赛承 诺 书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则。我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们参赛选择的题号是(从A/B/C/D中选择一项填写): D 我们的参赛报名号为(如果赛区设置报

2、名号的话): 所属学校(请填写完整的全名): 参赛队员 (打印并签名):1. 2. 3. 指导教师或指导教师组负责人(打印并签名): 平 日期: 2013 年 9 月 16 日赛区评阅编号(由赛区组委会评阅前进行编号):2013高教社杯全国大学生数学建模竞赛编 号 专 用 页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):公共自行车服务系统的统计分析摘 要本文研究的是有关公共自行车服务系统的统计分析,包括站点设置和锁桩数量的配置问题。对于该题中的问题我们转化为数

3、学中的数据统计与图像,利用Excel、matlab软件对数据进行处理。分别得到本题中的五个问题。对与问题一:首先要进行总体样本数据统计,利用Excel软件进行数据统计,找出所需要的重要数据,将其按照问题所需进行运算分析。第一、用Excel统计各站点20天中每天以及累计的借车频次和还车频次。第二、对所有站点按照累计的借车频次和还车频次分别给它们排序。第三、在Excel中汇总出每次用车时长的数据,随即将数据导入matlab中,通过matlab处理去除奇异数据,并做出图像。第四、通过该图得出用车时长最长的时段数据,拟合出函数分布,并判断实际观察的属性类别分配是否符合已知属性类别分配理论。第五、检测观

4、察数与理论数之间的一致性,通过检测真实数据与理论数据间的一致性来判定事物之间的独立性。对于问题二:首先在表借车卡SN列中用数据透视筛选出20天每张借车卡的数量,再将数据导入matlab中,统计数据中每张出现过的借车卡累计借车次数,进行数据处理后得出每张借车卡累计次数的分布情况。对于问题三:首先根据问题二的统计结果确定使用公共自行车次数最多的一天。在解答下列小问1)先从统计数据结果找出自行车用车的借、还车站点之间(非零)最短距离和最长距离。在利用Excel对借、还车是同一站点且使用时间在1分钟以上的借、还车情况进行统计。2)从问题一数据中选择那一天借还频次最高的站点,分别统计其借、还车时刻及用车

5、时长的分布。3)列表统计出那一天各站点借、还车高峰时段及其高峰时段的借、还车的频次,把共同借还车高峰时段的站点分别进行分类。对于问题四:通过从数据中分析出有用信息,并对目前公共自行车服务系统站点设置和锁桩数量的配置做出评价。对于问题五:从统计出来的数据中找出公共自行车服务系统的运行规律,并提出合理的改进建议关键词:公共自行车 Excel Matlab 总体样本 平面直方图 数据统计与分析 分布的检验 拟合优度检验(一)问题重述1.1. 背景资料与条件低碳生活是世界可持续发展的首要任务。全球变暖等气候问题致使人类不得不考量目前的生态环境。人类意识到生产和消费过程中出现的过量碳排放是形成气候问题的

6、重要因素之一,所以要减少碳排放就要相应优化和约束某些消费和生产活动。公共自行车作为一种低碳、环保、节能、健康的出行方式,正在全国许多城市迅速推广与普及。在公共自行车服务系统中,自行车租赁的站点位置及各站点自行车锁桩和自行车数量的配置,对系统的运行效率与用户的满意度有重要的影响。题目给出了:附件1是公共自行车数据(内含20个Excel文件);附件2公共自行车站点分布图。1.2. 需要解决的问题1.2.1. 问题一分别统计各站点20天中每天及累计的借车频次和还车频次,并对所有站点按累计的借车频次和还车频次分别给出它们的排序。另外,试统计分析每次用车时长的分布情况。1.2.2. 问题二试统计20天中

7、各天使用公共自行车的不同借车卡(即借车人)数量,并统计数据中出现过的每张借车卡累计借车次数的分布情况。1.2.3. 问题三找出所有已给站点合计使用公共自行车次数最大的一天,并讨论以下问题:(1)请定义两站点之间的距离,并找出自行车用车的借还车站点之间(非零)最短距离与最长距离。对借还车是同一站点且使用时间在1分钟以上的借还车情况进行统计。(2)选择借车频次最高和还车频次最高的站点,分别统计分析其借、还车时刻的分布及用车时长的分布。(3)找出各站点的借车高峰时段和还车高峰时段,在地图上标注或列表给出高峰时段各站点的借车频次和还车频次,并对具有共同借车高峰时段和还车高峰时段的站点分别进行归类。1.

8、2.4. 问题四请说明上述统计结果携带了哪些有用的信息,由此对目前公共自行车服务系统站点设置和锁桩数量的配置做出评价。1.2.5. 问题五找出公共自行车服务系统的其他运行规律,提出改进建议。(二)问题分析2.1. 问题的重要性分析建立此模型的目的是为了使公共自行车服务系统更加完善,便于市民通行。以此合理分布站点,根据不同站点人员借车的密集程度安排自行车的数量。做好每天高峰时段及节假日用车高峰时段的自行车调度是重要问题。2.2. 问题的思路分析2.2.1. 问题一对与问题一需要进行大量的数据统计,利用所给的Excel文件进行数据统计,找出所需要的重要数据,将其按照问题所需进行运算分析。首先统计各

9、站点20天中每天以及累计的借车频次和还车频次,然后对所有站点按照累计的借车频次和还车频次分别给它们排序,最后,统计分析每次用车时长的分布情况,可以通过该图看出用车时长最长的时段,数据处理后可以找出其满足的函数分布。并对其分布进行检验。2.2.2. 问题二与问题一相同,要先统计出各天使用公共自行车的不同借车卡数量,然后统计数据中每张出现过的借车卡累计借车次数,进行数据处理后得出每张借车卡累计次数的分布情况。2.2.3. 问题三通过的数据统计找出所有已给站点合计使用公共自行车次数最大的一天。1)首先任意定义两站点之间的距离,找出自行车用车的借还车站点之间(非零)最短距离与最长距离。然后对借还车是同

10、一站点且使用时间在1分钟以上的借还车情况进行统计。2)将统计出借车频次和还车频次的数据进行筛选,找出借车频次和还车频次最高的站点,把借、还车时刻的数据进行统计分析,处理得其分布以及车时长的分布。3)在统计数据中找出各站点的借车高峰时段和还车高峰时段,在地图上标注或列表给出高峰时段各站点的借车频次和还车频次,并对具有共同借车高峰时段和还车高峰时段的站点分别进行数据处理分类。2.2.4. 问题四通过问题一到问题三的数据处理,在统计结果中列出有用的信息,通过观察数据对目前公共自行车服务系统站点的设置和锁桩数量的配置进行评价。2.2.5. 问题五从数据中找出公共自行车服务系统的一些规律,提出合理的改进

11、建议(三)模型假设为了我们更好的解决该问题,在此之前,我们作出以下假设:1) 假设路程与时间成正比;2) 假设借出的车都归还(借车未还的忽略不计);3) 假设公共自行车不存在跨市运营;4) 假设公共自行车不存在跨市运营且只有一家运营公司;5)假设公共自行车在借车以后一直处于行驶状态 6)假设每个锁桩所能容纳的车辆都相同,(四)符号说明:中心距:偏斜度:偏斜度:表示【附件3】数据中每张卡的总次数的平均值;:表示【附件3】数据中每张卡的总次数:表示【附件3】数据中卡的总次数;:表示【附件3】数据中每张卡的总次数的标准差(五)模型的建立与求解5.1问题一 首先统计各站点20天中每天以及累计的借车频次

12、和还车频次见附件中的【附件1】然后对所有站点按照累计的借车频次和还车频次分别给它们排序见附件中的【附件2】最后,统计分析每次用车时长的分布情况1) 去除大数据、奇异值原因:1、通过把每次用车时长数据统计后画出直方图1【附件3】,经观察后发现有较多大数据阻碍了图像的完美表达,并且数据主要集中在0-150之间,为了便于观察分析,剔除大于150的奇异数据。编辑matlab程序:a=data;j=1;b=a(:,1);for i=2:20b=b;a(:,i);endfor i=1:size(b)if b(i)150;b(i)=0;j=j+1;endendj运行程序的结果:j=844图1偏态测定:将三阶

13、中心距与其标准差的三次方对比,求得偏态偏斜度即: 注:=0,表示数据为对称分布;0,表示数据为右偏或者正偏;表示3时,分布曲线为尖峰;当3时,分布曲线为平峰。编辑matlab程序,计算结果如下: =4.232) 利用Matlab软件画出每次用车时长在0-150之间的直方图。如图2所示。 编辑matlab程序a=data;b=a(:,1);for i=2:20b=b;a(:,i);end for i=1:size(b)if b(i)150b(i)=0;end endhist(b,1000)图23) 验证图2中曲线的分布情况。对于这种直方图,我们尝试用卡方分布,F分布,泊松分布来拟合,为了方便起见

14、,编写matlab程序进行分析;程序见附件中程序1,检验结果都不予通过。下面通过拟合曲线来看清分布情况图3注:(1)拟合的指数方程为(2)为拟合优度,越接近1越好,以上拟合优度=0.9412,效果良好。5.2问题二1)先统计出各天使用公共自行车的不同借车卡数量见附件中的【附件4】2)然后统计数据中每张出现过的借车卡累计借车次数见附件中的【附件5】3)进行数据处理后得出每张借车卡累计次数(见附件中【附件6】)分布情况:图4每张借车卡累计借车次数的统计如附表1,利用excel画出其分布图像,如图4经观察,图像分布接近指数分布图像,再利用excel进行拟合得到=0.9728,非常接近于1,(为优度系

15、数,越接近1,拟合程度越好)因此每张借车卡累计接车次数的分布较符合指数分布其函数为算得: =1 因此,进一步证明了每张借车卡累计接车次数的分布与指数分布具有满意的一致性。5.3.问题三通过分析所有已给站点合计使用公共自行车次数,使用最大的一天为第20天1) 定义两站点之间的距离,找出自行车用车的借还车站点之间(非零)最短距离与最长距离。见附件中的【附件7】由假设中路程与时间成正比的关系,因此,借车时间越长,则行驶的距离就越长。有附见7可知从黎明街道卫生中心到市政府西用车时间最长,也就是借还车距离最长的两点。对借还车是同一站点且使用时间在1分钟以上的借还车情况进行统计。见附件中的【附件8】2)找

16、出借车频次最高和还车频次最高的站点,分别为街心公园、五马美食林分别统计分析其借、还车时刻的分布及用车时长的分布。街心公园 借车时刻分布图,如图5;还车时刻分布图,如图6图5通过图像可知街心花园的借车时刻在17:00-18:00时段借出最多,其余时刻都有借车辆并且较均匀,各个时段借车数量主要集中在60-80之间,早晨与晚间借车数量相对较少。图6从图像中直观的看出还车时刻最多有两段分别为15:00-16:00和18:00-19:00,其余时刻还车量比较均匀,出现了两个高峰还车段,其余时间段还车数量主要集中在40-80之间五马美食林 借车时刻分布图,如图7;还车分布图,如图8图7由图像可知:早晨与晚

17、上都会出现借车高峰,总体分布比较均匀图8由图像可知数据中明显的高峰时段是在17:00-18:00街心公园用车时长的分布图9由图可知时长在4-20之间五马美食林用车时长分布图图10由图可知时长在3-14之间大部分数据比较集中从图9、图10可以看出两个站点时长主要集中的时长。1)找出各站点的借车高峰时段和还车高峰时段在地图上标注或列表给出高峰时段各站点的借车频次和还车频次见附件中【附件9】2)并对具有共同借车高峰时段和还车高峰时段的站点分别进行归类。见附件中【附件10】5.4.问题四首先数据统计出各锁桩借还车量总数见【附件11】通过上述所有数据统计找出有用信息:1)借、还车频次最高和最低的站点。2

18、)各个站点借、还车的高峰时段。3)借、还车次数的总和(由此说明当地人员密集度)。4)每张借车卡累计出现的次数。5)借、还车站点最短距离与最长距离。6)各个锁桩借、还车的数量。7)对20天所有的时长分布情况,得出人们借车所用时长大多在6-10min,从而可以对相应的时间设置合理的站点。评价:从附件1中分析:1)租车、还车都很不方便;,2)存在车多位少的问题;3)车少(调配车辆将会增加运营成本)从数据可以分析出,站点的锁桩相同,但是借、还车的数量却存在很大的差距。从附件2中可以看出:车站的位置设置不合理(例市中心、风景区、休闲区、集中;副城、外围、居住区、高教园、服务点较少,相对孤立,因此利用率也

19、低)。从附件11中可得,根据各个站点借车与还车的频次,可对目前的公共自行车服务站点合理的设立车辆或增加锁桩数量,在有的锁桩少的地方借、还车数量却很多(例如锁桩3).5.5.问题五运行规律:1)表2天数12345678910次数3640237412169103242938308403264036216548112106981天数11121314151617181920次数32726383184192041831389391913032400324534069342242次数0500010000150002000025000300003500040000450000510152025天数次数次数图

20、11通过表2和图11可以得出每七天的最后两天借还车总次数相对较高,由此说明周末是借、还车频次最高的日子。2)由以上统计结果分析出每天早晚是一个借还车高峰期。改进建议:1)可以将自行车分单双号,隔天运营,然后在周末单双号自行车全部运营,加强停车换乘组合模式,进而增加市民对公共自行车的吸引力;2)未还车辆较多,应设置信誉管理制度,并且完善站点设置;3)应根据自行车借还总数安排各站点的锁桩数及车辆数目;4)站点靠近公交站台,方便市民选择出行方式5)在早晚时段做好自行车的调度工作(五)模型的评价本文主要采用的是excel进行数据的统计与分析,从而得到所要求的结果。优点:较为准确的统计出了各个站点的高峰

21、时段,为以后自行车数量的分布及站点锁桩数量的分布都有一定的帮助。缺点:所给数据较多,剔除了奇异值后数据更加集中,也便于分析。但这样会使得结果出现一定的偏差。(六)参考文献:1李子强 李峰高 黄斌 罗幼喜 概率论与数理统计教程(第三版) 北京科学出版社 20011.82施庆生 陈晓龙 邓晓卫 概率论与数理统计(第二版) 北京化学工业出版社 2011.123阮沈东 王永利 桑群芳 MATLAB程序设计 北京 电子工业出版社20044郭爱民 徐向辉 经济计量分析与Excel应用 北京 中国市场出版社 2005.1附件【附件1】 【附件2】【附件3】 【附件4】【附件5】 【附件6】【附表1】 【附件7】【附件8】

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论