航班延误预测1 - 副本_第1页
航班延误预测1 - 副本_第2页
航班延误预测1 - 副本_第3页
航班延误预测1 - 副本_第4页
航班延误预测1 - 副本_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

长春工业大学——劲风队航班延误预测第五届中国软件杯大学生软件设计大赛整体流程劲风队导入历史数据数据降维特征提取生成分类模型导入待测数据分类预测输出预测结果训练阶段1预测阶段2整体流程劲风队预测模型预测结果历史数据待预测数据训练阶段测试阶段数据处理劲风队加载数据(Excel)解析数据去除脏数据数据入库数据入库数据处理历史数据变量数过多,引发维数灾难,难计算。多列之间具有直接或间接依赖关系,数据冗余较多。数据可进行手工降维处理。劲风队数据降维特征选择特征提取得到24个变量得到12个变量原数据40个变量属性分类多少通过观察可以发现,周六和周三为延误高峰期,周一周二为低峰期,其它日期则相差不大。据此将星期分为三类。劲风队

星期分类值描述d11,21低峰期d23,62高峰期d34,5,73正常期属性分类1、研究发现,航班延误情况与当天是星期几有关,根据历史数据得出如下统计结果。劲风队属性分类2、由下图可知航班延误与起飞时刻之间有着一定的关系。劲风队通过对上表分析6~8点,22~23点为延误低峰期,其它时刻无明显特点。据此将起飞时刻属性分为两类。劲风队

时刻分类值描述d16~8,22~231低峰期d2其它2正常期属性分类属性分类3、由航班延误与天气之间的历史数据分析关系得出下图。劲风队通过对上图分析并综合考虑后,本文将天气划分为四类。劲风队

天气分类值描述d1大雨及以上1严重恶劣天气d2小到中雨2中等恶劣天气d3阴/晴3正常天气d4其它4其它天气属性分类劲风队针对项目初步确立了以下方案1非线性回归概率统计贝叶斯分类线性回归历史数据庞大难编写计算程序高维矩阵的不稳定性回归效果差显示方程回归方程形式难以确立软计算程序编写复杂,时间开销大时间复杂度O(n)算法简单可靠程序编写复杂度低最终选择建模算法设计建模算法设计劲风队06以Max(P(X|Yi)P(Yi))做为X所属类别05对每个类别计算P(X|Yi)P(Yi)04对每个特征属性计算所划分的条件概率03对每个类别计算P(Yi)02获取训练样本01确定特征属性准备工作阶段应用阶段分类器训练阶段朴素贝叶斯分类流程图劲风队成果确立特征属性对待分类项进行分类对属性进行分类训练模型进行预测将上述算法应用于航班延误预测问题,对应的工作如下:建模算法设计程序结构劲风队TextText数据库模型文件预测程序JSON处理模型加载延误预测建模程序数据导入数据导出模型训练模型测试参数设置本程序基于贝叶斯分类算法实现,完整的程序源代码总共包括建模和预测两部分,两部分分别使用独

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论