




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
机器学习之非线性转换及应用研究指导老师:答辩人:专业:信息与计算科学目录CONTENTPART
ONEPART
TWOPARTTHREEPARTFOUR选题背景基本理论模型建立结果分析PARTONE选题背景PARTONE选题背景研究背景PM2.5是空气质量标准中颗粒物(粒径≤2.5μm)浓度限值。研究发现PM2.5因其粒径较小、相对PM10表面积较大,因此更容易富集空气中的有机污染物、酸性氧化物、有毒重金属、细菌和病毒。当PM2.5被人吸入到体内时,通过呼吸进入血液就可以产生并导致人体呼吸、内分泌、心血管、神经及免疫等各系统疾病的发生。研究内容及意义本文主要对PM2.5进行预测,即通过PM2.5的历史数据预测未来的发展趋势,对未来一段时间的PM2.5的值作出预测,得出雾霾天气的变化趋势。国内外研究现状详见文献综述叶林华\文献综述叶林华.doc幻灯片2PART
TWO基本理论PARTTWO基本理论非线性幻变换一般来说,线性回归是被我们使用最基本的描述变量间相互关系的方法,但是生活中大多数的模型都是非线性的。所以,我们利用数学手段把它转换为线性问题再来进行处理,来解决更加广泛的问题。幻灯片9高次非线性转换上节内容介绍了二次假设,即转换前的x空间只有二次,现在参考一个一般化的即高于二次的非线性变换,把二次变成Q次的多项式转换。数据归一化归一化是一种标准化的形式,经常用于数据去量纲计算。在不同的标准体系下,不同评价指标往往具有不同的量纲和量纲单位,如果就这样对数据进行对比分析,是不具有任何意义的。所以,我们需要在挖掘时将数据划入同一标准内,即将数据归一化。机器学习思路机器学习是人工智能领域的重要分支,它不仅仅可以用来简单的使用数据,更可以研究如何使得计算机接收数据后,具备更强大的学习和分析能力。为了实现以上能力,我们就需要运用经典模型、算法模拟,实现人类一直在做的学习行为,从而获得更多的知识和技能。幻灯片12PARTTWO基本理论二次假设。假设非线性的空间为x空间(左图),转换过得线性空间为z空间(右图),转换过程如下:(二次空间)(一次空间)转换↓↓幻灯片6PARTTWO基本理论机器学习思路机器学习的工作方式什么是机器学习?机器通过分析大量数据来进行学习。比如说,不需要通过编程来识别猫或人脸,它们可以通过使用图片来进行训练,从而归纳和识别特定的目标。机器学习和人工智能的关系机器学习是一种重在寻找数据中的模式并使用这些模式来做出预测的研究和算法的门类。机器学习是人工智能领域的一部分,并且和知识发现与数据挖掘有所交集。①选择数据:将数据分成三组:训练数据、验证数据和测试数据②模型数据:使用训练数据来构建使用相关特征的模型③验证模型:使用你的验证数据接入你的模型④测试模型:使用你的测试数据检查被验证的模型的表现⑤使用模型:使用完全训练好的模型在新数据上做预测⑥调优模型:使用更多数据、不同的特征或调整过的参数来提升算法的性能表现幻灯片2PARTTHREE模型建立PARTTHREE模型建立数据介绍气象污染数据均来自一个开放的网站。收集的主要气象污染因素有:PM2.5、PM10、O3、NO、CO、SO2、NO2。选取的数据范围从2016年1月至2016年6月,分为两个季度作为两组数据。为了提高训练效率,减少相关性弱的因素对预测的干扰,最终选择相关性较大四个影响因子,分别为O3、CO、NO、PM10。本文选取最终筛选过得大气污染数据,将PM2.5作为输出变量y,CO作为变量x1,NO作为变量x2,O3作为变量x3,PM10作为变量x4,首先对数据进行归一化处理,然后用第二章公式进行转换,得到最终数据如下:yz1z2z3z4z5z6z7z8z9z10z11z12z13z140.740.590.380.640.120.220.380.070.240.050.080.350.140.410.010.580.530.310.560.150.160.300.080.180.050.090.280.100.320.020.420.410.190.520.140.080.210.060.100.030.070.170.040.280.020.830.540.210.680.150.110.370.080.140.030.100.290.040.460.020.130.030.040.170.360.000.000.010.010.020.060.000.000.030.130.130.170.100.120.200.020.020.030.010.020.020.030.010.010.040.440.310.290.350.090.090.110.030.100.030.030.100.090.120.010.380.320.350.390.240.110.130.080.140.090.090.100.130.150.06PARTTHREE模型建立第一季度模型基于BP神经网络的PM2.5预测模型基于支持向量机的PM2.5预测模型导入数据幻灯片12幻灯片14PARTTHREE模型建立基于BP神经网络的PM2.5预测模型运行结果BP神经网络模型系数图
PARTTHREE模型建立基于BP神经网络的PM2.5预测模型运行结果BP神经网络系数数据图幻灯片11PARTTHREE模型建立基于支持向量机的PM2.5预测模型运行结果支持向量机模型系数数据图
回归方程为PARTTHREE模型建立第二季度模型基于BP神经网络的PM2.5预测模型基于支持向量机的PM2.5预测模型导入数据幻灯片16幻灯片18PARTTHREE模型建立基于BP神经网络的PM2.5预测模型运行结果BP神经网络模型系数图
PARTTHREE模型建立基于BP神经网络的PM2.5预测模型运行结果BP神经网络系数数据图幻灯片15PARTTHREE模型建立基于支持向量机的PM2.5预测模型运行结果支持向量机模型系数数据图
回归方程为PARTFOUR结果分析PARTFOUR结果分析交叉验证第一步:导入数据(第一季度或第二季度),选择交叉验证第二步:在交叉验证中继续导入BP神经网络算法,选择应用模型,再执行,对模型进行验证:BP神经网络PARTFOUR结果分析交叉验证第一步:导入数据(第一季度或第二季度),选择交叉验证第二步:在交叉验证中继续导入支持向量机,选择应用模型,再执行,对模型进行验证:支持向量机PARTFOUR结果分析BP神经网络支持向量机BP神经网络支持向量机1234第一季度结果第二季度结果PARTFOUR结果分析误差对比表时间BP神经网络误差支持向量机误差第一季度0.100+/-0.0440.656+/-0.452第二季度0.194+/-0.04
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年两人合伙开店协议合同全面模板
- 二零二五年度体育设施租赁保证金合同
- 二零二五年度合伙人退出及企业社会责任报告编制协议
- 二零二五年度情侣共同财产管理与争议解决合同
- 2025年度花卉养护与植物营养解决方案合同
- 二零二五年度建筑装修施工安全协议书范本
- 2025年度股东退股与公司研发投入及技术创新合作协议
- 二零二五年度公寓楼出租合同范本(含精装修、家具家电及物业管理)
- 二零二五年度林业产业发展与林地承包经营合同
- 2025年度高端酒店集团入股投资协议书
- 安徽师范大学成绩单绩点说明
- 生活垃圾清运承包合同
- 2022年北京市中西医结合医院医护人员招聘考试笔试题库及答案解析
- 门窗报价单样板
- 人教版高中物理选择性必修三 第5章第1节原子核的组成课件
- 《疼痛的药物治疗》PPT课件(PPT 67页)
- DB22∕T 2948-2018 天然、半天然草地牛羊混合放牧技术规程
- 炼油与化工企业电气管理制度
- 煤炭建设井巷工程消耗量定额(2015除税基价)总说明及章说明
- 8.建筑施工设备设施清单
- 小学科技社团活动电子版教(学)案20篇
评论
0/150
提交评论