




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于数据挖掘的风力发电机输出预测研究
能源能源是指从太阳和地球上收集的天然资源,如能、能、能、热、太阳能等。利用太阳能和地球上的自然能源,并将废物转化为能源产品的产物,如废物沼气和能源产量。其中,风力发电的成本与传统能源相似。在几种新兴能源中,风发电被列为发展趋势最具前景的领域之一,能够提供清洁、无害的能源。风是目前科学研究最成熟、规模和应用前景最为预测的可支配能源。近年来,风发电的蓬勃发展,风装置的安装不断增加。2012年底,中国介电气装置总安装功率为65.73gw。然而,风装置的输出具有间歇性和不确定性。大规模通风和网络分离增加了电气系统的运营风险,这对风装置的输出提出了更高、更精确的要求。本文通过对常规的风电风机输出功率预测方法的研究,提出了基于分类算法的风机输出功率预测算法.利用某风电场一年的风机输出功率预测数据,对算法进行了分析和比较,验证了改进的算法在大规模风电场的风机输出功率预测中的有效性和准确性.1风电场风机功率预测的研究国内外对电力风机输出功率预测的研究工作已经开展了很长时间,形成了许多比较成熟的预测理论和方法.其中,传统的预测方法包括自身外推法、时间序列法、相关分析法等.随着新理论而产生的新方法包括基于模糊理论的预测、专家系统预测、灰色预测、人工神经网络预测、基于小波理论的预测方法等.文献和文献通过设立一个数学模型,用该模型来描述风机输出功率变化过程的统计规律,并在这一模型的基础上确立风机输出功率预测的数学表达式,对未来的负荷进行预报.文献和文献采用误差反向传播算法对权值进行了调整.文献是在统计学中的VC维理论和结构风险最小原理基础上,根据有限的样本信息在模型的复杂性和学习能力之间寻求最佳折衷,以获得最好的风机输出功率预测效果.文献充分利用了风场地区的历史风机输出功率数据,采用聚类分析方法、模糊算法、粗糙集理论等总结出历史数据的规律性.以上文献在改善风电场风机输出功率预测的精确度,以及风电场并网后的功率方面,效果显著.但由于风机输出功率的波动性和间歇性特点,这些方法均难以灵活有效地满足风电场风机输出功率预测的特性以及大规模型风电场风机输出功率预测.2预测输出输出的分类算法2.1基于mtp的方法挖掘算法模型树是一种在叶节点采用线性回归函数的决策树,在预测连续值方面效果很好,它采用一个将分类问题转换为函数优化问题的标准方法来实现分类.模型树表示一种分段线性函数,它通过一系列的独立变量(称为属性)来预测一个变量的值(称为类).以表的形式表示的训练数据可以直接用来构造决策树.经典的M5P模型树将输入与输出参数之间的非线性关系转换成一个分段式线性关系,其劈分思想与决策树基本相同,但是劈分原则不同.决策树的劈分标准是信息增益原则,而经典M5P算法的劈分标准是样本属性差异化原则(StandardDeviationReduction,SDR),可以表示为:式中:T——总样本空间,其样本数是|T|;T1,T2——T被劈分后形成的两个子空间,样本数分别为|T1|,|T2|;d8(T)——总目标属性(ClassAttribute)标准差;d5(T1),ds(T2)——劈分后两个子空间的目标属性标准差.M5P算法的挖掘流程,也可称为挖掘的生命周期(LifeCycle),其具体步骤如下.步骤1定义问题,了解影响数据来源的因素.对问题作出正确的分类,并找出相应的解决方法;分析问题是否可以通过数据挖掘来解决,并对解决后的实际意义作出总结.步骤2搜集和选择定义所需要的数据.步骤3对数据进行删选和优化,此阶段为挖掘过程中最费时间的步骤,通常占总流程的50%~80%.步骤4选择数据挖掘的方法,并确定数据的格式,如决策树、规则、图形等.步骤5对数据进行训练或预测,并在此过程中,进行参数的设置和变化,得到有意义的结果.步骤6评估和整合已完成挖掘的任务,最后对结果进行归纳和总结.经典的M5P模型树是一阶线性模型,构建的树结构更小,预测精度更高,真正意义上实现了树结构的回归预测.其特点是训练规则简单有效、训练时间短、透明化程度高,以及具有较好的泛化能力.但对于现代的电力数据而言,特别是风机输出功率的数据更为复杂而庞大,经典的M5P算法已经无法满足对数据精度和处理效率的要求.2.2剪枝剪切建模在经典M5P算法的基础上,增加叶子节点数,并在叶子节点数公式中加入A值,代表影响风机输出功率的一切外界因素,这样可以有效提高M5P算法的效率,更能精确反映数据的高效性.改进的M5P算法通过改变叶子的数值和点集值,可以便于测试特定属性的值,并在每个叶节点预测类值.给定一个新的样本来预测其类值,树从根节点开始解释.在每个内部节点处,根据样本的某一特定属性值来选择左枝或右枝,当选择的节点是叶节点时,则由叶节点的模型预测输出.改进的M5P算法的劈分标准可以表示为:式中:A——叶子节点数量的改变.树的结构并不是越大越好,劈分太细可能会造成过拟合现象.剪枝就是对某些子树进行归并,而以叶子结点取代,以提高整个模型的简洁性和效率.在剪切之前,首先利用线性回归方法遍历树的各个结点,拟合出每个结点的多元线性方程.剪切的原则为预测误差减少量(Errorreduction):式中:ERMS——该结点(包括其下属分支和叶子的所有样本)处拟合方程预测的均方根误差;ERMSL,ERMSR——该结点劈分后的左、右叶子节点预测的均方根误差.以上均方根误差检验样本为自身结点处的样本.当RE>0时,该子树保留;否则,将该子树转变为一个叶子结点.剪切过程也是一个递归的过程.剪切后,树的相邻叶子结点处可能会出现一定程度的不连续性,因此熊浩等人提出树叶子结点的平滑方法.每个结点都存在一个按线性回归方法拟合的多元线性方程,并且具有相同的参数,将子结点与其父结点的两个方程合并为一个新的线性方程,则该方程可以有效地弥补两个相邻子结点的不连续性.合并公式为:式中:fparent——叶子上级父结点拟合方程;fchild——叶子结点拟合方程;n——到达本叶子结点的训练样本数目;k——常数,通常取值为15;fnew——合并后的方程,将取代叶子结点的线性方程.改进的M5P算法是用一系列分段线性模型组合起来的全局模型,从而为处理问题带来了所需的非线性.它与单纯的线性回归的区别在于,对输入空间的分割是由算法自动进行的.该算法具有效率高、鲁棒性好的优点,可以进行有效的学习,能够处理输入属性高达几百维的问题.改进的M5P算法的结果简单易懂,是一种具有广阔应用前景的数值预测算法.3结果与分析3.1风电场风机功率预测结果本文采用某沿海风力发电场一年的真实负荷数据进行分析与研究.影响负荷的因素有很多,如时间、季节、风速、天气,以及是否节假日等,本文选取风速和运行台数两个因素.将实际数据导入WEKA2.0中,结果如图1所示.从图1a中可以直观地发现,运行台数少于122台时,输出功率与运行台数成线性关系,运行台数越多,输出功率越大.在图1b中,风速低于8.08m/s时,风速与输出功率成线性关系,风速越大,输出功率越大.在图1c中,风速低于3.3m/s时,风速与运行台数成线性关系,风速越大,开启的运行台数越多.在图1a中,当运行台数维持在一定量时,如122台时,输出功率直线上升,导致这个结果的原因是风速的变化.因此,由图1可以得出,风速越大,运行台数越多,输出功率也就越大.针对这些数据特点,本文将采用分类算法来进行简单的风电场风机输出功率预测.3.2可视化分类结果M5P模型算法组合了树结构和线性回归模型,每个叶子节点是一个线性回归模型,因而可用于连续数据的回归.由于沿海风场风机输出功率预测大多指短期或极短期风机输出功率预测,得到的数据连续,且单位时间内的数据量并不庞大,非常符合经典的M5P模型算法的特征.其可视化分类结果如图2所示.从图2中可以看到数据通过经典的M5P模型后的具体分类情况.通过分类后,模型会根据数据的特点和规律性,拟定出每一类的算法公式,即数据预测公式.通过计算,得出M5P算法的误差率大约为9.5%,精确度较高,在数据项较少的情况下,此算法较为可靠,但当数据项很多时,其误差率较大.从图2中还可以发现,沿海风速大多低于8m/s,在此范围内,运行台数和风速成明显线性关系,即风速越大,运行台数越多.3.3风机功率预测算法的确定改进的M5P算法构建了一个决策/回归树模型,通过设置各参数使信息增益或减少,修改参数使误差率提高或降低.改进的M5P算法的交叉验证结果如表1所示.表1中数据是采用改进的M5P算法,以风速和运行台数两者属性进行分类,分类的结果为在某一固定值的情况下,统计平均值,以便对下一结果进行预测.由表1也可以得出,在一定范围内,风速和运行台数成线性关系,即风速越大,运行台数越多.根据上述两种算法的实验结果,能够直观地了解到智能优化技术虽然尚不完善,但从效率和精确度上,风机输出功率的预测技术已经得到很大的改善和进步.两种算法对风机输出功率的预测结果如表2所示.由表2可以得出,经典的M5P算法对于风机输出功率预测的正确率为89.461%,改进的M5P算法的预测正确率为93.373%.两种算法得出了相同的风机输出功率预测规律结果:在特定值范围内,风速、运行台数和输出功率相互成线性关系;当风速值和运行台数值超过一定范围后,3者的线性关系不明显,但仍然存在互增互减规律.通过比较可以发现,若要进行精确的风机输出功率预测,应当选用改进的M5P算法,可以大大提高预测的精确性;在对风机输出功率预测概念大致了解、并对下一时间段的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 智能服务机器人技术创新考核试卷
- 机械式停车设备故障预防与诊断技巧考核试卷
- 木材采运的数字化转型与智能化考核试卷
- 中介居间费合同范本
- 房主房子出租合同范本
- 维修农村管道合同范本
- 畜牧产品加工与供应合作协议
- 物联网技术应用研发生产合同书
- 电信运营商合作协议具体内容
- 工作计划-项目推进阶段详细工作安排
- 跨学科主题学习的意义与设计思路
- 2025年浙江国企台州黄岩站场管理服务有限公司招聘笔试参考题库附带答案详解
- 2025年医院财务工作计划(2篇)
- DB32T 4969-2024大型医用设备使用监督管理平台基础数据采集规范
- 2025年大连长兴开发建设限公司工作人员公开招聘高频重点提升(共500题)附带答案详解
- 教科版三年级下册科学全册单元教材分析
- 《物理学的发展史》课件
- 2025年广东广州市海珠区官洲街道办事处政府雇员招聘5人高频重点提升(共500题)附带答案详解
- 《道路交通安全法》课件完整版
- 加快形成农业新质生产力
- 2025年中粮集团招聘笔试参考题库含答案解析
评论
0/150
提交评论