基于K-means的功率特性测试数据清洗方法_第1页
基于K-means的功率特性测试数据清洗方法_第2页
基于K-means的功率特性测试数据清洗方法_第3页
基于K-means的功率特性测试数据清洗方法_第4页
基于K-means的功率特性测试数据清洗方法_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

【摘要】风电场技术后评估主要目的在于评估项目建成后是否达到设计发电能力,是否充分发挥了前评估所判定技术层的预期功效。目前,大多数业主单位开展的后评估工作主要服务于投资决策,尚未对风电场运行维护、升级改造、对比及对标分析等深入开展工作。由于缺乏统一的后评估标准,不同风机、风电场之间横向对比、对标等存在客观困难,对生产分析与性能评估带来诸多问题。同时,现场缺少计算相关生产指标的工具,如人为手动计算,工作量大,计算精度低。基于上述情况,用于风电场后评估指标的工具应用前景十分广阔,本方法针对后评估工具中功率曲线计算与评估中数据清洗方面进行说明。一、研究意义风能作为一种清洁和可再生的能源。近年来,世界各地安装的风力发电机越来越多。风电机组安装的数据采集与监视控制系统已经广泛的用于风力发电工况检测,其中包括风电曲线异常数据检测。风电功率曲线是在风电机组运行特性的评价过程中的一项重要指标,与风电机组的设计依据、性能评价指标、发电量考核指标、风电场的收益关系十分密切。风电机组良好的发电性能是保证风力发电企业生产运行管理和发展战略规划的决定因素。功率曲线作为描述风电机组运行性能的一个重要指标,但由于受到温度、气压和机组自身特性等因素的影响,不同风场、不同机组、不同时间所形成的功率曲线具有相当大的差异性。明确实际功率曲线与合同功率曲线之间的差异,对于技术后评估工作具有相当大的参考价值。本文介绍的基于K-means的功率特性测试数据清洗方法是功率曲线模拟流程中数据预处理的一部分,对于提升功率曲线模拟的准确性具有一定意义。二、研究方法基于风电功率曲线的异常数据可以归纳为三种A、B、C三种类型。A类异常数据主要是通用数据异常问题,包括全空数据、部分缺失数据、重复数据、时间异常数据、时间重复数据等。B类异常数据主要是按需数据异常问题,包括时间间隔不达标数据、状态位异常数据、风速越界数据、限功率数据等。C类异常数据主要是离散数据异常问题,包括传感器故障数据、传感器噪声数据和一些不受控随机因素造成的异常数据等。针对不同类别的异常数据,使用不同的数据识别和清洗方法。基于K-means的数据清洗方法主要针对C类异常数据。三、通用数据清洗通用数据清洗模块主要用于处理通用数据异常的问题。对于全空数据,主要存在于SCADA导出和合并过程中,对于全空数据的清洗有众多方法。其中无论是判断任一字段是否为空还是判断文档大小,均可以对全空数据进行数据清洗。对于部分缺失数据,主要存在于SCADA采集过程中出现某种导致的错误或是导出过程中存在某些异常造成的数据部分缺失,对于研究的字段进行针对性的非空检测是处理部分缺失数据的可靠方法。对于重复数据,主要存在于SCADA采集过程中出现某种导致的错误导致的重复或是导出过程中存在某些异常造成的数据重复,对于重复数据的识别主要基于特殊字段的重复检测,清洗手段需要根据所研究的参变量选择完全清洗和部分清洗两种数据清洗的程度。对于时间异常数据,主要存在于SCADA时钟序列出错或者数据导出未知错误导致的时间序列紊乱和重复的问题,部分数据可能已被上述重复数据处理,更详细的处理方法是采用堆栈容器中转数据的方式检测时间序列问题。对于时间重复数据,主要是对时间序列进行重检测,时间一定程度上作为整个数据集的主键,具有唯一标识数据条的作用,应该着重保证时间维度的数据正确性,这里采用二次循环检测方式来完全保证。四、按需数据清洗按需数据清洗模块主要用于处理按需数据异常的问题。对于时间间隔不达标数据,主要是按照相关标准IEC61400-12-1-2005以及IEC61400-12-2-2013中的要求,对时间间隔低于10min的数据进行清洗。在十分钟级数据整合和处理的过程过,很大可能会造成时间间隔的不符合使用者要求的情况出现,这里对不同时间戳格式的数据应采用不同的数据间隔格式来清洗数据。对于状态位异常数据,功率特性测试要求非正常位的数据需要剔除,这里对状态位异常数据条进行按需清洗。由于不用厂家不同风机型号的状态位标识各有不同,这里应结合实际情况按照需求对异常位数据进行清洗。对于风速异常数据,这里主要是针对越界、冰冻等数据进行清洗。越界数据的剔除方面,功率特性测试要求风速区间应在0-50m/s的范围之内,实际数据中有少量数据对应的风速区间超过了这个范畴,应按照需求对越界风速数据条进行清洗。冰冻数据的清洗主要基于风速标准差阈值的设定,若风速数据标准差过低且温度达到结冰条件,则应对冰冻数据进行清洗。对于功率异常数据,这里主要针对限功率数据进行清洗。功率特性测试要求对限电条件下的数据进行清洗,由于限功率涉及外部限功率和内部限功率,所使用的策略不同,实际应用过程中应当结合风电场运维手册和秒级数据进行清洗。五、离散数据清洗离散数据清洗模块主要用于处理离散数据异常的问题。离散数据的影响因素众多,很难从单一字段对数据进行清洗工作,离散数据的主要特点是围绕正常曲率随机分布,没有预测方法,连续性较差。这里使用无监督学习中的K-means聚类方法对离散数据进行清洗。在功率特性测试的过程中,针对爬升阶段(风速在切入风速和额定风速之间)和满发阶段(风速在额定风速和切出风速之间)两个阶段分别构建模型。对于任一阶段,以给定的数据集作为数据输入,数目为M,定义构建一个具有k的簇的模型,根据经验和实际情况,通常我们选择k=4作为参数设置。对于每一个10min数据X1、X2、X3…Xm,首先选择初始化的k个类别中心a1、a2…ak。对于每一个数据条,通过风速和功率的二维方式标记距离类别中心的aj最近的类别j。之后更新每个类别的中心点aj为隶属于该类别的所有数据条的均值。重复上述的操作直到满足最终的终止条件即迭代到达上限。而每一个中心点更新公式为经过离散数据异常清洗模块,由传感器故障造成的错误数据可以得到有效的清洗,同时由于迭代次数和k簇数目可控,噪声数据的清洗程度则根据实际情况来界定。六、清洗结果经过三个模块的数据清洗之后,可以观察相关

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论