《基于大数据的配电变压器重过载概率预测研究》11000字_第1页
《基于大数据的配电变压器重过载概率预测研究》11000字_第2页
《基于大数据的配电变压器重过载概率预测研究》11000字_第3页
《基于大数据的配电变压器重过载概率预测研究》11000字_第4页
《基于大数据的配电变压器重过载概率预测研究》11000字_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于大数据的配电变压器重过载概率预测研究目录TOC\h\z\t"一级样式,1,11,1,22,2"摘要 摘要本文基于大数据的背景下主要研究了我国配电网现状及存在问题,分析了配电网的相关因素,提出用C4.5+决策树分类模型,来建模分析预测配电变压器重过载问题,在给定数据范围下用Tempo机器学习进行AI建模,通过输入数据,数据拆分,C4.5+决策树分类,训练集模型评估,模型利用等通过一系列模型构建流程,最后得出预测结果.此文章希望为以后相关学术研究做出贡献.关键词:大数据;智能电网;模型预测;配电网第1章绪论1.1论文研究的背景及意义智能电网项目建设发展是我们在推动当今世界各国现代电力系统产业建设健康发展的过程中所必将带来技术的革新和提升,在我国是一个能源大国的基础上,这项技术被认为是最具有研究潜力的方向之一.我国对现代电力系统进行不断的深化改革,旨在为电力行业提供更好的服务和技术支持.随着世界上的自然资源枯竭,例如煤炭、石油等资源正在日益减少,全球为了可持续发展,正在将电网系统打造成为一个清洁、环保、节能的项目,这个项目需要全球共同努力,保护我们的家园.未来几年我国智能电网建设发展是一个重要战略目标.虽然我国智能电网的理论研究和应用实践还只是处于刚刚开始起步的一个时期,但是如果我们把如何建设一个智能化的电网建设作为当今世界上许多国家致力于研发和升级的项目,完善的智能电网系统会使我们的电力系统产品服务行业不断变革和健康发展.本文在大数据的背景下基于智能电网主要研究了我国配电网现状及存在问题.“电网”即电能传递与输送的主要承载者,从保证电网安全可靠地供电的角度,其中用户的需求大致有两个大的方面:第一,如何实现持续供电.电能是人们日常生活中必备的,现代社会没了持续的供电会带来不必要的混乱,给人们带来不便.第二,如何保证电能的质量.电能质量是大家容易忽略的一个方面,如果电能质量出现了问题,那么会严重影响发电、输送电能、用户用电等方面.上述两个方面都是建设智能电网所必须要考虑的,因为电能不持续或者电能质量较差,轻则会造成不必要的损失,重则会威胁人们的生命安全.在我国现代信息和科技发达的新时代,大数据技术的发展及其应用,推动了我国现代经济社会的发展过程,也是我国配电网的现代化、信息化、智能化快速发展的一个有力保证.在我国配电网的应用和发展实践中,配电网已经实现了一种实时自动监控、远程调度、用电情况预测、智能化用电等管理模型,为新的时期我国优化了配电网的科学发展,构建了现代化我国的电网制造体系,起到了重要的作用.随着我国经济的快速发展,对电能的要求越来越高,各领域各行业都需要稳定可靠的电能,建设好智能电网符合当下经济发展形势,是国家发展重要的一部分.建设质量可靠的国家智能电网需要强大的技术支持,努力达到可靠和智能两个要求.当前,我国已经基本形成了坚强可靠的智能网络结构,并且在智能化方面下了很大的功夫,依托互联网技术,研究的方向主要是针对实现智能电网信息化、智能化、自动化.健全和完善相关结构,保障中国电网系统的安全可靠运行.1.2大数据的定义大数据一词最早出现于2001年道格本尼提出的,随后在2008年首次以BigData作为大数据的名称定义,发展至今,大数据技术已经广泛存在于我们的日常生活中,依托互联网技术,人们利用大数据可以完成许多的工作,实现智能化操作.我国出现大数据一词与国外比较晚,但是随着国内技术的不断提升,国内有关大数据的行业正在迅猛发展.将大数据本土化定义为:通过互联网技术或者是移动终端等技术展开对于世界的了解.大数据在现代社会被广泛使用,例如人们通过电商平台搜索自己喜欢的商品时,平台会根据大数据给用户推荐相关产品,从而帮助用户.1.3大数据的应用现状及发展趋势麦肯锡在其近期发表的2016年研究成果报告中再次明确指出:中国企业的财务数据已经深入地广泛渗透到每一个不同行业和各项政府财政管理部门职能的各个领域,逐渐逐步发展为并成为重要的企业制造力驱动因素.而目前人们对于这一系列海量行业数据的准确理解与综合运用必然也直接预示了新一轮中国企业生产率的快速增长与企业消费者收入盈余增长浪潮的即将来临.移动互联网中的商业智能、咨询与信息服务以及健康等在保险、零售业、金融业、通讯等各个不同行业中进一步地应用显现,并且由此产生了很多巨大的企业社会经济价值和其在行业内的发展提升空间.目前典型的大数据应用领域有:1.商业和智能化领域:移动互联网和社交媒体网站带来的机会是给各种社交组织和机构通过对于大数据技术的综合运用,使大量产品和顾客的信息均为可以从该社交网站上实时获取.2008年美国的金融危机迅速席卷整个世界之后,餐饮企业也因此受到了巨大的重创.在很多食品行业都是通过暂时关闭自己的门店以缓解经济危机的条件情况下,星巴克却充分利用了区位数据分析法方便快捷地找准了最恰当的地点来建立新店,并成功拓展了.2.服务领域:一方面,公共组织可以充分利用云计算技术把自己所积累的大量历史数据资料进行综合挖掘和利用,从而为客户提供更加优质的交通服务,比如在交通领域实时的路况和对交通导向.美国俄亥俄州交通部,就是利用云计算分析和处理的大数据技术来帮助客户了解和掌握恶劣天气下发生的道路状况.另一方面,公共医疗机构也是可以通过对某些领域的大数据进行实时分析来提高对危机的监测和预警能力.谷歌公司通过对于人们在网上搜寻到的词条与疾病指挥中心的数据结果进行了分析和综合处理,有效及时准确地判定出了这种类型流感传播的主要来源,为公共健康医疗机构的发展提供了有价值的资料.3.政府日志决策采集领域:通过对决策数据的实时综合分析挖掘,从而有效地大大提高了各级政府日志决策的分析科学性和决策信息的采集时效性.通过对各个各级政府部门官方网站及其中的政府日志决策信息采集数据系统进行实时整合和分析集成,为各级人民政府及其有关职能部门和政府领导工作人员及时提供一种更加可视化的各级政府工作决策日志信息采集系统技术支撑解决服务.其中比如:2008年日本重大规模地震海啸事件预测发生后历时只需9分钟,美国联邦国家国土海洋和海岸大气动物管理局就已经实时发布了详尽的日本海啸影响预警,并且随即通过对美国海洋地震传感器所采集获得的日本海啸地震影响实时预测资料数据进行了综合电脑分析模拟,制订制作出详尽的日本海啸影响预测以及应急处置措施,并将自己设计制作的各种日本海啸地震影响预测模型以及事件数据实时公开化并发布上传到美国youtube等官方网站.1.4大数据引申出的数据挖掘技术随着移动互联网络和信息处理技术的高速发展进步,人们所需要积累的数据资料量急剧快速上升,动辄以t、tb千万计,如何从众多的的海量数据资料中进行搜集和分析提取有用的数据资料或者相关知识已经逐渐变得当务之急.数据挖掘技术是一种为了能够顺应这个时代需要而应运而生并且逐渐发展应用起来的一种基于数据处理的新技术.它也是我们进行数据知识系统开发的一个重要关键步骤.数据综合挖掘的分析任务主要类型包括分类关联数据分析、聚类分析、分类数据预测、时间跟踪序列和数据偏差跟踪分析.第2章我国配电网现状及存在问题2.1配电网的概念及特点在目前我国一些现代化的大型电力系统中,大型火力发电厂往往本身是一个远离当地负荷的电压中心,发电厂所需要产生的当地电能,一般都是需要经过一些高压或者超高压的当地输电互联网络直接运送用户到一些相应的当地负荷电压中心,然后由一些相应的当地负荷电压中心由一些相应的负荷电压密度等级较低的输电网络把这些相应的当地电能直接分配输送给相应用户,这种以各级电站相应的负荷电压等级为主的相应电力传输线路和其相互没有联系的大型变电站所共同构成的一个配电统一体,被我们称为一种相应的当地配电互联网络,即一种起到直接有效分配用户供电和相应动力设备作用的相应互联网络,又被我们称为相应配电网,供应于当地区域内的所有相应配电动力线路及其他相应配电动力设备的相应互联网络其总称,也就这就是我们所谓的相应配电网络系统.按电压等级分为:高压输电网(220kV,500kV,750kV,1000kV)高压配电网(66kV,10kV)中压配电网(10kV,35kV)低压配电网(220-380V)按地域分:城市配电网和农村配电网一、城市配电网的主要特点:(1)由于深入到城市的中心区和人口密集的地方,负载比较集中,发展的速度快,所以在进行规划的过程中应该保留一个发展的余地.(2)用户对供电质量要求高.(3)由于配电网的设计标准比较高,在安全和经济上的合理均衡下,要求其供电具备较高的可靠性.(4)由于无线配电网在无线调度上的供电接线比较复杂,需要我们充分考虑配电在无线调度上的接线灵活性、运行上的无线供电系统连续性及其它的经济效益.(5)随着配电网自动化水平的提高,对供电管理水平的要求越来越高.(6)公共配电电网系统基础设施的技术要求比较高.由于目前城市公共配电网建设中的输变线路与其他变电站建设需要充分综合考虑到其系统占地面积小、容量大、安全可靠、维修维护费用少以及影响城市整体景观.二、农村配电网的主要特点:(1)由于用户供电设备系统传输线路距离较长,分布利用范围宽,负载较小而分散;由于用户供电的周期季节性相对较强,且供电设备的综合利用率相对较低.(2)目前我国虽然经济社会发展迅猛,但是仍然普遍存在着许多建设项目没有明确总体规划,布局不合理,施工没有严格的总体规划,设备技术质量水平较差等缺乏先天自然条件的主要缺陷.(3)我国的农电企业组织结构不稳定,专门技术能力较低.(4)我们的农电系统的用户大多数为乡镇企业、农村排灌及其他农民的生活使用电,用户的安全使用电意识匮乏,严重影响了安全的供用电.2.2我国传统配电网的不足配电网的发展对于城市来说是很重要的,随着城市的要求不断提高,对电网稳定性和可靠性也有较高的要求.实际运行中,要将城市布局和电力系统考虑进去,合理科学地分配电网结构,才能使得电网稳定运行.城市的规划建设与电网的规划建设密切相关,随着城市的用电负荷不断提高,电网系统的安全性和可靠性成了城市配置电网首要考虑的因素,要求越高,那么电网的标准也就越高.当前,我国城市电网建设中,形成了一种无法相互适应的配电网体系,给我国的电能输送带来了诸多问题,从而导致城市居民受到不利影响.结合城市电网规划建设中存在的问题,配电网无法适应人们的使用需求,主要体现在以下几个方面:1.配电运输网络的建设电源点落后于电源我国大型城市配电建设的快速发展,由于目前我国大型城市的建设规模与城市商业化的不断建立,电源点的上网容量和对用电能源的输出也就因此受到了很大限制,特别是在城市配电网络线路建设中的电能传递.2.自改革和开放以来,城市建设发展速度迅猛,负荷年均增长率很高,但是电力配套工程的建设措施不及时,输电管线半径小,线路长,瓶颈效应也比较突出,电能在城市中输送得不到去,往往会因此引起严重的停电事故.3.对于电缆出线运行路径和运输通道的成本影响与实际城市规划并没有很好的相互适应,有些偏远地方已经完全改用了地下架空电缆,施工和项目建设时的成本也不被充分允许,采用双层架空电缆导线时用户所处的地理环境和网络条件也可能会有所受限,有些偏远地区则可能是已经采用了双层绝缘式架空导线,网络复杂较为普遍.4、早期停止施工的配电线路由于导线使用数量细、老化、年久失修,高能耗的配电设备使用数量多,线损率高,由于线路导线使用半径小和使用无线电功率的缺额相对较大,合线数量损耗大,个别偏远地区的电力配电网合线损耗比率可以直接达到30%,一般正常情况下在l5%~20%,造成了自然能源的大量利用浪费和严重的生态环境资源污染.5、供电不可靠的重大影响使停电因素正在不断增加,由于目前我国的配电网基础建设技术投资的不足,设备的不断老化和供电技术装备性能的低劣,供电设备事故频繁,往往仅仅只是一点小小的故障就可能会直接引发整个电网全线乃至大城市范围的严重停电.在各大城市中较为繁华的关键地段,重要工业场所供电用户的重大停电,影响涉及到了整体社会治安和实体经济用电市场.6、电网的结构复杂,环网连接点比较多.2.3国内外配电网现状与发展趋势近年来我国社会主义市场经济体制建设的进步与迅猛发展及广大人民群众对于生话文化素养认识水平的进一步提高,生产、生话对于全网电能运行质量和电网供电系统可靠性的总体要求不断得到提高.然而,由于目前我国有些部分地方的智能配电网仍然普遍存在着设备陈旧、技术含量低、布局不合理等诸多问题,影响了其配电管理线路的安全、可靠、经济运行.因此,必须进一步着力加快智能配电网的安全自动化、智能化的工程建设,提高了电网供电的安全可靠性,适应当今社会主义经济的快速发展和广大我国人民群众对于日常生活的实际需求.对于一些各类突发事件的停电情况或者自然灾害,国内外电网配电管理系统仍然根本无法真正能够做到安全、可靠地连续及时进行电网供电,而与此同时,用户对于电网供电系统电能运行质量的自动控制能力要求也就因此变得更高.目前,我国随着电力系统的进一步发展和我国电力市场的进一步建设,大规模的配电网己经走上了正轨,以此为基础所带来的结果就是设备数量和使用率的大幅度提高,供电设备的安全和可靠性也进一步有了明显的改善.随着我国重点地区城市配电网改造工程的不断深入和配电网建设工程自动化试点的不断开始和投运,全国目前已经有近百个重点地区城市的配电企业都实施了自己的配电网自动化系统,取得了一些初步的成绩,同时还存在着许多困难.

针对我国的电力供给存在的问题,主要体现在电网输送技术、维护技术等问题上.根据这些问题展开分析提出了一个改进的智能电网建设模型,旨在保障国家电网实现智能化,更加可靠和安全,这是全世界电网致力于建设的目标,关乎国家经济社会发展、以及环境卫生等方面的重大工程和举措.而智能电网则被认为是我们解决21世纪以来我国电力供给所面临的问题最好的有效方法.世界上有许多国家将智能电网建设作为国家的战略项目.例如,在美国前总统奥巴马政府执政时期,就通过了大量的经济拨款用于智能电网的建设,主要涉及的项目包括了使用先进的数字技术对数据进行管理和应对,旨在强化电网在实际运行过程中的可靠性和安全性.在智能电网建设中,人们能享受到更好的服务,可以得到高质量的电能输送,而且实现许多智能化操作,通过环保先进的技术可以使得电费开支减少.对于环境来说,优化电能可以减少对于煤炭等资源进行发电,保护环境.除了美国,欧洲多国一直也致力于智能电网的建设,实行绿色环保的清洁电能,既能保证电能的正常输送,又能实现可持续发展.在日本,智能电网建设主要是采用新能源,日本拥有先进的高科技技术,在政府的政策的支持下,大力发展新能源,开展智能电网的建设.第3章基于大数据的智能电网的分析3.1智能电网的概念及特点智能电网是依托先进的智能技术进行发展的电力网络系统,采用的先进技术主要包括了智能传感技术、计算机技术、智能控制技术等.智能电网与传统的电网相比,更加可靠安全,能对资源进行合理规划,既能维持用户所需,又能保护环境.智能电网的初衷就是实现确保可靠,经济,清洁和互动的电源供应,并为用户提供增值服务,实现面向市场的能源供应.“交互式网格[1-3]”是指通过加载系统的数字设备并升级网络来实现开放和互连的信息模型.网络管理系统实现了整个电力行业的智能,计算机化和层次化的交互式管理,例如发电、输电、电源、功耗,对客户的销售,网络的分层分布和全面的服务.智能电网首先体现出智能化的特点,依托互联网、大数据等先进的智能技术,建设更加强大可靠的电网系统.随着全世界对于智能电网建设的关注度越来越高,人们对于智能电网的认知程度也越来越深,因为当前世界的智能电网建设还存在诸多技术问题,但智能电网具有广泛的发展前景,被认为是未来最有潜力的技术之一.智能电网的建设十分复杂,因为它需要考虑的技术层面涉及很宽泛,智能技术当前还未完全成熟,所以导致智能电网在实际的运行中可能存在不稳定的因素,而且容易受到外界干扰,所以智能电网建设至关重要.智能电网的建设要实现可靠安全地运行,需要对新能源进行严格管理,健全和完善管理机制,才能保证为用户提供新能源的前提下,减少新能源对环境减少不利影响.根据大量的文献资料进行总结,智能电网通常有以下几个特点:1.自愈自愈是指智能电网安全可靠地运行,在相关技术的支持下,能够满足电网的基本功能和要求.具体体现在从事电网的相关人员对电网中的故障问题进行解决,以确保电网正常运行,减少出现电力输送不稳定或者电力中断的现象,为用户带来优质服务.2.安全安全是智能电网的核心关键点之一,智能电网要实现智能化,就必须要对外界的干扰因素或者恶意攻击采取及时可行的措施,旨在利用强大的防御机制来抵抗损害,确保一旦出现电能损害,智能电网能迅速恢复正常运行.3.兼容由于现在我国目前传统的大型电力传输网络主要都指的是通过面向无线遥感器和无线电网络进行风力发电.与计算机系统的工作原理相似,智能电网要具有一定的兼容性.这样就可以直接承载包括大型集中式风力发电系统等多种能源类型,提供多种储存能源的电力装置.4.交互交互是指智能电网和互联网相互联系,电网在实际的运行过程中,需要依托互联网技术进行信息交流,作为电网系统的完整一部分,互联网的作用十分重要,交互才能满足电网正常运行,获得更多关于电网的反馈,促进电网发展.5.集成智能电网是一个复杂的电力系统,继承了许多方面,例如建设工程中的监视、管理、控制、保养、经营等.智能电网下有多个其他系统,这些系统相互联系,才能使得智能电网更加稳定可靠,进而建立健全的电网体系.3.2智能电网的研究现状及发展趋势当前,国内外对于智能电网的建设还处于研发探索的阶段,在一些领域上已经取得了显著的成果,但是在某些环节上还存在技术难题,针对这些问题,国内外许多科学家展开了大量的研究和实验.智能电网符合未来社会的发展标准,对未来的很多行业来说十分重要,其独特的优点被全世界所认可.近几年,我国正在建设坚强智能化的电网系统,已经实现了坚强的标准,在智能化上面还需要不断探索,中国式的新型智能综合电网将以一个中国式的特高压智能电网作为其全国主干输电线路的主要网架,利用先进的信息技术和控制技术,构建一个智能化的电网系统.在全世界智能电网发展中,已经实现了遥遥领先,关键技术应用特点将主要集中包括在供电信息化、数字化、自动化和智能互联网等关键技术上,实现供电企业的智能集团化、客户化的服务和精细效益化、标准化.智能电网既能实现稳定可靠的运行,达到高效、稳定、绿色环保、经济等标准,又能够在各个角度上支持和推动我国乃至世界各地范围内的电力资源优化配置以及新型清洁能源开发,从而带动相关行业快速发展.智能电网建设对于突破传统电力技术是一次勇敢的尝试,具有里程碑式的意义.智能电网被广受关注,是未来重点发展的技术之一,在国家的政策支持下,我国正在紧锣密鼓地开展智能电网的研究和建设,经过不断的探索,一定会突破技术上的难关,取得突破性发展.相信在未来,许多行业领域都会接触到智能电网.同时,智能电网的建设也离不开其他行业知识和技术的支持,这是一个多领域融合的技术,利用先进的制造技术,将传统的电网升级革新,促进电网快速发展.3.3利用大数据分析配电网故障及原因在日常的生产生活中,我们可以看到很多电网故障的新闻,产生原因主要是地质灾害、恶劣天气、线路老化、非法盗取等,根据大数据调查报告可知,内部因素导致的电网故障是很少的,多数是由于外界原因.总的来看,发生故障既有人为因素也有自然因素.线路老化是一个很常见的原因,一些地方的电线没有得到及时维护和更换,在外界因素或者人为操作的因素下,导致电路出现故障.例如废弃建筑拆除、大风冰雹等恶劣天气、偏僻的农村电路没定期检查和清理等,这些都很容易引发线路老化,进而引起输送电路出现故障,给生命安全和财产带来危害.还有一种,由于配电变压器在运行的过程可能会存在配变“重过载”的情况发生,配变长时间处于重载或过载状态会降低设备寿命的同时会带来设备故障风险,引起停电事故发生,给电力公司和用户双方带来不必要的经济损失,这一因素也正是本文建模所要解决问题的所在[3-6].3.4挖掘配电变压器的影响因素目前国内正在优化电网结构,而且需要一段时间.除自然界不可避免的意外因素,我们人为尽可能有效控制的因素有:变压器自身故障、过载问题等.虽然短时期内并不能从根源阻止故障、过载问题,但是我们可以通过预测提前防备减少损失.3.5利用大数据提出解决对策随着电网系统中来自传感设备、检测设备、用户服务设备等方面的数据量不断增长,利用大数据技术解决电力系统中的数据处理问题显得尤为重要.而配电网是面向电力用户的最末一级电网,以配电变压器地理供电区域为边界的配电台区是配电网运维中的重要基本单元.配电变压器运行状态很大程度上决定了区内的供电质量.所以,配变在运行的过程中,可能会存在配变“重过载”的情况发生,配变长时间处于重载或过载状态会降低设备寿命的同时会带来设备故障风险,引起停电事故发生,给电力公司和用户双方带来不必要的经济损失.故需要对配变未来一段时间是否发生重过载进行预警.由此,我们提出采用数据分析结合人工智能的方法来对一段时间内给定数据进行清洗、拆分、进行AI建模,从而预测配电变压器是否出现“重过载”现象.第4章模型设计4.1基本原理此次建模选取了自2018年6月至2018年10月的一段数据,通过模型处理,可预测出这段时间内配电变压器是否重过载的概率.一、设计原理首先,我们可以从分析配电变压器特有性质入手,可以了解到变压器油色谱特征气体为:氢气()、甲烷()、乙烷()、乙烯()、乙炔()[7].而其故障类型又可以分为:正常、低能放电、高能放电、过热.如果能利用分类算法对变压器的油色谱检测数据进行分析,从而指导设备的故障类型诊断,就会大大缩短变压器维修时间,提高维修效率,节约维修成本.原理如图1所示:图SEQ图\*ARABIC1变压器预测原理图假如,我们取一段时间内的变压器油色谱特征数据,将数据进行处理后,将变压器油色谱特征气体的数值进行分类,不同气体值的范围会对应出不同的状态,如:过热,高能放电,低等放电,经过分类模型构建处理后,即可以得出配电变压器是否重过载的概率。那么我们该选择分类算法里的哪一种呢?二、算法选择分类算法在解决实际问题时经常会把数据集拆分为训练集、测试集.通过寻找合适的算法对训练集进行建模,最后用测试集对模型进行验证,如果误差能够达到一定精度,即则认为该模型合适,可以用来进行预测和分析.图2为算法详细原理.图SEQ图\*ARABIC2分类算法原理图首先,我们科普一种ID3算法,ID3算法是一种机器学习分类算法,它的核心是信息熵,该算法通过计算出每一个目标属性的信息增益,可设定增益熵最高的属性作为划分标准,重复个过程,直至生成一个好的分类训练样本的决策树.熵是对不确定性的一种度量,用来对信息进行量化.熵越大,不确定性越大,信息量也就越大.其公式为:.

图3ID3算法原理图但当属性取值很多时,ID3得出的效果会非常差,因为使用信息增益划分时它倾向于取值多的属性,因此本文选择采用了C4.5+算法,此算法在ID3算法的基础上演变,相比ID3算法其计算复杂度更低,计算效率得到了提高.它对于ID3算法的重要改进是使用信息增益率来选择节点属性.C4.5+算法是C4.5算法的修订版,引入Boosting方法,占用的内存资源较少,使用更少的规则集,计算速度比较快,并且准确率更高[8-10].C4.5+算法详细原理如图4所示:图4C4.5+算法原理图该算法继承了ID3算法的优点,克服了ID3算法偏向于多分类属性的问题,保证了规则更简单,可以避免过拟合;模型结果可解释性强.三、数据来源数据来源为某地市的配网变压器监测数据.训练集为2015年5月至2018年5月数据,测试集为2018年6月至2018年10月数据.其中包括:配变编号、额定容量、数据日期、配变类型、最大温度、最低温度、用户编号、用户名称、终端地址、电能表资产号、电流互感器、电压互感器、24点的运行负荷值、是否重过载.4.2模型流程我们的使用环境为Tempo大数据分析平台[16].所用数据亦为此平台所提供.运行开始,数据源文件首先通过HIVE输入,经过缺失值处理→数据拆分→设置角色→C4.5+决策树分类→模型利用→分类评估→模型输出.详细流程如图5所示:图5模型流程图此模型运行总共耗时39分37.9秒,该数据分析平台利用分布式环境中数据操作和处理功能,按照行、列、高级等类型,进行数据过滤、数据类型转换、缺失值处理等数据处理的操作.最后输出预测结果及分析.4.3预测结果结果如图6所示,其中f1为人工智能计算出的预测精确度,我们可以看到分类f1对0的预测值约为1.00,即此模型对预测配电变压器未过载的概率精确度达1.00,对1的预测值约为0.86,即此模型对预测配电变压器过载的概率精确度达0.86,由于数据庞大,在此只展示部分图例:图6预测结果图此模型可及时有效预测配电变压器是否过载问题,发现并及时治

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论