




已阅读5页,还剩68页未读, 继续免费阅读
(电力系统及其自动化专业论文)基于关联规则挖掘技术的城市用电负荷分析.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
a b s t r a c t p o w e rl o a di so n eo ft h em o s ti m p o r t a n ti n d i c e sf o ru r b a np o w e rn e t w o r k p l a n n i n ga n dm a n a g e m e n t t h ea n a l y s i sa n df o r e c a s t i n go fl o a di s t h eb a s i so f p l a n n i n g t h er e s e a r c ho fl o a dc h a r a c t e r i s t i c sa n di t sd e v e l o p m e n tt r e n dh a v eg r e a t s i g n i f i c a n c ef o rt h es e c u r ea n de c o n o m i c a lo p e r a t i o n ,p l a n n i n ga n dc o n s t r u c t i o no f p o w e r n e t w o r k s a s s o c i a t i o nr u l e sb a s e dm e t h o di sa p p l i e dt ot h eu r b a np o w e rl o a da n a l y s i si nt h i s p a p e r t h em e t h o d i sb a s e do nt h e t h e o r yo fd a t am i n i n g c o n s i d e r i n gt h e c h a r a c t e r i s t i co fp o w e rl o a d f i r s t l y , t h ed a t ao fp o w e rl o a da n di t sc o r r e l a t i v ef a c t o r s a r ei n t e g r a t e d ,a n dt h e nd a t aw a r e h o u s ew i t ht h et h e m eo fp o w e rl o a da n a l y s i si sb u i l t s e c o n d l y , i no r d e rt om a k ea n a l y s i sm o r ee f f e c t i v e l y , t h ec l u s t e r i n gm e t h o di su s e dt o g e n e r a l i z et h eo r i g i n a ld a t a l a s t ,t h ea s s o c i a t i o nr u l e sa l g o r i t h mi sd e v e l o p e dt of i n d f r e q u e n ti t e m sa n da c h i e v es t r o n ga s s o c i a t i o nr u l e sf r o mt h eh i s t o r i c a ld a t as e t t h e r e f o r e ,t h ee f f e c to fc o r r e l a t i v ef a c t o r st op o w e rl o a dc a l lb ea n a l y z e d b a s eo nt h em e t h o da b o v e ,ap r o g r a mw a s c o m p o s e da n dl o a dd a t ao f4 8c i t i e si n c h i n aw e r ea n a l y z e d t h er e l a t i o n sb e t w e e na n n u a lp o w e rc o n s u m p t i o na n dc i t yt y p e , s u c ha st h ec e n t e rh i e r a r c h ya n de x e c u t i v ec a t e g o r yo fc i t ye t c ,w e r ed i s c o v e r e di nt h i s p a p e r t h er e l a t i o n sb e t w e e np o w e rc o n s u m p t i o ng r o w t hr a t ea n ds o m ee c o n o m y f a c t o r s ,s u c ha st h ep r o p o r t i o no f s e c o n di n d u s t r ya n dg d pg r o w t h , w e r ea n a l y z e d f u r t h e r t h o s er e s u l t sa r er e a l i s t i ca n da l s oh a v eg i v e nas p e c i f i cn u m e r i c a li n t e r v a lo f f a c t o r s s o m eo ft h er u l e sc a n tb er e v e a l e db yt r a d i t i o n a lm e t h o d i nt h ee n d ,t h e v a l i d i t yo ft h et h e o r ya n dm e t h o da p p l i e di nt h i sp a p e rw e r ev e r i f i e dt h r o u g hi n s t a l l r u l e si nd a t ab e f o r e h a n d w i t he n r i c h i n go fd a t a ,t h em e t h o dp r o p o s e di nt h i sp a p e rh a sav e r yb r o a d p r o s p e c to fa p p l i c a t i o n t h i sd e e pd a t am i n i n gt e c h n i q u ec a nh e l pr e s e a r c h e st of i n d c h a r a c t e r i s t i c sa n dd e v e l o p m e n tr u l e so f p o w e rl o a dw h i c hm a yp r o v i d ea s c i e n t i f i c b a s i sf o rd e c i s i o nm a k i n go nu r b a nn e t w o r k p l a n n i n g k e yw o r d s :d a t a m i n i n g ,a s s o c i a t i o nr u l e s ,p o w e rl o a da n a l y s i s 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的 研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表 或撰写过的研究成果,也不包含为获得:苤鲞盘堂或其他教育机构的学位或证 书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中 作了明确的说明并表示了谢意。 学位论文作者签名:张晶签字日期: 加0 7 年厂月,弓日 学位论文版权使用授权书 本学位论文作者完全了解墨叠盘堂有关保留、使用学位论文的规定。 特授权基盗盘堂可以将学位论文的全部或部分内容编入有关数据库进行检 索,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校 向国家有关部门或机构送交论文的复印件和磁盘。 ( 保密的学位论文在解密后适用本授权说明) 学位论文作者签名:张晶导师签名确卢乞, 签字日期:撕7 年厂月,弓日 签字日期:年月 日 第一章绪论 1 2 电力负荷分析概述 第一章绪论 1 2 1 电力负荷分析目的及意义 电力系统的任务是给广大用户经济、安全、不间断的提供优质电能,满足各 类负荷的需求。电力负荷是电力系统规划设计和运行管理的重要指标之一【1 1 ,研 究电力负荷的特征及变化规律对于电网的安全、经济运行和规划建设都具有重要 意义。 科学的负荷分析,可以经济合理地安排电网内部发电机组的启停,保持电网 运行的安全稳定性,减少不必要的旋转储备容量,合理安排机组检修计划,保证 社会的正常生产和生活,可以根据负荷的峰谷情况及供电部门的要求合理安排设 备的工作时间,获得最佳用电效率,有效地降低发电成本,提高经济效益和社会 效益。负荷分析的结果,还可以有利于决定未来新的发电机组的安装,决定装机 容量的大小、地点和时间,决定电网的增容和改建,决定电网的发展和建设,为 电网的安全、经济、可靠运行提高保证。 在城市电网规划中,负荷及其发展趋势的分析预测是一项基础工作,它决定 了未来城市对电力的需求量和未来城市电网的供电容量,对城市供电电源点的确 定和发电规划具有重要的指导意义,其精度的高低直接影响着电网规划质量的优 劣。 1 2 2 电力负荷分析内容及方法 1 1 2 1 负荷分析内容 目前,电力负荷分析研究主要体现在:通过历年的电力负荷数据进行负荷特 性与变化规律的分析。 负荷按物理性能划分为有功负荷和无功负荷;按电能的产、供、销生产过程 分为发电负荷、供电负荷和用电负荷;按时间分为年( 季) 、月、日、时、分负 荷;另外售电量及用电量也是主要研究对象。 城市电网规划中负荷分析预测的对象主要有电量、负荷、最大负荷利用小时 数、年( 季、月、日) 负荷曲线、负荷同时率、负荷密度等。 第一章绪论 1 1 2 2 负荷分析方法【2 - 1 5 1 当前的城市负荷分析主要体现在负荷变化规律的分析即负荷预测方面。主要 方法分为经典负荷分析方法和现代负荷分析方法: 1 ) 经典分析方法 比例系数增长法 假定规划区今后的电力与过去有相同的增长率,用历史数据求出比例系数, 按比例预测未来发展。 弹性系数法 由规划区以往的用电量和国民生产总值分别求出它们的平均增长率k 一 疋,从而求得电力弹性系数e = k ,k ,再用某种方法预测未来m 年的弹性系 数e 及国民生产总值的增长率k :,则可得电力需求增长率k :,从而可按比例 系数增长预测法得出第m 年的用电量。 回归模型预测法 根据负荷过去的历史资料,建立可以进行数学分析的数学模型,对未来的负 荷进行预测。从数学上看,就是用数理统计中的回归分析方法,即通过对变量的 观测数据进行统计分析,确定变量之间的相互关系,从而实现预测目的。 负荷密度指标法 根据规划区各地块的用地性质,采用与其它地区类比的方式确定该规划区预 测年负荷密度。 负荷曲线叠加法 将电网用电负荷按照用电结构( 照明、动力等) 或者行业( 机械工业,居民 生活等) 分类,然后将所得的分类型典型日负荷曲线叠加,即可得到电网典型日 负荷曲线。 2 ) 现代负荷分析方法 灰色理论法 灰色理论法就是对在一定幅值范围、一定时区内变化的灰色量,通过一定的 数据处理技术,寻找出比原始数据有更强变化规律的新的数据数列,进而建立一 定数学模型进行预测的方法。 专家系统方法 专家系统方法是对于数据库里存放的过去几年的负荷数据和天气数据等进 行细致分析,汇集有经验的负荷预测人员的知识,提取有关规则。借助专家系统, 负荷预测人员能识别预测日所属的类型,考虑天气因素对负荷预测的影响,按照 一定的推理进行负荷预测。专家系统基本结构由知识库、推理机、数据库、人机 接口、解释程序和知识获取程序六部分组成,如图1 - 1 所示: 第一章绪论 图卜1 专家系统的基本结构 神经网络理论 神经网络理论是利用神经网络的学习功能,让计算机学习包含在历史负荷数 据中的映射关系,再利用这种映射关系预测未来负荷。由于该方法具有很强的鲁 棒性、记忆能力、非线性映射能力以及强大的自学习能力,因此有很大的应用市 场,但其缺点是学习收敛速度慢,可能收敛到局部最小点;并且知识表达困难, 难以充分利用调度人员经验中存在的模糊知识。 模糊负荷预测 模糊负荷预测是近几年比较热门的研究方向。 模糊控制是在所采用的控制方法上应用了模糊数学理论,使其进行确定性的 工作,对一些无法构造数学模型的被控过程进行有效控制。模糊系统不管其是如 何进行计算的,从输入输出的角度讲它是一个非线性函数。模糊系统对于任意一 个非线性连续函数,就是找出一类隶属函数,一种推理规则,一个解模糊方法, 使得设计出的模糊系统能够任意逼近这个非线性函数。 负荷分析是一个相当复杂的问题,不同电力系统由于负荷特性不同,可能有 不同的分析方法。即使同一个电力系统,根据分析时间的远近以及负荷特性的变 化,不同时期也可能采用不同的方法。目前尚无一个固定方法可以适用于一切电 力负荷分析问题,并保证优于其它一切方法。 1 2 3 电力负荷分析现状及面临的新形势 目前尽管负荷分析的方法有多种,但由于所需的数据难以得到或由于分析模 型存在不适应性,所以针对某一具体规划区域而言,可供选择的预测方法并不很 多。而且使用经典的电力负荷分析方法通常只能针对常规的目标得到一些一般应 用的结果。当前城市电网规划中一般采用1 1 2 2 中所述一种或几种方法进行负 第一章绪论 荷分析预测,最后通过专家干预获得最终结果。 近年来,电力负荷分析工作主要面临着对大量数据的处理和相关因素影响的 把握两个问题: 1 ) 庞大的数据量 近二十年来,随着电网规模的不断扩大和电力市场竞争机制的引入,e m s 和 d m s 各自积累了海量的数据,如何更好地利用和管理这些日益庞大的同构和异构 数据库,使之转化成为信息和知识,帮助企业更好地分析和决策,己成为地区供 电企业日益紧迫的需求。 所获得数据的主要来源包括: 客户资料 电力客户一般分为第二产业客户、第三产业客户、农村客户、居民客户等。 政府机构及公共管理部门统计及规划资料 包括属于政府机关的有关部委和各级行政主管部门,如经贸委、计委、统计 局、各工业主管局、企业的主管部门等。 电力公司内部统计资料 许多数据资料如电费、财务、计划、统计等可以直接从电力公司获取。 科研单位和一些专业咨询机构所掌握的资料 2 ) 相关因素的影响 电力负荷影响因素有很多,既受负荷本身的历史表现决定,还要受很多非负 荷因素的影响:一般来讲,电力网络负荷同其所在地区的经济、政治、气候等因 素常存在某种因果关系。近年来,负荷侧管理的采用( 如拉闸限电等) ,也使得 电网负荷特性发生变化。这些非负荷因素的影响往往无法用精确的数学表达式来 描述,只有通过对大量观察数据的统计处理,才能找到它们之间的关系和规律。 因此对电力负荷及其特性的发展变化的分析中重要的步就是研究电力负 荷与其相关的诸多影响因素之间的关系,寻找有效的方法,进行定性及定量分析, 为决策者提供有效支持。 1 3 数据挖掘研究现状 数据挖掘( d a t am i n i n g ) 是近年来新兴的研究领埘1 6 - 2 2 1 。它是从大量的历史数 据中寻找出潜在的、有用的知识。 1 3 1 数据挖掘的产生背景 在过去数十年中,随着计算机和信息技术的迅猛发展,尤其是数据库技术与 第一章绪论 应用的日益普及,我们产生和收集数据的能力已经迅速提高,许多商务、科学和 各类事务的计算机化,特别是万维网的流行,使得数据及其信息量以指数方式增 长,已经将我们淹没在数据和信息的汪洋大海中,存贮数据的爆炸性增长已激发 对新技术和自动工具的需求,以便帮助我们将海量数据转换成信息和知识。 各种能够从海量数据中发现信息的现代化技术应运而生。比如数据库技术、 数据仓库( d a t ah o u s e ) 技术、联机分析处理( o l a p ) 技术等等。但是这些技 术要么只是使得海量数据的管理更为方便、简捷,要么只是忠实客观的以各种查 询方式展现数据汇总得到的报表,从数据到知识还需要用户在报表的基础上自己 加工处理。 伴随着人工智能和数据库技术的发展,数据挖掘技术逐渐发展起来。数据挖 掘能够从大量的数据中为用户提取深层次的、灵活的、前瞻性的信息。数据挖掘 技术的出现给数据处理工作带来了质的飞跃,它相对人工处理数据而言节省了大 量时间,而且起到了不可替代的作用。数据挖掘技术的产生以及在各个领域的广 泛运用,正得益于目前全世界所拥有的巨大数据资源以及将这些数据资源转化为 信息和知识资源的巨大需要。 1 3 2 数据挖掘基本概念 数据挖掘是一种新兴的知识发现技术,它是从大量的、不完全的、有噪声的、 模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用 的信息和知识的过程,也可以说,数据挖掘是一类深层次的数据分析。数据挖掘 所提取得到的知识表示为概念( c o n c e p t s ) 、规则( r u l e s ) 、规律( r e g u l a r i t i e s ) 、模 式( p a t t e r n s ) 等形式,这些知识蕴含了数据库中一组对象之间的特定联系,揭示 出有价值的知识、规则或高层次的信息,帮助人们分析历史数据以及当前数据的 特征和规律。 数据挖掘过程一般需要经历确定挖掘对象、准备数据、建立模型、数据挖掘、 结果分析和知识应用这样几个阶段( 如图卜2 所示) ,这些阶段在具体实施中可 能需要重复许多次。而且为完成这些阶段的任务,需要不同专业人员参与其中, 具体过程如下: 1 ) 确定数据挖掘对象 定义清晰的挖掘对象,认清数据挖掘的目标是数据挖掘的第一步。根据用户 的要求,确定数据挖掘是发现何种类型的知识,因为根据对数据挖掘的不同要求 在具体的知识发现过程中会采用不同的数据挖掘算法。 2 ) 准备数据 根据用户的要求从数据库中提取与数据挖掘相关的数据,数据挖掘将主要从 第一章绪论 这些数据中提取知识。在选择数据后,还需要对数据进行预处理,对数据进行清 洗,解决数据中的缺陷、冗余、数据值的不一致、数据定义的不一致、过时的数 据等问题,最后形成真实数据库。 3 ) 挖掘模型构建 将数据转化成一个分析模型,这个分析模型是针对挖掘算法建立的。建立一 个真正适合挖掘算法的分析模型,是数据挖掘成功的关键。模型的建立必须从数 据的分析开始,首先为模型选择变量,接着从原始数据中构建新的预示值,下一 步就需要从数据中选取一个子集或样本建立模型,最后需要转换变量,使之和选 定来建立模型的算法一致。 4 ) 数据挖掘 运用选定的数据挖掘算法,从数据中提取出用户所需要的知识,这些知识可 以用一种特定的方式表示或使用一种常用的表示方式,如产生规则等。 5 ) 结果分析 当数据挖掘出现结果后,要对挖掘结果进行解释并且评估。在许多情况下, 利用可视化技术可将数据挖掘结果表现得更加清楚,更有利于对数据挖掘结果的 分析。 6 ) 知识应用 这一过程主要是将数据挖掘得出的预测模式和各个领域的专家知识结合在 一起,构成一个可供不同类型的人使用的应用程序,也只有通过对挖掘知识的应 用,才能对数据挖掘成果做出正确评价。 数 1 3 3 数据挖掘方法 图1 - 2 数据挖掘的一般过程 数据挖掘的常用方法有信息论方法、集合论方法、人工神经网络方法,遗传 第一童绪论 算法,统计分析方法。下面作简要介绍: 1 1 信息论方法 信息论方法如典型的算法决策树( i d 3 ) 方法是通过将大量数据有目的 分类,从中找到一些有价值的、潜在的信息。它的主要优点是描述简单,分类速 度快,特别适合大规模的数据处理。最有影响和最早的决策树方法是由q u i n l a n 提出的著名的基于信息熵的i d 3 算法。它的主要问题是:i d 3 是非递增学习算法; i d 3 决策树是单变量决策树,复杂概念的表达困难;同性间的相互关系强调不够; 抗噪性差。 2 ) 集合论方法 粗集方法,主要用于分类。 粗集方法是表示不确定信息的数学方法。其基本思想是:把对象的属性分为 条件属性和决策属性,按各个属性相同划分成等价类,条件属性和决策属性之间 有三种关系: a 下近似( 决策属性包含条件属性) b 上近似( 决策属性和条件属性之交非空) c 无关 然后对下近似建立确定性规则,对上近似建立不确定性规则,无关情况下不 存在规则。 粗集方法有几个优点:不需要给出额外信息;简化输入信息的表达空间;算 法简单,易于操作。粗集处理的对象是类似二维关系表的信息表。目前成熟的关 系数据库管理系统和新发展起来的数据仓库管理系统,为粗集的数据挖掘奠定了 坚实的基础。但粗集的数学基础是集合论,难以直接处理连续的属性。而现实信 息表中连续属性是普遍存在的。因此连续属性的离散化是制约粗集理论实用化的 难点。 模糊论方法,主要用于聚类。 即利用模糊集合理论对实际问题进行模糊评判、模糊决策、模糊模式识别和 模糊聚类分析。系统的复杂性越高,模糊性越强,一般模糊集合理论是用隶属度 来刻画模糊事物的亦此亦彼性的。 a o 系列方法 按照覆盖所有正例、排斥所有反例的思路寻找规则。 3 ) 人工神经网络方法 人工神经网络方法主要用于分类、聚类、特征挖掘、预测等等方面,人工神 经网络方法仿真生物神经网络,本质上是一个分散型或矩阵结构。它通过对训练 数据的挖掘逐步计算网络连接的加权值。神经网络由于本身良好的鲁棒性、自组 第一章绪论 织自适应性、并行处理、分布存储和高度容错等特性非常适合解决数据挖掘的问 题,近年来越来越受到人们的关注。 人工神经网络方法主要有:前馈式网络、反馈式网络和自组织网络等。 前馈式神经网络:以感知机、b p 反向传输模型、函数式网络为代表,用 于分类、预测和模式识别。 反馈式神经网络:以h o p f i e l d 的离散模型和连续模型为代表,分别用于 联想记忆和优化计算。 自组织网络:以a r t 模型、k o h o l o n 模型为代表的,用于聚类的自组织映 射方法。 神经网络方法的缺点是“黑箱”性,人们难以理解网络的学习和决策过程。 4 ) 遗传算法 遗传算法是一种基于生物自然选择与遗传机理的随机搜索算法,是一种仿生 全局优化方法。遗传算法模仿人工选择培育良种的思路,从一个初始规则集合开 始,迭代的通过交换对象成员( 杂交、基因突变) 产生群体,( 繁殖) ,评估并择 优复制( 物竞天泽、适者生存、不适应者淘汰) 优胜劣汰逐代积累计算,最终得 到最有的知识集。 遗传算法具有的隐含并行性、易于和其它模型结合等性质使得它在数据挖掘 中被加以应用。 遗传算法三个基本算子: a 繁殖:从一个旧种群选择出生命力强的个体产生新种群的过程。 b 交叉:选择两个不同个体的部分进行交换,形成新个体。 c 变异:对某些个体的某些基因进行变异。 这种遗传算法能够产生一群优良后代,这些后代力求满足适应性,经过若干 代的遗传,将得到满足要求的后代,即问题的解。 5 ) 统计分析方法 相关分析、回归分析、差异分析、因子分析、聚类分析、判别分析等。 数据挖掘技术是一个年轻且充满希望的研究领域,每年都有新的数据挖掘方 法和模型问世,人们对它的研究正日益广泛和深入。 数据挖掘的历史不长,但其应用却极其广泛f 2 3 硐,可以说,只要有数据的地 方,基本上都有数据挖掘的用武之地。当代,数据挖掘应用最集中的领域包括金 融、医疗保险、市场、零售业、制造业、司法、电信业、工程与科学等等。数据 挖掘在电力系统也有不同方面的应用,例如:故障检测、状态估计等等。而且, 随着电力自动化的发展,其应用也会越来越广泛。 第一章绪论 1 3 4 关联规则研究现状 关联规则分析是数据挖掘领域的一项重要研究内容,也是大多数人想象的数 据挖掘过程最普遍的知识发现形式,即在大型数据库中“淘金”。它能够发现大 量数据中项集之间有意义的联系,找出满足给定支持度和可信度的多个属性之间 的依赖关系。金子即指人们感兴趣的强关联规则能够提供一些原先不知道或 者不能明确表达出来的信息。 关联规则挖掘首先由a g r a w a l ,i m i e l i n s k i 和s w a m i 在1 9 9 3 年提出【27 1 ,它最 初起源于超级市场“购物篮”问题的分析,研究对象主要是售货数据。例如在超 市的前端收款机中就收集存储了大量的数据,一般情况下,这些数据由如下几个 部分组成:事务处理时间;一组顾客购买的商品;物品的数量及金额;以及顾客 的标示号( 如信用卡号) 等。这些数据是一条条购买事务的记录。这些数据中可能 隐含着许多有用的关联规则如:在购买面包的顾客中有7 5 的顾客同时也购买了 奶油等。这些关联规则是十分有价值的,商场管理人员可以根据这些关联规则更 好的规划商场,如把面包与奶油放在一起,起促销的作用。 近年来关联规则的应用研究主要集中在股票、图书馆数据分析、天气预报等 方面伫8 3 2 1 。电力方面则主要用于市场营销【3 3 1 、故障分析【3 4 】等。 1 4 数据挖掘技术在电力负荷分析中的应用 随着电力系统自动化的发展,信息的采集、传输、加工、存储、查询以及预 测和决策等的信息量和工作量越来越大,传统的数据处理方法对数据加工、分析 很不够,不能有效地挖掘电力系统数据内部的更有用的信息。因此在电力系统应 用数据仓库及其相关技术势在必行。将数据挖掘技术应用到电力负荷分析中来, 可以挖掘出更多有用的知识、模式,方便决策支持系统。 在电力系统中,除某些特别的应用外,各种数据的来源主要包括实时数据、 历史数据、模拟数据。同时,每一种数据来源中还包含有许多不同种类的数据, 所有这些数据构成了一个极其庞大的信息存储体系。然而,就目前看来,在电力 系统实际运行及规划管理中,人们通过这些数据所获得的信息量仅仅是这些海量 数据中所包含信息量的一部分,而隐藏在这些数据之后的更重要的信息如对数据 的整体特征描述和对其发展趋势的预测等,通过常规方法往往无法获得,但这些 信息在决策生成过程中却具有重要的参考价值。这一现状势必造成这样一种局 面:数据虽然充足,但能从中得到的信息相对而言却很缺乏,即许多有价值的数 据对于信息提取来说处于一种“死亡”状态,大量的可利用资源被浪费掉。这一 第一章绪论 切都是因为缺乏对数据进行深层分析的技术所造成。 正是由于目前电力系统中的数据利用很不充分,从中获得的信息相对缺乏和 单一,迫切需要一种适于电力系统应用的深层数据分析技术来改变这一现状,而 数据挖掘技术的逐渐成熟带来了这一契机。通过将数据挖掘技术以适用于电力系 统的方式应用于这些数据,将会有利于获得隐藏在这些数据后面的潜在的重要信 息。 将数据挖掘技术应用到电力负荷分析中,有着广泛的应用空间,这是由电力 负荷及其相关因素的数据特征决定的: 电力负荷的范围特征( 包括时间和空间上的) 与统计特征; 混合存在的离散信息和连续信息; 对某些不确定量的掌握和处理( 如噪声和不完整信息等) 。 当前数据挖掘技术在电力负荷分析中的应用主要体现在负荷预测上。文献 3 5 1 基于数据挖掘决策树算法实现了决策树形式的数据挖掘模型并运用于日负 荷预测。文献 3 6 】提出了一个基于数据挖掘技术的负荷预测模型,运用神经网络 进行负荷预测。文献 3 7 以数据挖掘为核心技术,搭建数据仓库平台,在此基础 上给出一种混合策略的神经网络的高峰负荷预测系统。 目前使用数据挖掘关联规则分析方法来研究电力负荷一系列指标与其多种 相关因素之间关系还不多见。本文即是运用基于关联规则分析的数据挖掘算法对 电力负荷及其多种相关因素之间的影响做了深入研究。 1 5 本文主要工作及结构 1 5 1 本文主要工作 由于将数据挖掘特别是关联规则技术运用于城市负荷特性分析在国内尚属 新兴的研究领域,各学术文献中鲜有对这方面的解决方案、设计思路和算法实现 的涉及,其基本原因是数据收集问题,因此本文在天津大学大量城市规划实践所 积累数据的基础上尝试将数据挖掘引入城市用电负荷分析,针对电网规划对负荷 分析的需求,深入研究和解决如下问题: l 、电力系统负荷周期性和随机性都很强,与众多因素都有着极为复杂的联 系,为了实现对经济、政策、气候条件等负荷关键因素对电力负荷需求影响等内 容的详细分析,需要对海量的负荷基础数据进行整理和分析。这些基础资料都分 散于不周的数据源中,并且存储形式有很大的区别。如何把这些历史数据收集整 合,为关联规则挖掘分析提供一个数据丰富、逻辑严密、结构合理的数据平台, 第一章绪论 是本文面临的首要问题; 2 、数据挖掘技术在对离散性的数据进行分析时具有很高的效率,然而负荷 基础资料大都是连续性的数值数据,这将给关联规则的挖掘过程带来很大的制 约。因此必须采取适当的离散技术对分析的源数据进行相应的变换以更好的提高 关联规则的效率; 3 、通过关联分析方法建立分析模型,挖掘数据背后隐藏的知识,得到各影 响因素和电力负荷之间的关系是本文的目的所在。本文通过研究分析大量城市的 实际规划数据,得出一些具有启发性的关联规则,可以在配电网评估、改造、规 划、建设中,对负荷进行分析和预测,为配网规划等提供依据。 1 5 2 本文结构 本文第二章详细介绍了城市用电负荷指标体系,简要分析了其主要影响因 素。第三章详细介绍了关联规则基础理论,按流程逐步阐述将关联规则应用于城 市电力负荷分析的详细步骤。第四章,设定两个挖掘主题对来自于4 8 个城市的 6 0 0 条负荷数据进行关联规则挖掘,并采用理想预埋规则数据验证本文方法和结 论的正确性。第五章进行全文工作总结及展望。 第二章城市用电负荷相关因素分析 第二章城市用电负荷相关因素分析 2 1 城市用电负荷指标体系 为正确描述电力负荷特性的变化,并准确估计其变化趋势,可以通过对一些 特定的指标参数的分析计算达到目的。 1 9 9 8 年原能源部颁发了电力工业生产统计指标解释,2 0 0 1 年初国家电力 公司对其中涉及负荷特性指标的部分进行了补充修改。目前电力工业生产统计 指标解释中定义的负荷特性指标包括最高负荷、最低负荷、平均负荷、负荷曲 线、负荷率、平均日负荷率、最小负荷率、月生产均衡率、年生产均衡率、最高 负荷利用小时、同时率、不同时率、尖峰负荷率、峰谷差率等1 5 个。但这些指 标定义是从指标的物理含义出发,概念性较强。在实际应用中,根据数据的可获 得程度和应用的方便性,扩展得出一些常用的负荷特性指标,包括:( 典型日) 日最大( 小) 负荷、日平均负荷、日负荷率、日最小负荷率、年平均日最小负荷 率、月负荷率、年平均月负荷率、季负荷率、年负荷率、最大负荷利用小时数、 日峰谷差、日峰谷差率、年最大峰谷差、年平均峰谷差、年平均峰谷差率、( 典 型) 日负荷曲线、年负荷曲线、年持续负荷曲线等。 负荷特性指标数量众多,但我国到目前为止尚未建立统一的分类方式和规范 的指标体系,造成在实际应用中,选用的指标不一致,口径不一,难以进行对比 分析,也容易造成指标混淆,带来错误和误差。 文献 2 】结合我国历史发展和现状,参考国外情况,兼顾发电、供电和用电 环节以及各地区差异,在深入分析和研究的基础上,提出了一套负荷特性指标体 系,其中包括日负荷特性指标、周负荷特性指标、月负荷特性指标和年( 季) 负 荷特性指标,如图2 1 所示。后面章节将详细介绍。 第二章城市用电负荷相关因素分析 负荷特性指标 日负荷特性周负荷特性 i1 月负荷特性 l1 年( 季) 负荷特性 l 、日最大( 小) 负荷 2 、日平均负荷 3 ,日负荷率 4 、日最小负荷率 5 、日负荷曲线 6 、日峰谷差率 7 、日峰谷差率 l 、周负荷曲线 2 1 1 日负荷特性指标 月最大( 小) 负荷 月平均日负荷 月平均日负荷率 月负荷率 月最小负荷率 月最大峰谷差 月最大峰谷差率 月甲均日峰谷差 月平均日峰谷差率 图2 - 1 负荷指标体系 j 、年最大( 小) 负荷 2 、年平均日负荷 3 、年平均日负荷率 4 、年平均月负荷率 5 、季负荷率 6 、年负荷率 7 、年最小负荷率 8 、年最大峰谷差 9 、年最大峰谷差率 1 0 、年平均日峰谷筹 l l 、年平均日峰谷差率 1 2 、年最大负荷利用小时数 1 3 、年持续负荷曲线 1 4 、年负荷曲线 电力系统中一殷考祭典型日负荷特性,典型日一股选最大负荷日,也司以选 最大峰谷差日,还可根据各地区情况选不同季节的某一代表日。 ( 典型) 日( 发、供、用电) 最大( 小) 负荷:( 典型日) 每日2 4 个整点 负荷中的最大( 小) 值。 日( 发、供、用电) 平均负荷:日平均负荷:旦皇量 日( 发、供、用电) 负荷率:日负荷率( ) = 禚1 0 0 。 日( 发、供、用电) 最小负荷率:日最小负荷率( ) = 燃l 。 ( 典型) 日( 发、供、用电) 负荷曲线:典型日按时间顺序以小时整点( 发、 供、用电) 负荷表示的负荷曲线。 ( 发、供电) 日峰谷差:日( 发、供电) 最大负荷与日( 发、供电) 最小 负荷之差。 ( 发、供电) 日峰谷差率:日峰谷差率( ) = 淼1 。 _二厶又钆又酞九文a之 第二章城市用电负荷相关因素分析 2 1 2 周负荷特性指标 周( 发、供、用电) 负荷曲线:每周按时间顺序以逐日( 发、供、用电) 最 大负荷表示的负荷曲线。 2 1 3 月负荷特性指标 ( 发、供、用电) 月最大( 小) 负荷:每月( 发、供、用电) 最大( 小) 负荷日的最大( 小) 负荷。 ( 发、供、用电) 月平均日负荷:每月( 发、供、用电) 日平均负荷的平 均值。 ( 发、供、用电) 月平均日负荷率:每月( 发、供、用电) 日负荷率的平 均值。 ( 发、供、用电) 月负荷率:月负荷率( ) = 号器1 品。 ( 发、供、用电) 月最小负荷率:每月( 发、供、用电) 日最小负荷率的 最小值。 ( 发、供电) 月最大峰谷差:每月( 发、供电) 日峰谷差的最大值。 ( 发、供电) 月最大峰谷差率:每月( 发、供电) 日峰谷差率的最大值。 ( 发、供电) 月平均日峰谷差:每月( 发、供电) 日峰谷差的平均值。 ( 发、供电) 月平均日峰谷差率:每月( 发、供电) 日峰谷差率的平均值。 2 1 。4 年( 季) 负荷特性指标 ( 发、供、用电) 年最大( 小) 负荷:全年各月( 发、供、用电) 最大( 小) 负荷的最大( 小) 值。 ( 发、供、用电) 年平均日负荷:全年( 发、供、用电) 月平均日负荷的 平均值。 ( 发、供、用电) 年平均日负荷率:全年( 发、供、用电) 月平均日负荷 率的平均值。 ( 发、供电) 年平均月负荷率:全年各月( 发、供电) 平均负荷之和与各 月( 发、供电) 最大负荷日平均负荷之和的比值。 ( 发、供电) 季负荷率:全年各月( 发、供电) 最大负荷日的最大负荷之 和的平均值与年最大负荷的比值。 ( 发、供、用电) 年负荷率:全年( 发、供、用电) 平均小时电量与年最 大负荷的比值。 第二章城市用电负荷相关因素分析 ( 发、供、用电) 年最小负荷率:全年( 发、供、用电) 日最小负荷率的 最小值。 ( 发、供电) 年最大峰谷差:全年( 发、供电) 日峰谷差的最大值。 ( 发、供电) 年最大峰谷差率:全年( 发、供电) 日峰谷差率的最大值。 ( 发、供电) 年平均日峰谷差:全年( 发、供电) 日峰谷差的平均值。 ( 发、供电) 年平均日峰谷差率:全年( 发、供电) 日峰谷差率的平均值。 ( 发、供、用电) 年最大负荷利用小时数:( 发、供、用电) 年用电量与 ( 发、供、用电) 年最大负荷的比值。 0 ( 发、供电) 年持续负荷曲线:按全年系统( 发、供电) 负荷的数值大小 及其持续小时数顺序绘制的曲线。 ( 发、供电) 年负荷曲线:按全年中逐月( 发、供电) 最大负荷绘制的曲 线。 根据我国实际情况,在进行负荷特性研究或城市电网规划时,可优先考虑采 用以下1 2 个指标。随着时间的推移和数据采集手段的提高,再逐步扩充到其它 指标。 年最大( 小) 负荷; 年平均日负荷; 年最大峰谷差; 年平均日峰谷差; 年平均日负荷率; 年最小负荷率; 年最大峰谷差率; 年平均日峰谷差率; 年最大负荷利用小时数: 冬、夏季典型日负荷曲线; 年负荷曲线; 年持续负荷曲线。 2 2 城市用电负荷影响因素分析 电力负荷既受负荷本身的历史表现决定,还受众多非负荷因素的影响。这些 因素与负荷之间形成了复杂的非线性映射关系,负荷变化模式也因此越来越复 杂,为了获得准确的结果,在进行负荷特性分析及其变化规律的预测时应综合考 虑各种因素对负荷的影响。 第二章城市用电负荷相关因素分析 一般说来,负荷特性的变化规律取决于用电地区的地理位置、经济环境、当 地气候条件和人民生活习惯等。表2 1 给出了日、月、年( 季) 负荷特性的主要 影响因素。 表2 1 不同负荷特性的主要影响因素【6 】 注:表中“电量”包括各种口径的数值,例如发电量、全社会用电量、网供电量等;“负荷” 即包括最大最d , 平均负荷以及峰谷差,也包括发电负荷、全社会用电负荷、网供负荷等各 种i = 1 径的数值。 从表2 一l 可以看出,经济环境、气象因素和时间因素是电力负荷的主要影响 因素。 2 2 1 经济环境对负荷特性的影响 电力网络运行地点的经济环境对电力负荷需求模式有显著影响。比如,供电 区域人口、收入和生活水平以及消费观念、工业生产水平、电气设备数量变化及 饱和水平和特性、政策发展趋势变化、经济发展水平和经济结构以及更为重要的 经济趋势对电网负荷增长下降造成的影响。另外,电力网络本身管理政策,如 负荷侧管理以及电价政策等因素也会对负荷变化发生影响。负荷侧管理会改变负 荷曲线形状,例如:削峰、填谷等。而电价政策对负荷的影响还涉及很多复杂因 素,如:全社会物价指数、各类用户对电价的承受能力等。 这些经济因素对负荷影响的时间是比较长,一般至少长于一周时间。在进行 年( 季度) 负荷特性发展趋势的分析预测时,根据这些因素对负荷预测值进行相 应的修正,是十分重要的。 第二章城市用电负荷相关因素分析 2 2 2 气象因素对负荷特性的影响 由于许多电网有大量的气候敏感负荷,如电热器、空调及农业灌溉等存在, 气候条件对负荷模式变化有显著影响。 对于许多电网而言,根据其对负荷影响,温度是最重要的气候变量,对于任 一给定日,温度对正常值的偏差,将引起负荷的显著变化。此外,过去温度对负 荷特性也有影响,比如持续高温将引起整个电网负荷持续上升,可能会产生一个 新的系统负荷高峰。对于地理分布较广而气候分布又不均匀的电网,一般在系统 负荷变化中,应考虑多个温度变量。湿度是另外一个可以影响电网负荷的因素, 特别是在高温或湿度大区域,其形式同温度相似。同样,雷暴雨由于因为温度变 化,也对负荷有显著影响。其它对负荷行为有影响的因素有:风速、降雨量、云 遮或日照强度。 2 2 3 时间因素对负荷特性的影晌 对负荷有重要影响的时间因素主要有3 种: 1 ) 季节变化 一般随着温度及日照小时数等的季节变化,负荷模式逐渐发生变化。季节事 件会导致负荷需求模式显著及结构性的变化。电网的高峰负荷是在夏季还是在冬 季,主要取决于季节影响。常见的季节事件有:日照时间的变化、季节需求比率 结构的变化、学校学年开始、假期生产大幅度减少( 如新年期间) 等。 、2 ) 周循环 负荷周循环是供电区域人口工作休息模式作用的结果,最明显的特征就是 双休日负荷水平明显低于工作日。对于不同的典型季节周,其相应典型负荷模式 也是不同的。 3 ) 法定及传统节日 法定及传统节日的影响,体现在这些日负荷水平比正常日降低,以及假日前 或后的一些天,由于趋向于个长“周末”,电力需求模式也发生明显变化。 2 3 本章小结 本章对负荷特性的指标体系进行了说明,较详细的叙述了负荷特性的影响因 素如经济环境、气候因素以及时间因素等。 本章涉及的内容是本文的理论依据。负荷特性的指标体系以及电力负荷主要 影响因素的相关知识将指导我们进行数据库结构的设计,在进行电力负荷及其相 第二章城市用电负荷相关因素分析 关因素间关联规则的挖掘时引导我们确定合理的挖掘对象。 第三章基于关联规则的城市负荷特性分析 第三章基于关联规则的城市负荷特性分析 3 1 关联规则理论基础 3 1 1 关联规则基本概念 在关联规则系统中,规则本身是“如果条件怎么样,那么结果或情况就如何” 的简单形式,可以表示为“ajb 一关联规则,它包括两个部分:左边的部分a 称为前件,右边的部分称为后件。前件可以包括一个或多个条件,在某个给定的 可信度限制情况下,要使后件为真,前件中所有条件必须同时为真。后件一般只 包含一种情况。 对于规则“a b ,一般用支持度、可信度、期望可信度和作用度四个参 数来描述一个关联规则的属性。下面将进行详细介绍。 设i = 1 1 ,1 2 一i m 是一组属性的全集,d 是数据库。d 中的每条记录t 是一 组属性,t i 。关联规则是如下形式的一种蕴含: a jb ,其中a 、b 是两组属性,a i ,b i ,且an b = o 。 1 ) 支持度 支持度描述了a 和b 这两个属性集的并集c 在所有的事务中出现的概率有 多大。 支持度( aj b ) = 鱼鱼笔耋铲 ( 3 一1 ) 例如:某天共有1 0 0 0 个顾客到某超市购买商品,其中有1 0 0 个顾客同时买 了面包与黄油,那么关联规则“面包黄油 的支持度为1 0 ( 1 0 0 1 0 0 0 ) 。 支持度是对关联规则重要性的衡量,支持度说明了这条规则在所有记录中有 多大的代表性,显然支持度越大,该关联规则所代表的情况出现的越频繁。 2 ) 可信度 可信度就是指在出现了属性集a 的事务t 中,属性集b 也同时出现的概率 有多大。 可信度b ,_ 号妄等慧器 c 3 2 ) 如上所述的面包与黄油的例子,该参数就回答了这样一个问题,如果一个用 户买了面包则他同时可能买黄油的可能性有多大。若有7 5 的用户在买了面包的 同时买了黄油,关联规则“面包黄油的可信度即为
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五版境外投资协议书
- 机电工程施工总承包资质标准二零二五年
- 物业委托管理协议
- 2025年日用织物制品项目建议书
- 供电外包劳务合同样本
- 青岛版小学二年级上册数学教学计划
- 平面的投影-教案
- 企业门头制作合同样本
- 中图版地理必修二第二章学教案
- 淘宝客服聘用合同
- 吉林省吉林市2024-2025学年高三下学期3月三模试题 英语 含答案
- 工程竣工决算编审方案的编制与审核指导
- 国开2025年《会计政策判断与选择》形考任务1-9答案
- 2025年智慧农业考试题大题及答案
- Unit3 Weather Part A(教学设计)-2023-2024学年人教PEP版英语四年级下册
- 计调业务2.2组团计调发团业务流程
- 《淋巴管瘤诊疗》课件
- 2025山东省安全员B证考试题库附答案
- 广告印刷投标方案(技术方案)
- 红色体育知到智慧树章节测试课后答案2024年秋西安体育学院
- Excel财务会计应用(沈国兴第3版) 第1-36次课 认识EXCEL-期末考试
评论
0/150
提交评论