




已阅读5页,还剩60页未读, 继续免费阅读
(计算机应用技术专业论文)电力系统暂态稳定评估中的数据挖掘技术研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
哈尔滨t 程大学硕十学 ! :) = 论文 摘要 电力系统规模逐渐增大,数据量提升,而当前的计算技术缺乏关于数据 整体特征的描述,无法根据现有的数据准确充分做出决策。将计算机领域的 数据挖掘技术应用于电力系统的暂态稳定评估领域,研究大数据量处理前提 下的电力系统计算方法,对于提高电力系统计算水平将有巨大帮助。 电力系统暂态稳定评估存在两个主要问题:一是参与分析评估的训练集 不足以覆盖整个样本空间,所选特征变量不能全面、正确地描述电力系统的 运行状态,导致分类结果不可靠;二是数据分析和处理能力有限,算法的收 敛性随系统规模的增大而下降。 引入数据挖掘理论中的关联规则分析,给出一种进行暂态稳定评估的分 类方法一关联分类法。这种方法不依赖于任何数学解析方法,完全从运行数 据出发,可避免大多数模式识别方法中存在的模型参数设置困难问题,还可 以对字符型数据进行分析。关联分类法是一种基于模式识别理论的方法,针 对这类方法在暂态稳定评估中存在的结果不可靠问题和电力系统运行的时交 性特点,本文提出了相应的改进方法,基于电力系统数据量庞大的特点进行 数据预处理,然后提取特征值进行数据模型的建立。一是对关联分类法中存 在无法正确分类的样本,先利用暂态稳定指标将它们辨识出来,接着根据每 个样本临界稳定程度的不同,分别采用t a y l o r 级数法和时域仿真法进行状态 确定,以保证最终全部结果的准确无误;二是针对电力系统运行的时变性特 点,将时间维度引入暂态稳定评估,给出建立在时间序列分析之上的关联分 类分析的改进算法,从而挖掘出电力系统的运行方式改变与暂态稳定程度改 变之间的内在联系,用以指导电力系统的运行与管理。 关键词:数据挖掘;暂态稳定评估:数学模型;数据预处理;关联规则 哈尔滨r t 程大学硕士学位论文 a b s t r a c t a st ot h em e t h o do ft h es e c u r i t ya n d s t a b i l i t yo fp o w e rs y s t e m s ,t h e e x p e d e n c e da n dq u a l i f i e dp o w e re n g i n e e r sa r en e c e s s a r y , a n dt h e yh a v et of i n d t h ew e a k n e s so fp o w e rs y s t e m st h r o u g ht r e m e n d o u sc a l c u l a t i o na n dd e c i d et h e d e f e n s i v es t r a t e g ya c c o r d i n g l y h o w e v e r , t h ep o w e rs y s t e m sb e c o m el a r g e ra n d l a r g e r ,t h eq u a n t i t yo ft h ed a t ac a p t u r e db ym o n i t o r i n gi n s t r u m e n t a t i o nh a sb e e n i n c r e a s i n gs i g n i f i c a n t l y , a n dt h et r a d i t i o n a lm e t h o do b v i o u s l yc a nn o t m a t c ht h e g r e a td a t ac a p a c i t ya n ym o r e b a s e do ns u c ht r e m e n d o u sr a wd a t a , h o wt oe x t r a c t u s e f u li n f o r m a t i o nf r o mt h e mb yt r a n s i e n t s t a b i l i t ya s s e s s m e n t ( t s a ) h a s b e c o m eac r i t i c a li s s u e ,8 0 懿t od e t e r m i n et h ec u r r e n to p e r a t i o n a ls t a t ea n dp r e d i c t s o m eo p e r a t i o n a lt r e n df o ro p e r a t o r s e f f e c t i v e l y i nt h i sp a p e r , d a t am i n i n g t e c h n i q u ei si n t r o d u c e df o rt s at os t u d yt h er e l a t i o n s h i pb e t w e e nt h eo p e r a t i o n s c h e d u l ea n dt r a n s i e n ts t a b i l i t yw h e ng r e a tq u a n t i t yd a t ai n v o l v e d t ot h eg r e a to p e r a t i o n a ld a t ao fp o w e rs y s t e m s ,an o v e la p p r o a c ht oa s s e s s t h et r a n s i e n ts t a b i l i t yo fp o w e r s y s t e m ,i e a s s o c i a t i v ec l a s s i f i c a t i o nm e t h o d ( a c m ) i sg i v e n s o m ea s s o c i a t i v er u l e sr e f l e c t i n gt h er e l a t i o n s h i pb e t w e e np o w e rs y s t e m o p e r a t i n gs t a t ea n dt r a n s i e n ts t a b i l i t ya r eg e n e r a t e da n du t i l i z e dt oe s t i m a t et h e t r a n s i e n ts t a b i l i t y t h i sa p p r o a c hi si n d e p e n d e n tf r o mt h em a t h e m a t i cm e t h o d ,s o i tc a na v o i dt h ed i f f i c u l t yo fp a r a m e t e r ss e t t i n g a c mi sb a s e do n 仔e q u e n c y s t a t i s t i co ft h eo p e r a t i n gs a m p l e s ,s os o m ec h a r a c t e rf e a t u r e sd e s c r i b i n go p e r a t i n g s t a t u sc a nb ei n c l u d e d f o rt h er e s u l t s u n c e r t a i n t yo ft h et r a d i t i o n a la c mu s e d i nt r a n s i e n ts t a b i l i t ya n dt h ed y n a m i co f p o w e rs y s t e mo p e r a t i o n ,t h ei m p r o v e m e n t i s g a i n e d i nt h i s p a p e r d u et ol a c k i n gi n f o r m a t i o na b o u tt h ed y n a m i c c h a r a c t e r i s t i c so fap o w e rs y s t e m ,w h i c hi s p r o v i d e db yt h ei n p u tf e a t u r e s , m i s c l a s s i f i c a t i o ni si n e v i t a b l e s oaf u z z ya r e ai sd e f i n e dh e r eb yt h ea f o r e s a i d t r a n s i e n ts t a b i l i t yi n d e xa n ds a m p l e sw i t h i ni ta l ea s s e s s e db yt a y l o rs e r i e sa n d 哈尔滨工程大学硕十学位论文 i i i i i 暑i ;i i 罩;i i i i ;i ;i i i ;i 宣i 眚譬毫i i 宣暑宣暑i ;i i i i 罱 f i m e - d o m a ms i m u l a t i o nr e s p e c t i v e l ya c c o r d i n gt ot h e i rs t a b i l i t yd e g r e e a d d i t i v e l y , t i m ed i m e n s i o ni si n t r o d u e e di n t ot s a s o m er u l e sr e f l e c t i n gt h ee f f e c t st h e c h a n g e so fi n f l u e n c ef i c t o mm a k i n go nt h es t a t e sc h a n g i n go f ap o w e r s y s t e mc a l l b eo b t a i n e d k e y w o r d s :d a t am i n i n g ;t r a n s i e n ts t a b i l i t ya s s e s s m e m ;m a t h e m a t i cm o d e l ;d a t a p r e p r o e e s s i n g ;a s s o c i a t i v ec l a s s i f i c a t i o n 哈尔滨工程大学 学位论文原创性声明 本人郑重声明:本论文的所有工作,是在导师的指导 下,由作者本人独立完成的。有关观点、方法、数据和文 献的引用已在文中指出,并与参考文献相对应。除文中已 注明引用的内容外,本论文不包含任何其他个人或集体已 经公开发表的作品成果。对本文的研究做出重要贡献的个 人和集体,均已在文中以明确方式标明。本人完全意识到 本声明的法律结果由本人承担。 作者( 签字) : 1 乖侈及 日期:内叼多年否月日 哈尔滨1 :程大学硕士学住论文 1 1 选题的目的和意义 第1 章绪论 随着计算机及其网络技术的迅猛发展,人类正在步入信息社会。电力行 业是应用信息技术较早的行业之一,信息技术在电力工业的应用始于2 0 世纪 6 0 年代初,迄今已经经过了三个发展阶段:6 0 7 0 年代是第一阶段,从生产 过程自动化起步,信息技术首先应用在发电厂自动监测监制和变电站自动监 测监控方面:第二阶段是8 0 9 0 年代的专项业务应用阶段,电网调度自动化、 电力负荷控制、计算机辅助设计、计算机仿真系统等应用开始深入广泛开展, 某些应用达到了较高的水平,与此同时,管理信息系统刚刚起步,并经历了 较多的失败:9 0 年代至今是第三阶段,信息技术应用进一步发展到综合应用, 由操作层向管理层延伸,实现管理信息化,建立各级企业的管理信息系统, 其他专项应用系统进一步发展到更高的水平。 信息技术在驱动电力工业由传统工业向高度集约化、知识化、技术化工 业转变的过程中,也使人们获取、存储、处理和显示的信息量剧增。在电力 系统中,随着数字化技术的广泛应用( 如数字化的开关设备、继电保护和实 时控制,各类相互独立的监控系统、地理信息系统和管理信息系统及为数众 多、规模庞大而类型不一的数据库) ,发电厂、变电所和调度中心时刻记录 着大量电气元件、电能信息方面的数据;随着电力体制改革的深化和电力市 场的不断完善,各个发电厂要定时向电力公司进行发电量和电能价格的报价, 参与上网竞价,有大量市场信息数据有待分析处理。电力系统中产生了正在 以指数速度增长的数据,展现在运行人员和决策者面前的已不是局限于本部 门、本单位和本行业的庞大数据库,而是浩瀚无垠的信息海洋。现阶段,如 何对数据进行快速、有效地分析、加工、提炼以获取所需系统的有用知识, 发挥数据的作用,进一步把各个信息孤岛汇集成为辅助决策信息系统,更好 地保证电力系统的安全、稳定、优质、经济的运行,已成为电力行业面临的 关键问题之一。 电力系统规模逐渐增大,数据量提升,而当前的计算技术缺乏关于数据 哈尔滨工程大学硕士学位论文 整体特征的描述,无法根据现有的数据准确充分做出决策1 2 1 。电力系统计算 亟需科学的理论和实践经验相结合的技术支持。本文的目的就是将计算机领 域的数据挖掘技术引入电力系统的暂态稳定评估领域,研究大数据量处理前 提下运行方式的制定及其与暂态稳定性之间的关系,提高电力系统计算水平。 1 2 国内外研究现状 1 2 1 数据挖掘的研究现状 人类现在生活在一个信息化时代,每天都有大量的信息产生,并通过各 种通信手段传送到世界的各个角落。与数据急剧增长现象形成鲜明对比的是, 目前对数据进行分析处理的工具很少。传统数据库系统所能做的只是对数据 库中的数据进行存取、查询、统计等简单的操作,人们通过这种处理所获得 的信息量仅仅是整个数据库所包含的信息量的一部分,缺乏关于数据整体特 征的描述及对其发展趋势预测方面的信息,缺乏对决策生成具有重要参考价 值的信息,导致了“数据爆炸但知识贫乏 的现象。近年来相关研究领域的 发展为上述问题的解决提供了可能:出现了超大规模数据库,可以收集海量 数据;研制出了具有每秒万亿次运算处理能力的超级计算机和并行处理计算 机,计算机技术在不断完善;出现了大数据量的快速访问技术;人工智能领 域较成熟的算法已被用于实际的应用系统及智能计算机的设计和实现中,并 取得了很好的结果。在这种背景下,数据挖掘( d m ,d a t a m i n i n g ) 技术应运 而生【3 1 。 数据挖掘的概念产生于2 0 世纪8 0 年代末,在9 0 年代获得了长足的发展, 今后仍将是研究的热点领域。 数据库系统可以高效地实现数据的录入、修改、统计、查询等功能,但 是无法发现数据中存在的关系和规则,无法根据现有的数据预测未来的发展 趋势,缺乏挖掘隐藏在数据中的知识的有效手段,导致了“数据爆炸但知识 贫乏 的现象。入们需要有新的、更有效的手段对各种大量数据进行挖掘以 发挥其潜能【4 】。数据挖掘正是在这样的应用需求环境下产生并迅速发展起来 的,它的出现为自动和智能地把海量的数据转化为有用的信息和知识提供了 手段。 2 哈尔滨丁程大学硕士学位论文 数据挖掘通常被视为以提取有用信息为目的的“数据簇聚 或“数据产 生 的过程,数据为信息处理者提取叛的和有用的规则服务,并能够根据已 有的信息对实际未发生行为的结果作出预测。数据挖掘是从大量数据中挖掘 出隐含的、先前未知的、对决策有潜在价值的知识和规则,提取的知识表示 为概念( c o n c e p t s ) 、规则( r u l e s ) 、规律( r e g u l a r i t i e s ) 、模式( p a t t e r n s ) 等形式。这些知识蕴含了数据库中一组对象之间的特定联系,揭示出有价值 的知识、规则或高层次的信息。数据挖掘的对象可以是数据库,也可以是文 件系统,或其他任何组织在一起的数据集合【5 1 。 与传统信息处理方法相比,数据挖掘技术有其自身的特点: ( 1 ) 处理对象为大规模数据库,数据规模十分巨大; ( 2 ) 信息查询一般是由决策制定者( 用户) 提出的即时随机查询,往往 没有精确的查询要求,需要靠数据挖掘技术寻找其可能感兴趣的信息; ( 3 ) 在一些应用中,某些行为并没有实际发生或很少发生,因而它们对 输出所造成的影响未能在数据库中体现出来,需要利用数据挖掘技术从数据 库中提取有用的规则,对这些行为提出预测; ( 4 ) 在一些应用中,由于数据变化迅速,因此要求数据挖掘技术能快速 对数据变化作出反应、更新规则以提供决策支持: ( 5 ) 数据挖掘中规则的发现主要基于大样本的统计规律,发现的规则不 必适用于所有的数据。 数据挖掘系统可以大致分为三层结构,如图1 1 所示。 l 特征提取与判别卜 i 关联度分析 卜 数据仓库 用 数 一分类与预测卜 产 据 界 数据库 。库 面 接 h 聚类分析 7 卜 结 口 果 i 其他数据源卜- - q 离群点分析卜 _ 叫进化分析卜 图1 1 数据挖掘系统体系结构 3 哈尔滨工程大学硕士学位论文 右侧是用户界面,将获取的信息以便于用户理解和观察的方式反映给用 户。左侧是数据源,包括数据库、数据仓库等。数据挖掘不一定要建立在数 据仓库的基础上,但如果数据挖掘与数据仓库协同工作,则将大大提高数据 挖掘的效率; 中间层是数据挖掘器,利用数据挖掘方法分析数据库中的数据,包括特 征提取与比较、关联度分析、分类与预测、聚类分析、离群点分析、进化分 析等: 还有一个与数据挖掘意义相近的名词,即数据库中的知识发现( k d d , k n o w l e d g ed i s c o v e r yo f d a t a b a s e ) 1 6 j ,它们之间既有联系又有区别: 知识发现强调知识是数据发现的最终产品,利用相应的数据挖掘算法, 按指定方式和阂值提取有价值的知识,包括数据挖掘前对数据的预处理、抽 样及转换和数据挖掘后对知识的评价解释过程。知识发现的整个过程包括在 指定的数据库中用数据挖掘算法提取模型,以及围绕数据挖掘进行的预处理 和结果表达等一系列计算步骤。 数据挖掘涉及的学科领域和方法很多,有多种分类法。 按数据挖掘的对象分,有关系数据库、面向对象数据库、空间数据库、时态 数据库、文本数据源、多媒体数据库、异质数据库、遗产数据库以及w w e b 等。 按采用的方法分,可粗分为:机器学习方法、统计方法、神经网络方法和 数据库方法。机器学习中,可细分为:归纳学习方法( 决策树、规则归纳等) 、 基于范例学习、遗传算法等。统计方法中,可细分为:回归分析( 多元回归、 自回归等) 、判别分析( 贝叶斯判别、费歇尔判别、非参数判别等) 、聚类 分析( 系统聚类、动态聚类等) 、探索性分析( 主元分析法、相关分析法等) 等。神经网络方法中,可细分为:前向神经网络( b p 算法等) 、自组织神经 网络( 自组织特征映射、竞争学习等) 等。数据库方法主要是多维数据分析 或o l a p 方法,另外还有面向属性的归纳方法。 按数据挖掘任务分,可分为两大类:描述( d e s c r i p t i v e ) 和预测印( r e d i e t i v e ) j 。描述任务以简练的、概括的方式描述数据集,表现出人们对数据的感兴 趣的一般特性;预测任务则对当前现有数据进行分析与推理,构造一个模型 4 哈尔滨工程大学硕+ 学位论文 或模型集,以对新的数据集的行为进行预测。这两大任务贯穿于以下六大类 知识模式的发现( d i s c o v e r y ) 中:特征提取与判别 ( e h a r a e t e r i z a t i o n a n d d i s e f i m i n a t i o n ) 、关联度分析( a s s o e i a t i o n a n a l y s i s ) 、分类与 预测( e l a s s i f i e a t i o n a n d p r e d i c t i o n ) 、聚类分析( e l u s t e r a n a l y s i s ) 、离群点分析 ( o u t l i e r a n a l y s i s ) 、进化分析( e v o l u t i o na n a l y s i s ) 。 数据挖掘的一些问题及需要做的工作: l 、发展数据挖掘的一般理论; 2 、发现语句的逻辑表达形式与发现任务的解释之间的关系; 3 、组合模式匹配( e p m ,e o m b i n a t o r i a l p a t t e m m a t c h i n g ) 规律是否正确; 4 、数据挖掘系统的结构、数据库管理系统与搜索模块的联接; 5 、发展k d d 查询语言及查询优化技术; 6 、扩展用连续值属性的关联规则发现框架; 7 、临时数据库在数据挖掘中的作用: 8 、对发现知识的评价准则及解释。 1 2 2 数据挖掘技术在电力系统中应用的研究现状 电力系统是一个动态非线性的大系统,在运行过程中不断产生和积累大 量的数据。在电力系统中,如果能应用数据挖掘技术,就可以更加充分地利 用运行数据,揭示历史数据背后蕴含的规则、原理,找到更加合理的解决问 题的方法,为决策的制定提供更加有力的科学依据。当前,已经有许多将数 据挖掘技术应用于电力系统的成功案例,主要涉及以下领域: ( 1 ) 电力设备运行状态的监视和故障诊断。电力系统对供电可靠性和经 济性的要求在逐渐提高,各种电力设备的安全运行已成为影响电力系统安全 稳定经济运行的重要因素。随着电力设备维修方式的发展,用于诊断的数据 不再只是少量的单次数据,而是包括离线试验数据和大量连续监测的在线数 据在内的数据仓库( d a t aw a r e h o u s e ) ,这些激增的数据背后隐藏着许多重 要信息,电力工作者希望能够对其进行更高层次的分析,更好地利用这些数 据。文献【8 】通过分析由监测系统提供的在线数据,研究了数据预处理方法, 对预处理后的数据通过时序建模提取征兆,并以电容型设备为例提出了相应 5 哈尔滨t 程大学硕十学何论文 的诊断策略。对输变电系统中的大型油浸电力变压器,提出了基于节约覆盖 集理论和模糊数学的诊断推理策略,对变压器的离线电气试验数据和油色谱 数据进行研究,在统计数据的基础上,建立了变压器故障诊断模型。文献【9 在发电厂中建立一个针对2 个发电机组的运行信息系统,通过关系数据库与 神经网络等技术,发现某些不正常的数据分布,暴露运行中的异常变化,协 助检修人员迅速找出问题发生的范围,及时采取对策。文献【3 4 】针对配电网 故障定位所依据的故障模式存在不确定性信息的情况,提出基于粗糙集理论 和遗传算法相结合的数据挖掘方法,处理实时输入信息的畸变,实现配电网 的故障定位。文献【l o 】将粗糙集理论用于配电网故障定位诊断模型的研究, 提出和构造了4 类不同的r s 和神经网络组合的故障诊断模型。类似的应用 在文献【1 1 】中也有体现。 ( 2 ) 负荷预测和电力用户的特征提取。在电力市场激烈的竞争机制下, 只有分析得到用户的特点,进而将市场分成有意义的群组,并实现短期市场 需求预测和长期电价预测,才能协助市场经理和业务执行人员制定出有益的 决策,设计新的市场运作。电力用户的多样性和负荷变化的随机性使得常规 算法很难实现上述目标。文献 1 2 】利用自适应决策树对5 0 0 个用户7 个月每 0 5 小时的用电记录及其相关属性进行聚类分析,划分出了用户群组行为模式 和相应的负荷需求情况,制定出合适的电费表,并得到了电力用户和某些影 向因素的关联关系。文献 1 3 】介绍了武汉供电局在配电故障统计分析系统中 利用数据挖掘方法,提高了供电可靠性经济效益。其中应用关联分析确定开 哭设备故障同温度、雨量、雷暴、负荷的关系,应用序列模式分析发现并预 测开关设备的故障率分布,应用分类和聚类分析为各种设备划分适当的故障 类型。文献 1 4 ,1 5 :j l 入负荷的地理空间属性,对长期积累的负荷数据进行聚 类分析,利用t a k a g i - s u g e n o 模糊模型分析得到某一区域( x ,y ) 的共c 类用 户的负荷变化情况。文献 1 6 乖l j 用回归树( r e g r e s s i o nt r e e ) 模型对负荷数据 进行定量分析,利用m u l t i l a y e rp e r c e p t r o n 人工神经元模型进行短期负荷预 测。为了提高负荷预测的效率,文献 1 7 】还引入了f u z z yc m e a n s 法,粗糙集 击和t a b u 搜索法卜刘州也有应用。使用这些方法,可以实现对客户模式和用电 ;焉求的快速划分,根据得到的规则预测出客户的用电模式,改进发电管理, 6 哈尔滨j 稗大学硕士学位论文 防止电价冲击对电力系统安全性造成的冲击,增强发电企业的竞争力。 ( 3 ) 电力系统调度运行的控制和决策支持。在常规电力系统运行模式下, 一旦电力系统发生故障,为了减少损失,需要调度员在极短时间内,从自动 传递到调度中心的各保护装- 置的动作信息中判断出故障原因和故障发生的具 体位置,并据此实施具体的故障隔离和恢复处理。一般地,调度员是根据在 长期运行过程中积累的经验做出应对策略的,但在信息流量庞大的今天,任 何人面对2 0 0 0 个分钟数据流组成的数据表都不可能进行有效处理。文献 1 8 】 利用粗糙集方法具有的强定性分析能力,对给定问题的数据,通过属性约简, 以属性间的不可分辨关系和不可分辨类估计各属性的重要程度,从信息表中 去除冗余属性,获取反映问题内在规律的分类规则。文献 1 9 从热电厂的运 行数据入手,将数据挖掘技术分别用于动态过程状态的监测控制和控制参数 设定值的最优调度问题。在控制系统的离线部分,对历史数据库中的运行和 测试数据进行预处理,利用回归分析和神经网络等方法得到覆盖对象运行区 域的若干运行模式,对应每一模式分别建立不同的动态模型,通过模式识别 和统计分析形成由过程参数到最佳模型集的推理规则,并将其用于在线数据 的分析,提高在线运行效率。文献【2 0 】通过关联规则算法对电力调度中心的 数据进行线损的相关性挖掘,并在安徽省电力调度通信中心投入运行。 ( 4 ) 电网的安全稳定分析。在电力市场前提下,不能用单个指标来全面 衡量系统的安全稳定性,应采取不同于传统时域仿真的方法,以兼顾经济、 环保等因素的影响。文献 2 1 2 3 论述了将数据挖掘中的决策树方法用于暂态 稳定分析,根据积累的电网运行数据和失稳记录来判断系统的运行状态;进 一步,利用提取出来的安全稳定评估知识,在系统正常运行时,给出系统可 能存在的隐患,以引起特别注意;还利用可视化技术,图形化地为诊断和校 核电网稳定性建立决策规则。 ( 5 ) 在电力市场中的应用。文献 2 4 】针对当前市场营销中决策分析功能 欠缺、深度不够的状况,根据数据挖掘的思想,研究了用电结构变化对全行 业售电量和售电均价的影响的评价方法,提出了各类用户对全行业的电价影 响因子、用电结构影响因子的概念,制定了售电价格结构分析的规范化计算 表格,并以实际数据分析了计算结果的合理性,指出其对市场营销的指导意 7 哈尔滨j t = 程大学硕十学何论文 义。文献 2 5 】论述了利用数据挖掘技术,对电力市场的报价一采购体系中各 种影响开停机计划的因素的分析,用回归、神经网络以及归纳算法等得出各 机组的开停机计划表。文献 2 6 】提出利用信息熵构造判定树的数据挖掘算法 对历史竞标样本进行分类的新思路。通过一个考虑市场需求水平、机组报价 水平、机组容量等多种因素的算例,得到机组的负荷率与这些因素一些潜在 的规则性知识,得到不同特征机组在市场中的竞标能力。这些知识对支持发 电商决策和电力中介机构安排最优交易计划等方面有重要参考价值。 1 3 数据挖掘在暂态稳定评估中的应用 长期以来,人们一直希望找到一种快速有效的暂态稳定评估方法,但速 度和精度却是难以兼顾的一对矛盾,常常会顾此失彼。与此同时,随着s c a d a 系统的普及,电力系统中产生了大量反映运行情况的动态行为信息。如何利 用好这些信息,从中找出系统运行的变化规律,以指导新的运行状态下电力 系统的动态行为,进行快速判断和预测,是决策者必然要面对的一个问题。 基于模式识别的暂态稳定评估中使用的输入特征各种各样,没有统一的 定义。一般地,按照特征提取的时刻可分为两类:静态特征和动态特征。静 态特征是故障发生前系统的各种测量量及其组合指标,如发电机的有无功功 率、母线电压等。动态特征是故障持续期间和故障后的测量量及其组合指标, 如发电机转子角度变化、加速度或最大转子动能等。如果只使用静态特征, 则t s a 只能用于一个固定的故障情况( 单一故障地点和类型) 。由于动态故 障可以提供故障对系统造成冲击的更充足和准确的信息,所以多数研究将二 者结合使用。但我们也应看到,在线求取动态特征量很费时间,难以满足现 场实时性的要求。 t s a 问题是一个分类问题,它的应用目标( 或称类别标示) 可分为四类, 即c c t 估计2 咖1 、能量裕度估计3 1 3 2 1 、发电机最大摇摆角预测3 3 1 3 4 1 和稳定分 类p “0 0 1 。无论使用何种指标,t s a 的最终目的都是对电力系统的运行状态进 行分类。 分类器设计中比较有代表性的算法有人工神经网络( a r t i f i c i a ln e u r a l n e t w o r k ,a n n ) 、模糊推理以及决策树技术等。 8 哈尔滨j :程入学硕士学位论文 人工神经网络是使用频率较多的一种算法。文献【3 7 】在已有方法的基础 上,提出了一种以人工智能为主体的层次型大系统在线暂态稳定评估方案。 利用规则推理和a n n 实现了对大系统故障后暂态稳定等级和c c t 的快速评 估,讨论了基于样本的输入特征向量筛选方法。文献 3 8 1 结合人工神经网络 和短时数字仿真提出一个用于在线暂态安全评估的事故筛选方法,将三层b p 网络作为模式分类器,建立稳定评估结果和所选特征量之间的映射关系。在 故障切除时刻终止的短时数字仿真被用来生成a n n 的输入量,每个a n n 处 理一个特定的事故状态。使用半监督学习算法,产生一个能够指示相对稳定 度的连续分布的暂态稳定指标。基于这个连续分布的稳定指标,设置一个相 对保守的分类门槛值,避免了不安全状态的漏报。文献 3 9 】又有发展,提出 一种数据结构分析方法,用来观察输入空间的可分性及边界区。在此基础上, 提出一种新的分类方法,即将边界区样本设定成不确定类,以避免误分类的 发生。文献 4 0 】 4 1 】利用神经网络训练动态元件的输入输出关系,同时利用遗 传算法优化神经网络的结构,加快训练速度。 模糊集理论适合于解决不确定性问题,可以利用模糊分类的思想,定义 系统不同暂态稳定程度的指标,作为神经网络的输出。文献 4 2 】结合模糊理 论,把神经网络的隐层激活函数定义为隶属度函数,构造了一种模糊神经网 络来实时预测系统的暂态稳定性。文献【4 3 】将模糊子集理论和高阶t a y l o r 级 数相结合,定义了7 种反映事故严重程度的性能指标,作为模糊隶属函数的 组合特征输入量,通过多元多变量的模糊隶属函数,产生一个能够指示相对 稳定裕度的连续分布的暂态稳定指标,对预想事故进行快速暂态稳定识别。 决策树是一种多阶段决策方法,通过对树的不断分叉,提取模式的特征, 能较好地解决某些分类问题。利用统计方法构造出的决策树进行暂态稳定评 价,可以以较高的正确率把输入样本分为稳定与不稳定两类。文献 4 4 】利用 混合决策树一人工神经网络方法进行电力系统动态安全评价,拟合动态安全域 与稳态输入量的函数关系。 支持向量机( s u p p o r tv e c t o rm a c h i n e ,s v m ) 是2 0 世纪9 0 年代提出的一 种建立在统计学习理论基础上的新型机器学习方法,遵循结构风险最小化原 则。其主要思想是机器学习要与有限的训练样本相适应,针对两分类问题, 在高维空间中寻找一个超平面作为两类的分割,以保证最小的分类错误率。 9 哈尔滨t 程人学硕士学位论文 s v m 能较好地解决小样本、非线性、高维数和局部极小点等实际问题,是 9 0 年代末发展最快的研究方向之一1 。文献 4 6 】通过构造支持向量机,找到 了划分系统是否暂态稳定的最优分界超平面和临界样本,利用装袋和近似推 理,快速精确地判断了电力系统的稳定程度。文献 4 7 ,4 8 d 8 也有类似的应用。 基于模式识别技术的暂态稳定评估不需要建立复杂的数学模型,评估速 度快,完全可以满足大系统在线计算的需求。各种暂态稳定分类器最终评估 结果的质量常用估计误差或误分类率来评价。 分类结果的质量除与所采用的分类方法的性能有关之外,更多的取决于 输入空间的可分性。由于t s a 问题的复杂性和输入特征表达能力的局限性, 在其输入空间会存在一些不能被准确辨识的模糊样本,误分类不可避免。这 在很大程度上限制了模式识别技术在实际电力系统暂态稳定评估中的应用。 数据挖掘技术突破了常规数据库的简单检索查询功能,可以对数据进行 微观、中观乃至宏观的统计、综合、分析和推理,指导实际问题的求解,发 现事件间的相互关系,对未来的活动进行预测。随着电力市场的深入发展和 不断完善,面对电力系统中日积月累的海量数据,面对电力系统运行方式安 排在经济性、安全性和可靠性等多方面全方位协调的要求,数据挖掘技术在 电力系统中将日渐发挥不可忽视的作用,因此,加强此方面的研究是今后发 展的必然趋势。 本文提出如下的解决办法:首先将待辨识的样本集根据稳定指标分为可 明确识别区和不可明确识别区( 模糊区) 。对前者,样本数量是大量的,可 以利用模式识别的方法进行快速准确分类;对后者,不可明确识别区中的样 本,样本数量是少量的,是在现有情况下,无论用何种模式识别的方法都无 法正确识别的。整个分析过程在所需信息上表现为从静态到动态的过渡,从 粗略到精确的递进,在分析方法上则充分结合了模式识别法的快速性和时域 仿真法的准确性,可以为决策者提供不同详略程度的稳定信息。解决办法的 具体层次结构如图1 2 所示。 1 4 本文的主要工作 根据数据挖掘理论在计算机领域的发展,结合电力系统计算的特点,将 1 0 数据挖掘理论的思想引入电力系统暂忐稳定分析问题,建立对应的评估体系 主要的研究工作如f : 图i2 数据挖掘技术在电力系统中的席川 ( 1 ) 对数据挖掘的概念与方法进行系统阐述。数据挖掘的六大类任务为 概念描述一特征描述与比较、关联度分析、分类与预测、聚类分析、离群点分 析、进化分析:数据挖掘的分类方法主要是用学习好的模型刈类别标志未知i 的数据元组或数掘对象进行分类,其研究问题与暂态稳定评估有相似性。 ( 2 ) 建立数学模型。将一个电力系统根据最小割的原则划分成若干区域, 从空间数据降维的角度有效避免“维数灾”问题。以区域为单位,提取各区 域节点数据的统计量,作为暂态稳定评估问题的输入特征变量。 ( 3 ) 基于关联分类分析的数据挖掘方法。该方法完全从数据的角度出发, 寻找数据中包含的统计信息,可以有效避免大多数模式识别方法中存在的模 型参数设置困难问题。 哈尔滨t 程大学硕士学位论文 ( 4 ) 算例验证。以具体算例验证在电力系统暂态稳定评估中的数据挖掘 算法的适用性。 1 5 论文的组织结构 本文首先交代了选题的背景和意义,对国内外关于数据挖掘及其在电力 系统暂态稳定评估领域的研究现状做了较为详细的分析,此为第l 章;论文 第2 章中具体阐述了数据挖掘的概念及方法,并且详细讨论了数据挖掘的各 种分类方法,指出其应用于暂态稳定评估具有理论优势的原因。 将数据挖掘技术应用于暂态稳定评估中面临两个主要问题:( 1 ) 没有建 立精确数学模型;( 2 ) 实用化程度低。针对问题( 1 ) ,在第3 章中通过电 网络划分将问题降维,并且选运行数据作为输入特征生成样本空间;针对问 题( 2 ) ,在第4 章中给出了一种切实可行的基于数据及挖掘技术的暂态稳定 评估计算方法,并且进行了算例验证。 最后作为结论,总结了本文所做的主要工作,取得的主要成绩和今后需 要改进的方向。 1 2 哈尔滨- 丁程大学硕士学位论文 第2 章数据挖掘综述及其分类方法 2 1 数据挖掘概述 2 1 1 基本定义 数据挖掘,又称数据库中的知识发现,比较权威的定义是f a y y a d 等人给 出的m :数据库中的知识发现是从数据中识别出有效的、新颖的、潜在有用 的,以及最终可理解的模式的高级过程( k n o w l e d g ed i s c o v e r yi nd a t a b a s e si s t h en o n t r i v i a lp r o c e s so fi d e n t i f y i n gv a l i d ,n o v e l ,p o t e n t i a l l yu s e f u l ,a n du l t i m a t e l y u n d e r s t a n d a b l ep a _ c t e m si nd a t a ) 。通俗地说,数据挖掘就是从大量的、不完全 的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们 事先不知道的、但又是潜在有用的信息和知识的过程。这个定义包括好几层 含义:数据源必须是真实的、大量的、含噪声的:发现的是用户感兴趣的知 识;发现的知识要能被接受、理解和运用;发现的知识支持特定的发现问题。 数据挖掘把人们对数据的应用从低层次的简单查询,提升到了从数据中挖掘 知识,提供决策支持的高度。数据挖掘汇集了多个领域的相关知识,如数据 库技术、统计学、模式识别、人工智能、机器学习,数据可视化、信息检索、 图像与信号处理和空间数据分析等,是一门新兴的交叉学科。 2 1 2 数据挖掘的主要过程 数据挖掘过程可粗略地分为:问题定义( t a s kd e f i n i t i o n ) 、数据准备和 预处理( d a t ap r e p a r a t i o na n dp r e p r o c e s s i n g ) 、数据挖掘( d a t am i n i n g ) ,以 及结果的解释和评估( i n t e r p r e t a t i o na n de v a l u a t i o n ) ,如图2 1 所示。 1 3 坚:堡! 垒垒兰尘! 坠丝圣 刚2i 数据挖掘过群示意矧 ( 1 ) 问题的定义数据挖掘的月的足在大量数捌中发现有用的令人感必 趣的信息,因此发现何种知汉就成为整个过程中第一个也是最重要的个阶 段。在问题定义过程中,数据挖掘人员必须和领域专家以及晟终用户紧密协 作,一方面明确实际工作对数据挖掘的要求,另方而通过对各种学习算法 的对比确定可用的学) j 算法。后续的学习算法选择和数据集准备都是在此基 础上进行的。 ( 2 ) 数据收集和数据预处理数据收集的目的是确定选取任务的操作对 象,即目标数掘( t a r g e td a t a ) ,可根据用户的需要从原始数据库叶 抽取得 到。数据预处理是数掘挖掘过程中的个重要步骤,可以消除数据噪声、推 导计算缺值数据、消除重复| 己录;完成离散型数掘与连续型数掘之州的相一: 转换;从初始特征中找出真f 有用的特征以减少数据挖掘时要考虑的特征或 变量个数,消减数据维数。 ( 3 ) 数据挖掘首先根据对问题的定义明确挖掘的任务或h 的,之后冉 决定使用什么样的算法,如分类、聚类、关联规则发现或序列模式发现等。 选择实现算法有两个考虑囚素:一是不同的数据有不同的特点,因此需要用 与之相关的算法来挖掘;二是用广或实际运行系统的要求,有的用广| 可能希 哈尔滨工程大学硕士学位论文 望获取描述型的、容易理解的知识,而有的用户只是希望获取预测准确度尽 可能高的预测型知识,并不在意获取的知识是否易于理解。 ( 4 ) 结果解释和评估数据挖掘阶段发现出来的模式,经过评估,可能 存在冗余或无关的模式,这时需要将其剔除;也有可能模式不满足用户要求, 这时则需要整个发现过程回退到前续阶段,如重新选取数据、采用新的数据 变换方法、设定新的参数值,甚至换一种算法,整个挖掘过程是一个不断反 馈的过程。另外,数据挖掘可能要对发现的模式进行可视化处理,或把结果 转换为用户易懂的表示方式,如把结果转换为“i f t h e n 规则【5 4 】。 数据挖掘仅仅是整个过程中的一个步骤。数据挖掘质量的好坏有两个影 响要素:一是所采用的数据挖掘技术的有效性,二是用于挖掘的数据的质量 和数量。如果选择了错误的数据或不适当的属性,或对数据进行了不适当的 转换,就会影响挖掘的结果。 2 1 3 数据挖掘的主要方法 数据挖掘从一个新的角度将数据库技术、机器学习、统计学等领域结合 起来,从更深层次中发掘存在于数据内部的有效的、新颖的、具有潜在效用 的乃至最终可理解的模式。研究者最感兴趣的是数据挖掘的六大类任务方法: 1 、概念描述一特征描述与比较 特征描述是对数据的归属类别的一般特征的概括。特征比较是目标类数 据对象的一般特征同相对( c o n t r a s t i n g ) 类的数据对象特征的比较,目标类和相 对类能够被用户所分辨和指定,相关的数据对象能够通过数据查询得到。概 念描述是最简单的一种描述型数据挖掘任务,它不是对于数据的简单的枚举, 而是对于数据特征的提取和比较的描述,当要描述的概念指的是一类对象时, 也称为类别描述。概念描述的主要方法有归纳、概括、特征提取和比较,它 们是完成数据挖掘的两个主要功能模块一多水平特征提取和比较的基础。 2 、关联度分析 关联度分析是指关联规则的发现,这些关联规则能够展示那些在一个给 定数据集中频繁地同时发生的属性值条件。就是从给定的数据集中发现项( 或 哈尔滨工程人学硕士学位论文 称特征变量、属性) 之间的关联关系,得到形如x j y 的关联规则,表示数 据集中满足项x 的记录也满足项y 。关联分析起源于对售货数据
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 吉林省延边朝鲜族自治州汪清县第六中学2025年高三高考模拟冲刺卷(提优卷)(四)化学试题含解析
- 上海市浦东新区上海民办张江集团校2025届初三毕业班教学质量检测试题数学试题含解析
- 江苏省盐城市滨海县蔡桥初级中学2025年高三下学期质量调查(一)物理试题含解析
- 山西省长治二中2024-2025学年全国高三模拟考(二)全国卷英语试题试卷含解析
- 沥青路面施工方案培训
- 湛江市大成中学高二上学期第四次月考物理试题
- 2025水产养殖承包合同范本
- 2025建筑材料购销合同模板下载
- 2025建筑材料采购销售合同模板
- 2025维修承包合同2
- 精装修算量与计价学习总结课件
- 《森林培育学》第一章 人工林概述
- FZTG型防提装置使用说明书
- 包头保利拉菲公馆地产营销策略提案
- 心脏的胚胎发育与先天性心脏病课件
- 钢结构施工组织设计方案
- 煤矿安全生产重点检查表
- YY/T 1421-2016载脂蛋白B测定试剂盒
- YS/T 1161.1-2016拟薄水铝石分析方法第1部分:胶溶指数的测定EDTA容量法
- GB/T 6678-2003化工产品采样总则
- GB/T 5121.1-2008铜及铜合金化学分析方法第1部分:铜含量的测定
评论
0/150
提交评论