智能电表异常测量数据诊断方法综述_第1页
智能电表异常测量数据诊断方法综述_第2页
智能电表异常测量数据诊断方法综述_第3页
智能电表异常测量数据诊断方法综述_第4页
智能电表异常测量数据诊断方法综述_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、智能电表异常测量数据诊断方法综述*裴茂林1,黄洋界1,赵伟2,李世松2(1. 国网江西省电力公司电力科学研究院,南昌 330069;2. 清华大学 电机系,北京 100084)摘 要:智能电表作为用电户与电网的信息链接点,能为电网提供用电户的用电习惯和负荷特征等信息,对指导电网合理安排电力负荷、提高电网运行效率具有重要价值。但实际电网中,智能电表获得的大量测量数据中,不可避免地存在一部分由多种原因导致的异常数据,例如用电户或电网中的突发事件、传感器的暂时故障、数据传输或存储故障,甚至人为的网络攻击,等等。如何从智能电表测量数据中辨别、提取、剔除这些异常数据,是准确获取用户负荷信息的关键。针对这

2、一问题,本文在参考国外国内相关文献基础上,对智能电表测量数据诊断方法进行了梳理、归纳和综述,并对不同方法的数学原理、适用范围等进行了比较和讨论。关键词:数据诊断;大数据;智能电表;负荷预测中图分类号:TM76 文献标识码:B 文章编号:1001-1390(2018)00-0000-00A review on outlier detection techniques for smart meter data analyticPei Maolin1, Huang Yangjie1,,Zhao Wei2, , Li Shisong2(1. 1. Electric Power Research Ins

3、titute of State Grid Jiangxi Electric Power Company Electric Power Research Institute, ,Nanchang 330069,, China. 2. Department of Electrical Engineering, Tsinghua University, Beijing 100084, China)Abstract: As a bridge between the customer and the power grids, the smart meter can supply useful infor

4、mation of electricity consumption habit and load characteristics for load forecasting, it is of great significance to guide power grid to arrange power load reasonably and improve so that the efficiency of the power grids can be improvedoperation. However, in reality, a part of the large set of meas

5、urement data contains misleading outliers, which are caused by many reasons, e.g. an accident in either the user side or the power grid side, failure of the instrument or a sensor, fault during data transmission or storage, internet hack, etc. How to detect, indicate and delete these outliers among

6、the smart meter data is of great importance towards an accurate load forecasting. In this paper, we summarize and review possible approaches in literatures for outlier detection that can be used for smart meter data analytic. The principle, mathematical realization and application of these technique

7、s are discussed. Keywords: Data data diagnosis, big data, smart meter, load forecasting引言过去的十年左右时间,智能电网从一个较为模糊的概念已发展成为世界电力工业发展的核心内容。如今,构建可靠、安全、经济、高效的智能电网,已成为中国乃至世界其他很多国家电网发展的首要目标1-2。以智能电表技术为主的高级量测系统,是负责测量、收集、储存、分析和利用电力用户用电信息的完整的网络和系统,能为智能电网提供基础的数据和信息支持,是构建智能电网的基础性技术支撑3-4。智能电表是用电户与电网的信息链接点5-6:智能电表一方面

8、能为用电户使用电能提*基金项目:国家公司科技项目(52182017001T)供实时、智能信息,提高用电电户耗用电能的经济性;另一方面,可给电网提供用电电户的用电信息及其统计分析结果。电网依据这些数据信息,可以合理安排电力负荷,提高电网运行效率。近年来,大数据技术的快速发展,为智能电表在提高电网运行安全性和电能利用效率方面提供了契机7-8。在大数据技术支持下,对智能电表测量数据的深度挖掘和分析(Smart Meter Data Analytic,SMDA),已成为智能电网发展建设的核心内容之一9-10。电力用户的用电行为以及负荷的特征信息,如今已能够较准确地从智能电表海量测量数据中被提取出来,如

9、此,电网可以更有针对性地进行负荷预测和管理,提高电网的运行效率11。于此同时,因智能电表联网所引起的网络攻击等安全问题,也可由大数据技术对其进行挖掘和加以防范,有助于提高电网运行的安全可靠性12。如上所述,若智能电表测量数据及其包含的信息被大量应用于电网的运行控制与管理,那么,智能电表测量数据本身的可靠性将对电网运行的安全和效率构成直接影响。然而在智能电表实际测量的结果中,不可避免地存在一些异常数据,例如,用电户或电网中发生的突发事件、传感器出现的暂时故障、数据传输或存储的失败,甚至存在人为的网络攻击,等等,这些都能是产生异常数据的根源。从智能电表测量数据中辨别、提取出进而剔除这些异常数据,才

10、能为电网运行中的信息挖掘提供更为准确的测量数据依据,这无疑具有十分重要的意义。针对这一问题,本文对目前国外国内文献中论及智能电表异常测量数据诊断的方法进行总结、归纳和梳理,并对不同诊断方法的数学原理、适用范围等进行比较和讨论,以期为深入、有效开展智能电表异常测量数据诊断提供建设性指导。统计法数据诊断技术通过统计分析测量数据确定异常测量数据的方法,也称统计法,是最早出现的数据诊断方法13-14。统计法的基本思路是:假定测量数据的概率分布模型,通过不一致性检验,将严重偏离概率分布曲线的测量数据视为异常数据。基于统计法的异常数据诊断的具体方法又有很多种,本节仅总结归纳其中一部分具有代表性的方法。1.

11、1 Grubbs法(extreme studentized deviate,ESD)Grubbs法由F. E. Grubbs提出15,该方法针对单一变量、接近正态分布函数的测量数据异常值进行检测。该方法的思路:寻找测量数据中最大偏离概率分布函数的测量值,并对其进行判定。Grubbs法定义如下函数: (1)其中,yi为测量数据;为测量数据的平均值;s代表测量数据的标准偏差。当如下判据成立时,就判定最大偏离点为异常数据,即: (2)其中,是自由度为N-2、置信区间为/(2N)的t分布函数的临界值。Grubbs法的优点是在未知用户参数信息情况下,就可对测量数据中的异常值进行检测;其缺点是只能对单值进

12、行检测,故测量数据很多时,实施该方法效率较低。1.2多极值点偏离算法(generalized extreme studentized deviate,GESD)为克服Grubbs法的缺点,B. Rosner对Grubbs法加以改进,提出了更为一般的多极值点偏离算法GESD16。该算法定义函数: (3)其中,i=1,2,r。它的计算类似于Grubbs法,但采用循环检测,即判定并除去最大异常数据后又重新进行计算,直至r个异常数据被剔除。如此,它的判据为: (4)其中,tp,v是自由度为v、置信区间为p=1-/2(n-i+1)的t分布函数的临界值。GESD法看似是Grubbs法的叠加,但与Grubb

13、s法叠加存在较大差异:首先,GESD法可根据被测试数据的异常值数量对临界值进行适当调整,而Grubbs法叠加则不具备这一特性。其次,除双向检测(最小值和最大值)外,Grubbs法允许进行单向检测(最小值或最大值),而GESD法仅限于双向检测。1.3 Tietjen-Moore法Tietjen-Moore法也是一种单变量、多异常点数据诊断算法,由G. I. Tietjen和R. H. Moore共同提出17。该方法的原理是,首先将测量数据按照绝对值大小进行排序,例如zj 代表测量数据中绝对值第j大的数据。将k个最大值点(最小值点)的检测统计量定义为: (5)其中,为剔除掉k个最大值点(最小值点)

14、后的样本的平均值。显然,Ek的值介于1与0之间。如此,根据设定的Ek值,可相应剔除测量数据中较为异常的值。Tietjen-Moore法与GESD法类似,只是所定义的判据有所区别。M. G. Marasinghe又对Tietjen-Moore法进行了改进18,具体改进Ek的统计量Fk:对k个测量数据进行Tietjen-Moore检测,若统计量Fk显著,则删掉最大偏离点并进行下一轮检测,直至检测不到异常数据为止。1.4 k-NN法(k-Nearest Neighbour algorithm)k-NN法是一类异常数据检测方法的统称,即具体实现算法有多种19-23,但其基本思想是一致的:将测量数据看作

15、一维或多维空间中的点,某测量数据(点)与其他测量数据(点)的距离若都大于一个阈值,就被判定为异常。但无论哪种具体的k-NN算法,首先都必须定义一个距离参数,以表征测量数据的偏离程度。常用的距离参数有欧氏距离和马氏距离(或马哈拉诺比斯距离)。欧式距离的定义为: (6)其中,x=x1,x2.,xn和y=y1,y2.,yn为测量向量。 对于一个均值、协方差矩阵为 C 的多变量向量x,其马氏距离为: (7) 与欧氏距离不同,马氏距离考虑了各变量之间的联系。但马氏距离的一个缺点是当矩阵的维数较大时,计算效率明显降低。1.5 k-均值法(k-means)k-均值法可将n个测量数据划分到k个子集中,并使得每

16、个数据点都属于离它最近的均值对应的子集。已知测量数据x=(x1,x2,xn),k-均值法要将这n个测量值划分到k个集合中(kn),使得集合内的平方和(within-cluster sum of squares,WCSS)最小,即优化合集分布,使其满足: (8)其中,i是Si中测量数据的均值。 经过训练的各个子集k,均会产生一个中心点和正常覆盖该子集测量点的最大半径。若新的测量数据落在所有子集所覆盖范围之外,就被判定为异常数据24-25。k-均值法效率高,可在高维、大量测量数据挖掘中使用;但k是一个输入参数,若选择不当,可能导致错误的结果。另外,k-均值法是收敛到局部最优解,相对全局分析算法,其

17、在某些情况下对异常测量数据的诊断效果不佳。1.6 k-中心点划分法(k-medoids)k-中心点划分法与k-均值法的思想一致,即将测量数据n打包划分到k个子集中,然后确定每个子集正常测量数据的范围;再基于确定的范围边界,对所有测量数据进行诊断,以确定异常值。与k-均值法的不同在于,k-中心点划分法采用实际测量数据作为每个子集的中心,而非测量数据的等效中心。另外,k-中心点划分法的优化目标是某个集合内测量数据到中心(实际测量数据点)距离之和最小化: (9)基于上述,与k-均值法相比,k-中心点划分法能更稳定地诊断出噪声和异常测量数据,即具有更好的鲁棒性26-27。1.7 最小体积椭圆法(Min

18、imum volume ellipsoid,MVE)最小体积椭圆法通过对多数测量数据(50%)的概率分布模型进行拟合,目标是以拟合出最小体积的椭圆边界来区分正常测量数据与异常测量数据28-29。若Xn=x1,x2,xn是np维的测量数据,按照式(7)可确定Xn的马氏距离d2。已知测量数据满足4维高斯分布,则该测量数据的马氏距离平方近似满足42分布。基于此结论,最小体积椭圆法比较马氏距离和24,p的方根值,即: (10)从而确定最小体积椭圆的边界。以此边界为界限,落入边界外的测量数据即被诊断为异常测量数据。1.8 凸壳剥离法(convex peeling)凸壳剥离法是用最外层的测量数据构建出一个

19、凸壳。删除落在该凸壳上的测量数据后,继续向内构建第二层凸壳,如此反复,就能构建出一个多层的类似洋葱的凸壳体28-29。凸壳剥离法赋予落在各层凸壳上的测量数据不同的权重,即深度。深度与凸壳到数据中心的距离正相关,在最外面的测量数据具有最小的深度。凸壳剥离法通过设定深度或剥离数据量来确定应剔除的最外层数据即异常数据。剥离量化指标也可通过最小二乘法、最小中值二乘法或最小修整二乘法确定。凸壳剥离法的优点是无需分类和设定条件以剔除异常数据,缺点是参数设置不当可能导致过多正常测量数据被误诊断为异常测量数据。主成分分析法(principal component analysis,PCA)在低维度下,最小体积

20、椭圆法和凸壳剥离法能较高效地诊断出异常测量数据,但测量数据维度高时,它们会显现出较大局限性。而主成分分析法则能较好地解决高维数据下的诊断效率问题31-32。主成分分析法的基本思想是:依据数据的相关属性,将高维测量数据映射到低维子空间,实现对高维测量数据的降维分析。从数学上看,主成分分析法采用一个正交化线性变换,将数据变换到一个新坐标系统中,使得数据的任何投影的最大方差在第一个坐标上;第二大方差在第二个坐标上,依次类推。如此,最大主成分的求解方程为: (11)其中,w为标准正交基。主成分分析法的优势是将数据降维,但前提是假定子空间中测量数据的结构紧凑,如此,也限制了它在测量数据为稀疏分布情况下的

21、适用性。1.10 混合高斯分布(Gaussian mixture models,GMM)高斯混合分布是一种典型的混合概率分布算法,其基本思路是先将n个测量数据划分到k个子集中,如采用k均值法,再将每个子集中的数据作为参数不同、彼此独立的高斯分布测量数据,即整体测量数据被表示为 (12)其中,i为高斯分布的权重;x为输入向量;t为目标向量;i为高斯概率函数,即:(13)通过设定各子集的置信区间即给测量数据施加边界,即可判断测量数据是正常值还是异常值33-34。1.11 极值分布理论(extreme value theory, EVT)极值分布理论仅关注测量数据中远离概率分布函数的极值点,并通过观

22、察这些极值点的概率分布函数,确定测量数据是否异常33,35。对极值点的选择,可以简单地取正态分布的极限,也可将数据分段处理,取每段中的最大值和最小值。极值点满足的概率分布函数为: (14) 相对于直接由概率分布函数来确定异常测量数据,极值分布理论具有更广的适用范围,且在某些特殊情况下(如罕见异常数据)具有更高的检测分辨率。1.12 支持向量机法(support vector machine,SVM)支持向量机法的目标,是建立一个最大间隔超平面,即将测量数据分组的同时,还使得分组子集对应的各子空间之间的距离最大。一般讲,测量数据在有限维空间中被区分,而用于区分的集合在该空间中通常线性不可分。为此

23、,支持向量机法将原有限维空间映射到维数高得多的空间,并在高维空间中分离子集。支持向量函数可被表示为: (15)其中,K为核函数;sign是符号函数;L代表类标;b表示偏置量;z为输入量;x是训练后的输入量。支持向量机法实现高维映射的核函数不尽相同,常见的核函数包括线性点积、多项式非线性函数、高斯分布函数等。支持向量机法通过支持向量函数在区域中的密集程度判断数据是否异常通常,高密度区域数据是正常的,而稀疏区域则表示存在测量异常值。相对于传统的统计数据诊断法,支持向量机法具有更高的诊断准确度;其缺点是需要对输入数据进行完全标记,而分类后,模型的参数不直观。测量数据高级诊断方法采用统计法诊断测量数据

24、,是通过分析测量数据的具体统计指标来区分正常数据与异常数据。而测量数据高级诊断方法,则具备自我学习能力,即通过学习或训练,能提取出测量数据(未知系统)中的关键特征,进而对测量数据的有效性做出正确判断。测量数据高级诊断方法主要包括神经网络法和机器学习法。2.1 神经网络法(neural network)神经网络可自主学习和适应未知参数系统,充分逼近任意复杂的非线性关系,具有较强的鲁棒性和容错性。凭借这些优势,神经网络成为测量数据诊断的主要方法之一。在神经网络中,除了输入节点,每个节点都是一个由非线性激活函数构成的神经元。数学上,每个神经元的输入与输出之间的关系可表示为: (16)其中,y为神经元

25、的输出;x是输入;w代表输入权重;b表征偏置量;为激活函数(多为S型函数)。神经网络首先通过样本训练实现对测量数据模型的描述。具体地,训练过程是依托最小化神经网络输出值与实际值之间偏差的平方和实现的,即: (17)其中,p(x)为无条件概率密度函数。原则上,以神经网络法诊断测量数据,可通过比较模型的预测值与实际测量值来实现。神经网络基于n个测量数据去预测第n+1个数据,若第n+1个实测数据与神经网络预测出的数据值相近,则表明第n+1个实测数据正常;反之若两者相差甚远,则其就被判定为异常测量数据。神经网络的具体算法又有很多种,常见的包括:多层感知器:是一种前向结构的神经网络,可用有向图表示,每层

26、由多个节点构成,每两层之间单向连接。这种神经网络结构简单,易于实现。例如,文献37-38就采用多层感知器实现了对异常测量数据的判定。自联想神经网络:是一种前馈型神经网络,其包括变换层、瓶颈层及反变换层。这种神经网络的输出量个数等于输入量个数,且训练后的网络对正常值不敏感,而对异常值则非常敏感,故借此,可筛选出异常数据。例如,文献39-40均采用自联想神经网络实现了对异常数据的诊断。Hopfield神经网络:是一种反馈型神经网络,即其从输出到输入有反馈连接。它是一种二元型神经网络,即其神经元的输出只取1和0两个值,分别表示神经元处于激活和抑制状态。如此,它可保证局部极小收敛。例如,文献41就采用

27、Hopfield神经网络实现了对异常测量数据的诊断。径向基函数神经网络:是一种使用径向基函数作为激活函数的神经网络。它的输出是输入的径向基函数和神经元参数的线性组合。径向基函数神经网络通常由三层构成:输入层、隐藏层和输出层。它的结构和训练均简单、收敛速度快、能较准确逼近任意非线性函数,可克服局部极小值问题。文献42是应用它诊断异常数据的一个成功案例。自组织映射:是一种使用非监督式学习产生训练样本的神经网络。与其他人工神经网络不同,自组织映射使用邻近函数来保持输入控件的拓扑性质。一般地,自组织映射将高维测量数据在低维空间表示,能降低数据处理的维度。例如,文献43就采用自组织映射实现了对测量数据的

28、诊断和分析。自适应共振理论网络: 它的主要目的是解决新的训练导致偏离原有训练的问题,其思路是当网络接收新输入时,检查新输入模式与已有存储模式之间的匹配程度,通过调整与新类别相关的权值,使新模式与已有模式获得最大相似度。如此,其对适应新输入模式具有较大灵活性,能避免对先前所学模式的修改。例如,文献44就应用它对测量数据进行了诊断。2.2 机器学习法(machine learning)机器学习法从人工智能研究中的模式识别和学习理论发展而来,旨在构建一种可以学习数据和预测数据的算法。与传统的编程需要严格的静态程序指令不同,机器学习仅需要样本输入即可建立相应的模型,很好地解决了计算中模型不明确的建模或

29、预测问题。如此,利用机器学习法可学习并建立测量数据的行为概况,然后用于发现测量数据中是否存在异常值。这里,将若干典型的以机器学习法实现数据诊断的文献综述如下:文献45采用C4.5决策树算法对测量数据中的异常值进行检测。机器学习中,决策树所代表的是对象属性与对象值之间的一种映射关系。树中的每个节点代表某一对象,而每个分叉路径则表征可能的属性值。决策树正是借助这些节点属性对测量数据进行分类的。决策树模型简单,可读性强,数据分类效率高;其缺点是可能受训练数据质量影响,会出现过度拟合问题。文献46使用基于规则的机器学习算法对测量数据进行诊断。基于规则的系统与决策树很相似,规则可直接从决策树的路径中生成

30、;但基于规则的系统更灵活,不会因为增加新规则而扰乱已有规则。文献47中使用层次聚类算法实现对数据的分类和诊断。它主要用于解决大数据样本下传统算法效率低下的问题。它在大数据运算下能提高效率,得益于不扫描所有数据点;它以测量数据在空间中的权重不等为准则,可充分利用可用内存来派生尽可能好的子集群,并最大限度地降低I/O成本。文献48采用基于密度的空间聚类算法进行数据分类和诊断。该聚类算法在给定空间的一组测量数据中,将密集的点组合在一起,标记为正常数据;相反,将孤立于正常数据集以外的低密度区域标记为异常值。该聚类算法的优点是无需指定数据中的聚类数量,可找到任意形状的簇,对数据库中点的排序大多不敏感;缺

31、点是对密度分布不均衡的数据的分类性能较差。数据诊断方法在智能电表测量中的应用基于统计、神经网络、机器学习的异常数据诊断方法,原则上并不局限于在智能电表测量数据领域的应用,因而上述数据诊断方法综述所使用的文献,也涉及到其他的测量领域。本节专门对上述数据诊断方法在智能电表异常数据检测应用的典型文献进行了盘点。文献49对建筑物的日常电能使用情况建立了智能化的预测模型,并在建立该模型上采用了本文1.2节中论及的多极值点偏离算法,成功地分离出了智能电表测量数据中存在的异常点。文献50提出了一种基于电力线载波信号强度检测的智能电表异常测量数据诊断方法,其判据基于简单的统计模型,即长期处于低概率分布的测量数

32、据和智能电表即被判定为异常。基于此方法,工作异常的智能电表被标记了出来,且效果令人满意。文献51使用了类似于k-均值法和k-中心点划分法的数据诊断方法,以判定智能电表测量数据中的异常值。该文献先将电能表测量数据分组,然后根据测量数据偏离子集中心的距离判定其是否异常。文献52提出了一种基于神经网络的智能电表“欺诈”型异常测量数据检测方法。该文献在对测量数据预处理时,先采用统计方法去除粗大数据;并在建立神经网络时使用了预测数据和测量数据之间的均方根误差作为检测指标。文献53提出了一种加权平均法以实现对智能电能表丢失测量数据的预测。具体通过对权重参数进行优化,提高了传统均值法或线性预测法的准确度。文

33、献54采用本文1.4节讨论的k-NN法对智能电表测得的异常数据进行了检测。所采用的数据诊断算法,采用了子集中心和多种距离函数,以提高检测的准确性,并取得了令人满意的效果。文献55采用机器学习法与统计法相结合的智能电表异常测量数据检测方案,其中,机器学习法采用的是外生变量周期回归;统计法选用的是高斯概率分布模型。该方法对离线和在线数据诊断均适用。文献56则采用机器学习和神经网络异常数据检测方法来提高智能电表测量数据的准确性。试验结果表明,经过该诊断方法处理后的数据,的确能明显提高负荷预测的准确性。文献57提出了一种结合动态回归模型和自适应模型异常阈值的智能电表异常数据检测方案。试验表明,该方法比

34、传统方法具有更高的检测准确性。结论针对智能电表测量结果中异常数据的诊断,对目前国外国内文献中论及的常用诊断方法进行了梳理、归纳和综述。首先给出了基于测量数据统计指标的常用诊断方法,包括Grubbs法、多极值点偏离算法、Tietjen-Moore法、k-NN法、k-均值法、k-中心点划分法、最小体积椭圆法、凸壳剥离法、主成分分析法、混合高斯分布、极值分布理论和支持向量机法。其次,对若干典型测量数据高级诊断方法,即神经网络算法和机器学习法进行了梳理和归纳。最后,对部分数据诊断方法在智能电表测量中的典型应用进行了简要的总结。从智能电表实际测量数据中辨别、提取、剔除异常数据时,应根据测量数据的类型、用

35、电户负荷的特点等,选取一种或多种方法组合的数据诊断方案。只有准确、有效地剔除异常测量数据,才能从智能电表测得的海量数据中挖掘出更为准确的相关数据和信息,进而为后续的负荷预测等电网运行监控提供更有价值的指导。参 考 文 献陈树勇, 宋书芳, 李兰欣, 等. 智能电网技术综述J. 电网技术, 2009, 33(8): 1-7.Chen Shuyong, Song Shufang, Li Lanxin, et al. Survey on Smart Grid TechnologyJ. Power System Technology, 2009, 33(8): 1-7.Farhangi H. The

36、path of the smart grid J. IEEE power and energy magazine, 2010, 8(1): 18-28.Mohassel R R, Fung A, Mohammadi F, et al. A survey on advanced metering infrastructure J. International Journal of Electrical Power & Energy Systems, 2014, 63: 473-484.栾文鹏. 高级量测体系J. 南方电网技术, 2009, 3 (2): 6-10.Luan Wenpeng. Ad

37、vanced metering infrastructure J. Southern Power System Technology, 2009, 3(2): 6-10.王思彤, 周晖, 袁瑞铭, 等. 智能电表的概念及应用J. 电网技术, 2010, 34(4): 17-23.Wang Sitong, Zhou Hui, Yuan Ruiming, et al. Concept and Application of Smart MeterJ. Power System Technology, 2010, 34(4): 17-23.Peters M. Home help (smart mete

38、rs)J. Power Engineer, 2007, 21(5):20-23.宋亚奇, 周国亮, 朱永利. 智能电网大数据处理技术现状与挑战J. 电网技术, 2013, 37(4): 927-935.Song Yaqi, Zhou Guoliang, Zhu Yongli. Present status and challenges of big data processing in smart gridJ. Power System Technology, 2013, 37(4): 927-935.张东霞, 苗新, 刘丽平, 等. 智能电网大数据技术发展研究J. 中国电机工程学报, 201

39、5(1): 2-12.Zhang Dongxia, Miao Xin, Liu Linping, et al. Research on development strategy for smart grid big data J. Proceedings of the CSEE, 2015(1): 2-12.Wang Y, Chen Q, Hong T, et al. Review of smart meter data analytics: Applications, methodologies, and challengesJ. IEEE Transactions on Smart Gri

40、d, 2018.Alahakoon D, Yu X. Smart electricity meter data intelligence for future energy systems: A surveyJ. IEEE Transactions on Industrial Informatics, 2016, 12(1): 425-436.Quilumba F L, Lee W J, Huang H, et al. Using smart meter data to improve the accuracy of intraday load forecasting considering

41、customer behavior similarities J. IEEE Transactions on Smart Grid, 2015, 6(2): 911-918.DepuruS S S R, Wang L, Devabhaktuni V, et al. High performance computing for detection of electricity theft J. International Journal of Electrical Power & Energy Systems, 2013, 47: 21-30Barnett V, Lewis T. Outlier

42、s in Statistical Data M . New York: John Wiley & Sons, 1994Hodge V, Jim A. A survey of outlier detection methodologies J. Artificial intelligence review, 2004, 22(2): 85-126.Grubbs F E. Procedures for detecting outlying observations in samples J. Technometrics, 1969, 11(1): 1-21.Rosner B. Percentage

43、 points for a generalized ESD many-outlier procedure J. Technometrics, 1983, 25(2): 165-172.Tietjen G I, Moore R H. Some Grubbs-type statistics for the detection of several outliers J. Technometrics, 1972, 14(3): 583-597.Marasinghe M G. A multistage procedure for detecting several outliers in linear

44、 regression J. Technometrics,1985, 27(4): 395-399.Ramaswamy S, Rajeev R, Kyuseok S. Efficient algorithms for mining outliers from large data sets J. ACM Sigmod Record, 2000, 29(2): 427-438.Knorr E M, Raymond T N, Vladimir T. Distance-based outliers: algorithms and applications J. The VLDB Journal-Th

45、e International Journal on Very Large Data Bases, 2000, 8(3-4): 237-253.Wettschereck D. A study of distance-based machine learning algorithms D. 1994, Oregon State University.Aha D W, Richard L B. A comparative evaluation of sequential feature selection algorithms M. Learning from data. Springer, Ne

46、w York, NY, 1996.Aggarwal C C, Philip S Y. Outlier detection for high dimensional data J. ACM Sigmod Record, 2001, 30(2): 37-46.Allan J, Carbonell J, Doddington G, et al. Topic detection and tracking pilot study: Final report C. Proceedings of the DARPA Broadcast News Transcription and Understanding

47、 Workshop, 1998.Nairac A, Townsend N, Carr R, et al. A system for the analysis of jet system vibration dataJ. Integrated Computer Aided Engineering, 1999, 6(1): 53-65.Bolton, R J, David J H. Unsupervised profiling methods for fraud detectionC. Credit Scoring and Credit Control VII, 2001: 235-255.Bra

48、dley P S, Fayyad U M, Mangasarian O L. Mathematical programming for data mining: formulations and challenges J. INFORMS Journal on Computing, 1999, 11(3): 217-238.Rousseeuw P, Leroy A. Robust regression and outlier detection M. John Wiley & Sons., 3 edition, 1996. Van Aelst S, Rousseeuw P. Minimum v

49、olume ellipsoid J. Wiley Interdisciplinary Reviews: Computational Statistics, 2009, 1(1): 71-82.Agyemang M, Ken B, Rada A. A comprehensive survey of numeric and symbolic outlier mining techniques J. Intelligent Data Analysis, 2006, 10(6): 521-538.Faloutsos C, Korn F, Labrinidis A, et al. Quantifiabl

50、e data mining using principal component analysis R. Technical Report CS-TR-3754, Institute for Systems Research, University of Maryland, College Park, MD, 1997.Parra L, Deco G, Miesbach S. Statistical independence and novelty detection with information preserving nonlinear maps J. Neural Computation

51、, 1996, 8(2): 260-269.Roberts S J. Novelty detection using extreme value statistics J. IEE Proceedings on Vision, Image and Signal Processing, 1998, 146(3):124-129.Bishop C M. Novelty detection and Neural Network validation C. Proceedings of the IEE Conference on Vision, Image and Signal Processing,

52、 1994: 217-222.Burridge P, Taylor A M R. Additive outlier detection via extremevalue theoryJ. Journal of Time Series Analysis, 2006, 27(5): 685-701.Tax D M J, Ypma A, Duin R P W. Support vector data description applied to machine vibration analysis C. Proceedings of ASCI99, Heijen, Netherlands, 1999

53、.Nairac A, Townsend N, Carr R., et al. A system for the analysis of jet system vibration data J. Integrated Computer Aided Engineering, 1999, 6(1):53-65.Hawkins S, He Hongxing, Williams Graham, et al. Outlier detection using replicator neural networks C. International Conference on Data Warehousing

54、and Knowledge Discovery. Springer, Berlin, Heidelberg, 2002: 170-180.Sohn H, Worden K, Farrar C. Novelty detection using auto-associative neural network. Proceedings of 2001 ASME International Mechanical Engineering Congress and Exposition, New York, 2001: LA-UR-01-2894.Yang T N, Wang S D. Fuzzy aut

55、o-associative neural networks for principal component extraction of noisy data J. IEEE transactions on neural networks, 2000, 11(3): 808-810.Crook P, Hayes G. A robot implementation of a biologically inspired method for novelty detection C. Proceedings of TIMR-2001, Towards Intelligent Mobile Robots

56、, Manchester, 1995.Chuang C C, Jeng J T, Lin P T. Annealing robust radial basis function networks for function approximation with outliers J. Neurocomputing, 2004, 56: 123-139.Rustum R, Adebayo J A. Replacing outliers and missing values from activated sludge data using Kohonen self-organizing map J.

57、 Journal of Environmental Engineering, 2007, 133(9): 909-916.Caudell T P, Newman D S. An adaptive resonance architecture to define normality and detect novelties in time series and databases C. IEEE World Congress on Neural Networks, Portland, Oregon. 1993: 166-176.Skalak D B, Rissland E L. Inductiv

58、e Learning in a Mixed Paradigm Setting C. Proceedings of the Eighth National Conference on Artificial Intelligence, Boston, MA, 1990: 840-847.Fawcett T, Foster P. Activity monitoring: Noticing interesting changes in behavior C. Proceedings of the fifth ACM SIGKDD international conference on Knowledg

59、e discovery and data mining, 1999.Zhang T, Ramakrishnan R, Livny M. BIRCH: An efficient data clustering method for very large databases C. Proceedings of the 1996 ACM SIGMOD International Conference on Management of Data, Montreal, Quebec, Canada, 1996: 103-114.Ester M, Kriegel H P, Xu X. A density-based algorithm for discovering clu

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论