下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于haar小波变换的时间序列多尺度分辨方法
自20世纪90年代以来,时间序列数据的研究有所增加。运用各种挖掘方法和模型,对时间序列进行分类、聚类、预测和关联模式挖掘,能提取时间序列中隐含的模式和信息,具有重要的理论意义和应用价值。由于时间序列来源于实际生活的各个应用领域,采样方法和测量标准都不一致,具有数据短期波动频繁、存在大量噪声干扰、以及非稳态的特点,因此对时间序列的分析和处理较为复杂并有着特殊的要求。时间序列数据的聚类分析近年来得到广泛研究。依据对数据的预处理方法以及数据的组织形式,时间序列聚类方法可分为以下3种:基于原始数据的时间序列聚类;基于特征提取的时间序列聚类;基于模型的时间序列聚类。文中主要研究基于特征提取的时间序列聚类。Agrawal等运用离散傅里叶变换(DFT)将原始时间序列转换为离散傅里叶系数,从而将时间序列从时域转换到频域,将变换后的前几个分量代替原始时间序列,对时间序列起到降维的作用,在此基础上利用欧氏距离进行时间序列的相似性查询和聚类研究。Struzik等通过标准正交变换将时间序列转换为一组Haar小波基,通过多分辨分析的方式对时间序列的局部斜率进行估计,得到基于Haar小波变换的符号表示法和对数差分表示法,对时间序列的相似性进行度量。Gavrilov基于原始的、经正规化处理的、由原始数据的一阶导数组成的证券时间序列,分别运用主成份分析、离散傅立叶变换和分段式正规化方法对时间序列进行降维处理;然后采用层次凝聚法对降维后的数据进行聚类分析。何兰芳等运用高斯调制小波作为母小波,通过对时间序列进行多重小波分解,去掉部分高频分量后对数据进行重构,在一组实验数据和大地电磁测深数据上进行实验。朱广彬等依据小波多分辨分析的原理,利用Daubechies4小波对温度异常时间序列进行5层小波分解,得到分解后的小波系数,将高频小波系数赋零值然后进行重构,对时间序列进行消噪处理。Dokur和ue6c0lmez分离出第1和第2心音信号,运用小波变换对分割后的心音信号进行特征提取;然后运用增量式自组织神经网络(ISOM)对心音信号进行分类。1时间序列自组织特征由于小波变换具有在时域和频域同时局部化和多尺度分辨的功能,能对时间序列数据进行很好的展开和逼近。通过对时间序列进行小波分析,分离和提取数据中的低频分量和高频分量,从而将原始数据中包含的信号与噪声相互分离。通过保留低频信号,去除高频噪声,可获取时间序列的总体趋势和全局特征,达到降维的目的。采用的技术路线如图1所示。获取时间序列总体趋势之后,计算时间序列的相关统计量,如:偏差、峰值、均值、方差、各阶原点矩、各阶中心矩等,获得时间序列的基本统计特征。以适当的形式组合时间序列的总体趋势和统计特征量,形成时间序列的待聚类组合特征量,作为自组织特征映射SOM神经网络聚类模型的输入数据,进行聚类分析,可改善时间序列数据的聚类精度。这里的研究方案中,选取一阶原点矩(均值)、二阶中心矩(方差)和三阶中心矩为统计特征量,突出时间序列数据的聚类特征。在几组模拟生成的时间序列数据上进行实验分析,并将此方法运用于三江平原地区MODIS遥感影像中林地植被的聚类提取,进行了应用研究。2小波变换的局部化特性小波变换是在Fourier变换和Gabor变换的基础上演变而来的,是继傅立叶分析之后的又一个重大突破,被广泛用于信号处理、图像压缩、模式识别、计算机视觉、量子物理以及众多非线性分析领域。小波变换在时域和频域都具有良好的局部化特性,是一种时频局部化或称为时频定位的工具,被誉为“数学显微镜”;同时小波变换还具有多分辨分析的特点,因此特别适用于对非平稳信号进行分析和处理。2.1haar小波尺度函数Haar小波是小波分析发展过程中出现最早的小波,Haar小波实质上是一阶的Daubechies小波,也是最简单的具有紧支特性的显式正交小波。其小波函数定义为Haar小波尺度函数定义为规范化的Haar小波尺度函数为其中,j为尺度因子,改变j使函数图形缩小或者放大;i为平移参数,改变i使函数沿x轴方向平移;常数因子2j/2用以满足内积等于1的条件。2.2多尺度分解haar小波小波变换通过平移母小波可获得信号的时间信息,而通过缩放小波的宽度或尺度可获得信号的频率特性。在小波变换中,近似值是大的缩放因子产生的系数,表示信号的低频分量。而细节值是小的缩放因子产生的系数,表示信号的高频分量。通过Haar小波变换对时间序列数据进行多尺度分解,每次分解将时间序列数据分解成包含低频分量的尺度信号和包含高频分量和噪声的细节信号。其中,尺度信号体现了时间序列数据的变化趋势。对获得的尺度信号再次执行小波变换进行2次分解,得到新的尺度信号和细节信号。在新的尺度信号上重复小波分解过程,直到分解和降维过程结束。每执行1次Haar小波分解,时间序列的长度缩短为本次分解前的1/2。长度为n的原始时间序列经过m次分解后,长度缩短为n/2m,从而达到降低时间维度的目的。3实验分析3.1基于自组织特征的som神经网络训练过程模拟生成4种不同类型的时间序列信号,即分别生成若干组正弦信号序列、余弦信号序列、正切信号序列和白噪声信号序列。每组时间序列的长度均为100,分别给这些信号(白噪声信号除外)加上一定量的在[0,1]区间上服从正态分布的随机噪声(衰减到原信号量的40%)。对各组时间序列分别进行3次Haar小波变换缩减维度,提取变换后的尺度信号;然后计算该时间序列的一阶原点矩、二阶及三阶中心矩等统计特征量。将尺度信号与各自的统计特征量组合成新的序列,作为自组织特征映射SOM神经网络的输入训练样本,对SOM神经网络进行训练,以便能很好区分以上各类信号。用白噪声信号作为以上4类信号的背景信号,以检验聚类算法的抗噪性能。3.1.1各类信号在二维平面上的排列服从均匀在尺度为50×50的二维平面上,生成160组含噪正弦时间序列、390组含噪余弦时间序列和280组含噪正切时间序列数据,以及2500组信号强度在区间[0,1]上呈正态分布的随机噪声时间序列。所有时间序列的长度均为100,并将噪声序列的强度衰减到原信号量的30%。计算4类信号中各组时间序列在二维平面上的水平坐标位置和垂直坐标位置,使各类信号在该二维平面上的排列服从均匀分布。生成各类模拟信号量时间序列的计算式为:式(4)~式(7)中,T为取值从0~100的一组长度为100的整型向量;randn(1,100)产生一组在[0,1]区间上取值服从正态分布的时间维度为100的随机向量。各类信号在二维平面上的坐标位置计算式分别为:式中,rand产生160组取值在[0,1]区间上服从均匀分布的随机变量;X1={x1,x2,…,xi,…,x160}为160组正弦信号序列在以上二维平面上的水平坐标矢量;Y1={y1,y2,…,yi,…,y160}为160组正弦信号序列在以上二维平面上的垂直坐标矢量,即(xi,yi)为第i组正弦信号时间序列在二维平面上的坐标位置。类似地,X2和Y2分别为390组余弦信号序列在二维平面上的水平坐标矢量和垂直坐标矢量;X3和Y3分别为280组正切信号序列在二维平面上的水平坐标矢量和垂直坐标矢量。模拟生成的实验数据在二维平面上的分布如图2所示。3.1.2时间序列数据的统计特征量对模拟生成的正弦信号时间序列、余弦信号时间序列、正切信号时间序列分别进行3次Haar小波变换,所产生的尺度分量和细节分量如图3~图5所示。计算以上3类时间序列数据的统计特征量,其中包括原始时间序列的一阶原点矩,二阶中心矩和三阶中心矩。将各类时间序列数据的3个统计量依次附加在3次小波分解后产生的尺度分量之后,作为自组织特征映射SOM神经网络聚类模型的输入训练样本,进行聚类分析。3.1.3时间序列聚类分析对以上3类时间序列数据以及高斯白噪声数据进行标准正规化变换;然后运用主成份分析,提取时间序列数据的前10个主成份分量,作为SOM神经网络聚类模型的输入向量,设定聚类类别数为6,对SOM神经网络进行训练;然后用训练好的神经网络对以上3类时间序列数据进行仿真聚类分析,所得到的结果如表1所示。表中,类别中元素总数指聚类算法判定为某类信号的时间序列的个数,如表中聚类算法将303组时间序列判定为正弦序列;命中数指在该类信号中正确分类的时间序列的个数,如表中分类得到的303组正弦序列中,有160组准确的进行了分类。对以上3类时间序列数据以及高斯白噪声数据进行3次Haar小波变换,取第3次小波变换后生成的尺度分量,作为SOM神经网络聚类模型的输入向量;并设定聚类类别数为6,对SOM神经网络进行训练,用训练好的神经网络对以上3类时间序列数据进行仿真聚类分析,所得到的结果如表2所示。对以上3类时间序列数据以及高斯白噪声数据进行3次Haar小波变换;然后计算各类时间序列数据的一阶原点矩、二阶中心矩和三阶中心矩,取第3次小波变换后生成的尺度分量,作为SOM神经网络输入向量的前11个分量;将以上3个统计量依次作为后3个分量,设定聚类类别数为6,对SOM神经网络进行训练,用训练好的神经网络对以上3类时间序列数据进行仿真聚类分析,所得到的结果如表3所示。3.1.4聚类分析精度分析基于3种时间序列特征提取方法,即主成份分析法、Haar小波变换法和Haar小波变换结合统计特征量方法,运用SOM神经网络对时间序列模拟数据进行聚类分析,通过对聚类结果进行分析发现:在基于以上3种特征提取的聚类分析中,余弦信号的聚类精度都很高;在基于主成份分析的聚类分析中,正切信号易与背景白噪声信号发生混分,使得对正切信号不能很好地分类和提取,而在基于Haar小波变换和基于Haar小波变换与统计特征量的聚类分析中,正切信号能得到很好地划分和提取。对于正弦信号,在基于以上3种特征提取的聚类分析中,都存在不同程度的误分。在基于主成份分析的聚类分析中,误分程度较高;在基于Haar小波变换的聚类分析中,误分程度和漏分程度都较高;而在基于Haar小波变换与统计特征量的聚类分析中,只存在少量漏分,误分程度得到很大改善。3.2基于nd-mi和k-me现行聚类分析的林地植被提取通过光谱分析和植被季相分析表明,在已获取的三江平原地区MODIS影像数据中,由第129,161,193,209,241,257和289天的NDVI和NDMI以及可见光红波段组成的多波段多时相的影像数据,可以很好地用于三江平原地区林地植被的提取。因此取以上7个时相的NDVI,NDMI和可见光红波段数据组合成实验用的时间序列数据,以便基于实际遥感影像数据进行实验分析。首先将以上7个时相的NDVI,NDMI和可见光红波段的数据依次排列形成组合的时间序列数据,对该数据进行标准正规化变换,使其取值范围统一到[0,1]区间上,对规范化的数据执行EnhancedLee滤波;然后执行最小噪声分离MNF变换,取MNF变换后数据的前3个主成分,运用K-Means聚类算法进行聚类分析,提取影像中的林地植被。截取影像数据中林地植被比较集中的一块区域,计算该区域范围内林地提取的生产者精度和用户精度,得到漏分误差为0,错分误差为41.20%,其生产者精度为100%,用户精度为58.80%。用以上方法提取的部分林地植被如图6所示。对规范化后的MODIS影像时间序列数据执行1次Haar小波变换;然后分别求得NDVI,ND-MI和可见光红波段时间序列数据的一阶原点矩、二阶中心矩和三阶中心矩,共9个统计量,将小波变换分解后得到的尺度分量与这9个统计量组合形成待聚类数据,作为输入向量输入到SOM神经网络聚类模型中进行聚类分析,得到提取的林地植被。取与图6相同的影像区域,计算在此区域范围内聚类分析的生产者精度和用户精度,得到生产者精度为95.88%,用户精度为92.33%。图7(a)是原始时间序列数据经标准正规化变换所得到的时间序列;图7(b)是左侧的时间序列经Haar小波变换及统计特征量提取后所形成时间序列;图8显示了基于小波变换与统计量进行聚类分析所提取的林地植被;图9是该研究区域内林地植被的实际分布情况。分析实验结果发现,基于小波变换与统计量,并运用SOM聚类模型进行林地植被提取,其生产者精度虽然略低于基于MNF变换和K-Means聚类算法提取林地植被的精度。前者的生产者精度为95.88%,后者的生产者精度接近100%。但基于小波变换与统计量所提取的林地分布范围,其用户精度较基于MNF变换法的提取精度有了较大提高。前者的用户精度为92.33%,后者的用户精度为58.80%。分析其原因,是由于原始时间序列中水体和林地植被之间光谱特征的差别并不十分明显,因此聚类算法不能很好地分割水体和植被;而经过小波变换和统计特征量提取之后,突显了水体和林地植被在光谱特征上的统计差别,使得聚类算法能够很好地划分水体和林地植被。4时间序列自组织特征1)通过对时间序列数据进行小波分析,将原始时间序列分解成信号成份(低频分量)与噪声成份(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 触电急救课件
- 苏教版江苏省南京市2023-2024学年高二上学期期末模拟数学试题
- 环境问题 课件
- 贝壳课件席慕蓉
- 第四讲 有趣的动物(看图写话教学)-二年级语文上册(统编版)
- 自然拼读课件
- 意大利地图课件
- 西京学院《语言程序设计》2022-2023学年期末试卷
- 西京学院《数字化与网络化制造》2021-2022学年期末试卷
- 译林牛津英语7年级上册7AUnit3ReadingⅡ
- 第五讲新闻评论的结构与节奏
- 护士长竞聘演讲ppt
- 从PK-PD看抗菌药物的合理应用
- 加热炉施工方案
- 进入重庆市特种设备信息化管理平台
- 意象对话放松引导词2[生活经验]
- 高速公路安全生产标准化指南1
- 学科融合课题研究实施方案
- 生物质压块机使用说明书
- 非织造布学——针刺讲解
- 临床药理学个体化药物治疗与精准医学
评论
0/150
提交评论