版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、基于时间序列相似性匹配算法的地震预测研究论文摘要:把匹配抽象时间序列相似性的方法引入到地震预报的应用中,结合大量地震历史源数据,地震领域的专家经验知识和相关成果根底上,提出了一种简化的抽象时间序列匹配模型。该模型在对海量数据进行预处理筛选的根底上在进行时间相似性匹配,增加了横向和纵向多方位地区和多方位时间段的匹配,不同时间差和阈值的匹配,并通过大量实验对该模型进行了反复验证,同时对我国地震频繁地区近几十年的地震历史数据进行了相似性匹配实验分析,取得了可信度较高的实验结果,实验结果验证了所给时间序列相似性匹配控制策略的有效性、实用性以及算法的优越性。论文关键词:时间序列,序列匹配,地震预测,算法
2、,地震相关地区0引言时间序列(Timeseries)泛指那些随时间或空间有序变化的数据集合,这些数据记录集合往往采用等时间或空间间隔进行度量。如何有效的管理和利用海量数据序列,有效的发现和理解这些数据序列背后隐含的规律和知识,已受到越来越多数据挖掘研究者广泛关注。在其相应的数据挖掘系统中,时间序列的相似性查询是分析时间序列变化规律的一种重要方法。对于时间序列的分类、预测及知识发现都具有重要的现实意义。比方在我们熟悉的股票,期货,具有相似性销售的产品,恒星的光谱曲线中相似性度量都具有不可替代的作用。地震序列是一维时间序列,却蕴藏着动态演化的中其它变量的痕迹和信息,因此对地震序列的研究具有重要意义
3、。时间序列相似度序列匹配是在时间,震级数据库中找出与给定时间,震级序列模型相似的序列,对相似性度量的建立求解过程,是数据挖掘中一类重要问题,具体表现在大量数据中具有时间和另一性质的二维相关性。在地震预报科学中,经过大量的研究和积累,专家们发现在一定的区域中地震活动具有同步涨落的现在。也就是说在一定的区域范围中的两个地区,特定震级以上的有明显震感的地震相伴发生的现象称为地震的相关现象,也称地震的区域相关性。地震的相关性反映了地球的自转,向心力相似,地质构造的相似,板块运动等对地震发生的规律性的影响。所以寻找地震相关区域,进而预报相关的地震,是人们最常用的预报地震的方法之一。鉴于传统方法费时费力,
4、预报不精确等特点。本文把数据挖掘技术引入地震预报科学中,通过不同地区地震数目的不同,首先进行粗相似匹配,即对原始地震数据中相差一定地震数目条数以下的地震区域将其转化为粗相似格式,其次对粗相似区域中的数据项转化为时间序列,对粗相似的区域进行时间相似度匹配来发现地震相关区域,从而进行地震预报。本文首先结合地震领域的相关知识,定义了序列的相似度量模型,提出了一种基于相似度序列匹配的算法,利用相关的地震相似度全面的对时间,经纬度和震级等地震相关信息进行处理,从而快速,全面的找出地震的相关区域。1地震相关地区的序列相似性定义及度量模型地震相关地区相似度匹配研究可以分为以下几个局部:相似性的定义,度量模型
5、的建立和相似度匹配算法的实现。相似性定义和度量模型一般根据不同的需求进行定义,进而转化为一些抽象的数学模型来解决问题。传统的相似性定义是根据时间序列数据的上升或下降的趋势和需解决的问题相结合来定义。比拟典型的有ARMA(autoregressionmovingaverage)模型,采用的是随机时间序列分析技术;DFT(discretefouriertransform)模型,采用的是把时间序列转化为空间中的点,对这些点进行分析处理。这些模型中都用了欧几里德距离作为序列间的相似性评价函数,也就是当两个序列间的欧氏距离小于一定的阈值时,就认为此序列相似。但在实际应用中,由于序列长度不一,采样率不同,
6、数据多少相差较大等问题,使得欧氏距离很难直接用于解决问题。由于地震数据记录的每一次地震发生的时间,经度,纬度,震级以及地震事件序列等。其具非线性特点,传统的时间序列相似性度量模型和匹配很难使用于地震数据。对此,本文根据地震相关领域知识,通过适当的数据预处理,将其转化为一定震级,一定时间,一定空间范围内的地震事件序列集。构成不同的地震时间序列。下面给出地震序列及相似性定义及地震序列相似性的模型。定义1地震事件把预处理过的地震数据目录中的每一条地震记录定义为一次事件。按照不同的空间属性划分为不同的地震事件集。在地震事件集上t时刻发生的地震事件记为F(t)。定义2地震事件序列在一定的区域中发生在一定
7、的时间范围H内的地震事件集Ft=F(t)|tH在时间轴上的一个排列。定义3地震序列对预处理过的地震数据目录里的地震数据提取其时间和震级,抽象为地震序列。定义4完整地震序列在某些地震区域中,对于地震序列S,在没有发生地震事件的时间上用空元素给予填充的地震序列。定义5地震相似性设x,y分别是两个地震序列,用函数(x,y),(x,y)来表示其相似性。令(x,y)=1,假设|x(t)-y(t)|M;(x,y)=0,假设|x(t)-y(t)|M;x(t),y(t)表示x,y的时间点,x(t)-y(t)表示其时间差。令(x,y)=1,假设|x(m)-y(m)|M;(x,y)=0,假设|x(m)-y(m)|
8、M;x(m),y(m)表示x,y的震级数,x(m)-y(m)表示震级差。M为年份误差的阈值,M;为震级误差的阈值。M越小时间相差越小,M越小震级相差越小。所以x,y可以对应不同的时间点,M和M为用户给定。定义6地震序列相似性模型设X和Y为两个不同的地震序列,那么X和Y的序列相似性可以用这两个序列中对应每一组数据的相似进行统计,记为相似性加权累计和来度量。两个地震序列的相似性度量模型定义为 2由于地震目录数据的条数是相当的大,在存储过程中难免会出现数据不一致的现象,例如数据日期不符合现实生活中的日期,所以要将类似于这样的无效数据去掉,从而提高数据的质量,有利于数据挖掘的质量。 时间 日期 经度
9、纬度 震级 区域 19650126 023000 102.9 29.1 3 78 19650420 060000 102.65 29 3.4 78 19710324 215416 98.1 35.5 6.5 67 19710325 202150 79.42 41.42 3.3 21 19710523 040330 92.3 32.5 6.7 55 2.2实验结果分析地震的时间序列相似性是指在一定时间空间范围内,两个地区发生的地震在时间,震级方面具有相似性。比方某区域A在1995,1997,1999,2003,2004有一定震级以上的地震,而在区域B在1997,1999,2001,2005,20
10、06也发生了地震,那么A和B两个区域在时间序列相似度上具有很大的相似性,本文针对这一特点,设计了3组实验,在进行粗相似的根底上分别从不同的时间差,时空差,粗细力度差等方面进行相似性序列分布分析。本实验采用4.5级以上的地震序列,时间跨度为1987-2007年范围内,对全国的相关区域进行分析研究,发现有些区域有着相似性,结果如表2所示。 区域 时间范围 经度范围 纬度范围 地震条数 年份相似 震级相似 72 1985-2005 100-105 25-30 260 41 36 61 1985-2005 95-100 25-30 160 36 23 40 1985-2005 85-90 30-35
11、240 12 14 19 1985-2005 75-80 35-40 280 12 11 62 1985-2005 95-100 30-35 120 11 10 59 1985-2005 95-100 15-25 96 10 10 由表2可以看出四川和台湾地区以及藏南和台湾地区的相似度最高,本文针对这两组区域时间差在30天以内的地震相关工程进行研究,发现四川和台湾地区有41次地震具有相关性,藏南和台湾地区有36次相匹配的地震工程,而且地 震震级相似性也很高,具有相同的趋势和震匹配性。图1给出四川地区经度100-105,纬度25-30和台湾地区经度120-125,纬度20-25相关地震的M-T图
12、。图2给出了藏南地区经度95-100,纬度25-30和台湾地区经度100-105,纬度25-30相关地震的M-T图。实验2:固定时间差为1年的粗粒度相似性分析在实验1的根底上,我们把实验的时间阈值由30天放大到1年,局部震级有所调整的情况下由于四川台湾地区数据较多,震级提高到5级以上,实验结果发现多了一些区域具有相似性,其中相似度提高最明显的是四川和台湾地区以及藏中和四川-云南交界地区。图3表示了四川-云南交界地区经度90-100, 纬度25-30和藏中地区经度85-90,纬度30-35的M-T图,相匹配的地震条数由16次增加到23次。图4表示了四川地区经度100-105,纬度25-30和台湾地区经度120-125,纬度20-25的M-T图,相匹配的工程由28上升到41。实验3:固定时间差为10天的细粒度相似性分析在实验1和2的根底上,针对四川台湾地区和四川云南,藏中两组地区將时间阈值缩小到10天,震级阈值缩小到5级,进行相似度更为精确的相似匹配。得到实验结果如图5和图
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 河北省-2024年-网格员-下半年笔试真题卷
- 废弃纺织品资源的综合利用研究与实践考核试卷
- 农业科学与农村文化创新视频考核试卷
- 托儿所服务的品牌建设和品牌推广考核试卷
- 仓储物流业财务战略协议
- 临时教育培训基地租赁合同
- 渔港通信管沟施工合同
- 展览馆施工零星合同
- 跨境电商软件投标技术要求模板
- 橄榄球俱乐部合同球员管理
- 临床实效研究设计
- 装饰装修临水临电施工方案
- 传热学-凝结核沸腾传热课件
- 棚户区改造入户调查表
- 招商银行智慧营销体系规划方案((2022年-2023年)-2022)
- 口腔科住院医师考试:2022牙周病学真题模拟及答案
- 主语从句详解课件
- 国家基本药物处方集
- 慢性伤口的综合处理课件
- 《人民币硬币和普通纪念币》理论考试题库(含答案)
- RoseMirrorHA安装维护手册
评论
0/150
提交评论