版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、基于时间序列相似性匹配算法的地震预测研究论文摘要:把匹配抽象时间序列相似性的方法引入到地震预报的应用中,结合大量地震历史源数据,地震领域的专家经验知识和相关成果根底上,提出了一种简化的抽象时间序列匹配模型。该模型在对海量数据进行预处理筛选的根底上在进行时间相似性匹配,增加了横向和纵向多方位地区和多方位时间段的匹配,不同时间差和阈值的匹配,并通过大量实验对该模型进行了反复验证,同时对我国地震频繁地区近几十年的地震历史数据进行了相似性匹配实验分析,取得了可信度较高的实验结果,实验结果验证了所给时间序列相似性匹配控制策略的有效性、实用性以及算法的优越性。论文关键词:时间序列,序列匹配,地震预测,算法
2、,地震相关地区0引言时间序列(Timeseries)泛指那些随时间或空间有序变化的数据集合,这些数据记录集合往往采用等时间或空间间隔进行度量。如何有效的管理和利用海量数据序列,有效的发现和理解这些数据序列背后隐含的规律和知识,已受到越来越多数据挖掘研究者广泛关注。在其相应的数据挖掘系统中,时间序列的相似性查询是分析时间序列变化规律的一种重要方法。对于时间序列的分类、预测及知识发现都具有重要的现实意义。比方在我们熟悉的股票,期货,具有相似性销售的产品,恒星的光谱曲线中相似性度量都具有不可替代的作用。地震序列是一维时间序列,却蕴藏着动态演化的中其它变量的痕迹和信息,因此对地震序列的研究具有重要意义
3、。时间序列相似度序列匹配是在时间,震级数据库中找出与给定时间,震级序列模型相似的序列,对相似性度量的建立求解过程,是数据挖掘中一类重要问题,具体表现在大量数据中具有时间和另一性质的二维相关性。在地震预报科学中,经过大量的研究和积累,专家们发现在一定的区域中地震活动具有同步涨落的现在。也就是说在一定的区域范围中的两个地区,特定震级以上的有明显震感的地震相伴发生的现象称为地震的相关现象,也称地震的区域相关性。地震的相关性反映了地球的自转,向心力相似,地质构造的相似,板块运动等对地震发生的规律性的影响。所以寻找地震相关区域,进而预报相关的地震,是人们最常用的预报地震的方法之一。鉴于传统方法费时费力,
4、预报不精确等特点。本文把数据挖掘技术引入地震预报科学中,通过不同地区地震数目的不同,首先进行粗相似匹配,即对原始地震数据中相差一定地震数目条数以下的地震区域将其转化为粗相似格式,其次对粗相似区域中的数据项转化为时间序列,对粗相似的区域进行时间相似度匹配来发现地震相关区域,从而进行地震预报。本文首先结合地震领域的相关知识,定义了序列的相似度量模型,提出了一种基于相似度序列匹配的算法,利用相关的地震相似度全面的对时间,经纬度和震级等地震相关信息进行处理,从而快速,全面的找出地震的相关区域。1地震相关地区的序列相似性定义及度量模型地震相关地区相似度匹配研究可以分为以下几个局部:相似性的定义,度量模型
5、的建立和相似度匹配算法的实现。相似性定义和度量模型一般根据不同的需求进行定义,进而转化为一些抽象的数学模型来解决问题。传统的相似性定义是根据时间序列数据的上升或下降的趋势和需解决的问题相结合来定义。比拟典型的有ARMA(autoregressionmovingaverage)模型,采用的是随机时间序列分析技术;DFT(discretefouriertransform)模型,采用的是把时间序列转化为空间中的点,对这些点进行分析处理。这些模型中都用了欧几里德距离作为序列间的相似性评价函数,也就是当两个序列间的欧氏距离小于一定的阈值时,就认为此序列相似。但在实际应用中,由于序列长度不一,采样率不同,
6、数据多少相差较大等问题,使得欧氏距离很难直接用于解决问题。由于地震数据记录的每一次地震发生的时间,经度,纬度,震级以及地震事件序列等。其具非线性特点,传统的时间序列相似性度量模型和匹配很难使用于地震数据。对此,本文根据地震相关领域知识,通过适当的数据预处理,将其转化为一定震级,一定时间,一定空间范围内的地震事件序列集。构成不同的地震时间序列。下面给出地震序列及相似性定义及地震序列相似性的模型。定义1地震事件把预处理过的地震数据目录中的每一条地震记录定义为一次事件。按照不同的空间属性划分为不同的地震事件集。在地震事件集上t时刻发生的地震事件记为F(t)。定义2地震事件序列在一定的区域中发生在一定
7、的时间范围H内的地震事件集Ft=F(t)|tH在时间轴上的一个排列。定义3地震序列对预处理过的地震数据目录里的地震数据提取其时间和震级,抽象为地震序列。定义4完整地震序列在某些地震区域中,对于地震序列S,在没有发生地震事件的时间上用空元素给予填充的地震序列。定义5地震相似性设x,y分别是两个地震序列,用函数(x,y),(x,y)来表示其相似性。令(x,y)=1,假设|x(t)-y(t)|M;(x,y)=0,假设|x(t)-y(t)|M;x(t),y(t)表示x,y的时间点,x(t)-y(t)表示其时间差。令(x,y)=1,假设|x(m)-y(m)|M;(x,y)=0,假设|x(m)-y(m)|
8、M;x(m),y(m)表示x,y的震级数,x(m)-y(m)表示震级差。M为年份误差的阈值,M;为震级误差的阈值。M越小时间相差越小,M越小震级相差越小。所以x,y可以对应不同的时间点,M和M为用户给定。定义6地震序列相似性模型设X和Y为两个不同的地震序列,那么X和Y的序列相似性可以用这两个序列中对应每一组数据的相似进行统计,记为相似性加权累计和来度量。两个地震序列的相似性度量模型定义为 2由于地震目录数据的条数是相当的大,在存储过程中难免会出现数据不一致的现象,例如数据日期不符合现实生活中的日期,所以要将类似于这样的无效数据去掉,从而提高数据的质量,有利于数据挖掘的质量。 时间 日期 经度
9、纬度 震级 区域 19650126 023000 102.9 29.1 3 78 19650420 060000 102.65 29 3.4 78 19710324 215416 98.1 35.5 6.5 67 19710325 202150 79.42 41.42 3.3 21 19710523 040330 92.3 32.5 6.7 55 2.2实验结果分析地震的时间序列相似性是指在一定时间空间范围内,两个地区发生的地震在时间,震级方面具有相似性。比方某区域A在1995,1997,1999,2003,2004有一定震级以上的地震,而在区域B在1997,1999,2001,2005,20
10、06也发生了地震,那么A和B两个区域在时间序列相似度上具有很大的相似性,本文针对这一特点,设计了3组实验,在进行粗相似的根底上分别从不同的时间差,时空差,粗细力度差等方面进行相似性序列分布分析。本实验采用4.5级以上的地震序列,时间跨度为1987-2007年范围内,对全国的相关区域进行分析研究,发现有些区域有着相似性,结果如表2所示。 区域 时间范围 经度范围 纬度范围 地震条数 年份相似 震级相似 72 1985-2005 100-105 25-30 260 41 36 61 1985-2005 95-100 25-30 160 36 23 40 1985-2005 85-90 30-35
11、240 12 14 19 1985-2005 75-80 35-40 280 12 11 62 1985-2005 95-100 30-35 120 11 10 59 1985-2005 95-100 15-25 96 10 10 由表2可以看出四川和台湾地区以及藏南和台湾地区的相似度最高,本文针对这两组区域时间差在30天以内的地震相关工程进行研究,发现四川和台湾地区有41次地震具有相关性,藏南和台湾地区有36次相匹配的地震工程,而且地 震震级相似性也很高,具有相同的趋势和震匹配性。图1给出四川地区经度100-105,纬度25-30和台湾地区经度120-125,纬度20-25相关地震的M-T图
12、。图2给出了藏南地区经度95-100,纬度25-30和台湾地区经度100-105,纬度25-30相关地震的M-T图。实验2:固定时间差为1年的粗粒度相似性分析在实验1的根底上,我们把实验的时间阈值由30天放大到1年,局部震级有所调整的情况下由于四川台湾地区数据较多,震级提高到5级以上,实验结果发现多了一些区域具有相似性,其中相似度提高最明显的是四川和台湾地区以及藏中和四川-云南交界地区。图3表示了四川-云南交界地区经度90-100, 纬度25-30和藏中地区经度85-90,纬度30-35的M-T图,相匹配的地震条数由16次增加到23次。图4表示了四川地区经度100-105,纬度25-30和台湾地区经度120-125,纬度20-25的M-T图,相匹配的工程由28上升到41。实验3:固定时间差为10天的细粒度相似性分析在实验1和2的根底上,针对四川台湾地区和四川云南,藏中两组地区將时间阈值缩小到10天,震级阈值缩小到5级,进行相似度更为精确的相似匹配。得到实验结果如图5和图
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024-2030年全球及中国合成婴儿毛刷行业销售情况及营销渠道策略报告
- 2024-2030年全球及中国分布式边缘云行业发展态势及前景趋势预测报告
- 2024-2030年全球及中国人参市场营销态势及供需前景预测报告
- 2024-2030年全球及中国FRP复合材料行业产销状况及需求前景预测报告
- 2024-2030年全球DNA测序行业运作模式投资战略分析报告版
- 2024-2030年乳糖N四糖搬迁改造项目可行性研究报告
- 2024年夫妻财产分割无子女离婚协议书范本6篇
- 2024年知识产权侵权赔偿和解协议书3篇
- 2024年砌墙工程信息管理系统合同
- 2024年空间基础设施建设与运营合同
- 疫苗与冷链管理
- 化工行业基础知识培训
- 快递服务的危险源辨识与风险评价
- 2023年鳌江镇活动策划项目招标文件
- 2024年基本公共卫生服务项目全员培训试题及答案
- 科研成果总结报告
- 《货币金融学》蒋先玲版期末复习知识点总结
- 输卵管积水护理查房
- MBTI量表完整版本
- Morse跌倒危险因素评估量表
- 重症肺炎的基本知识宣教
评论
0/150
提交评论