版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1Classification System for Time Series Data Based on Feature PatternExtraction基于特征模式提取的时间序列分类系统Hiroshi Sugimura , Kazunori Matsumoto2引言 文献1:将频率模式作为特征模式,但很多情况下频率与感兴趣对象不相关 文献2:基于背景知识,通过可 视化查询语言获得相似模式 文献3:SVM分类(分类难以理解) 文献4:聚类法(一个用户难以确认所有的提取集群) 文献6:提取了一种决策树方法3基于特征模式提取的时间序列分类系统v系统特点:获取特征模式和分类时不需要使用者具备背景知
2、识v研究目的:通过提取特征模式获取每个数据的特征4基于特征模式提取的时间序列分类系统v系统构成:代表性序列特征模式创建决策树时间序列数据加窗子序列聚类T5对时间序列加窗v滑动窗v窗的长度为20个数据6基于特征模式提取的时间序列分类系统v系统构成:代表性序列特征模式创建决策树时间序列数据加窗子序列聚类T7聚类v采用K均值聚类法 聚类准则:每个数据与质心的距离(即类内误 差)为数据 和数据 之间的距离 为包含 的子集的 质心整个聚类空间的误差为:kjNijjicxDXErr11)(),()(jcjC)( jix),(qpDpq8聚类v(转载)K均值法的步骤:选取聚类数目K选择一个含有随机选择样本的
3、K个类的初始分区,然后计算这些类的质心。通过将样本分配给与其质心距离最近的类生成一个新分区。重新计算新类的质心。重复前两部的过程直到满足收敛标准9基于特征模式提取的时间序列分类系统v系统构成:代表性序列特征模式创建决策树时间序列数据加窗子序列聚类T10)log()(nNwidfi)(*),(),(*ikikiwidftwtftwIDFTFNnIDFTF/),(kitwtfiw逆文本频率指数:为文档总数目为单词至少出现一次的文档数目权重定义为:为词在该文档中出现的次数11 在文档挖掘中,被公认为一种重要的统计测量方法 在数据库中广泛存在的特征模式是对分类来说是不重要的 认为序列为文档,则其子序列
4、可视为短句(term)12基于特征模式提取的时间序列分类系统v系统构成:代表性序列特征模式创建决策树时间序列数据加窗子序列聚类T13动态时间规整(DTW) DTW用于计算两个序列之间的距离,获取两个序列采样点之间的最优化路线 一个计算两序列距离的简单方法是对他们中的一个进行重复取样,然后一个样本一个样本的比较14DTW(转载)注:假设测试和参考模板分别用T和R表示,为了比较它们之间的相似度,可以计算它们之间的距离 DT,R,距离越小则相似度越高syxDryxDqyxDyxDyxDjijijijiji),(),(),(min),(),(111111rq,s11,jiyxji ,两个不等长的两个时
5、间序列长度为:),(jiyxD它们的相似度函数 为:为序列最新的移除值为序列减小和拓展的序列数为距离值15分类-步骤 基于特征模式制作分类器 评价分类器1.改进特征模式16决策树学习17遗传算法GA-基因表达基因表达(基因与特征模式相关联)一个特征模式可用一组数值表示18遗传算法GA-适应度函数 适应度函数(该系统利用信息增益比评价基因)T为k个训练实例的一个序列,T属于类Cj,识别T中一个实例所属类别所需的信息量为:给予测试X的结果T分为n个子集,类似所需的信息量为:通过划分T和测试X一致部分,所获得的信息:19遗传算法GA-适应度函数适应度函数增益的准则偏向于高频数据,为了改进这一问题,对
6、信息增益规范化信息增益比定义为:20遗传算法GA-选择 采用轮转法轮转法步骤: 对群体成员的适应度累加求和,记为n 在0-n间产生一个随机数 返回第一个累加值大于该随机数的群体成员21遗传算法GA-复制 复制(繁殖) 通过交换和变异产生产生新一代(转载)GA的流程图http:/ 利用金融股票价格数据来测试该方法20genes时准确性大大提高,GA法改进后准确性更高23(转载)遗传过程24(转载)轮转法(适应度比例法)用适应度比例法进行选择时,首先计算每个染色体的适应度,然后按比例于各染色体适应度的概率进入交换(匹配)集的染色体,其具体步骤如下: 计算每个染色体的适应度值f(xi); 累加所有染色体的适应度值,得最终累加值SUM= ,记录对应于每个染色体的中间累加值g(xi); 产生一个随机数N,0NSUM; 选择其
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度诊所医师国际医疗交流与合作聘用合同
- 二零二五年度股东间股权转让与公司治理结构优化协议
- 二零二五年度城市综合体车位租赁与充电桩安全运营合同
- 二零二五年度深圳市市区房屋买卖合同电子印章服务合同
- 2025年度解除劳动合同员工离职手续办理及费用承担合同
- 辽宁省朝阳市名校2025届中考四模生物试题含解析
- 南京航空航天大学金城学院《曲式学基础》2023-2024学年第一学期期末试卷
- 南京城市职业学院《影视虚拟空间技术》2023-2024学年第一学期期末试卷
- 南昌大学《人机工程学基础》2023-2024学年第一学期期末试卷
- 闽西职业技术学院《临床基础检验学》2023-2024学年第一学期期末试卷
- 废旧物资处置申请表
- GB/T 8005.2-2011铝及铝合金术语第2部分:化学分析
- GB/T 37234-2018文件鉴定通用规范
- GB/T 31888-2015中小学生校服
- 质量检查考核办法
- 云南省普通初中学生成长记录-基本素质发展初一-初三
- 2023年系统性硬化病诊断及诊疗指南
- 外科医师手术技能评分标准
- 《英语教师职业技能训练简明教程》全册配套优质教学课件
- 采购控制程序
- 六年级上册数学简便计算题200题专项练习
评论
0/150
提交评论