海洋资源数据挖掘中的粗糙集理论与知识获取_第1页
海洋资源数据挖掘中的粗糙集理论与知识获取_第2页
海洋资源数据挖掘中的粗糙集理论与知识获取_第3页
海洋资源数据挖掘中的粗糙集理论与知识获取_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、海洋资源数据挖掘中的粗糙集理论与知识获取1、项目研究意义:随着社会经济的发展,海洋资源的利用与开发将越来越受到人们的重视。浙江省是一个海洋大省,近年来海洋渔业、海水养殖、海洋生物、海洋环境、海洋气候、港口等方面都有了很大的发展,积累了大量的海洋资源数据。如何从大量的、杂乱无章的、强干扰的数据中挖掘潜在的、有利用价值的知识与信息,给人工智能的信息处理提出了前所未有的挑战。人们希望有一整套理论与方法,能够提供合适的数学模型,让计算机能够快速地从大量的数据中提取潜在的有利用价值的知识与信息。粗糙集理论是波兰数学家ZPawlak提出的一种理论,它为分析不完整、不确定性数据提供了新的思路,该理论的最大特

2、点是无需提供问题所需处理的数据集合之外的任何先验信息,因此对问题的处理比较客观,真正体现了“让数据自己说话”的思想。本课题的目的是用粗糙集的理论与方法,在与海洋资源相关行业所积累下的大量的数据中,分别建立各种信息系统的数学模型,解决信息系统中的知识获取问题。本课题所研究的问题对海洋渔业、海水养殖、海洋生物、海洋环境、海洋气候、港口等领域有直接的应用价值,而且在交通运输、工程技术、管理科学研究与商业等领域有重要的参考价值。2、项目研究目标及与申请者研究工作长期目标的关系;本项目研究目标是用粗糙集的理论与方法,在与海洋资源相关行业所积累下的大量的数据中,分别建立各种信息系统的数学模型,解决信息系统

3、中的知识获取问题。申请者一直从事有关海洋资源方面的研究工作。曾经为一些单位和部门进行有关渔业资源的数据处理;曾经主持了 “数据挖掘技术在渔业资源分析中的应用研究”课题。申请者研究工作长期目标是希望从大量的杂乱无章的、强干扰的数据中挖掘潜在的、有利用价值的信息和知识,逐步建立一整套数据挖掘的理论与方法,并建立适当的数学模型让机器能快速自动地从大量数据库中提取潜在的有利用价值的知识与信息。把所得到的知识与信息提供给有关单位、部门,开发建立决策支持系统,用来指导生产实践,促进地方经济的发展。本课题正是利用粗糙集理论与方法,对长期积累的海洋资源数据进行数据挖掘,建立基于粗糙集的数据挖掘的理论和方法,提

4、取潜在的有利用价值的知识,用来指导生产实践,促进地方经济的发展。3、项目研究内容,研究方案和进度安排:项目研究内容:(1) 对于大量复杂的海洋资源数据,进一步收集、分类、整理,并且建立和完善数据仓库。(2) 研究海洋资源数据噪音处理方法。(3) 研究基于粗糙集理论的海洋资源数据的近似分类。(4) 针对海洋资源数据的特殊要求,研究知识约简的新方法。(5) 分析各种知识约简强弱关系,研究基于粗糙集的决策规则。研究方案:(1) 借鉴已有的数据库理论和方法,建立海洋资源数据仓库。(2) 借鉴已有的噪音处理理论结论与和方法,研究基于粗糙集的噪音处理方法,并用来去除数据仓库中的噪音。(3) 拟采用分类、聚

5、类和包含度方法,研究基于粗糙集理论的海洋资源数据的近似分类。(4) 由构造性定义得到近似算子,讨论决策属性与条件属性之间的联系与依赖关系,分析属性的重要性,在已有知识约简概念基础上, 提出一些针对不同要求的知识约简的新方法。(5) 拟采用分析的方法,研究粗糙集理论中的决策规则。进度安排:2005年1月至2005年6月:收集整理海洋资源数据,进行归类并建立数据仓库。2005年7月至2005年12月:研究基于粗糙集的噪音处理方法,并用来去除数据仓库中的噪音。2006年1月至2006年6月:研究基于粗糙集理论的海洋资源数据的近似分类。2006年7月至2006年12月:针对海洋资源数据的特殊要求,研究

6、知识约简的新方法。2007年1月至2007年6月:分析各种知识约简强弱关系,研究基于粗糙集的决策规则。2007年7月至2007年9月:对每个专题给出各自的研究策略, 并逐步加以实施。2007年10月至2007年12月:努力扩大研究的结果,总结本项目的研究成果。4、项目创新之处:在海洋资源数据挖掘中,人们对收集的数据进行了许多统计分析,揭示了一些规律。但大多数建立在先验假设的基础上,有一定的局限性。本项目正是利用粗糙集理论与方法,抛开一切先验假设,探索海洋资源数据中的本质规律,建立一整套基于粗糙集的数据挖掘方法,揭示潜在的有利用价值的知识,用来指导生产实践,促进地方经济的发展。5、工作基础与工作

7、条件:申请人曾经主持了项目“数据挖掘技术在渔业资源分析中的应用研究”,积累了丰富的原始资料和数据分析的基本经验。申请人曾经主持了项目“基于粗糙集的算法研究与实现”,又参与项目“复杂系统不确定性分析的粗糙集方法”,对于粗糙集的理论和基于粗糙集的算法有了较好的掌握,为下一步工作打下了基础。项目组成员有多年的研究经验及扎实的理论基础,各位成员长时间从事科研实践活动,积累了丰富的经验,并且都具有跨专业分工协作的能力。6、预期研究结果及其利用研究结果的计划和今后发展的思路:(1)对已收集的海洋资源数据,进行归类整理,建立数据仓库。将来可以逐步增加和完善,并针对某一具体应用进行应用开发。(2)探索基于粗糙

8、集的噪音处理方法,将来可以应用到其他领域中。(3)将基本完成复杂数据中知识系统的结构特征,形成基于粗糙集的数据挖掘理论和方法。理论部分问题难度较大,估计其进展会慢一些。(4)归纳总结基于粗糙集的数据挖掘方法,将来为具体生产实践建立决策支持系统,服务于地方经济建设。(5)研究成果有的将以学术论文的形式总结出来,并将投寄国内外重要期刊;原始数据将会以数据库文件的形式存储磁盘或光盘中;算法的实现将会以程序的形式保存;围绕数据库的应用开发,将会以软件的形式保存。主要参考文献:1 Pawlak Z., Rough Sets: Theoretical Aspects of Reasoning about

9、Data. Kluwer Academic Publishers, Boston, 1991.2 Pawlak Z., Rough sets, decision algorithms and Bayes theorem. European Journal of Operational Research, 2002, 136, 181-189.3 Beynon M., Reducts within the variable precision rough sets model: A further investigation, European Journal of Operational Re

10、search, 2001, 134, 592-605.4 Dubios D., Prade H., Rough fuzzy sets and fuzzy rough sets, International Journal of General Systems, 1990, 17, 191-209.5 Grzymala-Busse J., Zuo X., Classification strategies using certain and possible rules, In: LNAI 1424, RSCTC98, Springer, Berlin, 1998.6 Hong T.-P., W

11、ang T.-T., Wang S.-L., Knowledge acquisition from quantitative data using the rough-set theory, Intelligent Data Analysis, 2000, 4, 289-304.7 Kryszkiewicz M., Rough set approach to incomplete information systems, Information Sciences, 1998, 112, 39-49.8 Kyszkiewicz M., Comparative study of alternati

12、ve types of knowledge reduction in insistent systems, International Journal of Intelligent Systems, 2001, 16, 105-120.9 梁吉业, 徐宗本,The algorithm on knowledge reduction in incomplete information systems. International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems, 2002, 10(1), 95-103. 1

13、0 梁吉业等,A new method for measuring uncertainty and fuzziness in rough set theory, International Journal of General Systems, 2002, 31(4), 331-34211 梁吉业, 徐宗本, 李月香,包含度与粗糙集数据分析中的度量, 计算机学报, 2001, 24(5), 544-547.12 刘清等,带Rough算子的决策规则及数据挖掘中的软计算, 计算机研究与发展,1999, 36, 800-804.13 刘清, Rough集与Rough推理, 科学出版社, 2001.1

14、4 王国胤,于洪,杨大春,基于条件信息熵的决策表约简,计算机学报,2002,25(7), 759-766.15 吴伟志,梁怡,张文修, Connections between rough set theory and Dempster-Shafer theory of evidence, International Journal of General Systems, 2002, 31(4), 405-430. 16 吴伟志,张文修,Neighborhood operator systems and approximations, Information Sciences, 2002, 14

15、4(1-4),201-217.17 徐宗本,梁吉业等,Inclusion degree: a perspective on measures for rough set data analysis, Information Sciences, 2002, 141,227-236.18 米据生, 吴伟志, 张文修,粗糙集的构造与公理化方法. 模式识别与人工智能, 2002, 15(3), 280-284.19 苗夺谦,王珏,粗糙集理论中知识粗糙性与信息熵的讨论, 模式识别与人工智能, 1998, 11,34-40.20 苗夺谦, 胡桂荣, 知识约简的一种启发式算法, 计算机研究与发展, 1999

16、, 36(6),681-684.21 张文修, 徐宗本, 知识系统与认知分析, 系统工程的理论与实践, 2002, 22(10), 118-122, 127.22 张文修, 米据生, 吴伟志, 不协调目标信息系统的知识约简, 计算机学报, 2003, 26(1), 12-18.23 李翠平,李盛恩,王珊,杜小勇,一种基于约束的多维数据异常点挖掘方法,软件学报, 2003 , 14(9) ,1571-1577.24 康卓,黄竞伟,李艳,康立山,复杂系统数据挖掘的多尺度混合算法,软件学报,2003 , 14(7) ,1229-1237.25 钱卫宁,魏藜,王焱,钱海蕾,周傲英,一个面向大规模数据库的数据挖掘系统,软件学报,2002 ,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论