基于网格数据挖掘体系结构设计_第1页
基于网格数据挖掘体系结构设计_第2页
基于网格数据挖掘体系结构设计_第3页
基于网格数据挖掘体系结构设计_第4页
基于网格数据挖掘体系结构设计_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于网格数据挖掘体系结构设计提纲相关知识课题背景研究现状研究内容进度安排参考文献数据挖掘数据挖掘(DataMining:DM)定义为从数据中抽取隐含的、以前未知的和潜在有用的模式的非平凡过程。数据挖掘使用机器学习、统计和可视化等技术来发现知识,并以易于人们理解的方式展现知识。网格计算(GridComputing)将服务器、存储系统和网络联合在一起,组成一个大的系统,从而为用户提供功能强大的多系统资源来处理特定的任务。对于最终用户或应用程序来说,数据文件、应用程序和系统看起来就像是一个巨大的虚拟计算系统。与集群,P2P有区别Globus项目

Globus项目是美国Argonne国家实验室的研发项目,Globus对信息安全、资源管理、信息服务、数据管理以及应用开发环境等网格计算的关键理论和技术进行了广泛的研究。GlobusToolkit,能够用来帮助规划和组建大型的网格试验和应用平台,开发适合大型网格系统运行的大型应用程序。Globustoolkit组件工作流(Workflow)课题背景在网格环境下,结合高性能的数据挖掘算法,实现一体化的数据挖掘平台,建立面向生物信息学的应用网格门户(Portal)。有助于研究生物信息学中的问题,如基因/蛋白质的序列分析、结构辨识及其它们之间的相互作用,从而加快他们的决策过程。基于网格数据挖掘网格上含有丰富的数据,是数据挖掘的理想目标。网格提供资源共享、安全机制、高性能计算能力及其分布的任务协调机制研究现状(1)DiscoveryNet是英国帝国大学开发的分布式知识发现平台。系统建立在Globus之上专注于高性能的挖掘算法和工作流发现工具开发,提供基于网格的知识发现服务。研究现状(2)GridMiner该系统实现了两种数据挖掘体系结构:基于中心化处理的数据挖掘和基于分布式处理的数据挖掘。其作业的调度和管理均交由Globus处理。侧重与网格环境下OLAP的实现研究现状(3)KnowledgeGrid侧重于知识标注研究内容开发网格数据挖掘平台数据挖掘工具的自适应描述框架(AdaptiveDescriptionFramework:ADF)基于webservice的数据挖掘算法挖掘模型的可视化网格生成数据(provenancedata)的挖掘开发网格数据挖掘平台建立在OGSI(OpenGridServiceInfrastructure)之上

网格中间件:GlobusToolkit4

工作流软件:TavernaSOA(Service-OrientedArchitecture)系统实现了一系列独立的webservice,每个webservice具有独立完整的功能,将这些服务组合起来构成了一个高度模块化,交互化,可重用,可扩展,易于维护的系统主动服务(ActiveService)

推荐数据挖掘工具自适应描述框架挖掘算法在不同的应用系统中,由于在输入数据格式、算法参数设置、挖掘模型表达和评价等方面的不同存在着很大差别。这在某种程度上,阻碍或延缓了数据挖掘在应用中的普及和推广。借鉴WebService及其SOAP对计算资源的描述和消息传递机制,在PMML的基础上,定义适于数据挖掘和模型表达的描述规范。建立基于WDSL的数据挖掘工具描述语言。算法的webservice形式Webservice实现资源的共享和程序共享,软件的复用同一个程序可以由不同的软件去调用

将Weka提供的数据挖掘程序包装成webservice。数据挖掘模型可视化数据挖掘结果的可视化提供用户直观的图象是一种趋势PMML->SVG->JPEG网格生成数据挖掘网格生成的数据包括对资源的描述数据、工作流描述数据等。对网格环境的健康性和协调性至关重要建立网格生成数据的历史数据库,记录数据的产生、变换及参与的其他活动。通过对历史数据库的挖掘,来发现网格环境中发生的主要活动及其规律体系结构资源层Globus层资源信息层TavernaWeb浏览器程序(如数据挖掘webservice)GRAMMDSSecurityDataManagementWeb门户Broker主动服务知识库硬件资源用户证书用户证书数据存取

Web部分VO节点1节点2Web门户Web浏览器显示部件控制部件webserviceMDSMDSwebservice逻辑部件知识库工作流(Workflow)部分Taverna数据挖掘服务知识库可视化数据存取主动服务进度安排2007-04-01至2007-5-31:阅读相关文献。2007-06-01至2007-7-31:完成系统体系结构总体设计。2007-08-01至2007-8-31:验证系统设计的可行性。2007-09-01至2007-10-31:掌握如何使用globus提供的接口进行编程。2007-11-01至2007-12-31:实现系统原型。2008-01-01至2008-3-15:完善系统功能。2008-03-16至2008-5-31:完成论文写作。参考文献[1]IanFoster,CarlKesselman,StevenTuecke.TheAnatomyoftheGrid:EnablingScalableVirtualOrganizations,IJSA,2001.[2]IanFoster,CarlKesselman,JeffreyM.Nick,StevenTuecke.ThePhysiologyoftheGrid:AnOpenGridServicesArchitectureforDistributedSystemsIntegration(draft),2002.[3]IanFoster.GlobusToolkitVersion4:SoftwareforService-OrientedSystems.IFIPInternationalConferenceonNetworkandParallelComputing,Springer-VerlagLNCS3779,pp2-13,2006.[4]BorjaSotomayor.TheGlobusToolkit4Programmer’sTutorialhttp:///gt4-tutorial/,2004-11-06.[5]Rowe,A.,etal.,TheDiscoveryNetSystemforHighThroughputBioinformatics.Bioinformatics,2003.19(suppl.1):p.i225-i231.[6]Brezany,P.,Hofer,J.,Tjoa,A.M.,Woehrer,A.:Towardsanopenservicearchitecturefordataminingonthegrid.ConferenceonDatabaseandExpertSystemsApplications(2003).[7]Brezany,P.andTjoa,I.A.M.,GridMiner:AFundamentalInfrastructureforBuildingIntelligentGridSystems.WebIntelligence,2005.Proceedings.The2005IEEE/WIC/ACMInternationalConferenceon,2005:p.150-156.[8]Gong,X.,etal.TowardBuildingGridApplicationsinBioinformatics.in4thAustralasianSymposiumonGridComputingande-Research.2006.Tasmania,Australia.[9]Khoussainov,R.,Zuo,X.,Kushmerick,N.:Grid-enabledWeka:AToolkitforMachineLearningontheGrid.ERCIMNews,n.59(2004).[10]Domenico

Talia,PaoloTrunfio,Oreste

Verta,Weka4WS:aWSRF-enabledWekaToolkitforDistributedDataMiningonGrids.Proc.ofthe9thEuropeanConferenceonPrinciplesandPracticeofKnowledgeDiscoveryinDatabases(PKDD2005),Porto,Portugal,October2005,LNAIv

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论