开题报告-空间聚类_第1页
开题报告-空间聚类_第2页
开题报告-空间聚类_第3页
开题报告-空间聚类_第4页
开题报告-空间聚类_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

各位博士、硕士、工程硕士硕士:为做好学位论文选题及开题汇报工作,在填写背面的《硕士学位论文开题汇报登记表》前,请认真阅读下文《有关硕士学位论文选题及开题汇报的规定》。登记表仅作为开题汇报的格式,所留的空格不够时请自行加页。根据《中华人民共和国学位条例暂行实行措施》中“硕士学位论文开题、答辩一般应公开举行,保密专业除外”的规定,我院研制了“硕士学位论文开题、答辩网上公告系统”,现已上网运行。请全体硕士注意在张贴开题、答辩布告的同步,使用此系统。从1月1日起开题、答辩的硕士都须在网上公告,否则开题及答辩无效。在完毕表格中的论证内容、导师签订意见、通过评议组专家评议、教研室以及院系签订意见后,请将《登记表》用A4纸打印1份,硕士生、工程硕士生请提交给所在院系硕士秘书,博士生请提交给硕士院学位办(从9月开始规定博士生到设在校图书馆的查新站对开题汇报进行查新工作,故请同步提交查新成果1份)。有关硕士学位论文选题及开题汇报的规定硕士学位论文工作是硕士培养的重要环节和重要内容。学位论文是硕士尤其是博士生学术水平和科研成果的集中体现,是衡量硕士培养质量和水平的重要标志之一,而做好学位论文选题和开题汇报又是完毕学位论文的前提和基础。因此,为了切实保证硕士的学位论文质量,做好学位论文选题及论文开题汇报是十分必要的。一、学位论文选题选题是学位论文成败的关键。因此规定导师、导师组及硕士本人要十分重视选题工作。硕士应在大量阅读文献、资料和充足调查研究的基础上进行选题。(一)博士学位论文选题规定到达前沿性、交叉性、急需性、实用性、创新性、可行性。详细规定如下:1.选题必须具有学科的前沿性;2.在选题上要注意学科间的互相交叉渗透;3.选题要重视国家急需处理的重大课题;4.选题要重视实用性,要面向国民经济的主战场;5.选题的指导思想、技术路线等,必须有创新性,同步还应与科学发展趋势相一致;6.选题要考虑到完毕论文的可行性(如:经费、试验仪器、设备、加工、资料等)。选题不易过大,要可以在规定的时间内完毕学位论文。(二)硕士学位论文选题规定硕士学位论文选题的内容、范围要合适。目的明确,在理论上和应用上要有相称重要的意义。选题既要面向国民经济建设的需要,为社会主义建设服务,同步又是本学科发展需要的理论或应用研究,要在理论上和应用上有相称重要的意义。尽量与科研任务挂钩,使硕士生处理实际问题的能力得到锻炼,既有助于提高论文的质量,增进成果转化,又能处理经费来源。对自选题应采用谨慎态度,个别自选题必须在看准方向、目的明确并已具有一定物质条件下才能考虑。(三)工程硕士论文选题工程硕士专业学位论文选题应直接来源于生产实际或具有明确的工程背景,其研究成果要有实际应用价值,论文拟处理的问题要有一定的技术难度和工作量,论文要具有一定的理论深度和先进性。详细可从如下几种方面选用:1.技术攻关、技术改造、技术推广与应用;2.新工艺、新材料、新产品、新设备的研制与开发;3.引进、消化、吸取和应用国外先进技术项目;4.应用基础性研究、预研专题;5.一种较为完整的工程技术项目或工程管理项目的规划或研究;6.工程设计与实行。二、学位论文开题汇报及查新开题汇报是对论文选题的科学性、先进性、可行性等的论证,是提高学位论文质量和准时完毕学位论文的重要环节。各硕士培养单位、硕士导师、导师组和硕士本人必须从思想上予以高度重视,高原则,严规定,严格遵照本规定有关规定,否则,将不容许硕士进入论文阶段。(一)开题汇报的准备工作:1.开题前,硕士必须做较全面深入的调研工作,并写出详细的调研汇报。2.硕士必须写出开题汇报的书面论证材料和学位论文的工作计划。3.凡需进行论文开题的硕士,应从硕士院网页上下载并填写《硕士学位论文开题汇报登记表》。(二)开题汇报的重要内容:1.课题的来源、目的和意义;2.选题的国内外研究现实状况、发展趋势及存在问题(附重要参照文献);3.选题研究目的、研究内容和拟处理的关键问题;4.拟采用的研究措施、技术路线、试验方案及可行性分析(已经有的研究工作基础和研究条件);5.选题的创新点(选题的前沿性、急需性、学科交叉性、应用性等);6.选题研究及论文工作计划;7.预期研究成果。(三)对开题汇报的查新工作:博士学位论文开题汇报完毕后,规定送交学校“教育部科技查新工作站”(设在校图书馆)进行查新,并获得查新成果。硕士学位论文开题汇报完毕后,鼓励进行查新工作。(四)开题网上公告:凡拟开题的硕士,必须提前1周在硕士院网页上按规定的格式进行公告。三、对学位论文开题汇报的管理1.硕士学位论文的开题汇报由学位办负责管理,各院(所、部)详细组织实行。2.各院(所、部)或教研室应构成开题汇报评议组对硕士的开题汇报进行评议。博士生开题汇报评议组不少于5人,硕士生不少于3人,设组长1人,导师不能担任组长。评议组的职责是:按照有关规定对开题汇报进行严格认真的评议,坚持高原则、严规定,对开题汇报提出详细评议意见,并给出通过或暂不通过或重新做开题汇报的结论。3.凡未通过开题汇报,需重新做开题汇报的硕士,应根据评议组意见,进行认真调研、充足准备,在条件成熟时再次做开题汇报,直至通过。4.若未通过开题汇报而自行进入学位论文阶段的,硕士院学位办将不接受其学位申请。5.已通过论文开题汇报的硕士,因某种原因更改选题,则需重新开题;若只是在原选题基础上拓宽或缩小研究范围,则须向学位办提出书面汇报立案。6.硕士开题一般在第三学期进行,但最晚必须在学位论文答辩前6个月完毕开题工作。7.开题汇报工作结束后,硕士、工程硕士将《学位论文开题汇报登记表》(1份)提交各院(所、部)硕士秘书,博士生将《学位论文开题汇报登记表》(1份)和学位论文开题汇报查新成果(1份)提交学位办。选自《硕士管理工作手册》(8月第四次修订版))学号:10609中国地质大学(武汉)硕士学位论文开题汇报登记表学科专业:计算机科学应用技术论文题目:空间聚类的研究与实现硕士姓名:余艳(硕士)导师姓名:周顺平(专家)所在院系:信息工程学院开题日期:-11-1硕士院制

填表说明一、填表前,请认真阅读学校《有关硕士学位论文选题及开题汇报的规定》。表中各项内容,要实事求是,逐项认真填写。体现要明确、严谨。二、封面中“学科专业”请博士生、硕士生严格按规定的二级学科、专业名称填写,工程硕士生请将此项改为“工程领域”并填写规定的工程领域名称,工程硕士为双导师制,故应填写两位导师姓名。三、填写表中第一页“简表”时:对于“选题类型、选题来源、经费来源”三项内容,请把各自所选字母填入项目背面的空格中。辨别基础研究和应用研究的重要标志:具有特定的实际应用目的的研究属于后者;辨别科学研究(基础研究和应用研究)与开发研究的重要标志:前者重要是为了增长科学技术知识,后者则是为了开辟新的应用(如新材料、新技术、新工艺等)。“摘要”的填写请严格按所留空格逐格填写。四、表中第二页、第三页、第四页所列项目是开题汇报的重要内容,须逐项、逐条进行详细论证、填写,所留空格不够时,请自行加页,页码按次序编。五、表中第五页中各意见栏须由有关人员亲笔填写,不得打印。开题汇报评议小组构成规定:博士生至少5人,硕士生至少3人,每组设组长1人,且硕士本人的导师不能担任组长。六、表格完毕后,请用A4纸装订成册1份,硕士生、工程硕士生交所在院系硕士秘书,同等学力人员交硕士院学位办,博士生交硕士院学位办(同步须提交1份查新汇报)。

一、简表论文题目空间聚类的研究与实现选题类型A.基础研究B.应用研究C.开发研究D.其他B选题来源A.国家级项目B.省部级项目C.横向项目D.自选项目C经费来源A.课题B.资助C.自筹A硕士姓名余艳性别女学号导师姓名周顺平性别男职称专家研究内容和意义摘要空间数据聚类是在一个较大的多维数据集中根据以某种度量为标准的相似性找出簇或稠密区域。空间统计分析可以从地理空间实体数据集中发现隐含的信息或知识。不同的聚类方法对数据的处理效果不一样。本课题针对空间数据的特性选取有代表性的聚类方法实现空间数据的最佳聚类分析。主题词1.主题词数量不多于三个;2.主题词之间空一格(英文用/分隔)中文空间数据聚类分析英文spatialdataclusteranalyze注:辨别基础研究和应用研究的重要标志:具有特定的实际应用目的的研究属于后者;辨别科学研究(基础研究和应用研究)与开发研究的重要标志:前者重要是为了增长科学技术知识,后者则是为了开辟新的应用(如新材料、新技术、新工艺等)。-1-二、选题根据1.选题的来源、目的和意义选题的来源:空间数据表达的基本任务,就是将以图形模拟的空间物体表到达计算机可以接受的数字形式。空间数据有两种基本的表达模型:栅格模型和矢量模型。在栅格模型中,地理空间被划分为规则的小单元(像元),空间位置有像元的行、列号表达。像元的大小反应了数据的辨别率即精度,空间物体由若干像元隐含描述。矢量模型将地理空间当作一种空域,地理要素存在其间。在矢量模型中,各类地理要素根据其空间形态特性分为点、线、面三类。在用空间数据描述的地理信息中,有时需要根据某种原则将有用或人们感爱好的数据汇集和分类,来发现地理数据中隐含的信息或变化的趋势。其中,聚类分析是用来研究和分析空间数据的首选。聚类分析是人类的一种重要行为。人类就是不停通过改善意识中的聚类模式来识别各类事物的。目前聚类分析已经广泛应用于包括模式识别、数据分析、图像处理、市场分析等领域,通过聚类分析,我们能识别密集和稀疏的区域,进而发现全局的分布模式,以及数据属性之间有趣的互相关系。空间数据聚类是在一种较大的多维数据集中根据以某种度量为原则的相似性找出簇或稠密区域,在同一种簇中的对象之间具有较高的相似度,而不一样簇中的对象差异较大。相异度是根据描述对象的属性值来计算的,距离是常常采用的度量方式。空间聚类对空间物体的集群性进行分析,将其分为几种不一样的子群(类)。子群的形成是地理系统运作的成果,根据此可以揭示某种地理机制。此外,子群可以作为其他分析的基础。例如:公共设施的建立一般的说是根据居民点群的分布,而不是详细的居民住宅的分布来布置的,因此需要对居民点群进行聚类分析以形成若干居民点子群,这样便于简化问题,突出重点。目的和意义:空间聚类分析可以从地理空间实体数据集中发现隐含的信息或知识,重要有地理空间实体凝聚的趋势、分布规律和变化趋势等。地理空间实体分布规律揭示了空间实体的群体定位特性。分布规律一般用分布密度与均值、分布中心、分布轴线和离散度参数来描述。空间聚类分析是揭示空间实体的群体定位特性的常用措施之一。地理空间实体发展变化趋势是指空间实体的分布形状与理论扩展形状的差异特性、空间实体分布形状随时间变化的变化特性、空间实体的非空间属性在2维或3维空间上的变化状况。空间聚类分析规定能发现任意形状的聚类,将得到的聚类形状与理论扩展形状(球形、椭圆形或方形)相比较可以发现许多故意义的隐含信息。2.选题的国内外研究现实状况、发展趋势及存在问题(附重要参照文献)国内外研究现实状况:20世纪90年代中期,空间聚类重要集中在两个方面:一是对初期算法的改善,二是开辟新的算法。例如,WaveCluster和DENCLUE等。然而,后期的研究发现,聚类空间数据仍然面临新的问题:(1)处理大量数据点;(2)处理高维数据;(3)处理多噪声。某些新的技术,如取样本,浓缩技术、索引技术和基于网络的技术逐渐应用到聚类中,某些性能较优的算法也相继的提出。重要有CLARANS,DBSCAN,BIRCH,STING,CLIQUE,CURE,OPTICS和CHAMELEON等算法。不过这些算法只能处理其中的一种或两个问题,并不能处理以上三个问题。近几年的某些新的研究着眼于对此前算法的深入改善和寻找新的聚类途径。例如:STING+,MAFIA,OPTIGRID,AMOEBA,COD-CLARANS,DBCLUC,DBRS和DBRS+等,他们开辟了空间聚类的新方向。发展趋势:目前聚类分析已经广泛应用于包括模式识别、数据分析、图象处理、市场分析等领域,通过聚类分析,我们能识别密集和稀疏的区域,进而发现全局的分布模式,以及数据属性之间有趣的互相关系。例如在市场分析中,聚类可以协助市场分析人员从客户的基本信息中获取各类不一样的顾客群,从而指导市场营销的方略;在模式识别上,通过聚类可以提取不一样模式之间的共性特性,然后运用这些特性,用于识别同类模式和不一样类模式;在生物信息学中,聚类可以指导生物的分类,可以通过对基因进行分类,获取对不一样种群生物的特性的认识。聚类分析在空间数据挖掘、web文档分类、离群点检测等方面也发挥着重要的作用。目前,伴随人工智能和数据挖掘技术的不停深入,聚类分析得到了不停的发展,尤其是伴随多种数据源的大量涌现,如图像数据、文本数据、DNA数据、时间序列数据、web数据等等,对聚类的研究已经成为数据挖掘领域中一种非常活跃的研究课题。存在问题:在人工智能和数据挖掘中,存在着大量的将数据划分的问题,这些问题常常是没有先验知识的,这些问题的处理都需要聚类分析的参与,伴随大量、不一样数据类型的涌现,对聚类分析的能力也提出了挑战。评价聚类分析的能力重要有六个衡量原则:(1)处理大量数据的能力,许多算法在不不小于200个数据对象的小数据集合上工作很好,不过伴随数据对象的增长,这些聚类算法的处理能力就会下降,因此一种好的聚类措施需要处理大量数据集合。(2)处理不一样类型数据的能力,目前的聚类算法一般只是针对某种数据类型,不过聚类作为一种分析工具,应当能为不一样类型数据进行分析,从而提供一种较普适的模型。(3)能过发现任意形状聚类的能力,许多聚类算法采用欧式距离来决定相似度,这种度量方式趋向于发现球(超球)簇,而现实种有着大量各类形状的簇,因此需要聚类可以发现任意形状的簇。(4)处理噪声的能力,现实数据不可防止的存在各类噪声,这些噪声的出现不应当对聚类产生较强的影响,不过有些聚类算法对噪声式敏感的,因此导致了较差的成果。(5)处理高维数据的能力,目前的数据集合具有各类不一样属性,这就使得数据处在高维空间中,人们对于三维如下的数据聚类状况可以很好的鉴别聚类成果的好坏,不过在高维状况下,考虑到数据分布也许很稀疏,并且高度倾斜,因此聚类这样的数据对象是一种具有挑战性的课题。(6)聚类成果的课解释性,聚类是为分析数据服务的,人们期望通过聚类从数据中抽取给出某种特定语义的解释,也就是聚类的成果应当是可解释的、可理解和可用的。参照文献:[1]、《基于网络的异常入侵检测措施》作者:赵卫伟,计算机工程与应用[2]、《一种区域型模糊聚类算法》作者:黄晓斌,马晓岩等,计算机工程与应用.21[3]、《用于数据挖掘的聚类算法》作者:姜园、张朝阳等,电子信息学报[4]、《一种基于划分的动态聚类算法》作者:万志华、欧阳为民等,计算机工程与设计.1[5]、《一种改善的K-means算法》作者:张玉芳、毛嘉莉等,计算机应用.8[6]、《一种新的聚类算法:等密度线算法》作者:赵艳厂、谢帆等,北京邮电大学学报.6[7]、《Web文档聚类中K-means算法的改善》作者:王子兴、冯志勇,微型机与应用[8]、《基于簇中心动态迁移的一种聚类算法》作者:李丽珊,朱文兴,福建农林大学学报.12[9]、《基于网格距离的聚类算法的设计、实现和应用》作者:田启明,王丽珍等,计算机应用.2[10]、《聚类问题的蚁群算法》作者:崇高等,计算机工程与应用.8[11]、《中文文本分类器的设计》作者:陆建江,张文献,计算机工程与应用.15[12]、《使用遗传算法实现K-means聚类算法的K值选择》作者:杨芳等,微机发展.1[13]、《数据聚类技术的研究》作者:张蓉,计算机工程与应用,.16[14]、《文本聚类算法的分析与比较》作者:谷波,张永奎,电脑开发与应用,[15]、《面向非球形分布数据的自适应K近邻聚类算法》作者:黄晓斌,万建伟等,计算机工程,.7本栏填写不下,可加续页。-2-三、选题研究方案1.选题研究目的、研究内容和拟处理的关键问题研究目的:重要的聚类措施及其聚类能力。选用不一样的聚类算法对空间数据(分为地理数据和属性数据)聚类。分析聚类成果,找到最优的聚类措施。完毕基于大型GIS平台的空间数据聚类的可视化工具。完毕论文1-2篇。研究内容:重要的聚类措施。不一样聚类措施的合用数据类型和聚类能力。整顿经典的较为完善和成熟的聚类算法以及部分改善了的能力较强的聚类算法。将空间数据分为描述实体地理位置的数据和属性数据分别选用相对较合适的聚类措施进行聚类。对同一空间数据选用不一样的聚类算法比较聚类成果得到最优算法。关键问题:不一样聚类措施的合用数据类型和聚类能力。不一样类型的空间数据找到最合适的聚类措施。2.拟采用的研究措施、技术路线、试验方案及可行性分析(已经有的研究工作基础和研究条件)研究措施:由于本课题是面向应用的,不仅是面向数据库的简朴检索查询调用,并且要对这些数据进行微观、中观乃至宏观的记录、分析、综合和推理,以指导实际问题的求解,企图发现事件间的互相关联,甚至运用已经有的数据对未来的活动进行预测,因此,我打算从基本入手。首先熟悉基本概念和有关背景,接着搜集和整顿已经有的聚类措施,包括每种聚类措施合用的数据类型、聚类能力和聚类效果等,接下来,将空间数据分为矢量数据和属性数据,针对它们不一样的特性分别选用较为合适的聚类措施进行聚类,并比较聚类成果进而得到最优解,最终,设计和实现数据聚类仪。技术路线:对空间数据的聚类重要分两类:一类是直接根据空间目的的几何数据进行聚类,其相似性的鉴别原则重要是距离,另一类是对空间目的关联的属性数据进行聚类,其措施是将属性数据看作低维或高维的几何数据,其相似性的鉴别原则重要是欧氏距离。试验方案:1、将几何数据用划分措施、层次措施、基于密度的措施和基于模型的措施中的经典聚类算法进行聚类,得到的聚类成果均有不理想的地方。2、由于经典的聚类措施有其局限性,逐渐引入改善了的聚类措施对几何数据聚类。3、比较用不一样的聚类措施得到的聚类成果,得到不一样数据的最优聚类措施。4、将属性数据当作低维或高维的几何数据,用几何数据聚类的措施得到最优成果。可行性分析:本课题实现的关键在于聚类相似度的选用和聚类算法思想确实立。几何数据的聚类相似度一般选用欧氏距离,但在将聚类行为看作动态过程的聚类措施中,欧氏距离不能作为唯一的相似度,这时需要用势函数作为鉴别聚类的原则。在用经典的划分措施对数据进行聚类时,聚类成果对聚类个数和数据输入的次序敏感,采用动态聚类算法能很好的处理此问题,在聚类的大小相差悬殊或聚类形状非凸时,MMC聚类措施能得到较优的成果。本栏填写不下,可加续页。-3-3.本选题的创新点(选题的前沿性、急需性、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论