数据挖掘方向【开题报告】_第1页
数据挖掘方向【开题报告】_第2页
数据挖掘方向【开题报告】_第3页
数据挖掘方向【开题报告】_第4页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

开题报告.研究(设计)目的意义及国内外研究状况和应用前景(附参考文献):研究(设计)目的意义随着我国经济的快速发展,各行各业的信息量正呈现爆发性增长趋势,其中极具代表性的是数据量以50%以上的年成长量不断刷新纪录。为了应对数据成长的压力,人们需要更多的技术与产品来满足数据成长的需要。而数据挖掘技术恰恰能做到这一点。近年来,随着计算机技术、信息技术的飞速发展,生活中涌现众多的各种形式的数据,我们采用多种方式整理以及储存。而数据的大量增长采用普通的数据统计方式难以满足大数据的收集以及整理需求,数据库能够对数据进行统计、查询以及录入等作用,然而数据之间的关系以及数据内部存在的规律,甚至于数据未来的发展趋势,采用数据库难以进行预测以及提取。现实生活中爆炸式的大数据采用传统的数据统计方式难以达到预期目的,因而,人们急需一种新型技术或者数据整理工具,从而协助人们从大量的数据信息当中找到自己最感兴趣的信息或者总结出对自己有益的规律,数据挖掘技术应运而生。数据挖掘是一门新型的、发展快而形成成熟的学科,其又被称之为数据信息当中的知识发现,其主要过程是采用某种科学的方法或知识,在大量的数据信息当中找出数据内在的规律以及联系,从而进行数据分析获得对人们有益的内在信息,按照不同的情形构建不同的数据挖掘模型,并且获得所需的知识。同时,挖掘出的这些隐藏的信息作为决策者的决策依据,成为决策者策略的制定的重要依据。数据挖掘为一门综合性的学科,其综合采用数据可视化、高性能计算、智能技术、模式识别技术、数据库存储技术、网络技术等多个领域的知识完善其自身的知识范畴。通过数据挖掘形成的信息以及数据广泛应用在科学研究、商务决策及其电子商务等各个领域,除此之外计算机网络、银行业务、金融等各个领域得到推广。数据挖掘不同于数据库系统的简单统计、查询功能,其通过一定的算法将数据当中内在的规律或模式找出,将有使用价值的模式当作处理实际问题的参考依据或者决策依据,同时采用现有的信息或知识预测对象的发展趋势。本文以矿井人员为源数据。球员数据当中包含众多的数据,通过对该类数据进行聚类分析。这些数据中记录了几十次的数据调用,其中考虑了下面不同的因素:姓名、身高、体重、所属班组、所属工种、职务、本人照片、血型等因素,因此可以基本满足完备性的要求。国内外研究状况数据挖掘技术使得在大量数据中找出有价值的内在的规律以及知识成为现实,当前国内外众多学者从事该数据挖掘技术的研究,国外较为成功的有R.Aggrawal所带领的IBMAlmaden实验室,加拿大SimonFraster大学成立的KDD课题研究小组,其研究了多种数据挖掘算法,在各个行业取得了较为成功的应用,同时也吸引了众多的商业机构以及研究学者开展数据挖掘技术的研究,同时也涌现出各种类型的数据挖掘系统,并且成功的在金融、经济、商业等行业取得成功应用。近年来,国外数据挖掘的研究趋势主要为数据挖掘技术算法的研究,例如,重点研究了Bayes(贝叶斯)方法和Boosting方法深入研究;数据挖掘技术中融入了传统的统计学回归方法;数据库技术与数据挖掘技术的紧密融合。数据挖掘技术应用方面主要为数据挖掘商业应用软件的逐步完善与提升,重点关注系统的研究,并非某个点的研究。数据挖掘商业软件主要应用在金融行业、保险业务以及电信业务等方面。国外目前著名的计算机企业在数据挖掘方面投入大量的资源,其中微软、IBM都成立了该方面的研究中心,并且研制出了类似Platinum、B0以及IBM等数据挖掘软件。通过软件实现数据挖掘是当前信息化技术发展的结果,当目前为止,数据挖掘软件历经了4个发展阶段。第一个阶段的数据挖掘程序仅能支持单个或少数数据挖掘算法,其中较为经典的数据挖掘系统有SalfordSystems研制的CART数据挖掘系统。在数据信息量巨大,且数据变化频率大的情况下,必须通过运用数据仓库或者数据库系统进行统一管理,显然该阶段的数据挖掘系统功能不能满足要求。基于第一阶段的数据挖掘软件,通过增添多种挖掘算法,不断推出了第二阶段的数据挖掘应用程序。该阶段的数据挖掘软件集成了数据库管理系统,能够对数据仓库以及数据库进行支持,可以与其他应用软件进行连接,系统扩展性较强,其另一个特点为能够对大数据集和复杂的数据集进行数据挖掘。在此基础上系统灵活性更强,采用了数据挖掘查询语言以及挖掘模式。其中最为常见的为DBMiner数据挖掘系统,其能够采用DMQL数据挖掘语言开展数据挖掘工作。然而,该阶段的数据挖掘软件的缺点在于侧重模型的形成,并且就模型系统的集成形成了第三阶段以及第四阶段的数据挖掘软件的形成。[1]韩王莹.基于数据挖掘技术的人力资源信息管理系统设计[J].电子设计工程,2015(15):54-56,[2]裴新明.基于数据挖掘的人力资源考核系统分析[J],企业改革与管理,2016(18):57-58.[3]杨帆.基于数据挖掘技术的人力资源信息化管理[J].信息通信,2017(4):152-153.[4]李妹琴.试论人力资源管理中数据挖掘技术的应用[J].财经界:学术版,2016(27).[5]徐毅.数据挖掘技术在人力资源管理中的应用研究[J].中国市场,2017(32).[6]王琳.基于数据挖掘的丫汽车学院教科研人员管理对策研究[D].大连海事大学,2016.[刀李会欣.数据仓库为中心的人力资源统计信息系统运用探究[J].关爱明天,2016(5).[8]张金艳.数据挖掘在人力资源离职管理中的应用——以GST公司为例[D].首都经济贸易大学,2016..主要内容、研究方法和思路近年来,计算机网络技术、数据库技术的不断发展,信息数据的日益膨胀,在巨大的数据信息当中找出自身最为关注的信息已经成为当前的一个极为重要的研究热点,在此基础上数据挖掘技术引起了信息产业界的极大关注。聚类分析技术是一种将数据集划分为多个簇的技术,确保同一个簇中的数据特征尽量保持一致,不同簇间的数据特征尽量相异的一项技术。本文分析了数据挖掘中的聚类算法类型,阐述了现有聚类算法的性能特点。为验证改进的K-means算法的效果,本文利用JAVA作为开发语言,以矿井人员统计数据为基础,运用基于改进的K-means聚类算法,将球员数据对象进行分类,通过对比分析传统K-means算法结果,改进后的K-means算法效果更好。前言1数据挖掘1.1数据挖掘定义L2数据挖掘过程2数据挖掘中的K-means聚类算法及改进K-means算法原理及其聚类过程传统K-means算法基于平均误差准则函数的k-means算法K-means算法聚类要素及其优缺点k-means聚类算法要素分析k-means聚类算法优劣势分析基于初始聚类中心选取的K-means算法改进改进初始聚类中心的选取基于规则初始聚类中心的k-means聚类算法对噪声以及孤立点处理能力的改进基于改进算法的实验分析3基于数据挖掘技术的矿井人员管理系统设计基于改进的K-means聚类算法的矿井人员管理系统软件总体功能结构方案系统软件实现流程运行界面及结果分析系统运行情况分析基于改进的K-means聚类结果分析4结论参考文献3.总体安排和进度(包括阶段性工作内容及完成日期):2018

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论