基于数据挖掘的大学生心理行为管理系统毕业论文任务书及开题报告_第1页
基于数据挖掘的大学生心理行为管理系统毕业论文任务书及开题报告_第2页
基于数据挖掘的大学生心理行为管理系统毕业论文任务书及开题报告_第3页
基于数据挖掘的大学生心理行为管理系统毕业论文任务书及开题报告_第4页
基于数据挖掘的大学生心理行为管理系统毕业论文任务书及开题报告_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1本科生毕业设计(论文)开题报告学 生 姓 名 : 导师姓名、职称 : 所 属 学 院:管理学院 专 业 班 级:信息管理与信息系统设计(论文)题目:基于数据挖掘的大学生心理行为管理系统 2015 年 3 月 8 日2开题报告填写要求1开题报告应根据教师下发的毕业设计(论文)任务书,在教师的指导下由学生独立撰写。2开题报告内容填写后,应及时打印提交指导教师审阅。3“设计的目的及意义”至少 800 汉字(外语至少 500 字),“基本内容和技术方案”至少 400 汉字(外语至少 200 字)。进度安排应尽可能详细。4指导教师意见:学生的调研是否充分?基本内容和技术方案是否已明确?是否已经具备开始设计(论文)的条件?能否达到预期的目标?是否同意进入设计(论文)阶段?3撰写内容要求(可加页):1.目的及意义(含国内外的研究现状分析)11 国内的大学生健康研究现状分析高等教育自 1999 年扩招以来,在校大学生人数不断增长,经过了十多年的时间大学生的人数成倍的增长,大学生的心理健康已经成了各界关注的问题,而我国的心理健康研究方法主要是心理测量法和问卷调查法,然后对这些测量表和问卷进行分析得出结果我国大学生心理健康研究主最常用的心理健康测量表有卡特尔人格因素测验(16PF)、大学生人格问卷(UPI)、埃克森人格问卷(EPQ)、自评量表(SCL-90)其他还包括考试焦虑量表、自尊量表躯体自信量表等。上述这些表基本都是从国外引进经过了汉化,不少学者认为不科学,也有不少学者致力于开发适合我国学生群的测量表,我国的大学生心理健康教育从最初的开设心理学课程和心理教育教育讲座,普及心理知识,校内建立心理咨询和辅导机构等应对方式。近几年随着科学技术的发展特别是计算机科学技术的发展,网上出现各种各样的测评网站。学校也开始开发这样的网站,学生可以在网上测评,网站会根据测评的结果来分析个人和群体行为特征给出适当的结果和建议。1.2 国外的大学生健康研究现状分析国外的研究以美国的为例,美国非常重视学校心理健康教育的研究有不少的学者进行了对比研究,如孙晓青等认为美国的大学生心理健康研究已经有相当的规模、研究量表多样化、研究范围多维化,研究范式实证化是其主要的特征。与我国类似,国外的学者认为大学生心理状况存在较大的问题,据世界卫生组织报道,美国年青人的疾病负担中,有一半来自心理障碍。较之于我国大学生心理健康研究角度和内容,国外的角度更加宽泛,内容更加丰富。41.3 国内研究现状分析数据挖掘(Data Mining),又称为数据库中的知识发现(KDD),是从大量数据中获取有效、新颖、潜在有用且最终可理解的模式的非平凡过程。简单的说,数据挖掘是从大量历史数据中寻找其规律的技术,是统计学、数据库和人工智能技术的综合。国内对数据挖掘和知识发现的研究晚于国外。1991 年,陈文伟等学者根据信息论示例学习方法提出了 IBLE 算法,这个算法在选择实体重要特征时,是用信息论中信道容 量的概念作为衡量标准进行度量,所以,信道容量能够克服了相互信息依赖正、反比例的缺点。该算法选取一组重要的特征来建立规则,把它作为决策树的结点。 所以,为了实现实例正确有效地判断,就必须用多个特征组合成规则的结点进行识别。 1997 年国家通过自然科学基金开始对数据挖掘的研究进行支持。之后国内的很多科 研单位和院校都在这个领域获得了丰硕成果,这些单位包括中科院、清华大学、中国科 大、复旦大学等,他们的成果为我国在此领域的发展起到了重要作用,得到了学术界的 高度重视。 现在决策树的研究方向主要是以下几点:(1)提高决策树的精度预测精度是决策树研究的重点,同时也是判断各种决策树生成算法和剪枝算法优劣最重要的衡量指标。通过构造多变量决策树从而减小树的规模,最终实现提高决策树精度的目的,所以如何提高决策树的预测精度也成为决策树方法研究中重要的一个研究方向。(2)修剪简化决策树决策树的修剪主要分为两个部分:一是通过对各种决策树剪枝方法的比较和分析,找出它们自身的特性和优缺点,并根据情况从中选择最适用的方法:二另辟蹊径找到不同于传统方法或者优于现用的剪枝方法。(3)决策树与其他技术的结合在知识发现中,一种方法是无法处理全部的数据集的,为了完成数据采掘的任务,必需要和其它方法相结合。为提高处理效率和精度,研究者将决策树同人工神经网络技术、遗传算法和模糊集理论等技术结合起来一起研究,取得了良好的效果。 所以,决策树多元化、 和其他技术的交叉结合也是决策树方法研究的一个重点。5(4)软件实现1.4 国外研究现状分析数据挖掘(DM)最早出自于数据库中的知识发现(KDD),数据挖掘技术通过多年的不断研究和实践应用,现在已经逐渐发展成为一门综合性的学科,涉及了诸如数据库技术、人工智能、统计分析、机器学习、模糊数学等众多领域,并不断地吸收这些领域的理论、 技术和研究成果, 形成了具有自己特色的研究分支。 对于数据挖掘我们一般有两种定义, 即广义定义和狭义定义。广义上定义数据挖掘,就是从大型数据集(可能是不完全的、 有噪声的、不确定性的、 各种存储形式的)中挖掘隐含在其中的、人们事先不知道的、对决策有用的知识的过程。狭义上定义数据挖掘,则是指从特定形式的数据集中提炼知识的过程。我们一般认为归纳学习方法中的示例学习是决策树学习的基础,它出自于概念学习系统 CLS(conceptlearningsystem)。 CLS 第一次在概念学习中应用了决策树,可惜的是 CLS 却不能出现太大的学习问题,这是它最大的缺点,但它却是以后出现的很多决策树 学习算法的基础。Quinlan 于上世纪七十年代末提出了一个著名的学习算法 ID3 算法,信息论中嫡的概念在这个算法中首先得到了应用,并将决策属性分类的判别能力利用信息增益来度量,选择决策节点属性。用这个算法来形成决策树是通过选择窗口来实现的,所以有着较强的学习能力,在处理大规模的数据库问题时相对比别的算法有优势。但 ID3 算法的缺点也很明显,主要有无法处理属性值缺失、不能对连续属性进行处理、计算信息增益时偏向取值较多的属性等。专家和学者也通过改进这些缺点,形成了各种各样的算法。二十世纪八十年代,LBreiman 等人针对 ID3 算法最后生成的决策树分枝较多、规模较大的缺点,提出了 CART 算法,这个算法就是完全克服了这些缺点。因为此算法源于 ID3 算法,所以它们的原理相似。在以 RT 算法中,提出并应用了杂度削减的概念,在决策树的生成过程中,取杂度削减最大的节点作为分裂节点,并最终生成二叉树;当树剪枝和误差评估时,则使用的是重采样技术,直至最终生成最优决策树。分类过程中,CART 算法的全部或部分训练集是一直驻留在内存中。上世纪 90 年代早期,Quinlan 自己也将 ID3 算法进行了改进,提出了现在人们熟知 的 C4.5 分类算法,这个算法与以往6算法最大的区别就是运用信息增益比值来进行估算,对每个属性的信息增益率计算得出具有的最高信息增益率的属性,就是测试属性。它继承优点弥补缺点,是 ID3 算法的升级和发展。Mehta 等人于上世纪九十年代后期提出了一种快速可扩展的分类算法,SLIQ 分类方法。在决策树的构造过程中,根据数据量大于内存容量的情况,利用在磁盘上属性列表和内存中类列表两种数据结构,通过采用预排序技术和广度优先的决策树生长方法,使用此算法可对磁盘上的数据集进行分类,同时不降低精确度。 SLIQ 在处理数据时, 由于内存中一直驻留着类表,而导致处理的数据量很小。上世纪九十年代后期,J.Shafer 等人也提出与 SLIQ 具有可比性的一种算法-SPRINT算法,这是一种可扩展的、可并行的归纳决策树。它不受内存限制、处理速度快,在设计上兼顾并行处理,允许多个处理器相互合作生成一致的决策树模型。 在 SPRINT 算法 使用过程中,建树和剪枝是分开的,顺序是先建立生成决策树,剪枝是在决策树生成之后进行,剪枝完成后,所留决策树只是原始决策树很小的一部分,由于计算复杂,所以决策树的执行效率非常低。PUBLIC 算法由 Rastogi 等人于上世纪九十年代末提出,在算法中提出的观点是建 树和树的剪枝是集成在一起的,在建立决策树时,树的相关节点的目标函数值是根据函 数计算得出的, 假如这个节点在以后的调整阶段将会删除,那么就不对此结点进行扩张,否则继续扩展该结点。 我们把通过这样的计算生成的 PUBLIC 决策和对同一样本集使用预剪枝策略生成的决策树进行比较,结果发现这两种树完全一样,由此可见,PUBLIC 算法的执行效率是很高的。1.5 目的及意义随着计算机的普及,人们逐渐步入了网络化的生活,学习、工作、娱乐都离不开电脑。我们走向了虚拟的网络世界,交流足不出户在社交工具上进行,工作是离不开软件工具,娱乐更是不再完全依赖电影院,一切可以更快更好的在电脑上解决。然而,虚拟的网络生活也产生了越来越多的心理问题,7在学生中更是普遍。目前大学生主要以独生子女偏多,还有部分是来自父母离异的单亲家庭,对于一些来自特殊环境的孩子心理问题成了严重的挑战。因为大学生刚入校,面临一个全新的、开放的、更加宽松的环境,部分学生的心理和行为一时难以适应,譬如思想比较封闭,精神紧张,行为拘谨。人际关系也发生巨大改变,许多学生面临复杂和多样的人际关系,新生出现消极的情绪和心理,如不满、悲观、失望,由此导致苦闷,缺乏学习动力,自卑等等。如果这些心理状态长期得不到调整,必将导致心理疾病。各个高校基本都对学生进行心理调查,可是如何分析、解释、和使用这些庞大的心理测量结果,才能使心理教育工作更有针对性,从而提高心理辅导工作的水平和效率,使得测试结果发挥更大作用,数据挖掘和知识发现技术正是解决了这一难题,使用数据挖掘的技术可以对学校学生测评的海量数据进行分析挖掘得出合适的结果,同时随着高校心理健康教育的进一步深化,高校学生心理档案的建立、心理健康水平的测量、心理咨询中心的日常管理工作等都成为心理咨询中心的综合性工作的决定性因素,学生心理管理系统的使用可以使学生心理档案的建立更加快捷,信息量更大,管理更科学,从而促使学生心理健康教育与咨询工作的深入开展。2.研究(设计)的基本内容、目标、拟采用的技术方案及措施2.1 研究内容及目标在 Microsoft Visual Studio 2008 的平台上采用 B/S 结构,开发一个基于数据挖掘技术的大学生心理行为管理系统,对学校学生进行网络测评,针对数据挖掘技术在大学生心理问题领域的应用进行研究。重点是大学生心理 问题数据的分类挖掘。在详细分析和比较各种常用分类算法的基础上,结合心理问题数 据的特点,选择决策树 算法构建大学生某种心理问题有无症8状的决策树模型,然后给出相应的结果和建议。2.2 拟采用的技术方案及措施研究背景和国内外研究趋势数据挖掘理论基础、挖掘技术分析决策树算法介绍数据采集对学生行为数据进行分析实施数据挖掘的方法分析应用决策树算法的结果得出及、得出结论93.进度安排毕业设计题目的确定:2014-12-20 至 2015-01-10学生选题确定:2015-01-10 至 2015-01-29开题报告完成:2015-03-03 至 2015-03-16毕业设计查阅收集资料,整理:2015-03-17 至 2015-03-22需求分析,确定功能模块,建立模型:2015-03-23 至 2015-04-05详细设计,包括数据设计和模块设计:2015-04-06 至 2015-04-19界面设计,代码分析与实现:2015-04-20 至 2015-05-03系统修改与调试:2015-05-04 至 2015-05-10论文初稿完成:2015-05-11 至 2015-05-13论文修改稿完成:2015-05-14 至 2015-05-17论文定稿完成:2015-05-18 至 2015-05-19毕业设计答辩:2015-06-084.阅读的参考文献不少于 15 篇(其中近五年外文文献不少于 3 篇)1 毛国君, 段立娟, 王实. 数据挖掘原理与算法. 北京: 清华大学出版社, 20052 UM Fayyad etal. Advances in knowledge discovery and data miningCambriage: MA:AAAI/MIT Press, 2003.3 王惠中, 彭安群. 数据挖掘研究现状及发展趋势. 工矿自动化, 20114 David Hand, Heikki Mannila and Padhraic Smyth. 数据挖掘原理.北京: 机械工业出版社,2003.5 Tom M.Mitchell. 机器学习(英文版). 北京: 机械工业出版社, 2003.6 王黎明. 决策树学习与剪枝算法研究. 武汉: 武汉理工大学, 2007.107 张俊杰, 张华. 数据挖掘在学生心理管理系统中的应用. 科技信息, 2010, (36): 5668 李楠, 段隆振, 陈萌. 决策树 C4.5 算法在数据挖掘中的分析及其应用 2008, (12): 160-163.9 董一鸿. 一种快速高效的神经网络分类器. 计算机工程, 2003, 29(19): 136-138.10 何广东. ID3 算法在高校学生心理教育方面的应用. 成功, 2012, (10):268.11 任丽君. 数据挖掘在大学生心理问题中的应用研究. 上海: 华东师范大学, 200612 Jiawei Han, Micheline Kamber. 数据挖掘概念与技术. 北京: 机械工业出版社, 2010.13 王虎,张骏.管理信息系统(第 2 版).武汉:武汉理工大学出版

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论