新工科背景下数据挖掘课程综合性实验设计_第1页
新工科背景下数据挖掘课程综合性实验设计_第2页
新工科背景下数据挖掘课程综合性实验设计_第3页
新工科背景下数据挖掘课程综合性实验设计_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

卫志华,孔思尹,丁志军,赵才荣摘要:针对数据挖掘课程传统教学方法偏重理论、局限于课本中某种挖掘算法的讲解和实现的问题,结合新工科背景下大数据人才培养的要求,提出面向该课程的综合性实验设计,介绍实验方案、实验内容、教学手段和评价方式的设计。关键词:新工科;数据挖掘;综合实验实验方案设计21世纪信息技术的发展使得万物互联成为可能,标志着全面互联时代的到来。互联网时代全球数据量爆炸性增长,数据和互联网的深度融合形成新的行业创新点不仅带来了新的经济增长点,也使得数据挖掘技术产生的价值受到越来越广泛的关注。目前国内高校人才培养综合实验的设计应贯彻“以学生为本,以能[1]互联网实际应用场景出发,选择微博评论或话题的情感分析作为主题,由学生选择他们关注的热门评论或话题作为切入点,形成完整的从数据采集、存储到分析并评价结果的流程。在实验过程中始终遵循新工科人才的培养标准,在提升学生学习和思考等硬实力的同时,也要兼顾学生沟通和表达能力等软实力的提升。综上,实验方案的总体设计见表1。[1]体系。面对新一轮科技革命和产业革命的历史[2]实验内容设计[5]基金项目:上海高校本科重点教改项目“学科交叉的计算机产学研大平台教学实践基地建设”;同济大学研究生计算机教育ComputerEducation表1综合实验方案总体设计1实验成果包括代码、实验报告、PPT1掌握情感分析的整个流程2代码重要部分需要注释3在实验报告中阐明实验的思路以及具体解决流程4PPT上概括整个思考和解决过程5加分项为:阐明在实验中遇到的问题、解决的办法以及自己一些创新的思考,查询文献采用最新的算法4具备资料查找和使用的能力5具备利用所学知识解决实际问题的能力6具备独立思考和解决问题的能力7具备良好的沟通和逻辑表达能力6独立完成实验,杜绝抄袭1爬取带有某个话题的所有微博信息,获取字获取用户点赞数、转发数、段包括<用户id,评论>(9分)提取情感信息(1分)灌水数据的进一步识别和处理(3分)删除话题内容无关微博(6分)改正繁体字、错别字(3分)删除因转发而重复爬取的微博,只留一条(2分)支持多粒度情感分类(3分)改进算法提高情感分析准确率(7分)情感词典预处理(3分)构建表情符号词典(1分)构建程度副词词典(1分)基础分词、词性标注、去停用词等(3分)计算每条微博的情感强度(1.5分)计算所有微博的情感值(1.5分)考虑近似词情感强度(1分)考虑表情符号情感强度(1分)考虑程度副词情感强度(1分)挑战计算情感值时考虑评论、点赞、转发数目(1分)句子级别的情感分析除考虑单个词语情感强度外还需要考虑词语之间的关系,以基于word2vec的情感分析为例,主要就是通过词向量进一步细化程度副词修饰下的情感词强度,其实验内容简要总结如图2所示。教育与教学研究⮰在教学过程中,教师的职能从传统的理论逐点讲解转变为抛出问题、引导思考、答疑解惑,应当充分发挥学生的主观能动性,促使学生能够通过查阅资料、做实验、与教师和同学讨论等多种方式自主探索图2句子级别的情感分析实验内容数据集构建(1分)并解决问题。在完成基础性[9]实验的过程中,将实验内容进行拆解,并给予一定的参考思路,培养学生对综合性复杂问基础计算所有微博或评论的情感值(1分)完成挑战性实验的过程中,用加分的方式鼓励学生对实验结挑战索现有方案存在的问题和可机制等)(5分)改进的措施,迭代更新实验方图3篇章级别的情感分析实验内容案,培养学生创新性思考和解决问题的能力。教学实施方案如图4所示。评价方式设计义相似度评估等;基于word2vec的情感分析[6]在实验评价过程中遵循多角度、全方位评价准则,细化实验评价指标,在对学生进行横向比较的同时兼顾纵向评估。细化实验评价指标是指尽量做到每一步骤评分都有迹可循,在代码实现方面强调学生的动手能力,表现为列出每一个完成项和挑战项可得的相应分数;在报告和PPT方面强调学生的思考和表达能力,阐明相应的思路和观点即可得到对应的分数。对学生进行横向比较是指在同样的实验条件下,对同一小组成员综合实验的完成情况作对比,作为整体实验难度和[7][8]教学手段设计计算机教育ComputerEducation教师题的情感分析;其次,在实验内容方面考虑学生的完成度和挑战度,将综合实验拆分成一系列由易到难的小实验;然后,在实验教学方法方面,考虑培养学生的自主性和解决实际问题的能力,用提供参考资料的方式取代完整的实验指导书;最后,在实验评价方面,考虑学生的纵向和横向对比,采用实验报告、性能指标、答辩等成绩的加权平均作为最终成绩。该综合性实验以数据挖掘课程为切入点,积极发挥教师的鼓励、启发和引导作用,并且充分考虑了学生的主观能动性,与新工科背景下计算机人才的培养标准相契合,提升了学生几方面的能力:①培养学生灵活运用数据挖掘课程中所学的各种算法和模型的能力;②在启发式教学过程中提高学生对复杂的综合性问题进行拆分和逐步解决的能力;③在提升学生基于实验方案正确编写实验代码能力的同时,拓宽了学生的视野,使学生了解并在一定程度上掌握数据挖掘的各类工具;④培养学生查阅并利用参考资料的能力,在学习其他文献的分析方法中针对自组织答辩,根据评分细则评定学生成绩完成实验报告和准备答辩表3实验结果评价方式评价指标在报告排版,文字表达,图标阐述等方面具有亮点即可。不超过5分2是否对实验结果作出分析并探讨可能的改进方案(8分)3是否对实验中遇到的问题和解决的方案作出陈述(8分)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论