




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Word第第页数据挖掘学生全口径接收效果分析一、文献综述
刘华和李瑗[1]通过教学看法,教学内容,教学方法这三个指标打分状况,进而利用Microsoft决策树算法,Microsoft关联算法和Microsoft聚类分析法挖掘模型进行挖掘分析。骆懿玲[2]基于元规章约束的关联挖掘进行课堂教学质量评价挖掘,并得出分析结果,给出建议。邵珠艳等[3]利用灰色关联分析,对影响课堂教学效果的因素打分后进行分析。叶勇[4]将云模型引入到遗传算法,再用改良遗传算法对支持向量机参数进行优化,并与BP神经网络、多元线性回来模型比较,以便对课堂教学质量的模型评价效果进行评价。袁万莲和郑诚[5]利用关联规章进行数据挖掘,得出与教学质量相关因素是老师的学历、职称以及教龄;职称为讲师、教龄较长或者高级职称、高学历的老师教学质量较好。张震等[6]将评价指标大致分为教学看法、教学内容、教学水平以及老师讨论力量,利用关联规章进行数据挖据。戴俊[7]以老师因素,同学因素,师生双方因素以及环境因素和考试成果作为变量,通过主成分回来方法对影响课堂教学效果的因素进行分析,为改良教学评价方式与提高课堂教学效果供应理论参考。许云华等[8]设计调查问题为“您最想对课堂教学提的看法”“改良方法”“如何实现从被动学习向动汲取学问的转变”,基于扎根理论对上述问题答案进行分析并得出分析结果。柴志贤和邱风[9]借鉴过程—成果讨论方法,在以往讨论的老师职称、年龄、所教班级、课程类别这些老师背景变量的基础上,增加教学素养、教学技能与教学责任心这三个影响因子进行分析,从而为提高高校课堂教学效果供应肯定阅历指导。
二、理论
〔一〕支持向量机〔SVM〕
支持向量机是由CorinnaCortes和Vapnik等在1995年首先提出的,是一种基于统计学习原理的数据挖掘技术。支持向量机分为支持向量回来机和支持向量分类机,本文主要应用支持向量分类机进行数据挖掘。支持向量机分类的核心是找到两互相平行并且间隔〔margin〕最大,并能将属于不同类别的样本点正确分开的边界,位于两边界中间位置并与之平行的超平面,称之为最大边界超平面,即为最终解。
〔二〕TF-IDFTF-IDF
是一种推断词语在文件中重要性程度的加权统计方法。一个词语在文件中消失的频率越高,它对这个文件来说就越重要;这个词语在整个语言中消失的频率越高,它对这个文档来说越不重要。TF-IDF可以利用计算机技术在不需要人工进行干预的状况下提取文件中的关键词,并快速对词频进行统计,常被用于文本挖掘和信息检索等前言领域。TF-IDF的主要思想是:若某个词在其他文件中很少消失,但在这一文件中消失的频率高,那么它极有可能反映了这一文件的特性,则认为它很适合用来分类,由于它具有很好的类别区分力量。TF-IDF事实上代表的是TF*IDF,TF表示词频,IDF表示逆文件频率。
三、模型
〔一〕数据来源
1.变量选取
为了获得老师因素、同学因素以及环境因素这三个变量的收稿日期:有效数据,笔者细心设计一份调查问卷,影响因素分为老师、同学及环境。老师因素中包括:学与生互动状况、授课方法、课堂考勤、按时上下课、PPT使用状况、一般话水平、讲课声音大小、作业布置状况以及课程考查形式。同学因素包括:出勤状况、遇到问题沟通状况、课下与同学和老师沟通状况、学习状态、听课表现、上课做笔记状况、课程内容把握状况以及课堂上的感受。环境因素包括:上课时周边环境、所用教室类型、课程支配上下学期状况、上机教学与否、教学设备、授课时间段、授课时长以及教室卫生环境。
2.数据猎取
在调查对象的选择上,我们主要以东北财经高校讨论生为调查对象,发放线上调查问卷,让同学仔细对自己所学课程中某一门课的教学效果进行评价。
〔二〕数据挖掘过程及结果
〔1〕读入数据。选择源选项卡中的excel节点,将调查问卷中数据导入到clementine中。
〔2〕数据审核。选择输出选项卡中的数据审核节点连接到excel节点上,由审核结果可知,Q5变量的类别比为90∶9∶1,单个类别值过大,会影响建模的精确程度,故应删除。
〔3〕数据分区。利用分区节点将数据进行分区,其中70%为训练集,其余30%为测试集。
〔4〕变量相关性分析。利用统计量节点分析变量之间的相关性,若相关性高,需要剔除相关变量,反之则不需剔除。经测试,在本文的变量中未发觉高相关性变量,因此无需剔除变量。
〔5〕得分变量重新分类。利用“重新分类”节点将得分变量分类,其中0—7分为一类,8、9、10分为另一类。
〔6〕特征选择建模。选择建模选择项卡中的特征选择节点,将其连接到数据流的恰当位置上。
〔7〕支持向量机建模。提取上一步得到的重要变量,选择建模选择项卡中的SVM节点进行建模。
〔8〕数据测试。测试过程和训练过程是相同的,且得到的精确率为93%,测试结果良好。
〔三〕文本挖掘过程及结果
1、数据清洗。原始调查问卷数据中包括文字,标点符号。其中一些信息对关键词抽取没有关心,甚至会严峻影响讨论。为了便利抽取工作顺当开展,有必要先对原始评论数据进行清洗,如“无”或“好”等,对问卷内容没有关心,进行直接删除处理。
2、数据预处理。预处理可以把句子级别的文本数据划分成可识别的`词、词组,主要包括分词、词性标注和依存句法分析三个部分。在本文中使用LTP进行分词。
3、关键词提取。由于人工标注会造成主观干扰,本文为了减小人工标注的主观性影响,要利用TF-IDF算法自动提取关键词。
四、结论及建议
〔一〕结论
同学、老师、环境三方面均对课堂接收效果产生较大影响。数据挖掘结果中,课堂爱好、学科把握内容为同学因素,授课方法以及课堂互动属于老师因素,排在其次位的上课周边环境则是环境因素。文本挖掘结果中,同学、课程、仔细为同学因素,理论、讲课、上课、教学、案例、互动属于老师因素,教室则是环境因素。因此,三种因素均对课堂接收效果产生影响。利用文本挖掘与数据挖掘对比分析可以得到良好的讨论结果。文本挖掘与数据挖掘的结果中均表达出了同学因素、老师因素以及环境因素对课堂接收效果产生影响,并且两种方法的分析结果中均以高频率消失“互动”因素,印证了文中使用的两种方法均可行并可得到较为精准的结果。
〔二〕建议
增加课堂小组商量环节。集体商量是课堂中不行忽视的环节,既可以活跃课堂的气氛,交换看法观点,拓宽学习范围;又可以活跃同学思维,多角度绽开思索,提升解决问题的力量,避开传统灌输式的教学方式。增加师生课堂互动。加强师生互动,调动课堂气氛,并利用实际问题创设情境,让同学给出解决的方案,提高同学的学习爱好。增加课本学问与实际案例的结合。书本的学问往往是生硬抽象的,而结合实际的案例后,不仅可以使死板的课本学问更加形象生动,易于理解消化,融会贯穿于实际案例中;也可以提高同学的学习爱好,提升学习的主动性与主动性。增加课程实践环节。将课本学问用于实际操作中,不仅可以升同学学习的乐趣,还可以使同学结合生活阅历学习相关学问,更好地将书本学问用于实际学习以及将来的工作中,同时在实践中深化对
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 私人贷款合同样本
- 2025年卸气柱项目发展计划
- 饮料加盟合同范本
- 5 走近我们的老师 第一课时 教学设计-2023-2024学年道德与法治三年级上册统编版
- 买房时的合同范本
- 门店拆除工程合同范本
- 8 蝴蝶的家(教学设计)-2024-2025学年统编版语文四年级上册
- 美的购销安装合同范本
- 4 日月山川(教学设计)-2024-2025学年统编版语文一年级上册
- 私人包车带司机协议
- 《中小学科学教育工作指南》解读与培训
- 学校食堂“三同三公开”制度实施方案
- 殡仪馆管理制度
- 2025年医院财务工作计划(2篇)
- DB32T 4969-2024大型医用设备使用监督管理平台基础数据采集规范
- 2025年大连长兴开发建设限公司工作人员公开招聘高频重点提升(共500题)附带答案详解
- 教科版三年级下册科学全册单元教材分析
- 《物理学的发展史》课件
- 2025年广东广州市海珠区官洲街道办事处政府雇员招聘5人高频重点提升(共500题)附带答案详解
- 《道路交通安全法》课件完整版
- 《小肠梗阻的诊断与治疗中国专家共识(2023版)》解读
评论
0/150
提交评论