版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、基于机器学习技术分析课堂提问的认知水平摘要提问被广泛认为是一种有效的教学策略,在教师与学生的相互交流之间存在着各种用途。在教育实践中,教师对课堂提问的分析具有特殊的效益。本文通过分析将老师的问题按照布鲁姆的分类自动分类到不同的认知水平的有效性,从而探讨了机器学习技术有效性。更具体地说,本文利用三种最有效的机器学习的分类技术:K-最近邻,贝叶斯和支持向量机的三种方法。这样,一个数据集的问题经过收集和分类,并且按照布鲁斯分类。经过预处理步骤应用到一个适合于机器学习技术问题。使用这个数据集,三种机器学习技术的性能就被评估。结果表明,K最近邻和贝叶斯性能相媲美,向量机在F1和精度性能优越。此外,结果还
2、表明,机器学习技术对于代表问题的特征的数量显示出不同程度的敏感性问题。1.引言在教育领域,提问被广泛认为是一种有效的教学策略。它是师生互动的主导模式,占总互动的近80%。自苏格拉底时代,提问被用来鼓励学生使用更高层次的思维过程。目前,教师每天问多达300到400个问题,所以提问仍然是最经常使用的教师教学干预手段。鉴于教师课堂提问对教学的重要性,对这些问题的分析已被广泛研究。一些研究人员发现开发出一套可以分类问题的分类集会对教学很有帮助。现在已经有了许多分类系统,其中大部分是完全由认知过程所需的回答问题的类别的基础上进行分类的。这些系统包括在不论语境分类问题的背景下数量有限的一般类别,而其他分类
3、系统开发了一个特定的课程,如一个对由美术教师提出的问题进行分类的系统。布鲁斯分类是最突出的问题分类系统的代表,它是由本杰明.布鲁斯提出,在他的努力,把思想行为分类成三个领域:认知(精神技能),情感(情感或情感领域的增长)和运动(手动或物理技能)。认知领域因其在中学和中学后教育的适用性受到重视。在认知领域,布鲁斯确定了六个不同的学习层次,并且根据层次结构进行了组织。认知方面的六大类如下:知识:注重记忆,识别信息;理解:专注于组织思想、信息的解释和翻译;应用:重点利用细节和原则解决问题;分析:专注于寻找潜在的组织和一个整体的划分;合成:专注于一个想法组合,以形成新的东西,创造一些独特的无论是口头上
4、或身体上;评价:专注于对问题作出判断,解决差距或分歧。在教学实践中,问题的有效使用依赖于教师的能力,由老师决定他提问问题的布鲁斯认知水平(BCL)。不幸的是,对教师提问的研究已经表明,这种技能通常是不太有效的。在这些研究中,它已经表明,教师在各级教育往往问需要记忆的问题,很少问需要反思的问题。这可以归因于缺乏提问的分类。因此,为了提高教师的提问能力,基于BCL来分析他们提出的问题是至关重要的。这样的分析结果,可以用于教师专业发展和评估教师的水平,也可以帮助师生互动。为了更好的教学和学习,分析教师的提问至关重要,本文提出了一种尝试,利用多种机器学习技术,将这个过程自动化。考虑到教育机构的电子学习
5、系统的迅速普及,这个过程的自动化是很有吸引力的。从这些系统中产生的大量的数据,使得手动管理它非常困难,因此,机器学习的技术是来操纵它们是非常有前途的手段。本文的其余部分组织如下。第2节评论有关的作品。3节是利用ML自动分类问题概述。第4节介绍了所获得的结果,第5节进行讨论。第6节是为结论。2相关作品在教育的文献中,教师课堂提问的研究受到了很大的关注,因为它们提供了一个信息来源,可以用来研究教学的各个方面。因此,文学作品的研究主要集中于对教师提出的问题的用途分析。例如,分析教师的问题已被用来研究教师的提问方式,是用来培养学生的技能和批判性思维,而不是在学习和回忆。也已被用来研究教师的问题对学生行
6、为的影响。从计算的角度来看,将问题自动按照BCL分类可以定义为按照问题的内容自动匹配到某一个确定的布鲁斯认知水平。显然,这项任务可以被看作是文本分类的一种特殊形式。也就是说,与典型的文本分类问题相比,它具有特定领域的特点。更具体地说,在一个典型的文本分类问题中,每一个文档都包含几百个单词,然而,在问题分类中,每一个问题通常包含不到50个单词,从而引起了一个不足。问题的缺乏,预计将影响机器学习技术性能。在文献中,很少有作品被报道。在人工神经网络,即反向传播神经网络,分类问题转化为三个难度级别,简单,中等,和困难。此外,查询文本的相关性的五维特征向量,平均词频,问题和答案的长度,词频分布,文本中的
7、问题和答案的分布作为输入到BP神经网络。结果计算得到F1值是近78%。在决策树中,根据决策树的困难,构建了一个自动分类的电子学习考试库。因此,电子学习系统可以是根据个人背景适合于每个学习者选择问题。设计了一种针对特定关键词问题的自动分类器设计。问题分类是一个有趣的工作。在这项工作中,一个适应性强的学习辅助工具,用于管理问题银行的问题,到预定义的类进行分类,并正确检索的问题,通过指定的类和/或难度级别。这些作品的一个共同的方面是,他们根据难度分级的问题。3. 方法论一般而言,目前的文本分类的趋势主要是密集的使用机器学习技术。理想的用机器学习技术设计文本分类系统需要四个主要步骤:文本表示,特征选择
8、,分类建设和分类测试。在文本表示步骤中,使用文本表示方法将文本映射到适于后续步骤的紧凑表示中。在特征选择步骤中,原始集的特征子集由特征的选择方法选择。在分类器的构造步骤中,机器学习分类器通过对人工分类下的一组文本的特征观察自动创建。在分类器的测试步骤,通过搜集到一个新的未知的文字来测试分类器的性能。因为问题分类是文本分类的一个实例,这些步骤也适用。下面的小节描述使用ML解决问题分类问题转化为线性的四个步骤。3.1. 问题描述基本上,问题文本不能直接用机器学习技术解释,因此,利用转换程序映射一个问题Qi文本到紧凑的表示,其内容需要统一适用。代表一个问题Qi的常见的方法是作一个特征权重<W1
9、jWtj>矢量,这不是一组特征(有时称为特征)出现在至少一个问题至少发生一次,0<wj<1表示特征T对问题Q的贡献率。权重可以是二进制权重(1表示存在0表示特征不存在);或基于非二进制的分类器构造算法。非二进制重量最常见的形式,使用标准的TFIDF函数,其定义为在ITr|表示在训练集的数量问题,#(TK,QJ)表示发生在QJ的Tk次数,#TR(TK)是指特征Tk的频率,也就是TK在问题中的发生次数。为了应用上述表示,一个预处理的问题,应适用于包括:减少问题文本来减少字符。标点符号的去除:所有类型的标点符号从问题中删除。标记:令牌是一个极大的非空白字符序列。在这个过程中,纯粹的
10、数字令牌被丢弃。分析:令牌被波特词干分析器分析。一个问题的文本预处理后,特征加权按方程1计算,长度归一化应用如下带新特征的权重的向量被输入到随后的步骤。3.2. 特征选择给定一个特征集包含一组训练集的问题的所有特征,特征的选择是从原始特征集选,这样的一个只有最具代表性的特征子集。一个计算更简单的选择方法根据一个函数接收的最高得分选择一个子集的特征,例如,检索词频率(TF),这衡量一个特征对分类任务的重要性。3.3. 分类器构造在分类器构造步骤中,一般的归纳过程会通过观察一组文本的特征自动生成一个分类的一个给定的组Ci,称为训练集,手动分类为Ci或专家进行分类Ci。从这些看出,归纳的过程,一个新
11、的未知的文本应收集的特点有分类Ci。对于大多数机器学习的技术,这一步可以通过使用一个目前可用的工具。3.4. 分类评价机器学习分类器对一类线性分类的有效性可以通过一些措施进行评价。这些措施的计算基本上取决于所获得的应急表。应急表主要包括以下值A:系统按照布鲁斯分类正确分类的问题数目。B:系统按照布鲁斯分类错误分类的问题数目。C:属类但系统没有正确布鲁斯分类的数目。D:系统正确的没有分配到BCLS的问题数量。以下是用于评估机器学习分类性能的常用的措施。精度(P):如果一个随机问题被分类在Ci下,这个决定是正确的。它可以被看作是分类器的“稳健程度”的相对于类。公式是P=A(3)B召回(R):如果一
12、个随机的问题应该被分类到Ci下,这项定是采取。它可以被看作是相对于该类的分类的程度的完整性。公式是R=-(4)ACF0测量:这是一次召回和精度的谐波平均值,对于0=1,如下F_2RP1R+P准确性(ACC):个分类的准确性+的定义如下A-D/+占+E7+万除了这些对分类器的措施,分类的有效性可以通过宏观平均值(所有类未加权平均效率)和微观平均值(从每类列联表的总和计算的有效性)进行评估。4. 实验结果本节介绍了从一系列的实验中获得的结果。以此进行评估不同的机器学习技术的性能。此外,从被认为是作为一个基线的以规则为基础的方法。在所有的机器学习技术实验中,基于TF的特征选择方法已经使用。更确切地说
13、,每种机器学习技术基于TF的选择已经尝试了不同数量。在每一个实验中,所选择的特征被用来在第3.1节所描述的问题表示。结果已在随后的部分中,但在对这些结果的描述之前,问题数据集的简要说明已经给出。4.1.问题集在Najran大学在一些课程讲座收集了一系列的问题。问题已通过手动与教育专家来对每一个问题分配一个合适的类。问题的子集是随机选择的,选择的问题是均匀分布在线性约束下的(即每个bcl100例)。所收集的数据集已被处理为在第4.1节中所述,并分为训练集(70%的数据集)和测试集(30%的数据集)。训练集和测试集的大小分别为420和180。表1显示了其问题样本。表1:问题数据集实例BCL问题实例
14、知识(Kn)确定计算机的标准组件理解(Co)详细描述图形应用(Ap)计算圆面积分析(An)将瀑布模型与原型模型进行比较。合成(Sy)开发基于活动的网络评价(Ev)对给定数据的不同图形表示的有效性进行评估4.2.基于规则的方法基于规则的方法是上世界八十年代最为流行的自动分类方法,以规则为基础的方法的问题分类通常由一组手动定义的逻辑规则。每个规则是一个分离的条款对于一个给定的BCL包含一组预定义特征的条件。一个给定的问题是,当且仅当它满足一定的BCL分类下的规则,即,当且仅当它满足至少一个在其条款。使用规则为基础的问题分类方法的结果显示在表2。表2:基于规则的方法的性能BCLAcc?FlKji0.
15、7&30.466Co0.8610.627Ap心4Ari0.850.509SyEv0.8560.552Macro-Av0-830.544Micro-Av0.8280.5234.3.k-近邻从这一系列的实验中得到的结果示于表3。宏观平均值和微观平均值F1结果表明KNN获得最佳的性能时,用于问题表示特征的TF>5。KNN的结果与基于规则的方法的结果比较,证实了ML技术对问题分类的有效性。表3:K近邻性能BCLTF>1TF>2TF>3TFE4Ac:F】AccFiAccFiAccFiAccFiKn0.8720.531C.S830.604Ol?QOD.66"Q.S
16、M0.66Q.S890.66Co0.9280.7720.9330.786019170期0,9170.7170l9】l0.733ApQ.S610.4190.&工Q.4S9Ol87S0.500d.B720.439Cl辭20.51LAn0.92S0.7450.7201922MS0.960.S73a弼i0>6SSy0.S8905650卫工Q.51L019060.6670.R舛0.627a?0.717Ey0.S940.6420.900Q.6790l?2.20.500.9:0.7&4O.R?40.612Maera-Av0.S950.6120.眈0.64DOl?Q0.674Q.90S0
17、.610则0.6S5Micro-AvQ.S950.622O.R98Q.65D01断0.6S20.9080.6S20则0.6S9BCL7F>67F>7TF>TF工9T¥>10AceFiAccFiAccFiAccFiA£CFiKnQ.S440.5630.&44Q.60J720.4SI0.7610.4S20.7610.4S2Co0.9110.867Q.53S0.S6"0.5560.RG0.5560.R5OOJ09Ap0.856Q.45S0.K610.49D0.&0.292Q.S2S0.311Q.R390.326An0.9330.7
18、690.939QJ760.S890.524Q.R720.465ClS720.439Sy0.9110.7140.6940.67R0.8330.444Q.K220.407Q.S2S0.392EyQ.S440.4170.瞅0.4550.8330.167Q.B22Q.ILL0L8170.108Macro-AvQ.S83Q.6DD询903910.S340.411d.B290.3S9Q.S280.376Micro-Av0.SS3Q.6D40.辭90.5970.S340.42SQ.K290.413Q.S2S0.400表4:NB的性能BCLTF>TF>j>47F>5A-ctFiAceF
19、iActF|ArcF,AccFiKn0.8780.450邛0.5000.S610L4680.8670.5QQ就0.553CoQJ110.704D.91I0.7420.900D.7IQ0.8890.66as8J0.656Ap0.86103590.894i.5Q.S940L55SQ.S7S0.450as70.176An。脈0.7230.956<1.8520.961D.S730.961Q.S6S0.956<1,852Sy0.8890.524D.90D0.640Q.S940.642Q.9110.692019110.692Ev19170.6gl0.9220.720Q.933D77S0.933
20、0.7780.9060.679Macro-Av0.8970.57j0.91D0.669Q9HD.671Q.9060.6590.9030.651Micfd-Ay0.8970.5&7Q.91D0.6S0Q航D.6320.9D60.671Q.90j0.660BCLFF>6>77T>S此gTF>10AteFiAceFiActFiArcF,AccFiKn0.K940.612Q.S830.5710.K44013640.8500.3720.S440.263CoO.S720.596Q.S720.5S20.&56015190.S610.545a貼60.536ApQ.87S
21、0.421Q.S830.462Q.S56012780.8560.2QlS560278AnQJ44O.SQ&0.95D0.S240.9110l6360,9】10.6360.9060.605Sy0.K940.642D.SM0.627Q甜I0.4440.S440.364dS2&0.205Ev0.8670.455Q.S830匚Q辽ai58Q.8I70.1OSQlSl7OJOSMacro-Av。驱Q.SM0.596Q濒014000.856Q.3S4a0J32Micro-Av0.8920.601Q.SW0.604QMS0l4H0.8560.402低0J534.4. 朴素贝叶斯朴素贝叶斯是一
22、种有效的概率分类方法,已应用于文本分类中。它的基本思想是词和类的联合概率的来估计给定问题的类的概率。朴素贝叶斯方法是最早用于文本分类的分类器算法,是一种统计学分类方法,它基于贝叶斯决策论并且基于此项独立的假设,不同属性对分类结果的影响是独立的。从这一系列的实验中得到的结果示于表4。结果表明,在贝叶斯方法中F1的表现最好时,用于问题表示特征的TF>3是。他们还表明,对于ACC,NB获得最佳的性能时,用于问题表示特征的TF>2。此外,NB的结果与KNN的结果比较,无论所选择的特征的数目如何,这两种方法显示了相差不多的性能。4.5. 支持向量机支持向量机是Vapnik等提出的一种新的学习
23、方法,它是建立在统计学习理论的VC维理论和结构风险原理基础上的,根据有限的样本信息在模型的复杂性(即特定训练样本的学习精度)和学习能力(即无错误地识别任意样本的能力)之间寻求最佳折衷,以期获得最好的推广能力。支持向量机的最大特点是根据结构风险最小化准则,以最大化分类间隔构造最优分类超平面来提高学习机的泛化能力较好地解决了高维数、非线性、局部极小点等问题,在训练样本数目相对较少的情况下也能取得很好的分类效果对于分类问题,支持向量机算法根据区域中的样本计算该区域的决策曲面,由此确定该区域中未知样本的类别。所得到的结果示于表5。表5:支持向量机的性能TF>3>化47F>5ActFi
24、AfFiAccFiAccFiAccFiKr.O.S«7a4780.8780.5600.SS3D.5SS俪gD.478am0.627Co0.939Q側二QMQ.?2S0.755DJS40.667APQ.WD.90D0.57L0.8K9a彌DJ68OL昭90.545An0.956a8460.9610.S680670.S890.956D.S4619500.SZ4sy0.9000.9280.7350.9220.7310期DM119170706Ey0.9170.6670.9280.7230.922QJOS0.9Q6D.6670L9Q50.622Macro-AyW7a辺0.9230.711呵90
25、.6990.9160,622Q卿0.665Micro-Av0.9070.6380.9230.7P0.91907070.916D.638OL剜0.669BCLTF>77f>8化9TF>10AccFiAccF,ArcF,AccFiAccFiKn0.9110.6920.8940.6420.S61D.46S0.85DD.47118500J72CoQ6150.SS30.6040.872诚0.85DD.491US720徳Ap0.S7S04500.8780.4500.8670,ij30.861D2S618500JS2Ar.0.9500.S240.9330.7300.9220.6%俪3D4S2am04S2S)0.922017200.9060.6530.900D.5250.8670.45518330286Ev0.872阳砧0.8440.2630.8KD.D570.81/D.05708220.000Macro-Ay0.9040.8900.5600.8730,4400.85503701852QJI4Micro-Ay0.9040.6390.89003770,873D.4870.855DJS9Q椚20J44结果表明,对于ACC和F1特征,当TF>2时,SVM的性能最好。另一个结论是,支持向
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五版监控设备销售与维护保养合同3篇
- 二零二五年度果树种植与农业科研合作承包合同2篇
- 二零二五版建筑工地场地勘查与风险评估委托合同3篇
- 二零二五版国际机场ATM设备场地租赁与广告合作合同3篇
- 二零二五版矿业勘探承包作业合同样本2篇
- 二零二五版智能停车场设计与施工合同3篇
- 二零二五版板房租赁合同附带设施设备维修协议3篇
- 二零二五版抵押房屋买卖合同与房屋保险服务合同3篇
- 二零二五版办公场地租赁与人力资源服务合同范本3篇
- 二零二五版鸡蛋养殖基地技术改造合同3篇
- 广东省佛山市2025届高三高中教学质量检测 (一)化学试题(含答案)
- 《国有控股上市公司高管薪酬的管控研究》
- 餐饮业环境保护管理方案
- 人教版【初中数学】知识点总结-全面+九年级上册数学全册教案
- 食品安全分享
- 矿山机械设备安全管理制度
- 计算机等级考试二级WPS Office高级应用与设计试题及答案指导(2025年)
- 造价框架协议合同范例
- 糖尿病肢端坏疽
- 心衰患者的个案护理
- 医护人员礼仪培训
评论
0/150
提交评论