学生成绩评价及预测模型_第1页
学生成绩评价及预测模型_第2页
学生成绩评价及预测模型_第3页
学生成绩评价及预测模型_第4页
学生成绩评价及预测模型_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、学生成绩评价及预测模型摘要学生学业成绩的分析和评价,是教学工作的重要环节,也是学校常规管理的重要内容。科学地分析评价学生的学业成绩,不仅可以使教师准确掌握学生的学习状况,还可以使学生了解到自己的学习情况,也能为教学管理、改进教学提供必要的依据分析。为了全面、客观、合理地评价学生的学习状况,本文通过在对基础数据进行统计分析的基础上,采用聚类分析中的k-均值聚类分析法对612名学生的成绩进行分类评价,建立了成绩评价模型。首先,根据统计学知识,通过对附表所给的数据进行统计和整理,对612名学生的整体成绩情况进行了详细分析说明。同时运用Excel软件画出学生成绩波动图、成绩等级饼状分布图等,并对各图进

2、行了相关分析和说明,最终得出学生总体成绩分布属于负偏态分布,绝大多数学生成绩分布在60-90分之间的结论。最后还运用非参数检验方法Ko1mogorov-Smirnov检验、Shapiro-Wilk检验以及图示检验法(直方图、标准Q-Q图以及箱式检验图)对结论进行检验,使用SPSS软件进行绘图与计算,最终验证了学生成绩分布为非正态分布,且为负偏态分布的结论是正确的。然后在数据分析的基础上上建立了基于快速聚类(k-均值聚类)分析的成绩评价模型。在确定分类数为5类后,利用SPSS进行快速聚类分析计算,结果显示其聚类中心均值依次为:、,各类人数分别为231、286、84、8、3,分类结果科学合理。为了

3、对612名学生后两个学期的学习情况进行预测,本文采用灰色预测理论中基于时间序列的GM(1,1)阶一元微分方程模型建立了成绩预测模型,为了保证建模方法的可行性,先对数据列进行了必要的检验处理,并且通过残差检验和级比偏差值检验两种方法对灰色预测GM(IJ)模型进行检验,结果显示模型的预测结果能达到较高的要求。最后利用Matlab编程得出预测函数,计算每个学生第5、6学期的成绩预测值以及前四个学期的拟合成绩,并且运用Koimogorov-Smirnov检验、Shapiro-Wilk检验以及图示检验法对对第5、6学期成绩预测值的正态性分布进行检验,得出学生成绩的总体分布不服从正态分布,而是负偏态分布,

4、与前四个学期的分析结果相吻合,因此可以判定预测结果是合理可靠的,具有较高的可信度。本文还就学生的学习状况,对学校管理部门提出相关的建议。最后讨论了GI(1,1)模型的推广问题,通过添加平衡因子改进模型级比数列的计算方法,以及添加上限条件修改输出函数的方法改进了模型,使得模型具有更强的适应性和更广的适用范围。关键字:成绩预测描述统计k-均值聚类分析灰色预测GM(1,1)负偏态分布问题重述评价学生学习状况的目的是激励优秀学生努力学习取得更好的成绩,同时鼓励基础相对薄弱的学生树立信心,不断进步。然而,现行的评价方式单纯的根据绝对分数”评价学生的学习状况,忽略了基础条件的差异;只对基础条件较好的学生起

5、到促进作用,对基础条件相对薄弱的学生很难起到鼓励作用。附件给出了612名学生连续四个学期的综合成绩。请根据附件数据,对这些学生的整体情况进行分析说明;请根据附件数据,建立数学模型,全面、客观、合理的评价这些学生的学习状况;试根据你的模型,预测这些学生后两个学期的学习情况。根据你的模型分析,试给学校的管理部门写一篇短文,提出对学生学习状况评价的建议和改进方案。模型的假设与符号说明1模型的假设假设每个学期的成绩满分为100分;I3假设每位学生所处的学习考试环境相同;假设每位学生的学习能力基本保持不变;假设每次考试试卷的难度都是相同的。2符号说明表示第,个学生的初始成绩数列表示第,个学生一次累加成绩

6、数列表示第,个学生第斤个学期数列级比表示第i个学生第k个学期数列均值表示第,个学生的预测成绩数列表示第,个学生的预测的一次累加成绩数列Eh)表示第,个学生第斤个学期的残差表示第,个学生第斤个学期的级比偏差(注:其他符号在相关位置再作假设。)问题分析1背景分析学生成绩评价原则是指对学生成绩评价活动的共同的、理性的认识。它是学生成绩理论与学生成绩评价实践活动的纽带。学生成绩评价理论从科学角度对学生成绩的评价进行研究,通常包括假设、概念、原理和原则等。学生成绩评价实践是评价学生成绩实践中所使用的原则、程序和方法。随着社会的发展,办学规模的不断扩大,教学质量的保证和提高的问题日益凸显,各种教学研究和教

7、学实践层出不穷,但是学生学习状况的评价作为提高教学质量和激励学生努力学习的重要手段,却没有得到应有的重视,显然传统的评价方法忽略了学生基础条件的差异,并不能对学生的学习状况进行全面、客观、合理的评价,建立一种科学的评价方法势在必行。2问题一的分析:基本数据分析根据统计学中描述统计方法,对这612名学生的整体成绩情况进行详细分析。其中包括每个学期整体成绩的平均值、最大值、最小值、方差、标准差、差评率、优秀率等多项指标。通过对附表所给的数据进行统计整理并作出相应的波动图、直方图、饼状图等,可以更为直观地了解四个学期成绩的分布情况。最终对学生的整体情况进行全面、客观、科学的分析说明。3问题二的分析:

8、成绩评价模型的分析传统方法中,对个体学生的成绩进行评价的方法主要是基于基本的统计计算,比如均值、排序等。事实上,这些方法单从成绩本上来讲基本能够反映学生的学习状况,但是其中也有很多局限性,比如排序评价,A学生与B学生的成绩可能相差分,但是经过排序后,就认为A学生比B学生优秀,这显然不是很合理。本文主要从实际出发,以学生心理接受程度为依据,提岀依据学习成绩的实际分布情况进行分类的方法对学生学习状况进行评价。然而究竟以什么标准进行分类呢分成多少级好呢分好的级别能够反映怎样的学习状况呢目前对于已知数据进行已知分类数或者未知分类数的方法有很多,常用的有聚类分析法。聚类分析是一种探索性的分析方法,在分类

9、的过程中,不必事先给出一个分类的标准,聚类分析能够从样本数据出发,自动进行分类。聚类分析所使用方法的不同,常常会得到不同的结论。不同研究者对于同一组数据进行聚类分析,所得到的聚类数未必一致。聚类分析中的k-均值聚类法,又叫迭代聚类法或者快速聚类法,可以事先给出分类数,聚类的结果也比较科学和合理,本文采用该方法作为成绩评价模型的主要方法。采用该方法进行聚类时,先给对象集一个粗糙的初始分类,然后用某种原则进行修改,直到分类比较合理为止。其具体步骤如下:原始数据的预处理:通过损失函数计算合理的分类数K将数据分成K个初始类,并计算各初始类的中心坐标通过合适的距离计算将数据重新分类,分类的原则是将样品划

10、入离中心最近的类中,然后重新计算中心坐标重复步骤3,当聚类满足算法终止条件时停止计算4问题三的分析:成绩预测模型的分析现实中,预测问题有很多种求解模型,比如BP神经网络模型、一元线性回归模型、灰色预测模型等。对于问题三,已知一批学生的前四个学期的成绩,预测其第五六学期的成绩,非常类似于灰箱过程。在灰色系统中,灰箱是已知部分数据,进而推测其他数据的一种模型。灰色预测是灰色系统的一个重要方面,它通过鉴别系统因素之间发展趋势的相异程度,即进行关联分析,并对原始数据进行生成处理来寻找系统变动的规律,生成有较强规律性的数据序列,然后建立相应的微分方程模型,从而预测事物未来发展趋势的状况。灰色预测是指利用

11、GM模型对系统行为特征的发展变化规律进行估计预测,同时也可以对行为特征的异常情况发生的时刻进行估计计算,以及对在特定时区内发生事件的未来时间分布情况做出研究等等。这些工作实质上是将“随机过程”当作“灰色过程”,随机变量”当作“灰变量”。本文釆用的是灰色系统理论中的GM(l.l)模型。3.4.1灰色建模可行性检验:对原始数据进行预检验与预处理为了保证建模方法的可行性,需要对已知数据列做必要的检验处理。设第/个学生第丿个学期的成绩为Y疋=(疋(7),黒,:娼(曲,1WjWn计算数列的级比迟(k-Z)心(幻一仙、,k-2,3,,刀珀(幻如果所有的级比兄都落在可容覆盖巧,即,(在本文中,小范围内,则数

12、列#可以作为灰色模型GM(l.l)的数据进行灰色预测。否则,需要对数列#做必要的变换处理,使其落入可容覆盖内。3.4.2建立GM(1,1)灰色模型对数列菇做一次累加生成1-AG0数列:X2!=(处(7),応,对(/?)其中,k”伙)二1Wjk,kWnJ=i均值数列易(W)二0.5*上(&)令0.5*&-/).k=2,3,,n则zi=(z乂為,w(.刃,,Wo)丿于是可建立灰微分方程纟伙)+az二b,k-2,3,,n纟伙)+az二b,k-2,3,,n转化为白化微分方程dx1,2+上二0-分1“=(afb)7tY=(站,站(3),9.-()4则由最小二乘法,求得使7(/)=(F一BuY(Y-BS达

13、到最小值的U=(a.b)T=(BtB)切(8)于是可求解白化微分方程(7)得到预测值为亠rlxfr-3.4.3预测值检验3.4.3.1残差检验计算残差值輕(&)-i(k)如果残差g2(幻0.2则可认为预测结果达到一般要求;如果残差g2(幻0.1则可认为预测结果达到较高要求;3.4.3.2级比偏差值检验计算级比偏差(J-Q5扒j.0-J*2(幻,k=1,2,如果级比偏差PXAO0.2则可认为预测结果达到一般要求;如果级比偏差P0.1则可认为预测结果达到较髙要求;利用Excel计算得到级比偏差检验数据(详细计算结果如表5(详细数据见附件9)所示),从学期2到学期4三个学期的级比偏差均值为依次为、和

14、,表明绝大部分级比偏差值都满足P個W0.1因此,可以说模型的预测结果能达到较高的要求。模型的建立与求解1学生成绩整体情况的总体分析4.1.1对学生成绩的描述统计分析及结果说明本文采用统计学中描述统计的方法对学生总体成绩的原始数据进行详细分析,得到了学生成绩的基础数据,如表1所示:表1学生成绩整体情况的描述统计方差偏度偏度的标准误峰度峰度的标准误极小值极大值从描述统计结果可以知道,由于偏度值都为负值,因此可以判断学生每个学期的总体成绩分布都厲于负偏态分布,即其波峰偏向于成绩较高的右侧,说明学生的总体成绩偏向于高分,且每个学期的偏度值的绝对值逐渐增大,因此偏态程度越来越严重。峰度值为正值,且每个学

15、期逐渐增大,说明高分层的学生数量逐渐增多。均值分数都在72-76分之间,可以判断学生的总体成绩状况良好。极大值普遍保持在90分左右,说明高分层波动不大。为了更直观地观测成绩分布情况,作出学生成绩波动图:弟一佯期成沁动第二学期三孚期成瀆波功图1学生成绩波动图从图1可以清楚地看到,学生成绩基本分布在七八十分之间。不过仅仅以此图进行分析说明过于笼统,因此为了更精确地刻画成绩分布,本文依据现实情况,把学生成绩按照如下评定方法划分为四个等级:1TOC o 1-5 h z.90-100分优75-90分良60-75分中60分以下差据此可以做出成绩等级饼状分布图:第一学期第二学期9.64%0.00%优良中差8

16、17%_35.13%0.33%42.81%4/55fSb.7优良中差第三学期第四学期572So16%4.25%丁000%优良39.54%1优良仏中回中F56214739%差%差图2成绩等级饼状分布图从图2可以准确地知道,90%以上的学生成绩都集中在良和中(即60-90分)两个等级之间,其中等级为良的人数占46%-57%,等级为中的人数占35%-48%,而差评的学生为数不多,在4%-10%之间。然而成绩占优的学生比率非常低,且第一和第四学期一个都没有。具体数值如图3所示:频数统计345344图3成绩等级分布柱状图综合以上,可以总结出学生成绩整体情况的分析说明:学生总体成绩分布属于负偏态分布;学生

17、总体成绩良好;绝大多数学生成绩分布在60-90分之间;90分以上的学生数量甚少,每学期只有1-2个,有两个学期甚至一个都没有。差评的学生为数不多,平均每学期只有43个,占总人数的1.2.2.2对结论的检验首先,本文釆用非参数检验方法Kolmogorov-Smirnov检验(D检验)和Shapiro-Wilk检验(w检验)两种方法进行检验,运用SPSS计算得到表2,如下:表2正态性检验Kolmogorov-Smirnov*Shapiro-Wilk学期统计量dfSig.统计量dfSig.学期1成绩612612学期2成绩612612学期3成绩612612学期4成绩612612a.Lilliefors

18、显著水平修正根据表2可知,D检验和W检验的显著性水平Sig.都极小,小于,因此可以判定为非正态分布。然后,分别利用SPSS绘制直方图、Q-Q图以及箱式检验图对结果进行正态性检验,如图4、图5和图6(清晰效果图请查看附图1-附图12)所示:图4成绩频次直方图从图4可以直观地看出,波峰偏向于右侧,而正态曲线长尾向左侧延长,因此,可以判定学生成绩的总体分布并不服从正态分布,而是负偏态分布。图5成绩标准Q-Q检验图从图5可以直观地看出,只有少部分数据集中在y二x直线上,而大部分数据都偏离了此直线,因此可以判定,该分布为非正态分布,且数据偏向y二x直线的左上方,因此可以推断负偏态分布的结论是正确的。图6

19、成绩箱式检验图在图6的箱式检验图中,方框中的区域表示50%的数据所处的范围,方框的上线边界代表了四分位数间距,方框中间的粗线表示中位数,而方框以外的上下两条横线分别代表了极大值和极小值。如果观测数据服从正态分布,那么50%的数据应该落在纵轴中3间位置。从图6可以明显地观察到,方框处于纵轴片上位置,因此可以判定学生成绩分布为非正态分布,且为负偏态分布。4.2k-均值聚类分析评价模型4.2.1确定分类数K虽然从理论上说,分类的多少并不会对结果的合理性产生较大影响,但是会对结果的精确程度造成一定程度的影响。因此,虽然k-均值聚类分析可以事先给定分类数目,但是为了使分类结果更为精确合理,本文根据统计学

20、中损失函数的原理,利用Matlab编写了分类损失函数并画出图像(代码见附录二),通过观察图像来确定合理的分类数。分类损失函数图像如图7所示:图7分类损失函数图像由于计算数值太多,因此图7显示的图像过于粗糙。由于左侧图像节点比较稀疏,而其他地方比较光滑稠密,因此选取左侧图像进行放大查看,如图8所示:图8放大后的损失函数图像从图8可以看出,曲线在纵轴之间有少许拐点,因此,放大后分别对纵轴以及纵轴之间的图像进行再次放大,如图9所示:图9放大后的损失函数图像从图9可以清楚地看到,大约在纵轴和处以及纵轴和处,图像有四个明显的拐点,因此分类数K取为4或者5都是合适的。由于图像上的观测数值稍偏向于5,因此本

21、文选取K值为5,即分为5类进行聚类。4.2.2利用SPSS进行快速聚类分析以612名学生四个学期的成绩数据为聚类变量,聚类数为5,迭代10次,运行SPSS进行聚类计算的结果如表3-表5所示,其中表6为最终的分类情况(由于篇幅有限,只列出部分数据,详细数据见附件17):表3最终聚类中心12345学期1成绩学期2成绩从聚类中心可以看出,五个类别的聚类中心均值分别为、和。因此可以根据此结果把学生的状况分为5个类别,依次是:学习状况良好、学习状况很好、学习状况一般、学习状况勉强以及学习状况差。表4每个聚类中的案例聚类总数有效个数缺失1231)231022862860384(8404880530总计61

22、26120从表中数据可以看出,处于类别1(学习状况良好)和类别2(学习状况很好)的学生数量占了绝大部分比率,与负偏态分布的结论相吻合,说明分类具有合理性。表5聚类成员(部分数据)j学生序号学期1学期2学期3学期4均值聚类61719*1159916011603160716121均值聚类中心1?2224225?26102611(2均值4.3成绩预测的灰色系统预测模型灰色预测通过鉴别系统因素之间发展趋势的相异程度,即进行关联分析,并对原始数据进行生成处理来寻找系统变动的规律,生成有较强规律性的数据序列,然后建立相应的微分方程模型,从而预测事物未来发展趋势的状况。灰色预测是指利用GM模型对系统行为特征

23、的发展变化规律进行估计预测,同时也可以对行为特征的异常情况发生的时刻进行估计计算,以及对在特定时区内发生事件的未来时间分布情况做出研究等等。这些工作实质上是将“随机过程”当作“灰色过程”,“随机变量”当作“灰变量”。本文采用的是灰色系统理论中的GM(1,1)模型。4.3.1灰色建模可行性检验:对原始数据进行预检验与预处理为了保证建模方法的可行性,需要对已知数据列做必要的检验处理。设第/个学生第丿个学期的成绩为赴=(笊ID,左,(),1WjWn(1)计算数列的级比hk-刀久V)二;細,k二2,3,.(2)如果所有的级比兄都落在可容覆盖忌,六),即,(在本文中,“4)范围内,则数列#可以作为灰色模

24、型GM(l.l)的数据进行灰色预测。否则,需要对数列#做必要的变换处理,使其落入可容覆盖内。即取适当的常数G作平移变换(揺伙)=代心+C,k=1,2,n则使数列*二6孜力)的级比为ML-;)疋(附=:細&X.k=2,3.n(3)由于有两个成绩为0討轅据,因此在计算级比时,统一将其当作缺失值并做替换处理(用该学生成绩非0的其他几门成绩的均值代替),由于数据量极少,因此不影响整个模型的计算结果。之后运用Excel进行计算后得到每个学生的级比,并对其进行比较判断后证实所有数据均落在可容覆盖范围内(详细数据见附件6)。三个级比的均值依次为、0和。因此学生成绩可以进行灰色模型GM(1,1)的数据进行灰色

25、预测。4.3.2建立GM(1,1)灰色模型对数列卅做一次累加生成1-AG0数列:xi=&(0用,03)二矽7),总7)卄疋用+以刃,,畑-1)hti)(4)其中,k欣A)=,1WjWk,kWnJ=i均值数列易伙)=0.5*0.5*x1-1),k=2,3,,n则z1!=,么l,Z!3)(5)于是可建立灰微分方程离伙)+胡(R)=b,k=2,3,,n(6)转化为白化微分方程务#/(上)-b记为I“二(a,b)T,Y=(如,她,站5)5二I则由最小二乘法,求得使心)=(F-By(Y-Bu.)达到最小值的I.h=(a.b)T=(BtB)2Br(8)于是可求解白化微分方程(7)得到预测值为”刀=(改刀_

26、f)e詁十夕$=12s-1(9)且迥匕+I)二込(k+1)-宕(),k=1,2,,n一1其中的待求参数爲和力则由公式(8)计算得到第i个学生待求参数血和仞。将血和血代入方程(9),可得预测方程为607610607610以k+f)=(#()-号)e_aik+三,k=12:n一1(10)依据预测方程仃0),写出Matlab代码(代码见附录一)即可计算每个学生第5、6学期的成绩预测值。而当k=1.2,3,4时,模型计算得出的是前四个学期的成绩拟合值。3.4.4预测值检验4.3.4.1残差检验计算残差值如果残差心)则可认为预测结果达到一般要求;如果残差0.1则可认为预测结果达到较髙要求;利用Excel

27、计算得到残差检验数据(详细计算结果如表4(详细数据见附件9)所示),前四个学期的残差均值为依次为、和,表明绝大部分残差值都满足個W0.1因此,可以说模型的预测结果能达到较髙的要求。表6残差检验序号学期1学期2学期3学期410203140566066086094.3.4.2级比偏差值检验计算级比偏差(1-0.刚=1-人個=12,n如果级比偏差P0.2则可认为预测结果达到一般要求;如果级比偏差PW0.1则可认为预测结果达到较高要求;利用Excel计算得到级比偏差检验数据(详细计算结果如表5(详细数据见附件9)所示),从学期2到学期4三个学期的级比偏差均值为依次为、和,表明绝大部分级比偏差值都满足P

28、心)W0.1因此,可以说模型的预测结果能达到较髙的要求。根Matlab的计算结果得到前四个学期的拟和成绩和第五六学期的预测成绩,如表6(详细数据见附件7)所示,这里只列出部分数据:极大值极小值12.均值75.76.其中后两个学期的极大值出现异常,为了准确地找出异常值,以第五学期为主要关键字,第六学期为次要关键字对预测结果进行排序,结果如表7所示:表9对第五六学期预测成绩排序后的结果612346307从表7可以方便地看到,第五学期348、387、346、307号学生以及第六学期282、468、301、348、387、346、307这几位同学的成绩超出了100分,且307同学第六学期的分数值超过了

29、180分。出现此问题主要是因为级比值过低,即成绩逐学期递增的趋势偏大,其级比均值为0.,而其他学生的级比均值为,两者相差,导致在预测的时候超出100分。模型在计算的时候并未就预测值做范围限制,且100分制的成绩模式属于现实世界中的人为规定,并不能为灰色预测模型所识别,因此也没有必要对此做限制。3.4.6成绩预测结果检验4.3.6.1对预测成绩的正态性检验如下:表10正态性检验学期Kolmogorov-Smirnov8Shapiro-Wilk统计量dfSig.dfSig.统计量学期1成绩612学期3成绩612612612612|学期4成绩学期5成绩612612学期6成绩612612学期2成绩61

30、2612根据表7可知,D检验和w检验的显著性水平Sig都极小,小于,因此可以判定为非正态分布O4.3.6.2-3.6.3图不法检验运用直方图、标准Q-Q检验图和箱式检验图(清晰图片见附图13-附图18)对预测成绩进行检验如下:学期5成須宜方图GW6成汝图10预测成绩频次直方图从图7可以直观地看出,在100分以内的成绩分布中,两个学期的波峰偏向于右侧,而正态曲线长尾向左侧延长,因此,可以判定学生成绩的总体分布并不服从正态分布,而是负偏态分布。而学期六的波峰直接看起来稍微偏向于左侧,这是因为GM预测模型的预测值有极少量数据偏大,在作图时并未剔除这几个数据。如果仔细观察图7中的右图可以发现,成绩大于

31、100分的数据只有极少量,因此,如果剔除这些数据后作图可以得到准确的负偏态分布图。屮恥放缄的。Q-Qffl成站的怀川3馬屮恥放缄的。Q-Qffl成站的怀川3馬图11预测成绩标准Q-Q检验图从图8可以直观地看出,在100分值范围内,只有少部分数据集中在尸x直线上,而大部分数据都偏离了此直线,因此可以判定,该分布为非正态分布,且数据偏向尸x直线的左上方,因此可以推断负偏态分布的结论是正确的。类似于直方图,曲线的中心稍微偏向于左侧,是因为并未剔除极少量的偏大数据。M011图12预测成绩箱式检验图从图9中可以明显地观察到,在100分值范围内方框处于纵轴偏上位置,因此可以判定学生成绩分布为非正态分布,且

32、为负偏态分布。而图9中的右图方框稍微偏向于下方,也是由于在作图时并未剔除极少数的偏大数据。综合以上各种检验方法,可以得出结论:利用灰色GI(1,1)预测模型计算得到的预测数据是合理可靠的,具有较髙的可信度。4.4给学校管理部门的建议学生成绩是学生学习状况的直接反映,在衡量学生知识水平、教师教授水平、学校教学管理等方面具有重要意义,因此对学生的考试成绩进行分析研究对学校的教育能力、学生的学习水平具有现实意义。我们运用统计学的相关原理和工具对612名学生四个学期的成绩进行分析后,给出了如下几条建议,望学校领导重视:一、学生成绩呈正态分布并非合理论断。目前主流的观点认为,学生的成绩分布应该呈现正态分

33、布,然而本文对612名学生的成绩经过科学地统计分析后发现,这些学生的成绩分布并不是正态分布,而是大多数成绩偏向于高分值的负偏态分布。我们结合现实情况,对此结果做了细致思考,得出以下结论:影响学生成绩高低的因素是多方面的,老师们在对学生成绩作评价的时候应该根据实际情况进行分析;影响考生成绩髙低的因素主要有两个方面:考试题目的难度对学生成绩的影响很大,学生自身的知识水平对考试成绩的影响也很大。因此,如果在对考试成绩进行统计分析后发现其分布呈现负偏态分布,则说明考生成绩偏向于高分值。在这种情况下,首先应该对试题难度进行合理论证,如果难度偏低,则说明成绩分布是合理的;如果难度偏髙,则说明学生自身的知识

34、水平很高;如果难度适中,则说明考生自身的知识水平比一般水准稍高。反之,如果考试成绩呈正偏态分布,则说明考生成绩偏向于低分值。在这种情况下,同样先要对试题难度进行合理论证,如果难度偏低,则说明学生自身的知识水平较低;如果难度偏高,则说明成绩分布是合理的;如果难度适中,则说明考生自身的知识水平比一般水准稍低。当然,成绩分布具体的合理程度以及考生的具体水平如何主要取决于曲线分布的偏度值、成绩的均值。因此如果学校领导们需要对考试成绩和学生们的学习状况作详细的分析研究,应该综合运用统计学的原理和相关工具进行建模分析,甚至可以找专门统计分析师进行科学分析。二、优秀率和差评率过低必须引起高度重视。一般认为,

35、分数大于90分则为优。而分数小于60分则为差。倘若学生成绩的优秀率极低,甚至为0,在排除试题难度超常甚至严重超纲的情况下,无论如何具有不合理性。因为无论是正态分布还是偏态分布,极髙的出现都是必然的。同理,差评率也是如此,极差的出现也都是必然的。因此,在出现此状况后,需要对试题难度进行合理论证,必要情况下还需要对近期的教学情况进行考察和调研。三、优秀率和差评率过髙也必须引起髙度重视。因为无论是正态分布还是偏态分布,极高值和极低值机不可能大量出现,否则必定是有问题的。四、标准偏差过大从侧面反映了学习状况存在众多不稳定因素。这些不稳定因素可能包括学生的情绪和心理状况不稳定,教育策略存在偏向性(教师偏

36、向于教授某知识点或者偏向于某学生等)。五、对于极差的个别学生,应该单独对他们进行沟通以找出他们成绩差的原因所在,进而对这些学生加强思想引导,增加学习压力,充分调动他们的学习能动性和积极性。模型的推广模型三的改进与推广在现实中,考试成绩无论是以原始分计算还是以标准分计算,都有一个范围限制,比如原始分,通常是采用百分制。而GM(1,1)模型在建立时并不能对预测结果的范围进行限制,因此很可能会出现预测结果超出上限的情况。考虑改进模型,使其能够根据实际情况限制预测结果的上下限。对模型进行研究后发现主要可以从两个方面对模型进行修改:1、改进级比数列儿的计算方法,添加上限平衡因子3对每一个级比进行平衡运算

37、,以增大较低的级比值。2、在预测函数中添加限定条件,只要预测值超出上限,就将其修改为上限值再输出。这两种方法在技术上都是可行的,然而方法一在计算上过于复杂,在技术上主要有以下两个难点:一是添加平衡因子3后不能对正常的级比值造成影响;二是平衡因子3的计算难度过大。为了解决这个问题,我们考虑这样处理:首先根据计算出所有的级比数列,然后计算其均值,最后把所有的级比值与该均值进行比较,如果低于改值,则将该数据当作缺失值处理。这样做虽然会产生一定的误差,但是考虑到预测结果超出常值的数据数量所占比率很低,并不影响整体,所以据此改进后的模型依然是可行的。而对于方法二,其原理简单,计算也容易。更重要的是,用此

38、方法修改模型后的预测结果同样具有合理性。因为虽然预测结果超出了上限,但是同时也说明该数据已经达到最佳值或者最低值,比如成绩数据,既然预测值超出了100分,那么说明该学生的水平也达到了最佳值。具体流程如下:因此可以采用方法二进行模型的改进。在添加了限制条件后,模型的适用性就增强了,应用范围也扩大了很多。因此对于模型的推广具有实际意义。参考文献张兴福,统计学原理,北京:北京大学医学出版社,北京大学出版社,2010年杜强,贾丽艳,SPSS统计分析从入门到精通,北京:人民邮电出版社,2009年IBM,IBMSPSSStatistics19用户指南,北京:IBM,2010年百度百科,灰色预测,2011年8月15日豆丁网,灰色预测模型及其应用,2011年8月15日附录附录一:预测学生成绩的Matlab代码%GM(1J)6jI=(a,b)T=(BT*B)(-l)*irT*YODp入clearall;%11AEiEy%YBtmp=xlsresd(l%b7GM(1,1)EyOpzJA1.x1sr110O61,1B2:D613r);Y_tmp=xlsread(fJ%b7GM(1,1)EyOpzJAi.xlsY%066,B2:D613);%HAEiAitoNEunUONUpiAd-E%3EXx=xlsread(%b7GM(1,1)EyOpz;Ai.x

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论