汇编浅析高考作文网上阅卷取分函数的数学模型_第1页
汇编浅析高考作文网上阅卷取分函数的数学模型_第2页
汇编浅析高考作文网上阅卷取分函数的数学模型_第3页
汇编浅析高考作文网上阅卷取分函数的数学模型_第4页
汇编浅析高考作文网上阅卷取分函数的数学模型_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2012年全国高考模拟参考部分高考作文网上阅卷取分函数的数学模型田 俊 忠(西北第二民族学院信息与计算科学系,宁夏银川市,750021)摘 要:高考作文网上阅卷的核心问题之一是如何确定考生成绩的取分函数,它将直接影响作文网上阅卷的科学性与对考生的公平性。本文在2002年宁夏高考作文网上阅卷成绩的现场数据基础上,利用概率统计的数学方法,建立了取分函数的三种数学模型,并进行数据模拟和比较,给出了比较科学合理最优的取分函数模型,而且在分析数据和总结历史经验的基础上,阐述了取分函数模型的思想过程及求解算法。关键词: 作文网上阅卷 取分函数 数学建模 数据模拟1 问题的提出作文网上阅卷是主观性试题网上阅

2、卷难度最大的一个课题,是整个阅卷工作电子信息化与自动化技术的一个最后的瓶颈。作文网上阅卷电子信息化解决方案形成意味着各种考试,各门课程主观性试题网上阅卷的彻底解决;可是作文网上阅卷在数学上存在着两大关键性的核心问题:1:每份试卷都先由两位阅卷老师独立地按照评分标准进行评分,在什么样的情况下进行对考生的作文进行三评,能使得这种区分方法在理论上是科学合理的,对考生是公正公平的,在工作量上是现实可行的。2:面对考生的二评或三评的评分,如何计算考生的成绩等问题,使得这种成绩的取分函数在理论上是科学的,对所有的考生是公平的。2 模型假设(1)作文试卷电子化经过电子扫描处理过的电子作文完全消去了影响试卷公

3、平阅卷的任何外在因素,不久有关考生的个人特征信息完全消去(如:考生姓名,考号,考区),评分多少,已评还是未评,是二评还是三评,是自评还是他评等方面的信息对评卷人员完全不存在;电子化的作文还可以多次分发,可以在同一时间发给不同教师,也可以在不同时间分发给不同的教师或同一教师,在时间上,评卷人员是分离的,相互独立的。(2)试卷分发的随机化作文电子化处理之后,可以使用随机化方法进行分发,比如可以用抽签法,随机数表法或人工随机抽取等方法.其随机化的方法可以使一篇电子作文在阅卷期限内的任何时间上都有同等的概率分发到每位评卷人员上;阅卷人员在评阅同一份作文是有差异的,尽管在评卷之前进行了认真培训,讨论评分

4、标准,模拟评阅,使阅卷评分更加趋同;但由于评卷人员在知识背景,阅历,对评分标准的理解力与个人倾向偏好等因素的存在与影响,评卷人员的差异总是存在的。随机化分发,使得这种差异对每位考生的影响是等概的,因而是公平的。(3)评阅的独立化由于作文的电子化处理与多次分发,第一位评卷人员在任何时间上评阅一篇作文时,不受任何外在信息的干扰,保证其独立自由地认真评阅,若干评卷人员即使评阅同一篇电子作文,也无法交流各自的观点与传递信息,试卷上也无已评的任何标记,互不影响,独立自主。任何一位评卷人员对任何一篇电子作文的评分都是相互独立的。(4)评分X的正态性由于评卷老师都是长期任教,多次参加高考作文阅卷,进行了严格

5、培训与选拔,充分讨论评分标准,模拟评卷,规范评卷行为,统一基调。由于所有阅卷人员都是独立自主地按照评分标准评阅作文,那么所评成绩服从正态分布。即XN(m,s)。其中:m表示作文成绩的理论值,s表示所有阅卷老师评分差异的平均水平。(宁夏高考作文网上阅卷研究报告之一支持此结论) 23 模型分析由模型假设,设X是考生作文的评分,则应有评分的分解式:X=m+e2因为 E(X)=m, 那么 E(e)=0 ,D(e)=s那么一篇作文的评分X的数学模型为:ìX=m+eí2 eN(0,s)î其中:m是考生作文成绩的理论值,e是评卷人员的评分与真值的偏差, e的大小反映了评卷老师阅

6、卷水平与对评分标准的理解把握程度的好坏。对任意一篇电子作文而言,m与e是未知的,也是不可测的。 造成考生成绩偏差来自e,所以e的偏差等于考生成绩偏差。设Xi是一篇电子作文第i评的评分,(i=1,2或i=1,2,3)为了使考生的成绩更加公平,应使e的偏差处在一定的范围内,为此提出区分度A 当当X1-X2<A,仅有两评的成绩X1与X2 X1-X2³A,则进行三评,设三评成绩为X3如何根据两评的成绩X1与X2或三评的成绩X1,X2,X3来计算作文的应得成绩,我们在二评时在兼顾两位老师评分的同时,也应该注意到,得高分比较难,概率也比较低,得高分的考生说明他们的素质水平高,所以要保护高分

7、即加大其权重。 当X1-X2³A,则进行三评,说明前两位阅卷老师中至少有一位阅卷有偏差,所以在三评时应在兼顾三位阅卷老师打分的同时,也要加重前两位阅卷老师其中一位与第三位阅卷老师分值相差不大分值的权重,同时也要减低出现误差值的权重,这样才能很好地维护考生的利益,使考生的成绩是合理的,公平的。第三位阅卷老师的打分其实就是为了验证前两位阅卷老师,前二位阅卷老师的评分: 如果Xi-X3<A,i=1,2,则表明Xi的评分是合理的,偏差不大,应加大其权重。 如果Xi-X3³A,i=1,2,则表明Xi的评分是不合理的,偏差很大,应尽可能地减低其权重,但是不能使其为零,因为它还是有

8、一点贡献,只不过小而已。4 模型建立由上述模型假设和模型分析可知,每位阅卷老师在打分时相互独立的,互不干涉,所以Xi之间没有相关性,是独立的,即他们在构成考生成绩是线性的。由于阅卷老师在评分时存在一定的偏差,有的影响大点,有的影响小点,而且他们分数高低不同,难度程度也不同,所以他们评分的权重是不同的,即评分系数是不同的,并设bi(i成绩。于是建立考生取分函数模型: =1,2,3)Xi的系数,Y为考生Y=b1X1+b2X2+b3X3 (4.1)其中: bi(i=1,2,3)是待定系数,Xi(i=1,2,3)是已知阅卷老师的评分值。根据2002年宁夏高考网上作文阅卷数据并经统计分析,知考生得分主要

9、集中在一定分数范围内,说明其得分的频率是不同的,而且得高低分频率远远低于得中间分数的频率,基于此我们以人数为衡量的标准用MatLab画出考生分数分布图,其x轴为考生的得分值(060),y轴为考生某一分数所对应的人数比例 (01),如图1所示:图1从上图可以看出考生在得分时是有差别的,处在不同的分数段有不同的难易度,所以我们根据考生成绩处在不同分值内,得分的系数是不同的。设难度系数 F(x)=åi<xfiåfi (4.2)其中fi是分数为i的人数(2)式的实际意义是考生得x分数前有多少人得分小于x,得分小于x人数多少反映了得x分数人的能力的大小,比åfi是为了

10、归一化。现在要求Y,必须先求bi(i=1,2,3)。在求bi时必须给出bi满足的条件,从而根据这些条件构造出bi41 两评的取分函数模型: 当X1-X2<A时,则进行二评,于是 ,X3=0,b3=0根据实验数据要求和假设分析可知,在二评时,认为二位阅卷老师的评分是符合误差范围的,所以它们的系数大小只于他的难度有关,于是得到二评满足的条件:若F(x1)越大,则b1越大, 若F(x2)越大,则b2越大 所以,b1,b2满足条件的数学模型为:ìb1=kF(X1)ïíb2=kF(X2)(4.3)ïb+b=112î由方程(4.3) 解得: k=1F

11、(X1)+F(X2)(4.4)F(X1)ìb1=ïïF(X1)+F(X2)íF(X2) 那么 (4.5)ïb2=ïF(X1)+F(X2)î于是得两评的取分函数S=F(X1)F(X1)+F(X2)X1+F(X2)F(X1)+F(X2)X2(4.6)42 三评的取分函数模型:模型一:当X1-X2³A时,则进行三评,于是,X3¹0,b3¹0 根据实验数据和模型分析可知出现三评是由于前二位阅卷老师其中一位出现偏差,三评是为了验证那一位出现偏差,并纠正其偏差,所以它们的系数大小不久与他的难度有关,而且与X

12、i-X3(i=1,2)大小有关,于是得到三评满足条件:(1) 若X1-X3越小,则b1,b3越大 (2) 若X2-X3越小,则b2,b3越大 (3) 若F(x1)越大,b1越大 (4) 若F(x2)越大,b2越大 (5) 若F(x3)越大,b3越大所以,得出b1,b2,b3满足条件的数学模型为:ìkF(Xïb1)1=ïX1-X3ïkF(Xíb2)2=ïX2-X3ïb3=kF(X3)ïîb1+b2+b3=1由方程(4.7)解,得k=X1-X3×X2-X3F(X1)X2-X3+F(X2)X1-X3+

13、F(X3)X1-X3×X2-X3于是得:ìF(Xïb1)X2-X31=ïF(X1)X2-X3+F(X2)X1-X3+F(X3)X1-X3×X2-X3ïï=F(X2)X1-X íb32ïF(X1)X2-X3+F(X2)X1-X3+F(X3)X1-X3×X2-X3 ïF(Xï3)X1-X3×Xïb2-X33=îF(X1)X2-X3+F(X2)X1-X3+F(X3)X1-X3×X2-X3(4.7)(4.8)(4.9)7那么三评取分函数T=F(

14、X1)X2-X3F(X1)X2-X3+F(X2)X1-X3+F(X3)X1-X3×X2-X3F(X2)X1-X3X1+F(X1)X2-X3+F(X2)X1-X3+F(X3)X1-X3×X2-X3F(X3)X1-X3×X2-X3F(X1)X2-X3+F(X2)X1-X3+F(X3)X1-X3×X2-X3X2+X3模型二:同理根据三评模型一满足的条件可知,我们把自身影响因素转化到对方相应的对立因素即得出三评满足条件: (1) 若X1-X3越大,则b2越大 (2) 若X2-X3越大,则b1越大 (3) 若F(x1)越大,b1越大 (4) 若F(x2)越大,b2

15、越大 (5) 若F(x3)越大,b3越大所以,得出b1,b2,b3满足条件的数学模型为:ìb1=kF(X1)X2-X3ïïb2=kF(X2)X1-X3íb3=kF(X3) ï (4.10) ïb1+b2+b3=1î由方程(4.10)解,得k=1F(X1)X2-X3+F(X2)X1-X3+F(X3) (4.11)那么:ìF(X1)X2-X3ïb1=F(X1)X2-X3+F(X2)X1-X3+F(X3)ïïF(X2)X1-X3íb2=F(X1)X2-X3+F(X2)X1-X3+F

16、(X3) (4.12) ïF(X3)ïïb3=F(X1)X2-X3+F(X2)X1-X3+F(X3)î于是得三评取分函数T=F(X1)XF(X1)X22-X3-X3+F(X2)X1-X3+F(X3)X2X1+F(X2)X1-X3F(X1)XF(X1)X2-X3+F(X2)X1-X3+F(X3)F(X3)-X3+F(X2)X1-X3+F(X3)+(4.13)X32模型三:并考虑到X1-X2自身偏差大小还对其系数大小有一定的贡献,于是得到三评满足条件:(1) 若X1-X3越小,则b1,b3越大 (2) 若X2-X3越小,则b2,b3越大 (3) 若X1-X2

17、越小,则b1,b2越大 (4) 若F(x1)越大,b1越大 (5) 若F(x2)越大,b2越大 (6) 若F(x3)越大,b3越大所以,得出b1,b2,b3满足条件的数学模型为:ìïb1=X-1ïïbï2=X2-íkF(XXX31)2×X1-X2kF(X3)1×X-X2(4.14)ïïbkF(X3)3=ïX1-X3×X2-X3ïîb1+b2+b3=1由方程(4.14)解,得X3×X2-X3×X1-X2k=X1-F(X 1)X2-X3+F

18、(X2)X1-X3+F(X3)X1-X 2那么:ìF(X-Xïb1)X231=ïF(X1)X2-X3+F(X2)X1-X3+F(X3)X1-X2ïïF(X-Xíb2)X132=ïF(X1)X2-X3+F(X2)X1-X3+F(X3)X1-X2 ïF(X-Xïb3)X12ï3=îF(X1)X2-X3+F(X2)X1-X3+F(X3)X1-X2于是得三评取分函数T=F(X1)X2-X3F(X1)X2-X3+F(X2)X1-X3+F(X3)XX1+1-X2F(X2)X1-X3F(XX2+1)

19、X2-X3+F(X2)X1-X3+F(X3)X1-X2F(X3)X1-X2F(X1)X2-X3+F(X2)X1-X3+F(X3)X1-XX32(4.15)4.16)10(5 模型求解根据难度系数 F(x)=åi<xfiåfi并统计2002年宁夏高考网上作文阅卷数据,得到F(x)的值,如表所示此表中出现一些分数没有对应的难度系数,主要是因为去年高考没有这些分数,所以认为这些分数难度系数等于它前一个分数的难度系数,零的难度系数为零,一分的难度系数等于零分的难度系数,依次类推,六十分的难度系数等于1。关于Xi-X3(i=1,2)值的计算只是在阅卷老师分数打出后,再进行简单的

20、求绝对值,然后由F(Xi)(i=1,2,3)组合计算就得到考生二评、三评成绩。6 数据模拟二评取分函数模拟:三评取分函数模拟模型一:模型二:模型三:我们从以上数据模拟可以看出二评的现评成绩与历史成绩相差不是很 大,主要因为现在所用的算法基本上符合原来两个成绩简单平均而得到的成绩,差值都是现评成绩大于历史成绩,这说明现在算法更有效地保护高分,更加具有区分度,使考生成绩更加合理化。三评取分函数数据模拟时出现一些现评成绩与历史成绩偏差很大,一些偏差不是很大,造成上述主要原因是:1:历史成绩取分函数在判断当T=Xi+X32Xi-X3<A(i=1,2)时,则得,没有考虑Xi-X3³A(i

21、=1,2)中Xi的影响,所以造成成绩要么偏高,要么偏低。2:现评成绩取分函数是在兼顾三位阅卷老师打分的同时,没有完全丢掉Xi-X3³A中Xi的贡献,Xi也起到调节考生分数的作用,不过,从差值来看如果Xi与其他二个分数相差不大,它的调节作用不是很大,基本上和历史数据吻合,相反,则很好地体现了Xi的贡献和调节作用,使考生的成绩具有全面性,既不是片面地夸大或偏低某一分数的影响,又不加大偏差很大成绩的影响,所以对考生成绩的计算是全面的,合理的。7 误差分析由于三评取分函数有三个模型,所以我们现在比较他们之间的误差:从以上简单的比较运算,可知三个模型接近历史评分的程度不同,出现误差的大小可以说明:1:模型2取分函数成绩与历史成绩相差很大,由于模型2三评时只考虑它的难度系数,没有考虑它与X1,X2的距离即阅卷老师打分偏差。2:模型1取分函数成绩与历史成绩相差不是很大,由于模型1三评时,考虑到它与X1,X2打分偏差,但是没有考虑X1,X2自身的偏差。3:模型3取分函数成绩与历史成绩相差比较小,由于模型3一、二评时,既考虑到它与X3的打分偏差,又考虑到X1,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论