评卷策略的设计与优化_第1页
评卷策略的设计与优化_第2页
评卷策略的设计与优化_第3页
评卷策略的设计与优化_第4页
评卷策略的设计与优化_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGE1评卷策略的设计与优化【摘要】在确定像数学建模竞赛这种形式比赛的优胜者时,常常需要评阅大量试卷。本文主要探讨了如何制定合理的评卷方案和筛选方案,以使在最短的时间内,选出优胜者。针对评阅方案的制定问题,首先在对题设条件的理解和分析后,引入评阅论文的分组矩阵和相遇矩阵,接着证明了分组矩阵和相遇矩阵之间的推导关系,在此基础上建立了以每位教师评阅数量在每轮中,整体上尽量均衡,一个教师评阅某一份论文最多一次为约束条件,以在几轮评阅中,被同一教师评阅的论文尽量少为目标函数的非线性规划模型,用matlab软件编程求解得到一组较优的评阅方案。针对在存在绝对名次的情况下,制定评阅方案,以在尽量短的时间内评奖的问题,首先将评阅方案分为三个阶段,定义评阅过程中用到的四个集合,接着在对整个评阅过程的宏观把握的基础上,深入探讨了几个提高筛选效率的原则,然后在此原则的指导下给出了完整的评阅方案流程,并用matlab编程得到在题中所给情况下的所用时间最短的评阅方案,并用随机模拟的方法评价该方案的理想程度。针对在教师存在个人偏好的情况下,制定合理的排名方案问题,首先设计了教师打分的尺度偏差和稳定程度两个刻画教师评分习惯的指标,根据这两个指标可以得知甲、丁、戊教师打分偏高、乙、丙、己、庚、辛教师打分偏低、教师打分的稳定性由高到低排序为辛、丙、戊、庚、己、乙、丁、甲;然后,使用spss软件根据这两个指标对8位教师做聚类分析,可以得知甲和丁打分较为接近,乙、戊、己和庚打分较为接近,丙和辛打分较为接近。然后,在以上分析的基础上利用统计分析的方法建立了一套排名方案,根据每一篇论文已有的分数推测出未评阅该论文的教师对该论文的评分,用每篇论文的全体教师评分的均值取代部分教师评分的均值,使得排名结果更为合理,并对其合理性进行了证明。在对以上三个问题的研究之后,用excel进一步分析了附录2数据中评阅方案的设计方法,推测出其可能的评阅原则后,再结合数据,用历史数据最优还原的方法对此原则进行验证,给出了各原则的数据通过率。综上所述,本文在理解题意的基础上,分别设计了不同条件下的试卷评阅方案、筛选方案和排名方案,并利用Matlab编程实现求解,具有较强的现实参考意义。【关键词】评阅方案绝对名次打分偏好排名方案一、问题重述数学建模竞赛的论文评阅是数学建模竞赛的重要环节。理想的办法是每个评阅教师评阅每一份论文,但由于时间和精力的限制做到这一点是很困难的,因此有必要找出一种有效的筛选方案,即:用较短的时问,通过几轮筛选,选出优胜者。现有150份参赛论文、8个评阅教师,每位教师评阅一份论文的时间均为半小时、每天评阅论文均为2小时。评出3个一等奖、6个二等奖、9个三等奖、18个优秀奖。据此解决以下三个问题,各问的条件无关、要求无关。一、若每份论文至少4位教师评阅,确定评阅方案,该方案还应满足:每位教师评阅数量在每轮中、整体上应尽量均衡;筛选的轮数尽量少;一个教师评阅某一份论文最多一次;总评阅次数尽量少;为使论文评阅尽可能的混合,在这几轮评阅中,被同一教师评阅的论文尽量少。二、理论上,每份参赛论文按论文质量应有确定的名次,我们称之为绝对名次。假设评阅教师在每轮评阅中只对该轮评阅的论文排名(评阅教师可在各轮评阅中重复评阅同一份论文),且每位教师的论文排名与绝对名次中的排名一致。确定评阅方案,在尽量短的时间内评奖。该方案应满足:每位教师评阅数量在每轮中、整体上应尽量均衡。附录1的数据给出了150份论文的绝对名次。并根据制定的评阅方案,计算论文评奖所需时间。三、事实上,教师不可能给出准确无误的排名,于是通常是每位教师给论文打分,以每份论文的平均得分作为排名的依据。附录2数据给出了对150份论文的打分情况。据此考察:1、各教师的打分情况:哪些偏高、哪些偏低、哪位教师打分不稳定、哪些教师较接近等。2、根据各教师打分存在的问题,设计更合理的排名方案,在附录2数据的基础上对150份论文评奖。3、证明所制定的排名方案比按平均分排名具有更高的合理性。四、考察附录2数据中评阅方案是如何设计的,尽可能提出更合理的评阅方案及排名方案,兼顾公平和效率。二、问题分析针对问题一,只需要制定教师的评阅方案,评阅轮是指把150份论文全部评阅过有且仅有一次的时间。评阅轮数为4,每份论文都被四位教师评阅过。据此可以建立规划模型,满足一个教师评阅某份论文最多一次,且每轮中、整体上,教师评阅数量尽量均衡的约束,以几轮评阅中,被同一教师评阅的论文尽量少作为目标函数,建立规划模型。针对问题二,在存在绝对名次的情况下,制定评阅方案,以在尽量短的时间内评奖,首先将评阅方案分为三个阶段,定义评阅过程中用到的四个集合,在对整个评阅过程的宏观把握的基础上,深入探讨了几个提高筛选效率的原则,然后给出完整的评阅方案流程,通过编程得到在题中所给情况下的所用时间最短的评阅方案。针对问题三,首先要求出8位教师的评分习惯,对于评分高低水平,可以通过对比某位教师的评分与其他评阅过这些论文的教师打出的分数的平均值求得;对于打分稳定程度,可以用评阅教师打分的离中趋势表示;对于哪些教师评分习惯接近的问题,可以根据打分的高低水平和稳定性两个指标对教师进行聚类分析。然后,要设计出一种更加合理的排名方案,如果可以根据每一篇论文已有的分数推测出未评阅该论文的教师对该论文的评分,那么用每篇论文得到的平均分作为排名的依据就是合理的了。针对问题四,同过观察附录2数据,推测出其评阅方案是如何设计的,并在此基础上提出更合理的评阅方案及排名方案,兼顾公平和效率。三、模型假设一轮筛选不同于一轮评阅,一轮筛选可以包含几轮评阅,一轮评阅是指将150篇论文读且仅读一次;评阅过程中除评阅以外的工作所占用的时间忽略不计;通过几轮筛选选出优胜者,即对论文评奖,选出3个一等奖、6个二等奖、9个三等奖、18个优秀奖;均衡是指每位教师在每轮中评阅的论文份数,以及评阅的论文总份数大致相当;问题二中,每位教师的论文排名与绝对排名一致意味着每位教师的评阅标准一致,没有个人偏好,能够做到绝对的公正;问题二中,评阅教师在每轮评阅中能够对评阅过的所有论文进行排名,但是评阅轮间评不具有记忆性,故而评阅教师可在各轮评阅中重复评阅同一篇论文;问题三中,教师不可能给出绝对无误的排名,意味着由于受个人偏好的影响,评阅教师的评卷标准并不完全一致;在整个评卷过程中,不会因为偶然事件导致评卷过程中止;题中所给数据真实可靠;四、模型的建立与求解4.1问题1——论文评阅方案的制定。4.1.1:0-1变量,1表示第i个教师评阅了j论文,0意则相反;:第k轮评阅的论文分组矩阵,每个教师代表一组,共八组,,都是阶的0-1矩阵;:0-1变量,1表示i论文和j论文在某轮中被同一个教师评阅,0意则相反;:第k轮评阅论文的相遇矩阵,任意两论文在同一轮中被同一教师评阅则表示相遇,,都是阶的0-1矩阵;:总的相遇矩阵,;:总相遇矩阵中的最大值;:总相遇矩阵中的最大值出现的个数;4.1.2=1\*GB4㈠对于题设条件的理解。=1\*GB2⑴评阅轮。评阅轮是指把150份论文全部评阅过有且仅有一次的时间。=2\*GB2⑵每份论文至少有四位教师评阅。在此题中,因为只要制定评阅方案,所以评阅轮数为4,每份论文都被四位教师评阅过。=3\*GB2⑶每轮中、整体上,教师评阅数量应尽量均衡。=1\*GB3①要使每轮中均衡,应尽量使每轮中每位教师评阅的论文数量相当。,因此最佳的分配方案是在每轮中,六位教师评阅19份论文,两位教师评阅18份论文,。=2\*GB3②因为一共有8个教师,每轮有两个教师阅读18份论文,要使整体上均衡,只要使每个教师均有一轮阅读了18份论文,共阅读75份即可,。=4\*GB2⑷一个教师评阅某份论文最多一次。评阅教师在整个阅卷过程中不会重复阅读任一份论文。=5\*GB2⑸在几轮评阅中,被同一教师评阅的论文尽量少。这个条件是为了避免一种不公平的现象发生,即:论文的质量差异会相互产生影响,若i论文的质量很好而j论文的质量很差,如果这两份论文在某些轮中都是被同样的教师评阅,以先评阅i论文,后评阅j论文为例,此种情况下j论文的得分会因为与i论文的对比而偏低,这就会造成一种不公平的发生。并非在相邻的两轮评阅中才会出现上述不公平,任意两篇论文在任意两轮评阅中,被相同教师评阅都会造成上述的不公平,如i、j两篇论文在第1、4轮被同一教师评阅,则同样会有相互影响,造成上述不公平。充分混合即要求任意两篇论文在任意两轮评阅中被同一教师评阅的次数最少,即相遇的次数最少。对整体而言,只要任意两篇论文相遇总数的最大值的最小值最小,则系统达到最优。(二)分组矩阵和相遇矩阵的关系定理TH若P为分组矩阵,则其对应的相遇矩阵为单位矩阵。证明对于任意一篇论文,在每轮中每次只能分给一个老师,即P的每一列中只有一个元素为1,其余的元素全部为0。由矩阵可得(1)若与不同时为1,即第i份论文与第j份论文不同在第组,则(2)若与同时为1,即第i份论文与第j份论文同在组,则满足相遇矩阵的定义。4.1.3=1\*GB4㈠确定约束条件=1\*GB3①每位教师评阅数量在每轮中,整体上应尽量均衡。=2\*GB3②一个教师评阅某一份论文最多一次。=3\*GB3③需要满足分组矩阵和相遇矩阵之间的数学关系。为单位矩阵=2\*GB4㈡确定目标函数我们的目标是使论文尽量地混合,在几轮评阅中,被同一教师评阅的论文尽量少,那么只要减少两两论文在某轮相遇的发生,即使任意两份论文在几轮评阅中总相遇次数尽量小,进一步分析,只需要它们的最大值尽量小:其中为总的相遇矩阵。其中=3\*GB4㈢综上,可以建立评阅方案的多目标规划模型:4.1.4用matlab编程求解得到一种较优的评阅方案(答案见附录1,程序见附录2)matlab程序算法如下:Step1:给Har变量赋初值为0,转入step2;Step2:whilehar~=5,通过while循环语句控制模拟次数,转入Step3;Step3:模拟第一轮评阅,随机产生论文编号。按产生后的顺序分别均分给第一至第八位老师,输出评阅方案x,转入Step4;Step4:模拟第二轮评阅,对每一个老师重新随机产生论文编号,并且扣除第一轮评阅中对应已经阅读过的论文,保证一个老师评阅论文最多一次,输出评阅方案y,进入Step5;Step5:模拟第三轮评阅,对每一个老师重新随机产生论文编号,并且扣除第一轮和第二轮评阅中对应已经阅读过的论文,输出评阅方案z,转入Step6;Step6:模拟第四轮评阅,对每一个老师重新随机产生论文编号,并且扣除第一轮、第二轮和第三轮评阅中对应已经阅读过的论文,输出评阅方案q,进入Step7;Step7:将四轮评阅方案存入150×8矩阵LJ中,进入Step8;Step8:重复执行step3到step7,直到循环结束。4.2问题2——绝对名次存在的情况下,制定评阅方案。4.2.1:表示第一轮评阅后排在第i篇论文前面的论文数量;:表示在筛选阶段,第k次比较后第i篇论文前面的论文数量;:第i篇论文的绝对名次;:第i个阶段单位论文评阅时间的个数;:评阅过程的总时间;(单位:小时)4.2.2=1\*GB4㈠定义评阅过程中的三个阶段:将整个评阅的过程分为:初读→筛选→评奖三个过程。=1\*GB2⑴初读:即为第一轮评阅,所有论文都会被有且仅有一位教师阅读。=2\*GB2⑵筛选:经过第一轮评阅后,利用一定的方法使教师交换评阅,筛选出不能获奖的论文。=3\*GB2⑶评奖:筛选结束后,从剩下的36篇论文从选中三个一等奖,六个二等奖,九个三等奖。=2\*GB4㈡定义评阅过程中用到的四个集合:=1\*GB2⑴未评阅集:在筛选阶段,尚未被评阅过的论文属于集合;=2\*GB2⑵评阅集:在筛选阶段,第i个教师评阅过的论文属于其相应的评阅集;=3\*GB2⑶筛选集:在筛选阶段,被筛选出去的论文属于集合;4.2.3=1\*GB4㈠整个评阅过程的宏观描述。第一步:初读阶段,为使每位教师的评阅数量在每轮中、整体上尽量均衡,应有6位教师评阅了19篇论文,2位教师评阅18篇论文。第二步:筛选阶段,经过初读后,每一个教师都对自己评阅过的论文进行了排名,即这时已获得了,现在分别从8位教师已评阅过的论文中选出1篇论文进入评阅集,在8位教师之间重新分配这8篇论文,假设教师的座次围成圆圈,当所有教师读完他所分到的那篇论文后,按顺时针顺序,将自己手头的论文传给下一位教师,再进行阅读,依次进行下去,在这个过程中教师会不断更新自己的评阅集的排名,另一方面,不断更新排在某篇论文前面的论文数,当其达到36时,就可以将这篇论文纳入筛选集,因为它必定不会得奖。这样下去当筛选集中的论文数量达到时,筛选阶段结束。第三步:评奖阶段,筛选阶段结束后,没有被选入筛选集的论文就是最终获奖的论文。从剩下的36篇论文从选中三个一等奖,六个二等奖,九个三等奖。=2\*GB4㈡几个提高筛选效率的原则的讨论。=1\*GB2⑴为了使排在某篇论文前面的论文数尽快地更新至超过36,应做到以下两点:=1\*GB3①初读阶段结束后,当分别从8位教师已评阅过的论文中选出1篇论文进入评阅集时,应最先选择最大的8篇论文分给8位教师评阅。=2\*GB3②在筛选阶段,当某篇论文因排在它前面的论文数达到36而被纳入筛选集后,需要从未评阅集中选出一篇论文补足空缺,这篇论文应该是未评阅集中最大的那篇论文。=2\*GB2⑵在筛选阶段,为了提高效率,要尽量避免老师读到完全相同的论文组合,如甲教师三次分别评阅的是1、2、3号论文,乙教师三次分别评阅的是2、3、1号论文,这是一种重复劳动,应尽量避免。因此,我们设定教师的评阅座次围成圆圈,每次8位教师同时读完各自的一篇论文后,按顺时针顺序,将自己手头的论文传给下一位教师,再进行阅读。=3\*GB2⑶信息利用完全原则。=1\*GB3①每个教师的评阅集内部先分更新信息。随着教师阅读数目的增加,其评阅集中的元素个数会增加,两两间的关系数目随之增加,以甲教师为例,前三次他分别评阅了1、2、3号论文,第4次阅读了4号论文,那么需要在此评阅集内更新关系次数为。=2\*GB3②评阅集间充分更新信息。=1\*ROMANI.同一次评阅结束的评阅集间同步更新。例:如果甲教师经两次评阅后,发现绝对名次,同样,乙教师经这两此评阅后,发现绝对名次,那么在更新时2号论文前面的论文数量时,应同时考虑这两个信息。=2\*ROMANII.不同次评阅的连锁更新。例:某教师上一次评阅发现,并据此更新了1号论文前面的论文数量,本次评阅他又发现,据此又更新了2好论文前面的论文数量。考虑到,所以,这种情况下要求连锁更新1号论文前面的论文数量。=3\*GB3③要避免的问题。例如:在筛选阶段,甲教师三次分别评阅了1、8、7号论文,乙教师三次分别评阅了2、1、8号论文,假设,那么1号论文前面的论文数量因为8号论文的原因分别更新了两次。综上,为了充分利用信息,提出如下的更新的策略:在筛选阶段,经k-1次评阅后,对于任一篇论文,综合考虑它在8个评阅集中的综合排名,找到所有比它排名靠前的论文,假设它们的编号分别为,则=3\*GB4㈢基于以上分析,给出完整的筛选阶段流程。第一步:分别从8位教师已评阅过的论文中选出1篇最大的论文进入评阅集,在8位教师之间重新分配这8篇论文。第二步:教师在筛选轮第一次评阅论文,第一次更新自己的评阅集。第三步:教师按顺时针顺序,将自己手头的论文传给下一位教师。第四步:教师继续评阅手头的论文,更新自己的评阅集及其排名。第五步:系统搜集教师的评阅集即排名,更新,若,则将该篇论文移入筛选集,再从未评阅集中选出最大的论文补足空缺。第六步:重复三至五步,直到筛选集中的论文数达到114为止。=4\*GB4㈣评奖方案=1\*GB2⑴思路一:评奖阶段可以按照上面的筛选方案,分别进行筛选,即36→18→9→3。=2\*GB2⑵思路二:考虑到经过筛筛选阶段后,原始的8个论文组剩下的论文数量分别为5,5,5,5,4,4,4,4,那么最大的偏小,可能较大,同理,也可能较大,如果,则不如直接让一个老师读完剩下的36篇论文,这就是评奖阶段安排的思路二。=3\*GB2⑶考虑到思路一和思路二的组合,共有下面四种组合:=1\*GB3①一位教师直接读完36篇。=2\*GB3②先筛选一轮,其余的由一位教师直接读完。=3\*GB3③先筛选两轮,其余的由一位教师直接读完。=4\*GB3④先筛选三轮,其余的由一位教师直接读完。=5\*GB4㈤评阅过程的最短总时间。第一步:确定单位阅读时间的总个数。=1\*GB2⑴初读阶段为。=2\*GB2⑵筛选阶段为。=3\*GB2⑶记第三阶段的单位阅读时间的总个数为第二步:计算总时间t 第三步:最后选择使总时间t最短的方案最为最终的方案。4.2.4用matlab编程(程序见附录3)求解,算法如下:Step1:首先定义3个集合,考核集,未考核集合筛选集,考核集和筛选集赋值为空,未考核集为1×150论文编号向量。进入step2;Step2:初读阶段。分别给第一二位老师18篇,第三到第八位老师19篇论文记录他们所读的文章按绝对名次由大到小排序的编号x(i),进入step3;Step3:筛选阶段。Whilesize(sxj,2)<114控制循环,当筛选集合中的元素为114时,结束循环;进入step4;Step4:首先提取出每个老师排名最差的文章,fori=1:8让第一至第八个老师分别评阅这八篇论文,结束循环。记录老师评阅论文的编号。进入step5;Step5:forj=1:7,让后一位老师读前一位老师的论文,即各位老师将自己读的文章向右传;记下这次评阅论文的编号,进入step6;Step6:对各位老师自己的名次集按照绝对名次进行排序,提取其中的论文编号。进入step7;Step7:对于每一个在名次集中的元素,在所有8个名次集中找到比它排名靠前的论文。并且将这些论文排在其前面,更新名次集。将这些论文从未考核集中转入到考核集。进入step8;Step8:评审阶段。通过比较,判断是否有论文之前的论文数大于36,如果存在,则删除这些论文,并且从未考核集中补充论文数到考核集中。进入step9;Step9:不断重复step3-step8,直到循环结束。得到剩下36篇论文。进入step10;Step10:定义评审集,赋值为空;未评审集,包含36篇论文。进入step11;step11:whilesize(wps,2)>0;控制循环。进入step12;step12:给四个老师分发5份论文,剩下的四个老师分发4份论文,读完之后相互交换自己评选排名最好的和最差的文章,最后得到第一名和第三十六名。将这两篇文章转入到评审集,进入step13;step14:重复step12,直到未评审集为空,循环结束。(字体)4.2.5方案评价用随机模拟方法生成10000组随机的排名,通过以上的方案完成评奖所需的最短时间的平均值。4.3问题3——教师具有个人偏好情况下的论文排名方案研究。4.3.1:参赛论文总份数;:评阅教师的总人数;:0-1变量,0表示第i个教师未评阅过第j篇论文,1意则相反;:第i个教师对第j份论文的评分,=0表示第i个教师没有评阅第j份论文;:评阅结束后,第j篇论文获得的平均分;:第i个教师对第j篇论文评阅的尺度偏差;:第i个教师评阅论文的总尺度偏差;:第i个教师的评阅稳定程度;4.3.2模型建立=1\*GB4㈠教师评分习惯的判定模型。=1\*GB2⑴教师评分高低水平的度量。评阅结束后,针对第j篇论文,其获得的平均分为定义第i个教师对第j篇论文评阅的尺度偏差为则第i个教师评阅论文的总尺度偏差为计算得到后,根据如下规则判定第i个教师的评分高低水平=2\*GB2⑵教师评分稳定性的度量。教师评阅的稳定性与其对所评阅论文打分的方差密切相关,但由于教师对论文的打分不仅受教师个人偏好的影响,还会受论文本身质量的影响,因此更为合理的方式是:用教师对所阅读论文的尺度偏差的稳定性来刻画其评分的稳定性。定义第i个教师的评阅稳定程度为计算得到后,可根据的大小判断教师的评阅稳定性,越大表示该教师评阅越稳定,越小则表示该教师评阅越不稳定。=3\*GB2⑶基于教师评分习惯的分类。根据以上的分析,教师的评分习惯是由两个指标——总尺度偏差、稳定程度——衡量的。因此,根据这两个指标对评阅教师进行聚类分析。首先,用表示第i个教师的第j个指标值,可以得到如下的数据阵:因为各指标的度量单位不同,所以先对数据进行标准化变换,令和分别表示第j个指标的样本均值和样本标准差,即:则标准化后的数据为:然后,根据标准化后的数据,计算8个教师两两之间的距离,用表示第i个城市和第j个城市之间的距离,这里的距离采用欧氏距离:得到如下的距离矩阵:接着,根据距离矩阵D进行系统聚类分析,基于聚类分析的结果确定评分习惯较为接近的教师。=2\*GB4㈡排名方案的设计。在竞赛的论文评阅中,要使评阅方案尽可能地合理,一种最理想的办法就是让每个教师评阅每一份论文,但当评阅论文数量非常大时,由于时间和精力的限制做到这一点很难。但是如果已知每位教师的评分习惯,用某一位评阅人所打的分数去统计分析出其他人在这同一篇论文上可能给出的成绩,就可以获得估计的每个教师对每篇论文的评分,然后对每篇论文所有的得分取平均数,再根据这个平均得分确定最终的论文排名。具体做法如下:第一步:分析每个教师评分的分布情况。虽然教师的评分会受到他所评论文本身质量的影响,但当评阅论文数量比较大时,每位教师评阅的论文总体上来说大致相当,某位教师评阅的全部是质量很差的论文或某位教师评阅的全部是质量很好的论文这两种情况属于小概率事件,可以不予考虑。用spss软件对150个教师的评分进行K-S正态检验,得到如下结果:甲乙丙丁戊己庚辛均值40.0739.7141.2546.4744.5742.140.6648.28标准差19.77315.9218.30416.24312.83710.9917.3065.503k-s正态检验统计量0.6120.6760.8621.0280.8640.9810.860.651P值0.750.750.4470.2410.4440.2910.450.791从上表可得,每个教师的评分都通过了k-s正态检验,因此评阅教师的评分都是服从正态分布的,即第二步:对教师的评分进行标准化变换。此时的分数称为标准分,标准分使各个教师评分的集中趋势和离中趋势均一致,因此,标准分的高低仅决定于教师评分的偏差尺度。第三步:根据每篇论文已有的几个标准化的分数,推导出未评阅该篇论文的教师会给这篇论文的标准分,计算方法如下:设t教师未评阅第j篇论文,教师评阅了第j篇论文,则t教师给j论文的标准分为第四步:根据第三步求得的标准分求出原始分,如下第五步:对每篇论文所有的得分取平均数,再根据这个平均得分确定最终的论文排名。4.3.3=1\*GB4㈠教师评分习惯的判定模型。=1\*GB2⑴教师评分的尺度偏差。用matlab(程序见附录4)求解模型得到教师评分的尺度偏差,然后根据判定规则得到教师评分高低水平如下表所示:教师甲乙丙丁戊己庚辛尺度偏差1.04270.98760.96261.03921.01160.98720.98130.9903评分高低偏高偏低偏低偏高偏高偏低偏低偏低=2\*GB2⑵教师评分稳定程度。用matlab(程序见附录4)求解模型得到教师评分的稳定程度,如下表所示:教师甲乙丙丁戊己庚辛稳定程度3.6822163.9195240.2078119.0237209.0519179.2944188.903273.1475由上表可得教师评分的稳定程度排序为:稳定程度:辛>丙>戊>庚>己>乙>丁>甲其中甲教师与其他教师相比,评分非常不稳定。=3\*GB2⑶对教师的分类。用spss软件对评阅教师进行系统聚类分析,得到如下结果:欧式距离矩阵1:甲2:乙3:丙4:丁5:戊6:己7:庚8:辛1:甲07.51915816.136771.9635097.3743458.3301579.69184514.033592:乙7.51915801.6261443.5916941.0114550.0348170.1405511.7563043:丙16.136771.62614409.4153223.1148241.2926460.8184371.1088814:丁1.9635093.5916949.41532202.1301333.8798024.8657416.4393775:戊7.3743451.0114553.1148242.13013300.8667961.1961381.163376:己8.3301570.0348171.2926463.8798020.86679600.0566191.3019037:庚9.6918450.1405510.8184374.8657411.1961380.05661901.1396738:辛14.033591.7563041.1088816.4393771.163371.3019031.1396730总组数不同时,各教师所属组号7组6组5组4组3组2组1:甲1111112:乙2222223:丙3333224:丁4444315:戊5522226:己2222227:庚6222228:辛765322从以上两表可以得到结论:=2\*GB4㈡对150份论文的评奖结果及其合理性证明。=1\*GB2⑴根据以上制定的方案得到36份获奖论文的平均得分及排名如下所示:序号平均分奖项序号平均分奖项序号平均分奖项序号平均分奖项149号66.09一等奖31号57.08三等奖115号54.93优秀奖5号52.50优秀奖39号64.74一等奖71号56.89三等奖7号54.02优秀奖75号52.44优秀奖107号64.53一等奖134号56.72三等奖95号54.00优秀奖80号51.98优秀奖70号64.21二等奖28号56.02三等奖93号53.91优秀奖14号51.89优秀奖66号62.50二等奖118号55.86三等奖32号53.41优秀奖133号51.19优秀奖42号60.96二等奖58号55.81三等奖84号53.23优秀奖82号50.30优秀奖150号59.89二等奖96号55.77三等奖35号52.82优秀奖59号50.13优秀奖116号58.80二等奖67号55.67三等奖137号52.76优秀奖15号49.99优秀奖73号57.47二等奖26号55.19三等奖8号52.64优秀奖20号49.84优秀奖=2\*GB2⑵合理性证明首先,从理论上来说,题目中的排名方案只是对部分教师给某篇论文打的分数求平均分,这种方法忽略了老师的个人偏好对打分结果的影响;而改进后的排名方案是对所有教师给某篇论文的打分求平均数,这样做,虽然教师也存在个人偏好,但所有论文都会受每个教师偏好的影响,这样总的来说,对所有论文还是公平的。其次,举例说明,对于118号论文,若按照题目所给的排名方案它应该获得三等奖,但评阅过它的教师为:甲、丙、丁、戊,其中甲、丁、戊都是打分偏高的老师,只有丙打分偏低,因此导致118号论文的得分虚高;如果按照改进后的排名方案,118号只能获得三等奖,这样更合理。4.4问题4——推测附录2的评阅方案,并设计更合理的方案。=1\*GB4㈠评阅方案的设计分析=1\*GB2⑴模型准备对于本题对总体设计方案的推导,首先通过excel表格分析,推理出一些可能的评阅原则,然后再结合数据,对此原则进行验证。在验证的过程中,采取还原历史数据的方法,即按照一定的原理,去掉一篇论文的某一个或几个老师的得分,作为该篇论文,前一轮或者前几轮结束时的评分情况。对于上述的原理,为了使被检验的评阅原则的通过率尽可能的大,可以采用有目的人工操作的方式。=2\*GB2⑵模型建立=1\*GB3①第一轮=1\*ROMANI.规则建立除了辛老师以外的七位老师进行评分,每篇论文有且仅有一位老师进行打分,筛选掉排名末位的40%的文章。=2\*ROMANII.分析根据数据情况,推理出排名末位的40%的文章的分数为30分。由于16,62,74,83,122号论文的第一轮评分都为30分,所以选取了论文序号最小的16号论文进入了下一轮,其余的均被淘汰,共计淘汰了60篇=3\*ROMANIII.规则检验考虑较为异常的16号论文按照分析中的方法进行理解,那么此条规则通过所有的150篇论文的检验,通过率为100%=2\*GB3②第二轮=1\*ROMANI.规则建立除了辛老师以外的七位老师进行评分,平均分40分以上的论文之直接进入下一轮,对于平均分40分一下的排名靠前的分差教大的再进行第三次评分,如果平均分比40分大则通过,如果平均分小于40分,则不通过。=2\*ROMANII.分析通过各种最优化的历史数据重现,还是无法满足3个异常的数据。=3\*ROMANIII.规则检验有3各数据异常,规则通过率为(90-3)/90=96.7%=3\*GB3③第三轮=1\*ROMANI.规则建立对于第二轮选出来的论文,按照平均分进行排序,排名前18位的论文(平均分55分以上)直接进入一二三等奖的评审,而剩下的论文(平均分40到55之间)进入优秀奖的评审,而其中的每一篇,辛老师都会进行评分。=2\*ROMANII.分析排名前18位的论文,直接进入一二三等奖的评审,最后一轮是八个老师都要进行评奖的,其中的7,31,134,107号,在最后一轮的评选中被辛老师评分了。其余的被辛老师评分的都是虽然经过了第二轮,但是没有直接进入最后一轮评分的论文。对于进入优秀奖的评分的每一篇论文,扣除辛老师的评分,再求平均分,发现平均分介于40和55(不含55)之间。正好满足了平均分40以上的进入优秀奖的评分,而排名前18位的平均分55分(含55)以上的直接进入最后的一二三等奖的评分。=3\*ROMANIII.规则检验可以人工最优化的去除数据,重现通过第二轮的论文前两轮的打分情况,发现规则通过率为100%=2\*GB4㈡更合理方案的设计问题二中设计的评阅方案就是一种较合理的评阅方案,它兼顾了公平和效率,在这里不再赘述。五、模型评价与改进5.1模型评价=1\*GB4㈠模型优点=1\*GB2⑴在问题一中引入分组矩阵和相遇矩阵,可以较好地刻画题设条件。=2\*GB2⑵在问题二中对评阅流程的分析比较深入。=3\*GB2⑶在问题三中,建立了评价教师打分习惯的指标体系——尺度偏差和稳定程度——可以形象地描述出教师的打分习惯。=2\*GB4㈡模型缺点=1\*GB2⑴在问题一中,没有考虑评阅教师的评分偏好问题。=2\*GB2⑵问题二中的分情况讨论较多,导致方案比较复杂。=3\*GB2⑶在问题三中,根据每一篇论文已有的分数推测出未评阅该论文的教师对该论文的评分时,会有一定的估计误差,会对最终评奖结果造成一定影响。5.2模型改进在问题一中,没有考虑评阅教师的评分偏好,但现实中这个问题不能忽略,所以将这个因素纳入模型一中考虑。在这种情况下,需要避免另一种不公平情况:某份论文的评阅教师组合(不考虑评阅顺序)会对论文分数产生影响,例如,若i论文和j论文最终的评阅教师组合完全相同(如下表),且这几个教师打分都偏高或偏低,就会导致i论文和j论文的分数偏差很大,这就会造成一种不公平的发生。第一轮第二轮第三轮第四轮i论文甲乙丙丁j论文乙丙丁甲下面分别分析各轮相对公平的分配论文方案:第一轮,因为教师评阅哪些论文是随机的,所以可以不予考虑;第二轮,两轮中评阅i论文和j论文的教师组合(不考虑评阅顺序)相同的情况共有组,因为28<150,所以不能完全避免这种不公平情况,但其中相对较公平分配方案为:有18个组阅读了5份论文,有10个队阅读了6份论文,。第三轮,三轮中评阅i论文和j论文的教师组合(不考虑评阅顺序)相同的情况共有组,因为56<150,所以不能完全避免这种不公平情况,但其中相对较公平分配方案为:有18个组阅读了2份论文,有38个队阅读了3份论文,。第四轮,四轮中评阅i论文和j论文的教师组合(不考虑评阅顺序)相同的情况共有组,因为70<150,所以不能完全避免这种不公平情况,但其中相对较公平分配方案为:有60个组阅读了2份论文,有10个队阅读了3份论文,。令为第二轮的评阅组合,为第三轮的评阅组合,为第四轮的评阅组合,表示被某一组合评阅的论文数量。因此,加入约束条件:最终评卷方案的多目标规划模型如下:六、参考文献[1].姜启源,谢金星,叶俊,数学模型(第三版)[M],北京:高等教育出版社,2003.8。[2].张红兵,贾来喜,李潞,spss宝典,北京:电子工业出版社,2007.2。[3].何晓群,多元统计分析(第二版),北京:中国人民大学出版社,2008.9.[4].谢金星,薛毅,优化建模与LINGO软件,北京:清华大学出版社,2005.7.七、附录7.1附录1甲教师评阅的试卷编号第一轮:23 59 108 63 35 71 29 25 148 9 98 107 57 34 15 84 12 140第二轮:51 116 7 41 106 19 88 145 73 143 139 104 22 38 32 5 6 141第三轮:48 113 111 95 127 100 66 81 129 80 102 46 11 120 138 133 121 96第四轮:56 125 99 1 26 78 83 49 117 17 36 126 94 97 110 50 33 101乙教师评阅的试卷编号第一轮:116 6 119 38 41 131 99 120 137 64 52 58 110 122 102 5 61 79第二轮:104 43 123 134 114 90 132 54 13 40 128 133 62 136 124 77 87 11第三轮:148 21 19 84 45 15 3 76 94 33 59 108 27 46 71 26 88 93第四轮:140 118 107 144 100 115 96 149 142 125 18 42 66 83 91 56 85 7丙教师评阅的试卷编号第一轮:17 14 129 51 72 138 2 48 49 27 82 16 147 40 97 32 83 143 50第二轮:43 25 44 80 149 70 120 65 142 135 133 112 84 47 42 103 60 5 26第三轮:148 126 114 106 101 67 85 74 132 111 10 128 131 57 117 118 100 66 75第四轮:88 34 1 127 130 3 64 121 123 15 144 86 11 33 36 59 45 134 30丁教丁教师评阅的试卷编号第一轮:95 8 43 113 139 60 100 24 149 13 141 114 73 4 39 142 136 133 42第二轮:5 80 131 63 115 143 10 109 31 50 25 34 112 54 118 137 87 46 97第三轮:47 36 62 35 18 45 66 85 111 61 72 124 127 98 106 150 29 40 56第四轮:32 44 105 92 22 108 93 16 27 17 121 37 77 59 20 125 57 128 132戊教师评阅试卷的编号第一轮:1 124 28 111 77 62 75 67 105 135 47 101 103 127 87 132 66 112 123第二轮:19 39 63 90 21 12 144 50 56 29 137 91 33 40 48 51 89 43 81第三轮:15 69 102 5 78 96 25 106 149 113 71 49 45 121 32 9 116 16 76第四轮:120 73 108 117 44 52 37 22 84 8 58 82 57 7 126 129 14 17 145己教师评阅的试卷编号第一轮:31 70 65 96 18 36 46 69 91 89 10 134 7 81 109 104 26 85 3第二轮:144 127 73 32 114 37 62 130 146 25 94 48 28 143 102 115 77 40 99第三轮:87 51 131 56 4 29 47 50 68 11 90 24 58 126 101 43 139 35 123第四轮:125 8 20 64 140 6 93 135 12 128 138 23 60 54 42 149 61 136 59庚教师评阅论文的试卷编号第一轮:76 20 74 121 126 54 125 45 78 56 92 130 22 30 118 11 44 21 128第二轮:112 40 141 93 98 7 16 75 146 41 59 69 9 57 26 144 15 140 111第三轮:90 136 83 4 46 71 67 31 39 48 110 116 58 73 12 119 132 18 143第四轮:99 129 89 81 135 32 100 138 25 97 96 61 107 27 79 102 53 42 47辛教师评阅论文的试卷编号第一轮:106 93 55 150 53 19 117 88 146 86 144 80 68 94 33 37 90 115 145第二轮:100 36 11 135 139 85 75 30 109 25 1 113 50 83 105 23 74 110 87第三轮:119 134 4 143 95 60 140 34 98 137 112 41 38 45 57 3 76 102 39第四轮:35 31 142 84 15 121 16 122 65 82 72 67 59 44 9 69 5 22 517.2附录2clearclchar=0;whilehar~=5%Ä£Äâ6´Î%µÚÒ»ÂÖx=randperm(150);a11=x(1,1:18);a12=x(1,19:36);a13=x(1,37:55);a14=x(1,56:74);a15=x(1,75:93);a16=x(1,94:112);a17=x(1,112:131);a18=x(1,132:150);%µÚ¶þÂÖb=x(1,19:150);A=randperm(length(b));fori=1:length(b)b1(i)=b(A(i));enda21=b1(1,1:18);c=[a11,a13,a14,a15,a16,a17,a18];A=randperm(length(c));fori=1:length(c)c1(i)=c(A(i));enda22=c1(1,1:18);d=[a11,a12,a14,a15,a16,a17,a18];A=randperm(length(d));fori=1:length(d)d1(i)=d(A(i));enda23=d1(1,1:19);e=[a11,a12,a13,a15,a16,a17,a18];A=randperm(length(e));fori=1:length(e)e1(i)=e(A(i));enda24=e1(1,1:19);f=[a11,a12,a13,a14,a16,a17,a18];A=randperm(length(f));fori=1:length(f)f1(i)=f(A(i));enda25=f1(1,1:19);g=[a11,a12,a13,a14,a15,a17,a18];A=randperm(length(g));fori=1:length(g)g1(i)=g(A(i));enda26=g1(1,1:19);h=[a11,a12,a13,a14,a15,a16,a18];A=randperm(length(h));fori=1:length(h)h1(i)=h(A(i));enda27=h1(1,1:19);I=[a11,a12,a13,a14,a15,a16,a17];A=randperm(length(I));fori=1:length(I)I1(i)=I(A(i));enda28=I1(1,1:19);y=[a21,a22,a23,a24,a25,a26,a27,a28];%µÚÈýÂÖhh1=[a11,a21];hh2=[a12,a22];hh3=[a13,a23];hh4=[a14,a24];hh5=[a15,a25];hh6=[a16,a26];hh7=[a17,a27];hh8=[a18,a28];n1=0;n2=0;n3=0;n4=0;n5=0;n6=0;n7=0;n8=0;while(n1+n2+n3+n4+n5+n6+n7+n8)~=8ww1=randperm(150);fori=1:size(hh1,2)forj=1:size(ww1,2)ifww1(1,j)==hh1(1,i)ww1(1,j)=0;endendendB=find(ww1);ww1=ww1(B);A=randperm(length(ww1));fori=1:length(ww1)ww11(i)=ww1(A(i));enda31=ww11(1,1:18);n1=1;ww2=randperm(150);fori=1:size(hh2,2)forj=1:size(ww2,2)ifww2(1,j)==hh2(1,i)ww2(1,j)=0;endendendB=find(ww2);ww2=ww2(B);A=randperm(length(ww2));fori=1:length(ww2)ww22(i)=ww2(A(i));enda32=ww22(1,1:18);n2=1;ww3=randperm(150);fori=1:size(hh3,2)forj=1:size(ww3,2)ifww3(1,j)==hh3(1,i)ww3(1,j)=0;endendendB=find(ww3);ww3=ww3(B);A=randperm(length(ww3));fori=1:length(ww3)ww33(i)=ww3(A(i));enda33=ww33(1,1:19);n3=1;ww4=randperm(150);fori=1:size(hh4,2)forj=1:size(ww4,2)ifww4(1,j)==hh4(1,i)ww4(1,j)=0;endendendB=find(ww4);ww4=ww4(B);A=randperm(length(ww4));fori=1:length(ww4)ww44(i)=ww4(A(i));enda34=ww44(1,1:19);n4=1;ww5=randperm(150);fori=1:size(hh5,2)forj=1:size(ww5,2)ifww5(1,j)==hh5(1,i)ww5(1,j)=0;endendendB=find(ww5);ww5=ww5(B);A=randperm(length(ww5));fori=1:length(ww5)ww55(i)=ww5(A(i));enda35=ww55(1,1:19);n5=1;ww6=randperm(150);fori=1:size(hh6,2)forj=1:size(ww6,2)ifww6(1,j)==hh6(1,i)ww6(1,j)=0;endendendB=find(ww6);ww6=ww6(B);A=randperm(length(ww6));fori=1:length(ww6)ww66(i)=ww6(A(i));enda36=ww66(1,1:19);n6=1;ww7=randperm(150);fori=1:size(hh7,2)forj=1:size(ww7,2)ifww7(1,j)==hh7(1,i)ww7(1,j)=0;endendendB=find(ww7);ww7=ww7(B);A=randperm(length(ww7));fori=1:length(ww7)ww77(i)=ww7(A(i));enda37=ww77(1,1:19);n7=1;ww8=randperm(150);fori=1:size(hh8,2)forj=1:size(ww8,2)ifww8(1,j)==hh8(1,i)ww8(1,j)=0;endendendB=find(ww8);ww8=ww8(B);A=randperm(length(ww8));fori=1:length(ww8)ww88(i)=ww8(A(i));enda38=ww88(1,1:19);n8=1;endz=[a31,a32,a33,a34,a35,a36,a37,a38];%µÚËÄÂÖhh1=[a11,a21,a31];hh2=[a12,a22,a32];hh3=[a13,a23,a33];hh4=[a14,a24,a34];hh5=[a15,a25,a35];hh6=[a16,a26,a36];hh7=[a17,a27,a37];hh8=[a18,a28,a38];n1=0;n2=0;n3=0;n4=0;n5=0;n6=0;n7=0;n8=0;while(n1+n2+n3+n4+n5+n6+n7+n8)~=8ww1=randperm(150);fori=1:size(hh1,2)forj=1:size(ww1,2)ifww1(1,j)==hh1(1,i)ww1(1,j)=0;endendendB=find(ww1);ww1=ww1(B);A=randperm(length(ww1));fori=1:length(ww1)ww11(i)=ww1(A(i));enda41=ww11(1,1:18);n1=1;ww2=randperm(150);fori=1:size(hh2,2)forj=1:size(ww2,2)ifww2(1,j)==hh2(1,i)ww2(1,j)=0;endendendB=find(ww2);ww2=ww2(B);A=randperm(length(ww2));fori=1:length(ww2)ww22(i)=ww2(A(i));enda42=ww22(1,1:18);n2=1;ww3=randperm(150);fori=1:size(hh3,2)forj=1:size(ww3,2)ifww3(1,j)==hh3(1,i)ww3(1,j)=0;endendendB=find(ww3);ww3=ww3(B);A=randperm(length(ww3));fori=1:length(ww3)ww33(i)=ww3(A(i));enda43=ww33(1,1:19);n3=1;ww4=randperm(150);fori=1:size(hh4,2)forj=1:size(ww4,2)ifww4(1,j)==hh4(1,i)ww4(1,j)=0;endendendB=find(ww4);ww4=ww4(B);A=randperm(length(ww4));fori=1:length(ww4)ww44(i)=ww4(A(i));enda44=ww44(1,1:19);n4=1;ww5=randperm(150);fori=1:size(hh5,2)forj=1:size(ww5,2)ifww5(1,j)==hh5(1,i)ww5(1,j)=0;endendendB=find(ww5);ww5=ww5(B);A=randperm(length(ww5));fori=1:length(ww5)ww55(i)=ww5(A(i));enda45=ww55(1,1:19);n5=1;ww6=randperm(150);fori=1:size(hh6,2)forj=1:size(ww6,2)ifww6(1,j)==hh6(1,i)ww6(1,j)=0;endendendB=find(ww6);ww6=ww6(B);A=randperm(length(ww6));fori=1:length(ww6)ww66(i)=ww6(A(i));enda46=ww66(1,1:19);n6=1;ww7=randperm(150);fori=1:size(hh7,2)forj=1:size(ww7,2)ifww7(1,j)==hh7(1,i)ww7(1,j)=0;endendendB=find(ww7);ww7=ww7(B);A=randperm(length(ww7));fori=1:length(ww7)ww77(i)=ww7(A(i));enda47=ww77(1,1:19);n7=1;ww8=randperm(150);fori=1:size(hh8,2)forj=1:size(ww8,2)ifww8(1,j)==hh8(1,i)ww8(1,j)=0;endendendB=find(ww8);ww8=ww8(B);A=randperm(length(ww8));fori=1:length(ww8)ww88(i)=ww8(A(i));enda48=ww88(1,1:19);n8=1;endq=[a41,a42,a43,a44,a45,a46,a47,a48];LJ=[x;y;z;q]har=har+1;end7.3附录3clearclc%¶¨ÒåÈý¸ö¼¯ºÏ£¬¿¼ºË¼¯¡¢Î´¿¼ºË¼¯¡¢É¸Ñ¡¼¯khj=[];wkh=[1:150];sxj=[];%µÚÒ»½×¶Î£º³õ¶Ábz=[249212431842120211189914591255585155051273094392614611114213110628813887299768955349122721331046967227514957441121619136121361024810512913910783371153598461130461038338109705477116741501071016011928314711801441481101326466964011443521

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论