版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、装 订 线一、 问题重述我国新的学位制度成立以来,随着社会环境的需要和要求产生了不同的具有我国特色的研究生招生和培养模式。由于新的学位制度成立时间不长,培养和招生模式都在尝试阶段,这使得研究生论文质量越来越引起人们的关注。特别是现如今研究生队伍的壮大和研究生在社会进步中发挥着巨大的作用,更使得研究生的论文质量成为众人关注的焦点。建立研究生论文质量评价体系,使用量化手段去找出国家招生过程中存在的问题,调整招生策略,招生方式,使真正具有研究能力和素质的优秀学生进入研究生队伍已经成为改变研究生论文质量的重中之重的课题。某校正在开展硕士生质量评价,并且将论文的评阅信息按年保存在数据库中(其总包括200
2、6年数据,2007年数据,2008年数据),现如今需要对数据进行分析以解决以下问题。1. 以各专业和各年对研究生选题和开题进行总体评价。2. 以各专业和各年对研究生论文评分进行总体评价。3. 对论文开题选题与论文得分之间的相关性进行分析,并且陈述所得的结论。4. 以各专业和各年对研究生论文复审得分情况进行总体评价。5. 对硕士毕业前后论文的评分结果进行分析,陈述所得的结论,并且提出对此的建议。二、 模型假设1、 假设初审论文与复审论文都是在某学校的硕士论文中随机收集的,排列顺序也是随机分布的。2、 假设初审论文、复审论文的评阅信息之间是相互独立的,并且是有效的。3、 假设06-08年硕士论文选
3、题的评分标准、硕士论文开题报告指标、硕士论文评分标准不变。4、 假设论文评阅不受专业、年份等的影响。5、 假设论文评阅不受硕士学位类别(如:学术型学位、专业型学位等)的影响。6、 假设该评分体系适用于该校所有入学类型(在职人员和非在职人员、定向培养和非定向培养、直博和提前攻博等类型)的学生的论文。7、 假设专家和评阅教师对论文的评阅采取双盲评审制度(隐去硕士生姓名、指导教师姓名及其指导老师的参考文献、致谢等几个方面的论文送往国内有相同专业高校的同行专家评阅),客观公正,排除了评审中非学术因素的干扰。8、 假设论文质量由论文最终得分唯一确定。9、 假设开题的标准和选题指标对论文质量有决定性作用。
4、10、论文初审和复审得分共同决定论文质量。三、 问题分析问题一中由于数据较多,我们可以用统计的方法,求出每年选题类型所占的比例,并统计出三年各选题类型变化趋势;针对各专业选题而言,统计三年中各装 订 线专业论文份数。对于开题,可以统计出各年报告指标平均分变化曲线;并且统计出三年各专业报告指标平均分柱状图及折线图和对数图。问题二中同样用的也是统计的方法,分别统计出每年论文平均得分变化曲线、每年各个分数点人数比例柱状图,并对其进行正态检验。用同样的方法对各专业做同样的处理。问题三中的要求是对各专业、各年硕士论文选题开题与论文得分之间的相关性进行分析,从附表1中可以看出它们之间没有必然的联系,因此把
5、开题和选题看成两个相关因子分别统计各年成绩优秀率分布情况,从而找出相关性。问题四中要求的是对复查情况的评价,因此可以用问题二的方法得出想要的结论。问题五中要求的是对硕士毕业前后论文的评分结果进行分析,因为在问题二和问题四中分别统计了初查和复查的情况,所以在这一块只是将其两者的变化情况分析出来,并找出引发该种变化的主要因素。四、 模型的建立与求解问题一首先按各专业进行评价,这样就不需考虑年份的关系,把三年的评价信息综合起来进行讨论。其中对于开题的主要评价标准是各个专业的开题报告评分的平均分Ai,i=1,2,334,Ai = 专业号为i的专业的开题报告评分的平均分,由matlab程序得出,折线图如
6、图4-1-1。图4-1-1 06-08年各专业论文开题平均分分布折线图平均值为:= =8,其中n = 34;方差为: = = ,其中n = 34;装 订 线偏度为:g1a= =,其中n=34;g10说明数据位于平均值右边的多一些。峰度为:g2a= =,其中n =34;g23说明样本中含有较多远离均值的数据。相对误差为: = = 8%。对于选题的主要评价标准是各个专业的选题的平均分Bi,i=1,2,334,Ai = 专业号为i的专业的开题报告评分的平均分,由matlab程序得出,折线图如图4-1-2。图4-1-2 06-08年各专业选题平均分布图平均值为:= =,其中n = 34;方差为:= =
7、 ,其中n = 34;偏度为:g1b= =,其中n=34;g10说明数据位于平均值右边的多一些。峰度为:g2b= =,其中n =34;g23说明样本中含有较多远离均值的数据。装 订 线相对误差为: = = 2%。对比以上两种得出结论:在只考虑专业的情况下,对开题和选题的总体评价,开题和选题的方差都不大,说明总体的变化波动性都比较小;但开题相对误差是选题相对误差的4倍,因此可以判断出选题的波动性更小,因此受学科的影响变化更小。接下来对其进行各年的变化讨论,同理也不需要考虑学科对他的影响。其中,对于开题而言,只需得出各年开题的平均得分,并分析出随年变化的趋势即可,平均值,其中n为各年抽查论文的数目
8、,Ci为每篇论文的得分。则可得:06=;07=;08=;平均值: = ;方差: = =,其中n = 3;相对误差为: = = 0.08%;说明它的数据分散性小,数据都聚集在平均值附近,但根据评分规则可以看出论文整体水平有所增长,但是增幅很小,而且07年的整体水平最好。变化趋势如图4-1-3。图4-1-3开题平均分按年分布情况装 订 线而对于选题而言,分别作出了各年四种选题在所有题中所占的比重, = ;其中代表第j年第i种选题模型在这一年中所占的比重,能代表这一年论文抽查数目,代表该年第i中选题模型的个数。计算结果统计如图4-1-4所示。对各年选题的总体评价1有理论意义2有实用价值3有理论意义和
9、实用价值06年13%18%69%07年9%16%75%08年9%21%70%图4-1-4 对各年选题的总体评价根据以上数据表的数据可以看出,3既有理论意义和又有实用价值的选题占有绝大多数比例,说明大多数硕士生注重的不只是理论意义还注重实用价值;但从历年的总体变化上可以看出学生更倾向于实用价值。其每一种选题在三年中的变化如图4-1-5所示。图4-1-5 06-08年选题随时间变化分布图综上所述,可以得出结论:在以上三年中,各个选题项所占的比例基本稳定,但大多数学生还是既倾向于理论意义又倾向于实际价值。4、2问题二1、06年、07年、08年硕士论文质量的评价首先,统计出06年、07年、08年各个分
10、数点的人数,用matlab编程分别绘制出06年、07年、08年各个分数点的人数比例图,如图4-2-1(1)、4-2-1(2)、4-2-1(3)所示。装 订 线图4-2-1(1) 06年各个论文成绩分数点的人数比例图图4-2-1(2) 07年各个论文成绩分数点的人数比例图图4-2-1(3) 08年各个论文成绩分数点的人数比例图装 订 线由图4-2-1(1)、4-2-1(2)、4-2-1(3)可以看出,06-08年各个分数点的人数比例满足一定的正态分布。分别对06年、07年、08年各个分数点的人数比例图进行正态分布检验,用matlab编程分别绘制出正态性检验图,如图4-2-2(1)、4-2-2(2
11、)、4-2-2(3)。图4-2-2(1) 06年各个论文成绩分数点的人数比例正态性检验图图4-2-2(2) 07年各个论文成绩分数点的人数比例正态性检验图图4-2-2(3) 08年各个论文成绩分数点的人数比例正态性检验图装 订 线由图4-2-2(1)、4-2-2(2)、4-2-2(3)可以确定,论文成绩服从正态分布,说明该校论文质量具有一定的真实性、适用性。然后,计算06年、07年、08年的论文平均分。设06年的平均分为ave1, 07年的平均分为ave2, 08年的平均分为ave3;06年377篇论文的得分分别为score1(1), score1(2), score1(3)score1(37
12、7), 07年494篇论文的得分分别为score1(1), score1(2), score1(3)score1(494), 08年458篇论文的得分分别为score1(1), score1(2), score1(3)score1(458)。(n)(公式4-2-1)根据公式4-2-1计算可得,ave1=,ave2=,ave3=。通过Excel做出折线图如图4-2-3所示。图4-2-3 06-08年各年论文平均分折线图 设ave1,ave2,ave3的平均值为ave,根据公式4-2-1计算可得:ave=。设ave1,ave2,ave3三个数据的方差为,根据公式4-2-2计算可得=。说明06、07
13、、08年的论文得分与其平均得分相差较小。公式4-2-2 设06、07、08年论文平均分的偏度系数为g1,通过公式4-2-3计算可得g1=。说明这3年的论文平均得分情况属于正态分布的不对称性情况,表示数据位于平均值左边的比右边的多。公式4-2-3设06、07、08年论文平均分的峰度为g2,根据公式4-2-4计算可得:g2=。说明这3年的论文平均得分服从正态分布,并且偏斜程度较小。公式4-2-4装 订 线综合三年的论文评分情况,可以得出:根据年份分析,硕士论文初审的得分情况服从正态分布,数据分布在初审论文平均值85.9分附近的概率大。由于84分以上的论文属于优秀论文,所以硕士论文质量良好。2、06
14、-08年各专业硕士论文质量的评价设06-08年各个专业的论文平均分为Ai,i=1,2,334,Ai = 专业号为i的专业论文的平均分,Sij表示专业号为i的专业的第j篇论文的得分,n表示专业号为i的专业的论文数量。通过公式4-2-5分别计算出Ai的值,并根据Ai做出各专业平均分的统计分析柱状图、折线图、对数图,如图4-2-4、4-2-5、4-2-6所示。公式4-2-5图4-2-4 06-08年各专业平均分统计分析柱状图图4-2-5 06-08年各专业平均分统计分析折线图装 订 线图4-2-6 06-08年各专业平均分统计分析对数图由图4-2-4、4-2-5、4-2-6可以看出,从柱状图折线图对
15、数图,曲线变化相对较小,各专业平均分的分布相对比较集中。由此可以推断:专业对硕士论文初审的评分影响较小。设各个专业的平均分为average,方差为p,偏度为g1p,峰度为g2p,根据公式4-2-6,计算可以得到:average=,p=,g1p=,g2p=。公式4-2-6说明各专业硕士论文初审得分与各专业平均分之差相比较变化不大,各专业硕士论文初审得分服从正态分布,为左偏态。数据分布在论文初审平均值85.6分附近的概率大。由于84分以上的论文属于优秀论文,所以硕士论文质量良好。综上所述,从年份、专业分别讨论可以得出结论:硕士论文初审得分情况服从正态分布,属于优秀论文及以上的概率较大。因此,该校硕
16、士论文质量良好。问题三根据附表4-3-1所提供的开题选题分数和对应的论文得分的分数,分别作出每年选题开题与论文得分的关系图,则可以通过相关性分析求出本题模型。由于开题对于论文得分同样重要,但选题得分对于开题分数具有掩盖性,所以分析时需要将开题得分进行放大。其放大规则如表4-3-1,装 订 线表4-3-1 开题分数转换图表开题分数转换后分数16212318421放大的意义就在于将开题与选题的重要性变得同等,两种因素和为一种进行分析,能够大大降低运算量,并且选择的数值变换公式也是符合开题与选题的实际情况,可以较为可观的反映实际关系,将开题转换后的分数与选题分数进行求和,作为输入变量,而相应输出变量
17、就是相应运算过的选题开题值的对应分数频率。在这里我们选择分数大于等于85分的相应频率作为输出变量,能够得到相应的拟合曲线。2006年的拟合曲线模型为:具体拟合曲线如图4-3-1(1)所示图4-3-1(1)2006年选题开题与论文得分相关性图其中,2006年论文得分特优率为:=1.3263% (其中m为特优生人数,n为总人数)优秀率为: 良好率为:=58.09%; =34.748%;一般率为: 曲线图积分:=1.59%; =59.416%装 订 线(其中积分表示的是论文分数大于等于85分的所占全部人数的百分比)2007年的拟合曲线模型为::具体拟合曲线如图4-3-1(2)所示图4-3-1(2)2
18、007年选题开题与论文得分相关性图其中,2007年论文得分特优率为:=0.405%优秀率为: 良好率为:=64.17%=29.96%一般率为: 曲线图积分:=0.809%=65.182%2008年的拟合曲线模型为::具体拟合曲线如图4-3-1(3)所示装 订 线图4-3-1(3)2008年选题开题与论文得分相关性图其中,2008年论文得分特优率为:=0.87336%优秀率为: 良好率为:=64.19%=29.91%一般率为: 曲线图积分:=0.218%=65.502%对比三年开题选题与论文得分的相关型曲线,如图4-3-2图4-3-2 三年选题开题与论文得分相关性对比图装 订 线由图得出,当时,
19、就不会再有分数大于85分的论文了,这就证明了开题选题对于论文得分是有相关性的。图中不难看出,按年作为依据来判定相关性分析时可以清楚的看到三年研究生论文的质量区别,再通过公式求得的优秀率及良好率,可以以此为依据来判定06,07,08三年的研究生论文质量。综合曲线是通过三条曲线取平均值而计算出来的曲线,其计算模型为:函数F(x)积分为:=64.32%通过积分表达式可以得到,其得到大于等于85分的研究生论文的频率有64.32%。通过数据分析得出结论:对于三年研究生论文质量的排序是08年,07年,06年。其中经过模型积分进行筛选,可以确定,08年和07年的优秀率最高。再者,由于08年招生方式的变化,使
20、得08年的一般率幅度大大降低,所以论文质量的排序就按照08年,07年,06年的顺序进行排序,可以得出,随着时间的变化,学校招生方式改变导致了学校研究生论文质量的变化。对于按照学科分类的方式,开题和选题的对于学科模型的设立相关性分析基于对于学科优秀率的分析,对于学科分类优秀率采用优秀学生占有本学科百分比的方式进行计算,优秀率计算结果如图4-3-3:图4-3-3 学科1-34的学科优秀率柱状拟合表由图中我们可以看出,有些学科的优秀率非常低,这也是后来调整招生策略时非常重要的原因之一。由其中的数据进行拟合后的模型为:;装 订 线曲线的积分(整体优秀率为)63.6569%;积分表明,所有学科中的优秀人
21、数占总共人数的63.6569%。开题选题在学科中的平均分计算结果如图4-3-4图4-3-4 开题选题平均分由上图可以清楚的看出,开题选题平均分数越低,其对应的论文平均得分大于85分的频率越高,学科的整体分数越高。综上所述,学校招生方式、开题的标准和选题指标对论文质量有决定性作用。问题四1、06-08年复审硕士论文质量评价统计出06-08年各个分数点的人数,用matlab编程绘制出06-08年各个分数点的人数比例图,如图4-4-1所示。图4-4-1 06-08年各个论文成绩分数点的人数比例图装 订 线由图4-4-1可以看出,06-08年各个分数点的人数比例满足一定的正态分布。对06-08年各个分
22、数点的人数比例图进行正态分布检验,用matlab编程绘制出正态性检验图,如图4-4-2。图4-4-2 06-08年各个论文成绩分数点的人数比例正态性检验图由图4-4-2可以确定,复审论文成绩服从正态分布,说明该校论文质量具有一定的真实性、适用性。设06-08年复审论文的平均值为ave,根据公式4-2-1计算可得:ave=。 公式4-4-1设06-08年复审论文的方差为,根据公式4-2-2计算可得=。说明06-08年复审论文得分与其平均得分相差较大。 公式4-4-2 设06-08年复审论文的偏度系数为g1,通过公式4-2-3计算可得g1=。说明06-08年复审论文平均得分情况属于正态分布的不对称
23、性情况,表示数据位于平均值左边的比右边的多。 公式4-4-3设06-08年复审论文的峰度为g2,根据公式4-2-4计算可得:g2=。说明06-08年复审论文平均得分服从正态分布,并且偏斜程度较大。 公式4-4-4从06-08年复审论文的评分情况可以得出:硕士论文复审的得分情况服从正态分布,数据分布在初审论文平均值8分附近的概率大。由于84分以上的论文属于优秀论文,所以硕士论文质量比较好。装 订 线4.4.2、各专业复审硕士论文质量评价设06-08年各个专业的复审论文平均分为Ai,i=1,2,334,Ai = 专业号为i的专业复审论文的平均分,Sij表示专业号为i的专业的第j篇复审论文的得分,n
24、表示专业号为i的专业的复审论文数量。通过公式4-4-5分别计算出Ai的值,并根据Ai做出各专业平均分的统计分析柱状图、折线图、对数图,如图4-4-3、4-4-4、4-4-5所示。 公式4-4-5图4-4-3 06-08年复审论文各专业平均分统计分析柱状图图4-4-4 06-08年复审论文各专业平均分统计分析折线图装 订 线图4-4-5 06-08年复审论文各专业平均分统计分析对数图由图4-4-3、4-4-4、4-4-5可以看出,从柱状图折线图对数图,曲线变化相对较小,各专业平均分的分布相对比较集中。曲线中间断开,是因为复审论文中专业号为7的专业没有抽到复审论文。由此可以推断:专业对硕士论文初审
25、的评分影响较小。设各个专业的平均分为average,方差为p,偏度为g1p,峰度为g2p,根据公式4-4-6,计算可以得到:average=,p=,g1p=,g2p=。 公式4-4-6 说明各专业硕士论文复审得分与各专业平均分之差相比较变化较大,各专业硕士论文复审得分服从正态分布,为左偏态。数据分布在论文初审平均值分附近的概率大。由于84分以上的论文属于优秀论文,所以硕士论文质量相对较好。综上所述,从年份、专业分别讨论可以得出结论:硕士论文复审得分情况服从正态分布,属于优秀论文及以上的概率相对较大。因此,该校硕士论文质量相对较好。装 订 线该题要求的是对硕士毕业前后论文的评分结果进行分析,首先
26、分别作出初审和复审各个分数段论文数目所占的比例,如图5-1-1和图5-1-2以及初审和复审分别在各个分数段论文数占总论文数的百分比,图5-1-3。图5-1-1复审各分数段论文数量百分比及拟合图像通过该图像,或图可以看出复审的分数主要集中在80-85分,而复审的平均分 = ;在80-85分范围内,(其中为平均分,n为总公复查论文数,为分数)说明拟合合理。其中拟合式为:;图5-1-2初审各分数段论文数量百分比及拟合图像同理,大家可以通过该图像,或图5-1-3可以看出复审的分数主要集中在85-90分,而复审的平均分;在85-90分范围内,(其中装 订 线为平均分,n为总公复查论文数,为分数)说明拟合
27、合理。其中拟合式为:;初审和复审分别在各个分数段论文数占总论文数的百分比初审复审60-70070-7575-8080-8585-9090-9595-100图5-1-3 初审和复审分别在各个分数段论文数占总论文数的百分比对比初审和复审整体在各个分数段的分布图,如图5-1-4,可以很清楚的看到初审的高分区人数分布跟家密集,这就说明复审的分数整体低于初审的分数。图5-1-4初审和复审分别在各个分数段论文数占总论文数的百分比柱状图在得到以上结论后,接下来讨论初审和复审具体变化。以上讨论的都没考虑专业的影响,现在以专业为影响因子,分别计算出复审与初审的增长率 = (i为专业号,其取值范围为(1,34)代
28、表i号专业的增长率,为i号专业初审的平均值,为i号专业复审的平均值),其各专业增长率分布图如图所示。装 订 线图各专业分数增长率散点分布图通过图可以看出绝大多数专业的增长率都是负值,也就是说几乎各专业复审平均值对于初审结果都有下降。而且平均下降率 = (n=34)=4.5787%。综上所述,可以得出结论:初审评阅的质量不高,可能由于教师碍于面子等因素没能让评阅真正的做到公平,而复审做的更加好。建议:评审论文本来就是一个很费人力和物力的活动,而这样初审往往因为各种客观因素使得评阅不能一次到位,而要再次进行复审,这样对人力物力是一种巨大的浪费,我建议在初审阶段就能做到公平公正,努力排除客观因素对论
29、文评阅的干扰,例如通过双盲评阅体制,在评阅时执行不暴露考生姓名,和批阅老师的姓名等举措,努力让评阅在初审中完全做好,不再复审。五、 模型的评价问题一采用专业与年份相互独立的方法进行解题,并且先对专业进行统计求解,再对各个年份进行求解,其中先对开题进行总体评价,再对选题进行综合评价。问题三主要对开题进行运算放大,把开题分数与选题进行整合从而达到通过开题选题一个变量来反应其与研究生论文的关系。第五问分析时不考虑招生方式对于研究生论文质量的影响,进而可以把复审与初审的论文可以拿到一起比较,减小运算的复杂程度。装 订 线六、 参考文献1 张国才,学生学习成绩负偏态分布的合理性 J.江苏高教,2002(
30、02)2 孙荣平;高校成绩分析信息系统的构建与实现D;哈尔滨工程大学;2006年3 杨丽军,高校教学水平评估中试卷质量分析系统的研究与实现J西安:微电子学与计算机,4 王肇. 正态分布在学生学习成绩评估中的应用J. 数理统计与管理, 1994, (06)5 中华人民共和国教育部教育统计数据 EB/OL.2009-06-01http:/edoas /w ebs ite18 / level2 .jsp?tablename= 10206 袁本涛,延建林,我国研究生创新能力现状及其影响因素分析7 中国科技统计.中国主要科技指标数据库 (高等院校 )EB/OLtitle/MainMod.asp?Main
31、q=7Subq=18 沈建新,高等院校科技创新团队建设研究 J.南京航空航天大学学报 (社会科学版第3期沈建新:研究生创新能力现状分析和对策Graduates Innovat ive Capability9中国学位与研究生教育发展报告课题组.中国学位与研究生教育发展报告(1978-2003) M.北京:高等教育出版社,2006:71-72装 订 线06-08年初审各专业硕士论文得分统计表专业号12345678平均分专业号910111213141516平均分8885专业号1718192021222324平均分专业号2526272829303132平均分专业号3334平均分七、 附录附表4-2-1:06-08年初审各专业硕士论文得分统计表附程序4-2-1:06、07、08年各年硕士论文初审平均分及方差matlab程序m =% 计算平均值u =mean(m)% 计算方差y =var(m)% 计算偏度:小于0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度篮球运动员个人荣誉奖励合同3篇
- 公益性岗位劳动合同协议书(2025年度)-社区健康促进3篇
- 2025年度新能源汽车合伙人股权分配与产业链整合合同3篇
- 2025年度农村宅基地房屋租赁与乡村旅游资源开发合同2篇
- 2025年农村自建房安全责任追究协议书
- 二零二五年度智能机器人研发项目采购合同风险管理与防范3篇
- 2025年度智能制造企业监事聘用合同规范文本3篇
- 二零二五石材品牌授权与市场营销合作合同3篇
- 二零二五年度日本语言学校入学合同2篇
- 二零二五年度公司与公司签订的智慧社区建设合作协议3篇
- 【浅析人工智能在石油行业中的应用3400字(论文)】
- 湖北省十堰市竹山县2023-2024学年三上数学期末经典模拟试题含答案
- 产品试制前准备状态检查报告
- (全)外研版丨九年级下册英语各模块作文范文(名校版)
- 煤矿企业瓦斯防治能力评估管理办法和基本标准
- 食品供应质量承诺书
- 驾驶员从业资格证电子版
- vas疼痛评分完整版
- 山东省临沂市兰山中学2022-2023学年高二化学上学期期末试题含解析
- 信息与计算科学专业课程标准
- 袁莎入门古筝教材1
评论
0/150
提交评论