数学建模作品_第1页
数学建模作品_第2页
数学建模作品_第3页
数学建模作品_第4页
数学建模作品_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、西安工业大学数学建模竞赛暨A题 摘 要本文为了通过2006、2007、2008年硕士生论文的评阅信息,对所给的表1,表2的信息,采用多元线性回归分析等统计学方法来分析硕士生论文情况,得到如下方法和结果:本文主要采用概率函数的分布法、建立矩阵和线性回归分析来求解问题。针对问题一,我们把建立对应于选题、开题的随机变量,计算各年各专业硕士生论文选题与开题的评分的数学期望和方差,评价各年、各专业的论文开题选题评价。针对问题二,我们把建立对应于论文得分的随机变量,用Matlab画出0-100分论文数目的分布情况,可以看出是基本符合正态分布的,计算该正态分布(各年、各专业0-100分论文数目分布)的数学期

2、望和方差,来对各年、各专业的论文总体情况进行评价。针对问题三,我们对问题一、二所建立的随机变量,建立线性回归方程,利用MATLAB的regress函数来求解来构造对应的多元线性回归函数,并用求解出的对所求的回归函数进行评价,验证画出各年各专业硕士生论文评分的分布图,求解问题针对问题四,我们把建立对应于复审得分的随机变量,计算各年各专业硕士生论文复审评分的数学期望和方差,求解问题。针对问题五,比较问题二和问题四中得到的数据,分析评分项目1-7对初审复审得分差的影响(即局部差量对总体差量的影响),可以看出评分项目3、4影响较大。联系相应评分项目内容和分值,阐述了某校硕士生论文评审体系中反应出的问题

3、,和提出了我们小组的看法和观点及建议。关键字:硕士论文评分体系 随机模型 线性回归方程)问题重述我国自1980年建立新的学位制度以来,已初步形成了具有我国特色的研究生招生和培养模式,并且随着社会环境的变化和人才培养的不同要求适时作出调整。如:入学类型开始有了在职人员和非在职人员、定向培养和非定向培养、直博和提前攻博等类型;招生工作中的计划内定向培养意识逐渐淡化,出现了在职攻读学位等进校不离岗的招生形式等等。然而,这种多样化的招生和培养方式,也使得研究生论文质量问题日益引起人们关注。特别是近年来研究生招生规模的迅速扩张,以及研究生在国家发展与社会进步中发挥的越来越大作用,更使研究生论文质量问题成

4、为人们关注的焦点。如何建立合理的研究生论文质量评价体系,并通过量化的手段找出当前国家在研究生招生过程中存在的问题,进而调整招生政策,改革招生方式,真正吸收综合素质高和研究能力强的优秀学生进入研究生队伍,已成为保证、提高硕士研究生论文质量的第一大关口,是国家乃至个人都十分关注的一项课题。为全面贯彻科学发展观,落实以质量为核心的发展要求,全面分析和评价我国硕士生质量,制定进一步提高硕士研究生教育质量的政策,需要对硕士生的招生质量、论文质量、培养质量等进行综合评价。某校正开展硕士生质量评价,现搜集到2006、2007、2008年硕士生论文的评阅信息,分别按年存放在相关数据库中。请根据这些信息分析解决

5、以下问题。对2006,2007,2008年各年硕士生论文选题与开题进行总体评价。包括各专业的评价和各年的总体评价。对2006,2007,2008年各年硕士论文评分的评价。包括各专业与各年的总体评价。对各专业、各年硕士论文选题开题与论文得分之间的相关性进行分析,你从中得出什么结论?对2006,2007,2008年复审(毕业后的重新评阅)论文的评价。包括各专业与各年的总体评价。对硕士毕业前后论文的评分结果进行分析,你得出什么样的评论。说明你的观点与结论。对此你有什么建议。)参数及名词说明在本模型的建立过程中我们用到如下参数及名词:E()代表某个参量的数学期望D()代表某个参量的方差j代表第j篇论文

6、 Xxt代表附表1中选题的评价结果Xkt1、Xkt2、 Xkt6 分别代表附表2中6项开题的评价结果Xkt代表开题的总评价 A1、A2、 A7分别代表附表3中论文第一位专家的盲审评阅结果B1、B2、 B7分别代表附表3中论文第二位专家的盲审评阅结果X代表二位专家的盲审的平均结果)问题假设)假设复评的结果是完全客观公正的,没有任何关于主观因素的影响;)假设论文的抽样评审是完全随机的,是具有代表性的;)模型的建立与求解下面我们分问题分别予以解答:1.问题一:对2006,2007,2008年各年硕士生论文选题与开题进行总体评价。包括各专业的评价和各年的总体评价。由于硕士生论文的选题(Xxt)和硕士生

7、论文开题报告的评分(Xkt)是随机变量,所以我们用数学期望和方差来描述随机变量。1.1各年硕士生论文选题评价:设: 图 1 选题评价图数据处理结果:表1 各年硕士生论文选题评价年份2006年2007年2008年E(Xxt)2.557032.672072.60262D(Xxt)0.506690.390430.42724由图1,表1数据可知,2007年E(Xkt)=2.67207最大, D(Xkt)最小,最集中,图中也可明显看出2007年图线在评分标准=3(有理论意义和使用价值)的论文数量最多,综上2007年论文理论与实际价值最高, 论文开题效果最好。而2006年、2008年水平基本相当。1.2各

8、年硕士生论文开题评价:数据处理结果:图2 各年硕士生论文开题评价表2 各年硕士生论文开题评价年份2006年2007年2008年E(Xkt)9.721499.672079.67686D(Xkt)3.887953.540233.87811由评分标准可知,分数越小论文开题质量越高,结合图2和表2数据,2007年E(Xkt)=9.67207最大,D(Xkt)=3.54023为历年最小,表明2007年开题论文质量最高,论文水平比较集中。1.3各专业三年硕士生论文选题和开题评价数据处理结果:表3 各专业三年硕士生论文选题和开题评价选题评价开题评价专业E(Xxt)D(Xxt)E(Xkt)D(Xkt)12.7

9、931030.2330569.9655173.34363922.4761900.6303859.3809521.47392332.0000001.00000013.5000002.25000042.6216220.5595339.7027033.77647952.8000000.16000010.0000002.40000062.6333330.36555610.0666675.12888972.5517240.5921529.1034483.67895482.1836730.8846319.4693882.41232892.6666670.4888899.1000003.623333102.

10、5294120.4844298.7058823.972318112.0500000.8475009.7500002.487500122.7761190.2633109.3432843.359768132.6250000.4843759.7395833.859266142.6250000.31770810.4583332.748264152.7931030.1640909.0344832.929845162.5057470.5947959.1034483.747919172.7037040.3566539.0370371.072702182.5970150.3599919.3432843.688

11、127192.5571430.4467359.9000003.975714202.7042250.2927999.4929583.066852212.5365850.5657359.9878054.182778222.6511630.27366110.4418603.572201233.0000000.00000010.5000002.250000242.7586210.3210469.6896552.972652252.8076920.3091728.8846153.255917262.7586210.32104610.2068973.957194272.7692310.1775159.88

12、46152.025148282.7021280.3368049.6914894.958013292.5625000.43359410.0000003.000000302.7000000.41000010.0000004.000000312.5555560.32098810.0370373.591221322.6296300.2331969.5185193.582990332.5357140.39158210.5000003.178571342.7500000.18750012.0000000.000000图3 分专业三年硕士生论文选题和开题评价(仅以1,2学科为例)图3-1 学科1选题评价图3

13、-2 学科2选题评价由表3数据可知,选题评价,学科3的E(Xxt)=2.000000,为所有学科中的最小值,D(Xxt)=1.000000,为所有学科的最大值,说明学科3的论文选题质量最差;学科23的E(Xxt)=3.000000,为所有学科中最接近于3(有理论意义和实用价值)者,D(Xxt)=0,为所有学科中的最小值,说明学科23的论文选题质量最好;开题评价,学科10的E(Xkt)= 8.705882,为所有学科中的最小值,但D(Xkt)= 3.972318相对较大,说明学科10的论文的总体开题质量最好,但水平较为参差,学科3 的E(Xkt)= 13.500000,为所有学科中的最大值,D(

14、Xkt)= 2.250000相对较小,说明学科3的论文的开题质量普遍较差。其他各学个开题选题情况也可从上表数据类似分析得出。2.问题二:对2006,2007,2008年各年硕士论文评分的评价。包括各专业与各年的总体评价。2.1各年硕士论文评分评价 图4 各年硕士论文评分评价图表4 各年硕士论文评分年份2006年2007年2008年E(X)85.5112786.0425186.14738D(X)22.6625117.1115514.50776由表4可得,2006年到2008年论文评分逐年升高,方差逐年减小,说明2008年论文的相对最好,且水平普遍提高,但同时也从反面反映出近年来,对硕士论文的评定

15、标准逐年在放松,虽然评分在上升,但硕士论文的质量未必有明显的提高。2.2各专业硕士论文评分评价图5 专业硕士论文评分评价(仅以1,2学科为例)表5 各专业硕士论文评分评价专业E(X)D(X)专业E(X)D(X)184.4482817.747321885.8432815.96425285.8809530.450111984.27519.53241377.2533.06252085.9471812.93471485.2635115.98632185.9542713.70599583.82.362283.3372113.20024684.4525.305832386.56.25785.3214316

16、.753832488.9655211.74019885.6377614.370052587.3173114.9498987.6333323.882222685.586212052784.2980813.028941187.22514.536872886.4148918.524671287.2238821.449882986.06258.4804691386.2135414.467423087.1833317.94139148525.416673186.0185211.434841584.1637914.164983286.5925911.667351688.19828

17、10.02753384.12514.261161787.1111115.802473483.3757.921875由图5可知,各专业论文的评分都集中在85分左右,未出现过低和过高的分数,说明论文的质量相对接近。由表5可知,学科3 的评分E(X)=77.25分,为所有学科中的最小值,D(X)=33.0625,为所有学科中的最大值,说明学科3的论文总体质量最差;学科24的E(X)= 88.96552分,为所有学科中的最大值,D(X)= 11.74019,说明学科24的论文的总体质量相对最好;学科10、16也相对较好。3.问题三:对各专业、各年硕士论文选题开题与论文得分之间的相关性进行分析,你从中得

18、出什么结论?3.1建立多元线性回归模型模型:是未知参数。设是的n个观测值,则满足:,其中各相互独立,且。令,则方程组用矩阵表达假定矩阵X的秩等于3,即列满秩,则解得 。的无偏估计3.2回归模型的假设检验当完成回归模型中参数及回归偏差的估计后,还需要对模型进行评价。包括检验采用线性回归是否合适,每一个变量是否对因变量起作用,采用线性回归好坏程度的度量。令,考虑总离差平方和其中:,称为剩余残差平方差,称为回归平方和。定义调整的复相关系数:当越接近1,因变量与各自变量之间的线性相关程度越强。图6 2006年开题选题与论文得分关系图7 2007年开题选题与论文得分关系图8 2008年开题选题与论文得分

19、关系3.3数据计算表6 回归模型参数表年份0694.8242-0.62049-0.794774.4621620.87860791.612880.141736-0.615083.9663830.91940890.845860.167069-0.530473.6599610.9233学科178.886212.067995-1.177123.2941680.611447254.822953.0592690.3834814.8395120.76915634.755.18752.656257.4989910474.234121.991363-0.616113.1101660.605089593.7317

20、1-0.76829-0.317071.442390.881563651.861663.913742-0.080363.8616980.5893772.663662.337263-0.695793.6843520.691676877.477821.207247-0.250563.655380.929837972.766412.541538-0.861263.707140.5754441072.263492.398381-0.607013.0126650.6259411181.107431.396772-0.64043.1875290.6989361263.979183.092416-0.4316

21、73.7111640.6420891371.689792.188146-0.444193.0224280.6314241469.999652.824101-0.815983.6888180.5353721559.447062.97728-0.105092.83180.5661211665.679342.4592240.1231252.6025190.6754531774.663511.928991-0.472543.6185190.8285841865.635152.568035-0.206223.3720610.7122661959.291743.193853-0.218643.577032

22、0.6550732073.455021.824032-0.344363.3268550.8556792163.132892.689737-0.050123.1087920.7051362271.728482.043703-0.520033.003060.68319723-280431.72416738.6038502478.19091.942389-0.705992.954140.7433392560.340983.404337-0.309092.8564730.5457892671.599981.996385-0.329353.7844780.7111672764.269882.500999

23、-0.061212.601020.5192522873.32432.271955-0.659362.9022040.454682981.099871.245749-0.585982.6039060.7995233075.926991.737216-0.397323.9142110.853953185.105690.963054-0.729962.9042310.7376193268.351651.9683550.1241642.8936760.7176743360.889462.6851450.039223.3073950.76703934InfInfInfInf03.4数据分析由图68和表6

24、知,2008年的线性回归方程的复相关系数最大,为0.9233,表明曲线拟合最好,2006年2007年拟合曲线方程的复相关系数也都超过了0.9,说明曲线拟合的相当好;各学科中,由于学科3,23,34样本数较少,不具有代表性,所以未进行拟合,在拟合的学科中,学科8的复相关系数最大,为0.929837,说明曲线拟合的相当好。综上,我们可以通过来近似估计论文得分。4.问题四:对2006,2007,2008年复审(毕业后的重新评阅)论文的评价。包括各专业与各年的总体评价。4.1对各年复审(毕业后的重新评阅)论文的评价表7 各年硕士生论文复审评价年份2006年2007年2008年E(Xfs)81.4387

25、882.5267981.94372D(Xfs)42.5753331.6064352.04711由表7可知,2007年的论文复审的E(Xfs)=82.52679,为三年中的最大值,D(Xfs)=31.60643,为三年中的最小值,说明2007年的论文质量最好,但三年论文复审的成绩均低于首次的评分。4.2对各专业复审(毕业后的重新评阅)论文的评价表8 各专业硕士生论文复审评价学科E(Xfs)D(Xfs)学科E(Xfs)D(Xfs)180.2916727.039931882.8666727.24889283.916677.4097221980.6666713.25926387.50.252084.7

26、142913.63265475.5555672.987652178.6666722.47222583.119.292279.4515.0475678.0526315.102492376367002482.3571423.37245882.5357134.320152588.255.9375984.6111124.68212679.2142968.954081089.222228.3950622783.7512.43751178.726.012882.818.861282.8888945.487652983.8260923.448021381.62524.567713084.058824.408

27、3041485.523.3753184.07623.022621580.534.453276.5217435.988661683.53571167.89163380.8571417.551021784.8888932.246913400 由表8可知,学科10的E(Xfs)=89.22222,为所有学科中的最大值,且D(Xfs)=8.395062,相对较小,说明学科10的论文总体质量最高。与表5相比,各学科论文的复审成绩均低于首次评价的成绩,且学科16、24初审成绩较好但复审出现了较大下滑(原因将在问题五中分析),这又说明硕士论文的评审出现了缺陷。5.问题五、对硕士毕业前后论文的评分结果进行分析

28、,你得出什么样的评论。说明你的观点与结论。对此你有什么建议。图9 评分项目与初审复审得分差均值的关系表9 评分项目与初审复审得分差均值的关系评分项目差的平均12345670.53940.58271.76541.52990.44800.44250.60760.61970.62682.09761.54250.47010.50240.61230.57950.60471.93151.53620.45910.47240.6099由此可见复审分值普遍比较低特别是评分项目3和4(即论文难度和工作量(满分30分)和 发表学术论文及获奖(满分20分),可见在硕士毕业后评审对论文难度和工作量和发表学术论文及获奖提

29、出了更高的要求。图10评分项目与初审复审得分均方差的关系表10 评分项目与初审复审得分均方差的关系评分项目均方差12345671.37991.463011.828310.12871.16101.23781.51461.51851.463012.942510.50201.15081.41241.54201.44921.463012.385410.31541.15591.32511.5283由此可见复审分值与初审分值均方差最大的是是评分项目3和4(即论文难度和工作量(满分30分)和 发表学术论文及获奖(满分20分),可见在硕士毕业后评审对论文难度和工作量和发表学术论文及获奖是出现平分差距最大的地方

30、。由此可见在今后的评分时应该缩小这两项分配的总分值或者将这两项进行细化,非配位更具体的若干字项目,减少平分带来的误差。由硕士生毕业前后论文的评分结果(见表11)分析可知,硕士论文毕业后的复审成绩较毕业前的初审成绩普遍偏低,硕士生论文的质量也更显参差不齐。并且从2006年到2008年的数据看出硕士生毕业的要求也在逐年放宽。表11 硕士论文初审复审比较表年份2006年2007年2008年初审E(X)85.5112786.0425186.14738复审E(Xfs)81.4387882.5267981.94372初审复审差值4.072493.515724.20366初审D(X)22.6625117.1

31、115514.50776复审D(Xfs)42.5753331.6064352.04711从而反应了目前硕士生毕业论文质量下滑和研究生质量滑坡现象严重。但如果仅仅把论文质量下滑和研究生水平滑坡归咎于学生有失公允,这涉及到学生、校方和社会三个方面,关系到管理机制和用人机制存在的种种弊端。建议:由图看出,在初审复审中论文难度和工作量及发表学术论文及获奖两项的差距最大,因此需细化评审体系中的这两项,减少这两项在评审体系的比重,增加论文体现的理论基础和专门知识、论文体现作者的科研能力两项所占的比重。应该对硕士论文的标准有一个统一要求,对不合格的论文坚决予以淘汰,对相关不负责任的导师实行“问责制”,以排除

32、导师与学生个体因素对论文的影响。 一方面,促使学生端正心态,切实重视论文写作。另一方面,导师也应严格管理,真正起到督促和指导作用。建立合理的研究生论文质量评价体系,并通过量化的手段找出当前国家在研究生招生过程中存在的问题,进而调整招生政策,改革招生方式,真正吸收综合素质高和研究能力强的优秀学生进入研究生队伍。减少导师所带的研究生数量,提高导师在研究生培养过程中的指导作用,提高研究生的综合能力,而不是盲目增加数量而忽视质量。)模型推广问题一只是简单的建立随机变量模型。若要更加精确的求解,可以对数据建立更多个多元的线性回归方程,即把选题,开题的各项都看成变元,对论文不同评分项目都建立线性回归方程,

33、然后加和。)参考文献1 数学模型(第三版),姜启源 谢金星等 高等教育出版社 20032 克劳斯·附录程序:选题得分分布情况:hold onl=size(XTd_1);val_XTd_1=zeros(1,4);for k=1:l(1,1);if XTd_1(k,1)=1 val_XTd_1(1,1)=val_XTd_1(1,1)+1;endif XTd_1(k,1)=2 val_XTd_1(1,2)=val_XTd_1(1,2)+1;endif XTd_1(k,1)=3 val_XTd_1(1,3)=val_XTd_1(1,3)+1;endif XTd_1(k,1)=4 val_XT

34、d_1(1,4)=val_XTd_1(1,4)+1;endendplot(1:4,val_XTd_1,'-ob'); l=size(XTd_2);val_XTd_2=zeros(1,4);for k=1:l(1,1);if XTd_2(k,1)=1 val_XTd_2(1,1)=val_XTd_2(1,1)+1;endif XTd_2(k,1)=2 val_XTd_2(1,2)=val_XTd_2(1,2)+1;endif XTd_2(k,1)=3 val_XTd_2(1,3)=val_XTd_2(1,3)+1;endif XTd_2(k,1)=4 val_XTd_2(1,4)

35、=val_XTd_2(1,4)+1;endendplot(1:4,val_XTd_2,'-ob');hold off开题得分分布情况:hold onArg_KTd_1=sum(KTd_1,2);l=size(Arg_KTd_1);val_Arg_KTd_1=zeros(1,21);for k=1:l(1,1); for p=1:21 if Arg_KTd_1(k,1)=p val_Arg_KTd_1(1,p)=val_Arg_KTd_1(1,p)+1; end endendplot(1:21,val_Arg_KTd_1,'-*b');Arg_KTd_2=sum(KTd_2,2);l=size(Arg_KTd_2);val_Arg_KTd_2=zeros(1,2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论