版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
目录绪论1.1课题的研究背景及意义随着教育水平的不断提升,各高校每年都在不断的进行扩招,2020年国内各高校应届毕业生的人数已经高达874万,与2019年毕业人数进行比较,应届毕业生的人数将近增加了近40万人,同上一年想比较增长4.79%,大学生入学人数每年都在急剧上升,这直接导致每年的大学应届毕业生的人数节节攀升,学生们面临的就业压力越来越大、就业形势也变得越来越紧张激烈。就业学生大多认为薪资待遇比较低,社会上相关呼声也不少。学生们刚刚入职时薪资水平不能达到预期,使得求职学生没有了积极就业的意愿。随着中国和美国之间关系变得紧张,由此所展开的贸易战,使得各企业在招聘时也变得更加严苛,就业趋势也是变得愈加严峻。面对即将完成学业的高校学生来说,在进入社会后为了顺利就业,并且可以对十多年来努力学习所掌握的知识进行融会贯通,转化为自己的生存技能资本。在当前国内就业的大环境下,大学毕业生对刚入职时薪酬的期望值与用人单位为刚刚毕业学生提供的实际工资之间存在较大的偏差。结果,毕业生在判断就业薪酬时,效果往往都不是特别理想。只有当用人单位提供的报酬达到或超过毕业生的最低期望工资时,求职者才有就业的冲动。事实上,在毕业生思考就业前景时,已经对基本工资、工作情况、职业规划以及入职后的相应福利等都做了预想,获得他们认为更“合理”的工作和薪水。目前,大多数高校缺乏有效的实施方法和管理策略来对大学生的就业或职业选择提出合理指导。与此同时,因为国内关于毕业生还处于起步阶段,可用于参考的文献并不多见,这也就限制了薪资期望影响因素的研究工作。通过调查发现,对学生就业薪酬影响较大的不只有学校知名度、学历、专业、学生交际、学生消费水平等因素,还有许多其他外在因素,行业自生的发展前景、工作地域、企业文化等因素对学生预期薪酬也有显著的影响,而造成学生薪资期望不同的因素也有许多,例如教育成本、城市消费水平、行业就业竞争、区域薪资差异、未来规划。然而通过研究薪资期望偏差同就业质量之间的差异情况,通过对比得出薪资期望偏差与工作称心程度两者成反比。本文将会通过对上述研究工作的整合,对影响大学毕业生薪资期望的因素进行更深入的挖掘、更全面的分析。1.2国内相关研究现状在国内,八十年代天津市首次对青少年择业问题进行调查研究,这也标志着我国从青少年开始,正在为健全完善的择业价值观而进行探索。在此过程中,将调研获得的数据同国外资料对比后,发现国内和国外学生对于择业标准存在着许多差异,自我实现需要才是国内大学生择业标准最重要因素,而经济收入并非我国大学生择业标准的首选因素。当时国民渐渐解放了思想,人们也正在经历国内外思想浪潮的冲击,人们生活虽然艰苦,但是基本日常生活需求也可以自足。大学生也没有迫切的经济需求,反而更加注重声望或技能的提升。通过调查发现在所有的择业因素中,兴趣爱好和自身能力比收入情况更加重要,而社会地位也显得尤为重要。九十年代,由于对外开放政策的实施,香港、澳门的相继回归,全国各行各业都在发生着巨大的改变。国内经济迅速发展,国内生产总值的增长率也一直保持在10%左右。社会购买力明显增强,人们的择业观也发生了变化,经济收入在影响就业因素里的比重也不断升高。正如《平凡的世界》所提到的“其实我们每个人的生活都是一个世界,即使最平凡的人也要为他生活的那个世界而奋斗。”人们在为了实现自己的价值在不断奋斗,而薪资水平也成为体现个人价值的重要因素。二十一世纪,世界经济局势骤变,科学技术高速发展,国家也解决农村温饱问题基本实现了九年义务教育的普及。所以在注重经济收入之外,自我发展也显得格外重要。在对毕业生进行调查后发现排在前两位的考虑因素分别是薪资水平和发展潜力,而专业岗位和工作环境对于毕业生择业就显得没有那么重要。同时调查结果显示,企业规模、专业水平、晋升机会等也是大学生比较看重的择业因素。在研究影响就业最主要因素的相关材料中表明,占比最重的是经济收入,前景发展也占比较大。在厦门大学2002届本科毕业生就业问卷调查中大学生期望的主要因素有薪资待遇、企业类别、企业性质和工作地点。同时,薪资水平、发展前景、就业城市之间也有着密切的联系。而较新的研究表明,毕业生对工作环境的也比较重视,而工作环境也不仅指狭义上的物理环境,也包括浓厚的企业文化,优秀的团队成员,工作生活的平衡。从经济角度的研究分析来看,影响薪资的主要因素集中于最低工资理论、生存工资理论、工资差别理论。美国“管理之父”泰勒曾对薪酬问题进行了深刻的研究,他发现了薪酬的激励作用,从心理学、行为学等方面对薪酬理论进行研究,同时分析出如何有效的发激励作用。综上所述,随着我国经济高速增长,各产业快速发展,人们生活水平发生巨大改变,国内大学生的就业期望关注重点也在不断发生变,已经从最初的个人发展到关注收入水平,到后来两者并重,最后对环境产生要求。这种不断变化的因素与我国的政策方针、经济发展和教育普及是密不可分的。以上文献对引导大学生毕业生在新冠疫情下形成科学合理的就业期望,发挥自己的优势,顺利就业,促进大学生的成才和全面发展,具有一定的现实意义。1.3课题的研究内容通常来说,高校毕业生的薪资水平可能会与学生的专业能力、社交能力以及家庭条件等因素有着密切的关系。在本文中,通过以性别、专业能力、社交能力以及家庭条件因素作为变量从而推导并建立得到大学毕业生薪资的影响因素的模型,考察了所预想的各个因素与大学毕业生就业薪资的影响关系,对此类问题进行了分析。首先预想影响毕业生期望薪资的一些因素,根据预想的影响因素通过抽样调查的方法收集高校学生的情况,设计调查问卷,通过对样本的分析,分析影响因素、建立数学模型、对模型进行改进,得出影响期望薪资的影响因素。确立线性关系后使用MATLAB软件建立线性回归模型并进行分析,确定薪资水平与预想的影响因素之间的联系,通过对各个变量做残差图和逐步回归分析一步步的排除其中影响不明显的因素,从而完善此模型,最终得到对大学毕业生薪金影响较大的因素。1.4本章小结本章主要对于分析毕业生薪资影响因素的背景、意义、目的、内容进行了详细概述,在完成论文期间,通过查阅大量资料用来分析可能影响大学生期望薪资的因素,为后面的调查表部分做准备。
2研究环境与相关方法2.1线性回归简介回归模型的建立和使用主要在针对自变量和因变量的各种关系分析应用中,当只有一个自变量和因变量的时候就成为一元线性回归,在直方图中用一条直线表现。如果涉及到研究多个自变量和因变量的关系,在直方图数据呈现出曲线散点图,这个模型被称为多元线性回归。通常我们运用回归模型进行分析事物现象的时候都对多个影响进行考虑,因此多元线性回归在统计分析应用中更普遍。在研究几种变量之间的关系是,经常用到回归分析的知识,在分析一元或多元线性回归分析的问题时,回归函数regress的调用必不可少,调用格式如下:(2-1)(2-2)上述公式中b表示估值,bint表示估值区间,r表示残差,rint表示置信区间,s表示统计量,设定为置信水平95%。Bint对其产生影响,如果数值越低则置信值越大。计算过程中要求响应变量值,当得到响应则说明回归方程式成立。在线性回归模型的建立过程中,实现过程如图2-1所示:图2-1线性回归模型建立2.2MATLAB简介MATLAB全称MatrixLaboratory,也称为矩阵实验室,用于专业高级数学计算,在算法开发、数据可视化、数据分析和数值计算方面有广泛的应用,具有强大的数学计算演算功能,在对接许多专业性较强的设计和开发时,可以运用许多开放的工具箱。为了与计算机网络环境进行交互式操作,在应用上不断拓展,提供了数据可视化,仿真和数值计算,算法开发等功能帮助软件开发顺利完成。MATLAB使用对接计算机编程语言,运用界面和编辑模式水平先进,应用领域广泛。在工业设计采用了系统设计,环境仿真,产品测试,信号处理,自动化控制等应用,在军事上被科研所用于软件开发,性能检测以及大量数学演算和高维度数据处理,在金融系统中用于实现预测经济走势和风险控制的模型设计,统计学应用优化图形处理,转化为动态可视化图形。在计算机编程过程中,可以对接C、C++、JAVA等语言和环境也为程序设计和网络应用提供了工具。作为一个高级数学算法软件,同时集成算法实现、绘制函数、数据分析、建立模型、对接其他语言等功能,并且具有众多内置命令与函数。使之成为教学研究、科学研究和专业领域方面成为不可或缺的软件。因此使用该软件本文所研究的大学生薪资期望调查提供技术方面的支持。2.3多元逐步回归多元逐步回归适用于自变量数量较多时,它可以让自变量在回归模型运算中自动完成。它的实现原理是把多个自变量逐个引用,最后在不断的检验中进行剔除处理。每次引入自变量都经过检验和处理后,经过多次不显著删除后,所有得到的变量都回归到最真的变量值。这种模型能够更好的处理复杂的自变量样本数据,并且能够提高预测的效率和准确性。在引入和检验过程需要进行调试:stepwise(x,y,inmodel,alpha)(2-3)在矩阵的变量调试中,一个n×m的矩阵用x表示,一个n×l的矩阵用y表示,该矩阵的列数指标通常使用inmodel表示,而alpha作为常数项在缺省时值为0.5,数值低于0.5则置信水平越高,同时alpha也用来表示显著性水平。运行命令后则会生成三个图形窗口。在stepwiseTable窗口中会显示包括回归系数以及其置信区间、模型的统计量剩余标准差(RMSE)、相关系数(R-square)以及F值和P值的统计表。2.4残值分析法残差分析(residualanalysis)是对回归方程所求的数值中观测值和估计值之间的残差数值进行分析,从而达到对回归模型准确性的调整。分析回归残差时要时刻对数值在图形中的拟合状态进行观察,以回归残差作为坐标系数,从而计算数值分布是否符合正态分布。残差是用来表示预测值与观测值之间的差值,也就是实际观察所得值与回归估计所得值的差值。在\t"/item/%E6%AE%8B%E5%B7%AE%E5%88%86%E6%9E%90/_blank"回归分析计算过程中,用δ来表示测定值与回归方程预测值两者之间的残差值。残差δ应当符合\t"/item/%E6%AE%8B%E5%B7%AE%E5%88%86%E6%9E%90/_blank"正态分布N(0,σ2)。而标准化残差(Pearson残差)是指残差除以其标准差后得到的数值,用δ*来表示,同时它也服从标准正态分布N(0,1)。通常情况下标准化残差的实验点落在(-2,2)区间之间的概率大于等于95%。若某一实验点落在(-2,2)区间以外,可以认定其为异常实验点,将其从回归线拟合中去除。其调用格式为:rcoplot(r,rint)(2-4)2.5系统回归方法通常事物的影响能出现多个因素,因此研究其中对某种现象造成的具体关联和变化,需要用多个自变量进行运算。多元线性回归运算的公式在一元线性基础上增加了几个变量和参数。在建立模型和公式前,需要考虑到自变量的具体性质,有的自变量是统一单位,有的自变量是定量或者定性的,比如检测家庭教育程度受到的影响有子女学习能力,父母年龄,经济收入,当地教育水平和发展情况,甚至当地家庭教育观念等多种因素,这样获得的样本数据必须经过一定的标准化处理。因此多元线性回归运用需要在统计软件中完成数据统计,分析和数值计算才能得出有效的回归方程模式。同时还需要进行检验来确认抽样样本有效与否,回归方程差异性和显著相关性是否成立。一些定性自变量需要进行合理的数据转换因此统计过程中需要运用更多数学演算方法,其中在进行样本处理和数值统计时候有一个标准分运算,转换结果得出标准回归方程和系数,公式2-5所示:(2-5)在统计时不同的单位会带来回归系数的变化,因此都转化为统一标准单位,方便计算。这个标准方程中自变量和因变量都选择平均水平,对应的标准分均为0所以常数项就没有了,标准回归方程中没有a这个项。在具体计算的软件中模型参数算法可以采取多种方式进行估算,同时需要软件进行验证。图2-2系统测试为了提高回归方程运用的准确性,对于样本的选取很重要,通过更专业的数学运算来确定自变量的参数能够更充分的为回归模型提高精确数值。2.6本章小结本章对本篇论文使用的方法、实验环境和数据处理方法等进行介绍,主要介绍了它们的功能特点、优势等。体现了模型建立前的设计思路,详述了在模型分析中所用到的相关方法,对测试样本的流程进行总结。
3数据采集与分析3.1数据样本分析由于此次研究过程中的研究数量过多,调查过程中不可能包括所有的研究对象,目前主要针对大学生自身素质进行研究,因此收集数据属于随机取样。具体抽取数据方法进一步细分为下面六种:(1)简单随机抽样:最基础的取样方法,不对数据进行任何改变,样本直接进行随机抽取获得样本数据使用。通常简单随机抽取数据内部差异不大,进行抽签抽取或者摇号码以及根据随机数表的方法完成简单随机抽取数据统计。(2)等距抽样:所谓等距抽样主要指样本总体之间的排列间隔。这种抽样方法要求主要是寻找一个可以等距离的参考标准,比如时间点或者方位距离或者其他可以参照的依据,先确定总体样本需要划分间隔的参照点,再进行机械或者系统取样。因为这种取样对于总体数量值较大时候比较快速方便,所以常常在这种情况下被运用。等距抽样的距离是根据总体数量除于一个固定值计算得出,相对其他抽样方法更为方便。(3)分层抽样:区别于简单抽样和等距抽样,当需要处理的样本数总体数量值较大,但是数值之间差异程度也较大,则需要对这样的样本数据进行分层处理。把其中差距较大的某一种类数据进行归类,这样就把总体分层为不同层级或者类别的数据,再进行抽样。根据一定特征或者标签把数据总体进行分类以后,每一个类别再选择随机抽样抽取样本。因此分层抽样包括多种方法结合在一起,再具体进行分类的时候也可以根据实际情况进行调整,具体抽取样本方式和以上几种类似。(4)整体抽样:整体抽样的取样方式与分层抽样有些相似,但是整体抽样不是分层,而是先把总体样本进行分组或者分群,再对划分成功的群和组内的样本进行抽取,最后完成抽样。(5)双重随机抽样:双重随机抽样也称为相关抽样法,当目标性状由于技术的或经济的原因很难直接观测时,或者必须进行破坏性测量时,可利用性状间的相关性,找出一个与目标性状显著相关且容易观测的过渡性状,通过对过渡性状的观测研究达到研究目标性状的目的。(6)两级随机抽样:两级随机抽样主要是指抽样时候根据一定的标准把总体样本进行两级划分,比如一个是被观测的,一个是观测定义,级分层的两个部分具有某种对应逻辑联系。这种抽样方法能够比较系统的对样本总体进行分组,满足更多数据统计分析的样本抽取要求。对于有自然分级现象的总体,采用分级随机抽样可以尽量少的投人获得尽量多的可靠的信息。由此进一步构建回顾模型前期建立的思想,如图3-1所示:图3-1回归模型建立思路由图3-1的建模思路,选取西京学院2018-2020届的大学生作为此次研究对象,在调查过程中,采取分类抽样进行数据的筛选。此次调查中,分别对8个专业的学生进行统计,共发放调查问卷1200份,其中本科600份,专科600份。回收有效问卷1000份,回收率83.3%。根据所得数据计算各个因素的占比。本科调查数据如表3-1所示:
表3-1本科生调查总体样本分布样本个数(个)比例(%)性别男30060%女20040%年级2018届12024%2019届18036%2020届20040%院系分布工业设计5010%会计学7515%计算机科学与技术8016%环境设计6513%网络与新媒体6012%经济管理7515%土木工程5511%医学影像技术408%生源地城市32064%农村18036%家庭经济情况富裕8517%如上表所示,男生人数300人,女生人数200人,所占比例分别为60%和40%。从不同年级的分布情况来看,2020届学生最多,人数为200人,占比40%,2019届学生180人,占比36%,而2018届人数最少,只有120人,占比24%。院系分布方面,工业设计50人,占比10%,会计学75人,占比15%,计算机科学与技术80人,占比16%,环境设计65人,占比13%,网络与新媒体60人,占比12%,经济管理75人,占比15%,土木工程55人,占比11%,医学影像技术40人,占比8%。在调查学生中有180位学生来自农村,占比38%,其余学生都来自各个城市,占比64%,家庭经济富裕的学生有85人,占比17%。专科调查数据如表3-2所示:
表3-2专科生调查总体样本分布样本个数(个)比例(%)性别男32064%女18036%年级2018届22044%2019届15030%2020届13026%院系分布工业设计6513%会计学8016%计算机科学与技术7014%环境设计5010%网络与新媒体5511%经济管理6012%土木工程6513%医学影像技术5511%生源地城市28056%农村22044%家庭经济情况富裕7515%普通37575%困难5010%专业排名前30%12024%专业成绩专业排名30%-60%32064%专业排名后40%6012%如上表所示,男生人数320人,女生人数180人,所占比例分别为64%和36%。从不同年级的分布情况来看,2018届学生最多,人数为220人,占比44%,2019届学生150人,占比30%,而2020届人数最少,只有130人,占比26%。院系分布方面,工业设计65人,占比13%,会计学80人,占比16%,计算机科学与技术70人,占比14%,环境设计50人,占比10%,网络与新媒体55人,占比11%,经济管理60人,占比12%,土木工程65人,占比13%,医学影像技术55人,占比11%。在调查学生中有220位学生来自农村,占比44%,其余学生都来自各个城市,占比56%,家庭经济富裕的学生有75人,占比15%。家庭经济困难的学生有50人,占比10%,其余学生占比75%。有120名学生专业成绩排名靠前,占比24%,而排名靠后的60名同学,占比12%。3.2设计影响因素调查表根据对以往相关成果的研究与查阅,总结了研究成果假设中所包含的与就业薪资期望相关的因素,抽取计算机、经济管理、会计三个专业各100名大学生进行随机调研。通过对调研问卷原始表里填写情况进行筛选与分析,得出二十多个可以对学生就业薪资产生影响的影响因子,进行筛查排序后,最终得出17个对薪资期望影响较大的影响因子,将这17个影响因子分为6类,分别为学生的个人基本信息包括性别、年级和专业情况、学生具体获奖情况和英语、计算机水平、学生是否参加社团和担任的班级干部情况、学生自控力、择业能力和信心、学生家庭中的父母的经济收入和生育情况、专业成绩情况。设计思路如图3-2所示:图3-2调查表设计思路将影响因子进行归类,将其作为解释变量,分别对各变量依据不同标准进行分值的计算,根据调查表建立多元线性回归模型。设计就业薪资期望调查表。该因子结构如表3-3所示:
表3-3问卷调查就业薪资期望影响因素设计及说明项目解释变量解释变量说明基本信息性别男=1女=2就读年级划分为大二,大三,大四,3级,计1~3分所读专业计算机=1,经济管理=2,会计=3综合能力获奖情况划分为未参与,省、国赛三,二,一,7级,计0~6分奖学金获得次数划分为未获得,1~2次,3~4次,5次以上,4级,计0~3分英语水平划分为无证书,英语四级,英语六级,计0,2,4分计算机水平划分为无证书,计算机一级,计算机二级,计算机三级,计算机四级,计0~4分交际能力是否担任班级职务是=1,否=0是否参加社团划分为从未参加,少量参加,经常参加计1~3分人际关系划分为不擅交际,朋友不多,朋友比较多,人脉比较广,计1-4分自我评价自控力划分为非常差,较差,一般,良好,优秀,计1~5分抗压能力家庭情况是否独生子女是=1,否=0是否单亲是=1,否=0家庭平均月收入3000以下,3000~5000,5000~7000,7000以上,计1-4分自我素养专业课成绩排名分为80%后,61%~80%,41%~60%,11%~40%,前10%,计1~5分
图3-3调研人员筛查调查人员中涉及到在校大二至大四的计算机类、经济管理类、会计类学生,为了便于反映不同学科、大二到大四对于毕业后工资水平的看法。通过在校发放问卷调查,发放问卷,没有缺省或者无效问卷,经过整理收集数据,删除无效数据后,获得的调查数据采用EXCEL表格进行保存,最终筛选的有效人员数据样本120名。如表3-4所示:表3-4有效调研人数计算机会计经管合计男18212059女22192061合计404040120其中,调研人员的期望薪资如图3-4所示:图3-4调研人员期望薪资3.3分析影响因子将调查统计完成的数据通过EXCEL导入到MATLAB软件中,如图3-5所示:图3-5薪资与变量导入数据导入成功后,分别对各因素新建数值矩阵中,代码如下:S=Untitled1(:,1);%薪资x1=Untitled1(:,2);%就读年级x2=Untitled1(:,3);%竞赛水平x3=Untitled1(:,4);%奖学水平x4=Untitled1(:,5);%英语水平x5=Untitled1(:,6);%计算机水平x6=Untitled1(:,7);%是否参加社团x7=Untitled1(:,8);%人际关系x8=Untitled1(:,9);%自控力x9=Untitled1(:,10);%择业信心x10=Untitled1(:,11);%抗压能力x11=Untitled1(:,12);%家庭平均月收入x12=Untitled1(:,13);%专业课成绩排名进行线性回归分析,而在回归方程中自变量是解释变量,因变量是就业薪资。在MATLAB中使用corrcoef函数计算相关度,在命令行输入:>>R1=corrcoef(S,x1);>>R2=corrcoef(S,x2);>>R3=corrcoef(S,x3);>>R4=corrcoef(S,x4);>>R5=corrcoef(S,x5);>>R6=corrcoef(S,x6);>>R7=corrcoef(S,x7);>>R8=corrcoef(S,x8);>>R9=corrcoef(S,x9);>>R10=corrcoef(S,x10);>>R11=corrcoef(S,x11);>>R12=corrcoef(S,x12);得出:corrcoef(S,x1)=-0.0622,corrcoef(S,x2)=0.6111corrcoef(S,x3)=0.3162,corrcoef(S,x4)=0.2114corrcoef(S,x5)=0.3079,corrcoef(S,x6)=0.1294corrcoef(S,x7)=-0.3550,corrcoef(S,x8)=0.0659corrcoef(S,x9)=0.0659,corrcoef(S,x10)=0.0659corrcoef(S,x11)=0.3793,corrcoef(S,x12)=0.4777根据所得数据可知,x2,x3,x5,x11,x12与薪资期望之间的相关系数大于0.3,其余相关系数都小于0.3。由数据可见,所有因素都和薪资期望呈线性关系,因此针对该问题可以建立多元线性回归模型来解决。3.4建立模型定义变量a0~a12表示回归系数,ɛ表示随机误差,建立数据模型:(3-1)其中ɛ 为随机误差项,回归分析的主要任务就是以误差ɛ的平方和最小为原则,求多元回归模型的回归系数a0~a12求解这个方程是以S为最小原则,求a0~ak要使得S最小,应该满足∂SS(3-2)然后使用MATLAB软件求解模型,进行回归方程的显著性检验。由此可得到结果如表3-5所示:表3-5各参数的分析结果表参数参数估计值置信区间a01239.8353[1073.1253,1406.5454]a1-16.8657[-48.4417,14.7104]a2174.0946[158.5466,189.6419]a3164.0858[136.8296,191.3420]a46.1553[-11.8082,24.1187]a533.7497[10.5651,56.9342]a640.2331[8.7561,71.7100]a7-12.8712[-39.1224,13.3800]a83.5001[-17.1817,24.1818]a90[0,0]a100[0,0]a11182.6410[149.2968,215.9852]a12210.0088[190.8159,229.2017]R2=0.0001F=0.0035P=0由表3-5可得到:R2=0.0001,F值为0.0035>0,P=0<0.05(缺省时定位0.05),即说明该模型是合理的,同时,变量的置信区间是包含0点的,则可认为影响效果不显著。然后使用多元逐步回归。具体代码如下:X=[ones(120,1),x1,x2,x3,x4,x5,x6,x7,x8,x9,x10,x11,x12];%[b,bint,r,rint,stats]=regress(S,X);rcoplot(r,rint);X1=[ones(120,1),x1,x2,x3,x4,x5,x6,x7,x8,x9,x10,x11,x12];stepwise(X,S);图3-6逐步回归结果图图3-6中的R用来表示的是线性回归的拟合度,R的取值范围是0~1,当R越接近1时,表示拟合度越高,也代表因变量与自变量的线性关系越明显,同时也证明假设的可靠性更高。R的平方表示决定系数,被用来映射解释方差占因变量方差的百分比;调整R2是因为自变量之间的相互影响之后,对决定系数R2的校正,使得实验更加严谨,当调整R2大于0.25可认为拟合度较好。本实验中R=0.938,R2=0.934也即模型可以决定薪金M的93.4%,其中R值接近1,调整R2明显大于0.25,证实多元线性关系成立。其对应的概率P=1.16215e-65<<0.01,残值的方差值为133.359。综上所得,此回归模型的回归效果比较成功。接下来在matlab软件上使用rcoplot命令进行残差分析。可得到残差分析图如图3-7所示:图3-7残差分析图通过对残差图的分析可得:图中除了使用红色标注的一些数据以外,剩下的数据都很接近零点,而且可以明显的看出他们的置信区间内都包含有零点。由此可说明此回归模型建立比较理想,可以与原始数据比较符合,其中的个别数据异常点可以忽略掉。3.5本章小结首先对收集的数据进行随机抽样,从客观方面建立分析对象,分析数据明确变量属性。对调查人员进行样本分布表的建立,依据相关材料与已有数据相结合设计薪资期望因素表。通过MATLAB将整理完成的数据进行相关系数的计算,建立多元线性回归模型并检验其显著性,对逐步回归结果进行解释。
4模型评估与分析4.1降维处理图4-1模型评估如图4-1,对回归模型进行评估,对R2和F统计量进行分析,通过对残差图的分析,剔除就读年级、就读专业等5个无法具体量化的定性解释变量,对其他影响因子通过SPSS软件(导入数据-分析-降维-因子分析)进行降维处理,对大学生认为影响就业薪资期望的重要因素进行因子分析。采取最大方差法抽取因子,根据成分转换矩阵显示的结果将剩余的12个解释变量归结为5类,可解释方差为79.315%,具体成分因子结构如表4-1所示:
表4-1成分表分类总计方差的/%累计/%相应的解释变量综合知识素养3.35427.95427.954竞赛获奖次数、英语水平、计算机水平、获得奖学金次社会交际水平1.95116.25144.206是否为学生干部、社团活动、人际关系自我评价系统1.70814.24058.447抗压能力、自控力、择业自信学生专业能力1.29410.79369.241专业课成绩排名家庭月收入1.20810.07373.315家庭月收入由于调研学生的性别、就读专业、就读年级、是否独生子女、是否单亲这些影响因子属性在多元线性回归分析过程中无法具体量化,所以将上述解释变量归结成定性变量。本文对是否单亲家庭、是否独生子女及不同性别学生就业薪资的平均值进行了分类汇总如表4-2所示:表4-2大学生就业薪酬期望汇总表是否单亲家庭平均工资性别平均工资是否独生子女平均工资是3201男3176是3212否3101女2911否2988由表4-2的结果不难得出,是否单亲家庭并不会对期望工资造成太大的影响;不同性别会对期望工资的影响比较大;相比于非独生子女,独生子女更期望有比较高的薪水。4.2因子相关性分析降维处理后的因子数值进行相关性分析和回归模型构建,根据(表4-3)的数据显示看出因子之间的相关性不明显,故而可以直接进行多元线性回归分析。这些因子中,存在正相关关系和负相关关系,了通过相关系数数值可以判断;社会交际能力与学生专业素养、家庭月收入呈现正相关,与自我评价系统呈负相关;自我评价系统与学生专业素养、家庭平均收入呈正相关;学生专业素养与家庭平均收入呈负相关。其中综合知识素养与学生专业素养相关性不明显。表4-3Pearson相关系数分类综合知识素养社会交际水平自我评价系统学生专业能力家庭月收入综合知识素养1社会交际水平-0.1411自我评价系统-0.315-0.4811学生专业能力0.0050.6570.1751家庭月收入0.3510.7250.022-0.18814.3模型改进通过前面的分析过程可以总结得出该模型使用逐步回归的方法将对于就业薪资影响不显著的因素变量逐一排除,然后使用残差分析法分析整个模型,从而确定模型是否合理,精确度高。该模型原理清晰,便于分析,操作简便。同时,我们的分析过程任然存在许多不足之处,例如模型的假设过于理想,为提升模型准确性,应该对模型中的因素做全面的考虑。就业薪资与其影响因素之间是通过拟合而得到的线性关系,所以还是存在着一定的误差。进行调研的院校不够全面,可能会导致结果不够完全准确。将分析所得的影响不显著因素去除,只需要保留x2,x3,x5,x6,x11,x12建立回归方程并且将两因素的平均项和交互项加入到方程中,反复的经过几次尝试,得到了较好的模型,方程如4-1所示: (4-1)然后使用MATLAB软件来解析此方程。且由此可得到结果如表4-4所示:
表4-4各参数的分析结果表参数参数估计值置信区间a01356.5462[1164.8432,1548.2492]a190.1378[35.4906,144.7850]a2125.3316[90.0677,160.5955]a371.3711[41.1555,101.5868]a470.5871[16.5095,124.6648]a5138.1979[75.9087,200.4870]a6152.1237[129.9387,174.3087]a711.5231[1.0989,21.9472]a8-17.5307[-26.8713,-8.1900]a9-5.3320[-20.8534,10.1893]a1021.4108[3.3770,39.4447]a1131.7060[23.2397,40.1724]R2=0.0001F=0.0066P=0由表4-4中可得到:R2=0.0001,F值为0.0068>0,P=0<0.05(缺省时定位0.05),即就是说明该模型是合理的。然后使用多元逐步回归进行数据分析,具体代码如下:X=[ones(120,1),x1,x2,x3,x4,x5,x6,x1.*x2,x1.*x3,x1.*x4,x1.*x5,x1.*x6];[b,bint,r,rint,stats]=regress(S,X);rcoplot(r,rint);X1=[ones(120,1),x1,x2,x3,x4,x5,x6];%除了薪资以外的所有变量stepwise(X,S)图4-2逐步回归结果图由图4-2可得:R2=0.964645,而修复后的R2=0.961402,也就是说,模型可以决定薪金M的96.46%,F的检验值为297.403,其对应的概率P=2.96514e-74<<0.01,残值的方差值为102.277。在此次改进的模型中,通过多数据的分析可以很清楚的看出R2有了明显的提高,所以说,模型成立。使用rcoplot命令进行残差分析,残差分析图如图3-5所示:图4-3残差分析图通过对残差图的分析可得:图中除了使用红色标注的一些数据以外,剩下的数据都很接近零点,而且可以明显的看出他们的置信区间内都包含有零点。由此可说明此回归模型建立比较理想,可以与原始数据比较符合,个别数据异常点可以忽略掉。综上得出影响大学毕业生期望薪资的主要因素为:竞赛获奖情况、奖学金获得情况、计算机水平、是否主动参加过公益活动、家庭月收入、专业课成绩排名。4.4本章小结本章首先对在回归分析中无法具体量化的影响因子进行分析,对影响因子进行降维处理,分析所得不显著因素剔除,保留x2,x3,x5,x6,x11,x12建立回归方程并且将两因素的平均项和交互项加入到方程中并建立模型,分析求出影响因子与薪资的相关度。然后使用MATLAB软件解析优化该模型,建立线性回归模型,验证模型的合理性从而得出模型结论,继而对模型做出评价。
5总结与展望5.1总结通过对问卷调查表设计,突出了问卷调查表的多样性,通过多方查阅,最大程度确保调查表的精确性。通过网络收集问卷表的途径对不同年级不同专业的学生进行调查结果收集汇总。首先对于在多元线性回归过程中无法具体量化的影响因子进行了分析,然后分析了可以具体量化的影响因子并求出影响因子与薪资的相关度,确定可以用多元线性回归方法进行分析。建立多元线性回归模型,将EXCEL中的数据导入到MATLAB软件中,通过MATLAB软件的regress命令进行多元线性回归,验证模型的合理性。通过MATLAB软件使用stepwise命令进行多元逐步回归,容易得知此回归模型的回归效果比较成功。通过MATLAB软件的rcoplot命令进行残差分析并画出残差图,容易得出异常数据点比较少且原始数据比较符合。对影响因子进行降维处理,再对因子相关性分析及构建回归模型容易得出影响大学生薪资的因素。分析所得的影响不显著因素去除,保留x2,x3,x5,x6,x11,x12建立回归方程并且将两因素的平均项和交互项加入到方程中并建立模型,采取多元线性回归、多元逐步回归和残差分析对模型的准确性有了更进一步的提高,从而得出模型结论,继而对模型做出评价。从多方面为对提高毕业生就业质量的问题提出应对之法,结合我国的就业形势,提出相应的对策建议:(一)、注重高校人才教育。高校应该持续加强学生的实践能力,提升对专业理论知识的掌握,从多方面理解、看待问题,结合社会需求、专业水平与兴趣爱好,制定出符合自己的职业规划。在“以就业为导向”的前提下,坚持以完善教学质量,提高人才素质。(二)、重视学生就业指导。学校开展就业指导不仅可以帮助学生了解专业前景以及严峻的就业形势,在入学到毕业的各个学期都持续开展就业指导课。适时开展关于就业指导的实践活动,在不断对就业形势的了解过程中,分析社会和政策的变化,结合自身的职业追求与社会需求,做好职业规划,树立正确的就业观。(三)、培养学生创新意识。在大众创新、万众创业的社会环境下,创业意识的重要性也愈加重要。为提升大学生的创业意识,首先应该先就业,毫无工作经验是毕业生最大的劣势,所以应该在工作中不断积累经验,了解企业的运行方式,拓宽人脉。这些经验只有在亲身实践后才会有所增益,也可以完善创业的可行性,树立正确的创业意识。(四)、提升专业课程建设。为适应经济社会发展的需求,找准定位,遵循教育可持续发展的原则,明确专业发展目标和人才培养方向。为区域经济和社会发展培养“厚基础、宽口径、强能力、高素质”的人才。培养特色专业人才,充分反应学科前沿及专业发展动态。(五)、落实校企深度合作。为了从根本上解决各校毕业生就业难的问题,高校必然学院与企业之间建立长期和稳固的校企合作关系,及时了解企业的运营机制和岗位需求和变化,以就业为导向不断完善高校的人才培养方案,培养出具有符合社会需要的经世致用的人才。校企共建需充分发挥企业在教学培养中的重要作用,共同探讨知行合一、工学结合的应用型人才培养新模式。5.2展望通过这次毕业设计,我深刻认识到遇到问题时,首先要认真思考,制定切实可行的计划,这不仅可以增强动手的实践能力,也可以让我们学到如何解决一个陌生问题,在很大程度上提升了我们的综合素质,专业能力。在此次毕业设计完成的过程中,锻炼了我的耐心和意志,提高了我解决事情的能力,但同时也存在数据收集不完善,算法不准确,实验的准确性和科学性不严谨等问题。这需
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 工信部《制造业企业数字化转型实施指南》
- 2025年广东货运从业资格证哪里考
- 以科普为引领的家用急救技能培训课程设计
- 企业内部安全监督体系的建立与实施
- 2025年莆田道路客货运输从业资格证b2考试题库
- 创新型团队建设的实践与思考
- 2025年乌鲁木齐货运从业资格考试试题及答案详解
- 创新思维在小学科学教育中的跨学科应用
- 利用现代科技手段优化家庭情感教育效果
- 烧烤作文300字6篇
- 独立基础土方开挖施工方案
- 【基于单片机的电子密码锁设计(论文)10000字】
- 肿瘤病人常见症状护理
- 瑜伽基础知识题库单选题100道及答案解析
- 广东省广州市2024年中考数学真题试卷(含答案)
- 2024年资格考试-注册质量经理考试近5年真题附答案
- 浙江省台州市2023-2024学年七年级上学期期末数学试题(含答案)
- 2024年秋季国家开放大学《形势与政策》大作业及答案
- 2024年上海宝山普陀中考英语一模作文集
- 2024年秋新人教版地理七年级上册课件 第一章 地球 1.3.1 地球的自转
- 设计变更控制程序
评论
0/150
提交评论