职工工资数学建模论文.doc_第1页
职工工资数学建模论文.doc_第2页
职工工资数学建模论文.doc_第3页
职工工资数学建模论文.doc_第4页
职工工资数学建模论文.doc_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

西安石油大学课程设计理学院(系) 信息与计算科学专业2013级 2班题目 职工的调薪问题学生 张锦指导老师 党林立2016 年 7月 数学模型与数学实验 课程设计任务书题 目职工的调薪问题学生姓名张锦学号201301010220专业班级信息1302设计内容与要求一问题的提出(1)分析平均日工资与其他因素之间的关系,尤其需要说明与哪些因素关系密切;(2)考察女工是否受到不公正待遇,以及她们的婚姻状况是否影响其收入;(3)继续改进你的模型,并给出模型误差分析。二问题的分析本题要求我们对企业员工的日工资进行分析,且分析日工资与其他影响因素之间的关系,同时指出那些因素对日工资影响较大。我们先建立简单的多元线性回归模型,对日工资与各因素之间的关系进行粗略的分析,因考虑到后期工龄对模型的关系影响不大,故建立了多元非线性回归模型,使之更符合实际。用主成分分析法对各个因素进行分析,并找出对日工资影响较大的几个。其次删除对模型影响较小的因素,保留主要因素是模型得到简化,使之更易于计算也更符合实际应用。三模型建立多元线性回归模型的建立与求解多元线性回归模型建立 首先对题目所给数据进行量化,量化结果见附录假设该企业员工工资何其影响因素满足多元线性关系,且各因素之间没有影响,由此建立多元线性回归模型得: 其中C(1)、C(2)、C(3)、C(4)、C(5)、C(6)、C(7)、C(8)、C(9)是待回归系数参量。起止时间2016年 6 月 20 日 至 2016年 7 月20日指导教师签名年 月 日系(教研室)主任签名年 月 日一、问题重述1.1问题描述职工工资可以说是人们最为关切、议论最多的部分,因此也常常是最受重视的部分。一般说来,现代企业的工资具有补偿职能、激励职能、调节职能、效益职能。科学合理的工资制度,是激励职工的劳动积极性,提高劳动效率的重要手段,正确运用工资的杠杆作用在调动员工积极性方面会起到事半功倍的效果。此外,对于企业中的各种不同的“特殊职务族”,是否要制定和执行专门的倾斜与优惠政策,如对管理干部、高级专家、女工等,也是需要重点考虑的问题。现随机抽取了某企业若干职工的相关数据,见附件Bdata.xls。请建立适当的数学模型研究下列问题:1.2问题提出(1)分析平均日工资与其他因素之间的关系,尤其需要说明与哪些因素关系密切;(2)考察女工是否受到不公正待遇,以及她们的婚姻状况是否影响其收入;(3)继续改进你的模型,并给出模型误差分析。二 问题分析本题要求我们对企业员工的日工资进行分析,且分析日工资与其他影响因素之间的关系,同时指出那些因素对日工资影响较大。我们先建立简单的多元线性回归模型,对日工资与各因素之间的关系进行粗略的分析,因考虑到后期工龄对模型的关系影响不大,故建立了多元非线性回归模型,使之更符合实际。用主成分分析法对各个因素进行分析,并找出对日工资影响较大的几个。其次删除对模型影响较小的因素,保留主要因素是模型得到简化,使之更易于计算也更符合实际应用。三、模型假设因素1、本题所给数据能确实反映出该公司的工资的构成2、所给数据有较高的可靠性及准确性3、假设男性是否已婚对工资构成不产生影响4、男性和女性的工资所获得的条件相同5、男性不管是否已婚等同于女性已婚四、主要符号说明这里仅给出主要符号说明,其余符号在文中一一说明五、问题一模型的建立与求解5.1多元线性回归模型的建立与求解5.1.1多元线性回归模型建立 首先对题目所给数据进行量化,量化结果见附录假设该企业员工工资何其影响因素满足多元线性关系,且各因素之间没有影响,由此建立多元线性回归模型得: 其中C(1)、C(2)、C(3)、C(4)、C(5)、C(6)、C(7)、C(8)、C(9)是待回归系数参量5.1.2 模型求解利用eviews软件对模型中工资与各个影响因素进行回归分析得如下结果Dependent Variable: YMethod: Least SquaresDate: 08/18/28 Time: 16:18Sample: 1 90Included observations: 90Y=C(1)+C(2)*X1+C(3)*X2+C(4)*X3+C(5)*X4+C(6)*X5+C(7)*X6+C(8)*X7 +C(9)*X8CoefficientStd. Errort-StatisticProb. C(1)37.145262.32544715.973380.0000C(2)0.0878930.00670113.117340.0000C(3)-0.1562032.239736-0.0697420.9446C(4)-4.9250916.531140-0.7540940.4530C(5)1.2182692.0451190.5956960.5530C(6)1.6088842.6174050.6146860.5405C(7)0.9819232.7017110.3634450.7172C(8)24.634175.7899664.2546310.0001C(9)17.132456.6805272.5645360.0122R-squared0.796310 Mean dependent var57.63333Adjusted R-squared0.776193 S.D. dependent var16.23594S.E. of regression7.680945 Akaike info criterion7.010002Sum squared resid4778.750 Schwarz criterion7.259983Log likelihood-306.4501 Durbin-Watson stat1.066961由此可得出 各系数的值如下表:参量参量估计C(1)37.14526C(2)0.087893C(3)-0.156203C(4)-4.925091C(5)1.218269C(6)1.608884C(7)0.981923C(8)24.63417C(9)17.13245将结果带入模型得5.1.3结论与检验5.1.3.1对模型的检验相关系数检验法在模型中,相关系数的计算公式为:此公式反映出了X与Y线性度的一个度量指标,其中r范围为(0,1),r越接近1,则X与Y线性度越高。由相关系数检验法计算得到r=0.7762可见r并不接近1,线性相关度并不高,因此,该企业职工工资与个因素之间并不是线性关系。通过eviews得到实际值、拟合值、残差的走势图,从图中可以看出 拟合值与实际值存在较大误差,因此该模型需要进一步的改进5.3.1.2结论该模型中,本文建立了多元线性回归模型,简单的给出了该企业工资与影响因素之间的关系。由于未考虑到工龄后期对工资影响减小的因素,同时该模型优化拟合度只有0.7762,故该模型并不可靠,我们需要引入非线性量对模型进行改进。5.2多元非线性回归模型的建立与求解5.2.1模型建立考虑到对于工龄非常大的时候,其对工资的影响程度会减小,因此建立工资关于各因素的多远非线性模型:其中C(1)、C(2)、C(3)、C(4)、C(5)、C(6)、C(7)、C(8)、C(9)、C(10)是待回归系数参量5.2.2模型求解利用eviews软件对模型中工资与各个影响因素进行回归分析得如下结果Dependent Variable: YMethod: Least SquaresDate: 08/18/28 Time: 17:58Sample: 1 90Included observations: 90Y=C(1)+C(2)*X1+C(3)*X2+C(4)*X3+C(5)*X4+C(6)*X5+C(7)*X6+C(8)*X7 +C(9)*X8+C(10)*X12CoefficientStd. Errort-StatisticProb. C(1)29.691422.08174514.262750.0000C(2)0.2223760.01916711.601860.0000C(3)-2.4588511.775009-1.3852610.1698C(4)-2.7738185.101962-0.5436770.5882C(5)-0.4366651.610987-0.2710540.7870C(6)1.9326922.0417140.9466030.3467C(7)0.8412162.1070660.3992360.6908C(8)19.619454.5674704.2954740.0000C(9)17.805185.2107453.4170120.0010C(10)-0.0003204.39E-05-7.2925420.0000R-squared0.877646 Mean dependent var57.63333Adjusted R-squared0.863882 S.D. dependent var16.23594S.E. of regression5.990123 Akaike info criterion6.522540Sum squared resid2870.526 Schwarz criterion6.800297Log likelihood-283.5143 Durbin-Watson stat1.583030算法同模型一 由此可得出 各系数的值如下表:参量参量估计C(1)29.69142C(2)0.222376C(3)-2.458851C(4)-2.773818C(5)-0.436665C(6)1.932692C(7)0.841216C(8)19.61945C(9)17.80518C(10)-0.000320将结果带入模型得到该公司员工工资与影响因素之间的关系为:5.2.3结论与检验5.2.3.1模型的检验检验方法同模型一本模型中r=0.8639,接近1,因此本模型满足非线性关系,比模型一更具有实际性和通用性,具有比较高的运用价值。同样我们通过eviews得到实际值、拟合值、残差的走势图,从图中可以看出,模型的拟合优度值比较高,样本的拟合值与实际值基本吻合,模型具有较高的实用价值。5.2.3.2结论再次我们建立了多元非线性回归模型,给出了该企业员工的工资与其影响因素的非线性关系。由于考虑到了工龄后期对模型的影响,使得模型的拟合优度达到了0.8639,因此模型二更具有实际应用价值和可靠性。5.3企业职工工资影响因素主成分分析5.3.1 下表给出了影响该企业职工工资的8项变量指标。(详见附录)其中x1 表示职工工龄(月),x2表示职工是否有过一线工作经历,x3表示是否接受过培训,x4表示工作性质,x5表示职工性别, x6表示职工婚姻状况,x7、x8联合表示职工学历情况序号x1x2x3x4x5x6x7x8170000100214000110031800111008540311111019046401111015.3.2 将表中的原始数据按公式做标准化处理,然后将它们代入相关系数公式计算,得到相关系数矩阵X1X2X3X4X5X6X7X8X11.0000000.1511460.1563210.0988540.1603890.0098290.0059960.180312X20.1511461.0000000.255665-0.053068-0.1049820.2543740.0948880.255223X30.1563210.2556651.0000000.4233550.3160250.0956180.4904360.802955X40.098854-0.0530680.4233551.0000000.4176210.2294840.2630660.346091X50.160389-0.1049820.3160250.4176211.0000000.4090810.2630660.161418X60.0098290.2543740.0956180.2294840.4090811.0000000.0349220.027420X70.0059960.0948880.4904360.2630660.2630660.0349221.000000-0.026333X80.1803120.2552230.8029550.3460910.1614180.027420-0.0263331.0000005.3.3 通过SPSS软件由相关系数矩阵计算特征值,以及各个主成分的贡献率与累计贡献率成份初始特征值提取平方和载入合计方差的 %累积 %合计方差的 %累积 %12.67433.42833.4282.67433.42833.42821.35016.87650.3041.35016.87650.30431.14914.35764.6611.14914.35764.66141.01312.66977.3301.01312.66977.3305.89711.21388.543.89711.21388.5436.5426.78195.3247.3304.12399.4488.044.552100.000提取方法:主成份分析。由此得到各个成分的贡献率与累计贡献率影响因素原变量成份特征值贡献率%累积贡献率%工龄(月)x112.67433.42833.428学历x721.35016.87650.304x831.14914.35764.661培训情况X351.01312.66977.330一线经历X26.89711.21388.543性别X57.5426.78195.324婚姻状况X64.3304.12399.448工作性质X48.044.552100.0005.3.4 结果分析由分析结果可得知在所有影响职工工资的因素中,工龄,学历,培训情况,一线经历对职工的工资影响比较大,尤其是工龄以及学历对工资的影响较大六、问题二模型建立与求解6.1问题分析通过问题一的5.3的分析可以得出,影响该企业职工的工资的主要因素为工龄,学历,培训情况,一线经历。因而我们在建立模型的时候可以排除次要因素的影响,是模型更具有实际操作性6.2模型的建立通过对之前的主成分分析,我们提出了对模型结果影响不大的工作性质,性别,婚姻状况几个因素,对模型进行一定的简单化处理,使得模型更加简易。考虑到工龄,学历,培训情况,一线经历几个影响较大的因素,我们建立如下模型:其中C(1)、C(2)、C(3)、C(4)、C(5)、C(6)、C(7)是待回归系数参量此模型自变量较少,因此可以更好的运用于实际情况6.3模型的求解通过eviews软件 对 y,x1,x2,x3,x7,x8,x12进行回归分析可以得到各自变量系数的值,运行结果如下表:Dependent Variable: YMethod: Least SquaresDate: 08/19/10 Time: 20:34Sample: 1 90Included observations: 90Y=C(1)+C(2)*X1+C(3)*X2+C(4)*X3+C(5)*X7+C(6)*X8+C(7)*X12CoefficientStd. Errort-StatisticProb.C(1)30.601641.51925820.142480.0000C(2)0.2224470.01865911.921580.0000C(3)-2.4281971.545233-1.5714120.1199C(4)-1.6860064.921521-0.3425780.7328C(5)19.141104.3538684.3963440.0000C(6)16.802184.9379673.4026510.0010C(7)-0.0003204.29E-05-7.4441910.0000R-squared0.876059Mean dependent var57.63333Adjusted R-squared0.867099S.D. dependent var16.23594S.E. of regression5.918909Akaike info criterion6.468768Sum squared resid2907.779Schwarz criterion6.663197Log likelihood-284.0945Durbin-Watson stat1.651991由表可得到各自变量系数的值如下:参量参量估计C(1)30.60164C(2)0.222447C(3)-2.428197C(4)-1.686006C(5)19.14110C(6)16.80218C(7)-0.000320将结果带入模型得到该公司员工工资与影响因素之间的关系为:6.4结论与检验6.4.1模型检验有运算结果可以得出P值除了个别外数值都接近于0或为0,因此P检验通过。D.W值为1.65接近2表中拟合优度R2=0.8761,接近于1 ,表明模型拟合优度较高。各种分析表明,此模型具有较高的可行性与可靠性,同时也简化的影响因素,使得更加具有实用价值。6.4.2考察女工是否受到不公正待遇,以及她们的婚姻状况是否影响其收入我们利用模型选取一组x1,x2,x3,x4 ,x7,x8相近,且代表性别婚姻的x5,x6取不同值,检验输出值,与期望值的误差在可接受范围内。计算结果如下,比较可知,性别对工资影响小,因此可以说明该企业女性职工并未受到不公平待遇。而女性的婚姻已否对工资虽有一定的影响,但在误差允许范围内,可以忽略不计,因此,也可以认为,该企业女性职工的婚姻状况不影响其收入。yX1X2X3X4X5X6X7X8y3738000010041.75653741000110042.0223842000010042.11054242001110042.11053842000110042.11053842001010042.11056.4.3结论模型三种,本文根据问题一中的主成份分析,采用提出法将对影响不大的因素剔除,并利用回归法对模型进行分析。这种简化的模型,在实际应用中,特别是当计算的工资个数非常多,耗资资源较多时,有着很大意义。通过对数据的分析我们得出该企业女性职工并未受到不公平待遇且女性职工的婚姻状况不影响其收入的结论。七、问题三模型的建立与求解7.1问题分析本文要求我们进一步改进模型,使得模型更加合理有效,为此我们利用模型二,采用逐步回归法,对模型二进行改进,检验及修正。7.2模型的建立7.2.1由第一问得模型二为:其中C(1)、C(2)、C(3)、C(4)、C(5)、C(6)、C(7)、C(8)、C(9)、C(10)是待回归系数参量首先我们对模型二所有变量做回归分析,回归结果如下:Dependent Variable: YMethod: Least SquaresDate: 08/20/10 Time: 01:50Sample (adjusted): 1 89Included observations: 89 after adjustmentsVariableCoefficientStd. Errort-StatisticProb.C(1)29.896101.99994814.948440.0000X10.2100600.01884311.147990.0000X2-3.0121871.712948-1.7584820.0825X3-2.6850394.920604-0.5456730.5868X4-0.4647281.493149-0.3112400.7564X51.0275871.5715400.6538720.5151X61.3202502.0117610.6562660.5136X719.968344.3968374.5415230.0000X818.783015.0216593.7403990.0003X12-0.0002834.42E-05-6.4030310.0000R-squared0.887207Mean dependent var57.52809Adjusted R-squared0.874357S.D. dependent var16.29702S.E. of regression5.776670Akaike info criterion6.451062Sum squared resid2636.223Schwarz criterion6.730684Log likelihood-277.0723Durbin-Watson stat1.501247显然由于变量过多,不可避免的可能存在共线性、异方差、自回归、自相关等问题,因此我们接下来对模型进行逐步的修正。7.2.2模型修正:通过对y,x1、x2、x3.x8做相关性分析,得到YX1X2X3X4X5X6X7X8Y1.0000000.7513690.2098820.5269470.2957610.2916150.0600140.3819190.412292X10.7513691.0000000.1511460.1563210.0988540.1603890.0098290.0059960.180312X20.2098820.1511461.0000000.255665-0.053068-0.1049820.2543740.0948880.255223X30.5269470.1563210.2556651.0000000.4233550.3160250.0956180.4904360.802955X40.2957610.098854-0.0530680.4233551.0000000.4176210.2294840.2630660.346091X50.2916150.160389-0.1049820.3160250.4176211.0000000.4090810.2630660.161418X60.0600140.0098290.2543740.0956180.2294840.4090811.0000000.0349220.027420X70.3819190.0059960.0948880.4904360.2630660.2630660.0349221.000000-0.026333X80.4122920.1803120.2552230.8029550.3460910.1614180.027420-0.0263331.000000可知其中一些因素与工资高度相关,而且解释变量之间也是高度相关的。现在按照逐步回归法原理建立模型。7.2.3建立一元回归模型相关系数检验表明,工资y值与工龄x1相关性最强,所以以y=c(1)+c(2)*x1+c(10)*x12作为最基本的模型7.2.4引入其他变量1、x7,x8变量引入则模型为y=c(1)+c(2)*x1+c(8)*x7+c(9)*x8+c(10)*x12对y,x8,x7,x1,x12进行回归分析得:Dependent Variable: YMethod: Least SquaresDate: 08/20/10 Time: 02:41Sample (adjusted): 1 90Included observations: 90 after adjustmentsVariableCoefficientStd. Errort-StatisticProb.C(1)31.030651.49254920.790370.0000X10.2051820.01845311.119260.0000X717.969462.2179468.1018460.0000X815.292991.7503468.7371240.0000X12-0.0002744.35E-05-6.2911360.0000R-squared0.879909Mean dependent var57.52809Adjusted R-squared0.874191S.D. dependent var16.29702S.E. of regression5.780491Akaike info criterion6.401394Sum squared resid2806.782Schwarz criterion6.541205Log likelihood-279.8620Durbin-Watson stat1.603228由表分析得,P值全为0通过检验。拟合优度R2=0.8799 接近1,拟合程度比较高。T检验合格 DW=1.603因此x7,x8予以保留。2、x3变量引入则模型为y=c(1)+c(2)*x1+c(4)*x3+c(8)*x7+c(9)*x8+c(10)*x12对y,x8,x7,x1,x3,x12进行回归分析得:Dependent Variable: YMethod: Least SquaresDate: 08/20/10 Time: 02:58Sample (adjusted): 1 89Included observations: 89 after adjustmentsVariableCoefficientStd. Errort-StatisticProb.C(1)31.058151.50352920.656840.0000X10.2049330.01857211.034230.0000X3-1.4439714.834062-0.2987080.7659X719.058604.2740904.4591010.0000X816.637914.8342053.4417060.0009X12-0.0002734.38E-05-6.2343820.0000R-squared0.880038Mean dependent var57.52809Adjusted R-squared0.872812S.D. dependent var16.29702S.E. of regression5.812086Akaike info criterion6.422792Sum squared resid2803.768Schwarz criterion6.590565Log likelihood-279.8142Durbin-Watson stat1.603949分析得到 拟合优度R2=0.88,拟合程度较高DW=1.604 T检验合格,但考虑到其P检验值交大,故对x3不予以保留3、x4,x5变量引入则模型为y=c(1)+c(2)*x1+c(5)*x4+c(6)*x5+c(9)*x8+c(10)*x12对y,x8,x7,x1,x4,x5,x12进行回归分析得:Dependent Variable: YMethod: Least SquaresDate: 08/20/10 Time: 03:21Sample (adjusted): 1 89Included observations: 89 after adjustmentsVariableCoefficientStd. Errort-StatisticProb.C(1)30.462461.57340319.360880.0000X10.2048540.01851611.063850.0000X40.1026571.4539770.0706040.9439X51.6823771.3866701.2132500.2285X717.116422.3490947.2863910.0000X814.942851.8670188.0035940.0000X12-0.0002754.37E-05-6.2926990.0000R-squared0.882393Mean dependent var57.52809Adjusted R-squared0.873788S.D. dependent var16.29702S.E. of regression5.789735Akaike info criterion6.425436Sum squared resid2748.725Schwarz criterion6.621172Log likelihood-278.9319Durbin-Watson stat1.540243由运行结果可知拟合优度R2=0.8824,拟合优度较高。DW=1.54T检验通过但考虑到其P值过大,因此对x4,x5也不予以保留。4、x2变量引入则模型为y=c(1)+c(2)*x1+c(3)*x2+c(8)*x7+c(9)*x8+c(10)*x12对y,x8,x7,x1,x2,x12进行回归分析得:Dependent Variable: YMethod: Least SquaresDate: 08/20/10 Time: 03:29Sample (adjusted): 1 89Included observations: 89 after adjustmentsVariableCoefficientStd. Errort-StatisticProb.C(1)31.054721.46994921.126390.0000X10.2112690.01845311.449000.0000X2-2.8389291.494337-1.8997920.0609X718.228262.1885258.3290140.0000X816.220371.7915649.0537490.0000X12-0.0002854.33E-05-6.5923150.0000R-squared0.884914Mean dependent var57.52809Adjusted R-squared0.877981S.D. dependent var16.29702S.E. of regression5.692753Akaike info criterion6.381301Sum squared resid2689.817Schwarz criterion6.549074Log likelihood-277.9679Durbin-Watson stat1.578856通过运行结果可以看到 对于x2解释变量的引入,R2=0.8849,拟合优度较高。DW=1.5789 ,接近于2。 T检验合格 P检验合格。因此对于解释变量x3我们予以保留。同理可以将剩余的解释变量x6引入模型,由于P值较大,所以对于x6,我们也不予以保留。5、最终模型建立通过以上逐步回归分析法我们剔除次要因素,保留主要因素,得到以下模型得:y=c(1)+c(2)*x1+c(3)*x2+c(8)*x7+c(9)*x8+c(10)*x127.3模型求解代入计算结果得y=31.05472+0.211269*x1-2.838929*x2+18.22826*x7+16.22037*x8+-0.000285*x127.4结论与检验7.4.1模型检验通过观察DW值(1.58),我们大致可以判断模型不存在一阶自相关性。此外,模型的拟合优度R2=0.8849,调整后的拟合优度R2=0.878,说明模型的拟合优度较好;F检验和T检验均通过,说明模型对总体的近似程度较高并且各解释变量对被解释变量的影响显著。所以我通过逐步回归法建立的模型是有效的。7.4.2结论通过采用逐步回归方法,对模型二进行改进,剔除对被解释变量的影响不显著的因素,从而得到可靠的优化模型。由以上分析以及模型的建立,我们可以看出,工龄和学历是对工资产生影响的两个关键因素。编号日工资工龄(月)一线经历培训情况工作性质性别婚姻状况学历标准化yx1x2x3x4x5x6x7x8x11337000010002341400011000.01531733341800111000.024074421900011000.026258253419001000

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论