软件开发人员的薪金_第1页
软件开发人员的薪金_第2页
软件开发人员的薪金_第3页
软件开发人员的薪金_第4页
软件开发人员的薪金_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、软件开发人员的薪金问题:一家高技术公司人事部为研究软件开发人员的薪金与他们的资历管理 责任教育程度等因素之间的关系,要建立一个数学模型,以便分析公司人事策略 的合理性,并作为新聘用人员的薪金的参考。他们认为目前公司人员的薪金总体 上是合理的,并作为建模的依据,于是调查了 46名软件开发人员的档案资料, 如表1,其中资历一列指从事专业工作的年数,管理一列中1表示管理人员,0表示非管理人员,教育一列中1表示中学程度,2表示大学程度,3表示更高的 程度(研究生)编号薪金资历管理教育编号薪金资历管理教育01 :1387611彳1242288461:202116081032516978711031870

2、1113261480380204 :1128310 12271740481r 1051176710328221848130620872212291354880107 :1177220 123014467100r 108105352013115942100209121952033223174101310 :1231330 n23323780101r 211149753113425410111212213713123514861110113 :1980031 d33616882120r 214114174013724170121315202634133815990130116 :1323140 d

3、33926330130r 117128844024017949140218132455024125685151319136775034227837161220159655114318838160221123666014417483160122 12135261 n34519207170r 2231383960246193462001表1软件开发人员的薪金与他们的资历、管理责任、教育程度分析与假设:按照常识,薪金自然随着资历(年)的增长而增加,管理人员的薪金应高于非管理人员,教育程度越高薪金也越高。薪金记作y,资历(年)记作x1,为了表示是否管理人员,定义x21,管理人员0,非管理人员.为了表示

4、三种教育程度,定义x31冲学0,其它x41,大学0,其它这样,中学用x3=1, x4=0表示,大学用x3=0, x4=1表示,研究生则用x3=0,x4=0表示。则表一的数据应变化为:编号yx1x2x3x4编号yx1x2x3x401 :138761r 11 :02422884610r 1021160811 00 1025169787110031870111002614803800104 :112831:00 :12717404811P 0051176711 00 1028221848100062087221012913548801007 1117722r 00 :130144671001r 00

5、810535201 103115942100010912195200032231741010010123133r 00 :133237801010r 1111497531103425410111011221371310135148611101013 :198003r 10 :036168821200r 114 1114174010372417012101 01520263410038159901301016 1132314r 00 :039263301310r 1171288440014017949140011813245500141256851510019 1136775r 00 :0422

6、78371610r 1201596551104318838160012112366601044174831601022213526r 10 :045192071700r 123138396001461934620010表2变换后软件开发人员的薪金与他们的资历、管理责任、教育程度为了简单起见,我们假定资历(年)对薪金的作用是线性的,即资历每增加一年,薪金的增长是常数;管理责任、教育程度、资历诸因素之间没有交互作用, 建立线性回归模型。基本模型:薪金y与资历x1,管理责任x2,教育程度x3,x4之间的多元线性回 归模型为ya0a1x1a2x283X384X4(1)其中ao,ai ,84是待估计的回

7、归系数,是随即误差 利用SAS编程可以得到回归系数及置信区间(置信水平为0.05)检验统计量R2,F, p的结果,见表3参数参数估计值p值1a011033.0001a1546.0001a26883.0001a3-2994.0001a41480.7053R*R =0.957F=226p=0表3模型(1)的计算结果结果分析:从表3,R2 =0.957,即因变量(薪金)的95.7%可由模型确定, F值远远超过F检验的临界值,p远小于,因而模型(1)从整体来看是可用 的。比如,利用模型可以估计(或预测)一个大学毕业、有 2年资历、非管理人 员的薪金为y a0 a1 2 a2 0 a3 0 a4 112

8、272模型中各个回归系数的含义可初步解释如下:x1的系数为546,说明资历每增 加1年,薪金增长546; x2的系数为6883,说明管理人员的薪金比非管理人员 的多6883; x3的系数为-2994,说明中学程度的薪金比研究生少 2994; x4的系 数为148,说明大学程度的薪金比研究生多148,但是应注意到a4对应的p值为 0.7053,远大于0.05,所以这个系数的解释是不可靠的。需要指出,以上解释是就平均值来说,并且,一个因素改变引起的因变量 的变化量,都是在其它因素不变的条件下才成立的。进一步的讨论:a4对应的p值远大于0.05,说明模型(1)存在缺点。为 寻找改进的方向,常用残差分

9、析方法(残差 指薪金的实际值y与用模型估计的 薪金y之差,是模型(1)中随机误差 的估计值,这里用了同一个符号)。我们 将因影响因素分成资历与管理一教育组合两类,管理一教育组合的定义如表4。200015001000N46Rsq0.9567AdjRsq0.9525 RMSE1028.2-1000-1500-20000.02.55.07.510.012.515.017.520.0组合123456管理01P 0P 10P 1教育112233表4管理一教育组合与资历x1的关系,图为了对残差进行分析,图1给出了管理一教育组合2给出了 与管理x2教育x3,x4组合间的关系。y = 11033 +546.1

10、3x1 +6882.5 x2 -2994.2 x3 +147.74 x4x1图1 模型(1) 与x1的关系y = 11033 +546.13x1 +6882.5 x2 -2994.2 x3 +147.74 x420001500 d1000 . *500 .0-500-1000 .-1500.-2000中十1.01.52.02.53.03.54.04.55.05.56.0N46Rsq0.9567AdjRsq0.9525RMSE1028.2x5图2 模型(1) 与x2 x3,x4组合间的关系从图1看,残差大概分成三种水平,这是由于6种管理一教育组合混在一起,在模型中未被正确反映的结果;从图2看,对

11、于前4个管理一教育组合,残差或 者全为正,或者全为负,也表明管理一教育组合在模型中处理不当。在模型(1)中管理责任和教育程度是分别起作用的,事实上,二者可能起 着交互作用,如大学程度的管理人员的薪金会比二者分别的薪金之和高一点。以上分析提示我们,应在基本模型(1)中增加管理x2与教育x3,x4的交互 项,建立新的回归模型。更好的模型 增加x2与x3,x4的交互项后,模型记作a3x3a4x4a5x2x3 a6 x2 x4(2)利用SAS得到以下结果如表5参数参数估计值p值a011204.0001a1497.0001a27048.0001a3-1727.0001a4-3480.0009a5-307

12、1.0001a61836.0001R*R =0.9988F=5544.8pv.0001表5模型(2)的计算结果由表5可知,模型(2)的R2和F值都比模型(1)有所改进,并且所有回 归系数的p值都小于置信水平0.05表明模型是完全可用的。与模型(1)类似,作模型(2)的两个残差分析图(图3,图4),可以看出,已经消除了图1、图2中的不正常现象,这也说明了模型(2)的适用性。y = 11204 +496.86x1 +7048 x2 -1726.5 x3 -348.39 x4 -3070.6 x2x3 +1836 x2x44002000-200-400-600-800-1000N46Rsq0.998

13、8AdjRsq0.9986 RMSE173.340.02.55.07.510.012.515.017.520.0x1图3 模型(2)与x1的关系400 J200N46Rsq 0.9988AdjRsq 0.9986RMSE173.34-200 .-400 .-600 ,-800 ,-1000 -=t1.52.02.53.03.54.04.55.05.5x51.06.0图4 模型(2) 与x2x3,x4组合间的关系从图3、图4还可以发现一个异常点:具有10年资历、大学程度的管理人 员(从表1可以查出是33号),他的实际薪金明显低于模型的估计值, 也明显低 于与他有类似经历的其他人的薪金。 这可能是

14、由于我们未知的原因造成的。 为了 使个别的数据不致影响整个模型,应该将这个异常值去掉,对模型(2)重新估计回归系数,得到的结果如表 6,残差分析见图5,图6。可以看出,去掉异常 数据后结果又有改善。参数参数估计值p值a011200.0001a1498.0001a27041.0001a3-1737.0001a4-356.0001a5-3056.0001a61997 FModel957459467239364867226.43.0001Error41Corrected Total451000802406Root MSE1028.17549R-Square0.956717271 Adj R-Sq5.

15、953240.9525Depe ndent MeanCoeff VarParameter EstimatesParameter Sta ndardIn tercept111033383.4924828.77.0001x11546.1276530.5411217.88.0001x216882.53292314.1445421.91.0001x31 -2994.17834412.04857-7.27 F1666050955544.80 |t|In tercept11120478.85272142.08.0001x11496.863935.5514489.50.0001x217047.99973102.3131868.89.0001x31 -1726.50419105.05048-16.43.0001x41 -348.3925497.30539-3.580.0009x2x31 -3070.59619148.92867- 20.62.0001x2x411835.96764130.8144514.03 FModel695732660915955

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论