版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、教师薪金问题教师薪金问题摘要本文是一个关于建立教师薪金影响因素的回归模型。在模型中我们考虑到了题目给出的所有因素,通过题目给出的数据,发现这七个变量之间与因变量均呈线性关系,因此我们初步的 建立了一般的线性回归模型,然后我们用MATLA歆件求解。我们首先利用MATLA歆件作出 薪金与老师工作时间的散点图,然后假设工作时间与教师薪金为线性关系,通过对解出的数据进行分析,我们发现模型存在缺陷,有些变量对因变量的影响不显着,这也就说明性别和 婚姻状况上的差异对所调查的教师的薪金影响较小。经过对模型的各个变量的逐步回归和作残差图,从影响系数的表图中我们得出了工作时间和学历对教师的薪金的影响最大。关键词
2、:统计回归模型MATLAB软件残差分析法逐步回归一、问题提出某地人事部门为研究中学教师的薪金与他们的资历,性别,教育程度及培训情况等因素之间 的关系,要建立一个数学模型,分析人士策略的合理,特别是考虑女教师是否受到不公平的 待遇,以及他们的婚姻状况是否会影响收入。为此,从当地教师中随机选了3414位进行观察,然后从中保留了 90个观察对象,得到了下表给出的相关数据。尽管这些数据具有一定 的代表性,但是仍有统计分析的必要。现将表中数据的符号介绍如下:Z月薪(单位:元);X1工作时间(以月计);X2=1男性,X2=0女性;X3=1男性或 单身女性,X3=0-已婚女性;X4学历(取值06,值越大表示
3、学历越高);X5=1受雇于 重点中学,X5=A其它;X6=1受过培训的毕业生,X6=CH未受过培训的毕业生或受过培 训的肄业生;X7=1以两年以上未从事教学工作,X7=CH其他。注意组合(X2,X3) = (1,1), (0,1 ), (0,0)的含义。(1)进行变量选择,建立变量X1X7与Z的回归模型(不一定包括每个自变量),说明教 师的薪金与哪些变量关系密切,是否存在性别和婚姻状况上的差异。为了数据处理上 的方便,建立对薪金取对数后作为因变量。(2)除了变量X1X7本身之外,尝试将他们的平方项或交互项加入到模型中,建立更好的模型量Z X1 X2 X3 X4 X5 X6 X7Z X1 X2
4、X3 X4 X5 X6 X71998 7 0 0 0 0 0 0462201 158 1 1 4 01 121015 14 1 1 0 0 0 0472992 159 1 1 5 11 131028 18 1 1 0 1 0 0481695 162 0 1 0 0 0 041250 19 1 1 0 0 0 0491792 167 1 1 0 1 0 051028 19 0 1 0 1 0 0501690 173 0 0 0 0 0 161028 19 0 0 0 0 0511827 174 0 0 0 000 171018 27 0 0 0 0 01522604 175 1 1 2 11 0
5、81072 30 0 0 0 0 0 0531720 199 0 1 0 0 0 091290 30 1 1 0 0 0 0541720 209 0 0 0 0 0 0101204 30 0 1 0 0 0 0552159 209 0 1 4 1 0 0111352 31 0 1 2 0 1 0561852 210 0 1 0 0 0 0121204 31 0 0 0 1 0 0572104 213 1 1 0 1 0 0131104 38 0 0 0 0 0 0581852 220 0 0 0 0 0 1141118 41 1 1 0 0 0 0591852 222 0 0 0 0 0 01
6、51127 42 0 0 0 0 0 0602210 222 1 1 0 0 0 0161259 42 1 1 0 1 0 0612266 223 0 1 0 0 0 0171127 42 1 1 0 0 0 0622027 23 1 1 0 0 0 0181127 42 0 0 0 1 0 0631852 227 0 0 0 1 0 0191095 47 0 0 0 0 01641852 232 0 0 0 0 0 1201113 52 0 0 0 0 01651995 235 0 0 0 0 0 1211462 52 0 1 2 0 1 0662616 245 1 1 3 11 02211
7、82 54 1 1 0 0 0 0672324 253 1 1 0 1 0 0231404 54 0 0 0 1 0 0681852 257 0 1 0 0 0 1241182 54 0 0 0 0 0 0692054 260 0 0 0 0 0 0251594 55 1 1 2 1 1 0702617 284 1 1 3 11 0261459 66 0 0 0 1 0 0711948 287 1 1 0 0 0 0271237 67 1 1 0 1 0 0721720 290 0 1 0 0 0 1281237 67 0 1 0 1 0 0732604 308 1 1 2 11 029149
8、6 75 0 1 0 0 0 0741852 309 1 1 0 1 0 1301424 78 1 1 0 1 0 0751942 319 0 0 0 1 0 0311424 79 0 1 0 0 0 0762027 325 1 1 0 0 0 0321347 91 1 1 0 1 0 0771942 326 1 1 0 1 0 0331343 92 0 0 0 0 01781720 329 1 1 0 1 0 0341310 94 0 0 0 1 0 0792048 337 0 0 0 0 0 0351814 103 0 0 2 1 1 0802334 346 1 1 2 11 136153
9、4 103 0 0 0 0 0 0811720 355 0 0 0 0 0 1371430 103 1 1 0 0 0 0821942 357 1 1 0 0 0 0381439 111 1 1 0 1 0 0832117 380 1 1 0 0 0 1391946 114 1 1 3 1 1 0842742 387 1 1 2 11 1402216 114 1 1 4 1 1 0852740 403 1 1 2 11 1411834 114 1 1 4 1 11861942 406 1 1 0 1 0 0421414 117 0 0 0 0 01872266 437 0 1 0 0 0 04
10、32052 139 1 1 0 1 0 0882436 453 0 1 0 0 0 0442087 140 0 0 2 1 11892067 458 0 1 0 0 0 0452264 154 0 0 2 1 11902000 464 1 1 2 11 0二、基本假设假设1:教师薪金除题中所列因素之外不再考虑其他因素对教师薪金的影响假设2:工作时间对教师薪金影响是成线性分布的。假设3:其他因素对教师薪金的影响也是成线性的。假设4:女性是否结婚与其工作能力无关。假设5:该地区的人事部门对中学教师的薪金调查是可信的。三、符号说明符号意义单位备注Z月薪元工作时间月性别婚姻状况学历是否受雇于重点中学是
11、否受过培训从事教育年限回归系数随机误差四、问题分析本题要求我们分析教师薪金与他们的资历、性别、教育程度及培训情况等因素之间的关系。接到日常生活中的常识,教师薪金应该与他们的资历、受教育程度有密切关系,资历高、受 教育程度高其薪金也应该相应的要高,与其性别、婚姻状况应该没有必然的联系。为了说明 教师薪金与各个因素之间的关系以及女教师是否受到不公正的待遇,她们的婚姻状况是否影响其收入。我们建立统计回归模型,通过各组数据来说明它们之间的关系,并进一步分析论 证来确定影响教师薪金的因素。五、模型的建立与求解首先,我们把所有的相关变量都予以考虑,分别对 作散点图,分别得到 与各个变量之间的关系,在下面
12、的散点图中我们可以很清楚的看到,再根据题目的建议和运算的方便我们开始对薪金取自然对数进行计算.由此,我们初步地得出了一个基本的线性回归模型如下:x1的散点图然后我们用MATLA歌解此模型,直接在MATLA呻输入命令(见附录),我们可以得到结 果(如下图),我们可以得到P值参数参数估计值置信区间1.13111.0268 1.23530.00270.0023 0.0031-0.0229-0.1432 0.09740.0094-0.1005 0.11930.10890.0296 0.18820.0385-0.0670 0.14400.1817-0.0507 0.414200 02 R2=0.7889
13、F= 51.6934P=0六、结果分析由上表中R2 =0.7889可以知道薪金(z)的78.89%可由模型确定,由p = 0远小于0.05,模型从整体上看是成立的,但是还可以看到一个问题,也就是说有些变量的置信区间是包含0点的,因此我们可以知道x2,x3,x5,x6,x7对因变量(z)的影响是不太显着的.模型的改进;我们可以把它们剔除掉,保留x1和x4建立逐步线性回归方程,根据题目的建议,我们尝试 将它们的交互项和平方项加入其中,经过反复几次的尝试我们得到了相对较好的模型 ,得到 如下方程:用MATLA咪解上式模型:在MATLA呻运行>> x = ones(90,1), x1, x
14、4, x1. * x4, x1.A2 * x4, x4 A2 * x1;>> b, bint, r, rint, stats = regress(y, x)得到了 P值和置信区间如下:参数参数估计值置信区间6.90266.8557 6.94960.00430.0037 0.004910.17460.1073 0.2419-0.0001-0.0003 0.0001-0.0000-0.0000 -0.0000-0.0228-0.0371 -0.00852R2= 0.9008F=152.6081P=0在上述改进的模型中,通过数据我们可以看到R2明显地得到了提高,也就是说薪金z的90.08
15、&均可由模型确定.P远小于0.05,模型从整体上看是成立的 进行残差分析:在MATLA昨运行命令:>> rcoplot(r,rint)可以得到残差分析:Residual Case Order Plots ae0.10-0.1-0.2-0.3Case Number残差图在残差图中我们可以看到,除个别数据(在图中用红色表示)外,其他数据的残差离零点 均较近,且残差的置信区间都包含零点.这说明回归模型能较好地符合原始数据.而个别异常点可以去掉.七、模型的评价与推广优点 :1. 该模型将现实中的人事策略问题用简单的线性规划问题进行分析计算. 结构简单,计算方便,有利于对相似问题进行
16、求解和对模型进行扩充. 比如教学评估问题,公司员工薪金问题等模型求解.2. 根据已知的数据,从常识和经验进行分析,辅作散点图,决定取那几个回归变量及它们的函数形式.缺点:该模型在处理此问题时有假设与理想化的思想,与实际问题的求解还有一定的距离. 比如所求模型结果只达到了模型设想的90%左右.八、参考文献姜启源 谢金星 叶俊 数学模型(第三版)高等教育出版社九、附录stats =0.7895 43.9242 0.0000 0.0183> > xi;> > x2;> > x3;> > x4;> > x5;> > x6;>
17、 > x7;> > x=xi,x2,x3,x4,x5,x6,x7;> > stepwise(x,z)b,bint,r,rint,stats=regress(z,x);> > b,bint,r,rint,stats=regress(z,x)b =7.06250.00170.0029-0.00140.06910.01800.0795-0.0200bint =6.9976 7.12750.0014 0.0019-0.0807 0.0866-0.0866 0.08390.0206 0.1175-0.0513 0.0873-0.0659 0.2250-0.088
18、6 0.0487r =-0.1685-0.1649-0.17690.0350-0.1756-0.1590-0.1621-0.13540.0481-0.0180-0.1213-0.0390-0.1194-0.1134-0.1055-0.0143-0.1070-0.1235-0.1227-0.1147-0.0383-0.07940.0762-0.0779-0.01780.0946-0.0737-0.07080.12390.04870.0679-0.02870.0062-0.06000.03280.10080.02910.00400.01410.0749-0.09430.01740.31200.13
19、11 0.1891 0.0326-0.0157 0.1033 0.1297 0.1006 0.1769 0.2724 0.0561 0.0380-0.0276 0.1117 0.2133 0.1135 0.0902 0.2654 0.2917 0.1773 0.0638 0.0935 0.1628 0.0909 0.2458 0.0530 0.1302 0.0260 0.0305-0.0761 0.0500-0.0549-0.0426 0.0067-0.0558 -0.1822 -0.0015 -0.1031 -0.1862 -0.0896 -0.0218 -0.0105 -0.0380 -0
20、.1896 -0.0662 -0.0206 -0.1932-0.4748rint =-0.4285 0.0915-0.4228 0.0931-0.4346 0.0809-0.2256 0.2956-0.4246 0.0734-0.4195 0.1016-0.4207 0.0964-0.3969 0.1260-0.2127 0.3090-0.2772 0.2413-0.3624 0.1197-0.2994 0.2214-0.3813 0.1425-0.3736 0.1468-0.3677 0.1568-0.2758 0.2472-0.3674 0.1533-0.3828 0.1358-0.382
21、8 0.1374-0.3751 0.1457-0.2656 0.1890-0.3406 0.1817-0.1842 0.3366-0.3408 0.1850-0.2748 0.2393-0.1657 0.3548-0.3355 0.1880-0.3239 0.1823-0.1351 0.3830-0.2137 0.3110-0.1922 0.3281-0.2914 0.2341-0.2561 0.2686-0.3210 0.2010-0.2186 0.2842-0.1620 0.3637-0.2336 0.2918-0.2593 0.2672-0.2459 0.2740-0.1767 0.32
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 石棉在建筑物中的应用考核试卷
- 2020-2024年高考地理专项分类汇编:人口的变化(含答案)
- 化学矿产业与智慧城市的协同发展考核试卷
- 日用化学产品的生命周期管理考核试卷
- DB11T 494.5-2013 人力资源服务规范 第5部分:高级人才寻访
- 医学模板课件教学课件
- k的课件教学课件
- 摇号课件教学课件
- 淮阴工学院《计算机辅助翻译》2022-2023学年期末试卷
- 淮阴工学院《工业自动化网络》2023-2024学年期末试卷
- 市民中心信息系统运营维护方案
- 职业卫生检测考试题库(400题)
- 硫系玻璃和红外玻璃的区别
- 画法几何及水利土建制图习题答案
- 《合并同类项》赛课一等奖教学课件
- RITTAL威图空调中文说明书
- 12富起来到强起来 第一课时教案 道德与法治
- 生物质能发电技术应用中存在的问题及优化方案
- 下颌磨牙髓腔解剖及开髓
- 2021年上半年《系统集成项目管理工程师》真题
- GB/T 706-2008热轧型钢
评论
0/150
提交评论