




已阅读5页,还剩2页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Logistic回归分析申请者是否具有保研资格(华北科技学院 计算# # 指导教师:#)摘要:保送研究生也就是推免生,现在越来越多的学校拥有保送研究生的资格,一般来说成绩排名比较靠前都能获得保研资格,但学生的管理才能也影响着学生的发展。本文就利用学生大学四年的平均分数和学生管理才能测试分数作为主要指标,建立Logistic回归模型,判定其是否具有保研资格。关键词: 平均分数 管理才能测试分数 Logistic回归模型 保研资格Abstract: Walks is born from graduate push, now more and more school have walked the graduate students qualification, generally speaking scores ranking is in front can obtain the qualification of research, but the management of students can also affect the development of students. This paper USES the student university four years of average scores and management of students as the main index to test scores, establish Logistic regression model, to determine his whether it has the qualification of the inquiry.Keywords: Average scores 、 management to test scores 、 Logistic regression model 、 The inquiry qualification一 前言logistic回归的因变量可以是二分非线性差分方程类的,也可以是多分类的,但是二分类的更为常用,也更加容易解释。所以实际中最为常用的就是二分类的logistic回归。本文应用的就是二分类的logistic回归,分析申请者是否具有研究生报送资格与平均学分和学生管理才能测试分之间的关系。二 Logistic回归的理论Logistic回归主要分为:二分类和多分类两种。非条件Logistic回归,适用于成组设计、且因变量为二分类变量的资料;条件Logistic回归,适用于配对设计、且因变量为二分类变量的资料;多分类Logistic回归,适用于因变量为多分类变量的资料,分为有序和无序多分类设Y为2分类变量的反应变量,结果有两种:Y=1表示某事件发生;Y=0表示某事件不发生。x为自变量可以是连续变量或分类变量。 根据大量观察,反应变量阳性结果的概率P与自变量X的关系通常不是直线关系,而是曲线关系。此形式为概率预测模型,给定自变量的取值时,可估计概率。其中,P为概率;0为常数项;1、2、m为偏回归系数。Exp为指数函数。(曲线关系)三 数据来源与模型建立因变量y=1表示申请者具有研究生保送资格,y=0表示申请者不具有研究生报送资格。自变量x1表示平均分,x2表示学生管理才能测试分。建立Logistic回归模型。 表1 30个申请者具体情况 序号X1X2Y12.96596123.14473132.54466043.22482153.29527162.43425072.20474182.36531093.695051102.575421112.354060123.466931132.514120142.514580153.196631163.634471173.595881182.363990193.305631203.405531212.364820222.664200232.684140243.505721252.485330262.465091273.785911283.446921292.635040303.485281四 Logistic回归分析使用spss软件进行Logistic回归分析,Save选项中选择预测值概率和组关系,在Residuals中用未标准化残差,标准化残差;在Option选项中选Hosmer-Lemeshow goodness-of-fit以及Casewise listing of residuals和classification plots和all case 表2 案件处理过程总结Case Processing SummaryUnweighted CasesaNPercentSelected CasesIncluded in Analysis30100.0Missing Cases0.0Total30100.0Unselected Cases0.0Total30100.0a. If weight is in effect, see classification table for the total number of cases.表1得分析样本和样本缺失情况,此时表明缺失为零,样本都有效. 表3 因变量编码Dependent Variable EncodingOriginal ValueInternal Value0011表3说明对被解释变量(因变量)编码为内部值,二元因变量被编码为0和1,以方便计算 表4 综合的测试模型系数Omnibus Tests of Model CoefficientsChi-squaredfSig.Step 1Step25.3712.000Block25.3712.000Model25.3712.000 表5 模型总结Model SummaryStep-2 Log likelihoodCox & Snell R SquareNagelkerke R Square115.010a.571.772a. Estimation terminated at iteration number 7 because parameter estimates changed by less than .001.表4和表5是对整个模型的检验,表中结果表明模型非常显著. 表6 Hosmer和Lemeshow测试Hosmer and Lemeshow TestStepChi-squaredfSig.15.0568.752表6是Hosmer-Lemeshow检验,检验因变量实际值与预测值的分布是否有显著差异,结果表明不显著,也就是说实验中因变量实际值与预测值没有显著差异,模型拟合较好 表7 分类Classification TableaObservedPredictedYPercentage Correct01Step 1Y010283.3121688.9Overall Percentage86.7a. The cut value is .500表7是分类矩阵,说明对86.7%的观测判断了正确的组. 表8 变量方程Variables in the EquationBS.E.WalddfSig.Exp(B)Step 1aX14.5632.1954.3241.03895.880X2.028.0163.0181.0821.028Constant-25.90810.3146.3101.012.000a. Variable(s) entered on step 1: X1, X2.表8是模型的系数及检验,由表中结果可以得到下面的模型: p/(1-p)=e-25.908+4.563x1+0.028x2这里p表示申请者具有研究生报送资格概率的预测值。看到模型中,常数项变量x1,x2系数的Wald检验在0.1的显著的,而且x1,x2系数的指数值都大于1,说明x1,x2对因变量的影响都是正的。平均分数越高和学生管理才能测试分数越高,该申请者就越有可能具有研究生报送资格,而且平均分对申请者是否具有研究生报送资格的影响大于学生管理才能测试分数的影响。表9 Casewise列表Casewise ListCaseSelected StatusaObservedPredictedPredicted GroupTemporary VariableYResidZResid1S1 .9841.016.1272S1 .8221.178.4653S0 .1980-.198-.4974S1 .8951.105.3425S1 .9761.024.1566S0 .0460-.046-.2197S1*.0610.9393.9128S0 .3970-.397-.8119S1 .9931.007.08510S1 .7001.300.65511S0 .0190-.019-.14012S1 1.0001.000.01113S0 .0460-.046-.22014S0 .1470-.147-.41515S1 .9991.001.03016S1 .9551.045.21817S1 .9991.001.03418S0 .0170-.017-.13019S1 .9911.009.09320S1 .9931.007.08521S0 .1450-.145-.41122S0 .1070-.107-.34523S0 .1000-.100-.33324S1 .9971.003.05225S0*.5461-.546-1.09726S1*.3610.6391.33127S1 1.0001.000.02128S1 1.0001.000.01129S0*.5161-.516-1.03330S1 .9901.010.100a. S = Selected, U = Unselected cases, and * = Misclassified cases.根据上面得到的Logistic模型,可以计算出每个申请者具有研究生保送资格概率的预测值,期望值的百分比可以反映保送的资格。概率值按照0.5为分界点进行判别归类。Predicted Group表示预测的组。Temporary Variable反映残差的的情况。第7,25,26,29个观测出现了误判的情况,可以对这些观测进行更深入的诊断。我们看到由于许多样品的特殊性,导致了模型的误判情况。但是Logistic模型还可以样品的一些共性,这也是我们需要证实的。Logistic还可以用于预测,如果我们知道申请者平均学分和学生管理才能测试分数,我们就可以计算出该申请者具有被保送的概率,以及是否具有保送资格。 SPSS没有给出Logistic回归的标准化回归系数,对于Logistic回归,回归系数也没有普通的线性回归那样的解释,因而计算机标准化回归系数并不重要。五 结论分析平均分数越高和学生管理才能测试分数越高,该申请者就越有可能具有研究生报送资格,而且平均分对申请者是否具有研究生报送资格的影响大于学生管理才能测试分数的影响。所以大学生在大学里还是
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 三步计算式题(教学设计)-2024-2025学年四年级上册数学沪教版
- 人教版(2024)九年级全册Section B第四课时教案设计
- 2024四川泸州航空发展投资集团下属空港电力公司副总经理招聘1人笔试参考题库附带答案详解
- 二年级上册品德教学设计-《我会这样吃》 沪教版
- 二年级上册道德与法治教学设计-第5课 每逢佳节倍思亲 第2课时 粤教版
- 三年级体育上册 搞好环境卫生教学设计
- 班主任跟岗培训大纲
- 安装资料员培训
- 初中学校危化品安全培训
- 中考语文二轮专题写人要抓住特点 教学设计
- 第一章 整式的乘除 单元测试(含答案) 2024-2025学年北师大版数学七年级下册
- 上海市闵行区区管国企招聘笔试冲刺题2025
- 微阵列技术在肿瘤标志物研究-洞察分析
- 2024至2030年中国气力输送系统行业投资前景及策略咨询研究报告
- 《认知主义》课件
- 中国高血压防治指南(2024年修订版)
- 建筑工程三级安全教育内容(同名15503)
- 华尔街英语课件
- 2024年抗癌新药研发合作合同
- 2024-2030年版中国网吧行业市场运营模式及发展策略分析报告
- 临床医生个人职业规划
评论
0/150
提交评论