SPSS二元Logistic回归案例分析_第1页
SPSS二元Logistic回归案例分析_第2页
SPSS二元Logistic回归案例分析_第3页
SPSS二元Logistic回归案例分析_第4页
SPSS二元Logistic回归案例分析_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

二元 Logistic 回归案例分析二元 Logistic,从字面上其实就可以理解大概是什么意思,Logistic 中文意思为“逻辑”但是这里,并不是逻辑的意思,而是通过 logit 变换来命名的,二元一般指“两种可能性”就好比逻辑中的“是”或者“ 否”一样,Logistic 回归模型的假设检验常用的检验方法有似然比检验( likelihood ratio test) 和 Wald 检验)似然比检验的具体步骤如下:1:先拟合不包含待检验因素的 Logistic 模型,求对数似然函数值 INL0 2:再拟合包含待检验因素的 Logistic 模型,求新的对数似然函数值 InL13: 最后比较两个对数似然函数值的差异,若两个模型分别包含 l 个自变量和 P 个自变量,记似然比统计量 G 的计算公式为 G=2(InLP - InLl). 在零假设成立的条件下,当样本含量 n较大时,G 统计量近似服从自由度为 V = P-l 的 x 平方分布,如果只是对一个回归系数(或一个自变量)进行检验,则 v=1.wald 检验,用 u 检验或者 X 平方检验,推断各参数 j 是否为 0,其中 u= bj / Sbj, X 的平方=(bj / Sbj), Sbj 为回归系数的标准误这里的“二元”主要针对“ 因变量”所以跟“曲线估计” 里面的 Logistic 曲线模型不一样,二元logistic 回归是指因变量为二分类变量是的回归分 析,对于这种回归模型,目标概率的取值会在(0-1),但是回归方程的因变量取值却落在实数集当中,这个是不能够接受的,所以,可以先将目标概率做 Logit 变换,这样它的取值区间变成了整个实数集,再做回归分析就不会有问题了,采用这种处理方法的回归分析,就是 Logistic 回归设因变量为 y, 其中“1” 代表事件发生, “0”代表事件未发生,影响 y 的 n 个自变量分别为 x1, x2 ,x3 xn 等等记事件发生的条件概率为 P那么 P= 事件未发生的概理为 1-P事件发生跟”未发生的概率比 为( p / 1-p ) 事件发生比,记住 Odds将 Odds 做对数转换,即可得到 Logistic 回归模型的线性模型:还是以教程“blankloan.sav“数据为例,研究银行客户贷款是否违约(拖欠)的问题,数据如下所示:上面的数据是大约 700 个申请贷款的客户,我们需要进行随机抽样,来进行二元 Logistic回归分析,上图中的“0”表示没有拖欠贷款, “1”表示拖欠贷款,接下来,步骤如下:1:设置随机抽样的随机种子,如下图所示:选择“设置起点”选择“ 固定值” 即可,本人感觉 200 万的容量已经足够了,就采用的默认值,点击确定,返回原界面、2:进行“转换”计算变量“生成一个变量(validate),进入如下界面:在数字表达式中,输入公式:rv.bernoulli(0.7 ),这个表达式的意思为:返回概率为 0.7的 bernoulli 分布随机值如果在 0.7 的概率下能够成功,那么就为 1,失败的话,就为“0“为了保持数据分析的有效性,对于样本中“违约” 变量取缺失值的部分,validate 变量也取缺失值,所以,需要设置一个“选择条件”点击“如果” 按钮,进入如下界面:如果“违约” 变量中,确实存在缺失值,那么当使用“missing”函数的时候,它的返回值应该为“1”或者 为“true“, 为了剔除 ”缺失值“所以,结果必须等于“0“ 也就是不存在缺失值的现象 点击 ”继续“ 按钮,返回原界面,如下所示:将是“是否曾经违约”作为“ 因变量”拖入因变量选框,分别将其他 8 个变量拖入“ 协变量”选框内, 在方法中,选择:forward.LR 方法将生成的新变量“validate“ 拖入“选择变量“框内,并点击”规则“ 设置相应的规则内容,如下所示:设置 validate 值为 1,此处我们只将取值为 1 的记录纳入模型建立过程,其它值(例如:0)将用来做结论的验证或者预测分析,当然你可以反推,采用 0 作为取值记录点击继续,返回,再点击“分类 ”按钮,进入如下页面在所有的 8 个自变量中,只有“ 教育水平”这个变量能够作为 “分类协变量” 因为其它变量都没有做分类,本例中,教育水平分为:初中,高中,大专,本科,研究生等等, 参考类别选择:“最后一个” 在对比中选择“ 指示符” 点击继续按钮,返回再点击“保存”按钮,进入界面:在“预测值“ 中选择”概率, 在“ 影响”中选择“Cook 距离” 在“残差”中选择“学生化”点击继续,返回,再点击“选项 ”按钮,进入如下界面:点击继续,再点击确定,可以得出分析结果了分析结果如下:1: 在“案例处理汇总”中可以看出:选定的案例 489 个,未选定的案例 361 个,这个结果是根据设定的 validate = 1 得到的,在 “因变量编码”中可以看出“违约” 的两种结果“是”或者“否” 分别用值“1“和“0”代替, 在“分类变量编码” 中教育水平分为 5 类, 如果选中“为完成高中,高中,大专,大学等,其中的任何一个,那么就取值为 1,未选中的为 0,如果四个都未被选中,那么就是”研究生 “ 频率分别代表了处在某个教育水平的个数,总和应该为 489 个1:在“分类表 ”中可以看出: 预测有 360 个是“否” (未违约) 有 129 个是“ 是”(违约)2:在“方程中的变量”表中可以看出:最初是对“常数项” 记性赋值,B 为-1.026, 标准误差为:0.103那么 wald =( B/S.E)=(-1.026/0.103) = 99.2248, 跟表中的“100.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论