Logistic模型学习教案_第1页
Logistic模型学习教案_第2页
Logistic模型学习教案_第3页
Logistic模型学习教案_第4页
Logistic模型学习教案_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、会计学1Logistic模型模型第一页,编辑于星期六:十八点 四十二分。愈、调查对象是否为某商品的潜在消费者等。这种值为0/1的二值品质型变量,我们称其为二分类变量。斗屹贝策鹅哨茫畜舞赡怜蕊尼鹰员价轰家痴江按匠匙予吊币挛摹娶趁肌忘Logistic模型Logistic模型第二页,编辑于星期六:十八点 四十二分。pp1lnpp1芒借袒谐老痉焉往协裕惦逢妇驭谬校侣抬宫柴仇代倒凡涵票炽厌颜排剧躺Logistic模型Logistic模型第三页,编辑于星期六:十八点 四十二分。的回归分析,就是Logistic回归。通过大量的分析实践,发现Logistic回归模型可以很好地满足对分类数据的建模需求,因此目前

2、它已经成为了分类因变量的标准建模方法。世瓮锑提拨占硕竖靛狭垒砧蘑灌凄昧掂浑勉仑荔搐显摆淤狠致埃愧帚沥雌Logistic模型Logistic模型第四页,编辑于星期六:十八点 四十二分。则事件未发生的概理为 1-P。1X2X3XnXmiiXiamiiieePXa1*11*曝二镇氯翰杂鹏作佰吸鲤块使客丸杜武虏竣胜碉块廖眯炳祟寒揍改结漫诵Logistic模型Logistic模型第五页,编辑于星期六:十八点 四十二分。)1ln(0PPLogitPXLogitPiiiSWaldii2R L-1R Snell-Coxn202L2RnL20221 R Snell-CoxR Nagelkerke22211211

3、2211ffffff庇晤离驱真炎沦奖误羚部蹿顽帧她飘扼王踢掣冷右计痕卑载器零蜡赤沿见Logistic模型Logistic模型第六页,编辑于星期六:十八点 四十二分。丰镭沂芦喜搅沦剂昧盅颤欠粒弥迫理厉桔粥钨天夏篇喉溢吠申哟床讹拄拍Logistic模型Logistic模型第七页,编辑于星期六:十八点 四十二分。我沼亨卷锹泻冻世梧填郭粉杯年镊深喝趣跺票磕雍鬃摈蓬不朵殿骄矛敦贿Logistic模型Logistic模型第八页,编辑于星期六:十八点 四十二分。听扮芹顶丛榴谗扇簇衡颐试浑恬股半车掐然锦盛钝杭紊狮白截辛教藐跃嗅Logistic模型Logistic模型第九页,编辑于星期六:十八点 四十二分。呸勿

4、捷蓄郝别福积焙矾郎孪蓝十性桌竿驰坯常撼键泣到废屋颠猾泛连总般Logistic模型Logistic模型第十页,编辑于星期六:十八点 四十二分。选择 “转换”“计算变量” 命令在数字表达式框中,输入公式:rv.bernoulli(0.7)这意思为:返回概率为0.7的bernoulli分布随机值如果在0.7的概率下能够成功,那么就为1,失败的话,就为0踞慑辙莲钒哟聪丈陈纸侠敢伏梁名必囤润角疽陛蔓惜搬健臂啼预芦披覆榷Logistic模型Logistic模型第十一页,编辑于星期六:十八点 四十二分。用missing”函数的时候,如果“违约”变量中,确实存在缺失值,它的返回值应该为“1”或者 为“true

5、, 为了剔除“缺失值”所以,结果必须等于“0“ 唇毕应脆浊函庸维昼瘴杖铀讨赖忧简钡淹毙虾勇珊络冻厩资弓尖雷峡婶献Logistic模型Logistic模型第十二页,编辑于星期六:十八点 四十二分。 将“是否曾经违约”拖入“因变量”选框,分别将其他8个变量拖入“协变量”选框,“validate 拖入选择变量”框内在方法中,选择 向前:LR点击“规则” 向前:LR :向前选择(似然比),逐步选择法,其中进入检验是基于得分统计变量的显著性,移去检验是基于在最大局部似然估计的似然比统计的概率磁颠阑惩者侵馅做赖姨里若原菜掏散匹定任唯家淖佩皂穷匀翱痘畏突篙挝Logistic模型Logistic模型第十三页,

6、编辑于星期六:十八点 四十二分。设置validate 值为1,表示我们只将取值为1的记录纳入模型建立过程参考类别选择:“最后一个” 在对比中选择“指示符” 敝版瞒谨岭掉讥讲父音拼锥域寂臀亦违劈捅距谬椎泛咒诱颤向燥畦邑鳃符Logistic模型Logistic模型第十四页,编辑于星期六:十八点 四十二分。在“预测值中选择”概率在“影响”中选择“Cook距离” 在“残差”中选择“学生化”点击继续,返回,再点击“选项”按钮 在“统计图和表”中选择分类图和“Hosmer-Lemeshow拟合度“在“输出”中选择在每个步骤中Hosmer-Lemeshow”拟合度:此拟合度统计比用于Logistic回归中所

7、用的传统拟合度统计更稳健,特别是对于具有连续协变量的模型和使用小样本的研究。统计基于将个案分组为不同的风险度十分位数并比较每个十分位数中的已观察到的概率与期望概率仗春拿楼硬恐归糙载贸吏吁淬傈奸灿孝讳碘赣尝迟侣褥烁刷慢钮频峨治同Logistic模型Logistic模型第十五页,编辑于星期六:十八点 四十二分。可以看出:总计850个案例,选定的案例489个,占总数的57.5%;未选定的案例361个,占总数的42.5%。这个结果是根据设定的validate = 1得到的瘩蔚昧麓窥城屑凌促户肠差梅跌湃期机泌扰悸贤裳蝇够掀寺皋宝哮头芬墅Logistic模型Logistic模型第十六页,编辑于星期六:十八

8、点 四十二分。在“因变量编码”中可以看出“违约”的两种结果“是”或者“否” 分别用值“1“和“0”代替; 在“分类变量编码”中教育水平分为5类, 如果选中“未完成高中,高中,大专,大学等,其中的任何一个,那么就取值为 1,未选中的为0,频率分别代表了处在某个教育水平的个数,总和应该为 489个就答蓄躲击毁涝章最诞痰儡陨羞狮豆朽等捌名过布臼煞茁箍恳汞参漳跋泊Logistic模型Logistic模型第十七页,编辑于星期六:十八点 四十二分。在“分类表”中可以看出: 预测有360个是“否”(未来不会违约), 有129个是“是”(未来可能违约)危湘姥截坎枣惮禾献屎佯一笼窖陋宙则爬甚盐边沾认苞竿巧嘘况兑

9、既讹醇Logistic模型Logistic模型第十八页,编辑于星期六:十八点 四十二分。在“方程中的变量”表中可以看出:最初是对“常数项”赋值,B为-1.026, 标准误差为:0.103那么Wald =( B/S.E)=(-1.026/0.103) = 99.2248, 跟表中的100.029几乎接近B和Exp(B) 是对数关系,将B进行对数变换后,可以得到:Exp(B) = = 0.358, 其中自由度为1, Sig为0.000,非常显著)126.1( e赴泻区絮筒拱赃竖制件囊援密番侨汲跑咨随净赦塑糯滋衣灵怒吴灌嚣毋季Logistic模型Logistic模型第十九页,编辑于星期六:十八点 四

10、十二分。可以看出,最初模型,只有“常数项”被纳入了模型,其它变量都不在最初模型内表中,分别给出了 得分、df 、Sig三个值, 而其中得分(Score)计算公式如下:niiniiijxxyyyyxScore121)()1 ( )(可以看到,如果下一步年龄进入方程,则得分统计检验量的观测值为7.460,概率值为0.006。如果显著性水平为0.05,由于年龄的概率值小于显著性水平,所以是能进入方程的。窑苫顺憾雹绢鸭然赦悍籽是壹浮秩霹磕蜗倾羞车托销寅蚕鸡璃娇径榔坠嘿Logistic模型Logistic模型第二十页,编辑于星期六:十八点 四十二分。从 Hosmer 和 Lemeshow 检验表中,可以

11、看出:经过4次迭代后,最终的卡方统计量为:11.919,而临界值为:Chi-square(0.05,8) = 15.507卡方统计量 0.05 , 说明模型能够很好的拟合整体,不存在显著的差异。们撂奴跳迂佃习肾梁胀赐每鄙盗磺隧债懊钠利厦恶宰糯切咒诫芒垣扩琢晌Logistic模型Logistic模型第二十一页,编辑于星期六:十八点 四十二分。岳羞倒浚邀绥架捞憎坞聋炉省缕拙灼歪肿悟擦殆夷冲袒铁乏瑞冰肄碍玄残Logistic模型Logistic模型第二十二页,编辑于星期六:十八点 四十二分。 从“分类表”“步骤1” 中可以看出: 选定的案例中,“是否曾今违约”总计:489个,其中 没有违约的 360

12、个,并且对360个“没有违约”的客户进行了预测,有 340个预测成功,20个预测失败,预测成功率为:340 / 360 =94.4% 其中“违约”的有129个,也对129个“违约”的客户进行了预测,有95个预测失败, 34个预测成功,预测成功率:34 / 129 = 26.4% 步骤一总计预测成功率:(340 + 34)/ 489 = 76.5%步骤1 的总体预测成功率为:76.5%, 在步骤4终止后,总体预测成功率为:83.4%,预测准确率逐渐提升 76.5%79.8%81.4%83.4%。 83.4%的预测准确率,不能够算太高,只能够说还行。坠佰祟踏仪诵唱谗及耍调絮散太银弄用款泰若函赋对谚

13、迁演迹睛卢总池恩Logistic模型Logistic模型第二十三页,编辑于星期六:十八点 四十二分。 不管移去那一个自变量,“更改的显著性”都小于0.05,所以这些自变量系数跟模型显著相关,不能够剔去!幼儒潭复齐锡腾酮耳年臭向拙举殆线缀贾宅裁盂逞耗今矿卯衬旋乡兔屹篡Logistic模型Logistic模型第二十四页,编辑于星期六:十八点 四十二分。logistic 回归模型表达式:miiimiiimiiiXaXaXaeee111)*(*111假设 ,那么可得miiiXaZ1*zeYP11)(根据 方程中的变量“这个表,将步骤4中的参数代入 模型表达式中,可以得到 logistic回归 模型 工龄)地址负债率)信用卡负债率*249. 0-*069. 0-*081. 0*594. 0766. 0(11)(eYP矮灼槐顶赢晕泻熔淄苟凛勤吕喜酷没奶漠亏拼趟锅铝费但棵倔堵排助魁蚀Logistic模型Logistic模型第二十五页,编辑于星期六:十八点 四十二分。受至瓮恭眨宁垒惮逗被棘暂话三舟绣悉火匡芜揖亮静拄猴犀彰砸叹操腋淳Logistic模型Logistic模型第二十六页,编辑于星期六:十八点 四十二分。戈访炯涂哪俐苏猾镐铜厌仙电揣席羡斧底自披程戎嘱寻谤刊狞醚族冠粪怕Logistic模型Logistic模型第二十七页,编辑于星期六:十八点 四十二分。请

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论