版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、7.5 逻辑回归分析 统计学上的定义和计算公式 定义:逻辑回归分析是对定性变量的回归分析。现实中的很多现象可以划分为两种可能,或者归结为两种状态,这两种状态分别用0和1 表示。买汽车回受到家庭、收入等因素的影响,但最终的结果只能是两个:买或不买。如果我们采用多个因素对01 表示的某种现象进行因果关系解释,就可能应用到logistic 回归。例如,想探讨胃癌发生的危险因素,可以选择两组人群,一组是胃癌组,一组是非胃癌组,两组人群肯定有不同的体征和生活方式等。这里的因变量就是是否胃癌,即“是”或“否”,为两分类变量,自变量就可以包括很多了,例如年龄、性别、饮食习惯等。自变量既可以是连续的,也可以是
2、分类的。通过logistic回归分析,就可以大致了解到底哪些因素是胃癌的危险因素。可用于处理定性因变量的统计分析方法有:判别分析(Discriminant analysis)、Probit分析、Logistic回归分析和对数线性模型等。在社会科学中,应用最多的是Logistic回归分析。Logistic回归分析根据因变量取值类别不同,又可以分为Binary Logistic回归分析和Multi-nominal Logistic回归分析。 Binary Logistic回归模型中因变量只能取两个值1和0(虚拟因变量),而Multinomial Logistic回归模型中因变量可以取多个值。本节将
3、只讨论Binary Logistic回归,并简称Logistic回归(与7.5节曲线估计中介绍的Logistic曲线模型相区别)。Logistic函数的形式为实例操作在一次关于某城镇居民上下班使用交通工具的社会调查中,因变量y =1表示居民主要乘坐公共汽车上下班;y=0表示主要骑自行车上下班;自变量x1表示被调查者的年龄;x2表示被调查者的月收入;x3表示被调查者的性别(x3=1为男性,x3=0为女性)。试建立y与自变量间的Logistic回归,数据如表所示。数据“上下班交通调查表.sav” 表:使用交通工具上下班情况(22.0版本)Step 1(22.0版本)Step 2(22.0版本)St
4、ep 3(22.0版本)结果分析:(1) 第一部分输出结果有两个表格,第一个表格说明所有个案(10个)都被选入作为回归分析的个案。个案处理摘要未加权的个案a数字百分比选定的个案已包括在分析中的个案10100.0缺少个案0.0总计10100.0未选定的个案0.0总计10100.0a. 如果权重有效,那么请参见分类表了解个案总数。(22.0版本)(2) 第二个表格说明初始的因变量值(0,1)已经转换为逻辑回归分析中常用的0、1数值。因变量编码原始值内部值主要骑自行车上下班0主要乘坐公共汽车上下班1(22.0版本)(3) 迭代过程迭代历史记录a,b,c迭代-2 对数似然系数常量步骤 0112.222
5、-.800212.217-.847312.217-.847a. 模型中包括常量。b. 初始 -2 对数似然:12.217c. 估算在迭代号 3 终止,因为参数估算更改小于 .001 。(22.0版本)(4) Classification Table分类表说明第一次迭代结果的拟合效果,从该表格可以看出对于y=0,有100%的准确性;对于y=1,有0%准确性,因此对于所有个案总共有70%的准确性。 分类表a,b观测值预测值上下班方式百分比正确主要骑自行车上下班主要乘坐公共汽车上下班步骤 0上下班方式主要骑自行车上下班70100.0主要乘坐公共汽车上下班30.0总体百分比70.0a. 模型中包括常量
6、。b. 分界值为 .500(22.0版本)Variables in the Equation表格列出了Step 1中各个变量对应的系数,以及该变量对应的Wald 统计量值和它对应的相伴概率。从该表格中可以看出x3相伴概率最小,Wald统计量最大,可见该变量在模型中很重要。方程式中的变量BS.E.Wald自由度显著性Exp(B)步骤 0常量-.847.6901.5081.220.429方程式中没有的变量a得分自由度显著性步骤 0变量x18.4231.004x2.6011.438x3.4761.490a. 由于冗余,未计算残差卡方。(22.0版本)(5) Omnibus Tests of Mode
7、l Coefficients表格列出了模型系数的Omnibus Tests结果。模型系数的 Omnibus 检验卡方自由度显著性步骤 1步长(T)12.2173.007块12.2173.007模型12.2173.007(22.0版本)(6) Model Summary表给出了-2 对数似然值、Cox和Snell的R2以及Nagelkerke的R2检验统计结果。模型摘要步长(T)-2 对数似然Cox & Snell R 平方Nagelkerke R 平方1.000a.7051.000a. 估算在迭代号 20 终止,因为检测到完美拟合。此解决方案并非唯一。(22.0版本)(7) Hosmer an
8、d Lemeshow Test表格以及Contingency Table for Hosmer and Lemeshow Test表格给出了Hosmer和Lemeshow的拟合优度检验统计量。Hosmer 和 Lemeshow 检验步长(T)卡方自由度显著性1.00071.000(22.0版本)Hosmer 和 Lemeshow 检验的列联表上下班方式 = 主要骑自行车上下班上下班方式 = 主要乘坐公共汽车上下班总计观测值期望值(E)观测值期望值(E)步骤 1111.0000.0001211.0000.0001311.0000.0001411.0000.0001511.0000.0001611.0000.0001711.0000.000180.0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 冠状动脉搭桥术后护理指南
- 003天花吊顶施工方案
- 抗震支架工程施工方案
- 工业自动化设备升级改造方案
- 2026广西玉林市北流市妇幼保健院招聘编外人员43人备考题库有完整答案详解
- 2026西藏技师学院锅炉兼综合维修工岗位补聘1人备考题库附参考答案详解(精练)
- 前列腺癌诊疗规范与指南更新解读
- 2026内蒙古通辽市科尔沁左翼后旗招聘政府专职消防员29人备考题库带答案详解(典型题)
- 2026河北邢台学院高层次人才引进55人备考题库带答案详解(夺分金卷)
- 2026江苏淮安市淮阴师范学院部分教师岗招聘4人备考题库附参考答案详解(综合题)
- 2025北京燃气集团校园招聘30人笔试历年典型考点题库附带答案详解试卷3套
- 急性阑尾炎课件教学
- 2025年江苏省企业人力资源管理师职业技能等级认定考试(专业能力)四级中级全真模拟试题及答案三
- 2024-2025学年浙江省宁波市第七中学教育集团八年级下学期期中语文试题
- 2025反诈知识竞赛考试题库及答案
- 建筑安全监督站培训课件
- 电力三种人安全培训课件
- 海南省海口市2024-2025学年七年级下学期期末考试生物试卷(含答案)
- 孕期产检的课件
- 企业人岗匹配度评估
- 2024年浙江省杭州市辅警协警笔试笔试测试卷(含答案)
评论
0/150
提交评论