![第7章 5逻辑回归分析讲义_第1页](http://file4.renrendoc.com/view3/M00/2E/1E/wKhkFmYroHGAJJRfAAJk8iSGRHY100.jpg)
![第7章 5逻辑回归分析讲义_第2页](http://file4.renrendoc.com/view3/M00/2E/1E/wKhkFmYroHGAJJRfAAJk8iSGRHY1002.jpg)
![第7章 5逻辑回归分析讲义_第3页](http://file4.renrendoc.com/view3/M00/2E/1E/wKhkFmYroHGAJJRfAAJk8iSGRHY1003.jpg)
![第7章 5逻辑回归分析讲义_第4页](http://file4.renrendoc.com/view3/M00/2E/1E/wKhkFmYroHGAJJRfAAJk8iSGRHY1004.jpg)
![第7章 5逻辑回归分析讲义_第5页](http://file4.renrendoc.com/view3/M00/2E/1E/wKhkFmYroHGAJJRfAAJk8iSGRHY1005.jpg)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第第页第7章5逻辑回归分析讲义
7.5规律回来分析
统计学上的定义和计算公式
定义:规律回来分析是对定性变量的回来分析。
现实中的许多现象可以划分为两种可能,或者归结为两种状态,这两种状态分别用0和1表示。买汽车回受到家庭、收入等因素的影响,但最终的结果只能是两个:买或不买。假如我们采纳多个因素对0-1表示的某种现象进行因果关系说明,就可能应用到logistic回来。例如,想探讨胃癌发生的危急因素,可以选择两组人群,一组是胃癌组,一组是非胃癌组,两组人群确定有不同的体征和生活方式等。这里的因变量就是是否胃癌,即“是”或“否”,为两分类变量,自变量就可以包括许多了,例如年龄、性别、饮食习惯等。自变量既可以是连续的,也可以是分类的。通过logistic回来分析,就可以大致了解究竟哪些因素是胃癌的危急因素。
可用于处理定性因变量的统计分析方法有:判别分析〔Discriminantanalysis〕、Probit分析、Logistic回来分析和对数线性模型等。在社会科学中,应用最多的是Logistic回来分析。Logistic回来分析依据因变量取值类别不同,又可以分为BinaryLogistic回来分析和Multi-nominalLogistic回来分析。
BinaryLogistic回来模型中因变量只能取两个值1和0〔虚拟因变量〕,而MultinomialLogistic回来模型中因变量可以取多个值。本节将只争论BinaryLogistic回来,并简称Logistic回来〔与7.5节曲线估量中介绍的Logistic曲线模型相区分〕。Logistic函数的形式为
实例操作
在一次关于某城镇居民上下班运用交通工具的社会调查中,因变量y=1表示居民主要乘坐公共汽车上下班;y=0表示主要骑自行车上下班;自变量*1表示被调查者的年龄;*2表示被调查者的月收入;*3表示被调查者的性别〔*3=1为男性,*3=0为女性〕。
试建立y与自变量间的Logistic回来,数据如表所示。数据“上下班交通调查表.sav”表:运用交通工具上下班状况
〔22.0版本〕
Step1
〔22.0版本〕
Step2
〔22.0版本〕
Step3
〔22.0版本〕
结果分析:
〔1〕第一部分输出结果有两个表格,第一个表格说明全部个案〔10个〕都被选入作为回来分析的个案。
个案处理
〔4〕ClassificationTable分类表说明第一次迭代结果的拟合效果,从该表格可以看出对于y=0,有100%的精确性;对于y=1,有0%精确性,因此对于全部个案总共有70%的精确性。
VariablesintheEquation表格列出了Step1中各个变量对应的系数,以及该变量对应的Wald统计量值和它对应的相伴概率。从该表格中可以看出*3相伴概率最小,Wald统计量最大,可见该变量在模型中很重要。
方程式中没有的变量
a
步骤0
变量
*1*2*3
得分8.423.601.476
自由度
111
显著性
.004.438.490
a.由于冗余,未计算残差卡方。
〔22.0版本〕
〔5〕OmnibusTestsofModelCoefficients表格列出了模型系数的OmnibusTests结果。
模型系数的Omnibus检验
步骤1
步长(T)块模型
卡方12.21712.21712.217
自由度
333
显著性
.007.007.007
〔22.0版本〕
〔6〕ModelSummary表给出了-2对数似然值、Co*和Snell的R2以及Nagelkerke的R2检验统计结果。
模型
Hosmer和Lemeshow检验的列联表
上下班方式=主要乘坐公共汽车上
上下班方式=主要骑自行车上下班
下班
观测值
000000012
期望值(E)
.000.000.000.000.000.000.0001.0002.000
总计
111111112
步骤1
123456789
观测值
111111100
期望值(E)
1.0001.0001.0001.0001.0001.0001.000.000.000
〔22.0版本〕
〔8〕规律回来的最末一个输出表格是CasewiseList,列出残差大于2的个案,由下表可知没有这样的个案。
个案列表a
a.由于找不到界外值,未生成casewise绘图。
〔22.0版本〕
7.5规律回来分析
统计学上的定义和计算公式
定义:规律回来分析是对定性变量的回来分析。
现实中的许多现象可以划分为两种可能,或者归结为两种状态,这两种状态分别用0和1表示。买汽车回受到家庭、收入等因素的影响,但最终的结果只能是两个:买或不买。假如我们采纳多个因素对0-1表示的某种现象进行因果关系说明,就可能应用到logistic回来。例如,想探讨胃癌发生的危急因素,可以选择两组人群,一组是胃癌组,一组是非胃癌组,两组人群确定有不同的体征和生活方式等。这里的因变量就是是否胃癌,即“是”或“否”,为两分类变量,自变量就可以包括许多了,例如年龄、性别、饮食习惯等。自变量既可以是连续的,也可以是分类的。通过logistic回来分析,就可以大致了解究竟哪些因素是胃癌的危急因素。
可用于处理定性因变量的统计分析方法有:判别分析〔Discriminantanalysis〕、Probit分析、Logistic回来分析和对数线性模型等。在社会科学中,应用最多的是Logistic回来分析。Logistic回来分析依据因变量取值类别不同,又可以分为BinaryLogistic回来分析和Multi-nominalLogistic回来分析。
BinaryLogistic回来模型中因变量只能取两个值1和0〔虚拟因变量〕,而MultinomialLogistic回来模型中因变量可以取多个值。本节将只争论BinaryLogistic回来,并简称Logistic回来〔与7.5节曲线估量中介绍的Logistic曲线模型相区分〕。Logistic函数的形式为
实例操作
在一次关于某城镇居民上下班运用交通工具的社会调查中,因变量y=1表示居民主要乘
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024-2025学年高中生物 第5章 生态系统及其稳定性 第1节 生态系统的结构说课稿 新人教版必修3
- DB37-T 4513-2022 城市地下综合管廊工程人民防空设计规范
- DB37-T 4431-2021 基于区块链的企业开办可信服务平台技术规范
- 个体双方出资合同范本
- 个人钢结构合同范本
- 单位厨房维修合同范本
- 保安公司用人合同范本
- 个人包工程合同范例
- 出租商铺房屋合同范本
- 写好房产合同范本
- 危险物品管理制度
- 门静脉炎护理课件
- 重庆八中2024届高三12月高考适应性月考卷(四) 语文试卷(含答案)
- 基础研究成果向临床转化的实践与挑战
- 建筑构造(下册)
- 电流互感器试验报告
- 蒋中一动态最优化基础
- 华中农业大学全日制专业学位研究生实践单位意见反馈表
- 付款申请英文模板
- 七年级英语阅读理解10篇(附答案解析)
- 抖音来客本地生活服务酒旅商家代运营策划方案
评论
0/150
提交评论