




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
定性数据的建模列联表及列联表分析
Logistic回归基本理论和方法
Logistic回归步骤以及SPSS实现
1
2
3定性数据的建模列联表及列联表分析Logistic回归基本理1列联表及列联表分析研究两个属性变量之间是否有联系研究步骤:通过问卷调查或统计资料获得属性变量的信息
整理问卷或统计资料获得列联表数据通过统计假设检验两个属性变量是否具有独立性列联表及列联表分析研究两个属性变量之间是否有联系2女性人口学研究教育婚姻合计合计大学大学以下结婚一次结婚多次5506168114461182512312051436女性人口学研究教育婚姻合计合计大学大学以下结婚一次结婚多次53频数列联表AB合计合计频数列联表AB合计合计4事件发生的概率A事件与同时发生的概率频率列联表B合计合计事件发生的概率事件发生的概率A事件与同时发生5统计假设与检验零假设:属性变量A与B相互独立检验统计量及其分布:n足够大
~
决策规则:对给定的显著性水平,若
则拒绝零假设.统计假设与检验零假设:属性变量A与B相互独立6检验统计量的计算检验统计量的计算7零假设:婚姻状态与教育水平没有关系检验统计量及其分布:n足够大
决策规则:对给定的显著性水平0.05
则拒绝零假设,即婚姻状态与教育水平有关联.零假设:婚姻状态与教育水平没有关系8SPSS实现数据结构属性变量1属性变量2SPSS实现数据结构属性变量1属性变量29逻辑斯蒂回归课件10逻辑斯蒂回归课件11SPSS中的数据输入频数A水平B水平123123111222SPSS中的数据输入频数A水平B水平12312311122212逻辑斯蒂回归课件13逻辑斯蒂回归课件14逻辑斯蒂回归课件15逻辑斯蒂回归课件16逻辑斯蒂回归课件17拒绝独立假设,即婚姻与教育程度有关。拒绝独立假设,即婚姻与教育程度有关。18
Logistic回归基本理论和方法研究某一事件发生的概率P=P(y=1)与若干因素之间的关系在0和1之间任意范围之间的数量若干个状态的标量Logistic回归基本理论和方法研究某一事件发生的概率P19logistic变换logistic变换Logistic回归模型
优势比logistic变换logistic变换优势比20概率p的预测P与多因素之间的关系预测概率p的预测P与多因素之间的关系预测21P与单因素之间的关系图px1最可能成功范围最不可能成功范围P与单因素之间的关系图px1最可能成功范围最不可能成功范围22回归系数的含义优势比(OddsRatio)—事件发生与不发生的概率比优势比与单变量系数之间的关系
回归系数的含义优势比(OddsRatio)—事件发生与不发23Logistic回归系数的估计(分组数据)n组观测数据结构:序号x参加调查总数事件出现次数事件出现频率Logistic变换12niLogistic回归系数的估计(分组数据)n组观测数据结构:24拟合模型
其中近似服从权(weight)回归模型具有异方差性拟合模型权(weight)回归模型具有异方差性25转换成经典回归模型(加权最小二乘)
其中近似服从转换成经典回归模型(加权最小二乘)其中近似服从26例题
在一次住房展销会上,与房地产商签订初步购房意向书的共有n=325名顾客.在随后的三个月里,只有一部分顾客确实购买了房屋.以顾客的年家庭收入x(万元)为自变量,建立Logistic回归模型.例题在一次住房展销会上,与房地产商签订初步购房意向书的27逻辑斯蒂回归课件28逻辑斯蒂回归课件29点击点击30利用上式可以对购房比例进行预测,如利用上式可以对购房比例进行预测,如31Logistic回归系数的估计(未分组数据)n组观测数据:~与的关系
Logistic回归系数的估计(未分组数据)n组观测数据:32参数的极大似然估计
的分布函数的似然函数未分组数据结构参数的极大似然估计的分布函数未分组数据结构33似然函数的对数表达利用迭代法求解似然函数对数的最大值点就是参数的极大似然估计,记为:似然函数的对数表达34拟合的优良性
回归模型的优良性拟合优度回归系数的显著性-2log(L)Wald=goodness-of-fitstatistics拟合的优良性回归模型的优良性拟合优度回归系数的显著性-235Hosmer-LemeshowTest零假设:因变量实际分布与预测的分布无差异决策准则:拒绝零假设模型不显著Hosmer-LemeshowTest零假设:36Logistic回归步骤以及SPSS实现
Logistic回归步骤以及SPSS实现37逻辑斯蒂回归课件38不显著,去掉最不显著的月收入变量,重新估计不显著,去掉最不显著的月收入变量,重新估计39逻辑斯蒂回归课件40结论:女性乘公交车比例高于男性,年龄越大,乘车的比例越高。结论:女性乘公交车比例高于男性,年龄越大,乘车的比例越高。41科研教案
庞素林.Logistic回归模型在信用风险中的应用.数学的实践与认识.2006,36(9):129~137科研教案庞素林.Logistic回归模型在信用风险中42判别模型建立的基本步骤样本分组将样本分成训练样本组和测试样本组建模过程利用训练样本建立分类模型评价过程利用测试样本评价模型的精度第二步第三步第一步判别模型建立的基本步骤样本分组将样本分成训练样本组和测试样本43摘要通过运行SPSS,建立Logistic回归信用评价模型(creditevaluationmodel),用来对中国2000年106家上市公司进行两类模式分类,这两类模式是指按照公司的经营状况分为“差”和“正常”两个小组.对每一家上市公司,考虑其经营状况的4个主要财务指标:每股收益、每股净资产、净资产收益率和每股现金流量.摘要通过运行SPSS,建立Logist44
仿真结果表明,Logistic回归信用评价模型对总体106个样本,判别准确率达到99.06%.此外,本文的研究结果还发现,当利用SPSS的Discriminant给出的模型系数建立的线性判别分析模型和利用SPSS的Multinomial
Logistic给出的模型参数建立的Logistic回归模型,Logistic回归模型的判别结果不如线性判别模型.但如果剔除不合格的样本,或是将样本数据规格化,则可以提高Logistic回归模型的分类准确率.仿真结果表明,Logistic回归信用评价模型对总体45引言中提及的一些研究结果Martin(1977)用Logistic模型预测公司破产及违约的概率Ohlson(1980)将Logistic模型应用于信用风险分析Madalla(1983)采用Logistic模型区别违约与非违约贷款申请人引言中提及的一些研究结果Martin(1977)用Logis46DavidWest(2000)利用5种神经网络和5种统计分类模型(线性判别分析、Logistic回归分析、K最近邻法、核密度分类法、分类树法)分别对德国和澳大利亚两组财务数据进行两类模式分类,研究结果表明:Logistic模型的判别准确率最高,分别为76.3%和87.25%.DavidWest(2000)利用5种神经网络和5种统计分47一个一般结论数据满足正态分布Logistic回归模型与判别分析模型具有相同的判别准确率
yesNoLogistic回归模型的判别准确率高于判别分析模型的判别准确率一个一般结论数据满足正态分布Logistic回归模型与判别48本研究结论当Logistic回归模型和判别分析模型都通过运行SPSS软件来估计模型参数并建立相应模型时,线性判别分析模型优于Logistic回归模型.本研究结论当Logistic回归模型和判别分析模型都通过运49定性数据的建模列联表及列联表分析
Logistic回归基本理论和方法
Logistic回归步骤以及SPSS实现
1
2
3定性数据的建模列联表及列联表分析Logistic回归基本理50列联表及列联表分析研究两个属性变量之间是否有联系研究步骤:通过问卷调查或统计资料获得属性变量的信息
整理问卷或统计资料获得列联表数据通过统计假设检验两个属性变量是否具有独立性列联表及列联表分析研究两个属性变量之间是否有联系51女性人口学研究教育婚姻合计合计大学大学以下结婚一次结婚多次5506168114461182512312051436女性人口学研究教育婚姻合计合计大学大学以下结婚一次结婚多次552频数列联表AB合计合计频数列联表AB合计合计53事件发生的概率A事件与同时发生的概率频率列联表B合计合计事件发生的概率事件发生的概率A事件与同时发生54统计假设与检验零假设:属性变量A与B相互独立检验统计量及其分布:n足够大
~
决策规则:对给定的显著性水平,若
则拒绝零假设.统计假设与检验零假设:属性变量A与B相互独立55检验统计量的计算检验统计量的计算56零假设:婚姻状态与教育水平没有关系检验统计量及其分布:n足够大
决策规则:对给定的显著性水平0.05
则拒绝零假设,即婚姻状态与教育水平有关联.零假设:婚姻状态与教育水平没有关系57SPSS实现数据结构属性变量1属性变量2SPSS实现数据结构属性变量1属性变量258逻辑斯蒂回归课件59逻辑斯蒂回归课件60SPSS中的数据输入频数A水平B水平123123111222SPSS中的数据输入频数A水平B水平12312311122261逻辑斯蒂回归课件62逻辑斯蒂回归课件63逻辑斯蒂回归课件64逻辑斯蒂回归课件65逻辑斯蒂回归课件66拒绝独立假设,即婚姻与教育程度有关。拒绝独立假设,即婚姻与教育程度有关。67
Logistic回归基本理论和方法研究某一事件发生的概率P=P(y=1)与若干因素之间的关系在0和1之间任意范围之间的数量若干个状态的标量Logistic回归基本理论和方法研究某一事件发生的概率P68logistic变换logistic变换Logistic回归模型
优势比logistic变换logistic变换优势比69概率p的预测P与多因素之间的关系预测概率p的预测P与多因素之间的关系预测70P与单因素之间的关系图px1最可能成功范围最不可能成功范围P与单因素之间的关系图px1最可能成功范围最不可能成功范围71回归系数的含义优势比(OddsRatio)—事件发生与不发生的概率比优势比与单变量系数之间的关系
回归系数的含义优势比(OddsRatio)—事件发生与不发72Logistic回归系数的估计(分组数据)n组观测数据结构:序号x参加调查总数事件出现次数事件出现频率Logistic变换12niLogistic回归系数的估计(分组数据)n组观测数据结构:73拟合模型
其中近似服从权(weight)回归模型具有异方差性拟合模型权(weight)回归模型具有异方差性74转换成经典回归模型(加权最小二乘)
其中近似服从转换成经典回归模型(加权最小二乘)其中近似服从75例题
在一次住房展销会上,与房地产商签订初步购房意向书的共有n=325名顾客.在随后的三个月里,只有一部分顾客确实购买了房屋.以顾客的年家庭收入x(万元)为自变量,建立Logistic回归模型.例题在一次住房展销会上,与房地产商签订初步购房意向书的76逻辑斯蒂回归课件77逻辑斯蒂回归课件78点击点击79利用上式可以对购房比例进行预测,如利用上式可以对购房比例进行预测,如80Logistic回归系数的估计(未分组数据)n组观测数据:~与的关系
Logistic回归系数的估计(未分组数据)n组观测数据:81参数的极大似然估计
的分布函数的似然函数未分组数据结构参数的极大似然估计的分布函数未分组数据结构82似然函数的对数表达利用迭代法求解似然函数对数的最大值点就是参数的极大似然估计,记为:似然函数的对数表达83拟合的优良性
回归模型的优良性拟合优度回归系数的显著性-2log(L)Wald=goodness-of-fitstatistics拟合的优良性回归模型的优良性拟合优度回归系数的显著性-284Hosmer-LemeshowTest零假设:因变量实际分布与预测的分布无差异决策准则:拒绝零假设模型不显著Hosmer-LemeshowTest零假设:85Logistic回归步骤以及SPSS实现
Logistic回归步骤以及SPSS实现86逻辑斯蒂回归课件87不显著,去掉最不显著的月收入变量,重新估计不显著,去掉最不显著的月收入变量,重新估计88逻辑斯蒂回归课件89结论:女性乘公交车比例高于男性,年龄越大,乘车的比例越高。结论:女性乘公交车比例高于男性,年龄越大,乘车的比例越高。90科研教案
庞素林.Logistic回归模型在信用风险中的应用.数学的实践与认识.2006,36(9):129~137科研教案庞素林.Logistic回归模型在信用风险中91判别模型建立的基本步骤样本分组将样本分成训练样本组和测试样本组建模过程利用训练样本建立分类模型评价过程利用测试样本评价模型的精度第二步第三步第一步判别模型建立的基本步骤样本分组将样本分成训练样本组和测试样本92摘要通过运行SPSS,建立Logistic回归信用评价模型(creditevaluationmodel),用来对中国2000年106家上市公司进行两类模式分类,这两类模式是指按照公司的经营状况分为“差”和“正常”两个小组.对每一家上市公司,考虑其经营状况的4个主要财务指标:每股收益、每股净资产、净资产收益率和每股现金流量.摘要通过运行SPSS,建立Logist93
仿真结果表明,Logistic回归信用评价模型对总体106个样本,判别准确率达到99.06%.此外,本文的研究结果还发现,当利用SPSS的Di
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 电子零售商的物流管理考核试卷
- 海洋环境友好型海洋生态保护与渔业资源管理服务考核试卷
- 外汇交易中的道德风险控制考核试卷
- 环保技术成果转化与推广考核试卷
- 海洋油气开采可持续发展考核试卷
- 电竞设备零售考核试卷
- 皮手套企业的产品质量追溯体系考核试卷
- 煤基清洁能源技术考核试卷
- 淀粉在电子产品的防静电包装制造考核试卷
- 海洋观测与数据采集技术考核试卷
- 钢平台铺板计算excel(可当计算书)
- 《强化学习理论与应用》环境
- 美丽的西双版纳
- 常用康复护理技术课件
- 冷镦模具设计培训资料课件-002
- 中国古代文学史元明清文学PPT完整全套教学课件
- 排水沟铸铁篦子规格
- 中学学校各项安全资料汇编
- 桥式起重机司机(中级)职业技能鉴定考试题库(职校培训)
- 第5章库存控制
- 中班数学给春天的信
评论
0/150
提交评论