逻辑回归课件_第1页
逻辑回归课件_第2页
逻辑回归课件_第3页
逻辑回归课件_第4页
逻辑回归课件_第5页
已阅读5页,还剩67页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三讲二项逻辑回归——以上市企业特别处理ST为例第三讲二项逻辑回归——以上市企业特别处理ST为例一、二项逻辑(BinaryLogisitic)回归二项逻辑斯蒂回归是可以用来预测具有两分特点的因变量概率的统计方法,它适用于判断一些事情将是发生还是不发生,某个候选人将当选还是不当选,某个人容易患某种病还是不容易患该病等等。与前面线性回归和方差分析中因变量为数值型变量不同,二项逻辑回归中的因变量具有两分特点。即:因变量只有两个值——发生(是)或不发生(否)。

一、二项逻辑(BinaryLogisitic)回归数据要求因变量应具有二分特点,保证因变量的取值为0或1;自变量可以是分类变量或数值变量,如果为分类变量,应为二分变量或被重新编码的指示变量,如果为数值变量,最好为多元正态分布。Logistic模型预测观测量相对于某一事件的发生概率:

某一事件不发生的概率:prob(noevent)=1-prob(event)数据要求Logistic回归系数

模型回归使用极大似然比法和迭代方法评价模型——判断拟合的优劣1.模型的拟合度2.系数检验3.影响点的查找4.交互项Logistic回归系数二、案例背景介绍特别处理(specialtreatment,ST)政策是我国股市持有的一项旨在保护投资者利益的政策。被特别处理的股票每日涨跌幅度是受到限制的,对被特别处理的股票证监会要求在原股票名称之前加上“ST”,以作提醒。二、案例背景介绍特别处理(specialtreat《上海证券交易所股票上市规则》关于特别处理的详细规定:《上海证券交易所股票上市规则》关于特别处理的详细规定:相关参考文献相关参考文献第三讲-逻辑回归课件ST政策的后果股票涨跌幅度被限制在5%以内;持续亏损可能会被退市;误导投资者影响企业正常经营我们更关心:企业怎么避免由于被ST面临着的退市风险?投资者怎么能察觉什么样的企业更有可能被ST?ST政策的后果股票涨跌幅度被限制在5%以内;三、数据介绍我国股市的ST状况三、数据介绍我国股市的ST状况大股东占款行为同企业ST的关系大股东占款行为同企业ST的关系数据说明数据来源于某商业数据库;ST的样本是在第t年被ST的深沪两市公司;相应的财务指标(解释变量)取自于第t-3年,即被ST之前第三年的数据因变量为该企业的ST状态,即ST或非ST。(二分特点)定义Y=0表示非ST,定义Y=1表示ST。如果因变量是取值多个的定性变量,逻辑回归不再适用,应该考虑多分变量的逻辑斯谛回归。数据说明四、指标设计1.ARA(X1)应收账款与总资产的比例,反映盈利质量;2.ASSET(X2)对数变换后的资产规模,反映公司规模;3.ATO(X3)资产周转率,量化一个企业对资产的利用效率;4.ROA(X4)资产收益率,反映每单位资产能够给企业带来的利润如何;四、指标设计1.ARA(X1)5.GROWTH(X5)销售收入增长率,反映企业的增长速度;6.LEV(X6)债务资产比率,也称杠杆比率。反映企业总资产中来自于债权人的比率;7.SHARE(X7)企业第一大股东的持股比率,反映该企业的股权结构。5.GROWTH(X5)统计数据统计数据五、描述分析单变量描述分析五、描述分析单变量描述分析变量分组对比的描述分析(盒状图)变量分组对比的描述分析(盒状图)分类表(a)(,)(b)ST已观测0步骤0ST0648136分类表(a)(,)(b)ST已观测0步骤0ST064813第三讲-逻辑回归课件报告STARAASSETATOROAGROWTHLEV0均值9.06034667762E-22.0773459460E1.5254105.66334496049E-21.23044284216E-14.01843469995E-1N648648648648648648标准差.0867357096138.32429628045E-1.3676712.037417359210.299471209170.164487412034中值6.63429700000E-22.0688101150E1.4345505.20196415000E-21.06396773000E-14.02690387000E-1极小值.00000000018.66070036.0028.000081700-.950727316.018431070极大值.63468424924.017610753.1513.311129979.998556503.9803217521均值1.75077078583E-12.0856945577E1.4183144.21299924167E-2-2.49055246111E-24.82025133222E-1N363636363636标准差.1420789105518.61102914854E-1.2424995.054591871362.400322588476.172601603908中值1.39242836500E-12.0816099460E1.3911002.56733655000E-2-1-15.04284161500E-1极小值.01191061519.07363796.0824.001052306-.816703929.138105086极大值.53359089323.48809660.9212.235083859.899764378.793781313总计均值9.50494463450E-22.0777853466E1.5197745.58701097529E-21-14.06063557534E-1N684684684684684684标准差.0922893115688.33523222911E-1.3628265.038593910305.307020050078.165763968255中值6.83271815000E-22.0700502790E1.4334005.12579800000E-21.02282637500E-14.06739738000E-1极小值.00000000018.66070036.0028.000081700-.950727316.018431070极大值.63468424924.017610753.1513.311129979.998556503.980321752报告STARAASSETATOROAGROWTHLEV0均值六、统计模型六、统计模型ST概率ST概率似然函数似然函数方程中的变量BS.E,WalsdfSig.步骤1aARA4.8801.49210.6901.001ASSET.247.2241.2111.271ATO-.507.657.5961.440ROA-.6376.224.0101.919GROWTH-.833.5672.1601.142LEV2.3541.2013.8401.050SHARE-.011.011.9931.319常量-8.8694.6363.6601.056a.在步骤1中输入的变量:ARA,ASSET,ATO,ROA,GROWTH,LEV,SHARE.方程中的变量BS.E,WalsdfSig.步骤1aARA4统计学推断全局检验:离差(DEV),似然比检验(卡方分布)局部检验:统计学推断七、预测评估预测模型七、预测评估预测模型预测评估预测评估最优预测规则最优预测规则分类表a

已观测已预测

ST百分比校正

01步骤ST0647199.813512.8总计百分比

94.7a.切割值为0.5分类表a已观测已预测ST百分比校正01步骤ST064TPR和FPR如何平衡不是一个容易的问题,需要根据实际工作需要选取适当的临界值,使得总损失最小化TPR和FPR分类表a

已观测已预测

ST百分比校正

01步骤ST046418471.61112569.4总计百分比

71.5a.

分类表a已观测已预测ST百分比校正01步骤ST046七、分析报告七、分析报告课后练习移动通信客户流失规律分析1.研究目的通过对某移动通信公司客户的流失数据分析,了解客户流失规律,建立流失预警系统,为客户关系管理服务。2.数据介绍某年度随机抽取的1000个移动通信客户。因变量时他们来年的流失行为。采集指标:客户等级:1,2,3,4;主叫次数(%):7日内日均主叫次数/90日内日均主叫次数;被叫次数(%);通话时长(%);费用(%)3.作业要求理解客户流失对企业的重大意义,做完整的逻辑回归分析,汇总成简短研究报告课后练习移动通信客户流失规律分析爱是什么?

一个精灵坐在碧绿的枝叶间沉思。

风儿若有若无。

一只鸟儿飞过来,停在枝上,望着远处将要成熟的稻田。

精灵取出一束黄澄澄的稻谷问道:“你爱这稻谷吗?”

“爱。”

“为什么?”

“它驱赶我的饥饿。”

鸟儿啄完稻谷,轻轻梳理着光润的羽毛。

“现在你爱这稻谷吗?”精灵又取出一束黄澄澄的稻谷。

鸟儿抬头望着远处的一湾泉水回答:“现在我爱那一湾泉水,我有点渴了。”

精灵摘下一片树叶,里面盛了一汪泉水。

鸟儿喝完泉水,准备振翅飞去。

“请再回答我一个问题,”精灵伸出指尖,鸟儿停在上面。

“你要去做什么更重要的事吗?我这里又稻谷也有泉水。”

“我要去那片开着风信子的山谷,去看那朵风信子。”

“为什么?它能驱赶你的饥饿?”

“不能。”

“它能滋润你的干渴?”

“不能。”爱是什么?

一个精灵坐在碧绿的枝叶间沉思。

风儿若有若无。

一只鸟儿飞过来,停在枝上,望着远处将要成熟的稻田。

精灵取出一束黄澄澄的稻谷问道:“你爱这稻谷吗?”

“爱。”

“为什么?”

“它驱赶我的饥饿。”

鸟儿啄完稻谷,轻轻梳理着光润的羽毛。

“现在你爱这稻谷吗?”精灵又取出一束黄澄澄的稻谷。

鸟儿抬头望着远处的一湾泉水回答:“现在我爱那一湾泉水,我有点渴了。”

精灵摘下一片树叶,里面盛了一汪泉水。

鸟儿喝完泉水,准备振翅飞去。

“请再回答我一个问题,”精灵伸出指尖,鸟儿停在上面。

“你要去做什么更重要的事吗?我这里又稻谷也有泉水。”

“我要去那片开着风信子的山谷,去看那朵风信子。”

“为什么?它能驱赶你的饥饿?”

“不能。”

“它能滋润你的干渴?”

“不能。”爱是什么?

一个精灵坐在碧绿的枝叶间沉思。

风儿若有若无。

其实,世上最温暖的语言,“不是我爱你,而是在一起。”

所以懂得才是最美的相遇!只有彼此以诚相待,彼此尊重,相互包容,相互懂得,才能走的更远。相遇是缘,相守是爱。缘是多么的妙不可言,而懂得又是多么的难能可贵。否则就会错过一时,错过一世!择一人深爱,陪一人到老。一路相扶相持,一路心手相牵,一路笑对风雨。在平凡的世界,不求爱的轰轰烈烈;不求誓言多么美丽;唯愿简单的相处,真心地付出,平淡地相守,才不负最美的人生;不负善良的自己。人海茫茫,不求人人都能刻骨铭心,但求对人对己问心无愧,无怨无悔足矣。大千世界,与万千人中遇见,只是相识的开始,只有彼此真心付出,以心交心,以情换情,相知相惜,才能相伴美好的一生,一路同行。然而,生活不仅是诗和远方,更要面对现实。如果曾经的拥有,不能天长地久,那么就要学会华丽地转身,学会忘记。忘记该忘记的人,忘记该忘记的事儿,忘记苦乐年华的悲喜交集。人有悲欢离合,月有阴晴圆缺。对于离开的人,不必折磨自己脆弱的生命,虚度了美好的朝夕;不必让心灵痛苦不堪,弄丢了快乐的自己。擦汗眼泪,告诉自己,日子还得继续,谁都不是谁的唯一,相信最美的风景一直在路上。人生,就是一场修行。你路过我,我忘记你;你有情,他无意。谁都希望在正确的时间遇见对的人,然而事与愿违时,你越渴望的东西,也许越是无情无义地弃你而去。所以美好的愿望,就会像肥皂泡一样破灭,只能在错误的时间遇到错的人。岁月匆匆像一阵风,有多少故事留下感动。愿曾经的相遇,无论是锦上添花,还是追悔莫及;无论是青涩年华的懵懂赏识,还是成长岁月无法躲避的经历……愿曾经的过往,依然如花芬芳四溢,永远无悔岁月赐予的美好相遇。其实,人生之路的每一段相遇,都是一笔财富,尤其亲情、友情和爱情。在漫长的旅途上,他们都会丰富你的生命,使你的生命更充实,更真实;丰盈你的内心,使你的内心更慈悲,更善良。所以生活的美好,缘于一颗善良的心,愿我们都能善待自己和他人。一路走来,愿相亲相爱的人,相濡以沫,同甘共苦,百年好合。愿有情有意的人,不离不弃,相惜相守,共度人生的每一个朝夕……直到老得哪也去不了,依然是彼此手心里的宝,感恩一路有你!其实,世上最温暖的语言,“不是我爱你,而是在一起。”

第三讲-逻辑回归课件第三讲二项逻辑回归——以上市企业特别处理ST为例第三讲二项逻辑回归——以上市企业特别处理ST为例一、二项逻辑(BinaryLogisitic)回归二项逻辑斯蒂回归是可以用来预测具有两分特点的因变量概率的统计方法,它适用于判断一些事情将是发生还是不发生,某个候选人将当选还是不当选,某个人容易患某种病还是不容易患该病等等。与前面线性回归和方差分析中因变量为数值型变量不同,二项逻辑回归中的因变量具有两分特点。即:因变量只有两个值——发生(是)或不发生(否)。

一、二项逻辑(BinaryLogisitic)回归数据要求因变量应具有二分特点,保证因变量的取值为0或1;自变量可以是分类变量或数值变量,如果为分类变量,应为二分变量或被重新编码的指示变量,如果为数值变量,最好为多元正态分布。Logistic模型预测观测量相对于某一事件的发生概率:

某一事件不发生的概率:prob(noevent)=1-prob(event)数据要求Logistic回归系数

模型回归使用极大似然比法和迭代方法评价模型——判断拟合的优劣1.模型的拟合度2.系数检验3.影响点的查找4.交互项Logistic回归系数二、案例背景介绍特别处理(specialtreatment,ST)政策是我国股市持有的一项旨在保护投资者利益的政策。被特别处理的股票每日涨跌幅度是受到限制的,对被特别处理的股票证监会要求在原股票名称之前加上“ST”,以作提醒。二、案例背景介绍特别处理(specialtreat《上海证券交易所股票上市规则》关于特别处理的详细规定:《上海证券交易所股票上市规则》关于特别处理的详细规定:相关参考文献相关参考文献第三讲-逻辑回归课件ST政策的后果股票涨跌幅度被限制在5%以内;持续亏损可能会被退市;误导投资者影响企业正常经营我们更关心:企业怎么避免由于被ST面临着的退市风险?投资者怎么能察觉什么样的企业更有可能被ST?ST政策的后果股票涨跌幅度被限制在5%以内;三、数据介绍我国股市的ST状况三、数据介绍我国股市的ST状况大股东占款行为同企业ST的关系大股东占款行为同企业ST的关系数据说明数据来源于某商业数据库;ST的样本是在第t年被ST的深沪两市公司;相应的财务指标(解释变量)取自于第t-3年,即被ST之前第三年的数据因变量为该企业的ST状态,即ST或非ST。(二分特点)定义Y=0表示非ST,定义Y=1表示ST。如果因变量是取值多个的定性变量,逻辑回归不再适用,应该考虑多分变量的逻辑斯谛回归。数据说明四、指标设计1.ARA(X1)应收账款与总资产的比例,反映盈利质量;2.ASSET(X2)对数变换后的资产规模,反映公司规模;3.ATO(X3)资产周转率,量化一个企业对资产的利用效率;4.ROA(X4)资产收益率,反映每单位资产能够给企业带来的利润如何;四、指标设计1.ARA(X1)5.GROWTH(X5)销售收入增长率,反映企业的增长速度;6.LEV(X6)债务资产比率,也称杠杆比率。反映企业总资产中来自于债权人的比率;7.SHARE(X7)企业第一大股东的持股比率,反映该企业的股权结构。5.GROWTH(X5)统计数据统计数据五、描述分析单变量描述分析五、描述分析单变量描述分析变量分组对比的描述分析(盒状图)变量分组对比的描述分析(盒状图)分类表(a)(,)(b)ST已观测0步骤0ST0648136分类表(a)(,)(b)ST已观测0步骤0ST064813第三讲-逻辑回归课件报告STARAASSETATOROAGROWTHLEV0均值9.06034667762E-22.0773459460E1.5254105.66334496049E-21.23044284216E-14.01843469995E-1N648648648648648648标准差.0867357096138.32429628045E-1.3676712.037417359210.299471209170.164487412034中值6.63429700000E-22.0688101150E1.4345505.20196415000E-21.06396773000E-14.02690387000E-1极小值.00000000018.66070036.0028.000081700-.950727316.018431070极大值.63468424924.017610753.1513.311129979.998556503.9803217521均值1.75077078583E-12.0856945577E1.4183144.21299924167E-2-2.49055246111E-24.82025133222E-1N363636363636标准差.1420789105518.61102914854E-1.2424995.054591871362.400322588476.172601603908中值1.39242836500E-12.0816099460E1.3911002.56733655000E-2-1-15.04284161500E-1极小值.01191061519.07363796.0824.001052306-.816703929.138105086极大值.53359089323.48809660.9212.235083859.899764378.793781313总计均值9.50494463450E-22.0777853466E1.5197745.58701097529E-21-14.06063557534E-1N684684684684684684标准差.0922893115688.33523222911E-1.3628265.038593910305.307020050078.165763968255中值6.83271815000E-22.0700502790E1.4334005.12579800000E-21.02282637500E-14.06739738000E-1极小值.00000000018.66070036.0028.000081700-.950727316.018431070极大值.63468424924.017610753.1513.311129979.998556503.980321752报告STARAASSETATOROAGROWTHLEV0均值六、统计模型六、统计模型ST概率ST概率似然函数似然函数方程中的变量BS.E,WalsdfSig.步骤1aARA4.8801.49210.6901.001ASSET.247.2241.2111.271ATO-.507.657.5961.440ROA-.6376.224.0101.919GROWTH-.833.5672.1601.142LEV2.3541.2013.8401.050SHARE-.011.011.9931.319常量-8.8694.6363.6601.056a.在步骤1中输入的变量:ARA,ASSET,ATO,ROA,GROWTH,LEV,SHARE.方程中的变量BS.E,WalsdfSig.步骤1aARA4统计学推断全局检验:离差(DEV),似然比检验(卡方分布)局部检验:统计学推断七、预测评估预测模型七、预测评估预测模型预测评估预测评估最优预测规则最优预测规则分类表a

已观测已预测

ST百分比校正

01步骤ST0647199.813512.8总计百分比

94.7a.切割值为0.5分类表a已观测已预测ST百分比校正01步骤ST064TPR和FPR如何平衡不是一个容易的问题,需要根据实际工作需要选取适当的临界值,使得总损失最小化TPR和FPR分类表a

已观测已预测

ST百分比校正

01步骤ST046418471.61112569.4总计百分比

71.5a.

分类表a已观测已预测ST百分比校正01步骤ST046七、分析报告七、分析报告课后练习移动通信客户流失规律分析1.研究目的通过对某移动通信公司客户的流失数据分析,了解客户流失规律,建立流失预警系统,为客户关系管理服务。2.数据介绍某年度随机抽取的1000个移动通信客户。因变量时他们来年的流失行为。采集指标:客户等级:1,2,3,4;主叫次数(%):7日内日均主叫次数/90日内日均主叫次数;被叫次数(%);通话时长(%);费用(%)3.作业要求理解客户流失对企业的重大意义,做完整的逻辑回归分析,汇总成简短研究报告课后练习移动通信客户流失规律分析爱是什么?

一个精灵坐在碧绿的枝叶间沉思。

风儿若有若无。

一只鸟儿飞过来,停在枝上,望着远处将要成熟的稻田。

精灵取出一束黄澄澄的稻谷问道:“你爱这稻谷吗?”

“爱。”

“为什么?”

“它驱赶我的饥饿。”

鸟儿啄完稻谷,轻轻梳理着光润的羽毛。

“现在你爱这稻谷吗?”精灵又取出一束黄澄澄的稻谷。

鸟儿抬头望着远处的一湾泉水回答:“现在我爱那一湾泉水,我有点渴了。”

精灵摘下一片树叶,里面盛了一汪泉水。

鸟儿喝完泉水,准备振翅飞去。

“请再回答我一个问题,”精灵伸出指尖,鸟儿停在上面。

“你要去做什么更重要的事吗?我这里又稻谷也有泉水。”

“我要去那片开着风信子的山谷,去看那朵风信子。”

“为什么?它能驱赶你的饥饿?”

“不能。”

“它能滋润你的干渴?”

“不能。”爱是什么?

一个精灵坐在碧绿的枝叶间沉思。

风儿若有若无。

一只鸟儿飞过来,停在枝上,望着远处将要成熟的稻田。

精灵取出一束黄澄澄的稻谷问道:“你爱这稻谷吗?”

“爱。”

“为什么?”

“它驱赶我的饥饿。”

鸟儿啄完稻谷,轻轻梳理着光润的羽毛。

“现在你爱这稻谷吗?”精灵又取出一束黄澄澄的稻谷。

鸟儿抬头望着远处的一湾泉水回答:“现在我爱那一湾泉水,我有点渴了。”

精灵

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论