版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Clementine自带应用程序实例(中文版)电信客户流失(二项式Logistic回归)译者注:Logistic regression应该翻译成Logistic回归,而非逻辑回归,因为本身跟逻辑没有什么关系本文档翻译自Clementine的自带应用程序实例,错漏在所难免,有问题请e-mail,欢迎粉我微博 e-mail:微博:说明logistic回归是一种基于输入值的记录分类统计技术。它跟线性回归相似但用分类目标字段替换数字字段。使用的流文件使用的数据文件例如,假设电信提供商关心流失给竞争对手的客户数量。如果服务使用数据可以被用来预测哪些客户有流失到竞争对手的倾向,那么就可以实施相应的措施以挽
2、留客户。实例以客户使用数据预测客户的可能流失概率。因为目标是分成两类,所以选用二项式模型。在多目标分类的情况下,可以使用多项式模型代替。详见系列教程Clementine自带实例_多项式Logistic回归.ppt(百度文库有)添加一个SPSS文件源节点,指向添加一个指向的SPSS源文件节点添加一个类型节点以定义字段,确保它们的类型都设置正确。例如,对于大多数只有0值和1值的字段来说应该被设为标志,但某些特定的字段,如性别,应该被更精确的视为双值集合。小技巧:要改变多个字段的类型,点击“值”字段排序,按下shift键对您要改变的字段进行多选。可右击选择的字段改变选择字段的类型或者属性。添加一个特
3、征选择节点到类型节点并执行 使用特征选择节点可以去掉跟预测目标无关的协变量从生成菜单中选择过滤器以生成过滤节点不是所有中的数据都对预测流失有用。您可以使用过滤器选择那些重要性比较强的因子在生成过滤器的对话框中,选择“所有标记的字段:重要”,点击确定把生成的过滤节点连接到类型节点连接数据审核节点到生成的过滤节点并执行在数据审核浏览器的质量标签中,单击%完成标题进行升序排序。这让您能识别出有大量缺失值的字段;在本例中,我们仅需修正字段logtoll,它的缺失值大于50%在缺失插补中,为logtoll选择指定在插补时间一栏,选择空值与无效值,已固定为一栏选择平均值在数据审计浏览器的质量节点,生成缺失
4、值超节点在缺失值超节点对话框中,增加样本数量至50%,确定,生成超节点到面板中,添加超节点到过滤节点。添加Logistic节点到超节点在Logistic节点中,点击模型标签并选择二项式方法选择前进法在专家标签中,选择专家模式,点击输出选择每一个步骤和参数估计执行Logistic节点生成模型,模型生成在右上角的面板上,右击选择浏览汇总标签展示了模型使用的目标字段和输入字段(预测字段/协变量)。我们看到这些都是被前进法选入的字段,而不是所有的被提交的字段。在高级标签展示的项目,依赖于建模节点中高级输出对话框所选有一项总会出现在案例处理过程摘要,那就是落在某分类的记录条数以及比例。另外,还列出了缺失
5、(如果有的话)数量,那些一个或多个输入字段不可用且未被选中向下滚动到分类表前进法由空模型(无协变量,看作基础模型,用于与最终模型比较)开始。空模型把所有的记录都预测为0,所以空模型有72.6%的准确率,因为726名客户没有流失。但是那些流失的客户一个都没预测正确往下拖到分类表(a)分类表展示了每次每个协变量加入模型后的结果。我们看到,第一步加入了一个协变量后,流失的预测比例从0提升至29.9%滚动到分类表的底部分类表展示的最后一步即为第8步。在这步算法决定不再往模型加入更多的协变量。尽管预测未流失客户的精度有一点下降,至91.2%,但预测流失的客户从最初的0上升至47.1%。相对于没有使用任何协变量的基准模型来说,是显著的提高。对于想减少客户流失的电信营运商来讲,若能减少一半的流失,将是保有自身收入流的一大步。本例还展示了如何考虑模型精确度的问题。有些案例中,整体精确度是会误导人的。基准模型有72.6%的精确度,而最终模型的精确度只提高到了79.1%;但是,如我们所见,单个类别的预测精度都得到了极大改变。结语要知道模型对数据拟合的怎么样,在建模节点的专家-输出里面有一些选项可以使用。欲知详情可查看帮助文件里的Logistic Model Nugget Advanced Output。Clementine中建模用到的数学方法可以在Documentation目录
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024至2030年中国野生发菜夹心水晶糖数据监测研究报告
- 2024年度农田作物病虫害监测承包合同
- 2024至2030年中国树脂少女花瓶数据监测研究报告
- 2020-2024年五年高考语文真题分类汇编专题05 名句名篇默写(解析版)
- 2024至2030年中国XDSL高速调制解调器行业投资前景及策略咨询研究报告
- 2024年度第二医院资产租赁合同
- 造林工程合同范本
- 二零二四年度服装设计师专项合同
- 转让水电合同范本
- 2024年度文化传媒内容制作合同
- 幼儿园教研五大领域主题30篇
- 2023年民俗博物馆防火、防盗、防恐应急预案
- 七年级劳动技能课全册教案
- 法学英语论文
- 如何培养一支高素质的班干部演示文稿
- 2023年西安国际港务区招聘笔试参考题库附带答案详解
- 发动机冷却系统说课稿课件
- 高中美术 湘美版 美术鉴赏第2单元 美术的历程第二课
- 山西祥源新型煤化工有限公司“上大关小”置换建设101万吨-年炭化室高度6.05米捣固焦化项目环评报告
- 建筑面积计算规范2023-1
- 2023年地域文化学习报告
评论
0/150
提交评论