版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Clementine自带 应用程序实例(中文版),电信客户流失(二项式Logistic回归),译者注:Logistic regression应该翻译成Logistic回归,而非逻辑回归,因为本身跟逻辑没有什么关系,本文档翻译自Clementine的自带应用程序实例,错漏在所难免,有问题请e-mail,欢迎粉我微博 e-mail: 微博:,说明,logistic回归是一种基于输入值的记录分类统计技术。它跟线性回归相似但用分类目标字段替换数字字段。 使用的流文件%clementine%demoClassification_Moduletelco_churn.str 使用的数据文件%clementi
2、ne%demotelco.sav,例如,假设电信提供商关心流失给竞争对手的客户数量。如果服务使用数据可以被用来预测哪些客户有流失到竞争对手的倾向,那么就可以实施相应的措施以挽留客户。 实例以客户使用数据预测客户的可能流失概率。因为目标是分成两类,所以选用二项式模型。在多目标分类的情况下,可以使用多项式模型代替。详见系列教程Clementine自带实例_多项式Logistic回归.ppt(百度文库有) 添加一个SPSS文件源节点,指向telco.sav,添加一个指向telco.sav的SPSS源文件节点 添加一个类型节点以定义字段,确保它们的类型都设置正确。例如,对于大多数只有0值和1值的字段来
3、说应该被设为标志,但某些特定的字段,如性别,应该被更精确的视为双值集合。,小技巧:要改变多个字段的类型,点击“值”字段排序,按下shift键对您要改变的字段进行多选。可右击选择的字段改变选择字段的类型或者属性。,添加一个特征选择节点到类型节点并执行 使用特征选择节点可以去掉跟预测目标无关的协变量 从生成菜单中选择过滤器以生成过滤节点,不是所有telco.sav中的数据都对预测流失有用。您可以使用过滤器选择那些重要性比较强的因子 在生成过滤器的对话框中,选择“所有标记的字段:重要”,点击确定 把生成的过滤节点连接到类型节点 连接数据审核节点到生成的过滤节点并执行 在数据审核浏览器的质量标签中,单
4、击%完成标题进行升序排序。这让您能识别出有大量缺失值的字段;在本例中,我们仅需修正字段logtoll,它的缺失值大于50% 在缺失插补中,为logtoll选择指定,在插补时间一栏,选择空值与无效值,已固定为一栏选择平均值 在数据审计浏览器的质量节点,生成缺失值超节点 在缺失值超节点对话框中,增加样本数量至50%,确定,生成超节点到面板中,添加超节点到过滤节点。,添加Logistic节点到超节点 在Logistic节点中,点击模型标签并选择二项式方法选择前进法,在专家标签中,选择专家模式,点击输出 选择每一个步骤和参数估计 执行Logistic节点生成模型,模型生成在右上角的面板上,右击选择浏览
5、 汇总标签展示了模型使用的目标字段和输入字段(预测字段/协变量)。我们看到这些都是被前进法选入的字段,而不是所有的被提交的字段。,在高级标签展示的项目,依赖于建模节点中高级输出对话框所选 有一项总会出现在案例处理过程摘要,那就是落在某分类的记录条数以及比例。另外,还列出了缺失(如果有的话)数量,那些一个或多个输入字段不可用且未被选中,向下滚动到分类表 前进法由空模型(无协变量,看作基础模型,用于与最终模型比较)开始。空模型把所有的记录都预测为0,所以空模型有72.6%的准确率,因为726名客户没有流失。但是那些流失的客户一个都没预测正确,往下拖到分类表(a) 分类表展示了每次每个协变量加入模型
6、后的结果。我们看到,第一步加入了一个协变量后,流失的预测比例从0提升至29.9%,滚动到分类表的底部 分类表展示的最后一步即为第8步。在这步算法决定不再往模型加入更多的协变量。尽管预测未流失客户的精度有一点下降,至91.2%,但预测流失的客户从最初的0上升至47.1%。相对于没有使用任何协变量的基准模型来说,是显著的提高。,对于想减少客户流失的电信营运商来讲,若能减少一半的流失,将是保有自身收入流的一大步。 本例还展示了如何考虑模型精确度的问题。有些案例中,整体精确度是会误导人的。基准模型有72.6%的精确度,而最终模型的精确度只提高到了79.1%;但是,如我们所见,单个类别的预测精度都得到了极大改变。,结语,要知道模型对数据拟合的怎么样,在建模节点的专家-输出里面有一些选项可以使用。欲知详情可查看帮助文件里的Logistic Model Nugget Advanced Output。Clementine中建模用到的数学方法可以在Documentation目录的Clementine Algorithm G
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 商务合同范本-工程合同模板
- 品牌策划合作协议-合同范本
- 合伙协议书范文
- 2024房屋租赁居间合同
- 2024运输合同物流运输合同纠纷案例
- 2024设立有限责公司出资协议模板
- 2024年冷库转让协议合同书
- 深圳发展银行委托贷款操作流程
- 2024年学校食堂用工合同协议书样本
- 北京借款合同的范本2024年
- 行政许可执法案卷自评表
- 最新一年级数学上册比轻重题汇总
- CNAS-GL004:2018《标准物质_标准样品的使用指南》(2019-2-20第一次修订)
- 科普知识讲座(火箭)PPT精选课件
- 高三一模动员主题班会-课件(PPT演示)
- 车辙的形成原因及预防措施
- 风电场升压站建筑工程主要施工方案
- 第五讲新闻评论的结构与节奏
- 从PK-PD看抗菌药物的合理应用
- 加热炉施工方案
- 意象对话放松引导词2[生活经验]
评论
0/150
提交评论