《金融大数据分析》-课件 第 11 章 监督学习的小结_第1页
《金融大数据分析》-课件 第 11 章 监督学习的小结_第2页
《金融大数据分析》-课件 第 11 章 监督学习的小结_第3页
《金融大数据分析》-课件 第 11 章 监督学习的小结_第4页
《金融大数据分析》-课件 第 11 章 监督学习的小结_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第11章监督学习的小结学习目标本章的学习目标如下:熟悉不同模型的优缺点比较了解如何使用特征重要性了解如何使用SHAP值增加模型可解释性熟悉使用程序实现模型的可解释性方法简介首先,我们先回顾一下监督学习的应用场景。然后,我们将对介绍过的主要模型进行一些简单的比较。然后,我们介绍如何为复杂模型增加可解释性。监督学习方法的总结监督学习在金融中的应用监督学习这一类方法在金融业中有着广泛的应用场景。监督学习既可以用于对回归问题(即对连续变量的预测)也可以对分类问题进行预测。监督学习的特点是我们需要给一些例子用来训练模型中的参数。而作为例子的训练数据中必须有特征变量(即𝑥变量)以及目标变量(即𝑦变量)的数值。一旦模型训练完成,我们就可以用来预测新的数据。监督学习在金融中的应用我们已经讨论过几种应用,包括预测贷款违约及对公司基本面的预测。除了这些应用之外,我们还可以将其用于其他预测问题。例如,我们可以预测公司股价变化,房价的涨跌幅度,以及经济指数的变化。根据具体的问题以及数据量,我们可以选择适合的监督学习的方法。监督学习模型比较监督学习模型比较该图可见,简单的模型的优势是有着很好的可解释性,也有着较低的计算成本。复杂的模型则往往会牺牲可解释性以及较少的计算量。但是复杂的模型可以更好的对数据进行拟合。在减少过拟合问题的同时,复杂模型也有更高的过拟合的风险。为了减少过拟合的风险,我们需要对模型进行验证。我们也可以通过正则化方法来减少模型的方差,减少过拟合问题。复杂模型的可解释性如前一部分讨论的那样,随着模型复杂性的增加,我们模型的可解释性往往会极大下降。本章中,我们将简单介绍两种方法来给复杂的模型增加一定的可解释性。特征重要性分析

特征重要性分析

特征重要性SHAP值

SHAP值SHAP值SHAP值

程序导入库使用pandas存储数据导入sklearn库model_selection模块的train_test_split函数,用于划分训练集和测试集导入sklearn库ensemble模块的RandomForestRegressor类,用于创建随机森林回归模型导入shap库,用于解释机器学习模型的预测结果导入库数据读取及处理

使用随机森林模型创建一个随机森林回归模型对象rf_model,设置随机种子为42,树的数量设置为100,最小样本分裂为10使用fit方法对X_train和y_train进行随机森林回归分析特征重要性获取随机森林回归模型的特征重要性,并将其保存在变量feature_importances中打印特征重要性根据特征重要性对特征进行排序,indices为排序后的索引将特征名称根据排序后的索引重新排列,names中存储的即为排序后的特征名称列表特征重要性绘制一个条形图,x轴为特征的索引,y轴为特征的重要性,特征的重要性由feature_importances提供,特征的索引由indices提供特征重要性使用Shap增加模型可解释性创建一个shap解释器对象explainer,explainer可以用来解释rf_model对任意输入数据的预测结果使用Explainer对象对测试集数据进行解释,得到每个特征对预测结果的影响值,存储在shap_values变量中使用shap库的plots.waterfall函数绘制一个瀑布图,来可视化shap_values中第一个元素的影响使用Shap增加模型可解释性习题知识理解

程序操作请使用随机森林来拟合贷款违约数据。请使用特征重要性来阐述哪些变量对模型的结果有着较大的影响。请使用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论