版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、金融智慧大脑开发平台介绍Finance AI & Open Financial PlatformABCDE营销、获客及KYC资金与资产风控、合规及KYC运营科技中国银行业痛点M01如何高效开展金融产品的宣传MOR02小微企业客户获客成本高M03个人客户精准低成本营销M04运营有形网点成本高效益低AR01获取高收益资产越来越难AR03实现小额高频的普惠信贷业务A02农业金融的低效益与高风险C01如何高效吸收低成本资金C02为大众提供高效低价的财富管理服务O01繁琐的支付与转账服务MOR02小微企业客户经营成本高O03个人金融服务的客服与消费者教育O04供应链金融中对信息流和物流的可靠追踪O05机
2、构结算与清算领域的流程、时滞及成本O06信贷业务流程的繁琐耗时O07海量业务资料的有效管理T01科技系统软硬件投资巨大且扩展性差T02科技研发与创新效率低AR01获取高收益资产越来越难MOR02小微企业客户获客与经营成本高AR03实现小额高频的普惠信贷业务R04个人金融服务中的反欺诈R05针对中小企业信贷的传统风控手段乏力R06合规管理、反洗钱与客户评估实现小额高频的普惠信贷业务小微企业客户获客成本高个人金融服务中的反欺诈针对中小企业信贷的传统风控手段乏力小额:额度在1万500万之间高频:获客便捷,自动化审批、流程简便,随借随还。普惠信贷:不同客户切分不同额度、期限、利率,同时是信用贷款供应链
3、金融中对信息流和物流的可靠追踪痛中之痛小微企业:特征,无抵押、无财报,白户,征信数据验证困难获客成本高:信息不对称让信息中介成为高利行业,财务数据,经营信息获取难。个人金融服务:个人消费贷款、个人经营贷,场景化问题,身份核验问题,团伙欺诈问题,包装欺诈问题。反欺诈:正向反欺诈、逆向反欺诈传统风控:建模能力、算法、样本、验证、Y数据,数据收集与验真、人才ML风控:AI技术,数据处理,样本处理,组合算法,调参,人才供应链金融:骗贷、资金挪用,应付账款、仓单质押真实性,外生风险,内生风险、主体风险、机会主义风险,上下游在资金、还款、信用、应收账款账户的控制信息流与物流可靠追踪:区块链技术性能问题,垂
4、直行业认识上,数据应用:历史交易数据、外部数据积累和挖掘,动态数据的监控,交易真实性,质押物监控.信贷业务流程的繁琐耗时业务流程:触达客户、申请、反欺诈、面签、审批、尽调、放款、核算、贷后服务、监控、催收、保全、处置、ABS等繁琐耗时:贷前、贷中、贷后节点数,风控模型参与度,反欺诈参与度,自动化流程、O2O流程,操作风险,进度工具智能化,道德风险等等这些痛点需要解决传统银行中的那些问题痛点细节痛点银行业务需要解决能力支撑建议方案实现小额高频的普惠信贷业务额度在1万500万之间信贷产品设计信贷流程优化、科技能力、数字化风控、反欺诈,ROA,-产品-模型匹配独立产品平台,场景沙箱推演,ROA计算、
5、ML风控获客便捷网点获客转型,O2O获客转型,线上获客转型客户体验,精准投放广告、流程便捷降低漏损率,风控与客户体验平衡的AI计算场景沙箱,嵌入式AI精准获客模型,智能线下获客工具,自动化审批交叉验证数据获取技术、数据匹配技术、自动规则引擎、语音质检、图像识别质检、风控引擎驱动的审批模型NLP、OCR、Image 理解技术、边缘计算、单项数据授权、数据安全与隐私保护技术RPA、NLP进行数据处理和自动化审批,不适用爬虫技术方式(接口接入技术)开放银行数据交换标准,双向鉴权流程简便贷前申请和查询授权(征信、房产、资产、卡资金、第三方数据)、申请资料简单并可后台接口查询、秒批、ROI漏损率低,贷中
6、和贷后等流程简便,产品设计必须的内容。边缘计算进行卫星模型处理,产品设计能力,客户体验,漏损AI计算产品沙箱、AI驱动设计随借随还产品设计中额度、期限、利率问题,产品工厂灵活配置,客户画像客群分类器设计、产品设计、流程设计、产品工厂独立化。产品工厂不同客户切分不同额度、期限、利率ML、ML风控模型、数据安全、数据鉴权数字化 风控能力ML风控模型信用贷款零售信用产品-零售信用风险模型数字化风控能力ML风控模型考虑使用解决方案:产品工厂平台(产品沙箱、产品工厂、ROA计算)、智能获客平台、风控建模、产品设计咨询、开放银行平台银行贷前能力银行应该具备Total Ability贷前:精准获客能力贷前:
7、KYC贷前:反欺诈能力银行贷中能力贷中:便捷开户贷中:便捷放款银行贷后能力贷前:信用风控建模贷后:D0低成本催收贷后:失联修复贷后:贷后预警银行运营能力信贷流程优化产品设计ROA沙箱低成本贷前、中、后运营能力边缘计算用于数据隐私保护与安全银联数据边缘计算建模信用中国边缘计算建模美团边缘计算建模其他场景边缘计算建模第三方数边缘计算建模银行历史数据边缘计算建模银行方集成计算建模技术平台支撑能力T01机器学习平台 T02OCR T032D人脸识别 T043D人脸支付 T05 NLP T06类脑学习 T07边缘计算 T08图计算 T09RPA T010 大数据分析 T011 DW高效 T012 交易安
8、全 T013产品工厂 T014开放银行 T015数据安全与隐私保护技术在传统审核资料的基础上,增加多渠道多维度的海量数据,构建风险模型网上消费第三方数据社交关系其它网络行为信贷数据征信报告申请资料第三方数据信用行为交叉匹配网络黑名单搜索引擎各类认证某知名机构风险评分Y=f(X1,X2,Xn)f?必须要有YX处理数据01数据观察02样本选择03补充样本04模型评估08模型调参07特征工程06单变量分析05好坏样本4:11、缺失值处理2、同质化处理(拍脑袋90%作为临界值进行删除)3、特征赛选(过滤式、包裹式和嵌入式,FICO监督数据分箱、区分度评分、拟合与尺度化、IV值、皮尔森、卡分分箱等、挑战
9、者)最终模型09最大难点风控建模传统建模最大难点风控建模人才分类建议(以某家银行建议为例)数据收集01申请数据征信报告支付数据税务数据电信数据电力数据ERP数据财务数据第三方介入数据点击模型数据交互场景数据数据分类器算法设计021、SVM+SKM+类脑计算初选2、Adaboost+Random Forest进行预测分类误差3、GAN网络自动模拟数据分类器4、类脑因果学习分类器算法AUC标定值DL数据观察031、 randomforest Tree自动弱分类好坏样本标注2、数据缺失扫描 3、样本分布计算4、GAN重建样本数据样本选择041、 GAN对抗大量样本比对学习2、对抗补偿函数选择 3、学
10、习历史数据补充(人工监督,局域学习数据)4、少量样本逻辑规则(类脑逻辑)5、GAN生成样本与正式样本分类(建模数据集、测试数据集、自比对数据集)补充样本051、 根据标注量按照4:1样本补充,2、样本量监测最大难点风控建模无监督学习建模单变量分析061、核心变量分析,参照FICO五类变量进行点单变量统计分析2、然后其他数据单变量统计分析3、输出是否正态分布,长尾右偏分布、离散分布,使用SKM建立正态分布特征核4、组合衍生变量单变量统计分析DL特征工程071、系统数据扫描2、缺失值处理:删除缺失值、统计量填充、特殊值填充、保留缺失值(预设缺失阀值90%)3、根据经验考虑缺失值是否补充判断4、ET
11、L过程级大数据处理过程5、同质化数据处理(深度学习同质化数据区分度切片)6、无监督数据分箱(等距、等频和逻辑规则Police数据分箱)+卡分分箱7、IV值特征筛选-皮尔森关系数特征赛选-挑战者-Ensemble learning-SKM+SVM+Ensemble learning+Random Forest+autoencoder(无标注特征)模型调参081、GBM模型调参 2、DNN学习GBM的min_ samples_split 、min_ samples_leaf的权重,ResNet学习max_ depth的深度,Loss函数定义权重回归。3、ResNet对梯度回升逆运算,GAN对抗进行
12、逆操作预测,最大难点风控建模无监督学习建模最大难点风控建模无监督学习建模模型评估091、传统Gini=2*AUC-1 设计预判值做线性相互计算2、使用KS值进行预测计算 进行模型区分度设定预设值计算3、互相关函数进行模型区分度(非线性)4、SKM验证GINI与KS值偏差度GINI: 60% : 过高,需要谨慎的验证模型KS: 75% : 过高,需要谨慎的验证模型我通过SKM算法计算到模型在训练集上的Gini系数达到了0.56左右,K-S值也达到了0.44左右,对于信用评估模型来说,效果算是非常好的。另外从图中可以看到,模型在训练集上的稳定性非常好,5折交叉验证的曲线非常接近。最大难点风控建模无
13、监督学习建模接下来验证模型在测试集上的表现,验证其泛化能力最大难点风控建模无监督学习建模最终模型101、全样本数据对模型重新拟合2、好坏样本区分度多算法测算:闵可夫斯基距离、. 欧氏距离、 标准化欧氏距离、曼哈顿距离、切比雪夫距离、 马氏距离、夹角相似距离、汉明距离、杰卡德距离 & 杰卡德相似系数、互相关 & 相关距离、 信息熵类脑.编辑距离、SKM距离自动学习AUC指的是ROC曲线包围形成的面积,而ROC曲线是由不同的TPR和FPR值形成的曲线。对于一个确定的模型,TPR和FPR都是阈值的函数,当我们学习到一个阈值之后,TPR和FPR随之确定。因此,如何学习阀值阈值才能达到最经济的结果,就是
14、一个非常重要的问题共线性检查、模型稳定性校验、严格的缺失值处理GBM算法还是Adaboost+Random Forest对模型很重要。建议的传统模型多方面数据的综合及独立应用征信数据,工行数据(穿透各个产品,如,信用卡,储蓄,按揭), 第三方数据 (电信,电力,会员,住址,教育,职称,等) 分类 (Segmentation)结合工行高管经验和统计分析, 寻找最佳分类(人群特性,数据特征, 或产品需要等)以便获得最准确的风险预估 设计更好的衍生变量通过业务知识,建模经验和数学计算, 构造大量更强更好衍生变量比如,i)原生变量信用额度和借贷金额虽对风险有一点预估能力, 但是它俩的比率 (信用额度使
15、用率, 指百分之几的信用额度已经用掉了; ii)借贷额增长速度 (以今天的借贷额和六个月前的借贷额的比例。 评估多种回归模型采用不同的变量输入方式 (stepwise, forward and、和 backward)及对各种统计参数调整 密切跟踪快速迭代定期检测模型表现。 发现问题立即调整和重新建立模型建议的实施路径A) 银行需求的理解 1) 对产品的认识 2) 对目标人群的了解(银行提出要求) 3) 对风控价格/成本的要求(风险承受度及利润目标) 4) 工行可以提供的数据B) 建模的步骤数据收集及整理2. 数据分析3. 模型建立4. 模型评估及选择5. 模型应用及落地6. 模型表现跟踪及反馈
16、7. 模型调整优化及迭代“双轨模型互补增强”: 同时建立两套模型(传统模型 vs 机器学习模型)。 以传统模型为主导 - 风险因子清晰客户容易理解以机器学习模型为“挑战者”- 识别传统模型的漏洞和偏差两者并用行业领先预测准确性客户需求模型输出的计算对接审批系统及自动化定期报告专人分析采集梳理及质量检测初步量化分析调整模型参数重新建立模型前端中台运营后台智能获客平台C01DSP平台C02DMP平台C03嵌入式智能获客平台C04金融超市C05儿童金融端综合产品与风控方案平台M01身份验证平台M02征信解析平台M03反欺诈M04产品平台M05场景平台M06风控模型M07穿透资产工具运营平台O01自动化审批O02智能尽调工具O03押品与保全O04智能催收O05贷后预警O06沙箱平台F01开放银行平台综合服务平台(助贷、融担、信保、
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度山西省高校教师资格证之高等教育法规考试题库
- 国家自然基金简介(1)-资助研究项目属性(2)-资助研培训课件
- 2024年泥水工项目协议模板下载
- 2024年除雪作业协议细则
- 2024汽车购贷担保协议样本全文参阅
- 2024年办公室装修施工协议样本
- 2024年斗殴双方和解赔偿协议样式
- 中小学教师数据素养-江苏师范大学中国大学mooc课后章节答案期末考试题库2023年
- 岗位保密条款:2024劳动协议增补篇
- 2024年全职收银员劳动协议范本
- 二年级珍惜时间发奋学习主题班会课件
- 平行与垂直(公开课)课件
- 城市轨道交通牵引供电及电力技术分析
- 建筑行业会计基本处理课件
- 三年级上册美术课件-第4课 连环画 ▏人美版 (共15张PPT)
- 光州事件与韩国的民主化课件
- 新人教统编版四年级上册道德与法治 第9课 正确认识广告 第2课时 教学课件
- 收取执行款银行账户确认书
- 初中艺术鄂教七年级上册(2022年新编) 漫步艺术长廊舞剧欣赏《永不消逝的电波》教学设计
- 水电厂检修标准化作业流程图
- GB 18384-2020 电动汽车安全要求
评论
0/150
提交评论