版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
机器学习自然语言处理视觉 导读今天分享的主题是信贷场景用户画像构建与应用,将结合信贷场景的特殊性,深入讨论如何建立一个服务于整个信贷业务场景的用户画像特征体系。今天的介绍会围绕下面五点展开:1.信贷场景用户画像构建方法2.信贷场景用户画像构建实践3.信贷场景用户画像应用4.扩展方向1.信贷用户画像业务目标QiFU奇富科技xataFun.从互联网信贷的业务视角理解画像需求,精准识别和理解潜在用户,提供个性化的信贷产品和服务,提高信贷风险决策准确性与管理效率,降低不良贷款率,提升盈利能力,实现持续发展。服务服务安全合规规模风险利润在核心业务场景中实现应用,以实现闭环效果。·提升业务指标:公司的核心目标是盈利,因此需要在获客、经营、风险、催收等环节提·提升对自身用户的认知:借贷市场不断变化,客群构成和质量都在变化,因此实时、准·提升客户满意度:通过画像构建,提高客户满意度,增加客户留存率。·防范系统和客户风险:通过画像构建的信息,有效防范潜在的系统性风险和客户风险。·配合合规改造:确保业务在合规框架内运营,配合合规改造的需求。2.信贷用户画像做什么信贷用户画像做什么外部数据精准化营销精细化运营精细化风险管理3.信贷用户画像构建技术难点口数据收集和整合口隐私和安全保障口数据验证和精准度评估□实时性和动态性·隐私和安全的保障:由于涉及到用户个人信息和隐私数据,需要保障隐私和安全。数据获取需要获得完整、合规的授权链路,采用有效措施确保数据的安全和保密。敏感数据需按照规则进行脱敏,避免泄密。·数据验证与精准度评估:构建用户画像后,需要进行有效性验证,确保在实际业务中的准确和可用性。基础画像可以通过groundtruth和交叉验证进行评估,而一些场景下可能需要采用问卷调研等方式进行评估和验证。·实时性和动态性:有些画像越稳定越好,如广告设备维度预测的性别,如果波动很大,说明模型构建得不够好。有些画像则越能反映用户行为和情景的变化越好,如我们通过用户埋点信息挖掘出来的需求画像。这些画像从数据获取、数据处理到画像生成都需要高效的数据实时处理和更新机制支撑。4.用户画像建模流程用户画像建模流程构建闭环式用户画像构建机制,运用专业技术规范画像构建流程,提升用户画像建模效果(提升模型指标、业务指标)数据画像理解数据理解数据准备建立模型画像评估画像发布一模型部署一模型监控一线上测试一线上服务一模型部署一模型监控一线上测试一线上服务一评价标准一技术指标评估一业务指标评估一技术指标评估一业务指标评估用户画像构建的核心流程包括以下几个步骤:·画像理解:从算法和数据的角度定义画像,清晰认知画像的价值。理解画像的定义对于算法和数据的角度是至关重要的。·数据了解与准备:了解数据的采集方式,进行数据探索分析,如可视化分析等。对数据质量进行评估,并进行数据清洗、变换以及特征工程,以满足模型的需求。·评估:制定评估标准,从技术指标和业务指标两个维度对画像进行评估。评估合格后,将画像或特征上线部署,并建立相应的监控和线上测试服务。·迭代与更新:画像的构建并非一次性完成,在需求变化、认知深入以及新的有效数据源增加的时候,需要对画像进行升级。画像的构建过程是一个闭环迭代的循环。这一流程确保了画像的质量、实用性,并使其能够适应业务需求的不断变化。信贷场景用户画像构建实践1.用户核心画像用户核心画像常房产负债/竞品核心用户画像主要包括以下九类特征:小微身份:表示用户是否为企业主、个体户等。虽然在工商数据中无法直接查找相关信息,但他们在用户行为、质量和需求等方面表明其与工商的小微身份相近。行业信息:可以基于国标的行业分类,并从风险和需求角度重新优化行业分类标准。采用规则和NLP算法进行构建的行业框架能更好地反映用户的行业特点。学历标签:包括专科以下、专科以上,本科以下、本科以上等分类。可能会细分专业、理工科等类别,甚至根据毕业学校的等级进行分类,以提高对用户风险的区分度。房产标签:包括是否拥有房产以及房产价值,并通过挖掘房产地理位置,关联小区、周边商圈、周边POI分布、人流等信息。车产标签:通常来自第三方数据,包括车辆的基本信息,如车辆的品牌、档次、价值、年限、残值等信息。收入标签:采用多种方式进行建模,可以是回归、多分类或单分类等,结合业务指标评估收入分的稳定性和可解释性。负债信息:挖掘用户在消金、小贷、消费贷、银行等机构的负债信息,了解用户的整体负债情况。竞品信息:通过特征挖掘,获取用户在消金、小贷、消费贷、银行等领域的竞品信息,帮助了解用户的竞品使用情况。2.用户画像体系策策略用户画像体系以业务需求为驱动,从信贷场景的策略应用到画像特征粒度,建立涵盖核心画像、基础画像和特征画像三层的用户画像体系年龄年龄小微/泛小微身份设备偏好行业职业学历房产车产兴趣地域收入负债/竞品多头航旅消费PreA质量分基础画像PreA意向分完件意向分税务特征企业经营特征动支意愿分人行征信竞品解读信用子分AP撞库特征电销行为特征电销标签特征INR特征点击登录等埋点注册完件授信动支还款逾期催收调额调价关系网特征信息流广告特征短信营销特征APP偏好资方拒绝性别画像的特征体系还包括基础画像和特征画像两类。基础画像包含通用的年龄、性别、设备偏好、APP偏好,以及用户的习惯、所属地域,所属地域可以衍生出许多属性,比如出生地、手机和身份证所在地。除此之外还有航旅,比如坐飞机或者坐高铁的习惯,以及Wifi接入,POl的信息等第三个层面就是特征画像,其粒度更细,涵盖范围更广。它包括信息流广告特征,主要是从RTA请求中抽取的特征,如不同媒体的请求、广告位,请求的次数、时间分布、设备信息等等,都挖掘成设备广告特征。此外,还有一些营销类的特征,如电销的营销行为。还有埋点的特征,对于埋点特征,用户通常已经下载了APP,并且大部分已经完成了注册,用户再去登录,一定与其需求或者关注点是强相关的,所以从中可以挖掘出很多特征。我们也会把业务中各个环节的累积行为数据挖掘成相关的特征,比如从注册到授信、动支、还款、逾期、催收等,还有调额调价这种业务的主动行为,以及经营行为带来的用户反馈,也建成相应的特征主题表。除此之外,为了方便使用,在提供特征宽表给业务使用时,往往也会结合具体业务侧的应用建立分场景的模型,如PreA质量分、PreA意愿分、动资意愿分、信用子分等。对小微企业主,挖掘企业相关的经营类的特征,比如上下游供应链、税票等信息。除此之外,我们也会通过关系网的特征,去挖掘一些画像标签,或者是一些特征字段。在常规数据源和手段之外,关系网往往能带目标3.信贷场景画像构建技术框架目标4.多数据源融合多数据源融合从特征、模型子分或置信度三个维度融合在实际中,多数据源的融合通常采用三种主要方法:·特征层面融合:将不同数据源的特征整合在一起,形成一个宽特征,并建立单一模型。这是一种较为通用的方法。这种方式有一个问题,就是在引入新数据源的时候,需要将新模型应用到所有的样本上,难以平滑过度。·单独建模再融合:不同数据源分别建模,然后使用多个模型进行融合。例如,对外部数据和内部数据分别建模,然后将两个分数进行回归融合。这种方法可以降低不同数据语境之间的耦合,但也可能引起更新问题,类似于特征层面融合。·置信度融合:不同的数据源单独建立模型,利用各自的模型分给画像赋置信度,最后融合时取最高置信度的结果。对于实事类的数据样本,我们可以把置信度赋予最高值。这种方式的优点是易于向前兼容,但整体指标会比前两种略差。选择合适的融合方法取决于具体业务场景、数据质量和模型效果的要求。每种方法都有其优点和缺点,需要根据实际情况进行权衡和选择。5.画像部署画像部署画像部署画像部署将用户画像产出结果封装以满足业务系统在不同场景的使用需求用户画像特用户画像特征体系6.画像效果及价值评估画像效果及价值评估从模型技术指标、整体准召、业务指标三个层面判断效果和检验价值7.画像管理画像管理标准规范标准规范→衍生逻辑、报告模板、命名规则、准确性验证信息融合→多数据融合、不断提升准确率和覆盖率版本管理→多版本并行、平滑切换、影响最小化监控报警→早发现、早解决(执行情况、数据稳定性、业务指标)知识体系→清晰、全面(字段解释、加工和挖掘方案)画像服务→可视化、在线离线(生产、部署)、特征库、自动化建模、高效回溯·建立标准规范:制定逻辑衍生、评估报告、命名规则等标准,确保评估报告完善,验证准确性的标准得以实施。·口径统一:实现核心画像的横向打通,统一口径,确保新老画像的一致性。·信息融合:强调多数据源融合,不断提升画像的准确率和覆盖率。·版本管理:管理多版本并行,实现平滑切换,最小化对系统的影响。·监控报警:提前发现问题,早期解决,包括执行情况、数据稳定性以及业务指标等的监·知识体系:建立清晰、全面的知识体系,包括字段解释、加工和挖掘方案等。·画像服务:实现可视化管理,涵盖在线离线生产和部署、特征库的维护、自动化建模以及高效回溯等功能。用户画像应用从增长获客、风险管理、客户经营等角度赋能信贷业务优化反欺诈策略提升A卡性能优化准入策略提升目客群规模优化额价策略降额xx亿提升B卡性能精准营销促完/促动/召回等提升C卡性能优化催收策略精准获客降低获客成本扩展方向采用前沿算法技术,如知识图谱、图计算、大语言模型等Q&AQ1:公司大模型相关在做的有哪些应用的探索,效果怎么样?A1:大模型已经在催收、电销等业务中得到明显的应用效果。A2:A卡(ApplicationScoreCard)是指贷前准入环节的申请评分卡,用于贷前审批阶段对贷款申请人进行风险评估;B卡(BehaviorScoreCard)用于贷中管理,利用借款人的还款及交易行为,结合其他数据预测借款人未来的还款能力和意愿,推测用户是否会逾期。B卡通常又分调额B卡和交易B卡;C卡(BehaviorScoreCardi)用于贷后催收管理,在借款人当前状态未逾期的情况下,预测未来该笔贷款变为坏账的概率。A3:通常是一些结构化的表。举个例子,比如用户有没有车子,用0和1表示,另外我们会把标签的概率值或置信度也带上。还会包含模型版本、更新时间、数据源。Q4:可以再深入介绍一下模型融合吗?A4:同一个用户不能在同一个标签下面有多个互相冲突的结果。比一个用户有没有车。可能在征信报告里看到他是有车贷的,那么大概率是有车的,还可能通过外部保险数据中看到他有车险,还有可能会用内部所有数据建模预测其有车没车的概率,最终可能得到多个结果,而业务希望的是只有一个结果,才简单好用,不会使策略过于复杂。这时就需要将结果融合成一个,这里就是刚才提到的三种方法,三种方法各有优劣,目前我们更多采用的是置信度融合的方法。Q5:可以介绍一下深度学习的主要应用场景吗?A5:深度学习的应用场景,首先就是文中提到的ABC三个卡片,还有一个场景是挖掘行为序列模型。另外,自然语言类相关处理的模型也会用到深度学习的算法。我们不会纯粹地为了使用前沿算法而去用,而是结合具体业务需求。Q6:如果样本包含很多客群,分客群单独建模效果会更好吗?A6
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年宁夏货运从业考试试题题库及答案
- 2024年用人单位劳动协议标准化文本版B版
- 《客服的重要性概述》课件
- 2024年住宅小区车位配建及销售合作协议2篇
- 考点2 词语(成语)的理解与运用
- 2024年停薪留职员工职业规划与发展支持协议合同3篇
- 2025施工工程承揽合同格式
- 2024外来单位进场建筑装修施工安全协议及承诺书3篇
- 2024年度农业科技项目委托投资合同3篇
- 2024年汽车租赁与广告合作推广服务协议3篇
- 学院校食堂餐饮企业承包经营退出管理制度
- 国开电大本科《人文英语4》机考真题(第十五套)
- 三维超声输卵管造影的应用课件
- 高压旋喷桩检测方案
- Unit1 My classroom Part A Lets spell(说课稿)-2022-2023学年英语四年级上册
- 查看下载郑州电视台商都频道简介
- 2023年国开大学期末考复习题-10861《理工英语4》
- 公安廉政心谈话六篇
- 【要点解读】《实践是检验真理的唯一标准》论证逻辑图
- 数字电子技术(山东工商学院)知到章节答案智慧树2023年
- 商务礼仪(山东联盟)知到章节答案智慧树2023年山东财经大学
评论
0/150
提交评论