大模型在金融行业的落地探索_第1页
大模型在金融行业的落地探索_第2页
大模型在金融行业的落地探索_第3页
大模型在金融行业的落地探索_第4页
大模型在金融行业的落地探索_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大合作、大创新、大共存

关注问题:后发劣势、可解释性、社会智能等

金融机构眼中的大模型技术

数字化转型助力大模型

数据信托助理大模型

大模型治理

CONTENTS

数据概念辨析

1.概念辨析:数据、标签、特征、信息

2.信息的贡献度:数据>>模型

3.数据与大数据的辨析:直接数据与间接数据

3.1大数据、大模型、大风控

大模型定义

・《自然-机器智能》将大模型定义为网络参数规模达到•大模型通过文本语言等训练的模型,是一种感知智

亿级以上的“预训练深度学习算法"能,不是决策智能,更不是计箕智能

•大模型通过海量数据的训练学习,具备了强大的语言•感知智能:基于Eayes公式

理解和表达、思维桂推理等能力,在文本图像理解、•决策智能:基于先验概率

内容生成等AI任务表现出显著优势和巨大潜力・计算智能:基于计算公式

大横型是一种生产力的恒升“电力一一智力大模型与传统侬的未来急势:由共存到超越

•我们必须跟随时代潮流,逆眺流必然被陶汰•先共存:受制于il第五杂度高、可解理性整等问题,大

模型会与传统模型会共存;

•敌对的人:不屑——坚决一限制一迷茫

・友好的人:好奇一尝试——学习一使用•共存方式:大模型为中控,可解释性模型为外围

•后超越:随着大模型兔杂度降低、可解释性增强,大模

型将逐步替代传统模型

系统性:大尺度和小尺度之间存在关系

e③

复杂性:由小尺度数据特征的动态非线性和随机关联

传统风控可解释性:传播因子(阻碍因子)、传播路径

•认为风险就是不确定性《SCIembAlT尺度系统智能》介尺度的多模态建模方

•用潮呈管控风险

卜法

•用资本抵去睐管理风险传

・模型、压力;则试等均为工具导客户本身风险

"

尺③客户信用风险

用“爆量之内

智能风控:度③客户欺诈风险

•能够精准计量风控

・风险、利润、客户的最优化管理

智能幽是一个体系,是为银行战・服务

•客户主标尺MU39M

愿人场景经营风险

八场溟欺诈风险

内场景交易风险

,不是传统的“全面风险・理”工场景客群偏差风睑

/不仅雌:大人场景特定风险

・风险传播体系尺

•数据模型体系度

,技术实现(下一代):传播的刻色1风

*场景集中度风险

内场景“逆周期“风险

®场景"灰鹿牛"风险

k场景"阚幽’顾

大合作、大创新、大共存

CONTENTS

大合作

银行与AI公司合作开发

大・银行内部大数据的整合

适合自己的大模型

作•银行外部大数据的补充

,大算力合作:

•非核心竞争力的专业能力一定要外包

金融业的AI公司

•云上大模型

,实现垂直领域的精调模型

•迁移大模型能力

结合行内大数据与知识库

♦头部AI公司基础大模型

•以银行的小规模算力打造轻量级推理模型

(精调模型)

大创新

智能客服机器人投资分析与预测

责任客服VS非责任客户弱化人类情感

保险公司的产品推荐

提升客户粘性

智能风控、反欺诈、反洗钱其他垂直领域的金融应用

标注样本智能0A

写代码写算法智能写文稿

环境感知智能运营

大共存

由共存到超越

/共存:大模型随通用能力增强,将逐步超越传统模型的能力,但受制于计算复杂度高、可解

共释性差等问题,短期内,大模型和传统模型会共存。

/共存方式:大模型可作为中控,将传统模型作为技能进行调用。

/超越:随着若大模型计算复杂度降低、可解释性增强,综合性价比来看,大模型将逐步替代

传统模型

关注问题:

1.后发劣势

2.可丽性

3-社会智能

4."类征信

避免“后发劣势陷阱”

0“后室测6彳>~EUg

电对・耽检体现点g杯充分

法gmMfl、EQMI出电R的■分

©»SWtt-------------颔礴整合-----------O-旃究--------

要“俯首甘为孺子牛“,做大量的、要“横眉冷对千夫指",要做革命要"甘做无名英碓",逐步建立算

耗时间的的数据工作,以实现对模性的、基础性的科技改造来实现业法研究能力,进而“随风潜入夜,

务全潮型的互联互通,进而实现对

型的效能的提升润物细无声”的实现智能血控对业

业务的敏捷支持务完美支持

覆其余回题

类征信

持牌?

可解释性平均智能

弱化可解释性中小银行备受挑战

白盒套黑盒

金融机构眼中的大模型技术

金融机构眼中的AI技术

生物特征识别知识图谱

客户身份验证、远程开户、刷对贷款信息、行业信息建立关系挖

脸支付等场景掘模型,通过机器学习进行模型训

计算机视觉机器学习算法

人脸识别、票据识别、场景识别深度学习、强化学习、自然语言

处理

智能语音自然语言处理

问答、咨询、理财、直询;身份识词嵌入、句子嵌入、编码-解码、

别、智能客服、智能理赔等注意力模型

金融机构眼中的大模型能力

人机交互能力

覆盖审计、财务、客服、营销承保理

赔等多个保险领域业场景

生成式能力一岗多能

代码生成贯穿远程银行全条线业务工作内容,覆盖

内容生成事前运营、事中辅助和事后质检等环节

金融机构眼中的大模型技术发展历程

基于

使用编码器-解基于

基于规则和统通过学习语基于自注意Transformer

码器架构,并Transformer的

计模型的方法言中的概率力机制的神的预训练语

通过大规模预训练语型

来处理语言翻分布来预测下经网络模型言模型(无

译平行i新斗库一个单词或标签数据预

进行训练

字符训练模型

Q9QQ0

---------6——O-o

统计机器翻神经机器翻语言簿模与TransformerBERTGPT

译(SMT)译(NMT)星曾到序列模型

金融机构眼中的大模型缺陷

技术缺陷:

外面证I:

•1.在个人信息收集阶段,当用

•通过文本语言等训绮的模型,•一是,算法黑箱.由于算法

户在使用ChatGPT时,会输入系统安全与稳定性

其智能类型是受限的,可见模型的黑箱运作机制,其运行自己的个人数据,依据《个人

ChatGPT只不过是一牌・如■规律和因果逻辑并不会显而易信息保护法》强询单独授权.

帼,不是决”能,更不是计见的摆在研发者面前.•2.在个人到雁的加工使用阶段,

ChatGPT使用了RLHF的训练方

二是,算法兽棒性。算法运

•法,用户使用过程中的输入和

<«Him:STBayes^C行容易受到数据、模型、训练

交互信息可能会用于其持续迭网络安全风险

方法等因素干扰,出现非£(棒代训练,进一步被用于为其他

用户提供服务,可能构成数据

人HUMS:特征。町第会有针对性的病•

共享,这时已与用户初最初使

•智能缺陷就星「h"GPT的使糕用目的相悖,根据《个人信息

用边界.•三是,算法歧视.算法以数保护法》需要更新授权.

.训练数据的获取.

•例如,在金融机构中,据为原料,如果初始使用的是•3ChatGPT

通过抓取互联网上的信息,可技术同质性风险

ChatGP坏是决策智能,用于有偏见的数据,无形中会导致能存在合规问题.

风险决策受限;ChatGPT不是生成的内容存在偏见或岐机,•4.数据泄涌.用户在使用过程

计算皆能,用于资本计量受限;引发用户对于算法的公平性争中输入个信,息,以及企业用户

谕入的各类工作相关信息,可

ChatGPT是语言领域的感知智议.破根主■自资本89,

能导致公司敏感信息泄露.

体现为训练样本败■.

能,可以以文字助手的身份嵌•5.算法缺陷导致数据主体行权学习局限性性风险

入大部分和文本相关的工作.困难.如更改权、删除权、访

•n«±:*问权等行权困越

数字化转型助力大模型

I生产关系适应生产力的发展

金融领域转型的三要素体现为:

♦金融机构的生产资料:

[1]掌握先进生产力的人

『/【2】数据

N金融机构的生产力:

[1]新业务

[2]新科技

♦金融机构的生产关系:

[1]部门边界

[2]资源分配

技术的转型、金融科技转型、银行的三次转型

技栩a>熊加K^LLY-.接木的冲突—nMbKMAIMcM一英一生产关系的重送

人民银行科技司雌季伟:金融科技.,帕微■.,兴于技术,•TtML.Emi

银.业部的曲g知?

行•生产力充实了生产关系的事业都成功了

型►nmmr:nram.,MMMM*..Mraniaw

•蹴

新技术革命

•技术

•E[金的II界冲击困ms.人员分配

外•从短模导向到份

・户的JB・

因值导向、,&化•新市场:边界合理.清・

成功写失败?..k

导向•新客户:•理论上,没有任何一个业晨、

♦新业务:创原产品■务属于电子银行部;

,实健上::姆像件么聊做,

11]第一步:调整部门边界(生产关系)好放生产力但没有件么自己能调的算

・明确边界:渠道一立台一生

|2]第二步:科技范・、业务范•两个方面发展生产力态」

0[[3]第三步:生产力充实生产关系,盘定新的部门边界

数据信托助力大模型

数据驱动业务的发展的逻辑

第一阶段第二阶段第三阶段

人商圈的数据与金融圈的数据各自®支付产生了"跨界"效应③"标准码"规范支付入口

相对独立发展®支付使得商圈有了金融圈的数据因"断0[连+征信持牌"规范数据

®商圈的数据孤岛3就形成了互联网金融业务使用

为金融圈的数据孤岛®一浪:互联网平台主导③二浪:持牌金融机构主导

数据驱动模型与算法发展的逻擅

智能风控领域模型算法的发展:

专家评分卡f逻辑回归一集成学习、深度学习

第一阶段底]三个阶段

依籁专家经豁经胧与散据奥动^Msaeai

侬:优点:工多采用专斜J分卡蝇

/可解释性强/准确性高/复杂硒模型快速识别

/客户体验好

:皎点:

X维护成本高X无法判断未知风险X对系统稳定性与速度要求高

X对专业性要

求高

集成学习模型深度学习模型

久多采用集成学习与深度学习模

数据要素化的发展逻场

断与生俱来的是:数据与众不同的是:数据与日gits的是:

具备三重属性:资源属性、技价值的特殊性:数据价值不在于数数据要素的外部性对促进数据价值

©术属性、金脓属性.据本身,数据价值来源于数据的技交换的数据要素市场化的客观帚求.

术加工,体现于数据的权益支配.

发展逻辑

雌的与生俱来、与众不同、与日俱增,共同决

定了数据形态变化必将遵循:

i.由数据记录到数据资源、

2.由雌资源到数据资产、

3.由数据资产到数据要素、

4.由数据要素到要素市场化

理解数据资产

1数据资产必须有价值2数据资产价值必须可以衡量3由特定主体合法拥有或者控制

资产的会计计・方法总结

□历史成本法:获取资产时实际付出的成本

□公允价值法:交易双方自愿交易的价格

口现金蜥现法:资产未来产生的现金流量按照一定方法折成当前价值

□按照资产当前情况,重新获取同样资产所付出的代价

□预计售卖后得到的净值

数据资产的商业模式探讨

数据交易所居银行信托

政府主导的数据交•个人数据资产采用•信托财产"双重所有权”与

易所模式涌现银行模式进行管理数据资产所有权和控制权分

离的特质具有契合性

第三方专业技术和和运营

政府资质完成监管、•实现个人数据的增•信托业务创新可以为数据资

加密等合规支持值和有序流通产创设更广阔的应用场景

•个人大数据资产的­数据的正外部性与相关性,

管理与运营综合服更多数量和维度数据的汇集

务系统会产生更有价值

©数据信托介绍

信托(Trust)是指委托人基于对受托人的信任,将其财产权利委托给

受托人,并由受托人针对受益人的利益或特定目的,按照委托人的意愿,

对信托财产进行独立的萱理、处分和风险隔离,以自己的名义管理和处

分信托财产的行为。

当上述"财产权利"变为"数据"时,就形成了数据信托。目前对

于数据信托定义的内涵和外延还在不断变化,但基本形成如下共识:数

据信托是一种关于数据要素的、市场化的、制度化的、功能化的、结构

化的、形成共识的数据生态框架。

在数据要素市场化阶段,信托的成熟框架,叠加数据商品的金融属

性增强,有助于市场化地促进数据要素的合理配置,发挥数据要素对经

济社会发展的乘数效应。

数据信托助力数据大市场

1.嘘要素化过程中的信托双层所有权架构优势2.数据确权中的数据信托制度优势

3.数据流通中的

信托风睑隔离与信任制衡优势圆

5.雌要素治理中的赎砥服务优势

大模型治理

从技术角度:万物皆模型

万物皆模型

EVERYTHING

MODELS

•人类画家的不同主要是风格

・风格即模型

・调整模型参数,可以得到这个画家一系列作品

•基于大模型的原始能力基础上二次开发

从哲学角度:

从哲学角度:AI时代中

主体与客体的关系在潜移戢化

1、潜移默化

•搜索引擎

•主动推荐断章

你诂在杯上看反I景,

2、潜移默化宥忒景的人在楼上看•你。

•我在利用AI扩展我的智能

明月装饰了你的窗子,

•AI在利用我展示他的智能

你装饰了别人的班。

大模型的治理

01里产力

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论