北京金融科技产业联盟-FATE隐私计算开源框架金融行业技术应用报告_第1页
北京金融科技产业联盟-FATE隐私计算开源框架金融行业技术应用报告_第2页
北京金融科技产业联盟-FATE隐私计算开源框架金融行业技术应用报告_第3页
北京金融科技产业联盟-FATE隐私计算开源框架金融行业技术应用报告_第4页
北京金融科技产业联盟-FATE隐私计算开源框架金融行业技术应用报告_第5页
已阅读5页,还剩109页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1evelopmentReportofOpenninancialIndustry北京金融科技产业联盟2前言本报告由北京金融科技产业联盟开源专业委员会组织编写3鹏柚文梓国:杨强涂晓军聂丽琴鲁金彪李艳程勇文定周雍恺黄安埠昕晔张宏李克鹏苗天麒远健梁晔华李钰高翔杨扬统稿:丁文定份有限公司、深圳致众银行股份有限公司、中国银联有限公司、建信金融科技有限责广发银行股份有限公司、北京神业银行股份有限公司、腾讯云计算(北京)有限责任公司:、华夏银行股份有限公司、泰康保险集团股份有限公司、星环信息科技(上海)股份有限公司、同盾科技有限公司、上海同态信息科技有限责任公司、神谱科技(上海)有限公司、神州融安数字科技(北京)有限公司4 8 5概述迈入了重要发展阶段。障用户隐私安全同时,。6本报告对主流隐私计算开源框架和金融业隐私计算开源生7值投资到技术分析,8(一)数据需求推动发展隐私计算的必要性据,与场景数据,9(二)开源成为重要途径源隐私计算技术通过开放、连接、协作、2.开源实现隐私计算技术安全可证明源隐私计算技术及第三方机构安全认证难以彻底解决安全可证供方本身潜在的作恶风险,题,从而满足安全可证明,3.开源助力隐私计算技术普惠。(三)政策环境提供支持数据来源:中国信通院《隐私计算白皮书(2021)》鼓励金融机构将开源技术应用作为提高核心技术自主可控能力年)》(以下简称《发展规划》)将“充分释放数据要素潜能”列为未来四年八项重点任务之一,要求“推动数据有序共享”。社会主义市场经济体制提供坚强支撑”。各行业积极响应国家、用的“可控可计量”3。22020年国务院办公厅印发《关于构建更加完善的要素市场化配置体制机制的意见》,要求“探索建立统理制度,提高数据质量和规范性,丰富数据产品。制定数据隐私保护制度和安全审查制用于大数据环境下的数据分类分级安全保护制度,加强对政务数据、企业商业秘密和个人数据的保护。”32022年国务院办公厅印发《要素市场化配置综合改革试点总体方案》要求“探索‘原始数据不出域、数的交易范式,在保护个人隐私和确保数据安全的前提下,分级分类、分步有序推动部分领可控可计量’”。金融行业对运用开源技术平台开展高质量金融场景应用建设的(一)特点概况间fted1.用于安全和私有深度学习的Python库tedoutLabs成了安全多方计算、同态加用预先构建的协议或使用TF-Encrypted的可插拔架构构建和测syloe提供一个在可信执行环境(TEEs)中执Asylo架,它包感通信的功能和服务,有的出现使得更多的开发人员能够使用MesaTEEpacheTeclave4和云服务流必须经过关和访问控制安全地将云用户的数据和代码执行隔里的操作系统、虚拟机管理器 (VMM/hypervisor)、或相邻的其他虚码的完户也可保远程nook1编程模型1.工业级框架,统一计算,存储,通信抽象层,适配不同的计算引擎,存储引擎,通信引擎2.提供一站式的联邦模型企业级服务解决方案。提供多插件支持联邦学习企业和科研应用3.支持主流的分类、回归、聚类和迁移学习的联邦化算法4.提供多种安全计算协议支撑上层应Fle据为主有提高件系统arn4高2.采用云原生部署方案。数据存放在HDFS,用MySQL存储系统数据,通过eFL51.基于飞桨(PaddlePaddle)和netes度学习设计,提供在计算机视言处理、推荐算法等领域的略及应用场景规模分布式集群部署发接口允许各方定义私有化的基础编程框架,并封装了一些学习数据集1L1动a51.集成了3方参与的安全多方计算TensorFlow计算框架r7点约束方面的差的模型时遵守//联合训练arn/采入算2.OpenFL是适用于数据科学家的灵活、可扩展且易于学习的工具indSpor/无户智联VFlareVIDIA研究人员将现有的ML/DL工作流程 快速适配到联邦学习架构上/弹性联邦学习解决方案,支持两个合作训练eFe/跨ate2训供计hub3用服务开发平数据计算//XFL翼数联邦学习数安全计算/高性能、易扩展、易集成,让开发者实现轻量级二次开发,帮助用户在不同应(二)应用情况1.PySyft深度学习框架中使用,状态或转换,并且可以链接在一起。链结构的头部始终有一个raTEE四,容器化部署方式,支持私有化、链以插件化方式链接。tHSM的功能,安全地存储和控制对密钥/证书的访问。最后,MesaTEE已经在所有安全级别(包括Level5的IntelSGX)中支持了GBDT,线性回归以及神经网络。主流的AI框架(例如大的联邦学习开源社区。TensorFlowFederated(TFF)是由谷歌公司开发的开源框s需研究算法的细节;通过在强大类型的功能编程环境中将TensorFlow与分布式通信运算符结合在一起,简洁地表达自定义联邦算法。借助TFF,开发者能够以声明方式表达联合计算,rnerFedlearner是字节跳动于2020年开源的联邦学习平台。实现了一个基于GRPC的通信协议,并以算子的形式集成到方式上,Fedlearner拥抱云原生,采用基于字节跳动前期在推荐和广告领域积累了成熟的机器学习建FL学习场景,分为编译阶段和运行阶段。编译阶段定义联邦学习任全称是联邦学习应用程序运行时环境(NVIDIAFederatedNVIDIAFLARE主要功能是帮助开发人员能够在真实场景中bPrimihubMPC(多方安全计算)、FL(联邦学习)、Primihub开源框架有以下特点:一是融合了多种隐私计算(一)发展历程浪潮,源技例,作为国内最早的一批对外开源的金融机构,由微众银行在源社区建设,的情强的头部金融机构,随着这些头部金融机构在某一开源技术领域的技术能力持续积(二)路径及形式与开源隐私计算现状产品的趋势愈发明显,,还是应用测试层面,发成本,2.金融行业参与开源隐私计算生态建设里程碑(FederatedAITechnologyEnabler)首次对外开源,为机器金融服务企业。同年,以光大科技为代表的金融机构基于合建模的双方在生产环境中验证了隐私计算技术在金融产品智月参与CCFAI方向及信用评分与信用评级国际会议发表专业报2021年3月,FATE社区牵头的首个联邦学习国际标准《IEEEP3652.1GuideforArchitecturalFrameworkand银行、农业银行、建信金科、微众银行、上海浦东发展银行基于隐私计算开源框架Rosetta开发了数据2022年,光大科技发起基于联邦框架的半监督学习训练范头的两项课题《金融行业异构隐私计算平台互联互通技术规范》(三)痛点和需求与业务及场景相关的经验。二是隐私计算框架面临安全性与可用性(计算效率)的平衡h益恒定定律”[5],即天、技术能力的进步,开识展将起到积极促进作用。四是当前隐私计算框架暂时无法有效解决金融机构内部数(四)隐私计算开源生态位全景图图1金融业隐私计算开源生态位全景图态,整体分为开源项目、开源社区、图2FATE发展里程碑业积极贡献,推动隐私计算开源发展3、隐私计算开源框架在金融行业应用广泛FATE是国内较为成熟,金融行业参与较为广泛的开源隐私(一)框架特点E、算法易开发、产品易集成、生产易运维、FATE为联邦学习隐私计算应用,提供了从模型研发阶段的套3FATE平台系统架构2.部署架构灵活可配EggRoll的FATE部署架构arkFATE图6网络互联架构(二)一站式解决方案算法库实2.联邦调度引擎联邦调度引擎(FATE-Flow)基于共享状态调度架构和跨数据中心的多方安全通信,实现了端到端全流程的多方联合任务图7FATE-Flow多方联合任务安全调度3.联邦可视化组件联邦可视化组件(FATE-Board)是联邦学习建模可视化和解图8联邦模型可视化4.联邦在线服务框架联邦在线服务框架(FATE-Serving)为FATE提供联邦在线联邦学习,9FATE-Serving架构邦计算引擎图10EggRoll架构云图12FATECloud核心功能(三)灵活适配r(四)云原生(一)技术发展展望学习将得到广泛应用2.多方异构平台互联互通势在必行3.支持异构基础算力设施的能力持续发展等多个基础设施方面做了大量的抽象与统一工作,对于有投入统一的计算通信接口不仅使得企业可以灵活配置与使用开4.云原生管理有必要进一步强化05.与大数据、人工智能等技术生态结合将更加紧密隐私计算尤其其中的联邦学习技术是在站在大数据处理技(二)生态建设展望1.金融行业参与开源生态建设形式将走向多样化1:2)组织方式上,按主题成立金融特别兴趣小组(SIG)形SIG和审批等,的架高效、稳定迭代,2.金融业将为开源生态发展提供持续动力2程,3参考文献[1]徐磊,魏思远.金融业隐私计算的内涵,应用和发展趋势[3]赵大伟.我国互联网消费金融相关问题研究——基于金融联邦学习研究与应用趋势报告.[5]《NoFreeLunchTheoremforSecurityandUtilitynQiangYang[6]刘韵洁,黄韬,汪硕.关于未来网络技术体系创新的思考4(一)应用概况身科技能力,(二)应用场景1.银联关于小微企业信用评估联合建模案例案例背景案例介绍5图15银联小微企业信用评估数据合作方案2.微众银行关于小微企业信用风险管理中的应用案例案例背景险管理来说,相关数据可以包括央行征信报告、案例介绍6间结果(而不是原始用户数据)来找到双方的交集用户。使用纵向联邦学习可以在保证数据安全的情况下训练联合通过使用FATE,微众银行与有发票数据的合作公司一起完成了纵向联邦建模,使用的联邦训练模型为纵向逻辑回归(Hetero-LR)。不同于传统的逻辑回归,微众银行和合作公司模型,使用加密的中间结果进行交互,率明显下降,如下图所示。7图16微众银行基于FATE改善小微企业贷款模型效果产业价值的数据与其他公司拥有的小微企业特征数据结合起来进行联合3.微众银行跨银行反洗钱应用案例案例背景8案例介绍反洗钱场景使用的联邦训练模型被称为横向逻辑回归(Homo-LR)。所有银行都提供相同特征维度的数据,这意味着。9图17微众银行使用联邦模型前后效果对比产业价值4.光大科技交叉营销案例案例背景交叉营销旨在发现客户多种需求并有针对性地进行产品组案例介绍图18团险职域营销逻辑流程图产业价值通过联邦学习可以帮助金融机构以密态的方式共享各自的5.光大科技联合风控案例案例背景案例介绍E图19机构客户风险评级对照实验结果率也会得到小幅度的提升。表4机构客户风险评级存证字段产业价值联邦学习在风控领域的应用一直是金融行业重点关注的领不对称而无法有效识别风险的问题。6.广发银行风险识别案例案例背景邦建模的可行性,案例介绍图20联邦建模平台架构(2)模型选择及评价款存在风险的客户,0.8240.7790.8240.7790.8240.8160(3)实验设计实A机构测试集B机构测试集10.8890.889

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论