![2022金融业数据应用发展报告_第1页](http://file4.renrendoc.com/view15/M00/12/32/wKhkGWeoldOAZ7AiAABRTDk6qSU166.jpg)
![2022金融业数据应用发展报告_第2页](http://file4.renrendoc.com/view15/M00/12/32/wKhkGWeoldOAZ7AiAABRTDk6qSU1662.jpg)
![2022金融业数据应用发展报告_第3页](http://file4.renrendoc.com/view15/M00/12/32/wKhkGWeoldOAZ7AiAABRTDk6qSU1663.jpg)
![2022金融业数据应用发展报告_第4页](http://file4.renrendoc.com/view15/M00/12/32/wKhkGWeoldOAZ7AiAABRTDk6qSU1664.jpg)
![2022金融业数据应用发展报告_第5页](http://file4.renrendoc.com/view15/M00/12/32/wKhkGWeoldOAZ7AiAABRTDk6qSU1665.jpg)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
20229第一章概 第二章数据要素价值体 第三章数据能力建设与运 第四章技术现状与安全防 第五章风险挑战与应 第六章发展展望与保障体 第七章典型案 据国际数据公司IDC预测,025中国数据量将高达48.ZB,占全球数据总量175ZB的27.%,数字化时代已然以数据为核心的数字技术成为驱动技术革命和经济社会发展2021年3社会发展第十四个五年规划和2035治理方式变革。2021年2(20222025,将数字思维贯穿业务运营全链条,注重金融创新的科技驱动和数据赋能。望等视角出发,结金融行业先进实践对大数据应用提升金融司、中国银行股份有限公司、中国建设银行股份有限公司、限公司、华夏银行股份有限公司、中国银联股份有限公司、这些技术与金融业务深度融,形成金融大数据,并逐步在数据等。这些不同来源的金融大数据通过整、分析、挖掘此外,金融大数据与人工智能技术深入融实现智能金年来国内外种法律法规的制定与实施,以及人们对于用户用新的技术来解决金融数据的跨机构间的作。目前,学术融,探索多方安全计算、联邦学习、可信执行环境等不同域的基础下完成跨机构之间的联计算、联建模、联查泛的领域。金融联风控、联营销、存客运营、反欺诈、反洗钱等多种金融应用场景均已开展基于隐私计算技术的金融数据的技术融应用目前处于加速探索阶段,种20198(FinTech)发展规划(2019-2021力、加大金融审慎监管力度、夯实金融科技基础支撑,为金金融业数据融应用通道,破除不同金融业态的数据壁垒化解金融信息孤岛制定数据融应用的相关标准规范,2020年4整和安全保护以及制定数据隐私保护机制和安审查制水平发展的同时可以深入地探索数据要素化的实践经验。2020年5《数据共享有序流转与融应用为加快建立现代中央银行制度推动金的意见》的一个有力举措。同时,种数据安全相关的政策法规相继制定和颁发开放,推动技术创新和经济社会发展。2021年6月发布的(202191,义务承担社会责任等,是我国首部以“数据”或“数据安全华人民共和国个人信息保护法》(2021111日起施行标准相继制定。20185转变。20211丢失或非法使用等情况。20212息保护及信息主体项法权益。下一步,人民银行将在确权,更便捷的数据交易,更理的数据使用,继续激发市场数据作,在金融数据监管日渐严峻的当前,金融数据的应多方安全计算等隐私计算技术继续推动金融跨机构间的数金融企业需要从企业级视角结业务需求对数据应用进金融业纷纷加强数据多元融数据资产化数据安全规等方面建设,为业务场景提供智能化、实时化、产品化和平化的数据服务并不断沉淀提升平基础能力,助力推进数字化转型任务下面从数据要素化数据服务化、能力平化三个方面对金融业大数据应用发展特点展开介绍。数据多元化金融业大数据应用呈现多元融态(AI(BI元融新阶段。等原则,从企业级视角出发,协同业务和技术,共同构建企的标签体系、用于多维度分析的多维数据模型、用于关联分首次将数据定位为新型生产要素,与土地、劳动力、资本、技术并列;2021年6月10日,《中华人民共和国数据安全种法规、行业标准的密集出给大数据应用安全治理提出了越来越高对非结构化数据的保护从关系型数据库到式样的非关系提供更完善的保护。OCR与设备指纹等多种人工智能技术,结等多个环节互联互通为平的消费者提供精准化、个性化的索引擎、OCR与生物识别技术等多项人工智能技术的融的资产配置方案同时结营销咨询、资讯推送等增值服务,有效降低交易成本并提升服务体验。当前的情况推荐最契用户需求的服务;在风控场景中,系灵活敏捷的数据处理流程、低代码甚至无代码的开发模式、于组件化数据服务的低代码平应运而生。低代码平的特,扩大数据标准的建设,扩大组件的范围,使数据服务的并对外能力开放。服务中化是实现这一目标的有效途径。目前,众多互联网化企业都在构建中,如:业务中、数据中,形成服务中化。其中,业务中将企业的核心能力以数字化形式沉淀为种服务中心;数据中可将海量数据聚、治理成数据资产,提供机器学习、深度学习等基本组件,形成数据技术一体化的服务平,可以便捷地复用中积累的数据和技术,更迅捷地向客户提供高效服务。数据中为业务中提供数据服务,业务中为客户提供服务并“业务数据化、数据业务化”的可持续发展闭环。服务中化可以实现对企业内部资源高效整、将业务数据化、数据技术能力平平交付敏捷化大部分金融企业的数据平设到数据中阶段,如何更快捷的交付数据产品和服务,是层面对平交付敏捷化建设展开介绍。在方法论层面,拥抱敏捷。一方面,企业推动平DevOps转型,透过自动化“软程标准化、自动化,进而实现平软件的交付敏捷化。另一方面,在全面开展数据开发运营的同时,通过串联项数据隔离等技术优势,实现大数据与云原生架构的融。技术平通过微服务+容器技术,推进数据加工和服务能力的整业务快速的变化与大量长尾需求,这要求数据中在业务化的过程中保持最大程度的开放。目前来看,数据中通过构建数据业务化的过程涉及到数据采集、数据治理、数据聚、数据服务、运行监控等环节。数据中为数据开发环节开数据集成开发环境,帮助应用租户自助式的创建数据服务API满足业务化需求;在模型开放层面,模型业务化的过程涉及到模型训练、发布、反馈迭代三个过程,数据中向应用租户提供了集成化模型训练平、统一的模型资产管理服务、MLOps服务、后评价服务,支撑类人工智能模型发布为API;在标签开放层面,用户标签是业务强相关数据,数据中通过轻量化标签开发模式支持业务部门自助式进行API可控化。平自主可控化,主要指基础硬件、基础软件、应加快推进数据价值化、发展数据要素市场是数字经济的关整理、聚、分析等,形成可采、可见、标准、互通、可信经过近些年的理论研究及实践经验证明数据治理和数所使用的词语或短语能确切表达数据类目的实际内容宜选择分类对象的最稳定的本质特性作为数据分类的按照控制数据的主体进行分类为目前最常见且直观的电商平、支付平、物流企业、电信企业、金融企业、社中介获取类数据,加工处理后向数据需求方(企业)直接政府部门在履行公共管理职能的过程中积累的大量数参照《信息安全技术网络数据分类分级要求》中的资料性附录A.2金融行业数据分类分级,根据金融机构所管辖并按照规要求,对不同规等级的数据,从系统权限、安对于整个系统的性能亦有了更高的要求。因此,如何在规的前提下完成高性能的系统运算成为数据治理系统架构的新个视角对本行数据资产进行内容开放共享的目录化管理工具,是数据资产的账。数据资产目录可以为业务需求场景2-1IT即算法+场景+基础型数据资产=提炼后信息的组服务型据运营管理手段,有助于企业间进行更广泛的数据作并由2-2数据资产目录构建的目标是通过建立统一的数据资产并建立统一、简洁的数据资产管理平。数据资产目录的构建目标、原数据资产目录的构建目标、原则一、数据资产管理标规图2-1部门、分支机构对监管数据的提取、报送、整等需求张Excel清单,比如通过数据资产管理平,持续进行数据需要考虑其可切分、可整等特点,不同数据资产间的整或单独数据资产的切分都会大大影响其原有资产状态下的在数据资产定价体制机制构建过程中,需要凝聚类主体力量,利用类主体在数据资产市场中形成的力来推动数设施与平的构建,并在落实市场规范和监管要求等方面发数据资产的定价可以分成数据资产估值与数据资产定可借通过专业的数据资产评估机构或先进的数字化评估系对于数据资产的定价可以在参照传统资产的定价的基被使用次数、历史供给价格、效果权重等因素的结,可以使用货币度量的估值方法与无形资产的非货币度量的估值方法相结进行综应用。数据资产的成本法是对数据资产进行生产或购置时所数据资产的收益法是通过估算数据资产的使用价值以数据资产的市场法是按市面上同等的数据资产的现行的数据资产市场,另外就是作为参照物的数据资产与被评估的数据资产之间具有可比较的参数等信息是可搜集到的,资产的正确性和完整性等方面进行度量的内部价值(IVI,IntrinsicValueofInformation)模型,有从数据资产对业务的实际使用效用方面进行度量的业务价值(BVI业务目标的实现和影响方面进行度量的绩效价值(PVI,PerformanceValueofInformation)模型。绩效价值模型从数据资产对组织业务的关键性前后组织的KPI综法模型是针对数据资产的特点然后就资产估值的目的,综考虑多方的影响因素和影响程度而构建相应模型的评估方法。综法评估模型需要数据资产的所有者结企业自身数据指标的丰富度,以及对数据的关注点和管控重点,自适应得对计算因子和计算权重进行调整和优化,于金融数据资产的定价模型参照实体资产定价模型大致可500MB着作和竞争的关系,方都将在考虑对手行为的前提下进被复制和传播也就容易造成数据使用者损害数据拥有者权价者站在从数据使用者的角度和围绕当前的数据资产可以方面需要交易活动的参与方积极主动地进行数据安全保障数据资产全生命周期管理是用于组织数据资产的设计地理空间数据生命周期模型由联邦地理数据委员会DataONE(NSF)资助。该数数据文件倡议(DDI)是大学间政治和社会研究联自上而下的顶层设计模式和自下而上的个击破模式两种从生产系统入手的常用建设模式包括企业数据模型建设模数据资产管理最重要的成功要素之一就是重视组织管碍。数据资产管理的核心目的是有效综运营数据以服务企使管理具流程化、规范化,结业务应用的数据资产管理不数据资产全生命周期管理是否成功取决于企业规性原则。数据治理应当符国家、行业法律法规和制度建设是数据管理和数据应用项工作有序开展的基构建金融机构数据治理制度体系,首先应符监管要求内外数据融共享。数据服务实质是众多独立离散的数据功能的大集。可平。技术类应用标准用于指导金融行业开展数据接口服务类的大数据基础平建设。在技术类标准的编制过程中,一金融数据服务的标准建设应遵循用户授权、安全规、分布采取的工作措施包括从企业层面对数据分布关系制定IT相关的成熟度模型,国际上有几套标准:COBIT5、GartnerI&OITScore、CMMI。Gartner的I&OITScoreITCOBIT5IT估,然后给出改进建议,也就是说,COBIT董事会层面。CMMI是对于软件组织在定义、实施、度量、控IT通用标准框架后,对数据中心服务能力进行归类、聚、分数据管理能力成熟度评估的依据是国家标准GB/T根据经典的DIKW(DataInformation-信息、过清洗、聚、计算等手段,形成更高阶的数据,即信息、变化,数据产品创新与先进技术和金融业务深入融。坚持变化,数据产品创新与先进技术和金融业务深入融。坚持找理方法,两者结促进数据产品创新团队积极主动解决品的创新提供更适的企业内部环境。建设数据资产平,实现数据资产和数据产品的当前,金融机构正处于数字化转型的深水区,尤其是动业务创新、资源整应用以及数据价值变现方向跨越,并与行业融度不断加深,金融机构数据规模急剧增大,数在数据内容、系统平和流程机制三个维度进行细化和落加工、分析和挖掘,在满足规的前提下,促进数据流通、数据资产由数据组成,兼具无形资产和有形资产的特《全国人民代表大会常务委员会关于加强网络信息保《全国人民代表大会常务委员会关于加强网络信息保24号(GB/T35273-2020此外,国际上ISO/IECJTC1SC32、ISO/IECJTC1WG9国际电信联盟(InternationalTelecommunicationUnion,ITU)(NationalInstituteofStandardsandTechnology,NIST)等组织和机构也正在开量化评估方面的指标产生波动,就需要使用数据资产要通过一个适的资产门户或资产管理场所,可阅读的方式查看资产信息后才能判断其是不是当前业务以通过文档的方式或建设数据资产管理系统以方便业务人数据资产持续性运营的前提是对数据资产进行整体性程当中出现种问题都有相对应的管理机制来指导相关人才能够保证数据资产运营项活动的顺利开展并取得预期与分配的机制。”这是中央首次在公开场提出数据可作为209年6月,中国信息通信研究院与中国通信标准化协会大数据技术标准推进委员会联发《数据资产管理实践(4.0版(DataAsst电子数据等。在企业中,并非所有的数据都构成数据资产,数据资产是能够为企业产生价值的数据资源。据资产价值的因素主要从数据资产的收益和风险两个维度2021年8月瞭望智库与光大银行联发《商业银行数对个环节尚未有深入的处理细则,其中数据确权可能是优有权,却被告知相关数据已经被服务商出售给其他商业机在技术上已经有研究人员提出了基于数字水印技术和区块目前我国的数据交易制度、标准还在不断完善的过程化管理委员会已发布的《信息技术数据交易服务平交易《信息技术数据交易服务平通用功能要求》(GB/T恪守内部规底开放与共享,并与业务不断深入融。数据安全、规、隐造数据安全规管理闭环。数据共享与开放的实现通过构建数据服务封装能力,如文数据采集是大数据平数据处理工作流程中的第一个来源主要包含类业务系统、类设备,以及外部数据源,广泛的大数据采集技术主要有ApacheSqoopApacheFlume、ApacheKafkaApachePulsar,IBMChangeDataCapture、FlinkCDC和OracleGoldenGate。技术产品基本情况如表4-1ApacheHadoopHDFS、Hive、HBase流平,集消息、跨平和异构的数据库环境中整,数据同BI按存储介质的不同,现代数据存储主要分为光学存储断创新的成果。Gartner2019(SSA)25.13制器(ECB)46.8%22.3%;而大中国市场固态存储市场销售额1.5680%。\h4-25非易失性内存(non-volatilememory,NVM)是指断\h\h图4-14-3以硫属化物为基础的相变材DRAMAHCI。AHCI更快、更高效地协议和接口,NVMe32GBpsIO1502001000IOPS模型更能发挥闪存介质的性能。NVMeOverFabric推动IPIP的每机器上的磁盘空间,并将这些分散的存储资源构成一和AI了大量的workload和可靠性特征数据,经过云端训练和本主流非结构数据服务的融平成为趋势。HPC正在向HPDAHDFSNVMeSSDHDD大幅提升,CPU反而可能成为性能瓶颈,传统的集中式存储和分布式存储架构都已无法很好应对。Disaggregated架构应运而生,他将控制器和存储介质分离,再通过低时延的4-4软件定义存储、超融基础架AHCI、SCSINVMeTB/PB仓库和BI目前常见的组件主要有:MapReduce、Hive、Spark4-5间结果,Reducesql(hql)sqlMapreduce、SparkHadoop3Storm、Spark4-6SparkAPIRDD(弹StreamTransformationStream(Continous(Streaming一是实时ETL。是数据实时传输的可计算通道,成为离线数控和展现业务、客户类指标,让数据化运营实时化。三是图4-2随着机构数据量快速增行,数据分析场景日益增多,高可靠和低延时的数据分析服务成为企业数字化转型的关键。越来越多的OLAP引擎致力于低成本和高性能的大规模4-7prestoMPP(Massivelyparallelprocessing),多个节点管GB-PB,Hive5-10MPPClouderaHadoopMPPSQLHadoop/SparkSQL查询cubeYandexPostgreSQL11PB主要解决PBANSISQL99SQLPB图4-3SharedDisk/Storage(共享存储SharedFailover数据RebalanceSharedStorage2080MPP等特征。数据仓库并不适这样的场景,而且成本较高。类格式的原始数据存储库。数据湖虽然适数据的存储,图4-4图4-5的schemaschema,schema图4-6ACID支持,可确保数据并发访问的一致性、正确性,尤其是在SQL的访问模式下。数据的模型化和数据治理:湖仓一体可以支持类数据模型的实现和转变,支持DataWarehouse模式架构,例如星形模型、雪花模型等。该系统应当保证数据完整性,并且具有健全的治理和审计机制。BI支持:“湖仓一体”支持直接在源数据上使用BI工具,这样可以加快分析效率,降低数据延时。另外相比于在数据湖和数据仓库中分别操作两个副本的方式,更具成本优势。存算分离:存算分离的架构,也使得系统能够扩展到更大规模的并发能力和数据容量。(一些新型的数据仓库已经采用了这种架构)开放性:采用开放、标准化的存储格式(如Parquet等),提供丰富的API支持,因此,种工具和引擎(包括机器学习和Python/R)可以高效地对数据进行直接访问。支持多种数据类型(结构化、非结构化):Lakehouse可为许多应用程序提供数据的入库、转换、分析和访问。数据类型包括图像、视频、音频、半结构化数据和文本等。支持种工作负载支持包括数据科学机器学习、SQL查询、分析等多种负载类型。这些工作负载可能需要多种工具来支持,但他们都由同一个数据库来支撑。端到端流:实时报表已经成为企业中的常态化需求,实现了对流的支持后,不再像以往一样,为实时数据服务构建专用的系统。此外,湖仓一体还需要考虑数据安全和访问控制相关能力,如数据的审计、保留周期、数据血缘管理等。传统大数据平本质上就是一个Lambda架构,原始数LayerHiveBI图4-7LambdaLambda架构的核心痛点是大量在不同计算系统和数据LayerStreamLayerbug果需要通过定制联邦计算来并数据集,无法通用化输出,图4-8Kappa随着Flink这时为了解决两套代码的问题,提出了Kappa架构。KappaLambdaKappa很多时候并不是完全规范的LambdaKappa可以是两者的混,比如大部分实时指标使用Kappa架构完(比如金额相关Lambda图4-9随着信息技术尤其是计算机及互联网技术的飞速发展,挖掘与分析技术的需求已经迫在眉睫。业务数据分析中,SAS、PweBI等统计分析软件是业务分析的流行工具。SAS(STATISTICALANALYSISSYSTEM)CAROLINA州立大学1966年开发的统计分析软件。统基本上可以分为四大部分:SASSAS数据管理、数据呈现、数据分析。SAS持续良好的统计分析SASPowerBI商业智能(BusinessIntelligence)包括企业用于商业PowerBIVertipaqPowerBI图、漏斗图等等之外,还支持卫星地图展示以及外部种自RPython。其内置的人机交互问AI户的种属性和行为数据利用一定的信用评分模型,和利率,从而识别和减少在金融交易中存在的交易风险。信探索性数据分析EDA,数据预处理,到变量筛选,模型的开发和评估,生成评分卡模型以及布置上线和模型监测。SVM模型能发挥优势,由于SVM(支持向量机)的训练过程只需要优势。对于使用支持向量机建模,其在小样本、非线性及高SVM也是努力最小化结构LogisticRegressionLogisticsRegressionLR拟能力更强目前DL已经有许多不同的实现如MLPCNN、LSTMDL深度多层感知机是首先提出的一种深度神经网络模型,深度多层感知机相比于浅层结构具有更强的分类和回归效果。对于深度多层感知机的训练通常通过基于梯度的算法,如4-10也于最近被用于金融领域,将金融时间序列转换为2D图像4-11训练方式,递归神经网络的训练是通过BackpropagationThroughTime(BPTT)。通过RNNRNN4-12RNN4-13LSTMRBM被用于降维、分类以及特征学习。从结构上看,RBM通过激活函数传递计算值。RBM图4-14RBMPregel,该平提供了一套非常灵活的API,可以描述种样的图计最短路径、PageRank通过LSTM、RNN研究大多可以看作是进行异常检测或者看作是一个分类问检测,通过AE通过信息检索和语义识别帮助金融机构对客户对数据进行深度学习在CRM式。基于大数据的精准营销方案是利用大数据平上的机器4在金融领域层次数据可视化主要是指将金融数据按层UReport、EchartsUReport是一款高性能报表引擎,通过配置单元格可以实现复杂报表的展示。UReport支持常见的报表存储与数据图4-15UReportK图4-16EchartsEcharts通过增量渲染技术,配种细致的优化,EChartsEChartsGLWebGL3D的组件主要有蚂蚁金服的AntVAntVGraphin,取自GraphInsight,是专门的图谱分基础设施监控、智慧医疗等领域。Graphin提供了一个强大图4-17AntV图4-18AntV百度地图API图4-19多维信息可视化一般包括数据解释和数据显示两个阶CBoardCBoardBI20图4-20CBoard二是企业从应用服务提供商(ApplicationService数据存放在ASP为数据密钥(DataEncryptionKey,简称DEK)CMK(通过KMSCMK)(DEK)一同写入永久性存储介质中。顾思义,信封加密中的“信封”指的是概念上数(Envelope)对数据库中数据加密是为增强普通关系数据库管理系统的安全性,提供一个安全适用的数据库加密平,对数据6DESDES(DataEncryptionStandard)是美国政府采用,DES协会(AmericanNationalStandardInstitute,ANSI)承DES签的算法。他易于理解和操作,也很流行。算法的字就是发明者的字:RonRivest,AdiShamir和Leonard加密和数字签的算法,也易于理解和操作。RSA得最广泛的公钥算法,从提出到现在已近二十年,经历了10SM1、SM2、SM3、SM4。128AES国民经济的个应用领域(包括国家政务通、警务通等重要法基于ECC,故其签速度与密钥生成速度都快于RSA。ECC2020表4-8如:0-1010-30如:20200322→20200322如如大数据集且需要保留DES、3DES、AESRSA、DSA如:女hashSHA-256、HMAC量;如如:0571-0571-仅返回可用数据集中一后系统不具备开放式仅返回可用数据集中一静态数据脱敏(StaticData动态数据脱敏(DynamicData4-94-10。4-10技术开发测试应用金融行业开发使用的业务系统中存在大量的客户敏感信息,如姓、年龄、手机号码、银行卡数据分享应用数据科学研究应用场研究时需要保留的数据特征可能是用户的年龄生产应数据交换应用提供数据,与生产应用场景相比,数据请求时会附带用户信息,需要对部分用户信息进行脱运维应业务融金融业务数据和外部可信数据,借助大数据客户的喜欢进行服务或者产品进行个性化推荐等。这类大数据应用前一般采用掩码屏蔽的方式对数据进行脱敏,后一般采用干扰等方式对借助大数据手段,保险企业可结内部、第三方这类大数据应用前一般采用掩码屏蔽的方式对数据进行脱敏,后一般采用干扰等方式对数模式正在发生行为模式等结智能规则引擎,相结,如商户评分模型及审批规则、行业风险模型、反欺诈模型等。这类大数据应用前一般采用掩码屏蔽的方式对数据进行脱敏,后一般大数据应用前一般采用掩码屏蔽的方式对数据进行脱敏,后一般采用干扰等方式对数据进多方安全计算(Multi-PartySecureComputation,研究在无可信第三方情况下,利用密码学的方式,让方数据安全地进行计算,而自又不会得到对方的信息。多方安全计算包含多种底层密码学技术,包括不经意传输同态加密(HomomorphicEncryption)等。多方安全计算图4-21environmentTEE境内进行计算,通过空间隔离来保障其安全性,即使是平联邦学习(FederatedLearning,FL),是机器学习在实践中,联邦学习通常与其他隐私计算技术相结,可结差分隐私技术,对中间交互的参数加入噪声进行混淆全规的方式进行数据共享与数据价值挖掘,实现数据的可解决多个参与方数据进行建模活动的隐私保护和数据安全随着数据要素的重要性日益提升,社会界对于数据保\h术(PrivateSetIntersection,PSI),实现高效加密的不transfer(GC中的地位和作用。2014此后国家相关部门出了一系列政策鼓励支持大数据产业的发展。2019央关于坚持和完善中国特色社会主义制度推进国家治理体步,行改委、经信委等职能部委,机构性质的多元带来运行机制GDP社会组织的海量信息被大规模的整存储,这些数据一旦泄建议我国加强数据应用方面的顶层设计和政策扶持力全保护浪潮的兴起和国数据安全保护实践的深入,我国在有序地互联互通将会成为数据要素市场化发展的下一步工随着信息技术的迅猛发展,行业的数字化转型已经是大势所趋,在当前产业都在积极探索数字化转型战略,积极尝试数字技术对自身的经营活动进行转型升级。深度融的趋势。在技术影响业务方面,大数据技术从联网征信、大数据风控等业务场景;在业务影响技术方面,和数据的融。建议金融机构和金融科技企业进一步加强和提升对数问题也成为政、产、学、研、用等界关注的焦点。一是数据发挥价值需要融应用。数据跨层级、跨地域、跨系统、跨部门、跨业务的融应用才能推动新模式、新应用、新业可传输等特性期待多元创新的安全规手段。数据的应用会安全管理模式。三是数据的价值发挥和安全规需要寻求动数据安全和规仍是多方主体数据协作过程中的痛点问题一方面缺乏能够兼顾安全规和数据协作的作机制与技术路径,无法消除数据主体之间对商业秘密泄露风险、商值挖掘的难点。需要遵循循序渐渐的原则,充分了解金融行业的规要求,和规责任的前提下,实现数据可用不可见,促进金融行业的数据协作与融应用,促进金融行业数据价值的最大化。至个人皆参与其中,市场主体趋于多元化,主体司其职拥有者,政府基础数据率先作为公共资源让方共享,同时并最终商品化。数字时代常见的企业平B2CC2C服务使用者”的多重身份加入其中。B2C平,作为信息技术的平可以以近于零的边际成本与众多开发者/服务提并非由开发者拥有C2C平使互联网公司完全变“平”,由服务提供者和用户进行交易,自己仅提供信息匹配模式的特点是,平利用用户间交易持续获得数据,将用户用户使用协议与交易方保持灵活的服务关系。数据作为用和平双方的共同努力,并在此过程中创生或挖掘了更多的机构将为数据要素市场良性运转提供保障。大数据交易所、数据经济商等数据交易平将积极发挥作用,参与构建数据360分析和综化数据共享,有效对接银过对类信息进行量化,大数据技术可以实现对类风险的乎是不可能的。因此,无感连接被提出,他是指个生态圈机器学习中的联学习方法。云计算、大数据、人工智能和的标杆。双方将会同地高校,以智能化为引领,以数字化通过联学习技术使得大数据技术实现金融数据应用联学习在不暴露数据的情况下分析和学习多个数据拥有业的具体应用落地方面,金融云和金融大数据平一般都是集中一体化建设,人工智能的相关应用也会依托集中化平6-1根据实际情况设立首席数据设立满足工作需要的专职岗负责本业务领域的数据治理,管理业务条线数设置专职或兼立覆盖管理、技术、运营等的复型数据团队”对于数据应图6-1金融数字化委员会作为数据治理专业决策和协调机构的领立覆盖管理、技术、运营等的复型数据团队”能力建议。25030队作意识的数据分析师协同完成。能根据任务的具体要求,综利用种计算机手段和知识,综来看数据分析处理人才的要求是比较高和全面的,需要具备较好的数学功底,良好的统计学知识、数据分析、商业分析和自然语言处理等较宽知识背景的人运用掌握的计算机辅助分析相关技能。建立核心数据团队、部门业务团队和区域综团队多层级、多类型数据分析师团队,团队协作联动核心数据分析师实施本领域小型数据分析项目区域综分析师团队负责定性数据分析师是社会热门的复型金融科技人才,不仅技能要求高((至少需要1-2年分析师足够的职业成长空间,才能保持队伍的稳定性、激发工作活力。提和基础。需要制定相关制度办法,明确了级类分析师对分析师实行“单制”管理,明确分析师准入标准、职能区域综团队联开展数据分析项目的方式,要求每位数据数据分析师拓展思路。打造数据分析师分享会等平,宣讲据分析师经验交流搭建舞。内外部外部数据作方数据;另一方面是与第三方进行数据公司作。求,解析第三方服务返回的数据;SDKJava发起HTTP在与外部数据服务作过程中,业务系统对数据需求征信、司法、税收、票据、多头、行业黑白单、企业经营内外部作保障措为了构筑安全规的数据作新模式,需要在数据作中对数据的应用采取一定措施来保障数据作的安全和健全数据作标准规范与制度体系,加大数据加快对于金融数据作标准规范和作管理制度建设相关的标准规范,配国家和行业监管部门,重点加强交易工作,确保数据作安全保障工作落到实处,对检查中发现根据国家密码管理相关规定,理运用密码技术和产内容的数据安全作信任体系的建设。对数据作过程中,严格网络安全配置管理,制订理的网络服务策略和强制路推进作企业的风险评估,实施对外部作商的评估和检查评估为辅的方式,在数据作的全过程中实施必要的作企业的风险评估。要适时、有效开展风险评估,重要系统的作企业至少每2年进行一次评估,并根据作企严格控制对作企业的风险评估过程,规避评估风险,采取以满足不断提升的数据隐私保护意识和监管对于安全性不础设施与混IT架构,并与第三方云供应商开展作等一IT混生态系统是其面临的最大挑战。风险的方案集。这种洞察需要IT部门和业务部门之间的复杂的混网络生态系统中被放大的风险的透明度。除获得织、文化和运营方面的措施一旦结使用,可以促使企业将使企业面临新的网络风险,要求企业采用新的网络战略,保据交易平作为数据买方和数据卖方的纽带,数据卖方的数据在数据交易平的帮助下流向数据买方。数据交易平虽然一定程度上加速了数据的共享和流通,但是目前数据交易平仍然存在很多问题:由于数据卖方的源数据流经数据交易平不诚实的数据交易平可能在未经数据卖方允许的情况下缓存数据部分数据交易平是中心化系统存在单点故障的目前缺乏一种可靠的数据交易生态系统来同时解决以贵阳大数据交易所以及INFOCHIMPS虽然不会缓存卖方的源高系统的容错性,并且数据交易平本身不缓存数据,但是切需要一种新的解决方案能够做到保护数据卖方源数据不会被数据交易平或者数据买方进行二次转卖以及针对单的安全数据交易生态系统(SecureBlockchain-basedData额外计费以及禁用智能约之间的调用来防止恶意智能IntelSoftwareGuardExtensions(SGX)技术保护加解密以及智能约的执行过程,保障智能约从输入到执行再到易平窃取隐私数据并进行二次转卖,不但如此,为了防止大数据服务平基于区块链数字实身份及区块链大数据交易平的订单信息及支付情况,向大数据客户交付大(TransportLayer个阶段、个环节,输的异构、多源、关联等特点,即使多个数据集自脱敏处法的数字签机制的可信性最终保证数据源的身份可信。由数据源自行生成非对称密码学算法的公钥与私钥,数据源将公钥及全网唯一的数据源标识发送到区块链网络,由区块链智能的智能约查询公钥然后验证签是否法理论上,数据源不需要公布私钥,只需自己保管好私钥即可,这样就避智能约等技术以数据为导向开展审计确保数据完整性、一致性及流转过程中的可追溯性。1工商银行数据资产管理平PB该平从技术架构方面上,为做好全局性数据资产的统资产”:数据资产、数据服务资产(DataAPI);“三类用息的全面采集和融创新使用,实现“资产易用”;通过数本平在技术和业务分别做出了解决方案创新。在技术数智融:面向全行业务场景和需求,提供即科技与业务融机制:打通数据资产中业务和技门槛,创新“普惠”用数新模式,全面提升数据应用效率。,提高数据资产的管理水平,深入挖掘数据价值,赋能工会效益方面,数据资源作为重要的生产要素,是行业发展的核心因素之一。数据资产管理平建设过程中沉淀和形2目前在浦发银行数据资产管理平上,有三类数据的数非结构化数据目录以全行公认的板块划分为切入点进指标数据的数据目录建设,除了建立指标的基础信息表7-1GB/T35273—JR/T0197—结行内实际,符业务图债图债外基理财产贵⾦货币市衍⽣细分细分表7-2理平身份证号,姓,性\h\h表7-3零售_零售_公司_公司_金融市场_金融市场_运营_内部管理_3某集团是国际领先的综发展和有效风险控制,对数据治理的监管要求日趋严格。如全覆盖原则,如构建覆盖层级的数据治理组织、制度、规期的数据治理能力覆盖项业务和数据的质量监控体系据治理体系开展类数据治理活动,盘活数据资产,形成数据驱动力,高效赋能业务。体系规划+1个技术平底座。基于3个体系的总体架构规划,结数据治理平的技4渐产生了数据项称、数据定义、数据的业务理解及技术理命、定义、规则及使用统计口径等。数据标准工作目标是根据数据盘点和数据标准调研工作结果,梳理应用频繁以及系统之间交互使用的数据项,框架、编制类数据标准、形成数据标准账。域业务子领域业务对象维度中文称维度中文别、业务子领域,用于区分同一领域下不同产品/不同类别债融等,参与人领域下又有投资人、融资人等业务子领域。维度中文称是对当前数据库中维度中文称的一个标准化命。包括维度英文称、数据类别、数据长度。维度英文称是当前数据库中维度的英文称。数据类别是维度取值参考类管理属性是从标准的管理层面对数据的统一规范和定统、状态、维护时间。类编码为分类或维度的唯一识别范、代码值、代码值对应称。业务要求,如果符,沿用整后的源系统相关代码,如互、级人员对数据使用口径的一致性。5农业银行数据分析挖掘平2017银行数据分析挖掘平。农业银行的数据分析挖掘平定位为面向数据分析师的专业化工作平和数据分析建模实验平。致力于构建开放融、计算高效、服务专业、功能全面、体验友好的企业级平,为全行数据分析人员提供专业的工作、良好的用数据接入与预处理中心。实现跨平批量数据接分析挖掘平管理体系。实现数据权限管控、工建立了模型运行中心。模型运行中心提供模型上下线、模型运行监控、模型跑批等模型运行功能,实现跨平模型的该平中的数据分析不仅可以帮助银行进行日常业务结,帮助银行改进业务流程、提升业务绩效、促进业务创6企业级数据字典是对中国银行全部数据的标准化释义249个业务交易系统数据项的梳理和整,并经过专项数数据字典平建设方面,2021年5月投产上线集数据字典管理、数据质量与安全管理等功能为一体的数据字典平,实现了数字资产管理、数据需求管控、全文检索、中行数据字典平功能:数字资产管理方面,实现企业级数工作方法论,经过一年左右的时间初步建成企业级数据字能够实现对数据的追踪溯源,为全行提供统一的标准与规案例7腾讯云隐私计算隐匿查询接口在信贷风控当银行客户向银行提出借贷申请时,银行需要整种7-2卡(A卡)评估用户逾期还贷风险,但仅使用人行征信数据并在实际生产应用时,银行通过在线打分接口结匿踪查询服务提供用户借贷逾期风险评分,以避免客户ID的泄漏。综数据服务创业公司作;银行放提供样本标签,数据服8个月后个人存款较峰值流失507亿元,流出存款占比为完成数据的加载和应用,将数据中DCRM202119统计查询。级网点负责人,管理员可查看辖内网点明细流水、统计报表、排行报表,指导网点开展智迎客业务。过“智迎客”有效识别客户154万,推送类营销消息63.35%。7.7%。1.0”项目,以公众号作为主战地,以“龙易作为数字化工具,以综提升客户价值为目标,通过开1.0”2.0”项目,实更贴近客户价值主张的客群策略,结客户晋升11持组产品营销。12动业务融精准滴管中小微企业,形成数字飞轮助推产业水,融15的其他可疑客户网络,实施预警清退,降低票据业务规定制产品经营方案,自动化穿透式派发潜在客户营销单。借助票据全景图谱,挖掘出银票贴现潜在客户近5.8万票据业务的市场前景,为分行业务目标的制定提供了依大数据助力票据业务快速且规发展。13传统的银行业零售客户经营体系普遍面临着长尾客户多、需求变化快、经营靠经验、管理成本高四大痛点问题。针对上述问题浦发银行启动了章鱼认知推荐服务平项目,以“智能、专业、个性”为目标,打造数据驱动持续进化、线上线下融的智慧零售新经营体系。章鱼认知推荐服务平基于浦发银行企业级数据中,章鱼认知推荐服务平成果广泛应用在浦发银行六大质量发展转型,精准服务客户1.22亿人次,促动财富成交模平(QuickML)在运用传统机器学习平临客户信息泄露、模型调优不及时、核心工具外包等风险,(QuikML)的项目。功能架构覆盖机器学习建模全流程,在定位和功能上与SAS类似,是支撑智能风控的机器学习建模平。QuickML可实现PB级的数据建模,自研的调度管理平可支持快速的交互式建模和批量建模,并支持模型数据Native可支持大规模数据的可视化和交互操作。目前该平已在QuickML产品通过交互式操作大大降低业务人员的模型操作成本,无需编写代码也可快速搭建风险模型。目前SAS,逐步建立了自主可控的国产化机器学习建模平体系。融业务必要技术能力。2019术讨论,选用了结卫星遥感、视觉算法和时空数据分析等20209构建了第一个将遥感传感等另类数据成功应用在金融领域AI28入了解分析不同区域、不同行业种植成本的差异,结对种结地的农忙时间,对农户申贷时间的理性做出评利用时间序列等模型对地的历史气候数据进行深度实现差异化精准授信。深度结种植行业特点,断农户耕种面积和品类,预测产量产值,从而给予理的贷分钟申请贷款,10RTA在广告投放过程中,媒体平将流量的必要信息(例如给媒体平,以实时接口响应的方式实现广告主和媒体平广告主和媒体双方需要以实时接口响应的方式进行定向,即RTA(Real-timeAPI)。具体过程如下:在广告投放过在安全性方面,联邦安全学习保障广告主与媒体平提机构的客户是否转化成为通过风控审核的客户不会被数据某金融服务机构广告主自身的数据常常缺乏特征多样建模来完成数据作。建模完成后,金融机构可查询用户打17常态,银行IT10112018年启动信用卡系统智能升级,期望升级处理能力可达日均处理固定格式交易3.5亿笔/日,联机交储设备内全RDMASmartMatrix3心容灾,达成“79”可靠性。IOPSOceanStorDoradoNoF+方案和端到端NVMe在安全方面,确保用户日常交易,以及在双11、618等7*240OceanStor地三中心部署,实现“79”级别的高可靠。AI99.99999%可靠性,及基于数据库的角色的分缩减,66%OPEX18某银行基于流批一体技术的风险监测实时需要考虑两套技术栈的输出结果对业务的收口和聚,不仅10T+1。KappaFlink1.10版本起已在Table/SQLAPI1.12upsert-kafka1.13加了多个SQLjob目通过使用Flink1.13项目,使用FlinkSQL的批数据转换成流数据,使该项目的读取数据源实现统一(均为Kafka)灵活运用FlinkSQLIntervalJoinTemporalJoinOverAggregation,实现对于流数据的实时19某银行是所在省首家区域性股份制商业银行和最大的进转型发展,不断提升综金融服务能力。私有
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 个人企业用人合同范本
- 产权商用租房合同范本
- 养殖出售合同范例
- 劳动合同兼职合同范例
- 幼儿园师幼互动中存在的问题及解决策略或建议
- 2025年度建筑工程施工合同履约验收标准范本
- 专利交易中介服务合同范本
- 公众号收购合同范例
- 足浴店劳动合同范本
- 豆制品供货合同范本
- GB/T 8014.1-2005铝及铝合金阳极氧化氧化膜厚度的测量方法第1部分:测量原则
- GB/T 3860-2009文献主题标引规则
- 股票基础知识(入市必读)-PPT
- 雅思阅读题型与技巧课件
- 招商银行房地产贷款压力测试
- 公文与公文写作课件
- 车削成形面和表面修饰加工课件
- 基于振动信号的齿轮故障诊断方法研究
- 义务教育物理课程标准(2022年版word版)
- 医疗器械分类目录2002版
- DB11_T1713-2020 城市综合管廊工程资料管理规程
评论
0/150
提交评论