金融行业数据应用发展报告2023_第1页
金融行业数据应用发展报告2023_第2页
金融行业数据应用发展报告2023_第3页
金融行业数据应用发展报告2023_第4页
金融行业数据应用发展报告2023_第5页
已阅读5页,还剩310页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

金融业数据应用发展报告(2023)北京金融科技产业联盟编委会成员:编写组成员:参编单位:一、概述 1 3(一)政策指引 3 15 29(一)数据治理 29 34 37 48 57 68(一)政策标准有待进一步完善 68(二)数据应用风险管控亟待加强 71(三)数据服务能力评价机制仍需完善 74(四)系统建设与数据应用仍然存在割裂 76 79 81(一)加大政策支持与标准供给 82 85 91 93 97 104 147 1501一、概述随着数字经济席卷全球,数据作为一种新型生产要素已成为重要战略资源。各行业纷纷增设信息科技部门,加大信息化建设力度,以期利用大数据技术提高服务能力和水平。网、政府、金融是大数据融合产业发展的重点行业。其中互联网和金融行业信息化水平高、研发力量雄厚,在业务数字化转型方面处于领先地位。除此之外,金融数据是大数据商业应用最早的数据源之一,面对如今快速增长的海量网络数据和复杂的网络社在此背景下,中央多次发文表示要加强数据的感知、传输、明确指出要加快构建全国一体化大数据中心体系,建设若干国家动数据赋能全产业协同转型;加强数据开放共享,建立健全数据要素市场,开展数据跨境传输安全管理试点。《金融科技发展规融数字化转型的总体思路、发展目标、重点任务和实施保障。解决金融科技发展不平衡不充分等问题,推动金融科技健全治理体2展,更好地满足数字经济时代提出的新要求、新任务。本报告通过对数据应用技术在2021至2023年间的发展进行分析探索,希望能够对大数据在金融行业的应用提供参考。报告一共分为六章。第一章概述,介绍了本报告的研究内容与意义。第二章发展背景,从政策及标准的背景、内容、影响等方面介绍2021年到2023年新出台的对金融行业影响较大的行业政策和行从数据要素流通、数据资产管理、数据治理、流通技术等角度对金融行业数据应用现状进行详细介绍。第四章面临的挑战,提出了政策标准不够完善、数据应用存在安全风险、数据服务能力评价体系不完善、系统建设与数据应用仍然存在割裂、数据产品创新乏力等数据应用面临的挑战及难题。第五章发展建议四章提出的挑战进行了逐一分析建议,提出了加强政策引导与制定应用标准、保障数据安全体系落地、形成数据服务闭环、建设数据友好型系统、数据驱动产品建设等对策建议。第六章典型案情况及数据专委会重点工作。本报告在北京金融科技产业联盟数据专委会组织下,由农业银行牵头,中国银行、数牍科技、富数科技、浙商银行、平安银行、洞见科技、银行卡检测中心、冲量在线、青岛银行、同盾科蓝象智联等机构共同编写完成。3在数据要素建设全面提速的背景下,数据赋能金融机构数字化转型已成为大数据时代的必然选择,全面加强数据能力建设势管部门也加强了对数据能力建设及数据治理的要求和指引。本章节主要从政策背景、内容、影响等角度对《中华人民共和国数据安全法》《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》《金融科技发展规划(2022—2025年)》《金融数据安全数据生命周期安全规范》《金融数据安全数据安全分级指南》《金融业数据能力建设指引》等政策法规、行业标准进行解读。(一)政策指引1.《中华人民共和国数据安全法》(1)政策背景简称《数据安全法》)经第十三届全国人民代表大会常务委员会《数据安全法》是我国首部以规制数据安全为核心内容的专项法案,其施行既有利于弥补我国数据安全保护领域的法律空白,为保护我国数据安全以及维护数据主权提供法律支持,又有4利于推动以数据为核心的数字经济的发展,实现我国产业的数字于国家安全战略对数据的审查、评估、管理等制定了严格的政策与措施,另一方面,为数据的要素化、充分挖掘数据提供了重要的制度保障。这是整个数据行业的基本法,更加强调总体国家安全观,该法以数据为核心,对信息社会、基础性支持作用,其本质是以安全为基础和起点,终极目标是数据作为生产要素能够加速流通。体现了我国数据安全保护的决心。一方面,进入信息全球化时代以来,数据安全问题频发,世界重要国家与国际组织先后通过立法对数据安全问题进行规制。另一方面,近年来我国产业的数字化转型升级加快,对数据安全保护提出了新的要求。我国当前针对数据安全问题的立法存在空白,法律体系尚不完善,数据安全受到严重威胁。在数字经济蓬勃发展的时代,应当建立起我国统一的数据安全法律体系,提升数据安全保护效力,为推动深刻的时代意义。(2)政策内容a.具体内容5络安全法》《个人信息保护法》以及其他专项及地方立法共同构成我国数据安全保护法律体系。《数据安全法》主要包括以下四第一,《数据安全法》确立了我国坚持数据安全保护与发展并举的原则。安全是法律保护的秩序价值,发展是法律追求的重要目标。就数据规制而言,需要更好地平衡安全与发展的关系,以实现数据安全与发展的动态平衡。丧失了安全保障,数据发展将失去稳定运行的前提,甚至会由于缺乏监管而带来不可承受的数据安全的前提下,鼓励数据依法合理有效利用,促进以数据为核心的数字经济发展。据安全法》出台前,我国多从技术控制的角度对数据安全问题进该法第三章以专章形式规定了数据分级分类保护、数据安全审查、数据出口管制、对等措施以及跨境流动审批等完善的体制机制维护数据安全。《数据安全法》设立的数据安全保护机制,弥补了过去重技术轻制度建设的情况,减少了因制度建设不完善而产生的数据安全问题。第三,《数据安全法》明晰了数据安全保护义务。与该法设立的数据安全保护机制相衔接,数据安全保护义务强调在数据安全保护机制下实行多元主体协作机制。在保护义务的具体实施方6测、风险评估以及数据交易等机制,明确了各级各类主体应当承担的义务以及采取的必要措施。考虑到政务数据具备的特殊价值,《数据安全法》第五章对政务数据安全与开放问题进行了单独规定。明晰的义务有利于规范数据处理活动,进一步明确数据第四,《数据安全法》建立了追责制度。针对不同的义务主体,《数据安全法》在第六章规定了不同的法律责任。针有关主管部门,明确了其监管责任以及对违反数据安全保护义务的组织和个人可以采取的措施。对进行数据处理活动的有关组织否则将根据其违法的程度不同,给予警告、停业整顿、吊执照以及罚款等惩戒措施。与上述措施不同,对不履行监管义务的国家机关工作人员以及责任人员主要给予行政处分以示惩戒。《数据安全法》以分级分类的形式明确了不同主体的法律责任,使得《数据安全法》的执行力更强,能够有效预防、制止罚危害数据安全的各类行为。总体而言,《数据安全法》明确数据安全主管机构的监管职责,建立健全数据安全协同治理体系,提高数据安全保障能力,促进数据出境安全和自由流动,促进数据开发利用,保护个人、组织的合法权益,维护国家主权、安全和发展利益,让数据安全有法可依、有章可循,为数字化经济的安全健康b.落地方案7对标《数据安全法》等法律法规和监管要求,金融机构首先充完善重要数据管理、数据安全风险评估、数据安全审查和出境管理等方面的要求,并加强监督落实。其次要持续完善数据安全技术防护措施,参照有关标准规范和最佳实践,做细做实数据分类分级和全生命周期安全防护建规范数据采集和外部数据使用,加大政务数据的采集和开发利及时申报数据安全审查。金融机构的数据治理体系建设核心将转向以保护数据主体权益的数据安全治理体系,从组织架构、管理流程、技术工具、人才培养等多个方面自上而下进行推动。重点关注的内容包括管理机构的明确、数据合规机制的建立与运转、数据安全创新技术的引入与研究、培训宣贯与人才培养。联防联控,共同推进落实数据安全管理。二是构建数据安全纵深防御体系,在传统网络安全防护的基8用安全防护,将数据安全要求嵌入业务需求和系统建设各个环保障数据安全使用;通过开展舆情监测、强化敏感数据监测、组织外包检查等措施,防范供应链安全风险。保护、安全保密、个人金融信息安全等方面的培训,开展案例警示教育,营造安全合规氛围;另一方面,利用网点、网站等多种渠道,持续宣传数据安全与个人金融信息保护内容,增强五是加强审计监督,组织开展年度信息科技风险检查、评估(3)政策影响信息保护上提出了新要求:以纸质等其他形式记载的“信息”,将其统一纳入《数据安全法》9第二,构建国家数据安全基本制度,覆盖数据全生命周期,重点明确了数据分类分级及重要数据保护目录、数据安全风险评估、数据安全审查、数据出口管制和域外管理等方面的要求。并强化了国家核心数据和重要数据的保护要求和法律责任。的主要义务、数据交易的原则性要求和政务数据开放规定。第五,体现数据伦理内容,要求数据的开发利用应充分考虑特殊群体的关怀,有利于增强全民的幸福感和获得感。2.《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》(1)政策背景以接近零成本无限复制,对传统产权、流通、断解放和发展数字生产力。按照党中央、国务院决策部署,国家赴多地深入调研,并吸纳了各方面有关意见。习近平总书记主持据二十条”。“数据二十条”主旨是构建数据基础制度,保障数据要素的安全和发展。(2)政策内容“数据二十条”强调探索建立数据产权制度,推动数据产权结构性分置和有序流通,结合数据要素特性强化高质量数据要素供给。在国家数据分类分级保护制度下,建立公共数据、个人数据的分类分级确权授权制度和市场化流通交易机制,建立数据资源持有权、数据加工使用权、数据产品经营权的“三权”分置的产权运行机制,健全各参与方合法权益保护制度,推进“共同使用,共享收益”新模式。加大个人信息保护力度,推行匿名化个人数据合理使用,健全数据要素权益保护制度。在流通和交易方面,要完善和规范数据流通规则,构建促进使用和流通、场内场外相结合的交易制度体系,培育壮大场内用范围可界定、流通过程可追溯、安全风险可防范的数据可信流充分发挥市场在资源配置中的决定性作用,更好地发挥政府作用。完善数据要素市场化配置机制,扩大数据要素市场化配置范围和按价值贡献参与分配渠道。完善数据要素收益的再分配调节机制,让全体人民更好共享数字经济发展成果。形成有效市场和有为政府相结合的数据要素治理格局。新政策支持,鼓励有条件的地方和行业在制度建设、技术路径、发展模式等方面先行先试,鼓励企业创新内部数据合规管理体系,不断探索完善数据基础制度。切实加强组织领导、加大政策支持力度、积极鼓励试验探索、稳步推进制度建设。(3)政策影响“数据二十条”指出数据基础制度建设事关国家发展和安全收益分配、安全治理,加快构建数据基础制度值,激活数据要素潜能指明了方向。构建数据基础制度体系,是新时代我国改革开放事业持续向纵深推进的标志性、全局性、战略性举措,有利于充分发挥数据要素作用,赋能实体经济,推动高质量发展;有利于做强做优做有利于统筹分配效率与公平,推动全民共享数字经济发展红利,理体系和治理能力现代化。3.《金融科技发展规划(2022—2025年)》(1)政策背景在《金融科技(FinTech)发展规划(2019—2021年)》引化转型的核心驱动力,在深化金融供给侧结构性改革、增强金融服务实体经济能力等方面发挥重要作用。人民银行认真贯彻落实党中央、国务院决策部署,从战略全局不断加强顶层设计和统筹规划,接续出台《金融科技发展规划(2022—2025年)》,提出新时期金融科技发展指导意见,明确金融数字化转型的总体思路、发展目标、重点任务和实施保障,为新时期金融数字化转型谋定方向、明晰路径。(2)政策内容《金融科技发展规划(2022—2025年)》明确了金融数字重点做好五方面工作。充分激活金融数据要素潜能。一是加强数据治理。建立健全协调一致、涵盖全生命周期的数据治理体系,统一数据编码规则级分类。二是深化融合应用。建立多元化数据共享和权属判定机模、差分隐私等技术对海量多样化多维度数据资源进行价值挖掘和关联分析。三是做好信息保护。严格落实数据安全保护法律法踪查询、去标记化、可信执行环境、随机化等手段严防数据逆向追踪、隐私泄露、数据篡改与不当使用,切实保着力打造数字化经营新动能。在战略部署方面,建立健全企业级数字化转型组织架构和治理机制,通过数字化能力成熟度评价等方式科学衡量转型质效,构建涵盖规划、生产、管理等职能的特色化发展矩阵。在敏捷创新方面,探索数决策与执行高度统一的创新协同网络。在中台建提纯加工、建模分析、质量管控、可视交互等功能的综合型数据中台。在业务赋能方面,运用知识图谱、机器构建覆盖用户全生命周期、业务全流程的数字化经营能力。不断深化关键核心技术应用。一是加强核心技术应用攻关,台、专项合作等方式加大关键软硬件技术金融应用的前瞻性与战略性研究攻关。二是切实保障供应链稳定可靠。强化关键核心技术标准符合性和安全性把关,确保技术路径与自身需求高度匹高等院校、科研院所、高新技术企业等搭建金融科技产用对接平术共研、场景共建、标准共商、成果共用、知识产权共享。加快推动金融服务智慧再造。在惠民方面,运用5G、虚拟现实、智能物联网(AIoT)等技术推动实体网点智慧升级与线金融在公共缴费、社保服务、医疗保障、交通出行等领域的应用场景。在利企方面,有序推动跨领域、跨地域信用信息互联互通绿色金融、农业金融、供应链金融、小微金融、科创金融等领域打造精细化、定制化数字信贷产品。切实加强金融科技审慎监管。一是强化金融科技创新行为监管。加快出台符合国情、国际接轨的金融科技伦理制度规则,不断扩大金融科技创新监管工具应用的广度与深度。二是筑牢金融和安全性。三是加快数字化监管能力建设。深化监管科技在金融市场、支付结算、征信、消费者保护等领域的应用,打造权威专业化风控基础设施。(3)政策影响《金融科技发展规划》明确了治理体系、数据要素、基础设施、核心技术、激活动能、智慧再造、审慎监管、发展基础等八组织统筹等五个方面提出要求。金融机构需要做好整体规划,完转型。在发展金融科技的过程中,金融机构需要着重关注数据风(1)标准背景随着大数据、人工智能、云计算等新技术在金融行业深入应的极高的商业价值和重要性日益凸显。同时,数据泄露、滥用、篡改等安全威胁的影响也在不断增加,逐步从机构内转移扩大至机构间和行业间,甚至影响国家安全、社会秩序、公众利益和金融市场稳定。如何在满足金融业务基本需求的基一步明确数据生命周期各阶段的保护要求,有助于金融业机构合理分配数据保护资源和成本,建立完善的数据生命周期防护机制。为指导金融业机构合理制定和有效落实数据生命周期安全管保金融数据安全应用,2021年4月,中国人民银行发布并实施JR/T0223—2021《金融数据安全数据生命周期安全规范》。(2)标准内容《金融数据安全数据生命周期安全规范》规定了金融数据生命周期安全原则、防护要求、组织保障要求以及信息系统运维保障要求,建立了覆盖数据采集、传输、存储、使用、删除及销毁过程的安全框架,适用于指导金融业机构开展电子数据安全防护工作,并为第三方测评机构开展数据安全检查与评估工作提供《金融数据安全数据生命周期安全规范》建立的安全框架业机构在开展业务和日常经营管理过程中,遵循以下数据安全基用原则、全程可控原则、动态控制原则以及权责一致原则。数据安全分级是建立完善的数据生命周期安全防护体系的基础,对机构的数据资产进行全面梳理,按照JR/T0197—2020相关要求,根据数据安全性遭到破坏后的影响范围和影响程度,数据生命周期包括数据采集、传输、存储、使用、删除和销毁等环节,《金融数据安全数据生命周期安全规范》针对各个做出了详细的规定。在金融业机构数据安全防护节均有其侧重的关键技术。在数据采集环节,数据源的真实性至令密码、设备指纹、数字签名等对数据源进行鉴别和认证;在数据传输环节,存在着数据传输中断、篡改、伪造及窃取等安全风险,需根据不同的数据传输模式和数据安全级别,采用相应的技术措施如加密传输、身份认证、可信物理信道和通信协议约定等篡改、丢失、不可用等安全风险,数据加密、权限控制和备份恢复是保障数据安全的重要手段;数据使用环节包括数据的访问、证、数据脱敏、数据加密、多方安全计算以及跟踪溯源等技术保销毁形成闭环。最后,《金融数据安全数据生命周期安全规范》对数据安全组织保障和信息系统运维保障进行了详细规定,如要求金融业机构建立健全包括决策层、管理层、执行层以及监督层的数据安检查评估、应急响应与事件处置等过程中的数据安全风险防控能力等,构成了数据生命周期安全防护机制能够有效落实和严格执行的基石。(3)标准影响一方面,《金融数据安全数据生命周期安全规范》为金融业机构开展金融数据生命周期安全防护提供了具体实施指导,其发布推动金融业机构逐步落实金融业数据安全管理要求,提升金融业数据安全保护工作的规范化和标准化程度,为金融业机构有效防范数据安全风险及应对数据安全事件提供科学依据和指导,为金融数据的应用和流动提供有力保障。另一方面,《金融数据安全数据生命周期安全规范》的发布能够促进金融科技的安全发展,明确了整个金融数据生命周期的安全要求,使金融业机构在数据安全治理方面的需求得到快速提升,从而推动一系列安全技术的发展。近年算、可信执行环境、联邦学习等为代表的隐私计算技术为数据交据脱敏、基于角色的数据授权方式等也在效率和适用性等方面面术,为金融数据提供更加有力的安全保障。(1)标准背景为落实中共中央、国务院加强数据资源整合和安全保护相关工作要求,指导金融业机构合理开展金融数据安全定级工作,有效落实金融数据生命周期全过程安全管理策略,进一步提高金融业数据管理和安全防护水平,确保金融数据的安全应用。2020年9月,中国人民银行发布《金融数据安全数据安全分级指南》(JR/T0197—2020)金融行业标准(以下简称“分级标准”有助于金融业机构明确金融数据保护对象,合理分配数据保护资源和成本,是金融机构建立完善的金融数据生命周期安全框架的基础,能够进一步促进金融数据在机构间、行业间的安全流动,有利于金融数据价值的充分释放和深度利用。(2)标准内容a.分级分类管理细则制度出台中给出的金融数据安全分级的目标、原则和范围,数据安全定级的要素、规则和定级过程,以及金融业机构典型数据定级规则,并基于单位的实际组织机构和业务情况等,制定并发布自己的分分级分类新增与修订等做出管理说明。b.分级分类台账形成主要依据数据的重要程度以及数据发生丢失、泄露、被篡改、被毁损事件的影响范围和程度将数据划分为5、4、3、2、1共五个安全级别。国人民银行涉密相关标准和规定执行;4级数据:一旦丢失、泄露、被篡改、被毁损会对金融市场稳定、上级单位业务造成严重旦丢失、泄露、被篡改、被毁损会对社会公众、单位本身、单位客户利益造成影响的数据,应实施较强安全控制;2级数据:一旦批量丢失、泄露、被篡改、被毁损会对社会公众、单位本身、单位客户利益造成影响的数据,对安全控制不作要求。开的数据定为1级,可以公司范围内公开或者不宜广泛公开的定为2级,仅针对特定人员公开的定为3级。二是参照“分级标准”中的数据安全级别,将涉及单位核心业务相关数据内容安全级别设置为对应的级别。三是分析各项业务内容发生数据丢失、泄露展实际情况,对数据进行定级。梳理与分类,形成统一的数据资产清单。二是参考统一数据资产节、业务形态和业务数据可公开范围,划分数据类别并按设置默认的数据安全级别。四是参照“分级标准”中的“金融业机构典型数据定级规则参考表”调整数据安全级别。五是其余数据内容综合数据影响范围和影响程度分析判断数据安全级别,形成台账初稿。最后,综合业务部门对台账初稿意见完善数据分类(3)标准影响在数据发展成为重要生产资源的当下,数据处理活动日益复杂,数据处理涉及的主体和环节越发多样化,企业内部数据可能存在各种被泄露、滥用、篡改的安全风险。对数据进行分类分级保护,有利于企业对其持有的数据“摸家底”,对不同重要和敏感程度的数据采取不同的管控和保护措施,建立、完善数据风险管理内部流程,对企业控制、处理的数据按照分类分级结助于企业应对各类业务场景下的网络安全与数据合规义务。3.《金融业数据能力建设指引》(1)标准背景数字技术的快速发展和新冠疫情的全球肆虐深刻改变了经济发展、社会治理和个人生活的方方面面,全球经济逐步由工业发展,先后出台一系列政策文件,以促进传统经济与数字经济深放金融业数据要素潜能,推动金融行业数据规范共享和综合应用,中国人民银行组织编制并发布了《金融业数据能力建设指引》,进一步明确了金融业数据能力建设遵循用户授权、安全合规、分类施策、最小够用等五大基本原则,同时也为金融机构开展数据工作指明方向、提供依据。通过数据能力建设提升金融数自上而下推动金融业数字化转型。(2)标准内容a.具体内容《金融业数据能力建设指引》规定了数据战略、数据治理、数据架构、数据规范、数据保护、数据质量、数据应用、数据生的建设目标和思路。《金融业数据能力建设指引》能力域主要分为以下八个方面:略评估三个能力项。数据战略规划是基于金融机构对数据的需求,经相关方充分协商达成一致后拆解出可评估、可衡量、可操作的目标,最终形成数据战略内容的过程。数据战略具有一定前路径等要素,做到内容全面、目标合理、范围明确、路径清晰,可操作性强,能够指导未来一段时间有效开展数据管理工作。数据战略实施是按照既定目标和路线持续执行数据战略工作任务确保达成预期目标。数据战略评估是在数据战略实施期间和实施数据责任等内容,是各项数据职能工作开展的基础。其目标是对数据管理和应用进行职责规划与控制,指导各项数据职能的执行,以确保有效落实数据战略目标。制度建设是数据管理和数据应用各项工作有序开展的基础,是数据治理的依据。制度建设分层次设计,遵循严格的发布流程,并定期检查和更新。技术支撑是指为开展数据治理工作而建设的相关系统或平台。据集成四个能力项。元数据管理是关于元数据的创建、存储、整合、控制等一整套流程的集合。数据模型使用结构化的语言将收集到的业务经营、管理和决策中使用的数据需求进行综合分析,并按照模型设计规范将数据需求重新组织。数据模型分为企业级数据模型和系统应用级数据模型。企业级数据模型包括主题域模型、概念模型和逻辑模型,系统应用级数据模型包括逻辑模型和物理模型。指标数据四个能力项。数据元是由一组属性规定其定义、标识、表示和允许值的数据单元。通过制定核心数据元的统一规范,提升数据相关方对数据理解的一致性。参考数据是一组增强数据可读性、可维护性、可理解性的数据集合。借助参考数据可实现对其他数据的合理分类。主数据是企业中需要跨系统、跨部门共享的核心业务实体数据。主数据管理是对主数据规范和内容进行管理,实现主数据跨系统、跨部门的一致、共享使用。明细数据是日常生产经营等活动中直接产生或获取的未经任何加工的初始数据。指标数据是在经营分析过程中衡量某一个目标或事物的数属性、业务属性、技术属性等组成。护审计三个能力项。数据保护策略是数据保护的核心内容,在制定的过程中结合企业管理需求、行业监管要求以及相关制度规范等统一制定。数据保护管理是通过开展数据保护等级划分、数据访问权限控制、用户身份认证和访问行为监控、数据安全风险防要求,实现对数据生存周期的安全管理。数据保护审计是一项控并且审计人员独立于审计所涉及的数据和流程。量分析、数据质量提升四个能力项。数据质量需求是根据业务、数据需要制定的一种衡量数据质量的规则,是度量和管理数据质量的依据,包括技术指标、业务指标以及相应的校验方法。数据业监管要求统一制定和管理。数据质量检查是根据数据质量规则发现问题并及时反馈的一种方法。数据质量分析作为数据质量提升的参考依据,通过对检查过程中发现的数据质量问题及相关信量改进和数据问题预防方案,确保数据质量改进工作有效落实。力项。数据分析是对企业各项经营管理活动提供数据决策支持而发展。数据交换是指数据在企业内外部的流转交互,包括按一定策略引入外部数据供内部应用以及有选择地对外提供企业内部数据等。数据交换的主要目的是通过及时高效获取外部数据和安全合规分享内部数据,从而更好地发挥数据价值。开展数据交换服务是通过对企业内外部数据的统一加工和分析,结合公众、行业和企业的需要,以数据分析结果的形式提供服务。数据服务一般需经过需求分析、服务开发、服务部署、服务监控、用户管理数据维护管理、历史数据管理四个能力项。数据需求是指企业在业务运营、经营分析和战略决策过程中产生和使用数据的分类、含义、分布和流转相关要求的描述。数据开发是指设计实施数据解决方案、提供数据服务并持续满足企业数据需求的过程。数据解决方案包括数据结构设计、采集存储、整合交换、挖掘探索、可视化(报表、用户视图)等内容。数据维护是指数据服务上线投入运营后,对数据采集、数据处理、数据存储等日常的运行维行业监管要求,以及业务、技术等方面的需求对历档、迁移、销毁等。b.落地原则下基本原则开展金融数据能力建设:用户授权。明确告知用户数据采集和使用的目的、方式以及范围,确保用户充分知情,获取用户自愿授权后方可采集使用,严格保障用户知情权和自主选择权。安全合规。遵循国家法律法规、管理制度,符合国家及金融过技术手段将原始信息脱敏,并与关联性较高的敏感信息进行安与不当使用,依法依规保护数据主体隐私权在数据管理与应用过分类施策。综合考量国家安全、公众权益、个人隐私和企业合法利益等因素,根据数据的保密性、完整性、可用性等属性受到破坏后的影响对象和影响程度,对数据进行分级分类管理。对细化管理。最小够用。规范数据使用行为,严控数据获取和应用范围,切实保障数据主体的数据所有权和使用权。不可见的前提下规范开展数据共享与融合应用,保证跨行业、跨机构的数据使用合规、范围可控,有效保护数据隐私安全,确保数据所有权不因共享应用而发生让渡。(3)标准影响《金融业数据能力建设指引》明确了金融业数据能力建设要遵循的5大基本原则和金融业数据工作的相关能力域和对应的《金融业数据能力建设指引》明确了从战略规划到实施再到评估的建设过程,数据战略内容覆盖数据管理的工作愿景、目标、原在数据治理方面,综合考量国家安全、公众权益、个人隐私和企业合法利益等因素,根据保密性、完整性、可用性等属性对数据控制措施,实现数据精细化管理。《金融业数据能力建设指引》的制定为金融机构开展数据工作指明方向、提供依据,引导金融机构加强数做好数据治理、强化数据安全保护、推动数据融放数据要素价值,为金融机构加快数字化转型发展夯实数据基础,打造适应数字经济时代发展的金融核心融业数据能力建设指引》的出台也有助于引导金融机构深挖数据要素潜能,全面提升数据管理和应用水平,切实将数据规划好、治理好、应用好、保护好。本章从数据要素流通、数据资产管理、数据治理、数据流通技术、数据运营体系等角度对数据应用发展现状进行详细介绍。(一)数据治理1.数据治理现状根据金融行业信息化发展的现状,结合当今数据治理的要求,金融机构现阶段数据管理方面存在以下的不足:(1)多系统分散建设,没有规范统一的数据标准和数据模型。金融机构的各个业务部门为满足业务的需求,各自建立独立的信息系统。各部门站在自身的立场使用和管理数据,从不同的角度关注数据,使得同类型数据分散在不同的信息系统中,数据口径不统一,逻辑不一致。缺少一个从全局视角对数据进行管理而导致数据不规范、不一致、冗余、无法共享等问题出现。(2)缺少统一的主数据。金融机构核心系统主要信息并不是存储在一个独立的系统中,或者不是通过统一的业务管理流程在系统间维护。缺乏对主数据的管理,就无法保障主数据在整个业务范围内保持一致、完整和可控,导致业务数据正确性无法得(3)缺乏完善、统一的数据质量管理体系。目前的数据质量管理主要由各部门分头进行,跨部门的数据质量沟通机制不完善,缺乏清晰的跨部门的数据质量管控规范与标准。很多金融机构数据的产生、使用、维护、备份、销毁的数据生命周期管理规范和流程还不完善,非结构化数据未纳入管理范畴。组织机构的数据考核体系也尚未建立,无法保障数据质量管理标准和规程的有效执行。2.数据治理核心领域型、数据标准、数据分类分级、数据质量管理、数据生命周期管理、数据分布和存储、数据交换以及数据安全。(1)元数据管理元数据管理是语义工具,其重要性在于能够为数据治理建立一套数据资料库,存储治理范围内的数据定义、负责人、来源、转换关系、目标、质量等级、依赖关系、安全权限等。这些信息对于商业整合、数据质量、可审计性等数据治理目标的实现至关元数据管理是实施数据治理的核心技术,有效的元数据管理终实现奠定坚实的基础。(2)数据模型数据治理的关键、重点。数据模型必须在设计过程中保持统一的业务定义。为满足将来不同的应用分析需要,逻辑数据模型的设计应支持最小粒度的详细数据的存储,以应对各种可能的分析查结构具有足够的灵活性和扩展性。(3)数据标准数据标准是金融机构建立的一套符合自身实际,涵盖定义、操作、应用多层次数据的标准化体系。包括基础标准和指标标准如元数据标准、数据交换和传输标准、数据质量标准等。商业银行的数据标准一般以业界的标准为基础,如国家标准、相关部委制定的标准,结合商业银行本身的实际情况对数据不同系统间数据转换的工作。(4)数据分类分级不同敏感级别、重要性级别的数据,需要采取不同的保护措此对数据资源目录进行梳理,并根据国家和各领域的管理要求进行分类分级,是保障数据安全的前提条件。(5)数据质量管理数据质量管理已经成为银行数据治理的有机组成部分。高质量的数据是商业银行进行分析决策、业务发展规划的重要基础,只有建立完整的数据质量体系,才能有效提升银行数据整体质量,从而更好地为客户服务,提供更为精准的决策分析基础。数据质量问题会发生在各个阶段,因此需要明确各个阶段的数据质量管理流程。从技术层面上,首先要完整、全面地定义数据质量的评估维度,包括完整性、时效性等。在系统建设的各个阶段都应该根据标准进行数据质量检测和规范,及时治理不合规(6)数据生命周期管理数据生命周期管理一般包括数据生成及传输、数据存储、数据处理及应用、数据销毁四个方面。数据要按照数据质量标准和发展需要产生,在数据产生阶段需要保证数据的准确性和完整性。在数据传输阶段需要考虑保密性和完整性,对不同类型的数据采取不同的措施防止数据泄露或者被篡改。在数据存储阶段除了关注保密性、完整据的可用性。为了降低存储成本,可以实行分级存储策略。分级存储就是根据数据的重要性、访问频次等指标将数据存储在不同性能的存储设备上。在数据处理及应用阶段,为了保证过程数据的安全性,一般采用联机处理。在数据销毁阶段,主要涉及数据的保密性。应该明确数据销毁流程,对数据销毁的过程有完整的记录,确保进行可靠销毁。;;(7)数据分布和存储数据分布和存储主要涵盖了数据如何划分和存储、总行系统以及总分行数据如何分布、主数据及参考数据(也称为副本数据或者辅数据)如何管理。只有对数据进行合理的分布和存储,才能有效地提高数据的共享程度,才能尽可能地减少数据冗余带来(8)数据交换数据交换是银行进行数据交互和共享的基础,合理的数据交换体系有助于银行提高数据共享程度和数据流转时效。一般商业银行会对系统间数据的交换规则制定一些原则,件的命名、内容进行明确,规范系统间、银行系统与外部机构间的数据交换规则,指导数据交换工作有序进行。建立统一的数据交换系统,一方面可以提高数据共享的时效性,精确掌握数据的流向。(9)数据安全数据安全管理的主要目的是解决数据在保存、使用和交换过程中的安全问题。主要体现在以下六个方面:二是数据隐私问题,系统中采集的证件号码、银行账号等信数据被非法访问;和应用的访问授权统一管理;事后进行审计和责任追究;五是制度及流程建立,逐步建立数据安全性的管理办法、系统开发规范、数据隐私管理办法及相应的应用系统规范、在管理决策和分析类系统中的审计管理办法等;六是应用系统权限的访问控制,建立集团级权限增加数字水印等技术在应用系统中的使用。1.数据资产管理概述良好的数据资产管理是释放数据要素价值的基础。数据资产管理包含数据资源化、数据资产化两个过程。数据资源化通过将资产化的必要前提。数据资源化以提升数据质量、保障数据安全动数据内外部流通。数据资源化包括数据模型管理、数据标准管理、数据质量管理、数据安全管理、数据开发管理等活动职能。数据资产化通过将数据资源转变为数据资产,使数据资源的潜在价值得以充分释放。数据资产化以扩大数据资产的应用范围、厘清数据资产的成本与效益为工作重点,并使数据供给端与数据消费端之间形成良性反馈闭环。数据资产化主要包括数据资产流通、数据资产运营、数据价值评估等活动职能。2.数据资产管理现状我国数据资产管理能力整体处于发展初期。数据能力成熟度评估模型(DataManagementCapabilityMaturityAssessmentModel,简称DCMM)是我国在数据管理领域正式发布的国家标准(GB/T36073—2018旨在帮助企业利用先进的数据管理理念和方法,建立和评价自身数据管理能力。中国电子信息行业联合会通过计算历年来评估企业的DCMM能力分布,大部分贯标贯标企业的80.1%;三级(稳健级)占总量的15.6%,四级及以上(量化级和优化级)不足5%。其次,行业间数据资产管理能力差异分布显著。根据中国信通院2023年1月发布的《数据资产管理实践白皮书6.0版》,软件和信息技术业、工业和制造业、医疗行业、教育行业等传统行业仍处于初级阶段,数据资产管理处于大数据平台建设阶段,主要针对核心业务开展数据标准化、数据质量管控等工作。而金融行业、互联网行业、通信行业、电力、零售等行业较早享受到资产管理实践案例可参考附录案例11-15。3.数据产品与服务随着企业数字化进程发展,数据资产管理不再局限于数据资源本身,对数据进行加工后的数据产品或数据服务也要加以管数据存储、数据交换到数据应用的全过程。在数据资产管理中,数据产品和服务不仅负责提供高质量的数据产品,如数据分析报告、数据模型和预测算法等,而且还承担着提升数据资产价值和效率的关键任务。大数据服务迎来了爆发期。与此同时,企业开始对数据的存储和分析处理有了更高的需求,为了解决这些需求,研究人员相继提出相关的数据服务。其中近几年提出了数据仓库、数据湖等新型数据平台,这些新型数据平台在企业的数据服务建设中起到了重要作用。当然数据仓库、数据湖在后继的生产使用中仍然存在问更好地支撑各种数据需求,研究者融合数据仓库和数据湖各自特点的新型数据平台,提出了数据湖仓。数据湖仓可以更好地挖掘数据价值,消除数据孤岛,减少数据冗余,降低存储成本,避免数据沼泽。近几年随着AI的兴起,数据湖仓一体是未来的发展数据服务终将成为企业下一代数据平台的方向和目标,只有让业务把数据用起来了,才能反向推动数据治理和数据标准等诸多工作。而数据治理的推进也会让数据服务化更好,让业务更好地使用数据,这其实也是企业数字化转型的重要方向和目标—让1.数据运营的背景数据要素化就是要将数据转化为可用于社会化大生产的资源,发挥出生产要素的作用和价值,促进数字经济和国家经发展。数据要素化过程中,需要经过数据资源化、数据资产化、数据资本化三个阶段。数据资源化涉及原始数据的采集、清洗、数据处理和数据价值识别,是数据资源形成阶段。数据资产化则是将实现数据资源价值的过程,通过数据流通将数据资源应用在合适的场景中,完成数据资源的价值传递,并体现核算中,成为主体资产的一部分。数据资本化阶段数据价值的变现,通过金融衍生品的创新,将高价值数据资产进经济的活跃和发展。金融行业是数据资源密集型行业,每时每刻都在产生和应用着海量数据,面向营销、征信、业务管理进行全面的信息化、数字化管理实践,并进一步向智能化业务应用转变。入金融业并通过金融业务体系实现价值变现。建立统一数据资产目录、实现数据的物理汇聚等方式实现金融数但在《个保法》的新规下,个人数据在没有单独同意授权的情况理地利用数据资源,开始探索通过隐私计算的方式来建立数据统数据价值实现除了内循环的有效应用外,还可以通过外循环将数据资源向其他单位、其他行业进行赋能,以此实现数据价值的充分挖掘。但金融行业数据的外循环却相对匮乏,金融业沉淀的数据资源鲜少被流通出来。构数据内循环运营管理方式,也需要考虑如何推动和构建数据外循环的运营实现方案,通过数据流通从数据要素市场的买方向数融行业沉淀和积累的数据资源的价值挖掘。另一方面,金融行业自身的金融业务属性,也需要在数据经济中承担起金融服务商的使命。从服务实体产业向服务实体产业资产的资本变现模式创新。有特点进行运营管理,还需要结合金融业自身的行业使命进行针对性地思考,从而搭建起具有金融业特色的数据运营管理体系。2.金融业数据运营的现状我国金融行业在信息化、自动化、智能化建设上,起步早、大提高了金融服务实体经济和人民生活的效率和质量。金融行业沉淀和积累了丰富的行业数据。金融行业也在科技的推动下,从数字金融、网络金融向数据驱动决策的智能金融和数据开放融合方向转变,这对金融数据运营提出了全新的要求。随着金融行业数据应用程度的不断加深,金融机构汇聚的数据规模、衍生的数据资产、数据类型也在快速地增长。传统的数据治理模式在效率和效果上都难以支撑新形势下的快速发展。同时,《个人信息保护法》《数据安全法》《网络安全法》的整体采集的授权同意管理体系和基于个人用户同意的数据应用控制类分级管理能力,也成为金融机构运营管理实践的重要内容。金融行业的数据运营,还要兼顾数据内循环和数据外循环的两方面要求。内循环是在集团或企业范围内,构建统一的数据标准、数据汇聚管理能力和数据开发利用能力,面向内部全业务链现。在这个过程中,数据价值的评估、数据资产的定价以及数据流通的计费管理和收益分配,成为数据价值变现的重要考量因通过数据流通印证数据资产的价值,为金融机构带来收益的同时,金融行业也在探索将金融赋能实体经济的业务内涵扩展到数字经济中。通过向已经存在数据采购合同的数据标的进行融资支持,金融机构通过金融产品创新有一次参与到数字经济浪潮全过程中深度探索金融行业的主体角色和能力边界,全面塑造着金融行业在新时代的崭新形象。3.金融业数据运营的目标金融业即可作为数据要素市场的普通参与主体,又身兼数据要素市场金融服务商的天然使命,金融业数据运营的目标就需要符合金融业的两种核心角色要求。值挖掘和应用机制,建立对内流通和对外流通双循环运营管理体系,发挥数据的价值并降低数据价值实现的整体成本。另一方面需要聚焦金融行业的业务特点,从数据资本运营的角度探索金融行业数据运营的价值实现路径。4.金融业数据运营体系(1)数据资源化阶段运营要求数据资源化阶段是指将有含义的数据信息集聚到一定规模,形成可被使用的资源的阶段。主要包括数据采集、数据清洗、数据加工、数据存储、数据价值评估几个方面。在数据资源化阶段,数据运营管理需要解决数据的标准与合数据产品,内容涉及数据标准和制度规范、数据质量、数据分类分级、数据资源目录、数据开发利用、成本管理和数据价值评估等。总体上来看,数据资产价值评估需要从多维度上进行统一考虑和周期性监测,以此建立数据资源价值的持续评估能力。(2)数据资产化阶段运营要求《数据资产管理白皮书(4.0)》将数据资产定义为“由企业拥有或控制的,能够为企业带来未来经济利益的,以物理或电子的方式记录的数据资源,如文件资料、电子数据等”。根据该数据资产。也就是说,数据资产诞生于数据资源的变现环节中,通过交换、交易等方式为企业或单位产生收益的数据资源,就变源的变现。数据资源变现离不开数据要素市场,市场化要素配置是数据制,按照“市场评价贡献、按贡献决定报酬”的价格生成机制,根据市场供求关系最终形成数据资产的市场化价格。但由于数据资源的特殊性,数据资源的价值贡献难以事先获得、数据交易双方对数据价值的判定存在信息不对称等情况,使得数据资源的定价复杂程度大幅提升。目前市场主流的数据定价依赖真实性、收益最大化、公平、无套利、隐私保护和计算效率的六大基本原则。而定价方法则集中于预定价、固定定价、拍卖定价、实时定价、协议定价和免费增值六类。针对大规模数据要素流通的市场定价,黄倩倩等人也提出了基于“报价-估价-议价”相结合的数据交易价格生成路2)数据商品目录数据商品目录有别于数据资源目录,是针对已经具备数据资产化条件的数据产品的统一管理清单。数据商品目录包含数据资据产品合规要求、数据价格、数据面向场景的行业贡献情况、数据交付要求等面向数据变现过程中的其他信息。数据商品目录集中呈现了某一数据流通平台范围内具备对外提供的数据资产范围。3)场景撮合数据资产的运营即利用最小的成本和资源,将数据资产服务表现在数据资产对特定场景的影响程度不一样。且由于行业差异、市场主体差异、目前客户群体差异等多维度因素的影响,这种数据资产的影响程度呈现出复杂的变化。另一场景,推动数据要素流通,是数据资产化阶段运营的关键任务。4)主体管理寻找到合适的场景,下一步就是围绕场景拓展有需求的客户。客户的来源可能存在多种情况,包括直接挖掘客户、代理人引入客户、集采分销引入客户等等。不同客户来源也带来了不同因而数据资产的有序流通,需要能够面向数据要素市场的多角色、多主体提供全面支持。5)数据交付数据资产化阶段核心任务是实现数据资源的变现。数据资源的成功交付使用,是变现前提条件。根据《数据安全法》规定,需要“建立数据分类分级保护制破坏、泄露或者非法获取、非法利用,对国家安全、相匹配的数据交付方式,是数据要素安全流通的基础。人工智能数据等将数据进行分类分级管理,并通过引入数据沙箱、隐私计算等多种数据交付工程解决方案并结合区块链等技术实现方式来搭建数据要素流通底座,实现金融领域数据要素的安6)数据贡献评价基于场景的贡献度、数据源服务能力、数据产品使用评价。通过生态内的数据资产评价标准,帮助降低数据资产变现过程中的信息不对称性,促进数据要素市场的健康发展。数据资产顺利交付后,需要根据数据流通过程中涉及的关联完成整个数据要素市场的资源配置。数据要素有别于传统商品,对数据要素在不同场景中的共享情况需要针对性进行测量和评估。因此数据资产变现过程中的收益分配也要根据数据资产交付的不同形式进行穿透式管理和针对性支持。(3)数据资本化阶段运营要求数据资本化是指通过数据交易流通将数据资产转变为数据到新的生产关系中,从而在更高层次上实现数据资本价值。数据技术的迅猛发展正在消除金融资本、实物资本与数据资本之间的鸿沟,巨大的颠覆性创新正在逐步将数据引入资本市场。数据资本需要通过金融产品的创新,实现对数据资产的融资、数据资产的信托、数据资产的权益保障等方式,构建基于数据资产的全新价值变现体系,实现数据的资本化运营。(4)穿透式审计数据运营管理需要具备支持平台审计或第三方审计的能力,建立起针对数据生命周期的全过程进行穿透式监管。穿透式监管是指不仅需要针对传统数据链路中的上下游链路、数据处理方式、数据处理对象进行监督和记录,还需要面向数据处理过程进针对中高保密数据运营过程中的数据来源合规性、数据应用方式合规性、数据流通过程合规性等进行识别和审查能力,才能切实保障平台运营工作的合规性、有效性。(5)数据存证和纠纷解决为了支持平台或第三方进行合规性审计,也为了支持数据资源化、资产化、资本化运营过程中产生的纠纷解决,除了需要做好穿透式追踪和记录机制外,还需要建立可信的数据存储和管理行业范围内通过区块链来解决数据存储的不可更改问题,并通过联盟链的方式,利用智能合约机制建立统一、共识的可信数为了保证平台存证数据满足纠纷解决的证据线索要求,平台还需要对存储的数据范围、数据内容进行管理。行业范围内可通过行业标准、引入公证机构、加入司法联盟链的方式来建立存证管理的标准体系。5.数据运营体系待解决问题度是充分发挥数据要素作用的前提,是实现资源有效配置和经济于构建数据基础制度更好发挥数据要素作用的意见》,提出要统筹推进数据产权、流通交易、收益分配、安全治理,加快构建数据基础制度体系的总体要求。数据流通领域和法律界人士从实践权制度先行先试。北京、上海、深圳、贵州等地的国家级新型数据交易中心,从数据流通实践的角度进行探索和尝试。比如北京国际大数据交易所(下称“北数所”)在2021年上线的IDeX系统,实现了数据产品上架登记的功能,并结合区块链数据不可篡改的特性进过数据准入评估对数据权属和合规性进行监督和管理。法律界则提出优先从搭建以数据使用权为核心的产权制度体系出发,通过对数据进行分类分级,进行针对性的制度设计和业务实践,促进数据的使用和价值的释放。安全数据安全分级指南》的基础上,探索金融数据确权的行业解决方案,推进数据确权规则的成熟和完善。1.框架总述素市场规范发展,有赖于行之有效的流通模式等规则机制和安全可靠的技术能力支撑。针对现阶段市场发展面临的挑战,提出包含规范体系、规则上而下指导和促进、自下而上支撑和推进,以保障数据来源可确认、使用范围可界定、流通过程可追溯、安全风险可防范。在规范体系的顶层指导下,通过规则机制和支撑能力体系双轮驱动,形成场内外多层次数据流通服务模式,共同推动金融数据流通市2.规范体系:战略规划、法律法规、标准规范国家战略规划、法律法规和行业标准规范整体构成金融数据立良好的数据流通市场环境。—2025年)》明确了金融数字化转型总体思路、目标方向和实其次,法律法规是保障数据要素流通合法、有序进行的重要行成为网络空间治理和数据保护的三驾马车,《网络安全法》负责网络空间安全整体的治理;《数据安全法》是数据安全领域的基础法律,负责数据处理活动的安全与开发利用;《个人信息保护法》负责个人信息的保护。最后,标准规范的制定和实施是推动数据要素流通的关键环据安全分级指南》和《金融业数据能力建设指引》等文件为金融数据采集、分类分级处理、传输、存储和使用等各个环节提供了详细的操作指南和安全标准。3.服务模式体系基于金融数据流通现状和当下国内各地数据交易所的发展,私计算流通服务模式;在同领域或同行业机构间共享与交换实现数据流通。另一方面,现如今各为场内、场外交易。综合金融业数据流通诉求、数据交易所模式以及数据要素市场外以及数据集、API服务、隐私数据服务等模式交互融合,建立多层次、多样化的数据流通服务模式体系。4.规则机制体系:管控、管理、市场数据流通规则机制体系分为管控机制、管理机制、市场机制三个层次,分别规范和促进金融数据流通的可行、能行和易行。管控机制是金融数据有序流通的前提,保障数据流通源头的合法是金融数据流通的关键,合作生态和定价收益等体系的建立有助于催化数据流通市场的高效发展。(1)管控机制管控机制层面由数据登记和公证体系、数据信用体系等组登记和公证体系:建立数据登记和合规公证体系,保障数据合法合规。登记构成要件包括登记机构、数据来源说明、数据授障交易数据真实可靠以及数据承载的数据主体权益,为数据要素稳定、健康、快速发展。造数据交易市场社会信用体系,逐步完善数据交易中失信行为认定、失信惩戒、异议处理和信用修复等机制。加强与社会信用体定交易数据“负面清单”,明确国家秘密、商业机密、个人隐私领域不能或严格限制交易的数据项。建立交易诚信“黑名单”机并责令限期整改。(2)管理机制管理机制层面由安全管理体系、质量管理体系、流通规则体系等组成。强调数据交易的可追溯性,记录、追溯数据交易的事前磋商与验证、交易流程和数据触达情况等。建立数据要素流通使用全过程的合规公证、安全审计、算法审查、监测预警机制,促进不同场景下数据要素安全可信流通。根据数据内容、应用场景等制定数隐私保护和安全防护。大力推进金融数据标准化建设,统一金融数据的规则和技术要量监管规则,将数据质量情况作为金融机构、公司治理风险管控的重要考量因素,加强评估考核和监督检查。中流通、场内场外相结合的交易制度。数据流通应体现为多层次的市场交易体系,并根据具体的类型和场景,适用不同的交易规交换、交易等场内和场外的流通方式。建立数据用途和用量控制制度,实现数据使用“可控可计量”。(3)市场机制市场机制层面由合作生态体系、定价收益体系、需求管理体系等组成。同构成的数据流通合作生态体系。交易所可以夯实数据要素治理数商可以提高数据要素应用水平,负责对多源异构数据的汇聚对接、清洗加工、质量管控、可信流通,将非标准化准化产品;第三方机构可以释放数据要素流通活力,提供数据集成、数据经纪、数据评估、数据审计、数据公证等市场服务,加快构建数据要素社会信用体系。价贡献、按贡献决定报酬的相关机制。充分发挥市场在资源配置中的决定性作用,扩大数据要素市场化配置范围和按价值贡献参强化基于数据价值创造的激励导向。通过数据产权制度保障数字权益、保障各相关主体基于数据市场评价贡献决定报酬分配。导向,梳理应用所需数据,开展专项数据治理。再通过迭代的方同时也涵盖监管要求的数据价值实现。加快培育供求匹配高效、标准制度统一、市场运行规范、产品质量可控的数据要素市场。金融数据流通的支撑能力体系。数据资产管理能力:数据资产(DataAsset)是指由组织(政府机构、企事业单位等)合法拥有或控制的数据,以电子或其他方式记录,例如文本、图像、语音、视频、网页、数据库、传感接带来经济效益和社会效益。在组织中,并非所有的数据都构成数据资产,数据资产是能够为组织产生价值的数据,数据资产的形成需要对数据进行主动管理并形成有效控制。从企业应用的角或控制,且预期在未来一定时期内为企业带来经济利益的以电子方式记录的数据资源。数据资产管理(DataAssetManagement)是指对数据资产进行规划、控制和供给的一组活动职能,包括开发、执行和监督有制、保护、交付和提高数据资产的价值。数据资产管理须充分融体内容在3.2章节详细论述。(4)数据治理能力金融业数据治理是指金融机构通过建立组织架构,明确董事会、监事会、高级管理层及内设部门等职责分工,制定和实施系统化的制度、流程和方法,确保数据统一管理、高效运行,并在经营管理中充分发挥价值的动态过程。数据治理其实是一种体系,是指从组织架构、管理制度、操作规范、应用技术、绩效考核支持等多个维度对组织的数据模型、数据架构、数据质量、数据安全、数据生命周期等各方面进行全面的梳理、建设以及持续高质量的数据对金融机构是战略性资产,要使数据具有价值,需确保数据的可信任、安全性、可访问性、准确性、共享性和及时性。然而,由于历史原因,大多数金融机构的数据是分散的、缺乏规范管理、无主数据标准的状态。随着金融机构不断推进数字化转型的进程,有效数据正迅速成为一个关键的业务差异,因此数据治理显得尤为重要。数据治理能力在3.3章节详细(5)数据流通的流程与技术数据交易业务流程主要包含数据产品上架、需求发布、分类分级登记和确权、数据资产评估和定价、供需匹配、数据产品分级流通、交易存证管理、监管通道、运营分析和数据产品下架等流程。具体如图3所示:脱敏、去标识化、匿名化、区块链、数据水印技术、密码技术、大数据技术与分析技术等。隐私计算在3.4章节详细论述。(6)数据运营能力方面,借助服务中介机构,其优势是对行业有深入的理解和服务经验,支持其挖掘合规、创新等各类潜在的场景。难以成为主要的流通模式,数据产品和服务则有可能成为数据要产品和服务的主要功能和交互界面,是实现数据要素价值交换的可行方式。同时,也有利于评估流通价格。活跃数据流通与交易:数据要素流通的关键在激发各方的动逐步丰富数据供给。同时,依托生态建立多方共赢的权益激励机务的成效。此外,加强数据合规和安全保障措施,免除各参与方数据运营在3.5章节详细论述。1.数据共享资产。如何在安全合规的前提下有效利用数据,推动数据的流通共享与开发利用,实现数据价值的最大化,成为数字经济发展的重要课题。由于数据具有流动性、多样性、可复制性等不同于传统生产要素的特性,数据安全风险在数字经济时代被不断放大。海量的拥有方面临失去其控制权和收益权的风险,同时数据流通链路的各环节都有可能发生数据泄露、隐私侵犯等一系列后链路问题。三个阶段均存在不同程度的原始数据出域情况和数据泄露风险。2021年,《数据安全法》和《个人信息保护法》正式实施后,法律层面对数据安全做出明确要求,传统数据流通模式存在较大的合规风险。由此,4.0的隐私计算阶段正式进入行业视野,数据流通与应用发生范式变革,业内普遍认为通过隐私计算可以赋能数据价值的安全释放与数据智能的合规应用。(1)隐私计算概述隐私计算(Privacy-preservingcomputation)指在保证数据提数据要素价值为目标的一类信息技术,保障数据在产生、存储、隐私计算是一套包含人工智能、密码学、数据科学等众多领域交叉融合的跨学科技术体系,用于保证满足数据隐私安全的基础上,实现数据价值的流通。隐私计算技术契合当前建设数字经济,挖掘数据要素市场的在多主体间充分进行数据共享与利用,实现数据价值的转化和释隐私计算主要包括如下三类:一是以多方安全计算、同态加密为代表的基于密码学的隐私计算技术。多方安全计算是一种在参与方互不信任且对等的前提导出的信息之外不泄漏各方的隐私数据的协议。同态加密是能够直接使用密文进行特定运算的加密技术。在同态加密计算过程在解密后,得到与明文计算相同的结果。二是以联邦学习为代表的人工智能与隐私保护技术融合衍生的技术。联邦学习是一种分布式机器学习范式,包括两个或多个参与方,这些参与方通过安全的算法协议进行联合机器学习,可以在各方原始数据不出本地、不传输原始数据的情况下联合多方数据源建模和提供联合模型推理服务。三是以可信执行环境为代表的基于可信硬件的隐私计算技术。基于可信执行环境的安全计算是数据计算平台上由软硬件方法构建的一个安全区域,可保证在安全区域内部加载的代码和数据在机密性和完整性方面得到保护。(2)隐私计算的发展阶段与共识《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》,从国家立法层面明确了对数据安全和隐私保护的多法联动要求;同时在国务院办公厅、工信部、央行等国家部委级套出台了-系列文件明确将数据作为-种新型生产要素,与土地、劳动力、资本、技术等传统要素并列,并且明确鼓励科技创新赋能数据安全有序流通。在国家相关政策、法规的支持下,隐私计算技术逐渐成为影目前被公认为是既能保护数据安全、又能释放数据价值的技术最优解。经过两年多的发展,隐私计算已经从概念验证阶段步入商业落地阶段,逐步形成了更广泛的技术共识和市场共识。在技术层面,以多方安全计算、联邦学习与可信执行技术为主的隐私计算每种技术均有各自特性与原生局限。在实际业务场景应用中,客户更注重其技术能否满足多样化的计算需的技术共识,对于构建基于隐私计算的全域数据智能流通网络有在市场层面,隐私计算商业化进程自2021年下半年以来明显提速,对于隐私计算价值的认知和预期也开始从平台建设延展至场景运营,形成了市场共识。隐私计算作为一种需要“对手使用方”才能充分体现价值的技术,除了提供数据流通安全的基础设施技术外,还在于与数据供应方和数据应用方建立生态链接,使多个数据供应方的数据资源通过算法实现价值融合,形成全局性的数据智能,最终应用于场景中并通过改善业务效果来充分释(3)多方安全计算多方安全计算(SecureMulti-PartyComputation,简称MPC或SMPC是指在无可信第三方的情况下,各方共同参与计算任意约定的函数,同时在计算过程中各个参与方的数据都不会发生泄漏。多方安全计算作用于数据交换过程中,在保证了数据保密的同时实现了数据共享,实现了数据可用而不可见,有利于解决“数据孤岛”现象。多方安全计算是密码学的一个分支,涉及很多密码学知识,同时也反作用于密码学,两者相互促进。多方安全计算包括多个技术分支,主要用到的技术是秘密共享、不经意传输、混淆电路、同态加密、零知识证明等。2)技术发展现状多方安全计算自1986年被提出之后,在比较长的时间里,针对其研究都集中在理论层面,而针对多方安全计算的应用少之使多方安全计算得到实际的应用。近年来,由于各国更加重视对数据资源的保护,出台了大量法律法规,多方安全计算又重到大众的视野,多个领域都开始尝试使用多方安全计算技术解决疗等领域有实际落地的应用。并且,相关的技术标准(如JR/T0196—2020多方安全计算金融应用技术规范)以及实施指引等3)技术发展趋势当前多方安全计算的开销大,所以需要优化算法的效率才能够使其大规模应用,同时多方安全计算属于密码学的分支,使用MPC技术将进一步与其他前沿技术如区块链、人工智能、物联4)应用情况多方安全计算技术可以在相对封闭的数据参与方间,建立起安全可信的数据交换网络,实现数据价值的最大效用。多方安全计算适用于数据安全查询、隐私集合求交及联合数据分析。数据安全查询指的是:数据查询方需要向数据拥有方查询数也不想让数据查询方知道其余数据。利用多方安全计算技术,能够实现数据的安全查询。隐私集合求交(PrivateSetIntersection,简称PSI)指的是:当两方都有各自的秘密列表,通过PSI,他们只能知道这两个列表有哪些项目是重合的,但是无法让对方看到自己列表中除交集之外的任何信息。能够在保证数据隐私和安全的同时,促进信息联合数据分析指的是:数据分析方分析数据需要使用到多个数据分析算法会暴露参与方数据的隐私,多方安全计算能够使原始数据在无需归集与共享的情况下实现计算,保护目标数据参与方的隐私。(4)联邦学习联邦学习(FL,FederatedLearning),又名联邦机器学习,联邦计算。联邦学习是在原始数据不出本地的前提下,通过模型的流通与处理来完成多方联合的机器学习,得到聚合的训练结果。联邦学习的参与方一般包括数据方、算法方、协调方、计算方、结果方、任务发起者等角色。2)技术发展现状按照数据特征和样本的分布情况,联邦学习可划分为横向联纵向联邦学习适用于参与方拥有重叠的数据样本,而数据特征不一致的情况。典型的例子是两家公司提供完全不同的服务,但在用户群体上有非常大的交集时,他们可以在各自不同的特征空间上协作,得到一个更好的机器学习模型。联邦迁移学习是指各参与方的数据集之间只有少量的重叠样本和特征,或者数据集的分布情况差别很大时,利用源领域和目标域之间的相似性,实现跨领域知识迁移的学习技术。3)技术发展趋势联邦学习的技术正在飞速发展中。2021年,名为群体学习的新型去中心化机器学习系统的出现引领了联邦学习新的潮流。群体学习引入区块链技术取代第三方协调方,在区块链上共享加密的梯度参数,参与方根据本地数据在本地进行所有模型运算,有力地保证了数据隐私不泄漏。群体学习利用区块链技术对试图破坏网络的不诚实参与者采取措施,用惩罚和激励机制为群体网络提供弹性和安全性。相比之下,当前星型网络的联邦学习摆脱不了中心化的数据处理和单点故障风险;纯粹点对点网络的联邦学习数据通信带宽消耗随着参与方的增多将走向失控,因而计算的规模受到严重制约;而群体学习将边缘计算和基于区块链的对4)应用情况联邦学习的架构通常支持通用硬件。而隐私计算的其他分支可行执行环境是需要特定硬件的。在多方参与的复杂场景下,联邦学习这种硬件无关的特性减少了多方间达成一致的沟通成本。当前有部分行业的用户执行严格的数据不出域要求,不仅原联邦学习“数据不动模型动”的特点能够契合用户的要求,化解由于联邦学习在数据安全流通中的显著作用,已被广泛应用于金融领域,在保证用户隐私的前提下用于联合数据挖掘和建(5)可信执行环境可信执行环境(TrustedExecutio是计算平台上由软硬件方法构建的一个安全区域,可保证在安全区域内部加载的代码和数据在机密性和完整性方面得到保护。其目标是确保一个任务按照预期执行,保证初始状态的机密性、完整性,以及运行时状态的机密性、完整性。2)技术发展现状可信计算平台联盟TCPA(TrustedComputingPlatformAlliance)该组织于2003年改组为可信计算组织TCG,并制定了关于可信计算平台、可信存储和可信网络连接等一系列技术规范。2009年OMTP(OpenMobileTerminalPlatform,开放移动终端平台)工作组智能终端的安全率先提出了一种双系统解决方隔离的安全操作系统,这一运行在隔离的硬件之上的隔离安全操作系统用来专门处理敏感信息以保证信息的安全。2011年GlobalPlatform(全球最主要的智能卡多应用管理规范的组织,简称为GP)从2011年起开始起草制定相关的TEE规范标准,并联合一些公司共同开发基于GPTEE标准的可信操作系统。因此,如今大多数基于TEE技术的TrustOS都遵循了GP3)技术发展趋势在国外ARM公司、Intel和AMD公司分别于2006、2015和2016年各自提出了硬件虚拟化技术TrustZone、IntelSGX和AMDSEV技术及其相关实现方案,在国内中由关村可信计算产业联盟2016年发布TPCM可信平台控制模块,为国产化可信执海光分别在2017年和2020年推出了支持可信执行环境技术ZX-TCT、海光CSV(ChinaSecurityVirtualization)。4)应用情况可信执行环境TEE技术因可支持多层次、高复杂读的算法逻辑实现、运算效率高和可信度量的方式保证TEE的运行逻辑的可信及可度量性的特性,受到业界一致认可,越来越多可信执行环境TEE的开源框架和产品踊跃而出。可信执行环境技术(后简称TEE)因其较强的算法通用性和较小的性能损失,在许多涉及隐私数据计算的场景中都得到了广a.计算逻辑相对复杂,算法难以通过同态加密等技术进行改造,或者改造过后效率下降过多。b.数据量大,数据传输和加解密的成本较高。d.需要可信第三方参与的隐私计算场景,且数据(部分或间接)可被可信第三方获取或反推。e.数据的传输与使用环境与互联网直接接触,需要防范来f.数据协作的各方不完全互信,存在参与各方恶意攻击的可其中最常见的具体应用场景包括:隐私身份信息的认证比对、大规模数据的跨机构联合建模分析、数据资产所有权保护、链上数据机密计算、智能合约的隐私保护等。(6)隐私计算的应用随着政策与需求的双重推动,隐私计算技术和产品成熟度迅速提升,从2020年的概念验证阶段快速进入到2021年的商业化落地阶段。据中国信通院《隐私计算应用报告(2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论