金融大数据应用新进展-从智能金融、普惠金融到宏观金融决策_第1页
金融大数据应用新进展-从智能金融、普惠金融到宏观金融决策_第2页
金融大数据应用新进展-从智能金融、普惠金融到宏观金融决策_第3页
金融大数据应用新进展-从智能金融、普惠金融到宏观金融决策_第4页
金融大数据应用新进展-从智能金融、普惠金融到宏观金融决策_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

金融大数据应用新进展从智能金融、普惠金融到宏观金融决策

波士顿咨询(BCG)的研究表明:不同的行业数据强度差异很大,金融行业的数据强度最大,因此大数据的概念很受金融机构重视。麦肯锡近期的研究报告也称大数据、云计算以及区块链等下一代金融颠覆性技术正逐步成熟。一大数据推动智能金融的兴起人工智能并非新生事物,在经历几次起伏之后迎来一次新的高潮,许多国家从国家战略层面来探索人工智能,美国政府曾组织多次关于人工智能的研讨会,广泛搜集意见,并且在2016年6月6号发布了《白宫人工智能未来计划》;日本提出“超智能社会”;2015年5月23日中国四部委发布了《“互联网+”人工智能三年行动实施方案》。(一)人工智能成为时尚人工智能(ArtificialIntelligence,简称AI)被用来代指一系列可以执行感知、学习、推理和决策的计算机技术,目的是让机器能像人一样解决问题。AI涵盖机器学习等学科,在过去15年,得益于数据、算法和计算能力的改善,业界在AI领域取得了长足进展。就目前的人工智能的布局来看,全球有6000多家人工智能公司(6038),美国人工智能企业总数为2905家,占全球的48%,约为一半,中国仅北京、上海、广州就有人工智能公司447家,占全球的7.4%[1]。(二)人工智能与大数据最近几年人工智能备受关注的一个重要原因就是大数据时代的到来,越来越多的数据产生了,这些数据中蕴含着很多经验和模式。为了教给人工智能新的技巧,需要将大量的数据输入模型,用以实现可靠的输出评分。目前,人工智能的突破主要依赖基于神经网络的机器学习。机器学习主要在大数据中寻找一些“模式”,然后在没有过多的人为解释下,用这些模式来预测结果。此方法意味着,数据量积累得越多,系统会越好。过去,人工智能的方法基本不受益于数据量的提升;新的方法中,只有五分之一的贡献来自方法本身的改进,其余全依仗数据量的提升。数据量推动系统从量变飞跃到质变[2]。大量数据(特别是标识数据)的支持是人工智能最核心的需求。无论是模式识别还是神经网络,不管是机器学习训练还是算法优化,都需要大量数据的“喂养”。例如,AlphaGo的成功之处,就在于其载有十几万份人类6~9段职业棋手对弈棋谱的数据库,AlphaGo利用其模仿人类常见的落子方式。通过大数据学习,人工智能算法发挥着越来越重要的作用,尤其是近期深度学习的进展对感知智能(包括图像和语音识别)的精度提升贡献巨大。大数据蕴含了丰富的信息维度,可以比喻为提供了必需的血液和能量,人工智能就好像“大脑”,对这些信息进行分析识别和认知发现,具体的行业应用则好像“躯干”,基于信息执行决策。国内外知名的互联网公司对人工智能都显示出高度的关注,认为人工智能和互联网大数据的结合会产生很多创新点,是驱动未来技术和商业模式的引擎。这些互联网公司都投入大量的人力和物力进行一些前沿性的研究和探索。(三)金融+人工智能的智能金融的兴起金融行业是一个数据密集型领域,除了数据量大之外,数据价值也非常高。AlphaGo所代表的人工智能在近几年大放异彩,所展示出的机器的深度学习能力让大数据处理呈现了新的方向。业界人士对于人工智能在金融领域的应用充满了期待,希望机器可通过大量学习已有的历史金融数据、策略、研报等,成为一个脑容量巨大、计算力超群的投资大师。国外金融领域已经开始探索人工智能的应用。一家新兴对冲基金Aidyia开发了自动交易机器人,该智能系统可以看到大量数据中蕴含的人们不能轻易发现的模式和规律。计算机辅助交易虽不是什么新鲜事,但是该公司希望可以开发智能软件,在没有人工指导或干预的情况下自行适应快速变化的交易市场。除了价格数据和技术图形分析,该智能系统充分研究了现有数据,集合不同语言的新闻报道、基本因素和经济数据,以及其他多个市场的价格和成交量,综合各种资料经过复杂验算,最终组合成模型,就个股在未来一星期或一个月将出现的价格走势做出预测[3]。Kensho是美国一家基于大数据和人工智能的金融科技公司,专注于对各类事件对金融市场的影响进行智能分析。该公司在2014年获得高盛的投资。“当油价高于100美元一桶时,中东政局动荡会对能源公司的股价产生怎样的影响?”Kensho的软件能很快给出答案,它的诀窍是通过大数据分析和自主学习。而对冲基金的分析师即便能获得所有的数据,也要经过数天的演算、推断,才能找到答案。(四)国内智能金融的现状在人工智能的热潮中,国内“人工智能+投资顾问”结合体形式的智能投顾初创企业也如雨后春笋般不断冒出,虽然参差不齐,但也代表了智能金融在国内发展的一个方向[4]。智能投顾的一个重要的特点就是通过大数据获得用户个性化的风险偏好及其变化规律。从市场规模来看,国内的智能投顾行业在中国国内处于非常早期的阶段,仅有的几家知名平台也处于创业期,远未形成规模。短期来看,智能投顾虽然能起到较大的辅助作用,但在绝大部分领域还不能替代人力。互联网金融的领跑者阿里巴巴率先布局智能金融[5],把人工智能技术用到互联网小贷、保险、征信、智能投顾、客户服务等多个领域。另外一家互联网巨头百度也积极在智能金融领域进行尝试。在2016年9月的百度世界大会上,百度金融宣布百度金融科技将投入大量的人力和物力来进行量化投资的研发。(五)智能金融的展望目前人工智能相对成熟的应用可以在图像识别和语音识别方面实现突破,来改善金融领域的身份验证、客户服务以及反欺诈,蚂蚁金服已经在金融标准化委员会的指导下开始牵头制定《互联网金融行业生物识别个人身份验证技术要求》和《互联网金融行业生物识别个人脸识别安全应用框架》两项金融标准。但是智能金融在一些重要的交易环节还不能完全实现自动化,目前和未来的一段时间内,智能金融会主要以“人工智能+专业经验”的形式提供金融的决策支持[6]。人工智能在金融应用中存在的交易风险也不能忽视,例如程序化高频交易会在市场下跌时根据策略模型严格执行止损,而这容易加速下跌。2010年,类似的事件使道琼斯工业指数在36分钟里暴跌9%,被称为万亿美元的股市下跌。从技术的角度来看,人工智能在金融领域的应用还处于尝试阶段。人工智能对金融的深远影响还不能够预测,真正的应用场景还要认真地思考。二助力互联网金融,实现普惠金融(一)普惠金融人群缺乏传统征信数据近年来传统金融服务模式深受大数据技术的影响,后者不仅可以渗透到金融服务的每一个环节,而且还能开拓出新的金融服务应用场景,从而拓展被服务人群,让普惠金融成为现实。普惠金融中的一个重要挑战就是风险问题:例如,印度2010年发生了小贷危机,在印度微贷最发达的省出现多人违约事件;截至2016年夏天的统计表明,中国的P2P企业平台已经有一半出现问题。许多消费者和小微企业因为缺乏信贷记录和合适的抵押品,在申请金融服务时困难重重。这些享受不到正常金融服务的低收入人群和小微企业,就是普惠金融服务的目标。无论对于发达国家,还是新兴市场国家,金融普惠都是一个非常重要的话题。根据世界银行估算,截至2014年,仍有约20亿成年人无法享受到最基础的金融服务。另据美国《彭博商业周刊》报道,全球1/4的人口没有银行账户、信用评分以及财务身份,也就是说全球有20亿人没有借贷能力。美国消费者金融保护局的一项最新分析指出,占美国成年人口11%的2600万美国消费者没有信用评分,因为他们的信用报告中没有信贷信息。此外,还有占美国成年人口8%的1900万消费者因信用报告中没有足够的信贷历史信息,从而无法支撑信用评分的基本应用。假设有这么一种情况:某位消费者每月按时缴房租,将薪水的20%存进银行,在日常交易中使用借记卡而不是信用卡,避开一切信贷活动,意味着他不可能获取信用评分,这种情况下申请相关金融服务,会困难重重。目前国内央行征信系统所登记的8.7亿自然人中,有信贷记录的为3.7亿人;可形成个人征信报告、得出个人信用评分的有2.75亿人(统计时间为2015年9月底)。截至2014年,中国的人口是13.67亿,这意味着将近10亿个人消费者没有包含传统信贷信用记录的信用报告,也没有信用评分;约1亿人由于传统信贷信用记录不足,仅有信用报告,而无信用评分。波士顿咨询的研究报告显示,5600万小微企业仅从中国银行体系获取了12%的融资,加上类金融体系——含租赁、保险、P2P,合起来也只20%。背后的原因在于:融资时间长、抵押物不充分、没有财务报表、成本较高。(二)国外面向普惠金融的大数据技术尝试国外知名的征信机构益博睿、艾奎法克斯、环联、律商联讯和决策分析公司费埃哲都积极尝试大数据应用,将一些替代数据——非传统信贷数据,例如房租、公共事业缴费、电信消费和支付数据等——纳入信用报告,抽取新的指标变量开发新信用评分,研究成果目前在美国的金融机构开始初步应用。另外,面对普惠金融的强大需求,目前有上百家金融科技(或者称为互联网金融)公司正在利用大数据技术(在中国这种初创企业也有几十家),尝试解决这些非传统的信用风险评估问题,探索实现普惠金融的商业模式。例如通过手机使用情况和其他个人习惯来预测其信用状况,从而帮助这些人进入金融体系。这些初创公司认为,手机使用习惯、网页浏览、社交媒体使用方式、公共事业缴费记录,以及心理测试结果都可以成为为贷款人提供评估潜在借款人的新方法。评估的思路是:如果手机的电量从来不会接近耗尽,其主人一般会及时偿还贷款;接听电话数量多于拨出电话数量的借款人的违约风险通常会小一些;以简要方式陈述贷款用途的借款人要优于长篇大论叙述贷款用途的借款人。比较有代表性的新兴金融科技公司有ZestFinance、Upstart和企业金融实验室(EntrepreneurialFinanceLab简称EFL)[7]。ZestFinance公司服务于发薪日还款的借贷者[8];UpStart服务于年轻的大学生,利用他们的学习成绩、毕业学校信息和简单的工作经历进行风险评估[9];EFL则服务于小微企业主,利用心理测量学进行风险评估。此外,其他的金融科技公司,例如Kreditech利用在线购物历史、手机通话的地区分布和类似的信息生成约2万个数据点进行消费者信用评估,并且给予每一位申请者100欧元的初次贷款,以便为借款人积累信用历史,帮助其改善贷款模型;RevolutionCredit开发出对贷款申请人进行测试并向其介绍金融知识的问题和游戏。订购其服务的贷款发放公司可以将测试和游戏结果作为对申请人进行评估的组成内容;总部设在新加坡的Lendo通过社交网络的朋友圈,预测消费者的信用状况。如果这些金融科技公司的众多不同商业模式中有任何一个能够取得成功,那么它对金融服务业以及国际社会产生的影响都将是巨大的,将为普惠金融的实现带来生机和活力。(三)大数据信用风险评估案例分析——ZestFinance美国新兴的互联网金融公司ZestFinance,原名是ZestCash,其研发团队主要成员为数学家和计算机科学家。公司前期主要通过ZestCash平台向用户放贷,后来聚焦于信用评估服务:以大数据技术重塑审贷过程,使得那些很难获得传统金融服务(Underbanked)的用户拥有可用的信用,从而降低该人群借贷成本。刚开始,ZestFinance为传统的发薪日贷款(PaydayLoans)(因借款人承诺在发薪日还款而得名)公司提供在线替代的产品。使用该产品的人群因信用记录缺失或记录较差,银行及一些非银行机构都拒绝为其提供金融服务,致使他们需支付高昂利息获取贷款。图1大数据征信视角和传统征信视角的比较图1展示的是ZestFinance公司基于大数据相关性原则所采用的信用评估视角。该评估方法和传统征信评估的基本立足点是一致的:消费者的还款能力和还款意愿。差异在于,传统征信的数据取自银行信贷数据,和信用风险直接相关;而大数据征信的数据在传统信贷数据之外,还囊括了与消费者还款能力、还款意愿相关的一些描述性风险特征,这些风险特征的抽取与筛选正是ZestFinance的技术核心所在。以传统征信方法的视角看,这些大数据征信的数据和消费者的信用状况相关性相对较弱,因此,ZestFinance就利用大数据技术搜集更多的数据维度,支撑、加强这些弱相关数据的描述能力。由此,大数据征信不再只依赖传统信贷数据,而是覆盖了更多消费者人群。1.大数据采集技术ZestFinance以大数据技术为基础采集多源数据,一方面继承了传统征信体系的决策变量,重视深度挖掘授信对象的信贷历史。另一方面,将能够影响用户信贷水平的其他因素也考虑在内,如用户申请信息等,从而实现了深度和广度的高度融合。如图2所示,ZestFinance数据来源的多元化体现在:首先,对于ZestFinance进行信用评估最重要的数据还是通过购买或者交换来自第三方,既包含银行和信用卡数据,也包括法律记录、搬家次数等非传统数据。图2ZestFinance公司的金融大数据实例其次是网络数据,如IP地址、浏览器版本甚至电脑的屏幕分辨率,这些数据可以挖掘出用户的位置信息、性格和行为特征,有利于评估信贷风险。此外社交网络数据也是大数据征信的重要数据源。最后,直接询问用户。为了证明自己的还款能力,用户会有详细、准确回答的激励,另外用户还会提交相关的公共记录凭证,如水电气账单、手机账单等。多维度的征信大数据可以使得ZestFinance不完全依赖于传统的征信体系,对个人消费者从不同的角度进行描述并进一步深入地量化信用评估。2.大数据挖掘技术ZestFinance的核心竞争力在于其强大的数据挖掘能力和模型开发能力,将机器学习领域比较成熟的技术创造性地用于传统的信贷风险管理领域。传统的信用评分模型一般拥有500个数据项,从中提取50个变量,利用一个预测分析模型做出信用风险量化评估。而在ZestFinance的新模型中,往往要用到3500个数据项,从中提取70000个变量,利用10个预测分析模型进行集成学习或者多角度学习,进而得到最终的消费者信用评分。如图3所示,ZestFinance的数据源是大数据,可以生成数以万计的风险变量,然后分别输入不同的预测模型中,例如欺诈模型、身份验证模型、预付能力模型、还款能力模型、还款意愿模型以及稳定性模型等。每一个子模型都从不同的角度预测个人消费者的信用状况,克服了传统信用评估中一个模型考虑因素的局限性,使预测更为细致。图3ZestFinance的信用评估模型解读2015年6月底,京东集团宣布投资ZestFinance,同时双方宣布成立名为JD-ZestFinanceGaia的合资公司,此举意味着京东将在自身消费金融体系中进一步引入ZestFinance公司的技术和经验,打造创新消费者信用评估体系。这次合作最初将为京东的分期贷款购物行为评估信贷风险,最终的战略目标是为中国各地的企业客户提供信用分析服务。2016年7月18日,百度宣布也将向美国金融科技公司ZestFinance进行数额未明的投资,后者将利用机器学习与大数据分析融合为百度提供更加精准的信用评分。作为此次投资的一部分,百度将使用ZestFinance的技术来判断其用户的信用。例如,如果未成年人用户在工作日搜索视频游戏,表示此人可能没有工作,而且不是学生,这项数据可以用于判断此人的信用状况。(四)国内大数据风险评估的现状由于发展阶段的原因,中国市场可以使用的金融数据远少于美国,普惠金融的风险评估存在巨大挑战。但另外,移动互联网重塑了社会生活形态,创造了丰富的金融消费场景和更多维度的用户大数据,为实现普惠金融提供了信息渠道、技术手段和新思维。最新的《中国互联网络发展状况统计报告》显示,截至2016年6月,我国网民7.10亿人,互联网普及率达到51.7%,较2015年底提高1.3个百分点,分别超过全球及亚洲平均水平3.1和8.1个百分点[10]。截至2016年6月,我国手机网民6.56亿,网民中使用手机上网的人群占比较2015年底的90.1%提升了1.4%;仅通过手机上网的网民占比为24.5%,网民进一步集中于移动端。2016年上半年,互联网金融类应用保持较好增长,网上支付和互联网理财用户分别增长9.3%和12.3%。电商快速发展、第三方支付厂商拓展线下消费支付场景,提供了海量的基础数据资源,成为征信大数据基础。同时,互联网上围绕信用主体而产生的交易行为信息、金融或经济关系信息,为风险信息挖掘提供了基础。中国大数据时代正汹涌而至。7亿互联网用户、3.5亿微信用户,以及8亿的智能连接装置,产生了海量数据沉淀,这些基础大数据组成了中国互联网时代的核心资源。与欧美用户相比,中国用户对分享个人信息有更强的主观愿望。BCG最近完成的一份调研结果显示,当被问及“给您定制一个个性化产品,是否愿意分享你使用这一产品所产生的数据”时,给出肯定答复的客户占被调研者的93%。目前,国内有几十家金融科技公司在尝试利用大数据技术来解决普惠金融和互联网金融中的风险评估问题,例如闪银科技、量化邦、数云普惠、集奥聚合、银联智策等公司,分别对电信、支付和一些互联网金融消费行为的大数据进行整合、匹配、交叉验证和挖掘,量化评估普惠金融服务人群的信用风险。一些互联网巨头也在大数据信用风险评估领域跃跃欲试,抢滩普惠金融的制高点。除了前面介绍的京东金融和百度都与ZestFinance合作,共同探索大数据风控之道外,蚂蚁金服旗下的芝麻信用还开发出信用评分产品,对海量信息数据进行综合处理和评估,目前已经应用到新金融的小额贷款和共享经济场景下,取得了不错的效果。这些国内外利用大数据信用评估技术的尝试虽然不够成熟,但是已经初见成效,对于特定消费场景和特定的普惠金融人群,还是有很好的替代作用。首个具有全球意义的重要数字经济指导原则——由中国推动并参与制定的《G20数字普惠金融高级原则》,在2016年9月5日杭州召开的G20峰会上得以通过[11]。这一原则为金融大数据的应用指明了发展方向,利用大数据技术实现未来的数字普惠金融充满了生机。三宏观金融决策和监管的新工具目前业内的金融大数据强调在微观层面的应用,例如评价消费者的信用风险、支持投资决策、识别金融主体的身份等。随着大数据分析和挖掘技术的不断提高,微观的金融大数据可以经过整合、匹配和建模,来支持宏观的金融监管和决策。传统的金融监管和决策以定性为主,辅助以简化的量化指标,对实际情况缺乏充分的把握,而大数据技术可以充分利用底层的细粒度的微观数据,整合分散的信息,融合不同维度的信息,带来具有及时性、前瞻性和更为准确的决策支持,提高监管水平和决策能力。本节将以金融系统性风险管理、银行存款保险费率的计算、对欺诈交易的检测和经济结构变化四个方面为例介绍金融大数据在宏观金融决策和监管中的应用。(一)金融关联的系统性风险管理金融危机之后,全球金融市场的关联性远胜于过去。市场的互动性一旦大大加强,就会导致流动性风险和系统性风险,造成市场恐慌。国内的信贷担保圈(多家企业通过互相担保或联合担保而产生的特殊利益群体)就是金融关联的典型代表。由于信贷市场的发展,关联的企业越来越多,互相形成担保圈,甚至形成一张巨大的网。在经济平稳增长期,担保圈会降低中小企业融资的难度,推动民营经济的发展。然而,一旦经济下行,担保圈就会显露其负面影响——加剧信贷风险。如若处理不当,极易引发系统性金融风险。过去几年,在南方企业担保流行的省份,往往一家企业出现信贷不良,一群企业遭殃,一个行业陷入泥潭,整个地区面临系统性风险,一些本来毫不相干,资金链正常,经营良好的企业也由于担保关联,跌入破产的深渊。信贷市场担保圈问题一度愈演愈烈,传统的担保圈分析方法对理解、处理担保圈问题作用有限。企业之间担保贷款本来是一种中性的信用增进方式,恰当地使用会产生风险释缓作用,由于担保圈风险迭出,银行和监管部门把问题归结到担保贷款本身,目前各家银行采取了比较严格的限制条款来避免担保贷款的发生。任何信贷产品都存在风险,金融机构本身就是经营风险的专业机构。本文的研究认为,从专业角度来说,担保圈风险发生的根本原因,是缺乏合适的风险管理工具,没有对担保圈进行正确的风险管理。目前对于担保圈的量化风险分析存在以下问题。首先是缺乏担保圈全量的大数据,没有足够的信息支撑。各家银行和当地的监管机构只有局部的企业担保关联数据,构不成完整的担保圈视图,风险信息有缺漏。无法了解整个担保圈相关企业的详细信息,因此处理具有系统性风险特点的担保圈风险具有很大的局限性。其次是无法对担保圈风险进行建模,对风险进行正确的量化描述。传统的风险分析工具都是对单个企业进行风险建模,适合对企业的贷款金额、贷款质量以及信贷行为建模,对于企业之间的关联关系无法进行量化描述和风险分析。因此我国有必要借助大数据的复杂系统分析方法,启动对担保圈的深入分析,为化解因担保圈引发的金融风险创造条件。要考虑到如下条件:一是央行征信系统已收集了大量丰富的企业担保关系数据。截至2015年底,中国人民银行征信中心为2146万企业建立了信用档案,有信贷记录的企业超过596万家,关联关系信息(仅限于有贷款卡的用户)超过2亿条。二是复杂网络技术已日趋成熟。复杂网络是由数量巨大的节点(研究对象)和节点之间错综复杂的关系(对象之间的关系)共同构成的网络结构。复杂网络分析技术针对越来越多、越来越复杂的事物之间的关联关系进行非线性建模,可以较好地解决大数据的数据量(Volume)、数据复杂程度(Variety)和处理速率(Velocity)等基本问题。图4是利用大数据分析进行担保圈风险管理的示例。首先对全国范围的担保关联企业进行建模,图4展示的是2007年1月的全国性担保网络,网络中的节点表示企业,边表示担保关系。通过网络算法划分,将担保网络简化为不同的规模较小且相对独立的担保群,这些担保群之间的担保关联连接稀疏;担保群的内部联系非常紧密,所以担保圈风险一般只发生在群内部。图5展示了根据复杂网络的算法分析,对担保群的风险进行计算,对担保群进行简单的风险分类,便于金融机构进行风险监测和管理系统性风险,类似地,也可以对每一个担保企业,根据担保关联关系,利用算法计算出风险等级,便于量化风险管理。图4全国性的担保网络(2007年1月)图5担保圈风险分类结果此外,国外金融机构和中央银行、金融监管机构已经将大数据的技术分支——复杂网络分析——应用于研究银行间拆借市场以监测流动性风险的发生。随着金融市场的创新和发展,金融风险变得越来越复杂,需要更多的数据支撑和复杂的数学模型来量化描述,大数据技术将成为未来金融风险管理的利器。(二)银行存款保险费率的计算2015年5月,作为金融市场化进一步深入的重大举措,银行存款保险制度正式开始实施,这不仅有利于稳定宏观金融,也对利率市场化后商业银行的稳健经营和有序竞争有利。存款保险费率的厘定是存款保险制度的一个核心,而保费的估算是设计存款保险方案中的难题之一。保费结构的设计,在很大程度上决定了存款保险对于参保银行的可接受度。想降低道德风险并减少逆向选择,取决于合理的保费结构。国内对于银行存款保险的研究以定性为主,对保险费率计算的量化分析比较欠缺。从国外信贷数据的应用情况来看,信贷数据有助于银行监管者准确评估监管对象的信用风险状况。对于建立了公共征信系统的国家来说,风险分析技术可以成为有效的监管工具,由于银行业的危机通常和高的不良贷款率相关,信贷数据常常用于信贷市场监控和银行监管,是银行监管统计数据的补充。因此,央行信贷大数据不仅可以帮助商业银行管理信用风险,还可以支持监管和宏观经济分析。未来的研究可以利用信贷大数据,基于预期损失模型来计算银行存款保险费率,从最基础的信贷数据单元开始计算,给保费制定提供更加及时、准确的决策支持。图6列出了利用信贷大数据进行银行存款保险保费计算的分析框架。图6利用信贷大数据进行银行存款保险保费的计算(三)进行精细化的金融监管技术进步加上日益复杂的市场,会使得金融监管机构的工作变得艰难复杂,但大数据技术的发展提供了化解之道,让金融市场维持良性运转成为可能。如金融监管机构正利用计算和“机器学习”算法的最新进展,扫描金融市场信息和公司财报,从中找出欺诈或市场滥用行为的蛛丝马迹。这些基于大数据分析技术的新型监管工具是金融交易欺诈侦查的未来,有越多的数据积累,其功能就将越强大。美国证交会几年前就推出了一个被称为“机械战警(Robocop)”的计算机程序(学名“会计质量模型”),用证交会的金融数据库检查企业利润报告,从中搜寻可能隐藏的异常行为——激进的会计手法或赤裸裸的欺诈[12]。“机械战警”的具体情况、手法,透露给外界的信息甚少,但其基本思路是:通过大数据分析,发现多个可能暗示着潜在会计问题的重要指标。2013年,中国上交所开展了“捕鼠行动”,意在打击“利用非公开信息进行交易”。依托数据库,市场监察部建立多种数据分析模型,通过深度挖掘寻找案件线索:锁定基准日,筛查高频户,参照账户开户、历史交易情况等,圈定嫌疑账户,最终查出一只只“硕鼠”。截至2015年初,上交所利用大数据分析方法,发现金额上百亿元的基金经理“老鼠仓”案件线索20余个。[13](四)观测产业结构调整的新角度金融大数据的深入挖掘还可以反映宏观经济变化的规律。例如,可以通过信贷大数据来观测产业结构的调整。截至2015年底,2146万户企业及其他组织被收录进企业征信系统,有596万户拥有信贷记录,该系统累计提供信用报告查询服务6.1亿次。该系统数据有三大特点:一、全面,数据采集覆盖了国内绝大部分金融机构;二、真实,所采集数据来自金融机构实际发生的每笔信贷业务,统计结果得自每笔业务数据汇总相加,数据可追溯从而可还原每笔明细;三、时间跨度长,企业征信系统始自银行信贷登记咨询系统,2005年起提供对外服务,已运行了十年有余,意味着系统收集的数据超过十年,因此,对于分析国内企业的行业行为和行业情况很有价值。例如可以将这些账户级的信贷数据,逐层整合成企业级和行业级,利用大数据挖掘、分析,从信贷市场角度剖析产业结构的变化[14]。图7描述了三大产业的产业增加值和信贷发生额的增长速度。由于历年信贷发生额的变动较大,为更好地反映整体趋势,图7选择以五年为节点,将2006~2015年切分为“十一五”和“十二五”两个区间。首先,通过产业间的横向比较发现,“十一五”期间,第三产业的增加值和信贷发生额两项增速都高于其他产业,第一产业恰恰相反,增加值和信贷发生额两项增速都低于其他产业;“十二五”期间,第三产业仍保持最强增长势头,而第一产业的增速超过了第二产业。从产业间增速对比角度看,信贷发生额和产业增加值保持了同样的趋势。其次,纵向比较不同时期各产业增长情况,“十二五”期间,各产业的信贷发生额和产业增加值的增速都呈现不同程度下降,其中第二产业下降最快——信贷发生额年均增速下降了54%,产业增加值年均增速下降了53%。另外,尽管各产业信贷发生额的增速一直高于增加值的增速,但随着时间推移,二者间的增速差逐步缩小,除第二产业外,信贷发生额增速下降的速度均快于增加值下降的速度。图7从信贷大数据看产业结构变化从上面的例子可以看出,金融大数据分析可以成为宏观金融决策和监管的有力工具,可以在市场化金融发展的过程中发挥重要的作用。与微观金融大数据的应用方面很多金融科技公司没有足够的金融大数据的情况不同,国内的金融大数据都掌握在政府和监管部门的手中,金融大数据的宏观应用有着良好的数据条件,更容易见到成效。四金融大数据的挑战与展望从金融智能投资,普惠金融的大数据风险评估到宏观金融决策和监管,金融大数据的应用带来了生机和活力,将成为金融服务业未来发展的有力工具。由于还处于发展过程中,目前金融大数据应用中的局限性和存在的问题还是不能忽视。(一)金融大数据的信息安全问题信息安全特别是网络安全是金融大数据应用的一个重要和紧迫的问题。据统计,2015年,31.5%的网上攻击针对金融行业,全球5亿金融消费者的信息遭到黑客攻击或泄露。因此金融机构在应用大数据时,需高度重视网络信息安全,严格遵守国家、行业有关网络信息安全管理要求,建立有效的网络安全防御体系及应急事件响应处理机制,定期进行风险识别、漏洞扫描和安全加固,设置信息安全官,专职向董事会汇报。对核心数据实施严格加密措施,最大程度降低数据泄露风险,必要时购买网络信息安全保险服务以弥补损失。(二)对大数据的真实性和公正性存在疑问大数据为金融风险评估提供更多的信息维度,甚至是传统风险管理的替代工具,但也对这些金融相关的数据真实性提出了更高要求。例如对上述ZestFinance的大数据信用风险评估

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论