PWC-光大银行大数据方案-创造数据和分析的信息优势-for SHRB-2015_第1页
PWC-光大银行大数据方案-创造数据和分析的信息优势-for SHRB-2015_第2页
PWC-光大银行大数据方案-创造数据和分析的信息优势-for SHRB-2015_第3页
PWC-光大银行大数据方案-创造数据和分析的信息优势-for SHRB-2015_第4页
PWC-光大银行大数据方案-创造数据和分析的信息优势-for SHRB-2015_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大数据时代到来,各银行聚焦如何运用内外部数据来帮助企业提高商业洞察能力,加快决策效率,逐渐在竞争中脱颖而出银行的商业价值链战略/市场客户/营销销售/渠道产品/创新流程/运营风险/管控我们应当聚焦哪类客户?他们的潜在市场有多大?我们的目标客户是谁/在哪里?如何同他们建立并维持良好的关系?客户通过什么方式买到自己需要的产品?如何创造出客户真正需要的产品?什么是最适合特定客户的产品?如何才能更快更好地响应客户,并为他们做更多有价值的事?如何管控客户的信用额度?如何处理风险与业务的关系?数据在以客户为导向的经营价值链中的应用考量现在:在经营管理层面业内公司面临哪些共同的问题?领先的集团公司在做些尝试和转变?大数据时代下,大家有了哪些共同的认识?未来:数据应用在哪些领域可能有应用价值?如何利用数据解决问题,突破瓶颈?大数据时代有哪些新的机遇?Data

FinanceProcessingX1

Model

YXf(x)

YX

Multivariate3

Analysis如今分析学存在许多不统一的概念–对“大数据”术语拥有多种定义数量数据集的规模种类数据的多元化:资源、种类、结构等速率数据产生的速度、分析、与使用精确性可信的质量描述数据集属性1990’s2000’s2010+OLTP

1970’sPunchcardsWebsite

sAudioAnalyst12bi

BusinessIntelligence

Predictive

ModelingSocialMediaTheDataScientistOpen

Source

AnalyticsSoftwareInformation

Worker

Mobile

2

TheDataWarehouseMulti-method

Simulation

TheData

Warehouse

ApplianceBigData1980’s

Decision

Support

Reports

Management

RDBMS

SmartPhonesEmbeddedAnalytics

DataVisualizationMEGABYTESGIGABYTESTERABYTES

&

TabletsPETABYTES

EXABYTESKILOBYTES通常与大数据相关联的属性大数据领域下广泛的科技产品/解决方案爆发性的数据存储大数据生态系统“大数据”的现实6我们传统上认为“大数据”是来自于社交网络分享、电子邮件和简讯,但是随着互联网的出现,数据只会变得更广泛。企业已经听到建立大数据平台,希望通过大数据的能力建设为传统的数据仓库带来新的气息。

当分析成为我们的生产力,

如何定义业务的价值和数据变现的商用模式成为我们的挑战。社交媒体通话记录语音通讯多媒体网页、应用程序的应用客户、订单、账单交易总账过程数据电子邮件聊天、即时通讯文件传感器遥感勘测、全球定位系统3D打印机工业4.0生物识别技术健康记录人力资源数据劳动力天气数据政府数据工商公安,法院电信COMBINED企业通常是数据“富有”,但信息“贫穷”

大多数组织面临的共同问题是“数据过载”,这使得它难以提取有价值的洞察力和智慧中国管理层认为对有用数据的访问正在逐年增加……但对捕获数据的有效利用率继续下降从上一年获得有用数据持续增加的报告有效地使用洞察以指导未来的战略的能力报告高管们正努力从数据转移到可操作的洞察力中去55%77%52%数据的有效利用率降低从数据到洞察力是主要的挑战Source:MITSloanManagementReview2015,PwCDigitalIQSurvey2014,PwCBigDecisionSurvey2014大数据技术的趋势数据分析朝深度发展,开源R语言与BIGDATA天然结合分布式内存技术和Hadoop技术的融合架构使得Hadoop进入了实时分析的领域,极大增加了对MPP分析型数据库阵营的威胁传统BI向实时的数据可视化发展人工智能是硅谷目前最新的“军备竞赛”大数据技术向云计算演化,云平台战略是未来争夺的焦点Analytics大数据技术近期5大趋势受趋势影响的技术堆栈InMemoryHadoopStreamingVisualizationAIMachineLearningCloud趋势前沿厂商或开源技术大数据技术趋势1:完全的数据分析能力,R语言成为更多选项传统BI的分析方法已无法满足大数据应用的要求,厂商迫切需要为自己产品增强高级数据分析的能力以保持在大数据时代的竞争力R的开源特性和Hadoop天生相合,并且支持多种统计挖掘算法,倍受业界关注不仅是Hadoop商用分析MPP也强调对R语言的支持,部分更是可分布式的库内挖掘。开源R和商用数据分析软件SAS,SPSS相比待解决的问题数据处理性能不足导致了数据探索和抽样分析的限制开源版本的开放性导致了结果的精确度难以被权威公认。开发易用性的不足提高了数据分析师的使用门槛支持算法的丰富度可视化以及易用性不如商业数据分析软件如SASTeradata于2014年公布了在AsterData上的商业版AsterDataRRHadoop支持RMR,RonHDFS以及RonHBASER和SPARK结合的SPARKR是最具潜力的OracleExalytics,HPVertica等均支持R语言

建议删除?或修改R语言的表述大数据技术趋势2:内存计算是数据处理加速器在数据仓库时代大部分企业困扰于BI报表的数据滞后性。在大数据时代,企业期望在新的技术架构中获得实时分析和交互式分析的能力。实时分析交互式分析离线分析实时分析交互式分析离线分析而内存技术带来了时效性的革命性突破,和Hadoop更是完美的结合。Hadoop提供持久化能力和海量数据的批量计算能力,内存技术提供一定量数据内的实时分析和交互式分析的能力。流计算分布式内存计算内存列式数据库分布式内存列式数据库实时分析交互式分析交互式OLAP分析更大数据量的实时分析SPARK的高性能和接近一栈式计算能力的特点已被业界公认为是下一代的Hadoop超级计算引擎除了HANA外值得关注的Actian的Vectorwise是世界上最快的单点内存列式数据库,近期推出了深度融合Hadoop的新版本SPARKENGINESparkGraphXSparkRMLibSparkStreaming交互式查询图计算交互式统计挖掘机器学习流计算专利技术SIMDExtension在操作系统级别优化CPU指令分布式内存数据库和Hadoop在同一集群PDT(PositionalDeltaTree)技术支持Hadoop无法实现的updatedelete操作超快的性能,宣称TCP中比Impala快10到30倍BlinkDB建议删除?针对大数据分析应用,企业信息平台将基于X86的分布式架构作为全新的基础架构引入,从而实现计算效能的优化及敏捷业务响应能力。12大数据平台1.0版基础架构

传统架构大数据分布架构9企业数据全生命周期管理-数据管控体系完善和扩充

传统的数据生命周期一般指数据获取(创建)、数据存储、数据加工(转换)、数据使用、数据归档、数据消除。但我们认为若要对数据进行有效的管理,必须数据获取之前就开始了。新的数据生命周期传统数据生命周期数据获取、数据交付、数据存储和控制方法数据标准、度量规则数据架构、数据分布、数据流数据规划数据规范应用方案数据创建/获取数据存储数据加工/使用数据归档/恢复数据销毁交易,事件,用途,社交,日志,语音和图像数据块ODSMDM数据仓库内容社交媒体和社区全面的监控和分析下一代的大数据体系数据的分析模型,学习,模拟,行动,保护数据的理解异常关联源数据的自动标签知识语义标签数据的自我学习企业和行业知识库体系收集,关联,标签,学习数据信息数据价值数据技术数据变现数据的快速入库深度挖掘实时统计和检索业务主题层业务语义层技术规范层大数据分析实现方法论大数据应用挖掘加工文本分析规范化处理文本分析预处理社交网络网络文章…社交媒体文本文本分词文本结构解析文本特征提取情感信息提取文本语义信息情感语义信息文本分类&聚类情感信息分类挖掘模型&算法主题分析信息知识库管理自动文本分类索引和搜索舆情分析趋势分析语音分析呼叫中心语音文件…预处理语音特征提取模式匹配语音情感特征提取语音情感模式匹配话者分离语音参数文本客户语音转写文本客服语音转写文本文本分词文本结构解析文本特征提取情感信息提取文本语义信息情感语义信息文本分类&聚类情感信息分类挖掘模型&算法静音检测语速检测语音检索语音情绪侦测主题分析信息客户满意度分析趋势分析结构化数据业务交易数据电商平台数据…主题分析信息预处理客户360度视图挖掘模型&算法基于文本分析技术和语音分析技术的调研,结合结构化数据在大数据加工域的处理,整合它们之间的共性处理部分,规划大数据加工域内数据处理的过程。核心差异化竞争力安全管理风险管理治理新技术创新数据集成快速入库展现层云服务分析工作台企业数据池数据湖外部数据池传统数据平台大数据平台大数据架构–普华永道的观点

SECURITYMANAGEMENT根据PwC的观点,参考架构中的以下组件需要一个强大的架构框架以适应新兴的和不断增长的新业务和复杂信息源需求大数据平台–从创新数据源为非结构化/半结构化数据的存储传统数据平台

–目的建立短期,长期,业务主题主导的内容数据集数据集成

/数据湖

–不同数据源系统整合的工具/机制,从新兴的数据平台传送数据到企业数据平台,反之亦然.一个完整平面化,碎片化和标签化数据平台展现层

–为业务用户提供分析,检索,展现和可视化平台分析工作台

–以“暗”的数据及时和有效的商业决策的业务机制CloudServices

–探索未来的信息存储和处理选项,通过基于云的服务交付模式,基础设施,平台,软件,数据和分析大数据架构–顶层框架

123456789企业数据池:

包括数据来源,其价值是已知的和可量化的企业应用数据源数据集成和快速入库:

用于将数据源的新兴大数据平台和数据平台相连的新兴与传统数据平台(EDW,MDM等)的技术和机制传统数据平台:数据库管理平台从建立和涌现主要用于处理和存储大量传统的结构化数据源数据湖:碎片化,平面化和标签化包含丰富数据类型的数据平台大数据平台:开放源体系,商业商品为基础,“扩展”数据平台,支持各种类型的信息形式的高容量的处理和存储外部数据池:

包括外部和内部的和第三方合作的数据来源,从结构化到非结构化的价值是未知的,但持有的承诺,解锁的见解展现层:参与数据业务用户——报告,交互式仪表板显示技术,实时报警,先进的可视化,生成的商业洞察力的基本的和先进的数据分析分析工作台:

对于商业用户提供访问,探索,自学习数据的能力,工具和技术来思考和实验产生的商业洞察力云服务:

大数据能力和应用提供了一个基于云的服务。例如,AmazonRDS,SQLAzure核心组件普华永道的大数据参考架构师技术分类的顶层设计建立的大数据方案安全管理风险管理治理新技术创新数据集成快速入库展现层云服务分析工作台企业数据池数据湖外部数据池传统数据平台大数据平台数据集成展现层分析工作台企业数据池外部数据池传统数据平台大数据平台MessagesETL,ELTDataExchangeHubCustomAPI’sDataFederationWebServicesAPIDataSyndication2xProcessingPersistenceOperationsWorkflowMapReduceComplexEventsMetadataCustomMapReduceAbstractionNewSQLDocStoreGraphDBBigDataAppliancesDistributedFileSystemKeyValueNOSQLSecurityAnalysisToolsCompressionClusterMgmt.IngestionODSPersistentStagingStagingFileStorageFileExchangeTypeIIITypeIIBIReportingRealTimeAlertsMashupsAdvancedVisualizationAnalyticsStatisticalMachineLearningTextUnstructuredAnalyticsApplicationsDecisionEngineRecommend.EngineCRMERPSalesMasterDataSupplyChainCallCenterSocialMediaBlogsWeatherSensorsCensusDemographics大数据架构

–参考体系框架云服务Infra.PlatformSoftwareDataAnalyticsMDMHubsLongTermStorageSpecialtyStorageContentManagementType1RepositoryCoexistenceRegistryDataAppliancesRDBMSColumnarDBParallelRDBMSCubesInMemoryViewsWebContentMgmt.Collabor.PortalsDigitalAssetMgmt.RecordsMgmt.IdeationSandboxes-Discovery数据湖As-a-servicePilot(s)Environ.银行数据银行交易数据用户金融信息电话录音客户信息构建–针对大数据平台数据信息按照客户的标签进行分类基本信息财务信息属性信息行为信息用户姓名用户性别用户年龄起始时间服务年限绝对贡献值增长率当前账户余额当前积分月均账户余额月均积分工作单位社会职位工作性质社会影响力基本套餐类型品牌信息月均工资范围婚姻状况民族生日业务办理常用渠道月均投诉次数投诉常用渠道增值业务使用信息月均使用量社会地位宗教信仰所属行业家庭结构通信地址汽车内装经常洗车是否加入汽车俱乐部爱好汽车类型服务高峰时段服务类型汽车更换频率月均服务次数业余爱好消费习惯保险理赔信息经常访问网站消费结构最近缴费时间政治面貌投诉问题……常玩游戏………………住居区域其他信息社交信息……大数据平台标签数据源系统数据互联网数据浏览信息搜索信息SNS信息用户数据身份信息偏好数据地理位置信息用户事件电子商务数据商品浏览信息交易数据消费趋势信息业务人人贷小额贷款风险管理和合规反欺诈反洗钱多点检测营销实时营销营销活动事件式营销全渠道营销客户360客户视图客户定价客户分类内部征信数据库相关对于企业内外部不同来源的信息,使用多源数据采集架构来捕获各种可能需要的数据,并包含数据格式统一化引擎用确保所有输出数据标准的一致性。

新闻媒体新浪金融和讯网金融界数据提供商路透社万德Wind国泰安社交媒体微博微信纸质媒体报纸杂志传统文件格式电子文件纸质文件网络爬虫JoBo/Nutch

数据流技术引擎聚合信息描述框架(RSS)第三方社交API数据服务商接口

虚拟专用网络代理

网路防火墙人工输入接口纸质内容扫描图像识别OpenCV语音识别CMUSphin4电子文档导入外部数据采集内部数据采集数据获取模块HTML格式处理XML格式处理Excel数据处理PDF格式处理JSON格式处理Word格式处理数据统一化适配模块数据格式化处理统一输出外部数据采集架构基于大数据的数据采集技术通过外部数据抓取提高模型准确度人口统计(Demographical)客户价值(CustomerValue)行为方式(Behavioral)态度(Attitudinal)模型层级形象价值观生活方式心理因素活跃度营销通过将非结构化数据转换为结构化数据,从营销方面可以了解客户的具体需求、产品满意度、甚至生活方式;从风险方面可以验证客户身份、客户收入水平、匹配黑名单等。这部分数据与现有数据库内部数据结合一起用于模型建立,提高模型的准确性和广度。风险稳定性收入水平分欺诈核实黑名单社媒数据源内部数据源采集分析输出TXTXMLCSVHTMLXMLDOCPDF……爬虫WebCrawlerFileCrawler格式转换(stream/

voicerecognition)(1)数据清洗&分词处理(2)内容分类&概念提取(3)情感分析&行为分析文本挖掘结构化数据归档与搜索非结构化数据转换为结构化数据外部数据获取路径。低高数据即时性低高获取难度内部数据客户基本信息、卡号、流水、消费、续期业务信息业务线坐席收集客户信息客户特征职业和家庭信息风险意识、投资偏好业务线网络收集客户信息内部及外部已整合数据个人、家庭保障缺口客户投诉文本和语音CDMGBD社交媒体信息(如人人、微博等)客户经理掌握的客户信息客户增值服务使用和体验信息收入房产车产投资…内外部未/半整合数据旅游网站信息携程途牛芒果网…移动App信息运动锻炼、减肥餐饮理财即时获取使用网站个人信息即时获取使用社交媒体个人信息即时获取在线搜索健康、养老、教育、投资信息在线购物信息(如生活、健康、医疗商品购买)淘宝/天猫京东苏宁…穿戴式设备(例如泰康咕咚手环“活力计划”)…小数据大数据医疗和健康管理信息内部征信数据库建设——数据分析普华永道通过为国内多家大型银行开发计量模型,对建立计量模型积累了丰富经验,包括数据收集清理,如何明确内部征信所需数据源,包括采集渠道、频率和数据项。

个贷系统合同数据数据仓库个人征信核心系统SEO税务数据企业征信催收系统外部数据数据分析汇总数据分析集市信用评分建模PD、LGD、EAD估算、建模模型持续监控策略优化市场营销模型开发原有PPT,内部征信数据来源的定义行外数据数据来源数据种类获取方式工商红盾行外数据结构化查询接口人行征信行外数据非结构化网页抓取水电数据行外数据结构化查询接口公安核查行外数据结构化查询接口法院信息行外数据结构化非结构化查询接口网页抓取公安户籍信息行外数据结构化查询接口土地信息行外数据非结构化网页抓取百居易房产交易行外数据非结构化网页抓取银联,电信数据行外数据非结构化合作设计内部征信数据库接口规范和数据库表结构prodidbankidassuidassuidloanidloanidloanidloanidloanidcustidcustidcustidCUST_INFO(客户信息-概况-自然人)CUST_ASSET(客户信息-资产信息)CUST_ADDR(客户信息-联系方式)CUST_INHAB(客户信息-居住信息)DACUSTFAMILY(客户信息-社会关系)APP(贷款申请-基本信息)APP_CAR(贷款申请-详细信息-汽车)APP_HOUSE(贷款申请-详细信息-购房)AP_PARTNER(贷款申请-共同借款人)APP_ASSUDIV(CU贷款申请-担保关联)ASSUCUST_INFO(担保物-保证信息)ASSUIMPA_INFO(CU担保物-抵质押物-基本信息)BANK(CU系统-机构-信息表)CONST_PROD(CU产品管理-产品定义)custid客户信息申请信息担保信息其他信息通过信息系统中的原始表,进行关联加工,构建内部征信数据库;项目中将详细记录在数据加工过程对原始数据进行的处理细节和口径;原有PPT,内部征信针对客户数据的分析挖掘主要集中在客户营销与客户风险管控战略/市场客户/营销销售/渠道产品/创新流程/运营风险/管控竞争分析客户脸谱分析客群人数市场占有情况分析市场客户价值分析市场市场产量分析市场周期性分析情景分析市场区域性分析扩张分析社会热点分析品牌价值分析公众社交舆情分析竞争对手分析监控客户定位销售活动销售人员分群销售业绩预测销售活动/行为特征挖掘销售价值分析销售人员脱落预测激励分析销售工具渠道管理渠道销售资源渠道机构网点360度视图渠道客户粘性渠道产品需求分析渠道客户回报率渠道机构网点价值分析渠道成本分析渠道资源投入与价值相关性分析数据维度之间的相关性开发产品动态定价用社交媒体设计产品次标准人群的产品开发产品创新产品优化产品组合量化风险客群分析资金成本测算风险测算客户服务客户服务项目偏好分析NextBestService客户服务项目投入价值分析公司-客户-代理人/渠道多方互动公司-客户-代理人/渠道多方互运营优化多渠道一致性应用(云)语音识别文字识别视频/语音签名基于多媒体技术的远程服务运营资源优化运营成本分析资源需求预测产能分析IT财务模型优化IT服务资源需求预测IT服务满意度分析信用评级防欺诈申请评级欺诈监测客户营销客户营销NextBestBuy社交媒体商机挖掘基于位置的营销老客户开发机会分析销售机会分析客户开发客户产品偏好分析客户需求满足度分析质押贷款客群分析交叉销售到期应对流失激活客户维系到期客户开发分析客户挽留分析到期客户产品匹配流失激活产品匹配流失激活客户开发分析流失激活销售服务人员匹配客户满意度分析客户接触偏好分析客户之声客户体验社交媒体客户之声收集分析客群营销接触方式偏好分析客户满意度与客群关系分析客户情绪分析客群服务接触方式偏好分析客户价值与营销接触相关性分析客户满意度与产品保费关系分析客户满意度与客户价值关系分析客户特征客户洞见客户特征信息收集分析客户特征实时分析现有客户脸谱分析客户行为客户在线行为收集和分析客户价值客群现实价值相关性分析客群未来价值相关性分析客户价值迁徙的客群相关性分析客群潜在价值相关性分析客户需求客户需求模型营销分析产品服务相关性分析客户产品营销差异化分析事件与营销相关分析客群市场营销分析跨界产品产品调优行为评级催收评级行业分析客群分析政策试点大数据在金融业的应用实例泰丰租赁泰丰租赁运用客户数据库、标的物数据库和宏观行业数据库实现了有效风险管理,并将数据库作为行业投放指引实现精准营销。狮桥资本狮桥立足市场大数据,深耕垂直领域理念和风险高度分散的商业模式,通过大数据平台构建了覆盖承租人和设备管理的完善风控体系。民生银行民生银行将数据挖掘技术应用于高端客户流失风险预测研究中,利用逻辑回归与决策树分类技术构建了客户流失预测模型以预测客户流失可能性。广发银行广发银行采用数据挖掘与分析技术加强风险控制机制,引入申请计分机制,根据客户资料信息,建立数据挖掘模型对信用卡申请客户进行信用评分。招商银行招商银行采用SAS的EnterpriseMiner模块建立个人贷款评分卡模型。在建立模型过程中,建立了统一的评分卡监测报表,并根据使用情况对模型进行相应调整。中信银行中信银行引入Greenplum数据仓库解决方案,建立数据库营销平台。结合实时、历史数据,进行全局数据挖掘分析,建立统一的客户视图,更有针对性的展开营销。汇丰银行汇丰银行引入SAS防欺诈管理解决方案构建其全球业务网络的防欺诈管理系统,通过收集和分析大数据解决复杂问题,以加快信息获取速度并超越竞争对手。建设银行建设银行通过大数据平台开发了小企业大数据创新信贷产品,并根据市场和客户需求的变化不断创新小微企业金融产品和服务,实现主动风险管理。光大银行光大银行开发了社交网络信息数据库,为信用卡业务和理财业务提供支持,并计划通过多样化的数据库平台实现营销与客户需求的无缝对接。原有PPT,大数据应用借助项目帮助华瑞银行打造基于大数据综合平台系统的互联网金融服务生态圈愿景

2143大数据平台运用各类自有的、合作伙伴的及丰富的第三方信息数据,打造可提供多样化的大数据金融相关产品和服务的平台小微拓展平台基于小微自营平台,为各类合作方或潜在合作方提供的助力共赢平台小微自营平台实现对业务端到端的流程全控制创新金融平台创新金融业务的摇篮核心平台合作机构管理产品管理小微业务营销管理小微业务风险管理(贷中)小微业务放款管理小微业务贷后管理创新金融业务专题研究创新金融业务试水创新金融业务培育大数据收集存储处理大数据分析对内大数据应用产品对外大数据应用产品外包服务提供第三方信息服务合作机构投融资支持业内交流学习平台合作机构间交叉营销潜在合作者引入核心差异化竞争力互联网金融服务生态圈的整体架构原有PPT,大数据应用

大数据平台能力解析——互联网金融服务生态圈的整体架构自动化处理专业化管理尚未实现部分实现或计划建立平台化管理模式解析结构化管理自动化处理标准化管理专业化管理标准化管理自动化处理大数据收集存储处理大数据分析对内大数应用产品对外大数据应用产品1234大数据平台数据解析合作机构数据存量及新增业务数据第三方征信数据第三方信息数据黑名单数据基于基础数据的衍生数据模块解析业务、合作机构、第三方信息等数据收集入仓小微数据集市客群特征分析客户信用分析报告(外)客户营销策略分析风险特征分析行业市场分析客户画像风险评分模型欺诈侦测模型客群差异化定价行业分析报告催收评分模型客户画像(外)行业分析报告(外)黑名单查询第三方信息查询工具解析数仓数据集市数仓数据集市零售/非零售评级模型小微自营平台小微拓展平台第三方信息平台数仓数据集市模型实验室数仓数据集市各类统计分析处理软件数据交互技术/工具模型生命周期管理原有PPT,大数据应用基于当前现状,明确大数据管理的通用需求和差异化需求:从更多数据源获取数据不同种数据源数据融合,不同数据特征数据融合高性能数据存储,检索,统计,服务足于大数据分析要求,分析不同层次不同种类数据,尽可能多的掌握企业数据,在数据融合和数据分析的基础上实现风险控制。运用爬虫技术和语义分析技术,实现多数据源融合和数据特征融合。进而实现图存储,图计算和图分析。用复杂网络理论和同构图解析计算设计风控模型01外部数据抓取如何高效地进行外部数据源和形式各异的海量基础数据的采集、处理、关联、检索等,以满足不同群体的信息需求03数据整合如何使用语义分析技术,抽取指定信息项,并实现不同种数据源融合,不同数据特征的数据融合04数据存储如何使用高性能大数据引擎,存储数据,并保持系统的最佳扩展性05数据检索如何实现高性能数据检索和数据统计,并能实现复杂业务关联02数据接口数据如何通过专用数据接口获得结构化数据,高效使用点对点数据接口获得第三方数据,06数据服务如何将已有的知识成果进行系统化、电子化的积累,建立高效、便捷的风控管理体系,以备内部进行知识共享与使用531数据红盾数据裁判文书金税数据水电数据风控应用人行报告执行文书数据检索数据融合风控预警通过外部数据与内部数据共同导入预警监测系统,可实现有效的风险实时监控和提示,以辅助管理层决策宏观经济数据:行业/区域舆情数据:客户/关联方/供应商等三表、工商数据:客户/关联方/供应商等电信运营商数据库仓储平台--外部数据账户、财务数据客户租赁行为:租赁申请;租赁物使用情况等企业经营水平数据库仓储平台--内部数据宏观经济风险:行业、区域趋势关联风险:管理层个人、关联客户风险(担保关系、集团关系)、商圈、供应链上下游声誉风险账户风险和财务风险公司治理经营管理信用风险:租金缴纳能力与意愿;风险缓释打分卡模型运行预警监测系统营销点挖掘重要趋势关注客户分层风险事件发现高风险客户识别联动风险监控报表、分析结果管理层决策原有PPT,风险预警建立全流程、多维度的反欺诈管理体系

客户欺诈风险评估

黑名单拒绝潜在骗贷客户反欺诈规则/模型对客户采取差异化的反欺诈防范流程通过科技手段验证设备、银行卡等信息的真实性通过大数据搜索,主动抓取并实时更新多家金融平台数万条黑名单数据对接多家第三方征信机构及数据服务商,多维度分析客户,全面评判客户借款真实性利用反欺诈模型及规则,结合设备指纹、银行卡信息校验,实现内部与外部相结合的全流程风险把控银行可依托大数据环境,通过收集黑名单校验、反欺诈规则、外部征信数据三重防范手段,建立信贷管理全流程的客户欺诈风险评估与管理体系。原有PPT,反欺诈多维度的黑名单收集与积累在内部积累形成的黑名单、银监会公布的黑名单基础上,通过大数据搜索,从多个维度主动抓取并实时更新消费金融及小微金融相关的黑名单数据。可针对机构运行情况,设计契合北银业务结构、信息技术能力的黑名单收集与管理方案。02外部征信:对接第三方征信机构,实时查询信息:人行征信报告(简报)8家个人征信公司数据其他第三方征信机构04构建全面完整的科创/小微金融黑名单库网络黑名单:收集各网贷公开名单,补充黑名单库:50余家平台名单数十万条黑名单信息0301政府公示信息:定期抓取比对法院、工商等政府机构公示信息:失信执行人名单工商局异常经营名单工商局抽检名单结果等外部数据供应商:交叉验证银行卡信息,手机设备信息等外部数据:手机设备信息银行卡信息诉讼信息、催欠信息网络轨迹信息等原有PPT,反欺诈反欺诈模型的常见类型及其比较信贷欺诈主要包括申请欺诈、交易欺诈;反欺诈模型主要包括基于规则的模型、基于神经网络的模型:基于规则的反欺诈模型基于神经网络的反欺诈模型运行逻辑检测交易是否触发一组规则的技术手段来识别欺诈交易;人工神经网络需要通过历史数据训练,得到模型参数,用于新数据的预测;核心模块欺诈规则库;神经网络训练模块、神经网络处理计算模块;优势模型结构相对简单、分支较少、流程较为清晰,易于理解、使用和维护;模型稳定性较好;模型应对不同欺诈类别的应变能力较强;系统具有自我训练、优化网络模型的功能;劣势规则库中所有的规则都是基于已知的欺诈类型设置的,因此对于新型的欺诈类型识别能力较弱;模型结构比较复杂;模型系统建设初期需要大量投入;适用对象数据量相对较少的业务;以静态信息为基础的欺诈识别过程,例如申请欺诈。拥有海量数据的信用卡业务;行为模式较为复杂、以动态信息为基础的欺诈识别过程,例如交易欺诈。商业银行所面临的主要欺诈类型为申请欺诈;适宜开发基于规则的反欺诈模型。原有PPT,反欺诈基于规则的反欺诈模型工作流程示例基于规则的反欺诈模型的核心是欺诈规则库构建、以及基于实际运行情况的规则优化与维护。欺诈规则库欺诈规则评分设定界限分数欺诈调查列入欺诈黑名单分数>界限分数是否为欺诈是否是否申请录入信息/其他来源信息进入信贷流程示例原有PPT,反欺诈反欺诈内部数据规则规则名称规则指标规则简述规则风险预警级别处理结果申请人是否欺诈黑名单库客户申请人证件号码命中欺诈黑名单库的申请人证件号码(含证件类型)为我行欺诈黑名单上的A系统拒绝处理团办申请人行查询时间相同同批次团办申请中,申请人人行征信报告的近期查询记录中有一次或多次相同查询时间同批次团办申请中,申请人人行征信报告的近N个月人行贷款或者信用卡审批查询记录中有一次或多次相同的查询时间B转交欺诈专员处理非本地申请且申请信息异常相似同批次团办申请中,申请人非本地且手机号码、住宅地址、工龄、职务、职级、联系人信息极其相似的同批次团办申请中,申请人非本地居民,且手机号码、住宅地址、工龄、职务、职级、联系人信息极其相似的B转交欺诈专员处理主动上门申请且材料异常齐全客户主动上门,且提供材料非常齐全或多于一般人,工作单位非常优质的客户自进件,提供的材料超过规定数量,工作单位性质为政府机关、事业单位、国有企业/上市公司的B转交欺诈专员处理勾选快递寄送且信息不匹配同批次团办选择快递寄送,且多数申请人人行信息与申请表信息不匹配的同批次团办申请人勾选EMS寄送卡片,且出现申请人人行上报单位名称或单位地址或单位电话或手机号码与申请表填写不匹配的B转交欺诈专员处理手机号连号不同证件号码手机号码连号,但是不同证件号码近N个月手机号码连号不同证件号码的申请次数大于等于1次C转交欺诈专员处理同自扣账户不同证件号码同一自扣还款账户,但是不同证件号码近N个月同一自扣还款账户账号不同证件号码的申请次数大于等于1次B转交欺诈专员处理同姓名和账单地址不同证件号码同样的姓名和账单地址,但不同的证件号码近N个月同一姓名和账单地址不同证件号码的申请次数大于等于1次C转交欺诈专员处理同单位电话不同单位地址同样的单位电话,但是单位地址不同近N个月同一单位电话不同单位地址的申请次数大于等于1次B转交欺

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论