版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、海量非结构化数据处理技术在运营管理中的运用目录2银行数据全生命周期管理探讨1海量非结构化数据特点及使用2规划、设计、线上、近线、离线、下线、调阅、销毁?结构化数据是哪些,非结构化数据是哪些,如何获取?海量非结构化数据技术要点与实现3银行数据全生命周期管理-系统数据、业务数据设计阶段落实数据管理:投产前明确数据管控手段:生产数据管理备份与归档:历史数据调用分析使用:提出应用系统数据管理规范定义应用系统数据管理协议明确不同类型数据的管控手段定义控制维护使用明确各类数据的特性确定各类数据的存在环境系统及业务数据的采集方式设计各类数据的备份与恢复生产数据性能及容量管理生产数据的备份与归档数据在线、近线
2、、下线管理备份数据有效性验证与管理系统数据监控与分析业务数据的调用与登记业务数据的翻新与备份3银行数据全生命周期管理目标数据规划数据生产数据管理数据使用- 数据特性识别- 使用规划设计 - 备份需求确认- 使用周期确定- 技术手段落实-生产状态监控-运行趋势分析-整体容量管理-历史数据调阅-运营情况分析-业务创新支持数据管理- 在线生产数据监控采集- 近线查询数据归档处理- 离线归档数据备份分析- 数据分析结果综合运用-数据采集管理-数据加工处理-备份计划管理-备份操作执行 -介质归档管理-备份周期管理4 数据管理如何实现 哪些是结构化数据 哪些是非结构化数据银行各类数据的产生、分布、状态、用
3、途.基础运行产生技术相关数据业务执行产生动态与静态数据信息操作安全账务银行单笔业务的执行,引起整体架构各层面产生各类关联性数据审计安全事故故障单接入网络服务器存储规范发展变更管理虚拟化安全应用应用系统数据管理协议、日志输出标准化.7业务标识设计:为业务全程分析埋下“线索”、染色请求:请求发起端,超时、成功率连接网络转发、动态分配,后端状态转换快速转接、转换,是否有堵塞服务业务服务原子交易,速度、可靠短连接:资源共用、容量大、连接耗时,关注异常波动长连接:资源专用、效率高,关注超时及挂起状态系统间会话业务流程单系统交易业务标识:可用于故障定位、容量系数、业务分析.89银行数据生命周期管理:从源头
4、控制与实施q日志标准化l日志分类:应用系统,应将交易流水日志、系统debug日志,系统报错日志l日志分级:各类日志应设置级别控制,通过动态开关,控制日志写出的粒度l日志格式:各类应用日志,尤其是系统报错日志,应遵守统一的格式要求l日志传输:日志写出并传输的方式,应采用全行统一的传输方式q 交易报文标准化l 统一交易标识:全行统一的交易标识,在多系统中传输,便于监控和故障诊断l 报文加密策略:对中间件、应用服务器的报文加密进行统一规定9 数据管理如何实现 哪些是结构化数据 哪些是非结构化数据A Composite Web Application, Involving J2EE, Integrat
5、ion Middleware and Legacy Systems 系统名称系统名称是否含有下列内容是否含有下列内容交易流水表交易流水表交易代码交易代码交易日期交易日期交易时间交易时间交易状态交易状态分类统计分类统计图形化前端管理系统图形化前端管理系统(GTS)(GTS)有有有有有有有有有有分行号分行号理财产品销售系统(理财产品销售系统(FUNDFUND)有有有有有有有有有有有有电子支付平台(电子支付平台(EPAYEPAY)有有有有有有有有有有无无外汇买卖系统(外汇买卖系统(EXCHEXCH)有有有有有有有有有有无无动态口令集中认证管理平台动态口令集中认证管理平台(OPT)(OPT)有有有有有
6、有有有有有渠道渠道现金管理系统(现金管理系统(CaMSCaMS)有有有有有有有有有有有有手机银行(手机银行(CEMBCEMB)有有有有有有有有有有登录方式登录方式短信平台系统短信平台系统(MSG)(MSG)有有有有在同一字段内在同一字段内有有运营商运营商贵金属交易系统贵金属交易系统(GOLD)(GOLD)有有有有有有有有有有无无核心业务系统(核心业务系统(ECASECAS)有有有有有有有有有有业务种类业务种类Call-CenterCall-Center系统系统(CCS)(CCS)有有有有有有有有有有交易种类交易种类总行大前置系统(总行大前置系统(EBIPEBIP)前置二期监控实施中前置二期监控
7、实施中总行中间业务平台(总行中间业务平台(EBMPEBMP)有有有有有有有有有有无无新网络银行系统(新网络银行系统(NBANKNBANK)有有有有有有有有有有交易渠道交易渠道基金托管系统基金托管系统(FTS)(FTS)有有有有有有有有有有有有第三方存管系统第三方存管系统(IFTS)(IFTS)有有有有有有有有有有交易渠道交易渠道企业年金系统(企业年金系统(EPAMSEPAMS)有有有有有有有有改造后有改造后有交易渠道交易渠道客户信息统一管理系统客户信息统一管理系统(ECIF)(ECIF)有有有有有有有有有有无无信贷风险流程管理系统(信贷风险流程管理系统(CECMCECM)有有有有有有无无有有无
8、无市场风险管理系统市场风险管理系统(SUMMIT)(SUMMIT)有有有有有有有有有有无无结构化数据及其采集使用:交易流水. 数据管理如何实现 哪些是结构化数据 哪些是非结构化数据非结构化数据:运行产生的各类日志【静态】运行过程中产生的各类日志为非结构化特性数据输入日志的结构化程度很低日志的字段标示等非标准化跨日志关联性高,但搜索线索难以自动化日志生成的形式多种多样(文件名不定)难以采集、归档、查询非标准日志难以定期清理难以保证日志的完整性难以做上下文关联分析网络端口监听所有端口TCP/UDPsyslog, SNMP, IMAP, POP3, JMS计算机文件监测运行的文件批量上传文件网络,应
9、用,服务器和设备日志自定义脚本与APIs 可设定测试 WMI, perfmon, AD, LDAP, SQL/DBI, OPSEC, LEA, JMX, VMware, Powershell文件系统 监测系统的变化 配置 密码文件 关键性脚本与代码13q XX系统应用协议分析: WTC+SOP是基本结构,SOP内还封装其他协议 封装XML、封装|分隔的key-value pair非结构化数据:运行产生的网络报文【动态】生产环境中的各类数据的关联性、多样性、复杂性目录16银行数据全生命周期管理探讨1海量非结构化数据特点及使用2动态数据、静态数据、结构化、非结构化、多层分布、逻辑相关运行监控、趋势
10、分析、容量管理、数据归档、查询统计、运营分析海量非结构化数据技术要点与实现3 数据分类及采集 日志类采集及使用 报文类采集及使用根据不同类型数据的特点,采取不同的技术手段l利用利用Hadoop、Storm等主流大数据技术,采等主流大数据技术,采集归档并分析海量非结集归档并分析海量非结构化日志,可完成跨层构化日志,可完成跨层面跨节点的多维度查询面跨节点的多维度查询与分析;与分析;l网络报文为动态瞬时存在数据,采集、解读、处理难度大,但数据为强客观性,分析与利用价值高;网络交易报文l利用GoldenGate等数据库同步技术采集结构化数据,实现离线状态下实时交易性能分析;非结构化日志离线交易流水监控
11、预警运营分析业务支持18网络交易报文采集u 交易协议标准、规范u 协议非加密u 网络镜像流量获取方便u 网络节点间交易监控 应用交易日志采集u 交易日志保存在文本文件中u 日志格式标准、规范u 对交易日志有归档查询、故障诊断分析的需求交易流水镜像采集u 交易流水内容丰富u 交易流水信息保存在数据库中 u交易流水表以Inset操作为主采集方式采集方式适用场景适用场景根据不同类型数据的特点,采取不同的技术手段19 数据分类及采集 日志类采集及使用 报文类采集及使用日志类数据采集:生产日志分析与监控的需求日志类数据采集:日志关键字分析使用样例日志类数据采集:非结构数据结构化的使用 数据分类及采集 日
12、志类采集及使用 报文类采集及使用25网络交换机流量交换机探针监控服务器将流量通过网络交换机镜像端口镜像到流量交换机流量过滤,报文拆分不影响网络运行将二进制流转换为可读的Pcap包按照通讯协议和报文格式解包网络交易报文采集分析实现原理25通过网络报文分析、提前预警故障隐患q前置前置-Connex上海上海 前置前置-connex北京北京26通过网络报文分析、观察关键业务会话状态业务分析、创新支持数据归档、查询服务运行采集、容量管理估值预警、隐患分析综合监控、聚焦定位综合采集使用日志+报文+数据库28运行状态综合展现:观测发现、聚焦定位、诊断分析服务台视图告警中心视图告警大屏视图交易视图应用关联性视
13、图交易详情视图交易路径视图资源使用视图告警热度图会话性能视图一线视图二线视图 通过各种视图有效运用,能够把监控系统采集到的各类数据,展示给不同角色的用户,在日常运维、重保值守,故障影响分析、故障定向定位等方面发挥重要作用。29系统容量数据采集:系统数据、应用数据、交易数据31历史数据综合查询:海量归档、转结构化、多维查询32业务运行状态分析:业务类型分布、业务类型趋势用户行为分析:操作行为、过程行为、结果选择目录34银行数据全生命周期管理探讨1海量非结构化数据特点及使用2采集与传输、归档与处理、查询与统计、分析与展现、集成与运用采集的复杂性、传输的可靠性、处理的高效性、结构化能力.海量非结构化
14、数据技术要点与实现335类型采集方式日志来源管理目标归档周期过期处理备注syslogsyslogTCPsyslogUDP网络采集,查询,归档6个月销毁记录采集时间,日志发生时间。加工采集数据。防火墙webServerAPP服务器DBServerOracle-tracetailDB采集,查询,归档,实时监控6个月销毁文本tailwebServer采集,查询,归档,实时监控12个月留存中间件应用日志性能tailOVO采集,查询,实时监控1个月销毁ITM事件tailOMNIBUS采集,查询,实时监控,归档6个月销毁资产tail交易流水采集,查询,实时监控,归档12个月留存统一监控平台网络报文tail
15、BPC采集,查询,实时监控,归档6个月销毁WRT技术要点与实现架构:明确数据对象、设计技术手段明确数据对象、设计技术手段 日志类采集技术要点 网络报文采集技术要点 数据整体管理与展现p采集与传输:p采集:根据业务、运维、监控、审计的需要,能够按照关联性、完整性、统计性等要求,采集各技术层面、各类生产环境、各中类型的生产日志;p传输:能够将采集到的各类日志,按照要求(是否可丢失),安全、稳定、可靠的进行传输,传送到日志采集服务器;p归档与查询:p归档:将采集到的各类日志,按照系统、模块、节点等架构规则,采集时间、保存周期等周期规则,业务、系统等属性规则,进行多维度归档与备份;p查询:按照归档的多
16、维度属性,能够进行跨系统、跨节点、跨文件综合查询;p分析与使用:p分析:针对非结构化数据,能够完成各类逻辑分析(如:周期内同一事件的发生次数、比例等)p使用:根据分析规则,能够产生各类、各级报警信息,并集成到监控系统,提供业务运行状态实时数据及分析结果,提供业务运行特征分析结果;日志类数据采集关键技术要点虚拟设备VS 管道程序v开发和移植方面:管道兼容普通LINUX 及类UNIX 系统,而设备方式除了linux 通用外,每一个UNIX都是一套新的设备程序。v日志采集能力方面:设备方式可以采集任何写入文件的日志,而管道方式只能采集 ”a+”(无文件则创建,有文件则追加) 文件。v日志采集范围方面
17、:设备方式是一个设备可以采集该操作系统上所有应用日志,而管道方式,每多一个日志文件,必须对应多增加一个进程或线程来采集。在不修改应用系统的情况下,采集各类日志:固定文件名、时间变量文件、名称变量、路径变化、目录下新增日志.38虚拟设备日志采集方式开始记录日志系统VFS日志文件设备控制信息 拦截write日志输出设置拦截路径开启/关闭采集应用虚拟设备配置控制程序拦截syslog控制其他相关设置管道程序采集日志方式开始打开日志文件(管道文件)写入日志(管道文件)建立日志文件(管道文件)读取日志文件(管道文件)日志输出应用管道程序读取管道syslog采集系统Data-IPData-IP:日志文件全路
18、径:日志文件全路径Ip+地址Ip+地址MappingHadoop块块块块App标识块块块块App标识块块块块App标识HDFS mr() NameNode/应用1应用2应用3.日志的归档与索引大数据平台-逻辑架构Flume:是Cloudera提供的一个高可用的、高可靠的、分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。42大数据平台-逻辑架构Kafka 是由 LinkedIn 开发,主要是用来处理 LinkedIn的大面积活跃数据流处理(activity strea
19、m)1. 可持久化消息2目标是高流量处理3消费状态信息并不保存在服务端,而是保存在消费端 4支持分布式。43大数据平台-逻辑架构Storm :是一套分布式的、可靠的,可容错的用于处理流式数据的系统。处理工作会被委派给不同的任务处理组件,每个组件负责一项简单的、特定的处理任务。44大数据平台-逻辑架构Hadoop :是一种可靠、高效、可伸缩的数据处理平台。Hadoop 是可靠的,因为它假设计算元素和存储会失败,因此它维护多个工作数据副本,确保能够针对失败的节点重新分布处理。Hadoop是高效的,因为它以并行的方式工作,通过并行处理加快处理速度。Hadoop 还是可伸缩的,能够处理 PB 级数据。
20、此外,Hadoop依赖于普通的服务器,因此它的成本比较低。45 日志类采集技术要点 网络报文采集技术要点 数据整体管理与展现确认应用协议类型暂未支持的协议获取协议规范理解应用报文编码和封装方式等获取样本数据包逐一比对和验证解码已支持的协议修改配置文件实施开发解码程序SOA中广泛使用的协议:XML、SOAP、XML_over_TCP、Java序列化传输(RMI、Socket、EJB、JMS)、JSON、BSON等金融行业常用协议:8583类、IFX for ATM/POS、SNA、CICS(http封装)、WAS(soap/jms)、WESB/WMB(soap/jms)、DB2_DRDA、Oracle TNS、CUPS、VISA、Mastercard、AE、JCB、三大运营商短信、Flexcube(核心银行)、TATA Bancs(核心银行)、FiServe(核心银行)、先进数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 正式达成的房屋地基买卖合同
- 版短期租约日租房协议
- 关于工作失误的保证书写作要点
- 金蝶服务合同的质量保证
- 舞台设备购销协议
- 炉衬注料修理招标文件
- 2023年天津市安定医院招聘制工作人员笔试真题
- 个人仓库合同范本
- 钢管物流合同范本
- 2024年度原材料供应与产品加工全面合作协议
- 2024年国家公务员考试《申论》真题(副省级)及答案解析
- 医院仪器设备采购合同范例
- 2024年天津市滨海新区大港中医医院招考聘用高层次人才管理单位遴选500模拟题附带答案详解
- 2015-2024北京中考真题语文汇编:记叙文阅读
- 2023年中国人民银行直属事业单位招聘考试真题
- 2024年湖南土建中级职称-建筑工程《法律法规及技术标准》考试题库(含答案)
- 国开(浙江)2024年《个人理财》形考作业1-4答案
- 个人简历模板(5套完整版)
- 拒绝校园欺凌教育主题课件
- 文艺复兴经典名著选读智慧树知到期末考试答案章节答案2024年北京大学
- 《风电场项目经济评价规范》(NB-T 31085-2016)
评论
0/150
提交评论