版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大数据分析系统方案
目录第1章 项目概述 51.1 项目背景 51.2 项目必要性 51.3 建设目的 6第2章 需求分析 82.1 功效及性能需求 82.2 系统集成需求 92.3 运行环境 102.4 安全需求 10第3章 总体设计 123.1 总体设计原则 123.2 总体目的 133.3 系统总体构造 133.4 系统逻辑构造 15第4章 具体设计方案 164.1 信息资源规划和数据库设计 164.1.1 数据模型概述 164.1.2 数据建模办法论 174.1.3 数据建模基本原则 184.1.4 数据库架构设计 194.2 数据应用支撑系统设计 214.2.1 大数据平台核心技术 214.2.2 云平台数据共享功效 264.3 数据服务层计 334.3.1 模型的应用 334.3.2 平台基础应用 334.4 数据解决和存储系统设计 344.4.1 大数据解决核心技术 354.4.2 数据存储采用MPP与hadoop融合架构 354.5 网络系统设计 354.6 安全系统设计 364.6.1 系统安全满足状况 364.6.2 系统安全配备管理功效 374.6.3 系统无安全漏洞保障 404.6.4 软件本身安全 434.6.5 性能和可靠性 444.7 运行维护系统设计 464.7.1 服务器管理 464.7.2 网络设备管理 464.7.3 进程管理 464.7.4 服务管理 464.7.5 数据库管理 464.7.6 中间管理 464.7.7 集群管理 474.7.8 故障管理 474.7.9 性能管理 474.7.10 配备文献管理 474.7.11 SYSLOG管理 474.8 其它系统设计 474.9 系统配备及软硬件选型原则 484.9.1 软硬件布署 484.9.2 数据规定 484.9.3 技术规定 494.10 系统软硬件物理布署方案 49第5章 项目建设与运行管理 515.1 项目领导机构 515.2 项目管理机构 515.3 项目承建机构 535.4 运行维护机构 535.5 有关管理制度 545.6 项目测试 555.6.1 单元测试 555.6.2 集成测试 555.6.3 系统测试 565.6.4 性能测试 565.6.5 验收测试 575.6.6 安装测试 575.7 安全性测试 585.7.1 功效验证 585.7.2 漏洞扫描 585.7.3 模拟攻击实验 585.8 项目验收 605.8.1 项目验收规定 605.8.2 项目验收的目的和原则 615.8.3 项目验收的组织和实施 615.8.4 项目验收的环节和程序 615.8.5 项目验收的测试方案 615.8.6 项目验收的文档清单 61第6章 项目培训计划 626.1 培训对象和培训目的 626.2 培训内容 62项目概述项目背景现在,随着JW改革的不停推动,XX网络系统、信息中心、信息安全系统的规模不停扩大,各类信息应用系统日趋复杂,迫切需要借助云计算平台,实现灵活、高效的软硬件资源分派和管理,从而有效整合XX的各类信息资源,提高XX信息系统的安全性、稳定性、可扩展性。另首先,随着社会公共安全管理的日趋复杂,XX行业通过大数据应用,把大量的关联信息进行汇总解决,能够重新认知和感知我们的外部环境。不仅能快速锁定疑犯,并且还能够防止和打击犯罪。XX云计算+大数据系统,将成为面对各J种的管理和分析利器,通过高效的云计算平台提供强大的大数据应用承载能力,面对各J种提供集中资源、集中管理、集中监控、配套实施的统一大数据应用环境,为各J实战应用提供强大支撑、服务、保障作用。云计算和大数据是变化将来XX工作发展的新趋势,并且已经实实在给XX科技管理与创新来了深刻的变革,有力地推动了XX各J种的工作优化和提高。项目必要性第一,构建“智慧XX”是将来JW形态演进的必然趋势。近年来,随着XX信息化建设的持续推动,我国XX机关的JW改革已开始迈进智能化发展的快车道,JW与人之间的互相感知和联系越来越紧密,“XX大数据分析系统”建设已成为当代JW发展的新趋势。第二,构建“智慧XX”是新一轮信息技术变革下的时代潮流。现在,全球正进行物联网、移动互联网、云计算等新一轮信息技术变革。新技术往往孕育着新的重大突破,信息资源成为重要的XX战斗力要素,信息化不仅成为推动XXJW方式变革的重要引擎,也给整个社会管理创新带来深刻变化。“XX大数据分析系统”建设将极大地创新XX管理方式,增进“管制型XX”向“服务型XX”转变。应当说,通过近来十年的发展,以网络化、数字化为载体的信息化JW特性日益显现,JW活动中人、事、物之间的互动能力明显增强,JW工作传载的功效不停增多,智能化程度逐步提高,“XX大数据分析系统”建设已成为当代信息技术变革下的时代潮流。第三,构建“智慧XX”是推动XX战斗力生成模式转变的重要途径。XX信息化的“智慧XX”建设是一场新的JW革命,对于整合JW情报资源、改造J情解决流程、创新J情研判模式、减少JW成本、实现JW效能的最优化含有推动作用。这场新JW革命的实质是推动XX建设和JW工作由数量规模型向质量效能型、由人力密集型向科技密集型转变。它规定把传统的XX战斗力生成模式转变到依靠科学技术特别是以信息技术为核心的高新技术上来。在这一转变过程中,大数据将成为XX战斗力生成的核心要素。拥有对海量数据占有、控制、分析、解决的主导权,将大数据优势转化为XX决策优势,继而转化为治安优势,将成为“XX大数据分析系统”的制胜核心。第四,构建“智慧XX”有助于拓呈当代JW功效、增进JW机制改革和提高JW管理精细化水平。首先,“智慧XX”的建设和实施将增进XX机关由传统的一元化管理职能向管理与服务功效并重、融合转化。另首先,“智慧XX”的建设和应用将变化传统的“金字塔”型XX管理体制,实现JW领导与指挥机制的扁平化,从而减少中间管理层,加紧信息流动,达成精减机构、快速反映、即时联动的目的。同时,构建“智慧XX”尚有助于提高XX机关JW管理的精细化和科学化水平,提高XX机关的执法水平和服务水平。建设目的XX部推行的“扁平化指挥模式”,就是最大程度地压缩指挥层级。减少中间环节,优化现有的情报信息管理,建立情报信息主打JW的有关机制,着力拉近指挥与实战,机关与一线的时空距离,缩短响应时间,提高快速反映能力。基于数据中心融合空间采集、电信运行商、交管部门、XX部门、社会公众的移动位置等数据形成大数据环境,建立大数据分析平台,支持J情解决、宏观决策、情报分析等大数据专项应用。智慧XX大数据分析系统项目一期建设重要目的为:建立智慧、高效的情报研判体系;建立扁平、快速的指挥调度体系建立打防一体化JW管理体系建立集约化的信息技术支撑体系。建立专业化的JW指挥作战队伍。需求分析功效及性能需求功效需求作为XX信息化发展到高级阶段的一种JW形态,“智慧XX”重要采用大数据、云计算、等新一代信息技术,将XX工作IT基础设施与物理设施、人际环境等高度融合,以提供智能化XX决策与服务。其建设目的是充足运用科技创新,以“智慧”引领JW改革与发展,打造XX行政高效、JW指挥扁平、治安管控联动、XX服务便捷的良性XX工作机制。“智慧XX”建设是一项涉及XX机关内外各领域、各部门的复杂系统工程,需要从整体上进行统一规划协调,做好顶层设计。性能需求软件系统必须确保质量,并在实施前通过完全测试;系统应含有自动报J功效,以提示系统管理员避免出现系统崩溃等严重事件;主服务器宕机时,可实时地切换到备用服务器上,顾客的应用应当不受影响;主备切换时,业务不感知,任务不失败,业务不会中断;主备切换时间不大于1秒;故障节点重启时间不大于2分钟;系统不得出现数据丢失、切换失败等,影响正常业务运行的故障;服务器端系统应可长久稳定运行,必须支持负载均衡能力,确保无单点故障;不会因长久使用或负载过高造成系统故障。系统应含有良好的并行解决机制,对存取冲突的竞争含有有效的仲裁和加锁机制,充足确保事务解决的完整性,并减少系统I/O开销,提高并发顾客查询和存取的性能。平台提供自底层硬件到上层解决流程的全方面监控体系,协助运维人员快速定位问题解决问题,使系统持续健康稳定的运行。系统集成需求软件平台含有集成内外多个运行系统的基本能力。软件平台集成性涉及下列几个方面:软件平台含有对不同厂家提供的各类软件产品接入、运行、监控能力;软件平台提供独立的集成平台来提供多个集成手段实现和移动现有业务支撑系统和能力系统的集成,以及对于此后有可能存在的各类业务平台进行业务引入的接口能力等。集成手段涉及实时调用、批量数据交换等方式,集成接口兼容WEBSERVICE、FTP、XML等方式,能够提供服务的封装能力。集成平台能力涉及下列方面:数据路由:能够对经由应用集成平台的数据进行检查和过滤,根据预定义的规则实现基于主题或数据内容的动态路由机制,应支持点对点、广播以及公布/订阅方式;合同转换:含有系统间传输/调用合同转换的能力,这些合同涉及但不限于JMS、FTP、CORBA、Socket、HTTP等;格式转换:含有不同数据格式转换的能力,能够对来自不同应用系统的数据进行识别和解析,能够以图形化方式定制不同的数据转换逻辑,实现数据格式的转换和数据内容的整顿;消息映射:将来自于源系统的消息构造或业务数据对象映射为目的系统的消息构造或业务数据对象;事件解决:支持事件驱动的架构技术,支持对系统之间信息交换事件的获取、解决和监控;集成监控:提供对接入访问、数据传输和集成服务等多个集成解决能力的监控功效,可根据多个日志查询并监控应用集成组件的运行状况。数据传输:实现多个应用之间的数据交换,数据交换支持基于消息队列和文献传输等模式。集成平台要能确保应用时间数据传输的可靠性,支持交易的完整性,支持数据传输的并行解决,并且支持管理人员对数据传输的过程进行监控和干预。数据访问:支持但不限于JDBC、ODBC等多个数据库接入模式。运行环境智慧XX大数据分析系统服务平台需要接受来自XX系统各部门的数据资源,各权属单位向系统共享、交换业务数据,系统需要提供对应的汇交、接受工具,以及导入、导出工具,业务数据的查询、统计等功效,并能够对外公布。安全需求1.物理安全规定物理安全规定涉及但不限于:物理位置的选择、物理访问控制、供电安全保障、防火防潮等。2.网络及设备安全规定网络安全规定涉及但不限于:系统布署所在的网络构造安全、设备入侵防备、设备防护、安全审计等。3.数据安全性规定涉及数据存储的安全性、数据传输的安全性、数据传输的完整性、数据传输的对的性、数据传输的及时性、数据备份及恢复机制、异常解决机制等。4.系统安全规定涉及数据资源及应用模块的等级访问控制、身份鉴别(不限于数字证书应用)及不可抵赖性、安全审计、系统的容错性等。5.应用安全规定(1)以CA认证系统为基础,实现顾客与服务资源的双向认证机制;(2)以基于角色的授权原则,建立与政务信息资源共享平台业务、平台管理人员、部门管理人员岗位职责相对应的权限管理机制及统一的安全登陆机制;(3)以密码技术为基础的数据完整与保密机制;(4)对安全事件进行审计机制以及根据政务信息资源共享平台不同的业务、数据应用需求而采用原则的安全合同;(5)对应用进行严格的监控,实时掌握个应用系统资源的消耗、运行的状况,保障服务的持续性和可用性。6.制度安全7.涉及项目管理制度、系统巡检及维护制度、数据备份制度、各类紧急应急方法;明确该项目基于该制度下的职责分工。8.含有丰富安全特性的交换机构成数据中心网络的第一重保护;9.含有高性能检测引擎的IPS对网络报文深度检测,构成数据中心网络第二重保护;10.凭借高性能硬件防火墙构成的数据中心网络边界,对数据中心网络做第三重保护。总体设计总体设计原则遵照对应原则:系统的设计应符合国家、省及有关信息化建设的政策法规、规范和原则,并考虑与正在制订或即将出台的有关政策法规、规范和原则的衔接。技术先进性:平台作为一种大投资、复杂度高、周期长的网络数据应用系统,必须在开发早期考虑到技术的延展性。作为应用系统建设的首要规定,就是应当确保系统在将来的几年中在软件基础构造和应用形态方面的技术先进性。安全性和可靠性:运用先进的访问控制、身份认证等技术避免非法顾客入侵;确保系统在异常状况下的对的可靠运行。数据的完整性和一致性:数据在全网各个应用系统中的采集、存储、传输和解决应当保持完整和一致。易扩展性:全部的产品均考虑到应用及系统不停扩展的规定,以形成一种易于管理、可持续发展的体系构造。将来业务的扩展只须在现有机制、原则的基础上,增加新的应用与服务模块。易用性:顾客界面规范统始终观,易于顾客掌握;提供方便的软件配备、管理和分发手段,门户网站系统作为信息系统统一架构体系,规定含有保持基本功效统一的前提下,能灵活开发扩展功效,采用统一的接口技术和接口规范。互操作能力:在不同层次的各个应用系统之间的数据应能充足共享,并通过技术手段实现应用程序之间的互操作。规范性:规范性涉及业务规范、开发规范、术语规范和数据规范等方面。可维护性及可扩展性:应用系统要便于维护,并可实现跨平台运行,同时应留有与将来工程的软件接口,确保系统能够扩展、升级。实用性:提供方便的软件工具,便于系统的配备、管理和维护,门户网站系统将针对不同类型的信息访问者提供不同的信息呈现内容,使顾客根据本身对信息的访问规定,快速获取有关的信息内容,从而充足发挥门户系统的渠道、桥梁作用。信息兼容性强:系统的建设支持对现有数据库数据的实时抽取,自动转化成统一的XML格式并且集成后的数据由本平台统一管理、联合查询、综合分析。另外,对于查询基础业务系统内数据的请求,要能够实时的对多个不同的数据库进行联合查询,还涉及了对文档,影音文献等内容,因此规定本系统的建设必须能够对非构造化的数据统一管理、联合查询。总体目的基于先进的云服务体系,建立统一的JW大数据平台和数据中心,运用大数据、空间数据采集等技术,通过整合JW指挥体系及电信运行商、交通部门、大数据中心信息挖掘,实现信息最大共享的基础上,构建JW指挥核心智慧应用方案。系统总体构造本项目系统总体架构,是在统一的基础设施支撑下,根据智慧XX大数据中心建设目的,建立统一的大数据资源中心,构建自主可控的统一信息安全保障体系。在统一的技术原则和业务规范支撑下,建立数据采集、数据清洗、质量管理、信息安全服务和资源统一调度等系统,并通过内、外网服务支撑其它智慧应用,建设覆盖全区的公共数据综合服务体系。平台架构以下图所示:图4-1智慧XXJW大数据分析系统总体架构示意图IaaS层:运用虚拟化技术将计算、存储和网络等基础硬件资源,以逻辑方式形成基础资源池层,再将资源池提供的虚拟机、虚拟存储或虚拟端口组等通过二次封装与组合、调度使用,形成一种个面对组织顾客的虚拟服务器、虚拟桌面或者云存储系统,通过这样的形式为系统的各业务单位提供资源服务;同时提供物理资源和虚拟资源的统一。PaaS层:在IaaS层基础上,提供开放式XX基础大数据解决平台整合XX内部数据和运行商数据,提供分布式数据库来解决海量构造化数据的管理和数据交互,提供原则SQL接口、JDBC技术,能够与前台应用进行无缝对接;同时提供海量流式计算解决cstorm,能够实时解决大规模并发任务的负载均衡和任务分发,做到全部任务实时分发解决,不堆积,做到高度可靠性,任何任务解决过程中不会丢失,保障全部任务都能够解决完。SaaS层:平台能够支撑全部电信运行商、XXJW系统数据运行,全部业务数据统一管理,根据权限做到绝对安全访问,基于数据中心运用大数据、空间数据采集等技术,通过整合XX部门、电信运行商等多部门采集的移动位置、舆情信息等,建立宏观决策、J情分析、JW调度管理等分析模型,为JW及公共安全管理提供大数据专项分析及应用。系统逻辑构造图4-2XX大数据库逻辑架构图MPP架构的新型数据库集群,重点面对行业大数据,采用SharedNothing架构,通过列存储、粗粒度索引等多项大数据解决技术,再结合MPP架构高效的分布式计算模式,完毕对分析类应用的支撑,运行环境多为低成本PCServer,含有高性能和高扩展性的特点,在公司分析类应用领域获得极其广泛的应用。具体设计方案信息资源规划和数据库设计数据模型概述XX大数据模型是采用一种与技术实现无关的方式,对系统内的业务信息,以及各类信息之间关联关系的数据描述。数据模型是数据仓库建设的基础,是建设数据仓库必不可少的一种环节。一种统一、完整、灵活、稳定的数据模型对数据仓库项目的成功起着重要作用,并且最少满足下列几点:统一沟通口径数据模型形成对业务定义和术语的统一认识,是各部门之间沟通的桥梁,使不同部门、单位的业务人员、应用开发人员和系统管理人员对系统的理解达成一致;数据整合与管控数据模型是整合多个数据源的重要手段。数据模型为复杂的数据仓库系统实施提供规范和基础构造,建立起各个业务系统与数据仓库之间的映射关系,实现源数据的有效整合和集中管控;增强分析能力通过数据建模,能够更全方面抽象数据的维度和指标关联信息,全方面反映数据本质,使数据反映的业务更加清晰,最大化数据价值;增进数据原则化通过数据模型的建立,排除数据描述的不一致性。如:同名异义、同物异名等等,更有助于从完整性、及时性、一致性等方面对数据质量进行管控。提高扩展性系统设计应当考虑到系统后续的应用扩展,系统整合,增加接口系统等扩展性,数据建模可觉得后续系统在接口层面和应用层面的扩展提供基础;因此,通过构建性能管理系统的统一数据模型,能统一和原则化系统的数据,实现数据一致性,最大化数据价值,辅助提高数据质量,增强系统数据应用能力和系统扩展性。数据建模办法论XX数据仓库建模办法从方向和驱动力来分,能够分为“自顶向下、逐步求精”以及“自底向上、综合集成”两种。图5-1数据仓库建模办法自顶而下的建模办法根据业务需求和业务问题来明确系统边界,划分主题域,再进行逐步细化,建立反映公司业务规则和业务关系的实体和实体关系。在业务需求明确的时候,该办法能够提高分析效率;自底向上的建模办法需要整合各业务系统的源数据,先抽象业务规则,划分主题域,再进行逐步细化,建立反映公司业务规则和业务关系的实体和实体关系。这种办法更关注搭建公司数据框架,建立完整的公司信息视图;在实际系统数据建模过程中普通采用这两种办法相结合,综合运用。数据建模基本原则原则化、规范化原则数据模型应遵从统一的主题域划分和实体命名规则,确保模型的原则化和规范化;先进性原则规定逻辑模型在设计上吸取业界、国内外优秀的建模经验与办法,确保模型的先进性;一致性原则数据模型的设计要能够确保数据的一致性,消除各数据源的数据不一致性,以确保数据模型内的信息是有关整个公司一致的全局信息;扩展性原则规定数据模型含有良好的可扩展性,支持对模型的迭代性演进。当业务需求提出新问题或有新的数据加入模型时,规定数据模型能够确保现有的数据和应用都不发生变化,更不得造成系统崩溃;自上而下的设计与自下而上的验证原则数据模型是为业务分析服务的,因此在创立模型时,应以业务需求为驱动。根据业务需求采用自上而下的办法设计并实现数据模型,并且采用迭代演进的模式,逐步丰富数据模型,逐步求精。同时,为了验证设计与实现的合理性与对的性,规定以实际数据对模型进行自下而上的验证;简朴可识别原则实体命名等要遵照简洁、能直接识别出业务意义的原则。数据库架构设计本工程采用主流成熟的开发框架和产品组件进行开发,采用多层体系构造来构建符合原则与管理规范体系、安全与运行保障体系的高可用性系统。综上,本项目开发的整体技术架构以下:图5-2智慧XXJW大数据分析系统总体技术架构示意图数据采集层,负责从XX系统内外部系统获取基础数据,涉及XX系统内部数据、运行商数据、行业信息数据、互联网数据及手工导入数据,以及移动通信网络的信息数据。外部系统在向本系统输出基础数据之前,需要开发一套程序完毕原始的格式转换和数据解决。首先要屏蔽顾客隐私信息,即顾客号码信息全部剔除,输出时采用通过加密的顾客数据。另首先需要筛选出核心字段,每条统计都是原始数据的几十个字段抽取出几个核心字段,这样能大大减少数据存储量。数据管控层,通过数据原则、数据等级、数据安全、数据质量等原则化的规则管理和调度控制,建立各类数据稽核手段、数据质量分析体系,确保平台数据一致性、完整性、合规性,实现信息共享和数据的高效流转。数据存储层,负责对获取的构造化和非构造化数据进行解决,并精确匹配到上层定义好的各类计算模型。数据管控层采用了基于开源的Hadoop分布式架构,将传统ETL的数据提取、数据清洗、数据转化、数据校验工作承载在智慧XX大数据云计算平台上,大大减少了大数据的解决成本,提高海量数据解决的及时性。数据挖掘层,重要对数据进行建模和分析,模型的重要类型有:关联分析:是在关系数据中,发现存在于项目集或对象集之间的关联规则,涉及关联、有关性、因果构造或频繁出现的模式。惯用的关联分析算法有Apriori算法及它的多个改善或扩展算法。分类分析:分类是实现定义好类别,属于有指导学习范畴。分类分析是根据数据的特性为每个类建立一种模型,根据数据的属性将数据分派到不同的组中。惯用分类算法有决策树、神经网络、贝叶斯分类等。聚类分析:是按照某种相近程度度量办法将数据分成互不相似的某些分组,实现每一聚类内部的相似性很高、各聚类之间的相似性很低。惯用的聚类算法有K均值、近来邻、神经网络等。预测模型分析:是从数据库或数据仓库中已知的数据推测位置的数据或对象集中某些属性的值分布。建立预测模型的惯用办法涉及回归分析、线型模型、支持矢量集、决策树预测、遗传算法、随机森林算法等。文本挖掘:文本是无构造或半构造化的数据,文本挖掘是从文本数据中推导出模式,其过程是通过文本分析、特性提取、模式分析的过程来实现。重要技术涉及文本构造分析、文本特性提取、文本检索、文本自动分类/聚类、文档自动摘要、话题检测与追踪、文本过滤、文本情感分析等。数据服务层,采用模块化独立封装技术与原则化应用接口,功效强大且扩展性强,提供数据公布/订阅服务、检索、统计、分析类服务集,并可通过定制服务集平滑扩展其它服务。数据应用支撑系统设计大数据平台核心技术(1)云平台流式计算技术Storm为分布式实时计算提供了一组通用原语,可被用于“流解决”之中,实时解决消息并更新数据库。这是管理队列及工作者集群的另一种方式。Storm也可被用于“持续计算”(continuouscomputation),对数据流做持续查询,在计算时就将成果以流的形式输出给顾客。它还可被用于“分布式RPC”,以并行的方式运行昂贵的运算。Storm能够方便地在一种计算机集群中编写与扩展复杂的实时计算,Storm用于实时解决,就好比Hadoop
用于批解决。Storm确保每个消息都会得到解决,并且它很快——在一种小集群中,每秒能够解决数以百万计的消息。更棒的是你能够使用任意编程语言来做开发。Storm有许多应用领域,涉及实时分析、在线机器学习、信息流解决(例如,能够使用Storm解决新的数据和快速更新数据库)、持续性的计算(例如,使用Storm持续查询,然后将成果返回给客户端,如将微博上的热门话题转发给顾客)、分布式RPC(远过程调用合同,通过网络从远程计算机程序上请求服务)、ETL(ExtractionTransformationLoading,数据抽取、转换和加载)等。cstorm集群由一种主节点和多个工作节点构成。主节点运行了一种名为“cnimbus”的守护进程,用于故障检测。每个工作节点都运行了一种名为“csupervisor”的守护进程,用于监听工作,开始、并终止工作进程。同时,csupervisor监听分派给它的机器,根据cnimbus的委派,在必要时启动和关闭工作进程。每个工作进程执行topology的一种子集。一种运行中的topology由诸多运行在诸多机器上的工作进程构成。cnimbus和csupervisor都能快速失败,并且是无状态的,这样一来它们就变得十分强健,两者的协调工作是由ApacheZooKeeper来完毕的。图5-3布署方式cstorm可确保一种Spout发射出的每个元组都会解决;如果它在超时时间内没有解决,cstorm会从该Spout重放该元组。消息流是cstorm里面的最核心的抽象对象。一种消息流是一种没有边界的tuple(元组)序列,而这些tuples会被以一种分布式的方式并行地创立和解决。对消息流的定义重要是对消息流里面的tuple的定义,我们会给tuple里的每个字段一种名字。并且不同tuple的对应字段的类型必须同样。也就是说:两个tuple的第一种字段的类型必须同样,第二个字段的类型必须同样,但是第一种字段和第二个字段能够有不同的类型。每个类型的流都能够按照实际需要定义一种流名,也叫流的唯一ID,以标记他的特殊性,如果开发者不定义流名,系统会默认一种流名为“#STEAM#”。考虑到系统之间传递构造,需要发送和接受端都对对应的字段进行网络字节序的转化,并且需要额外传递构造中每个字段的长度标记信息,这些额外的标记信息在传递的构造字段诸多的状况会给网络带宽带来很大压力,并增加传递的字节数,因此这里考虑使用JSON串来传递tuple。这样,一种tuple对应着一种完整的json串。在Worker中,并行运行着一种或多个Executor,Executor中运行着顾客逻辑线程,并且每个Executor运行的顾客逻辑可能是不同的(在并行执行不同的任务),顾客逻辑都是应用开发人员自行开发的,应用开发人员重要关注业务逻辑,而编程技术细节可能会考虑不周到,这样常会出现顾客逻辑线程出现异常,而这种异常往往是类似的,尽管能够通过编程把线程异常屏蔽在线程范畴内,但严重的越界操作却无法屏蔽,这将造成整个进程出现异常,从而影响这个Worker中其它顾客逻辑的执行,在一种对准性、一致性规定高的系统中,这个是不允许出现的。Worker间的消息通信方式以及容灾:Worker间的通信方式:由于采用一种数据解决节点对应一种独立的Worker进程,数据解决节点之间的通信也就是Worker间的通信,这意味着Worker之间的通信需要通过进程间通信机制来进行。考虑到可靠的TCP方式在效率和稳定性上都能够确保,因此Worker间采用TCP合同进行通信。图5-4Worker间通信方式通信效率考虑,这里重要从TCP传输的角度考虑,由于跨服务器间的通信受限于网络、网卡带宽的影响,因此框架通过可配备的方式,Worker间能够只和本服务器上的下游节点进行通信Worker容灾重要从两方面考虑:同一服务器内的容灾,在同一台服务器上同时启动两个同样的Worker进程,以避免别人误操作,或由于程序异常造成一种Worker死掉后,尚有一种继续能够用,这里为什么是两个同样的Worker进程呢?由于系统采用多线程,并且线程调度方略是操作系统范畴内,因此线程的调度优先级相对是比较高的,启动再多的线程只会浪费资源。不同服务器之间的容灾,这个重要针对混合集群的部分解决节点以及全网集群的全部解决节点,如果下游的某个节点死掉了,现在Worker节点将按照流分组规则在全网集群范畴将消息分发到集群中的下游节点中。当某个服务器上的Worker出现问题,该服务器上的csupervisor会自动检测到,并重启对应的Worker。简朴集群:集群中各服务器独立、并行的运行对应的计算拓扑,这些计算拓扑能够是相似的一种或不同的多个,各服务器内的Worker视其它服务器上的Worker不存在同样,每个服务器内每个worker之间是并行执行的,上下游Worker间异步并行执行。集群内各服务器间的Worker间不进行通信,正是由于这个才将其称为简朴集群,如果涉及到数据的一致性性问题,需要通过数据库等全局可见模块来进行数据协调。简朴集群通过多服务器并行、异步计算来提高运行效率,该集群是一种简朴的集群。全网集群方式:现在节点和集群中的全部服务器中的全部下游节点进行TCP常连接,并根据流分组方略和全部的下游节点进行通信。集群中全部解决节点都是并行异步的。混合集群,该集群重要是对简朴集群的扩展,使得某个特定数据解决bolt对应的Worker能够放到另外一台或几台服务器上,这个模式的集群类似与简朴集群与全网集群的混合体,通过这种集群,能够让简朴集群实现跨服务器的全网聚合或分流。内存数据库意义内存数据库建立于系统的内存之中,计算数据依赖于内存,无磁盘I/0。实现高效解决,减少传统数据库的压力。Redisredis是一种基于内存的key-value存储系统。和memcached类似,它支持存储的value类型相对更多,涉及string(字符串)、list(链表)、set(集合)、zset(sortedset--有序集合)和hash(哈希类型)。这些数据类型都支持push/pop、add/remove及取交集并集和差集及更丰富的操作,并且这些操作都是原子性的。在此基础上,redis支持多个不同方式的排序。与memcached同样,为了确保效率,数据都是缓存在内存中。区别的是redis会周期性的把更新的数据写入磁盘或者把修改操作写入追加的统计文献,并且在此基础上实现了master-slave(主从)同时。Redis是一种高性能的key-value数据库。redis的出现,很大程度赔偿了memcached这类key/value存储的局限性,在部分场合能够对关系数据库起到较好的补充作用。它提供了Python,Ruby,Erlang,PHP客户端,使用很方便。Redis支持主从同时。数据能够从主服务器向任意数量的从服务器上同时,从服务器能够是关联其它从服务器的主服务器。这使得Redis可执行单层树复制。从盘能够故意无意的对数据进行写操作。由于完全实现了公布/订阅机制,使得从数据库在任何地方同时树时,可订阅一种频道并接受主服务器完整的消息公布统计。同时对读取操作的可扩展性和数据冗余很有协助。(2)应用开发平台各类创新产品可根据其业务需求特点采用多个技术路线开发完毕。平台提供不限厂家、不限类型、不限上线时间的APP之间的应用互联,APP之间能够灵活进行调用。(3)平台支持接口技术阐明Web服务技术(WebService)WebServices是基于网络的、分布式的模块化组件,它执行特定的任务,恪守具体的技术规范,这些规范使得WebService能与其它兼容的组件进行互操作。它能够使用原则的互联网合同,像超文本传输合同HTTP和XML,将功效体现在互联网和公司内部网上。结合WebService技术,ESB提供一套原则的用于沟通不同平台、编程语言和组件模型的技术框架,实现原则、通用的数据共享。ESB平台支持最新的有关合同和原则,涉及XML、XSD、SOAP、WSDL、UDDI等,同时兼顾WebService的安全性、事务解决、性能等方面。文献传输技术(FTP)FTP是FileTransportationProtocol(文献传输合同)的缩写,是计算机之间交换数据的方式。FTP专门用来下载,顾客按照一定的规则(合同)和提供文献的服务器获得联系并将文献搬到自己的计算机中来。在进行FTP下载之前必须获得有效的资源链接或者服务器地址。首先,提供系统上传要共享的文献到FTP服务器,然后发送该文献的下载链接到ESB平台;ESB平台分发消息到订阅该数据的系统;数据消息系统解析消息中的下载链接,下载文献。消息队列技术(MQ)消息队列技术是分布式应用间交换信息的一种技术,在集成分布式应用环境中,对异构网络环境下的数据共享提供有效的通信手段。消息队列可驻留在内存或磁盘上,队列存储消息直到它们被应用程序读走。通过消息队列,应用程序可独立地执行--它们不需要懂得彼此的位置、不需要等待接受程序接受此消息。其它技术对于数据库直连、Socket直连等数据共享技术,以建设分布式、低耦合系统架构为目的,建议改造为以上三种技术之一。云平台数据共享功效(1)数据共享的目的智慧XX大数据分析系统应采用松耦合、分层的技术架构实现,数据开放共享是智慧XX大数据分析系统要实现的目的,具体来说即为:通过采用层次化、面对开放共享的技术架构,将顾客行为分析系统的应用与数据解耦,形成相对稳定、独立、开放的数据共享平台(该平台由数据装载层、数据解决层、元数据管理、数据质量管理及数据共享模块等组件构成),支撑应用及外部系统的数据需求,实现“一种数据平台,支撑多样化内、外部应用”的目的。智慧XX大数据分析系统在实现时需有独立的功效组件“数据共享模块”来统一管理顾客行为分析系统中数据共享平台对系统内部上层应用以及外部系统提供原则化的数据共享服务、方式及内容。数据共享模块需含有共享接口管理、访问控制、负荷控制及访问集群管理能力。共享接口管理:统一管理数据共享平台的接口,涉及查询、订阅、消息交换、数据库等接口。访问控制:访问权限的判断、会话管理、访问频率管理、请求队列管理以及安全控制等能力。负荷控制:对共享请求的成本进行评定,并回绝不合理的请求。访问集群管理:重要用来实现“数据共享模块”在分布式布署时的负载均衡和Failover管理。(2)数据共享服务对象及共享内容数据共享服务于智慧XX大数据分析系统本身的上层应用智慧XX大数据分析系统的上层应用能够分为三类:“实时KPI计算类”、“实时细节查询类”,以及“分析类非实时统计”,数据共享平台通过不同的共享方式向上层应用提供数据支撑。经营分析系统顾客行为分析系统能够为经营分析系统提供顾客行为数据(重要是xDR及顾客网络行为标签信息),使经营分析系统能形成全视角的客户数据。数据共享内容无论是针对顾客行为分析系统的上层应用还是外部系统的应用需求,数据共享平台均可向其提供数据共享服务,共享数据应涉及但不限于下列内容:原始信令原始信令为xDR合成前的信令消息,用于信令回溯,通过文献方式向外提供。xDR明细数据xDR明细数据属于统计类数据,是顾客有关观看行为、业务资源使用统计的总和,涉及各类信令合成xDR、话单等数据。维度汇总数据数据仓库层的全部数据。实时指标数据本系统实时指标数据是指在下个统计周期内需要完毕计算的指标,例如某实时指标5分钟统计,是指从业务需求角度应在下一种5分钟内完毕统计计算。建议15分钟(包含)粒度实时指标数据由流解决引擎技术解决。数据质量信息数据质量管理是智慧XX大数据分析系统的重要能力之一,在智慧XX大数据分析系统中,通过在数据采集、分发、加载等环节设立检测点,以生成多个数据质量报告、数据质量预J信息,这些信息能够提供应外部系统,让外部系统能够掌握有关数据的质量信息,例如:及时性、精确性、完整性等信息。应用汇总数据应用汇总数据重要指上层应用直接使用的数据。该部分数据能否共享,取决于该类数据与否可由上层应用下沉到数据共享平台。如果能够下沉到数据共享平台,则可通过数据共享平台进行共享。如果仅为应用的个性化数据,则不通过数据共享平台进行共享。(4)数据共享服务数据订阅方式系统支持通过数据共享服务接口,例如ESB数据服务总线,对各类数据进行订阅。订阅过程中有关所需数据的描述可通过元数据管理功效获取。API方式此种数据获取接口是一组由数据共享服务模块提供的API集合,供数据消费系统调用以达成以下目的:界定所需数据的位置、范畴、规格,设立数据过滤条件;向智慧XX大数据分析系统数据共享服务及接口传递有关所需数据范畴的参数;获取所需的数据成果。API接口的优势在于能够更加贴近智慧XX大数据分析系统的数据组织构造,更加贴近数据的应用场景与业务需求。同时,API接口方式也限定了对共享数据的访问方式,避免对数据的违规操作,利于对系统的管理与维护。API接口方式的本质是结合应用需求封装某些通用的数据访问及信息交换合同的综合应用。数据库接口方式通用的数据获取接口。涉及:各类数据库产品所自带的原生数据库访问接口合同,如OCI,以及原则的数据库访问接口合同,如:JDBC、ODBC等。通过这类接口除了能够直接获取所需的数据,也能够将其应用在间接地返回订阅数据的过程中(此状况下向数据订阅者返回的是一组能够查询到所需数据的SQL,然后通过数据库接口方式发SQL查询)。实时数据共享方式对于“实时”指标及预J数据,需要考虑对外提供专门的实时数据共享及获取接口。对于共享给告J与故障管理系统的“实时数据”。(5)数据共享服务管理数据共享服务管理功效涉及安全管理、服务注册、查找及路由,尚有日志管理功效。安全管理:服务认证鉴权是用于鉴别服务请求方与否含有服务调用权限;数据交换安全是用于确保服务请求、响应过程中的数据安全;权限管理是用于拟定服务请求方可调用的服务权限;注册、查找和路由:提供服务的注册、查找和路由管理功效;日志管理:是用于统计服务调用过程中产生的日志信息。安全管理认证鉴权认证鉴权是服务提供方对服务请求方与否正当进行的鉴别和确认。通过认证鉴权,能够使服务提供方确认服务请求方的身份,拟定与否有该服务的访问权限。认证鉴权涉及两个方面:拟定服务请求方与否有访问服务提供方所提供服务的功效权限;对于有功效权限的服务请求方,还需要再拟定其与否含有可访问的具体服务及有关数据范畴的权限。认证鉴权需提供以下功效:在服务请求时,服务请求方要提供顾客名、密码等校验信息。服务提供方针对校验信息进行认证,如果顾客名、密码校验失败,不解决请求消息,并返回失败提示信息;通过顾客名、密码校验后,验证该顾客与否有请求该服务的功效权限。如果顾客没有功效权限,不解决请求消息,并返回失败提示信息;通过功效权限校验后,根据该服务请求方可访问服务的数据范畴权限,解决请求消息,并返回响应成果。权限管理权限管理涉及功效权限和数据范畴权限的管理。功效权限是指服务请求方与否能够访问某一种服务。数据范畴权限是在允许服务请求方访问某一服务的基础上控制可访问的数据范畴。对第三方应用接入做权限控制,只允许那些被授权的第三方应用访问系统。访问频度管理对第三方应用接入访问的频度管理,有效避免恶意攻击,确保数据访问性能与安全。数据传输安全在服务的请求和响应过程中,需要通过网络传输有关的数据。数据的交换需要进行安全控制,能够采用以下安全技术手段:密钥管理:密钥是一种基于密码技术的安全机制。密钥机制中除密码的设计安全外,另一种重要的方面就是密钥管理体制,涉及密钥的产生、分发、更换、存储和销毁等内容;数字签名机制:数字签名是基于非对称加密技术的安全机制。它为需要加密的对象提供两类密钥:公钥和私钥,统一采用公钥方式加密,采用私钥方式解密;加密机制:加密可提高数据或业务流量信息的机密性。普通有两种形式的加密:物理层的群路加密和网络层或应用层的端到端加密。对大数据量的传输安全,能够在数据打包的基础上考虑整体的数字签名,而不强制规定加密。服务注册、查找及路由服务注册、查找服务注册、查找是服务管理的基础功效。服务注册用于公布服务,提供应服务请求方使用。服务查找是服务的请求方在服务注册信息中查找到对应的服务,并根据查找到的服务绑定信息,调用该服务。对于没有数据共享总线的省份,服务注册功效也是数据地图子模块功效的一部分。服务路由服务路由是将服务请求方的请求按照一定的路由规则发送到对应的服务提供方。而服务路由按照代理服务和目的服务的关系分为1对1模式和1对N模式:1对1模式:是指1个代理服务路由到1个目的服务。服务请求方访问代理服务,代理服务直接路由至目的服务提供数据;1对N模式:是指1个代理服务路由到N个目的服务。服务请求方访问代理服务,代理服务通过路由转发规则,路由至适宜的目的服务提供数据。日志管理日志管理统计服务运行过程中的重要事件,需要长久保存并定时备份。日志重要包含以下内容:服务的注册信息:服务注册者信息、服务标记、服务地址、服务描述、服务名称和注册时间等;服务访问信息:服务请求方身份信息、请求IP、服务标记、服务地址、服务名称、数据范畴、请求时间和响应时间等;服务的运行信息:服务启动时间、服务停止时间、服务运行状态、服务地址和服务停止因素等。(6)数据访问接入控制会话管理对访问的接入连接管理,涉及:对接入时长、计算资源及存储资源进行管理。访问优先级管理通过设立不同的队列,确保请求的不同优先级次序,以确保系统在高负荷状况下的核心请求的含有最小的解决时延。查询请求过滤完毕查询请求内容的特定解决,例如:采用HTTP的压缩以减小网络流量等。(7)数据访问负荷控制负载均衡采用服务负荷均衡技术是为了提高服务的稳定性,减少访问的压力。服务负荷分摊能够采用集群方式实现。数据服务集群的重点在于服务的负载分摊,通过集群技术提高数据服务的访问性能。负载分摊是把负载压力根据某种算法合理分派到集群中的每一台服务器上,以平衡每个集群节点的压力。访问请求数据缓存管理通过数据缓存,将访问热点数据缓存在内存中,以减轻二次访问对数据仓库带来的查询压力。查询成本控制通过实现对查询成本的预预计算,避免那些查询压力巨大的查询请求给数据解决层各个存储区域带来的不必要的查询压力。按照负荷控制方略的定义,能够直接回绝某些查询请求。数据服务层计XX大数据平台对外发挥价值的核心是提供种类丰富、类型多样的服务接口和服务能力。从服务类型来看,可分为通用类服务、研判类服务和智能类服务。通用类服务:在大数据平台提供的数据资源基础上,结合分布式计算、可视化分析和呈现等技术,可实现综合查询、搜索引擎、数据比对、布控预J、分类统计等惯用功效,以及趋势分析、异常分析、有关性分析等挖掘功效。研判类服务:基于大数据分析挖掘,实现各类战法集市、积分预J模型、全要素分析工具、社交网络分析、隐性重点人挖掘、治安态势分析等综合情报研判功效。智能类服务:综合情报研判功效,实现案件多维分析、人流激增预J、犯罪预测模型、人员智能画像、涉恐系数分析、人员亲密度模型分析等功效。模型的应用平台基础应用(1)大数据统一门户平台门户元数据管理与统计提供可视化的数据管理与统计界面,基于大数据平台采集挖掘技术、主题分类算法模型等技术,顾客能够多维度、可视化的快速理解大数据平台中的数据状况。(2)数据分析看板(3)可视化指挥调度数据解决和存储系统设计图5-13数据解决与存储架构大数据解决核心技术图5-14大数据解决核心技术数据存储采用MPP与hadoop融合架构新型数据库将逐步与Hadoop生态系统结合混搭使用,用MPP解决PB级别的、高质量的构造化数据,同时为应用提供丰富的SQL和事务支持能力;用Hadoop实现半构造化、非构造化数据解决。这样可同时满足构造化、半构造化和非构造化数据的解决需求。网络系统设计系统布署在公众服务云中,所需云主机全部布署在业务网络中,通过业务接入交换机向上级联到业务核心交换机。图5-16系统网络设计模型安全系统设计系统含有完善的安全管控机制,重要体现在:系统满足集团各项安全合规性规范规定;另外系统仍满足SOX法案对系统安全的各项规定与约束。从系统功效上考虑,提供安全监控、口令管理、登陆控制与日志审计等多项安全管控功效。另外,在网络安全、敏感数据安全与软件本身安全方面含有完毕的保障方案与流程。系统安全满足状况LTE信令分析平台满足状况:(1)系统提供密码方略设立功效;(2)系统中密码密文存储,配备文献中涉及密码的必须是密文;(3)系统间数据加密传输;(4)系统维护账号和预设账号分开,预设账号(涉及:应用程序使用的账号)不能被维护使用;(5)访问数据库的账号采用最小权限原则设立;(6)避免通过手工批解决进行业务维护;(7)避免通过直接操作数据库进行局数据制作;(8)避免采用手工方式进行数据统计;(9)满足操作维护日志审计,能够对操作系统、数据库、应用系统、网络设备的操作维护日志进行全方面审计;(10)满足日志的可过滤审计和统计分析;(11)满足数据库自动备份、全量及增量备份,操作系统和应用系统手工备份,日志的备份、核心业务数据备份;(12)规定单独布署测试环境,软件新版本、补丁在测试环境中测试,测试通过后,布署于运行环境中。系统安全配备管理功效安全监控我方解决方案中提供的主机服务器和多个应用服务器会予以专门的保护,避免未授权顾客的非法访问,其具体能力以下:通过良好的登录活动统计和报告、顾客和网络活动的周期检查,避免未被授权使用系统的顾客进入系统;按照顾客、组模式对操作系统的访问进行控制,避免已授权或未授权的顾客存取互相的重要信息。不同部门或类型的顾客只能访问对应的文献或应用,能够采用授权方式限定顾客对主机的访问范畴;避免恶意顾客占用过多系统资源(CPU、内存、文献系统等),从而避免因无系统资源造成系统对其它顾客的不可用的事件发生;对主机的安全事件进行具体的统计,并根据需要随时进行查阅。应提供完善的漏洞扫描手段,及时发现系统的安全隐患,并据此提供必要的解决方案;周期性进行操作系统备份,能够在系统崩溃后快速修复系统文献。口令管理我方解决方案中对各类主机及应用服务器系统登录口令的设立、使用、保存及配备管理已达成下列能力,以确保系统对非法入侵的抵抗能力。提供的安全方略强制实现顾客口令复杂度和长度安全规则,在此基础上可设定口令的安全限制条件,严禁顾客使用某些易被猜中的口令,如:帐号名、单位名称等,核心字在系统中可配备。主机系统的顾客口令不允许采用明文形式寄存,从而避免顾客的口令不被任何人直接非法获取。系统提供限制口令有效天数的功效,能够强迫使用者在规定的时间间隔中必须变更口令,使口令被猜中的可能性减少。登录控制管理人员能够通过安全的终端登录程序访问系统主机环境,来完毕系统配备和管理等有关工作。终端登录程序能够最大程度减少非法访问系统软件的机率,登录程序应当最大程度地减少公开的系统信息,避免为非法顾客提供方便。在登录过程未成功时不显示系统软件的标记;显示普通性注意事项,提示顾客只有正当顾客才干访问系统软件;在登录期间不提供协助信息,以免为非法顾客提供方便;在全部数据输入完毕之后才验证登录信息,出错时不提示哪些数据错误哪些数据对的;限制允许进行的登录失败次数(可设立为5次),并且能够通过审计功效进行统计,允许再次登录前强制时延,断开数据链路连接;限制登录程序允许的时间上限和下限,如果超出限制则中断登录进程;登录完毕后,显示上次成功登录时间和地址,以及登录失败的具体信息;当登录回话处在不工作状态时,应当在设定的超时时间后自动断开登录连接,以避免未授权顾客的非法访问。终端登录超时功效应实现中断连接、关闭应用和网络会话的功效;在性能管理系统以外的高风险地区(例如公司无法监测和进行安全管理的外部区域)的终端远程连接,或者服务于高风险系统的终端,应当限制连接时间以提高系统软件的安全性,终端的连接时间应在正常工作时间之内;日志审计生成和保存具体操作日志、登陆日志、任务操作日志统计和系统错误日志等信息的能力,所产生的日志能够在运行商所布署的审计方略之下进行有效的审计,审计日志应保存3个月,涉及:应用系统日志:应用系统含有完善的日志功效,能够统计系统异常状况及其它安全事件。应用系统日志涉及下列内容:顾客登录和退出的日期和具体时间及IP地址等信息;成功的和被回绝的系统访问活动的统计;成功的和被回绝的数据与其它资源的访问统计;成功的和被回绝的管理操作统计。操作系统日志启动操作系统日志功效对系统日志进行统计;系统日志应最少统计下列内容:对系统登录进行统计,统计登录主机的IP地址、顾客名、时间等;统计系统成功以及失败的登录事件;统计系统事件。系统必须提供一种机制审计与安全性有关的故障与冲突,其中涉及:授权(Authorization)失败:差错通行字,无效的SNMP通信,无效令牌;对控制方略的违反:严禁的源路由,被过滤掉的目的地;授权通过:对的通行字,远程登录带内访问,控制台访问等。系统必须提供一种机制审计用于统计并监控设备配备信息的变化,统计内容涉及登录时间,帐号,实施的操作和时间等信息。系统应支持“存在远端Server的操作审计功效”,即将系统上进行的全部操作在远端Server上都进行实时备份。系统备份在大数据量的应用场景中,系统采用数据库全量备份与增量备份相结合、库内数据备份与库外文献备份相结合的方式,完整、及时、有效地备份数据内容。系统无安全漏洞保障网络安全网络配备安全我方解决方案中通过防火墙(硬件防火墙)对进入内部网络的数据包进行扫描过滤,能够根据顾客、IP地址、访问类型等方式进行访问规则限制,能够对常见的入侵行为进行判断并制止,有条件的公司应使用多个防火墙进行集成。提供地址翻译功效,屏蔽网络内部细节,避免外部黑客运用IP探测技术发现内部网络构造和服务器真实地址,从而实现有针对性的攻击。能够对网络通讯进行监控,及时发现任何来自于网络内部或外部的黑客入侵或可疑的访问行为,并做到及时报J与阻断。数据传输安全我方解决方案中对各子网间或远程顾客传输中的数据进行安全保护,运用认证、校验、加密、等方式确保数据在网络层的安全。网络层认证报文的来源,避免攻击者运用伪装地址来发送报文;网络层确保数据报的完整性,报文在网络中传输时没有发生变化;网络层报文的内容在传输过程中未被读取,未授权方不能读取报文的内容;网络层认证报文没有重复,避免攻击者通过重发截获的认证报文来干扰正常的通信,从而造成事务多次执行,或是使依赖于被复制报文的上层应用发生混乱状况。防病毒安全由于系统中现在存在多个方式的连接,在多个途径的数据交换中都可能含有病毒感染的隐患。对于这些存在的安全问题,我方提供的安全方案通过有效的手段,对在网络中传输的数据及邮件进行实时的监视,对多个类型的文献都能够进行病毒的查杀工作,对远程子网中的服务器、工作站提供全方面的病毒防备,自动进行病毒代码库的更新,对发现的病毒能够在全网络范畴内进行去除。生产环境与开发测试环境分离我方提供的安全方案通过构建科学完善的系统环境及管理机制,对系统开发、测试、上线各个环节采用安全的区隔及流程管理,保障系统生产环境的安全可靠及高效运行。系统环境分为生产环境、开发环境及测试环境,各个环境之间采用严格的分离管理,对原有功效的升级改造、原有功效下线及新增功效开发,先在开发、测试环境进行有关的开发测试工作,确保数据解决及应用逻辑符合业务规定并能够对的运行之后,才在生产环境进行上线布署。在开发、测试环境构建与生产环境主体架构相似的、与生产环境互相独立的物理平台。敏感数据安全为了确保系统的敏感数据安全,对敏感数据的导出进行管理,实现敏感数据“不落地”,避免人工参加数据操作造成的数据泄漏。“不落地”是指数据在使用过程中不下载或者保存在个人PC机、手提电脑、U盘等个人存储设备上。感数据导出管理实现方案:图5-17敏感数据不落地管理实现图敏感数据导出重要是系统以系统控制方式或者以人工参加方式对系统的敏感数据进行导出。系统控制方式:针对外部系统(如专业网管、监控与告J管理系统、资源管理系统、CRM、BOSS、客服营销系统等系统)对性能管理系统固定的数据需求,建立“互动接口”,实现性能管理系统的目的数据传递到其它系统中执行分析、营销、管控等活动。能够通过文献接口等方式进行交互。人工参加方式:通过人工参加方式,实现临时的数据需求而实现管理方式。顾客能够通过“文献服务器”从性能管理系统下载数据到该服务器上;能够对下载的数据文献进行筛选、修改、等操作,并且以人工方式到外部系统中。文献操作服务器是类似于远程桌面类型的服务器。顾客能够通过远程登录该服务器登录各类外部系统;并且能够通过登录实现查询、上传、下载等功效。该服务器能够安装多个解决文献的软件,例如Excel、FoxPro等软件。但是该服务器必须有日志进行统计顾客操作过程,严禁提供文献下载到个人存储设备上。有条件的省市能够实现在性能管理系统下载敏感数据时,下载的文献直接发送到“文献操作服务器”上的该顾客帐户中,顾客通过登录文献服务器实现操作。从管理角度,我方解决方案中对敏感数据导出具体以下:系统控制方式导出的敏感数据,对接外部系统以“系统接口”办法实现数据对接。在此期间确保数据安全,不下载或者保存在个人PC机、手提电脑、U盘等个人存储设备上;通过人工参加方式导出的敏感数据,通过有关部门的审核才干下载或者保存在个人PC机、手提电脑、U盘等个人存储设备上。软件本身安全WEB站点安全我方提供的产品不使用common、login、system等默认登录页名称,严格限制口令明文口令,避免站点应用的顾客、主机、DB等口令信息存储明文保存在配备文献、代码或数据库中,具体已达成下列能力:杜绝跨站脚本弱点与跨站伪造请求。跨站脚本攻击(XSS)。是指运用网站漏洞从顾客那里恶意盗取信息。顾客在浏览网站、使用即时通讯软件、甚至在阅读电子邮件时,普通会点击其中的链接。攻击者通过在链接或者表单中插入恶意代码,就能够盗取顾客信息。攻击者普通会用十六进制(或其它编码方式)将链接编码,以免顾客怀疑它的正当性。网站在接受到包含恶意代码的请求之后会产成一种包含恶意代码的页面,而这个页面看起来就像是那个网站应当生成的正当页面同样。即跨站伪造请求(CSRF),是伪造客户端请求的一种攻击,英文全称是CrossSiteRequestForgery。攻击者可伪造顾客请求进行操作。杜绝泄露站点实际途径,避免通过页面右击属性、输入错误参数报错等操作而暴露实际文献途径。杜绝IIS上传组件漏洞。手工上传文本文献等应用的IIS上传组件本身就存在较大风险漏洞。攻击者能够上传类似“aa.asp;.xls”文献,上传组件检查后缀名为.xls就认为是.xls文献,而IIS内部解析时却会截取“;”前的内容为文献名,事实上传文献就成了aa.asp,攻击者就能够运用IIS上传组件的这个本身漏洞随意上传木马脚本,进而能够以匿名访问顾客(WebLogin)的身份来控制站点服务器主机。杜绝URL跳转限制被钓鱼操作,针对站点的URL跳转严格限制,以避免被钓鱼。编码规范化我方提供的产品不用常规编码工具自动生成的默认目录名称或文献名,如SYTEM、LOGIN、COMMON等名称,对顾客输入和URL进行过滤,将某些敏感字符进行转义(例如Script、<、>等)进行检查过滤。表单提交操作中,限制顾客提交的数据长度。核心动作使用POST办法提交,并增加时间戳或验证码。软件正版化我方提供的解决方案主机操作系统为正版操作系统,系统补丁包更新延时不超出三个月。系统运行或维护所应用的第三方软件全部为正版软件或开源软件。性能和可靠性可靠性规定系统确保7×24小时不间断运行,系统硬件构成含有冗余等安全方法。设备的MTBF(MeanTimeBetweenFailure,平均故障间隔时间)应不大于或等于每年50分钟内。每年每台设备故障率不超出2%。设备含有避免单点失效的功效,从而确保系统的可靠度不低于99.999%,规定某一种设备的宕机不影响业务的运行。具体可靠性方法以下:系统能够避免单点失效,即某台设备宕机不会影响到整个业务的运行系统的系统实现阵列级RAID备份系统提供核心部件的冗余能力系统设计寿命不不大于系统的硬件与软件互相配合,提供对系统故障的管理能力系统可靠、稳定,平均故障时间间隔不低于5000h,故障平均修复时间不高于1h。硬件设备有较高的可靠性和容错能力系统可监控各主机运行状况和数据解决状况,提前预J系统故障,减少系统故障率。系统含有压力缓冲能力,能够在一定时间内承受突发的超负荷的请求。系统含有动态调配集群资源的能力,支持在物理和逻辑上隔离多个任务所占用的资源。可扩展性系统含有布署灵活性与系统可扩展性,方便扩展设备容量和提高设备性能,系统能平滑升级。采用开放体系的硬件和基础软件平台;所应用的软硬件能够适应2-3年内网络扩容的需求。硬件系统采用模块构造,以确保系统内存、CPU及储存容量的扩展;硬件配备的升级不会引发应用级软件的修改和开发;应用软件的构造应能确保功效的扩展。为了适应系统的容量增加,硬件设备应含有较强的扩展能力,并应含有升级和向后兼容的能力。采用通用的计算机系统,使用分布式系统构造,局域网和广域网混合相连。系统的硬件性能优良、运行平稳可靠,并能够确保长时间的持续工作。系统重要硬件的容量和性能指标(涉及内存容量、解决器主频、硬盘容量、通信网带宽)应能适应整个系统解决能力、通信传输量、数据存储量和顾客实际需求等各方面的规定。系统根据实际需要能配备各类外设:磁带机或磁带库、光盘机、活动硬盘等设备。对于新的查询参数和规定,查询系统的软件模块含有可扩展性,可基于原有系统实现灵活、平滑的系统升级。系统各解决模块支持负载均衡,含有并行内存计算能力,支持数据的实时解决和离线解决。系统解决模块间低耦合,可根据需求和压力分别弹性扩展。可维护性系统支持自动化升级,通过维护工具完毕集群的升级管理,减少布署实施工作量;系统支持监控各主机运行状况和数据解决状况,提前预J系统故障,减少系统故障率;系统支持自动化巡检,提高系统监控力度,减少由于系统故障造成的损失;通过UCD设计,提高客户感知、减少维护工作量;支持故障定位、端到端问题跟踪和异常事件解决功效;支持话单关联成功率的实时分析,并提供分析报告,可及时定位各网元数据的精确性、及时性。运行维护系统设计服务器管理对服务器进行全方面的监控,涉及:服务器的基本信息,端口,文献系统,告J,性能,流量,可用性等综合呈现。网络设备管理针对交换机,路由器和防火墙等网络设备的基本信息、告J、性能、端口信息、端口流量,可用性等信息综合展示,直观呈现设备的全部信息。进程管理系统提供对服务器的进程全方面扫描,顾客可根据扫描成果筛选出重点关注的进程,并针对进程的重要性定制告J等级和描述,当进程出现异常时,第一时间告知到运维人员。服务管理系统提供对系统重点服务的监控,当服务不存在或者服务参数发生变化会产生告J。数据库管理数据库监控范畴涉及各重要应用系统中使用的各类数据库,能够监视数据库系统进程的运行状况和日志文献的变化。根据数据库的不同,系统重要监控数据库的进程、表空间运用率、数据文献运用率、锁、连接数等指标。在数据库监控页面系统也提供数据库所在设备的CPU、内存及磁盘空间运用率、进程、设备配备信息等性能指标。中间管理系统提供了现在主流厂商中间件的管理功效,能够监视中间件系统的基本信息和运行状况,能够动态收集应用性能数据并通过图形界面呈现。集群管理重要是实时监控集群各个节点的运行状态,并对各个节点进行性能监控与分析,以确保高性能、高可用性的集群服务。故障管理系统提供立体化、透明化监管、闭环故障解决、多个的告J预解决方略、实时精确的告J告知接口,丰富的告J解决经验,保障运行质量。系统提供一系列的告J预解决流程,顾客可自定义预解决方略。系统提供告J实时监控面板,告J将主动推送到实时面板,面板提供某些列的告J解决操作(涉及:告J去除,确认,归档,锁定,查看详情)。性能管理可针对设备类型或重点设备的重要指标自定义门限(涉及:单级门限和多级门限),并且提供越限告J功效。提供性能指标汇总功效,并对性能数据进行深度趋势分析。配备文献管理配备文献管理功效实现每天、每七天或每月定时备份网管设备的配备文献。备份的范畴是被管范畴内全部的网络设备。并提供配备文献比较的功效,顾客可选择需要比较的配备文献,系统将自动对比其差别,得出比较的成果,协助顾客分析配备文献。SYSLOG管理系统可根据SYSLOG发送的源设备和报文自定义告J规则,上报告J。对原始SYSLOG查询。其它系统设计无额外补充内容。系统配备及软硬件选型原则软硬件布署根据对本项目的需求分析,并结合应用体系架构的B/A/S实现形式以及对整个系统网络、安全、系统管理等方面的总体考虑,整个主机与存储系统重要分为下列几个部分:数据库服务器,应用服务器等。系统软件本项目数据库服务器和应用服务器的操作系统建议选用linux操作系统。数据库服务器数据库系统是整个系统的数据中心,设计上采用双机设计,考虑到项目特殊性,前期采用单数据库实现,后期根据需要再进行扩容方案建设(预留接口)。核心数据库服务器运行大型数据库,是整个系统的数据核心,含有高稳定性、高可靠性、高容错能力的规定。通过数据库的安全业务应用端口,能够提供应现有服务器设备和终端设备的访问,确保系统运行的高效、稳定、不中断。应用服务器本方案内,应用服务器重要为各业务系统提供硬件平台支撑。采用负载均衡服务器和Web应用服务器组合方式。同数据库服务器,考虑到项目特殊性,本次均衡服务器采用单节点,Web应用服务器采用集群方式。数据规定数据类型系统数据类型包含XX系统已有的数据,运行商、交通系统、等部门采集的居民衣、食、住、行的海量数据等多个类型的数据等。数据规模为确保数据的精确性,系统顾客数采集样本量不不大于0万。技术规定数据存储能力系统的存储容量高于3PB。数据分析能力规定系统每天解决日志条数高于200亿条,解决时延于300s,集群服务器数不不大于300台,单台设备配备高于CPU32核2.0G、内存256G。数据采集能力规定数据采集粒度为15分钟。数据呈现能力规定数据呈现刷新时间为60分钟。查询的响应时长不大于15秒。系统并发连接数不不大于1000个。系统可靠性规定系统平台含有7×24小时持续稳定运行。系统软硬件物理布署方案智慧XX大数据中心建设将重要依靠现有区传输网络平台,涉及互联网、政务外网来实施布署、访问大数据中心有关数据信息。图5-19大数据中心网络构造示意图XX系统各部门的系统布署的网络涵盖了政务内外网、部门专网、互联网,分别为XX内部、企事业单位、民众提供服务。项目建设与运行管理项目领导机构项目领导和管理机构简称项目领导小组,负责项目总体规划和方针方略的制订。(1)人员构成组长:XX系统有关部门主管领导各1人;各部门信息处室领导各1人。(2)重要职责制订方针方略,指导项目管理实施小组;设定项目目的、范畴及评价考核原则;同意项目计划,监控项目进程;协调项目所需有关资源,调配人力和资金;解决项目实施小组不能解决的问题;审批建设方案并参加验收;审批工作准则与工作规程,确保项目能够正常进行;对项目成败全方面负责。项目管理机构项目管理机构为负责本项目管理实施有关单位,负责项目建设过程中的日常管理工作。(1)人员构成项目管理机构组员由下列构成建设单位项目管理组长1名;承建单位项目组长1名;监理机构组长1名;专家组长1名构成。(2)重要职责根据本项目建设内容,建议本项目实施机构、机构构成及机构职责可按下表所示方式组建。表STYLEREF1\s6SEQ表\*ARABIC\s11实施机构职责项目实施机构组员机构构成重要职责备注建设单位项目管理组项目总负责人硬件负责人软件负责人对项目实施过程进行建设管理承建单位项目组项目经理采购合同组硬件实施组软件开发组质量控制组运维支持组负责具体项目的实施工作硬件实施组、软件实施组根据项目内容及实施需要还可划分小组监理机构组总监理工程师专业监理工程师总监对项目的建设过程进行“三控两管一协调”专家组行业专家技术专家对项目方案从业务和技术等多层次进行把关项目承建机构(1)人员构成由承建方委派高级项目管理人员出任项目经理1名,并由承建方的采购合同组、硬件实施组、软件开发组、质量控制组、运维支持组组长各1名,组员20名构成。(2)重要职责根据合同规定,收集项目有关信息,制订项目计划,指导项目执行;协调顾客和项目组的关系,安排人力资源,明确职责;评定项目执行风险,制订防备方法;监控产品订货、运输、安装、调试状况;定时编写项目进展状态的资料给顾客及有关人员;协助对变更进行评定,提出意见。并决定普通变更,重大变更告知有关决策人;协助制订、监控变更方法的执行;组织系统验收,签订验收文献,跟踪、统计试运行状况并安排有关人员解决试运行问题;验收完毕后,负责对项目进行总结、结项。运行维护机构在项目质保期内,项目软硬件平台的技术维护工作由项目承建单位负责;项目质保期后,采用购置技术运维服务的方式进行智慧XX大数据分析系统的维护工作。有关管理制度(1)强化监理的监督管理作用按照我国的有关规定,本项目必须引入监理单位,因此在本项的建设过程中,充足发挥监理的作用,对项目建设实施全过程的“进度、质量、成本”的监督管理,从而确保项目保质保量的完毕。(2)对参加项目建设单位的管理本项目的建设,将会有多家承建商参加,因此需要加强对各承建商的管理。管理的内容涉及对阶段性的成果评审和工作进度检查,对各承建商的重要人员(如项目经理、技术负责人、业务骨干等)进行资格审查、到位状况、主持工作的能力等进行管理,通过管理,确保阶段性提交的成果与产品符合
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年装箱单在应对外贸出口贸易救济措施中的策略合同3篇
- 二零二五版国际贸易特许经营合同主体欺诈风险管理与合同解除合同3篇
- 二零二五年电子显示屏广告租赁合同样本3篇
- 二零二五版代办房地产前期开发手续与建筑工程质量检测服务合同3篇
- 二零二五年采棉机驾驶员职业素养提升与劳动合同3篇
- 二零二五版能源行业冻库租赁合同含能源物资储备协议3篇
- 二零二五年酒店客房部服务员劳动合同书3篇
- 天津事业单位2025年度合同制聘用人员管理规范3篇
- 二零二五年度装修合同范本:环保装修保障您的生活品质6篇
- 二零二五版地产经纪居间合同纠纷处理指南3篇
- 【公开课】同一直线上二力的合成+课件+2024-2025学年+人教版(2024)初中物理八年级下册+
- 高职组全国职业院校技能大赛(婴幼儿照护赛项)备赛试题库(含答案)
- 2024年公安部直属事业单位招聘笔试参考题库附带答案详解
- 健康教育工作考核记录表
- 装饰工程施工技术ppt课件(完整版)
- SJG 05-2020 基坑支护技术标准-高清现行
- 汽车维修价格表
- 司炉岗位应急处置卡(燃气)参考
- 10KV供配电工程施工组织设计
- 终端拦截攻略
- 药物外渗处理及预防【病房护士安全警示教育培训课件】--ppt课件
评论
0/150
提交评论