金融大数据平台的应用场景_第1页
金融大数据平台的应用场景_第2页
金融大数据平台的应用场景_第3页
金融大数据平台的应用场景_第4页
金融大数据平台的应用场景_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、金融大数据平台的应用场景目录 TOC o 1-3 h z u HYPERLINK l _Toc490675209 1大数据在银行的应用场景 PAGEREF _Toc490675209 h 5 HYPERLINK l _Toc490675210 1.1 大类应用 PAGEREF _Toc490675210 h 5 HYPERLINK l _Toc490675211 1.1.1营销类模型 PAGEREF _Toc490675211 h 5 HYPERLINK l _Toc490675212 1.1.2风控类模型 PAGEREF _Toc490675212 h 5 HYPERLINK l _Toc4

2、90675213 1.1.3综合评价模型 PAGEREF _Toc490675213 h 5 HYPERLINK l _Toc490675214 1.2 细分应用 PAGEREF _Toc490675214 h 5 HYPERLINK l _Toc490675215 1.2.1客户风险画像 PAGEREF _Toc490675215 h 5 HYPERLINK l _Toc490675216 1.2.2客户综合评级 PAGEREF _Toc490675216 h 6 HYPERLINK l _Toc490675217 1.2.3客户综合预授信 PAGEREF _Toc490675217 h 6

3、 HYPERLINK l _Toc490675218 1.2.4客户风险定价 PAGEREF _Toc490675218 h 6 HYPERLINK l _Toc490675219 1.2.5客户利润贡献评价 PAGEREF _Toc490675219 h 6 HYPERLINK l _Toc490675220 1.2.6客户综合营销分析 PAGEREF _Toc490675220 h 6 HYPERLINK l _Toc490675221 1.2.7客户流失分析 PAGEREF _Toc490675221 h 6 HYPERLINK l _Toc490675222 1.2.8贷后实时监控分析

4、 PAGEREF _Toc490675222 h 6 HYPERLINK l _Toc490675223 1.2.9欺诈风险防范 PAGEREF _Toc490675223 h 7 HYPERLINK l _Toc490675224 2大数据建模平台Data Insight PAGEREF _Toc490675224 h 8 HYPERLINK l _Toc490675225 2.1 概述 PAGEREF _Toc490675225 h 8 HYPERLINK l _Toc490675226 2.1.1体系结构 PAGEREF _Toc490675226 h 8 HYPERLINK l _To

5、c490675227 2.2 DataInsight主要特性 PAGEREF _Toc490675227 h 9 HYPERLINK l _Toc490675228 2.2.1一体化的大数据挖掘应用平台 PAGEREF _Toc490675228 h 9 HYPERLINK l _Toc490675229 2.2.2并行化大数据挖掘运行平台 PAGEREF _Toc490675229 h 9 HYPERLINK l _Toc490675230 2.2.3高效的大数据挖掘落地平台 PAGEREF _Toc490675230 h 10 HYPERLINK l _Toc490675231 2.3 D

6、ataInsight主要功能 PAGEREF _Toc490675231 h 10 HYPERLINK l _Toc490675232 2.3.1模型工作流 PAGEREF _Toc490675232 h 10 HYPERLINK l _Toc490675233 2.3.2可视化数据探索 PAGEREF _Toc490675233 h 11 HYPERLINK l _Toc490675234 2.3.3并行化算法 PAGEREF _Toc490675234 h 12 HYPERLINK l _Toc490675235 2.3.4多建模语言支持 PAGEREF _Toc490675235 h 1

7、4 HYPERLINK l _Toc490675236 2.3.5模型应用管理 PAGEREF _Toc490675236 h 15 HYPERLINK l _Toc490675237 2.3.6模型即服务 PAGEREF _Toc490675237 h 16 HYPERLINK l _Toc490675238 3大数据分析展示平台Discovery PAGEREF _Toc490675238 h 18 HYPERLINK l _Toc490675239 3.1 平台架构 PAGEREF _Toc490675239 h 18 HYPERLINK l _Toc490675240 3.1.1数据引

8、擎 PAGEREF _Toc490675240 h 20 HYPERLINK l _Toc490675241 3.1.2BI Server PAGEREF _Toc490675241 h 21 HYPERLINK l _Toc490675242 3.1.3交互分析模块 PAGEREF _Toc490675242 h 21 HYPERLINK l _Toc490675243 3.1.4API PAGEREF _Toc490675243 h 22 HYPERLINK l _Toc490675244 3.2 平台特性 PAGEREF _Toc490675244 h 22 HYPERLINK l _T

9、oc490675245 3.3 交互式体验 PAGEREF _Toc490675245 h 23 HYPERLINK l _Toc490675246 3.3.1构建数据视图 PAGEREF _Toc490675246 h 23 HYPERLINK l _Toc490675247 3.3.2图表类型 PAGEREF _Toc490675247 h 24 HYPERLINK l _Toc490675248 4案例介绍 PAGEREF _Toc490675248 h 26 HYPERLINK l _Toc490675249 4.1 某大型银行卡收单专业化服务公司 PAGEREF _Toc490675

10、249 h 26 HYPERLINK l _Toc490675250 4.1.1持卡人特征归纳 PAGEREF _Toc490675250 h 26 HYPERLINK l _Toc490675251 4.1.2持卡人交易行为预测 PAGEREF _Toc490675251 h 27 HYPERLINK l _Toc490675252 4.1.3商圈聚类 PAGEREF _Toc490675252 h 27 HYPERLINK l _Toc490675253 4.2 某商业银行 PAGEREF _Toc490675253 h 27 HYPERLINK l _Toc490675254 4.2.1

11、优质不良客户分类 PAGEREF _Toc490675254 h 27 HYPERLINK l _Toc490675255 4.2.2员工账户监测预警 PAGEREF _Toc490675255 h 30大数据在银行的应用场景大类应用营销类模型此类模型主要客户细分为基础,建立客户的360度视图,建立应用于客户营销的业务模型,如:商户交易分析模型、商户行业分析模型、商户综合利润贡献模型、客户刷卡交易分析模型、产品推荐模型等。风控类模型该类模型主要用于信贷业务和欺诈防范,并与目前的征信建设相结合,如:商户评分模型及审批规则、行业风险识别模型、人行征信报告评分模型、个人信用分析模型、风险定价模型、风

12、险客户预警模型、贷后实时监控模型、反欺诈模型等。综合评价模型该类模型以之前的相关模型为基础,并通过规则引擎整合多个模型,进行加工处理,并根据不同业务需求产生不同的客户综合评价,如:客户综合利润贡献模型、POS商户综合评价模型、综合预授信模型、综合风险判断模型等。细分应用客户风险画像依据客户内部数据,结合各种外部数据源,排查不良信息,综合决策,建立客户全方位画像,并进行综合评分,最大程度挖掘优质客户,排除潜在风险客户,从客户前期筛选上进行风险前移客户综合评级 结合客户的交易情况和购买理财产品状况,并结合客户的个人信用综合分析,对商户建立综合评级,并进一步应用于我司的各种贷款产品中。客户综合预授信

13、针对客户的综合评级,结合不同业务类型,利用大数据评分和决策引擎规则判断,对潜在贷款客户进行预授信额度的试算,方便后期业务营销,同时可将业务风险前置。客户风险定价针对客户的综合评级,对不同信用级别的客户采取不同的定价策略,以收益覆盖风险为原则,优化我司相关业务产品的定价。客户利润贡献评价综合分析客户在我行的存量业务,进行利润贡献度评判,方便我行后期深度营销客户。客户综合营销分析通过客户关系深度挖掘和持有业务深入分析,判断最适合营销给客户的产品,同时结合我司的优势产品政策,加大综合营销力度,为营销客户提供全面支持,避免盲目营销的情况。客户流失分析通过大数据挖掘,如客户在我司POS业务变动情况,交易

14、频次、交易时间等多种综合指标,对客户的流失情况进行分析和综合预测,判断潜在流失客户,并增加营销力度,采取相应措施,最大程度上挽救客户。贷后实时监控分析利用内部数据和引入的外部数据,通过规则引擎的实时抓取和判断,对已放款客户的贷后情况进行实时分析,并进行区分高风险、中风险、低风险客户,并进行预警推送。欺诈风险防范 通过建立黑名单、灰名单机会,完善相应的规则引擎,对虚假交易、套现、电商诈骗等欺诈交易行为进行自动分析、挖掘,通过机器学习的方式提高银联商务防范风险业务的能力。大数据建模平台Data Insight概述大数据挖掘是大数据中非常重要的一个组成部分。只有从大数据中挖掘出价值,大数据才有意义。

15、明略DataInsight是一款企业级的大数据挖掘平台产品,通过应用先进的大数据技术,帮助企业实现了海量数据上的数据挖掘,获取隐藏在大数据下的知识,为企业创造新的业务价值。与常见的只能进行单机挖掘的产品不同,明略DataInsight基于Apache Spark架构,使得数据挖掘能够真正并行化起来,能够真正的在海量数据机上进行数据挖掘。突破了传统数据挖掘工具只能在单机上建模的缺陷,使得企业大数据挖掘成为了可能。体系结构明略DataInsight从上到下分为3层,分别是接口层,调度层和运行层。其中:接口层:用来与用户和外部系统进行交互。接口层提供了可视化建模工具以及模型应用系统界面,供用户创建模

16、型和对生产环境中的模型进行管理。此外,还提供了Restful API供其他外部系统进行模型服务调用。调度层:调度层负责调度模型作业的运行。一个模型作业由若干任务组成,每个任务的执行环境和执行次序都不一样。调度层负责将任务发往合适的执行器中运行,并负责任务之间的通信和错误处理等功能。运行层:运行层负责真正的运行一个任务,运行层是基于Spark并行架构的,在Spark中启动了多个运行器(Runner)来负责最终任务的执行。这儿的运行器可以是普通的Spark任务,也可以是R或者Python的容器。DataInsight主要特性一体化的大数据挖掘应用平台明略DataInsight提供高效的建模工具帮助

17、企业在大数据上进行数据挖掘,同时提供模型应用系统帮助企业整合从模型开发到模型上线的大数据挖掘落地的全过程,真正使得大数据挖掘能在企业轻松落地。明略DataInsight从企业业务落地出发,帮助企业有效的管理大数据挖掘的各个阶段,不单单为企业提供了高效的建模工具,同时也提供模型应用管理系统帮助企业管理已经建立好的模型,降低了模型部署、更新等维护的成本。明略DataInsight是基于大数据平台的产品,这就意味着明略DataInsight的实验环境和生产环境融为一体。在实验环境中建立的模型可以很方便的在生产环境中应用,降低了模型的部署和迁移成本。并行化大数据挖掘运行平台大数据时代的特点是数据量规模

18、巨大,传统的单机算法已经无法满足大数据时代的需要,因此需要使用并行算法来处理和计算大数据。明略DataInsight是一款基于Apache Spark架构的真正意义上的大数据挖掘平台,其通过Spark提供的高性能内存迭代计算引擎在多个节点上并行挖掘,解决了单机节点无法挖掘海量数据的问题,同时提高了挖掘速度。明略DataInsight自主研发了大量并行运行在Spark之上的数据挖掘算法。这些算法覆盖了数据挖掘工作中最常用的算法种类。用户可以非常方便的在明略DataInsight中使用这些算法来创建模型。在大数据挖掘实践中,使用并行化的数据挖掘算法只是整个挖掘工作中的一部分,更多的工作集中在数据预

19、处理方面。在大数据环境下,单机处理海量数据显然是不现实的。明略DataInsight提供了多种数据预处理的并行化算法,帮助用户高效的对数据进行处理。高效的大数据挖掘落地平台明略DataInsight专注于提高企业大数据挖掘的效率。在大数据挖掘实践中,往往70%-80%的时间和精力耗费在数据探索和数据处理上面。因此,提高数据探索和数据处理的效率会大大加速整个大数据挖掘的落地速度。明略DataInsight提供了交互式可视化的数据探索工具。明略DataInsight帮助用户实时对数据进行探索,来指引其寻找更好的解决方法。同时,明略DataInsight提供了大量的图表形式供用户更加直观的感受数据,

20、寻找数据中的规律。在数据处理方面,明略DataInsight除了提供大量的并行化数据处理算法之外,还对SQL进行了良好的支持。用户可以通过SQL语句对建模的中间结果进行各种操作,这样,具有SQL技能的用户可以零学习成本的使用SQL对数据进行各种探索和处理。DataInsight主要功能模型工作流企业大数据挖掘是一项系统性的工程,其涉及到从数据整合、数据探索、数据处理、模型建立、模型评估、模型调优等一系列的过程。因此,单一的步骤是不足以表示大数据挖掘全过程。明略DataInsight中使用工作流的概念来表示整个建模过程。在明略DataInsight中,每个建模步骤都看做一个算子,每个算子接受若干

21、输入,并且产生若干输出。每个算子的输出都可以作为其他算子的输入,这样,整个建模过程就可以形成一幅有向无环图。建模过程的目的就变成了将原始的输入通过一系列算子组合得到最终的业务结果。建模过程是一个不断尝试不断探索的过程。用户从原始数据出发,经过对数据的探索和处理,应用合适的算法,最终形成业务上可用的模型。在建模的过程中,会有很多尝试性的步骤,用户可以通过在模型工作流中添加分支的方法来进行不同方法的尝试。当模型开发完毕后,用户可以从模型中生成应用,这样就可以在生产环境中使用应用来产生业务结果。应用从本质上来看依然是工作流,记录了原始数据如何一步一步的变为最终的业务结果的过程,所不同的是,应用中的工

22、作流只保留了产生业务结果的必要步骤,不再保留用户在建模时所做的尝试性的工作。可视化数据探索对数据的理解是数据挖掘过程中的重中之重。只有理解数据,才能知道如何从数据中挖掘出有价值的信息。数据探索的过程同时也是数据预处理的过程,用户在探索数据时,需要将多种数据进行关联,并且对数据进行不同形式的转换,甚至使用多种算法来对数据进行尝试性的挖掘,来探索数据的意义。在形成最终模型之前,用户需要通过大量的实验来找到一条切实可行的挖掘方法。在用户进行实验时,对实验的时效性要求非常高。用户希望能够尽快试错,排除那些不可靠的方法,快速的找到可行的方法。明略DataInsight提供了交互式数据探索工具供用户对数据

23、进行实验性的探索工作。明略DataInsight通过先进的大数据技术,缩短了数据探索的时间,帮助用户实时的对数据进行探索和实验。同时,明略DataInsight通过可视化的方法,提供了常用的数据统计和分析的图表,供用户能够直观的从图形中发掘数据背后的意义。并行化算法明略DataInsight是基于Spark架构的并行化数据挖掘平台。明略DataInsight自主研发了大量的并行化数据挖掘算法,这些算法解决了单机算法不能挖掘大数据的问题,极大的方便了用户在大数据上的数据挖掘。 此外,明略DataInsight是一款覆盖整个建模过程的产品。除了数据挖掘的算法之外,明略DataInsight还提供了

24、若干数据处理的并行化算法,同样也可以在模型工作流的算子中使用,对数据进行并行化的处理。明略DataInsight支持的并行化算法列表如下:算法名称算法类型SVM分类算法Logistic Regression分类算法Native Bayes分类算法Decision Tree分类算法Gradient Boosted Decision Tree分类算法Random Forest分类算法K近邻分类算法Lasso Regression回归算法Ridge Regression回归算法Linear Regression回归算法Gradient Boosted Regression回归算法Regression

25、 Tree回归算法DBScan聚类算法Hierachy聚类聚类算法Fuzzy聚类聚类算法K-means聚类算法PCA/KPCA特征变换LDA/KDA特征变换ARMA/ARIMA趋势分析LS-SVM趋势分析GPR(高斯过程回归)趋势分析Item based CF推荐算法User based CF推荐算法Alternating Least Squares推荐算法LDA自然语言处理Word2Vec自然语言处理FPGrowth频繁模式&关联规则BIDE频繁模式&关联规则Apriori频繁模式&关联规则相关性分析数理统计分布统计数理统计标准向量化算法数据预处理算法Hash向量化算法数据预处理算法标准归一

26、化算法数据预处理算法去均值归一化算法数据预处理算法极差归一化算法数据预处理算法类别符号平衡采样算法数据预处理算法随机采样算法数据预处理算法均匀采样算法数据预处理算法均值/方差/协方差基础数据计算模块自定义计算方法基础数据计算模块多建模语言支持明略DataInsight是一款基于Spark的并行化大数据挖掘产品。用户除了使用DataInsight中提供的算法和模型进行建模之外,还可以使用其他外部语言进行建模。目前,明略DataInsight提供Python和R供用户自定义算子。明略DataInsight中的模型可以由不同语言的元素组合而成。用户可以使用DataInsight原生的算法或者模型,也

27、可以使用通过Python或R自定义的算法和模型,这样,极大的提高了建模的灵活性。此外,由于DataInsight中提供了外部语言,用户可以直接通过这些外部语言来对数据进行探索。Python和R中都包含了大量的优秀的绘图工具,用户可以直接使用这些工具在DataInsight中进行绘图。模型应用管理明略DataInsight是一款关注企业大数据挖掘落地全过程的产品。除了传统数据挖掘软件提供的建模工具之外,明略DataInsight还对建立完成模型的后续使用进行管理,帮助用户更好的在生产环境中应用模型,以实现期望的业务目标。在企业生产实践中,模型效果是会随着时间而不断衰减的,而且存在模型失效的问题。

28、为了保持模型的效果,就必须对模型进行有效的维护。在传统数据挖掘实践中,有专门的建模团队来负责模型维护,每一次模型维护都要经历模型重部署,重上线的过程,效率十分低下。明略DataInsight中,最终应用于生产的模型称为应用。明略DataInsight通过应用更新功能使用新数据重新训练应用,使得衰减效应变缓。应用每次更新完,都会产生一个新的应用版本,这样同一应用会保留多个版本,这些版本的输入输出都保持一致,用户可以任选其中一个版本来产生最终的结果。应用更新是一种简单而有效的方法,但是当数据发生了较大的变化时,简单的更新应用已不能维持模型效果,此时,需要深入到应用细节对应用进行调整。明略DataI

29、nsight可以将应用还原为工作流,用户可以在开发环境中打开工作流,在已有的工作流之上重新建模,直到模型效果满足业务需求。模型即服务明略DataInsight作为一款企业级的大数据挖掘平台,通过Restful API向企业其他生产系统提供服务,外部系统可以通过调用Restful API实现模型的运行和更新等操作。这样,明略DataInsight可以作为企业统一的模型服务平台,为企业各个生产系统进行复杂的数据挖掘计算,提供各个生产系统所需的业务数据。例如,明略DataInsight可以通过人群画像模型对客户进行画像,将画像结果提供给企业BI系统,在企业BI系统中结合其他数据一起绘制最终的业务报表

30、。根据用户在API中指定的输入和输出,明略DataInsight中相应的应用就可以从输入中读取原始数据,进过数据挖掘的复杂计算后,将结果数据存放到用户指定的输出中,这样就完成了一次数据挖掘任务。明略DataInsight支持多种输入输出,包括基于大数据的HIVE、HBASE、HDFS等,还包括传统关系型数据库,如Oracle、Mysql等,也包括一些NoSQL数据库,如MongoDB、Redis等。明略DataInsight支持的API如下:功能API说明运行应用/application/run运行应用的一个版本。需要指明应用版本的ID,运行的输入、输出,以及用户token。系统从输入中获取数

31、据,经过计算后将输出结果存储到用户指定的输出对象中。该API返回一个任务ID,用户可以使用该ID进行后续操作更新应用/application/update更新应用,生成一个新的应用版本。用户指明需要更新的应用ID,新版本名称、输入的数据和用户Token。系统通过输入数据新生成一个应用版本。该API返回一个任务ID和一个版本ID。停止任务/task/kill用户传入任务ID来停止一个正在运行中的任务。查询状态/task/status用户传入任务ID来查询任务的状态。状态包括任务正在运行、运行成功、运行失败和已停止。通过查询任务状态来决定下一步操作。通过明略DataInsight提供的API,用户

32、可以在自己的系统中进行调用。例如,用户将一个应用加入工作流中,通过run命令运行一个应用,然后不断查询状态,直到状态变为已完成,再继续下一步工作。由于输入输出都是由用户指定,因此,用户可以很方便的在工作流中加入数据挖掘的步骤。大数据分析展示平台Discovery随着大数据时代的带来,急剧膨胀的数据规模、对细粒度数据探索的需求,以及对决策时效性的需求愈加旺盛,传统的BI方案在解决数据规模、分析的时效性、数据粒度方面越发显得困难。传统的BI方案已经很难满足当前业务需求,基于深入分析株洲所大数据分析展示平台的业务需求特点和技术需求的基础上,选择基于海量数据的商务智能解决方案,以满足业务和技术要求。平

33、台架构Discovery是基于Hadoop技术框架的大数据商业智能平台,旨在帮助用户挖掘大数据环境下的数据价值,解决传统BI工具在大数据环境下无法使用的困境。Discovery是B/S架构,基于大数据技术构建,可同时支持大数据平台和传统的RDBMS;提供文本文件、JDBC、Cube、Search等多类型的数据源支持;Discovery平台架构如下:Discovery各个部分的主要功能如下:模块组件主要功能数据源ERP/CRM支持对接客户已有系统CDH/Hortonworks支持对接其他商用发行版RDBMS支持对接常用的关系型数据库Excel/CSV支持常用的文本文件格式数据预处理MOLAP C

34、ube配置多维OLAP Cube的维度、指标、数据更新方式等Search Index配置针对非结构化数据的索引数据引擎OLAP Engine支持ROLAP、MOLAP两种OLAP分析,为上层交互提供Roll up、Drill down、Slice & Dice等支撑AD-hoc Engine针对关系型数据库提供的查询引擎,支持常见的RDBMS、Hive、Impala等Search Engine针对非结构化数据提供的搜索引擎,支持对文本、图片等非结构化数据的检索分析,同时也支持对结构化数据进行明细粒度的分析。BI ServerSecurityBI Server提供针对访问连接(Https)、身份

35、认证等安全保证的功能,确保数据安全不外泄。Administration针对Dashboard、图表、数据预处理、分享等的权限控制,同时支持细粒度的数据访问权限控制。Business logic提供针对工作流、配置等的业务流程管理。Repository管理数据库、表、Cube、索引等。交互分析引擎Report Engine通过可视化界面创建到CSV、RDBMS、Cube和Index的连接,Drag & Drop数据源中的维度和指标,选择图表展现样式,生成chart。Discovery基于D3渲染图表,可支持大部分常用的展现形式并支持自定义。Dashboard Designer将Report En

36、gine生成的图组装为Dashboard,并提供自定义样式等的接口。APIDiscovery对外提供的Dashboard接口和Report接口,方便第三方App将Dashboard和Report整合可视化将API下引擎提供的各类功能封装为基于Html5的网页,支持pc、mobile等展现和下载、分享。数据引擎Discovery的数据引擎包括OLAP、Ad-hoc和Search三部分,分别面向基于Cube的查询、即席查询和明细搜索三种业务场景,并由BI Server进行统一调度。Discovery的OLAP引擎以Discovery的多维数据库为核心,旨在对原始数据进行抽取,转换和加载,支撑Dis

37、covery的在线分析,是Discovery必不可少的一部分。Discovery的OLAP引擎同时支持ROLAP和MOLAP两种模式,并且基于Hadoop生态系统进行了针对性的优化。OLAP引擎支持使用离线Cube进行数据存储,支持Cube数据定时全量以及增量更新。 Discovery的Ad-hoc引擎基于大数据生态体系的SQL引擎构建,支持在海量数据集上进行分钟级别的即席查询。 Discovery的Search引擎支持对数据进行raw data级别的探索发现,在可观的时间延迟内,支持对原始数据集进行灵活的数据探索分析。BI ServerBI Server支持对Discovery平台内的元数据

38、、权限等进行统一授权管理。BI Server可支持行列级别的数据权限管理。交互分析模块Discovery的分析模块以Dashboard为分析的载体,每个分析中可向Dashboard内加入任意数量的组件和控件。所有分析中的操作均通过拖拽和点击完成,无需写SQL。 支持任意维度和指标的切换,可以对已有的表样字段进行切换,从而进行自由分析。任意维度和指标切换的功能保障了当查看分析的人员在查看分析时,如果针对已有的表样产生额外的分析需求或改变了已有的分析需求,不需要重新制作分析,而可以直接通过切换维度和指标实现。 可以选择数据快速创建表格或者图表以使数据可视化、添加过滤条件筛选数据,即时排序,使数据分

39、析更快捷。APIDiscovery提供灵活的数据接口,对于有一定开发能力或者已有可视化工具的客户,Discovery可以通过标准的数据接口对外输出经过处理和分析的数据,帮组用户快速的生成定制报表。平台特性基于大数据技术的优异性能Discovery是一款真正支持海量大数据的BI产品。经过测试,Discovery对于分组汇总表的计算,百亿条数据规模,汇总计算均在3s内完成。对于明细表的展示,均在1s内即可完成。数据模型建立简单Discovery支持直接连接RDBMS或者Hadoop数据仓库、ROLAP和MOLAP连接Hadoop数据仓库,通过简单的Drag & Drop即可实现数据模型的建立。开放

40、架构方便集成Discovery可以结合数据仓库使用,也可以直接连接ERP/CRM等业务系统的数据源,扩展现有系统的功能,更好的利用现有IT资产。Discovery采用开放的SOA架构,提供了丰富的API接口,能够方便地融合进其他应用系统,能方便实现与第三方系统的用户和权限整合。易于非技术人员使用传统BI的繁杂之处主要体现在两个方面:技术人员需要花费大量时间准备数据以及业务人员基于数据偶得的一些分析需求实现过程复杂。Discovery基于明略MDP产品、结合BI的需求,提供完整的ETL工具协助用户自行进行数据准备,大大降低了非IT人员使用产品的门槛。实施周期短、维护简单由于Discovery特有

41、的数据准备模块,除去原始需求沟通时间,技术人员在实施时无需花费过多的时间来进行数据处理,而Discovery特有的建模流程能够极大的减少需求多变导致的数据准备和沟通交流时间,真正做到了了实施周期短,后期也无需投入过多的人力和时间来维护系统,解决需求上的变动。交互式体验构建数据视图视图是从一个或多个实际表中获得的,用于产生视图的表叫做该视图的基表。一个视图就是行和列的集合,一般由以下组件组成:标题、轴、区、单元格和标记。提供以下几个功能模块来帮助用户构建数据视图:拖动字段用户可以通过将字段从数据窗口拖到视图中来构建数据视图。用户可将字段拖到视图中的各种活动区域,或者将字段放置在功能面板上。若要从

42、功能面板移除字段,可将该字段从面板拖出,或点击字段后的“X”标签。筛选用户可使用筛选器来缩小视图中的数据范围。通过选择特定维度成员或特定度量范围,可以定义出具体的筛选器。例如,可在显示四个不同地区产品销售额的视图上进行筛选,筛选后只显示用户关心的两个地区。排序支持计算排序和手动排序。用户可使用排序进一步完善自己的视图,并精确提取所需要的信息。采用计算排序方式排序时,出现在工作表上的每个维度都可独立于任何其他维度进行排序。采用手动排序时,可以重新安排表中维度成员的顺序,方法是拖动这些维度成员,并控制这些成员在表中的排列顺序。图表类型Discovery中的图表使用Echarts+D3组合方案实现。ECharts基于HTML5 Canvas,是一个开源的纯JavaScript图表库,有比较完备的基础图表类型,因此选择ECharts作为Discovery基础图表类型的图表库。D3是基于JavaScript技术实现的图表的函数库,故D3也常被称做D3.js。D3.js提供了大量原生的可视化效果,非帯适合根据实际可视化

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论