Oracle高级数据分析白皮书_第1页
Oracle高级数据分析白皮书_第2页
Oracle高级数据分析白皮书_第3页
Oracle高级数据分析白皮书_第4页
Oracle高级数据分析白皮书_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 Oracle 大数据分析Oracle 数据库中的高级数据分析白皮书目 录TOC o 1-2 h z u HYPERLINK l _TOC_250016 执行概要4 HYPERLINK l _TOC_250015 大数据的曙光4 HYPERLINK l _TOC_250014 合并传统数据分析与大数据分析5 HYPERLINK l _TOC_250013 大数据分析技术 一种新的方法5 HYPERLINK l _TOC_250012 大数据用例6 HYPERLINK l _TOC_250011 示例 1:机器生成的数据6 HYPERLINK l _TOC_250010 示例 2:在线预订7 H

2、YPERLINK l _TOC_250009 示例 3:多渠道营销和舆情分析7 HYPERLINK l _TOC_250008 大数据分析需求8 HYPERLINK l _TOC_250007 大数据分析工具9 HYPERLINK l _TOC_250006 使用 Hadoop 的处理和分析类型9 HYPERLINK l _TOC_250005 使用 Oracle Advanced Analytics 执行数据库中处理10 HYPERLINK l _TOC_250004 高效数据挖掘10 HYPERLINK l _TOC_250003 使用 R 进行统计分析11 HYPERLINK l _TO

3、C_250002 Hadoop 与 Oracle 数据库相链接11 HYPERLINK l _TOC_250001 Oracle 大数据平台11 HYPERLINK l _TOC_250000 总结:适用于企业的各种分析12执行概要无论是微调供应链、监视车间操作、判断消费舆情,还是其他各种大规模分析挑战,大数据正在对企业产 生极大的影响。生成的业务数据量每年都在稳步增加,越来越多的信息类型以数字格式存储。其中的一个挑战是,要学习如何处理所有这些新数据类型以及确定哪些信息可能为您的业务提供价值。这不仅仅是访问新数据源、选定的事件或事务或者博文,还要了解所感兴趣的元素的模式及其之间的关系。只会快速

4、收集大量不同类型的数据并不能创造价值。您需要分析以发现有助于您业务的洞察。这正是本文所讲述的内容。大数据不仅带来了新的数据类型和存储机制,它还带来了新的分析类型。下面我们将讨论各种分析大数据的方法,利用这些分析方法,可以从这些不断涌入的信息发现模式和关系、做出明智预测、提供行动情报以及获得业务洞察。大数据分析是一连串持续的活动,而不是一个个孤立的活动。因此,您需要一套统一的大数据分析解决方案,从获取数据和发现新洞察,到做出可重复的决策以及扩展相关信息系统以支持后续分析。许多组织通过协调使用商业组件和开源组件完成这些任务。通过为大数据分析提供一个集成的架构,可以更易于执行各种类型的活动,更易于在

5、这些组件之间移动数据。大数据的曙光当数据的数量、产生的速度或种类超出了您的 I T 系统提取、存储、分析和处理数据的能力时,这些数据就成为了大数据。许多组织拥有处理大量结构化数据的设备和专业知识,但是,随着数据量不断增加并且数据流动速度不断加快,这些组织缺乏及时“挖掘”数据和提供行动情报的能力。对传统分析而言,不只是数据量增长过快,而且,数据涌入的速度以及数据类型的多样性也需要新型的数据处理和分析解决方案。然而,大数据并不总能纳入包含列和行的工整的表中。如今出现了许多新的数据类型,其中既有结构化也有非结构化的类型,对这些数据进行处理可以产生对业务或情况的洞察。例如,对于来自 twitter 信

6、源、呼叫详情报告、网络数据、摄像机和设备传感器的数据,通常首先要对它们进行预处理,如提炼、汇总、可能还有检测基本趋势和相关性之后,才将它们存储到数据仓库中。将结果加载到仓库用于其他分析将更加经济高效。这个想法是为了“化简”数据以便能够以结构化形式存放它们。然后,这些数据就变得与您的其他数据同样有用,可以使用传统的业务智能 (BI) 工具对它们进行研究了。合并传统数据分析与大数据分析为了利用大数据,整个企业通常需要在文化上和技术上进行一系列的转变,从探索新商机到扩展调查范围,再到利用新洞察,这些转变将随着您合并传统分析与大数据分析而进行。这一过程通常始于传统企业数据和工具,会带来对从销售预测到库

7、存水平的一切事物的洞察。数据通常保存在数据仓库中,并使用基于 SQL 的业务智能 (BI) 工具进行分析。仓库中的大部分数据来自于OLTP 数据库中最初捕获的业务事务。虽然 BI 的使用大多为报告和信息板,但是,越来越多的组织正在对多维数据库执行“假设”分析,在财务计划和预测情景下尤其如此。这些计划和预测应用程序可以从大数据获益,但组织需要高级分析才能使这一目标成为现实。对于诸如统计分析、数据挖掘、预测分析及文本挖掘等更高级的数据分析,公司过去习惯于将数据移动到专用服务器进行分析。将数据导出数据仓库、在外部分析服务器中创建数据副本,然后获得洞察和预测,这一过程非常耗时。而且,这种方法需要重复的

8、数据存储环境和专门的数据分析技能。成功建立预测模型后,若要对生产数据使用该模型,要么需要进行复杂的模型重写,要么需要再次将大量数据从数据仓库移动到外部数据分析服务器。这时对数据进行“评分”,然后将结果移回数据仓库。这一移动和重用数据以生成可指导行动的信息的过程可能需要数天、数周甚至数月才能完成。虽然许多组织在借助分析来利用自己的数据方面已经非常熟练,但他们在创建分析模型以便从大数据获取真正业务价值方面仍处于早期阶段。其主要障碍在于实现对公司数据及时和直接访问的这些过程缓慢且神秘。然而,各种新技术通过在数据库自身中实现高级分析,减少来回移动大量数据的需要,正在打破 IT 和数据分析之间原先存在的

9、藩篱。与此同时,新的数据类型也正在对传统数据源和熟悉的 BI 活动进行补充。例如,网络日志文件可跟踪网站访问者的运动,这将揭示何人何时在何处访问了该网站。这种数据可揭示人们与您网站的交互情况。社交媒体有助于您了解人们想些什么或者他们对某些事情的感觉。数据可来源于网页、社交媒体网站、微博、博客条目、电子邮件交流、搜索索引、点击流、设备传感器和所有类型的多媒体文件(包括音频、视频和摄影)。这些数据不仅可以从计算机来收集,还可以从数十亿移动电话、数百亿社交媒体帖子,以及源自汽车、公用事业量表、海运集装箱、车间设备、销售点终端和许多其他源的不断增多的联网传感器来收集。这些数据大多不太密集且信息含量不高

10、,不适合直接纳入数据仓库。正如我们将看到的,其中的一些数据更适合放在 Hadoop 分布式文件系统 (HDFS) 或非关系数据库(通常称为 NoSQL 数据库) 中。许多情况下,这是大数据分析的起点。大数据分析技术 一种新的方法当您使用 SQL 查询来查找财务数字或使用 OLAP 工具来生成销售预测时,通常知道自己拥有哪些类型的数据以及这些数据会告诉您什么。收入、地理位置和时间所有这些都以可预测的方式相互关联。您不一定知道答案是什么,但您知道数据集的各种元素之间是如何相互关联的。BI 用户通常从结构化数据库运行标准报告,结构化数据库已经过精心建模可利用这些关系。而大数据分析需要从大量各种数据中

11、提取出有用的含义,这些数据的原始形式缺少一种可定义每个元素在 彼此的上下文中所具有的含义的数据模型。在使用这种新式的分析时,您应考虑几个新的问题:发现 许多情况下,您并不确切了解自己拥有什么样的数据以及不同的数据集之间存在什么样的关系。您必须通过探索和发现过程弄明白这些东西。迭代 因为并不总能提前知晓实际关系,因此,在寻找所寻求的答案时,往往需要通过迭代过程才能获得洞察。迭代的本质是,有时它会将您引向通向死胡同的路径。没关系,实验正是迭代过程的组成部分。许多分析师和行业专家建议,先从明确的小项目开始,从每次迭代中吸取经验,逐渐转到下一个想法或调查领域。灵活的容量 因为大数据分析固有的迭代性质,

12、应准备好花更多时间和利用更多资源来解决问题。挖掘和预测 大数据分析不是简单明了的。您并不总能了解各种数据元素之间的相互关系。当您挖掘数据来发现模式和关系时,预测分析可以提供您所寻求的洞察。决策管理 考虑事务量和速度。如果您正在使用大数据分析来推动多个运营决策(如个性化网站或向呼叫中心客服人员提示消费者的习惯和活动),那么您需要考虑如何自动化执行和优化所有这些操作的实施。例如,您可能根本不知道社交数据是否可指明销售趋势。存在的挑战是,需要弄清楚哪些数据元素与哪些其他数据元素相关,以及存在多大程度的相关性。发现的过程不仅需要探索数据以了解如何使用数据,而且还需要确定这些数据与传统企业数据的关系。新

13、式调查不仅需要了解发生了什么,还需要知道发生这些情况的原因。例如,许多公司使用的一个关键指标是客户流失。对客户流失做出量化相当容易。但是,为何会出现客户流失?对呼叫数据记录、客户支持询问、社交媒体的评论和其他客户反馈进行研究,可以帮助解释客户流失的原因。类似的方法可用于其他类型的数据及用在其他情况中。某特定商店的销售额为何下降?为何某些患者生存时间比其他患者长?秘诀就是要找到正确的数据、发现隐藏的关系并正确分析数据。大数据用例本节给出了几个用例,说明不同业务领域中大数据分析的潜能。示例 1:机器生成的数据随着“物联网”每年的稳步增长,研究人员预测,由机器生成的数据量有一天将会超过人类所产生的数

14、据量。Machina Research(英国的一家研究公司)认为,到 2020 年全球的“智能”连接设备将会从现在的 13 亿增加到 125 亿 不包括智能电话、PC 和平板电脑。设备传感器遍布于重型机械、汽车、装配线、电网、计算机设备和许多其他领域。而这仅仅只是开始,因为越来越多设备的制造都将包含有监视自身运行及记录故障诊断与分析结果的传感器。例如,制造企业通常将传感器嵌入在自己的机器中,用于监视使用模式、预测维护问题,以及提高建 造质量。甚至像自行车、洗衣机和恒温器这样的消费设备也成为这一机器对机器 (M2M) 通信现象的一部分。对这些数据流进行研究,可以使制造商们改进自己的产品以及制定更

15、准确的服务周期。电子传感器不仅监视机械和大气状况,而且还监视人体的生物特征。在医疗保健行业,存在一个巨大商机,其不仅可改善患者治疗效果,而且还可以监视医疗诊断、治疗及索赔中存在的趋势,以便做出更好的临床和管理决策。一旦能以聚合形式分析数据,该商机会变得更加引人注目。如果有一千个传感器显示设备故障模式,或者有一千个心脏监护仪显示生物特征水平与不良反应间的相关性,那么我们就可以开始将趋势转化为预测,并最终使用大数据来采取纠正措施或先发制人的行动。同样,发现模式是关键。例如,保险公司现在请求司机们自愿提供跟踪其运动、地点以及不同时间所处位置的数据,这样保险公司就可以为每个客户开发更好的险种。客户通过

16、表明自己遵守限速、在事故低发地段行驶,以及避开高犯罪区域,可以有资格获得低成本的保险计划。示例 2:在线预订如果您在运营一个在线旅游预订网站,您可以利用自己的数据做很多有趣的事情来更好地了解您的用户。例如,当消费者预订航空旅行时,他们订机票的时间是否与其花钱多少有关?寻求低价票的度假旅客也许在晚上登录,而公司旅客则可能在清晨预定航班。与每种旅行方式相关的差异是什么,您如何发现这些使用模式?您可以先整理日志文件以确定人们何时开始、结束或完成预订。您也可以查看几个相关因素。例如,他们按价格或旅行时间排序了吗?他们对航空公司有偏好吗?每种类型的买家是喜欢白天的航班还是晚上的航班?他们考虑了多少个不同

17、航班选择?在完成预订前他们访问了您的网站几次,他们花了多长时间考虑购买?要回答这些问题,就需要比较和分析大量不断生成的 web 日志数据。大多数这类信息在孤立存在时并不十分重要,但是,当您以聚合方式对其分析时,就能开始看到模式及辨别重要趋势了。通过使用 HDFS 来获取原始数据及使用 MapReduce 来处理这些数据,您可以将各种变量相关联,如登录时间、鼠标点击次数、每个会话的时长,以及购买之前处于哪个队列或页面。然后您可以将这个答案集添加到您的数据仓库供其他分析使用。示例 3:多渠道营销和舆情分析今天的零售商必须面对大量重叠的接触点,其中包括社交、数字、直接接触点、实体店、移动和呼叫中心。

18、市场领先者通过分析交易历史记录和 web 行为,并且结合来自外部环境(如社交媒体、人口统计和财务)的数据来获得洞察。有远见的公司将社交媒体信源、客户人口统计信息、心理数据(价值观、态度、兴趣或生活方式)、购买数据和网络使用数据合并在一起,描绘出每个客户的行为和好恶的一幅全景视图。利用这些信息,可帮助零售商了解作为“个人市场”的每个潜在买家,从而为个人客户提供个性化量身定制的产品。为实现这种程度的个性化,零售商必须从有关客户、消费历史、库存、价格、营销活动及其他促销的大量数据中找出隐藏的答案。通过分析这些数据,零售商们可以更好地了解激发各种客户群和各种渠道中所希望行为的因素。数据还揭示了影响顾客

19、忠诚度和保留率的各种因素,如易用性、物有所值以及客户奖励计划的影响。对零售商而言,客户流失是一个大问题,而合适的分析解决方案能帮助他们发现客户流失背后的原因。通过检查已流失客户的有关记录,您可以发现模式,然后在当前客户中搜索那些同样模式的早期迹象。可以捕获、聚合和分析客户交互,并将其与其他类似净推介值的 KPI 相关联,从而增强对客户行为的洞察。例如,对 Twitter 信源和 Facebook 帖子进行分析,可以揭示特定区域或特定客户群内的服务质量问题。尽管传统的客户细分战略也按渠道特定的购买周期对客户进行了分组,但是,人们越来越多地通过公司是否能很好地管理跨所有渠道(包括移动、网络、呼叫中

20、心、IVR、经销商和零售店)的交互来界定其价值。舆情数据可以告诉您具体某个人是否喜欢您的公司和产品。将这些信息与其他电子商务数据相结合后,您还可以辨别出这些人是否是大消费客户,是否是常客,或者还不是客户。您还可以了解这些人对您客户数据库中的其他人是否产生影响。当您结合所有这些数据进行适当的分析后,就可以揭示出隐藏的关系,若非如此,您将无法了解这些关系。您可以确定行为模式,甚至可以预测出其他人在类似情况下可能会做什么。大数据分析需求在上面“大数据分析技术”一节中,我们讨论了您可以用来寻找大数据中蕴藏的意义和隐藏的关系的一些方法。本节我们将介绍以有利方式执行这些调查的三个重要需求:最大限度地减少数

21、据移动利用现有技能关注数据安全最大限度减少数据移动就是节约计算资源。在传统分析案例中,数据被移入计算机进行处理,然后发送到下一个目的地。例如,可能会从电子商务系统中提取生产数据,将其转换为关系数据类型,然后加载到结构化的运营数据存储中供生成报告。但是,随着数据量的增长,这种类型的 ETL 架构变得越来越低效。有太多的数据需要来回移动。因此最好在同一个位置存储和处理数据。随着新数据和新数据源的出现,人们开始需要掌握新的技能。有时,现有的技能储备将决定可以和应该在何处实施分析。缺乏必要技能时,培训、招聘和新工具使用多管齐下将会解决这一问题。在大多数组织中,能使用 SQL 分析数据的人比能使用 Ma

22、pReduce 分析数据的人多,因此,能够同时支持这两种处理就显得尤为重要。数据安全对许多企业应用程序都至关重要。数据仓库用户不仅习惯于仔细定义的指标及维度和属性,而且还习惯于一组可靠的管理策略和安全控制。而对非结构化数据源和开源分析工具,往往缺乏这些严格的过程。要注意每个分析项目的安全和数据治理需求,并确保您正在使用的工具可以满足这些需求。大数据分析工具有五种分析大数据并生成洞察的主要方法:发现工具 适用于整个信息生命周期,可快速、直观地探索和分析来自结构化数据源和非结构化数据源的任意组合的信息。这些工具允许与传统的 BI 源系统一起进行分析。因为不需要前期建模,因此用户可以迅速获得新洞察,

23、得出有意义的结论并做出明智的决策。BI 工具 对报告、分析和绩效管理都很重要,主要使用来自数据仓库和生产信息系统的事务数据。BI 工具在一个集成的企业级平台上提供全面的业务智能和绩效管理功能,包括企业报表、信息板、即席分析、记分卡和假设场景分析。数据库中分析 包括发现数据中存在的模式和关系的各种技术。因为这些技术直接在数据库内应用, 因此消除了与其他分析服务器之间的数据移动,这加速了信息周期并降低了总体拥有成本。Hadoop 用于对数据进行预处理以识别宏观趋势或找到有价值的信息,例如,超出范围的值。它支持企业使用廉价的商用服务器从新数据获得潜在价值。组织主要将 Hadoop 用作高级分析形式之

24、前的处理手段。决策管理 包括基于当前上下文采取明智行动的预测建模、业务规则和自我学习。这种分析类型支持跨多渠道的个别建议,可以使每个客户交互的价值最大化。可以集成 Oracle Advanced Analytics 评分以实施复杂的预测分析模型并创建实时的决策流程。所有这些方法在揭示隐藏关系的过程中都起着一定的作用。像 Oracle Endeca Information Discovery 这样的传统数据发现工具、像 Oracle Exalytics 这样的 BI 工具以及像 Oracle Real Time Decisions 这样的决策管理工具,将在其他白皮书中给予全面介绍。在本文中,我们

25、主要关注集成使用 Hadoop 和数据库中分析来处理和分析广阔的新数据领域。使用 Hadoop 的处理和分析类型当您需要就地过滤、排序或预处理大量新数据并提取数据以生成理论上包含更多“情报”的密度更高的数据时,Hadoop 是一个普遍的选择。预处理包括过滤新数据源以使其适用于数据仓库中的其他分析。例如,演唱会主办方可能希望对 twitter 信源进行分析来确定观众对与 Lady Gaga 新巡演有关的舞台布景、节目单、服饰和热身乐队喜欢的程度。他们可能首先使用像“#Gaga”、“#concert”、“#Palladium”等# 标记来收集与该艺术家相关的微博。通过解析文本并将其与英语字典中的褒

26、义和贬义词语相比较而确定每条微博的舆情。与 MapReduce 结合使用,Hadoop 可以在多个服务器上并行处理大量数据,然后把数据重新组合成一个统一的答案集,或将其与他类型的企业数据相整合。可以将生成的数据集导入数据仓库供数据挖掘和预测分析使用。对粉丝和观众的社交媒体进行分析,可以揭示在线消费者舆情的转变速度。体育运动队、当选官员和其他公众人物可以利用类似的战略来识别公众态度的细微差别,并做出相应的回应。任何拥有客户数据库的商业组织都可以进行进一步的分析,确定积极和消极态度对总销量、支持询问和其他关键指标有怎样的影响。使用 Hadoop 对社交媒体数据进行预处理通常是以下活动的第一步:预测

27、客户行为、预测交叉销售/追加销售商机、提高市场营销活动响应率、防止客户流失以及分析购物车以发现关联、模式和关系。Hadoop 也是一个过滤和预处理博客文件中的数据的极好工具。公司数据仓库在大数据时代不会过时。事实上,随着您发现新的分析类型以及经预处理后可融入您现有决策支持框架的新数据源,数据仓库变得更加重要。一旦对这些数据进行了分类、汇总和“会话化”(将其划分为个人客户对话),您就做好了将这些汇总加载到数据仓库供分析使用的准备。您可能决定将会话化的信息与 ERP 系统中的客户购买记录相联接,然后分析结果,从而更清楚地知道何种 web 操作带来了何种购买类型。使用 Oracle Advanced

28、 Analytics 执行数据库中处理大多数 Oracle 客户都非常习惯于使用 SQL 语言对结构化数据进行查询、报告和分析。这是事实上的分析标准,是大多数 BI 工具的基础技术。R 是人们在进行统计分析时喜欢使用的开源编程语言。分析师、数据科学家、研究人员和学者普遍使用 R 语言,因而 R 程序员群体越来越庞大。数据一旦加载到 Oracle 数据库,用户就可以利用 Oracle Advanced Analytics (OAA) 来发现隐藏在数据中的关系。Oracle Advanced Analytics 是 Oracle Database 企业版的一个选件,它兼具强大的数据库中算法和开源

29、R 算法,用户可以使用 SQL 和 R 语言来访问这些算法。该选件将高性能数据挖掘功能与开源 R 语言相结合,以便支持预测分析、数据挖掘、文本挖掘、统计分析、高级数值计算和交互式图形 所有这些都在数据库内部进行。Oracle Advanced Analytics 在一个强大的数据库中架构上提供全部核心分析功能和语言。这些分析功能包括:在数据库中实现的数据挖掘算法、用于基本统计技术的原生 SQL 函数,以及与开源 R 的集成, 这一集成可用于统计编程及利用一系列更广泛的统计技术。这个强大的分析环境最大限度减少了数据移动并确保了固有的安全性、可伸缩性和性能,从而为Oracle 数据库客户提供了应对

30、大数据项目的各种各样的功能。它包括数据挖掘工具,您可以使用这些工具创建复杂的模型并将它们部署在非常大的数据集上。您可以在 BI 应用程序中利用这些预测模型的分析结果。例如,您可以使用回归模型基于购买行为和人口统计数据来预测客户年龄。您还可以构建和应用能帮助您瞄准最佳客户、建立详细客户档案、发现和防止欺诈以及解决许多其他分析难题的预测模型。高效数据挖掘利用 OAA 中的数据挖掘工具,数据分析师可以直接操作数据库内的数据、以图形方式研究数据、构建和评估多个数据挖掘模型,以及在整个企业中部署预测和洞察。OAA 包括 15 个数据挖掘算法,分别用于分类、聚类、购物篮分析、欺诈检测和文本挖掘,可应用这些

31、算法来解决各种数据驱动的问题。它还包括十几个您可用来构建和部署预测应用程序的算法,这些应用程序可自动挖掘星型模式数据以提供实时结果和预测。由于数据、模型和结果都保存在 Oracle 数据库中,消除了数据移动,所以信息延迟降至最低,同时维护了安全性。使用标准 SQL 命令,您可以访问数据库中的高性能算法来挖掘表、视图、星型模式以及事务和非结构化数据。能够访问 Oracle 数据库中存储数据的任何人,都可以使用标准报表和BI 工具来访问 OAA 结果、预测、建议和发现。使用 R 进行统计分析Oracle Advanced Analytics 的设计初衷就是支持统计人员在非常大的数据集上使用 R。分

32、析模型可以使用R 来编写构建。Oracle 数据库中的相关表和视图可以显示为 R 对象。因而无需编写 SQL 语句。分析师可以编写 R 代码来操作数据库中的数据。通过在数据库中原地运行 R 程序,不再需要来回移动数据。这种集成式架构可以确保卓越的安全性和性能,因为您可以运用大规模可扩展的硬件资源处理复杂的问题。OAA 也支持现有 R 脚本和第三方程序包。所有现有的 R 开发技能、工具和脚本都可以在 OAA 中透明地执行,并且可以根据 Oracle Database11g 中存储的数据进行伸缩。R、Oracle 数据库和 Hadoop 之间的紧密集成,让分析师能够编写一个可以在以下三个不同环境中

33、运行的R 脚本:运行开源 R 的笔记本电脑、和 Oracle Big Data Connectors 一起运行的 Hadoop,以及 Oracle 数据库。如下节所述,很容易将分析结果链接到诸如 Oracle Business Intelligence 和 Oracle Exalytics 等业务分析工具。Hadoop 与 Oracle 数据库相链接有两个不同的选件都可用来将 Hadoop 中的数据和中间结果与您的 Oracle 数据仓库相链接。根据您的使用场合,您可能希望将 Hadoop 数据加载到数据仓库中,也可能希望将它留在原地仅供使用 SQL 对其进行查询。Oracle Loader

34、for Hadoop 提供了一种将 HDFS 数据加载到 Oracle 数据仓库的简单方法。它使用MapReduce 创建优化数据集以便可以高效地将这些数据加载到 Oracle 数据库。与其他 Hadoop 加载器不同, 它生成 Oracle 内部格式, 因而能以更少的系统资源更快地加载数据。数据加载后,就可以使用基于 SQL 的传统业务智能工具访问它们。Oracle SQL Connector for HDFS 是一种高速连接器,用于直接从 Oracle 数据库访问 HDFS 数据,在HDFS 与数据仓库环境之间架起了桥梁。这样可以通过 SQL 查询 HDFS 中存储的数据,将这些数据与Oracle 数据库中存储的数据相联接,或将它们加载到 Oracle 数据库中。Oracle 大数据平台Oracle 有三个解决大数据不同部分问题的工程化系统。每个平台都包括卓越数据处理所需的全部必要硬件和软件。所有组件都预先进行了集成,随时可以部署和运行。Ora

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论