




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
DataWarehouse
Unit
4TextBContents
NewWords
Abbreviations
Phrases参考译文NewWordsNewWordsPhrasesAbbreviationsListeningtoTextA数据仓库1.什么是数据仓库?数据仓库是一种系统,它将不同来源的数据聚合到单一的、集中的、一致的数据存储中,以支持业务分析、数据挖掘、人工智能(AI)和机器学习。数据仓库使组织能够以标准数据库无法实现的方式对大量历史数据(数拍字节)运行强大的分析。数据仓库成为商业智能(BI)解决方案的一部分,已经有三十多年的历史了,但是近年来有了巨大的发展。传统上,数据仓库部署在本地——通常在大型主机上,其功能主要集中在从其他来源提取数据、清理和准备数据以及在关系存储中加载和维护数据。最近,数据仓库可能托管在专用设备上或云中,并且大多数数据仓库都已经添加了分析功能以及数据可视化和演示工具。2.数据仓库的好处数据仓库为以下各项提供了基础:•更一致、更高质量的数据:数据仓库将来自多个不同来源的数据汇集在一起,然后对其进行清理、消除重复并对其进行标准化以创建单一可信数据源。参考译文•更快、无限的洞察力:不同的数据源限制了可用于支持任何给定决策的数据。数据仓库让使用公司所有数据来支持每个决策变得更加容易。•尖端工具支持更明智的决策:数据仓库支持大规模的商业智能功能,例如数据挖掘(发现数据中看不见的模式和关系)、人工智能和机器学习——数据专业人员和业务领导者可以使用的工具来获得可靠的证据以做出更明智的决策,其范围覆盖从企业流程到财务管理和库存管理的每个领域。•获得并增强竞争优势:结合以上所有优势,可以帮助组织更快地从数据中找到更多的机会,优于来自分散存储的数据。参考译文参考译文3.数据仓库结构一般来说,数据仓库具有三层结构:•提取层使用称为ETL(提取、转换和加载)的过程或称为ELT(提取、加载和转换)的过程来收集、清理和规范化/转换来自多个源的数据。•数据存储层通常是一个关系数据存储库,但是具有支持分析处理的模式。•分析层(或客户层)可以包括从标准查询工具到分析、数据挖掘、人工智能或机器学习功能以及演示可视化工具的所有内容。ETL和ELT是从原始来源提取数据并将其集成到数据仓库中的方法。两者之间的区别在于数据转换的位置。ETL从各种数据源系统中提取数据,使用中间转换引擎对其进行转换,然后将其加载到数据仓库系统中。因为ETL在将数据写入仓库之前先进行数据转换,所以它是加载较小数据量和本地数据仓库解决方案的更好选择。ELT从一个或多个远程源提取数据,然后将其加载到目标数据仓库中,而无需进行任何格式转换。ELT流程中的数据转换发生在目标数据库中。因此,ELT可以更快地将数据移至仓库,从而使其成为较大数据量或基于云的数据仓库解决方案的更好选择。此外,由于ELT不会转换传输中的数据,因此它是唯一适合加载数据湖的方法。4.数据仓库与数据库、数据湖和数据集市在数据仓库、数据库、数据湖和数据集市之间经常会产生混淆。虽然术语相似,但存在重要区别。4.1数据仓库与数据湖数据仓库将来自多个源的数据收集到一个中央存储库中,该存储库使用为数据分析设计的预定义模式进行了结构化。数据湖基本上是没有预定义模式的数据仓库。因此,与数据仓库相比,它支持更多类型的分析。数据湖通常建立在像ApacheHadoop这样的大数据平台之上。4.2数据仓库与数据集市数据集市是数据仓库的子集,其中包含针对特定业务线或部门的数据。因为它们包含较小的数据子集,所以数据集市使部门或业务线能够比使用更广泛的数据仓库数据集时更快地发现更侧重的见解。
参考译文4.3数据仓库与数据库建立数据库主要是为了快速查询和事务处理,而不是分析。数据库通常用作特定应用程序的重点数据存储,而数据仓库则存储组织中任意数量(甚至所有)应用程序的数据。同样重要的是:数据库从单个(通常是当前)时间点捕获并存储数据,而数据仓库包含预测分析、机器学习和其他高级分析所需的当前和历史数据。4.4云数据仓库云数据仓库是专门为在云中运行而构建的数据仓库,它作为托管服务提供给客户。在过去的五到七年中,随着越来越多的公司使用云服务并寻求减少其内部数据中心的占用空间,基于云的数据仓库变得越来越流行。使用云数据仓库,物理数据仓库基础架构由云公司管理,这意味着客户不必在硬件或软件上进行前期投资,也不必管理或维护数据仓库解决方案。参考译文参考译文5.数据仓库软件(本地/许可证)企业可以购买数据仓库许可证,然后在自己的本地基础结构上部署数据仓库。尽管这通常比云数据仓库服务贵,但对于希望对数据进行更多控制或需要遵守严格的安全性或数据隐私标准或法规的政府实体、金融机构或其他组织,这可能是一个更好的选择。6.数据仓库设备数据仓库设备是硬件和软件(CPU、存储、操作系统和数据仓
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年幼儿园上年工作方案
- 高三下学期《好心态、好状态》主题班会课件
- 2025年电子视力测量仪项目可行性研究报告
- 阅读区自制图书教案
- 2025年玻璃卡项目可行性研究报告
- 2025年特氟龙加热器项目可行性研究报告
- 2025年燃煤添加剂项目可行性研究报告
- 上海财大北郊高级中学2025年高三下学期期末复习检测试题(一模)数学试题含解析
- 长江艺术工程职业学院《体育舞蹈理论与实践Ⅰ》2023-2024学年第一学期期末试卷
- 郑州食品工程职业学院《私教实践指导》2023-2024学年第二学期期末试卷
- 东湖高新区2023-2024学年下学期期中七年级数学试题(含答案)
- 劳务派遣劳务外包项目方案投标文件(技术方案)
- 定额〔2025〕1号文-关于发布2018版电力建设工程概预算定额2024年度价格水平调整的通知
- 一种基于STM32的智能门锁系统的设计-毕业论文
- 《种子法》知识考试题库(含答案)
- T∕CAAA 030-2020 澳洲白绵羊种羊
- 微波-PATHLOSS软件的应用-入门指导
- 蓝牙音响成品检验规范
- 材料5:个人征信系统机构接入和接口验收工作流程
- 项目选址比选方案分析参考范本
- 初三化学酸碱盐的鉴别
评论
0/150
提交评论