




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
计算机专业英语(第三版)BigData
Unit
10Contents
NewWords
Abbreviations
PhrasesNotes参考译文NewWordsNewWordsNewWordsNewWordsPhrasesPhrasesAbbreviationsNotesNotesNotesNotesNotesListeningtoTextA大数据1.定义大数据是用来描述公司产生的浩繁的非结构化和半结构化数据的一个通用术语——要把这些数据加载到关系型数据库来分析会耗费大量时间和大量资金。虽然大数据并没有涉及任何具体数量,通常在谈论拍字节和艾字节时使用该术语。观察大数据的一个主要目标是发现可重复的业务模式。人们普遍承认,非结构化数据,其中大部分在文本文件中,占一个组织中至少有80%的数据。如果不加管理,企业每一年产生的全部非结构化数据会花费巨额的存储费用。如果审计或诉讼时不能找到信息,不加管理的非结构化数据也可能会带来法律责任。大数据分析往往是与云计算相关,因为实时分析大型数据集需要像MapReduce这样的一个框架来将任务分布到数十台、几百台甚至上千台的计算机上。参考译文2.大数据分析大数据分析研究大量的多种类型的数据,以揭示隐藏的模式、未知的相互关系及其他有用的信息。这些信息可以提供有竞争力的优势以超过对手组织,产生商业利益,例如更有效地营销和增加收入。大数据分析的主要目标是,让数据科学家和其他用户分析数量巨大的业务数据以及可能没有被传统的商业智能(BI)程序利用的其它数据源来帮助企业做出更好的业务决策。这些其他的数据源可能包括Web服务器日志和互联网点击流数据、社交媒体活动报告、移动电话的呼叫详细记录和传感器捕获的信息。有些人专门对这类的非结构化数据进行大数据分析,而像Gartner公司和Forrester研究公司这样的咨询公司也把业务数据和其他结构化数据当作有效的大数据形式。参考译文可以用软件工具进行大数据分析。这些工具通常作为高级分析学科的一部分,如预测分析和数据挖掘。但用于大数据分析的非结构化数据源可能不适合于传统的数据仓库。此外,传统的数据仓库可能无法满足由大数据所带来的需求。因此,一类新的大数据技术已经出现并正在很多大数据分析环境中使用。与大数据分析相关的技术包括NoSQL数据库、Hadoop和MapReduce。这些技术构成了支持集群系统中大数据集的处理开源软件框架的核心。组织在大数据分析项目上可能遇到的困难包括缺乏内部的分析技能和聘用经验丰富分析专家的高额成本,虽然厂商开始提供这些技术之间的软件接口,但把Hadoop系统与数据仓库加以整合也颇具挑战性。参考译文参考译文3.大数据管理大数据管理是对大量结构化和非结构化数据的组织、管理和治理。大数据管理的目标是确保高水平的数据质量、商业智能的可用性和大数据分析应用。企业、政府机构和其他组织采用大数据管理策略,以帮助他们与快速增长的数据池相抗衡,通常涉及千兆字节级甚至拍字节级的用不同文件格式保存的信息。有效的大数据管理帮助企业从各种非结构化和半结构化的数据集找到有价值的信息,包括通话详细记录、系统日志和社交媒体网站。大多数大数据环境超出了关系型数据库和传统的数据仓库平台,融入了适应处理和存储非传统的数据的技术。日益注重收集和分析大数据正在产生新一些平台,这些平台把传统数据仓库与用逻辑数据仓库构建的大数据系统相结合。作为这一进程的一部分,必须决定哪些数据合格、哪些数据可以处理、哪些数据应该被保存和分析,以改善目前的业务流程或提供业务的竞争优势。这个过程需要细致的数据分类,以便最终能够对较小的数据集进行快速而高效的分析。4.大数据即服务(BDaaS)大数据即服务(BDaaS)是由外部提供商提供的统计分析工具或信息,以帮助企业了解并使用从大量信息集中获得的数据以获得竞争优势。鉴于定期产生的非结构化数据的数量巨大,BDaaS利用外部供应商的预测分析技能来管理和评估大型数据集以释放组织资源,而不是雇用内部员工来实现这类功能。它可以通过采用数据处理软件或与数据科学家签订服务合同的形式来实现。BDaaS是管理服务的一种形式,类似于软件即服务或基础架构即服务。它往往依赖于云存储来保持这些信息拥有者和使用信息的提供者进行连续的数据访问。参考译文5.非结构化数据非结构化数据是描述任何不在数据库中的企业信息的通用标签。非结构化数据可以是文本的或非文本的。文本非结构化数据产生于电子邮件、PowerPoint演示文稿、Word文档、协作软件和即时消息这样的媒体。非文本非结构化数据产生于JPEG图像、MP3音频文件和Flash视频文件这样的媒体。非结构化数据中包含的信息并不总是很容易找到的。它要求可以扫描电子和硬拷贝文档中以及其它媒体中的数据,以便可以在特定上下文中按照特定的词语搜索得到相关概念。这就是所谓的语义搜索,也被称为企业搜索。在面向客户的业务中,可以对包含在非结构化数据中的信息进行分析,以改善客户关系管理和关系营销。随着如Twitter和Facebook这类社交媒体的应用成为主流,预期非结构化数据的增长将远远超过结构化数据的增长。
参考译文6.数据挖掘通常,数据挖掘(有时称为数据或知识发现)是从不同角度分析数据,并总结成有用信息的过程——此类信息可以增加收入、降低成本或两者兼而有之。数据挖掘软件是众多用于分析数据的分析工具之一。它允许用户从许多不同的层面或角度分析数据,对数据进行分类并总结出确定的关系。从技术上来说,数据挖掘是从几十个大型关系数据库中寻找关系或模式的过程。数据挖掘的范围包括:关联分析——找出一个事件与另一个事件关联的模式序列或路径分析——寻找一个事件导致另一个事件的模式分类——寻找新的模式(可能会导致数据的组织方式的改变,但没关系)聚类——在文档群中寻找以前不知道的事实并视觉化呈现预测——找出数据中可以合理预测未来的模式(数据挖掘这个区域被称为预测性分析。)数据挖掘技术被用在许多研究领域,包括数学、控制论、遗传学和营销。Web挖掘是在客户关系管理(CRM)中使用的一种数据挖掘,优势在于从网站的大量信息中寻出用户的行为模式。参考译文7.数据仓库数据仓库是一个企业的中央存储库,该库中包括了企业各个业务系统收集的全部或重要数据。该术语由W.H.Inmon提出。IBM公司有时使用术语“信息仓库”。通常情况下,数据仓库放在一个企业的主机服务器上。来自不同的联机事务处理(OLTP)应用程序和其他数据源的数据被选择性地提取并组织到数据仓库数据库中,供分析应用程序和用户查询之用。数据仓库强调采集不
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 单位采购供货合同范例
- 单包木工合同范本
- 加盟产生费用合同范本
- 物探工题库(含参考答案)
- 汽车电工电子应用试题
- 个人工作任务总结
- 厨具清洗维修合同范例
- 充电桩物业合同范本
- 机械制造技术考试模拟题(含答案)
- 一年级语文画教案
- 新教科版四年级下册科学全册重点题型练习课件(含答案)
- 建设工程概算预算结算管理规定
- 五星传变 廖金精
- 亮化工程投标书
- 公园栈道栈桥施工方案
- 不规则抗体筛查与鉴定
- 中国银行海尔多联机方案书
- 涂布机初级操作技术与维修培训课件
- GB/T 8417-2003灯光信号颜色
- GB/T 7984-2001输送带具有橡胶或塑料覆盖层的普通用途织物芯输送带
- GB/T 7631.10-2013润滑剂、工业用油和有关产品(L类)的分类第10部分:T组(涡轮机)
评论
0/150
提交评论