




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、大数据导论BIG DATATechnology第8章 大数据与云计算 本章主要内容如下。(1)云计算的概念与特点。(2)云计算的分类。(3)云计算的体系架构。(4)大数据与云计算未来的发展方向和趋势。(5)大数据与云计算在生产生活中的应用。8.1 什么是云计算8.1.1 云计算的概念与特点1云计算含义(1)Google公司的定义:云计算是拥有开放标准和基于互联网服务的,可以提供安全、快捷和便利的数据存储和网络计算服务的系统。(2)美国国家标准与技术研究院(NIST)的定义:云计算是一种应用资源模式,它可以根据需要用一种很简单的方法通过网络访问已配置的计算资源。这些资源由服务提供商以最小的代价或
2、专业的运作快速地配置和发布。(3)维基(Wiki)的定义:云计算是一种通过互联网以服务的方式提供动态可伸缩的虚拟化的资源的计算模式。 实质上,云计算是分布式计算(Distributed Computing)、并行计算(Parallel Computing)、效用计算(Utility Computing)、网络存储(Network Storage Technologies)、虚拟化(Virtualization)、负载均衡(Load Balance)等传统计算和网络技术融合而成的产物。2云计算特点(1)超大规模。(2)虚拟化。(3)高可靠性。(4)通用性。(5)高可扩展性。(6)按需服务。(7)
3、极其廉价。构建“云”的节点廉价。“云”由极其廉价的节点构成,而不采用复杂而昂贵的节点进行构建。管理成本廉价。“云”的自动化集中式管理使大量企业无须负担日益高昂的数据中心管理成本。资源通用性强。“云”的强通用性使资源的利用率有大幅度提升。 云计算的缺点:云计算既提供计算服务,又提供数据存储服务,潜在的危险性较大。因此,数据的安全保障必须加强。 8.1.2 云计算的分类1公有云 公有云(Public Cloud)通常指云的提供商向普通用户提供使用权的云。公有云一般可通过Internet使用,可在当今整个开放的公有网络中使用。一般来说,公有云可免费使用或使用费用低廉。 公有云的特点如下。(1)数据安
4、全性相对较差。(2)价格相对便宜。云计算对用户端的设备要求较低。(3)数据共享方便。云计算可以轻松实现不同设备间的数据与应用共享。(4)多方式使用网络。云计算为用户使用网络提供了多种可能方式。2私有云 私有云(Private Clouds)是为某一个特定客户单独使用而构建的,因而向该用户提供的对数据、安全及服务质量等的控制都是极为有效的,该用户几乎可以完全控制在此私有云上部署的应用程序。私有云可被部署在企业数据中心的防火墙内,也可以被部署在一个安全的主机托管场所。 私有云的特点如下。(1)数据相对安全。(2)服务质量稳定。(3)硬件受限制。(4)不影响私有云用户的现有IT管理的流程。3混合云
5、混合云(Hybrid Cloud)融合了公有云和私有云,是近年来云计算的主要模式和发展方向。私有云主要面向企业用户,出于安全考虑,企业更愿意将数据存放在私有云中,但是同时又希望可以获得公有云的计算资源,在这种情况,混合云越来越多地被采用,它对公有云和私有云进行融合和匹配,以获得更佳的效果,这种个性化的解决方案,达到了既省钱又安全的目的。8.1.3 云计算与分布式计算的区别 分布式计算是一种把需要进行大量计算的整体数据分解为若干个小块数据,由多台计算机分别计算各个小块数据,然后将各个小块数据的计算结果统一合并,得到整体数据结论的计算方式。 分布式中的计算节点的构建,一般是为完成某一个特定任务的需
6、要而建立的,因此其节点具有较强的针对性,即通用性较差;云计算一般来说都是为通用应用而设计的,通用性更强。分布式计算作为一种面向特殊应用的解决方案,仍将继续在某些特别领域存在,而云计算则会深入地影响整个IT行业乃至人类社会的生产、生活。 云计算是一种“生产者-消费者”模型,用户通过互联网获取云计算系统提供的各种服务。分布式系统是一种“资源共享”模型,资源提供者亦可成为资源消费者。 云计算采用集群来存储和管理数据资源,运行的任务以数据为中心,而分布式计算则以计算为中心。 分布式系统将数据和计算资源虚拟化,而云计算则进一步将硬件资源虚拟化。 分布式系统内各节点采用统一的操作系统,而云计算在各种操作系
7、统的虚拟机上提供各种服务。8.1.4 云计算的体系架构1云计算的服务模式 云计算的典型服务模式有3类:软件即服务(Software as a Service,SaaS),平台即服务(Platform as a Service,PaaS)和基础即服务(Infrastructure as a Service,IaaS)。云计算架构可参考图8-1和图8-2。图8-1 云计算平台架构图8-2 云计算基础架构(1)SaaS(软件即服务) 该层通过部署硬件基础设施对外提供服务。用户可以根据各自的需求购买虚拟或实体的计算、存储、网络等资源。用户可以在购买的空间内部署和运行包括操作系统和应用程序在内的软件,而
8、不需管理或控制任何云计算基础设施(事实上也不能管理或控制),但用户可以选择操作系统、存储空间并部署自己的应用,也可以控制有限的网络组件(如防火墙、负载均衡器等)。(2)PaaS(平台即服务) 该层将云计算应用程序开发和部署的平台作为一种服务提供给客户,该服务包括应用设计、应用开发、应用测试和应用托管等。开发者只需要上传代码和数据就可以使用云服务,而不需关心底层的具体实现方式和管理模式。(3)IaaS(基础即服务) 该层指云计算服务商提供虚拟的硬件资源,用户通过网络租赁即可搭建自己的应用系统。IaaS属底层,向用户提供可快速部署、按需分配、按需付费的高安全与高可靠的计算能力,并向用户提供存储能力
9、的租用服务,还可为应用提供开放的云服务接口,用户可以根据业务需求,灵活租用相应的云基础资源。2云计算的主要技术(1)虚拟化技术 虚拟化指计算单元不在真实的单元上而在虚拟的单元上运行,是一种优化资源和简化管理的计算方案。虚拟化技术适合在云计算平台中应用,虚拟化的核心解决了云计算等对硬件的依赖,提供统一的虚拟化界面;通过虚拟化技术,人们可以在一台服务器上运行多台虚拟机,从而实现了对服务器的优化和整合。 虚拟化技术使用动态资源伸缩的手段,降低了云计算基础设施的使用成本,并提高负载部署的灵活性。(2)中间件技术 支持应用软件的开发、运行、部署和管理的支撑软件被称为中间件。中间件是运行在两个层次之间的一
10、种组件,是在操作系统和应用软件之间的软件层次。中间件可以屏蔽硬件和操作系统之间的兼容问题,并具有管理分布式系统中的节点间的通信、节点资源和协调工作等功能。通过中间件技术,我们可将不同平台的计算节点组成一个功能强大的分布式计算系统。而云环境下的中间件技术,其主要功能是对云服务资源进行管理,包含用户管理、任务管理、安全管理等,为云计算的部署、运行、开发和应用提供高效支撑。(3)云存储技术 在云计算中,云存储技术通常和虚拟化技术相互结合起来,通过对数据资源的虚拟化,提高访问效率。目前数据存储技术HDFS(Hadoop Distributed File System,开源)和Google公司的GFS(
11、Google File System,非开源)具有高吞吐率、分布式和高速传输等优点,因此,采用云存储技术,可满足云计算为大量用户提供云服务的需求。8.1.5 云计算需要解决的问题1标准化问题2数据安全和隐私问题3网络稳定性问题 关于云安全的问题,我们需要给予极大的重视。1云计算的主要安全风险(1)来自云计算服务提供商的安全风险。(2)来自网络的安全风险。(3)来自虚拟化的安全风险。(4)边界安全模型失效带来的安全风险。2目前关于云计算安全性的研究 安全性研究集中在云计算安全标准的建立、可信访问控制、数据隐私保护、虚拟安全技术等方面。3降低云计算安全风险的措施(1)选择相对可靠的云计算服务提供商
12、。(2)经常备份数据。(3)增强安全防范意识,不将敏感或核心数据放在云端。(4)增强访问控制,明确谁可以访问哪些数据。8.1.6 具有代表性的云计算厂商 Google公司最早提出云计算概念,正在运营的云计算商用平台被称为Google应用引擎。平台上开发完善了操作系统Chrome OS、MapReduce编程模型、GFS文件系统和BigTable数据管理。Google公司推出了许多新的应用,从文档Google docs、图片、Google Picasa、邮件Gmail,到日程Google Calendar、地图Google map、翻译Google translate等,其应用涵盖桌面计算机日常
13、应用的各个方面。 Amazon公司在2011年全美评选十大“云计算”供应商中排名第一。其云计算主要提供底层的数据存储、计算机处理、信息排队和数据库管理系统等服务,不包括应用层面的服务。Amazon公司的云计算名为AWS(Amazon网络服务),包括4个部分:S3(简单的存储服务)、EC2(弹性计算云)、SQS(简单排列服务)、Simple DB(分布式数据存储)。 IBM公司推出的“蓝云计划”在全球建立了数十家云计算中心,在中国选择了北京和无锡作为其基地。IBM公司的蓝云平台由数据中心、管理软件、监控软件、应用服务器、数据库及一些虚拟化组件共同组成,是一个企业级的解决方案。 Microsoft
14、云计算包括3种运营模式:第一种模式是公司自己为客户提供公有云服务;第二种模式是和合作伙伴一起开发应用为客户服务;第三种模式是客户建立自己的私有云,Microsoft公司提供平台、产品、技术等支持。Microsoft公司在部署模式上全面覆盖了私有云、公有云和混合云的构建,提供的服务包括IaaS、PaaS和SaaS。 阿里(Alisoft)中小企业管理软件平台也产生了很大的影响。2009年,阿里巴巴集团成立子公司“阿里云”,并专注于云计算领域的研究和开发。2012年,阿里云为CSDN量身打造的基础云平台的第一个服务云邮箱正式上线运营,紧接着开放了存储业务。同年,阿里云联手天语打造出新一代云智能手机
15、。 2011年6月7日,Apple公司正式发布了iCloud云服务,该服务可以让Apple设备实现无缝对接。iCloud让使用者可以免费存储5GB的资料,使用者可存储并访问自己的音乐、照片、应用程序、日历、文档及更多内容,并以无线方式推送到自己的所有设备,一切都能自动完成。 华为云成立于2011年,隶属于华为公司。为加快华为云的发展,2017年3月起,华为公司专门成立了Cloud BU,全力构建并提供可信、开放、全球线上线下服务的公有云。8.2 大数据与云计算的关系 大数据复杂的需求对技术实现和底层计算资源提出了高要求,而云计算所具备的弹性伸缩、动态调配、资源虚拟化、支持多租户、支持按量计费或
16、按需使用及绿色节能等基本要素,正好契合了新型大数据处理技术的需求,也正在成为解决大数据问题的未来计算技术发展的重要方向。 大数据与云计算的关系可参考图8-3。图8-3 大数据与云计算的关系8.2.1 云计算将改变大数据分析 首先云计算为大数据提供了可以弹性扩展且又相对便宜的存储空间和计算资源,使中小企业可以通过云计算来完成大数据分析。 其次,云计算IT资源庞大,分布又相对广泛,是异构系统较多的企业及时准确处理数据的有力高效方式,甚至可以说是目前相对可实施的有效的唯一方式。大数据要走向云计算,还要依赖数据通信带宽的提高和云资源的建设,也需要确保原始数据较容易地迁移到云计算系统中,同时更需要云资源
17、池能“随心所欲”地随需扩展。8.2.2 大数据与云计算的区别和联系 大数据与云计算都是为数据存储和处理服务的,都需要占用大量的存储和计算资源,因而都要用到海量数据存储技术、海量数据管理技术等并行处理技术。大数据与云计算主要有以下几点区别。(1)目的不同。 大数据的目的是充分挖掘海量数据中的信息,以发现数据中的价值;云计算的目的是通过互联网更好地调用、扩展、管理及存储方面的资源和能力,即云计算以调用计算资源和存储资源为目的,以节省企业的IT部署成本。(2)处理对象不同。 大数据的处理对象是数据;云计算的处理对象是计算资源、存储资源和应用。 (3)推动企业不同。 大数据的推动力量是从事数据存储与处
18、理的软件厂商和拥有海量数据的企业;云计算的推动力量是拥有强力计算资源和海量存储资源的企业。8.2.3 大数据与云计算未来的发展方向和趋势 大数据的整体态势和发展趋势主要体现在如下几个方面:大数据与学术、大数据与人类的活动,大数据的安全隐私、关键应用、系统处理和对整个产业的影响。在整体态势上,数据的规模将变得更大,数据资源化、数据价值将更加凸显,数据私有化和联盟共享将更加普遍。大数据的发展会催生许多新兴职业,如数据分析师、数据科学家、数据工程师等,有非常丰富的数据经验的人才会成为稀缺人才。随着大数据的发展,数据共享联盟将逐渐壮大成为产业的核心一环。随着大数据的共享越来越普遍,隐私问题也随之而来,
19、例如每天手机产生的通话、位置等给人们带来了便利的同时,也带来了个人隐私的问题。 云计算未来可能会有以下4个发展方向。1混合云2大数据分析3个性化定制服务4云游戏8.2.4 大数据与云计算在生产生活中的应用1智慧医疗 随着大数据时代的到来,医疗行业的信息化也迎来自己的“大数据时代”。如何将患者的被动性参与转向主动健康管理,从单一案例效果评估转向过程性、全程性的整体评估和体验;从病种数据管理扩展到健康数据管理,从关注争端和治疗技术跨到预防、护理和康复环节是未来医疗行业需要关注和解决的问题。大数据技术是解决这些问题的重要途径。 基于大数据技术,有朝一日,机器的诊疗准确率甚至可能超过人类历史上最有名的
20、医生,智慧医疗将是大数据的下一站之一。(1)疾病诊疗(2)疾病预测(3)可穿戴医疗设备2电子商务 我国电子商务行业发展迅猛,产业规模迅速扩大,电子商务信息、交易和技术等服务企业不断涌现。电子商务在我国的经济体系中占据了越来越重要的地位,随着电子商务的迅猛发展,云计算和大数据技术在其中也得到了长足的应用。(1)个性化商品推荐 跨境电商Amazon公司通过传统门店无法比拟的互联网手段,空前地获取了极其丰富的用户行为信息,并且进行深度分析与挖掘。用户行为信息就是用户在网站上发生的所有行为,如搜索、浏览、打分、点评、加入购物筐、取出购物筐、加入收藏列表、购买、使用减价券和退货等;甚至包括在第三方网站上的相关行为,如比价、看相关评测、参与讨论、社交媒体上的交流、与好友互动等。 Amazon公司通过对这些行为信息的分析和理解,制定对客户的贴心服务及个性化推荐。(2)个性化营销 Informa
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 航空货运行业2025年市场竞争格局与行业规范实施效果研究报告
- 家居行业新生态构建:2025线上线下融合模式创新路径研究报告
- 保护动物的重要性议论文周记(8篇)
- 零售门店运营中的数字化客户关系管理系统报告
- 跨境支付2025年区块链与跨境支付跨境支付清算流程研究报告
- 尿液室内质控记录表(干化学法)
- 儿童营养与健康教育
- 2025-2030中国铬镍铁合金棒行业产销态势与投资盈利预测报告
- 2025-2030中国通气管行业发展状况与供需前景预测报告
- 2025-2030中国软磁合金材料行业运营态势与前景趋势预测报告
- 机动车查验员(中级)职业鉴定理论考试题及答案
- 国开(贵州)2024年秋《地域文化(专)》形考任务1-2答案
- 完整版:美制螺纹尺寸对照表(牙数、牙高、螺距、小径、中径外径、钻孔)
- 信创的基础知识培训课件
- 化学品作业场所安全警示标志大全
- 2024科技住宅设计标准
- AQ/T 2061-2018 金属非金属地下矿山防治水安全技术规范(正式版)
- 铸件厂安全现状评价报告
- 综合管廊及道路实施性施工组织设计概述
- 2024年河南省中考数学试卷真题及答案详解(精校打印)
- 中国民族钢琴艺术鉴赏智慧树知到期末考试答案章节答案2024年西安交通大学
评论
0/150
提交评论