终于有人把云计算、物联网和大数据讲明白了_第1页
终于有人把云计算、物联网和大数据讲明白了_第2页
终于有人把云计算、物联网和大数据讲明白了_第3页
终于有人把云计算、物联网和大数据讲明白了_第4页
终于有人把云计算、物联网和大数据讲明白了_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

01云计算

根据美国国家标准与技术研究院(NationalInstituteofStandardsandTechnology,NIST)的定义,云计算是指能够针对共享的可配置计算资源,按需提供方便的、泛在的网络接入的模型。上述计算资源包括网络、服务器、存储、应用和服务等,这些资源能够快速地提供和回收,而所涉及的管理开销要尽可能小。

具体来说,云模型包含五个基本特征、三个服务模型和四个部署模型。

五个基本特征:按需自助服务(on-demandself-service)广阔的互联网访问(broadnetworkaccess)资源池(resourcepooling)快速伸缩(rapidelasticity)可度量的服务(measuredservice)

三个服务模型:软件即服务(SoftwareasaService,SaaS)平台即服务(PlatformasaService,PaaS)基础设施即服务(InfrastructureasaService,IaaS)

四个部署模型:私有云(privatecloud)社区云(communitycloud)公有云(publiccloud)混合云(hybridcloud)

一般来说,云计算可以被看作通过计算机通信网络(例如互联网)来提供计算服务的分布式系统,其主要目标是利用分布式资源来解决大规模的计算问题。

云中的资源对用户是透明的,用户无须知晓资源所在的具体位置。这些资源能够同时被大量用户共享,用户能够在任何时间、任何地点访问应用程序和相关的数据。

云计算的体系结构如图1-3所示,还对三个服务模型进行了阐述。▲图1-3云计算的体系结构

1.基础设施即服务

这项服务是云计算提供的最简单的内容,其涉及大规模的计算资源的交付,这些计算资源包括存储空间、运算能力和网络带宽等。

基础设施即服务的主要优势是按次付费、安全性以及可靠性,因此也被称为硬件即服务(HardwareasaService,HaaS)。这项服务的典型案例有亚马逊云(AmazonElasticComputeCloud,EC2)、谷歌计算引擎(GoogleComputeEngine,GCE)和阿里云(Aliyun)等。

2.平台即服务

这项服务为云计算提供了应用程序的接口。对于云计算来说,基础设施即服务在很多应用场景下能力不足。

随着网络应用程序数的井喷式增长,平台即服务的相关研究与应用逐步涌现。很多全球性的跨国公司都不约而同地寻求在云计算平台方面称霸,就像微软在个人电脑领域所处的地位一样。平台即服务的典型案例有谷歌应用引擎(GoogleAppEngine,GAE)、微软云(MicrosoftAzure)等。

3.软件即服务

这项服务旨在提供终端用户可以直接使用的服务,这里的服务可以理解为部署在互联网上的软件。这样的服务模式在很大程度上替代了在个人电脑上运行的传统应用程序。

软件即服务的典型案例有思科(Cisco)的思科网迅(WebEx)、软营(Salesforce)的客户关系管理(CustomerRelationshipManagement,CRM)系统以及亚马逊网络服务(AmazonWebService,AWS)。

02物联网

物联网技术栈由三个核心层构成,即物/设备层、连接层和物联网云层,详情如图1-4所示。▲图1-4物联网的技术栈

在物/设备层,诸如传感器、执行器等物联网特定的硬件可以被添加至已有的核心硬件中,嵌入式的软件可以被修改或集成进已有的系统,以便管理和操作具体的设备。

在连接层,由通信协议来实现单个物/设备与云之间的通信,例如消息队列遥测传输(MessageQueuingTelemetryTransport,MQTT)协议。

在物联网云层,设备通信协议和管理软件用来协调、提供和管理互相连接的物/设备,由应用平台来实现物联网应用程序的开发和执行。此外,物联网云层还引入了分析与数据管理软件来存储、处理和分析由物/设备产生的数据。针对跨物/设备、人员和系统的过程监测,引入了过程管理软件来进行定义和执行。对于给定的目的,由物联网应用程序软件来协调物/设备、人员和系统之间的交互。

在上述三层的全域范围内,还存在特定的软件构件来对物联网体系整体的身份和安全进行管理,以及提供与商业系统和外部信息源的集成,常见的商业系统和外部信息源类型有企业资源计划(EnterpriseResourcePlanning,ERP)系统和客户关系管理(CRM)系统,外部信息源通常是指来自第三方的信息。

在谈论物联网技术时,“物联网平台”(IoTplatform)是一个提及频次很高的概念。在计算领域,术语“平台”是一个相对广泛的概念,有些文献将平台定义为一组有机结合起来的技术,基于这些技术,能够开发其他的应用程序。

物联网平台本质上是软件产品,其提供大量与应用程序无关的功能,利用这些功能可以构建物联网应用程序。对于各种不同的物联网平台,其提供者所侧重的物联网技术不同,因此所提供的功能集合也是不同的。

换言之,物联网平台的配置没有统一的标准,但是存在众多针对不同领域特定需求的物联网平台,例如ThingSpeak、DeviceHive、Xively、WSO2以及海尔COSMOPlat等。

将云计算与物联网进行对比分析,给出了两个技术领域的互补方面,详情如表1-1所示。

▼表1-1

云计算与物联网的互补方面

一般来说,物联网能够在云计算的虚拟形式的无限计算能力和资源上补偿自身的技术性限制(例如存储、计算能力和通信能力)。

云计算能够为物联网中服务的管理和组合提供高效的解决方案,同时能够实现利用物联网中产生的数据的应用程序和服务。对于物联网来说,云计算能够以更加分布式的、动态的方式来扩展其能处理的真实世界中物/设备的范围,进而交付大量实际生活中的场景所需要的服务。

在多数情况下,云计算能够提供物与应用程序之间的中间层,同时将实现应用程序所必需的复杂性和功能都隐藏起来,这将影响未来的应用程序开发。在未来的多云环境下,应用程序的开发面临着来自信息的收集、处理和传输等方面的新挑战。

物联网在工业领域的应用涵盖了众多方面,例如自动化、优化、可预测制造、运输等。

制造(manufacturing)是物联网在工业领域最大的市场,涉及软件、硬件、连通性和服务等。随着物联网的引入,由原料、工件、机器、工具、库存和物流等组成的工业系统构成了实施制造过程的生产单元,上述这些构件之间可以互相通信。

物联网提供的连通性驱动了各项操作技术(OperationalTechnology,OT)的实际性能的收敛性,这里的操作技术包括机械手、传送带、仪表、发电机等。在整个制造过程中,传感器、分布式控制以及安全软件发挥着“胶水”的作用。当前,工业领域有远见的企业都将生产线和生产过程构建在了物联网之上。

运输(transportation)是物联网在工业领域的第二大市场。当前,在众多城市中涌现的智能运输网络能够优化传统运输网络中的路径,生成高效、安全的路线,降低基础设施的开销并缓解交通拥塞。航空、铁路、城际等货运公司能够集成海量的数据来对需求进行实时分析,实现统筹规划和优化操作。

03大数据

随着物联网和云计算技术的发展,海量的数据以前所未有的速度从异构数据源产生,这些数据源所在的领域有医疗健康、政府机构、社交网络、环境监测和金融市场等。

在这些景象的背后,存在大量强大的系统和分布式应用程序来支持与数据相关的操作,例如智能电网(smartgrid)系统、医疗健康(healthcare)系统、零售业(retailing)系统、政府(government)系统等。

在大数据的变革发生之前,绝大多数机构和公司都没有能力长期保存归档数据,也无法高效地管理和利用大规模的数据集。实际上,现有的传统技术能够应对的存储和管理规模都是有限的。在大数据环境下,传统技术缺乏可扩展性和灵活性,其性能也无法令人满意。

当前,针对海量的数据集,需要设计涵盖清洗、处理、分析、加载等操作的可行性方案。业界的公司越来越意识到针对大数据的处理与分析是使企业具有竞争力的重要因素。

1.三类定义

当前大数据在各个领域的广泛普及使得学界与业界对大数据的定义很难达成一致。不过有一点共识是,大数据不仅是指大量的数据。通过对现有大数据的定义进行梳理,我们总结出三种对大数据进行描述和理解的定义。

1)属性型定义(attributivedefinition)

作为大数据研究与应用的先驱,国际数据公司(InternationalDataCorporation,IDC)在戴尔易安信(DELLEMC)公司的资助下于2011年提出了如下大数据的定义:大数据技术描述了技术与体系结构,其设计初衷是通过实施高速的捕获、发现以及分析,来经济性地提取大量具有广泛类型的数据的价值。

该定义侧面描述了大数据的四个显著特征:数量、速度、多样化和价值。由Gartner公司分析师总结的研究报告中给出了与上述定义类似的描述,该研究指出数据的增长所带来的挑战与机遇是三个维度的,即显著增长的数量(Volume)、速度(Velocity)和多样化(Variety)。

尽管关于数据在三个维度的描述最初并不是要给大数据下定义,但包括IBM、微软在内的业界在其后的十年间都沿用上述“3V”模型来对大数据进行描述。

2)比较型定义(comparativedefinition)

Mckinsey公司2011年给出的研究报告将大数据定义为:规模超出了典型数据库软件工具的捕获、存储、管理和分析能力的数据集。

尽管该报告没有在具体的度量标准方面对大数据给出定义,但其引入了一个革命性的方面,即怎样的数据集才能够被称为大数据。

3)架构型定义(architecturaldefinition)

美国国家标准与技术研究院(NIST)对大数据的描述为:大数据是指数据的数量、获取的速度以及数据的表示限制了使用传统关系数据库方法进行有效分析的能力,需要使用具有良好可扩展性的新型方法来对数据进行高效的处理。

2.5V

以下是一些文献中关于大数据特征的描述:数据的规模成为问题的一部分,并且传统的技术已经没有能力处理这样的数据。数据的规模迫使学界和业界不得不抛弃曾经流行的方法而去寻找新的方法。大数据是一个囊括了在合理时间内对潜在的超大数据集实现捕获、处理、分析和可视化的范畴,并且传统的信息技术无法胜任上述要求。大数据的核心必须包含三个关键的方面:数量多、速度快和多样化,即著名的“3V”。

1)数量

数据的数量又称为数据的规模,在大数据中,其是指在进行数据处理时所面对的超大规模的数据量。目前,海量的数据持续不断地从千百万设备和应用中产生(例如信息通信技术、智能手机、软件代码、社交网络、传感器以及各类日志)。McAfee公司在2012年估算:在2012年的每一天中,全球都产生着2.5EB的数据,并且该数值约每40个月实现翻倍。2013年,国际数据公司(IDC)估算全球所产生、复制和消费的数据已经达到4.4ZB,并且该数值约每两年实现翻倍。到2015年,全球产生的数据将达到8ZB。根据IDC的研究报告,全球产生的数据将在2020年达到40ZB。

2)速度

在大数据中,数据的速度是指在进行数据处理时所面对的具有高频率和高实时性的数据流。高速生成的数据应当及时进行处理,以便提取有用的信息和洞察潜在的价值。

全球知名的折扣连锁店沃尔玛基于消费者的交易每小时产生2.5PB的数据。视频分享类网站(例如优酷、爱奇艺等)则是大数据高频率和高实时性特征的另一个例证。

3)多样化

在大数据中,数据的多样化是指在进行数据处理时所面对的具有不同语法格式的数据类型。随着物联网技术与云计算技术的普及,海量的多源异构数据从不同的数据源以不同的数据格式持续地产生,典型的数据源有传感器、音频、视频、文档等。

海量的异构数据形成各种各样的数据集,这些数据集可能包含结构化数据、半结构化数据、非结构化数据,数据集的属性可能是公开或隐私的、共享或机密的、完整或不完整的,等等。

随着大数据理论的发展,更多的特征逐步被纳入考虑的范围,以便对大数据做出更好的定义,例如:想象(vision),这里的想象是指一种目的;验证(verification),这里的验证是指经过处理后的数据符合特定的要求;证实(validation),这里的证实是指前述的想象成为现实;复杂性(complexity),这里的复杂性是指由于数据之间关系的进化,海量数据的组织和分析均很困难;不变性(immutability),这里的不变性是指如果进行妥善管理,那么经过存储的海量数据可以永久保留。

描述大数据的五个关键特征(即“5V”):数量(Volume)速度(Velocity)多样化(Variety)准确性(Veracity)价值(Value)

4)准确性

在商界,决策者通常不会完全信任从大数据中提取出的信息,而会进一步对信息进行加工和处理,然后做出更好的决策。如果决策者不信任输入数据,那么输出数据也不会获得信任,这样的数据不会参

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论