版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、云计算技术综述胡经国本文作者的话本文是根据有关文献和资料编写的 漫话云计算 系列文稿之一。现作为云计算学习笔录,奉献给云计算业外读者,作为进一步学习和研究的参考。希望能够得到大家的指教和喜欢!下面是正文一、云计算关键技术1、虚拟化技术在云计算中,虚拟化( Virtualization )是一种资源管理技术。虚拟化技术,是指计算元件在虚拟的基础上而不是在真实的基础上运行。它可以扩大硬件的容量,简化软件的重新配置过程,减少软件虚拟机相关开销和支持更广泛的操作系统。通过虚拟化技术,可实现软件应用与底层硬件相隔离。它包括将单个资源划分为多个虚拟资源的裂分模式;也包括将多个资源整合为一个虚拟资源的聚合模
2、式。例如,可以将一台物理服务器虚拟成为多台逻辑机器;也可以将多台物理服务器虚拟成为一台逻辑机器。虚拟化技术根据对象可分为:计算虚拟化、存储虚拟化、网络虚拟化等。计算虚拟化又分为:系统级虚拟化、应用级虚拟化和桌面虚拟化。在云计算实现中,计算系统虚拟化,是一切建立在“云”上的服务与应用的基础。虚拟化技术目前主要应用在 CPU、操作系统、服务器等多个方面,是提高服务效率的最佳解决方案。2、分布式海量数据存储云计算系统由大量服务器组成,同时为大量用户服务。因此,云计算系统采用分布式存储的方式存储数据;用冗余存储的方式 (集群计算、数据冗余和分布式存储)保证数据的可靠性。冗余存储的方式,通过任务分解和集
3、群,用低配置机器替代超级计算机的性能,来保证低成本。这种方式保证分布式数据的高可用、高可靠和经济性,即为同一份数据存储多个副本。云计算系统中广泛使用的数据存储系统,是Google 的GFS 和Hadoop 团队开发的 GFS 的开源实现 HDFS。链接: GFSGFS( Google File System, Google 文件系统),是 Google 公司为了存储海量搜索数据而设计的专用文件系统。 GFS 是一个可扩展的分布式文件系统,用于大型的、分布式的、对大量数据进行访问的应用。它运行于廉价的普通硬件上,并提供容错功能。它可以给大量的用户提供总体性能较高的服务。链接: HDFSHDFS(
4、Hadoop Distributed File System, Hadoop 分布式文件系统) 被设计成适合运行在通用硬件( commodity hardware)上的分布式文件系统。它和现有的分布式文件系统有很多共同点。但是同时,它和其他的分布式文件系统的区别也是很明显的。 HDFS 是一个高度容错性的系统,适合部署在廉价的机器上。HDFS 能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。HDFS 具有高容错性( fault-tolerant )的特点,并且设计用来部署在低廉的( low-cost)硬件上。而且,它提供高吞吐量( high throughput)来访问应用程序的数据,
5、适合那些具有超大数据集( large data set)的应用程序。3、海量数据管理技术云计算需要对分布的、海量的数据进行处理、分析。因此,数据管理技术,必需能够高效地管理大量的数据。云计算系统中的数据管理技术,主要是 Google 的 BT sT lO 数据管理技术和 Hadoop 团队开发的开源数据管理模块HBase。由于云数据存储管理形式,不同于传统的 RDBMS 数据管理方式,如何在规模巨大的分布式数据中找到特定的数据,也是云计算数据管理技术所必须解决的问题。同时,由于管理形式的不同,造成传统的SQL 数据库接口,无法直接移植到云管理系统中来。目前,一些研究在关注为云数据管理提供RDB
6、MS和 SQL 的接口,如基于 Hadoap 子项目 HBase 和 Hive 等。另外,在云数据管理方面,如何保证数据安全性和数据访问高效性,也是研究关注的重点问题之一。链接: HBaseHBase( Hadoop Database, Hadoop 数据库),是一个分布式的、面向列的开源数据库。 HBase 不同于一般的关系型数据库,它是一个适合于非结构化数据存储的数据库。另一个不同的是, HBase 基于列的而不是基于行的模式。HBase 是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统。利用 HBase 技术可在廉价 PC Server上搭建起大规模结构化存储集群。链接: RDBM
7、SRDBMS ( Relational Database Management System,关系型数据库管理系统),是将数据组织为相关的行和列的系统;而管理关系型数据库的软件就是关系型数据库管理系统。常用的管理关系型数据库的软件有等。Oracle、SQL Server链接: SQLSQL(Structured Query Language,结构化查询语言) ,是一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系型数据库系统;同时也是数据库脚本文件的扩展名。链接: HiveHive 是基于 Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的
8、SQL 查询功能,可以将 MapReduce 任务进行运行。其优点是学习成本低,可以通过类SQL 语句转换为SQL 语句快速实现简单的 MapReduce统计,不必开发专门的 MapReduce应用,十分适合数据仓库的统计分析。链接: MapReduceMapReduce 是一种分布式并行编程模型,用于大规模数据集(大于 1TB)的并行运算。概念“ Map(映射)”和“ Reduce(归约)”,和它们的主要思想,都是从函数式编程语言里借来的,还有从矢量编程语言里借来的特性。它极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上。4、编程模式云计算提供了分布式计算模式
9、,客观上要求必须有分布式编程模式。云计算采用了一种思想简洁的分布式并行编程模型 MapReduce。 MapReduce 是一种编程模型和任务调度模型。主要用于数据集的并行运算和并行任务的调度处理。在该模式下,用户只需要自行编写 Map 函数和 Reduce函数,即可进行并行计算。其中,在 Map (映射)函数中定义各节点上的分块数据的处理方法;而在 Reduce(归约或化简)”函数中定义中间结果的保存方法以及最终结果的归纳方法。5、云计算平台管理技术云计算资源规模庞大,服务器数量众多并分布在不同的地点,同时运行着数百种应用。如何有效地管理这些服务器,保证整个系统提供不间断的服务,是巨大的挑战
10、。云计算系统的平台管理技术,能够使大量的服务器协同工作,方便地进行业务部署和开通,快速发现和恢复系统故障,通过自动化、智能化的手段实现大规模系统的可靠运营。云计算平台,也称为云平台。云计算平台可以划分为 3 类:以数据存储为主的存储型云平台,以数据处理为主的计算型云平台,以及计算和数据存储处理兼顾的综合云计算平台。转向云计算( Cloud Computing),是业界将要面临的一个重大转变。各种云平台( Cloud Platforms)的出现是该转变的最重要环节之一。顾名思义,云平台允许开发者们或是将写好的程序放在“云”里运行,或是使用“云”里提供的服务,或是二者皆有。二、云计算的技术基础图
11、2 云计算的技术基础在技术变革不断发生的过程中,网络逐步从基本互联网功能,转换到 Web 服务时代(典型的 Web2.0 时代); IT 也由企业网络互通性,转换到提供信息架构全面支撑企业核心业务。技术驱动力,也为云计算提供了实现的客观条件,如上图所示,在关键领域云计算技术已经就绪。1、标准化标准化 :公共技术、开源技术、硬件标准接口、高度可扩展硬件体系、基础架构平台化、异构相容。公共技术的长期发展,使得基础组件的标准化非常完善,硬件层面的互通已经没有阻碍(即使是非常封闭的大型机,目前也开始支持对外直接接出 IP 接口)。大规模运营的云计算,能够极大降低单位建设成本。链接:开源软件技术开源软件
12、( Open Source Software)技术,是指向公众开放软件源代码的技术。它源于一些软件技术发烧友出于技术展现目的或者说是对软件的一种热爱,将自己辛勤开发的软件源代码无私地发布到互联网社区上与社会共享。他们坚信,好的软件应该是开放的,应该由任何有能力的人参与共同完善,这就是开源技术的理念。互联网企业通过开源软件全面替代传统商业软件,从而得到信息化自主把控能力的过程,被称为软件开源化。2、虚拟化与自动化虚拟化与自动化 :计算虚拟化、存储虚拟化、网络安全虚拟化、资源整合、自动化调配、自动化响应、屏蔽基础架构不同组件的异构。虚拟化技术不断向纵深发展, IT 资源已经可以通过自动化的架构提供
13、全局动态调度能力,自动化提升了 IT 架构的伸缩性和扩展性。3、并行、分布式架构并行与分布式 :大规模集群技术、分布式数据库、分布式文件系统、可伸缩可扩展的大型软件架构。大规模的计算与数据处理系统,已经在分布式、并行处理的架构上得到广泛应用。计算密集、数据密集、大型数据文件系统,成为云计算的实现基础。从而,要求整个基础架构,具有更高的弹性与扩展性。链接:集群技术集群( Cluster)技术是一种较新的技术。通过集群技术,可以在付出较低成本的情况下获得在性能、可靠性、灵活性方面的相对较高的收益。其任务调度则是集群系统中的核心技术。在这里,集群,是指一组相互独立的、通过高速网络互联的计算机(服务器
14、)。它们构成了一个组即一个集群,并以单一系统的模式加以管理。一个客户与集群相互作用时,集群像是一个独立的服务器。集群配置是用于提高可用性和可伸缩性。链接:分布式数据库分布式数据库( Distributed Database,DDB ),是指数据分别存放在计算机网络中的各台计算机上的数据库。分布式数据库系统,通常使用较小的计算机系统,每台计算机可单独放置在一个地方,每台计算机中都可能有 DBMS(数据库管理系统) 的一份完整拷贝副本,或者部分拷贝副本,并具有自己局部的数据库;位于不同地点的许多计算机通过网络互相连接,共同组成一个完整的、全局的逻辑上集中、物理上分布的大型数据库。分布式数据库,是指
15、利用高速计算机网络将物理上分散的多个数据存储单元连接起来组成一个逻辑上统一的数据库。分布式数据库的基本思想,是将原来集中式数据库中的数据分散存储到多个通过网络连接的数据存储节点上,以获取更大的存储容量和更高的并发访问量。链接:网络节点网络节点,是指具有独立地址的一台计算机、服务器或其他设备与具有传送或接收数据功能的网络相连。节点可以是计算机、服务器,或工作站、网络用户、打印机和其他与网络连接的设备。在网络中拥有自己唯一网络地址的计算机、服务器等设备都是网络节点。整个网络就是由这许许多多的网络节点组成的;把许多的网络节点用通信线路连接起来,形成一定的几何关系,这就是计算机网络拓扑结构。4、带宽带
16、宽:服务器规模的急剧增长、服务器集群对外提供密集服务、互联网终端数量急剧增长、 10G/40G/100G。大规模的数据交换,需要超高带宽的支撑。网络平台在 40G/100G能力下,可具备更扁平化的结构,这使得云计算的信息交互以最短路径快速执行。因此,从传统 Web 服务向云计算服务发展,已经具备技术基础;而企业的 IT 从信息架构演进到弹性的 IT 服务,也成为必然。链接:带宽带宽( Band Width)又叫频宽,是指在固定的时间内可传输的资料数量,亦即在传输管道中可以传递数据的能力。在数字设备中,带宽通常以 bps 表示,即每秒可传输的位数。在模拟设备中,带宽通常以每秒传送周期或赫兹 (H
17、z)来表示。网络带宽,是指在一个固定的时间内( 1 秒),能通过的最大位数。就好象高速公路的车道一样,带宽越大,好比车道越多。网络带宽作为衡量网络使用情况的一个重要指标,日益受到人们的普遍关注。它不仅是政府或单位制订网络通信发展策略的重要依据,也是互联网用户和单位选择互联网接入服务商的主要因素之一。链接:网络扁平化结构网络传统结构是由路由器到中心交换机,再向下连接到分交换机的结构。网络扁平化就是取消这种结构,而是由路由器直接到交换机,交换机就开始带工作站了;然后此交换机又连接到另一个交换机,而那个交换机也直接带工作站了。如果需要增加工作站,那么就再增加一个新交换机即可。这使得云计算的信息交互以
18、最短路径快速执行。三、云计算八项核心技术全面解读确切地说,云计算是大规模分布式计算技术及其配套商业模式演进的产物。它的发展主要有赖于虚拟化、分布式数据存储、数据管理、编程模式、信息安全等各项技术、产品的共同发展。近些年来,托管、后向收费、按需交付等商业模式的演进,也加速了云计算市场的转折。云计算不仅改变了信息提供的方式,也颠覆了传统 ICT 系统的交付模式。与其说云计算是技术的创新,不如说云计算是思维和商业模式的转变。云计算技术,以虚拟化技术、分布式数据存储技术、编程模型、大规模数据管理技术、分布式资源管理、信息安全、云计算平台管理技术、绿色节能技术最为关键。链接: ICTICT 是信息、通信
19、和技术三个英文单词( Information , Communication,Technology)第一个字母的组合。它是信息技术与通信技术相融合而形成的一个新的概念和新的技术领域。1、虚拟化技术虚拟化是云计算最重要的核心技术之一。它为云计算服务提供基础架构层面的支撑,是 ICT 服务快速走向云计算的最主要驱动力。可以说,没有虚拟化技术,也就没有云计算服务的落地与成功。随着云计算应用的持续升温,业内对虚拟化技术的重视也提到了一个新的高度。与此同时,我们的调查发现,很多人对云计算和虚拟化的认识都存在误区,认为云计算就是虚拟化。事实上并非如此。虚拟化是云计算的重要组成部分,但不是全部。从技术上讲,
20、虚拟化是一种在软件中仿真计算机硬件,以虚拟资源为用户提供服务的计算形式。其宗旨在于合理调配计算机资源,使其更高效地提供服务。它把应用系统各硬件间的物理划分打破,从而实现架构的动态化,实现物理资源的集中管理和使用。虚拟化的最大好处,是增强系统的弹性和灵活性,降低成本、改进服务、提高资源利用效率。从表现形式上看,虚拟化又分两种应用模式:一种是将一台性能强大的服务器虚拟成多个独立的小服务器,服务于不同的用户。另一种是将多个服务器虚拟成一个强大的服务器,完成特定的功能。这两种模式的核心,都是统一管理,动态分配资源,提高资源利用率。在云计算中,这两种模式都有比较多的应用。2、分布式数据存储技术云计算的另
21、一大优势就是能够快速、高效地处理海量数据。在数据爆炸的今天,这一点至关重要。为了保证数据的高可靠性,云计算通常会采用分布式数据存储技术,将数据存储在不同的物理设备中。这种模式不仅摆脱了硬件设备的限制,同时扩展性更好,能够快速响应用户需求的变化。分布式存储与传统的网络存储并不完全一样。传统的网络存储系统,采用集中的存储服务器存放所有数据。存储服务器成为系统性能的瓶颈,不能满足大规模存储应用的需要。分布式网络存储系统,采用可扩展的系统结构,利用多台存储服务器分担存储负荷,利用位置服务器定位存储信息。它不但提高了系统的可靠性、可用性和存取效率,还易于扩展。在当前云计算领域, Google 的 GFS
22、 和 Hadoop开发的开源系统 HDFS,是比较流行的两种云计算分布式存储系统。GFS( Google File System,Google 文件系统)技术:谷歌的非开源的GFS( Google File System) 云计算平台,满足大量用户的需求,并行地为大量用户提供服务。这使得云计算的数据存储技术,具有了高吞吐率和高传输率的特点。HDFS(Hadoop Distributed File System, Hadoop 分布式文件系统) 技术:大部分 ICT 厂商,包括 Yahoo、Intel 的“云”计划,采用的都是 HDFS 的数据存储技术。未来的发展将集中在超大规模的数据存储、数据
23、加密和安全性保证、以及继续提高 I/O 速率等方面。3、编程模式分布式并行编程模式从本质上讲,云计算是一个多用户、多任务、支持并发 (行)处理的系统。高效、简捷、快速是其核心理念。它旨在通过网络把强大的服务器计算资源方便地分发到终端用户手中,同时保证低成本和良好的用户体验。在这个过程中,编程模式的选择至关重要。在云计算项目中,分布式并行编程模式将被广泛采用。分布式并行编程模式创立的初衷是更高效地利用软、硬件资源,让用户更快速、更简单地使用应用或服务。在分布式并行编程模式中,后台复杂的任务处理和资源调度,对于用户来说是透明的。这样,用户体验能够大大提升。MapReduce 是当前云计算主流分布式
24、并行编程模式之一。 MapReduce 模式将任务自动分成多个子任务,通过 Map 和 Reduce两步,实现任务在大规模计算节点中的高度与分配。MapReduce是 Google 开发的 java、 Python、 C+编程模型,主要用于大规模数据集(大于 1TB)的并行运算。 MapReduce 模式的思想,是将要执行的问题分解成 Map(映射)和 Reduce(化简或归约)的方式;先通过 Map 程序将数据切割成不相关的区块,分配(调度)给大量计算机处理,达到分布式计算的效果;再通过 Reduce程序将结果汇整输出。4、大规模数据管理技术海量数据管理是云计算的一大优势。如何管理涉及到很多
25、层面的东西。因此,高效的大规模数据管理技术,也是云计算不可或缺的核心技术之一。对于云计算来说,数据管理面临巨大的挑战。云计算不仅要保证数据的存储和访问,还要能够对海量数据进行特定的检索和分析。由于云计算需要对海量的分布式数据进行处理、分析,因而数据管理技术必需能够高效的管理大量数据。Google 的 BT(BigTable)数据管理技术和 Hadoop 团队开发的开源数据管理模块 DBase,是业界比较典型的大规模数据管理技术。、 BT( BigTable)数据管理技术BigTable 是非关系型数据库,是一个分布式的、持久化存储的多维度排序 Map 。 BigTable 与传统的关系型数据库
26、不同。它把所有数据都作为对象来处理,形成一个巨大的表格,用来分布式存储大规模结构化数据。 BigTable 的设计目的,是可靠地处理 PB 级别的数据,并且能够部署到上千台服务器上。、开源数据管理模块HBaseHBase定位于分布式、面向列的开源数据库。HBase不同于一般的关系型数据库。它是一个适合于非结构化数据存储的数据库。另一个不同的是,HBase基于列的而不是基于行的模式。作为高可靠性分布式存储系统,HBase 在性能和可伸缩方面,都有比较好的表现。利用 HBase 技术,可在廉价 PC Server(PC服务器)上搭建起大规模结构化存储集群。5、分布式资源管理技术由于云计算采用了分布
27、式存储技术存储数据,因而自然要引入分布式资源管理技术。在多节点的并发执行环境中,各个节点的状态需要同步。并且,在单个节点出现故障时,系统需要有效的机制保证其它节点不受影响。而分布式资源管理系统恰是这样的技术。它是保证系统状态正常的关键技术。另外,云计算系统所处理的资源往往非常庞大,少则几百台服务器,多则上万台服务器;同时可能跨跃多个地域。而且,云平台中运行的应用,也是数以千计。如何有效地管理这批资源,保证它们正常提供服务,需要强大的技术支撑。因此,分布式资源管理技术的重要性,可想而知。全球各大云计算方案服务提供商们,都在积极开展相关技术的研发工作。其中, Google 内部使用的 Borg 技
28、术,很受业内称道。另外,微软、IBM 、Oracle/Sun 等云计算巨头,都有相应解决方案提出。链接:云应用云应用( Cloud Apply )是云计算概念的子集,是云计算技术在应用层的体现。云应用跟云计算最大的不同在于:云计算作为一种宏观技术发展概念而存在;而云应用则是直接面对客户解决实际问题的产品。链接: BorgBorg,是谷歌公司的内部容器管理系统。早在十几年前,该公司就已经部署 Borg 系统对来自于几千个应用程序所提交的 job(工作)进行接收、调试、启动、停止、重启和监控。该项目的目的是实现资源管理的自动化以及跨多个数据中心的资源利用率最大化。6、信息安全调查数据表明,安全已经
29、成为阻碍云计算发展的最主要原因之一。数据显示, 32%已经使用云计算的组织,和 45%尚未使用云计算的组织的 ICT(信息和通信技术)管理,将云安全作为进一步部署云的最大障碍。因此,要想保证云计算能够长期稳定、快速发展,安全是首要需要解决的问题。事实上,云计算安全也不是新问题;传统互联网存在同样的问题。只是云计算出现以后,安全问题变得更加突出。在云计算体系中,安全涉及到很多层面,其中包括:网络安全、服务器安全、软件安全、系统安全等等。因此,有分析师认为,云安全产业的发展,将把传统安全技术提到一个新的阶段。现在,不管是软件安全厂商,还是硬件安全厂商,都在积极研发云计算安全产品和方案。包括传统杀毒
30、软件厂商、软硬防火墙厂商、 IDS/IPS 厂商在内的各个层面的安全供应商,都已加入到云安全领域。相信在不久的将来,云安全问题将得到很好的解决。链接: IDS/IPSIDS( Intrusion Detection Systems,入侵检测系统) ,从专业上讲就是依照一定的安全策略,通过软、硬件,对网络、系统的运行状况进行监视,尽可能发现各种攻击企图、攻击行为或者攻击结果,以保证网络系统资源的机密性、完整性和可用性。IPS( Intrusion Prevention System,入侵防御系统),是电脑网络安全设施,是对防病毒软件(Antivirus Programs)和防火墙(Packet
31、Filter 包过滤, Application Gateway 应用网关)的补充。入侵预防系统是一部能够监视网络或网络设备的网络资料传输行为的计算机网络安全设备,能够即时中断、调整或隔离一些不正常或是具有伤害性的网络资料传输行为。链接:防火墙防火墙( Firewall ),也称防护墙,是一种位于内部网络与外部网络之间的网络安全系统,一项信息安全的防护系统;依照特定的规则,允许或是限制传输的数据通过。所谓防火墙,是指一个由软件和硬件设备组合而成、在内部网和外部网之间、专用网与公共网之间的界面上构造的保护屏障,是一种获取安全性方法的形象说法。它是一种计算机硬件和软件的结合,使 Internet 与
32、 Intranet(内部网络)之间建立起一个安全网关( Security Gateway),从而保护内部网免受非法用户的侵入。防火墙主要由服务访问规则、验证工具、包过滤和应用网关 4 个部分组成。防火墙就是一个位于计算机和它所连接的网络之间的软件或硬件。该计算机流入流出的所有网络通信和数据包均要经过此防火墙。7、云计算平台管理技术云计算资源规模庞大,服务器数量众多并分布在不同的地点,同时运行着数百种应用。如何有效地管理这些服务器,保证整个系统提供不间断的服务,是巨大的挑战。云计算系统的平台管理技术,需要具有高效调配大量服务器资源,使其更好协同工作的能力。其中,方便地部署和开通新业务、快速发现并
33、且恢复系统故障、通过自动化、智能化手段实现大规模系统可靠的运营,是云计算平台管理技术的关键。对于提供者而言,云计算可以有三种部署模式,即公共云、私有云和混合云。这三种云计算部署模式,对平台管理的要求大不相同。对于用户而言,由于企业对于 ICT(信息和通信技术) 资源共享的控制、对系统效率的要求以及 ICT 成本投入预算不尽相同,企业所需要的云计算系统规模及可管理性能也大不相同。因此,云计算平台管理方案,要更多地考虑到定制化需求,能够满足不同场景的应用需求。包括 Google、IBM 、微软、 Oracle/Sun等在内的许多厂商,都有云计算平台管理方案推出。这些方案能够帮助企业实现基础架构整合
34、、实现企业硬件资源和软件资源的统一管理、统一分配、统一部署、统一监控和统一备份,打破应用对资源的独占,让企业云计算平台价值得以充分发挥。8、绿色节能技术节能环保是全球整个时代的大主题。云计算也以低成本、高效率着称。云计算具有巨大的规模经济效益。在提高资源利用效率的同时,节省了大量能源。绿色节能技术,已经成为云计算必不可少的技术。未来越来越多的节能技术,还会被引入到云计算中来。Carbon Disclosure Project(碳排放披露项目, CDP),近日发布了一项有关云计算有助于减少碳排放的研究报告。报告指出,迁移至云的美国公司,每年就可以减少碳排放 8570 万吨;这相当于 2 亿桶石油
35、所排放出的碳总量。总之,云计算服务提供商们,需要持续改善技术,让云计算更加绿色节能。四、云计算的12 种基础技术有 12 种技术,是云计算的基础技术,或是云计算现在达到的状态的关键技术或推动力量。它们是:1、虚拟化(前已有介绍)2、分布式计算、基本概念分布式计算( Distributed Computation)是一种计算方法,是与集中式计算相对的。随着计算技术的发展,有些应用需要非常巨大的计算能力才能完成。如果采用集中式计算,需要耗费相当长的时间来完成。分布式计算将该应用分解成许多小的部分,分配给多台计算机进行处理。这样可以节约整体计算时间,大大提高计算效率。分布式计算是一门计算机科学,主要
36、研究分布式系统。一个分布式系统包括若干通过网络互联的计算机。这些计算机互相配合以完成一个共同的目标 (我们将这个共同的目标称为“项目”) 。其具体的过程是:将需要进行大量计算的项目数据分割成小块,由多台计算机分别计算,再上传运算结果后统一合并得出数据结论。在分布式系统上运行的计算机程序,称为分布式计算程序;分布式编程就是编写上述程序的过程。、任务单元任务单元( Workunit, WU ),又称为任务包,是分布式计算项目的客户端分配到的最小单元的计算任务。客户端在连接到项目服务器后,可下载一个或多个新任务单元;计算完成后,再将这些任务单元的计算结果上传给项目服务器;并根据情况决定是否同时取回更
37、多新的任务单元。、工作方式项目方把大的计算任务分割成小块 (任务单元),通过互联网分发给志愿者进行计算;志愿者计算完成后,再通过网络把各自的计算结果返回到项目方的服务器。、作用可以帮助一些缺乏研究资金的、公益性质的科学研究,加速人类的科学进程。有效利用全世界联网机器的闲置处理能力,向大众普及科学意识。、局限性按照上述分布式计算的工作方式,该类科学研究必须是可能通过计算来解决全部或部分问题,而且其计算过程必须比较容易被分割成个人计算机的处理能力能够接受的大小。因此,分布式计算并不适用于所有的科学研究。、安全问题、信任项目对用户方来说,加入任何一个项目前,您必须确保您可以信任项目的研制方。这主要涉
38、及两个方面:个人计算机上的隐私数据,您从项目方下载的计算程序,运行在本机,而且可以访问网络。因此,只有可靠的项目方才能保证您计算机上的隐私数据不会被恶意地取走、修改等。、个人计算机寿命个人计算机的寿命,虽然分布式计算的计算程序一般运行在最低优先级,不会对您的日常使用造成影响。但是,计算程序全负荷运行时,仍会对计算机的各个部件造成一定压力和影响 (要了解更多请查看分布式计算对计算机软硬件的影响)。、冗余计算机制对项目方来说,参加分布式计算的志愿者毕竟不是项目方自己的人员,并不是全体可信任。因此,必须引入一定的冗余计算机制,才能防止计算错误、恶意作弊等。3、自治系统技术、基本概念在互联网中,自治系
39、统( Autonomic Systems, AS)是一个有权自主地决定在本系统中应采用何种路由协议的小型网络单位。这个网络单位可以是一个简单的网络,也可以是一个由一个或多个普通的网络管理员来控制的网络群体。它是一个单独的可管理的网络单元 (例如,一所大学,一个企业或者一个公司个体)。一个自治系统有时也被称为是一个路由选择域( Routing Domain)。一个自治系统将会分配到一个全局的唯一的 16 位号码,有时我们把这个号码叫做自治系统号( ASN )。、互联网协议定义一个自治系统就是处于一个管理机构控制之下的路由器和网络群组。它可以是一个路由器直接连接到一个 LAN 上,同时也连接到 I
40、nternet 上;它可以是一个由企业骨干网互连的多个局域网。在一个自治系统中的所有路由器必须相互连接,运行相同的路由协议,同时分配同一个自治系统编号。自治系统之间的链接使用外部路由协议,例如 BGP。、技术定义互联网协议在给自治系统提出了如上的的定义以后,又提出了一个更具有技术性的定义如下:一个自治系统即为由一个或多个网络运营商来运行一个或多个网络协议前缀的网络连接组合,这些运营商往往都具有单独的定义明确的路由策略。、分类自治系统可根据其连接和运作方式分为三类:多出口自治系统、末端自治系统、中转自治系统。、多出口自治系统多出口自治系统( Multihomed AS ),是指与其它的自治系统具
41、有多于一个连接的自治系统。一旦那些连接中的某一个完全失效,这个多出口的自治系统也仍然能保持和互联网络的联系。但是,这类自治系统不允许与自己所连接的其它任何一个自治系统穿过自己来访问另一个自治系统。、末端自治系统末端自治系统( Stub AS),是指仅与一个其它自治系统相连的自治系统。如果该 AS 的路由策略与其上游的 AS 完全相同,这说明该 AS 其实浪费了一个 ASN (自治系统号)。、中转自治系统中转自治系统,是指一个自治系统通过自己来为几个隔离开的网络提供连通服务。即:网络A 可通过作为中转AS 的网络 B 来连接到网络 C。所有的 ISP都是这类的中转自治系统,因为这原本是它们的根本
42、业务目的。由于 ISP 是在向客户网络“贩售中转服务”,因而使用中转自治系统这个术语来表示。、数学定义在数学上或者动力学中,自治系统与非自治系统相对应。自治系统为不显含时间 t 的动力学,而非自治系统则显含时间 t。可以这么认为,一般的自由振动系统为自治系统;而受迫振动系统则为非自治系统。在线性系统中,自治系统常定义为:不受外部影响即没有输入作用的一类动态系统。4、网格计算网格计算即分布式计算,是一门计算机科学。它研究如何把一个需要非常巨大的计算能力才能解决的问题分成许多小的部分;然后把这些部分分配给许多计算机进行处理;最后把这些计算结果综合起来得到最终结果。最近的分布式计算项目,已经被用于使
43、用世界各地成千上万志愿者的计算机的闲置计算能力。通过因特网,您可以分析来自外太空的电讯号,寻找隐蔽的黑洞,并探索可能存在的外星智慧生命;您可以寻找超过 1000 万位数字的梅森质数;您也可以寻找并发现对抗艾滋病毒更为有效的药物。从而,用以完成需要惊人的计算量的庞大项目。5、宽带网、基本概念宽带网是有线网络的简称。宽带是一个相对于窄带而言的概念。宽带网,简单地说,就是指高带宽的网络。通常,人们把骨干网传输速率在 2.5G 以上,接入网传输速率能够达到 1 兆的网络定义为宽带网。与传统的窄带网络相比,宽带网在速度上占据极大的优势。它可以为上网者提供更为平滑的视频图像,更为清晰逼真的声音效果和更为迅
44、速的网站搜索服务。宽带网的上网方式,主要采用 modem(调制解调器)拨号;或者采用 modem (调制解调器)路由器来使用。单一用户可仅使用 modem 来访问 Internet;局域网多用户,可使用路由器搭建局域网并完成多用户同时访问Internet。、宽带网架构宽带网架构分为 3 层:骨干网:相当于城市与城市之间的高速公路。城域网:相当于城市市区内的道路。社区接入网(社区宽带网) :相当于将道路从市区一直修到小区,抵达每户的家门口。、基本特点、优点A、传输速率快:过去通过电话线上网,其传输速率只有 64K ;而接入社区的宽带网能够为用户提供 10100 兆的网络带宽,上网速度是电话拨号上
45、网的100 倍以上。B、由于宽带网具有多媒体、互动性及个性化的特点,因而比起窄带网络来,它具备了更多功能,如视频点播、可视电话、电子商务、网上办公、远程教育等。C、宽带网上可以直接传输声音、图像和数据,使得电话上网中存在的长途电话和市话的区别消失,宽带网技术可以实现人们常说的“三网合一”。、缺点A 、宽带的接入费用和使用费用较之窄带高,而且各地之间存在较大差价。B、网上内容并不能完全与宽带网相配。、社区宽带网接入方式社区宽带网有以下几种常见接入方式:、 ADSL (非对称数字用户环路)A、接入方式ADSL 是对传统电话线进行改造,实现宽带接入。该系统在用户端采用ADSL 调制解调器(俗称:猫)
46、 ,通过电话线连接到电话交换局前端ADSL 解调设备解调后送入ATM 网,可以提供基于ATM 的各种应用业务。由于ADSL 头端设备 DSLAM 提供的是 ATM 接口,因而最终它还需要通过路由器连接因特网实现因特网接入。由于 ADSL 使用 40KHz 以上频率传输数据, 40KHz 以下仍然用来传输话音,因而使用 ADSL 可以一直连网而不影响电话的使用。链接: ADSLADSL ( Asymmetric Digital Subscriber Line,非对称数字用户环路),是一种新的数据传输方式。它因为上行和下行带宽不对称,因此称为非对称数字用户环路。它采用频分复用技术,把普通的电话线分
47、成了电话、上行和下行三个相对独立的信道,从而避免了相互之间的干扰。即使边打电话边上网,也不会发生上网速率和通话质量下降的情况。通常 ADSL 在不影响正常电话通信的情况下,可以提供最高 3.5Mbps 的上行速度和最高 24Mbps 的下行速度。链接: ATM 网ATM( Asynchronous Transfer Mode,异步传输模式) ,是一种较新型的单元交换技术。 ATM 使用 53 字节固定长度的单元进行交换。它是一种交换技术。它没有共享介质或包传递带来的延时,非常适合音频和视频数据的传输。按照 ATM (Asynchronous Transfer Mode,异步传输模式)构建的网络
48、即为 ATM 网。链接: DSLAMDSLAM(Digital Subscriber Line Access Multiplexer ,数字用户线路接入复用器),是各种 DSL 系统的局端设备,属于最后一公里 ( the last mile)接入设备。其功能是接纳所有的 DSL 线路,汇聚流量,相当于一个二层交换机。B、优缺点ADSL 接入的优点:是可以利用现有的市内电话网和电话交换局的机房,可以降低施工和维护成本,对电话业务没有影响。缺点:它对线路质量要求较高;当线路质量不高时,推广使用有困难。ADSL 的实际速度,还要受到用户和电话分局的电话线长度和电话线路的质量的影响;而且, ADSL
49、系统楼内楼外使用的都是非屏蔽双绞线,所以抵抗天气干扰(打雷下雨) 的能力较差。由于宽带可扩展的潜力不大,ADSL 不能满足日益增长的接入速率需求,只能成为过渡性产品,或者用于要求不高的旧社区单用户的宽带接入改造上。、 HFC (混合光纤同轴)A、接入方式在城市有线电视 HFC(Hybrid Fiber-Coaxial ,混合光纤同轴)网上,使用电缆调制解调器 (Cable Modem)进行数据传输,可构成宽带接入网。 HFC 宽带接入网下行传输利用 550M 870MHz 频段。在中国一般采用北美标准,以64QAM (Quadrature Amplitude Modulation ,相正交振幅
50、调制)方式调制传输数据,下行传输速率为27Mbps。与 ADSL 每户独占一条接入线不同,在一个光结点小区内的HFC 电缆调制解调器用户共享传输速率 27Mbps 或 40Mbps 的下行通道。为了保证接入速度,一个光结点小区内覆盖用户数目不能太多。中国广电总局要求 HFC 网光结点小区覆盖用户在 500 户以内,越少越好。链接: HFC 网HFC( Hybrid Fiber-Coaxial ,混合光纤同轴)网,是以光纤为骨干网络,同轴电缆为分支网络的高带宽网络,传输速率可达20 Mb/s 以上。目前,中国国内的广电行业系统网络即采用HFC 网络体系。数字电视以HFC 为传输基础网络,其与传统
51、有线电视结构基本一致,主要存储及传送的内容是MPEG-2 流,采用IP over DWDM 技术,基于 DVD IP 光纤网传输。链接:光节点(光结点)光节点:下行光接收机光电转换、上行光发射机电光转换的组合。简单理解的话,干线一般用光纤,支线一般用电缆,其间的转换装置统称为光节点。B、接入标准中国各个城市都建设了 HFC 网。一般线路频宽为 550MHz ,新建的能达到 870MHz 。2000 年后,中国一些城市进行了 HFC 网双向改造,并且开始进行宽带因特网接入试验性服务。例如,深圳率先将新建网络达到 1000MHz ,每个 CMTS 设备预计连接 300 户用户。链接: CMTSCM
52、TS( Cable Modem Terminal Systems,电缆调制解调器终端系统),是管理控制 Cable Modem(电缆调制解调器)的设备。C、优缺点采用电缆调制解调器在HFC 网上架构宽带接入网的优点是:可以利用已有的 HFC 网,只需要对同轴电缆网进行双向改造;可以使用有线电视台机房等。缺点是:需要进行 HFC 网的双向改造,工程施工和系统调试较为复杂,不可见因素较多。此外,还需要投资建立一个维护队伍,以保障网络的正常运行。从发展前景来看,其带宽进一步提高的潜力是有限的,不可能满足每一户接入速度达到 100Mbps 或今后 1Gbps 的需求。HFC 和 ADSL 这两种接入方
53、案的共同特点是利用已有的网络基础设施。它们各有自己的优点和用户群,在一段时间内将发挥一定作用。它们之间将存在既是相互竞争又是相辅相成的关系。它们共同的缺点是带宽进一步扩展能力有限,而且无法建设独立的社区内部网络平台。、高速以太网A、接入方式以太网,是应用最为广泛的局域网络传输方式。它采用基带传输,通过双绞线和传输设备,实现10M/100M/1Gbps 的网络传输;应用非常广泛,技术成熟。从最初的同轴电缆上的共享可以肯定,以太网络技术还将以更高的速度不断发展和提高。在北美,家庭的宽带接入一般很少采用构建以太网的方式。这是因为,住宅一般较分散,以太网方式成本较高。但是在中国,城市人口居住相当密集,90%以上是多层、高层住宅群,以太网方式就有了相对低成本的优势。尤其对于新建小区,采用综合布线构建以太网,优势更加明显。对于已经建成的社区,如要采用以太网社区接入解决方案则需要重新进行数据网络结构化布线。这对于高档社区的用户,可能是无法接受的。 10Base-S 网络方案则可利用社区现有的电话线布线系统组建社区网络,提供全双工 10Mbps 的网络速率。 10Base-S解决方案利用现有的电话线路,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度智能城市建设内部股权转让协议范本
- 2025年度商业空间窗帘设计、安装及后期维护合同4篇
- 2025年美团电商平台用户隐私保护与数据安全协议
- 2025版小区房屋装修智能家居系统安全评估与认证合同2篇
- 2025年度新能源项目用地承包及转让合同协议书4篇
- 2025年度门窗行业环保检测与认证服务合同4篇
- 二零二五年度外教合同终止与清算协议合同
- 二零二五年度土地租赁合同(农业开发)4篇
- 二零二五年度锚具市场推广合作合同4篇
- 展会现场观众组织与服务合同(2025版)2篇
- 2024年秋季学期学校办公室工作总结
- 铺大棚膜合同模板
- 长亭送别完整版本
- 2024年英语高考全国各地完形填空试题及解析
- 智能养老院视频监控技术方案
- 你比我猜题库课件
- 无人驾驶航空器安全操作理论复习测试附答案
- 建筑工地春节留守人员安全技术交底
- 默纳克-NICE1000技术交流-V1.0
- 蝴蝶兰的简介
- 老年人心理健康量表(含评分)
评论
0/150
提交评论