信息技术快报 内部快报_第1页
信息技术快报 内部快报_第2页
信息技术快报 内部快报_第3页
信息技术快报 内部快报_第4页
信息技术快报 内部快报_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 内部刊物 信息技术快报 Inforrmatioon Technoology Letteer2005年 第第3卷 第11期 (总第第20期)出版日期: 22005年11月6日目 录一 关于超级级计算与能力力服务的战略略思考 (1)二 面向方面面(aspeect)的程程序设计方法法(9)三 本体论的的研究和应用用现状(13)四 基于图形形处理器的通通用计算技术术(25)五 新书报道道 (36)关于超级计算与与能力服务的的战略思考李国杰近两年,超级计计算机研究又又一次形成热热潮。20004年11月月超级计算国国际会议(SSC20044)召开前,美美国和日本几几家公司你追追我赶,相继继宣布研制成成功

2、速度最快快的超级计算算机,从一个个侧面反映了了发达国家对对超级计算的的重视。最近近,美国科学学院、工程院院等机构组织织了十多名权权威学者经多多次研讨后,提提交了一份长长达227页页的建议报告告(“Gettiing Upp to SSpeed The FFuturee of SSuperccomputting”,以下简称称“未来超级计计算”报告),要要求政府增加加科研经费,进进一步重视以以定制技术为为主的超级计计算机研制。在在这种形势下下,根据国内内需求和技术术发展趋势,我我国高端计算算机研究应当当如何定位,应应当确立什么么样的发展目目标,这是摆摆在我们面前前迫切需要回回答的问题。本本文论述中国

3、国发展超级计计算机原则上上应当是系统统适应应用,而而不是应用去去适应系统;应根据我国国的实际需求求优化设计,有有重点地进行行创新突破,不不能盲目追随随美国的科研研方向。计算算所在计算机机系统研究方方向的重点目目标应当是研研制大幅度降降低信息化成成本的信息处处理和信息存存储能力服务务器。以“系统适应应应用”为原则,有有重点地突破破技术瓶颈,发发展满足国内内需求的超级级计算机。日本NEC公司司推出每秒336万亿次LLinpacck运算速度度的地球模拟拟器并行向量量超级计算机机,如同当年年苏联率先发发射成功人造造卫星一样,对对美国计算机机界产生巨大大冲击。美国国从事超级计计算机研制和和应用的学者者纷

4、纷写文章章、提建议,检检讨美国为什什么落后于日日本,批评政政府没有持续续地支持研制制适合科学计计算的超级计计算机。“未来超级计计算”报告,透彻彻分析了为什什么采用大宗宗商品化(ccommoddity)的的PC服务器器不可能构成成效率高的超超级计算机,指指出了突破存存储器带宽等等技术瓶颈的的必要性,同同时呼吁美国国政府增加超超级计算机研研制与应用方方面的科研投投入,表达了了美国要做超超级计算领头头羊的决心。本本节下面的论论述采用上述述报告中提供供的相关材料料。超级计算机的三三种类型。一年多前,计算算所就提出超超级计算机有有三种类型,或或者说有三种种发展模式:一种是“核武器”模式-追追求最高计算算

5、性能,成本本不作为主要要考虑因素;第二种是“高科技武器器”模式-有有重点的采用用新技术,追追求较高的性性能价格比;第三种是“常规武器”模式-即即国际上称为为Beowuulf 1994年,美国航空航天总署的戈达德(Goddard)太空飞行中心的科技人员建造了世界上第一组PC机群超级计算机,当时的目标只是达到1G(10亿)次浮点运算(GFLOPS),只是现在个人电脑的运算水平。可是当时达到这一水平的商用超级计算机价格是100万美元,研究人员用不起,只好自己动手攒,他们给自己攒的这台PC机群起了个名字:Beowulf。Beowulf是英国中世纪史诗中的一位英雄,这位英雄砍断怪兽Grendel的一肢,

6、从而打败了这一巨兽。从此以后,科学家们把自己攒的机群系统叫做Beowulf系统。的机群群模式,采用用商品化的部部件,主要追追求低成本。无无独有偶,“未来超级计计算”报告也将超超级计算分为为三种类型,与与我们的分类类十分类似:第一种是全全定制模式,追追求最短的ttime-tto-sollutionn,节点与互互联网都自己己做,代表产产品就是日本本的地球模拟拟器。第二种种是部分定制制模式或叫混混合模式,节节点和互联网网等部件都自自己做一部分分也买一些现现成商品,代代表产品是目目前世界最快快的超级计算算机IBMM的Bluee Genee/L,第三三种就是非定定制机群,即即Commoodity Clu

7、s 1994年,美国航空航天总署的戈达德(Goddard)太空飞行中心的科技人员建造了世界上第一组PC机群超级计算机,当时的目标只是达到1G(10亿)次浮点运算(GFLOPS),只是现在个人电脑的运算水平。可是当时达到这一水平的商用超级计算机价格是100万美元,研究人员用不起,只好自己动手攒,他们给自己攒的这台PC机群起了个名字:Beowulf。Beowulf是英国中世纪史诗中的一位英雄,这位英雄砍断怪兽Grendel的一肢,从而打败了这一巨兽。从此以后,科学家们把自己攒的机群系统叫做Beowulf系统。实际上,超级计计算机和汽车车等其他产品品一样有两种种不同方向的的追求。一种种是所谓Caap

8、abillity SSuperccomputting,追追求在最短的的时间内解决决某一个特定定的问题。对对于涉及国家家安全的紧迫迫问题或者某某些对响应时时间要求很苛苛刻的实时应应用,我们的的需要就是最最高的计算能能力。为了获获取这种无法法替代的计算算能力,如同同制造速度最最快的赛车一一样,成本可可降低为次要要因素。世界界上大多数最最高档的超级级计算机都属属于这种类型型。另一种类类型国外称为为Capaccity SSuperccomputting,可可翻译成高生生产力超级计计算机。这一一类超级计算算机往往同时时进行几个作作业,追求每每单位成本有有较高的持续续性能(Suustainned Peer

9、formmance)。大大多数中低档档的超级计算算机都属于这这一类型。所所谓Beowwulf机群群只是Cappacityy Supeercompputingg的一种追求求低成本的极极端例子,如如同小轿车中中的夏利。美国学术界和IIBM、CRRAY、SUUN等公司普普遍认为美国国应重点做CCapabiility Superrcompuuting,理理由是地球模模拟器持续性性能可达到峰峰值性能的33050,而Commmoditty Cluuster做做大型科学计计算的持续性性能只有峰值值性能的510,相相差3100倍。简单地地扩大Cluuster规规模,不可能能实现持续性性能达到一千千万亿次(PP

10、etafllops)的的超级计算机机。每一类科科学问题都有有其固有的并并行性。在并并行机上算过过题的人都有有体会:当并并行机规模(处处理机数目)扩扩大到一定程程度时,再扩扩大机器规模模已无济于事事。性能不但但不提高,由由于通信开销销增加性能反反而会下降。此此时想提高并并行机性能只只有增加求解解问题的规模模,这又受到到存储容量的的限制。因此此,用商品化化服务器做超超级计算机一一定会有一个个性能上限。目目前这个上限限大概是几十十万亿次。要要构建更高性性能的超级计计算机,必须须做艰苦的科科研与技术创创新,想用简简单的Cluuster来来对付肯定是是不行的。我国一段时间内内把超级计算算机等同于简简单的

11、机群系系统,把超级级计算机的科科研变成简单单的采购。8863计划只只出一半硬件件成本费,科科学院自曙光光2000以以后也没有支支持过计算所所做通用高性性能计算机研研制,使计算算所几乎无法法做重大的技技术突破与预预研。现在情情况有所转变变,最近科学学院已同意给给一笔高性能能计算机的预预研经费。本本文不必再多多费笔墨论证证Beowuulf不等于于超级计算机机。但上面的的简单分析没没有说清楚究究竟重点应做做第一种类型型还是第二种种类型超级计计算机。要说说清这件事要要对超级计算算机的技术瓶瓶颈做一些具具体分析。超级计算机的技技术瓶颈分析析超级计算机的技技术瓶颈包括括:处理器的的浮点处理能能力、处理器器

12、到各级Caache和随随机存储器的的带宽与延迟迟、随机存储储器的存取时时间(即meemory wall)、磁磁盘存储器带带宽、节点间间互连网络带带宽与延迟等等。其中有些些瓶颈与微机机、一般服务务器是共同的的,例如meemory wall、磁磁盘存储带宽宽等。对某些超级计算算机应用,如如等离子体物物理、三维动动画等,浮点点处理能力可可能是最关键键的瓶颈。事事实上所谓超超标量(Suuper SScalarr)和超流水水线(Supperpippeliniing)等先先进的RISSC技术主要要也是致力于于提高浮点处处理能力。流流行了很多年年的Linppack性能能测试标准(也也是评价超级级计算机TOO

13、P500的的标准),主主要也是测试试浮点处理能能力。由于对对存储器带宽宽和I/O带带宽重视不够够,Linppack值很很高的超级计计算机往往在在实际运行时时性能欠佳。因因此,SC22004大会会上已宣布今今后将不再用用Linpaack值评选选TOP5000,改用更更能反映存储储器与I/OO带宽及延迟迟的HPC Challlenge新新标准。Prrincetton大学的的著名学者李李凯教授今年年参加计算所所综合质量评评估时曾建议议:不用通用用CPU而改改用浮点处理理能力极强的的图形处理专专用芯片做超超级计算机的的处理器。这这是一个很有有价值的建议议,可大大提提高超级计算算机的性能价价格比。不论是

14、最近提出出的“未来超级计计算报告”,还是前两两年IBM、AArgonnne国家实验验室等单位联联合提出的BBlue PPlanett计划;不论论是IBM 正在开展的的PERCSS Productive, Easy-to-use, Reliable Computing System项目还是SSUN公司的的Hero项项目,强调最最多的超级计计算机的瓶颈颈都是存储器器带宽和延迟迟。日本的地地球模拟器最最吸引人之处处也是比商品品化服务器的的存储带宽高高得多。微处处理器浮点处处理能力的增增长遵循摩尔尔(Moorre)定律,近近十几年平均均每年增长559%,从11988年到到2004年年,浮点速度度增长了

15、10000倍。但但从19822年到20004年,存储储器带宽每年年平均增长338%,从11995年开开始,下降到到每年只增长长25%。存存储器带宽增增长慢并不是是技术上做不不到。实际上上2001年年微处理器的的带宽就可以以做到38GGbps。为为什么不把存存储器带宽提提高得快一些些呢?道理很很简单,高带带宽意味着高高成本。PCC服务器的存存储器带宽目目前一般在55GB/S以以下,如果做做到地球模拟拟器的每秒332GB水平平,也就卖不不出去了。商商品化的服务务器为了解决决性能与成本本的矛盾,采采取了分层的的存储器结构构,即在处理理器与主存储储器之间加了了几级缓冲存存储器(Caache)。随随着微

16、处理器器速度不断提提高,有Caache级数数越来越多的的发展趋势。对对于时间和空空间局部性较较好的应用,比比如矩阵计算算或带大量循循环的计算,即即使主存的带带宽不太宽,分分层的存储器器系统也能供供得上计算对对数据的需要要。但是,对对于不规则的的存取,比如如单独取某一一个只用一次次的数据,CCache系系统也要一次次取64或1128个字节节,造成极大大浪费(极限限情况浪费994%存储带带宽)。也就就是说,这种种情况下,存存储器的有效效带宽非常低低。这就是为为什么对某些些有大量不规规则存取的应应用,Beoowulf机机群的实际运运行效率非常常低。而并行行向量机则是是通过高成本本来换取高存 Prod

17、uctive, Easy-to-use, Reliable Computing System存储器的延迟每每年也只下降降5.5%左左右,远低于于摩尔(Mooore)定定律的发展速速度。19888年一次浮浮点运算需要要6个存取周周期时间才能能完成,而到到2004年年,一个存取取周期内可以以做100次次浮点运算。这这就是说,必必须一次同时时取出1000个64位字字才能与浮点点处理器的能能力相匹配。众众所周知的MMemoryy Walll已成为制约约计算机(不不仅是超级计计算机)发展展的主要瓶颈颈。除了向量量处理技术外外,多线程技技术是所谓延延迟隐藏(LLatenccy Hidding)的的重要途径

18、。当当一个线程因因等待数据而而挂起时,可可立即启动另另一个数据已已经到达的线线程,使处理理器一直忙着着。据预测,到到2010年年,一颗微处处理器芯片中中可装4-88个处理器,每每个处理器可可执行2-116条线程。到到2020年年,每颗微处处理器芯片中中可装64-128个处处理器,每个个处理器可执执行16-1128线程。这这种片内多处处理器(CMMP)技术是是微处理器技技术发展的主主要趋势,其其优点之一就就是大大减轻轻存储带宽的的压力。节点间互连网络络曾经是并行行计算机研究究最热门的方方向。我在普普度大学读博博士时,H.J.Sieegel 教教授每年都开开“Interrconneectionn

19、Netwwork”这门博士生生课程。在很很长一段时间间内,有关节节点间互连网网络的论文在在并行处理和和体系结构国国际会议文集集中占很大比比例。现在国国际上还有一一种学术期刊刊叫“Interrconneectionn Netwwork”,我还是这这份国际期刊刊的编委。我我国计算机界界对一台新研研制的超级计计算机是否有有创新,也特特别注重互连连网络是不是是自己做的。对对于至今超级级计算机的CCPU还要依依靠进口的中中国,以是否否自己做互连连网来区分第第二种类型和和第三种类型型超级计算机机似乎无可厚厚非。但不同于通信产产业,计算机机产业链的垂垂直分工已非非常明显。近近几年已冒出出来一些专门门做互连网

20、络络的公司,如如美国的Myyrinett公司等。尽尽管其产品的的性能还低于于最高档超级级计算机的互互连网络,但但由于许多第第三方并行软软件开发商在在Myrinnet网络上上开发、移植植并行软件,使使其软件逐渐渐丰富。有些些用户(比如如上海超级计计算中心)为为了获得更多多应用软件与与系统软件,坚坚持要买这种种成熟的互连连网络。这说说明,不但用用Commoodity服服务器有市场场竞争力,CCommoddity互连连网络也有市市场竞争力。由由于互连网络络公司能批量量生产,一般般比我们单独独研制一台机机器的互连网网络要便宜。这这里又遇到性性能与成本的的折衷。如果果我们的目标标是做一台最最高性能的机机

21、器,选择自自己设计互连连网络是可取取的。但如果果我们的目的的是做在市场场上竞争的超超级计算机,是是购买商品化化的互连网络络还是自己做做就得考虑成成本。Infinibband标准准的制定和产产品问世,为为研制生产超超级计算机提提供了新的互互连网络选择择。Infiinibannd的带宽已已达到20GGb以上,已已经与IBMM自己做的专专用互连网络络性能差不多多。今后除了了研制第一类类超级计算机机,采用Innfinibband做互互连网络的公公司可能会越越来越多。在在这种形势下下,创新不创创新只看做不不做自己独创创的互连网络络恐怕就有点点片面了。计算所是一个科科研单位,但但每次拿到研研制机器的科科研

22、经费不足足硬件成本的的一半,只能能按用户要求求做互连网络络。因此曙光光4000AA按用户需求求采用Myrrinet也也就不足为奇奇了。但计算算所仍然用创创新工程经费费的支持一直直坚持做互连连网络技术研研究,包括光光互连的研究究。计算所自自己设计研制制的互连网络络性能已超过过Myrinnet,但只只有在批量较较大时,成本本才会有竞争争优势。 不同的应用需要要突破不同的的技术瓶颈不同的应用对系系统结构的要要求是不同的的。至今世界界上还没有一一个万能的体体系结构完全全适合所有的的应用。对于于批量很大的的PC服务器器和RISCC服务器,厂厂商为了从规规模效应中赚赚利润,只能能根据市场需需求较大的应应用

23、设计较通通用的体系结结构,这时用用户的应用只只能努力适应应较固定的体体系结构。商商场的规律是是“店大欺客,客客大欺店”,对于买主主非常少的超超级计算机,事事情就反过来来了,系统结结构就要服从从应用的要求求。IBM的的Blue Gene/L为什么敢敢采用性能只只有通用CPPU 1/33的嵌入式CCPU PoowerPCC440做处处理器和高组组装密度的大大规模并行结结构(全机有有32K个处处理器),就就是因为主要要用于蛋白质质折叠计算,对对浮点处理能能力要求不高高但并行度很很高。下面的表一列出出了几种应用用的技术瓶颈颈,从中可以以看出不同的的应用对超级级计算机的要要求很不一样样。表中FPP表示浮

24、点计计算能力,MMS表示主存存规模,MBB表示存储器器带宽,MLL表示存储器器延迟,IBB表示互连网网络带宽,IIL表示互连连网络延迟。(表表一)超级计算机没有有必要做成万万能、通用。对对应用非常明明确的用户,研研制针对性强强的专用超级级计算机可能能是一条又省省钱又实惠的的好办法。计计算所为华大大基因中心研研制的生物计计算超级计算算机曙光40000H处理理能力超过44万亿次,研研制经费只花花了600万万元。其他的的应用部门也也可以考虑发发展面向本行行业的超级计计算机系统。曙曙光公司就具具备这种针对对行业需求优优化体系结构构的集成创新新能力,在石石油、气象等等行业已成功功地打开了局局面,这是我我

25、国发展高端端计算机的重重要思路。我国发展超级计计算机要走什什么路在“未来超级计计算”等报告中,美美国学者较多多地强调要重重点研制全定定制的最高水水平超级计算算机,强调商商品化服务器器节点不适合合做超级计算算机。从技术术上讲这种分分析有道理,但但其中也有要要拉开与日本本的距离做超超级计算机霸霸主的政治考考虑。我国的的国情不同于于美国,目前前我国大多数数用户购买超超级计算机的的经费预算还还不到日本地地球模拟器造造价的1/1100(地球球模拟器造价价超过4亿美美元)。在我我国,三种类类型的超级计计算机都有发发展空间。CCommoddity机群群是19977年出现的,现现在不但占据据了超级计算算机的大

26、部分分市场,而且且在TOP5500的前220名中也占占了12台。虽虽然采用商品品化的节点和和互连网络,但但在系统优化化配置、监控控、特别是软软件开发等方方面仍有创新新空间。这类类工作主要应应由企业完成成,不宜再列列入863等等高技术计划划。这两年我国通用用CPU的研研制有较大进进展。到20005年底,龙龙芯2D的性性能将与2GG主频的奔腾腾4差不多,完完全可以用来来研制超级计计算机与服务务器。也就是是说,“十一五”期间,我们们已有条件研研制全定制的的超级计算机机。但是不是是一定要研制制并行向量机机,是不是一一定要不计成成本研制世界界上最高水平平的计算机还还需要认真论论证。如果国国家确有某种种特

27、殊需求,采采取部分定制制的方式无法法满足需求,花花大钱做一台台也无可非议议。一般而言言,我国的重重点应放在第第二类(部分分定制)超级级计算机。根根据有所为有有所不为的原原则,按照用用户实际需求求重点突破必必须突破的技技术瓶颈。至至少计算所要要重点做第二二类超级计算算机,即我们们称之为“高科技武器器”型的超级计计算机。不是是追求达到解解决特定问题题的计算速度度世界第一,而而是让用户花花几千万元能能真正获得最最大的效益。超级计算机研究究有很强的溢溢出效益。今今天大部分微微机技术甚至至一些通信技技术都来源于于过去的超级级计算机研究究。最近IBBM等公司在在PERCSS等项目中开开展了一系列列大胆创新

28、的的原理性研究究。比如他们们正在研制的的SCM(SStoragge-Claass Meemory)将将使外存速度度提高500010000倍,达到现现在随机存储储器的速度但但价格比主存存低得多。这这种Disrruptivve(颠覆性性)创新发明明正是我们所所需要的技术术突破。瓶颈颈既是对我们们的挑战,也也是我们创新新的机遇。计计算所一定要要加强体系结结构方面的前前瞻性研究,重重视技术积累累,不能人云云亦云,盲目目随大流。长期以来8633计划没有把把超级计算机机当成有巨大大牵引力的前前瞻性研究,而而是当成采购购一台机器,这这种短视的做做法应当尽快快改变。计算所的努力方方向之一是第第三代机群系系统如

29、果把80年代代的VAX机机群称为第一一代机群,990年代IBBM的SP22看成第二代代机群的起点点,那么我们们现在要做的的就是不同于于第二代的第第三代机群。第第三代机群要要突破的关键键技术包括降降低成本、降降低功耗、提提高可用性、提提高I/O能能力,从而提提高实际应用用效益,提高高组装密度等等等。在这些些研究方向中中计算所的重重点是提高生生产力价格比比和机群的可可用性,使工工业标准机群群真正成为生生产性系统,在在本行业应用用中真正发挥挥第一生产力力的作用。所谓生产力价格格比不是实验验室运行Liinpackk等测试程序序反映出来的的性能价格比比,而是指单单位成本、单单位功耗、单单位空间机群群能提

30、供给用用户的实际生生产力(Prroducttivityy)。所谓高高可用是指计计算机机群能能像其他机械械与电器设备备一样长时间间不停机地工工作。目前一一台PC服务务器的平均无无故障运行时时间一般是几几年,用几千千台PC服务务器构成的机机群平均几小小时就会有一一个节点出故故障。如果不不采取容错或或其他高可用用技术,这种种机群无法真真正在生产性性应用中派上上用场。计算所近三年左左右的目标是是使工业标准准机群系统的的性能和组装装密度提高一一个数量级(22007年达达到100万万亿次水平),成成本和功耗降降低一个数量量级,可靠性性提高一个数数量级,使得得大规模机群群的可用性达达到99.999%(比现现

31、在提高1000倍)。要要达到这些目目标,必须在在体系结构、硬硬件和系统软软件设计等方方面做出别人人意想不到的的创新。智能能中心把传统统的机群结构构称为“玻璃天花板板”。现在天花花板已被捅破破,创新的空空间非常大。我我很同意徐志志伟副所长的的判断:“今后2-44年是我们计计算所在计算算机系统与软软件领域做出出经得起历史史考验的科研研成果的前所所未有的时机机。”我们一定要要抓住这一有有利时机,使使计算所系统统研究走到世世界的前列。二、能力服务器器大幅度降降低成本的网网格计算机一讲超级计算机机,人们习惯惯上都与大型型科学计算联联系起来。实实际上世界高高端计算机只只有不到100用户做科科学计算。目目前

32、TOP5500的计算算机有一半以以上安装在企企业(其中只只有少部分做做科学计算,多多数不是科学学计算)。实实际上世界最最大的几台CClusteer系统都是是用于Webb搜索和Innterneet服务。这这些机器从不不测Linppack,所所以都不在TTOP5000中。曙光已已销售近20000套机群群,很大的比比例用于Innterneet服务(包包括内容处理理),因此也也未列入国内内统计的TOOP100。既既然大多数计计算机用在学学校、企业、机机关,我们为为什么不想一一想什么样的的体系结构才才适合这类应应用?为了区区别于超级计计算机,我们们曾经把曙光光2000/3000等等称为“超级服务器器”。

33、我们的问问题是:超级级服务器应该该做成什么样样子?计算机(服务器器)是什么?计算机不过过是提供信息息处理能力(包包括计算能力力)、存储能能力和通信能能力的一种数数字化工具。我我们真正需要要的不是计算算机,而是信信息处理、存存储和通信能能力。上世纪纪80年代以以来,由于个个人生活的需需要,个人计计算机(PCC机)蓬勃发发展,使得PPC机几乎成成了计算机的的代名词。得得力于Inttel和微软软公司的市场场运作,人们们不知不觉将将个人计算机机变成了每个个单位的工作作终端机;而而把放大了的的PC机,去去掉显示器叫叫做服务器,这这就基本上构构成了今天的的计算机世界界。有谁认真真测试过,一一天24小时时,

34、我们办公公桌上PC机机中的CPUU、存储器有有多少时间真真正在工作,我我们机房中服服务器的信息息处理和存储储能力究竟发发挥了多少(见见图一、图二二)?如果更更深入一些,考考虑机器中的的全部门电路路,平均每一一时刻究竟又又有多少门电电路在实际工工作?我们每每天的工作就就是上网看EEmail ,发Emaail,通过过eb查资资料、编程序序、写文档,我我们需要的就就是一种能为为全体工作人人员提供这些些能力的数字字化电子系统统。假如现在在世界上没有有PC机,没没有PC服务务器,我们能能不能只用计计算所现有硬硬件资源的11/10(比比如说1000个高性能CCPU、500GB随机存存储器、2TTB磁盘)设

35、设计完全新型型的信息处理理能力服务器器、存储能力力服务器和通通信能力服务务器,使之满满足全所科研研工作的需求求?这似乎是是天方夜谭,但但在网络如此此发达的今天天,我们为什什么不能抛开开已被固化的的思维模式大大胆尝试一下下新的计算机机运行模式?研究超级计算机机的学者通常常面临的是要要求解一个规规模巨大或者者非常复杂的的问题。他们碰到的的难关总是资资源不够,要要想方设法用用上更多的处处理器和存储储单元;他们们的思路是尽尽量多占有资资源,而且要要考虑十分烦烦人的同步与与一致性等问问题。在共享享存储环境下下,一个处理理机修改了CCache必必须让所有的的处理机都知知道,否则算算出来结果就就不对。而对对

36、大多数企业业、机关、学学校、研究所所而言,不是是致力于求解解一个大问题题,而是要计计算机响应每每个人各自不不同的任务请请求命令。我我们现在面临临的局面不是是资源不够,而而是大部分时时间资源闲置置;我们需要要的不是多占占有别人的资资源,而是如如何尽快释放放自己的资源源让别人用,当当我们需要资资源时又能立立即得到。这这是与超级计计算机完全不不同的用户要要求,需要一一种能大幅度度节约信息化化成本的能力力服务器。这这应当是今后后几年中计算算所做CPUU、高端计算算机系统、网网络和网格研研究的共同努努力方向。在过去两年中,计计算所提出了了与国内其他他学者不同的的一种网格理理念:所谓网网格是指把一一台计算

37、机中中的各种部件件(CPU、存存储器、磁盘盘等)和资源源都独立上网网,形成相对对独立管理的的能力服务器器。从这种意意义讲,未来来的信息系统统运行模式不不是大量PCC机和服务器器连成网络,而而是能力服务务器与各种新新型终端构成成一台网格计计算机。就一一个单位而言言,整个计算算所的信息资资源就是一台台大的网格计计算机。如果处理器和存存储器分别集集中放在不同同的机柜(处处理器机柜中中应有少量存存储器,存储储器柜中也应应有少量处理理器),对资资源共享与管管理肯定会有有很多好处,但但这是与Prrocesssor inn Memoory(PIIM)正好相相反的思路。做做超级计算也也许需要CPPU离memm

38、ory越近近越好,但在在我们的工作作环境中,CCPU实际上上已经不是“中央”。也许把存存储器改为中中央更合适,即即Centrral Meemory Unit (CMU)或Centtral SStoragge Uniit(CSUU)。为什么么我们不能以以存储器为中中心来考虑新新的体系结构构呢?当然,跨跨机柜的延迟迟会不会导致致我们的需求求不能满足,还还要做大量的的实验来验证证。如果采用用光互连,机机柜之间的带带宽应该不成成问题。总之之,能力服务务器怎么做还还有很大的想想象空间,有有十分广阔的的创新余地。工工程中心的网网络存储已经经成功运行一一年多并已走走向市场,至至少在磁盘独独立上网方面面我们已

39、走出出了坚实的一一步。只要我我们认准方向向,持之以恒恒地做研究,一一定会有令人人拍手称快的的好结果。作者介绍:李国杰:19443年5月生生于湖南邵阳阳,19688年毕业于北北京大学,11981年获获中国科学院院工学硕士学学位,19885年获美国国普渡大学博博士学位。1198511986年间间在美国伊利利诺依大学CCSL实验室室作博士后,研研究计算机体体系结构。11987年回回到中国工作作于中国科学学院计算技术术研究所,11989年被被该所聘为研研究员。19990年被国国家科委选聘聘为国家智能能计算机研究究开发中心主主任,并担任任国家高技术术计划(8663计划)智智能计算机主主题专家组副副组长。

40、近十多年,主要要致力于并行行处理、计算算机体系结构构、人工智能能等领域的研研究并发表了了100多篇篇学术论文,合合著了4本英英文专著。目目前担任英文文版计算机学学报主编。几年来,主持研研制成功了曙曙光1号并行行计算机,曙曙光10000大规模并行行机曙光20000、曙光光3000超超级服务器和和曙光天演系系列计算机,领领导计算所研研制成功龙芯芯CPU并主主持科学院重重大项目IPPv6网络研研究。其中,曙曙光1号获11994年中中国科学院科科技进步特等等奖和19995年国家科科学技术进步步二等奖;曙曙光10000获得19996年中国科科学院科技进进步特等奖和和1997年年国家科学技技术进步一等等奖

41、。曙光22000和曙曙光30000分别获得22001年和和2003年年国家科技进进步二等奖。11994年获获得首届何梁梁何利基金科科技进步奖,11995年被被选为中国工工程院院士。22000年被被评为全国先先进工作者。22001年获获得美国普度度大学杰出校校友奖。20002年当选选第三世界科科学院院士。李国杰院士现任任中国科学院院计算所所长长、中国计算算机学会理事事长、全国人人大代表、8863信息领领域专家委员员会委员、国国家信息化专专家咨询委员员会委员。面向方面(asspect)的的程序设计方方法 程 虎摘要 面向方方面的程序设设计(AsppectOOrientted Prrogrammmi

42、ng, AOP)是是一种很有前前途的新型程程序设计方法法,它是面向向过程、面向向对象方法的的进一步发展展。通过引入入方面概念,改改进关注点的的分离(seeparattion oof conncernss),减少代代码缠结(ccode ttangliing)解决决横切关注点点(crosss cuttting conceerns)的的问题,提高高软件质量和和效率。自1997年AAOP以来的的7年间,全全球已开展大大量有关研究究与开发工作作,并自20002年起每每年召开专门门的国际学术术会议(Innternaationaal connf .onn AspeectOriennted SSoftwaar

43、e Deeveloppment,AOSD)探探讨问题,交交流取得的成成果。关键词 方面,面面向方面的程程序设计(AAOP),关关注点,横切切关注点,面面向方面的软软件开发(AAOSD)。引言计算机软件包括括程序及其文文档。程序设设计包括设计计、编制和调调试程序的方方法与过程。程程序设计方法法涉及用于指指导程序设计计工作的原理理和原则,以以及基于这些些原理和原则则的设计方法法和技术。数数十年来,经经历公式翻译译、过程式程程序设计、结结构化程序设设计、逻辑式式程序设计、函函数式程序设设计以及面向向对象程序设设计等。程序序设计方法学学可以对程序序设计人员选选用具体的程程序设计方法法起指导作用用,而具

44、体的的程序设计方方法对象程序序设计工作的的质量以及所所设计出来的的程序(即软软件)的质量量影响巨大。世间事物总是在在不断发展变变化,螺旋式式上升。程序序设计方法也也如此,近年年来流行面向向对象程序设设计方法。面面向对象的方方法起源于面面向对象的编编程语言,可可以追溯到220世纪600年代后期的的Simulla67语言言。到20世世纪末,面向向对象方法已已逐步发展成成为一类完整整的方法学和和系统化的技技术体系。它它不仅指导编编程设计,还还指导开发操操作系统、数数据库、网络络和编译系统统等。使用面向对象语语言来实现面面向对象设计计相对而言比比较容易,用用非面向对象象语言也可实实现面向对象象设计。也

45、有有这种情况,即即使用了面向向对象语言,但但由于未掌握握面向对象的的思维方法,开开发出来的软软件也未必是是面向对象的的。所以说,掌掌握面向对象象的编程思想想方法,如同同获得练气功功的真谛,它它的重要性往往往胜过了对对编程语言的的选择。面向对象方法有有诸多优点,如如使软件体系系结构良好,便便于软件构件件化、软件复复用和软件维维护等。但经经过这么多年年实践摸索,人人们也发现面面向对象方法法有其不足,如如许多软件系系统不完全都都能按系统的的功能来划分分构件,要完完成的业务功功能只是核心心级关注点(concerns),此外,还有不少系统级关注点,它们是完成核心级关注点所必须的配套设施,如日志记录、跟踪

46、、出错处理和安全检测等。这些系统级关注点与核心功能级关注点有交叉(cutcross)。当系统级关注点点能相对分割割地在基本功功能中考虑和和分析时,使使用当前的面面向对象语言言导致在许多多构件中要重重复包含(扩扩散)这些代代码,源程序序就要变成一一些为不同目目的而编制的的指令的缠结结(tanggling)混混乱物。缠结现象是现有有软件系统中中许多不必要要的复杂性的的核心。它增增加了功能构构件之间的依依赖性,分散散了构件原来来假定要做的的事情,提供供了许多程序序设计出错的的机会,使得得一些功能构构件难以复用用,源代码难难以开发、理理解和发展。按软件生命周期期的阶段来说说,在设计阶阶段,以类(cla

47、ss)为单位组织建模不全面;在编码阶段,把数据和方法都封装成类,不灵活、不便复用;在维护阶段,由于缠结原因造成难理解、难维护。因此,人们就想想到面向方面面(aspeects)的的方法。这一一概念最早是是由施乐(XXerox)公公司在美国加加州硅谷PaaloAltto研究中心心(PARCC)的首席科科学家、加拿拿大大不列颠颠哥伦比亚大大学教授Grregor Kicgaales等人人首次在19997年的欧欧洲面向对象象编程大会(EECOOP 97)上提提出。基本概念2.1 方面面(aspeect)从抽象意义上讲讲,是对软件件系统构件的的性能和语法法产生一定影影响的一些属属性;从设计计上讲是横切切系

48、统的一些些软件系统级级关注点;从从实现上讲,是是一种程序设设计单元,它它支持将横切切系统的关注注点封装在单单独的模块单单位中,是AAOP将横切切关注点局部部化和模块化化的实现机制制。通过将横切关注注点集中到aaspectt中,AOPP就取得一种种单一的结构构化行为,该该行为在传统统程序中分布布于整个代码码里。在AOOP中,asspect是是一阶实体,aspect 之于AOP,正如class之于 oop。2.2 面向向方面的程序序设计(AOOP)AOP是一种关关注点分离技技术,通过运运用aspeect这种程程序设计单元元,允许开发发者使用结构构化的设计和和代码,反映映其对系统的的认识方式。要要使

49、设计和代代码更加模块块化、更具结结构化,使关关注点局部化化而不是分散散于整个系统统中。同时,需需使关注点和和系统其他部部分保持良好好定义的接口口,从而真正正达到“分离关注点点,分而治之之”的目的。类似于传统语言言的语言编译译器,asppect语言言有相应的编编织器(weeaver),它它能像编织地地毯、壁毯那那样,把各式式彩线经纬纵纵横地编织出出美丽的图案案。2.3 关注注点(conncern)关注点就是一个个特定的目标标、概念或者者兴趣域。从过程的角度,典典型的开发关关注点包括:需求分析、设设计、编码、测测试和维护。从从技术的角度度,一个典型型的软件系统统分别包含若若干个核心级级和系统级的的

50、关注点。核核心级关注点点是系统要完完成的业务功功能;系统级级关注点是完完成核心级关关注点所必须须的配套设施施,这些配套套设施通常就就认为是整个个系统的系统统特性,或者者是业务功能能的功能约束束。2.4 横切切关注点(ccrossccuttinng conncern)理解横切关注点点的好途径是是用例子来说说明。考虑把把统一建模语语言(UMLL)用于简单单的图编辑器器(Figuure Edditor)。图1. 在图编编辑器中方面面模块、模块块类模块示意意图其中有两个具体体的图元素:点和线。在在面向对象方方法中,用类类表示点和线线,这些显露露好的模块性性,每个类的的源代码是紧紧密相关(内内聚),并且

51、且类之间有清清楚和良好定定义的接口。但但是如果再考考虑这样一个个关注点:图图元素移动时时要通知屏幕幕管理器Diisplayy,这就要求求移动图元素素的每个方法法(methhod)要做做通知。图中每个方法必必须实现这个个关注点,即即点和线框中中每个方法要要实现那些关关注点。注意意,显示修改改的框既不适适合在其它框框内也不适合合环绕其它框框,我们称这这为横切关注注点。如果只只使用面向对对象程序设计计方法,实现现横切关注点点就趋向于分分散在系统各各处,如图中中所示。但是是,如果使用用AOP机制制,我们就可可以在一个单单个方面中,模模块化显示修修改行为的实实现。我们可以用一个个单个模块单单位实现这个个

52、显示修改行行为,它使得得我们容易把把它作为一个个单个程序设设计单元来思思考。有了面面向方面的程程序设计语言言机制,我们们可以在设计计级用方面来来思考构建软软件系统。需求规约(sppecifiicatioon)与设计计开发软件的重要要原则之一是是要分离各种种关注点,这这种关注点的的分离,首先先要体现在需需求分析,对对需求进行规规约,然后针针对需求规约约进行设计。前前面已经提到到,面向对象象的分析与设设计有局限性性,引入asspect概概念后,相应应的规约和设设计也要重新新考虑。Xeerox 公公司PARCC已设计开发发Aspecct J语言言,它是基于于Java语言的的AOP扩展展,既是一种种规

53、约语言,也也是一种AOOP的实现语语言。Asppect JJ使用Javva语言实现现单个关注点点,并通过对对Java进行扩扩展,提供了了编织(weeavingg)规则。实现以扩充Javaa的实现方式式为例,编织织方式有3种种:静态织入(编译译时织入):借助预编译译器对源代码码进行增强,代代表是Asppect JJ。装载时织入:修修改classs loaader,在在加载claass时对其其进行二进制制增强,代表表是J Booss AOP。动态织入(运行行时织入):利用Javaa动态代理(ddynamiic prooxy)在运运行时拦截方方法调用,织织入方面逻辑辑。大多数AAOP框架均均以这种方

54、式式实现,灵活活性强,且对对被织入模块块的侵入性较较小。代表有有Nanniing、Sprinng AOPP等。展望自1997年首首次在欧洲面面向对象会议议上提出AOOP以来的77年间,全球球已开展大量量有关研究与与开发工作,并并自20022年起,每年年春天分别在在欧洲和美国国轮流召开专专门的面向方方面软件开发发(AOSDD)国际学术术会议。第11届是20002年4月在在荷兰Ensschedee召开,第22届是20003年3月在在美国波士顿顿召开,第33届是20004年3 月月在英国Laancastter召开,第第4届将于22005年33月在美国芝芝加哥召开。前前三届的与会会者包括美国国、加拿大

55、、荷荷兰、英国、法法国、德国、比比利时、瑞士士、西班牙、爱爱尔兰、丹麦麦和日本、以以色列等。除除了Xeroox公司,美美国IBM公公司的纽约WWatsonn研究中心,德德国西门子公公司和日本东东芝公司等都都投入研发,欧欧美和日本的的许多大学也也在进行研究究,我国北京京大学和西安安电子科技大大学的软件研研究所也对AAOP给以关关注并开展了了一些研究开开发工作。从近年的发展来来看,研究开开发AOP的的角度很多,有有的研究语言言,有的研究究规约和设计计,有的研究究实现,应用用还比较少,只只是为研究而而做些实例试试验。但从各各种刊物和会会议上的报告告交流来看,提提出了许多问问题,并对不不少问题进行行了

56、深入的分分析研究,有有的已提出解解决方案,并并取得了初步步成果。面向对象方法技技术从语言角角度提出后,已已在软件技术术方面取得突突破,并独树树一帜,影响响操作系统、数数据库、编译译和网络软件件的研发。现现在AOP也也有类似情况况,已有人在在研究其对操操作系统、中中间件等的研研发作用,并并已有一些文文章发表。预预计AOP也也会对软件技技术发展产生生影响,希望望我国软件工工作者能适当当投入力量,关关注和进行AAOP的研发发工作。Kicgalees G,et all AspeectOriennted PPrograammingg, In:Proc.of thhe Eurropeann Conff .

57、on ObjecctOriennted PPrograammingg (ECOOOP),June 1997曹东刚,梅宏.面向Aspeect的程序序设计一种新的的编程范型,计计算机科学,2003 ,30(9),510高海洋,陈平. AOP综综述,计算机机科学,20002,29(10),133135Elrad TT等编,面向向方面的程序序设计专集,(共共12篇文章),CCACM,2001,44(10),289971997年以来来ECOOPP会议录中有有关AOP文章,参参见LNCSS,第12411,1445,1743,1964,2072,2374,2743,3086等卷卷,Spriinger,199

58、720042002年以来来AOSD会议议录,可见AACM或AOSD网站站:www. 或或 HYPERLINK www.aaosd.nnet。作者简介:程 虎 男,19388年生,中国国科学院软件件所研究员,博博士生导师,现现任软件所总总体部顾问及及中国计算算机学会通讯讯编委。主主要方向为计计算机语言和和编译系统的的研究与开发发和人工智能能与神经网络络的研究,还还关注软件工工程与信息技技术标准。本体论的研究和和应用现状刘红阁 郑丽萍萍 张少方摘要 “本体论论”原是哲学研研究中发展出出来的一个概概念。近年来来,本体论的的研究和应用用受到了知识识工程及相关关应用领域的的广泛关注。本本文对目前本本体论

59、的研究究和应用现状状进行了综述述,主要内容容包括:本体体的定义、发发展本体的原原因、本体的的设计原则和和方法论、本本体的描述语语言和国内本本体的研究现现状。最后本本文指出了当当前本体论研研究中存在的的一些问题和和未来本体论论研究的主要要方向。关键字 本体论论、知识工程程、语义Weeb引言“本体论” (OOntoloogy,大写写O)原是哲哲学研究中发发展出来的一一个概念,研研究客观事物物存在的本质质和组成。本本体论在哲学学定义上的主主要特点在于于本体论是关关于世界某个个方面的一个个特定的分类类体系,这个个体系不依赖赖任何特定的的语言。近年年来,随着信信息科学的飞飞速发展,本本体论逐渐用用于知识

60、工程程和信息科学学等领域之中中。本文就目前本体体论的研究和和应用现状进进行了系统介介绍和综合评评述。首先就就本体的定义义和内涵进行行了深入的讨讨论(第2节节),其次给给出了发展本本体的原因以以及本体的具具体应用领域域(第三节),介介绍了本体的的设计原则和和方法论(第第4节)、当当前主流的本本体描述语言言(第5节),讨讨论了国内本本体论研究和和应用状况(第第6节),最最后本文指出出了当前本体体论研究中存存在的一些问问题和未来本本体论研究的的主要方向(第第7节)。本体是什么?本体论(Onttologyy)和本体(oontoloogy)在英英文表示是不不一样的,即即一个用大写写的“O”开头,另一一个

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论