高性能计算与高性能计算机_第1页
高性能计算与高性能计算机_第2页
高性能计算与高性能计算机_第3页
高性能计算与高性能计算机_第4页
高性能计算与高性能计算机_第5页
已阅读5页,还剩70页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

本PPT部分内容来源于国家高性能计算中心(合肥)12024/1/12计算机学院计算机科学与技术系主讲:陈蕾博士/副教授高性能计算与并行程序设计本PPT部分内容来源于国家高性能计算中心(合肥)22024/1/12为什么要开设这门课程本课程主要涉及高性能计算和并行程序设计,其核心是并行技术并行技术与当今计算机研究和应用的热点紧密相连:1、多核技术(INTEL、AMD、IBM、SONY、SUN、NVIDIA)。当你有了16个核的处理器怎么有效利用?2、集群技术。集群系统如今随处可见,如何有效使用它?并行是唯一途径。3、超级计算机。超级计算机用于求解富有挑战性的计算问题.有效的大规模并行软件是发挥其性能的关键4、云计算、网格计算、服务计算、高性能计算、物联网技术5、大数据6、……本PPT部分内容来源于国家高性能计算中心(合肥)32024/1/12为什么要并行计算?有限时间内解决复杂计算问题汽车碰撞实验:32CPU4小时(一个工况)药物筛选:64CPU,500万化合物,一年蛋白质折叠,256CPU、2个月只能算一个纳秒过程宇宙大尺度结构模拟:256CPU,6个月过去:大量应用需求的驱动需求驱动和技术推动本PPT部分内容来源于国家高性能计算中心(合肥)42024/1/12为什么要并行计算?

今天:计算机技术发展的推动芯片上晶体管数目每18个月增长一倍?工艺:90nm65nm32nm,逼近极限主频:从3.0GHz到4.0GHz,步履艰难功耗:单芯片百瓦功耗,mini型“核反应堆”本PPT部分内容来源于国家高性能计算中心(合肥)52024/1/12并行计算平民化的到来!

每个程序员面临的多核并行计算时代在单个芯片上内置多个处理单元-“核”每个处理器视为小型的并行计算机双核四核多核

并行计算已经成为必然!本PPT部分内容来源于国家高性能计算中心(合肥)62024/1/12如何进行并行(多核)计算?思路最关键,并行思想,并行算法新的工具和实现方法MPI/OpenMP,GoggleHadoop,IntelC++,WindowsHPC等好的编程方法针对硬件结构,重视程序性能本PPT部分内容来源于国家高性能计算中心(合肥)72024/1/12现实的情况●1、需要通过显式并行的硬件系统走向普及:集群计算机、多核处理器●2、然而大家对于并行计算方法和工具了解和认识不足。为此,开设这门课程希望把并行计算作为一种通用计算技术介绍给大家本PPT部分内容来源于国家高性能计算中心(合肥)82024/1/12课程目的澄清对并行计算的认识:

●不是少数人的专利●高性能计算随着机群系统、多核处理器的出现将逐渐普及到桌面系统了解高性能计算的前沿技术发展情况锻炼基本的资料检索、文献阅读、归纳整理和口头报告的能力实实在在体验并行软件开发

●并行编程语言-实现●并行程序性能与优化-分析●并行算法设计-设计●并行程序开发流程-独立开展本PPT部分内容来源于国家高性能计算中心(合肥)92024/1/12教材和主要参考书教材:暂无(提供电子教案)参考书:[1]并行计算导论,张林波等

,北京:清华大学出版社,2006[2]并行计算:结构、算法、编程(修订版),陈国良等,北京:高教出版社,2003[3]并行程序设计(第二版),BarryWilkinson等,陆鑫达等译,北京:机械工业出版社,2005[4]MPI并行程序设计实例教程,张武生等

,北京:清华大学出版社,2009[5]多核程序设计,陈天洲等,北京:清华大学出版社,2007[6]并行计算应用与实战,王鹏等,北京:机械工业出版社,2009本PPT部分内容来源于国家高性能计算中心(合肥)102024/1/12课程安排理论并行计算机系统及其结构模型(当代对称多处理机、大规模并行处理机、机群系统)并行计算机系统的性能评测以及并行算法的设计基础、一般设计策略和一般设计过程介绍几种常见的分布式并行算法

实践典型并行计算机系统—PC机群的搭建消息传递(MessagePassingInterface,MPI)并行程序设计具体内容安排第一讲高性能计算与高性能计算机第二讲并行计算机系统及其结构模型第三讲PC机群的搭建(自学)第四讲并行算法设计的关键技术第五讲MPI并行程序设计语言第六讲并行算法设计实例本PPT部分内容来源于国家高性能计算中心(合肥)112024/1/12第一讲高性能计算与高性能计算机1.高性能计算的意义2.高性能计算的发展与现状3.高性能计算的典型应用4.高性能计算的挑战与机遇本PPT部分内容来源于国家高性能计算中心(合肥)122024/1/121.高性能计算的意义(1)1.1高性能计算的内在含义1.2高性能计算的应用需求1.3高性能计算的战略地位本PPT部分内容来源于国家高性能计算中心(合肥)132024/1/121.高性能计算的意义(2)1.1高性能计算的内在含义计算和计算科学所有的学科都转向定量化和精确化三大科学:理论科学、实验科学和计算科学计算科学是一个交叉学科,用计算的方法来解决应用问题。适用于理论模型复杂或尚未建立、实验费用昂贵或无法进行。计算物理、计算化学、计算生物学、计算地质学、计算气象学。并行计算是跟上摩尔定律的重要手段。本PPT部分内容来源于国家高性能计算中心(合肥)142024/1/121.高性能计算的意义(3)高性能计算的含义高性能计算简称HPC(HighPerformanceComputing),泛指量大、快速、高效的运算。高性能计算主要包括:向量计算并行计算分布式计算网格计算………..本PPT部分内容来源于国家高性能计算中心(合肥)152024/1/121.高性能计算的意义(4)高性能计算的量纲前缀缩写基幂含意数值KiloK103Thousand千MegaM106Million兆,百万GigaG109Billion千兆,10亿TeraT1012Trillion垓,万亿PetaP1015Quadrillion千万亿ExaE1018Quitillion百亿亿Flops:每秒所执行的浮点运算次数(floating-pointoperationspersecond)目前的PC机运算速度通常在GFlops量级,高性能计算机运算速度则在TFlops至PFlops量级。本PPT部分内容来源于国家高性能计算中心(合肥)162024/1/121.高性能计算的意义(5)1.2高性能计算的应用需求应用需求计算密集型应用(Computing-intensive):大型科学工程计算,数值模拟等。应用领域:石油、气象、CAD、核能、制药、环境监测分析、系统仿真等。数据密集型应用(Data-intensive):数字图书馆,数据仓库,数据挖掘,计算可视化等。应用领域:图书馆、银行、证券、税务、决策支持系统等。通信密集型应用(Network-intensive):协同工作,网格计算,遥控和远程诊断等。应用领域:网站、信息中心、搜索引擎、电信、流媒体等。本PPT部分内容来源于国家高性能计算中心(合肥)172024/1/121.高性能计算的意义(6)千万亿次超级计算机的应用需求应用领域应用需求计算能力需求存储容量需求生物医学蛋白质电子态的计算药物发明中的筛选过程蛋白质折叠100Tflops800Tflops1Pflops30TB200TB1PB航空航天制造发动机燃烧模拟和机翼设计模拟500Tflops100TB气候环境短期天气预报长期天气预报局部突发性灾难预报(如洪水、海啸)20Tflops200Tflops1Pflops10TB100TB500TB核能领域完全等离子分析(包括电子结构分析)核武器数值模拟天然气燃烧500Tflops1Pflops1Pflops1PB1PB1PB纳米技术复合材料的结构分析和功能预测新材料发明200Tflops1Pflops400TB2PB天体物理学超新星三维模拟1Pflops1PB国防和国家安全密码破译先进武器模拟1Pflops1Pflops1PB1PB本PPT部分内容来源于国家高性能计算中心(合肥)182024/1/121.高性能计算的意义(7)1.3高性能计算的战略地位从战略高度上讲高性能计算技术是一个国家综合国力的体现。高性能高计算是支撑国家实力持续发展的关键技术之一。高性能计算国防安全、高科技发展和国民经济建设中占有重要的战略地位。

重大挑战问题:飞机设计、药物设计、全球气候预测、人类基因、海洋环流新材料、生物分子结构、半导体建模、超导建模等。本PPT部分内容来源于国家高性能计算中心(合肥)192024/1/121.高性能计算的意义(8)高性能计算在发达国家的战略地位(1)美国有关发展高性能计算的建议报告从1982年到2005年,美国国防部、能源部、国家科学院、国家科学基金委以及美国总统信息技术顾问委员会、美国信息技术咨询委员会、美国国家竞争力委员会等提出的有关信息技术和计算机的建议报告中,大都涉及到了高性能超级计算机的内容。本PPT部分内容来源于国家高性能计算中心(合肥)202024/1/121.高性能计算的意义(9)高性能计算在发达国家的战略地位(2)清单(按年代排序)1982年,美国国家科学院:《关于科学研究及工程中的大规模计算》1993年,美国国家科学院:《从台式计算机到万亿次计算机:充分发挥美国在高性能计算领域领导权》1995年,美国国家科学院:《特别工作组关于未来国家科学基金委超级计算中心计划报告》1996年,美国总统信息技术顾问委员会:《信息技术研究:为了未来》2000年,美国国家科学院:《促使信息技术更好》2001年,美国国家科学院:《无处不在》2002年,美国国防部:《适用于国家安全部门的高性能计算》2003年,美国能源部:《基于科学的大规模模拟》

2003年,美国国家科学基金委:《通过计算机基础结构变革科学与工程》

2003年,美国国家科学基金委:《信息时代的知识丢失》2004年,美国国家竞争力委员会:《促使美国变革并提高竞争力》

2004年,美国跨机构:《联邦高端计算计划-高端计算复兴特别工作组》2005年,美国国家科学院:《超级计算机未来》

2005年,美国总统信息技术顾问委员会:《计算科学:确保美国竞争力》本PPT部分内容来源于国家高性能计算中心(合肥)212024/1/121.高性能计算的意义(10)高性能计算在发达国家的战略地位(3)美国发展有关高性能计算的行动计划1993年,美国科学工程技术联邦协调理事会:《HPCC(HighperformanceComputing&Communication)GrandChallenge》计划,提出发展万亿次(Tera=1012)计算机计划。1996年,美国能源部和LawrenceLivermore、LosAlamos、Sandia三大核武器国家实验室:《ASIC(AcceleratedStrategicComputingInitiative)》计划,提出发展千万亿次(Pera=1015)计算机的目标。1997年,HPCC包括了HECC(HighEndComputing&Communication),被扩展为CIC(Computing,Information,Communication)计划。1998年度的CIC蓝皮书,将千万亿次计算机硬件和软件研制列入了计划中。2002年启动HPCS计划,希望确定未来10到20年超级计算机的体系结构。本PPT部分内容来源于国家高性能计算中心(合肥)222024/1/121.高性能计算的意义(11)高性能计算在发达国家的战略地位(4)美国1996年提出的ASCI(AcceleratedStrategicComputingInitiative)计划。通过数值模拟,评估核武器的性能、安全性、可靠性等。高分辨率、高逼真度、三维、全物理、全系统的规模和能力。计划研制5代计算平台,目前,前四代已完成,第五代平台正在研制。随着第一个十年研究结束,已经开始为下一个十年发展制订规划。本PPT部分内容来源于国家高性能计算中心(合肥)232024/1/121.高性能计算的意义(12)高性能计算在发达国家的战略地位(5)—ASCI高性能计算机BlueMountainOptionRed本PPT部分内容来源于国家高性能计算中心(合肥)242024/1/121.高性能计算的意义(13)高性能计算在发达国家的战略地位(6)美国2002年启动的千万亿次超级计算机研究HPCS计划从2002年起的两年多时间里,ES占据TOP1位置Cluster并不是HPC的最终体系结构美国DARPA于2002年启动高生产率计算系统(HighProductivityComputingSystems)HPCS计划希望确定未来10年甚至20年的高性能计算机体系结构高生产率而非峰值计算能力作为评价指标高性能计算的一个新的创新时代的开始本PPT部分内容来源于国家高性能计算中心(合肥)252024/1/121.高性能计算的意义(14)高性能计算在我国的战略地位(1)2006年2月,国务院发布《国家中长期科学和技术发展规划纲要(2006~2020年)》指出加速发展高性能计算对提高我国国防建设与国家安全、国家经济建设、国家重大工程和基础科学研究等尖端科技领域的核心支撑能力,具有十分重要的战略意义。提出要全面提升我国的自主创新能力,以期将我国在2020年前建设成为一个创新型国家。本PPT部分内容来源于国家高性能计算中心(合肥)262024/1/121.高性能计算的意义(15)高性能计算在我国的战略地位(2)中国高性能计算发展大事记1983年,由国防科技大学研制的银河I型亿次巨型机系统的成功问世,标志着我国具备了研制高端计算机系统的能力。1992年,曙光投入200万元研制曙光一号。随后,曙光一号、曙光1000、曙光2000、曙光3000、曙光4000相继问世。1994年,银河I的换代产品银河II在国家气象局正式投入运行,其系统性能达每秒10亿次,大大缩短了我国与先进国家的差距。1997年,银河III并行巨型计算机在北京通过国家鉴定,峰值性能为每秒130亿浮点运算。1999年,首台“神威I”计算机通过了国家级验收,并在国家气象中心投入运行。2000年,由1024个CPU组成的银河Ⅳ超级计算机系统问世,峰值性能达到每秒1.0647万亿次浮点运算。2002年,世界上第一个万亿次机群系统联想深腾1800出世,获得2004年国家科技进步二等奖。2003年,联想深腾6800问世把世界机群计算推向新的高峰。2004年,曙光4000A成功研制,使中国成为继美国、日本之后第三个能研制10万亿次商品化高性能计算机的国家(进入TOP500前10位)。2005年,中国高性能计算机性能TOP100排行榜揭晓,曙光位居第一。天梭荣获国家科学技术进步二等奖。2006年,曙光高性能计算机被胡锦涛总书记点评为“中国七大标志性自主创新成果之一”,曙光4000系列高性能计算机荣获国家科学技术进步二等奖。2007年12月,中国首台采用国产高性能通用处理器芯片“龙芯2F”的万亿次高性能计算机“KD-50-I”研制成功。2008年6月24日,中国科学院计算技术研究所、曙光公司和上海超级计算中心在中科院计算所联合举行了曙光5000落户上海超级计算中心的签约仪式。本PPT部分内容来源于国家高性能计算中心(合肥)272024/1/121.高性能计算的意义(16)高性能计算在我国的战略地位(3)—国产高性能计算平台神威-I银河-II曙光-5000联想-6800本PPT部分内容来源于国家高性能计算中心(合肥)282024/1/122.高性能计算的发展与现状(1)2.1高性能计算机的发展2.2高性能计算机的现状2.3高性能计算面临的主要问题本PPT部分内容来源于国家高性能计算中心(合肥)292024/1/122.高性能计算的发展与现状(2)2.1高性能计算机的发展历史回顾本PPT部分内容来源于国家高性能计算中心(合肥)302024/1/122.高性能计算的发展与现状(3)发展过程中的主流技术607080900010巨型机萌芽CDC6600向量机鼎盛CRAY-1,SX-3MPP发展CrayT3E,OptionRed机群发展NOW,IBMSP2,ASCIQ定制机器ESBlueGene本PPT部分内容来源于国家高性能计算中心(合肥)312024/1/122.高性能计算的发展与现状(4)两类构造高性能计算机的方式采用定制部件价格较高(小于1B$市场)对大规模或通信密集的任务进行了优化设计并行向量机采用商用部件利用每年80B$的市场优势对一些计算密集任务有很好的性能MPP/机群本PPT部分内容来源于国家高性能计算中心(合肥)322024/1/122.高性能计算的发展与现状(5)并行向量机构造方式PVP采用全定制部件定制的高性能向量处理器(Gflops)节点内多体交叉共享存储(GB)定制的高带宽低延迟互连(交叉开关)本PPT部分内容来源于国家高性能计算中心(合肥)332024/1/122.高性能计算的发展与现状(6)机群构造方式机群是一组独立的计算机(节点)的集合体:机群的各节点都是一个完整的系统:工作站,PC机或SMP互连通常使用高速互连网络,如Myrinet、Infiniband等各节点可以协同工作并表现为一个单一的、集中的计算资源CPUMemoryI/OChannel...CPUMemoryI/OChannelCPUMemoryI/OChannelCPUMemoryI/OChannelCPUMemoryI/OChannelSystemAreaNetwork&StorageAreaNetwork本PPT部分内容来源于国家高性能计算中心(合肥)342024/1/122.高性能计算的发展与现状(7)2006年TOP500预测:达到Petascale本PPT部分内容来源于国家高性能计算中心(合肥)352024/1/122.高性能计算的发展与现状(8)2.2高性能计算机的现状从Top500看高性能计算机现状(2009年)最快的高性能计算机:1.105Pflops最普遍的高性能计算机:机群(410台)安装高性能计算机最多的国家:美国(291台),亚洲(49台,日本15台,中国21台,印度6台),欧洲(145台)生产高性能计算机的企业:HP(212台),IBM(188台)高性能计算机中使用最多的微处理器:Intel系列(399台),IBM(55台),AMD(43台)高性能计算机使用最广泛的领域:企业与研究结构进入500强的最低性能:17.1Tflops,半年前为12.64Tflops500强的总性能为:22.6Pflops,半年前为16.95Pflops本PPT部分内容来源于国家高性能计算中心(合肥)362024/1/122.高性能计算的发展与现状(9)2.2高性能计算机的现状从Top500看高性能计算机现状(2013年)最快的高性能计算机:33.86Pflops,前十名中:美国5台,中国2台,德国2台,日本1台;已经有26套系统的最大性能迈入了PFlops(每秒千万亿次)级别;中国上榜超算66套,之前两次分别为72套、68套,基本保持稳定,而且始终仅次于美国位列世界第二(日本30套/-2)。有了天河2,中国不但在数量上,性能上也超越日本,成为世界第二。Intel处理器还是绝对主流,份额高达80.4%。88%的系统所用处理器拥有六个或更多核心,67%的不少于八核心。500套系统总性能223PFlops,比半年前的162PFlops增长了37.6%,比一年前的123PFlops则增长了81.3%。天河2一套就占了总性能的24.6%,几乎五分之一!美国252套占了一半还多,比上次有多了2套。欧洲112套,比上次增加7套,还是不如亚洲119套(少了4套)。英国、法国、德国分别有29、23、19套。本PPT部分内容来源于国家高性能计算中心(合肥)372024/1/122.高性能计算的发展与现状(10)近几年来Top1机器2001年,为IBMASCIWHITE,LINPACK峰值为12TFLOPS,处理器数目为8192。2002年—2004年上半年,为NECEarth-Simulator,LINPACK峰值为40TFLOPS,处理器数目为5120。2004年下半年—2007年11月,为IBMBlueGene,LINPACK峰值为478TFLOPS,处理器数目为212992。2008年6月,Top1为IBMRoadrunner(走鹃),LINPACK峰值为1.026PFLOPS,处理器核数目为122400。2009年6月,Top1为IBMRoadrunner(走鹃),LINPACK峰值为1.105PFLOPS,处理器核数目为129600。本PPT部分内容来源于国家高性能计算中心(合肥)382024/1/12本PPT部分内容来源于国家高性能计算中心(合肥)392024/1/122.高性能计算的发展与现状(New)天河2号本PPT部分内容来源于国家高性能计算中心(合肥)402024/1/122.高性能计算的发展与现状(New)天河2号本PPT部分内容来源于国家高性能计算中心(合肥)412024/1/122.高性能计算的发展与现状(New)天河2号本PPT部分内容来源于国家高性能计算中心(合肥)422024/1/122.高性能计算的发展与现状(11)IBMRoadrunner走鹃(1)本PPT部分内容来源于国家高性能计算中心(合肥)432024/1/122.高性能计算的发展与现状(12)IBMRoadrunner(2)基本参数(2008年6月)6,480AMDOpteron处理器,51.8TB内存(in3,240LS21刀片)12,960IBMCell处理器,51.8TB内存(in6,480QS22刀片)216Systemx3755I/O节点

26288-portISR2012Infiniband4xDDRswitches296机架

2.35MWpower1.026PFLOPS本PPT部分内容来源于国家高性能计算中心(合肥)442024/1/122.高性能计算的发展与现状(13)IBMRoadrunner(3)混合(Hybrid)设计(2008年6月)通用处理器+专用处理器采用两种不同架构的处理器:1.8GAMDOpteron双核处理器(X86架构)6912个处理器(6480个用于计算节点,432个用于系统操作和通信节点)共13824个cores(12960+864)3.2GIBMPowerXCell8i异构多核处理器数学运算比Opteron快30倍1个通用核(PowerProcessingElement

:PPE),8个专用核(SynergisticProcessingElement:SPE)(共有9个处理器核)12960个PPEcores和103680个SPEcores共116640个cores(12960+103680)系统共有130464个cores(13824+116640)本PPT部分内容来源于国家高性能计算中心(合肥)452024/1/122.高性能计算的发展与现状(14)IBMRoadrunner(4)刀片式机群架构(2008年6月)每个Triblade包含4个刀片,一个LS21Opteron刀片,一个扩展连接刀片,两个QS22Cell刀片。LS21包含2个1.8GHz双核Opterons,16GB内存。QS22包含2个3.2GHz

PowerXCell8i处理器,8GB内存。本PPT部分内容来源于国家高性能计算中心(合肥)462024/1/122.高性能计算的发展与现状(15)IBMRoadrunner(5)一个Triblade包含4个刀片一个BladeCenterH框包含3个Triblade一个机架(rack)包含4个BladeCenterH一个连接单元CU(ConnectedUnit)包含15个机架Roadbunner包含18个CU,通过两级Infiniband互连本PPT部分内容来源于国家高性能计算中心(合肥)472024/1/122.高性能计算的发展与现状(16)ASCIBlueGene/L设计特点采用专门的System-on-a-chip技术减少功耗、体积、复杂度和设计难度实现低延迟、高带宽存储系统MPP结构可扩展到

~100k处理器采用三种互连网络:Gbit以太网用于节点内部3DTorus用于节点间树用于多播通信本PPT部分内容来源于国家高性能计算中心(合肥)482024/1/122.高性能计算的发展与现状(17)ASCIBlueGene/L构造图BlueGene/LComputeASIC

本PPT部分内容来源于国家高性能计算中心(合肥)492024/1/122.高性能计算的发展与现状(18)最快的并行向量计算机—ES体系结构:并行向量机峰值速度/存储器:40Tflops/10TB节点数/处理器数/处理器峰值:640/5120/8Gflops占地:六个篮球场大3层建筑安装时间:2002年2月主要用途:全球气候变化预测、地震预报、原子能等本PPT部分内容来源于国家高性能计算中心(合肥)502024/1/122.高性能计算的发展与现状(19)TOP500中的机群机群系统在高性能计算机中所占比例迅速增加TOP500中目前有400个机群系统TOP500中最普通的并行机体系结构导致了高性能计算机的“平民化”本PPT部分内容来源于国家高性能计算中心(合肥)512024/1/122.高性能计算的发展与现状(20)中国的高端高性能机群2008年11月,第32届HPCTop500榜曙光5000A排名第10,LINPACK峰值180.6TFLOPS联想DeepComp7000排名第19,LINPACK峰值102.8TFLOPS2009年06月,第33届HPCTop500榜曙光5000A排名第15,LINPACK峰值180.6TFLOPS联想DeepComp7000排名第31,LINPACK峰值102.8TFLOPS本PPT部分内容来源于国家高性能计算中心(合肥)522024/1/122.高性能计算的发展与现状(21)中国的高端高性能机群—曙光5000机群特点(三高一低)高性能—超高运算速度,230Tflops高效能—超高系统效率,大于70%高密度—单节点4路16核刀片低功耗—230万亿次峰值功率700KW本PPT部分内容来源于国家高性能计算中心(合肥)532024/1/122.高性能计算的发展与现状(22)中国的个人高性能计算机—基于龙芯2号国产万亿次高性能计算机KD-50-I基本参数计算单元:336个主频750MHz的龙芯2F,总的峰值计算速度1.008TFlops服务节点:2个Opteron双核处理器,主频2.2GHz内存容量:每计算单元内存1GB,服务节点内存8GB,共344GB磁盘容量:876GB系统互联网络:千兆以太网特点(三低一高)低功耗—

整机功耗小于6KW低占地面积—

占地0.51平方米,高度1.74米低成本—

整机成本不超过80万高计算性能—

峰值性能达1TFlops以上本PPT部分内容来源于国家高性能计算中心(合肥)542024/1/122.高性能计算的发展与现状(23)从Top500看高性能计算机的趋势(1)关于计算机结构:机群系统仍将是高性能计算机最常用的结构MPP仍然是一个重要结构,尤其是作为PFlops超级计算机的主要结构PVP是另一种获得超高性能的重要结构,但不是主流本PPT部分内容来源于国家高性能计算中心(合肥)552024/1/122.高性能计算的发展与现状(24)从Top500看高性能计算的趋势(2)关于微处理器:主要是采用CMOS工艺的商用微处理器多核处理器占统治地位Intel处理器家族仍将是高性能计算机中占统治地位的处理器基于RISC的IBMPower体系也会有一席之地AMD有一定地位(HyperTransport加快了处理器间的通信速度,简化了一致性协议的实现)专用的处理器仍然存在,但逐渐减少适用于最高端系统(Roadrunner)向量处理器片上系统本PPT部分内容来源于国家高性能计算中心(合肥)562024/1/122.高性能计算的发展与现状(25)2.3高性能计算面临的主要问题Memorywall:存储器访问能力与处理部件计算能力的不平衡处理器速度每年提高59%,高性能计算速度提高更快。存储器速度每年提高7%。处理器性能与数据访问带宽和延迟之间的差距越来越大。必须从系统存储体系结构上创新,改进时延机制,以提供更高的带宽和更低的延迟。目前对三类超级计算机(定制、混合与商业)的主要区别在于针对不同的存储访问模式所能提供的有效本地和全局存储访问带宽。本PPT部分内容来源于国家高性能计算中心(合肥)572024/1/122.高性能计算的发展与现状(26)Programmingwall:系统规模增大到10万个以上处理器,系统结构复杂(数据共享与消息通信模式交织),为超级计算机编写高效健壮程序越来越复杂,越来越困难。高性能机器上的程序设计语言、库和应用开发环境的进展比广泛应用的工业软件差很多没有广泛应用的并行程序设计模型软件的研制周期大于硬件的研制周期高端计算的真正危机在于软件本PPT部分内容来源于国家高性能计算中心(合肥)582024/1/122.高性能计算的发展与现状(27)Powerwall:单个芯片的功耗急剧升高,导致整个系统的总功耗越来越高占地均在数百~数千平方米,功耗在数兆瓦综合成本急剧增加,高达数亿美元如ASCI系统和ES系统峰值(Tflops)占地(m2)功耗(KW)Glops/m2Glops/KW时间BlueGene/L36723015001595652452005ASCI.Purple77.826247800124.729.972005RedStorm43.52791700155.9125.592005Earth-Simulator403060800013.0752002ASCI.Q301858710016.144.232004本PPT部分内容来源于国家高性能计算中心(合肥)592024/1/122.高性能计算的发展与现状(28)功耗-工业界普遍关注的问题“HidinginPlainSight,GoogleSeeksMorePower”,byJohnMarkoff,June14,2006NewGooglePlantinTheDulles,Oregon,fromNYT,June14,2006Google策略在靠近河边的平原上建立机房水力发电全世界共有>500,000台服务器本PPT部分内容来源于国家高性能计算中心(合肥)602024/1/123.高性能计算的典型应用(1)3.1高性能计算的应用领域3.2高性能计算的代表应用实例3.2.1国产并行计算机在淮河流域防洪防污中的应用

3.2.2高性能计算在石油与天然气中的应用

3.2.3高性能计算在数字化大桥中的应用

本PPT部分内容来源于国家高性能计算中心(合肥)612024/1/123.高性能计算的典型应用(2)3.1高性能计算的应用领域气候能量的燃烧、熔化和裂变技术(军事国防)生物社会经济发展天体物理学数学能源及材料……“E3”报告62(WeatherModelingandForecasting)

考虑3000*3000平方公里的范围,垂直方向的考虑高度为11公里。将3000*3000*11立方公里的区域分成0.1*0.1*0.1立方公里的小区域,则将近有1011个不同的小区域。另外还需考虑时间因素,将时间参数量化。假定考虑48小时天气预报。

天气预报63每一小区域的计算包括参数的初始化及与其它区域的数据交换。若每一小区域计算的操作指令为100条,则整个范围一次计算的指令为1011*100=1013,两天的计算次数将近100次,因此,指令总数为1015条。用一台10亿次/秒(PIII500)计算,将大约需要280小时。若我们用100个10亿次/秒的处理器构成一台并行处理机,每个处理器计算的区域为109个,不同的处理器通过通信来传输参数,若个处理器的计算能力得到充分利用,则整个问题的计算时间不超过3小时。说明两点(1)并行计算机可以解决原先不能解决的问题;(2)可进行更准确的天气预报。64要开采石油,必须钻井。据说打这样一口井,花费是非常高的,差不多要几百万甚至上千万,如果选择的钻井地点有偏差,那么投入的人力、财力、物力就会全部浪费,损失巨大。因此提前的精确测算就显得格外重要。石油勘探靠什么呢?现在据我门所知还在依靠人工地震,就是在认为可能的地方进行人工爆破,然后搜集爆破后的反应,记录它的反射弧,再把这些数据送到计算机上进行处理,地质专家再根据得出的结论分析石油的分布,争取打下去就有石油开采出来。石油部门是我国最早应用计算机的部门。石油勘探本PPT部分内容来源于国家高性能计算中心(合肥)652024/1/123.高性能计算的典型应用(3)高性能计算的应用领域(1)从传统应用到新兴应用历史上,物理和工程科学是计算和计算机科学应用驱动者。现今,像生物科学(从基于实验发展为基于计算、从个体研究发展为跨学科研究、从注意数值技术发展为生物医学计算方法等)等是计算和计算机科学的受益者。将来,社会科学和人文科学则是计算和计算机科学的主要消费者。本PPT部分内容来源于国家高性能计算中心(合肥)662024/1/123.高性能计算的典型应用(4)高性能计算的应用领域(2)传统的科学与工程计算科学工程计算的共性:在过去20年,计算物理是应用的主要驱动力,这类应用具有如下共同特点:应用程序常常由定义在R3×t子空间的一组PDE所描述。多物理模拟的不同物理区域的计算方法各不相同。很多应用均主要集中在大学和研究所。研究侧重点离散化PDE及其相应的线性/非线性方程的求解。强调并行机的速度和问题求解精度。很少关心相关的I/O操作。并行化方法与编程模型并行化方法:最常使用区域分解法。编程模型:最常使用数据并行。本PPT部分内容来源于国家高性能计算中心(合肥)672024/1/123.高性能计算的典型应用(5)高性能计算的应用领域(3)与社会相关的新兴应用新应用的共性:最近几年,与社会相关的应用急剧增加与传统的计算应用分享市场空间,其共性是:应用问题常常由图来定义,而不是离散的R3空间。计算过程中的交互常是全局性的,而不是通过边界来交换信息的。新出现的应用,无相应的使用经验和成熟的软件。很多应用常集中在与社会相关的国计民生方面。研究侧重点建立诚信机制:包括硬件、软件、人机界面、安全协议的使用等。巨量的数据,而不是科学计算,将是此类应用的主要处理对象,I/O是最为关心的。数据的安全、属主、管理等带来一系列技术、法律和人道等问题。本PPT部分内容来源于国家高性能计算中心(合肥)682024/1/123.高性能计算的典型应用(6)高性能计算的应用领域(4)应用实例社会科学社会经济学:利用宏观经济理论和计算经济学(行为方程)来模拟经济活动,施行动态调整平衡,预测货币政策变化所带来的经济含义,修正改变金融政策来防止经济动荡。社会行为科学:当社会和行为科学家面临巨大的数据需要理解和保护这些数据时,社会科学家和计算科学家加强合作是最有利的;社会科学家可帮助计算科学家理解在社会生态系统中怎样运用计算机科学;行为科学家也能帮助计算机科学家开发良好的人机交互模型;心理学家和语言学家同计算机科学家合作,能联合开发易于理解、使用和语言翻译的计算机程序,等等。主体经济学:通过相互作用主体(包括个体、社会群体、机构、生物实体、物质实体等)动态系统建模来研究经济现象和规律,以达到理解以往的经验和规范作用,定量分析和发展理论以及改进方法等之目的。本PPT部分内容来源于国家高性能计算中心(合肥)692024/1/123.高性能计算的典型应用(7)高性能计算的应用领域(5)应用实例物理科学挖掘资料发现新星球(褐矮星):美国国家虚拟观测站的计算机科学家用计算机搜索(约2分钟)两个天文数据库中数百万天体的资料时发现了它,它是研究人员在演示软件的可行性时无意发现的,是天文界惊人的精确发现。超新星建模:伽利略观察巨大星球爆炸500年后,人们对超新星(比太阳至少大10倍)中心坍塌的爆炸机制仍不清楚。最近许多物理学家和计算科学家用一维、二维、三维程序来模拟此现象,有可能提高对此现象的认识和增加对宇宙特性的理解。暗物质与暗能量:最近宇宙科学家发现宇宙在加速膨胀,这与爱因斯坦广义相对论理论物质行为相反,宇宙科学家猜想,除暗物质外,宇宙也可能包含暗能量,此能量将引力作为排斥力,从而导致加速膨胀,美国芝加哥大学天文学家用扩展版FLASH程序模拟了宇宙的能力。本PPT部分内容来源于国家高性能计算中心(合肥)702024/1/123.高性能计算的典型应用(8)高性能计算的应用领域(6)应用实例工程与制造微气泡和船舶降阻:很久以来,研究人员已经知道其体积约在50~500微米之间的微气泡,在一些情形下可减少船舶80%的阻力、减少燃料消耗、增加航程。但是人们还不能确定最佳微气泡系统的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论