物理化学领域高性能计算发展分析_第1页
物理化学领域高性能计算发展分析_第2页
物理化学领域高性能计算发展分析_第3页
物理化学领域高性能计算发展分析_第4页
物理化学领域高性能计算发展分析_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 物理化学领域高性能计算发展分析目 录 TOC o 1-3 h z u HYPERLINK l _Toc530406924 1 高性能计算的发展现状 PAGEREF _Toc530406924 h 4 HYPERLINK l _Toc530406925 1.1 高性能计算概述 PAGEREF _Toc530406925 h 4 HYPERLINK l _Toc530406926 1.2 高性能计算的应用需求 PAGEREF _Toc530406926 h 4 HYPERLINK l _Toc530406927 1.3 国外高性能计算发展现状 PAGEREF _Toc530406927 h 5

2、HYPERLINK l _Toc530406928 1.4 国内高性能计算发展现状 PAGEREF _Toc530406928 h 6 HYPERLINK l _Toc530406929 1.5 高性能计算机关键技术发展现状 PAGEREF _Toc530406929 h 8 HYPERLINK l _Toc530406930 1.5.1 体系架构 PAGEREF _Toc530406930 h 8 HYPERLINK l _Toc530406931 1.5.2 处理器 PAGEREF _Toc530406931 h 9 HYPERLINK l _Toc530406932 1.5.3 并行编程

3、模型 PAGEREF _Toc530406932 h 11 HYPERLINK l _Toc530406933 1.5.4 互联网络 PAGEREF _Toc530406933 h 12 HYPERLINK l _Toc530406934 1.5.5 操作系统 PAGEREF _Toc530406934 h 13 HYPERLINK l _Toc530406935 2 物理化学领域高性能计算发展现状及需求分析 PAGEREF _Toc530406935 h 14 HYPERLINK l _Toc530406936 2.1 发展现状 PAGEREF _Toc530406936 h 14 HYPE

4、RLINK l _Toc530406937 2.2 主流计算方法介绍 PAGEREF _Toc530406937 h 16 HYPERLINK l _Toc530406938 2.2.1 第一性原理计算方法 PAGEREF _Toc530406938 h 16 HYPERLINK l _Toc530406939 2.2.2 半经验方法 PAGEREF _Toc530406939 h 20 HYPERLINK l _Toc530406940 2.2.3 分子力学方法 PAGEREF _Toc530406940 h 20 HYPERLINK l _Toc530406941 2.3 主流计算软件介绍

5、 PAGEREF _Toc530406941 h 21 HYPERLINK l _Toc530406942 2.3.1 Gaussian PAGEREF _Toc530406942 h 21 HYPERLINK l _Toc530406943 2.3.2 VASP PAGEREF _Toc530406943 h 23 HYPERLINK l _Toc530406944 2.3.3 Materials Stuido PAGEREF _Toc530406944 h 24 HYPERLINK l _Toc530406945 2.3.4 ADF PAGEREF _Toc530406945 h 26 H

6、YPERLINK l _Toc530406946 2.3.5 Molpro PAGEREF _Toc530406946 h 26 HYPERLINK l _Toc530406947 2.3.6 MOLCAS PAGEREF _Toc530406947 h 26 HYPERLINK l _Toc530406948 2.3.7 Q-Chem PAGEREF _Toc530406948 h 27 HYPERLINK l _Toc530406949 2.3.8 GAMESS PAGEREF _Toc530406949 h 28 HYPERLINK l _Toc530406950 2.3.9 MPQC

7、PAGEREF _Toc530406950 h 28 HYPERLINK l _Toc530406951 2.3.10 Turbomole PAGEREF _Toc530406951 h 29 HYPERLINK l _Toc530406952 2.3.11 QMCPACK PAGEREF _Toc530406952 h 29 HYPERLINK l _Toc530406953 2.3.12 WIEN2K PAGEREF _Toc530406953 h 29 HYPERLINK l _Toc530406954 2.3.13 ABINIT PAGEREF _Toc530406954 h 30 H

8、YPERLINK l _Toc530406955 2.3.14 Quantum-Espresso PAGEREF _Toc530406955 h 30 HYPERLINK l _Toc530406956 2.3.15 CPMD PAGEREF _Toc530406956 h 31 HYPERLINK l _Toc530406957 2.3.16 NWChem PAGEREF _Toc530406957 h 32 HYPERLINK l _Toc530406958 2.3.17 OCTOPUS PAGEREF _Toc530406958 h 32 HYPERLINK l _Toc53040695

9、9 2.3.18 SIESTA PAGEREF _Toc530406959 h 32 HYPERLINK l _Toc530406960 2.3.19 CP2K PAGEREF _Toc530406960 h 32 HYPERLINK l _Toc530406961 2.3.20 OpenMX PAGEREF _Toc530406961 h 33 HYPERLINK l _Toc530406962 2.3.21 DFTB+ PAGEREF _Toc530406962 h 33 HYPERLINK l _Toc530406963 2.3.22 DACAPO PAGEREF _Toc5304069

10、63 h 33 HYPERLINK l _Toc530406964 2.3.23 GPAW PAGEREF _Toc530406964 h 34 HYPERLINK l _Toc530406965 2.3.24 DL_POLY PAGEREF _Toc530406965 h 34 HYPERLINK l _Toc530406966 2.3.25 NAMD PAGEREF _Toc530406966 h 34 HYPERLINK l _Toc530406967 2.3.26 AMBER PAGEREF _Toc530406967 h 35 HYPERLINK l _Toc530406968 2.

11、3.27 GROMACS PAGEREF _Toc530406968 h 35 HYPERLINK l _Toc530406969 2.3.28 CHARMM PAGEREF _Toc530406969 h 35 HYPERLINK l _Toc530406970 2.3.29 LAMMPS PAGEREF _Toc530406970 h 35 HYPERLINK l _Toc530406971 2.4 主要晶体结构预测软件介绍 PAGEREF _Toc530406971 h 36 HYPERLINK l _Toc530406972 2.5 资源需求分析 PAGEREF _Toc5304069

12、72 h 37 HYPERLINK l _Toc530406973 2.5.1 计算资源需求 PAGEREF _Toc530406973 h 38 HYPERLINK l _Toc530406974 2.5.2 内存需求 PAGEREF _Toc530406974 h 42 HYPERLINK l _Toc530406975 2.5.3 网络需求 PAGEREF _Toc530406975 h 44 HYPERLINK l _Toc530406976 2.5.4 存储需求 PAGEREF _Toc530406976 h 45 HYPERLINK l _Toc530406977 2.5.5 基础

13、软件环境需求 PAGEREF _Toc530406977 h 46 HYPERLINK l _Toc530406978 2.5.6 可视化需求 PAGEREF _Toc530406978 h 48高性能计算的发展现状高性能计算概述高性能计算(High Performance Computing,简称HPC)是计算机科学的一个分支,研究并行算法和开发相关软件,致力于开发高性能计算机(High Performance Computer),满足科学计算、工程计算、海量数据处理等需要。自从1946年设计用于导弹弹道计算的世界上第一台现代计算机诞生开始,计算技术应用领域不断扩大,各应用领域对计算机的处理

14、能力需求越来越高,这也促使了高性能计算机和高性能计算技术不断向前发展。随着信息化社会的飞速发展,人类对信息处理能力的要求越来越高,不仅石油勘探、气象预报、航天国防、科学研究等需求高性能计算机,而金融、政府信息化、教育、企业、网络游戏等更广泛的领域对高性能计算的需求也迅猛增长。高性能计算的应用需求应用需求是高性能计算技术发展的根本动力。传统的高性能计算应用领域包括:量子化学、分子模拟、气象预报、天气研究、油气勘探、流体力学、结构力学、核反应等。随着经济发展和社会进步,科学研究、经济建设、国防安全等领域对高性能计算设施及环境提出了越来越高的需求,不仅高性能计算的应用需求急剧增大,而且应用范围从传统

15、领域不断扩大到资源环境、航空航天、新材料、新能源、医疗卫生、金融、互联网、文化产业等经济和社会发展的众多领域。当前,世界和中国面临诸多重大挑战性问题。比如,全球气候出现快速增温的事实使“应对气候变化”成为各国政治、经济和社会发展的重大课题,为了进一步消减“温室效应”和减少碳排放,实现可持续发展的低碳经济,新材料的发现、设计与应用迫在眉睫;随着化石能源的日益枯竭和环境的日趋恶化,新能源的开发势在必行;随着科技的发展,人类迈向太空的脚步逐渐加快,空间资源的争夺和战略性部署竟然愈发激烈,航空航天领域作为此项重大科研技术活动的基础支撑,投入将持续扩大;为了攻克重大疾病、进一步提高人口健康质量,生命科学

16、与新药制造已成为技术发展和经济投入的重要增长点;随着互联网技术不断发展,借助海量数据与高性能计算的力量使得人工智能研究不断取得新的突破,各大互联网企业对高性能计算的投入将持续增加;在国际竞争的大环境下,基础科研实力是高新技术发展的重要源泉,是未来科学和技术发展的内在动力,也是实现国家经济、社会和环境可持续性发展的重要途径,基础科学研究的投入也将持续增长。解决上述关系国家战略和国计民生的重大挑战性问题都离不开高性能计算的强力支撑,可以预见在战略层面,各国对高性能计算的投入会持续增长,而中国将更加发力;在技术层面上,高性能计算的应用范围将越来越广,反过来应用需求也将催生高性能计算新技术的诞生与发展

17、。图:全球HPC TOP500统计数据显示高性能计算能力成倍增长国外高性能计算发展现状高性能计算作为国家实力的重要体现,是一个国家最尖端的信息技术综合体。发达国家政府(美日欧)普遍将高性能计算作为国家战略,给予高度重视并进行持续投入。美国是世界上最重视高性能计算、投入最多、受益最大的国家。近数十年来,美国政府持续实施了SCP(战略计算机计划)、HPCC(高性能计算和通信)、ASCI(加速战略计算)、ASC(先进模拟和计算)、HPCS(高生产率计算机)等多个国家计划,从而确保了美国在高性能计算领域长期处于领先地位。2015年7月,美国政府提出了建立“国家战略计算项目”(NSCI),目的是创建美国

18、高性能计算的研发地位,研制世界上第一台百亿亿次计算系统,此举的目标就是夺回2013年以来被中国夺走的计算速度头名的宝座。2015年6月统计的全球性能最高的500台高性能计算机有233台安装在美国,其中性能最高的10台计算机中有5台部署于美国。美国在高性能计算领域的领先优势十分明显,为美国在科技创新和经济发展方面处于世界领先地位做出了重大贡献。当前,美国政府仍在继续加强其在高性能计算领域的研发投入。正在实施的UHPC(普适高性能计算)计划,目标是研究革命性的设计方法来满足不断增长的国防应用对高性能计算的需求,包括开发超高并发性的高性能计算机、有效提升系统能效比、简化并行应用设计方法和提升应用的容

19、错能力等,为实现百亿亿次(ExaFlops)计算奠定基础。日本一直以来位列高性能计算大国,与美国类似,日本政府非常重视高性能计算技术,不断加强其在高性能计算领域的研发投入。早在1990年,日本NEC公司研制的SX-3/44R系统就成为当时全球速度最快的高性能计算机。之后的1993年,Fujitsu公司开发的“数值风洞”系统,以及2004年NEC的“地球模拟器”再次位列全球第一。在2015年6月统计的全球TOP 500高性能计算机中,日本占据40席,其中Fujitsu公司研制的“K计算机”位列世界第四,“K计算机”将落户日本理化学研究所(RIKEN),服务于物理、化学、生物、医学、材料、能源等领

20、域科学研究。此外,日本正在进行Exascale Supercomputer Project(E级高性能计算)项目,该项目目标是建设E级的高性能计算与软件系统的来替换现有的“K计算机”,该系统将服务于未来日本科学技术研究如药物设计、地震影响研究等。欧洲也一直是高性能计算的活跃区域。2002年,7个欧洲国家的11个高性能计算中心就联合发起DEISA项目,旨在建立泛欧洲的高性能计算基础设施。在2015年6月统计的全球TOP 500高性能计算机中,欧洲占据了28%的席位。面向百亿亿次(ExaFlops)计算需求,欧洲提出了EESI和MareIncognito超算计划,主要从并行编程模型和和应用算法方面

21、突破百亿亿次级计算的关键技术,包括编程模型、负载均衡技术、微处理器/结点技术、性能分析工具、互连技术和高性能应用等。国内高性能计算发展现状“九五”以来,在国家及相关政府的持续支持和IT企业的积极参与下,我国高性能计算机有了长足的发展,研制队伍不断发展和壮大,主要的研制单位有:国家并行计算机工程技术研究中心、中科院计算技术研究所国家智能中心、国防科技大学计算机学院、公司等,是数十年积聚起来的我国高性能计算机技术研发的中坚力量。“十一五”期间,在国家863计划“高效能计算机及网格服务环境”重大项目的支持下,我国先后研制成功若干台百万亿次和千万亿次超级计算机系统。2008年,联想公司和公司分别研制成

22、功“深腾7000”和“5000”百万亿次计算机;2009年,国防科技大学研制成功“天河一号”千万亿次计算机,使我国成为继美国之后世界上第二个研制成功千万亿次计算机的国家;2010年6月,公司研制成功“星云”千万亿次计算机,性能列世界TOP500第二位。2010年11月,升级后的“天河-1A”系统创造了超级计算机全球排名第一的最好成绩。基于自主CPU芯片研制超级计算机也取得了重大突破,神威蓝光于2010年底成为第一个全部采用国产CPU实现的千万亿次超级计算机。进入“十二五”以来,我国的超级计算机研制继续发展,天河2号连续四次位居TOP500第一名。预计到“十二五”末,我国还将推出2套峰值性能超过

23、10亿亿次(100PFLOPS)的超级计算机系统,有望继续在TOP500排行榜中名列前茅。在2013年国务院发布的国家重大科技基础设施建设中长期规划(2012-2030年)中,多个基础设施的建设都离不开高性能计算系统如海底科学观测网、转化医学研究设施。其中,地球系统数值模拟器通过超级计算及存储专用系统的建设,并结合超级模拟支撑与管理软件系统、地球各层圈过程模拟软件系统等来实现模拟地球系统圈层变化和长期气候变化,精细描述和预测地球物理化学及生物过程,提高我国地球系统模拟的整体能力和重大自然灾害预测预警、气候变化预估的研究水平。图:TOP500系统国家分布历史统计我国在高性能计算机系统相关的基础性

24、支撑技术方面也有了很大进步。在处理器方面,国内自主研制的“龙芯”、“神威”、“飞腾”等系列的多核处理器方面已有所突破,相关的生态环境正在逐步完善;在异构协同与并行优化方面,国内在CPU/GPU混合结构的应用研究,比如生命科学领域的基因比对、分子动力学、电镜数据处理石油勘探领域的电子断层三维重构、叠前时间偏移、深度学习等方面均取得突破。在系统软件及环境方面,国内在大规模异构系统的管理和监控、大规模系统的快速部署以及高效系统虚拟化等关键技术上也取得了很大进展。“十一五”期间,在国家863计划“高效能计算机及网格服务环境”重大项目的支持下,成功开发具有自主知识产权的中国国家网格软件GOS(Grid

25、Operating System),突破了广域资源共享和协同工作的关键技术,其功能和性能已达到并超越国际同类软件水平。此外,863计划还先后重点支持了化学、天文、气象、生物医药、流体、激光聚变、大飞机、石油勘探地震成像等领域的高性能计算应用,形成了若干可利用上千以上的处理器核进行计算模拟的应用实例。高性能计算机关键技术发展现状体系架构作为高性能计算基础设施的核心,现代高性能计算机的发展从20世纪70年代的向量计算机开始,也已经有了几十年的发展历程。先后出现了向量机、多处理器并行向量机、MPP大规模并行处理机、SMP对称多处理机、DSM分布式共享存储计算机、Constellation星群系统、C

26、luster集群系统、混和系统等多种主体的体系架构,并分别在不同的时期占据着应用的主流。其中,计算机集群(简称集群、Cluster)是一种计算机系统,它通过一组松散集成的计算机软件和/或硬件连接起来高度紧密地协作完成计算工作。在某种意义上,他们可以被看作是一台计算机。集群系统中的单个计算机通常称为节点,通过内部网络连接。高性能计算集群采用将计算任务分配到集群的不同计算节点而提高计算能力。比较流行的高性能计算集群采用Linux操作系统和其它一些标准软件来完成并行运算,这一集群配置通常被称为Beowulf集群。这类集群通常运行特定的程序以发挥高性能计算集群的并行能力,这类程序一般使用特定的运行库,

27、比如MPI等。相比于MPP等一些专有高性能计算系统,集群系统具有明显的优势,包括:集群的标准化程度高高性能计算集群一般都是采用工业标准的硬件和软件系统,比如采用标准的x86架构处理器;工业标准的互联网络,比如InfiniBand、万兆网络等;通用的Linux操作系统;通用的并行编程标准和模型;通用的作业分发调度系统等。灵活性、可扩展性好集群是一个松散的架构,由计算节点通过互联网络连接而成,一个集群可以方便地进行扩展;同样的,一个集群也可以灵活的进行物理或逻辑上的拆分。MPP等一些专有定制系统就很难做到这样的灵活可扩展性。性能高集群单个计算节点性能在不断提升、集群互联网络技术发展迅猛、集群可扩展

28、性也越来越好、集群的并行编程技术不断进步,集群已经成为高性能计算的代名词。性价比高由于集群采用的是标准化的软硬件系统,采用的是大规模工业生产的设备部件,可以极大程度降低高性能计算系统的建设成本,相应的,集群的运维和维护成本也要小很多。投资风险小集群技术经过多年的发展,其硬件和软件技术已经发展得非常成熟,建设和维护需要的设备器件有充足的市场保障;绝大部分高性能计算应用在集群架构上开发和调试,应用支持程度高,可以确保高性能计算平台的建设成功。正是因为具有的这些优势,集群在高性能计算领域发展迅猛,目前已经成为高性能计算的主流架构。从2012年起,TOP500榜单中关于体系架构就只剩下Cluster和

29、MPP两位角色,其中Cluster一直占据超过80的装机份额,在中小规模高性能计算系统中更是占统治地位。图:TOP500中体系架构份额历史统计处理器处理器是高性能计算机的核心,很大程度上决定了高性能计算机的计算性能。随着x86处理器在PC消费级市场的繁荣,其触角逐渐延伸到高性能计算领域。另一方面,随着开放式集群架构在高性能计算领域的统治地位确立,市场占有率大、性价比高的x86处理器也成为自然合理的选择。自2000年开始,Intel和AMD的x86处理器在高性能计算市场占有率迅速扩大,逐渐蚕食掉了Alpha、MIPS、Power、SPARC、PA-RISC等RISC处理器的市场。2015年6月发

30、布的TOP500榜单中,共有427台系统(占比85.4)采用Intel处理器,其中仅Intel Xeon处理器E5家族就贡献了80,令其他厂商望尘莫及。IBM Power处理器的份额稳定在35台,占比7;AMD Opteron家族的占有量是20台(占比4)。从处理器多核角度来看,目前有96的系统采用6核及以上核心,85的系统采用8核及以上核心,39的系统采用10核及以上核心。从趋势来看,虽然8核仍是HPC系统的主流配置但应用逐步收窄,而10核和12核处理器的市场份额将会进一步扩大。图:TOP500中处理器份额历史统计此外,随着GPU、Intel MIC、FPGA等加速器/协处理器的出现,CPU

31、不再是高性能计算领域计算单元的唯一选择。相比于CPU,这些协处理器的浮点运算能力更强、任务处理模式更简单,非常适合部分高性能计算应用。使用协处理器可以大大提升高性能计算机的计算性能,分担CPU的处理负载。全球HPC TOP500中协处理器的使用越来越多,其中包括2015年6月连续四次蝉联TOP500第一的天河二号,2012年11月TOP500全球第一的Titan,2010年11月全球第一的天河-1A,以及2010年6月全球第二的星云系统。在协处理器的市场份额中,Nvidia GPU占据主导,AMD ATI GPU也有一定市场, Intel MIC(Xeon Phi)增长迅速,以PEZY-SC为

32、代表的其它类型协处理器在高性能计算中崭露头角。另外,以FPGA为代表的可定制化的SOC具有浮点计算能力强、整体功耗低的特点,未来会快速增长。图:TOP500中使用协处理器的系统越来越多并行编程模型现代高性能计算机都是并行计算机,通过并行计算,降低单个任务的计算时间、提高任务的求解精度、或者扩大问题的处理规模,这些都是高性能计算机的根本目标,也是高性能计算技术发展的驱动力。高性能计算机上的并行编程模型与计算机体系架构紧密相关。当前主流的并行编程模型与主流的高性能计算集群架构相匹配。从进程或线程的交互方式角度划分,并行编程模型主要有共享内存编程模型(Share Memory)和消息传递编程模型(M

33、essage Passing)。共享内存编程模型一般应用在共享内存体系结构上,比如SMP、DSM、NUMA。它具有单地址空间,线程级并行,主要实现有OpenMP和Pthreads。共享内存编程模型具有并行效率高、编程容易(特别是采用编译制导的OpenMP模型)等优点,但它的可移植性和可扩展性不好。当前高性能计算集群架构的计算节点通常都是采用多路多核架构,计算节点本身为SMP或NUMA结构。因此,共享内存编程模型可以在单个集群计算节点内实现并行计算。消息传递编程模型是分布式内存编程模型的一种,主要应用在分布式内存体系结构下,以早期的PVM(Parallel Virtual Machine)和目前

34、主流的MPI(Message Passing Interface)为代表。传递编程模型的特点是多地址空间、进程级并行、编程相对困难、可移植性好、可扩展性好。可以广泛应用在高性能集群体系架构上,可以实现集群跨节点并行计算。当前高性能集群的多层次结构,使得集群系统同时具备了共享内存和分布式共享内存两种体系结构的特点。根据现代集群多级并行结构的特点,很自然地考虑到可以将共享内存编程模型与分布式内存编程模型相结合。因此,MPI+OpenMP的混合编程模型得到了广泛的应用。混合编程模型提供了节点间和节点内的两级并行机制,它的优势在于结合了进程级的粗粒度并行(例如区域分解)和线程级的细粒度并行(如循环并行

35、)的优点。实践证明,在很多情况下,其执行效率和可扩展性高于纯MPI和OpenMP程序。互联网络高性能计算集群是一个通过内部互联网络将松散的计算节点有效整合起来的系统架构,内部互联网络是高性能计算集群的核心技术之一。集群系统内部互联网络主要用于以MPI为代表的并行计算程序节点间的数据网络通信,即作为计算网络使用。不同计算方法和计算程序的数据通信特征不尽相同,从类型看,有的数据交换以小数据包为主,有的大数据包交换较多。小数据包交换较多时,计算性能和效率对计算网络的延迟非常敏感,大数据包交换较多时,计算网络的带宽有关键性影响;从数据通信的频率看,有的计算方法和程序数据通信不频繁,对计算网络的性能要求

36、不高,有的数据通信密集,对计算网络的性能要求很高。总的来说,高性能计算机计算网络的性能对并行计算程序的并行加速比和并行扩展性有重要的影响。计算网络需要有高带宽、低延迟的特点。与MPP等体系架构一般使用高度定制化的私有内部网络不同,高性能计算集群系统一般采用标准通用的网络技术和设备,比如以太网络、Quadrics、Myrinet、InfiniBand。其中,千兆/万兆以太网络技术发展成熟、通用性好,目前仍占有一部分市场份额;Quadrics和Myrinet在与InfiniBand的竞争中败下阵来,目前已基本在市场上消失,而InfiniBand已经成为通用高速网络的代名词,在高性能计算领域的市场份

37、额逐年扩大,已经成为市场主流,特别是在大型、高端计算系统,InfiniBand几乎成为标配。2015年6月发布的TOP500榜单中,就系统内部互联网络而言,InfiniBand技术已被TOP500中的249台系统所采用(占比49.8),是TOP500中使用最广的内部网络互联技术。图:TOP500中互联网络份额历史统计操作系统早期高性能计算机硬件体系架构主要以MPP等封闭系统为主,操作系统一般为配套专用的Unix操作系统。随着开放标准的集群架构逐渐兴起,以及同样开放的Linux操作系统逐渐成熟,Linux操作系统被逐渐成为高性能计算机的主流。Linux的操作系统的稳定、安全、可靠、高效率、多用户

38、、开源等特征,尤其其多用户的特征,非常适合高性能计算机的使用模式。2015年6月发布的TOP500榜单中,各种Linux操作系统装载在多达472台HPC系统上,占比高达94.4,走向没落的Unix此次仍顽强地维持着2的份额。图:TOP500中操作系统份额历史统计物理化学领域高性能计算发展现状及需求分析发展现状在当今的科学研究中,计算已和实验、理论并列为三大科学方法。随着计算技术的迅猛发展、科学理论模型日渐成熟,高性能计算在科学、工程和社会等领域都有了广泛应用,用它来模拟或代替实验已成为可能。在地球地质、气象气候、测绘科学、天体空间物理、凝聚态物理、高能物理、计算化学、分子生物学、基因测序、材料

39、科学等领域,高性能计算已是必备的研究手段。特别在物理、化学、材料、生物等相关学科中,根据目前理论发展的基础,利用高性能计算可以观察到比实验现象更细致的层次,或者对目前比较昂贵或无法实现的实验观测进行理论模拟,从而帮助解释实验结果,理解自然规律,进一步指导实验过程。高性能计算还有助于建立新的理论。图:计算模拟将在科研、生产中发挥着越来越重要的作用物理化学领域中的理论模型及计算方法经过几十年的发展已经较为成熟,随着高性能计算机和高性能计算技术的迅猛发展,以及计算程序编程模型等方面的革新,计算模拟的威力越来越强,重要性越来越高,应用范围越来越广,需求越来越多。物理化学领域中的计算方法和计算程序不仅在

40、物理、化学的各个子学科中有着广泛的应用,还延伸覆盖到材料科学、生命科学、环境科学等其它相关学科,并广泛应用于能源、医药、石油化工、食品、建筑等应用行业中。物理、化学及相关学科是高性能计算的传统需求大户,粗略统计全球接近半数的高性能计算资源服务于物理、化学及相关学科。下图是上海超级计算中心的计算资源在各学科的最新统计分布情况,物理、化学、材料科学的比重达到60%,此外,分子生物科学占据13%,其中有一定比例是基于物理化学领域的计算方法。图:上海超级计算中心计算资源在各学科的分布物理化学领域计算模拟的可研究对象范围非常广,从原子、单分子到分子团簇、生物大分子、纳米材料、高分子材料、介观尺度粒子,空

41、间尺度可以从皮米跨度到微米,时间尺度可以从阿秒到数百年,物相从气相到凝聚态。计算模拟可以研究物质的热力学、结构、力学、电学、光学、磁学等性质,可以研究化学反应的机理,可以研究红外、紫外、荧光、核磁、 X射线等光谱性质,在分子生物学层次研究病理、毒理,可以研究物质的相变、扩散、吸附等等。物理化学领域的计算模拟不仅仅局限于科学技术研究,而且已经渗透和应用到工业生产和民生生活的各个层面,比如传统的冶金、石油、煤炭、化工,航天航空、船舶工业,新材料、新能源的研制开发,药物设计,医学治疗,食品安全,环境控制等等。图:物理化学计算模拟对象的空间和时间尺度物理化学领域的计算方法和计算程序种类繁多,具有各自的

42、特点和适用范围。比如在原子分子层次,量子力学效应显著,基于量子力学的第一性原理的计算方法比较适用;在纳米到微米尺度,分子力学和分子动力学是常用的研究方法;在介观尺度层面,Monte Carlo方法是研究材料随机性问题最有效的方法;在宏观尺度层面,有限元方法则是研究宏观尺度问题的重要方法,主要研究材料在多场(环境)作用下的响应,是材料功能研究的主要工具。此外,过去几年材料模拟由单纯的计算和工具研发,向着新材料设计稳步发展,不断融合前沿技术,如高性能计算、机器学习、数据挖掘,以及晶体结构预测技术。在国际材料基因组计划、集成计算材料工程和大数据工程等重大项目的推动下,物理化学领域的高性能计算逐步进入

43、产业革新时期。主流计算方法介绍图:物理化学计算模拟对象的空间和时间尺度第一性原理计算方法第一性原理方法(Ab initio Methods),也称为从头算方法,常指基于量子力学理论,完全由理论推导和计算而得,不使用基本物理常数和原子量以外的实验数据、以及经验或者半经验参数的求解薛定谔方程的方法。但大多数情况下这些第一性原理方法也包括一定的近似,而这些近似常由基本数学推导产生,例如换用更简单的函数形式或采用近似的积分方法。大多数第一原理方法使用波恩-奥本海默近似,将电子运动和原子核运动分离以简化薛定谔方程。在核不动近似下处理电子运动称为电子结构计算,处理原子核运动称为动力学计算。电子结构计算通过

44、求解定态薛定谔方程(也成为不含时薛定谔方程)得到。主流的电子结构计算方法包括Hartree-Fock方法、量子蒙特卡洛(QMC)、密度泛函方法(DFT)等。Hartree-Fock HYPERLINK /wiki/Hartree-Fock%E6%96%B9%E7%A8%8B o Hartree-Fock方程 Hartree-Fock是最常见的一种 HYPERLINK /w/index.php?title=%E7%AC%AC%E4%B8%80%E5%8E%9F%E7%90%86&action=edit&redlink=1 o 第一原理(页面不存在) 第一性原理电子结构计算方法,常用于处理非周期性

45、结构的分子体系的电子结构计算。求解过程常使用原子轨道线性组合 (LCAO)得到的基组来进行近似。通过这种近似,薛定谔方程可以转化为一个“简单”的电子哈密顿量的本征值方程。该方程的解为离散集。解得的本征值是分子结构的函数。在Hartree-Fock近似中,每个电子在其余电子的平均势中运动,但是不知道这些电子的位置。当电子离得很近时,即使是用平均方法考虑电子间的库仑相互作用,电子也不能相互避开,因此在Hartree-Fock中高估了电子排斥。 HYPERLINK /wiki/Hartree-Fock%E6%96%B9%E7%A8%8B o Hartree-Fock方程 Hartree-Fock方程

46、需采用 HYPERLINK /wiki/%E5%8F%98%E5%88%86%E6%B3%95 o 变分法 变分法求解,所得的近似能量永远等于或高于真实能量,随着基函数的增加,Hartree-Fock能量无限趋近于 HYPERLINK /w/index.php?title=Hartree-Fock%E6%9E%81%E9%99%90&action=edit&redlink=1 o Hartree-Fock极限(页面不存在) Hartree-Fock极限能。由于Hartree-Fock方法高估了电子相关作用,计算结果不太准确,后来又出现了很多计算方法,先进行Hartree-Fock计算,随后对电

47、子的瞬时相关对此进行修正。相应能量的降低称为 HYPERLINK /w/index.php?title=%E7%94%B5%E5%AD%90%E7%9B%B8%E5%85%B3&action=edit&redlink=1 o 电子相关(页面不存在) 电子相关能。这些方法称为 HYPERLINK /w/index.php?title=%E5%90%8EHartree-Fock%E6%96%B9%E6%B3%95&action=edit&redlink=1 o 后Hartree-Fock方法(页面不存在) 后Hartree-Fock方法,包括 HYPERLINK /wiki/%E5%A4%9A%E

48、4%BD%93%E5%BE%AE%E6%89%B0%E7%90%86%E8%AE%BA o 多体微扰理论 多体微扰理论、多组态自洽场方法 (MCSCF) 、组态相互作用(CI)、 HYPERLINK /wiki/%E5%A4%9A%E5%8F%82%E8%80%83%E6%80%81%E7%BB%84%E6%80%81%E7%9B%B8%E4%BA%92%E4%BD%9C%E7%94%A8%E6%96%B9%E6%B3%95 o 多参考态组态相互作用方法 多参考态组态相互作用方法 (MRCI) 、二次组态相互作用 (QCI) 、 HYPERLINK /wiki/%E8%80%A6%E5%90%

49、88%E7%B0%87%E7%90%86%E8%AE%BA o 耦合簇理论 耦合簇理论 (Coupled Cluster) 等。量子蒙特卡洛在Hartree-Fock理论中,很重要的一项误差就是在Hartree-Fock理论中,电子之间的关联项被全部忽略了。这其中的原因是因为我们将体系的基态波函数近似为单行列式的形式,电子所感受到的是平均场的作用,这使得我们可以将多体的波函数分解成为单电子波函数简化计算。如果我们用无穷多个行列式的组合作为基函数,则理论上也可以得到精确的基态能量,这恰恰就是全组态相互作用的基本原理。而量子蒙特卡罗(Quantum Monte Carlo)则从一个全新的角度考虑问

50、题。在量子蒙特卡罗中,体系的基态波函数显式地写成关联的波函数,也就是说波函数是电子-电子之间距离的显式函数。量子蒙特卡罗采用蒙特卡罗方法对积分进行数值解析。量子蒙特卡罗计算非常耗时,但却可能是目前精确度最高的第一性原理计算方法。密度泛函理论密度泛函理论(DFT)是一种研究多 HYPERLINK /view/3476.htm t _blank 电子体系电子结构的 HYPERLINK /view/2785.htm t _blank 量子力学方法。密度泛函理论在物理和化学上都有广泛的应用,适用于非周期性结构的 HYPERLINK /view/25255.htm t _blank 分子系统和周期性结构

51、的凝聚态结构,是凝聚态物理和 HYPERLINK /view/38602.htm t _blank 计算化学领域最常用的方法之一。电子结构理论的经典方法,特别是Hartree-Fock方法和后Hartree-Fock方法,是基于复杂的多电子 HYPERLINK /view/24951.htm t _blank 波函数的。密度泛函理论的主要目标就是用 HYPERLINK /view/818948.htm t _blank 电子密度取代波函数做为研究的基本量。因为多电子波函数有 3N 个变量(N 为电子数,每个电子包含三个空间变量),而电子密度仅是三个变量的函数,无论在概念上还是实际上都更方便处理

52、。密度泛函理论最普遍的应用是通过Kohn-Sham方法实现的。 在Kohn-Sham DFT的框架中,最难处理的多体问题(由于处在一个外部静电势中的电子相互作用而产生的)被简化成了一个没有相互作用的电子在有效势场中运动的问题。这个有效势场包括了外部势场以及电子间库仑相互作用的影响,例如,交换和相关作用。处理交换相关作用是KS DFT中的难点。目前并没有精确求解交换相关能EXC的方法。最简单的近似求解方法为局域密度近似(LDA近似)。LDA近似使用均匀电子气来计算体系的交换能(均匀电子气的交换能是可以精确求解的),而相关能部分则采用对自由电子气进行拟合的方法来处理。密度泛函方法根据基函数和近似方

53、法的不同,现在比较常用的方法有:FP-LCAO(Full Potential-Linear Combination of Atomic Oribtals,全势-线型原子轨道组合方法),FP-LMTO(Full Potential-Linear Muffin-tin Orbitals,全势-线性Muffin-tin轨道方法),FP-LAPW(Full Potential-Linearized Augmented Plane-wave,全势-线性化缀加平面波方法),Pseudopotential Plane-wave(PP-PW,赝势-平面波方法)。目前比较流行的DFT计算软件的主要计算方法如下:

54、VASP(PP-PW)CASTEP (PP-PW)Abinit (PP-PW)Crystal (FP-LCAO)Quantum-ESPRESSO(PP-PW,原PWscf)Wien2k (FP-LAPW)Siesta (Order-N方法,又称Siesta方法,基于LCAO)ELK (FP-LAPW)Exciting (PF-LAPW)Fleur (FP-LAPW)Octopus (TDDFT,用于光学性质计算等)量子动力学量子动力学方法基于量子力学理论方法处理原子核运动。在玻恩-奥本海默近似下对原子核坐标变量与电子变量进行分离后,与核自由度相关的波包通过与含时薛定谔方程全哈密顿量相关的演化算

55、符进行传播。而在以能量本征态为基础的另一套方法中,含时薛定谔方程则通过散射理论(Scattering Theory)进行求解。原子间相互作用势由势能面描述,一般情况下,势能面之间通过振动耦合项相互耦合。用于求解波包在分子中的传播的主要方法包括分裂算符法(Split Operator)多组态含时哈特里方法(MCTDH)第一性原理分子动力学量子动力学方法基于量子力学理论处理原子核的运动,计算非常耗时,且计算规模巨大,一般只能处理几个到几十个原子的体系,处理上百个原子的体系非常困难。为了能计算处理更大的体系,并缩短模拟时间,可使用牛顿运动定律研究系统的含时特性,包括振动转动或布朗运动,但电子运动仍然

56、通过第一性原理方法来处理。这样的方法称为第一性原理分子动力学或从头算分子动力学方法,包括密度泛函理论与分子动力学结合的Car-Parrinello方法。第一性原理分子动力学与经典分子动力学一样,原子核的运动用牛顿力学来描述。主要的区别是经典分子动力学方法使用经验势来处理电子结构,而第一性原理分子动力学中的电子结构基于量子力学方法计算处理。半经验方法半经验方法省略或近似处理了第一性原理计算中的一些费时的计算项,比如Hartree-Fock方法计算中的双电子积分。为了修正这些近似方法带来的误差,半经验方法计算使用了一系列由实验结果拟合的参数。有时,这些参数是根据第一原理计算结果进行拟合的。经验方法

57、是对半经验方法的进一步近似。经验方法并没有包括哈密顿量的双电子部分。经典方法包括埃里克休克尔提出的应用于电子体系的Huckel方法和霍夫曼提出的扩展Huckel方法。半经验计算比第一性原理计算快很多。但是如果计算的分子与参数化该方法时使用的分子结构不相近时,半经验方法可能给出完全错误的结果。半经验方法在有机化学领域应用最为广泛,因为有机分子的大小适中并主要由少数几种原子构成。与经验方法类似,半经验方法也可分为两大类:限于电子体系的半经验方法和限于价电子体系的半经验方法。目前大部分的半经验方法属于第二类。分子力学方法很多情况下,对大分子体系的处理可以完全避免使用量子化学计算,而使用分子力学的方法

58、。分子力学(Molecular Mechanics),又叫力场方法(Force Field Method),目前广泛地用于计算大分子体系的构象和能量。 HYPERLINK /w/index.php?title=%E5%88%86%E5%AD%90%E5%8A%9B%E5%AD%A6&action=edit&redlink=1 o 分子力学(页面不存在) 分子力学模拟使用古典力学模型(例如 HYPERLINK /wiki/%E8%B0%90%E6%8C%AF%E5%AD%90 o 谐振子 谐振子)描述分子体系的能量。分子力学模型的所有常数均通过实验数据或 HYPERLINK /w/index.p

59、hp?title=%E7%AC%AC%E4%B8%80%E5%8E%9F%E7%90%86&action=edit&redlink=1 o 第一原理(页面不存在) 第一原理计算结果得到。参数和方程的优化结果称为 HYPERLINK /wiki/%E5%88%86%E5%AD%90%E5%8A%9B%E5%9C%BA o 分子力场 分子力场。进行参数化的分子力场对分子力学方法的计算成功与否至关重要。针对某类分子优化的力场只有在应用于同类分子时才可保证得到可信的结果。在处理原子核运动方面,基于分子力场的分子动力学称为经典分子动力学方法,常用于蛋白质、高分子等大体系的模拟计算。主流计算软件介绍物理化

60、学领域的计算软件众多,包括第一性原理计算软件、分子动力学软件等。大部分软件包均支持多种计算方法,如Hartree-Fock、DFT、半经验方法、分子力学、分子动力学方法等,可以计算研究体系的能量、电学、磁学等不同性质。不同的软件包具有各自的特点及适用场景,需根据具体的研究体系进行选择。表:部分计算软件支持的计算方法列表GaussianGaussian是目前计算化学领域内最流行、应用范围最广的商业量子化学计算程序包之一,功能全面,基本上实现了第一性原理计算的各种算法,不仅可以模拟气相或者溶液中单分子体系的基态和激发态,还可以对周期边界体系(如晶体)进行计算。Gaussian软件可以研究的对象包括

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论