适应于千万亿次科学计算的新型计算模式

上传人：1*** IP属地：辽宁上传时间：2023-07-31 格式：DOCX 页数：26 大小：54.18KB 积分：30 举报 版权申诉

已阅读5页，还剩21页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

项目名称:首席科学家:项目名称:首席科学家:起止年限:依托部门:中国科学院适应于千万亿次科学计算的新型计算模式陈志明中国科学院数学与系统科学研究院2010.9至2015.9二、预期目标本项目以建立适应于千万亿次科学计算多学科交叉的新型计算模式为出发点，解决高效使用具有数千至数万处理器（核）的高性能计算机的关键基础算法问题，建立适应于千万亿次科学计算的高效并行应用支撑软件框架和平台，在框架和平台的支撑下，研制千万亿次科学计算并行应用程序，开展千万亿次科学计算典型应用示范研究。作为新型计算模式应用示例，我们将根据环境、材料、信息和国防建设等领域开展千万亿科学计算应用所必须解决的共性算法和支撑软件研制问题，开展大波数波动离散问题和大规模特征值问题的可扩展算法研究，实现千万亿次科学计算的大规模并行软件框架的研制，将创新的高性能算法应用于高性能气候系统模式、国防建设中粒子输运模拟的高精度高效计算方法研究与软件研制、集成电路设计制造中三维光刻工艺仿真、几何参数偏差下互连线寄生参数提取等国家重大需求问题。我们将结合天河、银河、曙光等百万亿到千万亿次系列高性能计算机检验和运行本项目研制的支撑软件框架、平台和应用程序，在武器物理、惯性约束聚变和地球系统模式等领域支撑实现数十人的协同并行应用软件研制，形成规模化应用。五年的预期目标为：1.可扩展基础并行算法的创新理论•研究区域分解和多重网格这两种快速算法对大波数波动问题求解，对波数是100以上的大波数波动问题，提出行之有效的数值算法，并考察算法的收敛性；•建立三维光刻工艺仿真的高效电磁场并行计算方法，解决几何参数偏差下互连线寄生参数提取的随机问题，建立一套基于完整物理原理的化学机械抛光工艺的建模和仿真算法；•发展三维地震波场正演快速算法和成像反演方法，建立基于多信息融合的反演理论和算法。•发表高水平学术论文30篇，培养博士和硕士研究生多人。2・自适应结构网格并行应用软件框架JASMIN框架功能得到很大的完善和发展，适应实际应用的复杂性和多样性，在武器物理、惯性约束聚变和地球系统模式等领域支撑实现数十人的协同并行应用软件研制，形成规模化应用。JASMIN框架性能得到极大的提升，适应千万亿次计算。基于JASMIN框架研制的五个以上应用软件适应数千至数万处理器核，并行效率大于30%，获得网格规模达数亿、自由度达数十亿、粒子数达数百亿的标志性模拟成果。•获得软件著作权或专利2-4项，发表高水平学术论文20篇。3.自适应非结构网格并行软件平台和特征值计算•形成一个适合千万亿次并行计算机的并行非结构网格自适应软件平台，基于平台发展2个以上有实际应用背景的并行应用程序，在国产并行计算机的数千至数万个处理器核上开展大规模高效并行数值模拟；.建立可用于千个原子的动力学模拟和各种边界条件的有限元电子结构计算软件包，可利用上千个处理器核进行大规模并行计算；建立一个包括热传导问题的统计力学多尺度耦合模型的、适用于大规模并行计算的软件包；.发展一种适合计算二维有阻挫或费米子系统的有效方法，能够解决Hubbard模型等与高温超导紧密相连的一系列计算物理问题，揭示高温超导现象的物理；.发表高水平学术论文30篇，培养一批并行计算的高水平研究人才。4.气候系统模式的高性能算法与应用•发展海冰/海洋模式转移极点的水平坐标；建立混合拉格朗日-欧拉海冰动力学数值方法；实现不同尺度下模拟冰间水道的随机参数化方案；确定截断和舍入误差随分辨率和时间的变化及计算误差的上确界;确定大气模式的可预报性及制约可预报性的因子；.发展高性能气候系统模式，该模式将能处理近1亿网格、1000亿自由度、在1000到10000个计算核上运行；.利用气候（地球）系统模式开展短期（季节）和长期（十年至百年）气候预测研究，参加国际模式比较计划；利用全球或区域耦合模式重点开展东亚气候（特别是极端天气、气候事件）和海冰变化及预测的研究；.基于R13方程组所采用的修正方法，对任意高阶正则化矩方程组给出数值模拟方案，在该方案的基础上研究自适应方法，开展大气高层流体力学模拟。.发表高水平学术论文30篇，培养博士和硕士研究生多人，争取培养杰出人才1名。5.支持多物理耦合的粒子输运算法与软件.针对武器物理研究和核电站反应堆设计等领域中大规模高精度的科学计算，建立MC全局解及全局降方差理论基础；.实现不同时空尺度下，粒子输运与其它物理过程高效、实用的大规模并行耦合计算；.通过MC方法与SN方法的耦合算法研究，实现MC方法与SN方法的正伴和空间两种耦合方式；N N.研制具有自主知识产权的、通用的、适应于数百至千万亿次计算机的大型粒子输运开放软件，实现数十亿至千亿粒子、数千上万核的蒙特卡罗大规模并行数值模拟能力，并取得良好的并行效率；•发表高水平学术论文20篇，培养博士后、博士和硕士研究生多人。三、研究方案本项目将针对千万亿次科学计算处理问题规模巨大和计算机体系结构日趋复杂的特点，依托我国的高性能计算硬件环境，有针对性地开展大规模可扩展算法和适应于千万亿次科学计算的应用软件实现方法研究，围绕几个有重要意义的挑战性的实际课题，组织研究队伍进行攻关。本项目与国内外类似的科学计算研究工作相比，有一系列创新点并有许多特色。本项目注重高性能科学计算软件研制的交叉性特点。高性能科学计算应用软件不同于一般的计算机应用软件，它的研制需要物理建模、计算方法、并行算法和软件实现的交叉融合。物理建模和计算方法需要抓住主要物理特征进行设计，一方面确保问题的求解精度，另一方面大幅度降低计算复杂度和计算量，降低对计算机的依赖程度。并行算法和软件实现需要针对物理模型和计算方法，充分考虑计算机体系结构。当前，国产高性能计算机的峰值性能已经逼近了以美国为代表的国际先进水平，这给我国科学与工程计算提供了良好的发展机遇。但是，如果仍然采用传统的技术途径，物理模型和计算方法专注于串行，并行算法和软件实现专注于计算机，并行应用程序专注于串行程序的并行化，则由于物理模型、计算方法和串行程序对大规模的先天不足，再加上学科的层次化分割，很难研制出高效使用大规模并行计算机的应用程序。同时，这样的技术途径也使得并行应用程序的研制周期相当长，无法适应国产高性能计算机的快速发展。因此，只有革新现有研究思路，真正实现物理建模、计算方法、并行算法和软件实现的交叉融合，大幅度降低并行应用程序的研制难度并缩短其研制周期，才有可能取得本质突破，实现跨越式发展。本项目基于以上认识，我们提出建立高性能科学计算应用软件发展的新型模式，即将并行应用支撑软件框架和软件平台作为“物理模型和计算方法”与“并行算法和软件实现”交叉融合的切入点，在框架和平台的支撑下，创新大规模可扩展的并行计算方法，研制千万亿次科学计算并行应用程序，开展千万亿次科学计算应用。我们认为，这一新模式的实现，将突破“计算效率低”和“研制周期长”两大瓶颈，推动我国科学计算应用软件实现跨越式发展。本项目针对国家重大应用对高性能科学计算的需求。我们从众多科学计算的应用问题中选择了高性能气候系统模式、与多物理过程耦合的粒子输运模拟、纳米尺度下集成电路设计制造中电磁和流体计算、大规模有限元电子结构计算、稀薄气体数值模拟、三维地震波场正演问题的快速算法和成像反演方法等具体研究课题作为切入点，以求重点突破，以点带面。本项目的应用目标中，有的是上一期973计划“高性能科学计算研究”高水平研究基础上的进一步创新，如气候系统模式、纳米尺度下集成电路设计制造中电磁计算、大规模有限元电子结构计算，需要解决在千万亿次计算环境下关键的可扩展性难题；有的则是根据我国科技发展和武器物理全过程的演化阶段新开拓的研究方向，如与多物理过程耦合的粒子输运模拟、稀薄气体数值模拟、三维地震波场正演问题的快速算法和成像反演方法。我们将为这些问题的解决提出发展新的计算方法和实现技术，而新的方法一旦提出，必有更广泛的应用。本项目瞄准高性能科学计算学科国际前沿。在上一期973项目“高性能科学计算研究”的资助下，我们以并行自适应算法及其关键实现技术这一国际科学计算领域极具挑战性的难题作为我们的主要目标，建立了并行自适应计算从方法的数学原理到软件实现框架和平台再到应用的创新体系，这些工作为本项目研究的开展奠定了坚实的基础。我们根据千万亿次科学计算的国际发展趋势，我们适时提出大规模代数方程组和大型特征值问题的可扩展算法作为我们的突破点，不仅仅是因为这是解决本项目重大应用目标的需要，更重要的是我们希望以此千万亿次科学计算的共性问题为突破口，为今后我国高性能科学计算全面实现跨越式发展打下基础。

四、年度计划年度研究内容预期目标第一年研究三维电磁散射问题的自适应各向异性PML方法，研究弹性波方程的自适应PML方法，为光刻问题和地震波的计算建立基础；研究三维时谐Maxwell方程的自适应有限元离散代数系统的多重网格法；研究互连线寄生参数提取的并行有限元算法；发展含各向异性和散射体的复杂结构中地震波传播的理论地震图正演计算.设计适应异构多核体系结构的结构网格数据结构；凝练实际应用物理模型和计算方法中的数据依赖关系，研究非规则数据通信算法；研究自适应结构网格上的稀疏非线性和线性代数方程组上的多重网格算法、区域分解方法；研究辐射输运数据驱动并行算法；研究辐射流体力学的并行自适应计算；研究辐射驱动的多介质大变形流体力学计算方法；五个以上应用软件的发展和完善.开展PHG平台及相关应用程序在千万亿次并行机上的移植、测试和优化;研究现有第一原理计算程序中的不足和解决办法；研究非线性（电子结构）特征值问题的数值分析、电子结构计算的多水平实空间方法；收集稀疏特征值问题的相关文献，寻找切入点和突破口；研究特征值问题的有限元方法，包括可信赖的界及其精度等;通过矩阵乘积态研究精确计算一维量子转移矩阵的方法.结合IPCCAR5气候变化评估对IAP/LASG气候系统模式分量模式进提出三维电磁散射问题的自适应各向异性PML方法，初步建立三维电磁散射问题的自适应计算程序；建立三维时谐Maxwell方程自适应有限元离散系统多重网格法理论，给出收敛性和波数的关系；建立互连线寄生参数提取的高效并行有限元方法.数据结构适应异构多核体系结构，完成相应软件模块的研制；非规则数据通信算法适应数千处理器核；并行多重网格算法和区域分解算法适应千万量级自由度和上千处理器核；初步实现辐射流体力学并行自适应计算;数据驱动并行算法适应数百处理器核.制订针对千万亿次并行机的性能优化方案，特别是核心数据结构；找出目前第一原理计算程序中的关键瓶颈；优化已有的电子结构实空间程序，提高其计算速度；解决转移矩阵重正化群方法在研究低温物理性质时的计算不稳定性.加深对IAP/LASG气候系统模式计算稳定性、计算效率等方面问题的理解，完善海冰模式热力学过程，提高海洋模式在极区的稳定性，加深国际先进大气模式对东亚气候模拟能力以及系统偏差的理解，实现分离低阶偏微分平流系统中计算误差，并利用数值验证理论公式；将NRxx算法实现到无结构网格上以及实现线性重构算法.建立粒子输运问题中MC方法全局

年度研究内容预期目标行检验和评估，改进海冰模式辐射参数化过程，研究海洋模式在极区的新求解算法,对国际先进大气模式进行检验和评估，研究低阶偏微分平流方程中计算误差的分离公式和试验方法；NRxx在无结构网格上的数值方法和二阶数值算法的实现.5.研究粒子输运问题的MC方法全局解及全局降方差方法；分析和分解系统的整个演化过程，研究粒子输运时空尺度自适应评判机制；研究SN方法的有限体积高精度格式.解及全局降方差方法理论基础；给出时空尺度自适应评判机制，确定粒子输运计算在何时何地采用独立于其它物理过程的时空尺度；给出SN方法求解粒子输运方程的高精度格式。第年研究声波表面波PML方法的数学理论；继续研究弹性波方程的自适应PML方法，为光刻问题和地震波的计算建立基础；从数值和理论上研究Helmholtz波动方程的多重网格法；针对耦合的偏微分方程组，给出基于物理的预处理算法的理论描述；研究Karithonov理论、高维小波等高效随机方法;探索模型降价的方法，在保持问题本质不变的情况下，用一个低阶的问题来代替高阶的问题，来获取反映问题本质的反演结果.发展非规则数据通信算法，研究动态负载平衡方法；研究适应数千处理器核的多物理耦合并行算法；研究适应数千处理器核的辐射输运通量扫描并行算法；研究适应大规模计算和数千处理器核的稀疏线性代数方程组解法；研究适应大规模计算的辐射流体力学计算方法；五个以上应用软件在数千处理器核上的大规模并行建立弹性波方程的自适应PML方法并开展计算模拟，初步建立三维光刻问题的自适应计算程序；建立此多重网格法的初步理论，给出收敛率和波数的关系；得到基于物理的预处理算法的理论描述和算法实现框架；建立互连线和电路分析的高效随机方法；对一些简单的模型问题，研究基于模型降阶的反演方法的可行性.JASMIN框架功能满足实际应用软件的发展需求，性能适应数千处理器核；提出一批适应数千处理器核的高效非规则数据通信算法、动态负载平衡方法、稀疏线性代数方程组迭代求解预处理方法；五个以上应用软件在数千处理器核上实现高效计算，网格规模达到千万量级，自由度达十亿，粒子数达百亿.完成PHG平台的多核优化，使其初

年度研究内容预期目标数值模拟.开展PHG平台的多核优化，主要是重点模块的MPI+OpenMP两层并行化;针对关键问题建立和发展新的第一原理计算计算方案，着手修改程序；开始能源相关材料的物理问题研究；开展特征值问题的数值分析、特征值问题的局部化离散研究、电子结构计算的多水平实空间方法探索；深入剖析稀疏特征值问题的已有算法和理论，明确其优点和不足;研究特征值问题的有限元方法，研究一般网格尤其是自适应网格下特征值问题的加速技术；探索研究精确计算二维张量网络态的投影或颗粒化的数值重正化群方法.海冰/海洋模式转移极点的水平坐标，设计基于卫星和雷达数据反演的冰间水道随机参数化，研究误差的吸引子理论和平均饱和误差的性质，利用大气模式开展大规模集合模拟数值试验，分析大气模式内部和外部变率及其对模拟结果的影响；研究使用拉盖尔多项式表达多原子气体原子内能的方法和BGK模型的Prantle数的修正方法.研究MC驿站源重要加塞置换抽样方法；在系统时空演化规律和其它物理过程求解方法的约束下，研究粒子输运计算的时空尺度大小；开展MC方法和SN方法的正伴耦合算法研究；研究MC驿站源粒子的并行抽样方法；研究SN方法的有限元（或间断有限元）高精度格式.步具备在上万处理器核上开展并行数值模拟的能力；初步达到改善第一原理计算效率的目的；优化已有的电子结构实空间程序，提高计算速度与精度;提出稀疏特征值问题新型算法的构造思路;发展精确计算二维张量网络态的数值重正化群方法.解决海冰/海洋模式在极区计算奇异性的问题，研发高分辨海洋模式，将误差的吸引子理论应用于Lorenz系统，获得其误差吸引中心，三维图像，利用数值模型得到平均饱和误差的数值,完成多模式集合模拟试验，获得大气模式内部和外部变率模态及其演变规,NRxx推广到多原子气体和Prantle数的修正.完成考虑重要性因子的MC驿站源加塞置换抽样方法及程序实现；在系统时空演化规律和其它物理过程求解方法的约束下，确定粒子输运计算的时空尺度范围；实现SN方法解伴随指导下的MC方法输运正算；建立高效的MC驿站源粒子并行抽样方法.

年度研究内容预期目标第年继续研究声波表面波PML方法的数学理论，研究电磁表面波PML方法的数学理论；研究Helmholtz问题的Robin区域分解法;研究各种高效随机方法求解互连线参数提取中的随机Maxwell方程；复杂参考模型的理论计算波形与实际观测波形间的互相关分析.针对异构多/众核CPU-GPU混合体系结构，研究提升计算效率的浮点性能优化方法；研究适应数千处理器核的辐射流体力学并行自适应计算；研究适应数万处理器核的非规则数据通信算法及数据驱动并行算法；研究适应数万处理器核的可扩展并行代数多重网格算法和区域分解算法；发展用户编程接口.进一步优化PHG平台；基于PHG平台发展并行应用程序；研究第一原理计算方法和程序的并行化等问题；建立材料设计的逆向设计方法，根据能源材料的特殊要求设计新的材料体系；开展特征值问题的局部化与多尺度组合离散研究与动力学模拟尝试;研究大规模线性和非线性代数方程组的预处理和迭代算法；研究特征值上下界的算法，发展相应的计算软件;探索研究精确计算二维张量网络态的投影或颗粒化的数值重正化群方法.建立混合拉格朗日-欧拉海冰动力学数值方法,建立多精度的并行化的高阶Taylor算法求解非线性混沌系统，减少计算误差的影响，基于集合模拟数值试验结果，分析大气候模式可预报性及关键海区海气动力学，分析数值模式空间分辨率对模式可预报性的影响；空间网格自适应的技建立声波表面波PML方法的数学基础并开展计算模拟；给出区域分解法的收敛性分析，并数值上进行验证;建立几何参数驱动互连线寄生参数提取的高效随机方法及并行算法；定量地测量在不同频段的时间和振幅上的波形差别及反映参考模型误差的敏感度函数.JASMIN框架和多个应用软件的浮点计算性能得到明显改善；完成近万处理器核的多个大规模计算算例.完成微电子设计中的光刻数值模拟并行程序的初步版本；对小体系进行动力学模拟，改进计算方法；形成易用的特征值有限元算法及后处理程序；发展精确计算二维张量网络态的数值重正化群方法.实现不同尺度下冰间水道的模拟，提高对海冰运动数值模拟的计算效率和精度，对lorenz模型实现可以处理数百至上千阶的优化数值算法，控制计算误差的增长，进而得到混沌系统长时的正确数值解，获得模式可预报性的时空演变规律和模式空间分辨率对可预报性影响的评估，完成分布式并行模式下网格h-自适应的部分代码.推导MC驿站源重要性纠偏权公式，给出重要性偏倚函数的优化选择标准；建立高效的粒子输运网格量与其它物理过程网格量之间的不同尺度重分、重映算法；提供适应于更大规模随机模拟的长周期随机数发生器.

年度研究内容预期目标术准备和基于Maxwellian迭代的正则化方法.5.研究MC驿站源重要性偏倚抽样函数的优化选择;研究粒子输运网格量与其它物理过程网格量之间的重分、重映算法；研究组和长周期随机数产生方法及品质检验方法.第四年继续研究电磁表面波PML方法的数学理论；研究离散波动方程基于PML方法的迭代方法；考察在粗空间上用有效光滑子的多重网格法对大波数波动问题的收敛情况;研究化学机械抛光工艺中粗糙接触问题以及复杂的三维非牛顿流问题;研究基于模型降价的方法，来获取反映问题本质的反演结果。初步实现全波形反演.面向数万处理器核，研究动态负载平衡方法；研究适应数万处理器核的辐射流体力学并行自适应计算；提出适应多物理耦合复杂应用发展需求的用户编程接口；多个并行应用软件在数万处理器核上的适应性考核.进一步优化PHG平台；基于PHG平台发展并行应用程序；完善能够高效使用上千核的第一原理计算程序；重点开始材料物性的研究；研究线性和非线性代数方程组的预处理和迭代算法，研究特征值问题的算法构造与理论分析；研究将特征值问题有限元算法深入到矩阵求解层面；探索研究精确计算二维张量网络态的投影或颗粒化的数值建立电磁表面波问题的自适应PML方法并开展计算模拟；对波数是一百左右的大波数波动问题，用此多重网格法进行有效计算；建立一套基于完整物理原理的化学机械抛光工艺的建模和仿真算法；提出基于模型降阶的反演方法的算法.基于JASMIN框架，初步完成并行编程模型的设计和验证；完成数万处理器核的多个大规模计算算例；完成三维激光等离子体相互作用粒子模拟的大规模计算，粒子规模达数百亿.完成光刻数值模拟并行程序的优化版本;进行典型分子体系计算，改进计算方法；发展精确计算二维张量网络态的数值重正化群方法.建立高性能和高分辨率海冰模式/海洋模式的框架，得到计算误差，初值误差，参数化方案中的误差等对低频震荡模拟结果的影响，找出制约模式可预报性的主要因素，初步完成高性能气候系统模式的研发，完成分布式并行模式下的网格自适应代码和

年度研究内容预期目标重正化群方法.结合耦合和分量模式开展海冰变化和预测，以及东亚气候的研究，对含CISK参数化机制的热带低频震荡模型进行误差增长的理论和数值研究，研究气候模式可预报性，开展20世纪气候数值模拟试验；空间网格自适应的技术准备和进行网格自适应的测试.开展含时外源问题，位置重要性偏倚抽样方法研究；研究MC方法和SN方法的空间耦合算法；研究粒子输运与其它物理过程在不同时空尺度下的耦合计算方法.负载平衡代码，进行空间网格自适应指示子的尝试.5.建立含时外源问题位置重要性偏倚抽样方法；实现MC方法和SN方法的空间耦合输运计算；实现粒子输运与其它物理过程在不同时空尺度下的耦合计算.第五年研究波导问题PML方法的数学理论；继续研究离散波动方程基于PML方法的迭代方法；研究改造粗空间的多重网格法的收敛情况，进一步研究区域分解的平行效果;研究光刻工艺仿真的三维电磁场问题;研究复杂参考模型的快速计算与反演.在数万处理器核上，运用并行应用软件，开展大规模数值模拟研究，获得一批具有显示度的大规模模拟成果。运用基于PHG平台发展的并行应用程序开展大规模数值模拟；开展电子结构计算程序优化与大规模并行计算；研究大规模线性和非线性特征值问题的数学性质、代数结构和高效算法；将先前形成的特征值问题有限元算法应用于实际计算问题应用张量重正化群方法研究二维Hubbard模型的基态性质.提出离散波动问题的可扩展方法；进一步对波数是一百左右的大波数波动问题，用多重网格和区域分解快速求解;建立三维光刻工艺仿真的高效电磁场并行计算方法；取得预期的快速算法和反演研究成果.JASMIN框架功能满足实际应用软件的发展需求，性能满足数万处理器核。完成二维辐射流体力学耦合粒子输运的大规模计算，自由度达数十亿；完成三维辐射流体界面不稳定性的大规模并行自适应计算，网格规模达到数亿量级，自适应计算显著降低网格规模和计算量.获得数千上万核上的非结构网格大规模并行自适应数值模拟结果；完成能够高效使用多核的第一原理并行计算程序，在上千个处理器核上进行电子结构大规模并行计算；在能源相关材料方面取得重要突破；创新大

年度研究内容预期目标继续开展短期和长期气候数值模拟试验，继续深入研究东亚夏季气候可预报性,对气候系统模式中的计算误差影响问题进行综合研究；初步研究方法在大气外层稀薄气体、微流和高超流体等可能应用上的测试和模型自适应.研究MC方法和SN方法的正伴及空间耦合模式的高效并行算法；研制耦合计算的高效并行程序；开展大规模并行计算测试.型稀疏特征值问题的并行计算方法；从机理上搞清楚高温超导赝能隙和其它产生的物理根源，解释实验上观察到的物理现象.完成高性能和高分辨率海冰/海洋模式，实现千亿自由度的气候模拟，获得东亚夏季气候可预报性的影响因子，获得气候系统模式中计算误差受时空分辨率的影响规律，以及其对模拟结果的影响程度，实现稀薄气体测试问题的全场并行模拟.实现MC方法和SN方法的正伴及空间耦合模式的高效并行计算；在千万亿次计算机上，实现数千上万核的蒙特卡罗大规模并行计算。一、研究内容本项目将集成具有共性的计算方法、并行算法和相应的软件模块，建立适应于千万亿次科学计算的高效并行应用支撑软件框架和软件平台，在框架和平台的支撑下，创新大规模可扩展的并行计算方法，研制千万亿次科学计算并行应用程序，进行千万亿次科学计算典型应用示范，建立适应于千万亿次科学计算的新型计算模式。1.可扩展基础并行算法一般地，构成实际应用物理过程的各个不同阶段的物理模型，可分别由不同类型的时间相关或无关的偏微分方程在给定的物理区域上描述。用计算机求解偏微分方程一般分为三步，首先在物理区域上划分网格、然后在网格上设计离散格式、最后求解离散线性和非线性方程组。在前期973项目支持下，我们在结构网格和非结构网格自适应方法的理论、算法和软件实现方面开展了系统的研究，取得了重要的创新性成果。当前，求解离散线性和非线性方程组的可扩展大规模并行算法成为千万亿次科学计算的关键问题，也是本课题的研究重点。大波数离散波动问题的可扩展算法具有广泛应用，它的突破将带动声波、电磁波、弹性波等许多重要应用的发展，对于线性方程组可扩展并行算法的研究具有重大推动作用，也是科学计算的公开困难问题。本课题将以此为突破口，开展集成电路设计制造中电磁和流体计算方法、三维地震波场正演问题的快速算法和成像反演方法的研究。1.1大波数波动离散问题的可扩展算法时谐Helmholtz方程和Maxwell方程组是模拟声波和电磁波的基本模型。当用某种离散化方法求解它们时，网格尺寸必须与频率相匹配，以得到满意的逼近误差。特别地，对高频情形网格尺寸必须很小，从而离散系统的规模变得非常大，其条件数也非常大（同时受到频率和网格尺寸的影响）。构造求解该离散系统的高效快速算法无疑是非常重要的。近年来，国内外已有一些计算数学专家尝试用一些快速算法来求解此代数系统，如多重网格算法，区域分解算法等。在区域分解方面，法国Despres教授首先提出了用Robin型非重叠区域分解法解此类问题，从数学上来说，此类区域分解法求解Helmholtz方程大波数波动问题是最自然的，因为此时每个问题是适定可解的。Despres已证明此区域分解算法是收敛的，该方法的一个优点是算法是高度平行的，非常适合于利用平行计算机进行求解。瑞士日内瓦大学的Gander教授进一步研究了该算法发现在波数50左右，利用优化交界面上的信息获得具有较快收敛的Robin型区域分解法。美国柯朗研究所的Windlund教授与其合作者，尝试用重叠型区域分解法来构造预条件子来处理Helmholtz方程的有限元离散系统，对波数是40左右的波动问题进行了有效的数值模拟，但对大波数问题，该方法效果不是很好，原因是该算法要构造有效的粗空间，而在粗空间上Helmholtz方程的数值解是不稳定的。总而言之，到目前为止，尚没有设计出真正高效的针对大波动数问题的区域分解算法。在多重网格方面，也有一些研究工作，最早的工作由多重网格专家Brandt教授首先提出，他称之为波射线多重网格法，基本思想是在粗网格上不求解大波数波动问题，而是建立所谓的射线辅助方程来进行校正，该方法对波数50左右的波动方程是有效的，但该方法的一大缺陷是构造的射线问题很难实现，对变系数问题无法推广。美国的Elman教授提出如果在粗网格上用GMRES迭代代替通常的Jacobi和Gauss-Seidel迭代来进行磨光，尽管在粗空间上迭代可能不收敛，但可以起到很好的校正作用，即消去误差的低频部分，数值显示对波数在50左右的波动问题，效果是明显的，能得到最优的多重网格迭代算法。但到目前为止，对大波数问题的多重网格法还有待进行深入的研究，其困难还在于如何在粗空间上构造有效稳定的校正问题。我们将从多个方面对该问题进行研究：首先充分研究大波数Helmholtz方程和时谐Maxwell方程组的谱结构，然后利用其构造尽可能小的粗空间并发展相应的区域分解方法和多层网格方法。在Robin型区域分解方法方面，由于对正定问题的Robin型区域分解法，我们已获得了一些世界领先的理论结果，其结果受到了国外计算数学家的广泛好评和引用，并已发展了一套有效的分析工具和数学技巧，我们将利用这些分析技巧和工具，进一步研究强不定问题的Robin型区域分解法的收敛情况。首先对波数不是很大的Helmholtz方程，证明此时Robin型区域分解法的收敛速度与正定问题是一样的。进一步，再研究大波数问题区域分解的收敛情况，由于此时方法是高度平行的，因此有望获得满意的数值结果，最后将从理论上详细分析大波数问题Robin型区域分解法的收敛行为，尤其要研究收敛率和波数的关系。在多重网格方面，我们将从两方面入手考虑Helmholtz问题的多重网格法,第一是在粗网格上设计更有效的光滑子，特别是问题相关的光滑子，即该光滑子与原始问题直接挂钩，同时用GMRES方法代替标准的Jacobi和Guass-Seidel方法作粗网格光滑子，此时尽管光滑迭代过程是不收敛的，但是可以起到误差的校正作用，其误差的低频部分可以消去。此想法已被应用求解对流-扩散问题以及强间断系数问题，相信对大波数问题也会有一定的效果。第二，我们将类似于Brandt教授的波射线多重网格法的思想，改造我们粗网格逼近问题。最近，XiaobingFeng和武海军教授利用间断有限元对Helmholtz方程提出了一个不依赖于网格的稳定的数值格式，从谱等价的角度，直观上我们可以采用此离散模式来构造我们的粗空间校正问题，在粗网格上设计有效的光滑子。1.2纳米尺度下集成电路设计制造中电磁和流体计算目前世界上最先进的集成电路制造工艺已经进入到纳米尺度（32纳米），芯片集成度达到数亿万门数量级，芯片面积达数平方厘米。市场上最快的单核CPU（奔腾4）的时钟频率达4GHz。考虑复杂工艺偏差的可制造性设计是集成电路设计进入纳米尺度的核心、前沿问题，也是目前国际研究的热点，这包括对集成电路核心工艺的建模、仿真以及考虑工艺参数偏差下集成电路的建模、仿真算法。进入32、22纳米工艺节点后，光刻机所采用的193纳米光源波长与掩模的特征尺寸已达到了同一个量级，光刻工艺进入了理论分辨率的极限，传统的光刻仿真方法将掩模和硅片表面假象为一个平面的假设不再成立。考虑掩模和硅片表面三维形貌的三维电磁散射效应的精确光刻模型和仿真算法已列为国际半导体技术发展路线图ITRS的前沿科学问题。现有的时域有限差分算法、波导方法以及严格耦合波分析方法存在着计算速度慢和收敛困难的问题，不能适用于大规模问题的光刻模拟。工业界仍缺少一套高效、成熟的三维光刻工艺仿真工具。在基于电磁场的掩模和成像模拟中，国际半导体技术发展路线图ITRS明确提出一方面要对现有方法在精度、速度和内存消耗等各方面做深入细致的比较研究，另一方面也提出发展更有效率的严格电磁散射分析方法在未来集成电路工艺优化和制造如大规模掩模缺陷检测等问题中有巨大的应用需求。我们将结合前期973项目开发的并行自适应有限元软件平台PHG,发展三维光刻电磁散射问题的自适应PML方法，建立具有自己特点的三维光刻严格电磁场计算方法及其实现技术。互连线的性能是决定电路性能和可靠性的关键因素之一，到了纳米工艺下，光刻、化学机械抛光等复杂工艺造成互连线几何尺寸的偏差，进一步影响互连线电学参数及其性能。几何参数偏差驱动的互连线寄生参数提取的目的就是要在互连线建模中进一步考虑工艺参数偏差的影响，它所面临的主要挑战是计算复杂度过高：一方面，集成电路互连线复杂的结构、庞大的规模给寄生参数提取的数值计算带来了巨大的挑战；另一方面，几何参数偏差驱动的互连线寄生参数提取需要在几何参数的随机空间中多次采样、重复求解。因而，我们迫切需要一个高效的互连线寄生参数提取的电磁场计算方法。目前，单核处理器性能已趋于饱和，随着并行处理时代的到来，基于并行处理的互连线寄生参数提取方法显得尤为重要。在上一个973项目中我们已经取得了互连线寄生参数提取、电磁场数值计算等一系列研究成果，我们将进一步从并行自适应有限元多重网格方法出发研究复杂结构互连线寄生参数提取的数值方法，一方面研究高效的并行有限元方法在互连线寄生参数提取中的应用，另一方面研究基于嵌套式稀疏网格的高效随机配置方法来求解互连线寄生参数提取的随机Maxwell方程。由于互连线主导芯片性能，化学机械抛光CMP工艺会改变互连线的高度，使其偏离设计值，从而影响电路性能。因此CMP工艺建模和仿真的目的是为了获得硅片上互连线的高度和介质层厚度及其偏差模型，以指导考虑芯片平整度和工艺偏差的电路分析和设计优化。目前基于物理原理的CMP工艺建模和仿真涉及到研磨垫和硅片之间的粗糙接触问题的求解以及研磨液在研磨垫和硅片两者之间复杂的三维非牛顿流问题的求解，其计算精度和计算复杂度的问题一直挑战着CMP工艺仿真技术在可制造性设计和CMP工艺优化等方面的应用。因而，我们迫切需要一个精确高效的CMP工艺建模和仿真算法。在以前的研究中，我们开发了基于粗糙研磨垫模型的CMP工艺建模和仿真方法，以及项目开发的并行自适应有限元软件平台PHG。我们将进一步从并行自适应有限元多重网格方法出发研究复杂的三维非牛顿流问题的数值方法，并结合已有的粗糙研磨垫模型，建立具有自己特点的、精确高效的CMP工艺建模和仿真方法及其实现技术。虽然化学机械抛光工艺是目前为止唯一成功并大规模使用的平坦化工艺技术，其硅片表面材料的去除机理问题一直在学术界存在较大争议。在本项目中，我们将进一步系统地研究研磨液、研磨颗粒以及研磨垫与硅片之间的物理化学作用，完善“React-Shear-Transport”模型，建立一套完整的、经过验证的CMP工艺研磨机制。1.3三维地震波场正演问题的快速算法和成像反演方法人们关于地球内部结构的认识大都来自于地震走时层析成像的反演研究，这些认识的取得离不开地震传感技术、海量数字存储能力和高速计算能力的发展，以及三维复杂介质中地震波传播的理论进展。但基于射线理论的走时层析成像方法仅使用直达（沿最短路径传播的）波震相等有限的到时信息，只包含射线路径上很狭小范围内的影响信息，而没有充分利用地震观测台记录到的所有波形信息，即利用地震波从震源经其它路径到达地震台的信息，故它不能对残留在地幔中成分显著不同的岩石层精确地成像。精细的成像要求我们考虑从不同大小弱散射体上弹回的能量，充分利用地震全波形记录所携带的所有可能震相的振幅和走时信息，来提高反演确定地球内部的非均匀结构分辨率，精确地约束确定非均匀体的尺寸、深度和速度差异，尤其是反演获得岩石圈底部与软流圈复杂过渡带的精细图像，以深入探讨地层破坏的动力学与现今强震活动的关系。因天然地震和地震台站的分布有限，无法达到对地球内部理想的均匀采样的现实条件下，采用数值方法来计算任意复杂结构的合成地震图，提供了地震层析成像的一种解决途径，促使了发展含各向异性和散射体的复杂结构中地震波传播的理论地震图正演计算的需求。通过复杂参考模型的理论计算波形与实际观测波形间的互相关分析，定量地测量在不同频段的时间和振幅上的波形差别及反映参考模型误差的敏感度函数，就可以进行地球内部结构的高分辨率全波形反演。在弹性考虑下利用有限差分法计算得到的理论地震波形，应用全波形反演方法成功的获得了美国洛杉矶盆地的三维结构；Fichtner等通过构建时间-频率域的观测与理论波形的偏离函数，给出了进行全球和区域多尺度深部结构的全波形反演成像的一种新途径；Sieminski等提出了利用理论和实测波形的振幅差异通过SKS波分裂分析进行上地幔变形的有限频分析途径。这些研究实例，充分展示了地震全波形反演研究已成为地震层析成像反演的前沿和热点。我们将在Zhao等提出的散射-积分法基础上，将原有的利用有限差分法模拟地震波在三维介质中的传播过程，进一步扩展计入介质衰减和散射，以及各向异性的不均匀介质的三维波动传播的波形正演计算。计划针对华北克拉通东部区域进行相关研究，由于区域较大，必须考虑到地球曲率和地形的影响，以及不同分区的耦合和边界连续性问题。在实际反演计算过程中，因不断地修正模型和求解正问题的需要，致使反演效率很低，且往往需要大量的时间来得到反演结果。探索应用目前科学计算中的模型降价的方法，在保持问题本质不变的情况下，用一个低阶的问题来代替高阶的问题，来获取反映问题本质的反演结果。2・自适应结构网格并行应用支撑软件框架网格是众多重大科学计算问题的重要基础，网格的质量对计算效率和结果精度均有重大影响。自适应结构网格是科学计算广泛采用的一类高质量网格。针对该类网格，建立并行应用支撑软件框架，是实现科学计算新型计算模式的关键步骤。在上一期973项目“高性能科学计算研究”的资助下，我们成功研制了自适应结构网格的并行应用支撑软件框架JASMIN。该框架适应于数十万亿次计算机，可以在数百上千处理器核上支持高效并行应用软件的研制。基于该框架，在武器物理、激光聚变、材料科学等领域已经成功研制多个并行应用软件，它们在实际应用中发挥了重要作用。这些工作为本项目新型计算模式的建立奠定了很好的基础。针对千万亿次计算，JASMIN框架需要进一步发展。首先，随着结点内多CPU/GPU的异构型体系结构、结点内“主存/三级Cache/二级Cache/—级Cache”的多级存储结构、以及处理器内多核共享存储结构的发展，计算机体系结构日趋复杂。体系结构的复杂化必然蕴含数据结构和性能优化的新要求。目前，JASMIN仅采用网格片的面向对象数据结构，这种数据结构可以很好地削弱多级存储结构对性能的影响，但是，不能较好地适应异构型体系结构和多核共享存储体系结构，因此，必须研究多层次的高效数据结构，发展与之相适应的并行计算模型和性能优化方法，使并行应用软件自然地匹配于计算机结点体系结构。其次，处理器核数提升100倍至1000倍之后，JASMIN框架集成的非数值并行算法的性能很难适应。其中，表现最为突出的是非规则数据通信算法和动态负载平衡方法。例如，计算网格块之间相邻关系的原算法的复杂度为O（N1.5），N为网格块的个数。当处理器核数为数百上千时，N通常小于10000，计算时间还是可以接受的。但是，当处理器核数达到数万时，N将增加100倍，计算时间则将增加数千倍，这是无法忍受的。再如，千万亿次计算求解的必然是复杂应用问题，复杂应用问题必然带来网格块计算时间的动态变化，势必引起处理器核之间的负载不平衡。这种不平衡将随处理器核数的增加日趋严重，如果得不到及时控制，即使增加处理器核数，也无法有效缩短计算时间。因此，必须发展适应数千至数万处理器核的高效非数值并行算法，尤其是非规则数据通信算法和负载平衡方法。再次，问题规模或自由度个数提升100倍至1000倍之后，许多重要数值并行算法的性能很难适应，而这些算法是发展JASMIN框架所必需的。同时，实际应用问题的复杂性使得这种不适应更加突出。例如，并行代数多重网格算法是求解多介质辐射流体力学方程组隐式离散所得稀疏线性代数方程组的高效迭代算法，但是，随着自由度个数的增加和物理过程的复杂化，该算法的并行粗化策略和粗网格算子已经不相适应，过高的计算复杂度已经淹没了并行加速，这个问题是当前一个世界性难题。因此，需要发展适应复杂物理过程的数亿网格、数百亿自由度的高效数值并行算法。最后，在千万亿次计算机上，实际应用问题日趋复杂且多样，JASMIN框架的并行编程模型需要适应这样的复杂性和多样性，需要发展新的功能。例如，复杂物理过程包含多个物理模型，每个物理模型由不同的偏微分方程描述，采用不同的并行算法，这就需要并行编程模型在适应每个物理模型的同时，还需要在模型之间屏蔽数据通信，甚至进行物理量插值;对于多介质流体力学或冲击动力学，需要考虑多块结构网格之间的滑移拼接；对于三维复杂结构，需要考虑多块三维结构网格之间拼接。目前，JASMIN框架还不能适应这些情形。针对千万亿次计算，本课题将进一步发展JASMIN框架，使之从数百上千处理器核跨越到数千至数万处理器核，逐步适应实际应用问题的复杂化和多样化。在此基础上，进一步完善并行编程模型，为科学计算的新型计算模式奠定坚实的基础。为此，以JASMIN框架的完善和发展为牵引，本课题将在数据结构与并行计算模型、非规则数据通信与动态负载平衡方法、数值并行算法、并行编程模型等方面，开展系统深入的研究，并进行应用示范。（1）针对武器物理和激光聚变等复杂应用，结合应用软件在复杂物理条件下的性能特征、数千至数万核的大规模特征、以及计算机的复杂多级体系结构，研究多层次的高效的面向对象数据结构，研究与之相适应的并行计算模型，设计高效的并行算法模板。（2）针对复杂应用高效能计算蕴含的非规则数据通信问题，研究适应于数千至数万核的非规则数据通信算法，主要包括：通信调度的低开销创建算法、热点通信瓶颈的预测和求解算法、（稀疏）全局数据通信算法等。（3）针对复杂应用高效能计算蕴含的动态负载不平衡问题，研究适应于数千至数万核的动态负载平衡方法，主要包括：充分反映运行特征的负载模型、负载不平衡状况的低开销评估算法、高效的负载平衡方法、低开销的负载迁移技术（4）针对全球气候模式、辐射流体力学、辐射和中子输运、激光等离子体相互作用、流体界面不稳定性、分子动力学和位错动力学等问题的数值模拟，研究适应于数千至数万核的高效数值并行算法，包括：稀疏（非）线性代数方程组迭代解法、并行代数多重网格算法、数据驱动并行算法、多物理模型耦合并行算法、并行网格自适应算法等。（5）完善和发展新型并行编程模型，主要包括：适应多物理模型耦合的抽象接口函数，JASMIN框架软件体系结构和抽象接口函数的完善，共性高效软件模块的研制与集成。（6）五个以上应用软件的高效能计算示范研究，主要包括：应用软件体系结构的改进与发展、数千上万核的大规模数值模拟等。这些软件分别为激光聚变辐射流体力学程序、辐射和中子输运程序、激光等离子体相互作用粒子模拟程序、流体界面不稳定性模拟程序、三维位错动力学程序等。3・自适应非结构网格并行软件平台和特征值计算自适应非结构网格是科学与工程计算中另一类广泛采用的高质量网格。基于后验误差估计的自适应有限元方法对于许多复杂计算问题可以达到理论上最优的误差下降速率，有着广泛的应用领域。针对该类网格和应用，建立并行软件平台，也是实现科学计算新型计算模式的关键步骤。通过前期973项目“高性能科学计算研究”的实施，我们研制了面向有限元计算的非结构网格自适应软件平台PHG，基于平台发展了多个并行应用程序，实现了数百至上千个处理器核上的自适应有限元计算。特别地，发展了电子结构的自适应有限元方法，研制了并行计算程序，实现了包含数百上千原子的体系的电子结构自适应有限元计算。随着千万亿次计算机的部署和应用，急需有针对性地开展软件平台并研究相应的算法。其一，针对日趋复杂的计算机体系结构，改进平台的数据结构和非数值并行算法，使之适应于千万亿次计算；其二，针对实际应用的复杂性和多样性，扩充平台的功能，更好地支撑实际应用和算法研究；其三，针对复杂应用中的大规模特征值问题，研究可扩展算法并结合平台应用于电子结构有限元计算。本课题将继续发展PHG平台使之能够适应于千万亿次科学计算，支撑面向千万亿次计算机的自适应有限元算法的研究与应用；继续发展电子结构的自适应有限元方法及软件，重点寻找其所导出的非线性特征值问题的高效算法，开展动力学模拟；研究大型特征值问题的高效并行算法，力求在张量网络态的重正化群计算方法方面取得新的突破。3.1支撑千万亿次计算的并行自适应有限元软件平台PHG我们将研制适应千万亿次并行计算机的非结构网格并行自适应软件平台，突破千万亿次并行计算机上非结构网格自适应计算、特别是并行自适应有限元计算的若干关键算法瓶颈，为千万亿次并行计算机上非结构网格自适应算法研究以及并行应用程序和软件的研制提供支撑。主要研究内容如下：（1）针对国产千万亿次并行计算机的体系结构特征，研究非结构网格上的并行自适应软件技术，发展PHG平台使之可以支持数千至数万处理器核上的并行自适应有限元计算，为算法研究和并行应用程序的研制提供支撑。同时，扩展PHG平台的功能，如引入多维多种单元类型的支持、提供非协调网格自适应支持等等，以满足并行应用程序发展的要求。（2）基于PHG平台发展若干个适合于千万亿次国产并行计算机的高效并行应用程序。我们将继续发展一些在前期973项目的支持下已经打下了很好基础的并行应用程序，如实空间方法第一原理计算程序、电磁涡流问题计算程序等，同时，扩展PHG的应用范围，发展微电路设计、天体物理、计算流体、生物计算等领域中的并行计算程序。3.2电子结构自适应有限元软件传统上，电子结构计算一般采用平面波方法。近30年来，该方法已得到了充分的发展并形成了VASP、PWSCF等众多商用或免费软件包，应用于多个科学计算领域，在物理、化学、微电子等领域产生了十分丰富的成果。这些领域对计算科学不断提出新的挑战，未来千万亿次规模的计算将是重要的发展趋势。而千万亿次规模计算必然利用上万个核的大规模并行计算机。人们认识到，为适应上万核的大规模并行计算，实空间方法比传统方法更具优势。事实上，平面波方法出现不久，早在80年代人们就提出了实空间计算方法。虽然实空间方法的起步并不比平面波方法晚太多，但由于在计算效率和精度上处于劣势，长期以来发展较慢。按采用的基函数划分，实空间方法的主要发展方向有有限差分法、有限元法和小波方法。其中有限差分法起步最早，发展较为成熟，已经形成了如PARSEC等软件包。小波方法也形成独特的发展方向，但遇到的困难更多。在前期973项目支持下，我们对电子结构的有限元方法开展了系统研究，主要考虑到有限元网格的自适应性质，我们认为这是其差别于有限差分法的最主要特点。充分发挥这一特点可以有效减少实空间基函数的个数，以降低计算量。基于后验误差估计的自适应有限元法可以排除经验因素，有利于控制精度。将这类自适应有限元法应用于电子结构计算是我们独创的方法，目前除我们之外未见相关报道。早在1980年代末，就有人提出了基于立方体网格的有限元电子结构计算方法，但长久以来即使与有限差分法相比，有限元法在计算效率方面也不具备优势，这主要是由于缺乏适合有限元方法的特征值问题算法。采用均匀网格的有限差分法在这方面可以借鉴平面波方法，以FFT为预条件因子从而有效的提高计算效率（但这种处理方法也限制了它的大规模并行化），而有限元法受插值格式的限制不能采用这类预条件。所以，除了使用自适应网格之外，寻找高效率的特征值算法，是有限元方法能否立足的关键。在这方面，我们已经取得了某些进展，如对LOBPCG算法的改进、提出了实空间梯度类算法的预条件因子、Newton类方法的理论分析，显示适合自适应有限元的高效率特征值算法是十分有希望的。在本课题中，我们的主要目标就是寻找适合自适应有限元、非线性（电子结构计算）特征值问题的高效算法，开展动力学模拟。其中面临的关键科学问题有：（1） Newton类特征值问题算法传统上，人们采用线性特征值问题的算法加以自洽迭代（SCF）处理电子结构计算中的非线性特征值问题。我们考虑Newton类或CG类特征值算法的出发点就是这类算法可以有效的利用初始值，对非线性问题具有一定优势。但更一般的，我们需要把特征值问题的迭代过程和非线性问题的迭代过程结合起来，达到最优的效率。另一个困难是自适应网格下Newton类和梯度类算法的预条件因子选取问题。（2）特征值问题的多尺度局部化与组合离散我们拟根据物理特性（如周期性、对称性和局部性）与方程的奇异性将问题的复杂度进行分解，着眼于有限元的局部化离散与组合求解算法设计：局部化离散有着天然的并行性与自适应性，并进行多尺度组合离散方法研究：用规模相对小的离散格式去离散特征值问题以抓住问题的低频（通常是在整体粗网格上求解）而（在局部加密网格上）并行解有关的局部边值问题以获得问题的高频。这样可在具有混合架构的并行计算机器上进行分层次并行计算。分子动力学模拟基于牛顿力学的经典近似描述原子的运动规律，是一种原理简单、实现方便的计算模拟手段，同时又能够深刻揭示了原子体系的复杂动力学性质和热力学统计性质，是材料科学不可或缺的计算模拟手段。然而，长久以来微观性质如何决定材料的宏观性质并未得到根本上的理解，人们期望大规模计算模拟可以提供研究这一问题的新的手段。简单的增加模型中的原子数量将使计算量快速上升，根本无法企及宏观尺度。为了解决这一类大尺度宏观体系的问题，人们希望有一种将不同尺度的模型结合在一起的多尺度方法，解决材料科学中的一些根本问题，既包含了从分子动力学模拟能够给出的关键的微观尺度的性质，又能够给出宏观体系的性质。我们拟在前人的和我们自己的工作基础之上，通过改进原子尺度模型和连续介质模型界面耦合方式，建立分子动力学到连续介质的跨尺度关联的新方法和软件，建立统计力学的多尺度耦合模型，并将其应用于材料科学和纳米器件等体系材料强度的研究中。3.3大型特征值问题并行计算及应用科学计算和工程应用领域的许多数学问题，均可归结为大规模代数特征值问题的数值求解，有关代数特征值问题的算法和软件，已经被广泛地应用于计算电磁学、材料电子结构的数值模拟、工程振动分析、振动控制和光纤设计等。对于线性特征值问题，人们已经有了比较深入的理解，也建立了一些颇为有效的算法，并取得了比较完善的收敛与复杂性理论。但是，这些算法和理论，大都只适用于处理中小规模矩阵和计算少量特征对，对于大规模矩阵它们则难以奏效且没有相应的理论支撑。特别地，适合于并行计算环境的算法及其相关理论则更为少见。造成这种局面的主要原因在于：（1）线性特征值问题蕴含有一定程度的非线性性，因此这类问题具有自身固有的特点和难度；（2）特征向量往往具有病态性质，这不仅给其自身的数值计算带来了困难，也严重地影响着特征值计算的可行性和准确性；（3）关于特征值问题的数值算法的核心部分往往是大规模不定线性代数方程组的求解，而关于这类线性方程组的有效数值算法和理论迄今仍然是数值代数领域中的挑战性问题。因此，如何突破已有算法的构造框架，建立能够求解大规模矩阵的多个特征对的稳定，准确且高效的数值算法，特别是具有灵活扩展性的并行计算方法，是一项具有重要理论意义和很高应用价值的研究课题，也是国际数值代数领域的研究热点。我们将从理论分析和实际计算两方面入手，兼顾算法理论体系的创新和应用性能价值的提升，研究大规模特征值问题的数学性质、代数结构、高效算法、以及相关程序的研制和集成。在对于具有不同应用背景的特征值问题的数学性质和代数结构进行深入透彻的剖析和发掘的基础上，充分利用问题的特性和结构，并面向具体的应用要求和目标，设计可行而有效的算法，特别是基于子空间技术的迭代算法和具有并行功能的计算方法。研究新算法的数学理论和数值性质。与此同时，我们也要特别关注和重视对于已被应用领域所广泛使用、并已取得良好应用效果的现有算法的数学理论的建立和完善，以及数值性质的发掘和诠释。在大型特征值问题的并行计算应用方面，我们将研究张量网络态的大规模特征值计算问题。张量网络态是研究二维量子问题的一个好的起点。但是，目前对这种新的波函数的研究大多局限在自旋或者玻色子问题上。对于费米子问题，目前还只是停留在概念研究阶段，没有实质性进展。对费米子问题上，要有一种新的方法的产生，而这种新方法应该是基于张量网络模型。张量网络态的重正化群理论发展是凝聚态以及量子信息理论计算方法的最近有较大进展的一个方向。张量网络态是刻画二维量子态波函数的一种新的表示形式，统计模型也都可写成张量乘积态的形式，这方面的研究对解决强关联理论研究中的一些难题具有重要意义。在前期973项目“高性能科学计算研究”支持下，我们在2008年提出了通过迭代投影的方法求解张量网络态的方法，将可计算的张量的维数提高了一个量级，使得可精确确定的张量元的数量达到或超过了1万的量级。2009年，我们进一步提出了一种对张量乘积态模型的二次重正化群方法，把计算量子统计模型的配分函数或张量乘积态的物理期望值的精度提高了至少五个量级。这些工作为精确研究相互作用量子态奠定了基础。我们将发展一种精确而有效的新的计算方法，尤其针对二维有阻挫或费米子系统，弥补现有数值计算方法的不足，并用这种方法来处理与高温超导现象相关的物理问题。4.气候系统模式的高性能算法与应用复杂流体问题的数值模拟不仅涉及数学、力学、地学或物理学等学科，而且与计算科学密不可分，是千万亿次科学计算的典型应用领域，在现代科学技术的许多应用领域中起着越来越重要的作用。本课题将以前期973项目的研究成果为基础，面向国家重大需求，重点研究气候环境与稀薄大气中复杂流动问题的高性能算法与应用。4.1气候系统模式发展和模拟气候系统模式是理解过去气候与环境演变、研究全球变化成因和机理、预估未来变化趋势的重要工具，是耦合大气、海洋、海冰和陆面等地球系统各圈层、研究它们之间复杂相互作用的大型综合软件。气候数值模拟往往需要利用气候系统模式积分几十年、几百年甚至上千年，计算量巨大。气候系统模式的发展不仅需要设计越来越合理的物理参数化方案，而且要求越来越快的高性能计算机、越来越高效的算法和支撑软件环境。在前期973项目的支持下，IAP/LASG气候系统模式中大气分量模式的动力框架和计算稳定性得到大幅度改善。为了提升我国在全球气候和环境变化研究中的竞争力，还需改进其他主要分量模式，如海冰和海洋模式，以进一步提高气候系统模式的性能。本课题拟以前期973项目为基础，重点针对IAP/LASG气候系统模式中海冰和海洋模式分辨率不断提高带来的计算稳定性、计算效率等问题，开展高性能计算理论与方法的研究。同时，也亟需研究模式的不确定性和可预报性对模拟结果精度与可信度的影响。通过算法创新和不确定性、可预报性研究，发展高性能气候系统模式，并进行20世纪气候变化模拟试验以检验模式性能。采用国际模式比较计划的标准进行年代际和长期数值模拟试验，开展过去与未来气候变化的数值模拟，积极参与国际模式比较计划。我们将以IAP/LASG的气候系统模式为出发点，解决以下关键问题：1）气候系统模式计算不稳定性、计算效率以及重要小尺度过程的模拟等问题随着分辨率的不断提高，IAP/LASG初步建立的海冰模式和现有的海洋模式在极区的计算不稳定性和极点通量交换等问题也越来越突出。本课题将改进海冰和海洋模式在极区的动力框架，采用两极或三极点的推广曲线水平坐标来处理极点的奇异性，即将奇异点转移到陆地上以回避模式的计算不稳定性和极点通量交换难题，从而提高气候（地球）系统模式对极地海冰厚度分布、海洋深层水形成和强度的模拟能力。考虑到拉格朗日坐标下质点流体动力学方法对海冰流变行为的精确模拟，以及欧拉坐标下有限差分法在海冰动力学计算中的效率，本课题将发展混合拉格朗日-欧拉数值方法，即将拉格朗日坐标下的质点流体动力学方法和欧拉坐标下的有限差分方法相结合，提高对海冰运动数值模拟的计算效率和精度。考虑到小尺度冰间水道（leads，宽度为几米到几公里）在极地气候变化中起着越来越重要的作用，本课题将利用高分辨率卫星和冰雷达信息反演冰间水道的统计特征，在此基础上设计冰间水道的随机参数化方案，实现在不同尺度下冰间水道的模拟。2）大气模式的不确定性与可预报性问题气候数值模拟中使用不同的计算机平台、不同的编译器、不同的计算精度会造成模拟结果存在一定的差异，这都是计算误差不确定性的具体体现。模式的计算误差不仅包括算法的截断误差，而且包括浮点舍入误差。舍入误差的积累与浮点计算的次数有关，随着模式分辨率的不断提高，计算次数成倍增加，其在总计算误差中的比例迅速增加，而且总计算误差也呈现增加的趋势，给模拟结果带来了计算不确定性。考虑到截断误差和舍入误差之间的反比增长关系，气候系统模式中可能存在最优的模式分辨率和时间分辨率。本课题将引进分离计算中截断误差和舍入误差的方法，细致地研究两种误差各自随时间和分辨率的变化，估算误差增长公式中的系数，进而得到计算误差的上确界。除了舍入误差和分辨率对模式性能的影响外，由于人类观测手段和对气候系统关键物理过程理解的局限性，气候系统模式的边界强迫和物理过程的参数化方案一直存在较大的不确定性。因此，模式的可预报性研究十分重要，对我们了解模式对关键过程的模拟能力具有指示作用。本课题将利用IAP/LASG大气环流模式以及国际上先进的大气环流模式开展大规模集合模拟数值试验，考察大气模式内部变率（由于初始场误差演变导致的误差），外部变率（强迫场的异常造成的变化），以及模式中参数不确定引起模拟结果的不确定性。以此为基础，深入研究大气模式的可预报性。此外，这些大气模式具有不同的分辨率，集合模拟结果可以让我们进一步分析不同分辨率下模式可预报性的变化，进而找出制约模式可预报性的因素。4.2稀薄气体的大规模数值模拟随着科技水平的发展，计算流体力学的应用领域不断扩大，对计算方法不断提出新的挑战。一方面，跨大气层飞行器的研制是航天技术领域的一个重要发展方向，它对大气层表面附近流场的物理建模和数值模拟提出了迫切需求。另一方面，生物学和材料科学的技术进步和应用发展，要求我们研究微米和纳米尺度的流体。无论是高空的流体还是细小的管道中的微纳米尺度下流体，都呈现一种极为稀薄的状态。传统的宏观流体力学模型不再适用于稀薄流体，需要用Boltzmann方程来描述。该方程直接引进粒子在空间各处的速度分布函数，具有时空维数高（七维）、含多重积分的碰撞项、计算区域无界等特点，计算量巨大，数值求解极其困难。发展Boltzmann方程的高效计算方法，实现稀薄气体千万亿次全场模拟，对航天和微纳流研究领域具有重要意义。近百年来，人们对Boltzmann方程的模型简化在这方面的努力历久不衰，其中两个十分重要的方法是S.Chapman和D.Enskog在1910至1920年代提出的Chapman-Enskog展开方法和H.Grad在1949年提出的矩方法，而这两种方法简化得到的结果都是一系列针对宏观物理量（如密度、温度等）的方程组。这样一来，自变量所在的空间维数大大下降，使得大规模的数值模拟成为了可能。然而这两种方法都存在着根本性的问题。由Chapman-Enskog展开得到的二阶Burnett方程组和三阶Super-Burnett方程组都是不稳定的，而Grad矩方法得到的三阶13阶矩方程组和四阶26阶矩方程组虽能保持稳定，但求解激波结构时，解中却出现了不物理的间断。这些问题严重地限制了这些高阶方法的应用，近些年来，这方面的工作有了较大的进展，这些进展大多是通过修正以上两个模型得到的。对Burnett方程组的修正包括X.Zhong等人给出的AugmentedBurnett方程组，S.Jin等人给出的RegularizedBurnett方程组，以及A.Bobylev给出的双曲型Burnett方程组等。而对Grad提出的13-moment方程组的修正则包括Mueller等人提出的COET方法，H.Struchtrup等人提出的R13方程组等。这些修正或者使Burnett方程组获得了稳定性，或者使Grad矩方法更接近物理实际，无论从理论上还是数值上都获得了一些突破。这些方法的涌现使得对稀薄气体或微流的数值模拟在保持和直接数值求解Boltzmann方程所得到的精度的同时，大大减小了计算量。但这些方法共同的特点是推导过程极其繁琐，得到的系统庞大且难以寻找规律，这就使得这些修正操作在往更高阶的方程组上推广时有很大的困难。数值实验表明，在流体稀薄效应强烈时，随着流体方程阶数的增加，解的收敛速度是很慢的。例如当激波马赫数达到3.0时，上面几乎所有的模型都无法正确地给出激波结构。因此为了更精确地描述物理，高阶方程组的必要性毋庸置疑。M.Torrilhon给出了构造任意高阶Grad矩方程组的方法，但其修正方案目前仍无任何结果。从各种修正模型的推导方式来看，R13方程组的推广也是最可行的。如果推广能够成功，对稀薄气体和微流的数值模拟将很可能开创一个全新的局面，对真实物理的逼近程度也将大幅度提高。针对当前国内外对稀薄流体动力学(RarefiedGasDynamics)和微流数值模拟的研究现状，针对稀薄气体高效全场模拟，在前一期973项目“高性能科学计算研究”在自适应方法和流体计算的基础上，我们将集中下面三个方向的研究：1)数值正则化高阶矩方法(NRxx)R13方程组是目前对高阶方程组的修正中较为成功的一个，其基本思路是在高阶Grad展开的附近做一阶Chapman-Enskog展开，巧妙地结合了上述两种构造宏观方程组的方案。这个方法由H.Grad本人在1958年提出，但并未受到重视，直至2003年H.Struchtrup和M.Torrilhon将其重新提出。这种方法可以毫无困难地平推到高阶情形，只是得到的体系将十分复杂。当前国际上对这一领域的研究局限于一种固定的思维模式，即首先得到修正矩方程组的解析形式，再考虑其数值求解方法。NRxx方法是我们在研究过程中发现的打破这一常规框架的新思路。NRxx方法的总体思路是跳过得到解析形式这一步骤，直接通过数值方式去实现，构造矩方程组和正则化这两个操作，可以说在使用的手段上有巨大的创新。换言之，我们直接求解的是Grad矩方程组和R13方程组的基础Boltzmann方程，但由于原来所使用的解析手段被融合到了数值技术中，所获得的数值结果事实上是正则化矩方组的数值解。在技术上，NRxx方法的最大突破之处在于构造了一种快速的变换方式，使得两个在不同空间中展开的分布函数之间可以方便地做运算，这不但使得越过构造方程组的步骤成为可能，更使得数值求解的效率得到了提高。而当前NRxx方法中仍需解决的问题包括边界条件的处理、碰撞算子的离散、稳态问题的求解等。2)网格和模型自适应自适应方法在提高问题求解效率和改善数值解精度方面有着出人意料的良好效果。对于空间的自适应，我们有着丰富的经验和良好的软件支持。空间自适应方法的主要思想是通过某种方案让计算机自行分析数值解的特性，进而自行调整网格结构，在解结构复杂的地方使用密网格，结构较简单的地方使用粗网格。这种方法在流体力学计算中已经被广泛应用。对方程做自适应则是一个全新的思路。基于NRxx方法，我们很可能将这种自适应推广到任意多种模型的情形，这将是一个前所未有的突破。如果这一想法得以实现，计算效率将进一步大大提高。假设我们的计算区域中仅10%是结构复杂的区域，为描述稀薄效应最强烈、结构最为复杂的流体结构，需要使用带有364个变量的矩方程组来计算，而在结构简单的区域一般使用10个变量即可。这样，不使用自适应和使用自适应的计算量之比至少为364:（10x90%+364x10%）牝8:1。对于并行化后的程序来说，这意味着我们所使用的并行机规模可减小为原来的1/8,这对于减小计算规模、提高运行效率来说将成为一项十分有意义的新技术。3）算法并行化基于NRxx的算法框架，并行化操作不仅切实可行，而且可期望达到接近线性加速的高加速比。依照我们当前的研究成果，NRxx算法将使用一种加强稳定性之后的显式Runge-Kutta迭代结合有限体积格式来求解方程组。这一对组合使得单元与单元之间的耦合关系只局限在局部，因此十分适合构建并行化算法。并行化中困难的部分在于并行化与自适应方法的结合。为了保证完成二者的结合，我们需要在自适应的过程中保证不同的网格节点上的网格相互匹配，还需要做一定量的负载平衡操作，以充分利用并行资源。这些要求使我们必须面对一系列复杂的网格操作，是算法实现中的一个技术难点。5.支持多物理耦合的粒子输运算法与软件粒子输运问题是能源（反应堆设计、石油勘探等）、医学（放射治疗、医学成像等）等科学技术、国民经济和国防领域研究的重要理论课题，其研究内容涵盖了单纯的粒子输运问题以及与其它多物理过程（例如流体力学）耦合的粒子输运问题两个方面。数值模拟是粒子输运问题研究最重要的手段之一。蒙特卡罗（MC）和离散纵标（S）方法是随着武器物理研究产生并发展起来的，是粒子输运模拟中应用最为广泛的两

人人文库> 全部分类> 行业资料 > 管理策划

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

适应于千万亿次科学计算的新型计算模式

文档简介

温馨提示

最新文档

评论

适应于千万亿次科学计算的新型计算模式

文档简介

温馨提示

最新文档

评论

相关文档