![高性能并行计算平台及并行计算环境概述_第1页](http://file2.renrendoc.com/fileroot_temp3/2021-6/27/8c4416ee-2cdf-492d-b336-5ed5dab4b130/8c4416ee-2cdf-492d-b336-5ed5dab4b1301.gif)
![高性能并行计算平台及并行计算环境概述_第2页](http://file2.renrendoc.com/fileroot_temp3/2021-6/27/8c4416ee-2cdf-492d-b336-5ed5dab4b130/8c4416ee-2cdf-492d-b336-5ed5dab4b1302.gif)
![高性能并行计算平台及并行计算环境概述_第3页](http://file2.renrendoc.com/fileroot_temp3/2021-6/27/8c4416ee-2cdf-492d-b336-5ed5dab4b130/8c4416ee-2cdf-492d-b336-5ed5dab4b1303.gif)
![高性能并行计算平台及并行计算环境概述_第4页](http://file2.renrendoc.com/fileroot_temp3/2021-6/27/8c4416ee-2cdf-492d-b336-5ed5dab4b130/8c4416ee-2cdf-492d-b336-5ed5dab4b1304.gif)
![高性能并行计算平台及并行计算环境概述_第5页](http://file2.renrendoc.com/fileroot_temp3/2021-6/27/8c4416ee-2cdf-492d-b336-5ed5dab4b130/8c4416ee-2cdf-492d-b336-5ed5dab4b1305.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、高性能并行计算平台及并行高性能并行计算平台及并行 计算环境概述计算环境概述 中国水利水电科学研究院 信息网络中心 2005年8月11日 内 容 提 要 1、前言 2、高性能并行计算平台建设 3、水利水电高性能计算实践 4、结语 1、前言 什么是高性能并行计算? 科学家和工程师可以用它来解决一些程序 规模庞大、运算时间长以及数据量大的科 研课题。 并行计算是提高服务器计算速度和处理能 力的一种有效手段。 计算机按照编好的程序对计算问题进行分 解,并把分解的任务块通过一定的方式交 给不同的处理器去求解。 国际发展动态 2005年6月22日公布的全球高性能计算机 top500,第一名是IBM的Blu
2、e Gene/L, Linpack测试值为每秒136.8万亿次,第二名 是IBM的Blue Gene/W,Linpack测试值为 每秒91万亿次。 日本第一的高性能计算机,Earth Simulator (地球模拟器),Linpack测试值为35.6万 亿次。 国内发展动态 中国的第一名,中国气象局的高性能计算机, Linpack值为每秒10.3万亿次。 曙光系列、神威系列、银河系列、深腾系列 中科院计算所、曙光公司和上海超级计算中心三 方共同研制的曙光4000A,Linpack测试值为每秒 8.061万亿次。 联想公司为中科院网络信息中心生产的深腾6800, 共有1060颗1.3Ghz的安腾
3、2处理器,Linpack测试 值为每秒4.183万亿次。 院内需求分析 随着工程规模的逐渐扩大、复杂问题求 解分析的日益深入,其科学计算的“瓶颈” 日趋严重,即使对模型和算法进行简化, 一次计算仍需要几个小时、几天甚至数十 天的时间,这一现状严重制约了我院水利 水电学科的发展,许多工程师、教授提出 的理论和设想都因为计算能力受到限制而 无法实施。 课题1:小湾坝踵应力诱导缝研究 小湾拱坝坝底缝计算采用网格有20万个单 元,总共24万多个节点。 单机上运行模拟计算程序时,一个计算步 需要将近45个小时,一个工况一般有 3040个计算步,总共有几十种工况。 课题2:混凝土三维细观力学模型的研究 模
4、型1:湿筛试件静动态弯拉强度细观力学分析 研究中对试件进行划分,用4面体单元将细网格6面体 单元过渡到两边粗网格6面体单元,共有24257节点, 29952个单元,其中骨料2160个单元,固化水泥砂浆 体3805单元,粘结界面14515单元以及宏观均匀混凝 土9472个单元。 以上三维计算是在内存1G,CPU为2.8G的PC机上进 行的。静力计算耗时163小时39分,约7天时间;动力 计算耗时196小时25分钟,约8天时间。 模型2:全级配试件静动态弯拉强度三维细观力学分析 剖分后的单元有骨料单元、融入小骨料后的固化水泥砂浆单 元和两者之间的界面单元,共有24257个节点,113920个单 元
5、。 计算时间:在以上配置相同的PC机上,三维静力计算耗时 209小时50分钟,约9天时间;动力计算耗时291小时57分钟, 约12天时间。 问 题 要实现三维细观力学数值计算,计算速度 这一难题必须克服,通常,针对一个模型 研究人员需要反复调整参数进行数值计算, 一个算例耗时数天甚至数周简直无法忍受。 上述种种计算和数据的处理对计算环境提 出了新的要求,如果以传统的个人PC机作 为计算平台,计算的时间和效率远远满足 不了科研的需求,甚至会由于内存、CPU 等硬件的限制而无法进行计算。因此我院 急需建设一个高性能并行计算平台,更好 的为科研项目服务。 二、高性能并行计算平台建设 硬件平台建设 初
6、步构想初步构想 采用Sun公司提供的Sun Fire Supercluster解决 方案。 24台高性能的Sun Fire 6800服务器作为集群 节点。 每台服务器达到满配置,即24个1.2Ghz UltraSPARCIII CPU,192GB内存。 节点之间采用Sun Fire Link Interconnect 技术 通过光纤互联。 IWHR 高性能并行计算平台硬件体系结构高性能并行计算平台硬件体系结构 Sun Fire 6800 技术指标 硬件完全冗余,可以从任何硬件故障中恢 复。 最多24个CPU,最大192GB内存,32PCI 或者16cPCI插槽。 每台Sun Fire 6800
7、机器最多分为4个域,每 个域相当于一台独立的服务器。 具有很好的线性扩充能力,24个CPU运行 时的Linpack值是1个CPU运行时的23.3倍。 Sun Fire Link Interconnect Sun Fire Link 为一套高带宽、低延迟的互 联系统,可以扩展Sun Fire6800 系统的可 用性。 一个Sun Fire Link系统最多可以由8个Sun Fire 6800服务器节点组成,每个节点由 Sun Fire Link光纤网络连接在一起, 一整套软件支持。Sun Management Center可以为Sun Fire Link 网络资源的配 置、监视与管理提供最佳可用
8、性。 我院Sun Fire 6800现有配置 CPU 数量 4 * 1200Mhz 内存容量 8 GB (16 X 512MB DIMMs) I/O板 4个,PCI扩展槽共32个 Sun Storage 3510 SCSI 磁盘阵列 可提供539GB 的存储空间 目前,本院的高性能并行计算平台建设 处于初步试验阶段,待并行计算技术在我 院应用成熟以后,可以很方便的对该平台 进行硬件升级,以获得更高的性能和计算 能力。 现 状 软件平台建设 操作系统 开发环境 编译器 数学函数库 高性能并行计算软件 作业管理接口 并行程序运行环境 并行数学函数库 并行程序调试分析工具 资源管理系统 IWHR 高
9、性能并行计算平台软件体系结构高性能并行计算平台软件体系结构 操作系统:Solaris 9 64位的Unix操作系统 具有杰出的稳定性和可维护性 单一服务器上最多可支持106个CPU 支持多线程,最多100万个进程。 支持多种应用软件,如 Sun Cluster软件、 Sun 管理中心软件、Sun Studio 编译环境 Sun Grid Engine等等。 开发环境:Sun Studio 9 主要组件包含如下: Sun Performance Library Distributed make utility, dmake dbx Command-Line Debugger Performanc
10、e Analysis Tools Integrated Development Environment (IDE) 编译器 对于科研课题的计算程序而言,编译器 的优劣对生成的程序的执行效率有着非常 明显的影响,现在在Unix下的免费编译器 软件主要是GNU计划提供的GCC,该编译 器可以编译C、C+、F77 等语言编写的程 序。Sun Fire 6800 服务器配套的编译器是 Sun 公司开发的商业编译软件-Sun Studio 9,该编译器在Solaris上编译运行的效率比 GNU的免费软件要高30%40%。 数学函数库:Sun Performance Library 它是Sun公司基于以下
11、标准的线性代数库而 生成的,具有相同的函数名和接口,但是 在Sun的服务器上运行得更快更精确。 LAPACK :用来解决线性代数问题 BLAS1:用来解决向量-向量运算问题 BLAS2:用来解决矩阵-向量运算问题 BLAS3:用来解决矩阵-矩阵运算问题 FFTPACK和VFFTPACK:快速傅立叶转换 高性能并行计算软件 作业管理接口 Sun ClusterTools Runtime Environment(CRE) 并行计算运行环境 Sun MPI and MPI I/O 并行数学函数库 Sun S3L( Scalable Scientific Subroutine Library) 并行程
12、序调试分析工具 Sun Prism Sun MPProf 作业管理接口:Sun CRE 执行程序(mprun) 杀死程序(mpkill) 显示作业信息 显示节点信息 并行计算运行环境 Sun MPI and MPI I/O Sun MPI 是一个高度优化的MPI版本。它 支持MPI1.2 标准和 MPI2.0 标准。 支持多线程编程。 与Sun CRE 集成。 完全支持Fortran77、C和C+ ,支持一些 基本的Fortran90 语法。 通过共享内存通信会获得更好的性能。 并行数学函数库:Sun S3L 它是建立在Sun MPI之上的,给用户提供了 一系列广泛应用的并行函数库。如LU分解
13、、 最小二乘法运算、矩阵转置等等。 支持Fortran77、Fortran90、C和C+ Sun S3L 子程序调用Sun Performance Library 来在节点上进行运算。 并行程序调试分析工具 Prism和MPProf Prism是一个图形编程环境,使用户能够对 并行程序进行调试和性能监控。 MPProf是一个用来查看Sun MPI程序的分 析工具。运行它可以获得程序的一些时间 信息: 在所有进程里MPI函数库调用所花费的时间占 程序运行时间的百分比; 每个进程在MPI函数库调用上花费的时间百分 比; MPI 函数库调用的次数、程序花费的时间; 资源管理系统(Resource M
14、anagement) Sun HPC ClusterTools 5 software可以和下 面三种分布式资源管理系统集成,用来管 理资源的分配、并行作业的控制和监视, 以及作业信息的统计。 Sun Grid Engine:Codine 5.2 Load Sharing Facility: LSF 4.x Portable Batch System: PBS 2.3.15 and PBS Pro 5.0 集成方法 IWHR 高性能并行计算平台软件体系结构高性能并行计算平台软件体系结构 三、高性能并行计算实践 课题一 在结构材料所使用服务器计算的工程 项目“小湾坝踵应力诱导峰分析”中,服 务器发挥了内存、硬盘空间大,计算稳定 的特点,为该工程项目的计算提供了有力 的支持。 课题二 在抗震中心的有关“混凝土三维细观力 学模型的研究”中,信息网络中心联系太 极公
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 用维修基金维修电梯主机轴承合同
- 路面砖产品质量监督抽查实施细则
- 湘教版数学八年级上册1.1《分式的基本性质》听评课记录1
- 五年级小数乘法口算练习题
- 七年级(人教版)集体备课听评课记录:2.2《整式的加减(3)》
- 五年级数学下册听评课记录《2因数与倍数2-2、5、3的倍数的特征》(人教版2)
- 二零二五年度风机采购合同合同履行监督与审计
- 2025年度荒山承包经营权租赁与生态修复合同
- 二零二五年度金融咨询服务副总经理聘用协议
- 沙子供货合同范本
- 天津在津居住情况承诺书
- PHOTOSHOP教案 学习资料
- 初中数学教学“教-学-评”一体化研究
- 2012年安徽高考理综试卷及答案-文档
- 《游戏界面设计专题实践》课件-知识点5:图标绘制准备与绘制步骤
- 自动扶梯安装过程记录
- MOOC 材料科学基础-西安交通大学 中国大学慕课答案
- 智慧供热管理系统方案可行性研究报告
- 帕金森病的言语康复治疗
- 中国城市居民的健康意识和生活方式调研分析报告
- 上海星巴克员工手册
评论
0/150
提交评论