版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1
并行计算机性能针对一个并行系统,需讨论计算和开销特征一、计算特征下表给出了3种商品化并行计算机系列的性能参数的历史值23存储器层次结构:存储器容量存储器时延存储器带宽1996年前后计算机中这3个参数的典型值45二、并行性和通信开销
并行程序中的开销可分为3类负载不平衡开销;并行性开销;通信开销(包括同步、通信和聚集)。
T=Tcomp+Tpar+Tinteract6说明:有3种类型的并行性操作。它们是并行性开销的来源:进程管理;分组操作进程查询操作7通信开销的来源有3种类型的操作同步聚集通信8巨大开销:注意有关并行性和通信开销的两个要点:通常比基本计算时间要大得多,在不同系统上变化很大。91011三、开销定量化1.问题的提出应对计算的并行性和通信开销进行量化。122.开销测量条件进行测量实验的确切条件必须清楚地加以说明。以下是部分列表:所使用的数据结构。所使用的编程语言、库以及编译器选择。一般地,开销测量应以批处理方式进行,都会被执行。13所使用的通信硬件和协议。因为在这种方式下大多数生成路径(productionrun)测量挂钟时间或是CPU时间。一般来讲,挂钟时间更有用。143.开销测量方法虽然测量开销粗看起来非常简单,但要获得精确测量结果却是很具挑战性的任务主要的原因有3种15乒乓方案:是测量点对点通信常用的方法:结点0执行一个发送操作向结点1发送一个m字节的消息,后者执行一个接收操作收到此消息结点1立即发送相同消息给结点016例题:测量时延的乒乓方案:
for(i=0;i<Runs;i++)
if(my_node_id==0){/*发送方*/
Tmp=Second();
start_time=Second();向结点1发送一个m字节消息;从结点1接收一个m字节消息;
end_time=Second();17timer_overhead=start_time-tmp;total_time=end_time-start_time-timer_overhead;communication_time[i]=total_time/2;}elseif(my_node_id==1){/*接收方*/从结点0接收一个m字节消息;向结点0发送一个m字节消息;}}18热土豆(hot_potato)方法(也称为救火队方法)。该方法面向n个结点;方法是个循环的发送接收。
19集合通信条件:设分布式存储器多计算机中n个结点中的每一个均执行以下的SPMD程序。使用路障来同步测量进程中的异步操作。20for(i=0;i<Runs;i++){
Barriersynchronization;Tmp=Second();start_time=Second();for(j=0;j<Iterations;j++)The_collective_routine_being_measured;End_time=Second();21Timer_overhead=start_time-tmp;Total_time=end_time-start_time–timer_overhead;Local_time=total_time/Iterations;Communication_time[i]=maximumOfallnlocaltimevalues;}22改用集合操作的通用化乒乓方法:for(i=0;i<Runs;i++){if(my_node_id==0){tmp=Second();start_time=Second();结点0向所有n个结点广播一个空消息;For(j=0;i<Iterations;j++)23thecollective_routine_being_measured;所有结点向结点0完成一个空归约;
if(my_node_id=0){end_time=Second();timer_overhead=start_time-tmp;Communication_time[i]=end_time-start_time-
timer_overhead}244.开销表达式经测量获得开销数据,有3种表示方法:用表格来表示数据。例如,下表给出了在SP2上运行专有MPL通信库所测得的点对点通信的定时结果。2526以曲线来表示数据如下图所示。其优点是曲线可示出通信开销增长趋向。
2728表达式表示例如,将所测得的定时数据用最小二乘法适当地加以拟合。就可将SP2上的点对点通信开销表示成消息长度的线性函数:t=46+0.035mμs如果加以拟合,它与曲线之间的误差是很小的,如上图所表明的那样。295.点对点通信表达式Hockney提出操作通信时间(以μs表示)特征的1个模型,其中的通信开销t(m)是消息长度m(以字节表示)的线性函数:
t(m)=t0+m/r∞式中t0是以μs表示的启动时间,而r∞是渐近带宽,单位MB/s。30Hockney还引入了两个附加的参数。半峰值长度记为m1/2字节,是达到半渐近带宽所需的消息长度。特殊性能,记为
0MB/s,用来表明短消息带宽。314个参数t0、r∞
、
m1/2、
0MB中的两个是独立的。另两个可用以下关系推得:t0=m1/2
/r∞=1/
0其中m1/2是表示系统支持短消息通信好坏程序的参数。
32例如:SP2的t(m)=46+0.035m。启动开销为t0=46μs;渐近带宽为:r∞=1/0.035=28.57MB/s,以及半峰值消息长度为:m1/2
=t0×r∞=1314字节。336.集合通信
将式Hockney表达式扩展成如下:通信开销T(m,n)现改为是m和n两者的函数。但启动时延仍只依赖于n。渐近带宽变为r∞(n)。
T(m,n)=t0(n)+m/r∞(n)34在将测得的定时数据与不同的t0(n)和r∞(n)形式拟合可推得如表中所示的4个集合操作的公式35367.集合计算测量了3种代表性的集合计算操作:路障、归约和扫描。它们拟合曲线开销表达式如下表所示。注意当处理器数超过256时,路障开销为762μs,相当于执行762x266=202,692flop所需的时间。现在可以回答这样问题,是否应使用同步算法?3738短
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 语言引导目标检测算法研究
- 二零二五年度建筑防水系统设计施工合同2篇
- 现代农业产业园风险评估与应对措施
- 冶金行业业务员工作总结
- 应急响应机制的建立
- 餐饮服务行业员工激励策略
- 二零二五年度个人房地产居间佣金分配合同范本4篇
- 二零二五年度电子商务平台商铺入驻合作协议2篇
- 二零二五年度个人股份质押合同样本:有限责任公司股权融资专用2篇
- 部编版一年级语文下册第18课《棉花姑娘》精美课件
- 英汉互译单词练习打印纸
- 2023湖北武汉华中科技大学招聘实验技术人员24人笔试参考题库(共500题)答案详解版
- 一氯二氟甲烷安全技术说明书MSDS
- 母婴护理员题库
- 老年人预防及控制养老机构院内感染院内感染基本知识
- SWITCH暗黑破坏神3超级金手指修改 版本号:2.7.6.90885
- 2023高考语文全国甲卷诗歌阅读题晁补之《临江仙 身外闲愁空满眼》讲评课件
- 物流签收回执单
- 钢结构厂房造价指标
- 安徽涵丰科技有限公司年产6000吨磷酸酯阻燃剂DOPO、4800吨磷酸酯阻燃剂DOPO衍生品、12000吨副产品盐酸、38000吨聚合氯化铝、20000吨固化剂项目环境影响报告书
- 宁骚公共政策学完整版笔记
评论
0/150
提交评论