




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第1章并行计算体系结构1.1并行计算机系统结构模型1.2访存模型1.3并行计算机系统互连1.1.1并行向量处理机(PVP)属于MIMD(Multiple-InstructionMultiple-Data)、UMA(UniformMemoryAccess)型的细粒度并行计算机少量的高性能向量处理器,处理能力≧1Gflops专用高宽带交叉开关实现存储器之间的互联大量的共享存储器模块(SM)大量向量寄存器和指令缓冲器,不使用高速缓存。机型CrayC-90/T-9,NECSX-4,Gralaxy-1,Cray-11.1.1并行向量处理机(PVP)典型结构VPVPVP交叉开关SMSMSM…………1.1.1并行向量处理机(PVP)实例Cray-1,组成如下:中央处理器,含运算控制部件,指令缓冲器,指令控制部件和寄存的功能部件。存储器(内存)交互通道,连接诊断维护控制机,磁盘存储器(SM)前端机(用户机)向量流水部件,含8*64个向量寄存器,但V0-V7配向量加和浮点加部件,标量寄存器组S0-S71.1.1并行向量处理机(PVP)4种向量运算指令源向量取自两个向量寄存器组
VjopVk源操作数之一取自标量寄存器组VjopS主存储与向量寄存器之间数据传送MemopVjVjopmem1.1.1并行向量处理机(PVP)并行要求无向量冲突V4→V1+V2V1发生源向量冲突V5→V1*V3无功能部件冲突V4→V1*V3发生乘部件冲突V5→V2*V61.1.2对称多机系统(SMP)属于MIMD,UMA,中粒度,高级别并行多机系统具有可插拔的Cache芯片的商用多机系统集中式共享存储器对称性:每个处理机关于I/O操作,OS服务和SM的权限是等同的可扩展行受到SM和总线的限制机型:SGI工作站,DEC服务器8400,Dawning-1等1.1.2对称多机系统(SMP)典型结构:SMp/cp/cSMp/c主机cacheSM总线和交叉开关…………
5种商用机型1.1.3大规模并行处理机(MPP)属于MIMD,NUMA中/大粒度多处理机采用专用的高宽带低延时的通信网络物理上分布的存储器进程间采用阻塞报文交互操作(同步)
处理机级、任务级(异步)机型:IntelParagon,IBMSPQ,Dawning10001.1.3大规模并行处理机(MPP)典型结构:P/CLMNICP/CLMNICCustom-DesignedNetwork…1.1.4分布式共享存储器多机系统(DSM)属于MIMD,NUMA,NORMA,大粒度多机系统(No-RemoteMemoryAccess)对用户来讲,是一个物理上分布的,逻辑上是共享的一个由硬件支持的单一的存储器地址空间。采用基于DIR(Cache目录)的Cache一致性机制采用专用通信网络可使用共享存储器编程模式1.1.4分布式共享存储器多机系统(DSM)机型StanfordDASH,GrayT30典型结构:P/CLMD/RNICMBP/CLMD/RNICMB……专用网络1.1.5工作站机群(COW)属于MIMDNUMA粗粒度多机系统分布式存储器每个节点是一套完整的计算机系统(SMP或PC)采用低成本的商品网络互连结构每个节点拥有本地磁盘和完整的OS(MPP只有内核)机型:BerkeleyNoW,AlphaFarm,FXCOW等1.1.5工作站机群(COW)典型结构:NICP/CMBridgeMBNICP/CMBridgeMB……商用网络LDLD10M10M5种典型系统结构特征1.1.6小结AttributePVPSMPDSMMPPCOWExampleSystemsCrayC-90CrayT-90CrayCS6400DEC8000DASHCrayT3DIntelparagonIBMSP2BerkeleyNOW,AlphafarmProcessorTypeCustomvectorprocessorCommoditymicro-processorCommoditymicro-processorCommoditymicro-processorCommoditymicro-processorMemoryModelCentralizedsharedCentralizedsharedDistributedsharedDistributedunsharedDistributedunsharedAddressSpaceSingleSingleSingleMultipleMultipleAccessModelUMAUMANUMANORMAorNUMAInter-connectCustomCrossbarBusorCrossbarCustomNetworkCustomNetworkCommodityNetwork1.1.6小结系统比较SystemCharacteristicsDECAlphaserver84005/440HP9000/T600IBMRS6000/R40SunUltraEnterprise6000SGIPowerChallengeXLNcessors121283036Processortype437MHzAlpha21164180MHzPA8000112MHzPowerPC604167MHzUltraSPARCI195MHzMIPSR10000Off-chipcacheperprocessor4MB8MB1MB512KB4MBMaxmemory28GB16GB2GB30GB16GBInterconnectBandwidthBus2.1GB/sBus960MB/sBus+Xbar1.8GB/sBus+Xbar2.6GB/sBus1.2GB/sInternaldisk192GB168GB38GB63GB114GBI/Ochannels12PCIbuses,each133MB/sN/A2MCA,each160MB/s30Sbus,each200MB/s6PowerChannel-2HIO,each320MB/sI/Oslots144PCIslots112HP-PBslots15MCA45Sbusslots12HIOSlotsI/Obandwidth1.2GB/s1GB/s320MB/s2.6GM/s320MBperHIOslot并行计算体系结构1.1并行计算机系统结构模型1.2访存模型1.3并行计算机系统互连1.2.1均匀访存模型(UMA)物理存储器被所有处理机均匀共享所有处理机访存时间相同适于通用的或分时的应用程序类型模型:1.2.1均匀访存模型(UMA)P1P2PnSysteminterconnect(bus,crossbar,multistage,network)SMmSM1I/O1.2.2非均匀访存模型(NUMA)是所有处理机的本地存储器的集合访问本地LM的访存时间较短访问远程LM的访存时间较长模型:1.2.2非均匀访存模型(NUMA)LM1LM2LMnP1P2PnInter-connectionNetwork……1.2.3Cache一致性非均匀访存模型(CC-NUMA)DSM结构模型:NIC,DIR,RCP/CMEMI/OP/C总线和交叉开关Node1NIC,DIR,RCP/CMEMI/OP/C总线和交叉开关Noden…SystemInterconnectNetwork1.2.4全局Cache访存模型(COMA)是NUMA的一种特例,是采用各处理机的Cache组成的全局地址空间远程Cache的访问是由Cache目录支持的模型:1.2.4全Cache访存模型(COMA)InterconnectionNetworkDCPDCPDCP1.2.5非远程访存模型(NORMA)在分布式存储器多机系统中,如果所有存储器都是专用的,而且只能被本地存储机访问,则这种访问模型称为NORAM绝大多数的NUMA支持NORAM在DSM中,NORAM的特性被隐匿的模型:1.2.5非远程访存模型(NORMA)1.2.6小结并行计算体系结构1.1并行计算机系统结构模型1.2访存模型1.3并行计算机系统互连1.3.1系统互连横向:网距渐增总线或交叉开
SANs
LANs
MANs
WANs纵向:网速渐增10M100M1000M10G100GNetworkBandwidth10Mb/s100Mb/s1Gb/s10Gb/s100Gb/sMINorDrossbarSwitchesLocelBosesSCIHippIMyrinetGigabitEthernetFibercChannelFDDII/OBusesFastEthernet:100BaseTATMIsoEnetEthernet:10BaseTWANsMANsLANsSANsBusesorSwitches网络环境总线SANLANMANWAN总线处理机总线存储器总线I/O总线构建在母板或背板上,网距在2m之内
注意,这里连接的实际口是多机系统的各个部件,而不是多计算机系统。SANSystemAreaNetwork把不同的节点连成一个单一的多计算机系统网距在3-25m。
注意,这是一个紧密耦合的多处理机或多计算机系统。LANLocalAreaNetwork在一个建筑物或一个校园或一个企业内部形成的多计算机系统网距25-500m。MANMetropolitanAreaNetwork覆盖整个城市的计算机网络网距<=25km。WANWorldAreaNetwork覆盖全球的计算机网络,将大量的IntraNet构建形成大的全球范围的Internet,可实现meta(i)计算1.3.2静态互连网络定义静态互连网络:处理单元之间有固定的连接,在程序执行期间,这种点到点的链接保持不变。节点度:射入或者射出一个节点的边数称为节点度(NodeDegree)网络直径:两个节点之间的最大距离,即最大径数称为~(NetworkDiametre)1.3.2静态互连网络对剖宽度:对分网络各半所必须移去的最小边数称为对剖宽度(BisectionWidth)对称网络:如果从任意节点上观看网络都是一样的,则称为对称网络(Symmetry
Network)1.3.2静态互连网络拓扑结构1(一维线性阵列)只与左右近邻节点相连N个节点用N-1条边节点度为2网络直径为N-1对剖度为1首尾连接时构成环(单向或双向)1.3.2静态互连网络拓扑结构2(四近邻连接)1.3.2静态互连网络拓扑结构3(树形连接)1.3.2静态互连网络实例
64个处理单元的IlliacIU型处理器PU0PU7PU1PU8PI15PU9PU56PU63PU57PU8PU16PU0PU56PU57PU63PU63PU7PU55PU0PU1PU7…………………………1.3.2静态互连网络
1.3.2静态互连网络PU9->PU45:PU9->PU1->PU57->PU56->PU48->PU47->PU46->PU45
或:PU9->PU1->PU57->PU49->
PU48->PU47->PU46->PU45对剖宽度2根下N=16(横向连接8根,蛇形连接8根)1.3.2静态互连网络拓扑结构4(超立方连接)1.3.2静态互连网络特性对照表1.3.3动态互连网络什么是动态互连网络?动态互联网络:用开关单元构成的,可按应用程序要求动态地改变连接组态的网络(总线交叉开关多级互连)总线:连接处理器存储模块I/O设备的一组导线和插座本地总线,CPU板级上的总线存储总线,存储器板级的总线数据总线,I/O板级和通信板级的总线系统总线,底板上的所有插入板间通信提供的通路1.3.3动态互连网络总线之间的关系:1.3.3动态互连网络交叉开关:1.3.3动态互连网络交叉开关特点交叉开关是一种单级交互网络当端口数为n时,其开关量(复杂度)为n2可在源目对之间提供动态链接,每个开关上的状态可由程序动态的控制使用交叉开关的两个途径:交互处理机通信(COW)、交互处理机-存储器访问(SMP)4*4交叉开关1.3.3动态互连网络多级互连网络单级交叉开关级联输入输出之间可动态切换级数logn开关单元n*logn1.3.3动态互连网络多级互联网络结构:1.3.3动态互连网络实例Ω网络1.3.3动态互连网络动态网络互连特性1.3.3宽带互连网络协议标准光纤分布数据接口(FDDI)快速以太网MyrinetSAN和LAN高性能并行接口(HiPPI)异步传输机制(ATM)可扩充一致接口(SCI)FDDI反向双向环利用冗余通路实现可靠性100~200Mbps的传输速率网距:100m(使用铜线)2km(使用多模光纤)60km(使用单模光纤)缺陷
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- DB32-T 5090.1-2025 医院医患沟通规范 第1部分:住院
- 如何利用Access进行数据挖掘试题及答案
- 探索C语言编程方法试题及答案
- 计算机二级ACCESS关键知识点试题及答案
- 2025年计算机二级ACCESS考试高频试题及答案
- 计算机二级C语言知识点全面复习试题及答案
- 门窗合同协议书定制怎么写
- 油工承包合同协议书
- C语言函数的应用试题及答案
- 购买协议书合同模板图片
- 【MOOC答案】《中国文化传承与科技创新》(北京邮电大学)中国慕课章节作业网课答案
- 员工团队合作
- 压缩空气管道管理规定模版(3篇)
- 三大音乐教学法在课堂中的应用研究-讲座课件
- 防汛抢险人员安全培训
- 一例支气管肺炎合并右肺实变患儿的护理查房
- 含两级混合运算(同步练习) 二年级下册数学人教版
- 2024年七月医疗器械质量管理制度
- 2024年高考真题-历史(安徽卷) 含答案
- GB/T 32124-2024磷石膏的处理处置规范
- 2024版中国血脂管理指南
评论
0/150
提交评论