版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
§5并发性发展及计算机系统的分类并行性概念
计算机系统的并行性发展
并行处理系统的结构与多机系统的耦合度
计算机系统的分类
并行性概念
只要在同一时刻或是在同一时间间隔内完成两种或两种以上性质相同或不同的工作,它们在时间上能互相重叠。
同时性(Simultaneity):两个或多个事件在同一时刻发生。并发性(Concurrency):两个或多个事件在同一时间间隔内发生。
从计算机系统中执行程序角度来看
指令内部
指令之间任务或进程之间作业或进程之间
从处理数据的并行性来看
位串字串位并字串位片串字并全并行存储器操作并行处理器操作步骤并行处理器操作并行指令、任务、作业并行
并行性开发途径
时间重叠(TimeInterleaving)是在并行性概念中引入时间因素,让多个处理过程在时间上相互错开,轮流重叠地使用同一套硬件设备的各个部分,以加快硬件周转而赢得速度。举例:流水线分离、细化功能部件→流水线→功能不同的多机系统→异构型多处理机系统指令流水线举例取指分析执行kK+1kkK+1K+1K+2K+2K+2部件分析取指执行时间并行性开发途径(续)资源重复(ResourceReplication):是在并行性概念中引入空间因素,通过重复设置硬件资源来提高可靠性或性能。多操作部件和多体存储器→相联、并行处理机→同构型多处理机系统CUPE(0)PE(1)PE(N-1)资源重复的例子并行性开发途径(续)资源共享(ResourceSharing):是利用软件的方法让多个用户按一定时间顺序轮流地使用同一套资源,以提高其利用率,这样也可以提高整个系统的性能。网络打印机多道程序、分时OS→真正的处理机代替虚拟机→分布处理系统计算机系统的并行性发展
1960年以前
算术运算的位运算(EDSAC、EDVAC、UNIVAC1)输入输出间操作的并行直接存储器访问(DMA)IBM709系列1960年至1970年流水线单处理机多功能部件流水线高速缓冲存储器Cache计算机系统的并行性发展(续)1970年至1980年多种并行处理系统结构,例:向量、阵列、相联等1980年至1990年RISC、多处理机、数据流机、智能机1990年以来MPP:MassivelyParallelProcessor大规模并行处理机SMP:SymmetricMultiprocessor对称多处理机Cluster:机群、集群坐落于LawrenceLivermore国家实验室的ASCIWhiteFUJITSUVPP5000IBMp69032x1.7GHzPower4+,217GFlops128GB内存,205GB/S内存带宽3xI/O抽屉,60xPCI-X,18GB/SI/O子系统带宽42x146.8GBUltraSCSI3磁盘,1920MB/S磁盘接口带宽(stripping)2xGigabitEthernet接口IBMLangchaoTERASCOPEServer10000系统总节点数量100个每节点2×2.8G处理器,2G内存96个计算节点,1个服务节点,3个存储节点系统的峰值计算能力1.0752Tflops采用Infiniband高性能互联网络带宽3.3Gbps-10Gbps,MPI带宽:单向>800MB/s延迟<7us并行处理计算机的结构
流水线计算机(时间重叠)
阵列处理机(资源重复)多处理机系统(资源共享)数据流计算机
流水线计算机、阵列处理机和多处理机流水线计算机:主要通过时间重叠,让多个部件在时间上交错重叠地并行执行运算和处理,以实现时间上的并行。阵列处理机:主要通过资源重复,设置大量算术逻辑单元,在同一控制部件作用下同时运算和处理,以实现空间上的并行。多处理机系统:主要通过资源共享,让共享输入/输出子系统、数据库资源及共享或不共享贮存的一组处理机在统一的操作系统全盘控制下,实现软件和硬件各级上相互作用,达到时间和空间上的异步并行。多机系统指的是多处理机系统和多计算机系统
多处理机系统:是由多台处理机组成的单一计算机系统,各处理机都可有自己的控制部件,可带自己的局部存储器,能执行各自的程序。多计算机系统:是由多台独立的计算机组成的系统,各计算机分别在逻辑上独立的操作系统控制下运行,机间可以互不通信,即使通信也只是经通道或通信线路以文件或数据集形式进行,实现多个作业的并行。
多机系统的耦合度
为了反映多机系统中各级器之间物理连接的紧密程度和交叉作用能力的强弱。最低耦合系统(LeastCoupledSystem):各种脱机系统
松散耦和系统(LooselyCoupledSystem):如果多台计算机通过通道或通信线路实现互连,共享某些磁带、磁盘等外围设备,以较低频带在文件或数据集一级相互作用。间接耦合系统紧密耦合系统(TightlyCoupledSystem):如果多台机器之间通过总线或高速开关互连,共享主存,并有较高的信息传输速度,可以实现数据集一级、任务级、作业级的并行。直接耦合系统
名次解释UMA:UniformMemoryAccess均匀存储访问NUMA:NouniformMemoryAccess非均匀存储访问COMA:Cache-OnlyMemoryAccess全高速缓存存储访问CC-NUMA:Cache-CoherentNonuniformMemoryAccess高速缓存一致性均匀存储访问NCC-NUMA:Cache-CoherentNonuniformMemoryAccess非高速缓存一致性均匀存储访问NORMA:No-RemoteMemoryAccess非远程存储访问DSM:DistributedSharedMemory分布式共享存储PVP:ParallelVectorProcessor并行向量处理机计算机系统的分类
采用的基本器件
计算机系统成本1966年MichaelJ,Flynn1978年DavidJ.Kuck:用指令流和执行流(ExecutionStream)及其多倍性来描述计算机系统总控制器的结构特征
1972年冯泽云:提出用数据处理的并行度来定量地描述各种计算机系统特性。按采用的基本器件分类计算机的更新换代第一代电子管计算机第二代晶体管计算机第三代中小规模集成电路第四代大或超大规模集成电路第五代VLSI(甚大规模集成电路)计算机性能的大幅度提高或更新换代,一方面依靠器件的不断更新,同时也依赖系统结构的不断改进。第一代1945~1954电子管继电器存储程序计算机程序控制I/O机器语言汇编语言普林斯顿ISA、ENIAC、IBM701第二代1955~1964晶体管、磁芯印刷电路浮点数据表示、寻址技术、中断、I/O处理机高级语言、编译、批处理监控程序UnivacLARC、CDC1604IBM7030第三代1965~1973)多层印刷电路微程序流水线、Cache、先行处理、系列机多道程序分时操作系统IBM360/370CDC6600/7600DECPDP-8第四代1974~1990LSI、VLSI半导体存储器向量处理分布式存储器并行和分布处理Cray-1、IBM3090DECVAX9000Convax-1第五代1990~
高性能微处理器高密度电路超标量、超流水、SMP、MP、MPP大规模、可扩展并行与分布处理SGICrayT3EIBM、SP2、DECAlphaServer8400五代计算机的特征表
按计算机系统成本分类巨型计算机、超级计算机
SuperComputer大型计算机
MainComputer中型机算机
MidComputer小型计算机
MiniComputer微型计算机
MicroComputer
工作站介于小型机和微型机之间,具有小型机的性能,微型机的价格。
本人的分类(从应用、成本)高性能计算机(MPP、Cluster、SMP)服务器工作站台式机便携机手持式终端(PDA、MP3、手机)个人计算机1981年8月12日1985年1986年1990年1993年1994年1995年2000年IBM5150Windows1.0CompaqWindows3.1PentiumNetscapeWindows95Pentium4WristPCDesktopPCTabletPCPocketPCPhonePC无线连接WearablecomputerMichaelJ,Flynn分类指令流:是指机器执行的指令序列。
数据流:是指指令流调用的数据序列,包括输入数据和中间结果。多倍性:是指在系统性能瓶颈部件上处于同一执行阶段的指令或数据的最大可能个数。
MichaelJ,Flynn分类SISD单指令流单数据流传统的单处理机属于SISD计算机SIMD单指令流多数据流并行处理机是SIMD计算机的典型代表我国的YH-I型是此类计算机型MISD多指令流单数据流实际上不存在,但也有学者认为存在MIMD多指令流多数据流包括了大多数多处理机及多计算机系统我国的YH-II型计算机是这种类型的计算机CUPUMMCSDSISSISDCU:控制部件,PU:处理机,MM:贮存模块,SM:共享主存IS:指令流,CS:控制流,DS:数据流CUPU1PU2PUnMM1MM2MMmDS1DS2DSnCSISSIMDSMCU1PU1PU2PUnMM1MM2MMmDSDSCS1ISnMISDSMCU2CUnCS2CSnIS2IS1CU:控制部件,PU:处理机,MM:贮存模块,SM:共享主存IS:指令流,CS:控制流,DS:数据流CU1PU1PU2PUnMM1MM2MMmDS1DSnCS1ISnMIMDCU2CUnCS2CSnIS2IS1DS2CU:控制部件,PU:处理机,MM:贮存模块,SM:共享主存IS:指令流,CS:控制流,DS:数据流DavidJ.Kuck分类用指令流和执行流(ExecutionStream)及其多倍性来描述计算机系统总控制器的结构特征。
SISE:单处理机系统
SIME:多操作部件的处理机MISE:带指令级多道程序的单处理机MIME:多处理机
冯泽云分类提出用数据处理的并行度来定量地描述各种计算机系统特性。
WSBS(字串位串)
WSBP(字串位并)WPBS(字并位串)WPBP(字并位并)
位片宽字宽SISDSIMD(MPP)SIMDMIMD1mn1m’n’VonNeumann结构计算机运算器ALU控制器输出设备输入设备存储器冯·诺依曼的设计思想“程序存储”核心思想计算机的程序和数据可以一同存在于存储器中,计算机通过在存储器中顺序读取程序来获取指令主存储器程序控制器I/O设备算术-逻辑单元存储数据和指令对二进制数进行算术和逻辑运算控制内存中的指令并执行系统的输入输出设备存储程序控制
StoredProgramControl
实现指令流程的三或四个阶段
取指令
取操作数
执行指令
写回结果VonNeumann机结构的主要特征
存储器是顺序线性编址的一维结构按地址访问、单元位数固定、运算速度与访存次数有关指令=操作码+地址码
操作数的类型由操作码决定指令在存储器中是按其执行顺序存储存储器内指令和数据同等看待二进制编码、运算以运算器为中心,I/O与存储器之间数据通过运算器,运算器、存储器、I/O设备的操作及之间的联系,由控制器控制
VonNeumann型结构的局限性
以数值计算为主,对自然语言、图像、图形和符号处理的能力较差;程序算法在整体上为顺序型,限制并行操作发挥;软件系统越来越复杂,正确性不能保证,软件生产效率低;硬件投资大,可靠性差,体系结构受限制;应用人员既懂专业知识,又具备编程技巧;
VonNeumann型结构的缺点
存在两个瓶颈
物理瓶颈:CPU与存储器之间频繁交换信智能瓶颈:每次只能顺序执行一条指令低级的机器语言与高级语言程序设计之间存在巨大的语义差距复杂的数据结构对象无法直接放到一维线性结构地址空间存储器中,必须经过地址映像
VonNeumann型结构的改进
增加了新的数据表示:浮点数、字符串
采用虚拟存储器,方便了高级语言编程引入堆栈,支持过程调用、递归机制采用变址寄存器,并增加间接寻址方式增加CPU内的通用寄存器和增设Cache采用存储器交叉访问技术,以及无冲突并行存储器采用指令流水技术采用多功能部件采用支持多处理机采用自定义数据表示使程序和数据空间分开
四十年来计算机系统结构的改进
串行算法-----〉适应并行算法出现向量计算机、并行计算机、多处理机高级语言与机器语言的语义差距减少出现面向高级语言计算机机器和直接执行高级语言机器硬件系统与操作系统和数据库管理系统软件相适应出现面向操作系统机器和数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025版信托资金借贷合同合规性审查条款3篇
- 二零二五年度古董家具修复木工合同范本4篇
- 二零二五年度智能锁定制加工合同范本4篇
- 2025版环保木工材料供应与分包工程合同4篇
- 2025版事业单位聘用合同续签与绩效考核及晋升标准协议3篇
- 2025版外教中介聘请合同标准范本3篇
- 农产品仓储库存管理与优化考核试卷
- 2025版信托投资公司外汇存款账户管理合同3篇
- 2025年加盟冰淇淋店合同模板
- 2025年加盟加盟推广合同
- 道路沥青工程施工方案
- 内陆养殖与水产品市场营销策略考核试卷
- 票据业务居间合同模板
- 承包钢板水泥库合同范本(2篇)
- DLT 572-2021 电力变压器运行规程
- 公司没缴社保劳动仲裁申请书
- 损伤力学与断裂分析
- 2024年县乡教师选调进城考试《教育学》题库及完整答案(考点梳理)
- 车借给别人免责协议书
- 应急预案评分标准表
- “网络安全课件:高校教师网络安全与信息化素养培训”
评论
0/150
提交评论