并行计算机体系结构复习_第1页
并行计算机体系结构复习_第2页
并行计算机体系结构复习_第3页
并行计算机体系结构复习_第4页
并行计算机体系结构复习_第5页
已阅读5页,还剩119页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2023/2/61并行计算机体系结构复习计算机系2023/2/62第一章概论§1.1引言1、计算机性能与结构关系2、需求3、可行性2023/2/63§1.2并行处理的定义

定义:并行处理是一种有效的强调 开发计算过程中并行事件 的信息处理方式。并行事件:

同时性并发性流水线2023/2/64§1.2并行处理的定义信息处理广义上包含数据处理、信息处理、知识处理和智能处理。

数据处理 信息处理 知识处理 智能处理认真理解并行事件与信息处理含义2023/2/65§1.3开发并行性的途径1、并行事件的获取并行事件可以从不同的处理级获取:作业或程序级: 任务或进程级:线程级:指令级:指令内部操作级:2023/2/662、并行计算机结构形式流水计算机阵列计算机多处理机和多计算机2023/2/67并行处理系统的发展过程多道程序、分时系统、虚拟存储器多终端远程系统分布式系统多存储器、多操作部件阵列处理机关联处理机同构型多处理机系统先行控制、高速缓存指令、操作宏流水线异构型多处理机具有以自治性为特征的分布控制单处理机通过资源共享通过资源重复通过时间重叠

通过对多处理机系统的网络化、多机互连、功能专用化得到前三种并行处理机系统2023/2/68§1.4并行处理机的分类

Flynn分类法Handler分类法按体系结构分类现代并行机结构分类2023/2/69Flynn分类法:MichaelJ.Flynn1966

按指令流、数据流分类指令流-机器执行指令的序列数据流-由指令调用的数据的序列单指令流单数据流SISD单指令流多数据流SIMD多指令流单数据流MISD多指令流多数据流MIMD§1.4并行处理机的分类2023/2/610T(c)=<K×K’,D×D’,W×W’>CPU数目能执行流水线的CPU数目CPU所控制的ALU数目能执行流水线的ALU数目ALU或PE中的位数ALU或PE中流水线的段数三元组分类法:WolfgangHändler1977年,Handler根据计算机系统中流水线和并行程度分类。从三个子系统级分析:处理机级PCU、算术逻辑部件级ALU、位级BIC§1.4并行处理机的分类2023/2/611向量流水机:阵列处理机:(含脉动阵列)SIMD关联处理机:具有联想存储,按内容存取、逻辑操作等同步系统(统一时钟)按体系结构分类§1.4并行处理机的分类2023/2/612§1.4并行处理机的分类由独立执行指令的处理器构成分布存储系统:多个存储器物理上分布集中存储系统:存储器物理上相对集中多处理机系统MIMD2023/2/613SIMD PVP并行向量处理机 (ParallelVectorProcessor)SMP对称多处理机

(SymmetricMultiprocessor)MPP大规模并行处理机(MassivelyParallelProcessor)DSM分布式共享存储多处理机

(DistributedSharedMemory)COW工作站机群

(ClusterOfWorkstations)现代并行机结构分类§1.4并行处理机的分类互2023/2/614并行处理系统性能上限分析(1)并行处理系统性能上限分析(2)2023/2/615H.T.Kung(1991)认为并行处理中的三个关键问题:并行计算的计算模型-并行性 问题分解、任务的分配处理机之间的通信-可扩展性 互连网的复杂性通用并行计算环境-可编程性 并行语言、并行编译、并行应用等2023/2/616第二章并行计算机模型以MIMD模式运行的计算机系统包含多个处理机或计算机的单一计算机系统通过互连网将各处理机、计算机或存储单元相连接§2.1概述2023/2/617基本特性:单处理机的能力和处理机阵列大小的乘积决定并行计算机系统的能力互连网络决定解决问题的类型和系统的适应能力控制方式分为集中式和分布式2023/2/618按通信方式按耦合度按控制方式

三者之间的关系2023/2/619从四个方面讨论并行计算机模型并行计算机结构模型并行计算机访存模型并行计算机性能模型并行计算机Cache一致性2023/2/620SIMD PVP并行向量处理机 (ParallelVectorProcessor)SMP对称多处理机

(SymmetricMultiprocessor)MPP大规模并行处理机(MassivelyParallelProcessor)DSM分布式共享存储多处理机

(DistributedSharedMemory)COW工作站机群

(ClusterOfWorkstations)§2.2并行处理机结构模型互2023/2/621§2.3并行计算机访存模型分类:均匀存储访问模型UMA非均匀存储访问模型NUMA全高速缓存存储访问模型COMA高速缓存一致性非均匀存储访问模型CC-NUMA非远程存储访问模型NORMA从系统访问存储器模式的角度来讨论多处理机,与上面所讨论的模型是并行计算机系统的两个方面。

2023/2/622§2.4并行计算机性能模型粒度概述:粒度是衡量软件进程所含计算量的尺度设R代表程序的执行时间,C代表用于通信的开销,用R/C比值表示每一单位计算的开销,即衡量任务粒度(TaskGranularity)大小的尺度。2023/2/623在粗粒度(Coarsegrain)并行情况下,R/C比值比较大,每个单位计算只需要少量的通信。在细粒度(Finegrain)并行情况下,R/C比值比较小,每个单位计算有很大的通信量和其它的开销。细粒度并行性需要许多台处理机,而粗粒度并行性只需较少台数的处理机。

2023/2/624细粒度并行性:把一个程序尽可能地分解成能并行执行的小任务。在极端情况下,一个小任务只完成一个操作。通常,一个小任务包含几条指令。2023/2/625两台处理机系统任务分配扩展到N台处理机系统的任务分配通信开销为线性的模型:额外开销与计算过程重叠的模型:具有多条通信链路的模型:2023/2/626性能模型总结:多处理机系统结构所需的额外开销,包括调度,对共享资源的竞争,同步,处理机之间通信等,在串行机和向量机(或别的单指令流机)系统结构中是不存在的。

2023/2/627当运行某个程序的处理机数目增加时,用于计算的那部分时间将减少,而额外开销时间却增加了。实际上,额外开销的增加可能比处理机数目的线性增加更快。2023/2/628矛盾:

R/C要足够小使能并行执行的任务数目较多;

R/C要足够大以免额外开销太大。

即不能期待通过增加处理机数目来提高多机系统性能

2023/2/629软硬件并行性匹配(粒度匹配)软件并行性:与求解的问题有关,由程序的控制和数据的相关性决定,是算法、程序设计风格和编译优化的函数。将求解问题分解为多个相关子任务,并可由一个有序图来表示各子任务之间的关系。2023/2/630硬件并行性:

是价格和性能折衷的函数,显示可以同时执行操作的资源利用方式,说明处理机资源峰值的性能。软件并行性反映用户的需求;硬件并行性反映了系统的适应性2023/2/631多机系统设计目标:

使系统结构和所求解问题(粒度)达到最佳匹配2023/2/632匹配过程:针对求解问题,将程序划分为尽可能多的并行成分,以获得最短计算时间;分析获得可能的单处理机性能,最大处理机数目和互连网络性能;根据要求,求得最佳粒度(加速比、性能价格比等);结构灵活性(适应性)2023/2/633§2.5并行计算机Cache一致性引发Cache一致性的缘由Cache一致性维护策略基于总线监听协议基于目录协议2023/2/634引发Cache一致性问题的缘由单机系统:写操作引发的Cache和主存数据的不一致I/O读引发的主存和Cache数据的不一致2023/2/635多处理机系统:共享数据写操作引发的Cache与主存以及各Cache之间的数据不一致;进程迁移引发的各Cache之间的数据不一致I/O操作造成的主存与各Cache中的数据不一致2023/2/636一致性的维护策略单机中的基本策略:写通过WT(Write-Through)

如果在Cache1中修改一个数据,则需要立即在主存中修改该数据写回WB(Write-Back)在Cache1中的修改修改一个数据,当该数据被替换时再写回主存(在相当长时间内,主存和Cache1数据不一致)2023/2/637

多机系统中cache一致性维护策略的改进:

基本思路:

及时更新主存和各Cache中的数据或作废其数据。

更新法(Write-Update)

作废法(Write-Invalidate)

2023/2/638根据网络的结构,采用不同方法维护各Cache之间及Cache与主存的一致性。播写法(监听总线协议,适合总线结构)目录表法2023/2/6393.监听总线协议

(1)采用WT策略的一致性维护(2)采用WB策略的一致性维护2023/2/6404.基于目录的协议全映射目录有限目录链式目录2023/2/641第三章互连网络§3.1网络特性

在网络中,计算机、处理机、存储器和I/O等称为结点。各结点通过互连网连接交换信息。一般网络是由有向或无向图来表示。结点数决定网络规模。

2023/2/642静态互连网——由结点和结点直接相连,连接方式固定不变动态互连网——由开关实现,可以动态改变结点之间连接几个主要的参数2023/2/643§3.2寻径函数

寻径函数:五个基本寻经函数2023/2/644各种互连函数与其逆函数之间有如下关系:2023/2/645部分互连函数之间的关系:2023/2/646§3.3静态互连网络

按不同的拓扑结构,连接结点的入出端。每种连接以一种寻径函数表示。若存在m中连接,用m个寻径函数表示。既一个结点可以与多个结点直接连接。一个静态互连网络SW,可表示为:

SW={f1,f2。。。。。Fm}当和没有直接连接的结点通信时,需要循环使用该互连网络各种静态互连网及其改进的变形,它的结点度和网络直径2023/2/647§3.4动态互连网络三种形式:总线结构——操作过程及控制过程,仲裁器、菊花链全互连开关——开关形式多级交叉开关网——各种多级开关2023/2/648当多个结点同时申请使用总线,引发总线冲突,需要总线仲裁。两种总线仲裁处理方法:

排队器——优先权编码器 菊花链——静态菊花链、动态菊花链2023/2/649多级互连网络:速度高,灵活性好,传输率低于完全开关网络,适用于PE较多的情形。其性能特点反映在以下三个方面: 开关形式 级间拓扑结构 控制方式2023/2/650

4)

控制方式对各个交换开关进行控制的方式有三种:(1)

级控制:同一级开关只用一个控制信号,处于同一状态(2)单元控制:每一个开关都有自己单独的控制信号(3)部分级控制:用i+1个控制信号控制第i级0≤i≤n-1,共(n+1)n/2个控制信号交换开关上的字母表示对该开关的控制信号,若不同开关写同一字母,表示它们用同一种控制信号。2023/2/651ABDEFHIJLCGK0123456701234567012345670213465702134657041526370415263760123457ε(0)β(2)

ε(0)β(3)

ε(0)σn

–1

STARAN网

5.

几种常见的多级互连网络(1)

STARAN网络:2023/2/6522)

Omega网络——多级混洗交换网络

由n级相同的网络构成,每一级包含一个完全混洗连接及随后一列2n-1个4功能交叉开关单元,采用单元控制方式,一般形式:7012345670415263760124502461357ABCDEFGHIJKL实质为STARAN网入出交换,并交换一下F、G位置,但不改变拓扑连接。0123456704152637601234502134657ABCDEGFHIJKL3σε(0)σε(0)σε(0)2023/2/6533)

Parker网络——基准网络2023/2/654基准网的递归构成:任何一个N×N的互连网络,可以由两个N/2×N/2的子网络组成。2023/2/655阻塞网络——同时实现两对或多对之间的连接时,可能因争用数据通路而发生冲突无阻塞网——可以同时实现任意结点对之间的连接重按排网——经过重新安排,可以同时实现任意对结点之间的连接2023/2/6564)Benes网2023/2/657010123235)Cantor网2023/2/658(6)

榕树(Banyan)网络

采用2×2带仲裁的开关从左到右,结点编址的第i位控制第i级开关的输出若采用a×b开关,结点采用b进制编址每个根结点对应下面各级都是一颗树榕树网可以实现以目标结点地址寻址2023/2/6597)Delta网分组混洗:设有N=q×c张牌,分为q组,每组c张。取每组第1张排到输出,然后每组取第2张排列到输出,依次类推,直至把N张牌分完。4组混洗2023/2/660Delta网构成:用a×b的开关可以构成an×bn的网络用a组混洗进行级间连接从左到右分别为0级至n-1级 开关输出和结点编址以b进制表示

{dn-1,dn-2……..d1d0}b用di

位控制第i级开关模块开关模块数 当a=b,(an-bn)/(a-b)

其它,nbn-12023/2/661§3.5消息传递机制计算机系统设计方案:2023/2/6622023/2/663消息格式寻径方式-四种寻径方式死锁和虚拟通道包冲突策略维序寻经广播与选播2023/2/664四种包冲突策略比较:阻塞法:控制简单,但可能会引起大面积阻塞扬弃法:控制简单,重发效果未知,可能加大网络负载虚拟直通法:不会浪费已经分配的资源,但需要一个能存放整个包的缓冲区,包缓冲区不可能做在寻径芯片上,要用存储器作为缓冲区,可能会有较大的存储延迟。绕道法:绕道结果未知,需要按某种算法寻径2023/2/665

第四章任务分配与调度§4.1多机操作系统概述1.主要特征:并行性——多机操作系统的主要目标是增强程序执行的并行性,以获得更高的系统处理能力,提高系统的运算速度,满足各应用领域对计算机系统性能的需求2023/2/6662.多机操作系统分类主从式——操作系统仅在指定的主处理机上运行。主处理机管理整个系统并为从处理机分配任务,从处理机通过软中断或访管访问主机。2023/2/667单独管理——每个处理机具有自己的操作系统或管理程序,按照自身需要,独立运行和管理。2023/2/668浮动管理——主处理机可以从一个处理机浮动到另一个处理机,任何处理机均可成为主处理机。2023/2/669§4.2任务分配——调度策略1、概述调度——为了优化某个目标函数,在一组具有任意特性的处理机中对一组进程进行调度。调度主要作出两个决定:决定把程序和数据分配到物理存储器的什么位置决定每个进程在哪个处理机上运行2023/2/670调度算法是对一组给定进程进行调度的过程,目的是研究处理机的分配和进程调度技术,以达到使用最少数量的处理机在最短时间内完成并行程序。调度算法效率: 当调度算法可以描述为一个多项式算法,效率较高 当调度算法可以描述为一个指数算法,效率较低2023/2/671与调度相关的一些性能指标(参数)最小完成时间所需最少处理机数目最小平均流处理机最大利用率处理机最小空闲时间2023/2/672一般情况下,寻找最优的调度算法不一定是最好的调度算法或不存在最优调度算法。所以最优调度算法往往指为合理的调度算法2023/2/673长期进程调度短期进程调度两类调度:确定性调度不确定性调度2023/2/674两种调度方法:抢先调度——一个任务完成之前允许被打断,以后可以接续恢复执行的调度非抢先调度——当一台处理机分配给某个任务后,该处理机为该任务提供服务直至该任务完成2023/2/675粒度组合与调度做并行程序设计时要回答两个基本问题:(1)如何将程序划分成并行模块、子任务以获得最短执行时间。(2)计算中的并发粒度为多大会比较理想。与问题以及机器有关,需要在并行性与调度开销之间做折衷。2023/2/676最小平均流时间调度

设多机系统为异构型或各处理机速度不同。已知每个任务在每个处理机上的执行时间,对于一组相互独立的任务,可获得最小平均流时间。 对于m个处理机和n个任务,有m×n的矩阵表示每个任务在不同处理机上的执行时间,Tij表示任务Tj在处理机Pi上的执行时间。2023/2/6773、不确定性调度不确定性调度的基本思路:(1)进一步探索进程执行时间的规律,以获得任务的执行时间或相应的数据(2)在运行过程中保证各处理机满负荷运行2023/2/678排队调度 设有P个处理机和无界要求服务的任务队列,已知任务到达的时间间隔概率分布,处理机处理时间的概率分布,并且任务到达时间间隔和处理时间概率分布相互独立。利用排队模型可以求得任务响应的平均时间或给出任务平均响应时间,求所需的处理机数目。(经过统计,任务到达服从爱尔郎Erlang分布)2023/2/679动态负载平衡两个含义:(1)在程序执行过程中对任务进行分解和分配,将任务从一台处理机向另一台处理机调动(2)将任务从重载处理机向空载或轻载处理机上迁移动态调度的依据,系统状态信息。需要通过交换信息了解系统状态两种交换方式:同步方式:按固定时间互通信息 (多长时间互通一次信息?)异步方式:因某一事件触发互通信息2023/2/680负载平衡策略接收者负载平衡——在任务并行执行过程中,当某处理机空载时,按“征兵协议”向周围结点发出征载请求,邻近的重载处理机进行响应,相互建立联系。发送者负载平衡——在任务并行执行过程中,重载处理机按“招标协议”向外广播寻求帮助。空载处理机收到请求,给予响应。“征兵协议”适用于负载比较平衡的系统“招标协议”适用于负载不平衡的系统2023/2/681几个基本参数:负载——处理机运行的用户程序没有完成的工作量。包括计算时间和通信时间。往往与具体的求解问题有关,需要按一定的方法估算。负载阈值——处理机负载的某一界限值。当某未完成任务的负载低于此值,就不适于再分解。 设任务P的计算时间为Tp,分解为两个子任务P1,P2。计算时间为Tp/2。若任务通信时间为Tc,当Tp/2<Tc时,并行处理失效。所以负载阈值T>2Tc。2023/2/682轻载——处理机负载小于负载阈值重载——处理机负载大于负载阈值空载——处理机空闲负载平衡——处理机均重载或处理机为空载和轻载2023/2/683第五章并行程序设计概况§4.1概述并行程序设计与算法、系统结构有密切的关系。并行性的关键在算法。研究并行算法及程序设计,是多机系统的一个重要研究课题。其中相关问题是十分重要和难以解决的问题之一。2023/2/684并行性级作业级、程序级进程级、任务级线程级进程是并行程序的基本单位程序数据分解-几个划分2023/2/685并行程序设计模型共享变量模型

消息传递模型数据并行模型面向对象模型

2023/2/686§4.2并行性条件1.数据相关 值相关

流相关反相关输出相关2023/2/687控制相关

S2的执行与否取决于S1的执行结果并行性检测

Bernstein准则(伯恩斯坦1966)程序中的相关性处理-基本块

2023/2/688例:P1:C=D×EP2: M=G+CP3: A=B+CP4: C=L+MP5: F=G/E交换性:Pi//PjPj//Pi结合性:Pi//Pj//Pk(Pi//Pj)//PkPi//(Pj//Pk)无传递性:Pi//PjPj//Pk无Pi≠Pk

2023/2/689§4.3并行语言与编译器并行语言特征优化特性:可用性可扩展性兼容性可移植性2023/2/690向量化——用向量指令取代串行程序中的一段代码并行化——用并行指令描述串行程序中可并行执行的程序段并行语言结构向量化:

并行化:三种主要并行结构

cobegin-coend

Fork——Join程序结构

parfor并行循环结构:2023/2/691§6.1引言冯·诺依曼机的基本特征:

“程序存储、顺序执行、二进制、五大部件组成、共享数据”计算机模型。相关性是并行处理的关键问题并行处理计算的发展,两条路线:对冯·诺依曼机结构改进,适应并行处理,解决相关性问题提出非冯·诺依曼结构

第六章数据流计算机2023/2/692四种驱动方式计算机模型

按控制机制对计算机模型分类,Treleaven教授提出划分为四种驱动方式:控制驱动数据驱动需求驱动模式匹配驱动2023/2/693控制驱动模型

这是传统的冯·诺依曼型结构基本特征:命令式语言程序顺序执行,指令的执行次序受指令计数器的控制,即由程序员指定序列操作其中:“共享数据,顺序执行”与并行性有密切关系2023/2/694数据驱动模型

程序中任意一条指令中所需的操作数(数据令牌)到齐,立即启动执行(称为“点火”)。一条指令的运算结果又流向下一条指令,作为下一条指令的操作数来驱动此指令的启动执行能充分地利用程序中指令级并行性不存在共享数据,也不存在指令计数器,指令启动执行的时机仅取决于操作数具备与否。只要有足够多的处理单元,凡是相互间不存在数据相关的指令都可以并行执行2023/2/695需求驱动模型

一个操作仅在需要用到其输出结果时才开始启动。如果这时该操作由于操作数未到而不能得到输出结果,则该操作再去启动能得到它的各个输入数的操作,也可能那些操作还要去启动另外一些操作,这样就把需求链一直延伸下去,直至遇到常数或外部输入的数据已经到达为止,然后再反方向地去执行运算。2023/2/696

计算的运行是由谓词模式匹配加以驱动的,程序的执行主要适合于求解非数值的符号演算。面向智能的计算机就是基于“模式匹配驱动”的计算机。

模式匹配驱动2023/2/697§6.2数据流计算机基本工作思路数据流计算机不共享数据,一条指令执行后不送存储器保存,以供其他指令共享,而是直接流向需要该结果的指令,作为新的操作数供下一条指令使用。每个操作数经过指令的一次使用后便消失。如果若干条指令要求使用相同的数据,那么就需要事先复制该数据的若干个副本,分别供多条指令使用。2023/2/698数据流驱动的特点

指令的执行是由数据可用性来驱动,而不是由程序计数器来控制。任何指令只要操作数可用,应该说是做好了执行的准备。数据驱动程序中的指令不用任何方式来排定次序。数据直接保存在指令内,不是存在共享存储器中。2023/2/699计算结果(数据令牌)直接在指令间传递。一条指令产生的数据可被复制成多份副本直接送给所有缺乏数据的指令。数据令牌一旦被一条指令使用后,它就不能再被其它指令重复使用。不需要共享存储器,不需要程序计数器,不需要控制定序器。2023/2/6100数据流计算机指令结构指令主要由操作包(OperationPacket)和数据令牌(DataToken)两部分组成操作包由操作码(OperationCode),一个或几个源操作数(SourceData)及后继指令地址(NextAddress)等等组成数据令牌通常由结果数值和目标地址等组成。其中的结果值是上条指令的运算结果,而目标地址直接取自上条指令的后继指令地址,如果一条指令的运算结果要送往几个目的地,则分别形成几个数据令牌,多个数据令牌同时在各个操作部件之间传送,允许有多条指令并行执行。2023/2/6101数据流驱动四个性质:

异步(Asynchrony)只要本条指令所需要的数据令牌都到达,指令即可独立地执行,而不必关心其他指令及数据的情况如何。并行性(Parallelism)可同时地并行执行多条指令,而且这种并行性通常是隐含的。函数性(Functionalism)由于不使用共享的数据存储单元,所以数据流程序不会产生诸如改变存储字这样的副作用。也可以说,数据流运算是纯函数性的。局部性(Locality)操作数不是作为“地址”变量,而是作为数据令牌直接传送,因此数据流运算没有产生长远影响的后果,运算效果具有局部性。2023/2/6102单赋值规则。单赋值的含义是指在程序中每个变量只能赋值一次,即同一变量在赋值语句的左部只允许出现一次,不允许对同一变量进行多次赋值。遵循单赋值规则。这有利于运算并行性的开发,同时也可防止“副作用”。所谓“副作用”是指在程序执行过程中修改了某些参数的值指令的执行次序由数据依赖关系确定,指令执行规则简单地仅受数据相关性约束。控制变量的应用范围

数据流语言基本特征:2023/2/61033.数据流计算机结构

静态数据流计算机基本点:数据令牌不带任何标号,每条有向分支线上在某一个时刻只能传送一个数据令牌,每个结点一次只能执行一个操作。执行规则:结点的每一条输入分支线上都有一个令牌出现(数据分支线上出现的数据令牌,控制分支线上出现携带结点操作所要求控制信号的控制令牌),而且输出分支线上没有令牌时,该结点的操作才能够被执行。具有数据令牌,还有控制令牌,由这两种令牌同时来决定结点的操作是否执行2023/2/6104两种实现可重入代码的并发调用方法重入代码复制 当数据流程序需要调用一段可重入代码时,复制这段代码形成一个副本被调用执行。执行结束后把结果送到输出端保留,以备其它指令应用,副本随即消失。问题:复制过程开销大,程序副本占大量的存储空间。动态数据流计算机2023/2/6105冯.诺依曼结构可重入代码的递归调用均是一次调用总是在上次调用之后进行。每时刻仅有一个可重入代码的副本在运行,从而保证了多次调用的顺序。数据流机的并行可能并发调用同一个可重入代码,即同一时刻有多个副本在运行,流动着不同次的操作数,流动路径的不同可能导致产生结果的时间不同,引发不同次操作数的混乱。带标志数据令牌 对同一次调用的重入代码中的数据令牌加相同的标志2023/2/6106基本点:每个数据令牌都带有标号(令牌标号及其他特征信息),从而使数据流程图中的一条有向分支线上可同时传送(带不同标号)几个数据令牌不需要用控制令牌来确认指令间数据令牌的传送。采用一个专门硬件(匹配部件)对数据令牌中的标号进行符合比较并加以识别。2023/2/6107数据流计算机的优点

高度并行运算。。流水线异步操作。与VLSI技术相适应。有利于提高软件生产能力2023/2/6108数据流计算机的缺点

操作开销过大不能有效利用传统计算机的研究成果数据流语言尚不完善2023/2/6109需要解决的几个主要问题

合理的划分并行性,减少开销

多级并行(作业,进程,函数级),一部分在编译时完成,一部分在运行时完成)复合函数、过程级(循环,数组等操作)的并行(Gajks,Motooka等人)同步与异步结合 函数级异步,指令级同步。

程序如何分解并如何把程序模块分配给各处理部件。

研制易于使用,易于由硬件实现的高级数据流语言。

2023/2/6110第七章可扩展性,时延包容性与顺序一致性2023/2/6111§7.1可扩展设计原理一、可扩展性概念一般并行计算机系统扩展性认为可扩展为成百或成千个处理器。实际上应是整个系统各方面都是可扩展的。处理机可扩展存储器可扩展(容量、带宽等)互连网络可扩展协议可扩展应用性能可扩展2023/2/6112两种并行系统的扩展性:基于总线共享存储结构基于Internet的分布系统

可扩展性设计的目标是以通信结构为基础的折中。2023/2/6113二、可扩展范围1、资源可扩展性

通过增加机器规模、存储部件规模以及软件规模等方法,使系统具有更高性能或功能。

规模扩展:增加PE数,包括相应网络、接口等子系统及对扩大的系统进行编程。

资源扩展:增加MEM容量,包括Cache和磁盘等。

软件扩展:包括扩展操作系统、编译器、数学和工程库、应用软件和编程环境。2023/2/6114

2、应用可扩展性机器规模可扩展性:

问题规模可扩展性3、技术可扩展性代可扩展性:异构可扩展性:空间可扩展性

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论