下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、并行排序算法的设计 电脑与信息技术杂志2014年第三期 1并行算法 1.1并行算法分类并行算法的种类非常多,分类标准也均有所不同。按照基础运算对象进行分类,有数值和非数值两周并行算法。按照并行运算过程中,各进程的执行时间进行分类,有同步、异步和独立三种不同的并行算法。按照进程处理机中,它们各自承担所要计算任务量进行分类,有大粒度、中粒度和小粒度三种并行算法。 1.2并行算法设计方法并行算法的设计需要参照系统类型以及系统的特征,对某一问题针对性在处理机上进行并行解决。并行算法的设计一般有三种办法:对已有的串行算法进行检查,对算法中的并行性进行开发,并加以优化;根据问题本身的特征出发,设计一个完全
2、不同的并行算法;在已有算法的基础上,根据问题的特征进行修改,处理类似的问题;第一种设计方法中,如若该串行算法已经有内在相关顺序性,就非常难做并行的优化;第二种设计方法中,对现有算法进行修改,则要熟知问题的特殊性;第三种设计方法,凭空创新设计出一个算法,技巧性非常强,不但没什么章法,而且技术水平达不到。针对并行算法的设计,目前最为普遍的设计方法有平衡树技术、分治策略技术、流水线技术以及倍增技术等等。 1.3并行算法计算模型并行计算模型是指从所有并行机中,把共性存在的基本特征分离出来,最终形成一个抽象的并行计算处理机,且要在具体并行机至上。它与顺序计算中的vonneumann模型非常相似。根据普渡
3、报告分析,并行计算模型,必须能够保证并行计算处理机针对哪种计算,表现出超强的计算能力。并行计算的模型、算法设计以及并行机的相互关系,如图1所示:并行计算模型在并行算法中,有着至关重要的作用。它作为一种常见物质基础提供给并行算法,进行相关研究;它还可以拿出一个简单便利的框架结构,用于并行算法的设计以及开发分析;因其适用性较强,看适用在许多种类的并行处理机上,使得新的并行算法充满生命力。 2并行排序的基本思想 并行排序算法是参照快速排序算法的分治方法,首先在主进程内,把其宿主机上等待排序的某一数组分割为n块,文件的大小决定n的值。然后再把n块数据推送到对应数量的从进程中,从进程对其已经接受的数据在
4、宿主机上进行串行排序,最后所有从进程将已排好序的数据回传给主进程,同时数据要放回到原数值的位置上,完成了并行排序。按照此思想进行排序,缺点是不能确定算法的性能。可以借鉴负载均衡的思想,对该算法做出一些改进。从进程接受到数据后,不再对数据进行划分,只需要将其分为相同大小的n块,并将n块推送到对应的n个从进程中,由从进程来对分到的数据进行排序操作,排序完成后将已排序的数据传回给主进程。最后主进程只需要对接收到的n块排序数据进行归并排序,至此就完成了数据的排序工作。 3算法设计 3.1算法基本思想本文并行排序的算法思想是,首先形成部分有序的数据库,然后依次读入将数据顺序分成的数据块,快的大小不能超出
5、内存的大小。最后再对每一个小块进行排序,排序的结果保存到临时的文件中。 3.2算法设计假设需要排序的数据总量为n,分为n个数据块,每个数据块的数据量为a,即n=na,每一块数据块进行排序的耗费的时间为t(a)。设立三个a的函数,readblock()读入数据块、sortblock()数据块的排序、writeblock()保存已排序的数据块,分三个步骤完成数据排序。排序耗费的总时间t(a)由三个函数执行总时间的决定,分别记作tr(a)、ts(a)、tw(a)。完成所有数据排序的时间为:如果只需要某一个进程对数据处理的话,即串行执行上述三个步骤,如图2所示:但是因为readblock()、sort
6、block()、writeblock()三者在排序的时候所占用的系统资源均不相同。若如想要数据读入readblock()和数据保存writeblock()二者同时进行的话,就需要把排序前数据和已排序的数据分布安防在两个不同的硬盘上,而且还不会争夺i/0资源。另外,因为这两个模块占用的cpu资源特别少,数据排序sortblock()也可以并行运行,互不影响。所以说我们通过使用单机进行数据的排序,提高了排序算法的效率。合理的并行算法运行时,必须根据数据块的特性制定。本文上述三个block相互排斥,在并行运算时,必须遵循以下规则:第m个数据块的readblock()、sortblock()、writ
7、eblock()结束之后,方能开始第m+1个数据块对应的readblock()、sortblock()、writeblock();第m个数据块的readblock()结束之后方能开始sortblock();第m个数据块的sortblock()结束之后,方能开始write-block()。总之,要保证三个进程并行运行完成对数据的排序工作,如图3所示:三个进程并行运行可以充分利用系统的cpu、i/0资源,当开始运行后,任一时间都会有readblock()、sortblock()、writeblock()并行运行。这样保证了进程运行时不存在等待的情况,同时正好是重要路由算法得的最优执行方案。在调用三个进程之前,必须要先创建进程,应用进程创建函数。程序执行时顺序完成数据的读入、数据排序和数据的保存。多次测量执行时间后,取平均值,以此为依据启动三个进程。最终,多进程的并行排序得以实现。 4结束语 当前数据信息量高速增长,信息化建设也逐步推进,人们对数据处理速度提出了更高的要求,计算机速度要求也越来越高,也成为许多学者和专家积极研究探索的重要课题。开发人员也不再需要考虑进
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年抹灰工程分包合同样本
- 2024年技术研发合作合同的技术细节
- 2024年摄影棚专用租赁合同
- 2024年度二手汽车买卖及售后服务合同
- 2024年房屋交易安全保障合同
- 2024年式电脑租借协议
- DB4117T 169.33-2021 动物疫病流行病学调查技术规范 第33部分:牛结节性皮肤病
- DB4113T 054-2024 蚕豆-花生轮作栽培技术规程
- DB4106T 14-2020 玉米单交种浚单1538栽培技术规程
- 2024年度工程师全职聘用协议
- 安保方案模板
- 体育室内课《篮球ppt课件》
- 安装培训方案
- 2023边缘物联代理技术要求
- 航空航天类专业大学生职业生涯规划书
- 餐厅小票打印模板
- 腹胀护理课件
- 水稻栽培技术-水稻常规栽培技术
- 常见营养相关慢性疾病的营养指导
- 标准报价单模板(二)
- 《mc入门教程》课件
评论
0/150
提交评论