版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、.1. 实验目的1.1 掌握集群的使用方法。1.2 掌握以并行的方式分析问题、设计并行程序的方法。1.3 掌握如何对并行程序进行简单的性能分析2. 实验要求122.1 使用MPI、OpenMp等并行程序设计方法设计矩阵乘法的并行程序。2.2 随机产生所需的矩阵元素,数据项不得少于1000*1000。2.3 尽量设计较高的加速比3. 实验环境1233.1 硬件环境:两个集群节点blade13、blade15。3.2 软件环境:Linux、gcc、Win7、VC+6.0。3.3 连接方式:Xmanager Enterprise 4.0远程桌面连接211.69.198.203。4. 实验程序1234
2、4.1 随机算法产生矩阵:srand(unsigned int)time(NULL);for (i=0; iN; i+)for (j=0; jN; j+)Aij = rand() % 10;Bij = rand() % 10;Cik = 0;4.2 串行程序设计time(&start);for (i=0; iM; i+)for (k=0; kM; k+)Cik = 0;for (j=0; jM; j+)Cik += Aij*Bjk;time(&end);4.3 并行程序设计MPI_Init(&argc,&argv)和MPI_Finalize()MPI_Init用来初始化MPI执行环境,建立多个
3、MPI进程之间的联系,为后续通信做准备。而MPI_Finalize则是结束MPI执行环境。这两个函数就是定义MPI程序的并行区的,除了检测是否初始化的函数之外,不应该在这两个函数定义的区域外调用其它MPI函数。这两个函数都返回整型值,标识函数是否调用成功。int MPI_Comm_rank(MPI_Comm comm, int *rank) MPI_Comm_rank函数用来标识各个MPI进程,获取调用该函数进程的进程号,将自身与其他进程区分。MPI_Comm_rank返回整型的错误值,需要提供两个参数:MPI_Comm类型的通信域,标识参与计算的MPI进程组。上面例子中使用的是MPI_COM
4、M_WORLD,这个进程组是MPI实现预先定义好的进程组,指的是所有MPI进程所在的进程组。如果想要申请自己的特殊的进程组,则需要通过MPI_Comm定义并通过其它MPI函数生成。&rank返回调用进程中的标识号。int MPI_Comm_size( MPI_Comm comm, int *size) MPI_Comm_size函数用来获取指定通信域的进程个数,确定自身需要完成的任务数。 MPI_Comm类型的通信域,标识参与计算的MPI进程组。上面的例子中用的是MPI_COMM_WORLD。&size返回相应进程组中的进程数。int MPI_Send(void *buf, int count
5、, MPI_Datatype datatype, int dest, int tag, MPI_Comm comm)MPI_Send 函数用于发送一个消息到目标进程。通信域中的dest进程发送数据,数据存放在buf中,类型是datatype,个数是count,这个消息的标志是tag,用以和本进程向同一目的进程发送的其它消息区别开来。int MPI_Recv(void *buf, int count, MPI_Datatype datatype, int source, int tag, MPI_Comm comm, MPI_Status *status)MPI_Recv 函数用于从指定进程接收
6、一个消息。它的含义是进程从comm域中source进程接收标签号为tag的数据,并保存到buf中。接收缓冲区buf的大小不能小于发送过来的消息的长度。否则会由于数组越界导致程序出错。主进程if(process_id = 0)row_aver = N / slave_num;remainder = N % slave_num;offset = 0;for(dest=1; dest=slave_num; dest+) rows = (dest = remainder) ? row_aver+1 : row_aver;printf(sending %d rows to process %dn, ro
7、ws, dest); MPI_Send(&offset,1,MPI_INT,dest,FROM_MASTER, MPI_COMM_WORLD);MPI_Send(&rows,1,MPI_INT,dest,FROM_MASTER, MPI_COMM_WORLD);MPI_Send(&Aoffset0,rows*N,MPI_INT,dest,FROM_MASTER, MPI_COMM_WORLD);MPI_Send(&B,N*N,MPI_INT,dest,FROM_MASTER,MPI_COMM_WORLD);offset += rows;start_time = MPI_Wtime();for(
8、source=1; source 0)MPI_Recv(&offset,1,MPI_INT,0,FROM_MASTER,MPI_COMM_WORLD,&status);MPI_Recv(&rows,1,MPI_INT,0,FROM_MASTER,MPI_COMM_WORLD,&status);MPI_Recv(&A,rows*N,MPI_INT,0,FROM_MASTER,MPI_COMM_WORLD,&status);MPI_Recv(&B,N*N,MPI_INT,0,FROM_MASTER,MPI_COMM_WORLD,&status);/矩阵乘法for(i=0; irows; i+)fo
9、r (k=0; kN; k+)int tmp = Aik;for (j=0; jN; j+)Cij += tmp*Bkj; /利用MPI_Send(&offset,1,MPI_INT,0,FROM_SLAVE,MPI_COMM_WORLD); MPI_Send(&rows,1,MPI_INT,0, FROM_SLAVE, MPI_COMM_WORLD); MPI_Send(&C,rows*N,MPI_UNSIGNED_LONG_LONG,0,FROM_SLAVE, MPI_COMM_WORLD);MPI_Finalize();return 0;5. 性能分析分析公式:加速比=串行执行时间/并行
10、执行时间效率=加速比/节点数123455.1 串行程序的执行时间(秒) 矩阵规模实验结果1000200030004000第1次11.00099.000372.000799.000第2次11.00098.000376.000799.000第3次11.00099.000373.000802.000平均值11.00098.667373.667800.000图1. 不同矩阵规模下串行程序的执行时间5.2 八个节点时,不同矩阵规模并行程序的执行时间(秒) 矩阵规模实验结果1000200030004000第1次0.8296.83323.37255.422第2次0.8326.83823.31555.786第
11、3次0.8376.82023.56055.732平均值0.8336.83023.41655.647加速比13.20514.44615.95814.376效率1.6511.8061.9951.797图2. 八个节点时,不同矩阵规模下并行程序的执行时间图3. 八个节点时,不同矩阵规模下并行程序的加速比图4. 八个节点时,不同矩阵规模下并行程序的效率分析随着矩阵规模的增加执行时间程序的执行时间急剧增加。加速比程序的加速比基本保持不变。效率程序的效率基本保持不变。5.3 矩阵规模为1000*1000时,不同节点数下并行程序的执行时间(秒) 节点个数实验结果2345678第1次5.7922.9171.9
12、451.4551.1700.9730.829第2次5.7932.8991.9441.4741.1670.9710.832第3次5.8382.9151.9351.4531.1690.9750.837平均值5.8082.9101.9411.4611.1690.9730.833加速比1.984 3.780 5.667 7.259 9.410 11.305 13.205 效率0.992 1.260 1.417 1.452 1.568 1.615 1.651 图5.矩阵规模1000*1000时,不同节点下的并行程序的执行时间图6.矩阵规模1000*1000时,不同节点下的并行程序的加速比图7.矩阵规模1
13、000*1000时,不同节点下的并行程序的效率分析随着计算节点数的增加,执行时间程序的执行时间迅速减少,然后趋于平稳。加速比程序的加速比基本呈线性增长,公式趋y=1.8374x+0.022。效率程序的效率逐步增长,然后趋于平缓。6. 用户手册1234566.1 连接:ssh pppusr211.69.168.203 密码:*6.2 登陆:sudo ssh blade13或者blade156.3 切换至工作目录: cd /home/pppusr/*6.4 编译:mpicc -o matrix matrix_multi.c6.5 运行:mpirun -np 8 ./matrix#include #
14、include #include #define N 1000 #define FROM_MASTER 1#define FROM_SLAVE 2int ANN, BNN;unsigned long long CNN;MPI_Status status;/消息接收状态变量,存储也是分布的 int main(int argc, char *argv) intprocess_num; /进程数,该变量为各处理器中的同名变量, 存储是分布的 intprocess_id; intslave_num; intdest; /目的进程标识号intsource; /发送数据进程的标识号introws;intr
15、ow_aver;intremainder; intoffset;/行偏移量inti, j, k; double start_time, end_time; srand(unsigned int)time(NULL);for (i=0; iN; i+)for (j=0; jN; j+)Aij = rand() % 10;Bij = rand() % 10;Cik = 0;MPI_Init(&argc, &argv);/初始化MPI/*该函数被各进程各调用一次,得到各自的进程id值*/MPI_Comm_rank(MPI_COMM_WORLD, &process_id);/*该函数被各进程各调用一次
16、,得到进程数*/MPI_Comm_size(MPI_COMM_WORLD, &process_num);slave_num = process_num - 1; if(process_id = 0)row_aver = N / slave_num;remainder = N % slave_num;offset = 0;/有的程序是将时间函数放在这个for循环的两边for(dest=1; dest=slave_num; dest+) rows = (dest = remainder) ? row_aver+1 : row_aver;printf(sending %d rows to proce
17、ss %dn, rows, dest); MPI_Send(&offset, 1, MPI_INT, dest, FROM_MASTER, MPI_COMM_WORLD);MPI_Send(&rows, 1, MPI_INT, dest, FROM_MASTER, MPI_COMM_WORLD);MPI_Send(&Aoffset0, rows*N, MPI_INT, dest, FROM_MASTER, MPI_COMM_WORLD);MPI_Send(&B, N*N, MPI_INT, dest, FROM_MASTER, MPI_COMM_WORLD);offset += rows;st
18、art_time = MPI_Wtime();for(source=1; source 0)MPI_Recv(&offset, 1, MPI_INT, 0, FROM_MASTER, MPI_COMM_WORLD, &status);MPI_Recv(&rows, 1, MPI_INT, 0, FROM_MASTER, MPI_COMM_WORLD, &status);MPI_Recv(&A, rows*N, MPI_INT, 0, FROM_MASTER, MPI_COMM_WORLD, &status);MPI_Recv(&B, N*N, MPI_INT, 0, FROM_MASTER, MPI_COMM_WORLD, &status);for(i=0; irows; i+)for (k=0; kN; k+)int tmp = Aik;for (j=0; jN; j+)Cij
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 协议赔偿合同范例
- 学车培训合同范例
- 塔吊分包合同范例
- 小额政府采购工程合同范例
- 品牌进驻酒店合同模板
- 医师证 合同范例
- 园林养护合同范例冬季
- 外墙外保温施工合同范例
- 工厂婚纱租赁合同范例
- 2024年度软件定制开发与技术支持协议
- 2024年全国高考Ⅰ卷英语试题及答案
- 期刊编辑的学术期刊编辑规范考核试卷
- T-CCSAS014-2022《化工企业承包商安全管理指南》
- 电梯安全总监和安全员的任命文件
- 2024年安徽省普通高中学业水平选择性考试 历史试卷
- 电子商务师职业技能等级证书培训方案
- JBT 14615-2024 内燃机 活塞运动组件 清洁度限值及测定方法(正式版)
- DL5009.2-2013电力建设安全工作规程第2部分:电力线路
- 理智与情感:爱情的心理文化之旅智慧树知到期末考试答案章节答案2024年昆明理工大学
- GA/T 2097-2023执法办案管理场所信息应用技术要求
- GB 20052-2024电力变压器能效限定值及能效等级
评论
0/150
提交评论