南开大学22秋学期《并行程序设计》在线作业答卷_第1页
南开大学22秋学期《并行程序设计》在线作业答卷_第2页
南开大学22秋学期《并行程序设计》在线作业答卷_第3页
南开大学22秋学期《并行程序设计》在线作业答卷_第4页
南开大学22秋学期《并行程序设计》在线作业答卷_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

22秋学期(高起本1709-1803、全层次1809-2103)《并行程序设计》在线作业-00001试卷总分:100得分:100一、单选题(共50道试题,共100分)SSEintrinsics_mm_load_sd命令的功能是____。对齐标量读取单精度浮点数未对齐标量读取单精度浮点数对齐标量读取双精度浮点数未对齐标量读取双精度浮点数答案:C2.在使用信号量之后必须对其进行____。初始化解锁减1销毁答案:D3.下列哪门课程不是并行程序设计的先导课?计算机概论高级语言程序设计计算机体系结构数据库系统答案:D4.SIMD并行架构的优点不包括____。辅助提供更大并发度设计简单编程简单更小的芯片尺寸答案:C5.在矩阵乘法的串行程序中,对____部分进行向量化收益最大。初始化第二个矩阵转置循环矩阵元素乘—加计算的循环结果输出答案:C6.pthread_join的第二个参数的作用是____。设置指定线程属性获取指定线程属性向指定线程传递参数获取指定线程函数返回结果答案:D7.如果运算结果要保存到独立无关的变量,则在向量运算之后需要进行的一个操作是____。对齐打包解包以上皆错答案:C8.对两个互斥量a、b,线程1执行lock(a);lock(b);,线程2执行lock(b);lock(a),则两个线程间会发生____。竞争条件数据依赖资源泄漏死锁答案:D9.SSE寄存器A和B中元素分别为A1A2A3A4和B1B2B3B4(均为由低到高),则执行C=blend(A,B,0x05)后,C中元素为A1A2B3B4B1B2A3A4A1B2A3B4B1A2B3A4答案:D10.C/C++语言存储二维数组采取____。行主次序存储列主次序存储交错式存储对角线存储答案:A11.单精度浮点数矩阵乘法进行AVX并行,期望的加速比为____.等于8小于84到8之间等于4答案:B12.SIMD架构中,_____。唯一控制单元控制所有计算单元每个计算单元独有控制单元一组计算单元共享一个控制单元以上皆错答案:B13.编写n个数求和的OpenMP程序,最高效的方法是____。多线程直接并发累加到共享变量将累加操作设置为临界区在累加操作前设置障碍采用归约指令答案:D14.每个SSE寄存器宽度为____位。3264128256答案:C15.互斥量是一种____同步机制。一元状态二元状态多元状态以上皆错答案:B16.四位助教帮助教授批改300份试卷,试卷共16道题,每位助教负责批改75份试卷,这是一种____任务划分方法。数据并行任务并行搜索并行预测并行答案:A17.Pthread是_____线程接口标准。LinuxPOSIXWindowsIOS答案:B18.在SSEintrinsics程序中整数数据类型是____。__m128__m128f__m128d__m128i答案:D19.pthread_rwlock_rdlock是对读写锁进行____操作。加锁解锁加读琐加写锁答案:C20.n个数求和的串行程序,通过一个循环将每个数累加到全局变量sum中,其多线程版本简单将循环范围改变为每个线程负载的范围,存在的问题是____。负载不均通信开销大CPU空闲等待严重sum累加产生竞争条件,导致结果错误答案:D21.数据依赖是指必须保持两个内存操作的____才能保证程序结果正确。大小时序时长cache局部性答案:B22.OpenMP并行模型是一种____编程模型。静态线程动态线程混合线程众核答案:B23.关于pthread_create的第一个pthread_t参数,下列说法错误的是____。它是输出参数它返回线程系统ID它返回线程的pthreadID需要为它预先分配内存答案:B24.并行算法运行时间是指____。最快进程花费时间所有进程平均花费时间所有进程花费总时间最慢进程花费时间答案:D25.下面哪个问题相对而言更不适合进行数据并行____。求和排序向量加法矩阵乘法答案:B26.AVX_512有____个专用寄存器。481632答案:D27.在使用条件变量之后必须对其进行____。初始化加锁解锁销毁答案:D28.当问题规模不变时,随着处理器数量增大,加速比____。必然增大必然减小必然不变以上皆错答案:D29.一个Neon寄存器最多存放____个短整型数。24816答案:C30.动态任务划分相对于静态任务划分的优点是____。确保负载均衡通信开销低实现简单计算复杂度低答案:A31.现代CPU中都具有指令乱序执行功能,其目的不包括____。消除指令依赖,更充分利用多流水线提高cache效率改变计算结果消除资源冲突答案:C32.在共享内存架构编程中,线程间不能通过____进行通信全局变量局部变量静态变量全局堆中变量答案:B33.OpenMP程序和Pthread程序中线程获得自身编号的方式分别是____。两者均为创建线程时传递参数两者均通过特定API前者创建线程时传递参数,后者通过特定API前者通过特定API,后者创建线程时传递参数答案:D34.for(i=0;i<16;i+=1){L=A[i+0]–B[i+0];D=D+abs(L);},此循环____。可完全向量化不可向量化不确定可部分向量化答案:D35.单程序多数据流模式是针对____架构的。SISDSIMDMISDMIMD答案:D36.在使用条件变量时,还需配套使用一个____。互斥量信号量障碍自旋锁答案:A37.全球500强超算在CPU、网络等硬件上越来越体现出采用____的趋势。特殊硬件通用硬件非公开硬件廉价硬件答案:B38.OpenMP中多线程间是一种____关系。主从分组对等竞争答案:A39.SSE是____平台的SIMD架构。x86POWERSPARCARM答案:A40.多个线程进行并行求和,每个线程将自己负责的值依次读入局部变量x,累加到全局变量sum上,sum+=x,对此,下面说法正确的是读取x存在数据依赖,不能并发进行累加顺序被改变,结果是错误的加法操作是简单运算,无需同步加法操作不是原子操作,需要同步保证数据依赖答案:D41.我们不能通过____指定OpenMP循环划分策略。使用编译指示设置环境变量调用库函数采用默认设置答案:C42.以下说法错误的是____。全归约的高效算法基于多对多广播的高效算法全归约高效算法基于一对多广播的高效算法前缀和的高效算法基于多对多广播的高效算法前缀和的高效算法中的通信模式于全归约的高效算法相似答案:B43.编写矩阵乘法的Neon程序,若矩阵元素为双精度浮点数,则应对矩阵乘—加计算的循环进行____路循环展开。24816答案:A44.CUDA的优点不包括____。可移植性入门简单标准的SPMD模式不再需要图形API答案:A45.1)R=XR*1.3;G=XG*1.8;B=XB*1.1;2)R=X[0]*1.3;G=X[1]*1.8;B=X[2]*1.1;这两个程序片段哪个进行向量化效率更高?1)2)不确定以上皆错答案:B46.编写矩阵乘法的AVX程序,若矩阵元素为单精度浮点数,则应对矩阵乘—加计算的循环进行____路循环展开。24816答案:C47.OpenMP编译指示中说明共享变量是用____子句。privatesharedschedulenowait答案:B48.动态任务划分相对于静态任务划分的缺点是____。可能导致负载不均通信开销高任务粒度粗计算复杂度高答案:B49.SSEintrin

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论