南开大学21秋《并行程序设计》在线作业一答案参考45

资源描述

南开大学21秋并行程序设计在线作业一答案参考1. OpenMP并行模型是一种_模式。OpenMP并行模型是一种_模式。A.SISDB.SIMDC.MISDD.SPMD参考答案：D2. 在下列应用中，SIMD最不适合_。A.图像处理B.音频处理C.科学计算D.数据库查询参考答案：D3. 在使用信号量之前必须对其进行_。在使用信号量之前必须对其进行_。A.初始化B.加锁C.加1D.销毁参考答案：A4. OpenMP主要是通过( )来更高层抽象的多线程编程。A.设计实现新的语言B.为现有语言提供大量库函数C.为现有语言扩展编译指示D.新编译器实现自动并行化参考答案：C5. 指定线程间划分循环策略的OpenMP子句是_。A.sharedB.reductionC.scheduleD.nowait参考答案：C6. 记并行时间为T，串行时间为T&39;，处理器数量为p，并行代价的定义是_。记并行时间为T，串行时间为T，处理器数量为p，并行代价的定义是_。A.pTB.T+TC.p(T-T)D.pT-T参考答案：A7. OpenMP不能实现的是( )。A.负责创建和管理线程B.隐藏栈管理C.提供同步机制D.自动并行化参考答案：D8. 在下面问题中，SIMD并行更适合( )。A.搜索B.排序C.矩阵乘法D.构建二叉排序树参考答案：C9. 采用划分子矩阵方法实现矩阵乘法，在进行SSE并行化时，是对(由外至内数)第_层循环进行循环展开然后向量化。采用划分子矩阵方法实现矩阵乘法，在进行SSE并行化时，是对(由外至内数)第_层循环进行循环展开然后向量化。A.3B.4C.5D.6参考答案：D10. 记并行时间为T，串行时间为T&39;，处理器数量为p，并行效率E的定义是_。记并行时间为T，串行时间为T，处理器数量为p，并行效率E的定义是_。A.T-TB.T/TC.T/pTD.pT-T参考答案：C11. 每个MMX寄存器宽度为_位。每个MMX寄存器宽度为_位。A.32B.64C.128D.256参考答案：B12. 全球500强超算在CPU、网络等硬件上越来越体现出采用( )的趋势。A.特殊硬件B.通用硬件C.非公开硬件D.廉价硬件参考答案：B13. 四位助教帮助教授批改300份试卷，试卷共16道题，每位助教负责批改所有试卷的4道题，这是一种_任务划分方法。四位助教帮助教授批改300份试卷，试卷共16道题，每位助教负责批改所有试卷的4道题，这是一种_任务划分方法。A.数据并行B.任务并行C.搜索并行D.预测并行参考答案：B14. 创建线程时，我们通过( )将线程号分别传递给每个线程。A.全局变量B.局部变量C.动态分配变量D.pthread_create的“线程函数参数”参数参考答案：D15. 两个矩阵相乘，将矩阵划分为固定大小的子矩阵，变元素运算为子矩阵运算，是使用利用数据访问的_达到更高的cache命中率。A.时间局部性B.空间局部性C.计算局部性D.混合局部性参考答案：A16. OpenMP不会自动地在_位置设置barrier。A.并行结构开始B.并行结构结束C.其他控制结构开始D.其他控制结构结束参考答案：C17. 以下超级计算机中，( )不是SIMD架构。A.CDCSTAR-100B.757C.银河D.天河1号参考答案：D18. 在编写使用n个线程进行n个数求和的OpenMP的程序时采用临界区技术，则多线程版本_串行版本。A.肯定快于B.肯定慢于C.可能快于D.以上皆错参考答案：B19. 采用划分子矩阵技术优化矩阵乘法CUDA程序，子矩阵数组变量声明应加_前缀。采用划分子矩阵技术优化矩阵乘法CUDA程序，子矩阵数组变量声明应加_前缀。A._global_B._device_C._shared_D._private_参考答案：C20. SSE intrinsics_mm_store_sd命令的功能是( )。A.对齐向量存单精度浮点数B.未对齐向量存单精度浮点数C.对齐标量存双精度浮点数D.未对齐标量存双精度浮点数参考答案：C21. Flynn分类法中，下面哪种体系结构在实际中几乎没有意义?( )A.SISDB.SIMDC.MISDD.MIMD参考答案：C22. 在使用条件变量之后必须对其进行_。在使用条件变量之后必须对其进行_。A.初始化B.加锁C.解锁D.销毁参考答案：D23. SSE intrinsics _mm_store_ss命令的功能是_。A.对齐向量存单精度浮点数B.未对齐向量存双精度浮点数C.对齐标量存单精度浮点数D.未对齐标量存双精度浮点数参考答案：C24. 将寄存器设置为4个给定单精度浮点数的SSE intrinsics指令是_。A._mm_set_psB._mm_set1_ssC._mm_setzero_ssD._mm_setzero_ps参考答案：A25. OpenMP编译指示是以( )开头的。A.“#include”B.“#ifdef”C.“#pragam”D.“#else”参考答案：C26. SSE intrinsics_mm_load_ss命令的功能是( )。A.对齐向量读取单精度浮点数B.未对齐向量读取单精度浮点数C.对齐标量读取单精度浮点数D.未对齐标量读取单精度浮点数参考答案：C27. 对于向线程函数传递参数，下列说法错误的是_。A.线程函数并非用户程序调用，因此无法直接传递B.线程函数必须接受void *参数，因此只能传递大小不超过指针的数据对象C.线程通常通过此途径获取线程号D.不同线程间的参数传递相互无关，即使它们具有相同的线程函数参考答案：B28. 第一款桌面多核CPU是( )发布的。A.IntelB.AMDC.IBMD.SUN参考答案：A29. MMX有_个专用寄存器。MMX有_个专用寄存器。A.4B.8C.16D.32参考答案：B30. 对于科学仿真并行计算的一般方法，哪个步骤的描述是错误的?对于科学仿真并行计算的一般方法，哪个步骤的描述是错误的?A.将空间离散化为网格B.在网络上进行局部计算C.局部计算结果完全独立D.重复若干时间步参考答案：C31. 将起泡排序程序改写为奇偶转置排序，关于其两层循环是否存在数据依赖，下面说法正确的是( )。A.外层存在，内层不存在B.外层不存在，内层存在C.两层都不存在D.两层都存在参考答案：A32. 对双精度浮点计算，AVX最高实现( )路并行。A.2B.4C.8D.16参考答案：B33. 下面哪种架构最适合数据并行?( )A.SISDB.SIMDC.MISDD.MIMD参考答案：B34. 每个AVX寄存器宽度为_位。每个AVX寄存器宽度为_位。A.32B.64C.128D.256参考答案：D35. OpenMP不会自动地在_位置设置barrier。OpenMP不会自动地在_位置设置barrier。A.并行结构开始B.并行结构结束C.其他控制结构开始D.其他控制结构结束参考答案：C36. 多个线程进行并行求和，每个线程将自己负责的值依次读入局部变量x，累加到全局变量sum上，sum+=x，对此，下面说法正确的是( )多个线程进行并行求和，每个线程将自己负责的值依次读入局部变量x，累加到全局变量sum上，sum+=x，对此，下面说法正确的是( )A.读取x存在数据依赖，不能并发进行B.累加顺序被改变，结果是错误的C.加法操作是简单运算，无需同步D.加法操作不是原子操作，需要同步保证数据依赖参考答案：D37. n个节点的超立方构造成本为( )。A.OlognB.OsqrtnC.OnD.Onlogn参考答案：D38. _执行pthread_sem_post操作，当前线程会唤醒阻塞线程。_执行pthread_sem_post操作，当前线程会唤醒阻塞线程。A.当信号量已加锁时B.当信号量为0时C.当信号量已超过阈值时D.当信号量已销毁时参考答案：B39. 在SSE intrinsics程序中双精度浮点数数据类型是_。在SSE intrinsics程序中双精度浮点数数据类型是_。A._m128B._m128fC._m128dD._m128i参考答案：C40. n个数求和的问题，使用n个处理器的并行算法达到了logn的运行时间，则算法( )。A.肯定不是代价最优B.肯定是代价最优C.不确定是否代价最优D.以上皆错参考答案：A41. 对矩阵每行排序的程序进行多线程并行化，对矩阵采用_。A.简单均匀块划分即可保证负载均衡B.循环划分才能实现负载均衡C.动态划分才能实现负载均衡D.随机划分才能实现负载均衡参考答案：C42. 对于多线程各自进行本地运算，然后由主线程汇总结果的模式，下面说法正确的是( )。A.在同构核心上，线程运行速度一样，主线程无需等待，直接汇总结果即可B.线程运行速度可能不一致，必须采用同步保证主线程汇总正确结果C.太多本地运算，不能体现并行效果，不是好的模式D.主线程汇总结果在性能上必然不如多线程并行汇总结果参考答案：B43. 在条件不成立时，使用pthread_cond_wait_。在条件不成立时，使用pthread_cond_wait_。A.令线程阻塞B.解锁互斥量C.解锁互斥量然后令线程阻塞D.加锁互斥量参考答案：C44. 下列指令集中( )不是SIMD指令集。A.SSEB.NeonC.AVXD.EMT64参考答案：D45. 单精度浮点数矩阵乘法进行AVX并行，期望的加速比为_.单精度浮点数矩阵乘法进行AVX并行，期望的加速比为_.A.等于8B.小于8C.4到8之间D.等于4参考答案：B46. AVX是( )平台的SIMD架构。A.x86B.POWERC.SPARCD.ARM参考答案：A47. MPI默认点对点通信模式是( )。A.阻塞的B.非阻塞的C.对等的D.主从的参考答案：A48. 使用_无法直接实现“主线程等待4个从线程完成任务”。A.1个信号量B.障碍C.1个互斥量D.4个互斥量参考答案：C49. SSE寄存器A中元素为A1 A2 A3 A4(均为由低到高)，则执行C=shuffle(A, A, 0x1B)后，C中元素为( )SSE寄存器A中元素为A1 A2 A3 A4(均为由低到高)，则执行C=shuffle(A, A, 0x1B)后，C中元素为( )A.A1 A2 A3 A4B.A2 A1 A4 A3C.A3 A4 A1 A2D.A4 A3 A2 A1参考答案：D50. CUDA的优点不包括_。CUDA的优点不包括_。A.可移植性B.入门简单C.标准的SPMD模式D.不再需要图形API参考答案：A51. OpenMP循环并行指令是_。OpenMP循环并行指令是_。A.omp parallelB.omp singleC.omp parallel forD.omp master参考答案：C52. SSE intrinsics _mm_load_pd命令的功能是_。SSE intrinsics _mm_load_pd命令的功能是_。A.对齐向量读取单精度浮点数B.未对齐向量读取单精度浮点数C.对齐向量读取双精度浮点数D.未对齐向量读取双精度浮点数参考答案：C53. SIMD并行模式是将多个_运算打包并发执行。A.不同B.相同C.混合D.依赖参考答案：B54. 在下面问题中，SIMD并行最不适合( )。A.向量加法B.向量中元素排序C.矩阵向量乘法D.矩阵加法参考答案：B55. 关于消息传递编程的特点，以下说法正确的是( )。A.与共享内存一样有竞争条件B.编程简单C.需程序员考虑局部性D.无需考虑进程间通信参考答案：C56. 超立方中相邻节点二进制编号_。A.至少差1位B.至多差1位C.恰好差1位D.差异不固定参考答案：C57. 华尔街是世界上超级计算机最密集的区域之一，原因是( )。A.金融巨头支付得起B.与超算制造商有良好合作C.海量交易需要很高安全性D.海量交易处理需要并行计算参考答案：D58. 以下哪条不是推动并行计算发展的因素?( )以下哪条不是推动并行计算发展的因素?( )A.存储是系统瓶颈B.单CPU发展已能满足应用需求C.利用标准硬件构造并行机令升级容易D.编程环境标准化逐步发展参考答案：B59. 在SSE intrinsics程序中双精度浮点数数据类型是( )。A._m128B._m128fC._m128dD._m128i参考答案：C60. 编写矩阵乘法的Neon程序，若矩阵元素为单精度浮点数，则应对矩阵乘加计算的循环进行_路循环展开。编写矩阵乘法的Neon程序，若矩阵元素为单精度浮点数，则应对矩阵乘加计算的循环进行_路循环展开。A.2B.4C.8D.16参考答案：B

展开阅读全文

南开大学21秋《并行程序设计》在线作业一答案参考45

最新文档