奥鹏易百

 找回密码
 立即注册

扫一扫,访问微社区

QQ登录

只需一步,快速开始

帮助中心知识拓展客服QQ 515224986
查看: 407|回复: 0

南开19秋学期(1709、1803、1809、1903、1909)《并行程序设计》在线作业(随机)

[复制链接]

1万

主题

1

回帖

2万

积分

论坛元老

积分
29028
发表于 2019-9-20 13:15:26 | 显示全部楼层 |阅读模式
扫码加微信
南开大学19秋学期(1709、1803、1809、1903、1909)《并行程序设计》在线作业(100分)
试卷名称19秋学期(1709、1803、1809、1903、1909)《并行程序设计》在线作业0003

南开作业答案
奥鹏南开大学作业
1.n个节点的二维mesh中节点最远通信距离为____。
A.1
B.O(logn)
C.O(sqrt(n))
D.O(n)
答案
2.在SSEintrinsics程序中双精度浮点数数据类型是____。
A.__m128
B.__m128f
C.__m128d
D.__m128i
答案
3.下面矩阵运算中哪个进行简单的数据并行效果不佳____。
A.矩阵求和
B.矩阵相乘
C.矩阵向量相乘
D.高斯消去
答案
4.CPU时钟频率1GHz每个时钟周期两个计算单元可执行4条指令内存延迟125ns进行向量点积运算无cache情况下计算能力为
A.8MFlops
B.125MFlops
C.1GFlops
D.4GFlops
答案
5.对MPI通信中发送方和接受方的类型匹配下面错误的说法是____。
A.均使用相同数据类型
B.均使用MPI_BYTE
C.均使用MPI_PACKED
D.使用相容类型
答案
6.以下哪条不是推动并行计算发展的因素?
A.存储是系统瓶颈
B.单CPU发展已能满足应用需求
C.利用标准硬件构造并行机令升级容易    奥鹏在线作业答案
奥鹏南开大学作业
D.编程环境标准化逐步发展
答案
7.在编写使用n个线程进行n个数求和的OpenMP的程序时采用临界区技术则多线程版本____串行版本。
A.肯定快于
B.肯定慢于
C.可能快于
D.以上皆错
答案
8.对这样的循环for(i=0i100i+=1)A[i+0]=A[i+0]+B[i+0]进行向量化基本技术手段是____。
A.循环划分
B.循环消除
C.循环展开
D.以上皆错
答案
9.静态线程编程模式的优点是____。
A.线程负载均衡
B.线程通信效率高
C.线程管理开销低
D.系统资源利用率高
答案
10.MPI基本原语不包括____。
A.MPI_Barrier
B.MPI_Comm_rank
C.MPI_Comm_size
D.MPI_Init
答案
11.OpenMP是___的一个常见替代。
A.SSE
B.MPI
C.Pthread
D.CUDA
答案
12.循环需满足特定条件才能进行OpenMP并行化下列哪个条件是错误的____。
A.循环变量应为带符号整数
B.终止检测必须是与循环不变量的比较
C.循环变量每步递增/递减一个循环不变量
D.循环体无进/出控制流
答案
13.16步循环4个线程循环01和89、23和1011、45和1213、67和1415分别分配给线程0、1、2、3这是OpenMP的____划分策略。
A.static
B.fixed
C.dynamic
D.guided
答案
14.经典冯诺依曼架构执行一条指令的过程中不包括哪个操作?
A.取指令
B.解码
C.安全性检查
D.执行指令
答案
15.造成超线性加速比的你原因包括____。
A.进程间大量通信
B.并行算法导致额外计算
C.并行计算工作量显著小于串行计算
D.问题求解包含不可并行化部分
答案
16.矩阵每行排序的问题更适合使用MPI的____编程模型。
A.阻塞的
B.非阻塞的
C.对等的
D.主从的
答案
17.SIMD架构未见于_____中。
A.多媒体扩展
B.图形和游戏处理器
C.计算机集群
D.协处理器
答案
18.pthread_rwlock_wrlock是对读写锁进行____操作。
A.加锁
B.解锁
C.加读琐
D.加写锁
答案
19.以下超级计算机中____是SIMD架构。
A.CRAY1
B.天河1A
C.天河2号
D.神威.太湖之光
答案
20.编写矩阵乘法的Neon程序若矩阵元素为双精度浮点数则应对矩阵乘—加计算的循环进行____路循环展开。
A.2
B.4
C.8
D.16
答案
21.CUDA的优点不包括____。
A.可移植性
B.入门简单
C.标准的SPMD模式
D.不再需要图形API
答案
22.OpenMP中多线程间是一种____关系。
A.主从
B.分组
C.对等
D.竞争
答案
23.SSEintrinsics_mm_store_sd命令的功能是____。
A.对齐向量存单精度浮点数
B.未对齐向量存单精度浮点数
C.对齐标量存双精度浮点数
D.未对齐标量存双精度浮点数
答案
24.并行算法的额外开销不包括____。
A.进程间通信
B.进程等待I/O
C.进程空闲
D.额外计算
答案
25.对于搜索分解下面哪个说法是错误的_____。
A.所有子树搜索任务都必须全部完成
B.工作量可能大于串行计算
C.工作量可能小于串行计算
D.可能产生超线性加速比
答案
26.编写矩阵乘法的SSE程序若矩阵元素为双精度浮点数则应对矩阵乘—加计算的循环进行____路循环展开。
A.2
B.4
C.8
D.16
答案
27.对矩阵乘法串行程序的主体三重循环我们选择最内层循环进行向量化的原因是____。
A.它最后执行
B.外层循环中没有计算操作
C.是随意选择的
D.它的连续循环步是对不同元素进行相同运算
答案
28.每个SSE寄存器宽度为____位。
A.32
B.64
C.128
D.256
答案
29.AVX是____平台的SIMD架构。
A.x86
B.POWER
C.SPARC
D.ARM
答案
30.主线程创建了4个从线程然后打印一条信息从线程打印各自的线程号未使用任何同步则主线程打印的消息和从线程打印的线程号的相对顺序____。
A.必然主线程前、从线程后
B.必然从线程前、主线程后
C.必然相互交织
D.各种顺序皆有可能
答案
31.在使用互斥量之前必须对其进行____。
A.初始化
B.加锁
C.解锁
D.销毁
答案
32.Neon是____平台的SIMD架构。
A.x86
B.POWER
C.SPARC
D.ARM
答案
33.对于效率E下面描述错误的是____。
A.理想并行E=1
B.总是在0~1之间
C.可能1
D.可能随着处理器数量增大趋向于0
答案
34.OpenMP的缺点不包括____。
A.常见并行结构的表达并不总可行
B.局部性处理不易
C.不易编写多核单核通用程序
D.性能控制不易
答案
35.____执行pthread_sem_wait操作线程进入阻塞状态。
A.当信号量已加锁时
B.当信号量为0时
C.当信号量已超过阈值时
D.当信号量已销毁时
答案
36.对矩阵乘法进行多线程并行化对矩阵采用____。
A.简单均匀块划分即可保证负载均衡
B.循环划分才能实现负载均衡
C.动态划分才能实现负载均衡
D.随机划分才能实现负载均衡
答案
37.对天气预报问题将大气层划分为5*10^8个网格单元每个时间步每个网格需200个浮点运算时间间隔设置为10分钟计算10天内大气运动100MFlops计算能力的计算机需要多少天?
A.1
B.10
C.100
D.300
答案
38.当处理器数量不变时随着问题规模增大效率增大对____成立。
A.部分并行算法
B.所有并行算法
C.所有并行算法都不
D.以上皆错
答案
39.将起泡排序程序改写为奇偶转置排序关于其两层循环是否存在数据依赖下面说法正确的是____。
A.外层存在,内层不存在
B.外层不存在,内层存在
C.两层都不存在
D.两层都存在
答案
40.动态任务划分相对于静态任务划分的优点是____。
A.确保负载均衡
B.通信开销低
C.实现简单
D.计算复杂度低
答案
41.将t个线程的局部结果汇总可采用递归分解并行进行即两两汇总中间结果继续两两汇总直到剩下唯一的最终结果其时间复杂度为____。
A.Θ(1)
B.Θ(logt)
C.Θ(t)
D.Θ(tlogt)
答案
42.pthread_sem_post是对信号量进行____操作。
A.加锁
B.解锁
C.加1
D.减1
答案
43.新一代GPU重点提供的新特性不包括____。
A.新型高速显存
B.GPU间直接高速互联
C.自动并行化
D.人工智能计算专门优化
答案
44.n个处理器、n个内存模块的交叉开关构造成本为____。
A.O(logn)
B.O(n)
C.O(nlogn)
D.O(n^2)
答案
45.OpenMP编译指示中说明共享变量是用____子句。
A.private
B.shared
C.schedule
D.nowait
答案
46.SSEintrinsics_mm_load_ps命令的功能是____。
A.对齐向量读取单精度浮点数
B.未对齐向量读取单精度浮点数
C.对齐向量读取双精度浮点数
D.未对齐向量读取双精度浮点数
答案
47.对单精度浮点数矩阵乘法程序进行SSE并行化预期加速比为____。
A.等于8
B.4到8之间
C.等于4
D.小于4
答案
48.SSEintrinsics_mm_load_pd命令的功能是____。
A.对齐向量读取单精度浮点数
B.未对齐向量读取单精度浮点数
C.对齐向量读取双精度浮点数
D.未对齐向量读取双精度浮点数
答案
49.OpenMP不能实现的是____。
A.负责创建和管理线程
B.隐藏栈管理
C.提供同步机制
D.自动并行化
答案
50.在应用中____的情况下读写锁相对于互斥量的性能优势更明显。
A.读写操作较为平均
B.读操作远远多于写操作
C.写操作远远多于读操作
D.以上皆错
答案

奥鹏作业答案
奥鹏南开大学作业
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|www.openhelp100.com ( 冀ICP备19026749号-1 )

GMT+8, 2024-5-20 16:27

Powered by openhelp100 X3.5

Copyright © 2001-2024 5u.studio.

快速回复 返回顶部 返回列表