奥鹏易百

 找回密码
 立即注册

扫一扫,访问微社区

QQ登录

只需一步,快速开始

帮助中心知识拓展客服QQ 515224986
查看: 349|回复: 0

南开19秋学期(1709、1803、1809、1903、1909)《并行程序设计...

[复制链接]

2万

主题

27

回帖

6万

积分

管理员

积分
60146
发表于 2019-10-7 21:08:25 | 显示全部楼层 |阅读模式
扫码加微信
南开19秋学期(1709、1803、1809、1903、1909)《并行程序设计》在线作业(随机)

(单选题)1:采用多核、众核技术提升CPU性能,相对于单核的优势不包括____。
A:架构设计更容易
B:更易突破物理极限
C:能更充分利用现有资源
D:功耗优势明显
正确答案:
(单选题)2:n个元素排序问题,如果只能通过元素比较交换构造算法,则n个处理器的并行排序算法达到____的运行时间才是代价最优的。
A:O(logn)
B:O(n)
C:O(nlogn)
D:O(n^2)
正确答案:
(单选题)3:一个并行算法是非代价最优的,则____改进为代价最优。
A:减少处理器数量必然能
B:减少处理器数量有可能
C:减少处理器数量也不可能
D:增大处理器数量必然能
正确答案:
(单选题)4:n*n的两个矩阵相乘,问题规模为____。
A:n
B:n^2
C:2n^2
D:n^3
正确答案:
(单选题)5:并行计算还主要用于国防、工程研究等领域,这种说法是____。
A:正确的
B:错误的
正确答案:
(单选题)6:MPI程序中发送和接收消息的两个进程必须____。
A:在同一个网段中
B:连接在同一个路由器上
C:在同一个通信域中
D:以上皆错
正确答案:
(单选题)7:关于ompsingle指令,下面说法错误的是____。
A:线程组中只有一个线程执行代码
B:用于I/O或初始化等任务
C:是保持数据依赖所必须的
D:入口或出口无隐式barrier
正确答案:
(单选题)8:超立方中相邻节点二进制编号____。
A:至少差1位
B:至多差1位
C:恰好差1位
D:差异不固定
正确答案:
(单选题)9:一个SSE寄存器可容纳____个短整型数。
A:2
B:4
C:8
D:16
正确答案:
(单选题)10:在下面问题中,SIMD并行最不适合____。
A:向量加法
B:向量中元素排序
C:矩阵向量乘法
D:矩阵加法
正确答案:
(单选题)11:主线程创建了4个从线程,对它们执行pthread_join,然后打印一条信息,从线程打印各自的线程号,未使用任何同步,则主线程打印的消息和从线程打印的线程号的相对顺序____。
A:必然主线程前、从线程后
B:必然从线程前、主线程后
C:必然相互交织
D:各种顺序皆有可能
正确答案:
(单选题)12:对矩阵乘法进行多线程并行化,对矩阵采用____。
A:简单均匀块划分即可保证负载均衡
B:循环划分才能实现负载均衡
C:动态划分才能实现负载均衡
D:随机划分才能实现负载均衡
正确答案:
(单选题)13:对于向量化,以下说法错误的是____。
A:总会有打包/解包开销
B:若运算对象连续存储,可消除打包开销
C:若运算结果连续存储,可消除解包开销
D:打包/解包开销由数据存储决定
正确答案:
(单选题)14:SSEintrinsics_mm_load_pd命令的功能是____。
A:对齐向量读取单精度浮点数
B:未对齐向量读取单精度浮点数
C:对齐向量读取双精度浮点数
D:未对齐向量读取双精度浮点数
正确答案:
(单选题)15:在128位的SIMD寄存器中,我们不能保存____。
A:16个8位整数
B:8个16位短整型
C:4个32位整型
D:16个字符的字符串
正确答案:
(单选题)16:对于多线程各自进行本地运算,然后由主线程汇总结果的模式,下面说法正确的是____。
A:在同构核心上,线程运行速度一样,主线程无需等待,直接汇总结果即可
B:线程运行速度可能不一致,必须采用同步保证主线程汇总正确结果
C:太多本地运算,不能体现并行效果,不是好的模式
D:主线程汇总结果在性能上必然不如多线程并行汇总结果
正确答案:
(单选题)17:编译器编译OpenMP并行循环时,会自动生成一些代码,其中不包括____。
A:创建和管理线程代码
B:循环划分给线程的代码
C:找出数据依赖的代码
D:线程同步的代码
正确答案:
(单选题)18:OpenMP编译指示的作用范围是____。
A:其后一个语句
B:其后连续语句
C:其后直到函数结束
D:整个函数
正确答案:
(单选题)19:SSE的blend指令的8位二进制整数参数被用做8个掩码imm8[0:7],若imm8[j]=1则表示___。
A:将第一个源寄存器的第j个元素放在目标寄存器位置1
B:将第二个源寄存器的第j个元素放在目标寄存器位置1
C:将第一个源寄存器的第j个元素放在目标寄存器位置j
D:将第二个源寄存器的第j个元素放在目标寄存器位置j
正确答案:
(单选题)20:编写矩阵乘法的Neon程序,若矩阵元素为单精度浮点数,则应对矩阵乘—加计算的循环进行____路循环展开。
A:2
B:4
C:8
D:16
正确答案:
(单选题)21:CUDA共享内存是由____共享。
A:Grid中所有线程
B:一个Block中所有线程
C:一个Warp中所有线程
D:GPU中所有线程
正确答案:
(单选题)22:记并行时间为T,串行时间为T',处理器数量为p,效率为E,则代价最优的定义是____。
A:pT'=T
B:E=Θ(1)
C:E=pT/T'
D:E=T'/pT
正确答案:
(单选题)23:天河1A和天河2号都是主要依靠____获得强大的计算能力。
A:单核CPU
B:多核CPU
C:众核CPU
D:众核协处理器
正确答案:
(单选题)24:在超市的顾客购买商品记录中统计一些商品组合的购买频率,将购买频率(商品组合)划分给不同进程,这是一种划分____的数据并行策略。
A:输入数据
B:中间结果
C:输出数据
D:临时数据
正确答案:
(单选题)25:静态任务划分相对于动态任务划分的优点是____。
A:确保负载均衡
B:任务粒度细
C:计算复杂度低
D:并行效率高
正确答案:
(单选题)26:对一个串行程序进行SIMD并行化,应重点考虑的程序部分是____。
A:声明语句
B:条件分支语句
C:循环语句
D:输入输出语句
正确答案:
(单选题)27:GPU相对于其他众核产品的优势不包括____。
A:平台普及
B:有CUDA这样易学的开发工具
C:性价比高
D:由英伟达公司一家把控
正确答案:
(单选题)28:CUDA寄存器是由____。
A:Grid中所有线程共享
B:一个Block中所有线程共享
C:一个Warp中所有线程共享
D:每个线程独享
正确答案:
(单选题)29:采用搜索分解设计15数码问题的并行算法,不包含下面哪个步骤____。
A:串行生成一定规模的搜索树
B:当前每个叶结点为根的子树搜索分配给一个处理器
C:发现解的处理器通知其他处理器
D:将所有处理器的结果组合成最终解
正确答案:
(单选题)30:关于MPI是什么,以下说法错误的是____。
A:一种消息传递编程模型标准
B:一种共享内存编程模型标准
C:编程角度看是C++/Fortran等的库
D:基于SPMD模型
正确答案:
(单选题)31:OpenMP是___架构下的一种编程工具。
A:SIMD
B:MISD
C:共享内存
D:分布式内存
正确答案:
(单选题)32:求解同一个问题的4个并行算法的等效率函数分析结果如下,其中____的可扩展性最优。
A:Θ(plogp)
B:Θ(p^2)
C:Θ(p^2logp)
D:Θ(p^3)
正确答案:
(单选题)33:OpenMP归约指令采用的是一种____算法。
A:分治
B:贪心
C:动态规划
D:排序
正确答案:
(单选题)34:一个函数是“线程安全的”,其含义是该函数____。
A:多线程执行能抵御网络攻击
B:多线程执行能保护用户隐私数据
C:多线程执行结果也是正确的
D:以上皆错
正确答案:
(单选题)35:for(i=0;i<10;i++)A[i]=A[i]+1;此循环____数据依赖。
A:存在
B:不存在
C:不确定
D:以上皆错
正确答案:
(单选题)36:利用cacheline一次读取多个数据字的机制优化程序访存性能,其机理是____。
A:降低了访存延迟
B:隐藏了访存延迟
C:利用了cache空间局部性
D:利用了cache时间局部性
正确答案:
(单选题)37:OpenMP最常见的编程方式是寻找串行程序中____结构进行并行化。
A:赋值语句
B:循环语句
C:递归
D:输出语句
正确答案:
(单选题)38:CUDA程序中不包括____。
A:host代码
B:device代码
C:kernel
D:图形渲染代码
正确答案:
(单选题)39:OpenMP程序和Pthread程序中线程获得自身编号的方式分别是____。
A:两者均为创建线程时传递参数
B:两者均通过特定API
C:前者创建线程时传递参数,后者通过特定API
D:前者通过特定API,后者创建线程时传递参数
正确答案:
(单选题)40:用GCC编译器编译SSEintrinsics程序,需使用编译选项
A:-march=corei7
B:-g
C:-O
D:-O2
正确答案:
(单选题)41:现代CPU中都具有指令乱序执行功能,其目的不包括____。
A:消除指令依赖,更充分利用多流水线
B:提高cache效率
C:改变计算结果
D:消除资源冲突
正确答案:
(单选题)42:并行计算的新兴应用领域不包括____。
A:制药
B:数字媒体
C:国防
D:游戏
正确答案:
(单选题)43:采用划分子矩阵技术优化矩阵乘法CUDA程序,主要思想是访存更多在____。
A:CPU内存
B:GPU显存
C:GPU共享内存
D:GPU寄存器
正确答案:
(单选题)44:对同一个问题的两个任务依赖图G1和G2,以下哪个条件不能表明G1优于G2____。
A:G1顶点权重之和小于G2
B:G1平均并发度大于G2
C:G1关键路径长度小于G2
D:G1顶点权重之和除以关键路径长度大于G2
正确答案:
(单选题)45:当问题规模不变时,随着处理器数量增大,加速比____。
A:必然增大
B:必然减小
C:必然不变
D:以上皆错
正确答案:
(单选题)46:关于OpenMP程序中的并行结构,以下说法正确的是____。
A:其结束时需程序员人为添加同步
B:其结束时OpenMP已默认添加隐式障碍
C:其结束时完全不需要同步
D:其结束时必须进行同步
正确答案:
(单选题)47:当前并行软件面临的主要挑战不包括____。
A:能耗
B:伸缩性
C:研发周期
D:可靠性
正确答案:
(单选题)48:关于互斥量mutex,下面说法错误的是____。
A:它将保护区域内的运算变成原子操作
B:任何时刻只允许一个线程进入保护区域
C:保险期间,对并发操作都应用互斥量保护
D:互斥量加锁、解锁开销远大于一般运算
正确答案:
(单选题)49:SIMD架构未见于_____中。
A:多媒体扩展
B:图形和游戏处理器
C:计算机集群
D:协处理器
正确答案:
(单选题)50:单精度浮点数矩阵乘法进行AVX并行,期望的加速比为____.
A:等于8
B:小于8
C:4到8之间
D:等于4
正确答案:


奥鹏易百网www.openhelp100.com专业提供网络教育各高校作业资源。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|www.openhelp100.com ( 冀ICP备19026749号-1 )

GMT+8, 2024-5-19 02:07

Powered by openhelp100 X3.5

Copyright © 2001-2024 5u.studio.

快速回复 返回顶部 返回列表