习题作业-第十二章 并行程序设计基础
- 格式:pdf
- 大小:96.96 KB
- 文档页数:2
2021《并行程序设计》在线作业附满分答案试卷总分:100 得分:100一、单选题 (共 50 道试题,共 100 分)1.在SSE intrinsics程序中双精度浮点数数据类型是____。
A.__m128B.__m128fC.__m128dD.__m128i答案:C2.SIMD架构未见于_____中。
A.多媒体扩展B.图形和游戏处理器C.计算机集群D.协处理器答案:C3.关于omp single指令,下面说法错误的是____。
A.线程组中只有一个线程执行代码B.用于I/O或初始化等任务C.是保持数据依赖所必须的D.入口或出口无隐式barrier答案:C4.数据依赖是指必须保持两个内存操作的____才能保证程序结果正确。
A.大小B.时序C.时长D.cache局部性答案:B更多学期服务+ V boge306195.为了实现向量计算,SIMD架构还需提供____。
A.更大的内存容量B.更快的内存传输C.更宽的寄存器D.更快的网络传输答案:C6.SSE intrinsics _mm_add_ps命令的功能是____。
A.寄存器间单精度浮点数向量加法B.寄存器间双精度浮点数向量加法C.寄存器内单精度浮点数加法D.寄存器内双精度浮点数加法答案:A7.一个函数是“线程安全的”,其含义是该函数____。
A.多线程执行能抵御网络攻击B.多线程执行能保护用户隐私数据C.多线程执行结果也是正确的D.以上皆错答案:C8.SPMD是为了简化____体系结构下的编程而提出的一种机制。
A.SISDB.SIMDC.MISDD.MIMD答案:D9.静态线程编程模式的优点是____。
A.线程负载均衡B.线程通信效率高C.线程管理开销低D.系统资源利用率高答案:C10.华尔街是世界上超级计算机最密集的区域之一,原因是____。
A.金融巨头支付得起B.与超算制造商有良好合作C.海量交易需要很高安全性D.海量交易处理需要并行计算答案:D11.矩阵每行排序的问题更适合使用MPI的____编程模型。
第1章C语言程序设计概述1.1一个C程序的执行是从 A 。
A.从main()函数开始,直到main()函数结束B.第一个函数开始,直到最后一个函数结束C.第一个语句开始,直到最后一个语句结束D.main()函数开始,直到最后一个函数结束1.2在C程序中,main()的位置 C 。
A.必须作为第一个函数B.必须作为最后一个函数C.可以任意D.必须放在它所调用的函数之后1.3C语言源程序的基本单位是 B 。
A.过程 B.函数 C.子程序 D.标识符1.4一个C源程序有且仅有一个一个函数和__零个或多个_____个其他函数。
1.5C语言源程序的语句分隔符是__分号___。
1.6C语言开发的四个步骤是_编辑源程序→对源程序进行编译→与库函数连接→运行目标程序__ 。
1.7C语言有哪些主要特点?C主要特点有:1.C语言简洁、紧凑,使用方便、灵活;2.运算符丰富;3.数据类型丰富;4.C语言是结构化语言;5.语法限制不太严格,程序设计自由度大;6.可直接与机器硬件打交道,直接访问内存地址;7.生成的目标代码质量高,程序执行效率高;8.C语言适用范围广,可移植性好。
1.8简述C编译和运行的基本方法。
略。
1.9常用的集成开发工具有哪些?各有什么特点?略。
1.10编写一个程序,在屏幕上输出以下内容:**************************** You are welcome! ****************************#include<stdio.h>void main( ) /*主函数 */{ /*函数体开始*/printf ("***************************\n"); /*输出语句*/printf ("* You are welcome! *\n");printf ("***************************\n");}1.11 编写一个C程序,输入a、b、c 3个值,输出其中最大者。
第十二章 并行程序设计基础习题例题:1、假定有n 个进程P(0),P(1),…,P(n -1),数组元素][i a 开始时被分配给进程P(i )。
试写出求归约和]1[]1[]0[-+++n a a a 的代码段,并以8=n 示例之。
2、假定某公司在银行中有三个账户X 、Y 和Z ,它们可以由公司的任何雇员随意访问。
雇员们对银行的存、取和转帐等事务处理的代码段可描述如下:/*从账户X 支取¥100元*/atomic {if (balance[X] > 100) balance[X] = balance[X]-100; }/*从账户Y 存入¥100元*/atomic {balance[Y] = balance[Y]-100;}/*从账户X 中转¥100元到帐号Z*/atomic {if (balance[X] > 100){balance[X] = balance[X]-100;balance[Z] = balance[Z]+100;} }其中,atomic {}为子原子操作。
试解释为什么雇员们在任何时候(同时)支、取、转帐时,这些事务操作总是安全有效的。
3、考虑如下使用lock 和unlock 的并行代码:parfor (i = 0;i < n ;i++){noncritical sectionlock(S);critical sectionunlock(S);}假定非临界区操作取T ncs时间,临界区操作取T cs时间,加锁取t lock时间,而去锁时间可忽略。
则相应的串行程序需n( T ncs + T cs )时间。
试问:①总的并行执行时间是多少?②使用n个处理器时加速多大?③你能忽略开销吗?4、计算两整数数组之内积的串行代码如下:Sum = 0;for(i = 0;i < N;i++)Sum = Sum + A[i]*B[i];试用①相并行;②分治并行;③流水线并行;④主-从行并行;⑤工作池并行等五种并行编程风范,写出如上计算内积的并行代码段。
1.SSE intrinsics_mm_store_ps命令的功能是()。
A.对齐向量存单精度浮点数B.未对齐向量存单精度浮点数C.对齐标量存单精度浮点数D.未对齐标量存单精度浮点数答案:A2.for (i=0;i<16;i+=1){L=A[i+0]-B[i+0];D=D+abs(L);},此循环()。
A.可完全向量化B.不可向量化C.不确定D.可部分向量化答案:D3.对这样的循环for(i=0;i<100;i+=1) A[i+0]=A[i+0]+B[i+0]; 进行向量化,基本技术手段是()。
A.循环划分B.循环消除C.循环展开D.以上皆错答案:C4.MMX有()个专用寄存器。
A.4B.8C.16D.32答案:B5.编译器编译OpenMP并行循环时,会自动生成一些代码,其中不包括()。
A.创建和管理线程代码B.循环划分给线程的代码C.找出数据依赖的代码D.线程同步的代码答案:C6.创建线程时,我们通过()将线程号分别传递给每个线程。
A.全局变量B.局部变量C.动态分配变量D.pthread_create的“线程函数参数”参数答案:D7.下列哪项不是这门课程的目标?()A.学会肯定能优化程序性能的方法B.学会用并行思维思考问题C.学会常用的并行编程工具D.理解软件到并行架构的映射答案:A8.编写n个数求和的OpenMP程序,最高效的方法是()。
A.多线程直接并发累加到共享变量B.将累加操作设置为临界区C.在累加操作前设置障碍D.采用归约指令答案:D9.静态线程编程模式的缺点是()。
A.线程管理开销高B.系统资源利用率低C.线程负载不均D.线程通信开销高答案:B10.采用MPI主从模型解决矩阵每行排序问题,主进程每次向一个从进程发送10行作为一个任务相对于每次发送1行的优点是()。
A.更有利于负载均衡B.减少了通信开销C.降低了计算次数D.减少了从进程空闲答案:B11.MPI收发各一条消息的API是()。
计算机编程并行程序设计基础知识了解并行程序设计的模型和工具计算机编程并行程序设计基础知识:了解并行程序设计的模型和工具计算机编程中的并行程序设计是一种重要的技术,通过同时执行多个任务来提高程序的性能和效率。
在现代计算机系统中,利用多核处理器和分布式计算等并行计算技术,可以更好地利用计算资源,实现更高效的程序运行。
本文将介绍并行程序设计的基础知识,包括并行计算模型和常用的并行程序设计工具。
通过了解这些知识,读者可以更好地理解并行计算的概念和原理,为编写高效的并行程序打下基础。
1. 并行计算模型在并行程序设计中,有几种常用的并行计算模型,包括共享内存模型、分布式内存模型和混合内存模型。
1.1 共享内存模型共享内存模型是一种采用共享内存的方式进行并行计算的模型。
在这个模型中,多个处理器可以同时访问同一个共享内存空间,从而实现数据共享和通信。
1.2 分布式内存模型分布式内存模型是一种采用分布式内存的方式进行并行计算的模型。
在这个模型中,每个处理器都有自己的独立内存空间,通过消息传递的方式进行数据通信和同步。
1.3 混合内存模型混合内存模型是一种将共享内存和分布式内存相结合的并行计算模型。
在这个模型中,多个处理器可以访问共享内存,并通过消息传递的方式进行通信和同步。
2. 并行程序设计工具为了方便开发者进行并行程序设计,有一些常用的并行程序设计工具可供使用。
下面介绍几种常见的工具。
2.1 OpenMP(开放多处理器)OpenMP是一种基于共享内存模型的并行程序设计工具,它可以通过在源代码中插入指令来实现并行计算。
通过使用OpenMP,开发者可以简单地将串行程序转换为并行程序,并利用多核处理器的性能优势。
2.2 MPI(消息传递接口)MPI是一种基于消息传递模型的并行程序设计工具,它可以在分布式内存系统中实现多个处理器之间的通信和同步。
通过使用MPI,开发者可以将任务分配给不同的处理器,并通过消息传递进行数据交换和协调。
并行程序设计1.引言本文档旨在提供一个详尽的指导,帮助开发人员设计和实现高效的并行程序。
文档将介绍并行计算的基本概念、技术和工具,并提供实例和最佳实践的指导。
2.并行计算基础知识2.1 并行计算概述介绍并行计算的基本概念、原理和优势。
2.2 并行计算模型介绍多种并行计算模型,如共享内存、分布式内存和混合模型。
2.3 并行计算架构介绍常见的并行计算架构,如对称多处理器(SMP)、多核处理器和集群系统。
3.并行程序设计基础3.1 并行程序设计思想介绍并行程序设计的思维方式和常见问题。
3.2 并行算法设计介绍并行算法设计的关键考虑因素和策略。
3.3 数据通信和同步介绍并行程序中的数据通信和同步机制,如消息传递和互斥量。
4.并行编程模型4.1 共享内存编程模型介绍基于共享内存的并行编程模型,如OpenMP。
4.2 分布式内存编程模型介绍基于分布式内存的并行编程模型,如MPI。
4.3 图模型编程介绍图模型编程的基本原理和常用框架,如Apache Hadoop和Spark。
5.性能优化和调试工具5.1 并行程序性能优化介绍常见的并行程序性能优化技术,如负载均衡和数据局部性优化。
5.2 并行程序调试工具介绍常用的并行程序调试工具,如GDB和总线分析器。
6.安全性和可靠性6.1 并行计算安全性介绍并行计算中的安全性问题,如访问控制和数据完整性。
6.2 并行计算可靠性介绍并行计算中的可靠性问题,如容错和故障恢复。
7.附件本文档涉及的附件包括示例代码和相关文献。
8.法律名词及注释在本文档中,涉及的法律名词及其注释如下:- 法律名词1:注释1- 法律名词2:注释2- 法律名词3:注释3。
2022年南开大学《并行程序设计》在线作业-00001对于效率E,下面描述错误的是____。
A:理想并行E=1B:总是在0~1之间C:可能>1D:可能随着处理器数量增大趋向于0正确选择:BOpenMP相对于Pthread的优点是____。
A:功能更强大B:可达更高并发度C:可降低通信开销D:由编译器生成线程创建和管理代码,更简单正确选择:Dpthread_join的作用是____。
A:强制终止指定线程B:检测指定线程是否结束C:等待指定线程结束才返回D:向指定线程发送数据正确选择:C在使用条件变量之后必须对其进行____。
A:初始化B:加锁C:解锁D:销毁正确选择:D在SSE intrinsics程序中整数数据类型是____。
A:__m128B:__m128fC:__m128dD:__m128i正确选择:D控制流语句进行SIMD并行化很困难的原因是控制流语句导致____。
A:连续数据执行不同指令B:连续数据执行相同指令C:同一数据执行不同指令D:同一数据执行相同指令正确选择:ACUDA共享内存是由____共享。
A:Grid中所有线程B:一个Block中所有线程C:一个Warp中所有线程D:GPU中所有线程正确选择:B在使用条件变量之前必须对其进行____。
A:初始化B:加锁C:解锁D:销毁正确选择:A在SSE intrinsics程序中单精度浮点数数据类型是____。
A:__m128B:__m128fC:__m128dD:__m128i正确选择:A和一对多广播对应的组通信操作是____。
A:多对一收集B:多对多收集C:多对一归约D:多对多归约正确选择:C竞争条件是指程序执行过程中两个或多个事件的____影响执行结果。
A:时序B:时长C:结果D:运算对象正确选择:A下面矩阵运算中,哪个进行简单的数据并行效果不佳____。
A:矩阵求和B:矩阵相乘C:矩阵向量相乘D:高斯消去正确选择:DCPU cache大小为32KB,如希望(单精度浮点数)矩阵乘法计算过程中所有数据都驻留cache中,则矩阵大小最大为A:16*16B:32*32C:64*64D:128*128正确选择:C关于MPI_recv对消息的区分,下列说法正确的是____。
一、单项选择题(每小题2分,共20分)第一章D 1.下列说法中错误的是()。
A、程序的执行总是从主函数开始B、主函数可以调用任何非主函数的其它函数C、任何非主函数可以调用其它任何非主函数D、程序可以从任何非主函数开始执行C 2.若a=4,b=7,则输出4*7=28的语句是()。
A、printf(“a*b=%d\n”a+b);B、 printf(“a*b=%d\n”,a*b);C、printf(“%d*%d=%d\n”,a,b,a*b);D、 printf(“%d*%d=%d\n”,a+b);第三章C 1. C语言中int型数据占2个字节,则long型数据占(C )个字节。
A、1B、2C、4D、8D 2.若C中int型数据占2个字节,则double型数据占(D )个字节。
A、1B、2C、4D、8B 3.若a为整型变数,则以下语句(B )。
a=-2L;printf(“%d\n”,a);A、赋值不合法B、输出-2C、输出不确定值D、输出2D 4. 若int型数据占2个字节,则下列语句的输出为(D )。
int k=-1;printf(“%d,%u\n”,k,k);A、-1,-1B、-1,32767C、-1,32768D、-1,65535B 5. 下列程序的输出是(B )。
#include<stdio.h>main(){printf(“%d\n”,null);}A、0B、变量无定义C、-1D、1C 6.若x为float型变数,则以下语句:x=223.82748;printf("%6.2f\n",x);运行结果为(C )。
A、223.8B、223.82C、223.83D、223.827D 7. 设有语句int a=3;则执行语句a+=a-=a*a后,变量a 的值是(D )。
A、3B、0C、9D、-12第四章A 1. 执行语句:a=5,b=8;printf(“%d\n”,c=a/b); 后输出的值为(A )。
1.两个矩阵相乘,若矩阵规模大于 cache 大小,则优化访存的可行方法是____。
A.先将两个矩阵读入 cache 再进行乘法B.先转置第一个矩阵再进行乘法 C.先转置第二个矩阵再进行乘法 D.以上皆错【参考答案】: C2.若 SIMD 并行化时遇到对齐问题,下列说法正确的是____。
A.只能使用不对齐访存指令B.不能进行 SIMD 并行化C.对齐开消可能完全抵消 SIMD 并行收益D.以上皆错【参考答案】: C3.OpenMP 不能实现的是____。
A.负责创建和管理线程B.隐藏栈管理C.提供同步机制D. 自动并行化【参考答案】: D4.MPI_Send 和 MPI_recv 是通过____区分消息。
A.端口号B.消息名C.消息标签D.消息哈希【参考答案】: C5.为了充分利用 CPU 内的多条流水线,程序应满足____。
A.相邻指令无依赖性B.相邻指令相互依赖C.整段程序中指令无依赖性 D.整段程序中指令相互依赖【参考答案】: A6.使用____无法直接实现“主线程等待 4 个从线程完成任务”。
A.1 个信号量B.障碍C.1 个互斥量D.4 个互斥量【参考答案】: C7.主线程创建了 4 个从线程,对它们执行 pthread_join,然后打印一条信息,从线程打印各自的线程号,未使用任何同步,则主线程打印的消息和从线程打印的线程号的相对顺序____。
A.必然主线程前、从线程后B.必然从线程前、主线程后C.必然相互交织D.各种顺序皆有可能【参考答案】: B8.对下面程序,说法正确的是 # pragma omp parallel for num_threads (thread_count) reduction(+:sum) for (k = 1; k <= n; k++) { sum += factor/(2*k-1); factor = -factor; }A.破坏了数据依赖B.未破坏数据依赖C.取决于变量声明D.比临界区方式性能差【参考答案】: A9.以下超级计算机中,____不是 SIMD 架构。