华南理工大学《高性能计算与云计算》复习资料
- 格式:pdf
- 大小:3.61 MB
- 文档页数:27
高性能计算(并行计算)复习提纲第一章并行计算机系统及其结构模型1.了解并行计算机系统互联网络及其分类不同带宽与距离的互连技术: 总线、SAN、LAN、MAN、WAN 1,静态互联网络:是指处理单元之间有着固定连接的一类网络,在程序执行期间,这种点到点的连接不变。
典型的静态网络有一维线性阵列、二维网孔、树连接、超立方网络、立方环、洗牌交换网、蝶形网络等。
2,动态互联网络:是用开关单元构成的,可按应用程序的要求动态的改变连接组态。
典型的动态网络包括总线、交叉开关和多级互连网络等,3,标准互联网络2.并行计算机系统结构,参见图1.20(P23)五种结构,要求理解这几种结构的硬件组成及工作方式。
2,并行计算机系统结构:行向量处理机pvp :硬件:向量处理机vp、共享存储器SM。
工作方式:高带宽的交叉开关网络将vp连向共享存储模块,存储器可以以兆字节每秒的速度想处理器提供数据。
通常使用向量寄存器和指令缓冲器。
对称多处理机SMP:硬件:商品微处理器(具有片上或外设高速缓存)、共享存储器、I/O设备。
工作方式:微处理器由总线或交叉开关连向共享存储器。
每个处理器可同等的访问共享存储器、I/O设备和操作系统服务。
MPP一般是指超大型计算机系统,它具有如下特性:①处理节点采用商品微处理器;②系统中有物理上的分布式存储器;③采用高通信带宽和低延迟的互连网络;④能扩放至成百上千乃至上万个处理器;⑤它是一种异步的MIMD机器,程序系由多个进程组成,每个都有其私有地址空间,进程间采用传递消息相互作用DSM分布式共享存储多处理机高速缓存目录DIR用以支持分布高速缓存的一致性。
DSM和SMP的主要差别是,DSM在物理上有分布在各节点中的局存从而形成了一个共享的存储器。
对用户而言,系统硬件和软件提供了一个单地址的编程空间.COW工作站机群机群往往是低成本的变形的MPP。
COW的重要界线和特征是:①每个节点都是一个完整的工作站(不包括监视器、键盘、鼠标等),一个节点也可以是一台PC或SMP;②各节点通过一种低成本的商品(标准)网络互连(;③各节点内总是有本地磁盘④节点内的网络接口是松散耦合到I/O 总线上的,⑤一个完整的操作系统驻留在每个节点中,而MPP中通常只是个微核,COW 的操作系统是工作站UNIX,加上一个附加的软件层以支持单一系统映像、并行度、通信和负载平衡等。
云计算考试复习资料Web搜索引擎:⼀个能够在合理响应时间内,根据⽤户的查询关键词,返回⼀个包含相关信息的结果列表(hits list)服务的综合体。
IC卡:集成电路卡。
即“集成电路卡”在⽇常⽣活中已随处可见。
实际上是⼀种数据存储系统,如有必要还可附加计算能⼒。
条形码是由⼀组规则排列的条、空以及对应的字符组成的标记。
当使⽤专门的条形码识别设备如⼿持式条码扫描器扫描这些条码时,条码中包含的信息就转化为计算机可识别的数据。
Wi-Fi:最常见的⽆线接⼊⽅式,是⼀种短距离传输技术,适⽤于办公室及家庭环境,有11Mbps,54Mbps,300Mbps等速率范围。
物联⽹的特点:1、感知识别普适化:⽆所不在的感知和识别将传统上分离的物理世界和信息世界⾼度融合。
2、异构设备互联化:各种异构设备利⽤⽆线通信模块和协议⾃组成⽹,异构⽹络通过“⽹关”互通互联。
3、联⽹终端规模化:物联⽹时代每⼀件物品均具通信功能成为⽹络终端,5-10年内联⽹终端规模有望突破百亿。
4、管理调控智能化物联⽹⾼效可靠组织⼤规模数据,与此同时,运筹学,机器学习,数据挖掘,专家系统等决策⼿段将⼴泛应⽤于各⾏各业。
5、应⽤服务链条化以⼯业⽣产为例,物联⽹技术覆盖从原材料引进,⽣产调度,节能减排,仓储物流到产品销售,售后服务等各个环节。
6、经济发展跨越化物联⽹技术有望成为从劳动密集型向知识密集型,从资源浪费型向环境友好型国民经济发展过程中的重要动⼒。
物联⽹的定义:1、通过射频识别(RFID)、红外感应器、全球定位系统、激光扫描器等信息传感设备,按约定的协议,把任何物品与互联⽹相连接,进⾏信息交换和通信,以实现智能化识别、定位、跟踪、监控和管理的⼀种⽹络概念2、实际是中国⼈的发明,整合了美国CPS(Cyber-Physical Systems)、欧盟IoT(Internet of Things)和⽇本U-Japan等概念。
是⼀个基于互联⽹、传统电信⽹等信息载体,让所有能被独⽴寻址的普通物理对象实现互联互通的⽹络。
云计算复习资料(推荐完整)编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(云计算复习资料(推荐完整))的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为云计算复习资料(推荐完整)的全部内容。
云计算复习资料(推荐完整)编辑整理:张嬗雒老师尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布到文库,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是我们任然希望云计算复习资料(推荐完整)这篇文档能够给您的工作和学习带来便利。
同时我们也真诚的希望收到您的建议和反馈到下面的留言区,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请下载收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为〈云计算复习资料(推荐完整)〉这篇文档的全部内容。
第一章:大数据与云计算1。
何为大数据?海量数据或巨量数据,其规模巨大到无法通过目前主流的计算机系统在合理时间内获取、存储、管理、处理并提炼以帮助使用者决策.2。
大数据具有4V+1C的特征(1)数据量大:存储的数据量巨大,PB级是常态(2)多样:数据的来源及格式多样(3)快速:数据增长速度快(4)价值密度低:需要对大量的数据进行处理,挖掘其潜在的价值.(5)复杂度:对数据的处理和分析的难度大3.什么是云计算?长定义:云计算是一种商业模型.它将计算任务分布在大量计算机构成的资源池上,使各种应用系统能根据需要获取计算力、存储空间和信息服务。
短定义:云计算是通过网络按需提供可动态伸缩的廉价计算服务.4。
云计算是并行计算、分布式计算和网络计算的发展。
5。
华南理工大学《高级计算机网络》复习资料[Part1]. IPv6协议【IPv4的危机】地址危机(最大的危机,但可通过NAT、CIDR、VLSM)、端到端业务模式无法实施、QoS和性能问题、配置复杂、安全问题、路由表的膨胀、移动性支持不够【IPV4与IPV6地址空间】IPV4:232 ≈ 43亿IPv6:2128=3.4×1038 ≈ 340涧【IPv6的改进之处】简化的报头格式,地址扩展到128位,增强的安全性和服务质量,可以实现更高效得路由基础,提供了对移动特性得支【IPv9网络】每个y是32bit部分,如。
【TCP/IPv6参考模型】【IPv6特点】地址及寻址全新的报文格式,高效的报头全新的地址配置方式,即插即用更好的QoS支持内置的安全性全新的邻居发现协议良好的扩展性内置的移动性端点分片【IPv6地址分类】单播地址用于唯一标识支持IPv6 的设备上的接口。
源地址必须是单播地址●单播地址(Unicast Address)-本地链路地址、环回地址、未指唯一本地地址、嵌入式Ipv4地址、全局单播地址、定地址●组播地址(Multicast Address)●任播地址(Anycast Address)【1.本地链路地址】●用在单一链路上●带有链路本地源或目的地址的数据包不转发到其它链路●支持IPv6的网络接口都需要有本地链路地址●IPv4不会自动生成,IPv6主机会自动创建。
【1.本地链路地址生成】只在同一本地链路中使用,范围:FE80::/64后64位为EUI-64地址:EUI-64生成:【1.本地链路地址用途】●主机使用路由器本地链路地址作为默认网关地址。
●路由器使用本地链路地址交换动态路由协议消息。
●转发数据包时,路由器的路由表使用本地链路地址确定下一跳路由器。
【2.环回地址】* 地址:::1/128* 主机用来将数据包发送给本身,不能分配给物理接口* 启用Ping命令,测试本地主机TCP/IP配置【3.未指定地址】地址:::/128不能分配给接口,仅作为源地址【4.唯一本地地址】地址:从FC00::/7 到FDFF::/7在一个站点内或有限站点数之间用作本地地址,在全局不具可路由性。
1.什么是云计算?云计算是分布式处理(Distributed Computing)、并行处理(Parallel Computing)和网格计算(Grid Computing)的发展,或者说是这些计算机科学概念的商业实现。
是指基于互联网的超级计算模式--即把存储于个人电脑、移动电话和其他设备上的大量信息和处理器资源集中在一起,协同工作。
在极大规模上可扩展的信息技术能力向外部客户作为服务来提供的一种计算方式。
2.云计算六种服务方式是什么?SAAS( Software as a Service ) ;PAAS( Platform as a Service ) ;IAAS( Infrastructure as a Service );云存储;MSP(管理服务提供);商业服务平台。
3.云计算体系结构云计算的基本原理是通过使计算分布在大量的分布式计算机上,而非本地计算机或远程服务器中,企业数据中心的运行将更与互联网相似。
这使得企业能够将资源切换到需要的应用上,根据需求访问计算机和存储系统。
4.简述Google云计算平台技术架构文件存储,Google Distributed File System,GFS并行数据处理MapReduce分布式锁Chubby分布式结构化数据表BigTable分布式存储系统Megastore分布式监控系统Dapper5.GFS的容错机制是什么?1).Master容错具体来说,Master上保存了GFS文件系统的三种元数据.命名空间(Name Space),也就是整个文件系统的目录结构。
Chunk与文件名的映射表。
Chunk副本的位置信息,每一个Chunk默认有三个副本2). Chunk Server容错GFS采用副本的方式实现Chunk Server的容错。
每一个Chunk有多个存储副本(默认为三个),分布存储在不同的Chunk Server上。
副本的分布策略需要考虑多种因素,如网络的拓扑、机架的分布、磁盘的利用率等.对于每一个Chunk,必须将所有的副本全部写入成功,才视为成功写入.在其后的过程中,如果相关的副本出现丢失或不可恢复等状况,Master会自动将该副本复制到其他Chunk Server,从而确保副本保持一定的个数。
云计算技术复习提纲及提示1.根据你的理解,说明什么是并行计算,什么是分布式计算。
答:并行计算:基于分而治之的思想,将一个大问题分解成多个小问题,并发地求解各小问题,使得多个运算得以同时运行的计算模式。
分布式计算:是研究分布式系统中如何进行计算的计算机科学。
分布式系统有多个由网络连接的计算机组成。
这些计算机能够联合完成共同的计算目标。
一个计算问题可以分解成许多小任务,分散到不同的计算机上处理,在处理过程中进行消息通信,最后汇总成最终结果。
2.简述并行程序设计过程。
答见课件3.并行计算模型分类。
隐式并行模型、数据并行模型、消息传递模型、共享变量模型4.什么是PVM?说明PVM系统由哪两部分组成。
答见课件5.MPI的最小子集由那六个基本函数组成,分别实现什么功能?答见课件6.MPI通信模式(四种)?答:同步模式、缓冲模式、标准模式、就绪模式7.MPI群集通信按照通信方向不同可分为三种,并举例?答:一对多(MPI_Bcast)、多对一(MPI_Gather)、多对多MPI_Allgather)8.MPI归约操作(MPI_Reduce)的主要功能?答见课件9.说明MPICH-G2和MPICH的区别和联系。
答:MPICH-G2和MPICH是MPI标准的两个开源实现;MPICH-G2适用于网格环境,MPICH 适用于集群环境;MPICH-G2基于MPICH架构,采用Globus技术实现。
10.什么是NFS和NIS,根据你的理解说明它们的主要作用?答见课件11.画图说明LSF Batch Job的生命周期(Life Cycle)。
答见课件12.说明LSF中Queue的功能和作用。
答:Queue(队列)既是作业的容器,又同时是调度策略的容器。
不同的队列可以配置不同的调度策略。
一个队列在不同的时间段可以执行不同的调度策略。
13.根据你的理解,说明什么是虚拟化、什么是虚拟机。
答:虚拟化是表示计算机资源的抽象方法,通过虚拟化可以用与访问抽象前资源一致的方法访问抽象后的资源。
高性能计算与云计算练习题1. 解释以下基本概念●HPC, HPCC, Distributed computing, Cloud computing●MIMD, SIMD, SISDHPC:High Performance Computing 高性能计算,即并行计算。
在并行计算机或分布式计算机等高性能计算系统上所做的超级计算。
HPCC:High Performance Computing and Communication 高性能计算与通信。
指分布式高性能计算、高速网络和Internet的使用。
Distributed computing:分布式计算。
在局域网环境下进行的计算。
比起性能来说,它更注重附加功能。
一个计算任务由多台计算机共同完成,由传统的人和软件之间的交互变成软件和软件之间的数据交互。
Cloud computing:云计算(Cloud Computing)是一种新兴的商业计算模型。
它将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够根据需要获取计算力、存储空间和各种软件服务。
MIMD:多指令多数据流。
每台处理机执行自己的指令,操作数也是各取各的。
SIMD:单指令多数据流。
所有“活动的”处理器在同一时刻执行同一条指令对多个数据流进行操作。
SISD:单指令单数据流。
传统的串行处理机。
CPU执行单一的指令流对单一的数据流进行操作。
2. 试比较PVP、SMP、MPP、DSM和Cluster并行机结构的不同点,以典型系统举例说明。
3. 列出常用静态和动态网络的主要参数(节点度、直径、对剖带宽和链路数)以及复杂度、网络性能、扩展性和容错性等。
常用的标准互联网络有哪些?答:静态网络(Static Networks)是指处理单元间有着固定连接的一类网络,在程序执行期间,这种点到点的链接保持不变;动态网络(Dynamic Networks)是用交换开关构成的,可按应用程序的要求动态地改变连接组态。
《高性能计算与云计算》复习资料2012计算机全英创新班黄炜杰(201230590051)1.解释并比较以下基本概念PVP, SMP, MPP, DSM, Cluster, ConstellationUMA, NUMA, CC_NUMA, CORMA, NORMAHPC, HPCC, Distributed computing, Cloud computingPVP:并行向量处理机。
系统中包含为数不多的高性能特制的向量处理器,使用专门设计的高带宽交叉开关网络将向量处理器连向共享存储模块。
通常不使用高速缓存,而使用大量的向量寄存器和指令缓冲器。
交叉开关SMP:对称多处理机。
节点包含两个或两个以上完全相同的处理器,在处理上没有主/从之分。
每个处理器对节点计算资源享有同等访问权。
SMP系统使用商品微处理器(具有片上或外置高速缓存),它们经由高速总线或交叉开关连向共享存储器。
MPP:大规模并行处理机。
节点传统上是由单一CPU、少量的内存、部分I/O、节点间的互联以及每个节点的操作系统的一个实例组成。
节点间的互联(以及驻留于各节点的操作系统实例)不需要硬件一致性,因为每个节点拥有其自己的操作系统以及自己唯一的物理内存地址空间。
因而,一致性是在软件中通过“消息传送”(message passing)实现的。
DSM:分布共享存储多处理机。
在物理上有分布在各节点的局部存储器,从而形成一个共享的存储器。
对用户而言,系统硬件和软件提供了一个单地址的编程空间。
Cluster:集群。
系统中的每个节点拥有小于16个处理器。
Cluster是一种并行或分布式处理系统,由一系列通过网络互连的互相协同工作的单机组成,形成单一、整合的计算资源。
Constellation:系统中的每个节点拥有大于或等于16个处理器。
UMA:Uniform Memory Access. 均匀存储访问模型。
特点:1.物理存储器被所有处理器均匀共享,所有处理器访问任何存储单元花费相同的时间;2.每台处理器可带私有高速缓存;3.外围设备也可以一定形式共享。
华工综合的高性能复习题2008 年11 月1. 解释以下基本概念HPC, HPCC, Distributed computing, Meta computing, Grid computingMIMD, SIMD, SISDPVP, SMP,MPP, DSM, Cluster, ConstellationUMA, NUMA, CC_NUMA, CORMA, NORMAHPC:高性能计算是计算机科学的一个分支,研究并行算法和开发相关软件,致力于开发高性能计算机(High Performance Computer)。
计算密集型(Compute-Intensive)应用数据密集型(Data-Intensive)应用网络密集型(Network-Intensive)应用HPCC:高性能计算和通信(High-Performance Computing andCommunications:HPCC)分布式高性能计算、高速网络和Internet的使用分布式计算(Distributed Computing)更着重于功能而不是性能的增加网格计算(Grid Computing)分布式高性能计算(Distributed, High Performance Computing:DHPC),或称元计算(Metacomputing)单指令单数据流:SISD 普及程度:MIMD > SIMD > MISD单指令多数据流:SIMD多指令单数据流:MISD多指令多数据流:MIMD⏹对称多处理共享存储并行机(SMP:Symmetric MultiProcessing);⏹分布共享存储并行机(DSM:Distributed Shared Memory);⏹大规模并行机(MPP:Massively Parallel Processors);⏹工作站(微机)机群(COW:Cluster Of Workstation、Beowulf PC-Cluster);⏹并行向量多处理机(PVP:Parallel Vector Processors)均匀访存模型(UMA:Uniform Memory Access)非均匀访存模型(NUMA:Nonuniform Memory Access)Cache一致性非均匀访存模型(CC-NUMA:Coherent-Cache Nonuniform Memory Access)分布式访存模型(DMA:Distributed Memory Access)2. 试比较PVP、SMP、MPP、DSM 和Cluster 并行机结构的不同点,以典型系统举例说明。
《高性能计算与云计算》复习资料2012计算机全英创新班黄炜杰(201230590051)1.解释并比较以下基本概念PVP, SMP, MPP, DSM, Cluster, ConstellationUMA, NUMA, CC_NUMA, CORMA, NORMAHPC, HPCC, Distributed computing, Cloud computingPVP:并行向量处理机。
系统中包含为数不多的高性能特制的向量处理器,使用专门设计的高带宽交叉开关网络将向量处理器连向共享存储模块。
通常不使用高速缓存,而使用大量的向量寄存器和指令缓冲器。
交叉开关SMP:对称多处理机。
节点包含两个或两个以上完全相同的处理器,在处理上没有主/从之分。
每个处理器对节点计算资源享有同等访问权。
SMP系统使用商品微处理器(具有片上或外置高速缓存),它们经由高速总线或交叉开关连向共享存储器。
MPP:大规模并行处理机。
节点传统上是由单一CPU、少量的内存、部分I/O、节点间的互联以及每个节点的操作系统的一个实例组成。
节点间的互联(以及驻留于各节点的操作系统实例)不需要硬件一致性,因为每个节点拥有其自己的操作系统以及自己唯一的物理内存地址空间。
因而,一致性是在软件中通过“消息传送”(message passing)实现的。
DSM:分布共享存储多处理机。
在物理上有分布在各节点的局部存储器,从而形成一个共享的存储器。
对用户而言,系统硬件和软件提供了一个单地址的编程空间。
Cluster:集群。
系统中的每个节点拥有小于16个处理器。
Cluster是一种并行或分布式处理系统,由一系列通过网络互连的互相协同工作的单机组成,形成单一、整合的计算资源。
Constellation:系统中的每个节点拥有大于或等于16个处理器。
UMA:Uniform Memory Access. 均匀存储访问模型。
特点:1.物理存储器被所有处理器均匀共享,所有处理器访问任何存储单元花费相同的时间;2.每台处理器可带私有高速缓存;3.外围设备也可以一定形式共享。
NUMA:Nonuniform Memory Access. 非均匀存储访问模型。
特点:1.被共享的存储器在物理上是分布在所有的处理器中的,组成全局地址空间;2.处理器访问存储器的时间是不同的,访问本地存储器或群内共享存储器较快,访问外地存储器或全局存储器较慢;3.每台处理器可带私有高速缓存,外设可以某种形式共享。
CC_NUMA:Coherent-Cache Nonuniform Memory Access. 高速缓存一致性非均匀存储访问模型。
实际上是将一些SMP机器作为一个单节点而彼此连接起来所形成的一个较大的系统。
特点:1. 使用基于目录的高速缓存一致性协议;2.保留SMP结构易于编程的优点,改善了常规SMP的可扩放性问题;3.实际上是一个分布共享存储的DSM多处理机系统;4.最显著的优点是程序员无需明确地在节点上分配数据,在运行时高速缓存一致性硬件会自动地将数据迁移到要用到的它的地方。
COMA:Cache-Only Memory Access. 全高速缓存存储访问。
是NUMA的一种特例。
特点:1.各处理器节点中没有存储层次结构,全部高速缓存组成了全局地址空间;2.利用分布的高速缓存目录进行远程高速缓存的访问;3.高速缓存容量一般大于2级高速缓存容量;4.使用COMA时,数据开始可以任意分配,因为在运行时它最终会被迁移到要用到的它的地方。
NORMA:No-Remote Memory Access. 非远程存储访问模型。
分布存储的多计算机系统,所有的存储器都是私有的,仅能由其处理器访问。
绝大多数NORMA不支持远程存储器访问。
HPC:High Performance Computing 高性能计算,即并行计算。
在并行计算机或分布式计算机等高性能计算系统上所做的超级计算。
HPCC:High Performance Computing and Communication 高性能计算与通信。
指分布式高性能计算、高速网络和Internet的使用。
Distributed computing:分布式计算。
在局域网环境下进行的计算。
比起性能来说,它更注重附加功能。
一个计算任务由多台计算机共同完成,由传统的人和软件之间的交互变成软件和软件之间的数据交互。
Cloud computing:云计算是一种新兴的共享基础架构的方法,通过互联网将资源以“按需服务”的形式提供给用户,利用互联网连接的数据中心和服务器进行高效计算和信息存取的系统,使计算能力可以向电能一样提供给客户(高度可扩展)2.试比较SMP、MPP和Cluster并行机结构的不同点,并以典型系统举例说明。
3.列出常用静态和动态网络的主要参数(节点度、直径、对剖带宽和链路数)以及复杂度、网络性能、扩展性和容错性等。
常用的标准互联网络有哪些?常用的标准互联网络有:4.比较并行计算模型PRAM、BSP和logP。
评述它们的差别、相对优点以及在模型化真实并行计算机和应用时的局限性。
PRAM优缺点BSP优缺点logP优缺点5. 比较在PRAM模型和BSP模型上,计算两个N阶向量内积的算法及其复杂度。
PRAM模型BSP模型6. 什么是加速比(speed up)、并行效率(efficiency)和可扩展性(scalability)? 如何描述在不同约束下的加速比?加速比(Speedup):对于一个给定的应用,并行算法(或并行程序)相对于串行算法(或串行程序)的性能提高程度.并行效率(Parallel Efficiency ):处理器的利用率Efficiency = (Sequential execution time) / (Number of processors * Parallel execution time)可扩展性(Scalability ):当系统和问题规模增大时,可维持相同性能的能力,即指应用、算法和结构能否充分利用不断增长的处理器的能力固定负载(Amdahl 定律):计算负载是固定不变,增加处理器数来提高计算速度。
加速比为:(W s 串行分量,W p 可并行分量)带通信开销的计算公式式不带通信开销的计算公o p s p x p s ps W pW W W W s p W W W W S +++=++=;/ 固定时间(Gustafson 定律):时间固定不变,为了提高精度加大计算量,相应的增多处理器数目。
加速比为:(考虑额外开销)不考虑额外开销Wo Wp Ws pWp Ws S Wp Ws pWp Ws p W p Ws pW Ws S p p +++=++=++=')(/*'存储受限(Sun -Ni 定律):只要存储空间许可,尽量增大问题的规模以产生更好的或更精确的解,加速比为: (f:串行分量比例(Ws/W) G(p):存储容量增加到P 倍))(//)()1()()1(/)()1()()1(''S )(/)()1()()1(/)()1()()1(''考虑额外开销不考虑额外开销W Wo p p G f f p G f f Wo p W p G f fW W p G f fW p p G f f p G f f p W p G f fW W p G f fW S +-+-+=+-+-+=-+-+=-+-+=7. 如何进行并行计算机性能评测?什么是基准测试程序? 并行计算机性能评测:通过CPU 和存储器的某些基本性能指标、并行和通信开销分析、并行机的可用性与好用性以及机器成本、价格与性价比进行机器级性能测评;通过加速比、效率、扩展性进行算法级性能测评;通过Benchmark 进行程序级性能测评。
基准测试程序:用于测试和预测计算机系统的性能,揭示了不同结构机器的长处和短处,为用户决定购买和使用哪种机器最适合他们的应用要求提供决策。
8. 什么是可扩放性测量标准?等效率函数的涵义是什么? 可扩放性测量标准:增加系统规模(处理器数)会增大额外开销和降低处理器利用率,所以对于一个特定的并行系统(算法或程序),它们能否有效利用不断增加的处理器的能力应是受限的,而度量这种能力就是可扩放性这一指标。
等效率函数的涵义:如果问题规模W 保持不变,处理器数p 增加,开销To 增大,效率E 下降。
为了维持一定的效率(介于0与1之间),当处理数p 增大时,需要相应地增大问题规模W 的值。
由此定义函数f E (p)为问题规模W 随处理器数p 变化的函数,为等效率函数。
9. 什么是分治策略的基本思想?举例说明如何应用平衡树方法、倍增技术和流水线技术。
分治策略的基本思想:将一个大而复杂的问题分解成若干特性相同的子问题分而治之。
平衡树方法:可应用于求n个数的最大值:叶节点存放待处理的数据,内节点执行相应子问题计算,根节点给出问题的解。
倍增技术:可以应用于求森林根,对于n个节点的树执行log n次指针跳跃即可找到树的根。
流水线技术:可应用于执行一维脉动阵列上的DFT计算。
10. 什么是均匀划分、方根划分、对数划分和功能划分?如何用划分方法解决PSRS排序、归并排序和(m,n)选择问题?均匀划分:将n个元素分割成p段,每段含有n/p个元素且分配给一台处理器。
方根划分:取每第i√n(i=1,2,…)个元素作为划分元素,而将序列划分成若干段,然后分段处理之。
对数划分:取每第i log n(i=1,2,….)个元素作为划分元素,而将序列划分成若干段,然后分段处理之。
功能划分:将长为n的序列划分成等长的一些组,每组中的元素应大于或等于m(最后一组除外),然后各组可并行处理。
采用均匀划分方法,解决PSRS排序:均匀划分待排序序列成n份,对每份作局部排序,再从每份中抽取n个样本,对n²个正则样本进行排序,选择主元然后对每部分进行主元划分,把每部分按段号进行全局交换,最后进行归并排序。
采用方根划分方法,解决归并排序:先对序列进行方根划分,然后进行段间、段内比较,最后进行段组归并。
采用功能划分方法解决(m,n)选择问题:先对序列进行功能划分,然后对每个子序列进行局部排序,将排序的各组进行两两比较,形成MIN序列,最后重复局部排序和两两比较直至出现m个最小者。
11. 并行算法设计的一般过程PCAM是指什么?各个步骤中的主要判据是什么?PCAM是Partitioning(划分)、Communication(通信)、Agglomeration(组合)和Mappin (映射)首字母的拼写,它们代表了使用此法设计并行算法的四个阶段。
划分判据:划分是否具有灵活性?划分是否避免了冗余计算和存储?划分任务尺寸是否大致相当?任务数与问题尺寸是否成比例?任务数与问题尺寸是否成比例?功能分解是一种更深层次的分解,是否合理?通信判据:所有任务是否执行大致相当的通信?是否尽可能的局部通信?通信操作是否能并行执行?同步任务的计算能否并行执行?组合判据:增加粒度是否减少了通信成本?重复计算是否已权衡了其得益?是否保持了灵活性和可扩展性?组合的任务数是否与问题尺寸成比例?是否保持了类似的计算和通信?有没有减少并行执行的机会?映射判据:采用集中式负载平衡方案,是否存在通信瓶颈?采用动态负载平衡方案,调度策略的成本如何?12. 什么是域分解和功能分解?如何将全局通信转换为局部通信?什么是表面-容积效应和重复计算?映射的策略是什么?域分解:也叫数据划分。