分布与并行计算思考题答案整理.docx

  • 格式:docx
  • 大小:106.85 KB
  • 文档页数:12

下载文档原格式

  / 6
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

分布式系统

笫一章分布式系统概述

1・一个有256个CPU的多计算机系统被组织成16X16的网格。在最坏的情况尺-•条消息的传输延迟为多少?(以跳为单位) 假定路由是最优的.那么最长的优化(理想)路径是从网格的一・角到相对的•角,即沿着对角线的路径。这个路径的长度是3()跳。如果在单行或单列上的终端处理器是互联起來的,那么路径长度变成15^

2・考虑一256个CPU的超立方休.在最坏的情况下,一个消息延迟是多少?(以跳为单位)

对于256个CPU的超立方体,每个节点有一个二进制地址.范围从OOOOOO(M)到11111111•从一个机器到另一个的一•跳,耍改变二进制地址中的一位,因此地址从00000000变到00000001就是一跳,从00000001到0(X)00011又是另外一跳。因此总共需耍八跳。

3・一个冬计算机系统有4096个50-MIPS的CPU,通过omega网络连接到内存。为了使一个内存请求能在-•条指令的时间内到达内存并返回结果.转换的速度需要有影快?

5O-MIPS=5纳秒.需耍【(4096的对数)=12】层开关.就有这么卷延迟•因为有来回.所以乘以2.转换速度就是5/24=0.208纳秒。

4 •一台试验文件服务器由于错误的原因.3/4的时间正常工作,1/4的时间由于故障停止工作。为了达到99%的可用性,这一文件服务誥需耍复制多少次?

设k是服务器的数则由题意知(l/4)k<0.01・这是最坏的情况.即所有的服务器都出故障的时间至名为1%的时间的情况。这k = 4。

5 •假设有一个包含m个待编详文件的大源程序。这个编译工作将在一个拥有!1个处理器的系统上进行.其中:n»m。希望这种方法的速度嚴好达到单处理器的m倍。哪些因素导致实际的速度达不到该值?

答:可能由于总线容量限制从而引起总线过载,或者交换开关延时。

6・举例说明名核并行计算机的结构和性能计算方法。(网上找的答案.参考)

多核并行计算机的结构

多核即在一・个单芯片上而集成两个捷至更多个处理器内核.其中每个内核都有自己的逻辑单元.控制单元.中断处理器、运算单元, -级cache.二级cache共享或独有.其部件的完整性和单核处理器内核相比完全一•致。片上多核处理器(CMP)是将多个计算内核集成在一个片处埋器芯片中.从而提高计算能力。每个微处理器核心实质上都是•个相对简单的单•线程微处理誥或者比较简单的冬线程微处理器. 这样多个效处理器核心就可以并行地执行程序代码.因而具有了较高的线程级并行性。由于CMP采川了相对简单的微处理蛊作为处理器核心•使得CMP具有高主煉设计和验证周期短.控制逻辑简单、扩展性好.易于实现.功耗低.通信延迟低等优点。此外.CHP还能充分利用不同应用的指令级并行和线程级并行,具有校高线程级并行性的应用町以很好地利用这种结构來提高性能。按照内核的对等与否,CMP 可分为同构多核和异构多核。计算内核相同,地位对等的称为''同构参核役同构CHP人务数山通用的处理器组成.零个处理器执行和同或者类似的任务。计算内核不同,地位不对等的称为“异构多核”,异构多核多采用“主处理核+协处理核”的设计。

C5IP处理器山多个CPU核心组成.每个核心执行%自的程序代码.但是CMP处理器的冬CPU核心执行的程序之间耍进行数据共享和同步.所以硬件结构必须支持核间通信。高效的通信机制是CHP处理器高性能的敢要保障•比较主流的片上高效通信机制有两种,一种是基于总线共享的cache结构,一种是基于片上的互连结构。总线共cache结构是扌旨每个CPU内核拥有共享的二级或三级cache,用于保存比较常用的数据.并通过连接核心的总线进行通信。这种系统的优点是结构简单,通信速度I淙缺点是基于总线的结构可扩展性较差。基于片上互连的结构是指每个CPU核心具有独立的处理单元和cache,各个CPU核心通过交叉开关或片上网络等方式连接在-•起。各个CPU 核心间通过消息通信。这种结构的优点是可扩展性好,数据带宽有保证,缺点是硕件结构复杂•且软件改动较大。

性能计算方法

以下6种性能爲求是用户经常提到的:执行时间.运行速隊吞吐率.利用率.成本有效性以及性能/成本比。

1) 运行»:运行速度是衡虽计算机性能的-项币雯指标。通常所说的计算机运算速度(平均运算速度).是指毎秒钟所能执行的描令条数.-般用

“百万条指令/秒"(mips, Million Instruction Per Second)来描述。同一台计算机.执行不同的运算所需时间可能不同•【大M对运算速度的描述常采用不同的方法。常用的有CPU时钟频率(丄频入每秒T•均执行折令数(ips)等。

2) 执行时间:等于从并行程序开始执行到所有进程执行完毕,瞄上时钟走过的时间,也称为谱上时间((wall clock time wall clock time).对客个

进程,增上时间可进••步分解为计算进涉分解为计算CPU时间.通偃CPU.同步开销时间.同步解的进程空闲时间。

3) 吞吐率:吞吐率定义为在单位时间内所处理的作业数。如果每次只执行一个作业,那么吞吐率就是执行时何的(御数。当有多个作业彼同

时执行时.常使用吞吐率来农示系统的性能。

4) 利川率:可茨示为计算机可达到速度与峰值速度之比。

5) 成本有效性:农示成本有效性的合适指标是利用率因子(或简称利川率),其可用利用率农达式,即农示为一个给定计算机可达到速度与峰值

速度之比。

6) 性能/成木比:所获得的性能与所消耗费用之比。性能可以川所获得的计并机达到放大速度表示。

第二章分布式系统中的通信机制

1・如果一个客户/服务器系统的通信原语是非阻塞的,在消息实际彼发送之前发送.对send的调川已完成。为了减少开销• 一些系统不拷贝数据到内核,而是直接从川户空间发送。对于这样的系统,诸设计两种方案.发送者能知道传输己经完成•可以遥新使用缓冲区。

第-•种方法是内核将消息拷贝到内部缓冲区,其后允许进程继续执行。第二种方法是当消息被发送后•中断发送者并通知它缓冲区可用.这里不需耍备分,节省了时间。

2・在许多通信系统中,调用send 个计数器,以保证当服务器削溃时客户机不会永久彼挂起。假设一容错系统,所有的客八机和

服务器都用多处理机方式实现.那么客户机或服务器谢溃的概率儿乎等于寥。你认为在这样的系统中能安全地避免超时吗?

不安全。因为在客户机和眼务器的通信过程中,并不仅仅由于客户机或服务器崩溃,从而引起信息的丢失,系统的瘫痪。在信息传输网络中也可能引起信息的丢失。而超时机制能够無决这个问题。

3. 解释RPC的工作原理和参数传递方法。僻释何为异步RPC。

客户机器上的进程调用远程过程时,通过客户存根将参数传递到服务器,然后阻塞"C直到收到响应。服务器上的服务器存根使用这些参数调用本地的过程,得出结果后再传递冋客户机器客户存根捉取结果后以通常的方式返冋。从客户的角度看,该过程和木地调用具有相同的形式,是透明的。

参数传递方法有传递值参数和传递引川参数。

在异步RPC中,服务器接收到客户发送的RPC请求后立即向客户送回应冷Z后再调川客户请求的过程.客户收到确认消息麻继续向下执行,只是在服务器将结果传递回来时发生一个中断。