当前位置：文档之家› 计算机体系结构练习题

计算机体系结构练习题

系别_________ 班级_________ 姓名__________ 学号__________

一、填空题

1.按照弗林（Flynn）分类法，计算机系统可以分为4类：SISD计算机、SIMD计算机、MISD 计算机和MIMD计算机。

2. 早期冯?诺依曼计算机的主要特点是程序存储、指令驱动、集中控制。

3. 改进之后的冯?诺依曼计算机的只要特点是存储器为中心，总线结构，分散控制。

4. 当前计算机系统中的存储系统是一个层次结构，其各层分别为：（通用寄存器，高速缓存，主存，辅存，脱机大容量存储器）。

5.高速缓冲存储器的地址映象方式有三种，它们分别是：全向量方式，直接相联方式，组相联方式。

6.虚拟存储器的三种管理方式是（段式管理，页式管理和段页式管理）。

8.目前计算机中常用数据有（用户定义数据，系统数据和指令数据）三种类型。

9.通常可能出现的流水线的相关性有（资源相关，数据相关和控制相关）。

10.根据指令间的对同一寄存器读和写操作的先后次序关系，数据相关冲突可分为（RAW、WAR和WAW）三种类型。

11.解决中断引起的流水线断流的方法有（不精确断点法和精确断点法）。

12.多流水线的调度主要有三种方法：(顺序发射顺序完成，顺序发射乱序完成，乱序发射乱序完成)。

13.目前向量处理机的系统结构有两种：（存储器－存储器型和寄存器－寄存器型）。

14.通用计算机基本指令分为5类，它们分别是：（数据传送类，运算类，程序控制类，输入输出类，处理机控制和调试类）。

15．执行指令x1=x2+x3；x4=x1-x5会引起（RAW）类型的数据相关，执行指令x5=x4*x3；x4=x0+x6会引起（WAR）类型的数据相关，执行指令x6=x1+x2；x6=x4*x5会引起（WAW）类型的数据相关。

16．多计算机网络中，通常出现的4种通信模式是（单播模式，选播模式，广播模式和会议模式）。

17.计算机模型按有关控制机制分类，可将计算机分为（控制）驱动，（数据）驱动，（需求）驱动，（模式匹配）驱动四种类型。

18.传统的冯?诺依曼计算机是以控制驱动方式工作，以数据驱动方式工作的典型计算机是（数据流计算机），以需求驱动方式工作的典型计算机是（归约机），以模式匹配驱动方式工作的典型计算机是（人工智能计算机）。

二、名词解释（每题2分，共16分）

1．计算机体系结构：

计算机系统结构就是计算机的机器语言程序员或编译程序编写者所看到的外特性，是硬件子系统的概念结构及其功能特性。

2．透明性：

在计算机技术中，一种本来存在的事物或属性，但从某种角度看似乎不存在，称为透明性。

3．系列机：

所谓系列机是指同一厂家生产的具有相同的系统结构，但采取了不同的组成和实现的技术方案，形成了不同型号的多种机型。

4．兼容机:

不同厂家所生产的具有相同系统结构的计算机系统，称为兼容机。

5．模拟:

模拟是指用软件的方法在一台计算机上，实现另一台计算机的指令系统，被模拟的机器是不存在的，称为虚拟机，执行模拟程序的机器称宿主机。

6．仿真:

仿真是指用微程序的方法在一台计算机上实现另一台计算机的指令系统。

7．程序的局部性原理:

程序访问局部性原理说明了计算机在程序执行过程中呈现出的一种规律，即程序往往重复使用它刚刚使用过的数据和指令。局部性分为时间上的局部性和空间上的局部性两种。所谓时间局部性是指近期被访问的代码，很可能不久又将再次被访问；空间局部性是指地址上相邻近的代码可能会被连续地访问。

8．MIPS：

它表示每秒百万条指令数。

9．基准测试程序：

为了能进行合理的评价，通常采用不同类型的程序进行测试，经过实践选择出的这些程序称为基准测试程序。

10．高速缓冲存储器:

高速缓冲存储器是存在于主存与CPU之间的一级存储器，由静态存储芯片（SRAM）组成，容量比较小但速度比主存高得多，接近于CPU的速度。

11．虚拟存储器:

虚拟存储器是由主存储器和辅助存储器组成，通过必须的软件和硬件的支持，使得CPU可以访问的存储器具有近似于主存的速度和近似于辅存的容量。

12．快表:

为了提高地址转换速度，缩短查表时间，采用一个小容量的、高速的相关存储部件，用来存放当前最经常用到的那一部分页表，采取按内容相联方式进行访问。这样，查页表的时间就相当于访问小容量的相关存储器的时间，从而大大地提高了速度，这个小容量相关存储器称为快表。

13．程序定位：

把一个程序交给处理机运行，必须首先把这个程序的指令和数据装入到主存储器中。一般情况下，程序所分配到的主存物理空间与程序本身的逻辑地址空间是不同的，把指令和数据中的逻辑地址(相对地址)转变成主存物理地址(绝对地址)的过程称为程序定位。

14．延迟转移技术：

为了使指令流水线不断流，在转移指令之后插入一条不相关的有效的指令，而转移指令被延迟执行，这种技术称为延迟转移技术。

15．窗口重叠技术：

为了能更简单、更直接地实现过程与过程之间的参数传递，大多数RISC机器的CPU中都设置有数量较大的寄存器组，让每个过程使用一个有限数量的寄存器窗口，并让各个过程的寄存器窗口部分重叠，这就是窗口重叠技术。

16．流水线技术：

把一个重复的时序过程分成若干个子过程，每个子过程都可以有效地在其专用功能段上和其他子过程同时执行的一种技术，称为流水线技术。

17．先行控制技术：

先行控制技术是采用缓冲技术使分析部件和执行部件能分别连续不断地分析和执行指令。17．动态流水线：

动态流水线在同一时间内允许按多种不同运算的联结方式工作。

18．静态流水线：

静态流水线在同一时间内只能按一种运算的联结方式工作。

19．线性流水线：

线性流水线中，从输入到输出，每个功能段只允许经过一次，不存在反馈回路。

20．非线性流水线：

非线性流水线存在反馈回路，从输入到输出过程中，某些功能段将数次通过流水线，这种流水线适合于进行线性递归的运算。

21．流水线的吞吐率：

流水线单位时间完成的任务数。

22．超标量计算机：

超标量处理机是重复设置多个“取指令”部件，多个“译码”、“执行”和“写结果”部件，并让这些部件同时工作来提高指令的执行速度，是可以在一个时钟周期内同时发射多条指令的处理机。

23．超长指令字计算机：

由编译程序在编译时找出指令间潜在的并行性，进行适当调度安排，把多个能并行执行的操作组合在一起，成为一条具有多个操作段的超长指令，由这条超长指令控制VLIW机中多个互相独立工作的功能部件，每个操作段控制一个功能部件，相当于同时执行多条指令。24．超流水线计算机：

超级流水线结构是把每一个流水线(一个周期)分成多个(例如3个)子流水线，而在每一个子流水线中取出的仍只有一条指令，但总的来看，在一个周期内取出了三条指令。即在一个时钟周期内能够分时发射多条指令的处理机。

25．向量的分段开采技术：

当向量的长度大于向量寄存器的长度时，必须把长向量分成长度固定的段，采用循环结构处理这个长向量，这种技术称为向量循环开采技术，也称为向量分段开采技术。

三、简答题

1.简述实现软件移植的3个途径。

答：(1)系列机与兼容机(2)模拟与仿真(3)统一标准的高级语言

2.简述Amdahl定律

答：系统中某一部件由于采用某种更快的执行方式后整个系统性能的提高与这种执行方式的使用频率或占总执行时间的比例有关。性能提高的衡量指标为加速比，其定义为：

答：方法1：由上向下（Top-Down）方法2：由下向上（Bottom-Up）方法3：中间开始（Middle-Out）

4.简述冯。诺依曼计算机的特征。

答：一般认为其主要特征有以下几点：

(1)机器以运算器为中心。除了完成运算以外，机器内部的数据传输都经过运算器。各部件的操作以及它们之间的协调由控制器集中控制。

(2)存储器按一维线性编址，顺序访问存储器地址单元，每个存储单元的位数固定。

(3)程序存储，指令和数据无区别存放在存储器中，指令和数据一样可以送到运算器中进行运算，指令与数据的区别主要在于地址区域不同。

(4)指令在存储器中按其执行顺序存放，由一个顺序控制器（亦称程序计数器或指令计数器）指定即将被执行的指令地址。每读取一条指令后，计数器自动按顺序递增。

(5)指令由操作码和地址码组成，操作码指明操作类型，地址码指明操作数的地址和结果地址。

(6)数据以二进制表示。

5.什么是存储系统？

答：存储系统是两个或两个以上的速度、容量、价格不同的存储器采用硬件，软件或软、硬件结合的办法联结成一个系统，使得整个系统看起来象一个存储器，其速度接近其中最快的一个，容量接近其中最大的一个，价格接近其中最便宜的一个。

6.简述全相联映象规则。

答：

（1）主存与缓存分成相同大小的数据块。

（2）主存的某一数据块可以装入缓存的任意一块空间中。

7.简述直接相联映象规则。

答：

（1）主存与缓存分成相同大小的数据块。

（2）主存容量应是缓存容量的整数倍，将主存空间按缓存的容量分成区，主存中每一区的块数与缓存的总块数相等。

（3）主存中某区的一块存入缓存时只能存入缓存中块号相同的位置。

8.简述组相联映象规则。

答：

（1）主存与缓存分成相同大小的数据块。

（2）主存和Cache按同样大小划分成组。

（3）主存容量是缓存容量的整数倍，将主存空间按缓冲区的大小分成区，主存中每一区的组数与缓存的组数相同。

（4）当主存的数据调入缓存时，主存与缓存的组号应相等，也就是各区中的某一块只能存入缓存的同组号的空间内，但组内各块地址之间则可以任意存放，即从主存的组到Cache 的组之间采用直接映象方式；在两个对应的组内部采用全相联映象方式。

9.试述页式管理虚拟存储器的工作过程。

答：页式管理是将主存空间与虚存空间按固定的大小划分成块，每块称为一页。页的大小和划分与程序的逻辑功能无关，由操作系统软件来执行。一般而言，一页的大小应该是512Bit 的整数倍，因为辅助磁盘存储的物理块的大小为512Bit。虚页中的页称为虚页，实存中的各页称为实页，各虚页与实页之间按全相联方式映象，也就是虚页中的一页，可以存入主存中的任意一页的位置。当CPU给出所要访问的虚地址后，根据用户号访问基址寄存器，求得用户的页表首地址Pa，然后与虚地址中的虚页号P相加，得到该页的表目，由此表目中得到该页存入主存中的实页号为p，将该页号读出与页内地址组装即可得到主存的实际地址。

10.引起Cache与主存内容不一致的原因是什么？为了保持Cache的一致性，在单计算机系统中一般采取哪些措施？

答：不一致的原因：

(1) 由于CPU写Cache，没有立即写主存

(2) 由于I/O处理机或I/O设备写主存

采取措施：

（1）全写法，亦称写直达法(WT法—Write through)

方法：在对Cache进行写操作的同时，也对主存该内容进行写入。

（2）写回法（WB法—Write back）

方法：在CPU执行写操作时,只写入Cache,不写入主存。

11.影响虚拟存储器命中率的因素有哪些？它们是如何影响的？

答：

（1）页面大小：当页面比较小时，随着页面的增大，命中率明显提高，但当页面增大到一定值时，命中率不再增大，而随着页面的增大而下降。

（2）主存容量：当主存容量增加时，命中率不断提高；当容量增大到一定程度后，命中率的提高就不大了。

（3）页面调度方式：页面的调度都是发生在产生缺页中断时进行，因此在程序刚开始运行时命中率很低，为此可以采用预取式调度法，提高命中率。

12.模拟与仿真的主要区别和适合场合是什么？

答：模拟是指用软件的方法在一台计算机上，实现另一台计算机的指令系统，被模拟的机器是不存在的，称为虚拟机，执行模拟程序的机器称宿主机。由于模拟采用纯软件解释执行方法，因此运行速度较慢，实时性差。因此只适合于移植运行时间短，使用次数少，而且在时间上没有约束和限制的软件。

仿真是指用微程序的方法在一台计算机上实现另一台计算机的指令系统。执行微程序的机器为宿主机，被实现的为目标机。仿真的运行速度比模拟快，但仿真计算机的系统结构，因此对于系统结构差别较大的机器难于用仿真的方法实现软件移植。

13.简述计算机系统结构用软件实现和用硬件实现各自的优缺点。

答：硬件实现:速度快、成本高；灵活性差、占用内存少。

软件实现:速度低、复制费用低;灵活性好、占用内存多。

14. 简述字节多路、数组多路和选择通道的数据传送方式。

答：

（1）字节多路通道：用于连接多台慢速外设，一般采用字节交叉传送数据的方式，即连接在通道上的各个设备轮流占用一个很短的时间片（通常小于100微秒）传输一个字节。（2）选择通道：是指每一个通道连接一台高速外设，也可以连接多台相同的高速外设，但通道只能对各台外设串行服务。当某一设备工作时，则通道与该设备相连，一直到整个数组传送完后，才可能转向为其他设备服务。

（3）数组多路通道：数组多路通道是字节多路通道与选择通道工作方式的综合，是在数组传送的基础上，再分时为多个高速外设服务。它每次选择一个高速设备后传送一个数据块，并轮流为多台外围设备服务。每台高速外设，如磁盘，其工作时间有寻址时间与传送时间之分。而寻址时间很长，在这段时间中并不需要通道的控制，所以是通道空闲时间，那么通道可以为其他准备好的高速外设服务。

15.什么是程序直接定位方式？什么是程序静态定位方式？

答：(1)直接定位方式程序员在编写程序时或编译程序对源程序进行编译时，就已经确切知道该程序应占用的主存物理空间。因此可以直接使用实际主存物理地址来编写或编译程序。目前大多不用这种方式。

(2)静态定位方式专门用装入程序来完成并要求程序本身可以重定位。在程序装入主存的过程中，把那些带有标识的指令或数据中的逻辑地址全部变成主存的物理地址，集中一次完成地址变换，一旦装入主存就不能再变动了。

16.什么是程序动态定位方式？

答：动态定位方式是利用类似变址寻址方法，有硬件支持完成。程序装入主存时，指令或数据地址不作修改，只把主存的起始地址装入该程序对应的基址寄存器中。在程序运行时，利用地址加法器，指令中的逻辑地址与已经存放在基址寄存器中的程序起始地址相加，就形成了主存的物理地址。指令的地址码不需全部修改。

17.什么是指令的重叠解释方式？重叠解释方式有哪三种？

答：所谓重叠解释方式，即是在两条相邻指令的解释过程中，某些不同解释阶段在时间上存在重叠部分。重叠解释方式分三种：一次重叠、先行控制技术和多操作部件并行。

18.什么是数据相关，数据相关冲突可分为哪三种类型？

答：数据相关是在几条相近的指令间共用相同的操作数时发生的。例如，指令部件中的某一条指令在进行操作数地址计算时要用到一个通用寄存器的内容，而这个通用寄存器的内容又要由这条指令前的另一条指令产生，但前面那条指令还未进入执行部件，还未产生通用寄存器的内容，这时指令部件中的那条指令只能停下来等待。

数据相关冲突可分为RAW、WAR和WAW三种类型。

19.在指令编码中，缩短地址码的方法很多，请列出三种缩短地址码的方法，并说明理由。答：缩短地址码长度的方法很多，如：

(1)用间接寻址方式缩短地址码长度。在主存储器的低端开辟出一个专门用来存储地址的区域，由于表示存储器低端部分的地址所需的地址码长度可以很短，将逻辑地址码存入这些单元，可以达到缩短地址码的目的。

(2)用变址寻址方式缩短地址码长度。由于程序局部性原理，在变址寻址方式中使用的地址偏移量可以比较短；因此，可以把比较长的基地址放在变址寄存器中，在指令的地址码中只需给出比较短的地址偏移量。

(3)用寄存器间接寻址方式缩短地址码长度。由于寄存器的数量比较少，表示一个寄存器的地址只需很少几位，而一个寄存器足可以放下一个逻辑地址。

四、问答与计算题（第1题10分，第2、3题每题15分共40分）

1.某机主存容量为512KB，Cache的容量为32KB，每块的大小为16个字（或字节）。划出全相联方式主、缓存的地址格式、目录表格式及其容量。

答：主存块数：512K/16＝32K＝215；缓存块数：32K/16＝2K＝211；块内地址：16＝24

2.某机主存容量为512KB，Cache的容量为32KB，每块的大小为16个字（或字节）。划出直接相联方式主、缓存的地址格式、目录表格式及其容量。

答：主存区数：512K/32K＝16＝24；缓存块数：32K/16＝2K＝211；块内地址：16＝24

3.主存容量为512KB，Cache的容量为32KB，每块为64个字（或字节），缓存共分128组。划出组相联方式主、缓存的地址格式、目录表格式及其容量。

答：主存区数：512K/32K＝16＝24；缓存组数：128＝27；缓存块数：32K/64＝512＝29；

组内块数：512/128＝4＝22；块内地址：64＝26

4.什么是方体置换？写出方体置换函数的表达式，假设互联网有16个结点，请画出4个方体置换函数（即C0，C1，C2，C3）的输入端与输出端的连接关系。

答：方体置换是实现二进制地址编号中第k位位值不同的输入端输出端之间的连接。其表达式为：

C0立方置换函数：

C1立方置换函数：

0000 0000

1000 1000

C2立方置换函数：C3立方置换函数：

5.什么是均匀洗牌置换？写出均匀洗牌置换函数的表达式，假设互联网有16个结点，请画出均匀洗牌置换的输入端与输出端的连接关系。

答：均匀洗牌置换是将输入端分成数目相等的两半，前一半和后一半按序一个隔一个地从头至尾依次与输出端相连，即将输入端二进制地址循环左移一位即得到对应的输出端二进制地址。其函数关系可表示为：

图略

6.什么是PM2I置换？写出PM2I置换函数的表达式，假设互联网有16个结点，请画出PM2I 置换当i＝2时的输入端与输出端的连接关系。

答：PM2I是对输入端编号加减2的i次方后得到输出端的编号。其函数关系可表示为：

图略

7.在页式虚拟存储器中，一个程序由P1～P5共5个页面组成。在程序执行过程中依次访问的页面如下：P2，P3，P2，P1，P5，P2，P4，P5，P3，P2，P5，P2

假设系统分配给这个程序的主存有3个页面，分别采用FIFO、LFU和OPT三种页面替换算法对这3页主存进行调度。

（1）画出主存页面调入、替换和命中的情况表。

（2）统计三种页面替换算法的页命中率。

解：三种替换算法的替换过程：

页地址流 2 3 2 1 5 2 4 5 3 2 5 2

FIFO 2 2 2 2 5 5 5 5 3 3 3 3

命中3次 3 3 3 3 2 2 2 2 2 5 5

1 1 1 4 4 4 4 4 2

调调命调替替替命替命替替

进进中进换换换中换中换换

2 2 2 1 5 2 4 5

3 2 5 2

LRU 3 3 2 1 5 2 4 5 3 2 5

命中5次 3 2 1 5 2 4 5 3 3

调调命调替命替命替替命命

进进中进换中换中换换中中

OPT 2 2 2 2 2 2 4 4 4 2 2 2

命中6次 3 3 3 3 3 3 3 3 3 3 3

1 5 5 5 5 5 5 5 5 5

调调命调替命替命命替命命

进进中进换中换中中换中中

8.一个有快表和慢表的页式虚拟存储器，最多有64个用户，每个用户最多要用1024个页面，每页4K字节，主存容量8M字节。

（1）写出多用户虚地址的格式，并标出各字段的长度。

（2）写出主存地址的格式，并标出各字段的长度。

（3）快表的字长为多少位？分几个字段？各字段的长度为多少位？

（4）慢表的容量是多少个存储字？每个存储字的长度为多少位？

答：用户号：64＝26，虚页号：1024＝210，页内地址：4K＝212，主存页数：8M/4K＝211

（1）多用户虚地址：

用户号（6位）＋虚页号（10位）＋页内地址（12位）共28位

（2）主存地址：

主存实页号（11位）＋页内地址（12位）共23位

（3）快表字长27位；分3个字段：用户号6位，虚页号10位，实页号11位

（4）慢表容量为2（6+10），每个存储字长为：主存页号＋1＝12位。

9.一个程序由五个虚页组成，采用LFU替换算法，在程序执行过程中依次访问的地址流如下：

4，5，3，2，5，1，3，2，3，5，1，3

（1）可能的最高页命中率是多少？

（2）至少要分配给该程序多少个主存页面才能获得最高的命中率。

（3）如果在程序执行过程中访问一个页面，平均要对该页面内的存储单元访问1024次，求访问存储单元的命中率。

解：（1）由于在页地址流中互不相同的页共有5页，因此最多分配5个主存页面就可获得最高页中命中率，可能的最高命中率为

（2）因为LFU替换算法为堆栈型换算法，即随着分配给该程序的主存页面数的减少，其命中率单调递减，所以为获得最高命中率H＝7/12，可采用逐步减少所分配的主存页数的方法来推算，若分配n个主存页面时可获得最高命中率，但分配n－1个页面时命中率却减少，则此时我们可以得出这样的结论：至少要分配给该程序n个主存页面才能获得最高的命中率。

由表可知，至少要分配给该程序4个主存页面才能获得最高的命中率。

页地址流 4 5 3 2 5 1 3 2 2 5 1 3

S(1) 4 5 3 2 5 1 3 2 2 5 1 3

堆S(2) 4 5 3 2 5 1 3 3 2 5 1

栈S(3) 4 5 3 2 5 1 1 3 2 5

内S(4) 4 4 3 2 5 5 1 3 2

容S(5) 4 4 4 4 4 4 4

S(6)

n=1 H

实n=2 H

页n=3 H H

数n=4 H H H H H H H

n>=5 H H H H H H H

（3）访问存储单元的命中率为

值得说明的是，在此例中，尽管LFU属于堆栈替换算法，但是分配的实际页数n也并不是越多越好，当命中率H达到饱和后，实际页数n的增加不仅不会提高命中率，反而会使实存的利用率下降。

10. 假设一台模型计算机共有10种不同的操作码，如果采用固定长操作码需要4位。已知各种操作码在程序中出现的概率如下表所示，计算采用Huffman编码法的操作码平均长度，并计算固定长操作码和Huffman操作码的信息冗余量（假设最短平均长度H＝3.1位）。指令序号指令使用频度Pi 指令序号指令使用频度Pi

I1 0.17 I6 0.09

I2 0.15 I7 0.08

I3 0.15 I8 0.07

I4 0.13 I9 0.03

I5 0.12 I10 0.01

答：构造Huffman树如下：

Huffman编码如下表：

指令号指令使用频度Pi Huffman编码码长指令号指令使用频度Pi Huffman 编码码长

I1 0.17 10 2 I6 0.09 0110 4 I2 0.15 000 3 I7 0.08 0111 4 I3 0.15 001 3 I8 0.07 1110 4 I4 0.13 010 3 I9 0.03 11110 5 I5 0.12 110 3 I10 0.01 11111 5 Huffman编码的平均码长为：

冗余量＝（3.15－3.10）/3.15＝1.59%

固定码长：log210＝4

冗余量＝（4－3.10）/4＝22.5%

13．一台模型机的各条指令的频度如下：

ADD（加）：43% SHR（右移）：1%

SUB（减）：13% CLL（循环左移）：2%

JOM（按页转移）：6% CLA（累加器清0）：22%

STO（存）：5% STP（停机）：1%

JMP（转移）：7％

试设计这9条指令的哈夫曼编码的操作码表示以及2-4等长扩展操作码表示，并计算这两种表示的平均操作码长度。

答：构造Huffman树如下：

Huffman编码如下表：

指令指令使用频度Pi Huffman 编码码长 2-4扩展码码长

ADD 0.43 0 1 00 2

CLA 0.22 100 3 01 2

SUB 0.13 101 3 1000 4

JMP 0.07 1100 4 1001 4

JOM 0.06 1101 4 1010 4

STO 0.05 1110 4 1011 4

CLL 0.02 11110 5 1100 4

SHR 0.01 111110 6 1101 4

STP 0.01 111111 6 1110 4

Huffman编码的平均码长为：

2-4编码的平均码长为：

14．用一条4段浮点加法器流水线求8个浮点数的和: Z＝A＋B＋C＋D＋E＋F＋G＋H,求流水线的吞吐率、加速比和效率,其中△t1=△t2=△t3=△t4=△t。

答：可对原式作一简单变化，得到：

Z＝[（A＋B）＋（C＋D）]＋[（E＋F）＋（G＋H）]

7个加法8个数的流水线时空图如下：

从流水线的时空图中可以很清楚地看到，7个浮点加法共用了15个时钟周期。

流水线的吞吐率为：

流水线的加速比为：

流水线的效率为：

15．设有两个向量A，B，各有4个元素，若在如图所示的静态双功能流水线上，计算向量点积：

其中，1→2→3→5组成加法流水线，1→4→5组成乘法流水线。

又设每个流水线所经过的时间均为△t，而且流水线的输出结果可以直接返回到输入或暂存于相应的缓冲寄存器中，其延迟时间和功能切换所需的时间都可以忽略不计。请使用合理的算法，能使完成向量点积A*B所用的时间最短，并求出流水线在此期间实际的吞吐率TP 和效率E。

解：首先，应选择适合于静态流水线工作的算法。对于本题，应先连续计算al*bl、a2*b2、a3*b3和a4*b4共4次乘法，然后功能切换，按((albl+a2b2)+(a3b3+a4b4))经3次加法来求得最后的结果。按此算法可画出流水线工作时的时空图。

由图可见，总共在15个△t的时间内流出7个结果，所以在这段时间里，流水线的实际吞吐率TP为7/15△t。

若不用流水线，由于一次求积需3△t,产生上述结果就需要4′3△t+3′4△t=24△t。因此,加速比为S=24△t/(15△t)=1.6。

该流水线的效率可用阴影区面积和全部5个段的总时空图面积之比求得，即

计算机系统结构三四章作业及答案

3.1 简述流水线技术的特点。（1）流水线把一个处理过程分解为若干个子过程，每个子过程由一个专门的功能部件来实现。因此，流水线实际上是把一个大的处理功能部件分解为多个独立的功能部件，并依靠它们的并行工作来提高吞吐率。（2）流水线中各段的时间应尽可能相等，否则将引起流水线堵塞和断流。（3）流水线每一个功能部件的前面都要有一个缓冲寄存器，称为流水寄存器。（4）流水技术适合于大量重复的时序过程，只有在输入端不断地提供任务，才能充分发挥流水线的效率。（5）流水线需要有通过时间和排空时间。在这两个时间段中，流水线都不是满负荷工作。 3.2 解决流水线瓶颈问题有哪两种常用方法？答：细分瓶颈段与重复设置瓶颈段 3.3 有一条指令流水线如下所示：（1 用两给出条指（1）（24? 变八级流水线（细分） ? 重复设置部件 )(ns 85 1 T n TP 1pipeline -== 3.4 有一个流水线由4段组成，其中每当流过第三段时，总要在该段循环一次，然后才能流到第4段。如果每段经过一次所需的时间都是△t ，问：（1）当在流水线的输入端连续地每△t 时间输入一个任务时，该流水线会发生什么情况？（2）此流水线的最大吞吐率为多少？如果每2△t 输入一个任务，连续处理10个任务时，其实际吞吐率和效率是多少？（3）当每段时间不变时，如何提高流水线的吞吐率？人连续处理10个任务时，其吞吐率提高多少？解：（1）会发生流水线阻塞情况。

（2）（3）重复设置部件吞吐率提高倍数＝ t t ??2310 75 ＝1.64 3.5 有一条动态多功能流水线由5段组成，加法用1、3、4、5段，乘法用1、2、5段，第2段的时间为2△t ，其余各段的时间均为△t ，而且流水线的输出可以直接返回输入端或暂存于相应的流水线寄存器中。现在该流水线上计算 ∏=+4 1 )(i i i B A ，画出时空图，并计算其吞吐率、加速比和效率。＋B 4；再计算由图可见，它在18个△t 时间中，给出了7个结果。所以吞吐率为：如果不用流水线，由于一次求积需3△t ，一次求和需5△t ，则产生上述7个结果共需（4×5+3×3）△t =29△t 。所以加速比为：该流水线的效率可由阴影区的面积和5个段总时空区的面积的比值求得： 3.6 在一个5段流水线处理机上,各段执行时间均为△t,需经9△t 才能完成一个任务,其预约表如下所示。段23 时间入 A 1 B 1 A 2 B 2 A 3 B 3 A 4 B 4 A B C D A × B C ×D

计算机体系结构习题(含答案)

第2章课后习题 1、尾数用补码、小数表示，阶码用移码、整数表示，尾数字长p=6（不包括符号位），阶码字长q=6（不包括符号位），为数基值r m=16，阶码基值r e=2。对于规格化浮点数，用十进制表达式写出如下数据（对于前11项，还要写出16进值编码）。（1）最大尾数（8）最小正数（2）最小正尾数（9）最大负数（3）最小尾数（10）最小负数（4）最大负尾数（11）浮点零（5）最大阶码（12）表数精度（6）最小阶码（13）表数效率（7）最大正数（14）能表示的规格化浮点数个数 2．一台计算机系统要求浮点数的精度不低于10-7.2，表数围正数不小于1038，且正、负数对称。尾数用原码、纯小数表示，阶码用移码、整数表示。 (1) 设计这种浮点数的格式 (2) 计算（1）所设计浮点数格式实际上能够表示的最大正数、最大负数、表数精度和表数效率。 3．某处理机要求浮点数在正数区的积累误差不大于2-p-1，其中，p是浮点数的尾数长度。 (1) 选择合适的舍入方法。 (2) 确定警戒位位数。 (3) 计算在正数区的误差围。 4．假设有A和B两种不同类型的处理机，A处理机中的数据不带标志符，其指令字长和数据字长均为32位。B处理机的数据带有标志符，每个数据的字长增加至36位，其中有4位是标志符，它的指令数由最多256条减少到不到64条。如果每执行一条指令平均要访问两个操作数，每个存放在存储器中的操作数平均要被访问8次。对于一个由1000条指令组成的程序，分别计算这个程序在A处理机和B处理机中所占用的存储空间大小（包括指令和数据），从中得到什么启发？ 5．一台模型机共有7条指令，各指令的使用频率分别为35%，25%，20%，10%，5%，3%和2%，有8个通用数据寄存器，2个变址寄存器。 (1) 要求操作码的平均长度最短，请设计操作码的编码，并计算所设计操作码的平均长度。 (2) 设计8字长的寄存器-寄存器型指令3条，16位字长的寄存器-存储器型变址寻址方式指令4条，变址围不小于±127。请设计指令格式，并给出各字段的长度和操作码的编码。 6．某处理机的指令字长为16位，有双地址指令、单地址指令和零地址指令3类，并假设每个地址字

计算机体系结构期末复习

计算机体系结构期末复习资料 1.并行性：是指在同一时刻或者是同一时间间隔内完成两种或两种以上性质相同或不同的工作。 2.CPI：每条指令执行时所花费的平均时钟周期。 3.体系结构：即计算机的属性，即概念性结构与功能特性。 4.Amdahl定理：加快某部件执行速度所获得的系统性能加速比，受限于该部件在系统中所占的重要性。 5.信息存储的整数边界：信息在主存中存放的起始地址必须是该信息（字节数）的整数倍。 6.指令系统的正交性：指在指令中各个不同含义的字段，在编码时应互不相关，相互独立。 7.流水线技术：是指将一个重复的时序过程，分解成为若干子过程，而每个过程都可有效在其专用功能段上与其他子过程同时执行。 8.定向技术：在某条指令产生一个结果之前，其他指令并不直接需要该计算结果，如果能将该计算结果从其他产生的地方直接送到其他指令需要它的地方，那么就可以避免暂停的技术就叫定向技术。 9.相关：衡量两个随机变量之间相关程度的指标。 10.向量流水处理机：是指处理机具有向量数据表示并通过向量指令对向量的各元素进行处理。、

11.定向：将计算结果从其产生的地方直接送到其他指令需要它的地方，或所有需要它的功能单元，避免暂停。 12.指令集的并行：当指令之间不存在相关时，它们在流水线中是可以重叠起来并行执行。 13.记分牌技术：流出和读操作数。在没有结构冲突时,尽可能早地执行没有数据冲突的指令,实现每个时钟周期执行一条指令。如果某条指令被暂停,而后面的指令与流水线中正在执行或被暂停的指令都不相关,是这些指令可以跨越它,继续流出和执行下去。 14.Tomasulo算法：寄存器换名是通过保留站和流出逻辑来共同完成,当指令流出时,如果其操作数还没有计算出来,则该指令中相应的寄存器换名将产生这个操作数的保留站的标识。因此,指令流出到保留站后,其操作数寄存器或者换成了数据本身,或换成了保留站的标识,和寄存器无关。后面指令对该寄存器的写入操作就不会产生WAR冲突。 15.替换算法：由于主存中的块比Cache中的块多，所以当要从主存中调一个块到Cache中时，会出现该块所映象到的一组（或一个）Cache块已全部被占用的情况。这时，需要被迫腾出其中的某一块，以接纳新调入的块。

计算机系统结构网上作业

计算机系统结构作业参考答案一、 1、试述现代计算机系统的多级层次结构。计算机系统具有层次性，它由多级层次结构组成。从功能上计算机系统可分为五个层次级别：第一级是设计级。这是一个硬件级，它由机器硬件直接执行。第二级是一般机器级，也称为机器语言级。它由微程序解释系统.这一级是硬件级。第三级是操作系统级，它由操作系统程序实现。这些操作系统由机器指令和广义指令组成，这些广义指令是操作系统定义和解释的软件指令。这一级也称混合级。第四级是汇编语言级。它给程序人员提供一种符号形式的语言，以减少程序编写的复杂性。这一级由汇编程序支持执行。第五级是高级语言级。这是面向用户为编写应用程序而设置的。这一级由各种高级语言支持。 2、试述RISC设计的基本原则和采用的技术。答：一般原则： (1)确定指令系统时，只选择使用频度很高的指令及少量有效支持操作系统，高级语言及其它功能的指令，大大减少指令条数，一般使之不超过100条； (2)减少寻址方式种类，一般不超过两种； (3)让所有指令在一个机器周期内完成； (4)扩大通用寄存器个数，一般不少于32个，尽量减少访存次数； (5)大多数指令用硬联实现，少数用微程序实现； (6)优化编译程序，简单有效地支持高级语言实现。

基本技术： (1)按RISC一般原则设计，即确定指令系统时，选最常用基本指令，附以少数对操作系统等支持最有用的指令，使指令精简。编码规整，寻址方式种类减少到1、2种。 (2)逻辑实现用硬联和微程序相结合。即大多数简单指令用硬联方式实现，功能复杂的指令用微程序实现。 (3)用重叠寄存器窗口。即：为了减少访存，减化寻址方式和指令格式，简有效地支持高级语言中的过程调用，在RISC机器中设有大量寄存嚣，井让各过程的寄存器窗口部分重叠。 (4)用流水和延迟转移实现指令，即可让本条指令执行与下条指令预取在时间上重叠。另外，将转移指令与其前面的一条指令对换位置，让成功转移总是在紧跟的指令执行之后发生，使预取指令不作废，节省一个机器周期。 (5)优化设计编译系统。即尽力优化寄存器分配，减少访存次数。不仅要利用常规手段优化编译，还可调整指令执行顺序，以尽量减少机器周期等。 3、试述全相联映像与直接映像的含义及区别（1）全相连映像主存中任何一个块均可以映像装入到Cache中的任何一个块的位置上。主存地址分为块号和块内地址两部分，Cache地址也分为块号和块内地址。Cache的块内地址部分直接取自主存地址的块内地址段。主存块号和Cache块号不相同，Cache块号根据主存块号从块表中查找。Cache保存的各数据块互不相关，Cache必须对每个块和块自身的地址加以存储。当请求数据时，Cache控制器要把请求地址同所有的地址加以比较，进行确认。（2）直接映像把主存分成若干区，每区与Cache大小相同。区内分块，主存每个区中块的大小和Cache 中块的大小相等，主存中每个区包含的块的个数与Cache中块的个数相等。任意一个主存块只能映像到Cache中唯一指定的块中，即相同块号的位置。主存地址分为三部分：区号、块号和块内地址，Cache地址分为：块号和块内地址。直接映像方式下，数据块只能映像到Cache中唯一指定的位置，故不存在替换算法的问题。它不同于全相连Cache，地址仅需比较一次。（3）区别：全相连映像比较灵活，块冲突率低，只有在Cache中的块全部装满后才会出现冲突，Cache 利用率高。但地址变换机构复杂，地址变换速度慢，成本高。直接映像的地址变换简单、速度快，可直接由主存地址提取出Cache地址。但不灵活，块冲突率较高，Cache空间得不到充分利用。 4. 画出冯?诺依曼机的结构组成？

计算机体系结构习题答案解析

第1章计算机系统结构的基本概念 1.1 解释下列术语层次机构：按照计算机语言从低级到高级的次序，把计算机系统按功能划分成多级层次结构，每一层以一种不同的语言为特征。这些层次依次为：微程序机器级，传统机器语言机器级，汇编语言机器级，高级语言机器级，应用语言机器级等。虚拟机：用软件实现的机器。翻译：先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序，然后再在这低一级机器上运行，实现程序的功能。解释：对于高一级机器上的程序中的每一条语句或指令，都是转去执行低一级机器上的一段等效程序。执行完后，再去高一级机器取下一条语句或指令，再进行解释执行，如此反复，直到解释执行完整个程序。计算机系统结构：传统机器程序员所看到的计算机属性，即概念性结构与功能特性。透明性：在计算机技术中，把这种本来存在的事物或属性，但从某种角度看又好像不存在的概念称为透明性。计算机组成：计算机系统结构的逻辑实现，包含物理机器级中的数据流和控制流的组成以及逻辑设计等。计算机实现：计算机组成的物理实现，包括处理机、主存等部件的物理结构，器件的集成度和速度，模块、插件、底板的划分与连接，信号传输，电源、冷却及整机装配技术等。系统加速比：对系统中某部分进行改进时，改进后系统性能提高的倍数。 Amdahl定律：当对一个系统中的某个部件进行改进后，所能获得的整个系统性能的提高，受限于该部件的执行时间占总执行时间的百分比。程序的局部性原理：程序执行时所访问的存储器地址不是随机分布的，而是相对地簇聚。包括时间局部性和空间局部性。 CPI：每条指令执行的平均时钟周期数。测试程序套件：由各种不同的真实应用程序构成的一组测试程序，用来测试计算机在各个方面的处理性能。存储程序计算机：冯·诺依曼结构计算机。其基本点是指令驱动。程序预先存放在计算机存储器中，机器一旦启动，就能按照程序指定的逻辑顺序执行这些程序，自动完成由程序所描述的处理工作。系列机：由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。软件兼容：一个软件可以不经修改或者只需少量修改就可以由一台计算机移植到另一台计算机上运行。差别只是执行时间的不同。向上（下）兼容：按某档计算机编制的程序，不加修改就能运行于比它高（低）档的计算机。向后（前）兼容：按某个时期投入市场的某种型号计算机编制的程序，不加修改地就能

系统结构期末考试试题及答案

得分评分人填空题: （20分，每题2 分）单选题：（10分，每题1分） A.任何虚页都可装入主存中任何实页的位置 B. 一个虚页只装进固定的主存实页位置《计算机系统结构》期末考试试卷（A ）得分注：1、共100分，考试时间120分钟。 2、此试卷适用于计算机科学与技术本科专业。 1、."启动I/O"指令是主要的输入输出指令，是属于（ A. 目态指令 B.管态指令 C.目态、管态都能用的指令 D.编译程序只能用的指令 2、输入输出系统硬件的功能对（B ）是透明的 A.操作系统程序员 B.应用程序员 C.系统结构设计人员 D.机器语言程序设计员 3、全相联地址映象是指（A ） C. 组之间固定，组内任何虚页可装入任何实页位置 D.组间可任意装入，组内是固定装入 4、（ C ）属于MIMD 系统结构 A.各处理单元同时受一个控制单元的管理 B.各处理单元同时受同个控制单元送来的指令 C.松耦合多处理机和多计算机系统 D. 阵列处理机 5、多处理机上两个程序段之间若有先写后读的数据相关，则（ B ） A.可以并行执行 B.不可能并行 C.任何情况均可交换串行 D.必须并行执行 6、计算机使用的语言是（B ） A.专属软件范畴，与计算机体系结构无关 B.分属于计算机系统各个层次 C.属于用以建立一个用户的应用环境 D. 属于符号化的机器指令 7、指令执行结果出现异常引起的中断是（ C ） A.输入/输出中断 B.机器校验中断 C.程序性中断 D.外部中断 &块冲突概率最高的 Cache 地址映象方式是（A ） A.直接 B .组相联 C .段相联 D .全相联 9、组相联映象、LRU 替换的Cache 存储器，不影响 Cache 命中率的是（B ） A.增大块的大小 B .增大主存容量 C .增大组的大小 D .增加Cache 中的块数 10、流水处理机对全局性相关的处理不包括（C ） A.猜测法 B.提前形成条件码 C.加快短循环程序的执行 D.设置相关专用通路

高级计算机体系结构作业汇总(非标准答案)

1.Explain the Concepts Computer Architecture 系统结构由程序设计者所看到的一个计算机系统的属性。即计算机系统的软硬件界面。 Advanced CA 高级系统结构新型计算机系统结构。基于串行计算机结构，研究多指令多数据计算机系统，具有并发、可扩展和可编程性。为非冯式系统结构。 Amdahl law Amdahl定律系统中某部件由于采用某种方式时系统性能改进后，整个系统性能的提高与该方式的使用频率或占的执行时间的比例有关。 SCALAR PROCESSING 标量处理机在同一时间内只处理一条数据。 LOOK-AHEAD 先行技术通过缓冲技术和预处理技术，解决存储器冲突，使运算器能够专心与数据的运算，从而大幅提高程序的执行速度。 PVP 向量型并行计算处理机以流水线结构为主的并行处理器。 SMP 对称多处理机系统任意处理器可直接访问任意内存地址,使用共享存储器，访问延迟、带宽、机率都是等价的。MPP 大规模并行计算机系统物理和逻辑上均是分布内存，能扩展至成百上千处理器，采用专门设计和定制的高通信带宽和低延迟的互联网络。 DSM 分布式共享存储系统内存模块物理上局部于各个处理器内部,但逻辑上是共享存储的。 COW 机群系统每个节点都是一个完整的计算机，各个节点通过高性能网络相互连接，网络接口和I/O总线松耦合连接，每个节点有完整的操作系统。 GCE 网格计算环境利用互联网上的计算机的处理器闲置处理能力来解决大型计算问题的一种科学计算。 CISC 复杂指令集计算机

通过设置一些复杂的指令，把一些原来由软件实现的常用功能改用硬件实现的指令系统实现，以此来提高计算机的执行速度。 RISC 精简指令集计算机尽量简化计算机指令功能，只保留那些功能简单，能在一个节拍内执行完的指令，而把复杂指令用段子程序来实现。 VMM 虚拟机监视器作为软硬件的中间层，在应用和操作系统所见的执行环境之间。 SUPERCOMPUTER 超级计算机数百数千甚至更多的处理器组成的能计算普通计算机不能完成的大型复杂问题的计算机。SVM 共享虚拟存储器存储器虚拟化为一个共享的存储器，并提供单一的地址空间。 MAINFRAME 大型计算机作为大型商业服务器，一般用于大型事务处理系统，特别是过去完成的且不值得重新编写的数据库应用系统方面。 COMPUTER SYSTEM ON CHIP 片上计算机系统在单个芯片上集成的一个完整系统。 PARALLEL ARCHITECTURE INTO SINGLE CHIP 单片并行结构在单个芯片上采用的并行体系结构 MOORE law Moore定律当价格不变时，集成电路上可容纳的晶体管数目，约每隔18个月便会增加一倍，性能也将提升一倍。 UMA 一致存储访问采用集中式存储的模式，提供均匀的存储访问。 NUMA 非一致存储访问内存模块局部在各个结点内部，所有局部内存模块构成并行机的全局内存模块。 COMA 全高速缓存存储访问采用分布式存储模式，通过高速缓存提供快速存储访问。 CC-NUMA 全高速缓存非一致性均匀访问存在专用硬件设备保证在任意时刻，各结点Cache中数据与全局内存数据的一致性。NORMA 非远程存储访问

《计算机体系结构》期末复习题标准答案

《计算机体系结构》期末复习题答案

————————————————————————————————作者：————————————————————————————————日期：

《计算机体系结构》期末复习题答案系别_________ 班级_________ 姓名__________ 学号__________ 一、填空题（每空1分） 1.按照弗林（Flynn）分类法，计算机系统可以分为4类：SISD计算机、（SIMD计算机）、（MISD计算机）和（MIMD计算机）。 2. 改进之后的冯?诺依曼计算机的只要特点是存储器为中心，总线结构，分散控制。 3. 当前计算机系统中的存储系统是一个层次结构，其各层分别为：（通用寄存器，高速缓存，主存，辅存，脱机大容量存储器）。 4.高速缓冲存储器的地址映象方式有三种，它们分别是：（全向量方式，直接相联方式，组相联方式）。 5.虚拟存储器的三种管理方式是（段式管理，页式管理和段页式管理）。 6.目前计算机中常用数据有（用户定义数据，系统数据和指令数据）三种类型。 7.通常可能出现的流水线的相关性有（资源相关，数据相关和控制相关）。 8.解决中断引起的流水线断流的方法有（不精确断点法和精确断点法）。 9.目前向量处理机的系统结构有两种：（存储器－存储器型和寄存器－寄存器型）。 10.通用计算机基本指令分为5类，它们分别是：（数据传送类，运算类，程序控制类，输入输出类，处理机控制和调试类）。 11．执行指令x1=x2+x3；x4=x1-x5会引起（RAW）类型的数据相关，执行指令x5=x4*x3；x4=x0+x6会引起（W AR）类型的数据相关，执行指令x6=x1+x2；x6=x4*x5会引起（WA W）类型的数据相关。 12．多计算机网络中，通常出现的4种通信模式是（单播模式，选播模式，广播模式和会议模式）。 13.传统的冯?诺依曼计算机是以控制驱动方式工作，以数据驱动方式工作的典型计算机是（数据流计算机），以需求驱动方式工作的典型计算机是（归约机），以模式匹配驱动方式工作的典型计算机是（人工智能计算机）。二、名词解释（每题2分） 1.计算机体系结构：计算机系统结构就是计算机的机器语言程序员或编译程序编写者所看到的外特性，是硬件子系统的概念结构及其功能特性。 2.系列机：所谓系列机是指同一厂家生产的具有相同的系统结构，但采取了不同的组成和实现的技术方案，形成了不同型号的多种机型。 3.模拟: 模拟是指用软件的方法在一台计算机上，实现另一台计算机的指令系统，被模拟的机器是不存在的，称为虚拟机，执行模拟程序的机器称宿主机。 4.程序的局部性原理: 程序访问局部性原理说明了计算机在程序执行过程中呈现出的一种规律，即程序往往重

计算机系统结构期末考试题目

第一章： 1.计算机系统结构的定义答：由程序设计者看到的一个计算机系统的属性，即概念性结构和功能特性。 2.透明性概念答：在计算机技术中，一种本来是存在的事物或属性，但从某种角度看似乎不存在，称为透明性现象。 3.兼容性向后兼容兼容性：同一个软件可以不加修改地运行于系统结构相同的各档机器，可获得相同的结果，差别只在于不同的运行时间。向后兼容：按某个时期投入市场的某种型号机器编制的程序，不加修改就能运行于在它之后投入市场的机器。 4.Amdahl定律答：系统中某一部件由于采用某种更快的执行方式后整个系统性能的提高与这种执行方式的使用频率或占总执行时间的比例有关。 5.CPI 答：每条指令的平均时钟周期数。 6.MIPS 答：每秒百万条指令数！MIPS=时钟频率/(CPI*10^6) 7.MFLOPS 答：每秒百万次浮点操作次数。MFLOPS=程序中的浮点操作次数/(执行时间*10^6) 8.命中率的概念答： 9.Flynn分类法是按指令流和数据流的多倍性特征进行计算机系统结构的划分答：①单指令流单数据流SISD ②单指令流多数据流SIMD ③多指令流单数据流MISD（实际不存在）④多指令流多数据流MIMD 10.计算机系统设计的定量原理（四个）答：①加快经常性事件的速度②Amdahl定律③CPU性能公式④访问的局部性原理11.CPI和加速比的计算答：CPI=CPU时钟周期数/IC CPU时间=CPU时钟周期数/频率 CPU时间=CPU时钟周期*时钟周期长加速比=（采用改进措施后的性能）/（没有采用改进措施前的性能） =(没有采用改进措施前执行某任务的时间)/(采用改进措施后执行某任务的时间) 12.软硬件实现的特点硬件实现：速度快、成本高；灵活性差、占用内存少软件实现：速度低、复制费用低；灵活性好、占用内存多 13.系统评价的标准 ①运算速度②存储器系统③其他性能④成本标准

计算机体系结构_第一次作业

计算机体系结构第一章 1.11 Availability is the most important consideration for designing servers, followed closely by scalability and throughput. a. We have a single processor with a failures in time(FIT) of 100. What is the mean time to failure (MTTF) for this system? b. If it takes 1 day to get the system running again, what is the availability of the system? c. Imagine that the government, to cut costs, is going to build a supercomputer out of inexpensive computers rather than expensive, reliable computers. What is the MTTF for a system with 1000 processors? Assume that if one fails, they all fail. 答： a. 平均故障时间(MTTF)是一个可靠性度量方法，MTTF的倒数是故障率，一般以每10亿小时运行中的故障时间计算(FIT)。因此由该定义可知1/MTTF=FIT/10＾9，所以MTTF=10^9/100=10^7。b. 系统可用性=MTTF/(MTTF+MTTR)，其中MTTR为平均修复时间，在该题目中表示为系统重启时间。计算10^7/(10^7+24)约等于1. c. 由于一个处理器发生故障，其他处理器也不能使用，所以故障率为原来的1000倍，所以MTTF值为单个处理器MTTF的1/1000即10^7/1000=10^4。 1.14 In this exercise, assume that we are considering enhancing

计算机体系结构习题与答案

一、复习题 1．简述冯?诺依曼原理，冯?诺依曼结构计算机包含哪几部分部件，其结构以何部件为中心？答：冯?诺依曼理论的要点包括：指令像数据那样存放在存储器中，并可以像数据那样进行处理；指令格式使用二进制机器码表示；用程序存储控制方式工作。这3条合称冯?诺依曼原理冯?诺依曼计算机由五大部分组成：运算器、控制器、存储器、输入设备、输出设备，整个结构一般以运算器为中心，也可以以控制器为中心。 (P51-P54) 2．简述计算机体系结构与组成、实现之间的关系。答：计算机体系结构通常是指程序设计人员所见到的计算机系统的属性，是硬件子系统的结构概念及其功能特性。计算机组成（computer organization）是依据计算机体系结构确定并且分配了硬件系统的概念结构和功能特性的基础上，设计计算机各部件的具体组成，它们之间的连接关系，实现机器指令级的各种功能和特性。同时，为实现指令的控制功能，还需要设计相应的软件系统来构成一个完整的运算系统。计算机实现，是计算机组成的物理实现, 就是把完成逻辑设计的计算机组成方案转换为真实的计算机。计算机体系结构、计算机组成和计算机实现是三个不同的概念，各自有不同的含义，但是又有着密切的联系，而且随着时间和技术的进步，这些含意也会有所改变。在某些情况下，有时也无须特意地去区分计算机体系结构和计算机组成的不同含义。 (P47-P48) 3．根据指令系统结构划分，现代计算机包含哪两种主要的体系结构？答：根据指令系统结构划分，现代计算机主要包含：CISC和RISC两种结构。 (P55) 4．简述RISC技术的特点？答：从指令系统结构上看，RISC 体系结构一般具有如下特点： (1) 精简指令系统。可以通过对过去大量的机器语言程序进行指令使用频度的统计，来选取其中常用的基本指令，并根据对操作系统、高级语言和应用环境等的支持增设一些最常用的指令; (2) 减少指令系统可采用的寻址方式种类，一般限制在2或3种; (3) 在指令的功能、格式和编码设计上尽可能地简化和规整，让所有指令尽可能等长; (4) 单机器周期指令，即大多数的指令都可以在一个机器周期内完成，并且允许处理器在同一时间内执行一系列的指令。 (P57-58) 5．有人认为，RISC技术将全面替代CISC，这种观点是否正确，说明理由？答：不正确。与CISC 架构相比较，RISC计算机具备结构简单、易于设计和程序执行效率高的特点，但并不能认为RISC 架构就可以取代CISC 架构。事实上，RISC 和CISC 各有优势，CISC计算机功能丰富，指令执行更加灵活，这些时RISC计算机无法比拟的，当今时代，两者正在逐步融合，成为CPU设计的新趋势。 (P55-59) 6．什么是流水线技术？答：流水线技术，指的是允许一个机器周期内的计算机各处理步骤重叠进行。特别是，当执行一条指令时，可以读取下一条指令，也就意味着，在任何一个时刻可以有不止一条指令在“流水线”上，每条指令处在不同的执行阶段。这样，即便读取和执行每条指令的时间保持不变，而计算机的总的吞吐量提高了。 (P60-62) 7．多处理器结构包含哪几种主要的体系结构，分别有什么特点？答：多处理器系统：主要通过资源共享，让共享输入/输出子系统、数据库资源及共享或不共享存储的一组处理机在统一的操作系统全盘控制下，实现软件和硬件各级上相互作用，达到时间和空间上的异步并行。 SIMD计算机有多个处理单元，由单一的指令部件控制，按照同一指令流的要求为他们分配各不相同的数据并进行处理。系统结构为由一个控制器、多个处理器、多个存贮模块和

2020.4《计算机体系结构》期末试卷A含答案

《计算机体系结构》期末考试A卷 (总分：100分，时间：100分钟) 姓名：周元华专业：计算机科学与技术学号： 18260070164016 学习中心：上海弘成一、填空题（每空1分，共14分） 1.高速缓冲存储器的地址映象方式有三种，它们分别是：全向量方式，直接相联方式，组相连方式。 2.虚拟存储器的三种管理方式是段式管理，页式管理和段页式管理。 3.从主存的角度来看，“Cache—主存”层次的目的是为了提高速度，而“主存—辅存”层次的目的是为了扩大容量 4.根据指令间的对同一寄存器读和写操作的先后次序关系，数据相关冲突可分为读与写（RAM）、写与读（WAR）和写与写（WAW）三种类型。 5.当代计算机体系结构的概念包括指令集结构、计算机组成和计算机实现三个方面的内容二、名词解释（每题2分，共16分）计算机体系结构：计算机体系结构是指根据属性和功能不同而划分的计算机理论组成部分及计算机基本工作原理、理论的总称。其中计算机理论组成部分并不单与某一个实际硬件相挂钩，如存储部分就包括寄存器、内存、硬盘等。兼容机：兼容机，就是由不同公司厂家生产的具有相同系统结构的计算机。简单点说，就是非厂家原装，而改由个体装配而成的机器，其中的元件可以是同一厂家出品，但更多的是整合各家之长的计算机。写直达法：写直达法一般指全写法。全写法（write-through）：又称写直达法、写穿法，透写法，Cache使用方式之一。高速缓冲存储器: 高速缓冲存储器（Cache）其原始意义是指存取速度比一般随机存取记忆体（RAM）来得快的一种RAM，一般而言它不像系统主记忆体那样使用DRAM技术，而使用昂贵但较快速的SRAM 技术，也有快取记忆体的名称。高速缓冲存储器是存在于主存与CPU之间的一级存储器，由静态存储芯片(SRAM)组成，容量比较小但速度比主存高得多，接近于CPU的速度。在计算机存储系统的层次结构中，是介于中央处理器和主存储器之间的高速小容量存储器。它和主存储器一起构成一级的存储器。高速缓冲存储器和主存储器之间信息的调度和传送是由硬件自动进行的。高速缓冲存储器最重要的技术指标是它的命中率。延迟转移技术：在转移指令之后插入一条或几条有效的指令。当程序执行时，要等这些插入的指令执行完成之后，才执行转移指令，因此，转移指令好像被延迟执行了，这种技术称为延迟转移技术。线性流水线：线性流水线就是由一整套工艺串联而成的生产线。流水线又称为装配线,一种工业上的生产方式，指每一个生产单位只专注处理某一个片段的工作，以提高工作效率及产量；按照流水线的输送方式大体可以分为：皮带流水装配线、板链线、倍速链、插件线、网带线、悬挂线及滚筒流水线这七类流水线。输送线的传输方式有同步传输的/（强制式），也可以是非同步传输/（柔性式），根据配置的选择，可以实现装配和输送的要求。输送线在企业的批量生产中不可或缺。流水线的吞吐率：流水线的吞吐率是单位时间内流水线处理的任务数。并行性：并行性是指计算机系统具有可以同时进行运算或操作的特性，在同一时间完成两种或两种以上工作。它包括同时性与并发性两种含义。同时性指两个或两个以上事件在同一时刻发生。并发性指两个或两个以上事件在同一时间间隔发生。三、简答题(每题5分，共30分） 1.如有一个经解释实现的计算机，可以按功能划分成4级。每一级为了执行一条指令需要下一级的N条指令解释。若执行第一级的一条指令需K(ns)时间，那么执行第2、3、4级的一条指令各需要用多少时间(ns)? 答：第1级：1条1级指令 K ns 第2级：1条2级指令N条1级指令 1*N*K ns = NK ns 第3级：1条3级指令N条2级指令 1*N*NK ns =N2K ns 第4级：1条4级指令N条3级指令 1*N*NNK ns =N3K ns 2.根据Amdahl定律，系统加速比由哪两个因素决定？答：系统加速比依赖于两个因素：（1）可改进比例：可改进部分在原系统计算时间中所占的比例（2）部件加速比：可改进部分改进以后的性能提高 3.简述组相联映象规则。答：(1)主存与缓存分成相同大小的数据块。(2)主存和Cache 按同样大小划分成组。(3)主存容量是缓存容量的整数倍,将主存空间按缓冲区的大小分成区，主存中每一区的组数与缓存的组数相同 4.引起Cache与主存内容不一致的原因是什么？为了保持Cache 的一致性，在单计算机系统中一般采取哪些措施？答：不一致的原因：（1）由于CPU写Cache，没有立即写主存（2）由于I/O处理机或I/O设备写主存采取措施：（1）全写法，亦称写直达法（WT法-Write through）方法：在对Cache进行写操作的同时，也对主存该内容进行写入（2）写回法（WB法-Write back）方法：在CPU执行写操作时，只写入Cache，不写入主存。 5.按照同一时间内各段之间的连接方式来分，流水线可分为哪两类？答：（1）静态流水线：在同一时间内，流水线的各段只能按同一种功能的连接方式工作。（2）动态流水线：在同一时间内，当某些段正在实现某种运算时，另一些段却在实现另一种运算。 6.Flynn分类法是根据什么对计算机进行分类的？将计算机分成哪几类？答：Flynn分类法，根据计算机中指令和数据的并行状况把计算机分成：（1）单指令流单数据流（SISD.；（2）单指令流多数据流（SIMD.；（3）多指令流单数据流（MISD.；（4）多指令流多数据流（MIMD.。四、问答与计算题（第1题10分，第2、3题每题15分共40分） 1.一个有快表和慢表的页式虚拟存储器，最多有64个用户，每个用户最多要用1024个页面，每页4K字节，主存容量8M字节。（1）写出多用户虚地址的格式，并标出各字段的长度。（2）写出主存地址的格式，并标出各字段的长度。

计算机系统结构第1-8章部分作业答案复习课程

计算机系统结构第1-8章部分作业答案

第一章 1.6 某台主频为400MHz 的计算机执行标准测试程序，程序中指令类型、执行数量和平均时钟周期数如下：求该计算机的有效CPI 、MIPS 和程序执行时间。解：（1）CPI ＝(45000×1＋75000×2＋8000×4＋1500×2) / 129500＝1.776 (或 259 460 ) （2）MIPS 速率＝f/ CPI ＝400/1.776 ＝225.225MIPS (或 259 5180 MIPS) （3）程序执行时间= (45000×1＋75000×2＋8000×4＋1500×2)／ 400=575μs 1.9 假设某应用程序中有4类操作，通过改进，各操作获得不同的性能提高。具体数据如下表所示：（1）改进后，各类操作的加速比分别是多少？（2）各类操作单独改进后，程序获得的加速比分别是多少？（3）4类操作均改进后，整个程序的加速比是多少？解：根据Amdahl 定律Se Fe Fe S n + -= )1(1可得

4类操作均改进后，整个程序的加速比： 2.16)1(1 ≈+-=∑∑i i i n S F F S 1.10 第二章变长编码，哈夫曼编码第三章 3.12 有一条指令流水线如下所示：（1）求连续输入10条指令的情况下，该流水线的实际吞吐率和效率。（2）该流水线的瓶颈在哪一段？请采用两种不同的措施消除此瓶颈。对于你所给出的两种新的流水线，连续输入10条指令时，其实际吞吐率和效率各是多少？解：（1）本题主要考察对各功能段用时不等的线性流水线的性能计算公式的掌握情况。 2200(ns) 2009200)10050(50t n t T max k i i =?++++=?-+?=∑=)1(1 流水 )(ns 220 1 T n TP 1-==流水

第2章计算机体系结构习题及答案解析

第二章习题（P69-70）一、复习题 1．简述冯?诺依曼原理，冯?诺依曼结构计算机包含哪几部分部件，其结构以何部件为中心？答：冯?诺依曼理论的要点包括：指令像数据那样存放在存储器中，并可以像数据那样进行处理；指令格式使用二进制机器码表示；用程序存储控制方式工作。这3条合称冯?诺依曼原理冯?诺依曼计算机由五大部分组成：运算器、控制器、存储器、输入设备、输出设备，整个结构一般以运算器为中心，也可以以控制器为中心。 (P51-P54) 2．简述计算机体系结构与组成、实现之间的关系。答：计算机体系结构通常是指程序设计人员所见到的计算机系统的属性，是硬件子系统的结构概念及其功能特性。计算机组成（computer organization）是依据计算机体系结构确定并且分配了硬件系统的概念结构和功能特性的基础上，设计计算机各部件的具体组成，它们之间的连接关系，实现机器指令级的各种功能和特性。同时，为实现指令的控制功能，还需要设计相应的软件系统来构成一个完整的运算系统。计算机实现，是计算机组成的物理实现, 就是把完成逻辑设计的计算机组成方案转换为真实的计算机。计算机体系结构、计算机组成和计算机实现是三个不同的概念，各自有不同的含义，但是又有着密切的联系，而且随着时间和技术的进步，这些含意也会有所改变。在某些情况下，有时也无须特意地去区分计算机体系结构和计算机组成的不同含义。 (P47-P48) 3．根据指令系统结构划分，现代计算机包含哪两种主要的体系结构？答：根据指令系统结构划分，现代计算机主要包含：CISC和RISC两种结构。 (P55) 4．简述RISC技术的特点？答：从指令系统结构上看，RISC 体系结构一般具有如下特点： (1) 精简指令系统。可以通过对过去大量的机器语言程序进行指令使用频度的统计，来选取其中常用的基本指令，并根据对操作系统、高级语言和应用环境等的支持增设一些最常用的指令; (2) 减少指令系统可采用的寻址方式种类，一般限制在2或3种; (3) 在指令的功能、格式和编码设计上尽可能地简化和规整，让所有指令尽可能等长; (4) 单机器周期指令，即大多数的指令都可以在一个机器周期内完成，并且允许处理器在同一时间内执行一系列的指令。 (P57-58) 5．有人认为，RISC技术将全面替代CISC，这种观点是否正确，说明理由？答：不正确。与CISC 架构相比较，RISC计算机具备结构简单、易于设计和程序执行效率高的特点，但并不能认为RISC 架构就可以取代CISC 架构。事实上，RISC 和CISC 各有优势，CISC计算机功能丰富，指令执行更加灵活，这些时RISC计算机无法比拟的，当今时代，两者正在逐步融合，成为CPU设计的新趋势。 (P55-59) 6．什么是流水线技术？答：流水线技术，指的是允许一个机器周期内的计算机各处理步骤重叠进行。特别是，当执行一条指令时，可以读取下一条指令，也就意味着，在任何一个时刻可以有不止一条指令在“流水线”上，每条指令处在不同的执行阶段。这样，即便读取和执行每条指令的时间保持不变，而计算机的总的吞吐量提高了。 (P60-62) 7．多处理器结构包含哪几种主要的体系结构，分别有什么特点？答：多处理器系统：主要通过资源共享，让共享输入/输出子系统、数据库资源及共享或不共享存储的一组处理机在统一的操作系统全盘控制下，实现软件和硬件各级上相互作用，达到时间和空间上的异步并行。

计算机体系结构期末试卷及答案

课程测试试题（ A 卷） ----------------------以下为教师填写-------------------- I、命题院（部）：信息科学与工程学院 II、课程名称：计算机体系结构 III、测试学期：2014－2015学年度第2学期 IV、测试对象：信息学院计算机、网络专业 2012 级班 V、问卷页数（A4）： 3 页 VI、答卷页数（A4）： 4 页 VII、考试方式：闭卷（开卷、闭卷或课程小论文，请填写清楚） VIII、问卷内容：一、填空题（共30分，20空，每空分） 1、现代计算机系统是由（）和（）组成的十分复杂的系统。 2、计算机系统应能支持软件可移植，实现可移植性的常用方法有3种，即（），（），统一高级语言。 3、可以将当前大多数通用寄存器型指令集结构进一步细分为3种类型，即（）、（）和存储器-存储器型指令集结构。 4、MIPS指令DADDIU R14，R5，#6属于（）类型的指令格式；MIPS指令 SD R4，300（R5）属于（）类型的指令格式。 5、描述流水线的工作，常采用时空图的方法。在时空图中，横坐标表示（），纵坐标代表（）。 6、在MIPS指令实现的简单数据通路中，在WB周期中，有两大类指令执行操作：（）和（）指令。 7、存储器的层次结构中，“Cache－主存”层次是为了弥补主存（）的不足，“主存－辅存”层次是为了弥补主存（）的不足。 8、Cache实现的映像规则有全相联映像、（）和（）三种。 9、反映存储外设可靠性能的参数有可靠性、（）和（）。 10、根据系统中处理器个数的多少，可把现有的MIMD计算机分为两类，每一类代表了一种存储器的结构和互连策略。第一类机器称为（）结构，第二类机器具有（）。二、判断题（每小题1分，共10分） 1、从计算机语言的角度，系统结构把计算机系统按功能划分成多级层次结构，其中，第2级是操作系统虚拟机，第3级是汇编语言虚拟机。（） 2、计算机系统中提高并行性的3种途径中，资源重复是在并行性概念中引入时间因素，加快硬件周转而赢得时间。（） 3、指令集结构中采用多种寻址方式可能会增加实现的复杂度和使用这些寻址方式的指令的CPI。（） 4、指令条数多，通常超过200条，是设计RISC的原则之一。（） 5、根据流水线中各功能段之间是否有反馈回路，可把流水线分为线性流水线和非线性流水线。（） 6、在多级存储体系中，“cache——主存”层次的存储管理实现主要由软件件实现。

《计算机体系结构》在线作业二

北交《计算机体系结构》在线作业二一、单选题（共20 道试题，共60 分。） 1. 按照M ·弗林对处理机并行性定义的分类原则，阵列机ILLIAC —IV 是( )。 A. SISD B. SIMD C. MISD D. MIMD 正确答案： 2. 输入输出系统硬件的功能对( )是透明的。 A. 操作系统程序员 B. 应用程序员 C. 系统结构设计人员 D. 机器语言程序设计员正确答案： 3. 浮点数尾数基值rm=8，尾数数值部分长6位，可表示规格化正尾数的个数是（）。 A. 56个 B. 63个 C. 64个 D. 84个正确答案： 4. 从计算机系统结构上讲，机器语言程序员所看到的机器属性是( )。 A. 计算机软件所要完成的功能 B. 计算机硬件的全部组成 C. 编程要用到的硬件组织 D. 计算机各部件的硬件实现正确答案： 5. 对机器语言程序员透明的是( )。 A. 中断字 B. 主存地址寄存器 C. 通用寄存器 D. 条件码正确答案： 6. 通道方式输入输出系统中，对优先级高的磁盘等高速设备，适合于连接( )。 A. 字节多路通道 B. 选择通道 C. 数组多路通道

D. 字节及数组多路通道正确答案： 7. 设16 个处理器编号分别为0 ，1 ，2 ，…，15 ，用PM 2-0 互联函数时，第13 号处理机与第( ) 号处理机相联。 A. 12 B. 9 C. 11 D. 5 正确答案： 8. 对系统程序员不透明的应当是( )。 A. Cache存贮器 B. 系列机各档不同的数据通路宽度 C. 指令缓冲寄存器 D. 虚拟存贮器正确答案： 9. 对应用程序员不透明的是( )。 A. 先行进位链 B. 乘法器 C. 指令缓冲器 D. 条件码寄存器正确答案： 10. 系列机软件应做到( )。 A. 向前兼容，并向上兼容 B. 向后兼容，力争向上兼容 C. 向前兼容，并向下兼容 D. 向后兼容，力争向下兼容正确答案： 11. 动态数据流机最突出的特点是使( )。 A. 数据流令牌无标号 B. 需要程序记数器来实现 C. 令牌带上标号 D. 同步由门(Latch)寄存器来实现正确答案： 12. 计算机系统多级层次中，从下层到上层，各级相对顺序正确的应当是( )。 A. 汇编语言机器级――操作系统机器级――高级语言机器级 B. 微程序机器级――传统机器语言机器级――汇编语言机器级 C. 传统机器语言机器级――高级语言机器级――汇编语言机器级 D. 汇编语言机器级――应用语言机器级――高级语言机器级正确答案： 13. 用户高级语言源程序中出现的读写(I/O) 语句，到读写操作全部完成，需要通过( )共同完成。 A. 编译系统和操作系统 B. I/O 总线、设备控制器和设备 C. 操作系统和I/O 设备硬件