计算机体系结构大题预测

格式：docx
大小：350.55 KB
文档页数：3

下载文档原格式

/ 3

计算机体系结构试卷试题(答案全)

一填空题（每空1分，共30分）1、系列机是指具有相同的体系结构，但具有不同组织和实现的一系列不同型号的机器。

2、存储程序计算机结构上的主要特点之一是以运算器为中心。

3、从计算机系统结构的多级层次结构可知，通常情况下，第1、2、3级用解释方法实现，第4或更高级用翻译方法实现。

4、对于最常见的事件，通常赋予它优先的处理权和资源使用权，这是计算机体系结构设计中的大概率事件优先原则。

5、容量为64块的Cache采用组相联方式映像，字块大小为128字节，每4块为一组，若主存容量为4096块，且以字编址，那么主存地址为 19 位，主存区号为 6 位。

6、可改进比例的值总是小于等于1 。

7、一般有两种策略来保存寄存器的内容,即：调用者保存和被调用者保存。

8、DLX指令集提供了立即数寻址、寄存器寻址、偏移寻址和寄存器间接寻址4种寻址方式。

9、对某流水线处理器测试时发现其存在结构冲突，通常可采用资源重复和流水化功能单元方法解决该问题。

10、编译器通过重新组织代码顺序消除暂停的技术被称为指令调度。

11、按照流水的级别可以把流水线分为部件级流水线、处理机级流水线和处理机间流水线。

12、为解决流水线使用非流水数据通路的寄存器引起冲突，在流水线设计中采用寄存器文件技术解决该问题。

13、Cache的替换算法常见的有 FIFO 、LRU 和随机法。

14、改进Cache性能的方法主要有降低失效率、减少失效开销和减少Cache命中时间。

15、减少流水线处理分支暂停时钟周期数的途径包括尽早判断分支转移是否成功和尽早计算出分支成功转移的PC值。

二、选择题（1—15题，每题1分，共15分）1、下面的指令中， A 不属于RISC处理器指令集。

Ａ.ADD R4,[1000] Ｂ.LD R3,(R4) Ｃ.SUB R4,R3 Ｄ.SD 0(R3),R42. 在其它部件性能保持不变的情况下，对CPU性能的不断改进并没有获得期望的结果，这主要是受到了 A 的影响。

计算机系统结构复习题(附答案) (1)

计算机系统结构复习题和重点（附答案）一、单项选择题1．实现汇编语言源程序变换成机器语言目标程序是由（）A．编译程序解释B．编译程序翻译C．汇编程序解释D．汇编程序翻译2．系列机软件必须保证（）A．向前兼容，并向上兼容B．向前兼容，并向下兼容C．向后兼容，力争向上兼容D．向后兼容，力争向下兼容3．浮点数尾数基值r m=8，尾数数值部分长6位，可表示规格化正尾数的个数是（）A．56个B．63个C．64个D．84个4．在IBM370系统中，支持操作系统实现多进程共用公用区管理最有效的指令是（）A．“执行”指令B．“程序调用”指令C．“比较与交换”指令D．“测试与置定”指令5．关于非专用总线三种控制方式中，下列叙述错误．．的是（）A．集中式定时查询，所有部件共用同一条“总线忙”线B．集中式定时查询，所有部件都用同一条“总线请求”线C．集中式独立请求，所有部件都用同一条“总线请求”线D．集中式串行链接，所有部件都用同一条“总线请求”线6．磁盘外部设备适合于连接到（）A．字节多路通道B．数组多路通道或选择通道C．选择通道或字节多路通道D．数组多路通道或字节多路通道7．在Cache存储器中常用的地址映象方式是（）A．全相联映象B．页表法映象C．组相联映象D．段页表映象8．在指令级高度并行的超级处理机中，下列叙述正确的是（）A．超标量处理机利用资源重复，要求高速时钟机制B．超流水线处理机利用资源重复，要求高速时钟机制C．超标量处理着重开发时间并行性，要求高速时钟机制D．超流水线处理机着重开发时间并行性，要求高速时钟机制9．间接二进制n方体网络是一种（）A．多级立方体网络B．多级全排列网络C．单级立方体网络D．多级混洗交换网络10．多端口存储器适合于连接A．紧耦合多处理机B．松耦合多处理机C．机数很多的处理机D．机数可变的多处理机二、填空题11．多处理机实现的是___________、___________间的并行。

(完整)计算机体系结构第五章练习题参考解答

（完整）计算机体系结构第五章练习题参考解答（完整）计算机体系结构第五章练习题参考解答编辑整理:尊敬的读者朋友们：这里是精品文档编辑中心，本文档内容是山我和我的同事精心编辑整理后发布的，发布之前我们对文中内容进行仔细校对，但是难免会有疏漏的地方，但是任然希望（（完整）讣算机体系结构第五章练习题参考解答）的内容能够给您的工作和学习带来便利。

同时也真诚的希望收到您的建议和反馈，这将是我们进步的源泉，前进的动力。

本文可编辑可修改，如果觉得对您有帮助请收藏以便随时查阅，最后祝您生活愉快业绩进步，以下为（完整）计算机体系结构第五章练习题参考解答的全部内容。

（完整）计算机体系结构第五章练习题参考解答第五章5o 34在一个采用组相联映象方式的Cache 存储系统中，主存由B 。

〜B?共8块组成，Cache 有2组，每组2块，每块大小为16B.在一个程序执行过程中，访存的主存块地址流为：B6, B4, Bi, B4, B6, B3, Bo, B4, B5, B7, B30（1）写出主存地址的格式，并标出各字段的长度。

（2）写出Cache 地址的格式，并标出各字段的长度。

（3）指出主存与Cache 之间各个块的映象关系。

（4）若Cache 的4个块号为C 。

、G 、C 2^ C 3,列出程序执行过程中的Cache 块地址流。

（5）若釆用FIFO 替换算法，计算Cache 的块命中率。

（6）若采用LRU 替换算法，计算Cache 的块命中率。

（7）若改为全相联映象方式，再做（5）和（6）。

（8）若在程序执行过程中，每从主存装入一块到Cache,平均要对这个块访问 16次,计算在这种情况下的Cache 命中率。

解：（1）（2）采用组相联映象时,主存和Cache 地址的格式分别为：主存按Cache 的大小分区，现主存有8个块，Cache 有2X2二4个块，则主存分为 8/4=2个区，区号E 的长度为1位。

计算机体系结构习题(含参考答案)

第 2 章课后习题1、尾数用补码、小数表示，阶码用移码、整数表示，尾数字长 p=6（不包括符号位），阶码字长 q=6 不包括符号位），为数基值 r m =16 ，阶码基值 r e =2。

对于规格化浮点数，用十进制表达式写出如下数据（对于前 11 项，还要写出 16 进值编码）8）最小正数 9）最大负数 10）最小负数 11）浮点零 12）表数精度 13）表数效率 14）能表示的规格化浮点数个数2．一台计算机系统要求浮点数的精度不低于 10-7.2，表数范围正数不小于 1038，且正、负数对称。

尾数用原码、纯小数表示，阶码用移码、整数表示。

（1）设计这种浮点数的格式（2）计算（ 1 ）所设计浮点数格式实际上能够表示的最大正数、最大负数、表数精度和表数效率。

3．某处理机要求浮点数在正数区的积累误差不大于 2-p-1 ，其中， p 是浮点数的尾数长度。

（1）选择合适的舍入方法。

（2）确定警戒位位数。

（3）计算在正数区的误差范围。

4．假设有 A 和 B 两种不同类型的处理机， A 处理机中的数据不带标志符，其指令字长和数据字长均为 32 位。

B 处理机的数据带有标志符，每个数据的字长增加至 36 位，其中有 4 位是标志符，它的指令数由最多 256条减少到不到 64 条。

如果每执行一条指令平均要访问两个操作数，每个存放在存储器中的操作数平均要被访问 8 次。

对于一个由 1000 条指令组成的程序，分别计算这个程序在 A 处理机和 B 处理机中所占用的存储空间大小（包括指令和数据），从中得到什么启发？5．一台模型机共有 7 条指令，各指令的使用频率分别为 35%，25%，20%，10%，5%， 3%和 2% ，有 8 个通用数据寄存器， 2 个变址寄存器。

（1）要求操作码的平均长度最短，请设计操作码的编码，并计算所设计操作码的平均长度。

（2）设计 8 字长的寄存器 -寄存器型指令 3 条， 16位字长的寄存器 -存储器型变址寻址方式指令 4 条，变址范围不小于 ±127。

计算机体系结构练习题参考解答

第二章2.13在一台单流水线多操作部件的处理机上执行下面的程序，每条指令的取指令、指令译码需要一个时钟周期，MOVE、ADD和MUL操作分别需要2个、3个和4个时钟周期，每个操作都在第一个时钟周期从通用寄存器中读操作数，在最后一个时钟周期把运算结果写到通用寄存器中。

k： MOVE R1，R0 ；R1← (R0)k+1： MUL R0，R2，R1 ；R0← (R2)×(R1)k+2： ADD R0，R2，R3 ；R0← (R2)+(R3)(1)就程序本身而言，可能有哪几种数据相关?(2)在程序实际执行过程中，哪几种数据相关会引起流水线停顿?(3)画出指令执行过程的流水线时空图，并计算完成这3条指令共需要多少个时钟周期？解：（1）就程序本身而言，可能有三种数据相关。

若3条指令顺序流动，则k指令对R1寄存器的写与k+1指令对R1寄存器的读形成的“先写后读”相关。

若3条指令异步流动，则k指令对R0寄存器的读与k+1指令对R0寄存器的写形成的“先读后写”相关，k+2指令对R0寄存器的写与k+1指令对R0寄存器的写形成的“写—写”相关。

（2）在程序实际执行过程中，二种数据相关会引起流水线停顿。

一是“先写后读”相关，k指令对R1的写在程序执行开始后的第四个时钟；k+1指令对R1的读对指令本身是第三个时钟，但k+1指令比k指令晚一个时钟进入流水线，则在程序执行开始后的第四个时钟要读R1。

不能在同一时钟周期内读写同一寄存器，因此k+1指令应推迟一个时钟进入流水线，产生了流水线停顿。

二是“写—写”相关，k+1指令对R0的写对指令本身是第六个时钟，而要求该指令进入流水线应在程序执行开始后的第三个时钟，所以对R0的写是在程序执行开始后的第八个时钟。

k+2指令对R0的写对指令本身是第五个时钟，而k+2指令比k+1指令晚一个时钟进入流水线，则在程序执行开始后的第四个时钟，所以对R0的写是在程序执行开始后的第八个时钟。

计算机体系结构复习题

1.7 将计算机系统中某一功能的处理速度加快10倍，但该功能的处理时间仅为整个系统运行时间的40%，则采用此增强功能方法后，能使整个系统的性能提高多少？解由题可知：可改进比例= 40% = 0.4 部件加速比= 10根据Amdahl定律可知：采用此增强功能方法后，能使整个系统的性能提高到原来的1.5625倍。

1.8 计算机系统中有三个部件可以改进，这三个部件的部件加速比为：部件加速比1=30；部件加速比2=20；部件加速比3=10（1）如果部件1和部件2的可改进比例均为30%，那么当部件3的可改进比例为多少时，系统加速比才可以达到10？（2）如果三个部件的可改进比例分别为30%、30%和20%，三个部件同时改进，那么系统中不可加速部分的执行时间在总执行时间中占的比例是多少？解：（1）在多个部件可改进情况下，Amdahl定理的扩展：已知S1＝30，S2＝20，S3＝10，S n＝10，F1＝0.3，F2＝0.3，得：得F3＝0.36，即部件3的可改进比例为36%。

（2）设系统改进前的执行时间为T，则3个部件改进前的执行时间为：（0.3+0.3+0.2）T = 0.8T，不可改进部分的执行时间为0.2T。

已知3个部件改进后的加速比分别为S1＝30，S2＝20，S3＝10，因此3个部件改进后的执行时间为：改进后整个系统的执行时间为：Tn = 0.045T+0.2T = 0.245T那么系统中不可改进部分的执行时间在总执行时间中占的比例是：3.4 设一条指令的执行过程分成取指令、分析指令和执行指令三个阶段，每个阶段所需的时间分别为△t、△t和2△t 。

分别求出下列各种情况下，连续执行N条指令所需的时间。

（1）顺序执行方式；（2）只有“取指令”与“执行指令”重叠；（3）“取指令”、“分析指令”与“执行指令”重叠。

解：（1）每条指令的执行时间为：△t＋△t＋2△t＝4△t连续执行N条指令所需的时间为：4N△t（2）连续执行N条指令所需的时间为：4△t＋3（N-1）△t＝（3N＋1）△t（3）连续执行N条指令所需的时间为：4△t＋2（N-1）△t＝（2N＋2）△t4.2 简述Tomasulo算法的基本思想。

2022-2023年软件水平考试《高级系统架构设计师》预测试题14(答案解析)

2022-2023年软件水平考试《高级系统架构设计师》预测试题（答案解析）全文为Word可编辑，若为PDF皆为盗版，请谨慎购买！第壹卷一.综合考点题库(共50题)1.软件重用可以分为垂直式重用和水平式重用，（）是一种典型的水平式重用。

A.医学词汇表B.标准函数库C.电子商务标准D.网银支付接口正确答案：B本题解析：软件重用分垂直式重用与水平式重用，垂直式重用是指局限于某一垂直领域的重用，如只在电力系统中用到的构件；而水平式重用是指通用领域的重用，如标准函数库，任何软件都能用，所以是水平式重用。

2.某宇航公司长期从事宇航装备的研制工作，嵌入式系统的可靠性分析与设计已成为该公司产品研制中的核心工作，随着宇航装备的综合化技术发展，嵌入式软件规模发生了巨大变化，代码规模已从原来的几十万扩展到上百万，从而带来了由于软件失效而引起系统可靠性降低的隐患。

公司领导非常重视软件可靠性工作，决定抽调王工程师等5人组建可靠性研究团队，专门研究提高本公司宇航装备的系统可靠性和软件可靠性问题，并要求在三个月内，给出本公司在系统和软件设计方面如何考虑可靠性设计的方法和规范。

可靠性研究团队很快拿出了系统及硬件的可靠性提高方案，但对于软件可靠性问题始终没有研究出一种普遍认同的方法。

问题内容：【问题1】（共9分）请用200字以内文字说明系统可靠性的定义及包含的4个子特性，并简要指出提高系统可靠性一般采用哪些技术？【问题2】（共8分）王工带领的可靠性研究团队之所以没能快速取得软件可靠性问题的技术突破，其核心原因是他们没有搞懂高可靠性软件应具备的特点。

软件可靠性一般致力于系统性地减少和消除对软件程序性能有不利影响的系统故障。

除非被修改，否则软件系统不会随着时间的推移而发生退化。

请根据你对软件可靠性的理解，给出表3-1所列出的硬件可靠性特征对应的软件可靠性特征之间的差异或相似之处，将答案写在答题纸上。

【问题3】（共8分）王工带领的可靠性研究团队在分析了大量相关资料基础上，提出软件的质量和可靠性必须在开发过程构建到软件中，也就是说，为了提高软件的可靠性，必须在需求分析、设计阶段开展软件可靠性筹划和设计。

计算机体系结构复习题(有答案)

《体系结构复习题》一、选择题（15 分） 1．计算机系统多级层次中，从下层到上层，各级相对顺序正确的应当是（） A.汇编语言机器级---操作系统机器级---高级语言机器级 B.微程序机器级---传统机器语言机器级---汇编语言机器级 C.传统机器语言机器级---高级语言机器级---汇编语言机器级 D. 汇编语言机器级---应用语言机器级---高级语言机器级 2．对系统程序员不透明的是（） A.Cache 存储器 B.系列几各档不同的数据通路宽度 C.指令缓冲寄存器 D.虚拟存储器 3．在计算机系统设计中，比较好的方法是（） A.从上向下设计 B.从下向上设计 C.从两头向中间设计 D.从中间开始向上、向下设计 4．不同系列的机器之间，实现软件移植的途径不包括（） A.用统一的高级语言 B.用统一的汇编语言 C.模拟 D.仿真 5．堆栈型机器比通用寄存器型机器优越的是（） A.支持先进先出类接替算法的求解 B.能更好地支持向量的运算 C. 支持由逆波兰表达式将高级语言多元赋值语句直接编译生成堆栈指令程序 D.能优化存储器的空间利用率 6．浮点数尾数基值 rm=8,尾数数值部分长 6 位，可表示的规格化最小正尾数为（） A.0.5 B.0.25 C.0.125 D.1/64 7．在尾数下溢处理方法中，平均误差最大的是（） A.截断法 B.舍入法 C.恒置“1”法 D.ROM 查表法 8． ILLIAC Ⅳ是一种（） A.流水线处理机 B.指令重叠处理机 C.阵列处理机 D.多处理机 9．能实现作业、任务级并行的异构型多处理机属（） A.MISD B.SIMD C.MIMD D.SISD 10．非线性流水线是指（） A.一次运算中使用流水线中多个功能段 B.一次运算中要多次使用流水线中的某些功能段 C. 流水线中的某些功能段在各次运算中的作用不同 D. 流水线中的各个功能段在各种运算中有不同的组合 11．流水机器对全局性的相关处理不包括（） A.猜测法 B.提前形成条件码 C.加快短循环程序的执行 D.设置相关专用通路 12．外部设备打印机适合于连接（） A.数组多路通道或选择通道 B.字节多路通道或选择通道 C.选择通道 D.任意一种通道 13．虚拟存储器常用的地址映像方式是（） A.全相联 B.段相联 C.组相联 D.直接

计算机体系结构期末考试试卷及答案

计算机体系结构期末考试试卷及答案一、选择题（每题2分，共20分）1. 计算机体系结构的研究对象是（）A. 硬件系统B. 软件系统C. 硬件和软件系统D. 计算机网络答案：C2. 下面哪个不是计算机体系结构的基本特性？（）A. 并行性B. 高效性C. 可扩展性D. 可靠性答案：D3. 下面哪个不是计算机体系结构的层次结构？（）A. 物理层B. 逻辑层C. 指令层D. 系统层答案：A4. 下面哪个不是流水线技术的优点？（）A. 提高指令执行速度B. 减少指令执行时间C. 提高硬件资源利用率D. 降低硬件成本答案：D5. 下面哪个不是超标量处理器的特点？（）A. 多指令发射B. 多指令执行C. 高性能D. 低功耗答案：D6. 下面哪个不是精简指令集计算机（RISC）的特点？（）A. 指令简单B. 执行速度快C. 指令复杂D. 硬件简化答案：C7. 下面哪个不是复杂指令集计算机（CISC）的特点？（）A. 指令复杂B. 执行速度慢C. 硬件复杂D. 指令简单答案：D8. 下面哪个不是存储器层次结构的组成部分？（）A. 寄存器B. 缓存C. 主存储器D. 硬盘答案：D9. 下面哪个不是虚拟存储器的作用？（）A. 扩展物理内存B. 提高内存利用率C. 提高程序执行速度D. 减少程序占用空间答案：D10. 下面哪个不是计算机体系结构的发展方向？（）A. 多核处理器B. 众核处理器C. 量子计算机D. 单核处理器答案：D二、填空题（每题2分，共20分）1. 计算机体系结构的五大部件是____、____、____、____、____。

答案：控制器、运算器、存储器、输入设备、输出设备2. 计算机体系结构的主要性能指标有____、____、____。

答案：吞吐量、执行时间、效率3. 流水线技术可以分为____、____、____三个级别。

答案：单级流水线、多级流水线、超流水线4.超标量处理器的主要技术有____、____、____。

计算机体系结构第四章练习题参考解答

计算机体系结构第四章练习题参考解答第四章4.52 浮点数系统使⽤的阶码基值r e =2，阶值位数q=2，尾数基值r m =10，尾数位数p ′=1，即按照使⽤的⼆进制位数来说，等价于p=4。

计算在⾮负阶、正尾数、规格化情况下的最⼩尾数值、最⼤尾数值、最⼤阶值、可表⽰的最⼩值和最⼤值及可表⽰数的个数。

解: 最⼩尾数值：r m -1 = 10-1 = 0.1最⼤尾数值：1- r m -p ′ =1-10-1 = 0.9 最⼤阶值：2q -1=3可表⽰数的最⼩值：1×r m -1 = 10-1 = 0.1 可表⽰数的最⼤值：r m 2q-1×（1- r m -p ′）=103（1-10-1）= 900可表⽰数的个数：2q ×r m p ′（r m -1）/r m = 22×101（10-1）/10 = 364.53 ⼀台机器要求浮点数的字长的精度不低于10-7.2，表数的范围正数不⼩于1038，且正负对称。

尾数⽤原码、纯⼩数表⽰，阶码⽤移码、整数表⽰。

设计这种浮点数的格式。

解依题意，取表数范围N =1038，表数精度δ=10-7.2。

由式（4-4）得：37log(log10log 21)log 2q +> = 6.99，上取整，得到阶码字长q=7。

由式（4-5）得：16log1053.2log 2p -->=，上取整，得到尾数字长p=24。

从⽽加上⼀个尾数符号位和⼀个阶码符号位，浮点数的总字长为：p+q+2=24+7+2=33。

实际浮点数总字长应为8的倍数，故取浮点数总字长为40位。

多出的7位可以加到尾数字长p 中⽤于提⾼浮点数的表数精度，也可以加到阶码字长q 中来扩⼤浮点数的表数范围。

暂且让p 增加6位，q 增加1位，即p=30，q=8。

如图4-8所⽰是设计出来的浮点数格式。

图4-8 例4.2浮点数的设计格式4.58 ⽤于⽂字处理的某专⽤机，每个⽂字符⽤4位⼗进制数字（0～9）编码表⽰，空格⽤︼表⽰。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

五、有5个中断源D1、D2、D3、D4、和D5，它们的中断优先级从高到低分别是1级、2级、3级、4级和5级，这些中断
源的中断优先级、正常情况下的中断屏蔽码和改变后的中断屏蔽码见表4．5所示。每个中断源有5位中断屏蔽码，“O”
表示该中断开放，“1”表示该中断被屏蔽。
表4．5 5个中断源的中断优先级和屏蔽码

中断源名称中断优先级
正常中断屏蔽码改变后的中断屏蔽码
D1 D2 D3 D4 D5 D1 D2 D3 D4 D5
D1 1 1 1 1 1 1 1 0 0 0 0
D2 2 0 1 1 1 1 1 1 0 0 0
D3 3 0 0 1 1 1 1 1 1 0 0
D4 4 0 0 0 1 1 1 1 0 1 1
D5 5 0 0 0 0 1 1 1 1 1 1

1. 当使用正常的中断屏蔽码时，处理机响应各中断源的中断服务请求的顺序是什么？实际的中断处理次序是什么？
2. 当使用改变后的中断屏蔽码时，处理机响应各中断源的中断服务请求的顺序是什么？实际的中断处理次序是什么？

【答案】
1）处理机响应各中断源的中断服务请求的顺序是D1,D2,D3,D4,D5
实际的中断处理次序是D1,D2,D3,D4,D5
2）处理机响应各中断源的中断服务请求的顺序是D1,D2,D3,D4,D5
实际的中断处理次序是D4,D5,D3,D2,D1
怎样实现层次化存储体系？
层次化存储提及要解决的问题，
（1）在一个较高层中，一个块可能被放置在哪里（块的放置）
（2）在较高层中，一个块如何被找到（块的定位）
（3）如果没有命中，哪个块应该被替换（块的替换）
（4）写操作时，该怎么办？（写策略）
（三种放置方式：全相连，组相连，直接相连）
（）………….
例1.3 如果FP操作的比例为25%，FP操作的平均CPI=4.0，其它指令的平均CPI为1.33，FPSQR操作的比例为2%， FPSQR的CPI
为20。假设有两种设计方案，公别把FPSQR操作的CPI和所有FP操作的CPI减为2。试利用CPU性能公式比较这两种设计方案哪
一个更好(只改变CPI而时钟频率和指令条数保持不变)。

解：原系统的CPI=25%×4+75%×1.33=2
方案1（使FPSQR操作的CPI为2）系统
CPI=CPI原-2%×（20-2）=2-2%×18=1.64
方案2（提高所有FP指令的处理速度）系统
CPI=CPI原-25%×（4-2）=2-25%×2=1.5
我们也可以根据以下公式计算出方案2系统的CPI
CPI= 75%×1.33+25%×2=1.5
显然，提高所有FP指令处理速度的方案要比提高FPSQR处理速度的方案要好。方案2的加速比=2/1.5= 1.33

例1.1 假设将某系统的某一部件的处理速度加快到10倍但该部件的原处理时间仅为整个运行时间的40%，则采用加快措施后能使
整个系统的性能提高多少？

解：由题意可知：Fe=0.4, Se=10，根据Amdahl定律

作5.4 在一台单流水线多操作部件的处理机上执行下面的程序，取指令、指令译码各需要1个时钟周期，MOVE,ADDT和MUL
操作各需要2个、3个和4个时钟周期。每个操作都在第一个时钟周期从寄存器中读取操作数，在最后1个时钟周期把运算
结果写到通用寄存器中。
K：MOVE R1,R0 ; R1←R0
K+1：MUL R0 , R2 ,R1 ; R0← (R1)×( R2)
K+2：ADD R0,R2 , R3 ; R0← (R2) +( R3)

（1）就程序本身而言，可能有哪几种相关？
（2）在程序实际执行过程中，有哪几种相关会引起流水线的停顿?
（3）画出指令执行过程的流水线时空图，并计算机执行晚这3条指令共使用了多少个时钟周期？

解（1）
K：MOVE R1,R0 ; R1←R0
K+1：MUL R0 , R2 ,R1 ; R0← (R1)×( R2)
K+2：ADD R0,R2 , R3 ; R0← (R2) +( R3)
K、K+1 存在写读相关，读写相关；
K+1、K+2存在写写相关。
（2）K、K+1 的写读相关，会引起流水线的停顿；
K+1、K+2的写写相关会引起流水线的停顿。
例 3.2 假设前面 DLX 非流水线实现的时钟周期时间为10ns，ALU和分支操作需要4个时钟周期，访问存储
器操作需5个时钟周期，上述操作在程序中出现的相对频率分别是：40％、20％和40％。在基本的DLX流
水线中，假设由于时钟扭曲和寄存器建立延迟等原因，流水线要在其时钟周期时间上附加1ns的额外开销。
现忽略任何其它延迟因素的影响，请问：相对于非流水实现而言，基本的DLX流水线执行指令的加速比是多
少？

解：当非流水执行指令时，指令的平均执行时间为
TPI非流水= 10 ns×((40% + 20%)×4 + 40%×5)
= 10 ns× 4.4
= 44 ns

在流水实现中，指令执行的平均时间是最慢一段的执行时间加上额外开销，即
TPI流水= 10ns + 1ns = 11ns
所以基本的DLX流水线执行指令的加速比为
S = TPI非流水/ TPI流水 = 44 ns / 11ns = 4
流水线的额外开销对其性能也有较大影响，这些额外开销主要来自于流水线寄存器的延迟和时钟扭曲。
流水线寄存器或锁存器具有一定的建立时间和传输延迟，这些延迟加长了流水线的时钟周期时间。

前面我们曾谈到增加流水线的段数可以提高流水线的性能，但是流水线段数的增加受限于这些额外开销，
因为增加流水线的段数意味着每段的时钟周期时间减小，一旦流水线的时钟周期时间降低到和额外开销一样
小的时候，流水线就没有任何作用了，这时在流水线的一个时钟周期内根本没有多少时间来完成流水段所规
定的操作。