计算机系统结构(第五版)第5章

格式：ppt
大小：2.48 MB
文档页数：88

下载文档原格式

白中英第五版计算机组成原理第5章

计算机组成原理
共一百零六页
（1）加法(jiāfǎ)
“ADD R2，R0”
PC→AR
取指
M→DR
DR→IR
PCo，G，ARi
R/W=R DRo，G，IRi
PC→AR M→DR DR→IR
（2）减法(jiǎnfǎ) “SUB R1，R3”
PCo，G，ARi
R/W=R
DRo，G，IRi
R2→Y
R0→X
计算机组成原理
运行标志
(biāozhì)触发器Cr
◆ 当计算机启动时，一定要从第1个节拍脉冲前沿开始工作。
◆ 停机时一定要在第4个节拍脉冲结束后关闭时序产生器。
计算机组成原理
共一百零六页
5.3.3 控制(kòngzhì)方式
控制器的控制方式：控制不同(bù tónɡ)操作序列时序信号的方法。
1. 同步控制方式
共一百零六页
MOV指令(zhǐlìng)的指令(zhǐlìng)周期——取指
计算机组成原理
共一百零六页
MOV指令的指令周期(zhōuqī)——执行
计算机组成原理
共一百零六页
play
5.2.3 LAD指令(zhǐlìng)的指令(zhǐlìng)周期
LAD R1, 6是一条(yī tiáo)RS指令
计算机组成原理
共一百零六页
计算机组成原理
共一百零六页
5.3 时序产生器和控制(kòngzhì)方式
[思考]
用二进制码表示的指令和数据都放在内存里，那么CPU是怎样(zěnyàng)识别出它们是数据还是指令呢?
从时间上来说:
◆ 取指发生在指令周期的第一个CPU周期;
◆ 取数发生在后面几个CPU周期，即 “执行指令”阶段。

吉林大学计算机系统结构题目整合第五章

第五章存储层次知识点汇总存储器层次结构、存储层次性能参数（平均每位价格、命中率、平均访存时间）、存储层次4个问题、CPU 访存地址分割、全相联映像、直接映像、组相联映像、查找方法、替换算法（随机、先进先出、最近最少使用法）、写直达法、写回法、按写分配、不按写分配、Cache性能分析、3C失效（强制失效、容量失效、冲突失效）、Victim Cache、伪相联映像Cache、硬件预取、编译器优化（数组合并、内外循环交换、循环融合、分块）、写缓冲合并、单字宽存储器、多字宽存储器、多体交叉存储器、存储体、虚拟存储器（页式、段式）、快表（TLB）简答题1.单级存储器的主要矛盾是什么？通常采取什么方法来解决？（知识点：多级存储器）答：主要矛盾：(1) 速度越快，每位价格就越高。

(2) 容量越大，每位价格就越低。

(3) 容量越大，速度越慢。

采取多级存储层次方法来解决。

2.“Cache-主存”和“主存-辅存”层次的主要区别是什么？（知识点：存储层次）3.在存储层次中应解决哪四个问题？（知识点：存储层次的四个问题）答：（1）映像规则：当把一个块调入高一层存储器时，可以放到哪些位置上。

（2）查找算法：当所要访问的块在高一层存储器中时，如何找到该块。

（3）替换算法：当发生失效时，应替换哪一块。

（4）写策略：当进行写访问时，应进行哪些操作。

4.地址映像方法有哪几种？它们各有什么优缺点？（知识点：地址映像）（1）全相联映像。

实现查找的机制复杂，代价高，速度慢。

Cache空间的利用率较高，块冲突概率较低，因而Cache的失效率也低。

（2）直接映像。

实现查找的机制简单，速度快。

Cache空间的利用率较低，块冲突概率较高，因而Cache 的失效率也高。

（3）组相联映像。

组相联是直接映像和全相联的一种折中。

5.Cache的3C失效是哪三种失效？针对每种失效给出一种降低失效率的方法。

（知识点：3C失效）答：强制性失效、容量失效、冲突失效。

计算机组成与系统结构(第五版立体化教材)

计算机组成与系统结构（第五版立体化教材）
2016年科学出版社出版的图书
01 成书过程
03 教材目录
目录
02 内容简介 04 教学资源
05 教材特色
07 图书目录
目录
06 作者简介
基本信息
《计算机组成与系统结构（第五版·立体化教材）》是由白中英主编，2011年12月科学出版社出版的普通高等教育计算机类特色专业系列规划教材。该教材可作为计算机及相关专业的教材，适合作软件类和应用类专业的教学用书，也可作为成人自学考试、全国计算机等级考试NCRE（四级）用书。
出版工作
2011年12月，《计算机组成与系统结构（第五版·立体化教材）》由科学出版社出版。
内容简介
内容简介
该教材将计算机组成原理和计算机系统结构两门课合二为一，讲授计算机单处理机系统的组成和工作原理，在该基础上扩展讲授并行计算机的体系结构。内容共10章：包括计算机系统概论；运算方法和运算器；多层次的存储器；指令系统；中央处理机；总线系统；外围设备；输入输出系统；安腾高性能处理机体系结构；并行体系结构。附录A中介绍了配套教材与教学设备。附录B中给出了计算机组成原理研究生入学统考大纲。
杨春武、冯一兵、张杰、靳秀国、杨秦、陈楠、于艳丽、刘敬晗、祁之力、王军德、张振华、刘俊荣、李娇娇、李贞、王坤山、肖炜、崔洪浚、白媛、吴琨等参与了第五版文字教材、CAI课件、习题库、试题库、教学仪器、实验设计、课程设计等的编写和研制工作。该教材由中国科学院计算技术研究所国家智能计算机研究开发中心陈鸿安研究员主审。
教材目录
教材目录
（注：目录排版从左到右列）
教学资源
教学资源
《计算机组成与系统结构（第五版·立体化教材）》的配套教材是《计算机组成原理试题解析（第五版）》。

第5章-计算机系统结构(第五版)李学干

第5章标量处理机
图 5 - 11 B一次相关与二次相关
第5章标量处理机
由图5 - 11可见，B二次相关时，只需推后“分析k+2”的始点到“执行k”送入通用寄存器的运算结果能在“分析k+2” 开始时出现于通用寄存器输出总线上即可，如图5 - 12(a)所示。至于推后多少拍，这取决于通用寄存器组译码、读
如图5 - 20(b)所示。即使流水线每隔Δt0流入一条指令，也会
因来不及处理被堆积于2段，致使流水线仍只能每隔 3Δt0才流出一条指令。
第5章标量处理机
图 5 - 20 最大吞吐率取决于瓶颈段的时间
第5章标量处理机
消除瓶颈的一种办法是将瓶颈子过程再细分。例如将2
段再细分成21、22、23三个子段，如图5-21(a)所示。让各子
同，如图5 - 23所示那样，则在T时间里，流水线各段的效率
都相同，均为η0，即
nΔt0 n 1 2 m 0 T m (n 1)
第5章标量处理机
整个流水线的效率

1 2 m
m

m0 mnΔt0 0 m mT
式中，分母mT是时空图中m个段和流水总时间T所围成
第5章标量处理机
图 5 - 3 一次重叠工作方式
第5章标量处理机
(2) 要解决“分析”与“执行”操作的并行。 (3) 要解决“分析”与“执行”操作控制上的同步。 (4) 要解决指令间各种相关的处理。图5 - 4示意出条件转移时第k条指令和第k+1条指令的时
间关系。
第5章标量处理机
图 5 - 4 第k条指令和第k+1条指令的时间关系
由于运算结果是在“执行”周期的末尾才送入通用寄存

精品文档-计算机系统结构(第五版)(李学干)-第4章

第4章存储体系
图 4 - 7 采用页式存储后D道程序仍可装入
第4章存储体系
假设系统内最多可在主存中容纳N道程序，对每道程序都将有一个页表。
图4 - 8 示意出页式管理的定位映像机构及其虚、实地址
第4章存储体系
图 4 - 8 页式管理的定位映像机构及其虚、实地址的变换过程
第4章存储体系
第4章存储体系
论点2 分配给某道程序的容量S1的增大也只是在开始时对 H
图4 - 24 的实线反映了用堆栈型替换算法时H与S1的关系。如果采用FIFO算法替换，由于它不是堆栈型算法，随着S1 的增大，H总的趋势也是上升的，但是从某个局部看，可能会有下降，如图4-24中虚线所示。这种现象同样会体现在Sp、S1 与H的关系上。
第4章存储体系
2. 段式存储中各段装入主存的起点是随意的，段表中的地址字段很长，必须能表示出主存中任意一个绝对地址，加上各段长度也是随意的，段长字段也很长，这既增加了辅助硬件开销，降低了查表速度，也使主存管理麻烦。例如，主存中已有A、B、C三个程序，其大小和位置如图4 - 7所示，现有一长度为12 KB的D道程序想要调入。
3. 参看图4 - 19，在页式虚拟存储器中每当用户用虚地址访问主存时，都必须查找内页表，将多用户虚地址变换成主存的实地址①、②。
第4章存储体系
图 4 - 19 页式虚拟存储器工作的全过程
第4章存储体系
4.2.3 1. 对页面失效的处理是设计好页式虚拟存储器的关键之一。 2. 要想使虚拟存储器的等效访问速度提高到接近于主存的访
内容时，总希望它已在速度最快的M1中，这就要求未来被访问信息的地址能预知，这对存储体系的构成是非常关键的。
第4章存储体系

计算机组成原理PPTPPT课件

➢钱晓捷，微型计算机原理及应用，清华大学出版社， 2006
精选ppt课件2021
2
目录
☼ 第一章计算机系统概论 ☼ 第二章指令系统 ☼ 第三章中央处理部件CPU ☼ 第四章存储系统 ☼ 第五章输入输出（I/O）系统
精选ppt课件2021
3
第一章计算机系统概论
1.1 计算机的基本概念
如何正确理解“计算机”这个术语呢？凡是能完成以下三类工作的机器就是计算机： ①能接受程序和数据的输入，并存储起来； ②能按照存储的程序对输入的数据进行自动处理并得出结果； ③能把结果输出。
特点：控制简单，译码时间短，编码浪费，n位操作码能表示2n条指令
操作码长度不固定：操作码分散在指令字的不同字段内
特点：能有效压缩操作码的平均长度，控制复杂，指令译码、分析较难
精选ppt课件2021
17
现代计算机中多采用不等长操作码——不同类的指令，其操作码的长度不同。
对于一部分不需要操作数的指令可以将指令操作码扩展到操作数字段，操作码的长度随地址码的减少而增加。
在不增加指令长度的情况下，能充分利用指令的各个字段扩展操作码的长度，使它可以表示更多的指令。
实现不等长操作码可以通过扩展操作码法实现。
精选ppt课件2021
18
操作码扩展实现方式等长扩展
每次扩展的操作码的位数相同。例如：4-8-12扩展法、 3-6-9扩展法、4-6-8扩展法不等长扩展
10010101 10100001
操作码用来表明本条指令要求计算机完成的操作，如加法，减法，取数等，CPU中有专门的译码电路来识别解释各操作码
地址码用来给出参加本次运算的操作数和运算结果所在的地址，根据地址码个数，指令格式分为零地址、一地址选ppt课件2021

计算机系统结构第五版习题答案

计算机系统结构第五版习题答案1.层次结构现代通用的计算机系统是由紧密相关的硬件和软件组成的。

从使用语言的角度，可以将系统看成是按功能划分的多层机器级组成的层次结构，由高到低分别为应用语言机器级、高级语言机器级、汇编语言机器级、操作系统机器级、传统机器语言机器级和微程序机器级。

2.计算机系统结构也称计算机体系结构，它只是系统结构中的一部分，指的是层次结构中的传统机器级的系统结构。

其界面之上包括操作系统级、汇编语言级、高级语言级和应用语言级中所有软件的功能，该界面之下包括所有硬件和固件的功能。

3.计算机实现指的是计算机组成的物理实现，包括处理机、主存等部件的物理结构，器件的集成度和速度，器件、模块、插件、底板的划分与连接，专用器件的设计，微组装技术，信号传输，电源、冷却及整机装配技术等。

它着眼于器件技术和微组装技术，其中，器件技术在实现技术中起着主导作用。

4.数据表示指的是能由机器硬件直接识别和引用的数据类型。

5.霍夫曼压缩概念霍夫曼压缩概念的基本思想时，当各种事件发生的概率不均等时，采用优化技术，对发生概率最高的事件用最短的位数来表示，而对出现概率较低的事件允许用较长的位数来表示，就会使表示的平均位数缩短。

6.RISC精简指令系统（RISC），不是简单地把指令系统进行简化，而是通过简化指令的途径使计算机的结构更加简单合理，以减少指令的执行周期数，从而提高运算速度。

7.CISC复杂指令系统（CISC），设计风格力图缩小机器语言与高级语言的语义差距，使源程序长度尽可能的短，以及尽可能少的访问存储器和执行尽可能少的指令，以求获得高性能。

8.非专用总线可以被多种功能或多个部件所分时共享，同一时间只有一对部件可使用总线进行通信。

9.数据宽度I/O设备取得I/O总线后所传送数据的总量.10.中断响应次序是在同时发生多个不同中断类的中断请求时，中断响应硬件中的排队器所决定的响应次序。

11.中断处理次序中断处理完的次序，也即中断处理程序完成中断处理的次序。

计算机系统结构习题答案(李学干)

计算机系统结构习题解答第一章习题一1.2一台经解释实现的计算机，可以按照功能划分成4级。

每一级为了执行一条指令需要下一级的N条指令解释。

若执行第1级的一条指令需K纳秒时间，那么执行第2、3、4级的一条指令个需要多少时间？解：①分析：计算机按功能分级时，最底层的为第1级。

向上一次是第2 、3、4级。

解释执行是在低级机器级上，用它的一串指令或语句来解释执行高一级上的一条指令的功能。

是逐条解释的。

②解答：执行第2、3、4级的一条指令各需KNns,KN2ns,KN3ns的时间。

1.3操作系统机器级的某些指令就用传统机器级的指令，这些指令可以用微程序直接实现，而不由操作系统自己来实现。

根据你对习题1.2的回答，你认为这样做有哪两个好处？答：可以加快操作系统操作命令解释的速度。

同时也节省了存放解释操作命令这部分解释程序所占用的空间。

简化了操作系统机器级的设计。

也有利于减少传统机器级的指令条数。

1.5硬件和软件在什么意义上是等效的？在什么意义上是不等效的？试举例说明。

答：硬件和软件在逻辑意义上是等效的。

在物理意义上是不等效的。

①在原理上，用硬件或固件实现的功能完全可以用软件来完成。

用软件实现的功能也可以用硬件或固件来完成。

功能一样。

②只是反映在速度、价格、实现的难易程度上，这两者是不同的。

性能不同。

③例如，浮点运算在80386以前一直是用软件实现的。

到了80486，将浮点运算器集成到了CPU中，可以直接通过浮点运算指令用硬件实现。

但速度却高的多。

1.9下列哪些对系统程序员是透明的？哪些对应用程序员是透明的？系列机各档不同的数据通路宽度；虚拟存储器；Cache存储器；程序状态字；“启动I/O”指令；“执行”指令；指令缓冲器。

答：①对系统程序员和应用程序员均透明的：是全用硬件实现的计算机组成所包含的方面。

有：数据通路宽度、Cache存储器、指令缓冲器。

②仅对应用程序员透明的：是一些软硬件结合实现的功能。

有：虚拟存储器、程序状态字、“启动I/O”指令。

计算机体系结构第5章_并行处理技术

第5章并行处理技术
3.累加和并行算法
对于累加和这样的递归操作，为了加快并行计算，常采用递归折叠方法。
一般而言，对于在P个处理单元上实现P个元素累加求和，需要折叠 log2 P 次，并行相加 log2 P 次，并行传送数据的次数根据各PE间互连网络的拓扑结构不同而有很大差异。设加法1次所需的时间为t加，并行相加的总次数为n，数据在两个相邻处理单元之间传送一次所需的时间为t传，并行传送数据的总次数为 x，则并行处理所需的总的时间为：nt加+ xt传。
在设计互连网络时应考虑以下的四个特征： 1.通信工作方式通信工作方式可分为同步和异步两种。 2.控制策略控制策略分为集中和分散两种。 3.交换方式交换方式分为线路交换和分组交换两种。 4.网络拓扑网络拓扑分为静态和动态两种。
第5章并行处理技术
5.3.2 互连函数的表示互连函数----互连函数描述的是各处理单元之间或处理单元与共享主存
(1)若处理单元的个数P＜n2
第5章并行处理技术
第5章并行处理技术
下面分析这种并行算法的计算时间和通信时间。 ①计算时间用Pij计算Cij时，需要对(n/m×n/m)阶子矩阵中的每个元素cij进行n次乘法和n次加法，故Pij的运行时间为： n/m×n/m×n×(t乘+t加)=n3/m2×(t乘+t加)
(3)∵ t乘、t加和tw 均为一个指令周期，ts忽略不计，n=64，m=8 ∴ 整个矩阵乘算法所需的总的运行时间为： TP =n3/m2×(t乘+t加)+ 2(mts + n2/m×tw) =643/82×(1+1)+2(0+642/8×1) =9216(指令周期)
第5章并行处理技术

第1章-计算机系统结构(第五版)李学干【可编辑全文】

3.
1) 系列机只能在系统结构相同或相近(允许向后稍许发展) 的机器之间实现汇编语言软件的移植。要求原来在B机器上运行的应用软件，能移植到有不同系统结构的A机器上，根据层次结构概念，可把B机器的机器语言看成是在A机器的机器语言级之上的一个虚拟机器语言，在A机器上用虚拟机概念来实现B机器的指令系统，如图 1 - 6所示。
图 1-6 用模拟方法实现应用软件的移植
如果能直接用微程序去解释B机器的指令，如图1 - 7所示，显然就会加快这一解释过程。
仿真和模拟的主要区别在于解释用的语言。仿真是用微程序解释，其解释程序存在于控制存储器中; 而模拟是用机器语言程序解释，其解释程序存在于主存中。
3) 不同系列间的软件移植一般是仿真和模拟并行。
TCPUICCPI1fc
假设系统共有n种指令，第i种指令的时钟周期数为 CPIi，第i种指令在程序中出现的次数为Ii，则
TCP U i n1 (CP iIIi)1 fc
这样
n
CP Ii1CIC P iIi i n1CP iIIIiC
为了反映程序的运行速度，通常引入如下一些定量指
(1) MIPS(Million Instructions Per Second，百万条指令数每秒)
1 MFLOPS≈3 MIPS
2. 在设计计算机系统时，一般应遵循如下的定量设计原
理：
(1) 哈夫曼(Huffman)压缩原理。 (2) Amdahl定律。性能可改进比fnew是系统性能可改进部分占用的时间与未改进时系统总执行时间的比值，显然，0≤fnew≤1。部件加速比rnew是系统性能可改进部分在改进后性能提高的比值。不难看出，rnew＞1
1.1 计算机系统的层次结构 1.2 计算机系统结构、计算机组成和计算机实现 1.3 计算机系统的软、硬件取舍和性能评测及定量设计原理 1.4 软件、应用、器件的发展对系统结构的影响 1.5 系统结构中的并行性开发及计算机系统的分类 1.6 本章小结

计算机系统结构课件：第五章并行处理技术

多机互连多计算机系统
并行处理技术发展
时间重叠
先行控制高速缓存
指令操作宏流水线
异构型多处理机系统
高级语言数据库处理机
松散耦合系统、专用外围处理机
功能专用化
计算机系统结构
Computer Architecture
第五章并行处理机和多处理机
并行处理中需研究的课题：
（1）在处理机数目很多的情况下，要把任何一个问题分成足够多的并行过程（即任务分配）非常困难，并且也不是所有问题都能做到这一点。
第五章并行处理机和多处理机
时延（TC ）——机器各子系统间通信开销的时间量度。如：存贮时延是处理机访问存贮器所需时间；同步时延是两台处理机互相同步所需的时间。
通信时延问题：计算机中不同的时延是由机器内部系统结构，实现技术和通信方式决定。系统结构和实现技术将会影响子系统间容许时延的选择。可以用平衡粒度和时延的办法来求得较好的计算机系统性能。
分布存贮器阵列处理机结构
CU CUM
SC
I/O
D
接口
PEM0 PEM1
PE0
PE1
ICN
PEMN-1 PEN-1
计算机系统结构
Computer Architecture
第五章并行处理机和多处理机
ILLIAC-IV 结构（分布存贮器并行处理机结构）
•处理单元阵列
由64个结构完全相同的处理单元PEi 构成，每个处理单元PEi字长 64位，PEMi为隶属于PEi的局部存储器，每个存储器有2K字，全部 PEi由CU统一管理，PEi都有一根方式位线，用来向CU传送每个PEi 的方式寄存器D中的方式位，使CU能了解各PEi的状态是否活动，作为控制它们工作的依据。

第5章-计算机系统结构(第五版)李学干

时供运算用。这样，“执行k”与“分析k+1”访问通用寄存器
组的时间关系如图5 - 9所示。
第5章标量处理机
图5-9
“执行k”、“分析k+1”重叠时，访问通用寄存器组的时间关系
第5章标量处理机
如果在运算器的输出到B或C输入之间增设“相关专用通路”，如图5 - 10 所示，则在发生L1或L2相关时，接通相应的相关专用通路，“执行k”时就可以在将运算结果送入通用
出机构的具体逻辑组成。而对B一次相关，则除此之外，还
需再推后一个“执行”周期，如图5 - 12(b)所示。由于B相关的概率并不是很低，增设B相关专用通路是值
得的，办法如图5 - 13所示。
第5章标量处理机
图 5 – 12 B (a) B二次相关的推后处理； (b) B一次相关的推后处理
第5章标量处理机
图 5 - 13
B相关专用通路法
第5章标量处理机
5.2 流水方
5.2.1
1. “分析k+1”与“执行k”的一次重叠是把指令的解释过程分解成“分析”与“执行”两个子过程，在独立的分析部件和执行部件上时间重叠地进行。若“分析”与“执行”子过程都需要Δt1的时间，如图5 - 14所示，则一条指令的解释
间关系。
第5章标量处理机
图 5 - 4 第k条指令和第k+1条指令的时间关系
第5章标量处理机
5.1.2
1.
当第k条指令是条件转移且转移成功时，传统做法与延迟转移做法的比较如图5 - 5所示。
第5章标量处理机
图 5 - 5 当第k条指令是条件转移且转移成功时， (a) 条件转移成功时成了顺序解释； (b) 采用延迟转移，条件转移成功时，仍保持重叠

《大学计算机基础》第五版_第1-4章课后习题答案

《大学计算机基础》第五版_第1-4章课后习题答案1.简述计算机系统的组成。

由硬件系统和软件系统组成2.计算机硬件包括那几个部分？分别说明各部分的作用。

a）主机和外设b）主机包括中央处理器和内存作用分别是指挥计算机的各部件按照指令的功能要求协调工作和存放预执行的程序和数据。

外设包括输入输出设备和外存，作用是接受用户输入的原始数据和程序并将它们转化为计算机可以识别的形式存放在内存中，将存放在内存中由计算机处理的结果转变为人们所能接受的形式。

3.指令和程序有什么区别？试述计算机执行指令的过程。

a)指令是能被计算机识别并执行的二进制代码，程序是计算机指令的有序集合。

b)取指令，分析指令，执行指令。

4.指令的串行执行和并行执行有什么区别？串行执行即在任何时刻只能执行一条指令，并行执行可以执行多条指令。

5.什么是流水线技术?在程序执行时多条指令重叠进行操作的一种准并行处理技术。

6.简述系统软件和应用软件的区别。

系统软件是指控制计算机的运行、管理计算机的各种资源、并为应用软件提供支持和服务。

应用软件是利用计算机的软、硬件资源为某一专门目的而开发的软件。

7.简述机器语言、汇编语言、高级语言各自的特点。

机器语言编程工作量大、难学难记难修改；汇编语言编程质量高，站存储空间少、执行速度快；高级语言接近自然语言和数学公式。

8.简述解释和编译的区别。

解释的翻译工作可立即执行，而编译的翻译工作不可立即装入机器执行。

9.简述将资源程序编译成可执行程序的过程。

首先产生一个与资源程序等价的目标程序，然后连接程序将目标程序和有关的程序库组合成一个完整的可执行程序。

10.简述常用各种高级语言的特点。

FORTRAN：用于科学计算。

COBOL：面向商业的通用语言。

C/C++:功能丰富，灵活，简洁明了。

BASIC：非结构化，功能少，速度慢。

JAVA：严谨可靠易懂。

11.什么是主板?它主要有哪些部件？各部件是如何连接的？a)主板（母版）是微型计算机中最大的一块集成电路板，也是其他部件和各种外部设备的连接载体。

计算机体系结构第五章课后习题答案

第五章存储层次5.1名词解释1．存储层次——采用不同的技术实现的存储器，处在离CPU不同距离的层次上，目标是达到离CPU最近的存储器的速度，最远的存储器的容量。

2．全相联映象——主存中的任一块可以被放置到Cache中任意一个地方。

3．直接映象——主存中的每一块只能被放置到Cache中唯一的一个地方。

4．组相联映象——主存中的每一块可以放置到Cache中唯一的一组中任何一个地方（Cache分成若干组，每组由若干块构成）。

5．替换算法——由于主存中的块比Cache中的块多，所以当要从主存中调一个块到Cache中时，会出现该块所映象到的一组（或一个）Cache块已全部被占用的情况。

这时，需要被迫腾出其中的某一块，以接纳新调入的块。

6．L RU——选择最近最少被访问的块作为被替换的块。

实际实现都是选择最久没有被访问的块作为被替换的块。

7．写直达法——在执行写操作时，不仅把信息写入Cache中相应的块，而且也写入下一级存储器中相应的块。

8．写回法——只把信息写入Cache中相应块，该块只有被替换时，才被写回主存。

9．按写分配法——写失效时，先把所写单元所在的块调入Cache，然后再进行写入。

10．不按写分配法——写失效时，直接写入下一级存储器中，而不把相应的块调入Cache。

11．写合并——在往缓冲器写入地址和数据时，如果缓冲器中存在被修改过的块，就检查其地址，看看本次写入数据的地址是否和缓冲器内某个有效块的地址匹配。

如果匹配，就将新数据与该块合并。

12．命中时间——访问Cache命中时所用的时间。

13．失效率——CPU访存时，在一级存储器中找不到所需信息的概率。

14．失效开销——CPU向二级存储器发出访问请求到把这个数据调入一级存储器所需的时间。

15．强制性失效——当第一次访问一个块时，该块不在Cache中，需要从下一级存储器中调入Cache，这就是强制性失效。

16．容量失效——如果程序在执行时，所需要的块不能全部调入Cache中，则当某些块被替换后又重新被访问，就会产生失效，这种失效就称作容量失效。

谢希仁计算机网络第五版(第5章)课后习题答案

第五章传输层5—01试说明运输层在协议栈中的地位和作用，运输层的通信和网络层的通信有什么重要区别？为什么运输层是必不可少的？答：运输层处于面向通信部分的最高层，同时也是用户功能中的最低层，向它上面的应用层提供服务运输层为应用进程之间提供端到端的逻辑通信，但网络层是为主机之间提供逻辑通信（面向主机，承担路由功能，即主机寻址及有效的分组交换）。

各种应用进程之间通信需要“可靠或尽力而为”的两类服务质量，必须由运输层以复用和分用的形式加载到网络层。

5—02网络层提供数据报或虚电路服务对上面的运输层有何影响？答：网络层提供数据报或虚电路服务不影响上面的运输层的运行机制。

但提供不同的服务质量。

5—03当应用程序使用面向连接的TCP和无连接的IP时，这种传输是面向连接的还是面向无连接的？答：都是。

这要在不同层次来看，在运输层是面向连接的，在网络层则是无连接的。

5—04试用画图解释运输层的复用。

画图说明许多个运输用户复用到一条运输连接上，而这条运输连接有复用到IP数据报上。

5—05试举例说明有些应用程序愿意采用不可靠的UDP，而不用采用可靠的TCP。

答：VOIP：由于语音信息具有一定的冗余度，人耳对VOIP数据报损失由一定的承受度，但对传输时延的变化较敏感。

有差错的UDP数据报在接收端被直接抛弃，TCP数据报出错则会引起重传，可能带来较大的时延扰动。

因此VOIP宁可采用不可靠的UDP，而不愿意采用可靠的TCP。

5—06接收方收到有差错的UDP用户数据报时应如何处理？答：丢弃5—07如果应用程序愿意使用UDP来完成可靠的传输，这可能吗？请说明理由答：可能，但应用程序中必须额外提供与TCP相同的功能。

5—08为什么说UDP是面向报文的，而TCP是面向字节流的？答：发送方UDP 对应用程序交下来的报文，在添加首部后就向下交付IP 层。

UDP 对应用层交下来的报文，既不合并，也不拆分，而是保留这些报文的边界。

接收方UDP 对IP 层交上来的UDP 用户数据报，在去除首部后就原封不动地交付上层的应用进程，一次交付一个完整的报文。

计算机系统结构第1-8章部分作业答案

第一章1.6 某台主频为400MHz 的计算机执行标准测试程序，程序中指令类型、执行数量和平均时钟周期数如下：求该计算机的有效CPI 、MIPS 和程序执行时间。

解：（1）CPI ＝(45000×1＋75000×2＋8000×4＋1500×2) / 129500＝1.776 (或259460) （2）MIPS 速率＝f/ CPI ＝400/1.776 ＝225.225MIPS (或2595180MIPS) （3）程序执行时间= (45000×1＋75000×2＋8000×4＋1500×2)／400=575μs1.9 假设某应用程序中有4类操作，通过改进，各操作获得不同的性能提高。

具体数据（1）改进后，各类操作的加速比分别是多少？（2）各类操作单独改进后，程序获得的加速比分别是多少？（3）4类操作均改进后，整个程序的加速比是多少？解：根据Amdahl 定律SeFeFe S n +-=)1(1可得4类操作均改进后，整个程序的加速比：2.16)1(1≈+-=∑∑iii n S F F S1.10 第二章变长编码，哈夫曼编码第三章3.12 有一条指令流水线如下所示：（1）求连续输入10条指令的情况下，该流水线的实际吞吐率和效率。

（2）该流水线的瓶颈在哪一段？请采用两种不同的措施消除此瓶颈。

对于你所给出的两种新的流水线，连续输入10条指令时，其实际吞吐率和效率各是多少？解：（1）本题主要考察对各功能段用时不等的线性流水线的性能计算公式的掌握情况。

2200(ns)2009200)10050(50t n t T maxki i =⨯++++=∆-+∆=∑=)1(1流水 )(ns 2201T nTP 1-==流水45.45%1154400TP ktTP E k1i i≈=⋅=∆⋅=∑= 注意：对于公式不能死记硬背，需要充分理解，注意公式的适用条件。

计算机体系结构----第五章

采用先行控制方式时一个程序的执行情况：
指令地址 „„ k-i-1 k-i „„ k-1 k k+1 „„ k+j k+j+1 „„ k+j+n k+j+n+1 k+j+n+2 „„ k+j+n+m k+j+n+m+1 „„ 指令执行情况已经执行完成的指令在后行写数栈中等待把结果写到主存储器中的指令正在指令执行部件中执行的指令已经由指令分析器预处理完成，存放在先行操作栈中的 RR*型指令，指令所需要的操作数已经读到先行读数栈中已经由指令分析器预处理完成，存放在先行操作栈中，指令所需要的操作数还没有读到先行读数栈中正在指令分析器中进行分析和预处理的指令已经从主存储器中预取到先行指令缓冲栈中的指令还没有进入处理机的指令
（2）先行操作栈指令分析器对已经存放在先行指令缓冲栈里的指令进行预处理，把处理之后的指令送入先行操作栈。处于指令分析器和运算控制器之间，使指令分析器和运算器能够各自独立工作。
对于无条件转移及条件转移指令等程序控制指令，一般在指令分析器中就能直接执行各种运算型指令、移位指令、数据传送指令等都要先处理成RR型指令，送入先行操作栈经过指令分析器预处理之后送到先行操作栈中等待运算器执行的指令就都变成了统一格式的RR型指令执行这种指令所需的操作数都存放在通用寄存器或先行读数栈中
2.解决访存冲突的方法： (1)两个独立的存储器：指令存储器和数据存储器。如果再规定，执行指令阶段产生的运算结果只写到通用寄存器，则取指令、分析指令和执行指令就可以同时进行。许多高性能计算机具有独立的指令Cache和数据 Cache结构，称为哈佛结构。 (2)采用低位交叉存取方式：这种方法不能根本解决冲突问题。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

1. 当第k条指令是条件转移且转移成功时，传统做法与延迟转移做法的比较如图5 - 5所示。
图 5 - 5 当第k条指令是条件转移且转移成功时，
(a) 条件转移成功时成了顺序解释； (b) 采用延迟转移，条件转移成功时，仍保持重叠
2. 当执行到“执行”指令时，按第二操作数地址 (X2)+(B2)+D2取出操作数区中单元的内容作为指令来执行，参见图5 - 6。
5.1 重叠方式 5.2 流水方式 5.3 指令级高度并行的超级处理机 5.4 本章小结
5.1 重叠方式
5.1.1
指令的重叠解释使机器语言程序的执行速度会比采用顺序解释有较大的提高。
解释一条机器指令的微操作可归并成取指令、分析和执行三部分，时间关系如图5 - 1所示。
图 5 - 1 对一条机器指令的解释
图 5 - 9 “执行k”、“分析k+1”重叠时，访问通输入之间增设“相关专用通路”，如图5 - 10 所示，则在发生L1或L2相关时，接通相应的相关专用通路，“执行k”时就可以在将运算结果送入通用
B或C寄存器，从而大大缩短了其间的传送时间，并保证“执行k+1”用此操作数时，它已在B或C寄存器中准备好了。
也就是说，在“执行k”得到的、送入通用寄存器的运算结果是来不及为“分析k+2”作基址值用，更不用说为“分析 k+1”作基址值用。
即B(k+1)=L3(k)时发生B一次相关，B(k+2)=L3(k)时发生B二次相关，如图5 - 11所示。
图 5 - 11 B一次相关与二次相关
由图5 - 11可见，B二次相关时，只需推后“分析k+2”的始点到“执行k”送入通用寄存器的运算结果能在“分析k+2 ” 开始时出现于通用寄存器输出总线上即可，如图5 - 12(a)所示。至于推后多少拍，这取决于通用寄存器组译码、读
图 5 - 10 用相关专用通路解决通用寄存器组的数相关
设操作数的有效地址 (Xd)+(B2)+d2是由分析器中的地址加法器形成的。由于多数情况的“分析”周期等于主存周期，因此，从时间上要求，在“分析”周期的前半段就应由通用寄存器输出总线取得(B2)，送入地址加法器。
由于运算结果是在“执行”周期的末尾才送入通用寄存器组的，因此它当然不能立即出现在通用寄存器输出总线上。
图 5 - 15 (a) 指令解释的流水处理； (b) 流水处理的时(间)空(间)图
2. 从不同的角度对流水可进行不同的分类。流水的向上扩展可理解为在多个处理机之间流水，如图 5 - 16所示。
图 5 - 16 处理机间的流水处理
要完成多种功能的流水可将多个单功能流水线组合。如 CRAY-1有12条单功能流水线，分别完成地址加、地址乘、标量加、标量移位、标量逻辑运算、标量数“数”、向量加、向量移位、向量逻辑运算、浮点加、浮点乘、浮点迭代求倒
图 5 - 14 指令分解为“分析”与“执行”子过程
如果把“分析”子过程再细分成“取指令”、“指令译码”和“取操作数”3个子过程，并改进运算器的结构以加快其“执行”子过程(如图5 - 15 (a)所示，这4个子过程分别由独立的子部件实现)，让经过的时间都等于Δt2，则指令解释的时(间)空(间)关系如图5 - 15(b)所示。图中的1、2、3、4、 5表示处理机所处理的第1、2、3、4、5条指令。
5.2 流水方
5.2.1
1. “分析k+1”与“执行k”的一次重叠是把指令的解释过程分解成“分析”与“执行”两个子过程，在独立的分析部件和执行部件上时间重叠地进行。若“分析”与“执行”子过程都需要Δt1的时间，如图5 - 14所示，则一条指令的解释需要2Δt1完成，但机器每隔Δt1就能解释完一条指令。
图 5 - 3 一次重叠工作方式
(2) 要解决“分析”与“执行”操作的并行。 (3) 要解决“分析”与“执行”操作控制上的同步。 (4) 要解决指令间各种相关的处理。图5 - 4示意出条件转移时第k条指令和第k+1条指令的时间关系。
图 5 - 4 第k条指令和第k+1条指令的时间关系
5.1.2
图5 - 2(b)是可能的一种方式。显然，重叠解释虽不能加快一条指令的解释，却能加快相邻两条指令以至整段程序的
图5-2 (a) 顺序解释; (b) 重叠解释的一种方式
(1) 要解决访主存的冲突。最多可预取多少条指令取决于指缓的容量。如果每次都
可以从指缓中取得指令，则“取指k+1”的时间很短，就可把这个微操作合并到“分析k+1”内，从而由原先的“取指k+2”、 “分析k+1”、“执行k”重叠变成只是“分析k+1”与“ k”的重叠，如图5 - 3所示。
出机构的具体逻辑组成。而对B一次相关，则除此之外，还需再推后一个“执行”周期，如图5 - 12(b)所示。
由于B相关的概率并不是很低，增设B相关专用通路是值得的，办法如图5 - 13所示。
图 5 – 12 B (a) B二次相关的推后处理； (b) B一次相关的推后处理
图 5 - 13 B相关专用通路法
L1、L3分别指明存放第一操作数和结果数的通用寄存器号，B2为形成第二操作数地址的基址值所在通用寄存器号， d2为相对位移量。图5 - 8示意出它们的时间关系。
图 5 - 8 指令解释过程中与通用寄存器内容有关的微操作时间关系
有些指令需要从通用寄存器组中取两个操作数 (L1)和 (L2)，若通用寄存器组做在一个片子上，每次只能读出一个数，则在“分析k+1”期间，操作数(L1)和(L2)就需要在不同拍时取得，分别送入运算器的B和C寄存器，以便在“执行k+1” 时供运算用。这样，“执行k”与“分析k+1”访问通用寄存器组的时间关系如图5 - 9所示。
图 5 - 6 IBM 370“执行”指令的执行
3. 主存空间数相关是相邻两条指令之间出现对主存同一单元要求先写而后读的关联，如图5 - 7(a)所示。
图5-7 (a) 主存数相关的时间关系;
(b) 由存控推后“分析k+1”的读
4.
一般的机器中，通用寄存器除了存放源操作数、运算结果外，也可能存放形成访存操作数物理地址的变址值或基址值，因此，通用寄存器组的相关又有操作数的相关和变址值或基址值的相关两种。

计算机系统结构(第五版)第5章

合集下载

白中英第五版计算机组成原理第5章

吉林大学计算机系统结构题目整合第五章

计算机组成与系统结构(第五版立体化教材)

第5章-计算机系统结构(第五版)李学干

精品文档-计算机系统结构(第五版)(李学干)-第4章

计算机组成原理PPTPPT课件

计算机系统结构第五版习题答案

计算机系统结构习题答案(李学干)

计算机体系结构第5章_并行处理技术

第1章-计算机系统结构(第五版)李学干【可编辑全文】

计算机系统结构课件：第五章并行处理技术

第5章-计算机系统结构(第五版)李学干

《大学计算机基础》第五版_第1-4章课后习题答案

计算机体系结构第五章课后习题答案

谢希仁计算机网络第五版(第5章)课后习题答案

计算机系统结构第1-8章部分作业答案

计算机体系结构----第五章

文档推荐

最新文档

计算机系统结构(第五版)第5章

合集下载

白中英第五版计算机组成原理第5章

吉林大学计算机系统结构题目整合第五章

计算机组成与系统结构(第五版 立体化教材)

第5章-计算机系统结构(第五版)李学干

精品文档-计算机系统结构(第五版)(李学干)-第4章

计算机组成原理PPTPPT课件

计算机系统结构第五版习题答案

计算机系统结构习题答案(李学干)

计算机体系结构第5章_并行处理技术

第1章-计算机系统结构(第五版)李学干【可编辑全文】

计算机系统结构课件：第五章 并行处理技术

第5章-计算机系统结构(第五版)李学干

《大学计算机基础》第五版_第1-4章课后习题答案

计算机体系结构第五章课后习题答案

谢希仁计算机网络第五版(第5章)课后习题答案

计算机系统结构第1-8章部分作业答案

计算机体系结构----第五章

文档推荐

最新文档

计算机组成与系统结构(第五版立体化教材)

计算机系统结构课件：第五章并行处理技术