高级计算机系统结构第三章
- 格式:ppt
- 大小:379.00 KB
- 文档页数:53
第三章流水线技术知识点汇总先行控制、流水线、单功能流水线、多功能流水线、静态流水线、动态流水线、部件级流水线、处理机级流水线、处理机间流水线、线性流水线、非线性流水线、顺序流水线、乱序流水线、时空图、流水线性能评价(吞吐率、加速比、效率)、解决流水线瓶颈问题方法、相关(数据相关、名相关、控制相关)、换名技术、流水线冲突(结构冲突、数据冲突、控制冲突)、流水线互锁机制、定向技术、指令调度、预测分支失败、预测分支成功、延迟分支(从前调度、从失败处调度、从成功处调度)、流水寄存器、3种向量处理方式(横向、纵向、纵横)、链接技术。
简答题1.流水技术有哪些特点?(答出4个即可)(知识点:流水线)答:1.将处理过程分解为若干子过程,由专门的功能部件来实现,2各段的时间尽可能相等,3各部件间都有一个缓冲寄存器,4适用于大量重复的时序过程,5需要通过时间和排空时间。
2.什么是静态流水线?什么是动态流水线?(知识点:静态流水线、动态流水线)答:同一时间段内,多功能流水线中的各段只能按同一种功能的连接方式工作;同一时间段内,多功能流水线中的各段可以按照不同的方式连接同时执行多种功能。
3.什么是单功能流水线?什么是多功能流水线?(知识点:单功能流水线、多功能流水线)答:只能完成一种固定功能的流水线。
流水线的各段可以进行不同的连接,以实现不同的功能。
4.什么是线性流水线?什么是非线性流水线?(知识点:线性流水线、非线性流水线)答:流水线的各段串行连接,没有反馈回路。
流水线中除了有串行的连接外,还有反馈回路。
5.列举3种相关。
(知识点:相关)答:数据相关,名相关,控制相关。
6.流水线中有哪三种冲突?各是什么原因造成的?(知识点:流水线冲突)答:结构冲突,硬件资源满足不了指令重叠执行的要求;数据冲突,指令在流水线中重叠执行时需要用到前面指令的执行结果;控制冲突,流水线遇到分支指令和其他会改变PC值的指令。
7.选择至少2种解决流水线结构冲突的方法简述。
计算机系统结构-第三章(习题解答)1. 什么是存储系统?对于一个由两个存储器M 1和M 2构成的存储系统,假设M1的命中率为h ,两个存储器的存储容量分别为s 1和s 2,存取时间分别为t 1和t 2,每千字节的成本分别为c 1和c 2。
⑴ 在什么条件下,整个存储系统的每千字节平均成本会接近于c 2? ⑵ 该存储系统的等效存取时间t a 是多少?⑶ 假设两层存储器的速度比r=t 2/t 1,并令e=t 1/t a 为存储系统的访问效率。
试以r 和命中率h 来表示访问效率e 。
⑷ 如果r=100,为使访问效率e>0.95,要求命中率h 是多少?⑸ 对于⑷中的命中率实际上很难达到,假设实际的命中率只能达到0.96。
现在采用一种缓冲技术来解决这个问题。
当访问M 1不命中时,把包括被访问数据在内的一个数据块都从M 2取到M 1中,并假设被取到M 1中的每个数据平均可以被重复访问5次。
请设计缓冲深度(即每次从M 2取到M 1中的数据块的大小)。
答:⑴ 整个存储系统的每千字节平均成本为:12s 1s 2c 2s 1s 1c 2s 1s 2s 2c 1s 1c c ++⨯=+⨯+⨯=不难看出:当s1/s2非常小的时候,上式的值约等于c2。
即:s2>>s1时,整个存储器系统的每千字节平均成本会接近于c2。
⑵ 存储系统的等效存取时间t a 为:2t )h 1(1t h t a ⨯-+⨯=⑶r)h 1(h 1t )h 1(t h t t t e 211a 1⨯-+=⨯-+⨯==⑷ 将数值代入上式可以算得:h>99.95% ⑸通过缓冲的方法,我们需要将命中率从0.96提高到0.9995。
假设对存储器的访问次数为5,缓冲块的大小为m 。
那么,不命中率减小到原来的1/5m ,列出等式有:m596.0119995.0--= 解这个方程得:m=16,即要达到⑷中的访问效率,缓冲的深度应该至少是16(个数据单位)。
第一章量化设计与分析根底1.计算机性能提升表现在哪些方面:半导体技术不断提高,如特征尺寸和时钟频率;计算机体系结构不断改良,如高级语言编译器、标准化的操作系统和指令更为简单的RISC 体系结构。
2.并行分类:1〕应用程序的并行分类:数据级并行(DLP):同时操作多数据任务级并行(TLP):创立了一些能够独立处理但大量采用并行方式执行的工作任务2〕硬件的体系结构:指令级并行(ILP):在编译器帮助下。
利用流水线的思想开发数据级并行,利用推理执行的思想以中等水平开发数据集并行。
向量体系结构和图像处理单元(GPUs):将单条指令并行应用于一个数据集,来到达数据集并行线程级并行:在紧耦合硬件模型中开发数据集并行或任务及并行,这种模型允许在线程之间进行交互。
请求级并行:在程序员或操作系统制定的大量去耦合任务之间开发并行3.Flynn’s分类是如何分类的?Flynn’s分类主要分为四类:1)单指令流、单数据流(SISD):一条指令处理一个数据,可以利用指令级并行(ILP)2)单指令流、多数据流(SIMD):将大量重复设置的处理单元按一定方式互连成阵列,在单一控制部件CU(Contrul Unit)控制下对各自所分配的不同数据并行执行同一指令规定的操作,主要应用于向量体系结构、多媒体扩展指令和图像处理单元(Graphics processor units) 3)多指令流、单数据流(MISD):用多个指令作用于单个数据流,没有商业实现4)多指令流多数据流(MIMD):每个处理器都提取自己的指令,对自己的数据进行操作,主要用于开发线程级并行TLP〔紧耦合MIMD〕和请求级并行RLP〔松耦合MIMD〕4.什么是“真正〞的计算机体系结构?1)满足目标和功能需求的组成和硬件;2)限制条件下最大化性能:本钱、功耗、可用性;3)包括指令集体系结构(ISA),微体系结构,硬件5.计算题:可靠性的计算平均无故障时间:Mean time to failure (MTTF),MTTF是故障率的倒数。
word文档下载后可自由复制编辑你计算机系统结构清华第2版习题解答word文档下载后可自由复制编辑1 目录1.1 第一章(P33)1.7-1.9(透明性概念),1.12-1.18(Amdahl定律),1.19、1.21、1.24(CPI/MIPS)1.2 第二章(P124)2.3、2.5、2.6(浮点数性能),2.13、2.15(指令编码)1.3 第三章(P202)3.3(存储层次性能),3.5(并行主存系统),3.15-3.15加1题(堆栈模拟),3.19中(3)(4)(6)(8)问(地址映象/替换算法--实存状况图)word文档下载后可自由复制编辑1.4 第四章(P250)4.5(中断屏蔽字表/中断过程示意图),4.8(通道流量计算/通道时间图)1.5 第五章(P343)5.9(流水线性能/时空图),5.15(2种调度算法)1.6 第六章(P391)6.6(向量流水时间计算),6.10(Amdahl定律/MFLOPS)1.7 第七章(P446)7.3、7.29(互连函数计算),7.6-7.14(互连网性质),7.4、7.5、7.26(多级网寻径算法),7.27(寻径/选播算法)word文档下载后可自由复制编辑1.8 第八章(P498)8.12(SISD/SIMD算法)1.9 第九章(P562)9.18(SISD/多功能部件/SIMD/MIMD算法)(注:每章可选1-2个主要知识点,每个知识点可只选1题。
有下划线者为推荐的主要知识点。
)word 文档 下载后可自由复制编辑2 例, 习题2.1 第一章(P33)例1.1,p10假设将某系统的某一部件的处理速度加快到10倍,但该部件的原处理时间仅为整个运行时间的40%,则采用加快措施后能使整个系统的性能提高多少?解:由题意可知:Fe=0.4, Se=10,根据Amdahl 定律SeFe Fe T To S n n +-==)1(1 56.164.01104.06.01≈=+=n Sword 文档 下载后可自由复制编辑例1.2,p10采用哪种实现技术来求浮点数平方根FPSQR 的操作对系统的性能影响较大。
第三章答案三、流水线技术(80空)1、对阶尾数相加2、求阶差规格化3、时间流水线的各段4、尽量相等流水线的瓶颈5、通过时间大量重复的时序输入端能连续地提供任务6、静态动态7、部件级处理机级8、标量流水处理机向量流水处理机9、线性流水线非线性流水线10、执行/有效地址计算周期存储器访问/分支完成周期11、译码读寄存器12、ALUoutput←A op B ALUoutput←NPC + Imm13、分支 STORE指令14、ALU指令 LOAD指令15、单周期多周期16、重复设置指令执行功能部件流水17、吞吐率等功能非流水线18、通过时间排空时间19、流水线寄存器的延迟时钟扭曲20、数据相关控制相关21、结构相关数据相关22、结构数据23、硬件开销功能单元的延迟24、写后读读后写写后读25、写后读读后写26、PC值改变为分支转移的目标地址 PC值保持正常(等于当前值加4)27、目标地址分支转移条件不成立28、8 存储器29、多功能线性 830、水平处理方式垂直处理方式31、纵向处理方式纵横处理方式32、存储器向量寄存器33、访问存储器的次数对存储器带宽的要求34、每秒执行多少指令(MIPS)每秒取得多少个浮点运算结果(MFLOPS)35、512 836、链接技术向量循环或分段开采技术37、源向量结果向量38、向量功能部件标量寄存器向量寄存器块39、向量寄存器向量功能部件3.1 流水线的基本概念1、流水线:将一个重复的时序过程,分解为若干个子过程,而每一个子过程都可有效地在其专用功能段上与其他子过程同时执行。
2、单功能流水线:只能完成一种固定功能的流水线。
3、多功能流水线:流水线的各段可以进行不同的连接,从而使流水线在不同的时间,或者在同一时间完成不同的功能。
4、静态流水线:同一时间内,流水线的各段只能按同一种功能的连接方式工作。
5、动态流水线:同一时间内,当某些段正在实现某种运算时,另一些段却在实现另一种运算。
第三章总线、中断与输入输出系统历年真题精选1. 通道程序执行结束后引发的中断是( B )。
A. 外中断B. I/O中断C. 程序性中断D. 机械校验中断2.磁盘外部设备适合于连接到( B )。
A. 字节多路通道B. 数组多路通道或选择通道C. 选择通道或字节多路通道D. 数组多路通道或字节多路通道3. 总线控制机构为解决N个部件利用总线时优先顺序的裁决,集中式按时查询,需外加控制线线数为( D )。
N]A.3 B. N+2 C. 2N+1 D. 2+[log24. 虽然中断响应顺序由硬件排队器固定好,但中断实际处置完的顺序是可以通过(系统软件)修改各中断级处置程序的(中断屏蔽)位,而动态改变。
5. 在知足通道设计流量不低于设备工作时的最大流量时,为使微观上不丢失设备信息,可以加设(数据缓冲器)或动态提高响应的(优先级)来弥补。
6. 总线控制方式有哪三种?各需要增加几根用于总线控制的控制线?并说明每种方式优先级的灵活性。
(P64-65)7.((1)20,20,25,40,40,100 us (2)200 B/ms (3)5 us )8.(1)1-3-4-2同步强化练习一、填空题。
1. 中断响应就是允许其中断CPU(现行程序)运行,转去对该请求进行预处置,包括保留(断点及其现场),调出有关处置该中断服务程序,准备运行。
2. 中断系统软硬件功能分派实质是中断(响应)硬件和中断(处置平衡)软件的功能分派。
3. 数组多路通道适用于连接多台(高)速设备,其通道“数据宽度”为(定长块)。
4. 输入输出系统包括输入输出设备、(设备控制器)及输入输出操作有关的(软硬件)。
5. 总线控制机构集中在一处的称(集中)式控制,分散在各部件的称(散布)式控制。
6. 多数低性能单用户计算机的输入输出由(程序员)安排,I/O系统设计主要解决CPU、主存和I/O设备在(速度)上的庞大不同。
7. 信息在总线上的双向传输有(半)双向和(全)双向两种。
第一章电脑体系结构的基本概念1.电脑系统结构的经典定义程序员所看到的电脑属性,即概念性结构与功能特性。
〔电脑组成:指电脑系统结构的逻辑实现。
电脑实现:电脑组成的物理实现〕2.电脑系统的多级层次结构:1.虚拟机:应用语言机器->高级语言机器->汇编语言机器->操作系统机器2.物理机:传统机器语言机器->微程序机器3.透明性:在电脑技术中,把这种本来存在的事物或属性,但从某种角度看又好似不存在的概念称为透明性。
4.编译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序5.解释:对于高一级机器上的程序中的每一条语句或指令,都转去执行低一级机器上的一段等效程序。
6.常见的电脑系统结构分类法有两种:Flynn分类法、冯氏分类法〔按系统并行度P m:计算机系统在单位时间内能处理的最大二进制位数〕进行分类。
Flynn分类法把电脑系统的结构分为4类:单指令流单数据流(SISD)单指令流多数据流(SIMD)多指令流单数据流(MISD)多指令流多数据流(MIMD)IS指令流,DS数据流,CS〔控制流〕,CU〔控制部件〕,PU〔处理部件〕,MM,SM〔表示存储器〕7.电脑设计的定量原理:1.大概率事件优先原理〔分配更多资源,到达更高性能〕2.Amdahl定理:加速比:S n=T0(加速前)T n(加速后)=1(1−Fe)+Fe/Se(Fe为可改良比例〔可改良部分的执行时间/总的执行时间〕,Se为部件加速比〔改良前/改良后〕3.程序的局部性原理:时间局部性:程序即将使用的信息很可能是目前使用的信息。
空间局部性:即将用到的信息可能与目前用到的信息在空间上相邻或相近。
4.CPU性能公式:1.时钟周期时间2.CPI:CPI = 执行程序所需的时钟周期数/IC3.IC(程序所执行的指令条数)8.并行性:电脑系统在同一时刻或者同一时间间隔内进行多种运算或操作。
同时性:两个或两个以上的事件在同一时刻发生。