第五章-标量处理机及流水线
- 格式:doc
- 大小:342.00 KB
- 文档页数:26
1、A.C. 23、采用4、CPU 5A.B.C.D. 6A.B.C.D. 78A.B.C.D. 9A. 10A.B.C.D. 11A.B.C.D.12、下列关于动态流水线正确的是()A.动态流水线是在同一时间内,当某些段正在实现某种运算时,另一些段却在进行另一种运算,这样对提高流水线的效率很有好处,但会使流水线控制变得很复杂B. 动态流水线是指运算操作并行C. 动态流水线是指指令步骤并行D. 动态流水线是指程序步骤并行13、流水CPU是由一系列叫做“段”的处理线路组成的。
一个m段流水线稳定时的CPU的吞吐能力,与m个并行部件的CPU 的吞吐能力相比()A.具有同等水平的吞吐能力B.不具备同等水平的吞吐能力C. 吞吐能力大于前者的吞吐能力D. 吞吐能力小于前者的吞吐能力14、设指令由取指、分析、执行3个子部件完成,并且每个子部件的时间均为△t,若采用常规标量流水线处理机(即处理机的度为1 )连续执行12条指令,共需15、若采用度为4的超标量流水线处理机,连续执行上述20条指令,只需16、设指令流水线把一条指令分为取指、分析、执行3个部分,且3部分的时间分别是t取指=2ns,t分析=2ns,t执行=1ns,则100条指令全部执行完毕需17、设指令由取指、分析、执行3个子部件完成,并且每个子部件的时间均为t,若采用常规标量流水线处理机,连续执行8条指令,则流水线的加速比为18、指令流水线中出现数据相关是流水线将受阻,()可解决数据相关问题。
A.增加硬件资源B.采用旁路技术C.采用分支预测技术D.以上都可以19、关于流水线技术的说法,错误的是()A.超标量技术需要配置多个功能部件和指令译码电路等B.与超标量技术和超流水线技术相比,超长指令字技术对优化编译器要求更高,而无其他硬件要求C.流水线按序流动时,在RAM、WAR和WAW中,只可能出现RAW相关D.超流水线技术相当于将流水线在分段,从而提高每个周期内功能部件的使用次数二、综合应用题1、某计算机的数据通路结构如图所示,写出实现ADD R1,(R2)的未操作序列(含取指令及确定后继指令的地址)。
第5章课后习题1.填空题(1) 衡量流水线性能的主要指标有(2) 指令乱序流动可能造成(3) 解决数据相关主要有(4) 超标量处理机开发的是行性。
(1). 吞吐率、加速比、效率(2). 先写后读、先读后写、写写(3). 推后分析、设置专用路径(4). 空间、时间2.假设一条指令的执行过程分为"取指令"、"分析"和"执行"三段,每一段的时间分别为△t、2△t和3△t。
在下列各种情况下,分别写出连续执行n条指令所需要的时间表达式。
(1) 顺序执行方式。
(2) 仅"取指令"和"执行"重叠。
(3) "取指令"、"分析"和"执行"重叠。
第2题(1) 顺序执行时每条指令用时=△t+2△t+3△t=6△t,因此n条指令所需要的时间=6n*△t(2) 第一条指令完成需要时间=△t+2△t+3△t=6△t,根据题义,下一条指令的"取指令"与上一条指令"执行"的最后一个△t重叠。
因此,自从第一条指令完成后,每隔4△t完成一条指令。
所以余下的n-1条指令用时(n-1)*4△t.所以,n条指令所需要的时间=6△t+(n-1)*4△t=2(2n+1)△t。
(3) 第一条指令完成需要时间=△t+2△t+3△t=6△t,由于一条指令的"取指令"和"分析"阶段和下一条指令的"执行"阶段重叠,因此,此后每3△t 完成一条指令,余下的n-1条指令用时(n-1)*3△t.因此n条指令所需要的时间=6△t+(n-1)*3△t=3(n+1)△t3.用一条5个功能段的浮点加法器流水线计算F=。
每个功能段的延迟时间均相等,流水线的输出端与输入端之间有直接数据通路,而且设置有足够的缓冲寄存器。
计算机系统结构-第五章⾃考练习题答案第五章重叠、流⽔和向量处理机历年真题精选1. “⼀次重叠”中消除“指令相关”最好的⽅法是( A )。
A. 不准修改指令B. 设相关专⽤通路C. 推后分析下条指令D. 推后执⾏下条指令2.流⽔处理机对全局性相关的处理不包括( D )。
A. 猜测法B. 提前形成条件码C. 加快短循环程序的执⾏D. 设置相关专⽤道路3. 推后“分析”和设置“(相关专⽤通道)”是解k1决重叠⽅式相关处理的两种基本⽅法。
前者是以(降低速度)为代价,使设备基本上不增加。
4. 流⽔线消除速度瓶颈的⽅法有瓶颈⼦过程(再细分)和瓶颈⼦过程(多套并联)两种。
5. 简述在流⽔机器中全局性相关的概念及处理全局性相关的⽅法。
(P144-146)6. 求向量D=A*(B+C),各向量元素个数均为6,参照CRAY-1⽅式分解为3条向量指令:①V3←存储器{访存取A送⼊V3寄存器组}②V2←V0+V1 {B+C→K}③V4←V2*V3 {K*A→D}当采⽤下列2种⽅式⼯作时各需多少拍才能得到全部结果?(1)①和②并⾏执⾏完后,再执⾏③;(27拍)(2)采⽤链接技术。
(22拍)(注:CRAY-1⽅式启动访存1拍,访存6拍,打⼊寄存器组1拍,加法6拍,乘7拍)7.有⼀个3段的单功能⾮线性流⽔线,预约表如下表所⽰。
(1)写出冲突向量,画冲突向量状态转移图并确定最佳调度⽅案。
(c=(101) ,最佳策略是每隔2△t流⼊⼀个任务)(2)按最佳调度⽅案输⼊5个任务,画出流⽔的时空图,求出此时的吞吐率和效率。
时钟t1t2t3t4段号S1√√S2√√S3√(吞吐率:5/12△t 效率:69.4% )8. 有⼀个双输⼊端的加—乘双功能静态流⽔线,由经过时间为Δt、2Δt、2Δt、Δt的1、2、3、4四个⼦过程构成。
加按1-2-4连接,乘按1-3-4连接,流⽔线输出设有数据缓冲器,也可将数据直接返回输⼊。
现要执⾏A*(B+C*(D+E*F))+G*H的运算,①调整计算顺序,画出能获得吞吐率尽量⾼的流⽔时空图,标出流⽔线⼊、出端数据的变化情况;②求出完成全部运算的时间及此期间流⽔线的效率和吞吐率。
第五章标量处理机与流水线选择题25,简答题10,演算题151 选择题★1.假设一条指令的执行过程可以分为“取指令”、“分析”和“执行”三段,每一段的执行时间分别为t∆、t∆3,顺序执行n条指令至少需要花费的2和t∆时间为:A. t3n∆B. t2n∆C. tn∆6D. tn∆答案:C★★2.假设一条指令的执行过程可以分为“取指令”、“分析”和“执行”三段,每一段的执行时间均为t∆,连续执行n条指令所需要花费的最短时间约为(假设仅有“取指令”和“执行”可重叠并假设n足够大):A. t3n∆B. t2n∆3C. tn∆2D. tn∆答案B3.假设一条指令的执行过程可以分为“取指令”、“分析”和“执行”三段,每一段的执行时间均为t∆,连续执行n条指令所需要花费的最短时间约为(假设仅有“取指令”和“分析”可重叠并假设n足够大):A. t3n∆B. t2n∆3C. tn∆2D. tn∆答案B★★4.假设一条指令的执行过程可以分为“取指令”、“分析”和“执行”三段,每一段的执行时间分别为t∆、t∆3,连续执行n条指令所需要花费的最2和t∆短时间约为(假设仅有“取指令”和“执行:”可重叠并假设n足够大):A. t6n∆B. t5n∆C. t3n∆D. tn∆答案B★★5.假设一条指令的执行过程可以分为“取指令”、“分析”和“执行”三段,每一段分别只有一个部件可供使用并且执行时间分别为t∆、t∆3,连续2和t∆执行n条指令所需要花费的最短时间约为(假设“取指令”、“分析”和“执行”可重叠并假设n足够大):A. t6n∆B. t2n∆C. t3n∆D. tn∆答案C★★6.看下述程序段:k:R0=R1×R4k+1:R6=R5+1k+2:R2=R0×R3k+3:R3=R4-1k+4:R2=R5K+5:……下列哪个数据相关没有在上述程序段中发生A. 先写后读相关B. 写-写相关C. 先读后写相关D. 以上都不对答案:D★7.看下述程序段:k:R5=R2k+1:R0=R1×R4k+2:R2=R5+1k+3:R4=R0×R3k+4:R3=R4-1K+5:……k和k+2之间发生的是什么数据相关I. 先写后读相关II.写-写相关III. 先读后写相关A.只有IB.只有I、IIC.只有I、IIID.以上都不对答案:C★8. 一条流水线可分为k 段,各段的执行时间都是t ∆,共向该流水线输入n 个任务,第n 个任务结束于: A. t nk ∆B. ()t n k ∆+C. ()1-+n kD. ()t n k ∆-+1 答案:D★9. 一条流水线的可分为k 段,各段的执行时间都是t ∆,共向该流水线输入n 个任务,求该流水线实际吞吐率的为:A. t k nTP ∆=B. ()t n k n TP ∆-+=1C. tTP ∆=1 D. tn k nTP ∆-+=)1(答案:D ★10. 一条流水线可以由以下时空图来表示,求该流水线的实际吞吐率(假设n=100)B. MIPS 04.1C. MIPS.09709D. MIPS.09615答案:C★★11.一条4段的流水线可以由以下时空图来表示,求该流水线的实际吞吐率(假设n=100)B. MIPS.0165C. MIPS.0167D. MIPS.0328答案:D★12.一条流水线可以由以下时空图来表示,求该流水线的加速比B. 3C. 4D. 6答案:C★13. 一条4段流水线,每段执行时间为1ns ,求该流水线执行100条指令最大效率为: A. 100% B. 96.2% C. 97.1% D. 388% 答案:C ★14. 如下图所示的浮点加法流水部件,计算()10,,2,1 ==+i Z Y X i i i ,流水线经过多少时钟后排空(假设时钟为t ∆)B. 15C. 14D. 13 答案:B★15.A. (111111)B. (110111)C. (010101)D. (101010) 答案:D ★★16. 某动态流水线有S1、S2、S3和S4段,其特性由下图所示的预约表来表示A. 6B. 5C. 4D. 3.5 答案:C ★17. 下图所示的时空图对应的处理机为:B. 超标量处理机C. 超流水处理机D. 超标量超流水处理机 答案:C★18. 一台()n m ,度的超标量超流水线处理机的指令并行度为A. mB. m(n-1)C. (m-1)(n-1)D. mn ★★★19. 连续执行100条指令时,一台2度的超标量处理机的最大效率是多少(假设这里的每条流水线是4段标准流水线的流水线)A. 100%B. 97.1%C. 94.3%D. 92.6%答案:C★★★20.连续执行100条指令时,一台5度的超标量超流水线处理机的最大效率是多少(假设这里的每条流水线是基于4段标准流水线的超标量流水线)A. 100%B. 97.09%C. 96.34%D. 96.15%答案:C★21.在不同结构的处理机上运行的矩阵乘法C=A×B,假设A是m×n阶的矩阵,B是n×l阶的矩阵,则最少需要进行多少次乘法和多少次加法A. mn, nlB. mnl, ml(n-1)C. mnl, mn(l-1)D. mnl, mnl答案:B★★22.试比较在指令并行度较低的情况下,具有相同指令并行度的超标量处理机a和超流水线处理机b的效率A. a>bB. a=bC. a<bD. 不能确定(和指令数有关)答案:A★★23.一条4个功能段的加-乘静态流水线,四个功能段如下所示,计算∑=⨯81 iiiB A,最少需要经过多少时间,假设运算的结果必须先写入到缓冲存储器才能供输入端使用。
并且只有当一个流水线排空后流水线才可以发生另一种运算。
(1)取指(2)译码、取数(3)运算(4)写结果A. 19B. 23C. 25D. 27答案:C ★★24.一条4个功能段的加-乘静态流水线,四个功能段如下所示,计算∑=⨯81 iiiB A,最少需要经过多少时间,假设运算的结果有专门的输出通路连接到输入端。
并且只有当一个流水线排空后流水线才可以发生另一种运算。
(5)取指(6)译码、取数(7)运算(8)写结果A. 16B. 23C. 25D. 27答案:B★25.一台标量处理机,具有一条5级指令流水线,每级均耗时1个时钟周期,执行一个具有20条指令的代码序列。
现将此标量处理机改为超流水线处理机,采用同样基准的指令流水线,不同的是每隔1/4个时钟周期发射1条指令,执行相同的代码序列。
问前后两次执行的加速比。
A. 2.4B. 2.46C. 2.67D. 2.75答案:B2 问答题★★1.简述流水线技术的特点答:流水线技术具有以下特点:⑴流水过程由多个相联系的子过程组成,每个过程称为流水线的“级”或“段”。
⑵流水技术适合于大量重复的时序过程。
★★2.请写出2种乱序流动方式中的数据相关,并举例说明分别在什么情况下发生(采用设计程序段的方式来说明)答:⑴写读相关:例如程序段R0=R1×R4; R2=R0×R3若第二条指令在第一条指令前执行则最终的结果与正确结果不同,此时发生写读相关⑵读写相关例如程序段R2=R0×R3; R3=R4-1若第二条指令在第一条指令前执行则最终的结果与正确结果不同,此时发生写读数据相关⑶写写相关例如程序段R2=R0×R3; R3=R4-1; R2=R5若指令三在指令一前发生则最终的结果与正确结果不同,此时发生写写数据相关★★3.在流水线处理机当中,可能有哪几种操作数据相关?这几种相关分别发生在什么情况下?解决操作数相关的基本方法有哪几种?答:①a. 写读相关(先读后写)例如程序段R0=R1×R4; R2=R0×R3若第二条指令在第一条指令前执行则最终的结果与正确结果不同,此时发生写读相关b. 写写相关例如程序段R2=R0×R3; R3=R4-1; R2=R5若指令三在指令一前发生则最终的结果与正确结果不同,此时发生写写数据相关c. 读写相关(先写后读)例如程序段R2=R0×R3; R3=R4-1若第二条指令在第一条指令前执行则最终的结果与正确结果不同,此时发生写读数据相关②解决数据相关的方法可以分为2大类:延迟执行、建立专用路径★4.解决流水线结构相关的方法有哪些?写出2种答:(1)流水化功能单元(2)资源重复★★5.降低流水线分支损失的方法有哪些?答:(1)在流水线中尽早判断出分支转移是否成功(2)尽早计算出分支转移成功时的PC值(即分支的目标地址)“冻结”“排空”流水线的方法:●预测分支失败●预测分支成功●延迟分支★★★6.试写出延迟分支的3种调度策略,并对其进行评价答:(1)从前调动分支必须不依赖于被调度阿指令,总是可以有效提高流水线的性能(2)从目标处调度若分支转移失败,必须保证被调度的指令对程序的执行没有影响,可能需要复制调度指令。
分支转移成功时,可提高流水线性能。
单由于复制指令,可能加大程序空间(3)从失败处调度若分支转移成功,必须保证被调度的指令对程序的执行无影响。
分支转移失败时,可提高流水线性能★7.简述单流水线标量处理机、超标量处理机、超流水线处理机、超标量超流水线处理机的特点答:具有标量数据表示和标量指令系统的处理机称为标量处理机,通常只有一条流水线,一个时钟周期内可以完成一条指令。
超标量处理机一般具有多于一条的流水线,一台m度的超标量处理机可同时发射m条指令,指令的发射等待时间为1个时钟,指令的并行度为m。
超流水线处理机一般具有一条k段的超流水线,一台n度的超流水处理机可以同时发射一条指令,指令的发射等待时间为1/n个时钟周期,每个时钟周期共发射n条指令。
指令的并行度为n。
m,度的超标量超标量超流水处理机一般具有多余1条的超流水线,一台()n超流水处理机可以同时发射m条指令,指令的发射等待时间为1/n个时钟周期,每个时钟周期共发射mn条指令,指令的并行度为mn。
★★8.画图说明什么是流水线“瓶颈”简述解决流水线瓶颈的方法答:A.将流水线的“瓶颈”部分再细分B.重复设置瓶颈流水段,让多个瓶颈流水段并行工作★9.什么是静态流水线?什么是动态流水线答:静态流水线:在同一时间内,多功能流水线种的各个功能只能按照一种固定的方式连接,实现一种固定的功能。
只有当按照这种连接方式工作的所有任务都流出流水线之后,多功能流水线才能重新尽心连接,以实现其他功能。
动态流水线:在同一时间内,多功能流水线种的割断可以按照不同的方式连接,同时执行多种功能。
其中流水线种各个功能部件不能发生冲突。
★★10.程序中有哪两类相关,分别可以采取什么方法来解决答:程序中可能出现下两类相关(1)数据相关数据相关指在执行本条指令的过程中,如果用到的指令、操作数、变址偏移量等是前面指令的执行结果,则必须等待前面的指令执行完成,并把结果写道主存或通用寄存器中之后,本条指令才能开始执行。