当前位置：文档之家› 计算机系统结构试题.doc

计算机系统结构试题.doc

第一章：

1．试述 Flynn分类的4种计算机系统结构有何特点。

2．假设高速缓存Cache 工作速度为主存的 5 倍，且 Cache 被访问命中的概率为90%，

则采用 Cache 后，能使整个存储系统获得多高的加速比？

3．某工作站采用时钟频率为 15 MHz、处理速率为 10 MIPS 的处理机来执行一个已知混合程序。

假定每次存储器存取为 1 周期延迟，试问：

（1）此计算机的有效 CPI 是多少？

（2）假定将处理机的时钟提高到30 MHz，但存储器子系统速率不变。这样，每次存储器

存取需要两个时钟周期。如果30%指令每条只需要一次存储存取，而另外5%每条需要两次存储存取，并假定已知混合程序的指令数不变，并与原工作站兼容，试求改进后的处理机性能。

4．处理机的时钟30 MHz

CPI。

（1）计算在单处理机上用上述跟踪数据运行程序的平均

（2）根据（ 1）所得 CPI，计算相应的 MIPS 速率。

1、解释图中各控制信号的作用。

2、各流水级存放控制信号的流水线寄存器有何异同？

3、设流水线模型机采用load 前推和数据前推，按时钟周期画出以下指令序列的时序图，标示出前推示意。

load r2, 12(r3)

addi r4, r2, 10

and r1, r2, r4

store r1, 10(r5)

4、给出节PPT中图的 BDEPEN控制信号的真值表。

半期：

1、

FPMUL对系统性能提高更大。假定FPMUL 操

试分析采用哪种设计方案实现求浮点数除法

作占整个测试程序执行时间的15%。

一种设计方案是增加专门的FPMUL硬件，可以将FPMUL操作的速度加快到10 倍；

另一种设计方案是提高所有FP 运算指令的执行速度，使得 FP指令的执行速度加快为原来的倍，设 FP 运算指令在总执行时间中占40%。（ 3 分）

解：对这两种设计方案的加速比分别进行计算。

增加专门 FPDIV 硬件方案： F = 15% = ， S

e = 10

S FPDIV = 1/(+10)=1/ =

提高所有 FP 运算指令速度方案： F e = 40% = ， S e =

S FP = 1/(+ = 1/ =

增加专门 FPDIV 硬件方案的加速比更高，对系统性能提高更大。

2. 设流水线模型机结构如下图所示，采用 load 前推和数据前推（包括 store 指令）。假设模

型机使用 subicc 指令，它将根据减法结果设置标志寄存器Z 的内容为 0 或为 1；其它的 ALU 计算指令不影响Z。指令 bne 的控制相关处理采用插入nop 指令的策略。（ 7 分）

带有内部前推及load 相关暂停功能的流水线处理机

设有以下指令序列：

Lop： load r1, 100(r3)

addi r2, r1, 10

store r2, 100(r3)

subicc r5, r5, 1

bne r5,lop ；如果 r5 的内容不为 0，则转 Lop

（1）按时钟周期画出以上指令序列第 1 次循环执行及转移到“ load r1, 100(r3) ”指令，在模型机中执行的时序图，标出内部前推示意。（3 分）

（2）如果以上指令序列在流水线CPU执行，当第2 条指令“ addi r2, r1, 10”进入 EXE 级时，试给出ADEPEN、 BDEPEN信号的值、 WB级信号 SLD的值。（ 2 分）ADEPEN = BDEPEN = SLD=

（3）设模型机采用延迟转移，调整以上指令序列的顺序，使得指令序列在模型机中执行时只有最小停顿，写出调整后的指令序列（不需要画时序图）。（2 分）

解：（ 1）

Store r3,100,r2 add MEM

（2） ADEPEN = 3 或（ 11）BDEPEN = 1或（01）SLD=1

（3）

Lop： load r1, 100(r3)

subicc r5, r5, 1

addi r2, r1, 10

bne r5,lop

store r2, 100(r3)

第四章：

1、浮点流水线延迟如PPT例 4-1 ，将下面的循环展开并进行指令调度，直到没有任何延迟。LOOP: LD F0,0(R1);

MULD F0,F0,F2;

LD F4,0(R2);

ADDD F0,F0,F4;

SD F0,0(R2);

DSUBI R1,R1,#8;

DSUBI R2,R2,#8;

BNEZ R1, R0 ， LOOP;

2、按 PPT 例 4-4 中的一段指令代码和记分牌信息初始状态，试给出SUBD指令写结果前各

记录表的状态。

LD F6 , 34(R2)

LD F2 , 45(R3)

MULTD F0,F2,F4

SUBD F8,F6,F2

DIVD F10,F0,F6

ADDD F6,F8,F2

3、采用 Tomasulo 算法，按PPT例 4-6 中的一段指令代码和各表的初始状态，试给出SUBD 指令写结果前的指令状态、保留站状态和寄存器状态。

第五章：

某个计算机系统有128 字节的高速缓存。它采用每块有8 个字节的 4 路组相联映射。物

理地址大小是32 位，最小可寻址单位是 1 个字节。（ 1）画图说明高速缓存的组织并指明物

理地址与高速缓存地址的关系；（ 2）可以将地址 000010AFH分配给高速缓存的哪一组？（ 3）假如地址 000010AFH和 FFFF7AxyH可以同时分配给同一个高速缓存组，地址中的 x 与 y 的值为多少？

假设对指令Cache 的访问占全部访问的75%，而对数据Cache 的访问占全部访问的25%。Cache 的命中时间为 1 个时钟周期，失效开销为50 个时钟周期，在混合Cache 中一次 LOAD 或 STORE操作访问Cache 的命中时间都要增加一个时钟周期，32KB 的指令 Cache 的失效率为%， 32 KB的数据 Cache 的失效率为 %， 64 KB的混合 Cache 的失效率为 %。又假设采用写直达策略，且有一个写缓冲器，并且忽略写缓冲器引起的等待。试问指令Cache 和数据 Cache 容量均为 32 KB的分离 Cache 和容量为 64 KB的混合 Cache 相比，哪种 Cache 的失效率更低？

两种情况下平均访存时间各是多少？

给定以下的假设，试计算直接映象Cache 和两路组相联Cache 的平均访问时间以及CPU 的性能。由计算结果能得出什么结论？

（1）理想 Cache 情况下的CPI 为，时钟周期为 2 ns ，平均每条指令访存次。

（2）两者 Cache 容量均为 64KB，块大小都是 32B。

（3）组相联 Cache 中的多路选择器使 CPU的时钟周期增加了 10%。

（4）这两种 Cache 的失效开销都是 80 ns 。

（5）命中时间为 1 个时钟周期。

（6） 64 KB 直接映象 Cache 的失效率为 %， 64 KB 两路组相联 Cache 的失效率为 %。

思考题：数据Cache 容量为 16KB，块大小为32B，最小寻址单位 1 字节，采用两路组相

联映像方式。

设 Cache 的物理地址为36 位。计算索引位数、标识位数、块内偏移量。