当前位置:文档之家› 计算机系统结构答案整理(清华第二版 前六章)

计算机系统结构答案整理(清华第二版 前六章)

计算机系统结构答案整理(清华第二版 前六章)
计算机系统结构答案整理(清华第二版 前六章)

《计算机系统结构》习题解答前六章相对完整zyy整理版

目录

第一章(P33)

1.7-1.9(透明性概念),1.12-1.18(Amdahl定律),1.19、1.21、1.24(CPI/MIPS)

第二章(P124)

2.3、2.5、2.6(浮点数性能),2.13、2.15(指令编码)

第三章(P202)

3.3(存储层次性能),3.5(并行主存系统),3.15-3.15加1题(堆栈模拟),3.19中(3)(4)(6)(8)问(地址映象/替换算法--实存状况图)

第四章(P250)

4.5(中断屏蔽字表/中断过程示意图),4.8(通道流量计算/通道时间图)

第五章(P343)

5.9(流水线性能/时空图),5.15(2种调度算法)

第六章(P391)

6.6(向量流水时间计算),6.10(Amdahl定律/MFLOPS)

第一章(P33)

1.2 解:这儿要注意的是第一级是最低的级别,而不是最高的级别。 第二级:NKns 第三级:N 2Kns 第四级:N 3Kns 1.7

(1)从指定角度来看,不必要了解的知识称为透明性概念。 (2)见下表,“√”为透明性概念,“P ”表示相关课文页数。

1.8见下表,“√”为透明性概念,“P ”表示相关课文页数。

1.9见下表,“√”表示都透明,“应”表示仅对应用程序员透明,“×”表示都不透明。

1.11 解:系列机是指由同一厂家生产并具有相同系统结构

的计算机,但具有不同的计算机组成与实现。

可行:(1) (3) (4) (6) (7)

不可行:(2) (5) (8)

模m 交叉,√, 浮点数据,×,P4 通道与I/O 处理机,×,

P4

总线宽度,√, 阵列运算部件,×, 结合型与独立型通道,√, 单总线,√, 访问保护,×, 中断,×, 指令控制方式,√, 堆栈指令,×, 最小编址单位,×, Cache 存储器,√, 指令地址寄存器,×, 指令缓冲器,√, 时标发生器,√, 条件码寄存器,×, 乘法器,√, 主存地址寄存器,√, 磁盘,×, 先行进位链,√, 移位器,√, 通用寄存器 ,×, 中断字寄存器,×, 数据通路宽度,√, 虚拟存储器,应, Cache 存储器,√, 程序状态字,×, “启动I/O ”指令,应, “执行”指令,×, 指令缓冲寄存器,√, Sn

20

1

0 1

Fe

1.12 已知Se=20 , 求作Fe-Sn 关系曲线。 将Se 代入Amdahl 定律得

e

n F S 20

1911

-=

1.13 上式中令Sn=2,解出Fe=10/19≈0.526

1.14 上式中令Sn=10,解出Fe=18/19≈0.947

1.15 已知两种方法可使性能得到相同的提高,问哪一种方法更好。

(1)用硬件组方法,已知Se=40,Fe=0.7,解出Sn=40/12.7≈3.1496(两种方法得到的相同性能) (2)用软件组方法,已知Se=20,Sn=40/12.7,解出Fe=27.3/38≈0.7184(第二种方法的百分比) (3)结论:软件组方法更好。因为硬件组需要将Se 再提高100%(20→40),而软件组只需将Fe 再提高1.84%(0.7→0.7184)。 1.17 57.34

.15

5

9.01.01≈=

+

=

n S

1.18 记f ── 时钟频率,T=1/f ── 时钟周期,B ── 带宽(Byte/s )。

方案一:)/(44

11s Byte f T

B =?= 方案二:)/(5.3421

%252%752s Byte f T

B =??+?=

1.19 由各种指令条数可以得到总条数,以及各百分比,然后代公式计算。

∑===4

1510i i IC IC

(1)∑==?+?+?+?=?

=4

1

55.108.0215.0232.0245.01)(i i

i IC

IC CPI CPI (2)806.2555.140

10

55.11040106

66≈=??=?=CPI f MIPS (3)(秒)003876.040055

.110

6

≈=?=

MIPS IC T

1.21

(1)24.21.0812.0418.026.01=?+?+?+?=CPI

(2)86.171024.21040106

6

6≈??=?=

CPI f MIPS

1.23

= 1

1.24记Tc ──新方案时钟周期,已知CPI = CPI

i

原时间 = CPI × IC × 0.95Tc = 0.95IC×Tc

新时间 = (0.3×2/3+0.7)× IC × Tc = 0.9IC×Tc

二者比较,新时间较短。

1.28解:原始MFLOPS = 195578/(10.8×106)=0.018

正则化后MFLOPS =195578/(13.6×106)=0.014

指令正则化后的具体值= f/CPI = 16.6M/(6×106)= 2.77

第二章(P124)

2.2解:

注意:位数用补码、小数表示,阶码用移码、整数表示。

1) 最大正尾数:1-16 - 6

2) 最小正尾数:16-1

3) 最小负尾数:-1

4) 最大负尾数:-(16-1+16 - 6)

5) 最大阶码:26-1

6) 最小阶码: -2 6

7) 最大正数: (1-16 - 6)* 16 63

8) 最小正数:16-1 * 16-64

9) 最大负数:-(16-1+16 - 6)*16-64

10) 最小负数:-16 63

11) 浮点零:0

12) 表数精度:1/2×16-(6-1)

13) 表数效率:15/16

14) 能表示的规格数浮点数个数:2×15×165×2×26+1

2.3解:

阶码全部位数为8,作无符号数看待真值为0~255,作移-127码看待真值为-127~+128;尾数(不计符号位)有23位小数,另加1位整数隐藏位,所以尾数绝对值为1.0~2.0 – 2-23,有效位数p=24;

最大绝对值为最大阶码与最大尾数绝对值的组合,最小绝对值为最小阶码与最小尾数绝对值的组合。代入相关公式后得最终结果如下表。

32位64位

±最大绝对值±(1-2-24)·2129±(1-2-53)·21025

±最小绝对值±2-127±2-1023

表数精度δ2-242-53

表数效率η100% 100%

2.5解:

1) 设计浮点数的格式:2-P=10-7.2 P=-log

2 10 -7.2=7.2×log

2

10

尾数为24位(隐藏最高位),阶码为7+1位(-128-127)。

2) 计算:

①最大正数:(1-2-24)×2127

②最大负数:-2-1×2-128

③表数精度:1/2×2-23=2-24=10-7.22

④表数效率:50%(如果尾数采用隐藏位,那么表数效率为100%)

2.6

(1) 0.2 = 0.333333H×160

设阶码为移-63码(即-26+1,原题未指明)

0.2 = 0.110011001100110011001101B×2-21位7位6位

0 0111111 333333

(其中最高有效位需隐藏)

阶码为移-127码(即-27+1)

(2) 符号位不变,(阶码 – 63)×4 + 127;尾数左规,除去最高位; (3) 符号位不变,(阶码 – 127)/ 4 + 63;尾数补最高位,按除法余数右移若干位,左补0。

2.10解:

要点:指令数由256减少到64,减少了两位指令码。 在A 处理机中所占的空间为:

MA = 1000*32 + (1000*2*32)/8 = 40000bit 在B 处理机中所占的空间:39000bit

MB = 1000*30 + (1000*2*36)/8 = 39000bit

2.13解:

指令

序号 出现 的概率 Huffman 编码法 2/8扩展 编码法 3/7扩展 编码法 I1 0.25 00 00 00 I2 0.20 10 01 01 I3 0.15 010 1000 10 I4 0.10 110 1001 11000 I5 0.08 0110 1010 11001 I6 0.08 1110 1011 11010 I7 0.05 1111 1100 11011 I8 0.04 01110 1101 11100 I9 0.03 011110 1110 11101 I10 0.02 011111 1111 11101

操作码平均长度 2.99 3.1 3.2 操作码冗余信息 0.7% 4.2% 7.2%

2.14

1位 8位 23位 0 01111101 10011001100110011001101

2.15解:

1) 单地址指令条数为63

零地址指令条数64

操作码分别为:

双址: 0000 ~1110

单地址:1111 000000

。。。。

1111 111110

零地址:1111 111111 000000

。。。。。。

1111 111111 111111

2) 首先,从题意可得:(16-x):63x = 1 :9

所以,x = 2

操作码分别为:

双址: 0000-1101(共14条)

单地址:1110 0000000

……..

1110 1111110

1111 0000000

……..

1111 1111110

(共126条)

零地址:1110 111111 000000

。。。。。。

1110 111111 111111

1111 111111 000000

。。。。

1111 111111 111111

(共128条)

第三章(P202)

3.1解:

(1) 当S2>>S1时,平均价格接近C2。 (2) ta = h*t1+(1-h)*t2 (3) e = 1/[h+(1-h)r] (4) 略

(5) 当r = 100时,h>0.99947

(6) P134公式,H ’ = (H+n-1)/n=(0.96+5D-1)/5D=0.99947

计算得:D>15.05,取D=16

3.2 (1)、T=h1*T1+h2*T2+(1-h1-h2)*T3 ,S=S1+S2+S3,C=(C1*S1+C2*S2+C3*S3)/(S1+S2+S3); (2)、由C= C=(C1*S1+C2*S2+C3*S3)/(S1+S2+S3)可看出当S3>>S1+S2时,C →C3。

3.3解:

(1)t = ht1 + (1 – h)t2,

当cache 为64k 时,t = 0.7*20ns + (1-0.7)*200ns = 74ns ; 当cache=128k 时,t = 38ns ; 当cache=256k 时,t=23.6ns (2)按照公式:

cache=64k, c=0.2585美元/k 字节; cache=128k, c=0.3152美元/k 字节; cache=256k ,c=0.4235美元/k 字节

(3)按等效访问时间由小到大排序,容量分别为:256k ,128k ,64k 按每字节平均价格由小到大排序,分别为:64k, 128k, 256k (4) ①19.129 ns.美元/k 字节;

②11.9776 ns.美元/k 字节; ③ 9.9946 ns.美元/k 字节; 选256k 的cache 最优

3.4 (1)、由c1*s1+c2*s2≤15000?0.01*512+0.5*s2≤1500?s2≤1

4.6MB (2)、由t=t1*h+t2*(1-h) ?40=20*0.95+(1-0.95)*t2?t2=420ns

3.5 已知g

g K n

n )1(1--=,其中g=0.1

依题意有2.0)1(12.0)1(111

+--=+≥--=++g

g K g g K n n n n

整理得0.9n ≥0.2,解出28.159

.0lg 2

.0lg ≈≤

n ,向下取整,得15; 按另一种题意理解是向上取整,得16,也对。

3.7解:

(1)

方式一、体号:4位;体内地址:20位;

方式二、存贮地址:20位;多路选择器:4位;

方式三、体内地址:20位;存储器体号:4位;

方式四、高位体号:1位;低位体号:3位;体内地址:20位;

方式五、高位体号:2位;低位体号:2位;体内地址:20位;

方式六、体内地址:20位;多路选择器:2位;低位体号:2位;

(2)

①扩大容量;

②比较简单;

③速度比较快;

④速度快,容量大;

⑤速度快,容量大;

⑥提高速度

(3)

① 1;

② 16;

③接近16;

④接近8;

⑤接近4;

⑥接近16

3.8由P.Budnik和D.J.Kuck提出的方法可知并行存储体的个数至少为m=17;再由^(2*p)+1=17得p=2;按公式体号=(2^p)*i+j mod m , 体内地址=i 得出无冲突的访问图如下:

3.9

(1)、由公式:g=?(log2Nv-log2Np)/(log2Np-log2Nd)?得:g=?(log24G-log24K)/(log24k-log24) ?=2,故需用2级页表;

(2)、一级页表存储容量为1KB,共256个页面;二级页表为4K个页面,共1M。

(3)、一级页表及目前正在进行中的程序的页表驻留主存,其它可以放在辅存中。

3.10

(1)、设访问主存时间为t1,则访问磁盘时间为10^4*t1,假定快表转换时间为t2,则查页表时间为10*t2,故平均等效时间为:T=t1*h1+(1-h1)*[t2+(1-h2)*10*t2+10^4*t1],其中h1=99.99%,h2=99%;

(2)、e=t1/T=t1/( t1*h1+(1-h1)*[t2+(1-h2)*10*t2+10^4*t1]).

3.12解:

(1)用户号:6位,虚页号:10位,页内偏移地址:12位

(2)实页号:11位,页内偏移地址:12位;

(3)快表字长:27位;其中,多用户虚页号:16位,实页号:11位

(4)慢表容量:64k个存储字(26*210),每个字长:装入位1位+实页号11位=12

3.13解:

(1)多用户虚地址:用户号-8位;虚页号-12位;页内偏移地址-10位;

实地址格式:实页号-14位;页内偏移-10位;

问题实质:(用户号-8位;虚页号-12位)->(实页号:14位)

(2)输入位:20(8+12);输出位:5;

(3)相等比较电路的位数:20;

(4)快表存储字长度:68位,每组分为:多用户虚页号:20位;实页号:14位;注意:有2套独立的比较电路。

(5)略(P160)

3.14(1)、假设D代表调入,T代表替换,M代表命中,则三种页面替换算法的情况表如下图所示:

时间T 1 2 3 4 5 6 7 8 9 1

11

1

2

命中次数

地址流P

2

P

3

P

2

P

1

P

5

P

2

P

4

P

5

P

3

P

2

P

5

P

2

FIFO算法2 2 2

2

*

5 5

5

*

5

*

3 3 3

3

*

3次

3 3 3

3

*

2 2 2

2

*

2

*

5 5

1 1

1

*

4 4 4 4

4

*

2

D D M D T T T M T M T T

LFU算法2 2 2 2

2

*

2 2

2

*

3 3

3

*

3

*

5次

3 3

3

*

5 5

5

*

5 5

5

*

5 5

1 1

1

*

4 4

4

*

2 2 2

D D M D T M T M T T M M

OPT算法2 2 2 2 2

2

*

4

*

4

*

4

*

2 2 2

6次

3 3 3

3

*

3 3 3 3

3

*

3 3

1

*

5 5 5 5 5 5 5 5

D D M D T M T M M T M M

(2)、FIFO算法的命中率为3/12,LFU算法的命中率为5/12,OPT算法的命中率为6/12。

3.15 欲知可能的最高命中率及所需的最少主存页数,较好的办法是通过“堆栈模拟法”,求得命中次数随主存页数变化的函数关系。下图就是“堆栈模拟图”,其中“√”表示命中。

(1)H max =7/12≈58.3% (2)n=4

(3)当1次页面访问代表连续1024次该页内存储单元访问时,后1023次单元访问肯定是命中的,而第1次单元访问的命中情况与这1次页面访问的命中情况相同。根据上图中最高命中情况,共有7次页命中(折算为7×1024次单元命中),5次页不命中(折算为5×1023次单元命中,也可写为5×1024-5),单元访问总次数为12×1024,故有: H cell =(12×1024-5)/(12×1024)=12283/12288≈99.96%

3.16 (1)、页地址流为:0,0,1,1,0,3,1,2,2,4,4,4; (2)、页地址流为:0,0,2,2,1,6,3,4,4,8,9,7; (3)、页地址流为:0,0,0,0,0,1,0,1,1,1,1,1; (4)、页面越大,则命中的可能性比较大。

3.17

设置虚拟存储器的主要目的是扩展存储空间,设置Cache 的主 要目的是提高访问速度。两种存储系统实现时的主要差别有: (1)、实现方法不同,Cache 全部用硬件实现,而虚拟存储器则以软件为主,硬件为辅; (2)、两级存储器的速度比不一样; (3)、页块大小不一样,Cache 系统一般1字——16字,虚拟存储系统则为1KB ——16KB ; (4)、等效存储容量不同,Cache 等效于主存,而虚拟存储系统等效于虚存; (5)、不命中进处理方式不同,Cache 系统采用等待方式,而虚拟系统采用任务切换。

3.18

直接映象的优点在于最简单、最直接,不需要联想查找,不需要页面替换算法,因而成本较低且速度较高。缺点是命中率较低,而且它还禁止并行虚拟地址转换。全相联的优点是提供最大的灵活性,可以实现较好的块替换策略,以减少块的冲突。缺点是检索过程昂贵,需要的硬件成本比较高。组相联可以提供较好的性能价格比,替换策略可以更加经济地实现,联想检索实现容易,设计灵活可以获得更高的高速缓存的命中率。段相联的优点在于,实现各种块替换算法比较灵活和对有限数量区段标记完成全联想检索比较经济。位选择组相联映象在块表中存放参与相联比较的只有主存地址中的区号,而没有组内块号B ,使B 实现起来比组相联要容易。

P= 4 5 3 2 5 1 3 2 3 5 1

3 命中次

数 4 5 3 2 5 1 3 2 3 5 1 3 4 5 3 2 5 1 3 2 3 5 1 4 5 3 2 5 1 1 2 3 5 4 4 3 2 5 5 1 2 2 4 4 4 4 4 4 4 n=1 0 n=2 √ 1 n=3 √ √ √ 3 n=4 √ √ √ √ √ √ √ 7 n=5 √ √ √ √ √ √

√ 7

直接映象<段相联<位选择<组相联<全相联。直接映射不需要联想查找,不需要页面替换算法;区段映射只对有限数量区段标记,所以完成全联想检索比较经济;组联想在做k路联想检索中,由于k实际上是相当小的,因此比全联想要经济得多;全联想标记长度大,检索耗时。

3.19解:

(1) 主存地址格式:

区号E 区内组号G 组内块号B 块内地址W

1 1 1 4

(2) Cache地址格式:

组号组内块号块内地址

1 1 4

(4) Cache的块地址流情况:

(3) 主存与Cache中各个块的映象对应关系:

虚存实页0 1 2 3

虚组0 0 0 √√

1 实存 1 √√

虚组1 2 ·0 实组0 2 √√

3 · 1 虚 3 √√

虚组2 4 · 2 实组1 页 4 √√

5 · 3 5 √√

虚组3 6 6 √√

7 7 √√

(a) 虚页集合与实页集合的对应关系 (b) 对应关系表(√为有关系)

B6 B2 B4 B1 B4 B6 B3 B0 B4 B5 B7 B3

C2 C3 C0 C1 C0 C2 C3 C1 C0 C1 C2 C3

(5) FIFO中Cache的块命中率:3/12=25%

(6) LFU中Cache的块命中率:4/12=33.3%

(7) 改为全相联映象后:

FIFO中块命中率: 4/12=33.3%

LFU中块命中率: 3/12=25%

(8)这时Cache的命中率:1-8/(16×12)=95.8%

3.20解:

(1) 主存 8×8=64MB,每个存储体为8M/16K=512区,每区16K/(32×4)=128组。

区号:9位,组号:7位,组内块号:2位,偏移地址:5位,存储体号:3位

(2) Cache中每块32Byte,共16K/32=512块,512/4=128组

组号:7位,组内块号:2位,块内偏移:5位。

(3) 相联目录表共有128行。

(4) 相联目录表如下:

19 2 1 19 2 1 19 2 1

E,B1 b e E,B2 b e ……E,B8 b e 其中,(E,B)表示区号和区内组号,b表示组内块号,e表示有效位。

(5) 比较电路的位数:19(其中1为为有效位标志)

(6) P181 图3.46

第四章(P250)

4.4 原题表述有错。“1”表示被屏蔽,“0”表示开放。

解:

(1) 正常中断屏蔽码:

响应:D1 D2 D3 D4 D5(硬件优先级) 处理:D1 D2 D3 D4 D5(屏蔽后的优先级) (2) 修改后:

响应:D1 D2 D3 D4 D5 处理:D4 D5 D3 D2 D1 (3) 处理示意图:

中断请求:D1 D2 D3 D4 D5 处理:

(4) 处理示意图:

中断请求:D3 D4 D5 D1 D2 处理:

4.5

D2

D3

D4

D5

D1

D2

D3

D4

D5

D1

4.6

4.7

4.8

(1)f=2×105字节/秒,T=5us

(2)Ts+Td=5us,通道时间图如下。作图时注意:至少要画到最慢设备的第二次请求出现,才能确定是否丢失数据(因为响应优先级低的设备较易丢失数据)。

设优

备先

号级

D1 1

D2 4

D3 2

D4 3

时间

(us)0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170

(3)5,160,20,40;

(4)D2丢失第一次请求的数据;

(5)参见P245。

第五章(P343)

5.3解:

(1)顺序执行:6n*Δt

(2)“取指令”和“执行”重叠:6t + (n-1)5t = (5n+1)Δt

(3)“取指令”、“分析”和“执行”重叠:6t + (n-1)3t = 3(n+1)Δt

(4)先行控制:3*(n+1)Δt, 约为3nΔt

5.6解:

(1)可能有:先写后读(RAW)相关;写-写(WAW)相关

(2)会引起流水线停顿的相关有:先写后读相关;

(3)时空图:(共用了9 个时钟周期) 部件:

ADD3 ADD3

ADD2 ADD2

ADD1 ADD1

MUL4 MUL 4

MUL3 MUL3 MUL2 MUL2

MUL1 MUL1

MOV2 MOV2

MOV1 MOV1

译码译码K 译码K

+1

译码K

+2

取指取指K 取指K

+1

取指K

+2

1 2 3 4 5 6 7 8 9

5.7

5.8解:

浮点数加法的流水线分为5段:输入,求阶差,对阶,尾数加,规格化。可将原来的求和算式分为以下9步:

1:A1+A2; 2:A3+A4; 3:A5+A6; 4:A7+A8; 5:A9+A10;

6:(A1+A2)+( A3+A4); 7:(A5+A6)+( A7+A8);

8:[(A1+A2)+( A3+A4)]+( A9+A10);

9:[(A1+A2)+( A3+A4)+( A9+A10)]+[ (A5+A6)+( A7+A8)];

时空图:

规格化 1 2 3 4 5 6 7 8 9

尾数加 1 2 3 4 5 6 7 8 9

对阶 1 2 3 4 5 6 7 8 9

求阶差 1 2 3 4 5 6 7 8 9

输入 1 2 3 4 5 6 7 8 9

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21

流水线性能分析:

吞吐率:

9

21 TP t

=?

加速比:S=9*5/21=15/7

计算机系统结构三四章作业及答案

3.1 简述流水线技术的特点。(1) 流水线把一个处理过程分解为若干个子过程,每个子过程由一个专门的功能部件来实现。因此,流水线实际上是把一个大的处理功能部件分解为多个独立的功能部件,并依靠它们的并行工作来提高吞吐率。(2) 流水线中各段的时间应尽可能相等,否则将引起流水线堵塞和断流。(3) 流水线每一个功能部件的前面都要有一个缓冲寄存器,称为流水寄存器。(4) 流水技术适合于大量重复的时序过程,只有在输入端不断地提供任务,才能充分发挥流水线的效率。(5) 流水线需要有通过时间和排空时间。在这两个时间段中,流水线都不是满负荷工作。 3.2 解决流水线瓶颈问题有哪两种常用方法?答:细分瓶颈段与重复设置瓶颈段 3.3 有一条指令流水线如下所示: (1 用两给出条指 (1) (24? 变八级流水线(细分) ? 重复设置部件 )(ns 85 1 T n TP 1pipeline -== 3.4 有一个流水线由4段组成,其中每当流过第三段时,总要在该段循环一次,然后才能流到第4段。如果每段经过一次所需的时间都是△t ,问: (1)当在流水线的输入端连续地每△t 时间输入一个任务时,该流水线会发生什么情况? (2)此流水线的最大吞吐率为多少?如果每2△t 输入一个任务,连续处理10个任务时,其实际吞吐率和效率是多少? (3)当每段时间不变时,如何提高流水线的吞吐率?人连续处理10个任务时,其吞吐率提高多少? 解:(1)会发生流水线阻塞情况。

(2) (3)重复设置部件 吞吐率提高倍数= t t ??2310 75 =1.64 3.5 有一条动态多功能流水线由5段组成,加法用1、3、4、5段,乘法用1、2、5段,第2段的时间为2△t ,其余各段的时间均为△t ,而且流水线的输出可以直接返回输入端或暂存于相应的流水线寄存器中。现在该流水线上计算 ∏=+4 1 )(i i i B A ,画出时空图,并计算其吞吐率、加速比和效率。 +B 4;再计算由图可见,它在18个△t 时间中,给出了7个结果。所以吞吐率为: 如果不用流水线,由于一次求积需3△t ,一次求和需5△t ,则产生上述7个结果共需(4×5+3×3)△t =29△t 。所以加速比为: 该流水线的效率可由阴影区的面积和5个段总时空区的面积的比值求得: 3.6 在一个5段流水线处理机上,各段执行时间均为△t,需经9△t 才能完成一个任务,其预约表如下所示。 段23 时间 入 A 1 B 1 A 2 B 2 A 3 B 3 A 4 B 4 A B C D A × B C ×D

计算机系统结构考试计算题

3.12 有一指令流水线如下所示 (1) 求连续输入10条指令,该流水线的实际吞吐率和效率; (2) 该流水线的“瓶颈”在哪一段?请采取两种不同的措施消除此“瓶颈”。 对于你所给出的两种新的流水线,连续输入10条指令时,其实际吞吐率和效率各是多少? 解:(1) 2200(ns)2009200)10050(50t )1n (t T max m 1 i i pipeline =?++++=?-+?=∑= )(ns 220 1 T n T P 1pipeline -== 45.45%11 5 4400T P m t T P E m 1 i i ≈=? =?? =∑= (2)瓶颈在3、4段。 ? 变成八级流水线(细分) 850(ns)509850t 1)(n t T max m 1 i i pipeline =?+?=?-+?=∑= )(ns 85 1 T n T P 1pipeline -== 58.82%17 10 8400T P m ti T P E m 1 i ≈=? =?? =∑= ? 重复设置部件 出 50ns 50ns 100ns 200ns

)(ns 85 1 T n T P 1pipeline -== 58.82%17 10885010400E ≈=??= 3.13 4段组成,3段时,一次,然4段。如果 需要的时间都是,问: (1) 当在流水线的输入端连续地每时间输入任务时,该流水线会发生 什么情况? (2) 此流水线的最大吞吐率为多少?如果每输入一个任务,连续处理 10个任务时的实际吞吐率和效率是多少? (3) 当每段时间不变时,如何提高该流水线的吞吐率?仍连续处理10个 任务时,其吞吐率提高多少? (2) t ?t ?2

计算机系统结构网上作业

计算机系统结构作业参考答案 一、 1、试述现代计算机系统的多级层次结构。 计算机系统具有层次性,它由多级层次结构组成。从功能上计算机系统可分为五个层次级别:第一级是设计级。这是一个硬件级,它由机器硬件直接执行。 第二级是一般机器级,也称为机器语言级。它由微程序解释系统.这一级是硬件级。 第三级是操作系统级,它由操作系统程序实现。这些操作系统由机器指令和广义指令组成,这些广义指令是操作系统定义和解释的软件指令。这一级也称混合级。 第四级是汇编语言级。它给程序人员提供一种符号形式的语言,以减少程序编写的复杂性。这一级由汇编程序支持执行。 第五级是高级语言级。这是面向用户为编写应用程序而设置的。这一级由各种高级语言支持。 2、试述RISC设计的基本原则和采用的技术。 答:一般原则: (1)确定指令系统时,只选择使用频度很高的指令及少量有效支持操作系统,高级语言及其它功能 的指令,大大减少指令条数,一般使之不超过100条; (2)减少寻址方式种类,一般不超过两种; (3)让所有指令在一个机器周期内完成; (4)扩大通用寄存器个数,一般不少于32个,尽量减少访存次数; (5)大多数指令用硬联实现,少数用微程序实现; (6)优化编译程序,简单有效地支持高级语言实现。

基本技术: (1)按RISC一般原则设计,即确定指令系统时,选最常用基本指令,附以少数对操作系统等支持最有用的指令,使指令精简。编码规整,寻址方式种类减少到1、2种。 (2)逻辑实现用硬联和微程序相结合。即大多数简单指令用硬联方式实现,功能复杂的指令用微程序实现。 (3)用重叠寄存器窗口。即:为了减少访存,减化寻址方式和指令格式,简有效地支持高级语言中的过程调用,在RISC机器中设有大量寄存嚣,井让各过程的寄存器窗口部分重叠。 (4)用流水和延迟转移实现指令,即可让本条指令执行与下条指令预取在时间上重叠。另外,将转移指令与其前面的一条指令对换位置,让成功转移总是在紧跟的指令执行之后发生,使预取指令不作废,节省一个机器周期。 (5)优化设计编译系统。即尽力优化寄存器分配,减少访存次数。不仅要利用常规手段优化编译,还可调整指令执行顺序,以尽量减少机器周期等。 3、试述全相联映像与直接映像的含义及区别 (1)全相连映像 主存中任何一个块均可以映像装入到Cache中的任何一个块的位置上。主存地址分为块号和块内地址两部分,Cache地址也分为块号和块内地址。Cache的块内地址部分直接取自主存地址的块内地址段。主存块号和Cache块号不相同,Cache块号根据主存块号从块表中查找。Cache保存的各数据块互不相关,Cache必须对每个块和块自身的地址加以存储。当请求数据时,Cache控制器要把请求地址同所有的地址加以比较,进行确认。 (2)直接映像 把主存分成若干区,每区与Cache大小相同。区内分块,主存每个区中块的大小和Cache 中块的大小相等,主存中每个区包含的块的个数与Cache中块的个数相等。任意一个主存块只能映像到Cache中唯一指定的块中,即相同块号的位置。主存地址分为三部分:区号、块号和块内地址,Cache地址分为:块号和块内地址。直接映像方式下,数据块只能映像到Cache中唯一指定的位置,故不存在替换算法的问题。它不同于全相连Cache,地址仅需比较一次。 (3)区别: 全相连映像比较灵活,块冲突率低,只有在Cache中的块全部装满后才会出现冲突,Cache 利用率高。但地址变换机构复杂,地址变换速度慢,成本高。 直接映像的地址变换简单、速度快,可直接由主存地址提取出Cache地址。但不灵活,块冲突率较高,Cache空间得不到充分利用。 4. 画出冯?诺依曼机的结构组成?

计算机系统结构试卷B

《计算机系统结构B卷》 一、填空题(每小题1.5分,共30分)。 1.对系列机而言,必须保证做到软件,力争做到软件向上兼容。 2.由软件实现的计算机称之为。 3. 多处理机系统按组织形式分有三种,功能分布是多处理机系统分工方式。 4.依据从哪一层开始设计,计算机体系结构设计的主要方法有三种,占据主导地位的是设计。 5. 在先行控制方式实现流水线的处理器中,有先行指令、先行操作、先行读数和后行写数等四个缓冲栈,缓冲深度最大的是。 6.按流水线的功能多寡分,可分为单功能流水线和。 7. 用于表示非线性流水线中的任务对未进入流水线的后继任务流入流水线的时间间隔的约束称为。 8.中断转移相关处理的基本方法包括不精确断点法和。 9. 互连网络中任意两个结点之间距离的最大值称为。 10.在多级交叉开关互联网络中,交叉开关的控制方式有、组控制和单元控制。 11. 在多计算机系统的互连网络中,通信模式包括、选播、广播和会议等四种。 12. 描述网络寻径效率常用的两个参数是通道流量和。 13.自定义数据表示包括标志符和两种数据表示。 14. 浮点数尾数基值越大,浮点数表示的数据范围。 15. 根据运算类型指令操作数存储方法不同,指令集结构可分为堆栈型、累加器型和。 16. 标量处理机是否高度并行是以指令级并行度(ILP)为来区分。 17.存储系统的基本存储层次有、主存储器和辅助存储器。 18. 采用并行存储器的目的是。 19. 从时间开销来看,伪命中的时间正常命中的时间。 20. 增加Cache存储系统的相联度,可降低Cache的不命中率,但会增加Cache 的。

二、简答题(每小题6分,共30分)。 1.多计算机系统和多处理机系统的差别有哪几方面?其中最根本的差别是哪个方面? 2. 什么是流水线相关?流水线相关可分为哪几大类? 3. 什么是动态互连网络?动态互连网络的互联形式有哪几种? 4. 指令系统设计包括哪两个方面?指令格式优化设计的目的是什么? 5. 维护Cache与主存一致性的更新算法有哪些? 三、分析题(第一小题8分,第二小题12分,共20分)。 1.某种处理机10条指令的使用频度分别为:0.25,0.20,0.15,0.10,0.08,0.08,0.05,0.04 ,0.03 ,0.02,试画出该处理机进行Huffman编码时的一棵Huffman树。 2. 在某采用全相联映象、相联目录表实现地址变换Cache存储器中,Cache 的容量是8KB,主存是由4个存储体组成的低位交叉访问存储器,主存总容量是32MB,每一个存储体的字长是32位,。 (1)写出主存地址和Cache地址的格式,并标出各字段的长度。 (2)说明目录表的行数、相联比较的位数和目录表的宽度。 四、计算题(第一小题8分,第二小题12分,共20分)。 1. 设16个处理器编号分别为0、1、……、15,用单级互连网络连接,当互连函数分别为:(1)Cube3、(2)PM+3、(3)Shuffle(Shuffle)时,第13号处理器分别与哪一个处理器相连? 2. 有一条5个功能段的线性动态多功能流水线如图所示,其中1→2→3→5功能段组成加法流水线,1→4→5功能段组成乘法流水线,设每个功能段的延迟时间 均相等为△t。用这条流水线计算F=4 1() i i i a b = + ∏,画出流水线时空图,并计算流水线的实际吞吐率、加速比和效率。 Z

计算机系统结构课后答案

1、数据结构和机器的数据表示之间是什么关系?确定和引入数据表示的基本原则是什么? 答:数据表示是能由硬件直接识别和引用的数据类型。数据结构反映各种数据元素或信息单元之间的结构关系。数据结构要通过软件映象变换成机器所具有的各种数据表示实现,所以数据表示是数据结构的组成元素。不同的数据表示可为数据结构的实现提供不同的支持,表现在实现效率和方便性不同。数据表示和数据结构是软件、硬件的交界面。 除基本数据表示不可少外,高级数据表示的引入遵循以下原则:(1)看系统的效率有否提高,是否养活了实现时间和存储空间。(2)看引入这种数据表示后,其通用性和利用率是否高。 2、标志符数据表示与描述符数据表示有何区别?描述符数据表示与向量数据表示对向量数据结构所提供的支持有什么不同? 答:标志符数据表示指将数据类型与数据本身直接联系在一起,让机器中每个数所都带类型樗位。其优点是:(1)简化了指令系统和程序设计;(2)简化了编译程序;(3)便于实现一致性校验;(4)能由硬件自动变换数据类型;(5)支持数据库系统的实现与数据类型无关;(6)为软件调试和应用软件开发提供支持。缺点是:(1)会增加程序所点的主存空间;(2)在微观上对机器的性能(运算速度)不利。 数据描述符指数据的描述与数据分开存放,描述所访问的数据是整块还是单个的,及访问该数据块或数据元素的地址住处它具备标志符数据表示的优点,并减少了标志符数据表示所占的空间,为向量和数组结构的实现提供支持。 数据描述符方法优于标志符数据表示,数据的描述与数据分开,描述所访问的数据是整块还是单个的,及访问该数据块或数据元素的地址信息,减少了樗符数据表示所占的窨。用描述符方法实现阵列数据的索引比用变址方法实现要方便,且便于检查出程序中的阵列越界错误。但它不能解决向量和数组的高速运算问题。而在有向量、数组数据表示的向量处理机上,硬件上设置有丰富的赂量或阵列运算指令,配有流水或阵列方式处理的高速运算器,不仅能快速形成向量、数组的元素地址,更重要的是便于实现把向量各元素成块预取到中央处理机,用一条向量、数组指令流水或同时对整个向量、数组高速处理.如让硬件越界判断与元素运算并行。这些比起用与向量、阵列无关的机器语言和数据表示串行实现要高效的多。 3、堆栈型机器与通用寄存器型机器的主要区别是什么?堆栈型机器系统结构为程序调用的哪些操作提供了支持? 答:有堆栈数据表示的机器称为堆栈机器。它与一般通用寄存器型机器不同。通用寄存器型

华科专升本计算机系统结构-作业全

第一章作业 简答题 1、简述什么是计算机系统结构。 2、答:计算机系统结构是程序员所看到的计算机属性,即概念性结构与功能性结构。 3、 4、计算机系统的层次从下到上包括哪些? 5、答:计算机系统的层次从上到下包括微程序机器级、机器语言、操作系统虚拟机、汇编 语言虚拟机、高级语言虚拟机、应用语言虚拟机。 6、 7、Flynn分类法是以什么对计算机系统进行分类分成哪几类? 8、答:Flynn分类法是以指令流和数据流的多倍性对计算机系统进行分类。Flynn分类法 把计算机系统的结构分为以下4类:单指令流单数据流、单指令多数据流、多指令流单数据流、多指令流多数据流。 9、 10、简述Amdahl定律及加速比计算公式。 答:Amdahl定律指出加快某部件执行速度所能获取得系统性加速比,受限于该部件的执行时间占系统中总执行时间的百分比。 加速比计算公式=系统性能(改进后)/系统性能(改进前)=总执行时间(改进前)/总执行时间(改进后) 计算题 5、如果某一些计算任务用向量方式求解比用标量方式求解快20倍。为达到加速比2,可用向量方式求解所花费时间占总的时间的百分比为多少 解:由题可知,系统加速比=2,部件加速比=20,通过向量方式求解可改进比例未知,可设为X。 根据Amdahl定律可知 系统加速比=1/[(1-X)+X/20]=2 求解得X=10/19 由此可得,可用向量方式求解所花费时间占总的时间的百分比魏53% 第二章作业 1、简述指令集结构设计的基本原则。 完整性、规整性、高效性和兼容性 2、简述RISC结构的设计原则。 1)选取使用频率最高的指令,并补充一些最有用的指令; 2)每条指令的功能应尽可能简单,并在一个机器周期内完成; 3)所有指令长度均相同; 4)只有Load和Store操作指令才访问存储器,其它指令操作均在寄存器之间进行; 5)以简单有效的方式支持高级语言。 3

计算机系统结构期末考试题目

第一章: 1.计算机系统结构的定义 答:由程序设计者看到的一个计算机系统的属性,即概念性结构和功能特性。 2.透明性概念 答:在计算机技术中,一种本来是存在的事物或属性,但从某种角度看似乎不存在,称为透明性现象。 3.兼容性向后兼容 兼容性:同一个软件可以不加修改地运行于系统结构相同的各档机器,可获得相同的结果,差别只在于不同的运行时间。 向后兼容:按某个时期投入市场的某种型号机器编制的程序,不加修改就能运行于在它之后投入市场的机器。 4.Amdahl定律 答:系统中某一部件由于采用某种更快的执行方式后整个系统性能的提高与这种执行方式的使用频率或占总执行时间的比例有关。 5.CPI 答:每条指令的平均时钟周期数。 6.MIPS 答:每秒百万条指令数!MIPS=时钟频率/(CPI*10^6) 7.MFLOPS 答:每秒百万次浮点操作次数。MFLOPS=程序中的浮点操作次数/(执行时间*10^6) 8.命中率的概念 答: 9.Flynn分类法是按指令流和数据流的多倍性特征进行计算机系统结构的划分 答:①单指令流单数据流SISD ②单指令流多数据流SIMD ③多指令流单数据流MISD (实际不存在)④多指令流多数据流MIMD 10.计算机系统设计的定量原理(四个) 答:①加快经常性事件的速度②Amdahl定律③CPU性能公式④访问的局部性原理11.CPI和加速比的计算 答:CPI=CPU时钟周期数/IC CPU时间=CPU时钟周期数/频率 CPU时间=CPU时钟周期*时钟周期长 加速比=(采用改进措施后的性能)/(没有采用改进措施前的性能) =(没有采用改进措施前执行某任务的时间)/(采用改进措施后执行某任务的时间) 12.软硬件实现的特点 硬件实现:速度快、成本高;灵活性差、占用内存少 软件实现:速度低、复制费用低;灵活性好、占用内存多 13.系统评价的标准 ①运算速度②存储器系统③其他性能④成本标准

(完整版)计算机系统结构试题及答案

计算机系统结构复习题 单选及填空: 计算机系统设计的主要方法 1、由上往下的设计(top-down) 2、由下往上的设计(bottom-up) 3、从中间开始(middle-out) Flynn分类法把计算机系统的结构分为以下四类: (1)单指令流单数据流 (2)单指令流多数据流 (3)多指令流单数据流 (4) 多指令流多数据流 堆栈型机器:CPU 中存储操作数的单元是堆栈的机器。 累加器型机器:CPU 中存储操作数的单元是累加器的机器。 通用寄存器型机器:CPU 中存储操作数的单元是通用寄存器的机器。 名词解释: 虚拟机:用软件实现的机器叫做虚拟机,但虚拟机不一定完全由软件实现,有些操作可以由硬件或固件(固件是指具有软件功能的固件)实现。 系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。 兼容机:它是指由不同公司厂家生产的具有相同系统结构的计算机。 流水线技术:将一个重复的时序过程,分解成为若干个子过程,而每一个子过程都可有效地在其专用功能段上与其它子过程同时执行。 单功能流水线:指流水线的各段之间的连接固定不变、只能完成一种固定功能的流水线。 多功能流水线:指各段可以进行不同的连接,以实现不同的功能的流水线。 顺序流水线:流水线输出端任务流出的顺序与输入端任务流入的顺序完全相同。 乱序流水线:流水线输出端任务流出的顺序与输入端任务流入的顺序可以不同,允许后进入流水线的任务先完成。这种流水线又称为无序流水线、错序流水线、异步流水线。 吞吐率:在单位时间内流水线所完成的任务数量或输出结果的数量。 指令的动态调度:

是指在保持数据流和异常行为的情况下,通过硬件对指令执行顺序进行重新安排,以提高流水线的利用率且减少停顿现象。是由硬件在程序实际运行时实施的。 指令的静态调度: 是指依靠编译器对代码进行静态调度,以减少相关和冲突。它不是在程序执行的过程中、而是在编译期间进行代码调度和优化的。 超标量: 一种多指令流出技术。它在每个时钟周期流出的指令条数不固定,依代码的具体情况而定,但有个上限。 超流水:在一个时钟周期内分时流出多条指令。 多级存储层次: 采用不同的技术实现的存储器,处在离CPU不同距离的层次上,各存储器之间一般满足包容关系,即任何一层存储器中的内容都是其下一层(离CPU更远的一层)存储器中内容的子集。目标是达到离CPU最近的存储器的速度,最远的存储器的容量。 写直达法: 在执行写操作时,不仅把信息写入Cache中相应的块,而且也写入下一级存储器中相应的块。写回法: 只把信息写入Cache中相应块,该块只有被替换时,才被写回主存。 集中式共享多处理机: 也称为对称式共享存储器多处理SMP。它一般由几十个处理器构成,各处理器共享一个集中式的物理存储器,这个主存相对于各处理器的关系是对称的, 分布式共享多处理机: 它的共享存储器分布在各台处理机中,每台处理机都带有自己的本地存储器,组成一个“处理机-存储器”单元。但是这些分布在各台处理机中的实际存储器又合在一起统一编址,在逻辑上组成一个共享存储器。这些处理机存储器单元通过互连网络连接在一起,每台处理机除了能访问本地存储器外,还能通过互连网络直接访问在其他处理机存储器单元中的“远程存储器”。 多Cache一致性: 多处理机中,当共享数据进入Cache,就可能出现多个处理器的Cache中都有同一存储器块的副本,要保证多个副本数据是一致的。 写作废协议: 在处理器对某个数据项进行写入之前,它拥有对该数据项的唯一的访问权 。 写更新协议: 当一个处理器对某数据项进行写入时,它把该新数据广播给所有其它Cache。这些Cache用该新数据对其中的副本进行更新。 机群:是一种价格低廉、易于构建、可扩放性极强的并行计算机系统。它由多台同构或异构

吉大14秋学期《计算机系统结构》在线作业二答案

吉大14秋学期《计算机系统结构》在线作业二 单选题判断题 一、单选题(共15 道试题,共60 分。) 1. 关于非专用总线三种控制方式中,下列叙述错误的是()。 A. 集中式定时查询,所有部件共用同一条“总线忙”线 B. 集中式定时查询,所有部件都用同一条“总线请求”线 C. 集中式独立请求,所有部件都用同一条“总线请求”线 D. 集中式串行链接,所有部件都用同一条“总线请求”线 -----------------选择:C 2. 汇编语言源程序变换成机器语言目标程序是经( ) 来实现的。 A. 编译程序解释 B. 汇编程序解释 C. 编译程序翻译 D. 汇编程序翻译 -----------------选择:D 3. 计算机使用的语言是( )。 A. 专属软件范畴,与计算机体系结构无关 B. 分属于计算机系统各个层次 C. 属于用以建立一个用户的应用环境 D. 属于符号化的机器指令 -----------------选择:B 4. 多端口存储器适合于连接()。 A. 紧耦合多处理机 B. 松耦合多处理机 C. 机数很多的处理机 D. 机数可变的多处理机 -----------------选择:A 5. 在系统结构设计中,提高软件功能实现的比例会( )。 A. 提高解题速度 B. 减少需要的存贮容量 C. 提高系统的灵活性 D. 提高系统的性能价格比 -----------------选择:C 6. 用户高级语言源程序中出现的读写(I/O) 语句,到读写操作全部完成,需要通过( )共同完成。 A. 编译系统和操作系统 B. I/O 总线、设备控制器和设备 C. 操作系统和I/O 设备硬件 D. 编译系统、操作系统软件和I/O 总线,设备控制器、设备硬件等 -----------------选择:D

计算机系统结构考试题库及答案

计算机系统结构试题及答案 一、选择题(50分,每题2分,正确答案可能不只一个,可单选 或复选) 1.(CPU周期、机器周期)是内存读取一条指令字的最短时间。 2.(多线程、多核)技术体现了计算机并行处理中的空间并行。 3.(冯?诺伊曼、存储程序)体系结构的计算机把程序及其操作数 据一同存储在存储器里。 4.(计算机体系结构)是机器语言程序员所看到的传统机器级所具 有的属性,其实质是确定计算机系统中软硬件的界面。 5.(控制器)的基本任务是按照程序所排的指令序列,从存储器取 出指令操作码到控制器中,对指令操作码译码分析,执行指令操作。 6.(流水线)技术体现了计算机并行处理中的时间并行。 7.(数据流)是执行周期中从内存流向运算器的信息流。 8.(指令周期)是取出并执行一条指令的时间。 9.1958年开始出现的第二代计算机,使用(晶体管)作为电子器件。 10.1960年代中期开始出现的第三代计算机,使用(小规模集成电路、 中规模集成电路)作为电子器件。 11.1970年代开始出现的第四代计算机,使用(大规模集成电路、超 大规模集成电路)作为电子器件。 12.Cache存储器在产生替换时,可以采用以下替换算法:(LFU算法、 LRU算法、随机替换)。

13.Cache的功能由(硬件)实现,因而对程序员是透明的。 14.Cache是介于CPU和(主存、内存)之间的小容量存储器,能高 速地向CPU提供指令和数据,从而加快程序的执行速度。 15.Cache由高速的(SRAM)组成。 16.CPU的基本功能包括(程序控制、操作控制、时间控制、数据加 工)。 17.CPU的控制方式通常分为:(同步控制方式、异步控制方式、联合 控制方式)反映了时序信号的定时方式。 18.CPU的联合控制方式的设计思想是:(在功能部件内部采用同步控 制方式、在功能部件之间采用异步控制方式、在硬件实现允许的情况下,尽可能多地采用异步控制方式)。 19.CPU的同步控制方式有时又称为(固定时序控制方式、无应答控 制方式)。 20.CPU的异步控制方式有时又称为(可变时序控制方式、应答控制 方式)。 21.EPROM是指(光擦可编程只读存储器)。 22.MOS半导体存储器中,(DRAM)可大幅度提高集成度,但由于(刷 新)操作,外围电路复杂,速度慢。 23.MOS半导体存储器中,(SRAM)的外围电路简单,速度(快),但 其使用的器件多,集成度不高。 24.RISC的几个要素是(一个有限的简单的指令集、CPU配备大量的 通用寄存器、强调对指令流水线的优化)。

计算机系统结构 课后习题答案(第2版)

习题一 1、解释下列术语 计算机系统的外特性:通常所讲的计算机系统结构的外特性是指机器语言程序员或编译程序编写者所看到的外特性,即由他们所看到的计算机的基本属性(概念性结构和功能特性)。 计算机系统的内特性:计算机系统的设计人员所看到的基本属性,本质上是为了将有关软件人员的基本属性加以逻辑实现的基本属性。 模拟:模拟方法是指用软件方法在一台现有的计算机上实现另一台计算机的指令系统。 可移植性:在新型号机出台后,原来开发的软件仍能继续在升级换代的新型号机器上使用,这就要求软件具有可兼容性,即可移植性。可兼容性是指一个软件可不经修改或只需少量修改,便可由一台机器移植到另一台机器上运行,即同一软件可应用于不同环境。 Amdahl定律:系统中对于某一部件采用某种更快的执行方式所能获得的系统性能改进程度,取决于这种执行方式被使用的频度或占总执行时间的比例。 虚拟机(Virtual Machine):指通过软件模拟的具有完整硬件系统功能的、运行在一个完全隔离环境中的完整计算机系统。 6、 7、假定求浮点数平方根的操作在某台机器上的一个基准测试程序中占总执行时间的20%,为了增强该操作的性能,可采用两种不同的方法:一种是增加专门的硬件,可使求浮点数平方根操作的速度提高为原来的20倍;另一种方法是提高所有浮点运算指令的速度,使其为原来的2倍,而浮点运算指令的执行时间在总执行时间中占30%。试比较这两种方法哪一种更好些。 答:增加硬件的方法的加速比Sp1=1.23, 另一种方法的加速比Sp2= 1.176,经计算可知Sp1=方法更好些。 Sp2>Sp2第一种 9、假设高速缓存Cache的工作速度为主存的5倍,且Cache被访问命中的概率 T=为90%,则采用Cache能使整个存储系统获得多高的加速比?答: 加速比

计算机系统结构三四章作业及答案

简述流水线技术的特点。(1) 流水线把一个处理过程分解为若干个子过程,每个子过程由一个专门的功能部件来实现。因此,流水线实际上是把一个大的处理功能部件分解为多个独立的功能部件,并依靠它们的并行工作来提高吞吐率。(2) 流水线中各段的时间应尽可能相等,否则将引起流水线堵塞和断流。(3) 流水线每一个功能部件的前面都要有一个缓冲寄存器,称为流水寄存器。(4) 流水技术适合于大量重复的时序过程,只有在输入端不断地提供任务,才能充分发挥流水线的效率。(5) 流水线需要有通过时间和排空时间。在这两个时间段中,流水线都不是满负荷工作。 解决流水线瓶颈问题有哪两种常用方法?答:细分瓶颈段与重复设置瓶颈段 有一条指令流水线如下所示: (1 (? ? TP = 有一个流水线由4段组成,其中每当流过第三段时,总要在该段循环一次,然后才能流到第4段。如果每段经过一次所需的时间都是△t ,问: (1)当在流水线的输入端连续地每△t 时间输入一个任务时,该流水线会发生什么情况? (2)此流水线的最大吞吐率为多少?如果每2△t 输入一个任务,连续处理10个任务时,其实际吞吐率和效率是多少? (3)当每段时间不变时,如何提高流水线的吞吐率?人连续处理10个任务时,其吞吐率提高多少? 解:(1)会发生流水线阻塞情况。 (2)

(3)重复设置部件 吞吐率提高倍数= t t ??2310 75 有一条动态多功能流水线由5段组成,加法用1、3、4、5段,乘法用1、2、5段,第2段的时间为2△t ,其余各段的时间均为△t ,而且流水线的输出可以直接返回输入端或暂存于相应的流水线寄存器中。现在该流水线上计算 ∏=+4 1 )(i i i B A ,画出时空图,并计算其吞吐率、加速比和效率。 4+B 4;再计算(A 由图可见,它在18个△t 时间中,给出了7个结果。所以吞吐率为: 如果不用流水线,由于一次求积需3△t ,一次求和需5△t ,则产生上述7个结果共需(4×5+3×3)△t =29△t 。所以加速比为: 该流水线的效率可由阴影区的面积和5个段总时空区的面积的比值求得: △t,需经9△t 才能完成一个任务,其预约表如下所示。 (1)画出流水线任务调度的状态转移图。 时间 入 A 1 B 1 A 2 B 2 A 3 B 3 A 4 B 4 A B C D A × B C ×D

计算机系统结构期末考试试题及其答案

计算机系统结构期末考试试题及其答案

《计算机系统结构》期末考试试卷A 卷第 2 页 共 24 页 计算机科学系《计算机系统结构》期末考试试卷(A 卷) 2、此试卷适用于计算机科学与技术本科专业。 一 单选题:(10分,每题1分) 1、 ."启动I/O"指令是主要的输入输出指 令,是属于( B ) A.目态指令 B.管态指令 C.目态、管态都能用的指令 D.编译程序只能用的指令 2、 输入输出系统硬件的功能对(B )是透 明的 A.操作系统程序员 B.应用程序员 C.系统结构设计人员 D.机器语言程序设计员 3、 全相联地址映象是指(A ) A.任何虚页都可装入主存中任何实页的位置 B.一个虚页只装进固定的主存实页位置 C.组之间固定,组内任何虚页可装入任何实页位

置 D.组间可任意装入,组内是固定装入 4、( C ) 属于MIMD系统结构 A.各处理单元同时受一个控制单元的管理 B.各处理单元同时受同个控制单元送来的指令 C.松耦合多处理机和多计算机系统 D.阵列处理机 5、多处理机上两个程序段之间若有先写 后读的数据相关,则(B ) A.可以并行执行 B.不可能并行 C.任何情况均可交换串行 D.必须并行执行 6、计算机使用的语言是(B) A.专属软件范畴,与计算机体系结构无关 B.分属于计算机系统各个层次 C.属于用以建立一个用户的应用环境 D.属于符号化的机器指令 7、指令执行结果出现异常引起的中断是 (C ) A.输入/输出中断 B.机器校验中断 C.程序性中断 D.外部中断 《计算机系统结构》期末考试试卷A卷第 3 页共 24 页

《计算机系统结构》与参考答案

2.以下各类中断中,属于自愿中断的是 C. A. 外部中断 B. I/O中断 C. 执行“访管”指令 D. 机器校验中断 3.高速外部设备磁盘机适合连接于 C. A. 选择通道或字节多路通道 B. 数组多路通道或字节多路通道 C.数组多路通道或选择通道 D.任意一种通道 4.页式虚拟存储器页表的作用是 A . A. 反映虚页在主存的存储情况 B.仅反映虚页是否调入主存 C. 反映主存实页与Cache 的对应关系 D. 反映虚页在辅存的存储情况5.软件和硬件的功能在逻辑上是C的 . A.固件优于软件 B.不等价 C.等价 D.软件优于固件 6.计算机中最优化的操作码编码方法是D. A.BCD 码 B.ASCII码 C.扩展操作码 D.哈夫曼编码 7.从计算机系统执行程序的角度看,并行性等级由低到高分为四级A. A .指令内部——指令之间——进程之间——程序之间 B .指令之间——指令内部——进程之间——程序之间 C.进程之间——指令之间——指令内部——程序之间 D .程序之间——进程之间——指令之间——指令内部 8.计算机系统多级层次结构中,操作系统机器级的直接上层是D. A .传统机器级 B .高级语言机器 C.应用语言机器级D.汇编语言机器级 9.全相联地址映像是指A. A. 任何虚页都可装入主存中任何实页的位置 B.一个虚页只装进固定的主存实页位置 C.组之间是固定的,而组内任何虚页可以装入任何实页位置 D.组间可任意装入,组内是固定装入 10.对于同一系列机,必须保证软件能够C. A .向前兼容,并向上兼容 B .向前兼容,并向下兼容C.向后兼容,力争向上兼容D .向后兼容,力争向下兼容11.设有 16 个处理单元的并行处理机系统, 采用共享主存的方式. 若同时存取16 个数据 , 为避免存储器访问冲突, 共享主存的多体数量应该为C才合理 . A. 15 B. 16 C. 17 D. 19 12.软件兼容的根本特征是C. A.向前兼容 B.向后兼容 C. 向上兼容 D. 向下兼容 13.在下列机器中,能够实现软件兼容的机器是 B. A.完全不同种类的机型 B.系统结构相同的机器 C. 宿主机和目标机 D.虚拟机 14.输入输出系统硬件的功能对C是透明的。 A. 操作系统程序员 B. 所有类别的程序员 C. 应用程序员 D. 系统结构设计师 15.在下列各项选择中,对于机器( 汇编 ) 语言程序员透明的是 D. A.通用寄存器 B. 条件码 C.中断字 D.主存储器地址寄存器 一、单项选择题 1.在流水机器中,全局性相关是指 B. A.指令相关 B. 由条件转移指令引起的相关 C “先读后写”相关 D.“先写后读”相关 2.以下不属于多处理机操作系统类型的是A. A .Windows 操作系统B.主从型操作系 C.浮动型操作系统 D .各自独立型操作系统 3.下列不是数据流计算特点的是D. A. 设置状态 B.没有指令计数器 C.没有变量的概念 D.操作结果不产生副作用 4.若输入流水线的指令既无局部性相关,也不存在全局性相关,则B. A. 可获得高的吞吐率和效率 B.出现瓶颈 C.流水线的效率和吞吐率恶化 D.可靠性提高 5.消除“一次重叠”中的“指令相关”最好方法是B. A. 不准修改指令 B.设置相关专用通路 C.推后分析下条指令 D.推后执行下条指令 6.流水线的技术指标不包括A. A. 数据宽度 B.吞吐率 C.加速比 D.效率 7.按照弗林对处理机并行性定义的分类原则,阵列机ILLIAC IV属于B. A.SISD B.SIMD C.MISD D.MIMD 8.设 8 个处理器编号分别为0,1, 2,?,7 用 Cube0 互联函数时,第7 号处理机可以与第D号处理机相联 . A. 0 B. 2 C. 4 D. 6 9.多端口存储器适合于连接 B. A .松耦合多处理机B.紧耦合多处理机C.机数很多的多处理机 D .机数可变的多处理机 10.以下不属于堆栈型替换算法的是A. A .先进先出法B.近期最久未用过法 C.近期最少使用法D.页面失效频率法 11.解决主存空间数相关的办法是C. A.基址值一次相关直接通路法 B.基址值二次相关直接通路法 C.通用寄存器组相关专用通路相关法 D. 推后读法 12. 一般来说 , 以下替换算法中 , 效果最优的替换算法是C. A. LRU 替换算法 B. FIFO 替换算法 C. OPT 替换算法 D. RAND替换算法

计算机系统结构考试计算题

有一指令流水线如下所示 入 1 2 3 4 出 50ns 50ns 100ns 200ns (1) 求连续输入10条指令,该流水线的实际吞吐率和效率; (2) 该流水线的“瓶颈”在哪一段请采取两种不同的措施消除此“瓶颈”。对 于你所给出的两种新的流水线,连续输入10条指令时,其实际吞吐率和效率各是多少 解:(1) 2200(ns) 2009200)10050(50t )1n (t T max m 1 i i pipeline =?++++=?-+?=∑= )(ns 220 1T n TP 1pipeline -== 45.45%11 5 4400TP m t TP E m 1 i i ≈=? =?? =∑= (2)瓶颈在3、4段。 变成八级流水线(细分) 850(ns) 509850t 1)(n t T max m 1 i i pipeline =?+?=?-+?=∑= )(ns 85 1 T n TP 1pipeline -== 58.82%17 10 8400TP m ti TP E m 1 i ≈=? =?? =∑= 重复设置部件 1 2 3_1 3_2 4_1 4_4 入 出

)(ns 851T n TP 1pipeline -== 58.82%17 10 8 85010400E ≈=??= 有一 4段组成,其3段时,总次,然后流到第4段。如果 需要的时间都是t ?,问: (1) 当在流水线的输入端连续地每t ?时间输入任务时,该流水线会发生 什么情况 (2) 此流水线的最大吞吐率为多少如果每t ?2输入一个任务,连续处理 10个任务时的实际吞吐率和效率是多少 (3) 当每段时间不变时,如何提高该流水线的吞吐率仍连续处理10个任 务时,其吞吐率提高多少 (2)

运筹学教程清华第三版课后答案(第一章,第五章部分)

1.某饲养场饲养动物出售,设每头动物每天至少需700g蛋白质、30g矿物质、100mg 维生素。现有五种饲料可供选用,各种饲料每kg营养成分含量及单价如表1所示。表1 要求确定既满足动物生长的营养需要,又使费用最省的选用饲料的方案。 x表示满足动物生长的营养需要时,解:设总费用为Z。i=1,2,3,4,5代表5种饲料。 i 第i种饲料所需的数量。则有: 2.某医院护士值班班次、每班工作时间及各班所需护士数如表2所示。每班护士值班 开始时间向病房报道,试决定: (1)若护士上班后连续工作8h,该医院最少需要多少名护士,以满足轮班需要; (2)若除22:00上班的护士连续工作8h外(取消第6班),其他班次护士由医院排定上1~4班的其中两个班,则该医院又需要多少名护士满足轮班需要。表2 x第i班开始上班的人数,i=1,2,3,4,5,6 解:(1)设 i x第i 解:(2)在题设情况下,可知第五班一定要30个人才能满足轮班需要。则设设 i 班开始上班的人数,i=1,2,3,4。

a 3.要在长度为l的一根圆钢上截取不同长度的零件毛坯,毛坯长度有n种,分别为 j (j=1,2,…n)。问每种毛坯应当截取多少根,才能使圆钢残料最少,试建立本问题的数学模型。 解:设 x表示各种毛坯的数量,i=1,2,…n。 i 4.一艘货轮分前、中、后三个舱位,它们的与最大允许载重量如表3.1所示。现有三 种货物待运,已知有相关数据列于表3.2。 表3.1 表3.2 又为了航海安全,前、中、后舱实际载重量大体保持各舱最大允许载重量的比例关系。具体要求:前、后舱分别与中舱之间载重量比例的偏差不超过15%,前、后舱之间不超过10%。问该货轮应该载A,B,C各多少件运费收入才最大?试建立这个问题的线性规划模型。 x表示第i件商品在舱j的装载量,i,j=1,2,3 解:设 ij 1)商品的数量约束: 2)商品的容积约束: 3)最大载重量约束: 4)重量比例偏差的约束: 5.篮球队需要选择5名队员组成出场阵容参加比赛。8名队员的身高及擅长位置见表 5. 表5

计算机体系结构第一次作业

问答题(共4道题) 1.什么是存储系统? 答:存储系统是指计算机中由存放程序和数据的各种存储设备、控制部件及管理信息调度的设备(硬件)和算法(软件)所组成的系统。计算机的主存储器不能同时满足存取速度快、存储容量大和成本低的要求,在计算机中必须有速度由慢到快、容量由大到小的多级层次存储器,以最优的控制调度算法和合理的成本,构成具有性能可接受的存储系统。 2.什么是高速缓冲存储器 答:指存取速度比一般随机存取记忆体(RAM)来得快的一种RAM。 一般而言它不像系统主记忆体那样使用DRAM技术,而使用昂贵但较快速的SRAM技术,也有快取记忆体的名称。 高速缓冲存储器是存在于主存与CPU之间的一级存储器,由静态存储芯片(SRAM)组成,容量比较小但速度比主存高得多,接近于CPU的速度。 在计算机存储系统的层次结构中,是介于中央处理器和主存储器之间的高速小容量存储器。它和主存储器一起构成一级的存储器。高速缓冲存储器和主存储器之间信息的调度和传送是由硬件自动进行的。 3.假设一台模型计算机共有10种不同的操作码,如果采用固定长操作码需要4 位。已知各种操作码在程序中出现的概率如下表所示,计算采用Huffman编码 法的操作码平均长度,并计算固定长操作码和Huffman操作码的信息冗余量 (假设最短平均长度H=3.1位)。 答:构造Huffman树如下:

Huffman 编码的平均码长为: ∑=10 1 i i i l p =0.17*2+(0.15+0.15+0.13+0.12)*3+(0.09+0.08+0.07)*4+(0.03+0.01)*5=3.15 冗余量=(3.15-3.10)/3.15=1.59% 固定码长=log210=4 冗余量=(4-3.10)/4=22.5% 4.若某机要求有:三地址指令4条,单地址指令192条,零地址指令16条。设指令字长为12位,每个地址码长3位。问能否以扩展操作码为其编码? 答:三种指令字格式如下:

专升本《计算机系统结构》_试卷_答案,DOC

专升本《计算机系统结构》 一、(共75题,共150分) 1. 最早的冯·诺依曼(von Neumann)结构计算机是以()为中心的。(2分) A.运算器 B.控制器 C.存储器 D.I/O设备 .标准答案:A 2. 同构型多处理机和异构型多处理机所采用的提高并行性的技术途径分别是()(2分) A.资源共享、资源重复 B.资源重复、资源共享 C.资源共享、时间重叠 D.资源重复、时间重叠 .标准答案:D 3. 由同一厂家生产的、系统结构相同的,但组成和实现不同的所有计算机,称为()(2分) A.兼容机 B.扩展机 C.系列机 D.系统机 .标准答案:C 4. 从计算机系统中处理数据的并行性看,并行性等级从低到高分为()(2分) A.位串字串、位并字串、位串字并、全并行 B.位并字串、全并行、位串字串、位串字并 C.全并行、位并字串、位串字串、位串字并 D.位串字串、位串字并、位并字串、全并行 .标准答案:A 5. 扩展编码要求(),否则会产生解码不唯一的问题。(2分) A.所有的短码都必须是长码的前缀 B.所有的短码都不能是长码的前缀 C.所有的短码都必须是长码的后缀 D.所有的短码都不能是长码的后缀 .标准答案:B 6. 下面的指令中,()不属于RISC处理器指令集。(2分) A.ADD R4,[1000] B.LD R3,(R4) C.SUB R4,R3 D.SD 0(R3),R4 .标准答案:A 7. 指令的重叠解释方式与顺序解释方式相比,可以提高()指令的执行速度。(2分) A.一条 B.两条 C.两条以上 D.两条或两条以上 .标准答案:D 8. 虚拟存储器外部地址变换,实现的是虚地址到()的变换。(2分) A.辅存物理地址 B.主存地址 C.Cache地址 D.虚地址 .标准答案:A 9. 设主存和辅存的平均访问时间分别为秒和秒,若要使虚拟存储器的主存-辅存层平均时间达到,问至少应保证主存访问命中率为()(2分) A.0.97 B.0.98 C.0.99 D.1 .标准答案:C 10. 替换算法要解决的问题是()(2分) A.用户的虚页如何与主存的实页对应 B.如何用主存的实页号替代多用户的虚页号 C.当页面失效时,选择主存中哪个页作为被替换页 D.新用户要进入主存,选择哪个用户作为被替换的用户 .标准答案:C 11. RISC执行程序的速度比CISC要快的原因是()(2分) A.RISC的指令系统中指令条数较少 B.程序在RISC上编译生成的目标程序较短 C.RISC的指令平均执行周期数较少 D.RISC只允许load和store指令访存 .标准答案:C 12. 输入输出系统硬件的功能对()是透明的。(2分) A.操作系统程序员 B.编译程序员 C.应用程序员 D.系统结构设计师 .标准答案:C 13. 在由多个通道组成的I/O系统中,I/O的最大流量是()(2分) A.各通道最大流量的最大值 B.各通道最大流量之和 C.各通道实际流量的最大值 D.各通道实际流量之和 .标准答案:B 14. 通道方式输入输出系统中,对优先级高的磁盘等高速设备,适合于连接( ) (2分) A.字节多路通道 B.选择通道 C.数组多路通道 D.字节及数组多路通道 .标准答案:B

相关主题
文本预览
相关文档 最新文档