当前位置:文档之家› 计算机体系结构复习资料汇总

计算机体系结构复习资料汇总

计算机体系结构复习资料汇总
计算机体系结构复习资料汇总

计算机体系结构选择题

1. 多处理机实现的并行主要是(B)

A、指令级并行

B、任务级并行

C、操作级并行

D、操作步骤的并行

2.计算机系统结构不包括( B )。

A、信息保护

B、主存速度

C、数据表示

D、机器工作状态

3.信息按整数边界存储的主要优点是(A)。

A、访存速度快

B、节约主存单元

C、指令字的规整化

D、指令的优化

4.以下说法不正确的是( D )。

A、线性流水线是单功能流水线

B、动态流水线是多功能流水线

C、静态流水线是多功能流水线

D、动态流水线只能是单功能流水线

5.对于采用组相联映像、LRU替换算法的cache存储器来说,不影响cache命中率的是(C)

A、增加cache中的块数

B、增加组的大小

C、增大主存容量

D、增大块的大小

6.与线性流水线最大吞吐率有关的是(C)。

A、各个功能段的执行时间

B、最快的那一段的执行时间

C、最慢的那一段的执行时间

D、最后功能段的执行时间

7. 下面对网络直径描述正确的是(A)

A、指互连网络中任意两个结点之间距离的最大值

B、指互连网络中任意两个结点之间距离的最小值

C、指互连网络中多个结点之间距离的最大值

D、指互连网络中多个结点之间距离的最小值

9.系统的可信性是指(A)

A、服务质量

B、平均修复时间

C、可用性

D、正常工作时间

10. 评价I/O主要性能的参数主要有(D)

A、连接性I/O系统的容量

B、I/O系统的容量响应时间

C、响应时间吞吐率

D、以上都是

11.对汇编语言程序员不透明的是(C )

A、程序计数器

B、主存地址寄存器

C、条件码寄存器

D、指令存储器

12.利用时间重叠原理实现并处理的是(A)。

A、流水机处理

B、多处理机

C、阵列处理机

D、机群系统

13.2-4扩展编码最多可以得到的码点数是(D)。

B、A、6 B、7

C、10

D、13

14.反映存储的可靠性是指系统从某个初始参点开始(A)。

B、初始参点B、执行时间

C、结束时间

D、中间某点

15.Cray-1向量处理机要实现指令间的链接,必须满足以下条件中的(C)。

A、源向量相同,功能部件不冲突,有指令相关

B、源向量不同,功能部件相同,无指令相关

C、源向量、功能部件都不相同,指令有写后读冲突

D、源向量、功能部件都不相同,指令有读后写冲突

16.不同系列的机器之间,实现可移植性的途径不包括(B)。

A、采用统一的高级语言

B、采用统一的汇编语言

C、模拟

D、仿真

17.RISC采用寄存器窗口重叠技术,从而大大减少了(C)。

A、绝大多数指令的执行周期

B、程序调用引起的访存次数

C、目标程序的指令条数

D、CPU访存的访问周期

18.Cray-1的两条向量指令:

V1 V2+V3

V4 V1*V5

属于(C)。

A、没有功能部件冲和源向量冲突,可以进行

B、没有源向量冲突,可以交换执行顺序

C、没有功能部件冲和源向量冲突,可以链接

D、有向量冲突,只能串行

19.下列属于互联函数(D)

A、恒等函数

B、交换函数

C、均匀洗牌函数

D、以上都是

20.下列说法不正确的是(D)。

A、单体多字存储能提高存储器频宽

B、多体存储器低位交叉编址能提高存储器频宽

C、多体存储器高位交叉编址便于扩大存储器容量

D、多体存储器高位交叉编址能提高存储器频宽

21.多处理机实现的并行主要是(B)

B、指令级并行B、任务级并行

C、操作级并行

D、操作步骤的并行

22.信息按整数边界存储的主要优点是(A)。

B、访存速度快B、节约主存单元

C、指令字的规整化

D、指令的优化

23.与线性流水线最大吞吐率有关的是( C )。

C、各个功能段的执行时间B、最快的那一段的执行时间

C、最慢的那一段的执行时间

D、最后功能段的执行时间

24.系统的可信性是指( A )

A、服务质量

B、平均修复时间

C、可用性

D、正常工作时间

25.不需要编制的数据存储空间是(D)。

A、CPU中的通用寄存器

B、主存储器

C、I/O接口中的寄存器

D、堆栈

26.以下是非线性流水线的调度方案:[(2,7);(2,2,7);(3,4);(4);(3,4,7);(4,7);(4,3);(5);(7)]。其中平均延迟最小的等间隔调度方案是(A)。

A、(4)

B、(5)

C、(3,4)D(4,3)

27.Cray-1向量处理机启动存储器、流水部件及寄存器打入各需一拍,现在有向

V3 存储器(从存储器中选数:6拍)

V4 V0+V1 (向量加:6拍)

V5 V3*V4 (向量乘:7拍)

向量长度均为N,则指令串最短的执行时间是(A)。

A、16+N拍

B、17+N拍

C、18+N拍

D、19+N拍

28.按cache地址映像的块冲突概率从高到低的顺序是(C)。

A、全相联映像、直接映像、组相联映像

B、组相联映像、直接映像、全相联映像

C、直接映像、组相联映像、全相联映像

D、全相联映像、组相联映像、直接映像

29.下列说法正确的是(C)

A、存储容量大,价格越高

B、存储容量小,价格越低

C、每位价格越高,速度越快

D、速度越慢,价格越高

30. 下面对同步总线描述错误的是(D)。

A、同步总线上所有设备通过统一的总线系统时钟进行同步

B、同步总线成本低,因为它不需要设备之间互相确定时序的逻辑

C、同步总线总线操作必须以相同的速度运行

D、容易适应更广泛的设备类型,扩充总线时不用担心时钟时序和时钟同步问题

计算机系统结构名词解释

1.层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次

结构,一层以一种不同的语言为特征。这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。

2.虚拟机:用软件实现的机器。

3.翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在

这低一级机器上运行,实现程序的功能。

4.解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的

一段等效程序。执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。

5.计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。

6.Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提

高,受限于该部件的执行时间占总执行时间的百分比。

7.CPI:每条指令执行的平均时钟周期数。

8.系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型

号的计算机。

9.堆栈型机器:CPU 中存储操作数的单元是堆栈的机器。

10.累加器型机器:CPU 中存储操作数的单元是累加器的机器。

11.通用寄存器型机器:CPU 中存储操作数的单元是通用寄存器的机器。

12.CISC:复杂指令集计算机

13.RISC:精简指令集计算机

14.寻址方式:指令系统中如何形成所要访问的数据的地址。一般来说,寻址方式可以指明

指令中的操作数是一个常数、一个寄存器操作数或者是一个存储器操作数。

15.数据表示:硬件结构能够识别、指令系统可以直接调用的那些数据结构。

16.流水线:将一个重复的时序过程,分解成为若干个子过程,而每一个子过程都可有效地

在其专用功能段上与其它子过程同时执行。

17.静态流水线:指在同一时间内,多功能流水线中的各段只能按同一种功能的连接方式工

作的流水线。当流水线要切换到另一种功能时,必须等前面的任务都流出流水线之后,才能改变连接。

18.动态流水线:指在同一时间内,多功能流水线中的各段可以按照不同的方式连接,同时

执行多种功能的流水线。它允许在某些段正在实现某种运算时,另一些段却在实现另一种运算。

19.非线性流水线:指各段除了有串行的连接外,还有反馈回路的流水线。

20.乱序流水线:流水线输出端任务流出的顺序与输入端任务流入的顺序可以不同,允许后

进入流水线的任务先完成。这种流水线又称为无序流水线、错序流水线、异步流水线。

21.吞吐率:在单位时间内流水线所完成的任务数量或输出结果的数量。

22.名相关:如果两条指令使用了相同的名,但是它们之间并没有数据流动,则称这两条指

令存在名相关。

23.反相关:考虑两条指令i和j,i在j的前面,如果指令j所写的名与指令i所读的名相

同,则称指令i和j发生了反相关。

24.结构冲突:因硬件资源满足不了指令重叠执行的要求而发生的冲突。

25.数据冲突:当指令在流水线中重叠执行时,因需要用到前面指令的执行结果而发生的冲

突。

26.控制冲突:流水线遇到分支指令或其它会改变PC值的指令所引起的冲突。

27.写后读冲突:考虑两条指令i和j,且i在j之前进入流水线,指令j用到指令i的计算

结果,而且在i将结果写入寄存器之前就去读该寄存器,因而得到的是旧值。

28.指令级并行:简称ILP。是指指令之间存在的一种并行性,利用它,计算机可以并行执

行两条或两条以上的指令。

29.指令调度:通过在编译时让编译器重新组织指令顺序或通过硬件在执行时调整指令顺序

来消除冲突。

30.指令的动态调度:是指在保持数据流和异常行为的情况下,通过硬件对指令执行顺序进

行重新安排,以提高流水线的利用率且减少停顿现象。是由硬件在程序实际运行时实施的

31.指令的静态调度:是指依靠编译器对代码进行静态调度,以减少相关和冲突。它不是在

程序执行的过程中、而是在编译期间进行代码调度和优化的。

32.保留站:在采用Tomasulo算法的MIPS处理器浮点部件中,在运算部件的入口设置的

用来保存一条已经流出并等待到本功能部件执行的指令(相关信息)。

33.CDB:公共数据总线。

34.多级存储层次:采用不同的技术实现的存储器,处在离CPU不同距离的层次上,各存

储器之间一般满足包容关系,即任何一层存储器中的内容都是其下一层(离CPU更远的一层)存储器中内容的子集。目标是达到离CPU最近的存储器的速度,最远的存储器的容量。

35.全相联映象:主存中的任一块可以被放置到Cache中任意一个地方。

36.直接映象:主存中的每一块只能被放置到Cache中唯一的一个地方。

37.组相联映象:主存中的每一块可以放置到Cache中唯一的一组中任何一个地方(Cache

分成若干组,每组由若干块构成)

38.写回法:只把信息写入Cache中相应块,该块只有被替换时,才被写回主存。

39.命中时间:访问Cache命中时所用的时间。

40.失效率:CPU访存时,在一级存储器中找不到所需信息的概率。

41.失效开销:CPU向二级存储器发出访问请求到把这个数据调入一级存储器所需的时间。

42.Cache经验规则:大小为N的直接映象Cache的失效率约等于大小为N /2的两路组相

联Cache的实效率。

43.透明性在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存

在的概念称为透明性。

44.程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。

包括时间局部性和空间局部性。

45.响应时间:从用户键入命令开始,到得到结果所花的时间。响应时间:从用户键入命

令开始,到得到结果所花的时间。

46.可靠性:指系统从某个初始参考点开始一直连续提供服务的能力,它通常用平均无故

障时间来衡量。

47.可用性:指系统正常工作的时间在连续两次正常服务间隔时间中所占的比率。

48.可信性:指服务的质量,即在多大程度上可以合理地认为服务是可靠的。

49. 线路交换:在线路交换中,源结点和目的结点之间的物理通路在整个数据传送期间一直

保持连接。

50.分组交换:把信息分割成许多组(又称为包),将它们分别送入互连网络。这些数据包

可以通过不同的路径传送,到目的结点后再拼合出原来的数据,结点之间不存在固定连

接的物理通路。

51.IPC: CPU每一时钟周期内所执行的指令的多少。

计算机体系结构填空题

1.常见的计算机系统结构分类法有3种:Flynn分类法、冯氏分类法、Handler分类法。

2.冯氏分类法用系统的最大并行度对计算机进行分类,大多数传统的位并行单处理机属字

串位并方式。

3.由软件实现的机器称为虚拟机器,在一个计算机系统中,低层机器的属性对高层机器

的程序员往往是透明的。

4.软件是促使计算机系统结构发展最重要的因素,应用是促使计算机系统结构发展最

基本的动力,而器件是促使计算机系统结构发展最活跃的因素。

5.程序的局部性包括程序的时间局部性和程序的空间局部性。

6.从多层次结构出发,计算机系统可以有由上往下设计、由下往上设计、和从中间

开始设计 3种不同的设计方法。

7.实现程序可移植的主要途径有统一高级语言、系列机、模拟或仿真。

8.为了在不同系统结构的机器之间实现软件移植,可采用模拟或仿真方法。

9.软件兼容有向上兼容、向下兼容、向前兼容和向后兼容4种,其中向后兼容是

软件兼容的根本特征。

10.广义来说,并行性既包含同时性,又包含并发性。

11.CPU中用来存储操作数的存储单元主要有堆栈、累加器和寄存器。

12.可将大多数通用寄存器型指令系统结构分为寄存器-寄存器型结构、寄存器-存储器

型结构和存储器-存储器型结构3类。

13.对指令系统的基本要求是:完整性、规模性、正交性和兼容性。

14.常见的3种表示分支条件的技术是条件码、条件寄存器和比较与分支。

15.改变控制流程的4种情况有跳转、分支、过程调用和过程返回。

16.当控制指令为无条件改变控制流时,称之为跳转,为有条件改变控制流程时,称之为

分支。

17.2-4-5扩展编码的方法的最短码长时 2 ,最长码长是 6 位,最多可编码的码点数为

46 个。

18.指令系统编码格式有变长编码格式、固定长度编码格式和混合型编码格式。

19.对CISC指令系统可以从面向目标程序增强指令功能、面向高级语音的优化实现来

改进指令系统和面向操作系统的优化实现改进系统。

20.流水线中的每个子过程及其功能部件称为流水线的段,流水线的段数称为流水线的深

度。

21.流水线中最慢的一段称为流水线的瓶颈。

22.如果流水线处理机具有向量数据表示和向量指令,则称之为向量流水机;否则,就称

之为标量流水处理机。

23.按照流水线所完成的功能来分,流水线可分为单功能流水线和多功能流水线。

24.按照同一时间内各段之间的链接方式来分,流水线可分为静态流水线和动态流水

线。

25.按照流水线的级别来分,流水线可分为部件级流水线,处理机级流水线和处理机

间流水线。

26.按照流水线种是否有反馈回来来分,流水线可分为线性流水线、非线性流水线。

27.按照输出端任务流出顺序与输入端流入的任务顺序是否相同来分,流水线可分为顺序

流动流水线、异步流动流水线。

28.有一条非线性流水线,其预约表为F={2,4,5},初始冲突向量为C0=(11010),则对于

C0,后续的两个冲突向量分别为 111110 和 11011 。

29.流水线在连续流动达到稳定状态后所得到的吞吐率,称为最大吞吐率。

30.消除流水线瓶颈的方法有细分瓶颈段和重复设置瓶颈段。

31.相关有3种类型,数据相关、名相关和控制相关。

32.指令之间的名相关有反相关和输出相关。

33.流水线冲突有结构冲突、数据冲突和控制冲突。

34.按照指令读访问写访问的先后顺序,可以将数据冲突分为写后读冲突、写后写冲突

和读后写冲突。

35.由分支指令引起的延迟称为分支延迟。

36.延迟分支方法有3种调度策略:从前调度、从目标处调度和从失败处调度。

37.基本的MIPS流水线分为5个段,分别是:取指令周期、指令翻译/读寄存器周期、

执行/有效地址计算周期、存储器访问/分支完成周期和写回周期。

38.向量流水处理机采用存储器-存储器型结构或寄存器-寄存器型结构。

39.Cray-1向量处理的一个显著特点是:只要不出现向量寄存器Vi 冲突和功能部件冲

突,各Vi之间和功能部件之间都能并行工作。

40.衡量向量处理机性能的主要参数有向量指令的处理时间、向量长度为无穷大时的向

量处理机的最大性能、半性能向量长度和向量长度临界值。

41.把能在同一个时钟周期内一起开始执行的几条向量指令称为一个编队。

42.在向量流水处理机上,向量指令序列中的一个编队内的指令可以同时执行,编队执

行时间为编队内所有的向量指令执行时间的最大值。

43.开发指令级并行的方法主要有两类:基于硬件的动态开发方法以及基于软件的静态

开发方法。

44.如果一串连续的代码除了入口和出口以外,没有其他分支指令和转入点,则称之为一个

基本程序块。

45.说出两种比较典型的动态调度算法:记分牌方法和 Tomasulo算法。

46.要扩充Tomasulo算法支持前瞻执行,需将Tomasulo算法中的“写结果”段分为写结

构和指令确认两个段。

47.前瞻执行允许指令乱序执行,但要求按程序顺序确认。

48.Tomasulo算法中换名功能是由保留站的编号来完成,而在前瞻执行机制中,换名功

能有 ROB 来完成的。

49.静态指令调度技术是优化的编译器来完成:其基本思想是重新排指令序列,拉开具有

数据相关的有关指令间的距离。

50.动态分支预测的依据是从转移指令过去的行为来预测他将来的行为,即根据近期转移

是否成功的历史记录,来预测下一次转移的方向。

51.多流处理机有超标量和超长指令字CLIW 。

52.存储层次的性能参数有存储容量、平均每位的价格、命中率和平均访问时间4

个。

53.存储器层次结构设计技术的基本依据是程序的局部性原理,它包括空间局部性和

时间局部性两方面。

54.“主存-辅存”层次的目的是为了弥补生存容量的不足,“cache-主存”层次的目的是

为了弥补主存速度的不足。

55.设有“cache-主存”层次,cache为8块,主存为16块:试分别对于以下两种情况,

计算访存块地址为0110时的索引(index),

(1)组相联,每组两块:索引为 01 ;

(2)直接映像:索引为 0 ;

56.存储层次要解决的4个问题是映像规则、查找方法、替换算法和读写策略。

57.在“cache-主存”层次中,写回法cache一般用按写分配法更新主存,写直达法cache

一般采用不按写分配法更新主存。

58.随机法中随机的选择被替换的块,先进先出中选择最早调入的块最为被替换的块,

最近最少使用法中选择近期最少被访问的块最为被替换的块。

59.按照产生不命中的原因的不同,可以把不命中分为强制性不命中、容量不命中、和

冲突不命中。

60.相联度越高,冲突不命中就越少;强制性不命中不受cache容量的影响;但容量

不命中却随着容量的增加而减少;强制性不命中和容量不命中不受相联度的影响。

61.对于给定的cache容量,当块大小增加时,不命中率开始是下降,后来反而上升。

Cache容量越大,使不命中率达到最低的块大小就越大。

62.增加块大小的方法在降低不命中率的同时会增加不命中开销,而提高相联读会增加

命中时间。

63.伪相联既能获得多路组相联cache的低不命中率,又能保持直接映像cache的命中

速度。

64.操作系统和用户程序对于同一个物理地址可能采用两种以上不同形式的虚拟地址来访

问,这些地址称为同义或别名。

65.在相同的器件条件下,如果要提高主存的贷款,可以采用单体多字存储器和多体交

叉存储器两种并行的存储器结构。

66.虚拟存储器采用全相联映像规则,替换算法采用最近最近少被访问LRU 算法,写策

略采用写回策略。

计算机体系结构简答题

1.计算机系统机构、计算机组成、计算机实现三者区别

计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。

计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。

计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。

计算机组成是计算机系统结构的逻辑实现。计算机实现是计算机组成的物理实现。一种体系结构可以有多种组成。一种组成可以有多种实现。

2.计算机系统结构的Flynn分类法是按什么来分类的?共分为哪几类?

答:Flynn分类法是按照指令流和数据流的多倍性进行分类。把计算机系统的结构分为:

(1)单指令流单数据流SISD

(2)单指令流多数据流SIMD

(3)多指令流单数据流MISD

(4)多指令流多数据流MIMD

3.冯诺依曼体系结构包括:

运算器、控制器、存储器、输入输出设备

4.简述CISC指令集结构功能设计的主要目标。从当前的计算机技术观点来看,CISC指令集结

构的计算机有什么缺点?

答:主要目标是增强指令功能,把越来越多的功能交由硬件来实现,并且指令的数量也是越来越多。

缺点:(1) CISC结构的指令集中,各种指令的使用频率相差悬殊。(2)CISC结构指令的复杂性带来了计算机体系结构的复杂性,这不仅增加了研制时间和成本,而且还容易造成设计错误。(3)CISC结构指令集的复杂性给VLSI设计增加了很大负担,不利于单片集成。(4)CISC结构的指令集中,许多复杂指令需要很复杂的操作,因而运行速度慢。(5) 在CISC 结构的指令集中,由于各条指令的功能不均衡性,不利于采用先进的计算机体系结构技术(如流水技术)来提高系统的性能。

5.简述RISC指令集结构的设计原则。

答(1)选取使用频率最高的指令,并补充一些最有用的指令;

(2)每条指令的功能应尽可能简单,并在一个机器周期内完成;

(3)所有指令长度均相同;

(4)只有Load和Store操作指令才访问存储器,其它指令操作均在寄存器之间进行;

(5) 以简单有效的方式支持高级语言

6.通常有哪几种指令格式,请简述其适用范围。

答:(1)变长编码格式。如果系统结构设计者感兴趣的是程序的目标代码大小,而不是性能,就可以采用变长编码格式。

(2)固定长度编码格式。如果感兴趣的是性能,而不是程序的目标代码大小,则可以选择固定长度编码格式。

(3)混合型编码格式。需要兼顾降低目标代码长度和降低译码复杂度时,可以采用混合型编码格式。

7. 解决流水线瓶颈问题有哪两种常用方法?

答:细分瓶颈段与重复设置瓶颈段

8.一条经典的五段流水线:

(1)取指令周期(IF)

(2)指令译码/读寄存器周期(ID)

(3)执行/有效地址计算周期(EX)

(4)存储器访问/分支完成周期(MEM)

(5)协会周期(WB)

9. 简述Tomasulo算法的基本思想。

答:核心思想是:①记录和检测指令相关,操作数一旦就绪就立即执行,把发生RAW冲突的可能性减小到最少;②通过寄存器换名来消除WAR冲突和WAW冲突。寄存器换

名是通过保留站来实现,它保存等待流出和正在流出指令所需要的操作数。

基本思想:只要操作数有效,就将其取到保留站,避免指令流出时才到寄存器中取数据,这就使得即将执行的指令从相应的保留站中取得操作数,而不是从寄存器中。指令的执行果也是直接送到等待数据的其它保留站中去。因而,对于连续的寄存器写,只有最后一个才真正更新寄存器中的内容。一条指令流出时,存放操作数的寄存器名被换成为对应于该寄存器保留站的名称(编号)

10向量处理机的结构:

存储器-存储器型和寄存器-寄存器型

11.cray-1的功能部件有:

整数加(3拍)、浮点加(6拍)、浮点乘(7拍)、浮点迭代求倒数(14拍)、逻辑运算(2

拍)、移位(4拍)

12.采用链接技术时,向量指令能够链接执行必须满足哪些条件?

既没有功能部件冲突,也没有寄存器冲突,具有先写后读,可以并行执行。

13.存储系统的性能参数:

每位价格、速度、存储容量。

14.

15.

16.

17.映像规则:

计算机体系结构大题

1. 某台主频为400MHz的计算机执行标准测试程序,程序中指令类型、执行数量和平均时钟周期数如下:

求该计算机的有效CPI、MIPS和程序执行时间。

解:(1)CPI =(45000×1+75000×2+8000×4+1500×2) / 129500=1.776 (2)MIPS速率=f/ CPI =400/1.776 =225.225MIPS

(3)程序执行时间= (45000×1+75000×2+8000×4+1500×2)/400=575s

假设4个程序都执行100M条指令,这3台计算机中每台计算机上每个程序的MIPS速率。

Hm=4/(1/100+1/0.1+1/0.2+1)=0.25

Gm=41*

100=1.19

*

2.0

*1.0

B几何平均值Am=(10+1+0.1+0.125)/4=2.81

Hm=4/(1/10+1+1/0.1+1/0.125)=0.2

Gm=4125

*1*

10=0.59

*1.0

.0

C的几何平均值Am=(5+5+2+1)/4=3.25

Hm=4/(1/5+1/5+1/2+1)=2.1

Gm=41*

*

5=2.66

5

*

2

3.将计算机系统中某一功能的处理速度加快20倍,但该功能的处理时间仅为整个系统运行时间的40%,则采用此增强功能方法后,能使整个系统的性能提高多少?

解由题可知:可改进比例 = 40% = 0.4 部件加速比 = 20 根据Amdahl定律可知: s=1/((1-0.4)+(0.4/20))=1.613

4.书上38页例2.1

5.简述RISC指令集结构的设计原则。

答(1)选取使用频率最高的指令,并补充一些最有用的指令;

(2)每条指令的功能应尽可能简单,并在一个机器周期内完成;

(3)所有指令长度均相同;

(4)只有Load和Store操作指令才访问存储器,其它指令操作均在寄存器之间进行;

(5) 以简单有效的方式支持高级语言

6.通常有哪几种指令格式,请简述其适用范围。

答:(1)变长编码格式。如果系统结构设计者感兴趣的是程序的目标代码大小,而不是性能,就可以采用变长编码格式。

(2)固定长度编码格式。如果感兴趣的是性能,而不是程序的目标代码大小,则可以选择固定长度编码格式。

(3)混合型编码格式。需要兼顾降低目标代码长度和降低译码复杂度时,可以采用混合型编码格式。

这3种编码的平均码长

8.书上62页 例题3.1

9. 书上63页 例题3.2

10. 有一条静态多功能流水线由5段组成,加法用1、3、4、5段,乘法用1、2、5段,第2段的时间为2△t ,其余各段的时间均为△t ,而且流水线的输出可以直接返回输入端或暂存于相应的流水寄存器中。现要在该流水线上计算 的吞吐率、加速比和效率,画出其时空图,并计

算其吞吐率、加速比和效率。

=?=

6

1i i i B A F

11.

12.

计算机体系结构论文

计算机体系结构论文 论文题目:计算机系统结构中多处理机技术姓名:XXX 班级:XXX 学号:XXXX

摘要:多处理机是指能同时执行多个进程的计算机系统.多处理机通过共享的主存或输入/输出子系统或高速通信网络进行通信。利用多台处理机进行多任务处理,协同求解一个大而复杂的问题来提高速度,或者依靠冗余的处理机及其重组能力来提高系统的可靠性、适应性和可用行。该文介绍了微处理器的发展、多处理机的总线以及处理机系统中通信和存储技术的发展和两种特殊的多处理机系统结构,以及现今几种典型的并行计算机体系结构及处理机分配与调度策略。而本篇论文主要根据所阅读的文章进行扩展延伸,主要介绍了多处理机技术,它的总线以及分配调度方面。 关键字:多处理机;体系结构;总线;调度 引言: 微电子技术和封装技术的进步,使得高性能的VLSI微处理器得以大批量生产,性能价格比不断合理,这为并行多处理机的发展奠定了重要的物质基础。计算机系统性能增长的根本因素有两个:一个是微电子技术,另一个是计算机体系结构技术。五十年代以来,人们先后采用了先行控制技术、流水线技术、增加功能部件甚至多机技术、存储寻址和管理能力的扩充、功能分布的强化、各种互联网络的拓扑结构以及支持多道、多任务的软件技术等_系列并行处理技术,提高计算机处理速度,增强系统性能。多处理机体系结构是计算机体系结构发展中的一个重要内容,已成为并行计算机发展中人们最关注的结构。 多处理机的介绍: 多处理机是指能同时执行多个进程的计算机系统。 由于超大规模集成电路(VLSI)技术迅速发展的结果,多处理技术能够充分地发挥高性能的32位微处理机的有效性,用大量低价格的部件配置高性能的计算机结构系统.以典型的

计算机系统结构三四章作业及答案

3.1 简述流水线技术的特点。(1) 流水线把一个处理过程分解为若干个子过程,每个子过程由一个专门的功能部件来实现。因此,流水线实际上是把一个大的处理功能部件分解为多个独立的功能部件,并依靠它们的并行工作来提高吞吐率。(2) 流水线中各段的时间应尽可能相等,否则将引起流水线堵塞和断流。(3) 流水线每一个功能部件的前面都要有一个缓冲寄存器,称为流水寄存器。(4) 流水技术适合于大量重复的时序过程,只有在输入端不断地提供任务,才能充分发挥流水线的效率。(5) 流水线需要有通过时间和排空时间。在这两个时间段中,流水线都不是满负荷工作。 3.2 解决流水线瓶颈问题有哪两种常用方法?答:细分瓶颈段与重复设置瓶颈段 3.3 有一条指令流水线如下所示: (1 用两给出条指 (1) (24? 变八级流水线(细分) ? 重复设置部件 )(ns 85 1 T n TP 1pipeline -== 3.4 有一个流水线由4段组成,其中每当流过第三段时,总要在该段循环一次,然后才能流到第4段。如果每段经过一次所需的时间都是△t ,问: (1)当在流水线的输入端连续地每△t 时间输入一个任务时,该流水线会发生什么情况? (2)此流水线的最大吞吐率为多少?如果每2△t 输入一个任务,连续处理10个任务时,其实际吞吐率和效率是多少? (3)当每段时间不变时,如何提高流水线的吞吐率?人连续处理10个任务时,其吞吐率提高多少? 解:(1)会发生流水线阻塞情况。

(2) (3)重复设置部件 吞吐率提高倍数= t t ??2310 75 =1.64 3.5 有一条动态多功能流水线由5段组成,加法用1、3、4、5段,乘法用1、2、5段,第2段的时间为2△t ,其余各段的时间均为△t ,而且流水线的输出可以直接返回输入端或暂存于相应的流水线寄存器中。现在该流水线上计算 ∏=+4 1 )(i i i B A ,画出时空图,并计算其吞吐率、加速比和效率。 +B 4;再计算由图可见,它在18个△t 时间中,给出了7个结果。所以吞吐率为: 如果不用流水线,由于一次求积需3△t ,一次求和需5△t ,则产生上述7个结果共需(4×5+3×3)△t =29△t 。所以加速比为: 该流水线的效率可由阴影区的面积和5个段总时空区的面积的比值求得: 3.6 在一个5段流水线处理机上,各段执行时间均为△t,需经9△t 才能完成一个任务,其预约表如下所示。 段23 时间 入 A 1 B 1 A 2 B 2 A 3 B 3 A 4 B 4 A B C D A × B C ×D

计算机体系结构期末复习

计算机体系结构期末复习资料 1.并行性:是指在同一时刻或者是同一时间间隔内完成两种或两种以上性质相同或不同的工作。 2.CPI:每条指令执行时所花费的平均时钟周期。 3.体系结构:即计算机的属性,即概念性结构与功能特性。 4.Amdahl定理:加快某部件执行速度所获得的系统性能加速比,受限于该部件在系统中所占的重要性。 5.信息存储的整数边界:信息在主存中存放的起始地址必须是该信息(字节数)的整数倍。 6.指令系统的正交性:指在指令中各个不同含义的字段,在编码时应互不相关,相互独立。 7.流水线技术:是指将一个重复的时序过程,分解成为若干子过程,而每个过程都可有效在其专用功能段上与其他子过程同时执行。 8.定向技术:在某条指令产生一个结果之前,其他指令并不直接需要该计算结果,如果能将该计算结果从其他产生的地方直接送到其他指令需要它的地方,那么就可以避免暂停的技术就叫定向技术。 9.相关:衡量两个随机变量之间相关程度的指标。 10.向量流水处理机:是指处理机具有向量数据表示并通过向量指令对向量的各元素进行处理。、

11.定向:将计算结果从其产生的地方直接送到其他指令需要它的地方,或所有需要它的功能单元,避免暂停。 12.指令集的并行:当指令之间不存在相关时,它们在流水线中是可以重叠起来并行执行。 13.记分牌技术:流出和读操作数。在没有结构冲突时,尽可能早地执行没有数据冲突的指令,实现每个时钟周期执行一条指令。如果某条指令被暂停,而后面的指令与流水线中正在执行或被暂停的指令都不相关,是这些指令可以跨越它,继续流出和执行下去。 14.Tomasulo算法:寄存器换名是通过保留站和流出逻辑来共同完成,当指令流出时,如果其操作数还没有计算出来,则该指令中相应的寄存器换名将产生这个操作数的保留站的标识。因此,指令流出到保留站后,其操作数寄存器或者换成了数据本身,或换成了保留站的标识,和寄存器无关。后面指令对该寄存器的写入操作就不会产生WAR冲突。 15.替换算法:由于主存中的块比Cache中的块多,所以当要从主存中调一个块到Cache中时,会出现该块所映象到的一组(或一个)Cache块已全部被占用的情况。这时,需要被迫腾出其中的某一块,以接纳新调入的块。

计算机体系结构复习计算题

1. 将计算机系统中某一功能的处理速度加快10倍,但该功能的处理时间仅为整个系统运行时间的40%,则采用此增强功能方法后,能使整个系统的性能提高多少 根据Amdahl 定律可知: 系统加速比 = = = 由题可知: 可改进比例 = 40% = 部件加速比 = 10 系统加速比 = 采用此增强功能方法后,能使整个系统的性能提高倍。 2. 假设一台计算机的I/O 处理占10%,当其CPU 性能改进到原来的10倍时,而I/O 性能仅改进为原来的两倍时,系统总体性能会有什么改进 加速比=1/(10%/2+90%/10)= 本题反映了Amdahl 定律,要改进一个系统的性能要对各方面性能都进行改进,不然系统中最慢的地方就成为新系统的瓶颈。 3. 双输入端的加、乘双功能静态流水线有1、2、3、4四个子部件,延时分别为Δt, Δt, 2Δt, Δt ,“加”由1→2→4组成,“乘”由1 →3→4组成,输出可直接返回输入或锁存。现执行 ∑=*+4 1 ])[(i i i i c b a (1) 画出流水时空图,标出流水线输入端数据变化情况。 (2) 求运算全部完成所需的时间和流水线效率。 (3) 找出瓶颈子过程并将其细分,重新画出时空图并计算流水时间和效率。 (1) (2)由上图可知,全部运算完的时间是23Δt 。 92 37 23437=???= t t η (3) 部件 ① ② ③ ④ ⑤ ⑥ 结果 输入 a 1 a 2 a 3 a 4 a 1+b 1 a 2+b 2 a 3+b 3 a 4+b 4 ① ③ ⑤ b 1 b 2 b 3 b 4 c 1 c 2 c 3 c 4 ② ④ ⑥ Δt 4 3 2 1

计算机系统结构网上作业

计算机系统结构作业参考答案 一、 1、试述现代计算机系统的多级层次结构。 计算机系统具有层次性,它由多级层次结构组成。从功能上计算机系统可分为五个层次级别:第一级是设计级。这是一个硬件级,它由机器硬件直接执行。 第二级是一般机器级,也称为机器语言级。它由微程序解释系统.这一级是硬件级。 第三级是操作系统级,它由操作系统程序实现。这些操作系统由机器指令和广义指令组成,这些广义指令是操作系统定义和解释的软件指令。这一级也称混合级。 第四级是汇编语言级。它给程序人员提供一种符号形式的语言,以减少程序编写的复杂性。这一级由汇编程序支持执行。 第五级是高级语言级。这是面向用户为编写应用程序而设置的。这一级由各种高级语言支持。 2、试述RISC设计的基本原则和采用的技术。 答:一般原则: (1)确定指令系统时,只选择使用频度很高的指令及少量有效支持操作系统,高级语言及其它功能 的指令,大大减少指令条数,一般使之不超过100条; (2)减少寻址方式种类,一般不超过两种; (3)让所有指令在一个机器周期内完成; (4)扩大通用寄存器个数,一般不少于32个,尽量减少访存次数; (5)大多数指令用硬联实现,少数用微程序实现; (6)优化编译程序,简单有效地支持高级语言实现。

基本技术: (1)按RISC一般原则设计,即确定指令系统时,选最常用基本指令,附以少数对操作系统等支持最有用的指令,使指令精简。编码规整,寻址方式种类减少到1、2种。 (2)逻辑实现用硬联和微程序相结合。即大多数简单指令用硬联方式实现,功能复杂的指令用微程序实现。 (3)用重叠寄存器窗口。即:为了减少访存,减化寻址方式和指令格式,简有效地支持高级语言中的过程调用,在RISC机器中设有大量寄存嚣,井让各过程的寄存器窗口部分重叠。 (4)用流水和延迟转移实现指令,即可让本条指令执行与下条指令预取在时间上重叠。另外,将转移指令与其前面的一条指令对换位置,让成功转移总是在紧跟的指令执行之后发生,使预取指令不作废,节省一个机器周期。 (5)优化设计编译系统。即尽力优化寄存器分配,减少访存次数。不仅要利用常规手段优化编译,还可调整指令执行顺序,以尽量减少机器周期等。 3、试述全相联映像与直接映像的含义及区别 (1)全相连映像 主存中任何一个块均可以映像装入到Cache中的任何一个块的位置上。主存地址分为块号和块内地址两部分,Cache地址也分为块号和块内地址。Cache的块内地址部分直接取自主存地址的块内地址段。主存块号和Cache块号不相同,Cache块号根据主存块号从块表中查找。Cache保存的各数据块互不相关,Cache必须对每个块和块自身的地址加以存储。当请求数据时,Cache控制器要把请求地址同所有的地址加以比较,进行确认。 (2)直接映像 把主存分成若干区,每区与Cache大小相同。区内分块,主存每个区中块的大小和Cache 中块的大小相等,主存中每个区包含的块的个数与Cache中块的个数相等。任意一个主存块只能映像到Cache中唯一指定的块中,即相同块号的位置。主存地址分为三部分:区号、块号和块内地址,Cache地址分为:块号和块内地址。直接映像方式下,数据块只能映像到Cache中唯一指定的位置,故不存在替换算法的问题。它不同于全相连Cache,地址仅需比较一次。 (3)区别: 全相连映像比较灵活,块冲突率低,只有在Cache中的块全部装满后才会出现冲突,Cache 利用率高。但地址变换机构复杂,地址变换速度慢,成本高。 直接映像的地址变换简单、速度快,可直接由主存地址提取出Cache地址。但不灵活,块冲突率较高,Cache空间得不到充分利用。 4. 画出冯?诺依曼机的结构组成?

系统结构期末考试试题及答案

得分 评分人 填空题: (20分,每题2 分) 单选题:(10分,每题1分) A.任何虚页都可装入主存中任何实页的位置 B. 一个虚页只装进固定的主存实页位置 《计算机系统结构》期末考试试卷(A ) 得分 注:1、共100分,考试时间120分钟。 2、此试卷适用于计算机科学与技术本科专业。 1、."启动I/O"指令是主要的输入输出指令,是属于( A. 目态指令 B.管态指令 C.目态、管态都能用的指令 D.编译程序只能用的指令 2、 输入输出系统硬件的功能对 (B )是透明的 A.操作系统程序员 B.应用程序员 C.系统结构设计人员 D.机器语言程序设计员 3、 全相联地址映象是指(A ) C. 组之间固定,组内任何虚页可装入任何实页位置 D.组间可任意装入,组内是固定装入 4、( C ) 属于MIMD 系统结构 A.各处理单元同时受一个控制单元的管理 B.各处理单元同时受同个控制单元送来的指令 C.松耦合多处理机和多计算机系统 D. 阵列处理机 5、多处理机上两个程序段之间若有先写后读的数据相关,则( B ) A.可以并行执行 B.不可能并行 C.任何情况均可交换串行 D.必须并行执行 6、 计算机使用的语言是(B ) A.专属软件范畴,与计算机体系结构无关 B.分属于计算机系统各个层次 C.属于用以建立一个用户的应用环境 D. 属于符号化的机器指令 7、 指令执行结果出现异常引起的中断是( C ) A.输入/输出中断 B.机器校验中断 C.程序性中断 D.外部中断 &块冲突概率最高的 Cache 地址映象方式是(A ) A.直接 B .组相联 C .段相联 D .全相联 9、 组相联映象、LRU 替换的Cache 存储器,不影响 Cache 命中率的是(B ) A.增大块的大小 B .增大主存容量 C .增大组的大小 D .增加Cache 中的块数 10、 流水处理机对全局性相关的处理不 包括(C ) A.猜测法 B.提前形成条件码 C.加快短循环程序的执行 D.设置相关专用通路

计算机系统结构复习题

1 【简答题】 传统的存储程序计算机的主要特征是什么?存在的主要问题是什么?目前计算机系统是如何改进的? 正确答案: 解: 主要特征: (1)机器以运算器为中心; (2)采用存储程序原理; (3)存储器是按地址访问的、线性编址的空间; (4)控制流由指令流产生; (5)指令由操作码和地址码组成; (6)数据以二进制编码表示,采用二进制运算。 主要问题和改进: (1)问题:以运算器为中心,所有部件的操作都由控制器集中控制,导致慢速输入输出操作占用快速运算器矛盾,影响运算器效率发挥。 改进:各种分布式的I/O处理或输入输出方式如程序控制、DMA(直接存储器访问)方式、 I/O处理机等。 (2)问题:数据和指令存放在同一存储器中,自我修改程序是难以编制、调试和使用的,不利于指令执行的重叠和流水。 改进:通过存储管理硬件的支持,由操作系统控制在程序执行过程中不准修改程序。 (3)问题:访问存储器次数较多影响计算机系统性能。 改进:按内容访问的相联存储器CAM,大量使用通用寄存器,在CPU和主存之间设置高速缓冲存储器cache。 (4)问题:受程序计数器控制,程序执行只能串行、顺序执行。 改进:改进CPU的组成,如采用重叠方式、先行控制、多操作部件甚至流水方式把若干条指令的操作重叠起来;采用向量处理技术、多机并行处理,总之通过并行处理技术进一步提升计算机系统速度。 (5)问题:需要指令功能更加丰富,但实现困难;计算机存储器容量大增,采用直接寻址方式指令中地址码位数不够。 改进:出现了CISC和RISC指令系统,CISC用硬件实现大量丰富功能,RISC只包含使用频率高的少量指令;采用多种灵活的寻址方式,如间接寻址、相对寻址、变址寻址、基址寻址、页式寻址等。 2 【简答题】 通用寄存器型指令系统结构在灵活性和提高性能方面的优势主要体现在哪几个方面? 正确答案: (1)寄存器的访问速度比存储器快很多;

计算机系统结构论文

计算机系统结构论文 计算机系统结构中多处理机技术 摘要:多处理机通过共享的主存或输入/输出子系统或高速通信网络进行通信。利用多台处理机进行多任务处理,协同求解一个大而复杂的问题来提高速度,或者依靠冗余的处理机及其重组能力来提高系统的可靠性、适应性和可用行。该文介绍了微处理器的发展、多处理机的总线以及处理机系统中通信和存储技术的发展和两种特殊的多处理机系统结构。 关键词:多处理机;体系结构;总线 微电子技术和封装技术的进步,使得高性能的VLSI 微处理器得以大批量生产,性能价格比不断合理,这为并行多处理机的发展奠定了重要的物质基础。 计算机系统性能增长的根本因素有两个:一是微电子技术,另一个是计算机体系结构技术。五十年代以来,人们先后采用了先行控制技术、流水线技术、增加功能部件甚至多机技术、存储寻址和管理能力的扩充、功能分布的强化、各种互联网络的拓扑结构以及支持多道、多任务的软件技术等一系列并行处理技术,提高计算机处理速度,增强系统性能。多处理机体系结构是计算机体系结构发展中的一个重要内容,已成为并行计算机发展中人们最关注的结构。

1 微处理器的发展 20 世纪80 年代中期,RISC 精简指令集计算机,用20%指令的组合实现了CISC 计算机指令系统不常用的80%指令的功能。在提高性能方面,RISC 采用了超级流水线、超级标量、超长指令字并行处理结构;多级指令Cache;编译优化等技术,充分利用RISC 的内部资源,发挥其内部操作的并行性,从而提高流水线的执行效率。20 世纪80 年代后期,RISC 处理机的性能指标几乎以每年翻一番的速度发展,它对于提高计算机系统的性能和应用水平起着巨大的作用。 目前,由Intel 和HP 两家公司联合开发的基于IA—64 架构的Merced 芯片,并由其共同定义的显式并行指令计算技术EPIC(Explicitly Parallel Instruction Computing ),将为微处理器技术的发展带来突破性进展。EPIC 技术主要指编译器在微处理器执行指令之前就对整个程序的代码作出优化安排,编译器分析指令间的依赖关系,将没有依赖关系的指令(最多3 个)组成一“组”,由Merced内置的执行单元读入被分成组的指令群并执行。从理论上讲,EPIC 可以并行执行3 倍于执行单元数的指令。64 位体系结构的Merced 芯片还采用了指令预测、数据预装等技术,可以显著地减少实际执行程序的长度,同时增强语句执行的并行性,经过代码的重组,程序的执行时间比基于传统体系结构

高级计算机体系结构作业汇总(非标准答案)

1.Explain the Concepts Computer Architecture 系统结构 由程序设计者所看到的一个计算机系统的属性。即计算机系统的软硬件界面。 Advanced CA 高级系统结构 新型计算机系统结构。基于串行计算机结构,研究多指令多数据计算机系统,具有并发、可扩展和可编程性。为非冯式系统结构。 Amdahl law Amdahl定律 系统中某部件由于采用某种方式时系统性能改进后,整个系统性能的提高与该方式的使用频率或占的执行时间的比例有关。 SCALAR PROCESSING 标量处理机 在同一时间内只处理一条数据。 LOOK-AHEAD 先行技术 通过缓冲技术和预处理技术,解决存储器冲突,使运算器能够专心与数据的运算,从而大幅提高程序的执行速度。 PVP 向量型并行计算处理机 以流水线结构为主的并行处理器。 SMP 对称多处理机系统 任意处理器可直接访问任意内存地址,使用共享存储器,访问延迟、带宽、机率都是等价的。MPP 大规模并行计算机系统 物理和逻辑上均是分布内存,能扩展至成百上千处理器,采用专门设计和定制的高通信带宽和低延迟的互联网络。 DSM 分布式共享存储系统 内存模块物理上局部于各个处理器内部,但逻辑上是共享存储的。 COW 机群系统 每个节点都是一个完整的计算机,各个节点通过高性能网络相互连接,网络接口和I/O总线松耦合连接,每个节点有完整的操作系统。 GCE 网格计算环境 利用互联网上的计算机的处理器闲置处理能力来解决大型计算问题的一种科学计算。 CISC 复杂指令集计算机

通过设置一些复杂的指令,把一些原来由软件实现的常用功能改用硬件实现的指令系统实现,以此来提高计算机的执行速度。 RISC 精简指令集计算机 尽量简化计算机指令功能,只保留那些功能简单,能在一个节拍内执行完的指令,而把复杂指令用段子程序来实现。 VMM 虚拟机监视器 作为软硬件的中间层,在应用和操作系统所见的执行环境之间。 SUPERCOMPUTER 超级计算机 数百数千甚至更多的处理器组成的能计算普通计算机不能完成的大型复杂问题的计算机。SVM 共享虚拟存储器 存储器虚拟化为一个共享的存储器,并提供单一的地址空间。 MAINFRAME 大型计算机 作为大型商业服务器,一般用于大型事务处理系统,特别是过去完成的且不值得重新编写的数据库应用系统方面。 COMPUTER SYSTEM ON CHIP 片上计算机系统 在单个芯片上集成的一个完整系统。 PARALLEL ARCHITECTURE INTO SINGLE CHIP 单片并行结构 在单个芯片上采用的并行体系结构 MOORE law Moore定律 当价格不变时,集成电路上可容纳的晶体管数目,约每隔18个月便会增加一倍,性能也将提升一倍。 UMA 一致存储访问 采用集中式存储的模式,提供均匀的存储访问。 NUMA 非一致存储访问 内存模块局部在各个结点内部,所有局部内存模块构成并行机的全局内存模块。 COMA 全高速缓存存储访问 采用分布式存储模式,通过高速缓存提供快速存储访问。 CC-NUMA 全高速缓存非一致性均匀访问 存在专用硬件设备保证在任意时刻,各结点Cache中数据与全局内存数据的一致性。NORMA 非远程存储访问

计算机系统结构期末考试题目

第一章: 1.计算机系统结构的定义 答:由程序设计者看到的一个计算机系统的属性,即概念性结构和功能特性。 2.透明性概念 答:在计算机技术中,一种本来是存在的事物或属性,但从某种角度看似乎不存在,称为透明性现象。 3.兼容性向后兼容 兼容性:同一个软件可以不加修改地运行于系统结构相同的各档机器,可获得相同的结果,差别只在于不同的运行时间。 向后兼容:按某个时期投入市场的某种型号机器编制的程序,不加修改就能运行于在它之后投入市场的机器。 4.Amdahl定律 答:系统中某一部件由于采用某种更快的执行方式后整个系统性能的提高与这种执行方式的使用频率或占总执行时间的比例有关。 5.CPI 答:每条指令的平均时钟周期数。 6.MIPS 答:每秒百万条指令数!MIPS=时钟频率/(CPI*10^6) 7.MFLOPS 答:每秒百万次浮点操作次数。MFLOPS=程序中的浮点操作次数/(执行时间*10^6) 8.命中率的概念 答: 9.Flynn分类法是按指令流和数据流的多倍性特征进行计算机系统结构的划分 答:①单指令流单数据流SISD ②单指令流多数据流SIMD ③多指令流单数据流MISD(实际不存在)④多指令流多数据流MIMD 10.计算机系统设计的定量原理(四个) 答:①加快经常性事件的速度②Amdahl定律③CPU性能公式④访问的局部性原理11.CPI和加速比的计算 答:CPI=CPU时钟周期数/IC CPU时间=CPU时钟周期数/频率 CPU时间=CPU时钟周期*时钟周期长 加速比=(采用改进措施后的性能)/(没有采用改进措施前的性能) =(没有采用改进措施前执行某任务的时间)/(采用改进措施后执行某任务的时间) 12.软硬件实现的特点 硬件实现:速度快、成本高;灵活性差、占用内存少 软件实现:速度低、复制费用低;灵活性好、占用内存多 13.系统评价的标准 ①运算速度②存储器系统③其他性能④成本标准

计算机系统结构总复习题

一、单项选择题 1、直接执行微指令的是( ) A.汇编程序B.编译程序 C.硬件D.微指令程序 2、对系统程序员不透明的应当是( )。 A.Cache存贮器B.系列机各档不同的数据通路宽度C.指令缓冲寄存器D.虚拟存贮器 3、对机器语言程序员透明的是( )。 A.中断字B.主存地址寄存器 C.通用寄存器D.条件码 4、计算机系统结构不包括( )。 A.主存速度B.机器工作状态 C.信息保护D.数据 5、从计算机系统结构上讲,机器语言程序员所看到的机器属性是( )。A.计算机软件所要完成的功能B.计算机硬件的全部组成 C.编程要用到的硬件组织D.计算机各部件的硬件实现 6、计算机组成设计不考虑( )。 A.专用部件设置B.功能部件的集成度 C.控制机构的组成D.缓冲技术 7、以下说法中,不正确的是( )。 软硬件功能是等效的,提高硬件功能的比例会: A.提高解题速度B.提高硬件利用率 C.提高硬件成本D.减少所需要的存贮器用量 8、在系统结构设计中,提高软件功能实现的比例会( )。 A.提高解题速度B.减少需要的存贮容量 C.提高系统的灵活性D.提高系统的性能价格比 9、下列说法中不正确的是( )。 A.软件设计费用比软件重复生产费用高 B.硬件功能只需实现一次,而软件功能可能要多次重复实现 C.硬件的生产费用比软件的生产费用高 D.硬件的设计费用比软件的设计费用低 10、在计算机系统设计中,比较好的方法是( )。 A.从上向下设计B.从下向上设计 C.从两头向中间设计D.从中间开始向上、向下设计11、"从中间开始"设计的"中间"目前多数是在( )。 A.传统机器语言级与操作系统机器级之间 B.传统机器语言级与微程序机器级之间 C.微程序机器级与汇编语言机器级之间 D.操作系统机器级与汇编语言机器级之间 12、系列机软件应做到( )。 A.向前兼容,并向上兼容 B.向后兼容,力争向上兼容

计算机体系结构习题答案解析

第1章计算机系统结构的基本概念 1.1 解释下列术语 层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。 虚拟机:用软件实现的机器。 翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。 解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。 计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。 透明性:在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。 计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。 计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。 系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。 Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。 程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。包括时间局部性和空间局部性。 CPI:每条指令执行的平均时钟周期数。 测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。 存储程序计算机:冯·诺依曼结构计算机。其基本点是指令驱动。程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。 系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。 软件兼容:一个软件可以不经修改或者只需少量修改就可以由一台计算机移植到另一台计算机上运行。差别只是执行时间的不同。 向上(下)兼容:按某档计算机编制的程序,不加修改就能运行于比它高(低)档的计算机。 向后(前)兼容:按某个时期投入市场的某种型号计算机编制的程序,不加修改地就能

2020.4《计算机体系结构》期末试卷A含答案

《计算机体系结构》期末考试A卷 (总分:100分,时间:100分钟) 姓名:周元华 专业:计算机科学与技术 学号: 18260070164016 学习中心:上海弘成 一、填空题(每空1分,共14分) 1.高速缓冲存储器的地址映象方式有三种,它们分别是:全向量方式,直接相联方式,组相连方式。 2.虚拟存储器的三种管理方式是段式管理,页式管理和 段页式管理。 3.从主存的角度来看,“Cache—主存”层次的目的是为了提高速度,而“主存—辅存”层次的目的是为了扩大容量 4.根据指令间的对同一寄存器读和写操作的先后次序关系,数据相关冲突可分为读与写(RAM)、写与读(WAR)和写与写(WAW)三种类型。 5.当代计算机体系结构的概念包括指令集结构、计算机组成和计算机实现三个方面的内容 二、名词解释(每题2分,共16分) 计算机体系结构: 计算机体系结构是指根据属性和功能不同而划分的计算机理论组成部分及计算机基本工作原理、理论的总称。其中计算机理论组成部分并不单与某一个实际硬件相挂钩,如存储部分就包括寄存器、内存、硬盘等。 兼容机: 兼容机,就是由不同公司厂家生产的具有相同系统结构的计算机。简单点说,就是非厂家原装,而改由个体装配而成的机器,其中的元件可以是同一厂家出品,但更多的是整合各家之长的 计算机。 写直达法: 写直达法一般指全写法。全写法(write-through):又称写直达法、写穿法,透写法,Cache使 用方式之一。 高速缓冲存储器: 高速缓冲存储器(Cache)其原始意义是指存取速度比一般随机存取记忆体(RAM)来得快 的一种RAM,一般而言它不像系统主记忆体那样使用DRAM技术,而使用昂贵但较快速的SRAM 技术,也有快取记忆体的名称。 高速缓冲存储器是存在于主存与CPU之间的一级存储器,由静态存储芯片(SRAM)组成, 容量比较小但速度比主存高得多,接近于CPU的速度。在计算机存储系统的层次结构中,是介 于中央处理器和主存储器之间的高速小容量存储器。它和主存储器一起构成一级的存储器。高速 缓冲存储器和主存储器之间信息的调度和传送是由硬件自动进行的。 高速缓冲存储器最重要的技术指标是它的命中率。 延迟转移技术: 在转移指令之后插入一条或几条有效的指令。当程序执行时,要等这些插入的指令执行完成 之后,才执行转移指令,因此,转移指令好像被延迟执行了,这种技术称为延迟转移技术。 线性流水线: 线性流水线就是由一整套工艺串联而成的生产线。 流水线又称为装配线,一种工业上的生产方式,指每一个生产单位只专注处理某一个片段的工 作,以提高工作效率及产量;按照流水线的输送方式大体可以分为:皮带流水装配线、板链线、 倍速链、插件线、网带线、悬挂线及滚筒流水线这七类流水线。 输送线的传输方式有同步传输的/(强制式),也可以是非同步传输/(柔性式),根据配置的 选择,可以实现装配和输送的要求。输送线在企业的批量生产中不可或缺。 流水线的吞吐率: 流水线的吞吐率是单位时间内流水线处理的任务数。 并行性: 并行性是指计算机系统具有可以同时进行运算或操作的特性,在同一时间完成两种或两种以 上工作。它包括同时性与并发性两种含义。同时性指两个或两个以上事件在同一时刻发生。并发 性指两个或两个以上事件在同一时间间隔发生。 三、简答题(每题5分,共30分) 1.如有一个经解释实现的计算机,可以按功能划分成4级。每一 级为了执行一条指令需要下一级的N条指令解释。若执行第一 级的一条指令需K(ns)时间,那么执行第2、3、4级的一条指 令各需要用多少时间(ns)? 答:第1级:1条1级指令 K ns 第2级:1条2级指令N条1级指令 1*N*K ns = NK ns 第3级:1条3级指令N条2级指令 1*N*NK ns =N2K ns 第4级:1条4级指令N条3级指令 1*N*NNK ns =N3K ns 2.根据Amdahl定律,系统加速比由哪两个因素决定? 答:系统加速比依赖于两个因素: (1)可改进比例:可改进部分在原系统计算时间中所占的比例 (2)部件加速比:可改进部分改进以后的性能提高 3.简述组相联映象规则。 答:(1)主存与缓存分成相同大小的数据块。(2)主存和Cache 按同样大小划分成组。(3)主存容量 是缓存容量的整数倍,将主存空间按缓冲区的大小分成区,主存中每一区的组数与缓存的组数相同 4.引起Cache与主存内容不一致的原因是什么?为了保持Cache 的一致性,在单计算机系统中一般采取哪些措施? 答:不一致的原因:(1)由于CPU写Cache,没有立即写主存 (2)由于I/O处理机或I/O设备写主存 采取措施: (1)全写法,亦称写直达法(WT法-Write through) 方法:在对Cache进行写操作的同时,也对主存该内容进行写入 (2)写回法(WB法-Write back) 方法:在CPU执行写操作时,只写入Cache,不写入主存。 5.按照同一时间内各段之间的连接方式来分,流水线可分为哪两 类? 答:(1)静态流水线:在同一时间内,流水线的各段只能按同一种功能的连接方式工作。 (2)动态流水线:在同一时间内,当某些段正在实现某种运算时,另一些段却在实现另一种运算。 6.Flynn分类法是根据什么对计算机进行分类的?将计算机分 成哪几类? 答:Flynn分类法,根据计算机中指令和数据的并行状况把计算机分成: (1)单指令流单数据流(SISD.; (2)单指令流多数据流(SIMD.; (3)多指令流单数据流(MISD.; (4)多指令流多数据流(MIMD.。 四、问答与计算题(第1题10分,第2、3题每题15分共40分) 1.一个有快表和慢表的页式虚拟存储器,最多有64个用户,每 个用户最多要用1024个页面,每页4K字节,主存容量8M字节。 (1)写出多用户虚地址的格式,并标出各字段的长度。 (2)写出主存地址的格式,并标出各字段的长度。

计算机系统结构试题及答案

计算机系统结构复习题 单选及填空: 计算机系统设计的主要方法 1、由上往下的设计(top-down) 2、由下往上的设计(bottom-up) 3、从中间开始(middle-out) Flynn分类法把计算机系统的结构分为以下四类: (1)单指令流单数据流 (2)单指令流多数据流 (3)多指令流单数据流 (4) 多指令流多数据流 堆栈型机器:CPU 中存储操作数的单元是堆栈的机器。 累加器型机器:CPU 中存储操作数的单元是累加器的机器。 通用寄存器型机器:CPU 中存储操作数的单元是通用寄存器的机器。 名词解释: 虚拟机:用软件实现的机器叫做虚拟机,但虚拟机不一定完全由软件实现,有些操作可以由硬件或固件(固件是指具有软件功能的固件)实现。 系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。 兼容机:它是指由不同公司厂家生产的具有相同系统结构的计算机。 流水线技术:将一个重复的时序过程,分解成为若干个子过程,而每一个子过程都可有效地在其专用功能段上与其它子过程同时执行。 单功能流水线:指流水线的各段之间的连接固定不变、只能完成一种固定功能的流水线。 多功能流水线:指各段可以进行不同的连接,以实现不同的功能的流水线。 顺序流水线:流水线输出端任务流出的顺序与输入端任务流入的顺序完全相同。 乱序流水线:流水线输出端任务流出的顺序与输入端任务流入的顺序可以不同,允许后进入流水线的任务先完成。这种流水线又称为无序流水线、错序流水线、异步流水线。 吞吐率:在单位时间流水线所完成的任务数量或输出结果的数量。 指令的动态调度:

是指在保持数据流和异常行为的情况下,通过硬件对指令执行顺序进行重新安排,以提高流水线的利用率且减少停顿现象。是由硬件在程序实际运行时实施的。 指令的静态调度: 是指依靠编译器对代码进行静态调度,以减少相关和冲突。它不是在程序执行的过程中、而是在编译期间进行代码调度和优化的。 超标量: 一种多指令流出技术。它在每个时钟周期流出的指令条数不固定,依代码的具体情况而定,但有个上限。 超流水:在一个时钟周期分时流出多条指令。 多级存储层次: 采用不同的技术实现的存储器,处在离CPU不同距离的层次上,各存储器之间一般满足包容关系,即任何一层存储器中的容都是其下一层(离CPU更远的一层)存储器中容的子集。目标是达到离CPU最近的存储器的速度,最远的存储器的容量。 写直达法: 在执行写操作时,不仅把信息写入Cache中相应的块,而且也写入下一级存储器中相应的块。写回法: 只把信息写入Cache中相应块,该块只有被替换时,才被写回主存。 集中式共享多处理机: 也称为对称式共享存储器多处理SMP。它一般由几十个处理器构成,各处理器共享一个集中式的物理存储器,这个主存相对于各处理器的关系是对称的, 分布式共享多处理机: 它的共享存储器分布在各台处理机中,每台处理机都带有自己的本地存储器,组成一个“处理机-存储器”单元。但是这些分布在各台处理机中的实际存储器又合在一起统一编址,在逻辑上组成一个共享存储器。这些处理机存储器单元通过互连网络连接在一起,每台处理机除了能访问本地存储器外,还能通过互连网络直接访问在其他处理机存储器单元中的“远程存储器”。 多Cache一致性: 多处理机中,当共享数据进入Cache,就可能出现多个处理器的Cache中都有同一存储器块的副本,要保证多个副本数据是一致的。 写作废协议: 在处理器对某个数据项进行写入之前,它拥有对该数据项的唯一的访问权 。 写更新协议: 当一个处理器对某数据项进行写入时,它把该新数据广播给所有其它Cache。这些Cache用该新数据对其中的副本进行更新。 机群:是一种价格低廉、易于构建、可扩放性极强的并行计算机系统。它由多台同构或异构

计算机网络体系结构论文

计算机网络体系结构 摘要:计算机冈络体系结构描述了计算机网络功能实体的划分原则及其相互之间协同工作的方法和规则。本文主要介绍的是现在应用比较广泛的层次型网络体系结构,OSI基本参考模型,计算机网络的七层通信协议的主要功能及其之间的关系,并简单介绍了TCP/IP四层通信模型。 关键字:计算机网络,层次型网络体系结构,OSI,TCP/IP 上世纪60年代末期,早期的网络都是各公司根据用户的要求而设计的。虽然用户的应用要求千变万化,但对网络(通信)的要求相对一致。为使公司的产品可以适应千变万化的应用要求,尤其是适应用户扩充应用的要求,同时也是为了满足市场的要求,保证新老产品的兼容性和可操作性,各公司提出了基于本公司产品的计算机网络体系结构。 随着计算机技术和通信技术的发展,通用的计算机网络体系结构逐渐浮出水面。现在应用比较广泛的网络体系结构为层次型网络体系结构。层次型网络体系结构是计算机网络出现以后第一个被提出并实际使用的网络体系结构。直到目前,其产生和发展的过程始终与计算机网络产生和发展的过程保持协调一致。为了简化网络设计与实现的复杂性,层次型网络体系结构将复杂的网络问题分解为若干个不同的小问题,每个层次专注于解决特定的同题,这样就比较容易对所解决本层次涉及的同题实现模块化和标准化,标准化的层次间的通信规则被称为协议。层次型网络体系结构是层和协议的集合。典型的层次型网络体系结构通信模型如下图所示 层次型网络体系结构首先提出了模块化的设计实现思想:将复杂的网络问题分解为较为单纯易于解决的小问题;用不同的模块解决不同的问题。不同的模块之间接口简单明确,因此可以各自独立地制定标准和进行开发。这一思路即使在后来出现的其他网络体系结构中仍然得到了遵循。 国际标准化组织ISO为层次型网络体系结构设计了OSI参考模型。该模型将网络自底向上划分为物理层、数据链路层、网络层、传输层、会话层、表示层和应用层七个层次,每

计算机体系结构_第一次作业

计算机体系结构 第一章 1.11 Availability is the most important consideration for designing servers, followed closely by scalability and throughput. a. We have a single processor with a failures in time(FIT) of 100. What is the mean time to failure (MTTF) for this system? b. If it takes 1 day to get the system running again, what is the availability of the system? c. Imagine that the government, to cut costs, is going to build a supercomputer out of inexpensive computers rather than expensive, reliable computers. What is the MTTF for a system with 1000 processors? Assume that if one fails, they all fail. 答: a. 平均故障时间(MTTF)是一个可靠性度量方法,MTTF的倒数是故 障率,一般以每10亿小时运行中的故障时间计算(FIT)。因此由该定义可知1/MTTF=FIT/10^9,所以MTTF=10^9/100=10^7。b. 系统可用性=MTTF/(MTTF+MTTR),其中MTTR为平均修复时间, 在该题目中表示为系统重启时间。计算10^7/(10^7+24)约等于1. c. 由于一个处理器发生故障,其他处理器也不能使用,所以故障率 为原来的1000倍,所以MTTF值为单个处理器MTTF的1/1000即10^7/1000=10^4。 1.14 In this exercise, assume that we are considering enhancing

计算机体系结构期末试卷及答案

课程测试试题( A 卷) ----------------------以下为教师填写-------------------- I、命题院(部):信息科学与工程学院 II、课程名称:计算机体系结构 III、测试学期:2014-2015学年度第2学期 IV、测试对象:信息学院计算机、网络专业 2012 级班 V、问卷页数(A4): 3 页 VI、答卷页数(A4): 4 页 VII、考试方式:闭卷(开卷、闭卷或课程小论文,请填写清楚) VIII、问卷内容: 一、填空题(共30分,20空,每空分) 1、现代计算机系统是由()和()组成的十分复杂的系统。 2、计算机系统应能支持软件可移植,实现可移植性的常用方法有3种,即(),(), 统一高级语言。 3、可以将当前大多数通用寄存器型指令集结构进一步细分为3种类型,即()、() 和存储器-存储器型指令集结构。 4、MIPS指令DADDIU R14,R5,#6属于()类型的指令格式;MIPS指令 SD R4,300(R5)属于()类型的指令格式。 5、描述流水线的工作,常采用时空图的方法。在时空图中,横坐标表示(),纵坐 标代表()。 6、在MIPS指令实现的简单数据通路中,在WB周期中,有两大类指令执行操作:() 和()指令。 7、存储器的层次结构中,“Cache-主存”层次是为了弥补主存()的不足,“主 存-辅存”层次是为了弥补主存()的不足。 8、Cache实现的映像规则有全相联映像、()和()三种。 9、反映存储外设可靠性能的参数有可靠性、()和()。 10、根据系统中处理器个数的多少,可把现有的MIMD计算机分为两类,每一类代表 了一种存储器的结构和互连策略。第一类机器称为()结构,第二类机器具有()。 二、判断题(每小题1分,共10分) 1、从计算机语言的角度,系统结构把计算机系统按功能划分成多级层次结构,其中, 第2级是操作系统虚拟机,第3级是汇编语言虚拟机。() 2、计算机系统中提高并行性的3种途径中,资源重复是在并行性概念中引入时间因 素,加快硬件周转而赢得时间。() 3、指令集结构中采用多种寻址方式可能会增加实现的复杂度和使用这些寻址方式的 指令的CPI。() 4、指令条数多,通常超过200条,是设计RISC的原则之一。() 5、根据流水线中各功能段之间是否有反馈回路,可把流水线分为线性流水线和非线 性流水线。() 6、在多级存储体系中,“cache——主存”层次的存储管理实现主要由软件件实现。

相关主题
文本预览
相关文档 最新文档