当前位置:文档之家› 计算机系统结构总复习题

计算机系统结构总复习题

计算机系统结构总复习题
计算机系统结构总复习题

河南科技大学电信学院

计算机系统结构期末试题总结

一、单项选择题

1、直接执行微指令的是( C )

A.汇编程序B.编译程序

C.硬件D.微指令程序

2、对系统程序员不透明的应当是( D )。

A.Cache存贮器B.系列机各档不同的数据通路宽度C.指令缓冲寄存器D.虚拟存贮器

3、对机器语言程序员透明的是( B )。

A.中断字B.主存地址寄存器

C.通用寄存器D.条件码

4、计算机系统结构不包括( A )。

A.主存速度B.机器工作状态

C.信息保护D.数据

5、从计算机系统结构上讲,机器语言程序员所看到的机器属性是( C )。

A.计算机软件所要完成的功能B.计算机硬件的全部组成

C.编程要用到的硬件组织D.计算机各部件的硬件实现

6、计算机组成设计不考虑( B )。

A.专用部件设置B.功能部件的集成度

C.控制机构的组成D.缓冲技术

7、以下说法中,不正确的是( B )。

软硬件功能是等效的,提高硬件功能的比例会:

A.提高解题速度B.提高硬件利用率

C.提高硬件成本D.减少所需要的存贮器用量

8、在系统结构设计中,提高软件功能实现的比例会( C )。

A.提高解题速度B.减少需要的存贮容量

C.提高系统的灵活性D.提高系统的性能价格比

9、下列说法中不正确的是( D )。

A.软件设计费用比软件重复生产费用高

B.硬件功能只需实现一次,而软件功能可能要多次重复实现

C.硬件的生产费用比软件的生产费用高

D.硬件的设计费用比软件的设计费用低

10、在计算机系统设计中,比较好的方法是( D )。

A.从上向下设计B.从下向上设计

C.从两头向中间设计D.从中间开始向上、向下设计11、"从中间开始"设计的"中间"目前多数是在( A )。

A.传统机器语言级与操作系统机器级之间

B.传统机器语言级与微程序机器级之间

C.微程序机器级与汇编语言机器级之间

D.操作系统机器级与汇编语言机器级之间

12、系列机软件应做到( B )。

A.向前兼容,并向上兼容

B.向后兼容,力争向上兼容

C.向前兼容,并向下兼容

D.向后兼容,力争向下兼容

13、推出系列机的新机器,不能更改的是( A )。

A.原有指令的寻址方式和操作码

B.系统总线的组成

C.数据通路宽度

D.存贮芯片的集成度

14、不同系列的机器之间,实现软件移植的途径不包括( B )。

A.用统一的高级语言B.用统一的汇编语言

C.模拟D.仿真

15、利用时间重叠概念实现并行处理的是( A )。

A.流水处理机B.多处理机

C.并行(阵列)处理机D.相联处理机

16、浮点数尾数基值rm=8,尾数数值部分长6位,可表示的规格化最小正尾数为( C )。

A.0.5 B.0.25 C.0.125 D.1/64

17、在尾数下溢处理方法中,平均误差最大的是( A )。

A.截断法B.舍入法C.恒置"l"法D.ROM查表法

18、浮点数尾数下溢处理时,最大误差最大,但下溢处理不需要时间,平均误差又趋于0的方法是( D )。

A.截断法B.舍入法C.ROM查表法D.恒置"l"法

19、程序员编写程序时使用的地址是( B )。

A.有效地址B.逻辑地址C.辅存实地址D.主存地址

20、计算机中优化使用的操作码编码方法是( B )。

A 哈夫曼编码

B ASCII码

C BCD码

D 扩展操作码

21、外部设备打印机适合于连接到( B )。

A.数组多路通道B.字节多路通道

C.选择通道D.任意一种通道

22、虚拟存储器常用的地址映象方式是( A )

A.全相联B.段相联

C.组相联D.直接

23、下列关于虚拟存贮器的说法,比较证确的应当是( D )。

A.访主存命中率随页面大小增大而提高

B.访主存命中率随主存容量增加而提高

C.更换替换算法能提高命中率

D.在主存命中率低时,改用堆栈型替换算法,并增大主存容量,可提高命中率

24、最能确保提高虚拟存贮器访主存的命中率的改进途径是( D )。

A.增大辅存容量

B.采用FIFO替换算法并增大页面

C.改用LRU替换算法并增大页面

D.改用LRU替换算法并增大页面数

25、Cache存贮器常用的地址映象方式是( C )。

A.全相联映象B.页表法映象

C.组相联映象D.段页表映象

26、与全相联映象相比,组相联映象的优点是( A )。

A.目录表小B.块冲突概率低

C.命中率高D.主存利用率高

27、下列说法正确的是( D )。

A.Cache容量一般不大,命中率不会很高

B.Cache芯片速度一般比CPU的速度慢数十倍

C.Cache本身速度很快。但地址变换的速度很慢

D.Cache存贮器查映象表和访问物理Cache其间可以流水,使速度与CPU匹配28、组相联映象、LRU替换的Cache存贮器,不影响Cache命中率的是( C )。

A.增加Cache中的块数B.增大组的大小

C.增大主存容量D.增大块的大小

29、块冲突概率最高的Cache地址映象方式是( C )。

A.段相联B.组相联

C.直接D.全相联

30、指令间“一次重叠”说法有错的是( B )。

A.仅“执行k”与“分析k+1”重叠

B.“分析k”完成后立即开始“执行k”

C.应尽量使“分析k+1”与“执行k”时间相等

D.只需要一套指令分析部件和执行部件

31、"一次重叠"中消除"指令相关"最好的方法是( A )。

A.不准修改指令B.设相关专用通路

C.推后分析下条指令D.推后执行下条指令

32、IBM360/91属于( B )。

A.向量流水机B.标量流水机

C.阵列流水机D.并行流水机

33、下列关于标量流水机的说法不正确的是( C )。

A.可对标量数据进行流水处理

B.没有向量数据表示

C.不能对向量数据进行运算

D.可以对向量、数组进行运算

34、以下说法不正确的是( D )。

A.线性流水线是单功能流水线

B.动态流水线是多功能流水线

C.静态流水线是多功能流水线

D.动态流水线只能是单功能流水线

35、静态流水线是指( C )。

A.只有一种功能的流水线

B.功能不能改变的流水线

C.同时只能完成一种功能的多功能流水线

D.可同时执行多种功能的流水线

36、非线性流水线是指( B )。

A.一次运算中使用流水线中的多个功能段

B.一次运算中要多次使用流水线中的某些功能段

C.流水线中某些功能段在各次运算中的作用不同

D.流水线的各个功能段在各种运算中有不同的组合

37、下列说法正确的是( B )。

A."一次重叠"是一次解释一条指令

B."一次重叠"是同时解释相邻两条指令

C.流水方式是同时只能解释两条指令

D."一次重叠"是同时可解释很多条指令

38、与流水线最大吞吐率高低有关的是( C )。

A.各个子过程的时间B.最快子过程的时间

C.最慢子过程的时间D.最后子过程的时间

39、在流水机器中,全局性相关是指( D )。

A.先写后读相关B.先读后写相关

C.指令相关D.由转移指令引起的相关

40、流水机器对全局性相关的处理不包括( D )。

A.猜测法B.提前形成条件码

C.加快短循环程序的执行D.设置相关专用通路

41、CRAY一I的流水线是( A )。

A.多条单功能流水线B.一条单功能流水线

C.多条多功能流水线D.一条多功能流水线

42、IBM360/91对指令中断的处理方法是( A )。

A.不精确断点法B.精确断点法

C.指令复执法D.对流水线重新调度

二、填空题

1、按照Flynn分类法,根据指令流和数据流的不同组织方式,计算机系统的结构可以分为SISD(单指令流单数据流)、MISD、MIMD或单指令流多数据流和多指令流多数据流。

2、Amdahl等人在1964年把系统结构定义为:由程序设计者所看到的一个计算机系统的属性,即概念性结构和功能特性。

3、指令系统是软件设计人员与硬件设计人员之间的一个主要分界面,也是他们之间互相沟通的一座桥梁。在计算机系统的设计过程中,指令系统的设计是非常关键的,它必须由软件设计人员和硬件设计人员共同来完成。

4、实现程序移植的主要途径有统一高级语言、系列机、模拟和仿真。

5、系列机软件兼容必须做到向后兼容,尽可能争取向上兼容。

6、开发并行性是为了并行处理,并行性又包括有同时性和并发性二重含义。

7、浮点数尾数基值增大。可使运算中的精度损失减小可表示数的精度变降低。

8、浮点数阶码位数影响数的可表示范围大小,尾数位数影响数的可表示精度大小。

9、设计指令系统时,在功能方面的基本要求是:指令系统的完整性、规整性、高效率和兼容性。

10、根据多台外围设备共享通道的不同情况,可将通道分为三种类型:字节多路通道、选择通道和数组多路通道。

11、输入输出设备的异步性、实时性、与设备无关性三个特点是现代计算机系统必须具备的共同特性。

12、评价存贮器性能的基本要求是大容量、高速度和低价格。

13、虚拟存贮器主要是为解决主存容量满足不了要求发展出来的。

14、Cache存贮器是为解决主存速度满足不了要求发展出来的。

15、虚拟存贮器是增加辅助软硬件。使主、辅存形成整体,速度接近于主存的。容量是辅存的。

16、Cache存贮器是增加辅助硬件,使之速度接近于Cache的,容量是__主_存的。

17、Cache存贮器对应用程序员是透明的。对系统程序员是透明的(填“透明”或“不透明”)

18、程序在时间上的局部性表现在,最近未来要用的信息可能就是现在正在使用的信息,这是因为程序中有存在着循环。

19、程序在空间上的局部性主要是因为程序通常是地存储和执行,数据通常是地存贮。

20、虚拟存贮器按映象算法不同,存贮管理方式有段式、页式和段页式3种。

21、在虚拟存储器中有三种地址空间,一种是应用程序员用来编写程序的地址空间,称为虚拟地址空间第二种是主存储器的地址空间,第三种是辅存地址空间,也就是磁盘存储器的地址空间。它们对应的三种地址分别是虚拟地址、主存地址和辅存地址。

22、段式虚拟存贮器是用段表来进行地址映象和变换的。

23、段页式虚拟存储器的内部地址映象表机构有快表和慢表两部分。

24、页面替换是发生于页面失效,同时又发生页面争用的时候。

25、评价虚拟存贮器所用替换算法的好坏,主要是看主存命中率的高低,其次看算法是否易于实现,以及所需的辅助软硬件的多少。

26、Cache存贮器地址映象大多采用全相联映象或组相联映象,以利于实现。

27、Cache存贮器采用组相联的映象规则是组间直接映象,组内各块间全相联映象。

28、Cache存贮器写操作时,只写入Cache,仅当需要块替换时,才将其写回主存。称这种修改主存块内容的方法为写回法。

29、在Cache存贮器中,CPU每次写Cache的同时,也写入主存,称这种更新主存块内容的方法为写直达法。

30、Cache写不命中时,只写入主存储器,并不将该字所在块由主存调入Cache。称此分配法为不按写分配法。

31、CPU写Cache不命中时,除写入主存外,同时还将含该字的主存块调入Cache。称此分配法为按写分配法。

32、层次存储系统的设计的目的是使有效存取时间接近于最内层存储器的存取时间,使总体的平均每字成本接近于最外层存储器的每字成本,容量接近于最大存储器的容量。

33、解决重叠和流水中的操作数相关,不外乎是推后法和设置相关专用通路法两种基本方法。

34、流水有部件、处理机、系统等不同等级,多个处理机之间的流水属系统级流水,也称宏流水。

35、多功能流水线各功能段同时只能按某一种功能联接的称为静态流水线。

36、多功能流水线各功能段同时可按不同运算或功能联接工作,称此流水线为动

态流水线。

37、流水线消除速度瓶颈的方法有瓶颈过程再细分和瓶颈子过程多套并联两种。

38、向量处理机的结构主要有存储器-存储器结构和寄存器-寄存器结构

两种。

39、先行控制(Look-ahead)技术的关键是缓冲技术和预处理技术,以及这两者的相结合。通过对指令流和数据流的预处理和缓冲,能够尽量使指令分析和指令执行部件独立地工作,并始终处于忙碌状态。

三、判断题

1、系统是否设浮点运算指令,对计算机系统结构是透明的。(×)

2、软硬功能分配时,提高软件功能的比例会提高系统灵活性,也会提高解题速度。(×)

3、经常用的基本单元功能,宜于用软件实现,以降低实现费用。( ×)

4、系列机应用软件应做到向前兼容,力争向下兼容。(×)

5、系列机不再是方向,因为它约束了计算机系统结构的发展。( ×)

6、系列机低档低价格,但性能太低;高档机高性能,但价格太高。因此,为获得高性能价格

比,应尽可能购置性能价格比高的中档机。(√)

7、二进制数表示数据信息较之二一十进制数表示,其存贮空间利用率低,运算速度要快。( X )

8、浮点数尾数下溢处理采用舍入法还是恒置"1"法,对计算机系统结构是不透明的。(X )

9、对概率不等的事件用Huffman编码,其具体编码不唯一,但平均码长肯定是唯一的,且是最短的。( √)

10、多数I/O系统的结构应面向操作系统设计,考虑如何在操作系统与I/O系统之间进行合理的软、硬件功能分配。( √)

11、低速打印机,在总线上传送数据时,其"数据宽度"宜用可变长块。( X )

12、磁盘设备在数据传送时,数据宽度宜采用单字或单宇节。( X )

13、对标量数据来说,并行主存系统的实际频宽采用多体单字方式的要比采用单体单字方式组成的高。( √)

14、在存贮体系中,地址的映象与地址的变换没有区别。( X )

15、虚拟存贮器内部地址映象方式的选择,依据于是否有高的主存命中率,而不是高的实页冲突概率。( X )

四、问答题

1、实现软件移植的途径有哪些?各受什么限制?

答:软件移植的途径主要有:统一高级语言,系列机,模拟与仿真。

统一高级语言,由于只能实现高级语言软件的移植,而目前高级语言种类繁多,无法完全统一成一种,只能相对统一成少数几种。系列机,由于系列内各档机器的结构变化不能太大,到一定时候会阻碍系列发展,只能实现在结构相同或相近的机器间的汇编语言应用软件的移植。模拟与仿真,模拟是用宿主机的机器指令解释,机器语言差别大时,速度慢;仿真是用宿主机的微程序解释,当机器差异大时,仿真困难,仿真的效率和灵活性差。

2、计算机系统的Flynn(弗林)分类法是按什么来分类的?共分哪几类?解释其含义。

答:弗林分类法是按指令流、数据流及其多倍性分类的。共分四类。

SISD--指令部件只对一条指令处理,只控制一个操作部件操作。如一般的串行单处理机。SIMD--由单一指令部件同时控制多个重复设置的处理单元,执行同一指令下不同数据的操作。如阵列处理机。

MISD--多个指令部件对同一数据的各个处理阶段进行操作。这种机器很少见。

MIMD--多个独立或相对独立的处理机分别执行各自的程序、作业或进程。例如多处理机。

3、计算机系统结构的定义是什么?它与计算机组成、计算机实现有什么区别和联系?

指机器级程序员所看到的计算机属性,即概念性结构和功能特征。

计算机组成是计算机系统结构的逻辑实现

计算机实现是计算机系统结构的物理实现

系统结构、组成和实现所包含的具体内容是随不同机器而变化的

4.计算机设计人员需要完成哪些设计任务?

1、确定用户对计算机系统的功能、价格和性能的要求;

2、确定用户对计算机系统软硬件的要求;

3、设计出符合今后发展方向的系统结构

5.什么是RISC?什么是CISC?RISC的主要特点是什么?

RISC是精简指令集计算机。CISC是复杂指令系统计算机

(1) 选取使用频度较高的一些简单指令以及一些很有用但又不复杂的指令,让复杂指令的功能由频度高的简单指令的组合来实现。

(2) 指令长度固定,指令格式种类少,寻址方式种类少。

(3) 只有取数/存数指令访问存储器,其余指令的操作都在寄存器内完成。

(4) CPU中有多个通用寄存器。

(5) 采用流水线技术,大部分指令在一个时钟周期内完成。采用超标量和超流水线技术,可使每条指令的平均执行时间小于一个时钟周期。

(6) 控制器采用组合逻辑控制,不用微程序控制.

(7) 采用优化的编译程序

6.什么是地址映象和地址变换,它们之间有什么关系?

1、在Cache中,地址映象是指把主存地址空间映象到Cache地址空间;而地址变换则是指当程序已经装入到Cache后,在实际运行过程中,把主存地址如何变换成Cache地址;

2、在虚拟存储器中,地址映象是把虚拟地址空间映象到主存地址空间;而地址变换是在程序被装入主存储器后,在实际运行时,把多用户虚地址变换成主存实地址或磁盘存储器地址。

地址的映象和变换是紧密相关的。采用什么样的地址映象方法,就必然有与这种映象

方法相对应的地址变换方法。

7.Cache存储系统有几种替换算法,有什么区别?

1、轮换法;

2、LFU算法;

3、比较对法;

4、堆栈法。

轮换法是一种先进先出(FIFO)算法,另外三种实际上都属于最久没有被使用(LFU)算法,只是它们的实现方式各不相同。

8.流水线中的“瓶颈”是如何产生的?有什么办法可以解决流水线“瓶颈”问题?

流水线中各段时间不相等引起“堵塞”、“断流”等问题,执行时间长的一段将成为整个流水线的“瓶颈”。

解决方法有:1、将流水线的“瓶颈”部分再细分;2、重复设置瓶颈功能段,让多个瓶颈功能段并行工作。

9、在页式虚拟存贮器中,什么叫页面失效?什么叫页面争用?什么时候两者同时发生?什么时候两者不同时发生?

答:要访间的虚页不在实际主存申时,就会发生页面失效。当页面调入主存,主存中的页面位置全部已被其它虚页占用时,就会发生页面争用。当分配给程序的内存已被全部占用之后,只要发生页面失效,就一定会发生页面争用。反之,发生页面失效,并不会发生页面争用。

10、计算机系统“由中间开始”设计,其“中间”指的是什么地方?这样设计的好处是什么?答:"中间"是指多级层次结构中的软、硬件交界面,目前是处于传统机器级与操作系统机器级之间。

这样设计,能合理地进行软、硬件的功能分配,优化软、硬件设计,可为软件和应用提供更多更好的硬件支持,可使软、硬件同时设计,缩短系统的设计周期。

五、计算题

1、用一台40MHZ处理机执行标准测试程序,它含的混合指令数和相应所需的时钟周期数如下:

指令数时钟周期数

指令类

整数运算45000 1

数据传送32000 2

浮点15000 2

控制传送8000 2

求有效CPI、MIPS速率和程序的执行时间。

2、某台计算机只有Load/Store 指令能对存储器进行读/写操作,其它指令只对寄存器进行操作。根据程序跟踪实验结果,已知每种指令所占的比例及CPI数如下:

(1) 求上述情况下的平均CPI。

(2) 假设程序由M条指令组成。算逻运算中25%的指令的两个操作数中的一个已在寄存器中,另一个必须在算逻指令执行前用Load指令从存储器取到寄存器。因此有人建议增加另一种算逻指令,其特点是一个操作数取自寄存器,另一个操作数取自存储器,即寄存器?存储器类型,假设这种指令的CPI等于2。同时,转移指令的CPI变为3。求新指令系统的平均CPI。

3、某机器有10条指令,使用频度分别为:

0.01,0.15,0.12,0.07,0.08,0.13,0.15,0.03,0.17,0.09。

(1)计算用等长操作码编码的平均码长;4

(2)构造Huffman树;

(3)写出Huffman的一种编码,并计算其平均码长;

(4)只有二种码长,求平均码长最短的扩展操作码编码及其平均码长。

4、有一条流水线如下所示。

(1) 求连续输入10条指令,该流水线的实际吞吐率和效率;

(2) 该流水线的瓶颈在哪一段?请采取三种不同的措施消除此“瓶颈”。对于你所给出的新流水线,计算连续输入10条指令时,其实际吞吐率和效率。

5、试根据以下指令,阐述先行控制技术的工作过程:n LOAD R1,A1

n+1 ADD R1,R2

n+2 JMP L

?

L:?

五、计算题

----------------------------------------------------------------------

1、试题序号:581

2、题型:计算题

3、难度级别:4

4、知识点:一、计算机体系结构的基本概念

5、分值:10

6、所需时间:15分钟

7、试题关键字:解释执行

8、试题内容:

假设有一个计算机系统分为四级,每一级指令都比它下一级指令在功能上强M 倍,即一条r+1级指令能够完成M 条r 指令的工作,且一条r+1级指令需要N 条r 级指令解释。对于一段在第一级执行时间为K 的程序,在第二、第三、第四级上的一段等效程序需要执行多少时间? 9、答案内容:

解:假设在第一级上用时间K 执行了该级IC 条指令。1分

对第二级而言,为了完成IC 条指令的功能,第二级指令的条数为:M

IC

。为

了执行第二级M IC 条指令,需要执行

N M

IC

条第一级的指令对其进行解释,所以对于第二级而言,等效程序的执行时间是:

K

M N IC K N M IC M M IC

T ??

????

+=?

?????+=12 2分

对于第三级而言,为了完成IC 条指令的功能,第三级指令的条数为:

2M IC 。为了执行第三级2

M

IC 条指令,需要执行N M IC

2条第二级的指令对其进行解释。那么对第二级而言,总的指令条数为:

N M IC

M IC 22+ 3分 而第二级N M IC M IC 22+等效于第一级M N M IC M IC ??

????+22条指令,同时还需要

N N M IC M IC

??

????+22条第一级指令进行解释,所以第三级等效程序的执行时间是: K

M N IC K

N N M IC M M IC M N M IC M M

IC T 2

2

22231??

????

+=????????????++??????+= 3分

按照同样的逐层递推关系,不难求得第四级等效程序的总的执行时间为:

K

M N T 3

41??

????

+= 1分

10、评分细则:10分/小题,评分细则分布在答案内容中。

----------------------------------------------------------------------

1、试题序号:582

2、题型:计算题

3、难度级别:3

4、知识点:1.5 定量分析技术基础

5、分值:10

6、所需时间:15分钟

7、试题关键字:阿姆达尔定律 8、试题内容:

已知某商用计算机拟增加字符串操作功能。 若用软件实现,与无字符串操作相比,速度提高4倍, CPU 成本提高1/5倍;若用硬件实现,则速度是原来的100倍,,CPU 成本是原来的5倍。 由实验测得,字符串操作占总运行时间的50%, CPU 成本约占整机成本的1/3。你选用哪种设计方案? 9、答案内容:

解:采用软件方法时

根据阿姆达尔定律,性能提高:

=1.66 2分 硬件成本提高到C=2/3 + 1/3* (1+1/5)=1.07 1分 价格性能比为:C/S = 1.07/1.66 = 0.64 1分 采用硬件方法时:

S=1/[(1-50%)+50%/100]=1.98 2分

硬件成本提高到C=2/3 + 1/3* 5=2.33 1分 价格性能比为:C/S = 2.33/1.98 = 1.18 1分

如果仅考虑性能提高,则可选择硬件方法,而考虑性能提高和成本因素,则应选择软件方法。 2分

10、评分细则:10分/小题,评分细则分布在答案内容中。

----------------------------------------------------------------------

1、试题序号:583

2、题型:计算题

3、难度级别:4

4、知识点:一、计算机体系结构的基本概念

5、分值:10

6、所需时间:15分钟

7、试题关键字:CPU 性能公式 8、试题内容:

假设我们考虑条件分支指令的两种不同设计方法如下:

(1) CPUA :通过比较指令设置条件码,然后测试条件码进行分支。 (2) CPUB :在分支指令中包括比较过程

S=

1

(1-50%)+

50% 5

在两种CPU中,条件分支指令都占用2个时钟周期而所有其它指令占用1个时钟周期,对于CPUA,执行的指令中分支指令占20%;由于每个分支指令之前都需要有比较指令,因此比较指令也占20%。由于CPUA在分支时不需要比较,因此假设它的时钟周期时间比CPUB快1.25倍。哪一个CPU更快?如果CPUA的时钟周期时间仅仅比CPUB快1.1倍,哪一个CPU更快呢?

9、答案内容:

解:我们不考虑所有系统问题,所以可用CPU性能公式。占用2个时钟周期的分支指令占总指令的20%,剩下的指令占用1个时钟周期。所以

CPIA = 0.2 ? 2 + 0.80 ? 1 = 1.2 1分

则CPU性能为:

总CPU时间A = IC ? 1.2 ?时钟周期A 1分

根据假设,有:

时钟周期B = 1.25 ?时钟周期A 1分

在CPUB中没有独立的比较指令,所以CPUB的程序量为CPUA的80%,分支指令的比例为:

20%/80% = 25% 2分

这些分支指令占用2个时钟周期,而剩下的75%的指令占用1个时钟周期,因此: CPIB = 0.25 ? 2 + 0.75 ? 1 = 1.25 1分

因为CPUB不执行比较,故:

ICB = 0.8 ? ICA

因此CPUB性能为:

总CPU时间B = ICB ? CPIB ?时钟周期B

= 0.8 ? ICA ? 1.25 ? (1.25 ?时钟周期A)

= 1.25 ? ICA ?时钟周期A 2分

在这些假设之下,尽管CPUB执行指令条数较少,CPUA因为有着更短的时钟周期,所以比CPUB快。

如果CPUA的时钟周期时间仅仅比CPUB快1.1倍,则

时钟周期B = 1.10 ?时钟周期A

CPUB的性能为:

总CPU时间B = ICB ? CPIB ?时钟周期B

= 0.8 ? ICA ? 1.25 ? (1.10 ?时钟周期A)

= 1.10 ? ICA ?时钟周期A

因此CPUB由于执行更少指令条数,比CPUA运行更快。 2分

10、评分细则:10分/小题,评分细则分布在答案内容中。

----------------------------------------------------------------------

1、试题序号:584

2、题型:计算题

3、难度级别:2

4、知识点:一、计算机体系结构的基本概念

5、分值:10

6、所需时间:15分钟

7、试题关键字:CPU性能公式

8、试题内容:

对于一台400MHz计算机执行标准测试程序,程序中指令类型,执行数量和平均时钟周期数如下:

指令类型 指令执行数量 平均时钟周期数 整数 45000 1 数据传送 75000 2 浮点 8000 4 分支 1500 2

求该计算机的有效CPI 、MIPS 和程序执行时间。 9、答案内容:

解:IC CPI IC CPI i i /)(∑?= 1分

776.1129500

2

150048000275000145000=?+?+?+?=

CPI 3分

MIPS CPI f MIPS 225.22510

776.110400106

6

6=??=?=速率 3分 程序执行时间=(2150048000275000145000?+?+?+?)/400=575s 3

10、评分细则:10分/小题,评分细则分布在答案内容中。

----------------------------------------------------------------------

1、试题序号:585

2、题型:计算题

3、难度级别:2

4、知识点:一、计算机体系结构的基本概念

5、分值:10

6、所需时间:15分钟

7、试题关键字:CPI

8、试题内容:

假定要在一个时钟速率为40MHz 的标量处理机上执行20万条目标代码指令的程序,该程序中含有4种主要类型指令,每种指令类型所占的比例及CPI 数如图所示。要求计算:

(1)在单处理机上执行该程序的平均CPI.

(2)根据(1)所得到的CPI 值,计算相应的MIPS 速率。

指令类型 CPI 指令所占比例

ALU 1 60% LOAD/STORE 指令(Cache 命中时) 4

18% Branch 指令

4 12% 访存指令(Cache 不合中时)

8

10%

9、答案内容:

解:IC CPI IC CPI i i /)(∑?==CPIi ?ICi/IC=1 ?0.6+4 ?0.18+4 ?0.12+8

?0.1=2.24 5分

MIPS CPI f MIPS 86.171024.21040106

6

6=??=?=速率阶段 5分

10、评分细则:10分/小题,评分细则分布在答案内容中。

----------------------------------------------------------------------

1、试题序号:586

2、题型:计算题

3、难度级别:3

4、知识点:一、计算机体系结构的基本概念

5、分值:10

6、所需时间:15分钟

7、试题关键字:Amdahl 定律 8、试题内容:

计算机系统有三个部件可以改进,这三个部件的加速比如下: 部件加速比1=30; 部件加速比2=20; 部件加速比3=10;

(1) 如果部件1和部件2的可改进比例为30%,那么当部件3的可改进比例为多少时,系统的加速比才可以达到10?

(2) 如果三个部件的可改进比例为30%、30%和20%,三个部件同时改进后,那么系统中不可加速部分的执行时间在总执行时间中占的比例是多少? 9、答案内容:

解:在多个部件可改进情况下Amdahl 定律的扩展:

??

???

?+-=e e e

o

e

S f f T T )1(

e

e e S

f f S +

-=

)1(1

∑+-=

i

i

i i

i S f f S )1(1

2分

式中,fi 为可加速部件i 在未优化系统中所占的比例;Si 是部件i 的加速比。

1

332211321)](1[-??

??

??+++++-=S f S f

S f f f f S

1

3330203.0303.0)]3.03.0(1[10-??

??

??

+++++-=f f

36.018065

3==

f 4分

82.07.14126012602.1609.0606.02

.02.010

2.020

3.0303.02

.02.010

2.020

3.0303.0)]2.03.03.0(1[==+++=

+++=

+++++-=

T T

T T T

p 4分

10、评分细则:10分/小题,评分细则分布在答案内容中。

----------------------------------------------------------------------

1、试题序号:587

2、题型:计算题

3、难度级别:3

4、知识点:二、计算机指令集结构设计

5、分值:10

6、所需时间:15分钟

7、试题关键字:

8、试题内容:指令集结构

对于下面的三个赋值语句:

A=B+C

B=A+C

D=A-B

试用堆栈型、累加器型和通用寄存器型指令集

(1)分别用汇编指令加以编写。

(2)为衡量存储器使用效率,假设对三种指令集均有:操作码占用一字节,存储器地址占用二字节,操作数占用四字节。计算三种代码序列自存储器取指所需总字节,取数或存数所需的总字节。哪一种结构需传送的总字节数最少?

9、答案内容:

答:(1)汇编指令编写如下: 5分

堆栈型累加器型寄存器型

PUSH B PUSH C ADD TOP A PUSH C ADD TOP B PUSH A SUB POP D LOAD B

ADD C

STORE A

ADD C

STORE B

LOAD A

SUB B

STORE D

LOAD R1,B

ADD R1,C

STORE A,R1

LOAD R2,C

ADD R2,R1

STORE B,R2

SUB R1,R2

STORE D,R1

(2)据上面的指令序列,计算得: 5分

堆栈型累加器型寄存器型

取指:10+7*2=24 8+8*2=24 8+20*2=28

存取数:7*4=28 8*4=32 6*4=24

总计:52字节56字节64字节

10、评分细则:10分/小题,评分细则分布在答案内容中。

---------------------------------------------------------------------

-

1、试题序号:588

2、题型:计算题

3、难度级别:3

4、知识点:二、计算机指令集结构设计

5、分值:10

6、所需时间:15分钟

7、试题关键字:DLX指令集结构

8、试题内容:

1、现有如下C语言源代码:

for (i=0;i<=100,i++)

{A[i]=B[i]+C;}

其DLX实现代码如下:

ADDI R1,R0,#0

SW 2000(R0),R1

loop:

LW R1,2000(R0)

MULT R2,R1,#4

ADDI R3,R2,#5000

LW R4, 0(R3)

LW R5,1500(R0)

ADD R6,R4,R5

LW R1,2000(R0)

MULT R2,R1,#4

ADDI R7,R2,#0

SW 0(R7),R6

LW R1,2000(R0)

ADDI R1,R1,#1

SW 2000(R0),R1

LW R1,2000(,R0)

ADDI R8,R1,# -101

BNEZ R8,loop

其中,A和B是两个32位整数的数组,C和i均是32位整数。假设所有数据的值及其地址均保存在存储器中,A和B的起始地址分别是0和5000。C和i的地址分别是 1500和2000。在循环的两次迭代之间不将任何数据保存在寄存器中。求:(1)该程序段共执行了多少条指令。

(2)程序对存储器中的数据访问了多少次?

(3)DLX代码的大小(占用存储空间大小)是多少字节?

9、答案内容:

计算机系统结构题库

《计算机系统结构》题库 一.单项选择题(在下列每小题的四个备选答案中,只有一个答案是正确的,请把你认为是正确的答案填入题后的()内,每小题2分) 第一章: 1.计算机系统多级层次中,从下层到上层,各级相对顺序正确的应当是: A.汇编语言机器级---操作系统机器级---高级语言机器级 B.微程序机器级---传统机器语言机器级---汇编语言机器级 C.传统机器语言机器级---高级机器语言机器级---汇编语言机器级 D.汇编语言机器级---应用语言机器级---高级语言机器级 答案:B 分数:2 所属章节1—1 2.汇编语言源程序变成机器语言目标程序是经来实现的。 A. 编译程序解释 B. 汇编程序解释 C. 编译程序翻译 D. 汇编程序翻译 答案:D 分数:2 所属章节1—1 3.直接执行微指令的是: A. 汇编程序 B. 编译程序 C. 硬件 D. 微指令程序 答案:C 分数:2 所属章节1—1 4.对系统程序员不透明的是: A. Cache存储器 B. 系列机各档不同的数据通路宽度 C. 指令缓冲寄存器 D. 虚拟存储器 答案:D 分数:2 所属章节1—2 5.对应用程序员不透明的是: A. 先行进位链 B. 乘法器 C. 指令缓冲器 D. 条件码寄存器 答案:D 分数:2 所属章节1—2 6.对机器语言程序员透明的是: A. 中断字 B. 主存地址寄存器 C. 通用寄存器 D. 条件码 答案:B 分数:2 所属章节1—2 7.计算机系统结构不包括: A. 主存速度 B. 机器工作状态 C. 信息保护 D. 数据表示 答案:A 分数:2 所属章节1—2 8.对计算机系统结构透明的是: A. 字符行运算指令 B. 是否使用通道行I/O处理机 C. 虚拟存储器 D. VLSI技术 答案:D 分数:2 所属章节1—2 9.对汇编语言程序员透明的是: A.I/O方式中的DMA访问方式 B. 浮点数据表示 C. 访问方式保护 D 程序性中断. 答案:A 分数:2 所属章节1—2 10.属计算机系统结构考虑的应是:

北邮高级计算机系统结构实验二三四五

实验二指令流水线相关性分析 ·实验目的 通过使用WINDLX模拟器,对程序中的三种相关现象进行观察,并对使用专用通路,增加运算部件等技术对性能的影响进行考察,加深对流水线和RISC处理器的特点的理解。 ·实验原理: 指令流水线中主要有结构相关、数据相关、控制相关。相关影响流水线性能。·实验步骤 一.使用WinDLX模拟器,对做如下分析: (1)观察程序中出现的数据/控制/结构相关。指出程序中出现上述现象的指令组合。 (2)考察增加浮点运算部件对性能的影响。 (3)考察增加forward部件对性能的影响。 (4)观察转移指令在转移成功和转移不成功时候的流水线开销。 ·实验过程 一.使用WinDLX模拟器,对做如下分析: } 浮点加、乘、除部件都设置为1,浮点数运算部件的延时都设置为4,如图1: 图1 初始设置 将和加载至WinDLX中,如图2示。

图2 加载程序 1.观察程序中出现的数据/控制/结构相关;指出程序中出现上述现象的指令组合。 1)数据相关 点击F7,使程序单步执行,当出现R-Stall时停止,运行过程中出现下图3所示,输入整数6。 图3 输入整数6 @ 打开Clock Diagram,可以清楚的看到指令执行的流水线如图4所示。 图4 指令流水线 双击第一次出现R-Stall的指令行,如图5所示。

图5 指令详细信息 对以上出现的情况分析如下: 程序发生了数据相关,R-Stall(R-暂停)表示引起暂停的原因是RAW。 lbu r3,0×0(r2) 要在WB周期写回r3中的数据;而下一条指令 & seqi r5,r3,0×a 要在intEX周期中读取r3中的数据。 上述过程发生了WR冲突,即写读相关。为了避免此类冲突, seq r5,r4,0×a的intEX指令延迟了一个周期进行。 由此,相关指令为: 2)控制相关 由图6可以看出,在第4时钟周期:第一条指令处于MEM段,第二条命令处于intEX段,第三条指令出于aborted状态,第四条命令处于IF段。 图 6 指令流水线 }

《计算机系统结构》复习题

计算机系统结构复习 填空(15*1分),选择(15*1分),简答题(5/6 30分),综合题(4*10分) 1、从使用语言角度,可将系统按功能划分为多层次机器级结构,层次结构分别是:应用语言机器级、高级语言机器级、汇编语言机器级、操作系统机器级、传统机器语言机器级和微程序机器级。 2、各机器级的实现主要靠翻译和解释或两者结合进行。翻译是先用转换程序将高一级机器级上的程序整个地变换成低一级机器级上等效的程序,然后再在低一级机器级上实现的技术。解释则是在低级机器上用它的一串语句或指令来仿真高级机器上的一条语句或指令的功能,是通过对高级的机器级语言程序中的每条语句或指令逐条解释来实现的技术。 3、计算机系统结构在计算机系统机器级层次中指传统机器级的系统结构。 4、计算机系统结构研究的是软、硬件之间的功能分配以及对传统机器级界面的确定,为机器语言、汇编语言程序设计或编译程序生成系统提供使其设计或生成的程序能在机器上正确运行应看到的遵循的计算机属性。 5、计算机系统结构的属性包括: 1.数据表示、2.寻址方式、3.寄存器组织、4.指令系统、5.存储系统组织、6.中断机构、7.系统机器级的管态和用户态的定义和切换、8.机器级的I/O 结构、9.系统各部分的信息保护方式和保护机构等。 6、机器透明性:指相对于每一机器级设计人员,都客观存在的功能或属性看不到的现象,称相对于此级设计人员来说,这些功能或属性是具有透明性,即透明的。 7、计算机组成指的是计算机系统结构的逻辑实现,包括机器级内部的数据流和控制流的组成以及逻辑设计等。它着眼于机器级内部各事件的排序方式与控制机构、各部件的功能及各部件间的联系。 8、计算机组成设计要解决的问题是在所希望达到的性能和价格下,怎样更好、更合理地把各种设备各部件组织成计算机,来实现所确定的系统结构。 9、当前,计算机组成设计主要是围绕提高速度,着重从提高操作的并行度、重叠度,以及功能的分散和设置专用功能部件来进行的。 10、计算机组成设计要确定的方面一般应包括: 1.数据通路宽路、2.专用部件的设置、3.各种操作对部件的共享程度、4.功能部件的并行度、5.控制机构的组成方式、6.缓冲和排队技术、7.预估预判技术、8.可靠性技术等。 11、计算机实现指计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,器件、模块、插件、底板的划分与连接,专用器件的设计,微组装技术,信号传输,电源、冷却及整机装配技术等。它着眼于器件技术和微组装技术,其中,器件技术在实现技术中起着主导作用。 13、软、硬件取舍的三个基本原则是: (1).考虑在现有硬件、器件(主要是逻辑器件和存储器)条件下,系统要有高的性能价格比,主要从实现费用、速度和其他性能要求来综合考虑。 (2).考虑到准备采用和可能采用的组成技术,使它尽可能不要过多或不合理地限制各种组成、实现技术的采用。 (3).从“软”的角度考虑如何为编译和操作系统的实现以及为高级语言程序的设计提供更多更好的硬件支持。 14、程序在系统上运行的时间应该是衡量机器时间(速度)性能最可靠的标准。 15、计算机性能通常用峰值性能及持续性能来评价。峰值性能是指在理想情况下计算机系统可获得的最高理论性能值,它不能反映出系统的实际性能。

计算机系统结构基本习题和答案

计算机系统结构基本习题和答案 填空题 1、从(使用语言的)角度可以将系统看成是按(功能)划分的多个机器级组成的层次结构。 2、计算机系统结构的层次结构由高到低分别为(应用语言机器级,高级语言机器级,汇编语言机器级,操作系统机器级,传统机器语言机器级,微程序机器级)。 3、应用程序语言经(应用程序包)的(翻译)成高级语言程序。 4、高级语言程序经(编译程序)的(翻译)成汇编语言程序。 5、汇编语言程序经(汇编程序)的(翻译)成机器语言程序。 6、在操作系统机器级,一般用机器语言程序(解释)作业控制语句。 7、传统机器语言机器级,是用(微指令程序)来(解释)机器指令。 8、微指令由(硬件)直接执行。 9、在计算机系统结构的层次结构中,机器被定义为(能存储和执行相应语言程序的算法和数据结构)的集合体。 10、目前M0由(硬件)实现,M1用(微程序(固件))实现,M2到M5大多用(软件)实现。以(软件)为主实现的机器成为虚拟机。(虚拟机)不一定全用软件实现,有些操作也可用(固件或硬件)实现。 11、透明指的是(客观存在的事物或属性从某个角度看不到),它带来的好处是(简化某级的设计),带来的不利是(无法控制)。 12、计算机系统结构也称(计算机体系结构),指的是(传统机器级的系统结构)。它是(软件和硬件/固件)的交界面,是机器语言汇编语言程序设计者或编译程序设计者看到的(机器物理系统)的抽象。 13、计算机组成指的是(计算机系统结构的逻辑实现),包括(机器级内的数据流和控制流)的组成逻辑设计等。计算机实现指的是(计算机组成的物理实现),它着眼于(器件)技术和(微组装)技术。 14、确定指令系统中是否要设乘法指令属于(计算机系统结构),乘法指令是用专门的高速乘法器实现还是用加法器实现属于(计算机组成),乘法器和加法-移位器的物理实现属于(计算机实现)。 15、主存容量与编址方式的确定属于(计算机系统结构),主存是否采用多体交叉属于(计算机组成),主存器件的选定属于(计算机实现)。 16、设计何种系列机属于(计算机系统结构),系列机内不同型号计算机的组织属于(计算机组成)。 17、是否采用通道方式输入输出的确定属于(计算机系统结构),通道采用结合型还是独立型属于(计算机组成)。 18、对PDP-11或VAX-11来说,单总线结构属于(计算机系统结构),其机器级的I/O连接和使用方式属于(计算机组成)。 19、由于计算机组成和计算机实现关系密切,有人称它们为(计算机实现),即计算机系统的(逻辑实现)和(物理实现)。 20、计算机系统结构可有(由上而下)、(由下而上)和(由中间开始)三种不同的设计思路。 21、“由中间开始”设计的“中间”是指(层次结构中的软硬交界面),目前多数是在(传统机器级)与(操作系统级)之间。 22、除了分布处理,MPP和机群系统外,并行处理计算机按其基本结构特征可分为(流水线计算机)、(阵列处理机)、(多处理机)、(数据流计算机)四种不同的结构。 23、费林按指令流和数据流的多倍性把计算机系统分类,这里的多倍性指(系统瓶颈部件上

2010年4月自考计算机系统结构试题及答案

全国2010年4月自学考试计算机系统结构试题 课程代码:02325 一、单项选择题(本大题共10小题,每小题1分,共10分) 在每小题列出的四个备选项中只有一个是符合题目要求的,请将其代码填写在题后的括号内。错选、多选或未选均不得分。 1.在计算机系统结构设计中,提高软件功能实现的比例可( ) A.提高解题速度B.减少需要的存储器容量 C.提高系统的灵活性D.提高系统的性能价格比 2.浮点数表示的尾数的基r m=16,尾数长度p=8,可表示的规格化最大正尾数的值是( ) A.1/256 B.1/2 C.15/16 D.255/256 3.下列数据存储空间为隐含寻址方式的是( ) A.CPU中的通用寄存器B.主存储器 C.I/O接口中的寄存器D.堆栈 4.当计算机系统执行通道程序完成输入输出工作时,执行通道程序的是( ) A.CPU B.通道 C.CPU和通道D.指定的外设 5.下列有关中断的叙述正确的是( ) A.中断响应的次序是由硬件决定的B.中断处理的次序是由硬件决定的 C.中断处理的次序是不可改的D.中断响应的次序是可灵活改变的 6.与虚拟存储器的等效访问速度无关 ..的是( ) A.访存页地址流B.页面替换算法 C.主存的容量D.辅存的容量 7.非线性流水线的特征是( ) A.一次运算中使用流水线中的多个功能段 B.一次运算中多次使用流水线中的某些功能段 C.流水线中某些功能段在各次运算中的作用不同 D.流水线的各功能段在不同的运算中可以有不同的连接 8.属于集中式共享存储器结构的SIMD计算机是( ) A.ILLIAC IV B.BSP C.CM-2 D.MP-1 1

计算机体系结构实验报告二

实验二结构相关 一、实验目得: 通过本实验,加深对结构相关得理解,了解结构相关对CPU性能得影响。 二、实验内容: 1、用WinDLX模拟器运行程序structure_d、s 。 2、通过模拟,找出存在结构相关得指令对以及导致结构相关得部件。 3、记录由结构相关引起得暂停时钟周期数,计算暂停时钟周期数占总执行 周期数得百分比。 4、论述结构相关对CPU性能得影响,讨论解决结构相关得方法。 三、实验程序structure_d、s LHI R2, (A>>16)&0xFFFF 数据相关 ADDUI R2, R2, A&0xFFFF LHI R3, (B>>16)&0xFFFF ADDUI R3, R3, B&0xFFFF ADDU R4, R0, R3 loop: LD F0, 0(R2) LD F4, 0(R3) ADDD F0, F0, F4 ;浮点运算,两个周期,结构相关 ADDD F2, F0, F2 ; < A stall is found (an example of how to answer your questions) ADDI R2, R2, #8 ADDI R3, R3, #8 SUB R5, R4, R2 BNEZ R5, loop ;条件跳转 TRAP #0 ;; Exit < this is a ment !! A: 、double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 B: 、double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 四、实验过程 打开软件,load structure_d、s文件,进行单步运行。经过分析,此程序一 次循环中共有五次结构相关。(Rstall 数据相关Stall 结构相关) 1)第一个结构相关:addd f2,,f0,f2 由于前面得数据相关,导致上一条指令addd f0,f0,f4暂停在ID阶段,所以下一条指令addd f2,,f0,f2发生结构相关,导致相关得部件:译码部件。

(完整版)计算机系统结构复习题(附答案)范文

计算机系统结构复习题和重点(附答案) 一、单项选择题 1.实现汇编语言源程序变换成机器语言目标程序是由() A.编译程序解释B.编译程序翻译 C.汇编程序解释D.汇编程序翻译 2.系列机软件必须保证() A.向前兼容,并向上兼容B.向前兼容,并向下兼容 C.向后兼容,力争向上兼容D.向后兼容,力争向下兼容 3.浮点数尾数基值r m=8,尾数数值部分长6位,可表示规格化正尾数的个数是()A.56个B.63个 C.64个D.84个 4.在IBM370系统中,支持操作系统实现多进程共用公用区管理最有效的指令是()A.“执行”指令B.“程序调用”指令 C.“比较与交换”指令D.“测试与置定”指令 5.关于非专用总线三种控制方式中,下列叙述错误 ..的是() A.集中式定时查询,所有部件共用同一条“总线忙”线 B.集中式定时查询,所有部件都用同一条“总线请求”线 C.集中式独立请求,所有部件都用同一条“总线请求”线 D.集中式串行链接,所有部件都用同一条“总线请求”线 6.磁盘外部设备适合于连接到() A.字节多路通道B.数组多路通道或选择通道 C.选择通道或字节多路通道D.数组多路通道或字节多路通道 7.在Cache存储器中常用的地址映象方式是() A.全相联映象B.页表法映象 C.组相联映象D.段页表映象 8.在指令级高度并行的超级处理机中,下列叙述正确的是() A.超标量处理机利用资源重复,要求高速时钟机制 B.超流水线处理机利用资源重复,要求高速时钟机制 C.超标量处理着重开发时间并行性,要求高速时钟机制 D.超流水线处理机着重开发时间并行性,要求高速时钟机制 9.间接二进制n方体网络是一种() A.多级立方体网络B.多级全排列网络

计算机体系结构试题汇总

计算机系统结构 姓名:学号: 一、简答题(每小题10分,共20分) 1.简述使用物理地址进行DMA存在的问题,及其解决办法。 2.从目的、技术途径、组成、分工方式、工作方式等5个方面对同构型多处理机和异构型多处理机做一比较(列表)。 二、(60分)现有如下表达式: Y=a ×X 其中:X和Y是两个有64个元素的32位的整数的向量,a为32位的整数。假设在存储器中,X和Y的起始地址分别为1000和5000,a的起始地址为6000。 1.请写出实现该表达式的MIPS代码。 2.假设指令的平均执行时钟周期数为5,计算机的主频为500 MHz,请计算上述MIPS 代码(非流水化实现)的执行时间。 3.将上述MIPS代码在MIPS流水线上(有正常的定向路径、分支指令在译码段被解析出来)执行,请以最快执行方式调度该MIPS指令序列。注意:可以改变操作数,但不能改变操作码和指令条数。画出调度前和调度后的MIPS代码序列执行的流水线时空图,计算调度前和调度后的MIPS代码序列执行所需的时钟周期数,以及调度前后的MIPS流水线执行的加速比。 4.根据3的结果说明流水线相关对CPU性能的影响。 三、(20分)请分析I/O对于性能的影响有多大?假设: 1.I/O操作按照页面方式进行,每页大小为16 KB,Cache块大小为64 B;且对应新页的地址不在Cache中;而CPU不访问新调入页面中的任何数据。 2.Cache中95%被替换的块将再次被读取,并引起一次失效;Cache使用写回方法,平均50%的块被修改过;I/O系统缓冲能够存储一个完整的Cache块。 3.访问或失效在所有Cache块中均匀分布;在CPU和I/O之间,没有其他访问Cache 的干扰;无I/O时,每1百万个时钟周期中,有15,000次失效;失效开销是30个时钟周期。如果替换块被修改过,则再加上30个周期用于写回主存。计算机平均每1百万个周期处理一页。

计算机系统结构试题及答案

计算机系统结构复习题 单选及填空: 计算机系统设计的主要方法 1、由上往下的设计(top-down) 2、由下往上的设计(bottom-up) 3、从中间开始(middle-out) Flynn分类法把计算机系统的结构分为以下四类: (1)单指令流单数据流 (2)单指令流多数据流 (3)多指令流单数据流 (4) 多指令流多数据流 堆栈型机器:CPU 中存储操作数的单元是堆栈的机器。 累加器型机器:CPU 中存储操作数的单元是累加器的机器。 通用寄存器型机器:CPU 中存储操作数的单元是通用寄存器的机器。 名词解释: 虚拟机:用软件实现的机器叫做虚拟机,但虚拟机不一定完全由软件实现,有些操作可以由硬件或固件(固件是指具有软件功能的固件)实现。 系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。 兼容机:它是指由不同公司厂家生产的具有相同系统结构的计算机。 流水线技术:将一个重复的时序过程,分解成为若干个子过程,而每一个子过程都可有效地在其专用功能段上与其它子过程同时执行。 单功能流水线:指流水线的各段之间的连接固定不变、只能完成一种固定功能的流水线。 多功能流水线:指各段可以进行不同的连接,以实现不同的功能的流水线。 顺序流水线:流水线输出端任务流出的顺序与输入端任务流入的顺序完全相同。 乱序流水线:流水线输出端任务流出的顺序与输入端任务流入的顺序可以不同,允许后进入流水线的任务先完成。这种流水线又称为无序流水线、错序流水线、异步流水线。 吞吐率:在单位时间流水线所完成的任务数量或输出结果的数量。 指令的动态调度:

是指在保持数据流和异常行为的情况下,通过硬件对指令执行顺序进行重新安排,以提高流水线的利用率且减少停顿现象。是由硬件在程序实际运行时实施的。 指令的静态调度: 是指依靠编译器对代码进行静态调度,以减少相关和冲突。它不是在程序执行的过程中、而是在编译期间进行代码调度和优化的。 超标量: 一种多指令流出技术。它在每个时钟周期流出的指令条数不固定,依代码的具体情况而定,但有个上限。 超流水:在一个时钟周期分时流出多条指令。 多级存储层次: 采用不同的技术实现的存储器,处在离CPU不同距离的层次上,各存储器之间一般满足包容关系,即任何一层存储器中的容都是其下一层(离CPU更远的一层)存储器中容的子集。目标是达到离CPU最近的存储器的速度,最远的存储器的容量。 写直达法: 在执行写操作时,不仅把信息写入Cache中相应的块,而且也写入下一级存储器中相应的块。写回法: 只把信息写入Cache中相应块,该块只有被替换时,才被写回主存。 集中式共享多处理机: 也称为对称式共享存储器多处理SMP。它一般由几十个处理器构成,各处理器共享一个集中式的物理存储器,这个主存相对于各处理器的关系是对称的, 分布式共享多处理机: 它的共享存储器分布在各台处理机中,每台处理机都带有自己的本地存储器,组成一个“处理机-存储器”单元。但是这些分布在各台处理机中的实际存储器又合在一起统一编址,在逻辑上组成一个共享存储器。这些处理机存储器单元通过互连网络连接在一起,每台处理机除了能访问本地存储器外,还能通过互连网络直接访问在其他处理机存储器单元中的“远程存储器”。 多Cache一致性: 多处理机中,当共享数据进入Cache,就可能出现多个处理器的Cache中都有同一存储器块的副本,要保证多个副本数据是一致的。 写作废协议: 在处理器对某个数据项进行写入之前,它拥有对该数据项的唯一的访问权 。 写更新协议: 当一个处理器对某数据项进行写入时,它把该新数据广播给所有其它Cache。这些Cache用该新数据对其中的副本进行更新。 机群:是一种价格低廉、易于构建、可扩放性极强的并行计算机系统。它由多台同构或异构

计算机系统结构考试题库及答案

计算机系统结构试题及答案 一、选择题(50分,每题2分,正确答案可能不只一个,可单选 或复选) 1.(CPU周期、机器周期)是内存读取一条指令字的最短时间。 2.(多线程、多核)技术体现了计算机并行处理中的空间并行。 3.(冯?诺伊曼、存储程序)体系结构的计算机把程序及其操作数 据一同存储在存储器里。 4.(计算机体系结构)是机器语言程序员所看到的传统机器级所具 有的属性,其实质是确定计算机系统中软硬件的界面。 5.(控制器)的基本任务是按照程序所排的指令序列,从存储器取 出指令操作码到控制器中,对指令操作码译码分析,执行指令操作。 6.(流水线)技术体现了计算机并行处理中的时间并行。 7.(数据流)是执行周期中从内存流向运算器的信息流。 8.(指令周期)是取出并执行一条指令的时间。 9.1958年开始出现的第二代计算机,使用(晶体管)作为电子器件。 10.1960年代中期开始出现的第三代计算机,使用(小规模集成电路、 中规模集成电路)作为电子器件。 11.1970年代开始出现的第四代计算机,使用(大规模集成电路、超 大规模集成电路)作为电子器件。 12.Cache存储器在产生替换时,可以采用以下替换算法:(LFU算法、 LRU算法、随机替换)。

13.Cache的功能由(硬件)实现,因而对程序员是透明的。 14.Cache是介于CPU和(主存、内存)之间的小容量存储器,能高 速地向CPU提供指令和数据,从而加快程序的执行速度。 15.Cache由高速的(SRAM)组成。 16.CPU的基本功能包括(程序控制、操作控制、时间控制、数据加 工)。 17.CPU的控制方式通常分为:(同步控制方式、异步控制方式、联合 控制方式)反映了时序信号的定时方式。 18.CPU的联合控制方式的设计思想是:(在功能部件内部采用同步控 制方式、在功能部件之间采用异步控制方式、在硬件实现允许的情况下,尽可能多地采用异步控制方式)。 19.CPU的同步控制方式有时又称为(固定时序控制方式、无应答控 制方式)。 20.CPU的异步控制方式有时又称为(可变时序控制方式、应答控制 方式)。 21.EPROM是指(光擦可编程只读存储器)。 22.MOS半导体存储器中,(DRAM)可大幅度提高集成度,但由于(刷 新)操作,外围电路复杂,速度慢。 23.MOS半导体存储器中,(SRAM)的外围电路简单,速度(快),但 其使用的器件多,集成度不高。 24.RISC的几个要素是(一个有限的简单的指令集、CPU配备大量的 通用寄存器、强调对指令流水线的优化)。

计算机系统结构(复习题)

《计算机系统结构》复习题(一) 一、单项选择题 1.同号相减或异号相加,阶差为1,只需要设置位警戒位。【】A.0 B. 1 C. 2 D. 3 2.计算机系统多级层次结构中,操作系统机器级的直接上层是【】A.传统机器级B.高级语言机器级 C.应用语言机器级D.汇编语言机器级 3.以下不.是设计RISC的原则的是【】A.指令多用硬联控制实现 B.指令条数多,通常超过100条 C.指令寻址方式一般不超过两种 D.所有指令都在一个机器周期内完成 4. 下列操作码的编码方法中,操作码平均长度最短的是:【】 A、固定长编码 B、Huffman编码 C、不等长扩展编码 D、等长扩展编码 5.在采用延迟转移技术时,在以下几种调度方法中,效果最好的是哪一种方法【】 A.将转移指令前的那条指令调度到延迟槽中 B.将转移目标处的那条指令调度到延迟槽中 C.将转移不发生时该执行的那条指令调度到延迟槽中 D.在延迟槽中填入NOP空操作指令 6.在以下输入输出控制器的管理方式中,外设的工作速度对计算机性能影响最小的是 【】 A. 程序控制轮询方式 B. 程序控制中断方式 C. 直接存储器访问方式 D. I/O处理机方式 7. 计算机系统多级层次结构中,操作系统机器级的直接上层是【】 A.传统机器级B.高级语言机器级 C.应用语言机器级D.汇编语言机器级 8.多处理机的互连方式采用总线形式的优点是【】 A.硬件成本低且简单 B.适用于处理机机数较多的场合 C.有很高的潜在通信速率 D.不便于改变系统硬件设置 9.浮点数尾数基值r m=8,尾数数值部分长6位,可表示规格化正尾数的个数是【】A.56个B.63个 C.64个D.84个

北邮计算机系统结构实验报告-实验一到五-WINDLX模拟器

北京邮电大学 实验报告 课程名称计算机系统结构 计算机学院03班 王陈(11)

目录 实验一WINDLX模拟器安装及使用......................................... 错误!未定义书签。 ·实验准备................................................................................ 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验内容及要求.................................................................... 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 ·实验总结............................................................................. 错误!未定义书签。实验二指令流水线相关性分析 ............................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 ·实验总结............................................................................. 错误!未定义书签。实验三DLX处理器程序设计 .................................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 A.向量加法代码及性能分析 ................................................... 错误!未定义书签。 B.双精度浮点加法求和代码及结果分析 .............................. 错误!未定义书签。 ·实验总结............................................................................. 错误!未定义书签。实验四代码优化 ....................................................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验原理................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 ·实验总结+实习体会........................................................... 错误!未定义书签。实验五循环展开 ....................................................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验原理................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 矩阵乘程序代码清单及注释说明........................................... 错误!未定义书签。 相关性分析结果........................................................................... 错误!未定义书签。 增加浮点运算部件对性能的影响........................................... 错误!未定义书签。 增加forward部件对性能的影响 ............................................ 错误!未定义书签。 转移指令在转移成功和转移不成功时候的流水线开销 .. 错误!未定义书签。 ·实验总结+实习体会+课程建议......................................... 错误!未定义书签。

《计算机体系结构》期末复习题标准答案

《计算机体系结构》期末复习题答案

————————————————————————————————作者:————————————————————————————————日期:

《计算机体系结构》期末复习题答案 系别_________ 班级_________ 姓名__________ 学号__________ 一、填空题(每空1分) 1.按照弗林(Flynn)分类法,计算机系统可以分为4类:SISD计算机、(SIMD计算机)、(MISD计算机)和(MIMD计算机)。 2. 改进之后的冯?诺依曼计算机的只要特点是存储器为中心,总线结构,分散控制。 3. 当前计算机系统中的存储系统是一个层次结构,其各层分别为:(通用寄存器,高速缓存,主存,辅存,脱机大容量存储器)。 4.高速缓冲存储器的地址映象方式有三种,它们分别是:(全向量方式,直接相联方式,组相联方式)。 5.虚拟存储器的三种管理方式是(段式管理,页式管理和段页式管理)。 6.目前计算机中常用数据有(用户定义数据,系统数据和指令数据)三种类型。 7.通常可能出现的流水线的相关性有(资源相关,数据相关和控制相关)。 8.解决中断引起的流水线断流的方法有(不精确断点法和精确断点法)。 9.目前向量处理机的系统结构有两种:(存储器-存储器型和寄存器-寄存器型)。 10.通用计算机基本指令分为5类,它们分别是:(数据传送类,运算类,程序控制类,输入输出类,处理机控制和调试类)。 11.执行指令x1=x2+x3;x4=x1-x5会引起(RAW)类型的数据相关,执行指令x5=x4*x3;x4=x0+x6会引起(W AR)类型的数据相关,执行指令x6=x1+x2;x6=x4*x5会引起(WA W)类型的数据相关。 12.多计算机网络中,通常出现的4种通信模式是(单播模式,选播模式,广播模式和会议模式)。 13.传统的冯?诺依曼计算机是以控制驱动方式工作,以数据驱动方式工作的典型计算机是(数据流计算机),以需求驱动方式工作的典型计算机是(归约机),以模式匹配驱动方式工作的典型计算机是(人工智能计算机)。 二、名词解释(每题2分) 1.计算机体系结构: 计算机系统结构就是计算机的机器语言程序员或编译程序编写者所看到的外特性,是硬件子系统的概念结构及其功能特性。 2.系列机: 所谓系列机是指同一厂家生产的具有相同的系统结构,但采取了不同的组成和实现的技术方案,形成了不同型号的多种机型。 3.模拟: 模拟是指用软件的方法在一台计算机上,实现另一台计算机的指令系统,被模拟的机器是不存在的,称为虚拟机,执行模拟程序的机器称宿主机。 4.程序的局部性原理: 程序访问局部性原理说明了计算机在程序执行过程中呈现出的一种规律,即程序往往重

计算机系统结构实验报告

计算机系统结构实验报告 一.流水线中的相关 实验目的: 1. 熟练掌握WinDLX模拟器的操作和使用,熟悉DLX指令集结构及其特点; 2. 加深对计算机流水线基本概念的理解; 3. 进一步了解DLX基本流水线各段的功能以及基本操作; 4. 加深对数据相关、结构相关的理解,了解这两类相关对CPU性能的影响; 5. 了解解决数据相关的方法,掌握如何使用定向技术来减少数据相关带来的暂停。 实验平台: WinDLX模拟器 实验内容和步骤: 1.用WinDLX模拟器执行下列三个程序: 求阶乘程序fact.s 求最大公倍数程序gcm.s 求素数程序prim.s 分别以步进、连续、设置断点的方式运行程序,观察程序在流水线中的执行情况,观察 CPU中寄存器和存储器的内容。熟练掌握WinDLX的操作和使用。 2. 用WinDLX运行程序structure_d.s,通过模拟找出存在资源相关的指令对以及导致资源相 关的部件;记录由资源相关引起的暂停时钟周期数,计算暂停时钟周期数占总执行周期数的 百分比;论述资源相关对CPU性能的影响,讨论解决资源相关的方法。 3. 在不采用定向技术的情况下(去掉Configuration菜单中Enable Forwarding选项前的勾选符),用WinDLX运行程序data_d.s。记录数据相关引起的暂停时钟周期数以及程序执行的 总时钟周期数,计算暂停时钟周期数占总执行周期数的百分比。 在采用定向技术的情况下(勾选Enable Forwarding),用WinDLX再次运行程序data_d.s。重复上述3中的工作,并计算采用定向技术后性能提高的倍数。 1. 求阶乘程序 用WinDLX模拟器执行求阶乘程序fact.s。这个程序说明浮点指令的使用。该程序从标准 输入读入一个整数,求其阶乘,然后将结果输出。 该程序中调用了input.s中的输入子程序,这个子程序用于读入正整数。 实验结果: 在载入fact.s和input.s之后,不设置任何断点运行。 a.不采用重新定向技术,我们得到的结果

上海大学 计算机系统结构复习题汇总

计算机系统结构复习题 一、单项选择题 1、直接执行微指令的是( C ) A.汇编程序B.编译程序 C.硬件D.微指令程序 2、对系统程序员不透明的应当是( D )。 A.Cache存贮器B.系列机各档不同的数据通路宽度C.指令缓冲寄存器D.虚拟存贮器 3、对机器语言程序员透明的是( B )。 A.中断字B.主存地址寄存器 C.通用寄存器D.条件码 4、计算机系统结构不包括( A )。 A.主存速度B.机器工作状态 C.信息保护D.数据 5、从计算机系统结构上讲,机器语言程序员所看到的机器属性是( C )。 A.计算机软件所要完成的功能B.计算机硬件的全部组成 C.编程要用到的硬件组织D.计算机各部件的硬件实现 6、计算机组成设计不考虑( B )。 A.专用部件设置B.功能部件的集成度 C.控制机构的组成D.缓冲技术 7、以下说法中,不正确的是( B )。 软硬件功能是等效的,提高硬件功能的比例会: A.提高解题速度B.提高硬件利用率 C.提高硬件成本D.减少所需要的存贮器用量 8、在系统结构设计中,提高软件功能实现的比例会( C )。 A.提高解题速度B.减少需要的存贮容量 C.提高系统的灵活性D.提高系统的性能价格比 9、下列说法中不正确的是( D )。 A.软件设计费用比软件重复生产费用高 B.硬件功能只需实现一次,而软件功能可能要多次重复实现 C.硬件的生产费用比软件的生产费用高 D.硬件的设计费用比软件的设计费用低 10、在计算机系统设计中,比较好的方法是( D )。 A.从上向下设计B.从下向上设计 C.从两头向中间设计D.从中间开始向上、向下设计11、"从中间开始"设计的"中间"目前多数是在( A )。 A.传统机器语言级与操作系统机器级之间 B.传统机器语言级与微程序机器级之间 C.微程序机器级与汇编语言机器级之间 D.操作系统机器级与汇编语言机器级之间 12、系列机软件应做到( B )。 A.向前兼容,并向上兼容 B.向后兼容,力争向上兼容

计算机体系结构实验报告二

实验二结构相关 一、实验目的: 通过本实验,加深对结构相关的理解,了解结构相关对CPU性能的影响。 二、实验内容: 1. 用WinDLX模拟器运行程序structure_d.s 。 2. 通过模拟,找出存在结构相关的指令对以及导致结构相关的部件。 3. 记录由结构相关引起的暂停时钟周期数,计算暂停时钟周期数占总执行 周期数的百分比。 4. 论述结构相关对CPU性能的影响,讨论解决结构相关的方法。 三、实验程序structure_d.s LHI R2, (A>>16)&0xFFFF 数据相关 ADDUI R2, R2, A&0xFFFF LHI R3, (B>>16)&0xFFFF ADDUI R3, R3, B&0xFFFF ADDU R4, R0, R3 loop: LD F0, 0(R2) LD F4, 0(R3) ADDD F0, F0, F4 ;浮点运算,两个周期,结构相关 ADDD F2, F0, F2 ; <- A stall is found (an example of how to answer your questions) ADDI R2, R2, #8 ADDI R3, R3, #8 SUB R5, R4, R2 BNEZ R5, loop ;条件跳转 TRAP #0 ;; Exit <- this is a comment !! A: .double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 B: .double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10

四、实验过程 打开软件,load structure_d.s文件,进行单步运行。经过分析,此程序一 次循环中共有五次结构相关。(R-stall 数据相关Stall- 结构相关) 1)第一个结构相关:addd f2,,f0,f2 由于前面的数据相关,导致上一条指令addd f0,f0,f4暂停在ID阶段,所以下一条指令addd f2,,f0,f2发生结构相关,导致相关的部件:译码部件。 2)第二个结构相关:ADDI R2, R2, #8,与第一个结构相关类似。由于数据相关, 上一条指令暂停在ID阶段,所以导致下一条指令发生结构相关。

相关主题
文本预览
相关文档 最新文档