当前位置:文档之家› 计算机系统结构(自考)

计算机系统结构(自考)

计算机系统结构(自考)
计算机系统结构(自考)

简答题

1、什么是系列机软件的向上兼容和向后兼容?

答:系列机软件的向上兼容指的是按某档机器编写的软件,不加修改就能运行于比它高档的机器上;

系列机软件的向后兼容指的是按某个时期投入市场的机器上编写的软件,不加修改就能运行于在它之后投入市场的机器上。

2、在机器中,确定和引入新的数据表示的基本原则是什么?

答:机器中确定和引入新的数据表示的基本原则是:除了基本的数据表示一般都应配置之外,对某些高级数据表示是否引入,一是看系统效率有否提高,即是否减少了实现的时间和存储的空间,实现空间有否减少又主要看在主存和处理机之间传送的信息量有否减少;二是看引入这种数据表示的通用性和利用率是否提高。

3、为了解决主存和CPU之间的速度差对机器性能的影响,会采取哪3种解决办法?

答:一是在CPU中设置通用寄存器,让运算直接在CPU的通用寄存器中进行,减少与主存的交往;二是采用存储器的多体交叉并行存取来提高主存的等效速度;三是在主存和CPU 之间增加速度高、容量小、每位价格高的Cache存储器。

4、CPU写Cache时会发生Cache与主存的对应副本内容不一致的问题,解决此问题有哪些方法?各需要增加什么开销?

答:用两种解决方法:

写回法:CPU只写入Cache,不写入主存,仅当Cache块替换时,才先写回主存后再替换,这种方法要求对每个Cache块增加一个修改的资源开销。

写直达法:CPU每次写Cache的同时,也经写直达通路写入主存,这种方法要增加写主存的时间开销。

5、流水线按级别分成几类?线性流水线和非线性流水线有什么区别?动态流水线和静态流水线有何区别?

答:流水线按级别可分为部件级、处理机级和系统级三级。

线性流水线段间无反馈或越过的通路,非线性流水线则有反馈回路或前越通路。

静态流水和动态流水都是多功能的流水。而静态流水线在某一时间内只能按一种功能联接流水,只有等流水线全部留空后,才能切换成按另一种功能联接流水(或静态流水必须等流水线排空后才可进行功能切换)。动态流水线按一种功能流水未完成之前,可重新开始另一种功能的流水。

6、标志符数据表示与描述符数据表示有什么不同?

答:标志符数据表示中,标志符是与每个数据相连的,而且合存在同一个存储单元中,用于描述单个数据的类型属性。

描述符数据表示中,数据描述符是与数据分开独立存放的,用于描述成块数据的类型属性、地址等信息的。

7、为什么要对中断类分成优先级?如何分级?

答:各中断源是相互独立而随机的发出中断请求的。当多个中断源同时发出中断请求时,CPU只能先响应和处理其中相对优先级别高的中断请求,因此需要对中断源的响应和处理安排一个优先顺序。

中断分成类后,同一类内部各中断请求的优先序一般由软件或通道来管理,而不同类的中断则要根据中断的性质、紧迫性、重要性等分成若干优先级,以便CPU可以有序的对这些中断请求进行响应和处理。

8、什么是堆栈式替换算法(用式子描述)。

答:满足一下两个关系式的替换算法就是堆栈式替换算法:

N

N>L t时,B t(n)=B t(n+1)

其中,n为分配给程序的实页数,B t(n)为t时刻在n个实页中的页面集合,L t为t时刻已处理过的不同虚页的页面数。

9、简述重叠解释方式中的“一次重叠”含义及采用“一次重叠”解释的两点主要好处。答:将指令的解释分为“分析”和“执行”两个阶段,任何时刻都只是“执行K”与“分析”在时间上重叠,让指令分析部件和指令执行部件同时在处理相邻的两条指令。

K+1

采用“一次重叠”使系统只要一套指令分析部件和一套指令执行部件,省了硬件,也简化了指令之间的相关控制。

10、流水机中,什么是全局性相关?处理办法有哪些?

答:全局性相关是指转移指令与其后续指令之间的相关,处理方法有:

1.猜测法:猜测其中一个分支继续流入,待条件码形成以后在决定是继续执行,还是作废,按另一分支重新流水。

2.提前形成转移所需的条件。

3.延迟转移,在编译生成目标指令程序时,将转移指令与其前面不相关的若干条指令交换位置。

4.加快短循环程序的处理。

11、设计指令系统时,以乘法运算为例,系统结构设计、计算机组成设计、计算机实现各考虑什么?

答:系统结构设计考虑是否要设置乘法指令;

计算机组成设计考虑是否要配置高速的乘法器;

计算机实现考虑乘法器、加法—移位器的物理实现。

12、总线控制方式有哪3种?各需要增加几根用于总线控制的控制线?总线控制优先级可否程序改变?

答:总线控制方式有串行链接、定时查询和独立请求3种。

串行链接需增加3根控制线,优先级连线固定,无灵活性,总线控制优先级不能用程序改变。

定时查询需增加2+[log2N]根控制线,优先级可用程序改变,灵活。

独立请求需增加2N+1根控制线,优先级可用程序改变,灵活。

13、简述流水机器处理全局性相关时,加快短循环程序的处理办法。

答:遇到分支时,判断是否为短循环,将整个循环体各指令一次性全部取入指令缓冲器,并暂停预取指令,以减少不必要的访存次数。同时让流水时的循环出口恒猜选循环分支。14、多处理机中的并行性表现在哪些方面?

答:多处理机主要实现作业之间、程序段之间、任务之间的并行,也可以包含有指令级、指令内部各微操作之间的并行。

15、简述页面失效频率(PFF)算法的思想。

答:页面失效频率替换算法是对LRU替换算法的改进。在程序的运行过程中,操作系统不断的根据所统计出的各道程序测页面失效率来动态调节分配各各道程序的实页数,给页面失效率很低的程序适当少分配一些实页,给页面失效率很高的程序适当多分配一些实页。16、未来10年里发展计算机系统的3T性能目标指的是什么?

答:计算机系统的3T性能目标是:CPU的计算能力为1TFLOPS(每秒1012次浮点操作)、主存容量为1TBYTE、I/O系统的带宽为1TBYTE/s(每秒1012字节)。

17、主存实际频宽与模数m的关系是什么?出现这种现象的原因是什么?指令流与数据流完全随机时,主存实际频宽与模数m有什么关系?

答:并行主存系统的实际频宽随模数m的增加会提高,但不是线性增加,随着模数m的增大,其实际频宽的增量越来越小。这是因为程序中的指令和数据并不是完全顺序的放置和被访问的,程序会有转移,数据分布有一定的随机性。如果指令流与数据流是完全随机的,主存实际频宽将随模数m的增大,大致成平方根的关系增大。

18、采用指令“一次重叠”解释时,什么情况会发生主存空间数相关?

答:主存空间数相关是在相邻指令之间出现了对主存同一单元要求在先的指令必须先完成写,在后的指令才能读的“先写后读”相关。

19、什么是大规模并行处理机MPP?什么叫机群系统?

答:大规模并行处理机MPP是用数百至数万个高性能、低成本的RISC微处理器通过互连网络互连,构成的SIMO或MIMO系统,适宜进行细或中粒度的大规模并行处理。

机群系统是将多个高性能工作站或高档微型机使用高速通信网络互连,构成的MIMO 系统,适宜进行中、粗粒度进程间的高效并行处理。

20、什么是流水线的速度瓶颈?消除流水线速度瓶颈的方法有哪两种?

答:流水线中经过时间最大的功能段就是流水线中的速度瓶颈。

消除流水线中的速度瓶颈的方法有:(1)将瓶颈子过程再细分;(2)将瓶颈子过程多套并联。

21、当浮点数尾数基值减小时,对机器数的表示会产生哪些影响?

①数的可表示范围变小;

②可表示数的总个数减少;

③数在数轴上的分布变密;

④机器数的精度提高;

⑤运算过程中的精度损失增大;

⑥运算速度有所降低。

22、通道分为哪三种类型?各适合连接什么类型的设备?

答:通道分字节多路、数组多路和选择3类通道。

字节多路通道适合于连接大量低速的字符设备,数组多路通道适合于连接告诉的设备,选择通道适合于连接中、高速的高优先级的设备。

23、对于Cache而言,什么是地址映像和地址变换?映像规则的选择依据是什么?

答:地址映像就是将每个主存块按什么规则装入Cache中;地址变换是每次访问Cache时怎样将主存地址变换成Cache地址。

映像规则的选择除了看所用硬件是否速度高、价格低外,还要看块冲突概率是否低、Cache空间利用率是否高。

24、多处理机在结构与并行性方面与阵列处理机有何不同?

答:在结构方面,阵列处理机的互连较规整,有一定专用性,互连的处理单元数量大;多处理机要采用更为灵活多变的结构,实现复杂的互连模式,互联的处理机数少。

在并行性方面,阵列处理机是操作级并行,是并行性的同时性;多处理机是作业、程序、任务级的并行,同时也包含有指令内部操作之间的并行,是并行性的并发性。

25、数据驱动

答:只要一条或一组指令所要求的操作数全部准备就绪,就可立即激发相应的指令或指令组执行。

26、简述计算机系统有中间开始设计的“中间”指的是什么地方?这样设计的好处是什么?答:“中间”是指多级层次结构中的软硬件交界面,目前是处于传统机器级和操作系统机器

级之间。

这样设计能合理的进行软硬件的功能分配,可为软件和应用提供更多更好的硬件支持,可使软硬件同时设计,缩短系统的设计周期。

27、采用哈夫曼编码,要求短码和长码之间要符合什么规则,才能唯一和立即解码?具体编码是否唯一?平均码长是否唯一?

答:采用哈夫曼编码,要求短码不是长码的前缀,才能唯一和立即解码。

具体编码并不唯一,但平均码长肯定是唯一的。

28、列举非专用总线控制中的独立请求方式的优点和缺点。

答:独立请求方式的优点是:(1)总显得分配速度高,不必检测哪个设备要求使用总线;(2)总线使用的优先序可由控制程序改变,灵活;(3)不会因部件故障而使系统瘫痪,可靠。

缺点是:(1)附加控制总线数多,需2N+1根;(2)价格高;(3)控制器复杂;(4)可扩充性差。

29、在页式虚拟存储器中,什么叫页面失效?什么叫页面争用?什么时候两者同时发生?什么时候两者不同时发生?

答:要访问的虚页不在实际主存中时,就会发生页面失效。当页面调入主存,主存中的页面位置全部已被其他虚页占用时,就会发生页面争用。当分配给程序的内存区已被全部占用之后,只要发生页面失效,就一定会发生页面争用。反之,发生页面失效,并不会发生页面争用。

30、流水机器的中断处理有哪两种方法?各有什么优缺点?

答:流水机器的中断处理有不精确断点法和精确断点法两种。

不精确断点法优点是控制简单,缺点是不利于程序的排错。

精确断点法优点是中断现场精确对应于发出中断的指令,有利于程序的排错,但不利之处是需要有大量的后援寄存器,硬件花费大。

31、并行性的含义是什么?包括哪两重含义?从计算机系统执行程序的角度出发,由低到高的并行级别有哪些?

答:同一时刻或同一时间间隔内可完成两种以上性质相同或不同的工作特性称为并行性。并行性包括同时性和并发性两重含义。

从计算机系统执行程序的角度出发,由低到高的并行级别有:指令内部各微操作之间的并行、指令之间的并行、人物或进程之间的并行、作业或程序之间的并行。

32、什么是高级语言机器?一般有哪两种方式实现?

答:高级语言机器是不需要编译即可运行高级语言程序的计算机。

高级语言机器一般有直接执行和间接执行两种形式。直接执行的高级语言机器是通过硬件或固件来解释执行,而间接执行的高级语言机器是经汇编后执行。

33、列举非专用总线控制中的定时查询方式的优点和缺点。

答:定时查询方式的优点是:(1)总线使用的优先序可由控制程序改变,灵活;(2)不会因部件故障而使系统瘫痪,可靠。

缺点是:(1)附加控制总线数多,需2+[log2N]根;(2)总线控制复杂,价格较高;(3)总线分配速度不高;(4)可扩充性差。

34、存储体系

答:存储体系是指在构成存储系统的几种不同的存储器之间,配上辅助软硬件或辅助硬件,使之从应用程序员的角度看,它们在逻辑上是一个整体。

35、采用指令“一次重叠”解释时,什么叫指令相关?如何处理?

答:指令相关是因为指令在程序的执行过程中允许被修改造成的,本条指令要等到之前的指令执行完成后才能形成。

解决的办法是规定指令在执行中不允许修改,如果用户需要修改时,可设置类似于IBM370的“执行”指令,将指令相关转换成操作数相关,统一按操作数相关来处理。36、何谓数据表示?它与数据结构有什么关系?

答:数据表示指的是能由机器硬件直接识别和引用的数据类型,主要表现在配置有哪些数据运算类指令和相应的运算部件。

数据结构要通过软件映像变换成机器中所具有的各种数据表示来实现。不同的数据表示可以为数据结构的实现提供不同的支持。因此数据结构和数据表示是软硬件之间的一个主要交界面。

37、现代计算机系统中,中断系统的软硬件功能是怎样分配的?为何这样分配?

答:中断响应的速度要求快,所以一般用硬件实现。中断的处理过程比较多样化,有的可能比较复杂,所以一般用软件实现,但可以增加某些硬件支持。

中断响应过程中,中断现场的保存和恢复用硬件实现(指保存最重要、最基本通用的硬件状态),所以保证有较快的中断响应速度的。另一部分现场,需要根据中断处理要求保存的内容及中断的具体处理用软件实现,以提高灵活性。

38、流水处理的主要技术途径是什么?在CPU中可以有哪两类流水?在存储系统或存储体系中举出两个应用流水的例子。

答:流水处理的主要技术途径时间重叠和功能部件专用化。

CPU内部可以有指令流水线和运算操作流水线。

在存储系统中,主存模m多体交叉对个分体的交叉访问是一种流水。存储体系中,Cache 存储器的查地址映像表和访物理Cache可以流水、1

39、多处理机常用哪些方式实现互连?各适合什么场合?写出三种即可。

答:互连方式包括:

①总线式互连:适合于处理机机数少、系统信息流量小、机数可扩充的才场合;

②环形互连:适合于使用高带宽的光纤通信、处理机机数不太多、系统系统信息流量较高、机数可扩充的场合;

③交叉开关互连:适合于处理机机数多、系统信息流量大、机数可扩充的场合;

④多端口处理器互连:适合于处理机机数少、系统信息流量较高、机数不能扩充的场合;

⑤开关枢纽结构:适合于处理机机数多、机数可扩充的分布式多处理机场合。

40、页式虚拟存储器的页面时怎样划分的?这样划分会使指令和数据发生什么情况?

北邮高级计算机系统结构实验二三四五

实验二指令流水线相关性分析 ·实验目的 通过使用WINDLX模拟器,对程序中的三种相关现象进行观察,并对使用专用通路,增加运算部件等技术对性能的影响进行考察,加深对流水线和RISC处理器的特点的理解。 ·实验原理: 指令流水线中主要有结构相关、数据相关、控制相关。相关影响流水线性能。·实验步骤 一.使用WinDLX模拟器,对做如下分析: (1)观察程序中出现的数据/控制/结构相关。指出程序中出现上述现象的指令组合。 (2)考察增加浮点运算部件对性能的影响。 (3)考察增加forward部件对性能的影响。 (4)观察转移指令在转移成功和转移不成功时候的流水线开销。 ·实验过程 一.使用WinDLX模拟器,对做如下分析: } 浮点加、乘、除部件都设置为1,浮点数运算部件的延时都设置为4,如图1: 图1 初始设置 将和加载至WinDLX中,如图2示。

图2 加载程序 1.观察程序中出现的数据/控制/结构相关;指出程序中出现上述现象的指令组合。 1)数据相关 点击F7,使程序单步执行,当出现R-Stall时停止,运行过程中出现下图3所示,输入整数6。 图3 输入整数6 @ 打开Clock Diagram,可以清楚的看到指令执行的流水线如图4所示。 图4 指令流水线 双击第一次出现R-Stall的指令行,如图5所示。

图5 指令详细信息 对以上出现的情况分析如下: 程序发生了数据相关,R-Stall(R-暂停)表示引起暂停的原因是RAW。 lbu r3,0×0(r2) 要在WB周期写回r3中的数据;而下一条指令 & seqi r5,r3,0×a 要在intEX周期中读取r3中的数据。 上述过程发生了WR冲突,即写读相关。为了避免此类冲突, seq r5,r4,0×a的intEX指令延迟了一个周期进行。 由此,相关指令为: 2)控制相关 由图6可以看出,在第4时钟周期:第一条指令处于MEM段,第二条命令处于intEX段,第三条指令出于aborted状态,第四条命令处于IF段。 图 6 指令流水线 }

自考计算机系统结构试题及答案解析

自考计算机系统结构试题及答案解析

4月高等教育自学考试全国统一命题考试 计算机系统结构试卷 (课程代码02325) 本试卷共3页,满分l00分,考试时间l50分钟。考生答题注意事项: 1.本卷所有试题必须在答题卡上作答。答在试卷上无效,试卷空白处和背面均可作草稿纸. 2.第一部分为选择题。必须对应试卷上的题号使用2B铅笔将“答题卡”的相应代码涂黑。3.第二部分为非选择题。必须注明大、小题号,使用0.5毫米黑色字迹签字笔作答。 4.合理安排答题空间,超出答题区域无效。 第一部分选择题 一、单项选择题(本大题共10小题,每小题1分,共10分) 在每小题列出的四个备选项中只有一个是符合题目要求的,请将其选出并将“答题卡” 的相应代码涂黑。未涂、错涂或多涂均无分。1.以软件为主实现的机器称为p26 A.模型机器B.模拟机 C.虚拟机器

D.实际机器 2.下列关于系列机软件兼容描述正确的是p40 A.系列机软件必须保证向后兼容,力争向前兼容 B.系列机软件必须保证向下兼容,力争向前兼容 C.系列机软件必须保证向前兼容,力争向上兼容 D.系列机软件必须保证向下兼容,力争向后兼容 3.浮点数阶值采用二进制p位、尾数基值位r m,则该浮点数的最大阶值为p63 A.2p B.2p-1 C.2p-1 D.2p-1-1 4.为了使任何时候所需的信息都只用一个存储周期访问到,信息在主存中存放的地址要求是p73 A.地址最低位为0 B.地址最高位为0 C.该信息宽度的一半

D.该信息宽度的整数倍 5.存储器的最大频宽是指p98 A.存储器瞬时访问的频宽 B.存储器最大的传输速率 C.存储器连续访问时的频宽 D.存储器的实际传输速率 6.总线控制定时查询方式的控制线的线数为p111 A.┌log2N┐B.1+┌log2N ┐ C.2+┌log2N┐D.3+┌log2N┐ 7. 存储层次构成的主要依据是p127 A.CPU的速度B.主存器件 C.程序设计语言D.程序的局部性 8.相联存储器的访问依据是 A.内容B.地址 C.速度D.周期

计算机体系结构实验报告二

实验二结构相关 一、实验目得: 通过本实验,加深对结构相关得理解,了解结构相关对CPU性能得影响。 二、实验内容: 1、用WinDLX模拟器运行程序structure_d、s 。 2、通过模拟,找出存在结构相关得指令对以及导致结构相关得部件。 3、记录由结构相关引起得暂停时钟周期数,计算暂停时钟周期数占总执行 周期数得百分比。 4、论述结构相关对CPU性能得影响,讨论解决结构相关得方法。 三、实验程序structure_d、s LHI R2, (A>>16)&0xFFFF 数据相关 ADDUI R2, R2, A&0xFFFF LHI R3, (B>>16)&0xFFFF ADDUI R3, R3, B&0xFFFF ADDU R4, R0, R3 loop: LD F0, 0(R2) LD F4, 0(R3) ADDD F0, F0, F4 ;浮点运算,两个周期,结构相关 ADDD F2, F0, F2 ; < A stall is found (an example of how to answer your questions) ADDI R2, R2, #8 ADDI R3, R3, #8 SUB R5, R4, R2 BNEZ R5, loop ;条件跳转 TRAP #0 ;; Exit < this is a ment !! A: 、double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 B: 、double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 四、实验过程 打开软件,load structure_d、s文件,进行单步运行。经过分析,此程序一 次循环中共有五次结构相关。(Rstall 数据相关Stall 结构相关) 1)第一个结构相关:addd f2,,f0,f2 由于前面得数据相关,导致上一条指令addd f0,f0,f4暂停在ID阶段,所以下一条指令addd f2,,f0,f2发生结构相关,导致相关得部件:译码部件。

自考计算机系统结构考前复习资料

自考计算机系统结构考前复习资料

第一章计算机系统结构的基本概念 从处理数据的角度看,并行级别有位串字串,位并字串,位片串字并,全并行。位串字串和位并字串基本上构成了SIMD。位片串字并的例子有:相联处理机STARAN,MPP。全并行的例子有:阵列处理机ILLIAC IV。 从加工信息的角度看,并行级别有存储器操作并行,处理器操作步骤并行,处理器操作并行,指令、任务、作业并行。 存储器操作并行是指能够在一个存储周期内并行读出多个CPU字的,采用单体多字、多体单字或多体多字的交叉访问主存系统,进而采用按内容访问方式,位片串字并或全并行方式,在一个主存周期内实现对存储器中大量字的高速并行操作。例子有并行存储器系统,以相联存储器为核心构成的相联处理机。 处理器操作步骤并行是指在并行性概念中引入时间因素,让多个处理过程在时间上错开,轮流重复地执行使用同一套设备的各个部分,加快硬件周转来赢得速度。例子有流水线处理机。 处理器操作并行是指一个指令部件同时控制

多个处理单元,实现一条指令对多个数据的操作。擅长对向量、数组进行处理。例子有阵列处理机。 指令、任务、作业并行是指多个独立的处理机分别执行各自的指令、任务、作业。例子有多处理机,计算机网络,分布处理系统。 并行性的开发途径有时间重叠(Time Interleaving),资源重复(Resource Replication),资源共享(Resource Sharing)。 时间重叠是指在并行性概念中引入时间因素,让多个处理过程在时间上错开,轮流重复地执行使用同一套设备的各个部分,加快硬件周转来赢得速度。例子有流水线处理机。 资源重复是指一个指令部件同时控制多个处理单元,实现一条指令对多个数据的操作。例子有阵列处理机,相联处理机。 资源共享是指用软件方法让多个用户按一定时间顺序轮流使用同一套资源以提高资源的利用率,从而提高系统性能。例子有多处理机,计算机网络,分布处理系统。 SISD:一个指令部件控制一个操作部件,实现一

计算机系统结构第一章自考练习题答案

第一章计算机系统结构的基本概念 历年真题精选 1. 下列对系统程序员不透明的是()。 A. 乘法器 B. 先行进位链 C. 指令缓冲器 D. 条件码寄存器2.“从中间开始”设计的“中间”目前多数是在( D )。 A. 微程序机器级与汇编语言机器级之间 B. 操作系统机器级与汇编语言机器级之间 C. 传统机器语言机器级与微程序机器级之间 D. 传统机器语言机器级与操作系统机器级之间 3. 开发计算机系统结构并行性的主要技术途径有时间重叠、(资源重复)和(资源 共享)。 4. 计算机系统弗林分类法,把计算机系统分成单指令流单数据流(SISD)、单指令流多数 据流(SIMD)、(多指令流单数据流(MISD))和(多指令流多数据流(MIMD))四大类。 5. 设计指令系统时,以乘法运算为例,简述系统结构设计、计算机组成设计、计算机实现 各应考虑的问题。( P4) 6. 实现软件移植的途径有哪些各受什么限制( P14) 同步强化练习 一.单项选择题。 1. 实现汇编语言源程序变换成机器语言目标程序是由( C )。 A. 编译程序翻译 B. 编译程序解释 C. 汇编程序翻译 D. 汇编程序解释 2. 系列机软件应做到( B ) A. 向前兼容,并向下兼容 B. 向后兼容,力争向上兼容 C. 向前兼容,并向上兼容 D. 向后兼容,力争向下兼容 3. 在计算机系统多级层次结构中,机器级由低到高,相对顺序正确的应当是( B )。 A. 传统机器语言、汇编语言、操作系统 B. 微程序、传统机器语言、高级语言 C. 高级语言、汇编语言、传统机器语言 D. 传统机器语言、应用语言、高级语言 4. 可以直接执行微指令的是( C )。 A. 编译程序 B. 微程序 C. 硬件 D. 汇编程序 5. 计算机系统结构不包括( A )。 A. 主存速度 B. 数据表示 C. 机器工作状态 D. 信息保护 6. 对计算机系统结构透明的是()。 A. 是否使用通道型I/0处理机 B. 虚拟存储器 C. 字符行运算指令 D. VLSI技术 7. 在主存设计上,属计算机系统结构考虑的应是( C )。 A. 频宽的确定 B. 多体交叉还是单体 C. 容量和编址单位 D. 用MOS还是TTL 8. 计算机组成设计不考虑( B )。 A. 缓冲技术 B. 功能部件的集成度 C. 专用部件设置 D. 控制机构的组成

北邮计算机系统结构实验报告-实验一到五-WINDLX模拟器

北京邮电大学 实验报告 课程名称计算机系统结构 计算机学院03班 王陈(11)

目录 实验一WINDLX模拟器安装及使用......................................... 错误!未定义书签。 ·实验准备................................................................................ 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验内容及要求.................................................................... 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 ·实验总结............................................................................. 错误!未定义书签。实验二指令流水线相关性分析 ............................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 ·实验总结............................................................................. 错误!未定义书签。实验三DLX处理器程序设计 .................................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 A.向量加法代码及性能分析 ................................................... 错误!未定义书签。 B.双精度浮点加法求和代码及结果分析 .............................. 错误!未定义书签。 ·实验总结............................................................................. 错误!未定义书签。实验四代码优化 ....................................................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验原理................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 ·实验总结+实习体会........................................................... 错误!未定义书签。实验五循环展开 ....................................................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验原理................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 矩阵乘程序代码清单及注释说明........................................... 错误!未定义书签。 相关性分析结果........................................................................... 错误!未定义书签。 增加浮点运算部件对性能的影响........................................... 错误!未定义书签。 增加forward部件对性能的影响 ............................................ 错误!未定义书签。 转移指令在转移成功和转移不成功时候的流水线开销 .. 错误!未定义书签。 ·实验总结+实习体会+课程建议......................................... 错误!未定义书签。

自考计算机系统结构考前复习资料

第一章计算机系统结构的基本概念 从处理数据的角度看,并行级别有位串字串,位并字串,位片串字并,全并行。位串字串和位并字串基本上构成了SIMD。位片串字并的例子有:相联处理机STARAN,MPP。全并行的例子有:阵列处理机ILLIAC IV。 从加工信息的角度看,并行级别有存储器操作并行,处理器操作步骤并行,处理器操作并行,指令、任务、作业并行。 存储器操作并行是指可以在一个存储周期内并行读出多个CPU字的,采用单体多字、多体单字或多体多字的交叉访问主存系统,进而采用按内容访问方式,位片串字并或全并行方式,在一个主存周期内实现对存储器中大量字的高速并行操作。例子有并行存储器系统,以相联存储器为核心构成的相联处理机。 处理器操作步骤并行是指在并行性概念中引入时间因素,让多个处理过程在时间上错开,轮流重复地执行使用同一套设备的各个部分,加快硬件周转来赢得速度。例子有流水线处理机。 处理器操作并行是指一个指令部件同时控制多个处理单元,实现一条指令对多个数据的操作。擅长对向量、数组进行处理。例子有阵列处理机。 指令、任务、作业并行是指多个独立的处理机分别执行各自的指令、任务、作业。例子有多处理机,计算机网络,分布处理系统。 并行性的开发途径有时间重叠(Time Interleaving),资源重复(Resource Replication),资源共享(Resource Sharing)。 时间重叠是指在并行性概念中引入时间因素,让多个处理过程在时间上错开,轮流重复地执行使用同一套设备的各个部分,加快硬件周转来赢得速度。例子有流水线处理机。 资源重复是指一个指令部件同时控制多个处理单元,实现一条指令对多个数据的操作。例子有阵列处理机,相联处理机。 资源共享是指用软件方法让多个用户按一定时间顺序轮流使用同一套资源以提高资源的利用率,从而提高系统性能。例子有多处理机,计算机网络,分布处理系统。 SISD:一个指令部件控制一个操作部件,实现一条指令对一个数据的操作。例子有传统的单处理机 SIMD:一个指令部件同时控制多个处理单元,实现一条指令对多个数据的操作。例子有阵列处理机,相联处理机。 MIMD:多个独立的处理机分别执行各自的指令、任务、作业,实现指令、任务、作业并行的多机系统,是多个SISD的集合,也称多倍SISD系统(MSISD)。例子有多处理机,计算机网络,分布处理系统。 exercises: 1.有一台经解释实现的计算机,可以按功能划分成4级,每一级为了执行一条指令,需要下一级的N条指令来解释。如果执行第1级的一条指令要Kns时间,那么执行第2、第3和第4级的一条指令各需要用多少时间? 解答:执行第2、第3和第4级的一条指令各需要KNns、KN^2ns、KN^3ns的时间。 1.有一个计算机系统可按功能分成4级,每级的指令互不相同,每一级的指令都比其下一级的指令在效能上强M倍,即第i级的一条指令能完成第i-1级的M条指令的计算量。现若需第i级的N条指令解释第i+1级的一条指令,而有一段第1级的程序需要运行Ks,问在第2、3和4级上一段等效程序各需要运行多长时间? 答:第2级上等效程序需运行:(N/M)*Ks。第3级上等效程序需运行:(N/M)*(N/M)*Ks。第4级上等效程序需运行:(N/M)*(N/M)*(N/M)*Ks。 note: 由题意可知:第i级的一条指令能完成第i-1级的M条指令的计算量。而现在第i 级有N条指令解释第i+1级的一条指令,那么,我们就可以用N/M来表示N/M 表示第i+1级

计算机系统结构作业答案第三章(张晨曦)

3.1 -3.3为术语解释等解答题。 3.4 设一条指令的执行过程分为取指令,分析指令和执行指令3个阶段,每个阶段所需时间分别为ΔT, ΔT, 2ΔT,分别求出下列各种情况下,连续执行N条指令所需的时间。 (1) 顺序执行方式 (2) 只有“取指令”与“执行指令”重叠 (3) “取指令”,“分析指令”与“执行指令”重叠 解: (1) 4NΔT (2) (3N+1) ΔT (3) 2(N+1) ΔT 3.6 解决流水线瓶颈问题有哪两种常用方法? 解: (1) 细分瓶颈段 将瓶颈段细分为若干个子瓶颈段 (2) 重复设置瓶颈段 重复设置瓶颈段,使之并行工作,以此错开处理任务 3.9 列举下面循环中的所有相关,包括输出相关,反相关,真数据相关。 for(i = 2; i < 100; i=i+1) { a[i] = b[i] + a[i]; -----(1) c[i+1] = a[i] + d[i]; -----(2) a[i-1] = 2*b[i]; -----(3) b[i+1] = 2*b[i]; -----(4) } 解: 输出相关:第k次循环时(1)与第k+1轮时(3) 反相关:第k次循环时(1)和(2)与第k-1轮时(3) 真数据相关:每次循环(1)与(2),第k次循环(4)与k+1次循环(1),(3),(4) 3.12 有一指令流水线如下所示 50ns 50ns 100ns 200ns (1)求连续如入10条指令的情况下,该流水线的实际吞吐率和效率 (2)该流水线的“瓶颈”在哪一段?请采用两种不同的措施消除此“瓶颈”。对于你所给出 的两种新的流水线连续输入10条指令时,其实际吞吐率和效率各是多少? 解:(1)(m表示流水线级数,n 表示任务数)

计算机系统结构实验报告

计算机系统结构实验报告 一.流水线中的相关 实验目的: 1. 熟练掌握WinDLX模拟器的操作和使用,熟悉DLX指令集结构及其特点; 2. 加深对计算机流水线基本概念的理解; 3. 进一步了解DLX基本流水线各段的功能以及基本操作; 4. 加深对数据相关、结构相关的理解,了解这两类相关对CPU性能的影响; 5. 了解解决数据相关的方法,掌握如何使用定向技术来减少数据相关带来的暂停。 实验平台: WinDLX模拟器 实验内容和步骤: 1.用WinDLX模拟器执行下列三个程序: 求阶乘程序fact.s 求最大公倍数程序gcm.s 求素数程序prim.s 分别以步进、连续、设置断点的方式运行程序,观察程序在流水线中的执行情况,观察 CPU中寄存器和存储器的内容。熟练掌握WinDLX的操作和使用。 2. 用WinDLX运行程序structure_d.s,通过模拟找出存在资源相关的指令对以及导致资源相 关的部件;记录由资源相关引起的暂停时钟周期数,计算暂停时钟周期数占总执行周期数的 百分比;论述资源相关对CPU性能的影响,讨论解决资源相关的方法。 3. 在不采用定向技术的情况下(去掉Configuration菜单中Enable Forwarding选项前的勾选符),用WinDLX运行程序data_d.s。记录数据相关引起的暂停时钟周期数以及程序执行的 总时钟周期数,计算暂停时钟周期数占总执行周期数的百分比。 在采用定向技术的情况下(勾选Enable Forwarding),用WinDLX再次运行程序data_d.s。重复上述3中的工作,并计算采用定向技术后性能提高的倍数。 1. 求阶乘程序 用WinDLX模拟器执行求阶乘程序fact.s。这个程序说明浮点指令的使用。该程序从标准 输入读入一个整数,求其阶乘,然后将结果输出。 该程序中调用了input.s中的输入子程序,这个子程序用于读入正整数。 实验结果: 在载入fact.s和input.s之后,不设置任何断点运行。 a.不采用重新定向技术,我们得到的结果

计算机体系结构自考

全国 2004年 7月高等教育自学考试 计算机系统结构试卷 课程代码:02325 一、单项选择题( 在每小题的四个备选答案中,选出一个正确答案,并将正确答案的 序号填在题干的括号内。每小题2分,共20 分) 1.软件和固件的功能在逻辑上是 ( )的。 A.固件优于软件 B.不等价 C.等价 D.软件优于固件 2.( )编写者看到的逻辑结构和功能能力就是计算机的外部特性。 A.操作系统 B.汇编语言程序 C.Windows NT D.微程序 3.RISC 计算机的指令系统集类型是 ( )。 A. 堆栈型 B.累加器型 C.寄存器—寄存器型 D.寄存器-存储器型 4.主存储器的 ( )要求属于外特性。 A. 容量大小 B.速度 C.页面组织 D.带宽 5.在采用延迟转移技术时,在以下几种调度方法中,效果最好的是哪一种方法 ?( ) A.将转移指令前的那条指令调度到延迟槽中 B.将转移目标处的那条指令调度到延迟槽中 C.将转移不发生时该执行的那条指令调度到延迟槽中 D.在延迟槽中填入 NOP 空操作指令 6.设 8个处理器编号分别为 0,1,2?,7用 Cube2互联函数时,第 5号处理机与第 ( 处理机相联。 A.1 B.3 C.4 D.6 7.大型计算机和小型计算机的主要区别在于 ( )。 A.大型机运行速度比小型机快得多 B.大型机能够控制大量的外设 C.大型机具有图型终端和图形处理能力 D.大型机的外存经管能力超过小型机 8.在以下总线规范中,哪一种总线具有与设备和主机无关的高级命令系统 ?( ) A.IDE B.AT C.SCSI D.PCI )号)。 1 / 5

计算机体系结构实验报告二

实验二结构相关 一、实验目的: 通过本实验,加深对结构相关的理解,了解结构相关对CPU性能的影响。 二、实验内容: 1. 用WinDLX模拟器运行程序structure_d.s 。 2. 通过模拟,找出存在结构相关的指令对以及导致结构相关的部件。 3. 记录由结构相关引起的暂停时钟周期数,计算暂停时钟周期数占总执行 周期数的百分比。 4. 论述结构相关对CPU性能的影响,讨论解决结构相关的方法。 三、实验程序structure_d.s LHI R2, (A>>16)&0xFFFF 数据相关 ADDUI R2, R2, A&0xFFFF LHI R3, (B>>16)&0xFFFF ADDUI R3, R3, B&0xFFFF ADDU R4, R0, R3 loop: LD F0, 0(R2) LD F4, 0(R3) ADDD F0, F0, F4 ;浮点运算,两个周期,结构相关 ADDD F2, F0, F2 ; <- A stall is found (an example of how to answer your questions) ADDI R2, R2, #8 ADDI R3, R3, #8 SUB R5, R4, R2 BNEZ R5, loop ;条件跳转 TRAP #0 ;; Exit <- this is a comment !! A: .double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 B: .double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10

四、实验过程 打开软件,load structure_d.s文件,进行单步运行。经过分析,此程序一 次循环中共有五次结构相关。(R-stall 数据相关Stall- 结构相关) 1)第一个结构相关:addd f2,,f0,f2 由于前面的数据相关,导致上一条指令addd f0,f0,f4暂停在ID阶段,所以下一条指令addd f2,,f0,f2发生结构相关,导致相关的部件:译码部件。 2)第二个结构相关:ADDI R2, R2, #8,与第一个结构相关类似。由于数据相关, 上一条指令暂停在ID阶段,所以导致下一条指令发生结构相关。

高等计算机体系结构考题部分答案整理与分析(1).

高等计算机体系结构考题部分答案整理与分析(1) ——2002年高体考试真题解析1.填空题 1)第一台通用流水线计算机是:Stretch,即IBM7030 解析:主要是考察流水线技术的相关背景。最早实现流水线技术的计算机应该是使用Stretch,即IBM7030,使用流水线实现了重叠取指令、译码和执 行。其中还设计了避免冲突的ALU旁路技术。在1964年发布了CDC6600是使 用记分板技术实现动态调度流水线机制的机器。而使用保留站机制的Tomasulo 算法是在IBM 360/91中使用的。知识来源于本科课件第二讲 2)有效检测N位加法溢出的方法是: 察看输入最高位的进位是否等于最高位输出的进位 解析:该知识来自本科计算器加减法运算的相关知识。溢出指运算的结果超出了正常的表示范围。加法溢出只可能出现在两个同为正数或同为负数相加 才可以实现。可用以下方法检测:察看输入最高位的进位是否等于最高位输出 的进位。若不相等则容易知道该数据溢出。 3)时间局部性是指: 如果一个信息项正在被访问,那么近期它还会再被访问 解析:考察流水线及性能改进基础——局部性原理。局部性原理:CPU访问存储器时,无论取指令或者存取数据,访问存储单元都趋向于聚集在一个较 小的连续区域中。局部性原理包含时间局部性和空间局部性。时间局部性指 如果一个信息项正在被访问,那么近期它还会再被访问。原因:由程序循环和 堆栈技术造成的。空间局部性指在最近的将来用到的信息很可能在现在正在使 用的信息在空间地址上临近。原因:由指令顺序执行和数组存放造成。 4)流水线存在的三种相关是:数据相关、名字相关和控制相关 解析:考察指令级并行技术的基础相关知识。相关性是程序的特性,一个相关 是否会导致实际的冒险,该冒险是否会造成停顿,这是流水线结构的基本特征。 指令共有三种不同类型的相关:数据相关、名字相关和控制相关。 2.辨析题 1)加深流水线级数一定可以提升处理器性能。 这句话说法不对。当然在一定条件下加深流水线的级数可以加快流水线处理的 并行度,从而提高处理器的性能。但超过一定限度后,流水线级数无法无限制 地增加并提高处理性能。影响和限制流水线级数来提高性能的因素如下:1)指 令流的并行度有限,当流水线级数增加,即流水线深度增加时,因为相关引起 停顿将最终造成CPI的增加。更深的流水线会造成时钟周期的下降,并受到时 钟扭斜和负载的限制。 2)增加页面大小一定可以提升系统整体性能。 这句话说得不对。由于RAM价格下降,存储器变得更大;处理器和存储器之间 的速度差别更大,因此必须增加页面大小。但增加页面大小会使存储器中的内 部碎片变得严重,从而浪费很多存储空间。因此增加页面大小不一定可以提升 系统整体性能。

计算机系统结构实验教程

实验一流水线及流水线中的冲突 实验目的 1.加深对计算机流水线基本概念的理解; 2.理解MIPS结构如何用5段流水线来实现,理解各段的功能和基本操作; 3.加深对数据冲突、结构冲突的理解,理解这两类冲突对CPU性能的影响; 4.进一步理解解决数据冲突的方法,掌握如何应用定向技术来减少数据冲突引起的停顿。 5.加深对指令调度和延迟分支技术的理解; 6.熟练掌握用指令调度技术来解决流水线中的数据冲突的方法; 7.进一步理解指令调度技术和延迟分支技术对CPU性能的改进。 实验平台 指令级和流水线操作级模拟器MIPSsim, 实验内容和步骤 首先要掌握MIPSsim模拟器的使用方法。 一、流水线及流水线中的冲突观察 1. 启动MIPSsim。 2.根据预备知识中关于流水线各段操作的描述,进一步理解流水线窗口中各段的功能,掌握各流水寄存器的含义。(用鼠标双击各段,就可以看到各流水寄存器的内容) 3. 熟悉MIPSsim模拟器的操作和使用方法。 可以先载入一个样例程序(在本模拟器所在的文件夹下的“样例程序”文件夹中),然后分别以单步执行一个周期、执行多个周期、连续执行、设置断点等的方式运行程序,观察程序的执行情况,观察CPU中寄存器和存储器的内容的变化,特别是流水寄存器内容的变化。 4. 勾选配置菜单中的“流水方式”,使模拟器工作于流水方式下。 5.观察程序在流水线中的执行情况,步骤如下: (1)用MIPSsim的“文件”菜单中的“载入程序”来加载pipeline.s(在模拟器所在文 件夹下的“样例程序”文件夹中); (2)关闭定向功能。这是通过在“配置”菜单中去选“定向”(即使得该项前面没有“√” 号)来实现的; (3)用单步执行一周期的方式(“执行”菜单中,或用F7)执行该程序,观察每一周 期中,各段流水寄存器内容的变化、指令的执行情况(代码窗口)以及时钟周期 图; (4)当执行到第10个时钟周期时,各段分别正在处理的指令是: IF: ID:

自考计算机系统结构试题-小炒

一、选择题 1、对汇编语言程序员,下列(A )不是透明的。 A: 中断字寄存器 B: 乘法器 C: 移位器 D: 指令缓冲器 2、假设对A机器指令系统的每条指令的解释执行可直接由B机 器的一段微程序解释执行,则A称为(D )。 A: 仿真机 B: 宿主机 C: 虚拟机 D: 目标机 3、 1. 查看下面三条指令:V3←A;V2←V0+V1;V4←V2*V3;假 设向量长度小于64,且前后其他的指令均没有相关性,数据进入和 流出每个功能部件,包括访问存储器都需要一拍的时间,假设向 量的长度为N。三条指令全部采用串行的方法,那么执行的时间是:A: 3N+20 B: 3N+21 C: 3N+22 D: 3N+23 4、某向量处理机有16个向量寄存器,其中V0-V5种分别存放有 向量A,B,C,D,E,F,向量的长度是8,向量各元素均为浮点数;处理 部件采用两个单功能流水线,加法功能部件时间为2拍,乘法功 能部件时间为3拍。采用类似CRAY-1的链接技术,先计算(A+B)*C, 在流水线不停的情况下,接着计算(D+E)*F。求此链接流水线的通 过时间是多少拍?(设寄存器出入各需1拍) A: 8 B: 9 C: 17 D: 18 5、设有一个4个处理器的MIMD系统,假设在系统中访存取指和 取数的时间可以忽略不计;加法与乘法分别需要2拍和4拍;在 MIMD系统中处理器(机)之间每进行一次数据传送的时间为1拍; 在MIMD系统中,每个PE都可以和其它PE有直接的的通路。 求利用此系统计算表达式所需 的节拍数。 A: 23 B: 12 C: 11 D: 10 6、以下哪些是周期窃取方式的特点? A : 硬件结构简单 B : 硬件结构复杂 C : 数据输入或输出过程中占用了CPU时间 D : 数据输入或输出过程中不占用CPU时间 7、从下列有关Cache的描述中,选出应填入空格中的正确答案: (1)今有甲、乙两台计算机,甲计算机的Cache存取时间为50ns, 主存储器为2us;乙计算机的Cache存储时间为100ns,主存储器 为1.2us。设Cache的命中率均为95%,则甲计算机的平均存取 时间为__A_ns;乙计算机的平均存取时间为__B_ns。 (2)在Cache中,经常采用直接映象或组相联映象两种方式,在 Cache容量相等的情况下,前者比后者的命中率__C__。 选项 A : 147.5 153.5 155 180 选项 B : 147.5 153.5 155 180 选项 C : 高低相等 8、有研究人员指出,如果在采用通用寄存器指令集结构的计算 机里加入寄存器—存储器寻址方式可能提高计算机效率,做法就 是用指令ADD R2,0(Rb)代替指令序列LOAD R1,0(Rb) ADD R2,R2,R1假定使用新的指令能使时钟周期增加10%,并且假定只 对时钟产生影响,而不影响CPI那么采用新指令,要达到与原来 同样的性能需要去掉的LOAD操作所占的百分比?(提示:去掉的 是与ADD指令连用的LOAD指令,假定未采用新指令前LOAD指令 占总指令的22.8%)A: 39% B: 36% C: 40% D: 39.8% 9、下述的几个需要解决的问题中,那个是向量处理机所最需要 关心的? A: 计算机指令的优化技术 B: 设计满足运算器带宽要求的存储器 C: 如何提高存储器的利用率,增加存储器系统的容量 D: 纵横处理方式的划分问题 10、一台单处理机可以以标量方式运行,也可以以向量方式运行。 在向量方式情况下,计算可比标量方式快18倍。设某基准程序在 此计算机上运行的时间是T。另外,已知T的25%用于向量方式, 其余机器时间则以标量方式运行。那么在上述条件下与完全不用 向量方式的条件下相比的加速比是: A: 3 B: 3.43 C: 3.33 D: 以上均不正确 11、给定1个采用完全混洗互连网络,并有256个PE的SIMD机 器,加入执行混洗互连函数10次,则原来在PE123中的数据将被 送往何处? A: PE237 B: PE222 C: PE111 D: PE175 12、 设计一种采用加、乘和数据寻径操作的算法,计算表达式 。假设加法和乘法分别需要2个和4个 单位时间,从存储器取指令、取数据、译码的时间忽略不计,所 有的指令和数据已经装入有关的PE。现有一台串行计算机,有一 个加法器,一个乘法器,问最短多少单位时间计算出s? A: 192ns B: 130ns C: 128ns D: 以上结果都不对 13、下列功能,那些一般由硬件实现? A : 第一次关CPU中断 B : 返回中断点 C : 第一次开CPU中断 D : 保存中断点 14、星形网络的网络直径和链路数分别为()和()。 选项 1 : N-1 N/2 2 N(N-1)/2 选项 2 : N-1 N/2 2 N(N-1)/2 16、在计算机系统结构来看,机器语言程序员看到的机器属性是 (D)。 A)计算机软件所要完成的功能B)计算机硬件的全部组 成 C)编程要用到的硬件知识D)计算机各部件的硬件 实现 17、在提高CPU性能的问题上,从系统结构角度,可以(D)。 A)提高时钟频率B) 减少程序指令条数 C)减少每条指令的时钟周期数D)减少程序 指令条数和减少每条指令的时钟周期数 18、计算机系统结构不包括(C )。 A)主存速度B)机器工作状态C)信息保护 D)数据表示 19、推出系列机的新机器,不能更改的是(A)。 A)原有指令的寻址方式和操作码B) 系统的总线的组成 C)数据通路宽度 D)存储芯片的集成度 20、在系统结构设计中,提高软件功能实现的比例会(C)。 A)提高解题速度 B)减少需要的存储容量 C)提高系统的灵活性 D)提高系统的性能价格比 21、重叠寄存器技术主要用于解决在RISC系统中因( C )而导 致的问题。 A)JMP指令影响流水线 B)CALL指令的现场保护 C)只有LOAD和STORE指令带来的访问存储器不便D) 存储器访问速度 22、不属于堆栈型替换算法的是(C )。 A)近期最少使用法B)近期最久未用法 C)先 进先出法D)页面失效频率法 23、与全相联映象相比,组相联映象的优点是(B)。 A)目录表小B)块冲突概率低C)命中率高 D)主存利用率高 24、最能确保提高虚拟存储器访主存的命中率的改进途径是(D)。 A)增大辅存容量 B)采用FIFO替换算法并增大页面 C)改用LRU替换算法并增大页面D)改用LRU 替换算法并增大页面数 25、"一次重叠"中消除"指令相关"最好的方法是( A )。 A)不准修改指令B)设相关专用通路C)推后分析下条指令 D)推后执行下条指令 26、在流水机器中,全局性相关是指(D)。 A)先写后读相关B)先读后写相关C)指令相关 D)由转移指令引起的相关 27、下列说法不正确的是(D)。 A)线性流水线是单功能流水线B) 动态流水线是多功能流水线 C)静态流水线是多功能流水线D) 动态流水线只能是单功能流水线 28、16个处理器编号为0、1、…、15,采用单级Cube3互连网络 互连,与13号处理器相连的处理器号是()。 A)2 B)3 C)4 D)5 29、经多级网络串联来实现全排列网络,只能用(C)。 A)多级立方体网络B)多级PM2I网络C)多级混洗 交换网络D)上述任何网络 30、经3级立方体网络对0-7八个端子(0 1 2 3 4 5 6 7)排列, 进行模8移4变换,得到的这八个端子新的排列应当是()。 A)(2 3 4 5 6 7 0 1)B) (4 5 6 7 0 1 2 3) C)(1 2 3 0 5 6 7 4)D) (1 0 3 2 5 4 7 6) 31、虫蚀寻径以流水方式在各寻径器是顺序传送的是(C)。 A)消息B)包C)片 D)字节 32、能实现指令、程序、任务级并行的计算机系统属于(D )。

计算机系统结构总结

1、计算机系统的多级层次结构: 物理机:用固件/硬件实现的机器。 虚拟机:由软件实现的机器。(虚拟机中有些操作可以由硬件或固件实现。固件:具有软件功能的硬件)本门课程研究软硬件的交界面 2、计算机系统结构(Computer Architecture)是指传统机器程序员所看到的计算机属性,即概 念性结构与功能特性。 计算机组成(Computer Organization)指的是计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。着眼于物理机器级内各事件的排序方式与控制方式、各部件的功能以及各部件之间的联系。 计算机实现(Computer Implementation)指的是计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。着眼于器件技术和微组装技术,其中器件技术在实现技术中起主导作用。 下面举例说明上三个概念的区别: (1)确定指令系统中是否有乘法指令属于计算机系统结构的内容,但乘法指令时用专门的乘法器实现,还是用加法器经多步操作来实现,属于计算机组成。而乘法器、 加法器的物理实现,入器件的选定及所用的微组装技术等,属于计算机实现。 (2)主存容量与编址方式(按位、按字节或按字访问等)的确定属于计算机系统结构。 为了达到给定的性能价格比,主存速度的快慢、逻辑结构是否采用多体交叉等属 于计算机组成。而主存系统的物理实现,如器件的选定、逻辑电路的设计、微组 装技术的使用等均属于计算机实现。 3、CPU性能取决于CPU时间。 冯?诺依曼计算机以运算器为中心。 4、仿真和模拟的主要区别在于解释执行所用的语言。(仿真是用是微程序解释执行,模拟是 用机器语言程序解释执行) 5、并行性的两层含义:同时性(simultaneity)和并发性(concurrency) (同时性:两个或两个以上的事件在同一时刻发生) (并发性:两个或两个以上的事件在同一时间间隔内发生) 6、看课后题:1.7和1.9

相关主题
文本预览
相关文档 最新文档