当前位置：文档之家› 计算机组成与体系结构

计算机组成与体系结构

第1章计算机组成与体系结构

根据考试大纲，本章内容要求考生掌握3个知识点。

（1）构成计算机的各类部件的功能及其相互关系；

（2）各种体系结构的特点与应用（SMP、MPP）；

（3）计算机体系结构的发展。

1.1 计算机体系结构的发展

冯·诺依曼等人于1946年提出了一个完整的现代计算机雏形，它由运算器、控制器、存储器和输入/输出设备组成。现代的计算机系统结构与冯·诺依曼等人当时提出的计算机系统结构相比，已发生了重大变化，虽然就其结构原理来说，占有主流地位的仍是以存储程序原理为基础的冯·诺依曼型计算机，但是，计算机系统结构有了许多改进，主要包括以下几个方面。

（1）计算机系统结构从基于串行算法改变为适应并行算法，从而出现了向量计算机、并行计算机、多处理机等。

（2）高级语言与机器语言的语义距离缩小，从而出现了面向高级语言机器和执行高级语言机器。

（3）硬件子系统与操作系统和数据库管理系统软件相适应，从而出现了面向对象操作系统机器和数据库计算机等。

（4）计算机系统结构从传统的指令驱动型改变为数据驱动型和需求驱动型，从而出现了数据流计算机和归约机。

（5）为了适应特定应用环境而出现了各种专用计算机。

（6）为了获得高可靠性而研制容错计算机。

（7）计算机系统功能分散化、专业化，从而出现了各种功能分布计算机，这类计算机包括外围处理机、通信处理机等。

（8）出现了与大规模、超大规模集成电路相适应的计算机系统结构。

（9）出现了处理非数值化信息的智能计算机。例如自然语言、声音、图形和图像处理等。

1.2 构成计算机的各类部件的功能及其相互关系

计算机由控制器、运算器、存储器、输入设备和输出设备组成。

1966年，Michael.J.Flynn提出根据指令流、数据流的多倍性特征对计算机系统进行分类（通常称为Flynn分类法），有关定义如下：

?指令流：指机器执行的指令序列。

?数据流：指由指令流调用的数据序列，包括输入数据和中间结果，但不包括输出数据。

?多倍性：指在系统性能瓶颈部件上同时处于同一执行阶段的指令或数据的最大可能

个数。

Flynn根据不同的指令流-数据流组织方式，把计算机系统分成4类。

（1）单指令流单数据流（SISD）：SISD其实就是传统的顺序执行的单处理器计算机，其指令部件每次只对一条指令进行译码，并只对一个操作部件分配数据。流水线方式的单处理机有时也被当作SISD。值得注意的是，Intel公司的PⅡ中开始采用MMX技术，引进了一些新的通用指令，从某种意义上使用了单指令流多数据流的思想，但是，与Intel公司的前几代产品（X86/Pentium）相比，其指令序列的执行方式和调用数据的方式没有发生根本性的变化，所以从整体上来看，采用PⅡ芯片的PC仍属于SISD。

（2）单指令流多数据流（SIMD）：SIMD以并行处理机（阵列处理机）为代表，并行处理机包括多个重复的处理单元PU1-PU n，由单一指令部件控制，按照同一指令流的要求为它们分配各自所需的不同数据。相联处理机也属于这一类。

（3）多指令流单数据流（MISD）：MISD具有n个处理单元，按n条不同指令的要求对同一数据流及其中间结果进行不同的处理。一个处理单元的输出又作为另一个处理单元的输入，这类系统实际上很少见到。有文献把流水线看做多个指令部件，称流水线计算机是MISD。

（4）多指令流多数据流（MIMD）：MIMD是指能实现作业、任务、指令等各级全面并行的多机系统。多处理机属于MIMD。当前的高性能服务器与超级计算机大多具有多个处理机，能进行多任务处理，称为多处理机系统。不论是大规模并行处理机MPP（Massively Parallel Processor）还是对称多处理机SMP（Symmetrical Multi Processor），都属于这一类。

Flynn分类法是最普遍使用的。其他的分类法还有：

（1）冯氏分类法：由冯泽云在1972年提出，冯氏分类法以计算机系统在单位时间内所能处理的最大二进制位数来对计算机系统进行分类。

（2）Handler分类法：由WolfganHandler在1977年提出，Handler分类法根据计算机指令执行的并行度和流水线来对计算机系统进行分类。

（3）Kuck分类法：由DavidJ．Kuck在1978年提出，Kuck分类法与Flynn分类法相似，也是用指令流、执行流和多倍性来描述计算机系统特征，但其强调执行流的概念，而不是数据流。

第1章计算机组成与体系结构 3 1.3 各种体系结构的特点与应用

1.3.1 复杂指令系统计算机

复杂指令系统计算机（CISC）的主要特点如下。

①指令数量众多：指令系统拥有大量的指令，通常有100～250条。

②指令使用频率相差悬殊：指令使用频率相差悬殊，最常使用的是一些比较简单的指令，仅占指令总数的20%，但在程序中出现的频率却占80%，而大部分复杂指令却很少使用。

③支持很多种寻址方式：支持的寻址方式通常为5～20种。

④变长的指令：指令长度不是固定的，变长的指令增加指令译码电路的复杂性。

⑤指令可以对存储器单元中的数据直接进行处理：典型的CISC处理器通常都有指令能够直接对内存单元中的数据进行处理，其执行速度较慢。

1.3.2 精简指令系统计算机

精简指令系统计算机（RISC）不是简单地把指令系统进行简化，而是通过简化指令的途径使计算机的结构更加简单合理，以减少指令的执行周期数，从而提高运算速度。

RISC的主要特点：

（1）指令数量少：优先选取使用频率最高的一些简单指令以及一些常用指令，避免使用复杂指令。大多数指令都是对寄存器操作，对存储器的操作仅提供了读和写两种方式。

（2）指令的寻址方式少：通常只支持寄存器寻址方式、立即数寻址方式以及相对寻址方式。

（3）指令长度固定、格式种类少：因为RISC指令数量少，格式相对简单，其指令长度固定，指令之间各字段的划分比较一致，译码相对容易。

（4）只提供了Load/Store指令访问存储器：只提供了从存储器读数Load和把数据写入存储器Store两条指令，其余所有的操作都在CPU的寄存器间进行。

（5）以硬布线逻辑控制为主：为了提高操作的执行速度，通常采用硬布线逻辑（组合逻辑）来构建控制器。而CISC的指令系统很复杂，难以用组合逻辑电路实现控制器，通常采用微程序控制。

（6）单周期指令执行：因为简化了指令系统，很容易利用流水线技术使得大部分指令都能在一个机器周期内完成。少数指令可能会需要多个周期执行，例如Load/Store指令因为需要访问存储器，其执行时间就会长一些。

（7）优化的编译器：RISC的精简指令集使编译工作简单化。因为指令长度固定、格式少、寻址方式少，编译时不必在具有相似功能的许多指令中进行选择，也不必为寻址方式

的选择而费心，同时易于实现优化，从而可以生成能够高效执行的机器代码。

采用RISC技术的CPU硬件一般具有如下特点：寄存器数量多；采用流水线组织；控制器的实现采用硬布线控制逻辑电路。

大多数RISC采用了Cache（缓存）方案，使用Cache来提高取指的速度。而且有的RISC甚至使用两个独立的Cache来改善性能：一个称为指令Cache，另一个称为数据Cache。这样，取指和读数可以同时进行，互不干扰。

典型的RISC处理器有DEC公司的Alpha21164、IBM公司的PowerPC620、HP公司的PA-8000、SGI公司MIPS分部的TS和Sun公司的Ultra SPARC等。

从理论上来看，CISC和RISC都有各自的优势，不能认为精简指令计算机就好，复杂指令计算机就不好，事实上，这两种设计方法很难找到完全的界线，而且在实际的芯片中，这两种设计方法也有相互渗透的地方，表1-1所示是两者的简单对比。

表1-1 CISC和RISC的简单对比

项目CISC RISC

指令条数多只选取最常见的指令

指令复杂度高低

指令长度变化短、固定

指令执行周期随指令变化大大多在一个机器同期完成

指令格式复杂简单

寻址方式多极少

涉及访问主存指令多极少，大部分只有两条指令

通用寄存器数量一般大量

译码方式微程序控制硬件电路

对编译系统要求低高

1.3.3 流水线技术

流水线技术是把一个任务分解为若干个顺序执行的子任务，不同的子任务由不同的执行机构负责执行，而这些机构可以同时工作。在任一时刻，任一任务只占用其中一个执行机构，这样就可以实现多个任务的重叠执行，以提高工作效率。

流水线的关键之处在于重叠执行。为了得到高性能的表现，流水线应该满负荷工作，即各个阶段都要同时并行地工作。但是在实际情况中，流水线各个阶段可能会相互影响，阻塞流水线，使其性能下降。阻塞主要由以下两种情形引起：执行转移指令和共享资源冲突。

（1）转移指令的影响

通常在顺序执行指令的情况下，当CPU取一条指令时，流水线的地址计算部件可以独立地把当前PC值加上当前指令长度来计算下一条指令的地址，从而可以并行地工作，但

第1章计算机组成与体系结构 5

是当流水线执行一条转移指令时，就会引起流水线的阻塞。因为在该转移指令完成之前，流水线不能确定出下一条指令的地址。所以为了保证指令的正确执行，必须把取指段和指令地址计算段互锁。在取出转移指令后，立即锁住指令地址计算段，直到转移指令执行完成。互锁阶段流水线处于等待状态，不能满负荷工作，因而性能下降。

（2）共享资源访问冲突

当多条指令以流水线方式重叠执行时，由于可能会引起对共享的寄存器／存储器资源访问次序的变化，因此将导致冲突，这种情况又称为数据相关。为了避免这种冲突，就需要把相互有关的指令进行阻塞，这样就会引起流水线效率的下降。一般来说，指令流水线级数越多，越容易导致数据相关，阻塞流水线。

1．指令流水线

计算机中，一条指令的执行需要若干步，通常采用流水线技术来实现指令的执行，以提高CPU性能。

典型的指令执行共分7个阶段：①计算指令地址，修改程序计数器PC；②取指，即从存储器中取出指令；③指令译码；④计算操作数地址；⑤取操作数；⑥执行指令；⑦保存结果。

对指令执行阶段的划分也可以把取指作为第一阶段，其他阶段顺序前移，而在最后一个阶段计算下一条指令的地址。若假定指令执行的各个阶段的执行时间相同，都是一个周期。执行一条指令就需要花费7个周期的时间。采用流水线技术以后，当满负荷时，每个周期都能从流水线上完成一条指令，相当于性能大约改善了7倍。实际上，流水线技术对性能的提高程度取决于其执行顺序中最慢的一步。例如，在指令执行的7个阶段中，如果访问存储器需要4个周期，而其他操作只需一个周期，一条指令的执行共需访存3次再加上4个周期的执行段，所以共需要16个周期。采用流水线以后，由于受限于访存操作，4个周期才能完成一条指令的执行，因此性能提高了大约4倍。

2．运算操作流水线

计算机在执行各种运算操作时，也可以应用流水线技术来提高运算速度。例如执行浮点加法运算，可以把它分成3个阶段：对阶、尾数相加和结果规格化。流水线的3个阶段用锁存器进行分割，锁存器用来在相邻两段之间保持处理的中间结果，以供下一阶段使用。这样在满负荷时，该流水线可以同时处理3条浮点加法指令。

1.3.4 并行处理

1．超级标量处理机

在超级标量处理机中，配置了多个功能部件和指令译码电路，采取了多条流水线，还有多个寄存器端口和总线，因此可以同时执行多个操作，以并行处理来提高机器的速度。它可以同时从存储器中取出几条指令同时送入不同的功能部件。超级标量机的硬件是不能重新安排指令的前后次序的，但可以在编译程序时采取优化的办法对指令的执行次序进行

精心安排，把能并行执行的指令搭配起来。

2．超级流水线处理机

超级流水线处理机的周期比其他结构的处理机的短。与超级标量计算机一样，硬件不能调整指令的执行次序，而由编译程序解决优先问题。

3．超长指令字处理机

VLIW是一种单指令流多操作码多数据的系统结构，编译程序在编译时把这个能并行执行的操作组合在一起，成为一条有多个操作段的超长指令，这条超长指令控制VLIW中多个互相独立的功能部件，每个操作段控制一个功能部件，相当于同时执行多条指令。

4．向量处理机

向量处理机是一种具有向量数据表示、设置有相应的指令和硬件、能对向量的各个元素进行并行处理的计算机。当进行向量运算时，它的性能要比大型机好得多。向量处理机有巨型计算机和向量协处理机（或称为数组处理机）两种类型，巨型计算机能对大量的数据进行浮点运算，同时它还可以进行标量计算和一般数据处理。向量处理机一般采用流水线工作，当它处理一条数组指令时，会对数组中的每个元素执行相同的操作，而且各元素间是互相无关的，因此流水线不会阻塞，能以每个时钟周期送出一个结果的速度运行。为了存储系统能及时提供数据，向量处理器配有一个大容量的、分成多个模块交错工作的主存储器。为了提高运算速度，向量处理机的运算部件中可采用多个功能部件，例如向量部件、浮点部件、整数运算部件和计算地址用的地址部件。向量协处理机就是专门处理浮点和向量运算的数组处理机，它一般连接到主机总线上。

5．多处理机系统

多处理机具有两个或两个以上的处理机，共享输入/输出子系统，在操作系统的统一控制下，通过共享主存或高速通信网络进行通信，协同求解一个个复杂的问题。多处理机通过利用多台处理机进行多任务处理来提高速度，利用系统的重组能力来提高可靠性、适应性和可用性。多处理机具有共享存储器和分布存储器两种不同的结构。具有共享存储器的多处理机中，程序员无数据划分的负担，容易编程；系统处理机数目较少，不易扩充。具有分布式存储器的多处理机结构灵活；容易扩充；难以在各个处理单元之间实现复杂数据结构的数据传送；任务动态分配复杂；现有软件可继承性差，需要设计新的并行算法。多处理机系统属于MIMD系统，与SIMD的并行处理机相比，有很大的差别。其根源就在于两者的并行性的层次不同，多处理机要实现的是更高一层的作业任务间的并行。

6．大规模并行处理机

并行处理机有时也称为阵列处理机，它使用按地址访问的随机存储器，以单指令流多数据流方式工作，主要用于要求大量高速进行向量矩阵运算的应用领域。并行处理机的并行性来源于资源重复，它把大量相同的处理单元（PE）通过互联网络（ICN）连接起来，在统一的控制器（CU）控制下，对各自分配来的数据并行地完成同一条指令所规定的操作。PE是不带指令控制部件的算术逻辑运算单元。并行处理机具有强大的向量运算能力，具有

第1章计算机组成与体系结构 7

向量化功能的高级语言编译程序有助于提高并行处理机的通用性，减少编译时间。

并行处理机有两种基本结构类型：采用分布存储器的并行处理结构和采用集中式共享存储器的并行处理结构。分布式存储器的并行处理结构中，每一个处理机都有自己的存储器，只要控制部件将并行处理的程序分配至各处理机，它们便能并行处理，各自从自己的存储器中取得信息。而共享存储多处理机结构中的存储器是集中共享的，由于多个处理机

共享，在各处理机访问共享存储器时会发生竞争。因此，需采取措施尽可能避免竞争的发生。

大规模并行处理机（MPP ）是随着微处理器技术的飞跃和应用需求的不断攀升，在20世纪80年代中期发展起来的一种新机型。它是由众多的微处理器（从几百到上万）组成的大规模的并行系统。MPP 的出现成为计算机领域中的一个研发热点，被用作开发万亿次甚至更高速的巨型机的主要结构。MPP 可以采用市场上的出售的RISC 处理器，所以有很高的性价比。

7．对称处理机

对称多处理机（SMP ）目前也基于RISC 微处理器。它与MPP 最大的差别在于存储系

统：SMP 有一个统一的共享主存空间，而MPP 则是每个微处理器都拥有自己的本地存储器。

1.3.5 互联网络

互联网络（ICN ）是用来连接一个计算机系统中各个处理单元（或处理机）、存储模块以及各种外部设备，在系统软件控制下，使各处理单元或各个功能部件相互通信的硬件网络结构。

常见的互联网结构有总线结构、交叉开关和多级互联网。并行处理机互连有多种方法，分别举例如下：

（1）恒等置换：相同编号的输入端与输出端一一对应互连。其表达式如下：

110110()n k n k I x x x x x x x x --= （2）交换置换：实现二进制地址编号中第0位位值不同的输入端和输出端之间的连接。其表达式如下：

011011()n k n k E x x x x x x x x --= （3）方体置换：实现二进制地址编号中第k 位位值不同的输入端和输出端之间的连接。其表达式如下：

_110110()k k n k n C x x x x x x x x --=

（4）均匀洗牌置换（shuffle ）：将输入端二进制地址循环左移一位得到对应的输出端二进制地址。其表达式如下：

121023101()n n n n n S x x x x x x x x x -----=

8 （5）蝶式置换：将输入端二进制地址的最高位和最低位互换位置得到对应的输出端二进制地址。其表达式如下：

12100211()n n n n B x x x x x x x x ----=

（6）位序颠倒置换：将输入端二进制地址的位序颠倒过来得到对应的输出端二进制地址。其表达式如下：

12100121()n n n n P x x x x x x x x ----= 1.4 例题分析

例题1（2001年试题31～32）

按照Flynn 的分类，P Ⅱ的MMX 指令采用的是（31）模型，而当前的高性能服务器与超级计算机则大多属于（32）类。

（31）、（32）A ．SISD B ．SIMD C ．MISD D ．MIMD 例题1分析

按照Flynn 的分类，计算机可分为SISD 、SIMD 、MISD 和MIMD 共4类。

P Ⅱ中开始采用MMX 技术，引进了一些新的通用指令，虽然使用了单指令多数据思想，但从整体上说P Ⅱ仍属于SISD 类。

当前的高性能服务器与超级计算机大多具有多个处理器，多任务处理并行处理，基本上都属于MIMD 。

例题1答案

（31）A （32）D

例题2（2002年试题50）

微指令大体上可分为两类：水平型微指令和垂直型微指令。在下列几项中，不符合水平型微指令特点的是（50）。

（50）A ．执行速度快 B ．并行度较低

C ．更多地体现了控制器的硬件细节

D ．微指令长度较长

例题2分析

水平型微指令的主要特征：微指令的长度比较长，微指令中的微操作具有高度的并行性，微指令编码简单，减少了译码时间，使其执行速度快，更多地体现了控制器的硬件细节。

垂直型微指令的主要特征：长度短，功能弱，并行度低，编程容易但微程序长，效率低。

例题2答案

（50）B

例题3（2002年试题42～47）

在下列体系结构中，最适合于多个任务并行执行的体系结构是（42）。

第1章计算机组成与体系结构9

流水线控制方式下，（43）是全局性相关，流水线机器对全局性相关的处理不包括（44）。静态流水线是指（45）。

假设并行（阵列）处理器的16个处理器编号为0～15，采用单级Cube3网络互联时，与13号处理器相连的处理器的编号为（46）。

在下列几项中，不符合RISC特点的是（47）。

（42）A．流水线向量机结构B．分布存储多处理机结构C．共享存储多处理机结构D．堆栈处理机结构（43）A．转移指令引起的相关B．先写后读相关

C.先读后写相关D．写-写相关

（44）A．猜测法B．提前形成条件码

C．设置相关专用通道D．加快短循环程序的执行（45）A．只有一种功能的流水线

B．功能不能改变的流水线

C．可同时执行多种功能的流水线

D．在同一时间段内，只能完成一种功能的流水线

（46）A．1 B．5

C．7 D．14

（47）A．指令长度固定，指令种类少

B．寻址方式种类丰富，指令功能尽量增强

C．设置大量通用寄存器，访问存储器指令简单

D．选取使用频率较高的一些简单指令

例题3分析

流水线向量处理机是用于指令并行执行的而不是任务并行，并不属于多处理机。堆栈处理机用于特别的计算或用作外设的数据读写。这两种结构均不适于多个任务的并行执行。并行处理机可分两种类型，分别为采用分布存储器的并行处理结构和采用集中式共享存储器的并行处理结构。其中分布式存储器的多处理机并行处理结构中，每一个处理器都有自己的存储器，只要控制部件将并行处理的程序分配各处理机，它们便能并行处理，各自从自己的存储器中取得信息。而共享存储多处理机结构中的存储器是集中共享的，由于多个处理机共享，在各处理机访问共享存储器时会发生竞争。因此，最适合于多个任务并行执行的体系结构是分布存储多处理机结构。

在流水线机器中，指令相关、主存操作数相关、通用寄存器组的操作数相关及变址寄存器变址值相关为局部性相关。在具体对局部性相关进行处理时，先写后读相关、先读后写相关和写-写相关都是控制机构能处理的局部性相关的内容。而转移指令引起的相关则会对流水线机器的吞吐能力和效率造成的影响较局部性相关要严重得多，被称为全局性相关。

对全局性相关处理时，采用的方法有猜测法、加快和提前形成条件码、加快短循环程

10 序的执行、转移指令迟延执行等。而设置相关专用通道是对局部性相关进行处理时所采取的多种措施之一。

静态流水线的定义是指在某一时间内各段只能按一种功能连接流水线，只有等流水线全部流空后才能切换成按另一种功能连接流水线。

并行处理机互联有多种方法，在构成单级互联网络时可采用n 个结点的立方体网络结构。在此立方体上的每一个顶点代表一个处理机。在编号为0～15的16个处理机构成的立方体上，每一个处理机均可用4位二进制编码来表示。利用n 个结点的一般互联函数为：

_110110()i i n i n Cube P P PP P P PP --= 因为13= (1101)2，所以，它只能与编码为(0101)2 =5的处理机相连接。例题3答案

（42）B （43）A （44）C （45）D （46）B （47）B

例题4（2003年试题44～45）

编号为0、1、2、3、…、15的16个处理器，采用单级互联网络联接。当互联函数为Cube 3时，11号处理器连接到（44）号处理器上。若采用Shuffle 互联函数，则11号处理器应连接到（45）号处理器上。

（44）A ．2

B ．3

C ．7

D ．9 （45）A ．2

B ．5

C ．7

D ．11 例题4分析

并行处理机互联有多种方法，在构成单级互联网络时可采用n 个节点的立方体网络结构。在此立方体上的每一个顶点（即节点）代表一个处理器。在编号为0～15的16个处理器构成的立方体上，每一个处理器均可用4位二进制编码来表示。利用n 个结点的一般互联函数为：

_110110()i i n i n Cube P P PP P P PP --=

因为11号处理器的编码为1011，它只能与编码为0011号处理器相连接。因此，与该处理器相连接的可以是3（0011）号处理器。

如果采用Shuffle 互联函数，则根据公式: 12102

101()n n n n Shuffle P P PP P PP P ----= 因为11号处理器的编码为1011，则经过变换后为0111，即为7号。例题4答案

（44）B （45）C

例题5（2004年5月试题44～45）

某流水线浮点加法器分为5级，若每一级所需要的时间分别是6ns 、7ns 、8ns 、9ns 和6ns ，则此流水线的最大加速比为（44）。若每一级的时间均为7ns ，则最大加速比为（45）。

计算机组织与体系结构实验报告

《计算机组织与体系结构》实验报告学号： XXX 姓名：XXX 班级：XXX 指导教师：XXX 时间: 2013年01月中国矿业大学计算机学院

目录一基本运算器实验 (2) 1、实验目的 (2) 2、实验设备 (2) 3、实验原理 (2) 4、实验步骤 (3) 5、实验结果 (5) 5、实验体会 (5) 二微程序控制实验 (6) 1、实验目的 (6) 2、实验设备 (6) 3、实验原理 (6) 4、实验步骤 (12) 5、实验体会 (13) 三CPU与简单模型机设计实验 (13) 1、实验目的 (13) 2、实验设备 (13) 3、实验原理 (13) 4、实验步骤 (18) 5、实验流图 (21) 6、实验体会 (25)

实验一基本运算器实验 1. 实验目的 (1) 了解运算器的组成结构。 (2) 掌握运算器的工作原理。 2. 实验设备 PC机一台，TD-CMA实验系统一套。 3.实验原理本实验的原理如下图所示：运算器内部含有三个独立运算部件，分别为算术、逻辑和移位运算部件，要处理的数据存于暂存器A和暂存器B，三个部件同时接受来自A和B的数据（有些处理器体系结构把移位运算器放于算术和逻辑运算部件之前，如ARM），各部件对操作数进行何种运算由控制信号S3…S0和CN来决定，任何时候，多路选择开关只选择三部件中一个部件的结果作为ALU的输出。如果是影响进位的运算，还将置进位标志FC，在运算结果输出前，置ALU零标志。ALU中所有模块集成在一片FPGA中。逻辑运算部件由逻辑门构成，较为简单，而后面又有专门的算术运算部件设计实验，在此对这两个部件不再赘述。移位运算采用的是桶形移位器，一般采用交叉开关矩阵来实现，交叉开关的原理如图1-1-2所示。图中显示的是一个4X4的矩阵（系统中是一个8X8的矩阵）。每一个输入都通过开关与一个输出相连，把沿对角线的开关导通，就可实现移位功能，即： (1) 对于逻辑左移或逻辑右移功能，将一条对角线的开关导通，这将所有的输入位与所使用的输出分别相连,而没有同任何输入相连的则输出连接0。 (2) 对于循环右移功能，右移对角线同互补的左移对角线一起激活。例如，在4位矩阵中使用‘右1’和‘左3’对角线来实现右循环1位。 (3) 对于未连接的输出位，移位时使用符号扩展或是0填充，具体由相应的指令控制。使用另外的逻辑进行移位总量译码和符号判别。

计算机组成与结构

第1章计算机组成与体系结构根据考试大纲，本章内容要求考生掌握3个知识点。（1）构成计算机的各类部件的功能及其相互关系；（2）各种体系结构的特点与应用（SMP、MPP）；（3）计算机体系结构的发展。 1.1 计算机体系结构的发展冯·诺依曼等人于1946年提出了一个完整的现代计算机雏形，它由运算器、控制器、存储器和输入/输出设备组成。现代的计算机系统结构与冯·诺依曼等人当时提出的计算机系统结构相比，已发生了重大变化，虽然就其结构原理来说，占有主流地位的仍是以存储程序原理为基础的冯·诺依曼型计算机，但是，计算机系统结构有了许多改进，主要包括以下几个方面。（1）计算机系统结构从基于串行算法改变为适应并行算法，从而出现了向量计算机、并行计算机、多处理机等。（2）高级语言与机器语言的语义距离缩小，从而出现了面向高级语言机器和执行高级语言机器。（3）硬件子系统与操作系统和数据库管理系统软件相适应，从而出现了面向对象操作系统机器和数据库计算机等。（4）计算机系统结构从传统的指令驱动型改变为数据驱动型和需求驱动型，从而出现了数据流计算机和归约机。（5）为了适应特定应用环境而出现了各种专用计算机。（6）为了获得高可靠性而研制容错计算机。（7）计算机系统功能分散化、专业化，从而出现了各种功能分布计算机，这类计算机包括外围处理机、通信处理机等。（8）出现了与大规模、超大规模集成电路相适应的计算机系统结构。（9）出现了处理非数值化信息的智能计算机。例如自然语言、声音、图形和图像处理等。 1.2 构成计算机的各类部件的功能及其相互关系计算机由控制器、运算器、存储器、输入设备和输出设备组成。

计算机系统的组成教案

《计算机软硬件系统》教案辛丰中学朱瑞金一、教学目标 1、知识与技能 (1)了解计算机硬件和软件的概念及其关系; (2)了解计算机硬件的各个组成部份及其作用; (3)知道存储器的分类、内存RAM与ROM的区别及其作用。 (4)了解软件的分类,知道常见的软件的类别。 2、过程与方法 (1)通过让学生观察计算机的结构和主要部件,了解计算机结构及各部分的作用; (2)通过学习活动让学生体验计算机软件的分类及其作用,并归纳计算机系统的组成结构图。 3、情感态度与价值观在学习过程中,激发学生学习计算机基础知识的兴趣和积极探究的精神。二、教学重点与难点教学重点：计算机系统的组成及结构,各主要部件的作用。教学难点：计算机系统的组成及结构。三、教具学具：多媒体课件、教科书四、教学方法：创设情境法，师生问答法、讲授法学习方法：自主学习和协作学习五、教学过程 (一) 创设情境、导入新课上课前先给学生提出一些关于计算机的用途的问题，例如：同学们通常使用计算机做什么呢？然后问学生：“同学们知道这样高性能的机器是由什么组成的吗一个计算机系统究竟由哪几部分组成？各自有何作用？相互之间有何关系？”这就是我们本节课要研究的内容：计算机系统的组成。” （二）讲授新课一个完整的计算机系统由硬件系统和软件系统两大部分组成。 1、计算机硬件系统计算机硬件是人们看得见、摸得着的实体，它是由一组设备组装而成的，将这些设备作为一个统一体而协调运行，故称之为硬件系统。计算机硬件主要包括：运算器、控制器、存储器、输入设备和输入设备五个部分。（1）运算器和控制器运算器是计算机对数据进行加工处理的部件；控制器是计算机的指挥中心，用来控制计算机各部件协调工作，并使整个处理过程有条不紊地进行；运算器和控制器合称为中央处理器，简称CPU；CPU 是计算机的核心部件，相当于人的大脑。（2）存储器

计算机系统结构三四章作业及答案

3.1 简述流水线技术的特点。（1）流水线把一个处理过程分解为若干个子过程，每个子过程由一个专门的功能部件来实现。因此，流水线实际上是把一个大的处理功能部件分解为多个独立的功能部件，并依靠它们的并行工作来提高吞吐率。（2）流水线中各段的时间应尽可能相等，否则将引起流水线堵塞和断流。（3）流水线每一个功能部件的前面都要有一个缓冲寄存器，称为流水寄存器。（4）流水技术适合于大量重复的时序过程，只有在输入端不断地提供任务，才能充分发挥流水线的效率。（5）流水线需要有通过时间和排空时间。在这两个时间段中，流水线都不是满负荷工作。 3.2 解决流水线瓶颈问题有哪两种常用方法？答：细分瓶颈段与重复设置瓶颈段 3.3 有一条指令流水线如下所示：（1 用两给出条指（1）（24? 变八级流水线（细分） ? 重复设置部件 )(ns 85 1 T n TP 1pipeline -== 3.4 有一个流水线由4段组成，其中每当流过第三段时，总要在该段循环一次，然后才能流到第4段。如果每段经过一次所需的时间都是△t ，问：（1）当在流水线的输入端连续地每△t 时间输入一个任务时，该流水线会发生什么情况？（2）此流水线的最大吞吐率为多少？如果每2△t 输入一个任务，连续处理10个任务时，其实际吞吐率和效率是多少？（3）当每段时间不变时，如何提高流水线的吞吐率？人连续处理10个任务时，其吞吐率提高多少？解：（1）会发生流水线阻塞情况。

（2）（3）重复设置部件吞吐率提高倍数＝ t t ??2310 75 ＝1.64 3.5 有一条动态多功能流水线由5段组成，加法用1、3、4、5段，乘法用1、2、5段，第2段的时间为2△t ，其余各段的时间均为△t ，而且流水线的输出可以直接返回输入端或暂存于相应的流水线寄存器中。现在该流水线上计算 ∏=+4 1 )(i i i B A ，画出时空图，并计算其吞吐率、加速比和效率。＋B 4；再计算由图可见，它在18个△t 时间中，给出了7个结果。所以吞吐率为：如果不用流水线，由于一次求积需3△t ，一次求和需5△t ，则产生上述7个结果共需（4×5+3×3）△t =29△t 。所以加速比为：该流水线的效率可由阴影区的面积和5个段总时空区的面积的比值求得： 3.6 在一个5段流水线处理机上,各段执行时间均为△t,需经9△t 才能完成一个任务,其预约表如下所示。段23 时间入 A 1 B 1 A 2 B 2 A 3 B 3 A 4 B 4 A B C D A × B C ×D

计算机系统组成教学设计

《计算机系统组成》教学设计一、教学对象分析本校初一级学生，基础比较薄弱，针对其好奇好动的特点。在教学过程当中，多设计一些教学过程让学生动手参与，提高学生的兴趣，增加感性认识。在讲解过程中注意多联系生活及身边的事物，有利于学生更好地掌握和理解教学内容。学习本课之前，许多学生对计算机的操作有一定了解，但学生对于计算机系统的构成，各部件的功能，工作原理还没有形成具体概念。因此必要进一步学习《计算机系统的组成》二、教学内容分析本章内容是信息技术的基础知识。涉及到计算机的系统构成的术语和概念比较多，应用范围广泛，在教学中多运用实物介绍比较和基础练习，引导学生观察，分析，比较，归纳，从而达到教学目标。教学重点：计算机是由特定功能的各种设备组合在一起的一个整体。教学难点：计算机硬件和软件的概念。三、教学目标基本目标（1）了解计算机组成各部分的名称和作用（2）知道什么是计算机软件，了解计算机软件的作用。（3）了解计算机处理信息的过程。四、教学方法 ⒈本课的教学内容涉及较多名称术语，在教学中可以通过演示教学辅助软件，展示计算机硬件实物，讲解投影等多种形式增加学生对教学内容的感性认识。 ⒉学生通过填写、拼图比较，思考回答，讨论表述，理解巩固相关知识。五、教学过程设计新课导入：同学们，计算机这个词对于我们来说已经不再陌生了，它已经渗透到我们生活中的每个环节中去了。那么你们知道哪些有关计算机的名词呢？(根据学生的回答，教师作出相应的小结)。同学们，你们所说的这些名词有的是计算机的硬件，有的是计算机的软件，还有一些则是计算机的应用，今天我们就要学习计算机系统的组成，计算机有许多部件，如显示器、主机、键盘等，这些部件在处理信息的过程中各起什么作用呢？一个完整的计算机系统又是由哪些部分组成？这就是今天我们要学习的内容。（一）计算机的硬件系统（屏幕广播） ⒈硬件：指计算机实际设备的总称 ⒉硬件部分按其功能划分为：控制器、运算器、存储器（内外）、输入设备、输出设备。 ⒊展示一台打开的计算机，用实物介绍硬件的组成与作用。 ⒋硬件系统的组成结构图和功能作用。 ⒌网络传送“硬件分类填空练习课件”，让学生独自或者讨论完成练习。选一到两个学生上讲

计算机系统结构网上作业

计算机系统结构作业参考答案一、 1、试述现代计算机系统的多级层次结构。计算机系统具有层次性，它由多级层次结构组成。从功能上计算机系统可分为五个层次级别：第一级是设计级。这是一个硬件级，它由机器硬件直接执行。第二级是一般机器级，也称为机器语言级。它由微程序解释系统.这一级是硬件级。第三级是操作系统级，它由操作系统程序实现。这些操作系统由机器指令和广义指令组成，这些广义指令是操作系统定义和解释的软件指令。这一级也称混合级。第四级是汇编语言级。它给程序人员提供一种符号形式的语言，以减少程序编写的复杂性。这一级由汇编程序支持执行。第五级是高级语言级。这是面向用户为编写应用程序而设置的。这一级由各种高级语言支持。 2、试述RISC设计的基本原则和采用的技术。答：一般原则： (1)确定指令系统时，只选择使用频度很高的指令及少量有效支持操作系统，高级语言及其它功能的指令，大大减少指令条数，一般使之不超过100条； (2)减少寻址方式种类，一般不超过两种； (3)让所有指令在一个机器周期内完成； (4)扩大通用寄存器个数，一般不少于32个，尽量减少访存次数； (5)大多数指令用硬联实现，少数用微程序实现； (6)优化编译程序，简单有效地支持高级语言实现。

基本技术： (1)按RISC一般原则设计，即确定指令系统时，选最常用基本指令，附以少数对操作系统等支持最有用的指令，使指令精简。编码规整，寻址方式种类减少到1、2种。 (2)逻辑实现用硬联和微程序相结合。即大多数简单指令用硬联方式实现，功能复杂的指令用微程序实现。 (3)用重叠寄存器窗口。即：为了减少访存，减化寻址方式和指令格式，简有效地支持高级语言中的过程调用，在RISC机器中设有大量寄存嚣，井让各过程的寄存器窗口部分重叠。 (4)用流水和延迟转移实现指令，即可让本条指令执行与下条指令预取在时间上重叠。另外，将转移指令与其前面的一条指令对换位置，让成功转移总是在紧跟的指令执行之后发生，使预取指令不作废，节省一个机器周期。 (5)优化设计编译系统。即尽力优化寄存器分配，减少访存次数。不仅要利用常规手段优化编译，还可调整指令执行顺序，以尽量减少机器周期等。 3、试述全相联映像与直接映像的含义及区别（1）全相连映像主存中任何一个块均可以映像装入到Cache中的任何一个块的位置上。主存地址分为块号和块内地址两部分，Cache地址也分为块号和块内地址。Cache的块内地址部分直接取自主存地址的块内地址段。主存块号和Cache块号不相同，Cache块号根据主存块号从块表中查找。Cache保存的各数据块互不相关，Cache必须对每个块和块自身的地址加以存储。当请求数据时，Cache控制器要把请求地址同所有的地址加以比较，进行确认。（2）直接映像把主存分成若干区，每区与Cache大小相同。区内分块，主存每个区中块的大小和Cache 中块的大小相等，主存中每个区包含的块的个数与Cache中块的个数相等。任意一个主存块只能映像到Cache中唯一指定的块中，即相同块号的位置。主存地址分为三部分：区号、块号和块内地址，Cache地址分为：块号和块内地址。直接映像方式下，数据块只能映像到Cache中唯一指定的位置，故不存在替换算法的问题。它不同于全相连Cache，地址仅需比较一次。（3）区别：全相连映像比较灵活，块冲突率低，只有在Cache中的块全部装满后才会出现冲突，Cache 利用率高。但地址变换机构复杂，地址变换速度慢，成本高。直接映像的地址变换简单、速度快，可直接由主存地址提取出Cache地址。但不灵活，块冲突率较高，Cache空间得不到充分利用。 4. 画出冯?诺依曼机的结构组成？

计算机组成与系统结构常见选择题

一、选择题（50分，每题2分，正确答案可能不只一个，可单选或复选） 1.（CPU周期、机器周期）是内存读取一条指令字的最短时间。 2.（多线程、多核）技术体现了计算机并行处理中的空间并行。 3.（冯诺伊曼、存储程序）体系结构的计算机把程序及其操作数据一同存储在存储器里。 4.（计算机体系结构）是机器语言程序员所看到的传统机器级所具有的属性，其实质是确定计算机系统中软硬件的界面。 5.（控制器）的基本任务是按照程序所排的指令序列，从存储器取出指令操作码到控制器中，对指令操作码译码分析，执行指令操作。 6.（流水线）技术体现了计算机并行处理中的时间并行。 7.（数据流）是执行周期中从内存流向运算器的信息流。 8.（指令周期）是取出并执行一条指令的时间。年开始出现的第二代计算机，使用（晶体管）作为电子器件。年代中期开始出现的第三代计算机，使用（小规模集成电路、中规模集成电路）作为电子器件。年代开始出现的第四代计算机，使用（大规模集成电路、超大规模集成电路）作为电子器件。存储器在产生替换时，可以采用以下替换算法：（LFU算法、LRU算法、随机替换）。的功能由（硬件）实现，因而对程序员是透明的。是介于CPU和（主存、内存）之间的小容量存储器，能高速地向CPU提供指令和数据，从而加快程序的执行速度。由高速的（SRAM）组成。的基本功能包括（程序控制、操作控制、时间控制、数据加工）。的控制方式通常分为：（同步控制方式、异步控制方式、联合控制方式）反映了时序信号的定时方式。的联合控制方式的设计思想是：（在功能部件内部采用同步控制方式、在功能部件之间采用异步控制方式、在硬件实现允许的情况下，尽可能多地采用异步控制方式）。的同步控制方式有时又称为（固定时序控制方式、无应答控制方式）。的异步控制方式有时又称为（可变时序控制方式、应答控制方式）。

高级计算机体系结构作业汇总(非标准答案)

1.Explain the Concepts Computer Architecture 系统结构由程序设计者所看到的一个计算机系统的属性。即计算机系统的软硬件界面。 Advanced CA 高级系统结构新型计算机系统结构。基于串行计算机结构，研究多指令多数据计算机系统，具有并发、可扩展和可编程性。为非冯式系统结构。 Amdahl law Amdahl定律系统中某部件由于采用某种方式时系统性能改进后，整个系统性能的提高与该方式的使用频率或占的执行时间的比例有关。 SCALAR PROCESSING 标量处理机在同一时间内只处理一条数据。 LOOK-AHEAD 先行技术通过缓冲技术和预处理技术，解决存储器冲突，使运算器能够专心与数据的运算，从而大幅提高程序的执行速度。 PVP 向量型并行计算处理机以流水线结构为主的并行处理器。 SMP 对称多处理机系统任意处理器可直接访问任意内存地址,使用共享存储器，访问延迟、带宽、机率都是等价的。MPP 大规模并行计算机系统物理和逻辑上均是分布内存，能扩展至成百上千处理器，采用专门设计和定制的高通信带宽和低延迟的互联网络。 DSM 分布式共享存储系统内存模块物理上局部于各个处理器内部,但逻辑上是共享存储的。 COW 机群系统每个节点都是一个完整的计算机，各个节点通过高性能网络相互连接，网络接口和I/O总线松耦合连接，每个节点有完整的操作系统。 GCE 网格计算环境利用互联网上的计算机的处理器闲置处理能力来解决大型计算问题的一种科学计算。 CISC 复杂指令集计算机

通过设置一些复杂的指令，把一些原来由软件实现的常用功能改用硬件实现的指令系统实现，以此来提高计算机的执行速度。 RISC 精简指令集计算机尽量简化计算机指令功能，只保留那些功能简单，能在一个节拍内执行完的指令，而把复杂指令用段子程序来实现。 VMM 虚拟机监视器作为软硬件的中间层，在应用和操作系统所见的执行环境之间。 SUPERCOMPUTER 超级计算机数百数千甚至更多的处理器组成的能计算普通计算机不能完成的大型复杂问题的计算机。SVM 共享虚拟存储器存储器虚拟化为一个共享的存储器，并提供单一的地址空间。 MAINFRAME 大型计算机作为大型商业服务器，一般用于大型事务处理系统，特别是过去完成的且不值得重新编写的数据库应用系统方面。 COMPUTER SYSTEM ON CHIP 片上计算机系统在单个芯片上集成的一个完整系统。 PARALLEL ARCHITECTURE INTO SINGLE CHIP 单片并行结构在单个芯片上采用的并行体系结构 MOORE law Moore定律当价格不变时，集成电路上可容纳的晶体管数目，约每隔18个月便会增加一倍，性能也将提升一倍。 UMA 一致存储访问采用集中式存储的模式，提供均匀的存储访问。 NUMA 非一致存储访问内存模块局部在各个结点内部，所有局部内存模块构成并行机的全局内存模块。 COMA 全高速缓存存储访问采用分布式存储模式，通过高速缓存提供快速存储访问。 CC-NUMA 全高速缓存非一致性均匀访问存在专用硬件设备保证在任意时刻，各结点Cache中数据与全局内存数据的一致性。NORMA 非远程存储访问

计算机体系结构习题答案解析

第1章计算机系统结构的基本概念 1.1 解释下列术语层次机构：按照计算机语言从低级到高级的次序，把计算机系统按功能划分成多级层次结构，每一层以一种不同的语言为特征。这些层次依次为：微程序机器级，传统机器语言机器级，汇编语言机器级，高级语言机器级，应用语言机器级等。虚拟机：用软件实现的机器。翻译：先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序，然后再在这低一级机器上运行，实现程序的功能。解释：对于高一级机器上的程序中的每一条语句或指令，都是转去执行低一级机器上的一段等效程序。执行完后，再去高一级机器取下一条语句或指令，再进行解释执行，如此反复，直到解释执行完整个程序。计算机系统结构：传统机器程序员所看到的计算机属性，即概念性结构与功能特性。透明性：在计算机技术中，把这种本来存在的事物或属性，但从某种角度看又好像不存在的概念称为透明性。计算机组成：计算机系统结构的逻辑实现，包含物理机器级中的数据流和控制流的组成以及逻辑设计等。计算机实现：计算机组成的物理实现，包括处理机、主存等部件的物理结构，器件的集成度和速度，模块、插件、底板的划分与连接，信号传输，电源、冷却及整机装配技术等。系统加速比：对系统中某部分进行改进时，改进后系统性能提高的倍数。 Amdahl定律：当对一个系统中的某个部件进行改进后，所能获得的整个系统性能的提高，受限于该部件的执行时间占总执行时间的百分比。程序的局部性原理：程序执行时所访问的存储器地址不是随机分布的，而是相对地簇聚。包括时间局部性和空间局部性。 CPI：每条指令执行的平均时钟周期数。测试程序套件：由各种不同的真实应用程序构成的一组测试程序，用来测试计算机在各个方面的处理性能。存储程序计算机：冯·诺依曼结构计算机。其基本点是指令驱动。程序预先存放在计算机存储器中，机器一旦启动，就能按照程序指定的逻辑顺序执行这些程序，自动完成由程序所描述的处理工作。系列机：由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。软件兼容：一个软件可以不经修改或者只需少量修改就可以由一台计算机移植到另一台计算机上运行。差别只是执行时间的不同。向上（下）兼容：按某档计算机编制的程序，不加修改就能运行于比它高（低）档的计算机。向后（前）兼容：按某个时期投入市场的某种型号计算机编制的程序，不加修改地就能

计算机组成与体系结构复习大纲2016

《计算机组成与系统结构》考试大纲第1章计算机系统概论本章的学习目的：初步了解计算机系统的组成和计算机的工作过程，掌握常用的概念、名词术语，为以后各章的学习打下基础。本章要掌握的主要内容： 1.计算机系统是由硬件和软件两大部分组成的，硬件是物质基础，软件是解题的灵魂。弄清硬件和软件的概念。 2.计算机硬件系统所包含的主要部分，各部分的功能及其组成框图。 3.计算机的工作过程，主要是周而复始地取出指令、解释指令和执行指令的过程。而指令周期是指取出指令和执行指令所需的时间。它包括取出指令、解释指令和执行指令两个阶段。 4.冯·诺依曼计算机的设计思想是采用二进制表示各种信息以及存储程序和程序控制。存储程序的概念是将解题程序（连同必须的原始数据）预先存入存储器；程序控制是指控制器依据所存储的程序控制全机自动、协调地完成解题任务。存储程序和程序控制统称为存储程序控制。它是电子数字计算机与其他计算工具的最大区别，是电子计算机之所以能高速进行大量计算工作的基础。 5.控制器和运算器合称为中央处理器CPU，当前CPU芯片还集成有存储管理部件、Cache等；CPU和内存储器合称为计算机主机。 6.指令字和数据均以二进制代码的形式存入存储器，计算机是如何区分出指令和数据的。 7.计算机系统的主要性能指标：字长、存储容量、运算速度等。 8.计算机的运算速度是指它每秒钟执行指令的条数。单位是MIPS（百万条指令每秒） ∑=? = n i i i m t f V 1 1 式中，n—指令的种类 f i —第i种指令在程序中出现的频度（%） t i —第i种指令的指令周期 9.计算机系统按功能划分，通常为五级的层次结构：依次是微程序设计级、一般机器级、操作系统级、汇编语言级和高级语言级，每一级都可进行程序设计。 10.软件和硬件在逻辑功能的等效性及其例子。 11.本章主要的术语及概念：

计算机体系结构_第一次作业

计算机体系结构第一章 1.11 Availability is the most important consideration for designing servers, followed closely by scalability and throughput. a. We have a single processor with a failures in time(FIT) of 100. What is the mean time to failure (MTTF) for this system? b. If it takes 1 day to get the system running again, what is the availability of the system? c. Imagine that the government, to cut costs, is going to build a supercomputer out of inexpensive computers rather than expensive, reliable computers. What is the MTTF for a system with 1000 processors? Assume that if one fails, they all fail. 答： a. 平均故障时间(MTTF)是一个可靠性度量方法，MTTF的倒数是故障率，一般以每10亿小时运行中的故障时间计算(FIT)。因此由该定义可知1/MTTF=FIT/10＾9，所以MTTF=10^9/100=10^7。b. 系统可用性=MTTF/(MTTF+MTTR)，其中MTTR为平均修复时间，在该题目中表示为系统重启时间。计算10^7/(10^7+24)约等于1. c. 由于一个处理器发生故障，其他处理器也不能使用，所以故障率为原来的1000倍，所以MTTF值为单个处理器MTTF的1/1000即10^7/1000=10^4。 1.14 In this exercise, assume that we are considering enhancing

《_计算机组成与系统结构》考试试卷

学试卷院（系、部）专业班级姓名学号 …… .… … … … … …… … … … … .密… … … … … … … … … …… … … … … 封 … … … … …… . . …… … … … ……. . 线… … … … … … … … … … … … … … . . 计算机组成与系统结构考试试卷一．填空题 (填空每空1分，共10分；选择填空每空2分，共20分) 1．计算机系统中的存贮器系统是指___D ___。 A RAM 存贮器 B ROM 存贮器 C 主存贮器 D cache 、主存贮器和外存贮器 2．某机字长32位，其中1位符号位，31位表示尾数。若用定点小数表示，则最大正小数为___B ___。 A +（1 – 2-32） B +（1 – 2-31） C 2-32 D 2-31 3．算术 / 逻辑运算单元74181ALU 可完成___C ___。 A 16种算术运算功能 B 16种逻辑运算功能 C 16种算术运算功能和16种逻辑运算功能 D 4位乘法运算和除法运算功能 4．存储单元是指___B ___。 A 存放一个二进制信息位的存贮元 B 存放一个机器字的所有存贮元集合 C 存放一个字节的所有存贮元集合 D 存放两个字节的所有存贮元集合； 5．相联存贮器是按___C ___进行寻址的存贮器。 A 地址方式 B 堆栈方式 C 内容指定方式 D 地址方式与堆栈方式 6．变址寻址方式中，操作数的有效地址等于___C ___。 A 基值寄存器内容加上形式地址（位移量） B 堆栈指示器内容加上形式地址（位移量） C 变址寄存器内容加上形式地址（位移量） D 程序记数器内容加上形式地址（位移量） 7．以下叙述中正确描述的句子是：___D ___。 A 同一个CPU 周期中，可以并行执行的微操作叫相容性微操作 B 同一个CPU 周期中，不可以并行执行的微操作叫相容性微操作 C 同一个CPU 周期中，可以并行执行的微操作叫相斥性微操作 D 同一个CPU 周期中，不可以并行执行的微操作叫相斥性微操作 8．计算机使用总线结构的主要优点是便于实现积木化，同时___C ___。 A 减少了信息传输量 B 提高了信息传输的速度 C 减少了信息传输线的条数

计算机系统主要由哪两部分组成

1.计算机系统主要由哪两部分组成？硬件结构主要有哪几大部分？答：计算机系统主要由硬件、软件两大部分组成，硬件结构从概念上来说主要由中央处理器（运算器、控制器）、存贮器、输入设备、输出设备等几大部分组成。 2.PLC、DCS的中文全称和英文全称分别是什么？答：PLC中文全称：可编程序逻辑控制器，英文全称：ProgrammablepLogicalpController 。DCS中文全称：分散控制系统，英文全称： DistributedpControlpSystem。 3.一体化PLC和模块化PLC各有什么特点？答：一体化PLC通常为小型PLC，其 I/O点数规模小，I/O、PS、CPU等都集中在一起，适合于单机自动化任务

或简单的控制对象。模块化PLC通常为中、大规模PLC，其I/O点数在几百点、几千点甚至上万点，所有I/O 以及PS、CPU、CP等等功能单元均做成独立的模块形式，根据需要以总线形式连接组合在一起，构成一个完整的系统，以实现复杂的自动控制任务。 4.PLC由哪几个部分组成？答：PLC的基本组成部分有：电源模块、CPU模块、I/O模块、编程器、编程软件工具包等，根据不同类型的系统，一般还会有安装机架（底板）、通讯模板、智能模板、接口模板等 5.一般而言,PLC的I/O点数要冗余10%。 6.PLC设计规范中,RS232通讯的距离是为15m。 7.PLC的RS485专用通讯模块的通讯距离500m。 8.PLC采用典型的计算机结构，由

中央处理器、存储器、输入输出接口电路和其它一些电路组成。 9.PLC的输入信号模式中，交流输入的电压大多采用AC110V或 AC220V，直流输入额定电压为 DC24～48V。 10.PLC中CPU的主要作用是什么？答：CPU是PLC的主要部分，是系统的控制中枢，它接收并存储从编程器键入的用户程序和数据；检查电源、存储器、I/O以及警戒定时器的状态，并诊断用户程序的语法错误。 11.PLC在循环扫描周期内，将所需要输入输出信息存到预先准备好的一定区域，这个区域称为 I/O镜像区。 12.控制系统的各类模块中，PS、 CPU、CP、AI、AO、DI、DO、IM分别指的是哪些类型的模块？答：PS－电源模块，CPU－中央处理器模块，CP－通讯处理器模块，AI －模拟量输入模块，AO－模拟量输出

《计算机体系结构》在线作业二

北交《计算机体系结构》在线作业二一、单选题（共20 道试题，共60 分。） 1. 按照M ·弗林对处理机并行性定义的分类原则，阵列机ILLIAC —IV 是( )。 A. SISD B. SIMD C. MISD D. MIMD 正确答案： 2. 输入输出系统硬件的功能对( )是透明的。 A. 操作系统程序员 B. 应用程序员 C. 系统结构设计人员 D. 机器语言程序设计员正确答案： 3. 浮点数尾数基值rm=8，尾数数值部分长6位，可表示规格化正尾数的个数是（）。 A. 56个 B. 63个 C. 64个 D. 84个正确答案： 4. 从计算机系统结构上讲，机器语言程序员所看到的机器属性是( )。 A. 计算机软件所要完成的功能 B. 计算机硬件的全部组成 C. 编程要用到的硬件组织 D. 计算机各部件的硬件实现正确答案： 5. 对机器语言程序员透明的是( )。 A. 中断字 B. 主存地址寄存器 C. 通用寄存器 D. 条件码正确答案： 6. 通道方式输入输出系统中，对优先级高的磁盘等高速设备，适合于连接( )。 A. 字节多路通道 B. 选择通道 C. 数组多路通道

D. 字节及数组多路通道正确答案： 7. 设16 个处理器编号分别为0 ，1 ，2 ，…，15 ，用PM 2-0 互联函数时，第13 号处理机与第( ) 号处理机相联。 A. 12 B. 9 C. 11 D. 5 正确答案： 8. 对系统程序员不透明的应当是( )。 A. Cache存贮器 B. 系列机各档不同的数据通路宽度 C. 指令缓冲寄存器 D. 虚拟存贮器正确答案： 9. 对应用程序员不透明的是( )。 A. 先行进位链 B. 乘法器 C. 指令缓冲器 D. 条件码寄存器正确答案： 10. 系列机软件应做到( )。 A. 向前兼容，并向上兼容 B. 向后兼容，力争向上兼容 C. 向前兼容，并向下兼容 D. 向后兼容，力争向下兼容正确答案： 11. 动态数据流机最突出的特点是使( )。 A. 数据流令牌无标号 B. 需要程序记数器来实现 C. 令牌带上标号 D. 同步由门(Latch)寄存器来实现正确答案： 12. 计算机系统多级层次中，从下层到上层，各级相对顺序正确的应当是( )。 A. 汇编语言机器级――操作系统机器级――高级语言机器级 B. 微程序机器级――传统机器语言机器级――汇编语言机器级 C. 传统机器语言机器级――高级语言机器级――汇编语言机器级 D. 汇编语言机器级――应用语言机器级――高级语言机器级正确答案： 13. 用户高级语言源程序中出现的读写(I/O) 语句，到读写操作全部完成，需要通过( )共同完成。 A. 编译系统和操作系统 B. I/O 总线、设备控制器和设备 C. 操作系统和I/O 设备硬件

计算机组成与系统结构课后答案全

第 1 章习题答案 5．若有两个基准测试程序P1和P2在机器M1和M2上运行，假定M1和M2的价格分别是5000元和8000元，下表给出了P1和P2在M1和M2上所花的时间和指令条数。请回答下列问题：（1）对于P1，哪台机器的速度快？快多少？对于P2呢？（2）在M1上执行P1和P2的速度分别是多少MIPS？在M2上的执行速度又各是多少？从执行速度来看，对于P2，哪台机器的速度快？快多少？（3）假定M1和M2的时钟频率各是800MHz和，则在M1和M2上执行P1时的平均时钟周期数CPI各是多少？（4）如果某个用户需要大量使用程序P1，并且该用户主要关心系统的响应时间而不是吞吐率，那么，该用户需要大批购进机器时，应该选择M1还是M2？为什么？（提示：从性价比上考虑）（5）如果另一个用户也需要购进大批机器，但该用户使用P1和P2一样多，主要关心的也是响应时间，那么，应该选择M1还是M2？为什么？参考答案：（1）对于P1，M2比M1快一倍；对于P2，M1比M2快一倍。（2）对于M1，P1的速度为：200M/10=20MIPS；P2为300k/=100MIPS。对于M2，P1的速度为：150M/5=30MIPS；P2为420k/=70MIPS。从执行速度来看，对于P2，因为100/70=倍，所以M1比M2快倍。（3）在M1上执行P1时的平均时钟周期数CPI为：10×800M/(200×106)=40。在M2上执行P1时的平均时钟周期数CPI为：5×(150×106)=40。（4）考虑运行P1时M1和M2的性价比，因为该用户主要关心系统的响应时间，所以性价比中的性能应考虑执行时间，其性能为执行时间的倒数。故性价比R为： R=1/(执行时间×价格) R越大说明性价比越高，也即，“执行时间×价格”的值越小，则性价比越高。因为10×5000 > 5×8000，所以，M2的性价比高。应选择M2。（5）P1和P2需要同等考虑，性能有多种方式：执行时间总和、算术平均、几何平均。若用算术平均方式，则：因为(10+/2×5000 > (5+/2×8000，所以M2的性价比高，应选择M2。若用几何平均方式，则：因为sqrt(10× ×5000 < sqrt(5××8000，所以M1的性价比高，应选择M1。 6．若机器M1和M2具有相同的指令集，其时钟频率分别为1GHz和。在指令集中有五种不同类型的指令请回答下列问题：（1）M1和M2的峰值MIPS各是多少？（2）假定某程序P的指令序列中，五类指令具有完全相同的指令条数，则程序P在M1和M2上运行时，哪台机器更快？快多少？在M1和M2上执行程序P时的平均时钟周期数CPI各是多少？

第一部分计算机系统组成及说明

第一部分：计算机系统组成及说明一、计算机系统组成一个完整的计算机系统通常是由硬件系统和软件系统两大部分组成的。（一）硬件（hardware）硬件是指计算机的物理设备，包括主机及其外部设备。具体地说，硬件系统由运算器、控制器、存储器、输入设备和输出设备五大部件组成。 ①存储器。存储器是计算机用来存放程序和原始数据及运算的中间结果和最后结果的记忆部件。 ②运算器。运算器对二进制数码进行算术或逻辑运算。 ③控制器。控制器是计算机的“神经中枢”。它指挥计算机各部件按照指令功能的要求自动协调地进行所需的各种操作。 ④输入/输出设备（简称I/O设备）。计算机和外界进行联系业务要通过输入输出设备才能实现。输入设备用来接受用户输入的原始数据和程序，并将它们转换成计算机所能识别的形式（二进制）存放到内存中。输出设备的主要功能是把计算机处理的结果转变为人们能接受的形式，如数字、字母、符号或图形。（二）软件（software）软件是指系统中的程序以及开发、使用和维护程序所需要的所有文档的集合。包括计算机本身运行所需的系统软件和用户完成特定任务所需的应用软件（三）硬件和软件的关系

硬件是计算机的基础，软件对硬件起辅助支持作用，二者相辅相成，缺一不可，只有有了软件的支持，硬件才能充分发挥自己的作用。二、计算机工作原理（一）冯·诺依曼设计思想计算机问世５０年来，虽然现在的计算机系统从性能指标、运算速度、工作方式、应用领域和价格等方面与当时的计算机有很大的差别，但基本体系结构没有变，都属于冯·诺依曼计算机。冯·诺依曼设计思想可以简要地概括为以下三点： ①计算机应包括运算器、存储器、控制器、输入和输出设备五大基本部件。 ②计算机内部应采用二进制来表示指令和数据。每条指令一般具有一个操作码和一个地址码。其中，操作码表示运算性质，地址码指出操作数在存储器的位置。 ③将编好的程序和原始数据送入内存储器中，然后启动计算机工作，计算机应在不需操作人员干预的情况下，自动逐条取出指令和执行任务。冯·诺依曼设计思想最重要之处在于他明确地提出了“程序存储”的概念。他的全部设计思想，实际上是对“程序存储”要领的具体化。

计算机体系结构第一次作业

问答题（共4道题） 1．什么是存储系统？答：存储系统是指计算机中由存放程序和数据的各种存储设备、控制部件及管理信息调度的设备（硬件）和算法（软件）所组成的系统。计算机的主存储器不能同时满足存取速度快、存储容量大和成本低的要求，在计算机中必须有速度由慢到快、容量由大到小的多级层次存储器，以最优的控制调度算法和合理的成本，构成具有性能可接受的存储系统。 2．什么是高速缓冲存储器答：指存取速度比一般随机存取记忆体（RAM）来得快的一种RAM。一般而言它不像系统主记忆体那样使用DRAM技术，而使用昂贵但较快速的SRAM技术，也有快取记忆体的名称。高速缓冲存储器是存在于主存与CPU之间的一级存储器，由静态存储芯片(SRAM)组成，容量比较小但速度比主存高得多，接近于CPU的速度。在计算机存储系统的层次结构中，是介于中央处理器和主存储器之间的高速小容量存储器。它和主存储器一起构成一级的存储器。高速缓冲存储器和主存储器之间信息的调度和传送是由硬件自动进行的。 3．假设一台模型计算机共有10种不同的操作码，如果采用固定长操作码需要4 位。已知各种操作码在程序中出现的概率如下表所示，计算采用Huffman编码法的操作码平均长度，并计算固定长操作码和Huffman操作码的信息冗余量（假设最短平均长度H＝3.1位）。答：构造Huffman树如下：

Huffman 编码的平均码长为： ∑=10 1 i i i l p =0.17*2+（0.15+0.15+0.13+0.12）*3+（0.09+0.08+0.07）*4+（0.03+0.01）*5=3.15 冗余量=（3.15-3.10）/3.15=1.59% 固定码长=log210=4 冗余量=（4-3.10）/4=22.5% 4.若某机要求有：三地址指令4条，单地址指令192条，零地址指令16条。设指令字长为12位，每个地址码长3位。问能否以扩展操作码为其编码？答：三种指令字格式如下：

计算机组成与系统结构书本答案

C1: 以下哪些设备不属于冯?诺伊曼体系结构计算机的五大部件？寄存器, 缓冲器适配器的作用是保证_____用计算机系统特性所要求的形式发送或接收信息。正确答案是：I/O设备 1966年，Flynn从计算机体系结构的并行性能出发，按照_____的不同组织方式，把计算机系统的结构分为SISD、SIMD、MISD和MIMD四类。指令流, 数据流具有相同_____的计算机，可以采用不同的_____ 。：计算机体系结构，计算机组成冯?诺伊曼型计算机的设计思想是_____。正确答案是：存储程序并按地址顺序执行 1958年开始出现的第二代计算机，使用_____作为电子器件。晶体管在计算机系统的层次结构中，_____采用符号语言。高级语言级, 汇编语言级世界上第一台通用电子数字计算机ENIAC使用_____作为电子器件电子管在计算机系统的层次结构中，属于硬件级的是_____。微程序设计级, 机器语言级 C2：为了提高浮点数的表示精度，当尾数不为_____时，通过修改阶码并移动小数点，使尾数域的最高有效位为_____，这称为浮点数的规格化表示。0，1 在我国使用的计算机汉字操作平台中，_____字符集未收录繁体汉字。GB2312 在定点_____运算中，为了判断溢出是否发生，可采用双符号位检测法。不论溢出与否,其_____符号位始终指示正确的符号。小数，最高, 整数，最高在定点二进制运算器中，减法运算一般通过_____来实现。补码运算的二进制加法器在奇偶校验中，只有当数据中包含有_____个1时, 偶校验位=_____。偶数，0, 奇数，1 奇偶校验无法检测_____个错误，更无法识别错误信息的_____。偶数，位置, 偶数，内容在PC机中，若用扩展ASCII码、Unicode UCS-2和UCS-4方法表示一个字符，则三者之间的差异为：扩展ASCII码用_____位表示，Unicode UCS-2用_____位表示，Unicode UCS-4用_____位表示。8，16，32 C3：相联存储器是以______来访问存储器的。关键字, 内容 Cache由高速的______组成。SRAM Cache存储器在产生替换时，可以采用以下替换算法：______。LFU算法, LRU算法, 随机替换 Cache的功能由______实现，因而对程序员是透明的。硬件 MOS半导体存储器中，______的外围电路简单，速度______，但其使用的器件多，集成度不高。SRAM，快 EPROM是指______。光擦可编程只读存储器虚拟地址空间的大小实际上受到______容量的限制。辅助存储器相联存储器是以______来访问存储器的。关键字, 内容从CPU来看，增加Cache的目的，就是在性能上使______的平均读出时间尽可能接近Cache 的读出时间。主存, 内存虚拟地址由______生成。编译程序 MOS半导体存储器中，______可大幅度提高集成度，但由于______操作，外围电路复杂，速度慢。DRAM，刷新虚拟存储器可看作是一个容量非常大的______存储器，有了它，用户无需考虑所编程序在