当前位置：文档之家› 计算机体系结构

计算机体系结构

有关并行算法

专业

指导教师

班级

学号

姓名

日期

广西工学院计算机学院

有关并行算法

一、并行计算技术概述

60年代初期，由于晶体管技术与存储器技术的发展导致并行计算机的出现，这一时期的典型代表就是IBM 360。创建和使用并行计算机的主要原因是因为并行计算机是解决筚处理器速度瓶颈的最好方法之一。并行计算机是由一组处理单元组成的，这组处理单元通过相互之间的通信与协作．以更快的速度共同完成一项大规模的计算任务。因此，并行计算机的两个最主要的组成部分是计算节点和节点间的通信与协作机制。并行计算机体系结构的发展也主要体现在计算节点性能的提高以及节点间通信技术的改进两方面。

就单台计算机系统而言．采用SMP技术是扩展其佳能的比较有效的方法．它可以将系统中的多个操作系统分布在多个处理器上执行以获得并行处理的效果。SMP技术可以通过多线程并行来提高性能。通过采用并行多线程技术，服务器可以通过SMP技术同时处理多个应用请求．使得这些程序获得了更好的运行效果，而且在龠式机的专业应用软件中，并行多线程技术的采用也日益增多。

伴随SMP技术的出现．带来另外的问题，那就是当应用增加时．虽然可以通过增加处理器的方法来扩展系统能力，但是，一方面需要有扩展连接处理器的系统总线的高超技术，并不是每个系统厂商都能做到，另一方面由于对共享资源的竞争所造成的系统瓶颈．使得单机系统的性能呈非线性增长。因此，当应用增加超过单机系统的承受能力时，就采用集群系统(CLUS-rIER)。在集群系统中，每台服务器处理各自的工作，提供各自的服务。当需要更高的的性能以适应更多的应用肘，既可以升级原有的服务器（增加更多的处理器、内存和存储等），又可以在集群系统中增加新的服务器。更进一步，集群系统在平衡和扩展整个计算机应用系统的工作负载的同时，也为用户提供了高性能和高可用性。

1977年,DEC公司推出了以VAX为结点机的松散耦合的集群系统．并成功地糌VMS操作系统移植到该系统上。20世纪90年代后．随着RISC技术的发展运用和高性能网络产品的出现，集群系统在性能价格比(C∞t/Perfonuance)、【il扩展性&ala-bility)、可用性(Availability)等方面都显示出了很强的竞争力，尤其是它在对现有单机上的软硬件产品的继承和对商用软硬件最新研究成果的快速运用，从两方面表现出传统MPP无法比拟的优势。

这里所介绍的高性能计算环境，从程序开发角度主要分为以下两类：一大类是共享内存系统，包括并行向量机(PVP，Par-allel Vector Pnx:eswr)、分布式共享存储多处理机(DSM.Dis-tributied Shared Memory)和对称多处理饥(SMP,Symmer/calMuhiPmcessing)等结构，其特点是多个处理器拥有物理上共享的内存，如HP的SuperDome．我国曙光1号，SGI Power Chal-lenge等；另·一大类是分布存储系统(DMP)，如大规模并行处理机(MPP．Massively Parallel Processor)和集群系统(Cluster)，其特点是系统由多个物理上分布的结蠃组成，每个结点拥有自己的内存．

二、什么是并行算法

并行算法（parallel computing）是指，在并行机上，将一个应用分解成多个子任务，分配给不同的处理器，各处理器之间相互协调，并行地执行子任务，从而达到加速求解速度，或者求解大规模应用问题的目的。

开展并行计算，必须具备三个节本条件：

1.并行机。并行机至少包含两台或两台以上处理机，这些处理机通过通过互联

网相互连接，相互通信。

2.应用问题必须具有并行度。也就是说，应用可以分解为多个子任务，这些子

任务可以并行地执行，将一个应用分解为多个子任务的过程，称为并行算法

的设计。

3.并行编程。在并行机提供的并行编程环境上，具体实现并行算法，编制并行

程序，并运行该程序，从而达到并行求解应用问题的目的

三、并行算法的基本原理

并行计算是同时使用多种计算资源解决计算问题的过程。并行计算的主要目的是快速解决大型且复杂的计算问题。此外还包括：利用非本地资源，节约成本―使用多个“廉价”计算资源取代大型计算机，同时克服单个计算机上存在的存储器限制。

传统地，串行计算是指在单个计算机（具有单个中央处理单元）上执行软件写操作。CPU 逐个使用一系列指令解决问题，但其中只有一种指令可提供随时并及时的使用。并行计算是在串行计算的基础上演变而来，它努力仿真自然世界中的事务状态：一个序列中众多同时发生的、复杂且相关的事件。

为利用并行计算，通常计算问题表现为以下特征：

（1）将工作分离成离散部分，有助于同时解决；

（2）随时并及时地执行多个程序指令；

（3）多计算资源下解决问题的耗时要少于单个计算资源下的耗时。

并行计算是相对于串行计算来说的，所谓并行计算分为时间上的并行和空间上的并行。时间上的并行就是指流水线技术，而空间上的并行则是指用多个处理器并发的执行计算。并行计算的主要研究内容大致可分为四个方面：

(1)并行计算机的并行性抽取，充分理解和抽取当前并行计算机体系结构的高性能特征，提出实用的并行计算模型和并行计算评价方法。

(2)并行计算设计与分析，设计高效率的并行算法，将应用问题分解为可并行计算的多个子任务。

(3)并行实现技术，主要包含并行程序设计和并行性能优化

(4)并行应用，这是并行计算研究的最终目的。

四、并行计算机的分类

SIMD机器是指单指令流多数据流并行机，也即指系统中各功能部件或处理机对多组数据执行相同的指令流或操作。SIMD机器在任何时刻只有一条指令在执行。所以该类计算机的主要特征是：同步的、确定的。它适合于指令／操作级并行。

MIMD并行机是指多指令流多数据流并行机，也即指系统中的各处理机在各自唯一的数据流上执行各自的指令流，与其它处理机无关。MIMD的一个特例是单程序、多数据计算，即所有处理机执行同一程序，而由进程指标加以参数化，从而完成对不同数据的操作。

分布存储MIMD并行多处理机，该系统中每台处理机都有自己的局部存储器，构成一个单独的节点，节点之间通过互连网络相互连接。每台处理机只能直接访问局存，不能访问其它处理机的存储器，它们之间的协调以消息传递的方式进行。

分布共享存储MIMD并行机，分布共享存储结构也称为非一致内存访问结构，是指系统中的每台处理机都有自己的局部存储器，但这些局存组合起来形成了一个统一的共享地址空间。

五、并行计算机的体系结构

并行计算机体系结构是指并行处理系统(主要是分布式系统)中处理机或节点机之间的互连方式，它直接影响并行算法的实现效率。

并行计算机体系机构分类:

（1）总线结构；

（2）网格结构；

（3）超立方体结构。

总线结构中个处理机共享同一条物理线路，同一时刻只允许也有一个处理机发送消息，

当有多个处理机同时发送消息时，将使用仲裁机制决定消息发送顺序，从而导致通信开销的

增大。

网络结构，也就是二维阵列，可以分为环绕连接和无环绕连接两种方式，n*n 网格结构

的网络直径为2（n-1）。

超立方体结构，n=2^q 个节点可构成一个q 维超立方体。若用q 位二进制数对节点进行

编号，则超立方体结构中有两个节点相连的充分必要条件是节点的编号有且仅有一个不同。

六、并行算法的分类

根据基本运算对象的不同可分为以下两种：

数值并行算法，主要是指为数值计算设计的并行算法，如矩阵运算、多项式求解、解

线性方程组等。

非数值并行算法，是指为基于关系运算的一类诸如排序、选择、分类、搜索及图论等

方面的非数值计算问题设计的并行算法。

根据并行进程间执行顺序关系的不同可分为以下几种：

同步并行算法，是指某些进程必须等待别的进程的一类并行算法，异步并行算法，是指诸进程的执行一般不必相互等待的一类并行算法，进程间的通

信一般是通过动态地读、取(修改)共享存储器的全局变量。如通常运行在MIMD 机模型上的

并行算法。

独立并行算法，进程间执行是完成独立的，计算的整个过程不需要任何通信，例如气

象预报应用中通常需要同时计算多个模型，以保证预报的实时性。

七、并行算法的性能问题

1、硬件性能指标

a) 重要的性能指标是CPU 和输入/输出的速度以及互连网络的性能。

b) 互连网络的性能有两个重要的指标：延时（Latency ）和带宽（Bandwidth ）。

i. 延迟时间是指从CPU 发送分组至接收到响应的时间间隔。

ii. 对分带宽、聚集带宽和平均带宽（按照CPU 能力算）。

2、软件性能指标

最关键的性能指标是加速比（speedup ）：一个程序在有n 个处理器的计算机运行和在只

有一个处理器的计算机上运行相比快多少倍。

理想的加速比不可能达到的部分原因是几乎所有的程序都有串行部分。

假定一个程序在单处理器计算机上运行需要T 秒，其中一部分是串行代码，所占比例记

为f ，那么剩余的（1－f ）就是可以并行的。后一部分代码运行在n 个CPU 上而且没有任何

其它开销，那么在最理想的情况下，执行时间可以从（1－f ）T 减少到（1－f ）T/n 。串行

部分加并行部分的整个执行时间就是fT ＋（1－f ）T/n 。加速比就是原来程序的执行时间

除以新的程序的执行时间：

八、并行程序的开发模式

1．共享内存模式

共享内存并行模式编程相对较为简单，程序员不用考虑数据在内存中的位置，进程管理

及同步操作由系统完成。但是用这种方式编制的程序通常并行效率不高，因为它属于细粒度

并行，主要针对循环进行并行处理。另外共享内存并行模式只能运行在共享内存类型的计算

机系统上。

)f (n-n n -f)T (fT T Speedup 11/1+=+=

在共享内存模型中，一个并行程序由多个共享内存的并行任务组成，数据的交换通过隐含地使用共享数据来完成。此编程模式一般仅衙指定可以并行执行的循环，而不需考虑计算与数据如何划分．以及如何进行任务间通信，编译器会自动完成上述功能。

目前业界流行的共享内存模型开发标准是OpenMP。OpenMP定义了一套编译指导语句，用于指定程序的并行性、数据的共享，私有等信。其目标是为SMP系统提供可移植、可扩展的开发接口。Intel，DEC，Silicon Graphics．Kuch&Associates和1BM早在15午前就联合定义了OpenMP早期标准．新的OpenMP标准由OpenMP Architecture Review Board于1997年推出，现在已发展到2.0版。

2.消息传递模式

在消息传递模式中，一个并行程序由多个并行任务组成。每个并行任务拥有自己的数据并对其进行计算操作。任务之间数据的交换是通过显式的消息传递语句来完成的。

消息传递的并行方式虽然是在分布式内存的计算机结构基础上发展而来的．但是几乎所有类型的计算机都支持这种并行模式，因此更具通用性。消息传递方式的并行属于粗粒度并行，程序员负责进程管理、消息传递及同步．并行的工作量要大于共享内存并行模式。但同时程序员可以控制的也更多，可以通过仔细考虑任务分配，并行算法等方式对程序进行优化，因而获得较高的并行效率。国际上采用消息传递方式的应用软件远远多于采用共享内存并行模式的应用软件。国内的高性能计算用户也大多采用消息传递的并行方式开发自己的应用程序。

现在广泛使用的消息传递模型有两个：PVM和MPI。PVM即Parallel Vutual Machine 并行虚拟机）与MPI即Message Pas8-ing Intedace(消息传递界面)。PVM与MPI所提供的功能大致相同．但两者的侧重点有所不同。PVM强调在异构环境下的可移植性和互操作性。程序之间可以互相通信，并支持动态的资源管理和一定程度的容错：而MP!更强调性能，不同的MPI实现之间缺乏互操作性，本身也不支持容错（可以通过专门的容错软件来支持容错）。一般而言，使用MPI比较适合于开发MPP或同构集群上的并行应用，可以有较高的通信性能：而PVM更适合于异构的集群系统。

九、目前流行的并行程序设计的方法及其优缺点

1. MPI

MPI(Message Passing Interface)消息传递接口是MPI论坛发布的一个库，而不是一门实现语言，支持C/C++/Fortran。是一种消息传递编程模型，为进程间通信服务。MPI提供了一种与平台无关，可以被广泛使用的编写消息传递程序的标准。用它来编写消息传递程序，不仅实用、可移植、高效和灵活，而且和当前已有的实现没有太大的变化。

优点：可以在集群上使用，也可以在单核/多核CPU上使用，它能协调多台主机间的并行计算，因此并行规模上的可伸缩性很强，能在从个人电脑到世界TOP10的超级计算机上使用。

缺点：第一，基于消息传递，需要显示划分和分布计算任务，显示进行消息传递与同步，且不易增量开发串行程序的并行性；第二，使用进程间通信的方式协调并行计算，这导致并行效率较低、内存开销大、不直观、编程麻烦。

2. OpenMP

OpenMP(Open Multi Processing)是由Open ARB发布的一种用于并行编程的规范，是建立在串行语言上的扩展，目前可以在C/C++/Fortran中使用。

OpenMP由三部分组成：编译指导(compiler directive)、运行库(runtime library)和环境变量(environment variables)。其语言模型基于以下假设：执行单元是共享一个地址空间的线程，即OpenMP是基于派生/连接(fork/join)的编程模型。

Fork/join并行机制：并行区前，串行命令派生出多条并行命令并行执行，执行到并行区末等待，等所有并行任务都结束，再转到串行执行。

OpenMP有两种常用的并行开发形式：一是通过简单的fork/join对串行程序并行化；二是采用单程序多数据对串行程序并行化。

优点：第一，共享存储模型，使得程序员不必进行数据划分和分布，使得开发并行程序比较容易；第二，更适合于SMP系统；第三，主要面向循环级的并行开发，可以容易地实现增量性的并行化。

缺点：第一，OpenMP只适用于SMP结构；第二，OpenMP主要开发循环级的并行程序，受此限制，对某些应用并不适合；第三，OpenMP的编写、正确性调试和性能调度复杂。

3. Intel IPP

Intel IPP(Integrated Performance Primitives)，Intel集成性能基元是Intel函数库的第二代。Intel为每种新的多核处理器都发布一个IPP函数库（C/C++ API），专用于多核架构，提供了调度优化的函数库，其中涉及的领域有数学、信号处理、音频视频、图像处理与编码、字符串、密码学。

优点：是经过性能高度优化的库，执行效率高。

缺点：专用于Intel处理器和某些领域，不方便移植

发展趋势：为广泛的多媒体提供功能，并着眼于持续改进产品的生命周期。

4. Intel TBB

Intel TBB(Threading Building Blocks)，Intel线程构建模块，是一个为创建可靠的、可移植的和可扩展的并行程序的C++模板库。专用于编写高层抽象的C++程序，和可移植的程序。

优点：可移植、可扩展。

缺点：性能没有IPP高。

发展趋势：扩展TBB到支持java和.net

5. MapReduce

MapReducesh是Google的人研究出来的一个模型，开发的一个针对大规模群组中的海量数据处理的分布式编程模型。

优点：能用于处理大规模数据，能将很多繁琐的细节隐藏起来，伸缩性非常好

缺点：不适应实时应用的需求

发展趋势：用优化云计算下的的编程

计算机体系结构试题及答案版本

计算机体系结构试题及答案 1、计算机高性能发展受益于：(1) 电路技术的发展；(2) 计算机体系结构技术的发展。 2、层次结构：计算机系统可以按语言的功能划分为多级层次结构，每一层以不同的语言为特征。第六级：应用语言虚拟机-> 第五级：高级语言虚拟机-> 第四级：汇编语言虚拟机-> 第三级：操作系统虚拟机->第二级：机器语言(传统机器级) -> 第一级：微程序机器级。 3、计算机体系结构：程序员所看到的计算机的属性，即概括性结构与功能特性。 4、透明性：在计算机技术中，对本来存在的事物或属性，从某一角度来看又好像不存在的概念称为透明性。 5、Amdahl 提出的体系结构是指机器语言级程序员所看见的计算机属性。 6、经典计算机体系结构概念的实质3是计算机系统中软、硬件界面的确定，也就是指令集的设计，该界面之上由软件的功能实现，界面之下由硬件和固件的功能来实现。 7、计算机组织是计算机系统的逻辑实现；计算机实现是计算机系统的物理实现。

8、计算机体系结构、计算机组织、计算机实现的区别和联系？答：一种体系结构可以有多种组成，一种组成可以有多种物理实现，体系结构包括对组织与实现的研究。 9、系列机：是指具有相同的体系结构但具有不同组织和实现的一系列不同型号的机器。 10、软件兼容：即同一个软件可以不加修改地运行于系统结构相同的各机器，而且它们所获得的结果一样，差别只在于运行时间的不同。 11、兼容机：不同厂家生产的、具有相同体系结构的计算机。 12、向后兼容是软件兼容的根本特征，也是系列机的根本特征。 13、当今计算机领域市场可划分为：服务器、桌面系统、嵌入式计算三大领域。 14、摩尔定律：集成电路密度大约每两年翻一番。 15、定量分析技术基础（1）性能的评测：（a）响应时间：从事件开始到结束之间的时间；计算机完成某一任务所花费的全部时间。（b）流量：单位时间内所完成的工作量。（c ）假定两台计算机x 、y；x 比y 快意思为：对于给定任务，x 的响应时间比y少。x的性能是y的几倍是指：响应时间x / 响应时间y = n ，响应时间与性能成反比。

计算机体系结构解

————————————————————————————————作者：————————————————————————————————日期：

第一章计算机组成原理本部分要求掌握计算机方面的基础知识，包括计算机的发展、计算的系统组成、基本组成和工作原理、计算机的数制数据表示以及运算校验、指令系统以及计算机系统的安全等基础性的知识。内容多而且复杂，尤其是有关计算机硬件方面的内容，很细而且灵活性不高，知识量相当大，掌握这部分一定要多下功夫，学会取舍、把握重点、抓住要害。 1.1 考试大纲及历年考题知识点 1.1.1 大纲要求考试要求： 1 掌握数据表示、算术和逻辑运算； 2 掌握计算机体系结构以及各主要部件的性能和基本工作原理考试范围 1 计算机科学基础 1.1 数制及其转换二进制、十进制和十六进制等常用制数制及其相互转换 1.2 数据的表示 ?数的表示（原码、反码、补码、移码表示，整数和实数的机内表示，精度和溢出）?非数值表示（字符和汉字表示、声音表示、图像表示） ?校验方法和校验码（奇偶校验码、海明校验码、循环冗余校验码） 1.3 算术运算和逻辑运算 ?计算机中的二进制数运算方法 ?逻辑代数的基本运算和逻辑表达式的化简 2．计算机系统知识 2.1 计算机系统的组成、体系结构分类及特性 ?CPU 和存储器的组成、性能和基本工作原理 ?常用I/O 设备、通信设备的性能，以及基本工作原理 ?I/O 接口的功能、类型和特性 ?I/O 控制方式（中断系统、DMA、I/O 处理机方式） ?CISC/RISC，流水线操作，多处理机，并行处理 2.2 存储系统 ?主存-Cache 存储系统的工作原理 ?虚拟存储器基本工作原理，多级存储体系的性能价格 ?RAID 类型和特性 2.3 安全性、可靠性与系统性能评测基础知识 ?诊断与容错 ?系统可靠性分析评价 ?计算机系统性能评测方式 1.2 计算机科学基础 1.2.1 数制及其转换 1、R 进制转换成十进制的方法按权展开法:先写成多项式,然后计算十进制结果. 举例： (1101.01)2=1×2^3+1×2^2+0×2^1+1×2^0+ 0×2^-1+1×2^-2 =8+4+1+0.25=13.25 (237)8=2×8^2+3×8^1+7×8^0 =128+24+7=159 (10D)16=1×16^2+13×16^0=256+13=269

计算机体系结构期末复习

计算机体系结构期末复习资料 1.并行性：是指在同一时刻或者是同一时间间隔内完成两种或两种以上性质相同或不同的工作。 2.CPI：每条指令执行时所花费的平均时钟周期。 3.体系结构：即计算机的属性，即概念性结构与功能特性。 4.Amdahl定理：加快某部件执行速度所获得的系统性能加速比，受限于该部件在系统中所占的重要性。 5.信息存储的整数边界：信息在主存中存放的起始地址必须是该信息（字节数）的整数倍。 6.指令系统的正交性：指在指令中各个不同含义的字段，在编码时应互不相关，相互独立。 7.流水线技术：是指将一个重复的时序过程，分解成为若干子过程，而每个过程都可有效在其专用功能段上与其他子过程同时执行。 8.定向技术：在某条指令产生一个结果之前，其他指令并不直接需要该计算结果，如果能将该计算结果从其他产生的地方直接送到其他指令需要它的地方，那么就可以避免暂停的技术就叫定向技术。 9.相关：衡量两个随机变量之间相关程度的指标。 10.向量流水处理机：是指处理机具有向量数据表示并通过向量指令对向量的各元素进行处理。、

11.定向：将计算结果从其产生的地方直接送到其他指令需要它的地方，或所有需要它的功能单元，避免暂停。 12.指令集的并行：当指令之间不存在相关时，它们在流水线中是可以重叠起来并行执行。 13.记分牌技术：流出和读操作数。在没有结构冲突时,尽可能早地执行没有数据冲突的指令,实现每个时钟周期执行一条指令。如果某条指令被暂停,而后面的指令与流水线中正在执行或被暂停的指令都不相关,是这些指令可以跨越它,继续流出和执行下去。 14.Tomasulo算法：寄存器换名是通过保留站和流出逻辑来共同完成,当指令流出时,如果其操作数还没有计算出来,则该指令中相应的寄存器换名将产生这个操作数的保留站的标识。因此,指令流出到保留站后,其操作数寄存器或者换成了数据本身,或换成了保留站的标识,和寄存器无关。后面指令对该寄存器的写入操作就不会产生WAR冲突。 15.替换算法：由于主存中的块比Cache中的块多，所以当要从主存中调一个块到Cache中时，会出现该块所映象到的一组（或一个）Cache块已全部被占用的情况。这时，需要被迫腾出其中的某一块，以接纳新调入的块。

计算机系统结构考试计算题

3.12 有一指令流水线如下所示（1）求连续输入10条指令，该流水线的实际吞吐率和效率；（2）该流水线的“瓶颈”在哪一段？请采取两种不同的措施消除此“瓶颈”。对于你所给出的两种新的流水线，连续输入10条指令时，其实际吞吐率和效率各是多少？解：（1） 2200(ns)2009200)10050(50t )1n (t T max m 1 i i pipeline =?++++=?-+?=∑= )(ns 220 1 T n T P 1pipeline -== 45.45%11 5 4400T P m t T P E m 1 i i ≈=? =?? =∑= （2）瓶颈在3、4段。 ? 变成八级流水线（细分） 850(ns)509850t 1)(n t T max m 1 i i pipeline =?+?=?-+?=∑= )(ns 85 1 T n T P 1pipeline -== 58.82%17 10 8400T P m ti T P E m 1 i ≈=? =?? =∑= ? 重复设置部件出 50ns 50ns 100ns 200ns

)(ns 85 1 T n T P 1pipeline -== 58.82%17 10885010400E ≈=??= 3.13 4段组成，3段时，一次，然4段。如果需要的时间都是，问：（1）当在流水线的输入端连续地每时间输入任务时，该流水线会发生什么情况？（2）此流水线的最大吞吐率为多少？如果每输入一个任务，连续处理 10个任务时的实际吞吐率和效率是多少？（3）当每段时间不变时，如何提高该流水线的吞吐率？仍连续处理10个任务时，其吞吐率提高多少？（2） t ?t ?2

计算机系统结构有详细答案

(仅供参考，不作为考试标准)，选择题分，每题分)2(30计算机系统结构设计者所关心的是________所看到的的计算机结构。 A)硬件设计人员B)逻辑设计人员 D)高级语言程序员C)机器语言或汇编语言程序员。意________，应当注提系在计算机统设计时，为了高系统性能度的令执行速快A)加经常性使用指大的指令特B)要别精心设计少量功能强数的占减少在数量上很小比例的指令条C)要度D)要加快少量指令的速。的问题统中因________而导致系主重叠寄存器技术要用于解决在RISC 流水线影A)JMP指令响保护令B)CALL指的现场问存储器不便来只C)有LOAD和STORE指令带的访度速器访问D)存储 ________ 效率高计为使流水算机运行要A)各过程段时间不同B)连续处理的任务类型应该不同 D)连续处理的任务数尽可能少C)连续处理的任务类型应该相同栈型替是的________。换算法堆不属于B)近期最少A)近期最使用法久未用法 D)页面失效频率法出进C)先先法象联组，相映的优点。是________象联全与相映相比B)块冲突概率低C)命中率高D)主存利用率小录A)目表高是方好关相指除中叠次一重消令最的法________。B)设相关专用令指改准A)不修通路令指条下析分后推C) 令指条下行执后推D) 流的用采，时关据数到，中作水操遇相________。有法办解决器译编化优A)用办的排新重令指过通，测检序法据数B)向定重技术 C)延迟转移技术 D)加快和提前形成条件码经多级网络串联来实现全排列网络，只能用________。 A)多级立方体网络B)多级PM2I网络 D)上述多级混洗交换网络任何网络C) 序传送的________。是以虫蚀寻径流水方式在各寻径器是顺B)包A)消息C)片节D)字 ________ 处理机超标量作指条令部件个B) 只有一操期A)在一个时钟周内分时发射多多钟C)在一个时周期内同时发射条指令件有只一个取指部D)

系统结构期末考试试题及答案

得分评分人填空题: （20分，每题2 分）单选题：（10分，每题1分） A.任何虚页都可装入主存中任何实页的位置 B. 一个虚页只装进固定的主存实页位置《计算机系统结构》期末考试试卷（A ）得分注：1、共100分，考试时间120分钟。 2、此试卷适用于计算机科学与技术本科专业。 1、."启动I/O"指令是主要的输入输出指令，是属于（ A. 目态指令 B.管态指令 C.目态、管态都能用的指令 D.编译程序只能用的指令 2、输入输出系统硬件的功能对（B ）是透明的 A.操作系统程序员 B.应用程序员 C.系统结构设计人员 D.机器语言程序设计员 3、全相联地址映象是指（A ） C. 组之间固定，组内任何虚页可装入任何实页位置 D.组间可任意装入，组内是固定装入 4、（ C ）属于MIMD 系统结构 A.各处理单元同时受一个控制单元的管理 B.各处理单元同时受同个控制单元送来的指令 C.松耦合多处理机和多计算机系统 D. 阵列处理机 5、多处理机上两个程序段之间若有先写后读的数据相关，则（ B ） A.可以并行执行 B.不可能并行 C.任何情况均可交换串行 D.必须并行执行 6、计算机使用的语言是（B ） A.专属软件范畴，与计算机体系结构无关 B.分属于计算机系统各个层次 C.属于用以建立一个用户的应用环境 D. 属于符号化的机器指令 7、指令执行结果出现异常引起的中断是（ C ） A.输入/输出中断 B.机器校验中断 C.程序性中断 D.外部中断 &块冲突概率最高的 Cache 地址映象方式是（A ） A.直接 B .组相联 C .段相联 D .全相联 9、组相联映象、LRU 替换的Cache 存储器，不影响 Cache 命中率的是（B ） A.增大块的大小 B .增大主存容量 C .增大组的大小 D .增加Cache 中的块数 10、流水处理机对全局性相关的处理不包括（C ） A.猜测法 B.提前形成条件码 C.加快短循环程序的执行 D.设置相关专用通路

计算机系统结构计算题

计算题用一条4段浮点加法器流水线求8个浮点数的和：Z ＝A ＋B ＋C ＋D ＋E ＋F ＋G ＋H 解： Z ＝[(A ＋B)＋(C ＋D)]＋[(E ＋F)＋(G ＋H)] 例设在下图所示的静态流水线上计算：流水线的输出可以直接返回输入端或暂存于相应的流水寄存器中，试计算其吞吐率、加周期 1 2 3 规格化尾数加对阶求阶差时间A C E G A+B E+F A+B+C+D 7个浮点加法共用了15个时钟周期。流水线的吞吐率为：TP n T t t k ==?=?7150471?? 流水线的加速比为：S T T t t k ==???=?04715187?? 流水线的效率为：E T k T t t k =?=????=?047415047?? 乘法加减法时间段输入 A 1 B 1 A 2 B 2 A 3 B 3 A 4 B 4 A B C D A ×B C ×D 1 2 3 4

（3）计算性能在18个△t 时间中，给出了7个结果。吞吐率为：不用流水线，由于一次求和需6△t ，一次求积需则产生上述7个结果共需（4×6+3×4）△t = 36△t 加速比为流水线的效率例有一条动态多功能流水线由5段组成，加法用1、3、4、5 段，乘法用1、2、5段，第2段的时间为2△t ，其余各段时间均为△t ，而且流水线的输出可以直接返回输入端或暂存于相应的流水寄存器中。若在该流水线上计算: 试计算其吞吐率、加速比和效率。 (1) 选择适合于流水线工作的算法应先计算A 1×B 1、A 2×B 2、A 3×B 3和A 4×B 4；再计算(A 1×B 1)＋(A 2×B 2) (A 3×B 3)＋(A 4×B 4)；然后求总的累加结果。 (2) 画出时空图 (3) 计算性能非线性流水线例5.3：一条4功能段的非线性流水线，每个功能段的延迟时间都相等，它的预约表如下： (1)写出流水线的禁止向量和初始冲突向量。乘法加法 t TP ?=18756.11828≈??=t t S 31.018 54344≈??+?=E

计算机体系结构知识点

目录第一章计算机系统结构基本概念 (2) (一) 概念 (2) (二) 定量分析技术 (3) (三) 计算机系统结构发展 (4) (四) 计算机的并行性 (5) 第二章计算机指令集结构 (7) 一. 指令集结构的分类 (7) 二. 寻址方式 (7) 三. 指令集结构的功能设计 (8) 四. 指令格式的设计 (10) 五. MIPS指令集结构 (10) 第三章流水线技术 (14) 一. 流水线的基本概念 (14) 二. 流水线的性能指标 (14) 三. 流水线的相关与冲突 (16) 四. 流水线的实现 (18) 第四章指令集并行 (18) 付志强

第一章计算机系统结构基本概念 (一)概念什么是计算机系统结构:程序员所看到的计算机属性,即概念性结构与功能特性. 透明性:在计算机技术中,把本来存在的事物或属性,但从某种角度看又好像不存在的概念成为透明性. 常见计算机系统结构分类法冯氏分类法(冯泽云):按最大并行度对计算机进行分类. Flynn分类法:按指令流和数据流多倍性进行分类 ①单指令流单数据流 ②单指令流多数据流 ③多指令流单数据流(不存在) ④多指令流多数据流付志强

(二)定量分析技术 Amdahl定律:加快某部件执行速度所能获得的系统性能加速比,受限于该部件的执行时间占系统中总执行时间的百分比. 加速比=系统性能改进后系统性能改进前 = 总执行时间改进前总执行时间改进后加速比依赖于以下两个因素 ①可改进比例 ②部件加速比 CPU性能公式 CPU时间 CPU时间=执行程序所需时间的时钟周期数x时钟周期时间(系统频率倒数) CPI(Cycles Per Instruction) CPI =执行程序所需时钟周期数/所执行指令条数 ∴CPU时间= IC x CPI x 时钟周期时间可知CPU性能取决于一下三个方面 ①时钟周期时间:取决于硬件实现技术和计算机组成付志强

计算机体系结构参考1

第一题选择题 1．SIMD是指（B） A、单指令流单数据流 B、单指令流多数据流 C、多指令流单数据流 D、多指令流多数据流 2．下列那种存储设备不需要编址？D A. 通用寄存器 B. 主存储器 C. 输入输出设备 D. 堆栈 3．按照计算机系统层次结构，算术运算、逻辑运算和移位等指令应属于（A）级机器语言。 A、传统机器语言机器 B、操作系统机器 C、汇编语言机器 D、高级语言机器 4．早期的计算机系统只有定点数据表示，因此硬件结构可以很简单。但是这样的系统有明显的缺点，下面哪一个不是它的缺点：B A．数据表示范围小 B．单个需要的计算时钟周期多 C．编程困难 D．存储单元的利用率很低 7．下面哪个页面替换算法实际上是不能够实现的？D A）随机页面替换算法 B）先进先出替换算法 C）最久没有使用算法 D）最优替换算法

9．指令优化编码方法，就编码的效率来讲，那种方法最好？C A. 固定长度编码 B. 扩展编码法 C. huffman编码法 D. 以上编码都不是 10．在早期冯·诺依曼计算机特征中，机器以（C）为中心。 A、存储器 B、输入输出设备 C、运算器 D、控制器 1.RISC 计算机的指令系统集类型是( C ) 。 A. 堆栈型 B. 累加器型 C. 寄存器—寄存器型 D. 寄存器- 存储器型 2、相联存储器的访问方式是( D )。 A．先进先出顺序访问 B．按地址访问 C．无地址访问 D．按内容访问 3、假设—条指令的执行过程可以分为“取指令”、“分析”和“执行”三段，每—段分别只有—个部件可供使用，并且执行时间分别为Δt、2Δt和3Δt，连续执行n条指令所需要花费的最短时间约为( C )。（假设“取指令”、“分析”和“执行”可重叠，并假设n足够大） A．6 nΔt B．2 nΔt C．3 nΔt D．nΔt 6、下列计算机不属于RISC计算机的是（C ）。 A．SUN：Ultra SPARC

计算机系统结构期末考试题目

第一章： 1.计算机系统结构的定义答：由程序设计者看到的一个计算机系统的属性，即概念性结构和功能特性。 2.透明性概念答：在计算机技术中，一种本来是存在的事物或属性，但从某种角度看似乎不存在，称为透明性现象。 3.兼容性向后兼容兼容性：同一个软件可以不加修改地运行于系统结构相同的各档机器，可获得相同的结果，差别只在于不同的运行时间。向后兼容：按某个时期投入市场的某种型号机器编制的程序，不加修改就能运行于在它之后投入市场的机器。 4.Amdahl定律答：系统中某一部件由于采用某种更快的执行方式后整个系统性能的提高与这种执行方式的使用频率或占总执行时间的比例有关。 5.CPI 答：每条指令的平均时钟周期数。 6.MIPS 答：每秒百万条指令数！MIPS=时钟频率/(CPI*10^6) 7.MFLOPS 答：每秒百万次浮点操作次数。MFLOPS=程序中的浮点操作次数/(执行时间*10^6) 8.命中率的概念答： 9.Flynn分类法是按指令流和数据流的多倍性特征进行计算机系统结构的划分答：①单指令流单数据流SISD ②单指令流多数据流SIMD ③多指令流单数据流MISD（实际不存在）④多指令流多数据流MIMD 10.计算机系统设计的定量原理（四个）答：①加快经常性事件的速度②Amdahl定律③CPU性能公式④访问的局部性原理11.CPI和加速比的计算答：CPI=CPU时钟周期数/IC CPU时间=CPU时钟周期数/频率 CPU时间=CPU时钟周期*时钟周期长加速比=（采用改进措施后的性能）/（没有采用改进措施前的性能） =(没有采用改进措施前执行某任务的时间)/(采用改进措施后执行某任务的时间) 12.软硬件实现的特点硬件实现：速度快、成本高；灵活性差、占用内存少软件实现：速度低、复制费用低；灵活性好、占用内存多 13.系统评价的标准 ①运算速度②存储器系统③其他性能④成本标准

计算机体系结构复习计算题

1. 将计算机系统中某一功能的处理速度加快10倍，但该功能的处理时间仅为整个系统运行时间的40%，则采用此增强功能方法后，能使整个系统的性能提高多少根据Amdahl 定律可知：系统加速比＝＝＝由题可知：可改进比例 = 40% = 部件加速比 = 10 系统加速比 = 采用此增强功能方法后，能使整个系统的性能提高倍。 2. 假设一台计算机的I/O 处理占10％，当其CPU 性能改进到原来的10倍时，而I/O 性能仅改进为原来的两倍时，系统总体性能会有什么改进加速比＝1/（10%/2+90%/10）= 本题反映了Amdahl 定律，要改进一个系统的性能要对各方面性能都进行改进，不然系统中最慢的地方就成为新系统的瓶颈。 3. 双输入端的加、乘双功能静态流水线有1、2、3、4四个子部件，延时分别为Δt, Δt, 2Δt, Δt ，“加”由1→2→4组成，“乘”由1 →3→4组成，输出可直接返回输入或锁存。现执行 ∑=*+4 1 ])[(i i i i c b a （1）画出流水时空图，标出流水线输入端数据变化情况。（2）求运算全部完成所需的时间和流水线效率。（3）找出瓶颈子过程并将其细分，重新画出时空图并计算流水时间和效率。（1）（2）由上图可知，全部运算完的时间是23Δt 。 92 37 23437=???= t t η （3）部件 ① ② ③ ④ ⑤ ⑥ 结果输入 a 1 a 2 a 3 a 4 a 1+b 1 a 2+b 2 a 3+b 3 a 4+b 4 ① ③ ⑤ b 1 b 2 b 3 b 4 c 1 c 2 c 3 c 4 ② ④ ⑥ Δt 4 3 2 1

完整版计算机体系结构课后习题原版答案_张晨曦著

第1章计算机系统结构的基本概念 (1) 第2章指令集结构的分类 (10) 第3章流水线技术 (15) 第4章指令级并行 (37) 第5章存储层次 (55) 第6章输入输出系统 (70) 第7章互连网络 (41) 第8章多处理机 (45) 第9章机群 (45) 第1章计算机系统结构的基本概念 1.1 解释下列术语层次机构：按照计算机语言从低级到高级的次序，把计算机系统按功能划分成多级层次结构，每一层以一种不同的语言为特征。这些层次依次为：微程序机器级，传统机器语言机器级，汇编语言机器级，高级语言机器级，应用语言机器级等。虚拟机：用软件实现的机器。翻译：先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序，然后再在这低一级机器上运行，实现程序的功能。

解释：对于高一级机器上的程序中的每一条语句或指令，都是转去执行低一级机器上的一段等效程序。执行完后，再去高一级机器取下一条语句或指令，再进行解释执行，如此反复，直到解释执行完整个程序。计算机系统结构：传统机器程序员所看到的计算机属性，即概念性结构与功能特性。在计算机技术中，把这种本来存在的事物或属性，但从某种角度看又好像不存在的概念称为透明性。计算机组成：计算机系统结构的逻辑实现，包含物理机器级中的数据流和控制流的组成以及逻辑设计等。计算机实现：计算机组成的物理实现，包括处理机、主存等部件的物理结构，器件的集成度和速度，模块、插件、底板的划分与连接，信号传输，电源、冷却及整机装配技术等。系统加速比：对系统中某部分进行改进时，改进后系统性能提高的倍数。 Amdahl定律：当对一个系统中的某个部件进行改进后，所能获得的整个系统性能的提高，受限于该部件的执行时间占总执行时间的百分比。程序的局部性原理：程序执行时所访问的存储器地址不是随机分布的，而是相对地簇聚。包括时间局部性和空间局部性。

2020.4《计算机体系结构》期末试卷A含答案

《计算机体系结构》期末考试A卷 (总分：100分，时间：100分钟) 姓名：周元华专业：计算机科学与技术学号： 18260070164016 学习中心：上海弘成一、填空题（每空1分，共14分） 1.高速缓冲存储器的地址映象方式有三种，它们分别是：全向量方式，直接相联方式，组相连方式。 2.虚拟存储器的三种管理方式是段式管理，页式管理和段页式管理。 3.从主存的角度来看，“Cache—主存”层次的目的是为了提高速度，而“主存—辅存”层次的目的是为了扩大容量 4.根据指令间的对同一寄存器读和写操作的先后次序关系，数据相关冲突可分为读与写（RAM）、写与读（WAR）和写与写（WAW）三种类型。 5.当代计算机体系结构的概念包括指令集结构、计算机组成和计算机实现三个方面的内容二、名词解释（每题2分，共16分）计算机体系结构：计算机体系结构是指根据属性和功能不同而划分的计算机理论组成部分及计算机基本工作原理、理论的总称。其中计算机理论组成部分并不单与某一个实际硬件相挂钩，如存储部分就包括寄存器、内存、硬盘等。兼容机：兼容机，就是由不同公司厂家生产的具有相同系统结构的计算机。简单点说，就是非厂家原装，而改由个体装配而成的机器，其中的元件可以是同一厂家出品，但更多的是整合各家之长的计算机。写直达法：写直达法一般指全写法。全写法（write-through）：又称写直达法、写穿法，透写法，Cache使用方式之一。高速缓冲存储器: 高速缓冲存储器（Cache）其原始意义是指存取速度比一般随机存取记忆体（RAM）来得快的一种RAM，一般而言它不像系统主记忆体那样使用DRAM技术，而使用昂贵但较快速的SRAM 技术，也有快取记忆体的名称。高速缓冲存储器是存在于主存与CPU之间的一级存储器，由静态存储芯片(SRAM)组成，容量比较小但速度比主存高得多，接近于CPU的速度。在计算机存储系统的层次结构中，是介于中央处理器和主存储器之间的高速小容量存储器。它和主存储器一起构成一级的存储器。高速缓冲存储器和主存储器之间信息的调度和传送是由硬件自动进行的。高速缓冲存储器最重要的技术指标是它的命中率。延迟转移技术：在转移指令之后插入一条或几条有效的指令。当程序执行时，要等这些插入的指令执行完成之后，才执行转移指令，因此，转移指令好像被延迟执行了，这种技术称为延迟转移技术。线性流水线：线性流水线就是由一整套工艺串联而成的生产线。流水线又称为装配线,一种工业上的生产方式，指每一个生产单位只专注处理某一个片段的工作，以提高工作效率及产量；按照流水线的输送方式大体可以分为：皮带流水装配线、板链线、倍速链、插件线、网带线、悬挂线及滚筒流水线这七类流水线。输送线的传输方式有同步传输的/（强制式），也可以是非同步传输/（柔性式），根据配置的选择，可以实现装配和输送的要求。输送线在企业的批量生产中不可或缺。流水线的吞吐率：流水线的吞吐率是单位时间内流水线处理的任务数。并行性：并行性是指计算机系统具有可以同时进行运算或操作的特性，在同一时间完成两种或两种以上工作。它包括同时性与并发性两种含义。同时性指两个或两个以上事件在同一时刻发生。并发性指两个或两个以上事件在同一时间间隔发生。三、简答题(每题5分，共30分） 1.如有一个经解释实现的计算机，可以按功能划分成4级。每一级为了执行一条指令需要下一级的N条指令解释。若执行第一级的一条指令需K(ns)时间，那么执行第2、3、4级的一条指令各需要用多少时间(ns)? 答：第1级：1条1级指令 K ns 第2级：1条2级指令N条1级指令 1*N*K ns = NK ns 第3级：1条3级指令N条2级指令 1*N*NK ns =N2K ns 第4级：1条4级指令N条3级指令 1*N*NNK ns =N3K ns 2.根据Amdahl定律，系统加速比由哪两个因素决定？答：系统加速比依赖于两个因素：（1）可改进比例：可改进部分在原系统计算时间中所占的比例（2）部件加速比：可改进部分改进以后的性能提高 3.简述组相联映象规则。答：(1)主存与缓存分成相同大小的数据块。(2)主存和Cache 按同样大小划分成组。(3)主存容量是缓存容量的整数倍,将主存空间按缓冲区的大小分成区，主存中每一区的组数与缓存的组数相同 4.引起Cache与主存内容不一致的原因是什么？为了保持Cache 的一致性，在单计算机系统中一般采取哪些措施？答：不一致的原因：（1）由于CPU写Cache，没有立即写主存（2）由于I/O处理机或I/O设备写主存采取措施：（1）全写法，亦称写直达法（WT法-Write through）方法：在对Cache进行写操作的同时，也对主存该内容进行写入（2）写回法（WB法-Write back）方法：在CPU执行写操作时，只写入Cache，不写入主存。 5.按照同一时间内各段之间的连接方式来分，流水线可分为哪两类？答：（1）静态流水线：在同一时间内，流水线的各段只能按同一种功能的连接方式工作。（2）动态流水线：在同一时间内，当某些段正在实现某种运算时，另一些段却在实现另一种运算。 6.Flynn分类法是根据什么对计算机进行分类的？将计算机分成哪几类？答：Flynn分类法，根据计算机中指令和数据的并行状况把计算机分成：（1）单指令流单数据流（SISD.；（2）单指令流多数据流（SIMD.；（3）多指令流单数据流（MISD.；（4）多指令流多数据流（MIMD.。四、问答与计算题（第1题10分，第2、3题每题15分共40分） 1.一个有快表和慢表的页式虚拟存储器，最多有64个用户，每个用户最多要用1024个页面，每页4K字节，主存容量8M字节。（1）写出多用户虚地址的格式，并标出各字段的长度。（2）写出主存地址的格式，并标出各字段的长度。

计算机体系结构试题汇总

计算机系统结构姓名：学号：一、简答题（每小题10分，共20分） 1．简述使用物理地址进行DMA存在的问题，及其解决办法。 2．从目的、技术途径、组成、分工方式、工作方式等5个方面对同构型多处理机和异构型多处理机做一比较（列表）。二、（60分）现有如下表达式： Y＝a ×X 其中：X和Y是两个有64个元素的32位的整数的向量，a为32位的整数。假设在存储器中，X和Y的起始地址分别为1000和5000，a的起始地址为6000。 1．请写出实现该表达式的MIPS代码。 2．假设指令的平均执行时钟周期数为5，计算机的主频为500 MHz，请计算上述MIPS 代码（非流水化实现）的执行时间。 3．将上述MIPS代码在MIPS流水线上（有正常的定向路径、分支指令在译码段被解析出来）执行，请以最快执行方式调度该MIPS指令序列。注意：可以改变操作数，但不能改变操作码和指令条数。画出调度前和调度后的MIPS代码序列执行的流水线时空图，计算调度前和调度后的MIPS代码序列执行所需的时钟周期数，以及调度前后的MIPS流水线执行的加速比。 4．根据3的结果说明流水线相关对CPU性能的影响。三、（20分）请分析I/O对于性能的影响有多大？假设： 1．I/O操作按照页面方式进行，每页大小为16 KB，Cache块大小为64 B；且对应新页的地址不在Cache中；而CPU不访问新调入页面中的任何数据。 2．Cache中95%被替换的块将再次被读取，并引起一次失效；Cache使用写回方法，平均50%的块被修改过；I/O系统缓冲能够存储一个完整的Cache块。 3．访问或失效在所有Cache块中均匀分布；在CPU和I/O之间，没有其他访问Cache 的干扰；无I/O时，每1百万个时钟周期中，有15,000次失效；失效开销是30个时钟周期。如果替换块被修改过，则再加上30个周期用于写回主存。计算机平均每1百万个周期处理一页。

计算机体系结构期末试卷及答案

课程测试试题（ A 卷） ----------------------以下为教师填写-------------------- I、命题院（部）：信息科学与工程学院 II、课程名称：计算机体系结构 III、测试学期：2014－2015学年度第2学期 IV、测试对象：信息学院计算机、网络专业 2012 级班 V、问卷页数（A4）： 3 页 VI、答卷页数（A4）： 4 页 VII、考试方式：闭卷（开卷、闭卷或课程小论文，请填写清楚） VIII、问卷内容：一、填空题（共30分，20空，每空分） 1、现代计算机系统是由（）和（）组成的十分复杂的系统。 2、计算机系统应能支持软件可移植，实现可移植性的常用方法有3种，即（），（），统一高级语言。 3、可以将当前大多数通用寄存器型指令集结构进一步细分为3种类型，即（）、（）和存储器-存储器型指令集结构。 4、MIPS指令DADDIU R14，R5，#6属于（）类型的指令格式；MIPS指令 SD R4，300（R5）属于（）类型的指令格式。 5、描述流水线的工作，常采用时空图的方法。在时空图中，横坐标表示（），纵坐标代表（）。 6、在MIPS指令实现的简单数据通路中，在WB周期中，有两大类指令执行操作：（）和（）指令。 7、存储器的层次结构中，“Cache－主存”层次是为了弥补主存（）的不足，“主存－辅存”层次是为了弥补主存（）的不足。 8、Cache实现的映像规则有全相联映像、（）和（）三种。 9、反映存储外设可靠性能的参数有可靠性、（）和（）。 10、根据系统中处理器个数的多少，可把现有的MIMD计算机分为两类，每一类代表了一种存储器的结构和互连策略。第一类机器称为（）结构，第二类机器具有（）。二、判断题（每小题1分，共10分） 1、从计算机语言的角度，系统结构把计算机系统按功能划分成多级层次结构，其中，第2级是操作系统虚拟机，第3级是汇编语言虚拟机。（） 2、计算机系统中提高并行性的3种途径中，资源重复是在并行性概念中引入时间因素，加快硬件周转而赢得时间。（） 3、指令集结构中采用多种寻址方式可能会增加实现的复杂度和使用这些寻址方式的指令的CPI。（） 4、指令条数多，通常超过200条，是设计RISC的原则之一。（） 5、根据流水线中各功能段之间是否有反馈回路，可把流水线分为线性流水线和非线性流水线。（） 6、在多级存储体系中，“cache——主存”层次的存储管理实现主要由软件件实现。

计算机系统结构论文

计算机系统结构论文计算机系统结构中多处理机技术摘要：多处理机通过共享的主存或输入/输出子系统或高速通信网络进行通信。利用多台处理机进行多任务处理，协同求解一个大而复杂的问题来提高速度，或者依靠冗余的处理机及其重组能力来提高系统的可靠性、适应性和可用行。该文介绍了微处理器的发展、多处理机的总线以及处理机系统中通信和存储技术的发展和两种特殊的多处理机系统结构。关键词：多处理机；体系结构；总线微电子技术和封装技术的进步，使得高性能的VLSI 微处理器得以大批量生产，性能价格比不断合理，这为并行多处理机的发展奠定了重要的物质基础。计算机系统性能增长的根本因素有两个：一是微电子技术，另一个是计算机体系结构技术。五十年代以来，人们先后采用了先行控制技术、流水线技术、增加功能部件甚至多机技术、存储寻址和管理能力的扩充、功能分布的强化、各种互联网络的拓扑结构以及支持多道、多任务的软件技术等一系列并行处理技术，提高计算机处理速度，增强系统性能。多处理机体系结构是计算机体系结构发展中的一个重要内容，已成为并行计算机发展中人们最关注的结构。

1 微处理器的发展 20 世纪80 年代中期，RISC 精简指令集计算机，用20%指令的组合实现了CISC 计算机指令系统不常用的80%指令的功能。在提高性能方面，RISC 采用了超级流水线、超级标量、超长指令字并行处理结构；多级指令Cache；编译优化等技术，充分利用RISC 的内部资源，发挥其内部操作的并行性，从而提高流水线的执行效率。20 世纪80 年代后期，RISC 处理机的性能指标几乎以每年翻一番的速度发展，它对于提高计算机系统的性能和应用水平起着巨大的作用。目前，由Intel 和HP 两家公司联合开发的基于IA—64 架构的Merced 芯片，并由其共同定义的显式并行指令计算技术EPIC(Explicitly Parallel Instruction Computing )，将为微处理器技术的发展带来突破性进展。EPIC 技术主要指编译器在微处理器执行指令之前就对整个程序的代码作出优化安排，编译器分析指令间的依赖关系，将没有依赖关系的指令(最多3 个)组成一“组”，由Merced内置的执行单元读入被分成组的指令群并执行。从理论上讲，EPIC 可以并行执行3 倍于执行单元数的指令。64 位体系结构的Merced 芯片还采用了指令预测、数据预装等技术，可以显著地减少实际执行程序的长度，同时增强语句执行的并行性，经过代码的重组，程序的执行时间比基于传统体系结构

-计算机系统结构(有详细答案)

(仅供参考，不作为考试标准)，选择题(30分，每题2分) 计算机系统结构设计者所关心的是________所看到的的计算机结构。 A)硬件设计人员B)逻辑设计人员 C)机器语言或汇编语言程序员D)高级语言程序员在计算机系统设计时，为了提高系统性能，应当注意________。 A)加快经常性使用指令的执行速度 B)要特别精心设计少量功能强大的指令 C)要减少在数量上占很小比例的指令的条数 D)要加快少量指令的速度重叠寄存器技术主要用于解决在RISC系统中因________而导致的问题。 A)JMP指令影响流水线 B)CALL指令的现场保护 C)只有LOAD和STORE指令带来的访问存储器不便 D)存储器访问速度为使流水计算机运行效率高________ A)各过程段时间要不同B)连续处理的任务类型应该不同 C)连续处理的任务类型应该相同D)连续处理的任务数尽可能少不属于堆栈型替换算法的是________。 A)近期最少使用法B)近期最久未用法 C)先进先出法D)页面失效频率法与全相联映象相比，组相联映象的优点是________。 A)目录表小B)块冲突概率低C)命中率高D)主存利用率高"一次重叠"中消除"指令相关"最好的方法是________。 A)不准修改指令B)设相关专用通路 C)推后分析下条指令D)推后执行下条指令流水操作中，遇到数据相关时，采用的解决办法有________。 A)用优化编译器检测，通过指令重新排序的办法 B)数据重定向技术 C)延迟转移技术 D)加快和提前形成条件码经多级网络串联来实现全排列网络，只能用________。 A)多级立方体网络B)多级PM2I网络 C)多级混洗交换网络D)上述任何网络虫蚀寻径以流水方式在各寻径器是顺序传送的是________。授课：XXX

第一部分计算机系统组成及说明

第一部分：计算机系统组成及说明一、计算机系统组成一个完整的计算机系统通常是由硬件系统和软件系统两大部分组成的。（一）硬件（hardware）硬件是指计算机的物理设备，包括主机及其外部设备。具体地说，硬件系统由运算器、控制器、存储器、输入设备和输出设备五大部件组成。 ①存储器。存储器是计算机用来存放程序和原始数据及运算的中间结果和最后结果的记忆部件。 ②运算器。运算器对二进制数码进行算术或逻辑运算。 ③控制器。控制器是计算机的“神经中枢”。它指挥计算机各部件按照指令功能的要求自动协调地进行所需的各种操作。 ④输入/输出设备（简称I/O设备）。计算机和外界进行联系业务要通过输入输出设备才能实现。输入设备用来接受用户输入的原始数据和程序，并将它们转换成计算机所能识别的形式（二进制）存放到内存中。输出设备的主要功能是把计算机处理的结果转变为人们能接受的形式，如数字、字母、符号或图形。（二）软件（software）软件是指系统中的程序以及开发、使用和维护程序所需要的所有文档的集合。包括计算机本身运行所需的系统软件和用户完成特定任务所需的应用软件（三）硬件和软件的关系

硬件是计算机的基础，软件对硬件起辅助支持作用，二者相辅相成，缺一不可，只有有了软件的支持，硬件才能充分发挥自己的作用。二、计算机工作原理（一）冯·诺依曼设计思想计算机问世５０年来，虽然现在的计算机系统从性能指标、运算速度、工作方式、应用领域和价格等方面与当时的计算机有很大的差别，但基本体系结构没有变，都属于冯·诺依曼计算机。冯·诺依曼设计思想可以简要地概括为以下三点： ①计算机应包括运算器、存储器、控制器、输入和输出设备五大基本部件。 ②计算机内部应采用二进制来表示指令和数据。每条指令一般具有一个操作码和一个地址码。其中，操作码表示运算性质，地址码指出操作数在存储器的位置。 ③将编好的程序和原始数据送入内存储器中，然后启动计算机工作，计算机应在不需操作人员干预的情况下，自动逐条取出指令和执行任务。冯·诺依曼设计思想最重要之处在于他明确地提出了“程序存储”的概念。他的全部设计思想，实际上是对“程序存储”要领的具体化。

《计算机体系结构》期末复习题标准答案

《计算机体系结构》期末复习题答案

《计算机体系结构》期末复习题答案系别_________ 班级_________ 姓名__________ 学号__________ 一、填空题（每空1分） 1.按照弗林（Flynn）分类法，计算机系统可以分为4类：SISD计算机、（SIMD计算机）、（MISD计算机）和（MIMD计算机）。 2. 改进之后的冯?诺依曼计算机的只要特点是存储器为中心，总线结构，分散控制。 3. 当前计算机系统中的存储系统是一个层次结构，其各层分别为：（通用寄存器，高速缓存，主存，辅存，脱机大容量存储器）。 4.高速缓冲存储器的地址映象方式有三种，它们分别是：（全向量方式，直接相联方式，组相联方式）。 5.虚拟存储器的三种管理方式是（段式管理，页式管理和段页式管理）。 6.目前计算机中常用数据有（用户定义数据，系统数据和指令数据）三种类型。 7.通常可能出现的流水线的相关性有（资源相关，数据相关和控制相关）。 8.解决中断引起的流水线断流的方法有（不精确断点法和精确断点法）。 9.目前向量处理机的系统结构有两种：（存储器－存储器型和寄存器－寄存器型）。 10.通用计算机基本指令分为5类，它们分别是：（数据传送类，运算类，程序控制类，输入输出类，处理机控制和调试类）。 11．执行指令x1=x2+x3；x4=x1-x5会引起（RAW）类型的数据相关，执行指令x5=x4*x3；x4=x0+x6会引起（W AR）类型的数据相关，执行指令x6=x1+x2；x6=x4*x5会引起（WA W）类型的数据相关。 12．多计算机网络中，通常出现的4种通信模式是（单播模式，选播模式，广播模式和会议模式）。 13.传统的冯?诺依曼计算机是以控制驱动方式工作，以数据驱动方式工作的典型计算机是（数据流计算机），以需求驱动方式工作的典型计算机是（归约机），以模式匹配驱动方式工作的典型计算机是（人工智能计算机）。二、名词解释（每题2分） 1.计算机体系结构：计算机系统结构就是计算机的机器语言程序员或编译程序编写者所看到的外特性，是硬件子系统的概念结构及其功能特性。 2.系列机：所谓系列机是指同一厂家生产的具有相同的系统结构，但采取了不同的组成和实现的技术方案，形成了不同型号的多种机型。 3.模拟: 模拟是指用软件的方法在一台计算机上，实现另一台计算机的指令系统，被模拟的机器是不存在的，称为虚拟机，执行模拟程序的机器称宿主机。 4.程序的局部性原理: 程序访问局部性原理说明了计算机在程序执行过程中呈现出的一种规律，即程序往往重