超标量、超级流水线、超长指令字、向量机
- 格式:doc
- 大小:17.00 KB
- 文档页数:3
系统结构名词解释(3)系统结构名词解释结构冲突:因硬件资源满足不了指令重叠执行的要求而发生的冲突。
数据冲突:当指令在流水线中重叠执行时,因需要用到前面指令的执行结果而发生的冲突。
控制冲突:流水线遇到分支指令或其它会改变PC值的指令所引起的冲突。
定向:用来解决写后读冲突的。
在发生写后读相关的情况下,在计算结果尚未出来之前,后面等待使用该结果的指令并不见得是马上就要用该结果。
如果能够将该计算结果从其产生的地方直接送到其它指令需要它的地方,那么就可以避免停顿。
写后读冲突:考虑两条指令i和j,且i在j之前进入流水线,指令j用到指令i的计算结果,而且在i将结果写入寄存器之前就去读该寄存器,因而得到的是旧值。
读后写冲突:考虑两条指令i和j,且i在j之前进入流水线,指令j的目的寄存器和指令i的源操作数寄存器相同,而且j在i读取该寄存器之前就先对它进行了写操作,导致i读到的值是错误的。
写后写冲突:考虑两条指令i和j,且i在j之前进入流水线,,指令j和指令i的结果单元(寄存器或存储器单元)相同,而且j在i写入之前就先对该单元进行了写入操作,从而导致写入顺序错误。
这时在结果单元中留下的是i写入的值,而不是j写入的。
链接技术:具有先写后读相关的两条指令,在不出现功能部件冲突和Vi冲突的情况下,可以把功能部件链接起来进行流水处理,以达到加快执行的目的。
分段开采:当向量的长度大于向量寄存器的长度时,必须把长向量分成长度固定的段,然后循环分段处理,每一次循环只处理一个向量段。
半性能向量长度:向量处理机的性能为其最大性能的一半时所需的向量长度。
向量长度临界值:向量流水方式的处理速度优于标量串行方式的处理速度时所需的向量长度的最小值。
4.1解释下列术语指令级并行:简称ILP。
是指指令之间存在的一种并行性,利用它,计算机可以并行执行两条或两条以上的指令。
指令调度:通过在编译时让编译器重新组织指令顺序或通过硬件在执行时调整指令顺序来消除冲突。
虚拟存放器中怎样实现虚拟地址到实地址变换(按段式管理, 可画图说明)由用户号找到基址寄存器, 从基址寄存器中读出段表起始地址, 把起始地址与多用户虚地址中段号相加得到段表地址, 把段表中起始地址与段内偏移D相加就能得到主存实地址。
(4分)内偏移d直接拼接起来就得到主存实地址A(2分)Amdahl定律: 一个反应部件速度与系统整体性能关系定律。
系统中对某一部件采取愈加快实施方法所能取得系统性能改善程度, 取决于这种实施方法所占总实施时间百分比。
Amdahl定律: 系统中对某一部件采取某种愈加快实施方法所能取得系统性能改善程度, 取决于这种方法被使用频度, 或所占总实施时间百分比。
即系统加速比为: (见P12 (1-3))单发射: 假如一个处理机在单个时钟周期中只能取出一条指令供实施, 就称为单发射(处理机)寄存器窗口重合: 嵌套两个过程分配使用相邻寄存器窗口中, 有一部分寄存器是重合,有了这种重合后, 过程之间参数传输就不需要实际上数据移动, 能够提升速度和降低访存。
交叉访问存放器: 存放器由N个存放体组成, CPU在一个存放周期中能够访问多个存放体, 所谓交叉, 是指个存放体之间地址是交叉配置。
端接电阻:加速比: 比较基准运行条件下运行时间与改变了运行条件后完成一样任务所需时间之比。
多发射: 在单个时钟周期内能够取出多条指令供实施。
延迟转移: 将转移指令与前一条指令次序对调, 确保了转移指令实施和前一条直流能够正常运行。
延迟转移技术: 重新排列指令实施次序, 将转移指令与其前一条指令次序对调, 即先实施转移指令, 后实施前一条指令。
这么既确保了转移指令实施, 又使其前一条指令得以正常实施。
并行访问存放器: 将存放器字长增加N倍, 在一个存放访问周期就能并行读取N个字。
阻抗匹配先行控制: 先行控制又称为估计控制, 是处理机种实施指令重合实施技术基础。
先行控制技术: 包含指令预处理技术(pre-processing)和缓冲技术(buffering)。
第一章1.基于(存储程序)原理的冯工作方式的基本特点(按地址访问并顺序执行指令)。
2.计算机硬件指(计算机系统的实体部分,他由看得见摸得着的各种电子元器件及各类光电机设备的实物组成,包括主机外设等)软件指(人们事先编制的具有各类特殊功能的程序,是无形的),固件是指(具有某软件功能的硬件,一般由ROM实现)3.计算机唯一能直接执行的语言是(机器)语言。
4.计算机将存储、算术逻辑运算和控制三个部分合称为(主机),再加上(输入设备)和(输出设备)就组成了计算机硬件系统。
5.(指令)和(数据)都放在存储器中,(控制器)能自动识别他们。
6.指令的解释是由(控制器)来完成的,运算器用来完成(算术和逻辑运算)7.计算机硬件的主要技术指标:(机器字长),(存储容量),(运算速度)。
第二章1.移码常用来表示浮点数的(阶码)部分,移码和补码除符号位不相同外,其它各位相同。
2.在浮点表示时,若用全0表示机器零(尾数为0,阶码最小),则阶码应采用(移码)机器数形式。
在定点表示时,若要求数值0在计算机中唯一表示全零,则应采用(补码)机器数形式。
3.正数补码算术移位时,(符号)位不变,空位补(0)。
负数补码算术左移时,(符号)位不变,低位补(0)。
负数补码算术右移时,(符号)位不变,高位补(1)。
4.正数原码左移时,(符号)位不变,高位丢0,结果(正确),右移时低位丢(1),结果引起误差。
负数原码左移时,(符号)位不变,高位丢(1),结果出错,右移时低位丢(1),结果正确。
5.正数补码左移时,(符号)位不变,高位丢1,结果(出错),右移时低位丢(0),结果引起误差。
负数补码左移时,(符号)位不变,高位丢(1),结果正确,右移时低位丢(1),结果引起误差。
第三章1.(Cache)、(主存)和(辅存)组成三级存储系统,分级目的是(提高访存速度、扩大存储容量)。
2.半导体静态RAM依据(触发器原理)存储信息,半导体动态RAM依据(电容存储电荷原理)存储信息。
总复习第一章1.计算机系统结构、组成、实现的基本概念和包含的内容;系统结构与软硬件功能划分的关系;计算机系统的多级层次结构;判断某项内容属于结构、组成、实现的哪一类;判断某项内容针对不同程序员的透明性。
2.促进系统结构发展的因素(软件、应用、器件)。
软件:实现软件可移植性的方法;系列机的概念;软件兼容的概念(向前、向后、向上、向下兼容);模拟与仿真技术的概念;应用:应用对系统结构的要求。
器件:系统结构下移的概念。
3.计算机系统的分型与分类的概念。
Flynn分类法4.系统结构设计的定量原理(Amdahl定理);加速比的计算方法;5.程序访问的局部性原理(时间局部性、空间局部性);判断系统结构中局部性原理的应用。
6.系统评价的指标(响应时间、CPU时间、MIPS、MFLOPS);运用CPU性能公式、平均CPI比较系统性能。
7.并行性的概念;并行性的等级、粒度;并行性的开发策略(时间重叠、资源重复、资源共享);8.计算机系统的主要设计方法第二章1.指令系统的设计要求(完备性、有效性、兼容性、规整性、对称性、可扩充性、正交性、有利于编译)。
2.指令系统的分类(堆栈型、累加器型、通用寄存器型);通用寄存器型指令的特点(R-R型、R-M型、M-M型)。
3.操作数访问方式(按地址访问、按内容访问);按地址访问的编址问题:字编址、字节编址、位编址;按字节编址时的大端排序与小端排序。
编址规定中的访存越界问题及其解决方法。
按内容访问:联想存储器的工作过程。
4.指令格式的设计准则;操作码的优化方法(霍夫曼编码、扩展霍夫曼编码)。
5.指令系统的两种设计风格CISC和RISC。
CISC风格的特点;RISC风格的特点。
RISC风格指令系统的实现技术:窗口寄存器重叠技术、优化转移技术。
6.数据类型、数据表示、数据结构的概念和关系;引入数据表示的原则(减少程序执行时间和存储容量、较好的通用性和较高的效率);数据表示与系统结构的关系。
超标量处理机和超流⽔线处理机——计算机系统结构在表5.2中,基准标量处理机是⼀台普通的单流⽔线处理机。
为了便于进⾏⽐较,把基准标量处理机的机器流⽔线周期和指令发射等待时间都假设为1个时钟周期,同时发射的指令条数为⼀条,它的指令级并⾏度ILP(Instruction Level Parallelism)假设为1。
另外三种指令级并⾏处理机,即并⾏度为m的超标量处理机,并⾏度为n的超流⽔线处理机,以及并⾏度为(m,n)的超标量超流⽔线处理机,它们的性能都相对于基准标量处理机进⾏⽐较。
单流⽔线处理机只有⼀条指令流⽔线,只有⼀个多功能的操作部件,每个时钟周期"取指令"和"分析"完成⼀条指令。
在许多流⽔线处理机中,指令流⽔线的流⽔段数k=4;它把⼀条指令的执⾏过程主要分解为"取指令"、"分析"、"执⾏"和"写结果"4个阶段。
指令所要执⾏的功能主要在多功能操作部件中,在"执⾏"这⼀流⽔段完成。
多数流⽔线处理机的多功能操作部件采⽤流⽔线结构。
有的简单指令,只要⼀个时钟周期就能够在"执⾏"流⽔段中完成,⽽⽐较复杂的指令往往需要多个时钟周期。
另外,还有条件转移等的影响;因此,⼀般流⽔线标量处理机每个时钟周期平均执⾏指令的条数⼩于1,即它的指令级并⾏度ILP<1。
超标量、超流⽔线和超标量超流⽔线三种处理机在⼀个时钟周期内可以执⾏完成多条指令,即它们的指令级并⾏度ILP都⼤于1。
超标量处理机基本结构超标量处理机的典型结构是有多个操作部件,⼀个或⼏个⽐较⼤的通⽤寄存器堆,⼀个或两个⾼速Cache。
先进的超标量处理机⼀般都包含有三个处理单元,⼀个是定点处理单元,通常称为中央处理单元(CPU),它由⼀个或多个整数处理部件组成;第⼆个是浮点处理单元(FPU),它由浮点加减法部件和浮点乘除法部件等组成;第三个是图形加速部件,也称为图形处理单元(GPU),这是现代处理机中不可缺少的⼀个部分。
计算机组成期末复习第一篇:计算机组成期末复习第一章1.简要解释下述概念:(1)冯·诺依曼机:采用冯·诺依曼体制的计算机被称为冯·诺依曼机。
(2)编译:编译就是把高级语言变成计算机可以识别的二进制语言。
(3)虚拟机:指通过配置软件(如某种语言的编译器或解释器)扩充机器功能后所形成的一台计算机。
2.采用数字化方法表示信息有哪些优点?(1)抗干扰能力强, 可靠性高。
(2)依靠多位数字的组合,在表示数值时可获得很宽的表示范围以及很高的精度。
(3)数字化的信息可以存储、信息传送也比较容易实现。
(4)可表示的信息类型与范围及其广泛,几乎没有限制。
(5)能用逻辑代数等数字逻辑技术进行信息处理,这就形成了计算机硬件设计的基础。
3.衡量计算机性能的基本指标有哪些?(1)基本字长——参加一次运算的数的位数;(2)数据通路宽度——数据总线一次能并行传送的位数;(3)运算速度——可用①CPU的时钟频率与主频,②每秒平均执行指令数,③典型四则运算的时间来表示。
(4)主存储器容量——可用字节数或单元数(字数)×位数来表示。
(5)外存容量——常用字节数表示。
(6)配备的外围设备及其性能。
(7)系统软件配置。
4.软件系统一般包含哪些部分?列举读者所熟悉的三个系统软件。
(1)系统软件:操作系统、编译程序与解释程序、各种软件平台(2)应用软件WINDOWS7操作系统,C语言编译程序等,数据库管理系统5.提高单CPU计算机性能的主要技术有哪些?(1)流水线处理技术(2)RISC(精简指令系统计算机)技术(3)超标量技术(4)平衡不同子系统的数据吞吐率(5)超长指令字(VLIW)技术第二章1.简要解释下列名词术语:(1)位权:数制中每一固定位置对应的单位值称为位权。
(2)ASCII码:美国国家信息交换标准代码(American Standard Code for InformationInterchange)的简称。
计算机体系结构优化基础知识计算机体系结构是指计算机硬件与软件共同组成的系统结构,涉及到计算机的组成部分、数据流动及处理方式等方面。
优化计算机体系结构可以提升计算机的性能、降低能耗并提高系统的可靠性。
本文将介绍计算机体系结构优化的基础知识,包括指令级并行、数据级并行、内存层次结构和硬件加速等方面。
一、指令级并行指令级并行是通过并发处理多条指令来提高系统性能。
它主要有以下几种形式:1. 流水线技术:流水线将一条指令的执行过程分解成多个步骤,并同时执行多条指令的不同阶段。
这样可以提高指令的执行速度。
典型的流水线包括取指、译码、执行、访存和写回等阶段。
2. 超标量技术:超标量技术允许同时发射多个指令,通过乱序执行和重排序来提高指令级并行性。
它可以同时执行多条在数据相关上无冲突的指令,从而提高系统的吞吐量。
3. 动态调度技术:动态调度技术可以根据指令之间的数据依赖关系,动态地调整指令的执行顺序,以最大程度地利用系统资源。
这样可以提高指令级并行性和执行效率。
二、数据级并行数据级并行是通过同时处理多个数据元素来提高系统性能。
它主要有以下几种形式:1. 向量处理器:向量处理器可以同时对一个向量中的多个元素进行计算,从而提高计算性能。
它适用于科学计算和图形处理等需要大量并行计算的应用场景。
2. 并行计算:并行计算将一个大问题拆分成多个子任务,并通过分布式计算来同时解决这些子任务。
这样可以充分利用多核处理器或集群系统的计算能力。
3. SIMD指令集:SIMD指令集允许一条指令同时对多个数据元素进行操作。
这样可以提高数据级并行性,加速图像处理和多媒体应用等。
三、内存层次结构内存层次结构是计算机存储器层次之间的组织方式。
通过合理的内存层次结构可以提高数据访问效率,减少内存访问延迟。
常见的内存层次结构包括:1. 高速缓存(Cache):高速缓存是位于处理器和主存之间的一层快速存储器。
它通过保存最近访问的数据和指令,减少了对主存的访问次数,提高了系统的运行速度。
得分评分人二填空题:(20分,每题2分)《计算机系统结构》期末考试试卷(A )得分注:1、共100分,考试时间120分钟。
2、此试卷适用于计算机科学与技术本科专业。
•"启动I/O"指令是主要的输入输出指令,是属于(B )B •管态指令C.目态、管态都能用的指令D •编译程序只能用的指令输入输出系统硬件的功能对(B )是透明的A.操作系统程序员B •应用程序员C •系统结构设计人员D.机器语言程序设计员3、全相联地址映象是指(A )A.任何虚页都可装入主存中任何实页的位置B.一个虚页只装进固定的主存实页位置C.组之间固定,组内任何虚页可装入任何实页位置D.组间可任意装入,组内是固定装入4、(C )属于MIMD 系统结构A.各处理单元同时受一个控制单元的管理B.各处理单元同时受同个控制单元送来的指令C.松耦合多处理机和多计算机系统D.阵列处理机5、多处理机上两个程序段之间若有先写后读的数据相关,则(B )A.可以并行执行B •不可能并行C •任何情况均可交换串行D.必须并行执行6、计算机使用的语言是(B )A.专属软件范畴,与计算机体系结构无关B.分属于计算机系统各个层次C.属于用以建立一个用户的应用环境D.属于符号化的机器指令7、指令执行结果出现异常引起的中断是(C )A.输入/输出中断B.机器校验中断C •程序性中断D.外部中断8、块冲突概率最高的Cache 地址映象方式是(A )A ■直接B.组相联C.段相联D.全相联9、组相联映象、LRU 替换的Cache 存储器,不影响Cache 命中率的是(B )A.增大块的大小B.增大主存容量C.增大组的大小D ■增加Cache 中的块数10、流水处理机对全局性相关的处理不包括(C )A.猜测法B •提前形成条件码C •加快短循环程序的执行D •设置相关专用通路一单选题:(10分,每题1分)2、 1、A.目态指令1、数据通路宽度就是—数据总线上一次并行传送的信息位数_。
计算机系统结构:第一章基本概念填空题、选择题复习:1、从使用语言角度,系统按功能划分层次结构由低到高分别为:微程序机器M0、传统机器M1、操作系统机器M2、汇编语言机器M3、高级语言机器M4、应用语言机器M5.2、计算机系统的设计思路:“从中间开始”设计的“中间”是指层次结构中的软硬件交界面,目前多数在传统机器语言机器级与操作系统机器级之间。
3、翻译与解释的区别与联系:区别:翻译是整个程序转换,解释是低级机器的一串语句仿真高级机器的一条语句;联系:都是高级机器程序在低级机器上执行的必须步骤。
4、模拟与仿真的区别:模拟:用机器语言解释实现软件移植的方法,解释的语言存在主存中;仿真用微程序解释,存储在控制存储器中。
5、解决好软件的可移植性方法有统一高级语言、采用系列机、模拟与仿真。
6、系列机必须保证向后兼容,力争向上兼容。
7、非用户片也称通用片,其功能是由器件厂生产时定死的,器件的用户只能用,不能改;现场片,用户根据需要改变器件内部功能;用户片是专门按用户的要求生产高集成度VLSI器件,完全按用户的要求设计的用户片称为全用户片。
一般同一系列内各档机器可分别用通用片、现场片或用户片实现。
8、计算机应用可归纳为向上升级的4类:数据处理、信息处理、知识处理、智能处理。
9、并行性开发的途径有:时间重叠、资源重复和资源共享。
10、并行性是指:同一时刻或同一时间间隔内完成两种或两种以上性质相同或不同的工作,并行性包含同时性和并发性二重含义。
11、科学计算中的重大挑战性课题往往要求计算机系统能有1TFLOPS的计算能力、1TBYTE 的主存容量、1TBYTE/S的I/O带宽。
12、并行处理计算机的结构:流水线计算机——时间重叠,阵列处理机——资源重复,多处理机——资源共享。
13、多机系统分多处理机系统和多计算机系统,多处理机系统:多台处理机组成的单一系统,多计算机系统:多台独立的计算机组成的系统。
14、多机系统的耦合度可以分为最低耦合、松散耦合和紧密耦合。
超标量、超级流水线、超长指令字、向量机
记得本科学计算机系统结构时,在了解了流水线这一用于提高cpu处理速度的方法后,书中还介绍了一些其他的结构,这些结构一般用于较高性能的计算机中
(呵呵,嵌入式系统中我还没看到,连multi issue的cpu都不多),包括:
超标量(Super Scalar)、超级流水线(Super Pipeline)、超长指令字(VLIW)、和向量机。
这些概念我总混淆,现在随着理解的深入,已经完全知道了它们各自的
特点,写点简要的介绍,贴在这里。
1、超标量(Super Scalar)
将一条指令分成若干个周期处理以达到多条指令重叠处理,从而提高cpu部件利用
率的技术叫做标量流水技术.
超级标量是指cpu内一般能有多条流水线,这些流水线能够并行处理.在单流水线结构中,指令虽然能够重叠执行,但仍然是顺序的,每个周期只能发射(issue)或退休(retire) 一条指令.超级标量结构的cpu支持指令级并行,每个周期可以发射多条指令(2-4条居多).这样,可以使得cpu的IPC(Instruction Per Clock) > 1, 从而提高cpu处理速度.
超级标量机能同时对若干条指令进行译码,将可以并行执行的指令送往不同的执行部件,在程序运行期间,由硬件(通常是状态记录部件和调度部件)来完成指令调度.
超级标量机主要是借助硬件资源重复(例如有两套译码器和ALU等)来实现空间的并行操作.
我们熟知的pentium系列(可能是p-II开始),还有SUN SPARC系列的较高级型号,以及MIPS若干型号等都采用了超级标量技术.
2、超级流水线(Super Pipeline)
超级流水线又叫做深度流水线,它是提高cpu速度通常采取的一种技术。
CPU处理指令是通过Clock来驱动的,每个clock完成一级流水线操作。
每个周期所做的操作越少,那么需要的时间久越短,时间越短,频率就可以提得越高。
所以超级流水线就是将cpu处理指令是得操作进一步细分,增加流水线级数来提高频率。
频率高了,当流水线开足马力运行时平均每个周期完成一条指令(单发射情况下),这样cpu处理得速度
久提高了。
当然,这是理想情况下,一般是流水线级数越多,重叠执行的执行就越多,那么发生竞争冲突得可能性就越大,对流水线性能有一定影响。
现在很多cpu都是将超标量和超级流水线技术一起使用,例如pentium IV,流水线达到20级,频率最快已经超过3GHZ.我们教科书上用于教学的经典MIPS只有5
级流水。
3、超长指令字(VLIW:Very Long Instruction Word)
超常指令字是由美国Yale大学教授Fisher提出的。
它有点类似于超级标量,是一条指令来实现多个操作的并行执行,之所以放到一条指令是为了减少内存访问。
通常
一条指令多达上百位,有若干操作数,每条指令可以做不同的几种运算。
那些指令可以并行执行是由编译器来选择的。
通常VLIW机只有一个控制器,每个周期启动一条长指令,长指令被分为几个字段,每个字段控制相应的部件。
由于编译器需要考虑数据相关
性,避免冲突,并且尽可能利用并行,完成指令调度,所以硬件结构较简单。
VLIW机器较少,可能不太容易实现,我们平时很少接触VLIW机器(也许是我孤陋寡闻),我知道业界比较有名的VLIW公司之一是Transmeta,在加州硅谷Santa Clara(呵呵,我心目中硅谷圣地之一,还有San Jose,Palo Alto,都是it英雄辈出的地方)。
它做的机器采用X86指令集,VLIW实现,具体资料可以去访问公司的网站。
4、向量机(Vector Machine)
我们平时接触的计算机都是标量机,向量机都是大型计算机,一般用于军事工业,气象预报,以及其他大型科学计算领域,这也说明了向量机都很贵。
国产的银河计算机就是向量机。
普通的计算机所做的计算,例如加减乘除,只能对一组数据进行操作,被称为标量运算。
向量运算一般是若干同类型标量运算的循环。
向量运算通常是对多组数据成批进行同样运算,所得结果也是一组数据。
很多做科学计算的大(巨)型机都是向量机,例如国产银河。
这个好像我们平时不太接触的到。
5、SIMD技术
刚刚看到网上一段介绍SIMD的文字,贴在这里:
单指令多数据(Single Instruction Multiple Data)
简称SIMD。
SIMD结构的CPU有多个执行部件,但都在同一个指令部件的控制下。
SIMD在性能上有什么优势呢?以加法指令为例,单指令单数据(SISD)的CPU对加法指令译码后,执行部件先访问内存,取得第一个操作数;之后再一次访问内存,取得第二个操作数;随后才能进行求和运算。
而在SIMD型CPU中,指令译码后几个执行部件同时访问内存,一次性获得所有操作数进行运算。
这个特点使得SIMD特别适合于多媒体应用等数据密集型运算。
AMD 公司的3D NOW!技术其实质就是SIMD,这使K6-2处理器在音频解码、视频回放、3D游戏等应用中显示出优异性能。
以下无正文
仅供个人用于学习、研究;不得用于商业用途。
толькодля людей, которые используются для обучения, исследований и не должны использоваться в коммерческих целях.
For personal use only in study and research; not for commercial use.
Nur für den persönlichen für Studien, F orschung, zu kommerziellen Zwecken verwendet werden.
Pour l 'étude et la recherche uniquement à des fins personnelles; pas à des fins commerciales.。