计算机高性能体系结构复习资料整理
- 格式:pdf
- 大小:503.20 KB
- 文档页数:9
第一章计算机体系机构的基本概念1.计算机系统结构包括数据表示、机器工作状态、信息保护,不包括主存速度。
计算机系统结构应该考虑的内容包括主存容量和编址方式,而主存采用MOS还是TTL器件、主存是采用多体交叉还是单体、主存频宽的确定等都不是计算机系统结构应该考虑的内容。
存储器采用单体单字,还是多体交叉并行存取,对系统结构设计是透明的。
又如在系列机内推出新机器,不能更改的是原有指令的寻址方式和操作码,而存储芯片的集成度、系统总线的组成、数据通路宽度是可以更改的。
系列机是指在一个厂家内生产的具有相同的体系结构,但具有不同的组成和实现的一系列不同型号的机器。
2. 计算机系统中提高并行性的技术途径有时间重叠、资源重复和资源共享三种。
在高性能单处理机的发展中,它的实现基础是流水线。
3. 软件和硬件在逻辑功能上是等效的,软件的功能可用硬件或固件完成,但性能、实现的难易程度不同。
4. Amdahl 定律:加快某部件执行速度所获得的系统性能加速比,受限于该部件在系统中所占的重要性。
5. 计算机组成是计算机系统结构的逻辑实现,计算机实现是计算机组成的物理实现。
6. 计算机系统多级层次结构由高到低,依次是应用语言机器级、高级语言机器级、汇编语言机器级、操作系统机器级、传统机器语言级和微程序机器级。
7. 某计算机系统采用浮点运算部件后,使浮点运算速度提高到原来的20倍,而系统运行某一程序的整体性能提高到原来的5倍,试计算该程序中浮点操作所占的比例。
系统加速比=1 / (1-可改进比例+可改进比例/部件加速比)5 = 1 / (1-可改进比例+可改进比例/ 20)可得可改进比例=84.2%8. 假设某应用程序中有4类操作,通过改进,各操作获得不同的性能提高。
具体数据、如下所示。
(1)改进后,各类操作的加速比分别是多少?(2)各类操作单独改进后,程序获得的加速比分别是多少?(3)4类操作均改进后,整个程序的加速比是多少?多部件改进后的系统加速比=1 / (1-(11.1%+33.3%+38.9%+16.7%)+(11.1%/2+33.3%/1.33+38.9%/3.33+16.7%/4))=2.169. 将计算机系统中某一功能的处理速度加快20倍,但该功能的处理时间仅占整个系统运行时间的40%,则采用此增强功能方法后,能使整个系统的性能提高多少。
计算机系统结构复习题(含答案)计算机系统结构复习题1、虚拟机的概念虚拟机(Virtual Machine)指通过软件模拟的具有完整硬件系统功能的、运行在一个完全隔离环境中的完整计算机系统。
2、指令系统的设计方法、概念、主要原因、对象、总线的仲裁算法主要原因:因为指令系统是软件设计人员与硬件设计人员之间的一个主要分界面,也是他们之间互相沟通的一座桥梁。
对象:概念:又称指令集(instruction set)是计算机体系结构设计的核心,是计算机软、硬件接口,是指机器所具有的全部指令的集合。
它反映了计算机所拥有的基本功能。
它是机器语言程序员所看到的机器的主要属性之一。
设计方法:①、首先考虑所应实现的基本功能,确定哪些基本功能应该由硬件实现,哪些功能由软件实现比较合适。
包括指令的功能设计和指令格式的设计;②、在确定哪些基本功能用硬件来实现时,主要考虑3个因素:速度、成本、灵活性;硬件实现的特点:速度快、成本高、灵活性差软件实现的特点:速度慢、价格便宜、灵活性好③、对指令系统的基本要求完整性、规整性、正交性、高效率、兼容性。
总线仲裁算法有:静态优先级算法、固定时间片算法、(动态优先级)算法和(先来先服务)算法3、要实现两条指令在世间上重叠解释步骤是什么?为了实现两条指令在时间上重叠解释:首先需要付出空间代价,如增加数据总线、控制总线、指令缓冲器、地址加法器、相关专用通路,将指令分析部件和指令执行部件功能分开、单独设置,主存采用多体交叉存取,等等。
其次要处理好指令之间可能存在的关联,如转移的处理,指令相关,主存空间数的相关、通用寄存器组的数相关和基址值相关等的处理。
此外,还应合理调配好机器指令的微操作,使“分析”和“执行”的时间尽可能相等,以提高重叠的效率。
4、互连网络的交换方式有(线路交换)、(包交换)和(线路/包交换)5、SIMD互连网络采用(线路)交换,多处理机常采用(包)交换6、与重叠机器一样,流水机器在遇到(转移指令)指令,尤其是(条件转移指令)指令时,效率也会显著下降7、按指令与数据流的多倍性将数据流分为(SISD)、(SIMD)、(MISD)、(MIMD)四类。
一、名词解释1、Cache 2:1 经验规则:大小为N的直接映像Cache的失效率约等于大小为N/2的两路组相联Cache的失效率。
2、计算机体系结构:指那些对程序员可见的系统属性,还包括设计思想与体系结构。
3、同构型多处理机:由多个同类型,至少担负同等功能的处理机组成,同时处理同一作业中能并行执行的多个任务。
4、通道处理机:能够执行有限I/O指令,并且能够被多台外围设备共享的小型DMA专用处理机。
5、堆栈型机器:其CPU中存储操作数的主要单元是堆栈。
6、Victim Cache:在Cache与下一级存储器的数据通路之间增设一个全相联的小Cache,用来存放由于失效而被丢弃(替换)的那些块。
7、RAID:廉价磁盘冗余阵列或独立磁盘冗余阵列8、累加器型机器:其CPU中存储操作数的主要单元是累加器9、透明性:在计算机技术中,对本来存在的事物或属性,但从某种角度看又好象不存在的概念称为透明性。
10、向量处理机:面向向量型并行计算,以流水线结构为主的并行处理计算机。
11、通用寄存器型机器:CPU中存储操作数的主要单元是通用寄存器。
12、虚拟Cache:访问Cache的索引和标识都是虚拟地址的一部分。
13、机群:机群是一种价格低廉、易于构建、可扩放性极强的并行计算机系统。
它由多台同构或异构的独立计算机通过高性能网络或局域网互连在一起,协同完成特定的并行计算任务。
从用户的角度来看,机群就是一个单一、集中的计算资源。
14、定向技术:当流水线中出现数据冲突时,可以将计算结果从其产生的地方直接送到其他指令中需要它的地方,或所有需要它的功能单元,避免暂停。
15、系列机:由同一厂家生产的具有相同的系统结构,但具有不同组成和实现的一系列不同型号的机器。
16、强制性失效:当第一次访问一个块时,该块不在Cache中,需从下一级存储器中调入Cache,这就是强制性失效。
17、失效率:CPU在第一级存储器中找不到所需数据的概率。
高性能计算机体系结构试题1.名词注释推测执行,指令级并行,并行计算机,流水线,反相关,结构竞争。
2.简述题简述高性能计算机系统的应用领域;简述记分牌算法中指令执行阶段及每个阶段所解决的冲突类型;(资料5)简述解决数据冒险的几种方法;简述路径调动技术的基本思想。
(课件第三部分,P33)3.下面四组MIPS代码,每组由两条指令组成(1)DADDI R1, R1, 4 (2)DADD R3,R1,R2LD R2, 7(R1) SD R2,7(R1)(3)SD R2,7(R1)(4)BEZ R1,PLACESD F2,200(R7)SD R1,7(R1)判断每组是否存在相关,如果存在,请给出相关的类型,并判断每组是否能乱续执行。
4. 根据需要展开下面的循环并进行指令调度,直到没有任何延迟(资料4)LOOP: LD F0,0(R1)MULTD F0,F0,F2LD F4,0(R2)ADDD F0,F0,F4SD 0(R2),F0SUBI R1,R1,8SUBI R2,R2,8BNEQZ R1,LOOP指令延迟表如下:5.假设有一个长流水线,仅仅对条件转移指令使用目标缓冲。
假设分支预测错误的开销为4个时钟周期,缓冲不命中的开销为3个时钟周期。
假设:命中率为95%,预测精度为90%,分支频率为20%,没有分支的基本CPI为1。
(1)程序执行的CPI(2)相对于采用固定的2个时钟周期延迟的分支处理,哪种方法程序的执行速度快?6.请将如下代码写成软件流水循环。
LOOP: LD F0,0(R1)ADDD F4,F0,F2MULTD F6,F4,#5SD F6,0(R1)DSUBI R1,R1,# 8BNZ R1,R2,LOOP7.由16个节点组成的立方体网络中,按照E立方体路由,请给出15号节点传送数据给4号节点的路由过程。
课件第四部分P17)。
超级计算机的体系结构和性能分析超级计算机是目前世界上最为强大的计算机之一,能够处理巨大的数据和运算任务,是现代科学和技术发展的重要基础设施。
但是想要深入了解超级计算机的性能和体系结构,需要具备一些相关的专业知识和技能。
本文将从计算机结构、处理器、内存等方面进行分析,帮助读者更好地了解超级计算机的体系结构和性能。
一、计算机结构超级计算机的结构与普通计算机基本一致,主要包括CPU、内存、输入输出设备等部件,但是其规模和性能要远远超过普通计算机。
超级计算机通常采用并行计算的方式,即将大的任务分解成若干个小任务,由多个处理器并行处理,最终将结果整合起来。
这种方法可以大大提高计算效率,缩短计算时间。
二、处理器超级计算机的处理器通常采用多核心和超线程技术。
多核心技术指处理器内部集成了多个独立的CPU核心,可以同时处理多个任务。
超线程技术是在单一核心内部模拟多个逻辑核心,可以实现单一核心同时处理多个线程。
这些技术的使用可以有效提高计算机的运算速度和效率。
三、内存超级计算机的内存通常采用高性能存储技术,如延迟高带宽内存(HBM)、高速缓存(Cache)等。
这些技术可以实现内存数据的快速读取和存储,为计算机的高速运算提供了保障。
此外,超级计算机的内存容量通常需要大于普通计算机,以应对大规模的数据处理需求。
四、高速网络超级计算机的高速网络是其性能优异的重要保障。
高速网络可以实现处理器之间和计算节点之间的高速数据传输,提高数据处理效率和运算速度。
此外,高速网络还可以支持异构计算,即不同种类的处理器在同一系统中协同工作,共同完成计算任务。
总之,超级计算机是目前科学技术发展中不可或缺的重要设备。
了解其体系结构和性能分析对于深入理解超级计算机的运行原理和应用场景非常重要。
通过对计算机结构、处理器、内存等方面的分析,我们可以更好地了解超级计算机的优势和限制,从而更好地利用其为科学技术发展做出贡献。
计算机系统结构知识点复习考点归纳总结令)控制计算机硬件的层次,汇编语言机器级则是用(助记符)来控制计算机硬件的层次。
22、缓存技术是为了(解决处理器与主存速度不匹配的问题)而引入的。
23、DMA访问是指(直接内存访问)技术,可以减少CPU的负担,提高数据传输效率。
24、在多处理机系统中,(任务)级并行性是指多个任务同时执行,(数据)级并行性是指一个任务中的多个数据同时执行。
25、计算机系统中的(指令流水线)技术可以提高CPU 的运行效率,将多个指令的执行过程重叠起来,从而减少CPU的空闲时间。
26、计算机系统中的(虚拟存储器)技术可以将主存和辅存结合起来,使得程序能够访问比主存更大的地址空间,从而提高系统的性能。
27、计算机系统中的(分布式系统)是指将多个计算机连接起来,共同完成一个任务,可以提高系统的可靠性和性能。
28、计算机系统中的(并行计算)技术可以将一个大问题分解成多个小问题,同时在多个处理器上进行计算,从而提高计算速度和效率。
29、计算机系统中的(云计算)是指将计算资源和服务通过网络提供给用户,可以实现资源的共享和高效利用。
4096字节之间)当程序需要访问某一页时。
操作系统会将该页从磁盘上读入主存,然后再进行访问。
这种方式可以提高存储器的利用率,但也会增加访问时间和开销。
并行性是指在同一时间段内完成多项任务的能力。
它可以分为最低耦合、松散耦合和紧密耦合三种类型,取决于物理连接的紧密度和交叉作用能力的强弱。
开发并行性的途径有时间重叠、资源重复和资源共享。
并行性的开发需要综合考虑硬件、软件、语言、算法和性能评价等因素。
资源重复是指通过重复设置硬件资源来提高可靠性或性能。
最典型的例子是双工系统。
资源重复不仅可以提高可靠性,而且可以进一步用多计算机或机群系统来提高系统的速度性能。
并行处理技术的研究需要综合考虑硬件、软件、语言、算法和性能评价等因素。
沿时间重叠技术途径发展的异构型多处理机系统的典型结构代表是流水线处理机。
第一章计算机系统结构的基本概念从处理数据的角度看,并行级别有位串字串,位并字串,位片串字并,全并行。
位串字串和位并字串基本上构成了SIMD。
位片串字并的例子有:相联处理机STARAN,MPP。
全并行的例子有:阵列处理机ILLIAC IV。
从加工信息的角度看,并行级别有存储器操作并行,处理器操作步骤并行,处理器操作并行,指令、任务、作业并行。
存储器操作并行是指可以在一个存储周期内并行读出多个CPU字的,采用单体多字、多体单字或多体多字的交叉访问主存系统,进而采用按内容访问方式,位片串字并或全并行方式,在一个主存周期内实现对存储器中大量字的高速并行操作。
例子有并行存储器系统,以相联存储器为核心构成的相联处理机。
处理器操作步骤并行是指在并行性概念中引入时间因素,让多个处理过程在时间上错开,轮流重复地执行使用同一套设备的各个部分,加快硬件周转来赢得速度。
例子有流水线处理机。
处理器操作并行是指一个指令部件同时控制多个处理单元,实现一条指令对多个数据的操作。
擅长对向量、数组进行处理。
例子有阵列处理机。
指令、任务、作业并行是指多个独立的处理机分别执行各自的指令、任务、作业。
例子有多处理机,计算机网络,分布处理系统。
并行性的开发途径有时间重叠(TimeInterleaving),资源重复(ResourceReplication),资源共享(Resource Sharing)。
时间重叠是指在并行性概念中引入时间因素,让多个处理过程在时间上错开,轮流重复地执行使用同一套设备的各个部分,加快硬件周转来赢得速度。
例子有流水线处理机。
资源重复是指一个指令部件同时控制多个处理单元,实现一条指令对多个数据的操作。
例子有阵列处理机,相联处理机。
资源共享是指用软件方法让多个用户按一定时间顺序轮流使用同一套资源以提高资源的利用率,从而提高系统性能。
例子有多处理机,计算机网络,分布处理系统。
SISD:一个指令部件控制一个操作部件,实现一条指令对一个数据的操作。
计算机系统结构复习材料(供参考)这边整理的例题,⽼师说不会考原题!请配合PPT 和课本使⽤,认真复习。
如果到时候没有帮上很⼤的忙请不要怪我!⼀、填空题(每空1分,共20分)1.计算机系统多级层次结构含义P1 考6个机器级以及各⾃⽤什么实现。
计算机多级层次结构由⾼到低分别为应⽤语⾔机器级、⾼级语⾔机器级、汇编语⾔机器级、操作系统机器级(前4者均⽤软件实现)、传统机器语⾔机器级(⽤微程序(固件)实现)和微程序机器级(⽤硬件实现)。
2.弗林分类P26 可以写英⽂也可以写中⽂。
1966年,弗林提出按指令流和数据流的多倍性对计算机系统分类。
把计算机系统分成单指令流单数据流SISD 、单指令流多数据流SIMD 、多指令流单数据流MISD 和多指令流多数据流四⼤类MIMD 。
3.计算机系统持续性能评测,⼏种⽅式表达式,以及表达式中变量含义P10。
⼏何性能平均值不考。
(1)算术性能平均值A m①以速率评价: = 1/n(1/T 1+1/T 2+……+1/Tn)②以时间评价:(2)调和性能平均值H m= n/( T 1+T 2+……+Tn)(3)加权算术平均值A m以上的式⼦,T i 和R i 分别是第i 个程序的执⾏时间和执⾏速率,αi 是权值∑∑====n i in i i m T n R n A 11111∑==ni i m T n A 11∑∑====ni i n i i m T n R n H 111∑∑====ni iini i i m T R A 111αα4.规格浮点数,P40表2-1。
这题是这样考的:题⽬会给化出p=?,m=?,r m=?和某种条件,然后求该条件下的值。
(以下那张图考试时不会给出),并要记补充那句。
* 表中特例是指r m为2的整数次幂时,⽤=2m代⼊。
补充:随着r m越⼤,可表⽰数的范围增⼤、个数增多、精度单调下降,右移造成的精度损失降低,运算速度提⾼。
5.尾数下溢处理⽅法,优缺点⽐较P44。