计算机系统结构_第六章练习 答案
- 格式:doc
- 大小:132.00 KB
- 文档页数:7
1. 写出下列各数的原码、反码、补码、移码(用8位二进制表示),其中MSB是最高位(符号位),LSB是最低位。
如果是小数,则小数点在MSB之后;如果是整数,则小数点在LSB之后。
(1)-59/64 (2)27/128 (3)-127/128 (4)用小数表示-1(5)用整数表示-1 (6)-127 (7)35 (8)-1282. 设[x]补=x0.x1x2x3x4,其中x i取0或1,若要使x>-0.5,则x0、x1、x2、x3、x4的取值应满足什么条件?3. 若32位定点小数的最高位为符号位,用补码表示,则所能表示的最大正数为,最小正数为,最大负数为,最小负数为;若32位定点整数的最高位为符号位,用原码表示,则所能表示的最大正数为,最小正数为,最大负数为,最小负数为。
4. 若机器字长为32位,在浮点数据表示时阶符占1位,阶码值占7位,数符占1位,尾数值占23位,阶码用移码表示,尾数用原码表示,则该浮点数格式所能表示的最大正数为,最小正数为,最大负数为,最小负数为。
5. 某机浮点数字长为18位,格式如图2.35所示,已知阶码(含阶符)用补码表示,尾数(含数符)用原码表示。
(1)将(-1027)10表示成规格化浮点数;(2)浮点数(0EF43)16是否是规格化浮点数?它所表示的真值是多少?图2.35 浮点数的表示格式6. 有一个字长为32位的浮点数,格式如图2.36所示,已知数符占1位;阶码占8位,用移码表示;尾数值占23位,尾数用补码表示。
图2.36 浮点数的表示格式请写出:(1)所能表示的最大正数;(2)所能表示的最小负数;(3)规格化数所能表示的数的围。
7. 若浮点数x的IEEE754标准的32位存储格式为(8FEFC000)16,求其浮点数的十进制数值。
8. 将数(-7.28125)10转换成IEEE754标准的32位浮点数的二进制存储格式。
9. 已知x=-0.x1x2…x n,求证:[x]补=+0.00…01。
第六章总线系统一、填空题:1.PCI总线采用A.______仲裁方式,每一个PCI设备都有独立的总线请求和总线授权两条信号线与B.______相连。
2.SCSI是处于A.______和B.______之间的并行I/O接口,可允许连接C.______台不同类型的高速外围设备。
3.总线有A 特性、B 特性、C 特性、D 特性,因此必须E 。
4.微型计算机的标准总线从16位的A 总线发展到32位的B 总线和C 总线,又进一步发展到64位的D 总线。
二、选择题:1.计算机使用总线结构的主要优点是便于实现技术化,同时______。
A. 减少信息传输量B. 提高信息传输速度C. 减少了信息传输线的条数D. 减少了存储器占用时间2.描述PCI总线基本概念中正确的句子是______。
A.PCI总线的基本传输机制是猝发式传送B.PCI总线是一个与处理器有关的高速外围总线C.PCI设备一定是主设备D.系统中允许只有一条PCI总线3.描述PCI总线中基本概念表述不正确的是______。
A.PCI设备不一定是主设备B.PCI总线是一个与处理器有关的高速外围总线C.PCI总线的基本传输机制是猝发式传送D.系统中允许有多条PCI总线4.并行I/O标准接口SCSI中,一块适配器可以连接______台具有SCSI接口的设备。
A. 6B. 7C. 8D. 95.下面对计算机总线的描述中,确切完备的概念是______。
A.地址信息、数据信息不能同时出现B.地址信息与控制信息不能同时出现C.数据信息与控制信息不能同时出现D.两种信息源的代码不能在总线中同时传送6.SCSI接口以菊花链形式最多可连接______台设备。
A.7台 B.8台 C.6台 D.10台7.微型机系统中外设通过适配器与主板的系统总线相连接,其功能是___。
A. 数据缓冲和数据格式转换B.监测外设的状态C.控制外设的操作D. 前三种功能的综合作用8.计算机使用总线结构的主要优点是便于实现积木化,同时___。
一填空题六、输入输出系统(28空)1、连接特性I/O系统容量2、响应时间吞量3、寻道时间旋转时间4、传输时间控制器开销5、从盘面到缓冲存储器从缓冲存储器到主机6、面密度7、提高转速提高记录密度8、可用性可信性9、可用性可信性可靠性10、容量大可靠性高11、RAID1 RAID212、同步异步13、通用串行总线14、必须独占使用15、周边元件扩展接口廉价磁盘冗余阵列六、输入输出系统(10个)6.1 引言6.2 外部存储设备6.3 可靠性、可用性和可信性1、系统可靠性:系统可靠性是指系统从初始状态开始一直提供服务的能力,可靠性通常用平均无故障时间(MTTF)来衡量。
2、系统可用性:系统可用性是指系统正常工作时间在连续两次正常服务间隔时间中所占的比率。
3、系统可信性:系统的可信性是指服务的质量,即在多大程度上可以合理的认为服务是可靠的。
可信性是不可以度量的。
4、故障容忍技术:通过冗余措施,虽然可能出现故障,但是可以通过冗余信息保证服务仍然能够正常进行。
6.4 廉价磁盘冗余陈列RAID5、RAID:即廉价磁盘冗余陈列,通过在磁盘阵列中增加冗余信息来容错,提高磁盘阵列的可靠性。
当单个磁盘失效时,丢失的信息可以通过冗余盘中的信息重新构建。
6、RAID1:亦称镜像盘,使用双备份磁盘。
每当数据写入一个磁盘时,将该数据也写到另一个冗余盘,这样形成信息的两份复制品。
如果一个磁盘失效,系统可以到镜像盘中获得所需要的信息。
镜像是最昂贵的解决方法。
特点是系统可靠性很高,但效率很低。
6.5 I/O设备与CPU和存储器的连接7、PCI:Peripheral Component Interconnect,即外围器件互连,是一种为CPU和外设之间提供高性能数据通道的总线。
8、I/O层次结构:即I/O系统的四级层次结构,在一台大型计算机系统中可以有多个通道,一个通道可以连接多个设备控制器,而一个设备控制器又可以管理一台或多台外围设备。
计算机系统结构习题解答第一章习题一1.2一台经解释实现的计算机,可以按照功能划分成4级。
每一级为了执行一条指令需要下一级的N条指令解释。
若执行第1级的一条指令需K纳秒时间,那么执行第2、3、4级的一条指令个需要多少时间?解:①分析:计算机按功能分级时,最底层的为第1级。
向上一次是第2 、3、4级。
解释执行是在低级机器级上,用它的一串指令或语句来解释执行高一级上的一条指令的功能。
是逐条解释的。
②解答:执行第2、3、4级的一条指令各需KNns,KN2ns,KN3ns的时间。
1.3操作系统机器级的某些指令就用传统机器级的指令,这些指令可以用微程序直接实现,而不由操作系统自己来实现。
根据你对习题1.2的回答,你认为这样做有哪两个好处?答:可以加快操作系统操作命令解释的速度。
同时也节省了存放解释操作命令这部分解释程序所占用的空间。
简化了操作系统机器级的设计。
也有利于减少传统机器级的指令条数。
1.5硬件和软件在什么意义上是等效的?在什么意义上是不等效的?试举例说明。
答:硬件和软件在逻辑意义上是等效的。
在物理意义上是不等效的。
①在原理上,用硬件或固件实现的功能完全可以用软件来完成。
用软件实现的功能也可以用硬件或固件来完成。
功能一样。
②只是反映在速度、价格、实现的难易程度上,这两者是不同的。
性能不同。
③例如,浮点运算在80386以前一直是用软件实现的。
到了80486,将浮点运算器集成到了CPU中,可以直接通过浮点运算指令用硬件实现。
但速度却高的多。
1.9下列哪些对系统程序员是透明的?哪些对应用程序员是透明的?系列机各档不同的数据通路宽度;虚拟存储器;Cache存储器;程序状态字;“启动I/O”指令;“执行”指令;指令缓冲器。
答:①对系统程序员和应用程序员均透明的:是全用硬件实现的计算机组成所包含的方面。
有:数据通路宽度、Cache存储器、指令缓冲器。
②仅对应用程序员透明的:是一些软硬件结合实现的功能。
有:虚拟存储器、程序状态字、“启动I/O”指令。
1.如何区别存储器和寄存器?两者是一回事的说法对吗?解:存储器和寄存器不是一回事。
存储器在CPU 的外边,专门用来存放程序和数据,访问存储器的速度较慢。
寄存器属于CPU 的一部分,访问寄存器的速度很快。
2.存储器的主要功能是什么?为什么要把存储系统分成若干个不同层次?主要有哪些层次?解:存储器的主要功能是用来保存程序和数据。
存储系统是由几个容量、速度和价存储系统和结构各不相同的存储器用硬件、软件、硬件与软件相结合的方法连接起来的系统。
把存储系统分成若干个不同层次的目的是为了解决存储容量、存取速度和价格之间的矛盾。
由高速缓冲存储器、主存储器、辅助存储器构成的三级存储系统可以分为两个层次,其中高速缓存和主存间称为Cache -主存存储层次(Cache 存储系统);主存和辅存间称为主存—辅存存储层次(虚拟存储系统)。
3.什么是半导体存储器?它有什么特点?解:采用半导体器件制造的存储器,主要有MOS 型存储器和双极型存储器两大类。
半导体存储器具有容量大、速度快、体积小、可靠性高等特点。
半导体随机存储器存储的信息会因为断电而丢失。
4.SRAM 记忆单元电路的工作原理是什么?它和DRAM 记忆单元电路相比有何异同点?解:SRAM 记忆单元由6个MOS 管组成,利用双稳态触发器来存储信息,可以对其进行读或写,只要电源不断电,信息将可保留。
DRAM 记忆单元可以由4个和单个MOS管组成,利用栅极电容存储信息,需要定时刷新。
5.动态RAM 为什么要刷新?一般有几种刷新方式?各有什么优缺点?解:DRAM 记忆单元是通过栅极电容上存储的电荷来暂存信息的,由于电容上的电荷会随着时间的推移被逐渐泄放掉,因此每隔一定的时间必须向栅极电容补充一次电荷,这个过程就叫做刷新。
常见的刷新方式有集中式、分散式和异步式3种。
集中方式的特点是读写操作时不受刷新工作的影响,系统的存取速度比较高;但有死区,而且存储容量越大,死区就越长。
分散方式的特点是没有死区;但它加长了系统的存取周期,降低了整机的速度,且刷新过于频繁,没有充分利用所允许的最大刷新间隔。
计算机体系结构试题及答案12008年01月23日22:211、计算机高性能发展受益于:(1)电路技术的发展;(2)计算机体系结构技术的发展。
2、层次结构:计算机系统可以按语言的功能划分为多级层次结构,每一层以不同的语言为特征。
第六级:应用语言虚拟机-> 第五级:高级语言虚拟机-> 第四级:汇编语言虚拟机-> 第三级:操作系统虚拟机-> 第二级:机器语言(传统机器级) ->第一级:微程序机器级。
3、计算机体系结构:程序员所看到的计算机的属性,即概括性结构与功能特性。
For personal use only in study and research; not for commercial use4、透明性:在计算机技术中,对本来存在的事物或属性,从某一角度来看又好像不存在的概念称为透明性。
5、Amdahl提出的体系结构是指机器语言级程序员所看见的计算机属性。
6、经典计算机体系结构概念的实质3是计算机系统中软、硬件界面的确定,也就是指令集的设计,该界面之上由软件的功能实现,界面之下由硬件和固件的功能来实现。
7、计算机组织是计算机系统的逻辑实现;计算机实现是计算机系统的物理实现。
8、计算机体系结构、计算机组织、计算机实现的区别和联系?答:一种体系结构可以有多种组成,一种组成可以有多种物理实现,体系结构包括对组织与实现的研究。
9、系列机:是指具有相同的体系结构但具有不同组织和实现的一系列不同型号的机器。
10、软件兼容:即同一个软件可以不加修改地运行于系统结构相同的各机器,而且它们所获得的结果一样,差别只在于运行时间的不同。
11、兼容机:不同厂家生产的、具有相同体系结构的计算机。
12、向后兼容是软件兼容的根本特征,也是系列机的根本特征。
13、当今计算机领域市场可划分为:服务器、桌面系统、嵌入式计算三大领域。
14、摩尔定律:集成电路密度大约每两年翻一番。
15、定量分析技术基础(1)性能的评测:(a)响应时间:从事件开始到结束之间的时间;计算机完成某一任务所花费的全部时间。
计算机系统结构_第六章练习答案计算机系统结构_第六章练习答案第六章向量处理机1.在大型数组的处置中常常涵盖向量排序,按照数组中各排序相继的次序,我们可以把向量处置方法分成哪三种类型?横向处理方式,纵向处理方式,纵横处理方式纵向处理方式:向量排序就是按行的方式从左至右纵向的展开横向处理方式:向量排序就是按列的方式自上而下横向的展开四海处理方式:纵向处置和横向处置结合的方式2.表述以下与向量处置有关的术语。
(1)向量和标量的平衡点:为了使向量硬件设备和标量设备的利用率相等,一个程序中向量代码所占的百分比(2)用户代码的向定量比值:用户代码可以向定量的部分占到全部的比重(3)向量化编译器或量化器:将标量运算进行向量化或者将向量运算进行适当的修改使之能够进入向量处理进行向量处理的编译器3.详细描述提升向量处理机性能的常用技术(1)链接技术(2)向量循环或分段开采技术(3)向量递归技术(4)稠密矩阵的处置技术4.下述的几个需要解决的问题中,那个是向量处理机所最需要关心的?a.计算机指令的优化技术b.设计满足用户运算器频宽建议的存储器c.如何提高存储器的利用率,增加存储器系统的容量d.纵横处理方式的划分问题5.假设系统在向量模式下面能达至9mflops,在标量模式下能达至1mflops速度,而代码的90%就是向量运算,10%就是标量运算,这样花掉在两种模式上的排序时间成正比。
那么向量平衡点就是:a.0.1b.0.9一个程序中向量代码所占的百分比c.0.5d.以上都不是6.查看下面三条指令:v3←av2←v0+v1v4←v2*v3假设向量长度大于64,且前后其他的指令均没相关性,数据步入和流入每个功能部件,包含出访存储器都须要一拍摄的时间,假设向量的长度为n。
三条指令全部使用以太网的方法,那么继续执行的时间就是:a.3n+20b.3n+21c.3n+22d.3n+237.下面一组向量操作能分成几个编队?假设每种流水功能部件只有一个。
习题1.给出以下概念的解释说明。
指令周期(Instruction Cycle)机器周期(Machine Cycle)同步系统(Synchronous system)时序信号(Timing signal)控制单元(Control Unit, CU)执行部件(Execute Unit,EU)组合逻辑元件(Combinational logic element)或操作元件(Operate element)时序逻辑元件(Sequential logic circuit)或状态元件(State element)多路选择器(Multiplexor)扩展器(Extension unit)“零”扩展(0- extend)“符号”扩展(Sign extend)算术逻辑部件ALU(Arithmetic Logic Unit)加法器(Adder)CPU总线(CPU Bus)寄存器堆(Register file)定时方式(Clocking methodology)边沿触发(Edge-triggered)寄存器写信号(Register Write)指令存储器(Instruction Memory)数据存储器(Data Memory)程序计数器(Program Counter)指令寄存器(Instruction Register)指令译码器(Instruction Decoder)时钟周期(Clock Cycle)主频(CPU Clock Rate / Frequency转移目标地址(Branch target address)控制信号(Control signal)微程序控制器(Microprogrammed control)硬布线控制器(Hardwared control)控制存储器(Control Storage,控存CS)微代码(Microcode)微指令(Microinstruction)微程序(Microprogram)固件(Firmware)中断过程(Interrupt Processing)异常(Exception)故障(fault)自陷(Trap) 终止(Abort)中断(Interrupt)中断服务程序(Interrupt Handler)中断允许位(Interrupt Enable Bit)关中断(Interrupt OFF)开中断(Interrupt ON)中断响应(Interrupt Response)向量中断(Vector Interrupt)中断向量(Interrupt vector)中断向量表(Interrupt vector table)向量地址(vector Address)中断类型号(Interrupt number)2. 简单回答下列问题。
word 文档下载后可自由复制编辑你计算机系统结构清华第 2 版习题解答word 文档下载后可自由复制编辑1 目录1.1 第一章(P33)1.7-1.9 (透明性概念),1.12-1.18 (Amdahl定律),1.19、1.21 、1.24 (CPI/MIPS)1.2 第二章(P124)2.3 、2.5 、2.6 (浮点数性能),2.13 、2.15 (指令编码)1.3 第三章(P202)3.3 (存储层次性能), 3.5 (并行主存系统),3.15-3.15 加 1 题(堆栈模拟),3.19 中(3)(4)(6)(8)问(地址映象/ 替换算法-- 实存状况图)word 文档下载后可自由复制编辑1.4 第四章(P250)4.5 (中断屏蔽字表/中断过程示意图),4.8 (通道流量计算/通道时间图)1.5 第五章(P343)5.9 (流水线性能/ 时空图),5.15 (2种调度算法)1.6 第六章(P391)6.6 (向量流水时间计算),6.10 (Amdahl定律/MFLOPS)1.7 第七章(P446)7.3 、7.29(互连函数计算),7.6-7.14 (互连网性质),7.4 、7.5 、7.26(多级网寻径算法),word 文档下载后可自由复制编辑7.27 (寻径/ 选播算法)1.8 第八章(P498)8.12 ( SISD/SIMD 算法)1.9 第九章(P562)9.18 ( SISD/多功能部件/SIMD/MIMD 算法)(注:每章可选1-2 个主要知识点,每个知识点可只选 1 题。
有下划线者为推荐的主要知识点。
)word 文档 下载后可自由复制编辑2 例 , 习题2.1 第一章 (P33)例 1.1,p10假设将某系统的某一部件的处理速度加快到 10倍 ,但该部件的原处理时间仅为整个运行时间的40%,则采用加快措施后能使整个系统的性能提高多少?解:由题意可知: Fe=0.4, Se=10,根据 Amdahl 定律S n To T n1 (1Fe )S n 1 10.6 0.4100.64 Fe Se 1.56word 文档 下载后可自由复制编辑例 1.2,p10采用哪种实现技术来求浮点数平方根 FPSQR 的操作对系统的性能影响较大。
第六章向量处理机1.在大型数组的处理中常常包含向量计算,按照数组中各计算相继的次序,我们可以把向量处理方法分为哪三种类型?横向处理方式,纵向处理方式,纵横处理方式横向处理方式:向量计算是按行的方式从左至右横向的进行纵向处理方式:向量计算是按列的方式自上而下纵向的进行纵横处理方式:横向处理和纵向处理相结合的方式2.解释下列与向量处理有关的术语。
(1)向量和标量的平衡点:为了使向量硬件设备和标量设备的利用率相等,一个程序中向量代码所占的百分比(2)用户代码的向量化比值:用户代码可向量化的部分占全部的比重(3)向量化编译器或量化器:将标量运算进行向量化或者将向量运算进行适当的修改使之能够进入向量处理进行向量处理的编译器3.简要叙述提高向量处理机性能的常用技术(1)链接技术(2)向量循环或分段开采技术(3)向量递归技术(4)稀疏矩阵的处理技术4.下述的几个需要解决的问题中,那个是向量处理机所最需要关心的?A.计算机指令的优化技术B.设计满足运算器带宽要求的存储器C.如何提高存储器的利用率,增加存储器系统的容量D.纵横处理方式的划分问题5.假设系统在向量模式下面能够达到9Mflops,在标量模式下能够达到1Mflops速度,而代码的90%是向量运算,10%是标量运算,这样花在两种模式上的计算时间相等。
那么向量平衡点是:A.0.1B.0.9 一个程序中向量代码所占的百分比C.0.5D.以上都不是6.查看下面三条指令:V3←AV2←V0+V1V4←V2*V3假设向量长度小于64,且前后其他的指令均没有相关性,数据进入和流出每个功能部件,包括访问存储器都需要一拍的时间,假设向量的长度为N。
三条指令全部采用串行的方法,那么执行的时间是:A.3N+20B.3N+21C.3N+22D.3N+237.下面一组向量操作能分成几个编队?假设每种流水功能部件只有一个。
LV V1,Rx ;取向量MULTSV V2,F0,V1;向量和标量相乘LV V3,Ry ;取向量YADDV V4,V2,V3;加法SV Ry,V4;存结果可以划分成四个编队:(1)LV (2)MULTSV LV (3)ADDV (4)SV8.在一台向量处理机上实现A=B×s操作,其中A和B是长度为200的向量,s是一个标量。
向量寄存器长度为64。
功能部件的启动开销为:取数和存数部件为12个时钟周期,乘法部件为7个时钟周期,加法部件为6个时钟周期。
总的执行时间是?A.784B.783C.785D.7809.简述三种向量处理方式,他们对向量处理机结构要求有什么不同。
解:水平处理方式:向量长度为N,则水平处理方式相当于执行N次循环。
不适合对向量进行流水处理。
(或者叫做横向处理方式)垂直处理方式:将整个向量按相同的运算处理完毕之后,再去执行其他的运算,适合对向量进行流水处理,向量运算指令的源/目向量都放在存储器内,使得流水线运算部件的输入输出端直接与存储器相联,构成M-M型的运算流水线。
分组处理方式:把长度为N的向量分为若干组,每组按照纵向处理10.解释下列与向量处理有关的术语。
(1)向量规约指令(2)收集和散播指令解:(1)将向量化转化为标量的指令(2)收集指令可以把非连续存储单元的内容传送到向量寄存器组中若干个连续的寄存器;散播指令与此相反。
他们用于稀疏矩阵的存储与运算,可以节省空间。
11. 查看下面三条指令:V3←AV2←V0+V1V4←V2*V3假设向量长度小于64,且前后其他的指令均没有相关性,数据进入和流出每个功能部件,包括访问存储器都需要一拍的时间,假设向量的长度为N。
三条指令采用链接的方法,那么执行的时间是:A.3N+22B.2N+15C.N+16D.N+1712.在一台向量处理机上实现A=B×s操作,其中A和B是长度为200的向量,s是一个标量。
向量寄存器长度为64。
功能部件的启动开销为:取数和存数部件为12个时钟周期,乘法部件为7个时钟周期,加法部件为6个时钟周期。
那么一个结果元素的平均执行时间(包括启动开销)为:A.3.7B.3.9C.4.1D.4.313.某向量处理机有16个向量寄存器,其中V0-V5种分别存放有向量A,B,C,D,E,F,向量的长度是8,向量各元素均为浮点数;处理部件采用两个单功能流水线,加法功能部件时间为2拍,乘法功能部件时间为3拍。
采用类似CRAY-1的链接技术,先计算(A+B)*C,在流水线不停的情况下,接着计算(D+E)*F 。
求此链接流水线的通过时间是多少拍?(设寄存器出入各需1拍)A.8B.9C.17D.1814.名词解释向量流水处理机 解:处理机具有向量数据表示,并通过向量指令对向量的各元素进行处理。
15.某向量处理机有16个向量寄存器,其中V0-V5种分别存放有向量A,B,C,D,E,F,向量的长度是8,向量各元素均为浮点数;处理部件采用两个单功能流水线,加法功能部件时间为2拍,乘法功能部件时间为3拍。
采用类似CRAY-1的链接技术,先计算(A+B)*C,在流水线不停的情况下,接着计算(D+E)*F 。
每拍时间是50ns,完成这些计算并且把结果存进相应的寄存器,此处理部件实际吞吐率是多少MFLOPS?(设寄存器出入各需1拍)A.26.67B.29.C.24.6D.25.8316.一台单处理机可以以标量方式运行,也可以以向量方式运行。
在向量方式情况下,计算可比标量方式快9倍。
设某基准程序在此计算机上运行的时间是T 。
另外,已知T 的25%用于向量方式,其余机器时间则以标量方式运行。
请计算在上述条件下与完全不用向量方式条件下相比的加速比,并计算上述程序中向量化代码所占的百分比。
加速比=(0.25T*9+0.75T*1)/T=3由于T 中向量化代码所占的时间为0.25T ,则串行代码用时=T-0.25T=0.75T ,所以完全不用向量方式执行该段代码用时= 0.75T+9*0.25T=3T, 因此加速比=3T/T=3.根据Amdahl 定律.17.一台向量计算机一次只能以下述两种方式中的一种运行:一种是向量方式,执行速度v R 为10Mflops ;另一种是标量方式,执行速度s R 为1Mflops 。
设α是该计算机的典型程序代码中可以向量化部分的百分比。
如果要使平均执行的速度达到7.5Mflops,那么向量化百分比应该多大?1/[a/Rv+(1-a)/Rs]=7.5所以a=0.96318.在CARY1机器上,设向量长度均为32,s 是标量寄存器,加法需要6拍,乘法需要7拍,从存储器读数需要6拍,打入寄存器及启动功能部件(包括寄存器)各需要1拍。
则下面的指令组完成所需要的拍数是:V3←存储器 打入1,启动1,读数6V2←V0+V1s0←s2+s3V3←V1×V4A.111B.110C.78D.798+31+9+3119.在CRAY-1机器上,链接方式执行下面4条向量指令(括号中给出相应功能部件的时间),如果向量寄存器和功能部件之间的数据传输需要1拍,试求此链接流水线的流过时间为多少拍?V0←存储器(存储器取数7拍)9 V1←V0+V1(向量加3拍)5 V3←V2<A3(按照A3左移4拍)6 V5←V3∧V4(向量逻辑乘2拍)4A.23B.24C.30D.3120. 一台单处理机可以以标量方式运行,也可以以向量方式运行。
在向量方式情况下,计算可比标量方式快18倍。
设某基准程序在此计算机上运行的时间是T 。
另外,已知T 的25%用于向量方式,其余机器时间则以标量方式运行。
那么在上述条件下与完全不用向量方式的条件下相比的加速比是:A.3B.3.43C.3.33D.以上均不正确1/[0.75/18+0.25/1]21.一台向量计算机一次只能以下述两种方式中的一种运行:一种是向量方式,执行速度v R 为10Mflops ;另一种是标量方式,执行速度s R 为1Mflops 。
设α是该计算机的典型程序代码中可以向量化部分的百分比。
求平均执行速度的计算公式。
1/[a/Rv+(1-a)/Rs]=10/(10-9a)22.向量处理机有那两种最基本的结构?存储器--存储器结构寄存器--寄存器结构23.研制高性能的向量处理机主要需要解决哪几个问题?(1) 较好的维持向量/标量性能平衡(2) 可扩展性随处理机数目的增加而提高(3) 增加存储器系统的容量和性能(4) 提供高性能的I/O 和易访问的网络24.为了提高向量处理机的性能,会采用一些特殊的技术,下面那一项不是提高向量处理机性能而采用的技术?A.链接技术B.向量递归技术C.cache 缓存技术D.稀疏矩阵的处理技术25.在CARY1机器上,设向量长度均为32,s 是标量寄存器,加法需要6拍,乘法需要7拍,从存储器读数需要6拍,打入寄存器及启动功能部件(包括寄存器)各需要1拍。
则下面的指令组完成所需要的拍数是:V0←存储器V2←V0+V1V3←V2×V1V5←V3×V426.若要进行向量运算D=A×(B+C),假设向量长度N<64,且B和C已经存至V0和V1,则下面三条指令就可以完成上述的运算。
V3←A (6拍)V2←V0+V1 (6拍)V4←V2×V3 (7拍)分别求三条指令全部用串行的方法和链接技术执行的时间(读写各需1拍)。
27.在某台向量处理机上执行DAXPY代码,即完成Y=a×X+Y,其中X和Y是向量,最初存放在内存,a是一个标量,他们的向量指令如下:LV V1,Rx ;取向量MULTSV V2,F0,V1 ;标量和向量相乘LV V2,Ry ;取向量YADDV V4,V2,V3 ;相加SV Ry,V4 ;存结果求总的执行时间。
假设其中存取数需要12拍,乘法需要7拍,加法需要6拍,向量长度是n。
28.假设某向量处理机上执行DAXPY代码所需要的时钟周期是4n+64,其中n是向量长度,时钟频率是200MHz,那么最大性能是多少?A. 90MFLOPSB. 80MFLOPSC.50 MFLOPSD. 100MFLOPS29.假设某向量处理机上执行DAXPY代码所需要的时钟周期是4n+64,其中n是向量长度,时钟频率是200MHz,那么半性能向量长度是:A.12.8B.10.7C.12D.1330.日本FOCOM向量处理机VP-200具有流水线链接和并行化功能。
它有2条存储流水线到向量寄存器,两者可以并行工作。
此外尚有加法和乘法流水线。
各流水线间均可以链接操作。
若现在要在Vp-200向量机上实现以下的向量操作:A(I)=B(I) ×C(I)+D(I) ×E(I)+F(I) ×G(I)I=1,2,…,N。
假定所有流水线的延迟时间都相等,取/存操作转换时将有t的流水线重构延迟时间。