计算机体系结构复习题
- 格式:docx
- 大小:39.73 KB
- 文档页数:10
计算机系统结构复习题和重点(附答案)一、单项选择题1.实现汇编语言源程序变换成机器语言目标程序是由()A.编译程序解释B.编译程序翻译C.汇编程序解释D.汇编程序翻译2.系列机软件必须保证()A.向前兼容,并向上兼容B.向前兼容,并向下兼容C.向后兼容,力争向上兼容D.向后兼容,力争向下兼容3.浮点数尾数基值r m=8,尾数数值部分长6位,可表示规格化正尾数的个数是()A.56个B.63个C.64个D.84个4.在IBM370系统中,支持操作系统实现多进程共用公用区管理最有效的指令是()A.“执行”指令B.“程序调用”指令C.“比较与交换”指令D.“测试与置定”指令5.关于非专用总线三种控制方式中,下列叙述错误..的是()A.集中式定时查询,所有部件共用同一条“总线忙”线B.集中式定时查询,所有部件都用同一条“总线请求”线C.集中式独立请求,所有部件都用同一条“总线请求”线D.集中式串行链接,所有部件都用同一条“总线请求”线6.磁盘外部设备适合于连接到()A.字节多路通道B.数组多路通道或选择通道C.选择通道或字节多路通道D.数组多路通道或字节多路通道7.在Cache存储器中常用的地址映象方式是()A.全相联映象B.页表法映象C.组相联映象D.段页表映象8.在指令级高度并行的超级处理机中,下列叙述正确的是()A.超标量处理机利用资源重复,要求高速时钟机制B.超流水线处理机利用资源重复,要求高速时钟机制C.超标量处理着重开发时间并行性,要求高速时钟机制D.超流水线处理机着重开发时间并行性,要求高速时钟机制9.间接二进制n方体网络是一种()A.多级立方体网络B.多级全排列网络C.单级立方体网络D.多级混洗交换网络10.多端口存储器适合于连接A.紧耦合多处理机B.松耦合多处理机C.机数很多的处理机D.机数可变的多处理机二、填空题11.多处理机实现的是___________、___________间的并行。
第一章计算机网络体系结构一、习题1、比特的传播时延与链路带宽的关系()。
A.没有关系 B. 反比关系C. 正比关系D. 无法确定2、计算机网络中可以没有的是()。
A. 客服机B. 操作系统C. 服务器D. 无法确定3、在OSI参考模型中,提供流量控制的层是第(1)层;提供建立、维护和拆除端到端连接的层是(2);为数据分组提供在网络中路由功能的是(3);传输层提供(4)的数据传送;为网络层实体提供数据发送和接收功能和过程的是(5)。
(1)A. 1、2、3 B. 2、3、4 C. 3、4、5 D. 4、5、6(2)A. 物理层 B. 数据链路层 C. 会话层 D. 传输层(3)A. 物理层 B. 数据链路层 C.网络层 D. 传输层(4)A. 主机进程之间 B. 网络之间 C. 数据链路层 D. 物理线路层(5)A. 物理层 B. 数据链路层 C. 会话层 D. 传输层4、计算机网络的基本分类方法主要有两种:一种是根据网络所使用的传输技术;另一种是根据()。
A. 网络协议B. 网络操作系统C. 覆盖范围与规模D. 网络服务器类型与规模5、计算机网络从逻辑功能上可分为()。
Ⅰ.资源子网Ⅱ.局域网Ⅲ.通信子网Ⅳ.广域网A. Ⅱ、ⅣB.Ⅰ、ⅢB. Ⅰ、Ⅳ D. Ⅲ、Ⅳ6、计算机网络最基本的功能是()。
Ⅰ. 流量控制Ⅱ.路由选择Ⅲ. 分布式处理Ⅳ. 传输控制A. Ⅰ、Ⅱ、ⅣB. Ⅰ、Ⅲ、ⅣC. Ⅰ、ⅣD. Ⅲ、Ⅳ7、世界上第一个计算机网络是()。
A. ARPANETB. 因特网C. NSFnetD. CERNET8、物理层、数据链路层、网络层、传输层的传输单位(或PDU)分别是()。
Ⅰ.帧Ⅱ. 比特Ⅲ.报文段Ⅳ.数据报A.Ⅰ、Ⅱ、Ⅳ、Ⅲ B. Ⅱ、Ⅰ、Ⅳ、ⅢC.Ⅰ、Ⅳ、Ⅱ、ⅢD. Ⅲ、Ⅳ、Ⅱ、Ⅰ9、设某段电路的传播时延是10ms,带宽为10Mbit/s,则该段电路的时延带宽积为()。
A. 2×105 bitB. 4×105 bitC. 1×105 bitD. 8×105 bit时延带宽=传播时延×信道带宽时延带宽积=10×10 ×10×10 bit=1×10 bit10、在OSI参考模型中,第N层与它之上的第N+1层的关系是()。
计算机网络体系结构复习题-选择题1、1974年,IBM首先公布了世界上第一个计算机网络体系结构是【】A、DNAB、FNAC、DCAD、SNA2、负责源端主机到目标主机之间packets的递送是【】A、数据链路层B、网络层C、传输层D、应用层3、挂号电子邮件是属于【】A、无证实数据报B、层证数据报C、用户证实数据报D、以上都不是4、传输的流量控制主要在【】A、端到端之间进行B、相邻结点之间进行C、源结点到目的结点之间进行D、主机到主机之间进行5、下列哪些应用是由UDP提供的【】A、Web应用B、文件传输C、视频会议D、电子邮件6、HFC的带宽是【】A、独占的B、在用户间共享的C、在整个网络中共享D、以上都不是7、下列在HTTP请求行和状态行中都存在的是【】A、HTTP版本号B、URLC、状态代码D、状态语句8、HTTP与下列哪两个有相似性【】A、FTP和SNMPB、FTP和SMTPC、SNMP和SMTPD、TELNET和FTP9、流行的应用层协议已被赋予特定的端口号,DNS的TCP端口号是【】A、25B、53C、80D、11010、下列不属于基于GUI的用户代理是【】A、mailB、EudoraC、outlookD、netscape11、在FTP中,通过三个属性来解决异构问题,其中包含了流、数据块和压缩的是【】A、文件类型B、数据结构C、传输模式D、算法结构12、在SMTP中,下列哪一种服务质量是最重要的【】A、最小延迟B、最大呑吐量C、可靠性D、带宽13、一封电子邮件包含一条文本形式的生日祝贺词,一张蛋糕图片和一首歌。
文本必须先于图象处理。
则内容类型(content-type)是【】A、Multipart/mixedB、Multipart/digestC、Multipart/parallelD、Multipart/alternative14、每一个主机都被记录在下列哪一个名称服务器上【】A、局部名称服务器B、根名称服务器C、权威名称服务器D、全局名称服务器15、如果报文来自于高速缓存,则DNS响应会被归类为【】A、授权的B、非授权的C、迭代的D、递归的16、对于使用TCP的系统,发送窗口大小是由下列什么窗口大小来决定的【】A、接收方B、发送方C、拥塞D、A和C17、设计用于IP的基于数据流的QoS模型称为【】A、综合业务B、差分业务C、RSVPD、多播树18、下列哪一种服务类型特别适用于突发性数据【】A、CBRB、VBR19、下列哪一种通信量整形方法在主机空闲时给主机提供信用【】A、漏桶B、令牌桶C、通信量桶D、猝发性桶20、SCTP是一个【】A、面向字节、可靠的协议B、面向信息、可靠的协议C、面向字节、不可靠的协议D、面向信息、不可靠的协议21、在SCTP的关联建立中使用了【】A、二次握手B、三次握手C、四次握手D、五次握手22、当SCTP收到几个相同的SACKs时,会认为数据块(data chunk)丢失【】A、2B、3C、4D、523、当IGMP信息包被封装在IP数据报中时,IP数据报中的TTL 字段值为【】A、0B、1C、2D、324、下列属于基于源端树的多播路由协议是【】A、OSPFB、DVMRPC、PIM-SMD、CBT25、下列不属于多播应用的是【】A、新闻发布B、视频会议C、分布式数据库的访问D、因特网电话26、AH不能提供下列哪一种服务【】A、消息完整性B、保密性C、访问控制D、防止重放攻击27、当一个IP数据报中封装了ESP的头部和尾部时,其头部协议字段的值为【】A、50B、5128、一个SA连接通过SPI,AH或ESP标识和源IP地址三个元素唯一地被定义,其中具有与虚电路号相类似功能的是【】A、SPI B、AH 标识C、源IP地址D、ESP标识29、在遂道技术中,IP数据报先_______然后_________【】A、被封装到另一个数据报中;加密B、加密;被封装到另一个数据报中C、鉴别;加密D、加密;鉴别30、AH和ESP中的序列号的作用是【】A、防止重放攻击B、进行访问控制C、消息完整性保护D、保密1、1974年,IBM首先公布了世界上第一个计算机网络体系结构是【】A、SNAB、DNAC、DCAD、DNS2、数据链路层的流量控制主要在【】A、端到端之间进行B、相邻结点之间进行C、源结点到目的结点之间进行D、主机到主机之间进行3、HFC(光纤混合同轴电缆)的带宽是【】A、独占的B、在用户间共享的C、是在网络间共享的D、在主干线上共享4、有些应用要求完全可靠地传送数据(不能有数据丢失),而有一些应用可以容忍一定数量的数据丢失称为丢失容忍应用,下列属于丢失容忍应用的是A、财务应用B、文件传输C、电子邮件D、视频会议【】5、排队延迟什么时候比较大,什么时候却又显得微不足道呢?这很大程度上取决于以下因素【】A、输出队列的分组到达速率B、输出链路的传输率C、分组到达时刻的分布特性D、以上都是6、在测试FTP数据连接主动打开方式中,如果命令行为port192,168,0,1,1,30,请问其监听的端口为【】A、30B、60C、90D、2867、客户端机器通常需要用下列哪一个协议来发送邮件【】A、POP3B、IAMPC、SMTPD、MTA8、一封电子邮件包含一条文本形式的生日祝贺词,一张蛋糕图片和一首歌。
《计算机系统结构》期末考试复习题一、选择题:1、我们称由(B )实现的机器为虚拟机器。
A、硬件B、软件C、微程序D、固件2、计算机系统结构设计者所关心的是(C )所看到的的计算机结构。
A、硬件设计人员B、逻辑设计人员C、机器语言或汇编语言程序员D、高级语言程序员3、计算机组成是计算机系统结构的(B )。
A、硬件实现B、逻辑实现C、软件实现D、以上三种4、在计算机系统设计时,为了提高系统性能,应当注意(A )。
A、加快经常性使用指令的执行速度B、要特别精心设计少量功能强大的指令B、要减少在数量上占很小比例的指令的条数D、要加快少量指令的速度5、SIMD计算机可以处理(D )。
A、多指令流、单数据流B、单指令流单数据流C、多指令流多数据流D、单指令流多数据流6、在提高CPU性能的问题上,从系统结构角度,可以(C )。
A、提高时钟频率B、减少程序指令条数C、减少每条指令的时钟周期数D、减少程序指令条数和减少每条指令的时钟周期数7、冯.诺依曼计算机是(B )。
A、以存储器为中心B、以CPU为中心C、以处理输入/输出危重点D、以存储器与计算器为中心8、解决软件移植最好的办法就是(C )。
A、采用模拟方法B、采用仿真的方法C、采用统一高级语言D、采用统一标准设计计算机结构9、对计算机系统结构,下列透明的是(A )。
A、数据总线宽度B、浮点数表示C、CPU寄存器个数D、存储器的编址方法10、以下对系统程序员不透明的是(B )。
A、系列机各档不同的数据通路宽度B、虚拟存储器C、指令缓冲寄存器D、存储器读写缓冲寄存器11、在浮点数表示中,尾数的位数多少主要影响( B )。
A、表数范围B、表数精度C、表数效率D、运算实现容易程度12、当浮点数的尾数基值为(A )时,其表数效率最高(假如不考虑隐藏位)。
A、16B、8C、4D、213、当浮点数的尾数基值为( D )时,其表数精度最高,表数范围最大。
A、2B、8C、16D、2或414、当浮点数的尾数用原码表示,基值为2,阶码用移码表示,基值为2时,若尾数部分占23位(不含符号位),阶码占8位(含符号位),则表示的最大负数和最大正数分别为( C )。
第一章计算机网络体系结构一、单项选择1、计算机网络中可以没有的是___D___。
A 客户机B 服务器C 操作系统D 数据库管理系统2、下列说法正确的是____D__。
A 在较小范围内布置的一定是局域网,而在较大范围内布置的一定是广域网B 城域网是连接广域网而覆盖园区的网络C 城域网是为淘汰局域网和广域网而提出的一种网络技术D 局域网是基于广播技术发展起来的网络,广域网是基于交换技术发展起来的网络3、计算机网络最重要的功能是______。
A 数据通信B 资源共享C 节省费用D 提高可靠性4、局域网和广域网之间的差异不仅在于他们所能覆盖的范围不同,而且还在于他们的_____不同。
A 所使用的介质不同B 所使用的协议C 所支持的通信量D 所提供的服务5、下面的选项中,网格型网络的特点____。
A 不容易配置B 不太稳定C 扩展性不好D 容易发生故障6、相对于OSI的7层参考模型的低4层,TCP/IP模型内对应的层次有__B___。
A 传输层、互联网层、网络接口层和物理层B 传输层、互联网层、网络接口层C 传输层、互联网层、ATM层和物理层D传输层、网络层、数据链路层和物理层7、下述说法正确的是_____。
A 网络层的协议是网络层内部处理数据的规定B 接口实现的是人与计算机之间的交互C 在应用层与网落层之间的接口上交换的是包D 上一层的协议数据单元就是下一层的服务数据单元8、以下说法正确的是__B____。
A PDU的长度越大越好B PDU的长度越小越好C PDU的长度不要太大,但也不能太小D PDU的长度没有规定,可随便定9、在OSI参考模型中,表示层提供的功能是_____。
A 交互管理B 透明传输C 死锁管理D 文本压缩10、在OSI参考模型中,第n层与它之上的第n+1层的关系是______。
A 第n层为第n+1层提供服务B 第n+1层为从第n层接收的报文添加一个报头C 第n层使用第n+1层提供服务D 第n层和第n+1层提供服务互不影响11、在OSI参考模型中,自下而上第一个提供端到端服务的层次是_____。
1【简答题】传统的存储程序计算机的主要特征是什么?存在的主要问题是什么?目前计算机系统是如何改进的?正确答案:解:主要特征:(1)机器以运算器为中心;(2)采用存储程序原理;(3)存储器是按地址访问的、线性编址的空间;(4)控制流由指令流产生;(5)指令由操作码和地址码组成;(6)数据以二进制编码表示,采用二进制运算。
主要问题和改进:(1)问题:以运算器为中心,所有部件的操作都由控制器集中控制,导致慢速输入输出操作占用快速运算器矛盾,影响运算器效率发挥。
改进:各种分布式的I/O处理或输入输出方式如程序控制、DMA(直接存储器访问)方式、 I/O 处理机等。
(2)问题:数据和指令存放在同一存储器中,自我修改程序是难以编制、调试和使用的,不利于指令执行的重叠和流水。
改进:通过存储管理硬件的支持,由操作系统控制在程序执行过程中不准修改程序.(3)问题:访问存储器次数较多影响计算机系统性能。
改进:按内容访问的相联存储器CAM,大量使用通用寄存器,在CPU和主存之间设置高速缓冲存储器cache。
(4)问题:受程序计数器控制,程序执行只能串行、顺序执行.改进:改进CPU的组成,如采用重叠方式、先行控制、多操作部件甚至流水方式把若干条指令的操作重叠起来;采用向量处理技术、多机并行处理,总之通过并行处理技术进一步提升计算机系统速度。
(5)问题:需要指令功能更加丰富,但实现困难;计算机存储器容量大增,采用直接寻址方式指令中地址码位数不够.改进:出现了CISC和RISC指令系统,CISC用硬件实现大量丰富功能,RISC只包含使用频率高的少量指令;采用多种灵活的寻址方式,如间接寻址、相对寻址、变址寻址、基址寻址、页式寻址等。
2【简答题】通用寄存器型指令系统结构在灵活性和提高性能方面的优势主要体现在哪几个方面?正确答案:(1)寄存器的访问速度比存储器快很多;(2)对编译器而言,能更加容易、有效地分配和使用寄存器。
在表达式求值方面,通用寄存器型结构具有更大的灵活性和更高的效率。
《计算机体系结构》期末复习题答案系别_________ 班级_________ 姓名__________ 学号__________一、填空题(每空1分)1.按照弗林(Flynn)分类法,计算机系统可以分为4类:SISD计算机、(SIMD计算机)、(MISD计算机)和(MIMD计算机)。
2. 改进之后的冯•诺依曼计算机的只要特点是存储器为中心,总线结构,分散控制。
3. 当前计算机系统中的存储系统是一个层次结构,其各层分别为:(通用寄存器,高速缓存,主存,辅存,脱机大容量存储器)。
4.高速缓冲存储器的地址映象方式有三种,它们分别是:(全向量方式,直接相联方式,组相联方式)。
5.虚拟存储器的三种管理方式是(段式管理,页式管理和段页式管理)。
6.目前计算机中常用数据有(用户定义数据,系统数据和指令数据)三种类型。
7.通常可能出现的流水线的相关性有(资源相关,数据相关和控制相关)。
8.解决中断引起的流水线断流的方法有(不精确断点法和精确断点法)。
9.目前向量处理机的系统结构有两种:(存储器-存储器型和寄存器-寄存器型)。
10.通用计算机基本指令分为5类,它们分别是:(数据传送类,运算类,程序控制类,输入输出类,处理机控制和调试类)。
11.执行指令x1=x2+x3;x4=x1-x5会引起(RAW)类型的数据相关,执行指令x5=x4*x3;x4=x0+x6会引起(W AR)类型的数据相关,执行指令x6=x1+x2;x6=x4*x5会引起(WA W)类型的数据相关。
12.多计算机网络中,通常出现的4种通信模式是(单播模式,选播模式,广播模式和会议模式)。
13.传统的冯•诺依曼计算机是以控制驱动方式工作,以数据驱动方式工作的典型计算机是(数据流计算机),以需求驱动方式工作的典型计算机是(归约机),以模式匹配驱动方式工作的典型计算机是(人工智能计算机)。
二、名词解释(每题2分)1.计算机体系结构:计算机系统结构就是计算机的机器语言程序员或编译程序编写者所看到的外特性,是硬件子系统的概念结构及其功能特性。
二、填空题1、按照Flynn分类法,根据指令流和数据流的不同组织方式,计算机系统的结构可以分为SISD(单指令流单数据流)、MISD、MIMD或单指令流多数据流和多指令流多数据流。
2、Amdahl等人在1964年把系统结构定义为:由程序设计者所看到的一个计算机系统的属性,即概念性结构和功能特性。
3、指令系统是软件设计人员与硬件设计人员之间的一个主要分界面,也是他们之间互相沟通的一座桥梁。
在计算机系统的设计过程中,指令系统的设计是非常关键的,它必须由软件设计人员和硬件设计人员共同来完成。
4、实现程序移植的主要途径有统一高级语言、系列机、模拟和仿真。
5、系列机软件兼容必须做到向后兼容,尽可能争取向上兼容。
6、开发并行性是为了并行处理,并行性又包括有同时性和并发性二重含义。
7、浮点数尾数基值增大。
可使运算中的精度损失减小可表示数的精度变降低。
8、浮点数阶码位数影响数的可表示范围大小,尾数位数影响数的可表示精度大小。
9、设计指令系统时,在功能方面的基本要求是:指令系统的完整性、规整性、高效率和兼容性。
10、根据多台外围设备共享通道的不同情况,可将通道分为三种类型:字节多路通道、选择通道和数组多路通道。
11、输入输出设备的异步性、实时性、与设备无关性三个特点是现代计算机系统必须具备的共同特性。
12、评价存贮器性能的基本要求是大容量、高速度和低价格。
13、虚拟存贮器主要是为解决主存容量满足不了要求发展出来的。
14、Cache存贮器是为解决主存速度满足不了要求发展出来的。
15、虚拟存贮器是增加辅助软硬件。
使主、辅存形成整体,速度接近于主存的。
容量是辅存的。
16、Cache存贮器是增加辅助硬件,使之速度接近于Cache的,容量是__主_存的。
17、Cache存贮器对应用程序员是透明的。
对系统程序员是透明的(填“透明”或“不透明”)18、程序在时间上的局部性表现在,最近未来要用的信息可能就是现在正在使用的信息,这是因为程序中有存在着循环。
计算机系统构造复习1、从使用语言角度,可将系统按功能划分为多层次机器级构造,层次构造分别是:应用语言机器级、高级语言机器级、汇编语言机器级、操作系统机器级、传统机器语言机器级和微程序序机器级。
2、各机器级的实现主要靠翻译和解释或两者结合进展。
翻译是先用转换程序将高一级机器级上的程序整个地变换成低一级机器级上等效的程序,然后再在低一级机器级上实现的技术。
解释则是在低级机器上用它的一串语句或指令来仿真高级机器上的一条语句或指令的功能,是通过对高级的机器级语言程序中的每条语句或指令逐条解释来实现的技术。
3、计算机系统构造在计算机系统机器级层次中指传统机器级的系统构造。
4、计算机系统构造研究的是软、硬件之间的功能分配以及对传统机器级界面确实定,提供机器语言、汇编语言程序设计或编译程序生成系统为使其设计或生成的程序能在机器上正确运行应看到的遵循的计算机属性。
5、计算机系统构造的属性包括:数据表示、寻址方式、存放器组织、指令系统、存储系统组织、中断机构、系统机器级的管态和用户态的定义和切换、机器级的I/O构造、系统各局部的信息保护方式和保护机构等属性。
6、机器透明性:指相对于每一机器级设计人员,都客观存在的功能或属性看不到的现象,称相对于此级设计人员来说,这此功能或属性是具有透明性,即透明的。
7、计算机组成指的是计算机系统构造的逻辑实现,包括机器级部的数据流和控制流的组成以及逻辑设计等。
它着眼于机器级部各事件的排序方式与控制机构、各部件的功能及各部件间的联系。
8、计算机组成设计要解决的问题是在所希望到达的性能和价格下,怎样更好、更合理地把各种设备各部件组织成计算机,来实现所确定的系统构造。
9、当前,计算机组成设计主要是围绕提高速度,着重从提高操作的并行度、重叠度,以及功能的分散和设置专用功能部件来进展的。
10、计算机组成设计要确定的方面一般应包括:数据通路宽路、专用部件的设置、各种操作对部件的共享程度、功能部件的并行度、控制机构的组成方式、缓冲和排队技术、预估预判技术、可靠性技术等。
计算机106 计算机系统结构复习题一、选择题1.Cache存储器写操作时,只写入Cache,仅当需要块替换时,才将其写回主存,称这种修改主存块内容的方法为___写回法_______。
2.仿真和模拟的主要区别在于采用不同的语言进行解释。
仿真采用___________解释,其解释程序在控制存储器中,而模拟采用机器语言程序解释,其解释程序在___________中。
3.16个处理器编号为0~15,采用PM2+3单级网络互连,与13号处理器相连的处理器号是( 利用公式计算机一下。
)A.5 B.7 C.11 D.144.在共享主存的多处理机中,为减少访问主存冲突,采用的方式一般是( )A.虚拟存储器B.共享Cache存储器C.用高速单体主存系统D.并行多体交叉主存系统5.7.下列关于标量流水机的说法不正确的是( )A.没有向量数据表示 B.不能对向量数据进行运算C.可对标量数据进行流水处理 D.可以对向量、数组进行运算6.广义地讲, F. 有着两种含义:一是 G. ,指两个以上事件在 A. 发生;二是 H. ,指两个以上事件在 C. 间隔内发生。
A. 同一时刻B. 不同时刻C. 同一时间D. 不同时间E. 串行性F. 并行性G. 同时性H. 并发性7.页式虚拟存储管理中,实页冲突概率最低的地址映象方式是( )A.直接映象B.全相联映象C.组相联映象D.段相联映象8.组相联映象、LRU替换的Cache存储器,不影响Cache命中率的是( )A.增大块的大小B.增大主存容量C.增大组的大小 D.增加Cache中的块数9.不同系列的机器之间,实现软件移植的途径不包括()A.模拟 B.仿真C.用统一汇编语言D.用统一高级语言10.采用地址码高位交叉的目的是()。
A. 扩大存储器的容量B. 提高存储器的速度C. 缩小存储器的容量D. 减小存储器的速度11.超标量处理机主要是采用()来开发处理机内部的并行性的。
A. 空间B. 重叠C.资源重复D. 时间重叠12.在下列内容中,对系统程序员和应用程序员都透明的是()。
1.7 将计算机系统中某一功能的处理速度加快10倍,但该功能的处理时间仅为整个系统运行时间的40%,则采用此增强功能方法后,能使整个系统的性能提高多少?解由题可知:可改进比例= 40% = 0.4 部件加速比= 10根据Amdahl定律可知:采用此增强功能方法后,能使整个系统的性能提高到原来的1.5625倍。
1.8 计算机系统中有三个部件可以改进,这三个部件的部件加速比为:部件加速比1=30;部件加速比2=20;部件加速比3=10(1)如果部件1和部件2的可改进比例均为30%,那么当部件3的可改进比例为多少时,系统加速比才可以达到10?(2)如果三个部件的可改进比例分别为30%、30%和20%,三个部件同时改进,那么系统中不可加速部分的执行时间在总执行时间中占的比例是多少?解:(1)在多个部件可改进情况下,Amdahl定理的扩展:已知S1=30,S2=20,S3=10,S n=10,F1=0.3,F2=0.3,得:得F3=0.36,即部件3的可改进比例为36%。
(2)设系统改进前的执行时间为T,则3个部件改进前的执行时间为:(0.3+0.3+0.2)T = 0.8T,不可改进部分的执行时间为0.2T。
已知3个部件改进后的加速比分别为S1=30,S2=20,S3=10,因此3个部件改进后的执行时间为:改进后整个系统的执行时间为:Tn = 0.045T+0.2T = 0.245T那么系统中不可改进部分的执行时间在总执行时间中占的比例是:3.4 设一条指令的执行过程分成取指令、分析指令和执行指令三个阶段,每个阶段所需的时间分别为△t、△t和2△t 。
分别求出下列各种情况下,连续执行N条指令所需的时间。
(1)顺序执行方式;(2)只有“取指令”与“执行指令”重叠;(3)“取指令”、“分析指令”与“执行指令”重叠。
解:(1)每条指令的执行时间为:△t+△t+2△t=4△t连续执行N条指令所需的时间为:4N△t(2)连续执行N条指令所需的时间为:4△t+3(N-1)△t=(3N+1)△t(3)连续执行N条指令所需的时间为:4△t+2(N-1)△t=(2N+2)△t4.2 简述Tomasulo算法的基本思想。
答:核心思想是:①记录和检测指令相关,操作数一旦就绪就立即执行,把发生RAW 冲突的可能性减小到最少;②通过寄存器换名来消除W AR冲突和W AW冲突。
寄存器换名是通过保留站来实现,它保存等待流出和正在流出指令所需要的操作数。
基本思想:只要操作数有效,就将其取到保留站,避免指令流出时才到寄存器中取数据,这就使得即将执行的指令从相应的保留站中取得操作数,而不是从寄存器中。
指令的执行结果也是直接送到等待数据的其它保留站中去。
因而,对于连续的寄存器写,只有最后一个才真正更新寄存器中的内容。
一条指令流出时,存放操作数的寄存器名被换成为对应于该寄存器保留站的名称(编号)。
☐Consider a program with the given characteristics⏹Instruction count (I-Count) = 106 instructions⏹30% of instructions are loads and stores⏹D-cache miss rate is 5% and I-cache miss rate is 1%⏹Miss penalty is 100 clock cycles for instruction anddata caches⏹Compute combined misses per instruction and memorystall cycles☐Combined misses per instruction in I-Cache and D-Cache⏹1% + 30% ⨯5% = 0.025 combined misses per instruction⏹Equal to 25 misses per 1000 instructions☐Memory stall cycles⏹0.025 ⨯ 100 (miss penalty) = 2.5 stall cycles perinstruction⏹Total memory stall cycles = 106⨯ 2.5 = 2,500,000 CPI with Memory Stalls☐ A processor has CPI of 1.5 without any memory stalls⏹Cache miss rate is 2% for instruction and 5% fordata⏹20% of instructions are loads and stores⏹Cache miss penalty is 100 clock cycles for I-cacheand D-cache☐What is the impact on the CPI?☐Answer:Mem Stalls per Instruction =0.02×100 + 0.2×0.05×100 = 3CPIMemoryStalls=1.5 + 3 = 4.5 cycles per instructionCPIMemoryStalls / CPIPerfectCache=4.5 / 1.5 = 3Processor is 3 times slower due to memory stall cyclesCPINoCache=1.5 + (1 + 0.2) × 100 = 121.5 (a lot worse)3.13有一个流水线由4段组成,其中每当流经第3段时,总要在该段循环一次,然后才能流到第4段。
如果每段经过一次所需要的时间都是,问:t∆(1) 当在流水线的输入端连续地每时间输入任务时,该流水线会发生什么情况?(2) 此流水线的最大吞吐率为多少?如果每输入一个任务,连续处理10个任务时的实际吞吐率和效率是多少?(3) 当每段时间不变时,如何提高该流水线的吞吐率?仍连续处理10个任务时,其吞吐率提高多少?解:(1)会发生流水线阻塞情况。
(3)重复设置部件吞吐率提高倍数=t t ∆∆231075=1.643.17 现有一条段数为4的流水线,无条件分支在第二个时钟周期结束时就被解析出来,而条件分支要到第三个时钟周期结束时才能够被解析出来。
第一个流水段是完全独立于指令类型的,即所有类型的指令都必须经过第一个流水段的处理。
请问在没有任何控制相关的情况下,该流水线相对于存在上述控制相关情况下的加速比是多少?解:没有控制相关时流水线的平均CPI =1存在控制相关时:由于无条件分支在第二个时钟周期结束时就被解析出来,而条件分支要到第3个时钟周期结束时才能被解析出来。
所以:(1)若使用排空流水线的策略,则对于条件分支,有两个额外的stall ,对无条件分支,有一个额外的stall :CPI = 1+20%*2+5%*1 = 1.45加速比S=CPI/1 = 1.45(2) 若使用预测分支成功策略,则对于不成功的条件分支,有两个额外的stall ,对无条件分支和成功的条件分支,有一个额外的stall 1:CPI = 1+20%*(60%*1+40%*2) +5%*1 = 1.33加速比S=CPI/1 = 1.33(3)若使用预测分支失败策略,则对于成功的条件分支,有两个额外的stall ;对无条件分支,有一个额外的stall ;对不成功的条件分支,其目标地址已经由PC 值给出,不必等待,所以无延迟:CPI = 1+20%*(60%*2 + 40%*0) +5%*1 = 1.29加速比S=CPI/1 = 1.294.4 假设有一条长流水线,仅仅对条件转移指令使用分支目标缓冲。
假设分支预测错误的开销为4个时钟周期,缓冲不命中的开销为3个时钟周期。
假设:命中率为90%,预测精度为90%,分支频率为15%,没有分支的基本CPI 为1。
(1) 求程序执行的CPI 。
(2) 相对于采用固定的2个时钟周期延迟的分支处理,哪种方法程序执行速度更快?解:(1)程序执行的CPI = 没有分支的基本CPI (1) + 分支带来的额外开销t ∆t ∆2分支带来的额外开销是指在分支指令中,缓冲命中但预测错误带来的开销与缓冲没有命中带来的开销之和。
分支带来的额外开销= 15% * (90%命中×10%预测错误×4 + 10%没命中×3)= 0.099所以,程序执行的CPI =1 +0.099 = 1.099(2)采用固定的2 个时钟周期延迟的分支处理CPI = 1 + 15%×2 = 1.3由(1)(2)可知分支目标缓冲方法执行速度快。
4.9 设指令流水线由取指令、分析指令和执行指令3个部件构成,每个部件经过的时间为△t,连续流入12条指令。
分别画出标量流水处理机以及ILP均为4的超标量处理机、超长指令字处理机、超流水处理机的时空图,并分别计算它们相对于标量流水处理机的加速比。
解:标量流水处理机的时空图:执行完12条指令需T1=14△t。
超标量流水处理机与超长指令字处理机的时空图:超标量流水处理机中,每一个时钟周期同时启动4条指令。
执行完12条指令需T2=5△t,相对于标量流水处理机的加速比为:超长指令字处理机中,每4条指令组成一条长指令,共形成3条长指令。
执行完12条指令需T3=5△t,相对于标量流水处理机的加速比为:超流水处理机的时空图:超流水处理机中,每1/4个时钟周期启动一条指令。
执行完12条指令需T4=5.75△t,相对于标量流水处理机的加速比为:4、(10分)假定我们有一台计算机,如果所有的cache访问都命中的话,它的CPI是2.0。
唯一的数据访问指令是store和load,它们占指令总数的40%,不命中损失是25个时钟周期,不命中率是2%。
如果所有的指令访问cache都命中的话,那么机器的速度是存在cache不命中时的多少倍?首先计算所有cache访问都命中时计算机的性能:CPU执行时间=(CPU时钟周期+内存停机周期)×时钟周期时长=(IC×CPI+0)×时钟周期时长= IC×2.0×时钟周期时长现在计算考虑cache不命中在内的真实计算机性能,我们先计算内存停机周期:内存停机周期=IC×每条指令访问内存的次数×不命中率×不命中损失=IC×(1+0.4)×0.02×25=IC×0.7其中(1+0.4)代表每条指令访问一次内存,而占指令总数40%的store和load 访问两次内存,所以平均每条指令访问访问(1+0.4)次内存。