计算机系统结构第8章_多计算机系统
- 格式:ppt
- 大小:448.50 KB
- 文档页数:54
中国海洋大学计算机系统结构课程大纲(理论课程)中国海洋大学计算机系统结构课程大纲(理论课程)英文名称Computer Architecture【开课单位】计算机科学与技术系【课程模块】学科基础【课程编号】【课程类别】选修【学时数】 48 (理论实践 ) 【学分数】 3一、课程描述本课程大纲根据2011年本科人才培养方案进行修订或制定。
(一)教学对象计算机科学与技术专业大学三年级学生(二)教学目标及修读要求1、教学目标(课程结束后学生在知识、技能和态度三个层面达到的目标) 本课程的结束后,学生应掌握计算机系统结构的基本概念、基本原理、基本结构和基本分析方法,初步了解和掌握几种高性能计算机系统的架构;初步具备计算机系统的架构分析能力,初步具备计算机系统性能的评测技能;对现有的主流计算机系统能有一个比较全面的了解,开阔眼界和思路,为今后进一步的学习、研究和工作奠定基础。
2、修读要求(简要说明课程的性质,与其他专业课程群的关系,学生应具备的基本专业素质和技能等)本课程是一门专业理论课。
由于计算机系统是一个复杂的系统,在学生已经学习了“计算机组成原理”、“计算机操作系统”、“汇编语言程序设计”、“高级语言程序设计”等计算机硬件和软件方面的多门课程之后,通过学习“计算机系统结构”这门课程才能够建立起计算机系统的完整概念。
(三)先修课程(参照2011版人才培养方案中的课程名称,课程名称要准确) 先修课程:“高级语言程序设计”;“计算机组成原理”;“操作系统”。
二、教学内容(一)第1章计算机系统结构的基本概念1、主要内容:1.1 计算机系统结构1.2 计算机系统设计技术1.3 系统结构的评价标准1.4 计算机系统结构的发展2、教学要求:(按照掌握、理解、了解三个层次对学生学习提出要求)掌握计算机系统层次结构,计算机系统结构、计算机组成、计算机实现定义及三者之间的关系,透明性概念,Amdahl定律,CPU性能公式,局部性原理,MIPS 定义,MFLOPS定义,计算机系统结构的分类;理解计算机系统设计方法,系统结构的评价标准;了解冯?诺依曼计算机特征,计算机系统结构的发展,价格、软件、应用、VLSI和算法对系统结构的影响。
第8章CPU的结构和功能例8.1假设指令流水线分取指(IF)、译码(ID)、执行(EX)、回写(WR)四个过程段,共有10条指令连续输入此流水线。
(1)画出指令周期流程。
(2)画出非流水线时空图。
(3)画出流水线时空图。
(4)假设时钟周期为100ns,求流水线的实际吞吐率。
(5)求该流水处理器的加速比。
解:(1)根据指令周期包括IF、ID、EX、WR四个子过程,图8.1(a)为指令周期流程图。
(2)非流水线时空图如图8.1(b)所示。
假设一个时间单位为一个时钟周期,则每隔4个时钟周期才有一个输出结果。
(3)流水线时空图如图8.1(c)所示。
由图可见,第一条指令出结果需要4个时钟周期。
当流水线满载时,以后每一个时钟周期可以出一个结果,即执行完一条指令。
(a)指令周期流程(b) 非流水线时空图(c) 标准流水线时空图图8.1 例8.1答图(4)由图8.1(c)所示的10条指令进入流水线的时空图可见,在13个时钟周期结束时,CPU执行完10条指令,故实际吞吐率为:10/(100ns×13) ≈ 0.77×107条指令/秒(5)在流水处理器中,当任务饱满时,指令不断输入流水线,不论是几级流水线,每隔一个时钟周期都输出一个结果。
对于本题四级流水线而言,处理10条指令所需的时钟周期数为T4 = 4 +(10 −1)= 13。
而非流水线处理10条指令需4×10 = 40个时钟周期。
故该流水处理器的加速比为40 ÷13 ≈ 3.08 例8.2设某机有四个中断源1、2、3、4,其硬件排队优先次序按1→2→3→4降序排列,各中断源的服务程序中所对应的屏蔽字如表8.1所示。
表8.1 例8.2各中断源对应的屏蔽字中断源 屏蔽字1 2 3 41 1 1 0 12 0 1 0 03 1 1 1 14 0 1 0 1(1)给出上述四个中断源的中断处理次序。
(2)若四个中断源同时有中断请求,画出CPU执行程序的轨迹。
word 文档下载后可自由复制编辑你计算机系统结构清华第 2 版习题解答word 文档下载后可自由复制编辑1 目录1.1 第一章(P33)1.7-1.9 (透明性概念),1.12-1.18 (Amdahl定律),1.19、1.21 、1.24 (CPI/MIPS)1.2 第二章(P124)2.3 、2.5 、2.6 (浮点数性能),2.13 、2.15 (指令编码)1.3 第三章(P202)3.3 (存储层次性能), 3.5 (并行主存系统),3.15-3.15 加 1 题(堆栈模拟),3.19 中(3)(4)(6)(8)问(地址映象/ 替换算法-- 实存状况图)word 文档下载后可自由复制编辑1.4 第四章(P250)4.5 (中断屏蔽字表/中断过程示意图),4.8 (通道流量计算/通道时间图)1.5 第五章(P343)5.9 (流水线性能/ 时空图),5.15 (2种调度算法)1.6 第六章(P391)6.6 (向量流水时间计算),6.10 (Amdahl定律/MFLOPS)1.7 第七章(P446)7.3 、7.29(互连函数计算),7.6-7.14 (互连网性质),7.4 、7.5 、7.26(多级网寻径算法),word 文档下载后可自由复制编辑7.27 (寻径/ 选播算法)1.8 第八章(P498)8.12 ( SISD/SIMD 算法)1.9 第九章(P562)9.18 ( SISD/多功能部件/SIMD/MIMD 算法)(注:每章可选1-2 个主要知识点,每个知识点可只选 1 题。
有下划线者为推荐的主要知识点。
)word 文档 下载后可自由复制编辑2 例 , 习题2.1 第一章 (P33)例 1.1,p10假设将某系统的某一部件的处理速度加快到 10倍 ,但该部件的原处理时间仅为整个运行时间的40%,则采用加快措施后能使整个系统的性能提高多少?解:由题意可知: Fe=0.4, Se=10,根据 Amdahl 定律S n To T n1 (1Fe )S n 1 10.6 0.4100.64 Fe Se 1.56word 文档 下载后可自由复制编辑例 1.2,p10采用哪种实现技术来求浮点数平方根 FPSQR 的操作对系统的性能影响较大。
计算机系统结构:第一章基本概念填空题、选择题复习:1、从使用语言角度,系统按功能划分层次结构由低到高分别为:微程序机器M0、传统机器M1、操作系统机器M2、汇编语言机器M3、高级语言机器M4、应用语言机器M5.2、计算机系统的设计思路:“从中间开始”设计的“中间”是指层次结构中的软硬件交界面,目前多数在传统机器语言机器级与操作系统机器级之间。
3、翻译与解释的区别与联系:区别:翻译是整个程序转换,解释是低级机器的一串语句仿真高级机器的一条语句;联系:都是高级机器程序在低级机器上执行的必须步骤。
4、模拟与仿真的区别:模拟:用机器语言解释实现软件移植的方法,解释的语言存在主存中;仿真用微程序解释,存储在控制存储器中。
5、解决好软件的可移植性方法有统一高级语言、采用系列机、模拟与仿真。
6、系列机必须保证向后兼容,力争向上兼容。
7、非用户片也称通用片,其功能是由器件厂生产时定死的,器件的用户只能用,不能改;现场片,用户根据需要改变器件内部功能;用户片是专门按用户的要求生产高集成度VLSI器件,完全按用户的要求设计的用户片称为全用户片。
一般同一系列内各档机器可分别用通用片、现场片或用户片实现。
8、计算机应用可归纳为向上升级的4类:数据处理、信息处理、知识处理、智能处理。
9、并行性开发的途径有:时间重叠、资源重复和资源共享。
10、并行性是指:同一时刻或同一时间间隔内完成两种或两种以上性质相同或不同的工作,并行性包含同时性和并发性二重含义。
11、科学计算中的重大挑战性课题往往要求计算机系统能有1TFLOPS的计算能力、1TBYTE 的主存容量、1TBYTE/S的I/O带宽。
12、并行处理计算机的结构:流水线计算机——时间重叠,阵列处理机——资源重复,多处理机——资源共享。
13、多机系统分多处理机系统和多计算机系统,多处理机系统:多台处理机组成的单一系统,多计算机系统:多台独立的计算机组成的系统。
14、多机系统的耦合度可以分为最低耦合、松散耦合和紧密耦合。
计算机体系结构各章简答题及答案第⼀章计算机体系结构的基本概念1. 什么是计算机系统的多级层次结构?2. 硬件和软件在什么意义上是等效的在什么意义上是不等效的?3. 经典计算机系统结构的实质是什么?4. 语⾔实现的两种基本技术是什么?5. 对于通⽤寄存器型机器来说,机器语⾔程序设计者所看到的计算机的属性主要有哪些?6. 什么是软件兼容软件兼容有⼏种其中哪⼀种是软件兼容的根本特征?7. 什么是系列机它的出现较好地解决了什么⽭盾?8. 对计算机发展⾮常关键的实现技术有哪些?9. 实现软件移植的主要途径有哪些?10. 试以系列机为例,说明计算机系统结构、计算机组成和计算机实现三者之间的关系。
11. 存储程序计算机在系统结构上的主要特点是什么?12. 从系统结构的发展情况看,新型系统结构的设计主要从哪两⽅⾯着⼿?13. 软件技术两个最重要的发展趋势是什么?14. 计算机系统设计⼈员的技术挑战主要来⾃哪⼏个⽅⾯?15. ⼀种计算机系统结构的⽣命周期是怎样的?16. 商品的标价(价格)由哪些因素构成?17. 对计算机系统成本产⽣影响的主要因素有哪些?18. ⽤户CPU时间由哪三个因素决定?19. ⽬前常⽤的测试程序分为哪五类?20. 什么叫测试程序组件在评价计算机系统设计时最常见的测试程序组件是哪个?21. SPEC2000测试程序组件中包括哪⼏个测试程序组件?22. 测试基于Microsoft公司的Windows系列操作系统平台的最常⽤测试组件有哪些?23. 常⽤的专门的性能指标测试程序有哪些?24. 计算机系统结构设计和分析中最经常使⽤的三条基本原则是什么25. 根据Amdahl定律,系统加速⽐由哪两个因素决定?26. 从执⾏程序的⾓度看,并⾏性等级从低到⾼可分为哪⼏级?27. 从处理数据的⾓度,并⾏性等级从低到⾼可以分为哪⼏级?28. 计算机系统中提⾼并⾏性的技术途径有哪三种?29. 多机系统的耦合度可以分为哪⼏类?30. 单机系统和多机系统中,都是按哪三种技术途径分别发展为哪三类多处理机?31. 三种类型的多处理机(同构型多处理机、异构型多处理机、分布处理系统)的主要区别是什么1. 什么是计算机系统的多级层次结构从计算机语⾔的⾓度,把计算机系统按功能划分成以下多级层次结构:2. 硬件和软件在什么意义上是等效的在什么意义上是不等效的硬件和软件在功能实现上是等效的,即⼀种功能可以由软件实现,也可以由硬件实现。
念1.1计算机系统的多级层次结构1.2计算机系统结构、组成与实现1.2.1结构、组成、实现的定义与内涵1.2.2计算机系统结构、组成和实现三者的相互影响1.3软硬件取舍与计算机系统设计思路1.3.1软硬件取舍的基本原则1.3.2计算机系统的设计思路1.4结构设计要解决好软件的可移植性1.4.1统一高级语言1.4.2采用系列机1.4.3模拟与仿真1.5应用与器件的发展对系统结构的影响1.5.1应用的发展对系统结构的影响1.5.2器件的发展对系统结构的影响1.6系统结构中的并行性发展及计算机系统的分类1.6.1并行性概念1.6.2并行处理系统的结构与多机系统的耦合度1.6.3计算机系统的分类第2章数据表示与指令系统2.1数据表示2.1.1数据表示与数据结构2.1.2高级数据表示2.1.3引入数据表示的原则2.1.4浮点数尾数基值大小和下溢处理方法的选择2.2寻址方式2.2.1寻址方式分析2.2.2逻辑地址与主存物理地址2.3指令格式的优化设计2.3.1操作码的优化2.3.2指令字格式的优化2.4按CISC方向发展与改进指令系统2.4.1面向目标程序优化实现改进2.4.2面向高级语言优化实现改进2.4.3面向操作系统优化实现改进2.5按RISC方向发展与改进指令系统2.5.1 RISC的提出2.5.2设计RISC的原则2.5.3设计RISC结构用的基本技术2.5.4 RISC技术的发展第3章总线、中断与输入输出系统3.1输入输出系统的基本概念3.2总线设计3.2.1总线的类型3.2.2总线的控制方式3.2.3总线的通讯技术3.2.4数据宽度与总线线数3.3中断系统3.3.1中断的分类和分级3.3.2中断系统的软硬件功能分配3.4通道处理机3.4.1工作原理3.4.2通道流量的分析第4章存储体系4.1存储体系概念与并行主存系统4.1.1发展存储体系的必要性4.1.2并行主存系统频宽的分析4.1.3存储体系的形成与分支4.1.4存储体系的性能参数4.2虚拟存储器4.2.1不同的虚拟存储管理方式4.2.2页式虚拟存储器的构成4.2.3页式虚拟存储器实现中的问题4.3高速缓冲(Cache)存储器4.3.1基本结构4.3.2地址的映象与变换4.3.3替换算法的实现4.3.4 Cache存储器的透明性及性能分析第5章重叠、流水和向量处理机5.1重叠方式5.1.1基本思想和一次重叠5.1.2相关处理5.2流水方式5.2.1基本概念5.2.2流水线处理机的主要性能5.2.3流水机器的相关处理和控制机构5.3向量的流水处理与向量流水处理机5.3.1向量的流水处理5.3.2向量流水处理机5.4指令级高度并行的超级处理机5.4.1超标量处理机5.4.2超长指令字(VLIW)处理机5.4.3超流水线处理机第6章阵列处理机6.1阵列处理机原理6.1.1阵列处理机的基本构形6.1.2阵列处理机的特点6.2阵列处理机的并行算法6.2.1 ILLIACⅣ的处理单元阵列结构6.2.2阵列处理机的并行算法举例6.3 SIMD计算机的互连网络6.3.1互连网络的设计目标及互连函数6.3.2基本的单级互连网络6.3.3多级互连网络6.4并行存储器的无冲突访问6.5并行处理机举例6.5.1 MPP位平面阵列处理机6.5.2 CM连接机第7章多处理机7.1多处理机的特点及主要技术问题7.2多处理机的硬件结构7.2.1紧耦合和松耦合7.2.2机间互连形式7.3程序并行性7.3.1并行算法7.3.2程序并行性的分析7.3.3并行程序设计语言7.4多处理机的性能7.4.1任务粒度与系统性能7.4.2性能模型与分析7.5多处理机的操作系统7.5.1主从型操作系统7.5.2各自独立型操作系统7.5.3浮动型操作系统第8章其它计算机结构8.1脉动阵列机8.1.1脉动阵列结构的原理和特点8.1.2通用的脉动阵列结构8.2大规模并行处理机MPP与机群系统8.2.1大规模并行处理机MPP8.2.2机群系统8.3数据流机8.3.1数据驱动的概念8.3.2数据流程序图和语言8.3.3数据流计算机的结构8.3.4数据流机器存在的问题8.4归约机8.5智能机8.5.1智能信息处理与智能机正的实处理机代替虚拟机器;可以增加存储寄存器组织、指令系统、存储系统组织、中断系统、管态目态定义与转换、逐级往以上方法存在的问题是软、硬件脱语义同一语言在不同机器上不通用;程序员的习惯但到一定时还可采用模拟仿困难;重新设计软件经济上不划处理单络设计,数据在存储器中的分布算进程间的同步间调度。
第一章1.6 某台主频为400MHz 的计算机执行标准测试程序,程序中指令类型、执行数量和平均时钟周期数如下:求该计算机的有效CPI 、MIPS 和程序执行时间。
解:(1)CPI =(45000×1+75000×2+8000×4+1500×2) / 129500=1.776 (或259460) (2)MIPS 速率=f/ CPI =400/1.776 =225.225MIPS (或2595180MIPS) (3)程序执行时间= (45000×1+75000×2+8000×4+1500×2)/400=575μs1.9 假设某应用程序中有4类操作,通过改进,各操作获得不同的性能提高。
具体数据(1)改进后,各类操作的加速比分别是多少?(2)各类操作单独改进后,程序获得的加速比分别是多少? (3)4类操作均改进后,整个程序的加速比是多少? 解:根据Amdahl 定律SeFeFe S n +-=)1(1可得4类操作均改进后,整个程序的加速比:2.16)1(1≈+-=∑∑iii n S F F S1.10 第二章变长编码,哈夫曼编码第三章3.12 有一条指令流水线如下所示:(1)求连续输入10条指令的情况下,该流水线的实际吞吐率和效率。
(2)该流水线的瓶颈在哪一段?请采用两种不同的措施消除此瓶颈。
对于你所给出的两种新的流水线,连续输入10条指令时,其实际吞吐率和效率各是多少? 解:(1)本题主要考察对各功能段用时不等的线性流水线的性能计算公式的掌握情况。
2200(ns)2009200)10050(50t n t T maxki i =⨯++++=∆-+∆=∑=)1(1流水 )(ns 2201T nTP 1-==流水45.45%1154400TP ktTP E k1i i≈=⋅=∆⋅=∑= 注意:对于公式不能死记硬背,需要充分理解,注意公式的适用条件。