流水线CPU技术讲解

格式：ppt
大小：2.08 MB
文档页数：85

下载文档原格式

计算机流水线（Pipeline）技术

计算机流⽔线（Pipeline）技术流⽔线是现代RISC核⼼的⼀个重要设计，它极⼤地提⾼了性能。

对于⼀条具体的指令执⾏过程，通常可以分为五个部分：取指令，指令译码，取操作数，运算（ALU），写结果。

其中前三步⼀般由指令控制器完成，后两步则由运算器完成。

按照传统的⽅式，所有指令顺序执⾏，那么先是指令控制器⼯作，完成第⼀条指令的前三步，然后运算器⼯作，完成后两步，在指令控制器⼯作，完成第⼆条指令的前三步，在是运算器，完成第⼆条指令的后两部……很明显，当指令控制器⼯作是运算器基本上在休息，⽽当运算器在⼯作时指令控制器却在休息，造成了相当⼤的资源浪费。

解决⽅法很容易想到，当指令控制器完成了第⼀条指令的前三步后，直接开始第⼆条指令的操作，运算单元也是。

这样就形成了流⽔线系统，这是⼀条2级流⽔线。

如果是⼀个超标量系统，假设有三个指令控制单元和两个运算单元，那么就可以在完成了第⼀条指令的取址⼯作后直接开始第⼆条指令的取址，这时第⼀条指令在进⾏译码，然后第三条指令取址，第⼆条指令译码，第⼀条指令取操作数……这样就是⼀个5级流⽔线。

很显然，5级流⽔线的平均理论速度是不⽤流⽔线的4倍。

流⽔线系统最⼤限度地利⽤了CPU资源，使每个部件在每个时钟周期都⼯作，⼤⼤提⾼了效率。

但是，流⽔线有两个⾮常⼤的问题：相关和转移。

在⼀个流⽔线系统中，如果第⼆条指令需要⽤到第⼀条指令的结果，这种情况叫做相关。

以上⾯哪个5级流⽔线为例，当第⼆条指令需要取操作数时，第⼀条指令的运算还没有完成，如果这时第⼆条指令就去取操作数，就会得到错误的结果。

所以，这时整条流⽔线不得不停顿下来，等待第⼀条指令的完成。

这是很讨厌的问题，特别是对于⽐较长的流⽔线，⽐如20级，这种停顿通常要损失⼗⼏个时钟周期。

⽬前解决这个问题的⽅法是乱序执⾏。

乱序执⾏的原理是在两条相关指令中插⼊不相关的指令，使整条流⽔线顺畅。

⽐如上⾯的例⼦中，开始执⾏第⼀条指令后直接开始执⾏第三条指令（假设第三条指令不相关），然后才开始执⾏第⼆条指令，这样当第⼆条指令需要取操作数时第⼀条指令刚好完成，⽽且第三条指令也快要完成了，整条流⽔线不会停顿。

Intel系列CPU流水线技术的发展与展望

Intel系列CPU流水线技术的发展与展望流水线技术是指在程序执行时多条指令重叠进行操作的一种准并行处理实现技术。

在计算机中，把一个重复的过程分解为若干子过程，每个子过程由专门的功能部件来实现。

将多个处理过程在时间上错开，依次通过各功能段，这样，每个子过程就可以与其他子过程并行进行。

其中，流水线中的每个子过程及其功能部件称为流水线的级或段，段与段相互连接形成流水线。

流水线的段数称为流水线的深度。

把流水线技术应用于指令的解释执行过程，就形成了指令流水线。

其中可以把指令的执行过程分为取指令、译码、执行、存结果4个子过程。

把流水线技术应用于运算的执行过程，就形成了运算操作流水线，也称为部件级流水线。

Inter Pentium 系列中采用的流水线技术流水线技术早在Intel的X86芯片中均得到了实现。

而Pentium系列CPU产品更是一个高级的超标量处理器。

奔腾处理器可以在一个时钟周期内完成两条指令，一个流水线完成一条指令。

具有MMX技术的奔腾处理器为整型流水线增加了一个额外的处理阶段。

在486芯片中，一条指令一般被划分为五个标准的部分，奔腾亦是如此，而在P6中，由于采用了近似于RISC的技术，一条指令被划分成了创纪录的十四个阶段，这极大地提高了流水线的速度。

P6系列处理器使用动态执行结构，该结构通过硬件寄存器重命名和分支预测的方法，将乱序执行和推测执行合成在一起。

奔腾Ⅲ处理器使用了P6中的动态执行技术，增加了超标量双流水线结构、分支预测技术、通过乱序来优化指令流水线、将指令划分为更细的阶段。

而奔腾Ⅳ新增的技术有使用高级动态执行、执行跟踪缓存、快速执行引擎、超长管道处理技术、超线程技术。

它基本的指令流水线长度达到了20级，更长的流水线可以使处理器运行在更高的主频下，从而提高处理器的性能，但有可能带来一些指令执行上的延迟。

提高流水线性能的方法及相关技术从不同的角度和观点，可以把流水线分成多种不同的种类。

按照流水线所完成的功能来分，可以分为单功能流水线和多功能流水线。

第8章中央处理器-流水线CPU

Load Ifetch Reg/Dec Exec Mem Wr
R-type Ifetch Reg/Dec Exec Wr
R-type Ifetch Reg/Dec Exec Wr
°上述流水线有个问题: 两条指令试图同时写寄存器，因为
• Load在第5阶段用寄存器写口 • R-type在第4 阶段用寄存器写口
• 每个周期有五个功能部件同时在工作 • 后面指令在前面完成取指后马上开始 • 每个load指令仍然需要五个周期完成 • 但是，吞吐率(throughput)提高许多，理想情况下，有：
• 每个周期有一条指令进入流水线 • 每个周期都有一条指令完成 • 每条指令的有效周期(CPI)为1
含R-type和 Load 指令的流水线
这样使流水线中的每条指令都有相同多个阶段!
Store指令的四个阶段
Cycle 1 Cycle 2 Cycle 3 Cycle 4 Store Ifetch Reg/Dec Exec Mem Wr
NOOP!
°Ifetch：取指令并计算PC+4 °Reg/Dec：从寄存器取数，同时指令在译码器进行译码 °Exec：12位立即数符号扩展后与寄存器值相加，计算主存地址 °Mem：将寄存器读出的数据写到主存
Delay through Control Logic New Value
PC+4 PC
Old Value
New Value
Old Value
New Value
Old Value Old Value
New Value New Value
Register Write Occurs
Old Value
Register File Access Time New Value

中央处理器CPU——指令流水线

中央处理器CPU——指令流⽔线指令流⽔线概念：⼀条指令的执⾏过程划分为不同阶段，占⽤不同硬件资源，多条指令重叠操作实现并⾏处理1.顺序执⾏：⼜称串⾏执⾏⽅式；传统的冯诺依曼机器优点:控制简单，硬件代价⼩缺点：速度慢，各功能部件利⽤率低2.⼀次重叠执⾏⽅式：优点：时间缩短三分之⼀，各功能部件利⽤效率提⾼缺点：控制复杂，硬件开销增⼤3.⼆次重叠执⾏⽅式：优点：时间缩短三分之⼆，理想状态指令执⾏过程图:⽤于分析指令执⾏过程和影响流⽔线因素时空图：⽤于分析流⽔线的性能吞吐率TP:单位时间内流⽔线完成的任务数量或输出结果的数量加速⽐S：同⼀任务下，不使⽤流⽔线⽤时与使⽤流⽔线⽤时之⽐效率E：流⽔线的设备利⽤率锁存器（缓冲寄存器）：作⽤是保存本流⽔段的执⾏结果，提供给下⼀流⽔段使⽤。

影响因素：结构相关（资源冲突）：多条指令同⼀时间争⽤同⼀资源解决：1.后⼀相关指令暂停⼀周期；2.资源重复配置（数据存储器+指令存储器）数据相关（数据冲突）：在⼀个程序中，上⼀条指令执⾏完才能执⾏下⼀条指令（这两条指令即为数据相关）解决：将数据相关的指令和后续指令暂停时钟周期到问题消失再执⾏；1.硬件阻塞stall和软件插⼊NOP；2.数据旁路技术；3.编译优化：通过编译器调整指令顺序控制相关（控制冲突）：转移指令和改变PC值的指令造成断流解决：1.尽早判别转移是否发⽣，尽早⽣成转移⽬标地址2．预取转移成功和不成功两个控制流⽅向上的⽬标指令3．加快和提前形成条件码4．提⾼转移⽅向的猜准率流⽔线的分类1.根据流⽔线使⽤级别:部件功能级、处理机级和处理机间级流⽔线部件功能级流⽔：将复杂的算术逻辑运算组成流⽔线⼯作⽅式处理机级流⽔：把⼀条指令解释过程分成多个⼦过程，如取指、译码、执⾏、访存及写回5个⼦过程。

处理机间流⽔：是⼀种宏流⽔，其中每⼀个处理机完成某⼀专门任务，各个处理机所得到的结果需存放在与下⼀个处理机所共享的存储器中2，按流⽔线可以完成的功能分为：单功能流⽔线和多功能流⽔线单功能流⽔线：指只能实现⼀种固定的专门功能的流⽔线；多功能流⽔线：指通过各段间的不同连接⽅式可以同时或不同时地实现多种能的流⽔线。

Intel系列CPU的流水线结构与性能分析

Intel系列CPU的流水线结构与性能分析流水线技术早在Intel的X86芯片中均得到了实现。

流水线的使用使CPU 的性能得到了很大的提升，而Pentium系列CPU产品更是一个高级的超标量处理器。

当然CPU流水线性能是有限制，影响CPU流水线性能的因素有:1、多个任务在同一时间周期内争用同一个流水段例如，假如在指令流水线中，如果数据和指令是放在同一个储存器中，并且访问接口也只有一个，那么，两条指令就会争用储存器；在一些算数流水线中，有些运算会同时访问一个运算部件。

2、数据依赖比如，A运算必须得到B运算的结果，但是，B运算还没有开始，A运算动作就必须等待，直到A运算完成，两次运算不能同时执行。

3、条件转移的影响如果第一条指令是一个条件转移指令，那么系统就会不清楚下面应该执行那一条指令。

这时就必须等第一条指令的判断结果出来才能执行第二条指令。

条件转移所造成的流水线停顿甚至比相关还要严重的多。

越是长的流水线，相关和转移两大问题也越严重，所以，流水线并不是越长越好，超标量也不是越多越好，找到一个速度与效率的平衡点才是最重要的。

为了解决这些影响流水线性能的因素和提高CPU性能，Intel公司采取了一系列技术手段。

在Pentium III的时候主要采用的技术1.采用超标量双流水线结构超标量流水线设计是Pentium微处理器技术的核心。

所谓超标量就是处理器内部含有多个执行单元来完成多条指令的同时执行。

Pentium有两条分别称为U和V的指令流水线，各自有独立的算术逻辑单元ALU及高速缓存结构。

这种双流水线并行作业的方式，使得Pentium在每个时钟周期内可同时执行两条指令。

此外，还有一个执行单元，保证同时完成一条浮点运算指令。

在Pentium III时采用3条独立的12级超标量流水线。

2.分支预测技术为了减少由于转移导致流水线的效率损失，Pentium采用分支预测技术来动态预测指令的目标地址，从而节省了CPU的执行时间。

处理器系列之CPU流水线科普

处理器系列之CPU流水线科普1989年推出的i486处理器引入了五级流水线。

这时，在CPU中不再仅运行一条指令，每一级流水线在同一时刻都运行着不同的指令。

这个设计使得i486比同频率的386处理器性能提升了不止一倍。

五级流水线中的取指阶段将指令从指令缓存中取出（i486中的指令缓存为8KB）；第二级为译码阶段，将取出的指令翻译为具体的功能操作；第三级为转址阶段，用来将内存地址和偏移进行转换；第四级为执行阶段，指令在该阶段真正执行运算；第五级为退出阶段，运算的结果被写回寄存器或者内存。

由于处理器同时运行了多条指令，大大提升了程序运行的性能。

处理器一般由如下功能单元组成：取指单元译码单元执行单元Load/store单元（load用于从内存中取数据，而STORE用于存数据到内存）例外/中断单元电源管理单元流水线通常由取指、译码、执行及Load/Store等单元组成。

各单元按图所示的几个步骤循环重复自身工作。

流水线的含义：与工厂生产线类似，将一件工作分成若干个固定的工序进行。

cpu流水线技术是一种将指令分解为多步，并让不同指令的各步操作重叠，从而实现几条指令并行处理，以加速程序运行过程的技术。

指令的每步有各自独立的电路来处理，每完成一步，就进到下一步，而前一步则处理后续指令。

（原理和生产流水线一样）CPU指令流水线根据之前描述的基础，指令进入流水线，通过流水线处理，从流水线出来的过程，对于我们程序员来说，是比较直观的。

I486拥有五级流水线。

分别是：取指(Fetch)，译码(D1, main decode)，转址(D2, translate)，执行(EX, execute)，写回(WB)。

某个指令可以在流水线的任何一级。

但是这样的流水线有一个明显的缺陷。

对于下面的指令代码，它们的功能是将两个变量的内容进行交换。

1 XOR a, b2 XOR b, a3 XOR a, b从8086直到386处理器都没有流水线。

流水线结构在cpu中的运用是一种

高效的计算方式。

流水线结构是一种在CPU中实现的技术，它允许在一个时钟周期内完成多条指令的执行。

流水线结构通过将一条指令分为若干个独立的阶段来实现，每个阶段都负责执行一部分指令。

这样，在一个时钟周期内就可以同时执行多条指令。

这样，CPU 就可以在一个时钟周期内完成多条指令的执行。

流水线结构带来了很多优点，主要有以下几点:
提高了CPU的运行速度，由于在一个时钟周期内可以同时执行多条指令，所以CPU的运行速度得到了提高。

提高了CPU的并行度，可以同时执行多条指令，并行度提高了。

降低了CPU的功耗。

缺点：但是流水线结构也带来了一些问题，比如流水线控制和数据相关性等，这些问题需要程序员在编程时进行特别处理。

当流水线执行过程中出现数据相关性时，就会导致流水线活动的阻塞，这种现象称为流水线冒险（Pipeline Hazard）。

数据相关性通常发生在两条指令之间，而在这两条指令之间的那些指令就会因为数据相关性而被阻塞。

解决这个问题的方法有两种:
数据相关性检测和预流控制（Data Hazard Detection and Control）。

这种方法可以在指令执行之前检测出数据相关性，
并采取适当的措施防止阻塞。

流水线重排（Pipeline Rescheduling）。

这种方法可以在程序运行过程中，重新调整指令的执行顺序，以避免数据相关性。

流水线控制是一种很复杂的问题，需要综合考虑很多因素，比如指令的类型、指令的执行顺序、流水线的结构等等。

在这些因素的综合影响下，程序员需要在编程时特别注意这些问题，以避免流水线的阻塞。

什么是流水线技术pipeline

什么是流水线技术pipeline/uid-9185047-id-445171.html2010流水线(Pipeline)技术是目前广泛应用于微处理芯片(CPU)中的一项关键技术，但对许多非专业性的读者来说，这个名词过于抽象，加上P6(高能奔腾)应用的超流水线(Super Pipeline)技术，更令人一头雾水，不知所云。

本文以简单、形象、非专业的语言来介绍这一技术，加深大家对其的理解。

流水线技术指的是对CPU内部的各条指令的执行方式的一种形容，要了解它，就必须先了解指令及其执行过程。

一、计算机指令及其执行过程计算机指令，就是告诉CPU要做什么事的一组特定的二进制集合。

如果我们将CPU比喻成一个加工厂，那么，一条指令就好比一张订单，它引发了CPU__加工厂的一系列动作，最后分别得到了运算结果和产品。

那么，它们到底是怎样工作的呢?首先，要有一个接收订单的部门——CPU的取指令机构；其次，还要有完成订单的车间——CPU的执行指令机构。

在工厂中，一张订单上的产品被分成了许多道工序，而指令亦在CPU中转换成了许多条对应的微操作，依次完成它们，就执行完了整条指令。

二、执行指令的方式及流水线技术在低档的CPU中，指令的执行是串行的，简单地说，就是执行完了一条指令后，再执行下一条指令，好比我们上面提到的那个加工厂在创业之初，只有一间小车间及孤军奋战的老板，那么，当他接到一张订单之后，他必然忙于完成第1张订单，而没有能力去接第2张订单。

这样接订单→完成订单→接订单→……取指令→执行指令→取指令→……是一个串行的过程。

后来，老板发现接受订单不费太多时间，而且他还有了一个帮工，他们可以相互独立地工作，这样，老板就在完成上张订单产品的同时，接受下一张订单的订货。

这表现在CPU上就是取指令机构与执行指令机构的分开，这样从CPU整体来看，CPU在执行上条指令的同时，又在并行地取下条指令。

这在CPU技术上是一个质的飞跃，它使得CPU从串行工作变为并行工作，从而具有了流水线的雏型。

带中断系统的五级流水线CPU设计

优化缓存设计：通过优化缓存设计，提高缓存命中率，减少缓存未命中的情况。
优化分支预测：通过优化分支预测算法，提高分支预测的准确性，减少分支预测错误导致的性能损失。
实际应用中的考虑因素
PART 06
硬件资源的占用
处理器核心数量：根据实际需求选择合适的处理器核心数量
内存容量：根据实际需求选择合适的内存容量
பைடு நூலகம்
中断优先级和向量表的作用：保证中断系统的高效性和稳定性，提高CPU的性能和可靠性
带中断系统的五级流水线CPU设计实现
PART 04
中断处理在流水线的实施
中断处理单元：负责处理中断请求，并控制中断响应
中断响应：当接收到中断请求时，CPU暂停当前指令的执行，跳转到中断处理程序
中断优先级：根据中断请求的优先级，决定中断响应的顺序
THANK YOU
汇报人：
中断响应：CPU接收到中断请求信号后，暂停当前任务，进入中断处理状态
中断服务：CPU执行中断服务程序，处理中断请求
中断返回：中断服务完成后，CPU返回到被中断的任务继续执行
中断优先级和向量表
中断优先级：中断系统在处理多个中断请求时，根据优先级的高低来决定处理顺序
向量表：中断系统在处理中断请求时，通过向量表来查找中断处理程序的入口地址
研究方法：采用理论分析、实验验证、仿真模拟等方法进行研究
研究意义：新型中断处理技术的研究与应用可以提高计算机系统的性能和可靠性，提高计算机系统的安全性和稳定性，推动计算机技术的发展。
流水线设计中的新思路和新方法
硬件加速技术：利用专用硬件加速流水线处理过程
自适应流水线设计：根据任务需求自动调整流水线结构
流水线设计的概念
五级流水线设计原理

流水线(Pipeline)介绍PPT课件

❖ 写后读（RAW） ❖ 写后写 (WAW) ❖ 读后写 (WAR)
.
16
写后读冒险（RAW: Read After Write）
❖ 在 i 写入之前，j 先去读。j 会错误的获取旧值。
❖ 这对应“真数据相关”，为了确保j可以得到正确的i值，必须保持程序的顺序。
i: DSUB R1,R2,R3 j: DADD R4,R1,R3ຫໍສະໝຸດ DSUB R4，R1，R5
IM
Reg
DM
Reg
XOR R6，R1，R7
IM
Reg
DM
AND R8，R1，R9
IM
Reg
OR R10，R1，R11
IM
Reg
AND,OR操作不会暂停，但是DSUB,XOR指
令需要等待DADD在WB阶段写回数据后才
可以执行。
.
15
2.4 数据冒险的解决办法
❖ 根据指令中读写访问的顺序，可以将数据冒险分为三类。分别是:
处理器流水线相关技术
报告人：Hardy
.
1
流水线技术
❖1.流水线的概念 ❖2.流水线的冒险和冒险的解决办法 ❖3.多发射处理器
.
2
1.流水线的概念
❖ 流水线技术：
把一个重复的过程分解为若干个子过程，每个子过程由专门的功能部件来实现。将多个处理过程在时间上错开，依次通过各功能段，这样，每个子过程就可以与其他子过程并行进行。
.
5
采用相同的功能模块，指令顺序执行和按照流水线
技术执行，在时间上可以看出流水线指令的执行速
度提高了4倍。
.
6
流水线的基本作用
流水线增大了CPU的指令吞吐量—即单位时间执行指令的条数，但是它未减少指令各自的执行时间。实际上流水线技术要对流水线附加一些控制，因而了增加开销，使单条指令执行时间略有增加。吞吐量的增大意味着程序运行的更快，总的执行时间变短，尽管没有一条指令的执行变快。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

局部性相关：数据相关
(2) I3: STA M(x)，R3 ；（R3)->M(x)，M(x)是存储器单元 I4: ADD R3，R4，R5 ； (R4)+(R5)->R3
第(2)组指令中，I3指令应先读出R3内容并存入存储单元M(x)，然后在I4指令中将运算结果写入R3。但由于I4指令进入流水线，变成I4指令在I3指令读出R3内容前就写入R3，发生WAR
(1) I1: ADD R1，R2，R3 ； (R2) + (R3)->R1 I2: SUB R4，R1，R5 ； (R1) - (R5)->R4
(2) I3: STA M(x)，R3 ； R3)->M(x)，M(x)是存储器单元
I4: ADD R3，R4，R5 ；
(R4)+(R5)->R3
(3) I5: MUL R3，R1，R2 ； I6: ADD R3，R4，R5 ；
（2）空间并行—— 资源重复用多个相同部件处理多个事件。
实现方式：多处理器系统和多计算机系统或单处理器系统。
(3) 时间并行+空间并行既采用时间并行性又采用空间并行性。
例：奔腾CPU采用的超标量流水技术。
流水线CPU的结构
现代流水线计算机系统组成原理如左图所示。其中 CPU按流水线方式组织，通常由三部分组成：指令部件、指令队列、执行部件。这三个功能部件可以组成一个3级流水线。
流水线CPU
流水CPU
并行性概念
1．并行性的含义同时性——指两个或者两个以上事件在同一时刻发生。并发性——指两个或者两个以上事件在同一时间间隔内发生。
2 并行性概念
2．并行处理技术的主要形式
（1）时间并行— 时间重叠让多个处理过程在时间上相互错开，轮流重叠地使用
同一套硬件的各个部分，从而赢得高速度。实现方式：采用流水处理部件。
（2）流水线工作原理
① 指令周期的三个主要过程：
入
取指
取数
执行
出
图5.30 指令周期的三个过程段
② 指令执行过程的时空图
a．非流水线时空图 b．标量流水线时空图 c. 超标量流水线时空图
空间S
执行
取数
取指
I1
I2
I1I2
I3 I4 I5
I6
I1
I3
I5
I2
I4
I6
I1
I3
I5
Байду номын сангаасI7
I2
I4
I6
I8
· 资源相关 · 数据相关
局部性相关
· 变址转移 · 中断
全局性相关
局部性相关：资源相关
在同一机器时钟周期内争用同一个功能部件所发生的冲突。
时钟 1 2
3
4
5
指令
I1
取指译码取数执行
I2
取指译码取数执行
I3
取指译码取数
在时钟3发生争用内存的问题—资源相关。
解决方法： ① 将取指操作推迟一个时钟进行；
图3.33 流水线计算机系统组成原理示意图
指令流水线原理
问题的提出串行执行方式存在部件利用率不高（有闲置时间）的问题。
CPU周期
使用部件
取指令 PC，MS，IR等
闲置部件 ALU，GRS
取数
MS
PC，ALU，GRS
执行
ALU，GRS
PC，MS
每个过程段所用的部件不同在某个过程段时，其他过程段的部件处于空闲
(R1)×(R2)->R3 (R4) + (R5)->R3
局部性相关：数据相关
(1) I1: ADD R1，R2，R3 ； I2: SUB R4，R1，R5 ；
(R2) + (R3)->R1 (R1) - (R5)->R4
第(1)组指令中，I1指令运算结果应先写入R1，然后在I2指令中读出R1内容。由于I2指令进入流水线，变成I2指令在I1指令写入R1前就读出R1内容，发生 RAW（写后读）相关。
② 增设一个存储器，将指令和数据分开存放；
③ 采用双端口存储器。
局部性相关：数据相关
在程序中，一条指令的执行需等前一条指令执行完后才能进行，则有数据相关。
例：SUB R1，R2，R3；（R2）（R3） R1
ADD R4，R1，R5；（R1）（R5） R4
时钟 1 2 3 4
指令
SUB 取指译码取数执行
吞吐率就越高。但需增加硬件，控制更复杂； ③ 流水线每个阶段的执行时间应尽量一致； ④ 流水线充满（满载）时达到最大的吞吐率。
流水线相关问题
· 流水线相关：是指邻近指令之间由于某种关系，出现了不能同时被流水操作的现象。
· 流水线的相关会造成流水线的断流，影响整个流水线的效率。
造成流水线相关的原因
局部性相关：数据相关
(3) I5: MUL R3，R1，R2 ； (R1)×(R2)->R3 I6: ADD R3，R4，R5 ； (R4) + (R5)->R3
第(3)组指令中，如果I6指令的加法运算完成时间早于I5指令的乘法运算时间，变成指令I6在指令I5写入R3前就写入R3，导致R3的内容错误，发生WAW(写后写）相关。
局部性相关的处理方法
指令调度法
· 静态调度 · 动态调度
设置多个功能部件
内部数据定向
（1）指令调度法
指令调度
改变指令的执行顺序以解决相关性带来的问题
静态指令调度
改变程序中指令的位置
流水线 vs 非流水线
① 非流水线指令的执行是串行的； ② 标量流水线从满载起，每经1个周期做完一条指令； ③ 超标量流水线，提高了吞吐量，但需二套（或二
套以上）流水线的硬件及其他电路。（见附图）
常见的超标量流水线结构
（3）流水线工作方式的特点
① 具有时间的并行性； ② 流水线分工越细，可同时运行的指令越多，
I3
I5
I7
I9
I4
I6
I8
I10
（C）超标量流水线时空图
空间S
I1
I2
I3
执行
I1
I2
I3
取数
I1
I2
I3
取指 I1
I2
I3
（a）非流水线时空图
时间T
空间S
I1 I2 I3 I4
执行取数取指 I1
I1
I2
I3
I4
I1
I2
I3
I4
I2
I3
I4
（b）标量流水线时空图
时间T
时间T 图5.31 非流水线与流水线对比
解决方法：
① 推迟ADD指令的取数操作；
ADD
取指译码取数
② 采用数据旁路
（内部向
前）技术，
直接把结果送给下一条指令。
全局性相关：控制相关
由条件转移指令或中断引起的。
解决方法： ① 延迟转移法：加入空操作，等待转移条件形成。 ② 猜测法：选择出现概率较高的分支进行指令预取。
【例4】流水线中有三类数据相关冲突：写后读相关；读后写相关；写后写相关。判断以下三组指令各存在哪种类型的数据相关。

计算机组成_ 流水线处理器(Pipelined Processor)_

页数:36
Verilog实现流水线CPU实验报告

页数:39
流水线MIPS CPU的设计—张玲松

页数:56
《流水线CPU技术》PPT课件

页数:1
计算机组成原理第五章第6讲流水CPU

页数:23
流水线处理器冲突问题

页数:13
流水线CPU技术讲解

页数:85
第7章流水线结构RISC CPU设计

页数:59
CPU流水线

页数:9
华科组成原理课程设计-MIPS流水线CPU

页数:22

流水线CPU技术讲解

合集下载

计算机流水线（Pipeline）技术

Intel系列CPU流水线技术的发展与展望

第8章中央处理器-流水线CPU

中央处理器CPU——指令流水线

Intel系列CPU的流水线结构与性能分析

处理器系列之CPU流水线科普

流水线结构在cpu中的运用是一种

什么是流水线技术pipeline

带中断系统的五级流水线CPU设计

流水线(Pipeline)介绍PPT课件

文档推荐

最新文档

流水线CPU技术讲解

合集下载

计算机流水线（Pipeline）技术

Intel系列CPU流水线技术的发展与展望

第8章 中央处理器-流水线CPU

中央处理器CPU——指令流水线

Intel系列CPU的流水线结构与性能分析

处理器系列之CPU流水线科普

流水线结构在cpu中的运用是一种

什么是流水线技术pipeline

带中断系统的五级流水线CPU设计

流水线(Pipeline)介绍PPT课件

文档推荐

最新文档

第8章中央处理器-流水线CPU