实验四控制冒险与分支预测

格式：doc
大小：429.50 KB
文档页数：20

下载文档原格式

/ 20

分支程序的设计实验报告

分支程序的设计实验报告实验目的本实验旨在通过设计一个分支程序来展示控制流程中的分支结构，加深对这一概念的理解，并通过实际编程提高对分支结构的应用能力。

实验原理分支程序是一种常见的控制流程结构，它根据条件的真假选择不同的执行路径。

在编程中，分支程序通常用于判断特定条件是否满足，并根据不同结果执行不同的操作。

常见的条件语句包括if 语句、switch 语句等。

在设计一个分支程序时，需要明确条件和执行路径，并根据不同情况进行相应处理。

分支程序的设计需要考虑条件的正确性和完备性，避免出现判断错误或遗漏情况。

实验过程本实验选择使用Python 语言来设计和实现一个简单的分支程序。

具体步骤如下：1. 首先，根据实际需求确定分支程序的目标和条件。

在本实验中，我们设计了一个分支程序来判断一个数字是否是奇数。

2. 接下来，根据选定条件，实现相应的判断逻辑。

我们使用if 语句来对给定数字进行判断。

如果数字对2 求余等于0，那么这个数字是偶数；否则，这个数字是奇数。

3. 在程序中加入输出语句，以便用户能够看到最终的判断结果。

4. 编译和运行程序，观察输出结果是否符合预期。

在实验过程中，我们还可以进行额外的调试和优化，并添加更多的分支条件来扩展程序功能。

例如，我们可以增加一个分支条件来判断数字是否为负数，或者根据数字的大小进行不同的处理等。

实验结果经过编写、编译和运行，我们得到了一个简单的分支程序。

该程序可以根据给定的数字判断其是否是奇数，并将结果输出给用户。

下面是程序的源代码：pythonn = int(input("请输入一个整数: "))if n % 2 == 0:print("这是一个偶数。

")else:print("这是一个奇数。

")以下是程序运行的示例结果：请输入一个整数: 5这是一个奇数。

请输入一个整数: 8这是一个偶数。

实验总结通过本次实验，我们深入学习了分支程序的设计原理和实现方法，并通过编写一个简单的示例程序加深了对分支结构的理解。

分支结构控制实验报告

一、实验目的1. 理解并掌握分支结构在程序设计中的作用。

2. 熟练运用if-else语句和switch-case结构实现分支控制。

3. 通过实际案例，提高对分支结构在实际编程中的应用能力。

二、实验环境1. 操作系统：Windows 102. 编程语言：C语言3. 编译器：Visual Studio 2019三、实验内容1. 实验一：使用if-else语句判断一个数是正数、负数还是零。

```c#include <stdio.h>int main() {int num;printf("请输入一个整数：");scanf("%d", &num);if (num > 0) {printf("%d 是正数。

\n", num);} else if (num < 0) {printf("%d 是负数。

\n", num);} else {printf("%d 是零。

\n", num);}return 0;}```2. 实验二：使用switch-case结构判断一个星期中的某一天。

```c#include <stdio.h>int main() {int day;printf("请输入星期几（1-7）：");scanf("%d", &day);switch (day) {case 1:printf("星期一。

\n");break;case 2:printf("星期二。

\n");break;case 3:printf("星期三。

\n");break;case 4:printf("星期四。

\n");break;case 5:printf("星期五。

实验四分支程序与循环程序

实验四分支程序与循环程序一、实验目的1、熟悉转移指令的功能与使用；2、掌握偏移量的计算方法；3、熟悉分支程序设计和调试方法；4、进一步掌握堆栈指令的使用；5、熟悉循环程序设计和调试方法。

二、实验仪器1、DVCC-598JH 单片开发机一台；2、WD-5型直流稳压源一台。

三、实验预习1、认真阅读实验指导书有关内容，明确实验目的、内容和操作步骤；2、对实验中的程序和指令进行手工汇编；3、复习实验中相关指令的功能；4、复习偏移量的计算及OFST 键的操作方法。

四、实验内容 1、分支程序设计分支程序是根据不同的条件，执行不同的程序段，也称条件分支程序。

程序一：比较片内RAM 40H 和41H 单元中的两个无符号数，将较大数存入40H 单元，较小数存入41H 单元。

)0()0(∠≥⎩⎨⎧+-=a a ba b a y参考程序：ORG1000HSTART ： MOV A ，40H CLRCSUBB A ，41HJNCW AITMOV A，40HXCH A，41HMOV 40H，AW AIT：SJMP $END程序二：设a数存放在累加器A中，b数存放在寄存器B中，求下列算式的y值，并将结果存入累加器A中。

参考程序：ORG 1000HJB ACC.7，NUSCLR CSUBB A，BSJMP DONENUS：ADD A，BDONE：SJMP DONEEND2、循环程序设计在实际应用中，往往需要多次反复执行某种相同的操作，而只是参与操作的操作数不同，这时就可以采用循环程序结构。

它可以缩短指令数，减少程序所占的内存空间。

程序三：数据块传送将片外RAM中地址为4500H~450FH中的数据块传送到4700H~470FH单元中。

参考程序：地址目的程序源程序ORG 1000H1000 7A00 MOV R2，#00H1002 7B45 MOV R3，#45H1004 904700 MOV DPTR，#4700H1007 C083 LOOP：PUSH DPH1009 C082 PUSH DPL100B 8A82 MOV DPL，R2100D 8B83 MOV DPH，R3100F E0 MOVX A，@DPTR1010 D082 POP DPL1012 D083 POP DPH1014 F0 MOVX @DPTR，A1015 A3 INCDPTR1016 0A INCR21017 BA10ED CJNE R2，#10H，LOOP101A 80FE SJMP $END五、实验步骤1、认真阅读实验参考程序并分析程序运行后的理论结果；2、输入程序并检查输入是否正确；3、根据已知条件输入程序执行前的原始数据；4、执行程序，检查并记录结果；六、练习1、将ASCII码转化为十六进制数。

实验四分支和循环程序设计实验(精)

实验四分支和循环程序设计实验一、实验要求和目的1．熟悉汇编语言程序设计结构；2．熟悉汇编语言分支程序基本指令的使用方法；3．掌握利用汇编语言实现单分支、双分支、多分支的程序设计方法；4．了解汇编语言循环程序设计的基本流程；5．熟悉汇编语言循环基本指令的使用方法；6．掌握利用汇编语言的循环指令完成循环程序设计方法。

二、软硬件环境1、硬件环境：计算机系统 windows；2、软件环境：装有 MASM、DEBUG、LINK、等应用程序。

三、实验涉及的主要知识在实际应用中，经常根据一些条件来选择一条分支执行。

汇编语言的条件判断主要是通过状态寄存器中的状态位、无符号数相减或有符号相减而导致的结果来进行。

1．无条件转移指令 JMP无条件转移指令 JMP是使程序无条件转移至目标处，又分为段内转移、段间转移。

2．条件转移指令 JXX条件转移指令可分为三大类：1）．简单条件转移指令指令。

根据单个标志位的状态判断转移条件。

标志位指令转移条件意义CFJC CF=1 有进位/借位JNC CF=0 无进位/借位ZFJE/JZ ZF=1 相等/等于 0JNE/JNZ ZF=0 不相等/不等于 0SFJS SF=1 是负数JNS SF=0 是正数OFJO OF=1 有溢出JNO OF=0 无溢出PFJP/JPE PF=1 有偶数个 1JNP/JPO PF=0 有奇数个 12）．无符号数条件转移指令。

假设在条件转移指令前使用比较指令，比较两个无符号数A，B，指令进行的的操作是 A-B，其转移指令如下：指令转移条件意义JA/JNBE CF=0 AND ZF=0 A>BJAE/JNB CF=0 OR ZF=1 A>=BJB/JNAE CF=1 AND ZF=0 A<BJBE/JNA CF=1 OR ZF=1 A<=B3）.带符号数条件转移指令。

指令转移条件意义JG/JNLE SF=OF AND ZF=0 A>BJGE/JNL SF=OF OR ZF=1 A>=BJL/JNGE SF OF AND ZF=0 A<BJLE/JNG SF OF OR ZF=1 A<=B四、实验内容与步骤1、判断方程 AX2+BX+C=0是否有实根。

实验四组合电路中的竞争与冒险

实验四组合电路中的竞争和冒险姓名：zht学号：班级：15自动化2班日期：2016/10/28目录一、实验内容 (3)二、逻辑图、真值表及实验方法和步骤 (4)①逻辑图： (4)②真值表： (4)③实验方法和步骤： (5)三、实验数据及总结 (7)①实验数据： (7)②总结： (10)一、实验内容实现函数D⋅=，并假定，输入只有原变量即无反变F⋅⋅CADBAB量输入。

1.画出逻辑图，使易于观察电路的竞争冒险现象。

2.列出真值表。

3.静态测试，即按真值表验证其逻辑功能。

4.观察变量A变化过程中的险象：即取B=C=D=1，得F=A+A，A改接函数发生器的连续脉冲源，使工作频率尽可能高。

观察是否出现险象，如有，请测出毛刺的幅度和宽度（中值宽度）。

5.分别观察变量B、D变化过程中产生的险象。

6.用加冗余项法消除A变化过程中产生的险象。

实验仪器：1.数字电路实验箱、数字万用表、示波器。

2.器件：74LS00、74LS20。

二、逻辑图、真值表及实验方法和步骤①逻辑图：②真值表：③实验方法和步骤：观察险象的方法：调整A、B、C、D四个输入中其中三个的值，化简函数使F=x+x或F=x x（x为剩下的那个输入值）。

再将输出F接入示波器的输入端，即可观察到x变化过程中的险象。

比如取B=C=D=1，使F=A+A，再将F接入示波器的输入端，即可通过示波器观察到A 变化过程中的险象。

观察险象的步骤：按照逻辑图连接好电路，静态检测确认无误后，将B、C、D的模拟开关调为1，A接连续脉冲，将输出F接入示波器的输入端，调整示波器使其显示输入的波形，即可观察A变化过程中的险象。

若要观察B变化过程中的险象，则需调整模拟开关使A=1、C=1、D=0；若要观察D变化过程中的险象，则需调整模拟开关使A=0、B=0、C=1，其他步骤不变。

消除险象的方法：首先绘制该函数的卡诺图如下所示：我们的目的是消除A变化过程中产生的险象，所以只考虑A。

可以看出卡诺图中在没有黄色的圈的情况下红色的圈之间有间隙，表达到实际电路上的含义则是当B=C=D=1时会遗留独立的A和A相加，产生冒险现象。

Java程序设计任务驱动式教程任务四挑战选择(使用分支控制流程)

2／22
目录
任务十一用数组存储信息（使用数组）任务十二使用字符串进行交流（使用字符串）任务十三防患于未然（捕获并处理异常）任务十四主动出击（抛出异常）任务十五认识Java Applet（Applet入门） Java Applet Applet
任务十六丰富多彩的Applet（在Applet中播放声音和显示图像）
第1章目录
9／22
4.3 代码分析
• 程序代码
(1)使用if-else条件语句实现的代码如下： package com.task04; import javax.swing.*; public class ComputePriceIf{ public static void main(String[] args){ int c,s=0; double p=0,w=0,d,f; p=Double.parseDouble(JOptionPane.showInputDialog("请输入运输公司的运输单价",new Double(p))); w=Double.parseDouble(JOptionPane.showInputDialog("请输入要运输的货物的重量",new Double(w))); s=Integer.parseInt(JOptionPane.showInputDialog("请输入运输的距离",new Integer(s))); if(s>=3000)c=12; else c=s/250; if(c<1)d=0; else if(c<2)d=0.02; else if(c<4)d=0.05; else if(c<8)d=0.08; else if(c<12)d=0.1; else d=0.15; f=p*w*s*(1-d); System.out.println("运输公司的运输单价为"+p); System.out.println("该次运输的货物重量为"+w); System.out.println("该次运输的运输距离为"+s); System.out.println("该次运输的总运费为"+f); } }

实验四分支循环结构程序设计-4页文档资料

实验四、分支循环结构程序设计一、实验目的1．通过本实验，加深对循环控制结构有关概念的理解。

2．熟练掌握while、do-while和for三种循环控制语句的特点，掌握循环结构程序设计和调试方法。

3．掌握二重循环结构程序的设计方法。

二、实验内容1．用while循环实现数据统计问题。

数据统计问题：从键盘输入一批任意数量的整数，统计其中不大于100的非负数数值的个数。

2．编写并调试程序，使用do-while循环控制语句实现上面的数据统计问题。

调试数据仍参照上面给出的几种情况设计使用。

3．编写并调试程序，使用for循环控制语句实现上面的数据统计问题。

4．阶乘累加问题。

编写程序，求1+2！+3！+…+n!的值（习题5.9）。

三、实验指导1．用while循环实现数据统计问题。

⑴编程分析由于输入数据个数是不确定的，因此每次执行程序时，循环次数都是不确定的。

在进行程序设计时，确定循环控制的方法是本实验的一个关键问题。

循环控制条件可以有多种确定方法：①使用一个负数作为数据输入结束标志。

②输入一个数据后通过进行询问的方式决定是否继续输入下一个数据。

⑵参考程序l 参考程序一/* 使用负数作为数据输入结束标志的程序 */#include "stdio.h"void main()int m,counter=0;while(1)printf("请输入一个整数：");scanf("%d",&m);if(m<0)break;if(m<=100)counter++;printf("\n");printf("符合要求的整数个数为: %d\n",counter);l 参考程序二/* 通过进行询问的方式决定是否继续输入下一个数据的程序 */#include "stdio.h"void main()int m,counter=0;char ask;while(1)printf("请输入一个整数：");scanf("%d",&m);getchar();if(m>=0&&m<=100)counter++;printf("继续输入下一个数据？(Y/N)");ask=getchar();getchar();if(ask!='y'&&ask!='Y')break;printf("\n");printf("符合要求的整数个数为: %d\n",counter);⑶程序调试这里只对“参考程序一”的调试数据进行设计。

实验四组合电路的竞争冒险

实验四组合电路的竞争冒险1．实验目的通过实验观察组合电路中存在的竞争冒险现象，学会用实验手段消除竞争冒险对电路的影响。

2．实验原理在组合逻辑电路里，信号从输入到输出的过程中，由于不同通路上门的级数不同，或者门电路平均延迟时间的差异，使信号从输入经不同通路传输到输出级的时间不同。

由于这个原因，可能会使逻辑电路产生错误输出。

通常把这种现象称为竞争冒险。

下面是一个最简单的例子。

在图4.1（a ）的与门电路中，无论A=1、B=0还是A=0、B=1，输出皆为Y=0。

但是，如果输入信号A 从1跳变为0时，B 从0跳变为1，而信号B 首先上升到以(max)IL V 以上，这样在极短的时间T 内将出现A 、B 同时高于(max)IL V 的状态，于是便在门电路的输出端产生了极窄的Y=1的尖峰脉冲，或称为电压毛刺，如图所示（在画波形时考虑了门电路的传输延迟时间）。

显然，这个尖峰脉冲不符合门电路在稳态下的逻辑关系，因而它是系统内部的噪声。

同样，在图4.1（b ）的或门电路中，无论A=0、B=1还是A=1、B=0，输出都应该是Y=1。

但如果A 从1变成0的时刻和B 从0变成1的时刻略有差异，而且在A 下降到(min)IH V 时B 还没有上升到(min)IH V ，则在暂短的t ∆时间内将出现A 、B 同时低于(min)IH V 的状态，使输出端产生极窄的Y=0的尖峰脉冲。

这个脉冲同样也是违背稳态下关系的躁声。

我们把门电路两个输入信号同时向相反的逻辑电平跳变（一个从1变为0，另一个从0图4.1 组合电路中的竞争冒险B&≥11AA B Y Y Y tA B IH(min)IH(min)tY变为1）的现象叫做竞争。

应当指出，有竞争现象时不一定都会产生尖峰脉冲。

例如，在图4.1（a ）中，如果在B 上升到(max)IL V 之前A 已经降到了(max)IL V 以下（如图中虚线所示），这时输出端不会产生尖峰脉冲。

简述影响指令执行时间的主要不确定因素

简述影响指令执行时间的主要不确定因素——处理器流水线机制论坛上经常有人问，某段语句的执行时间是多少；或者是某几段语句，那段执行时间快。

绝大多数朋友也会带着好奇的观点，在旁边观战；通常的回答是：你看芯片手册吧。

类似的帖子和类似的回答很多，但是很少有人能把这个问题回答的清晰和彻底。

我觉得，这种提问本来就不专业，答案也不唯一。

至于原因？因为一条指令的执行时间不仅取决于处理器的频率，还取决于许多处理器以外的因素。

芯片手册上指令的执行时间，通常是不考虑外界因素的：不考虑总线冲突、不考虑内存延迟、不考虑高速缓存机制、不考虑流水线的相关性等。

这里我打算分两次主要介绍下，高速缓存和处理器的流水线机制如何影响指令的执行时间的。

本次先介绍流水线相关机制。

1. 流水线技术现代绝大多数的处理器在某个时刻，并不是只处理一个指令，而是按照流水线的形式处理，这和我们实际生活中，车间里的流水线是一个原理。

下面我们假设某个处理器有三级流水线：译指/运算/写存。

这里只是假设，不要对号入座。

译指：处理器读取并分析指令的功能，比如mov是赋值，add是加法；译指为下一步的运算提供数据输入和选择相应的硬件单元。

运算：处理器进行加减乘除移位比较等等运算，不需要运算的指令进行下一步骤“排队”。

写存：处理器将运算单元的输入写回内存或者寄存器，并更新pc。

假设该处理器正在处理四条指令ABCD。

每条指令又有三个处理过程，即译指/运算/写存。

我们假设流水线的每个阶段需要耗时1ns，一条指令的完整执行时间就是3ns；不采用流水线时，指令的完整执行时间是3ns。

流水线分析例题

流⽔线分析例题例1：MIPS 流⽔线，后半拍写 GPRs。

求阻塞法处理 RAW 冒险时的执⾏时间。

ADD R4,R5,R6SUB R7,R4,R6OR R8,R4,R6SW R6,20(R4)LW R9,20(R8)I1-I2 冒险，停 3 拍。

此时 I1-I3, I1-I4 均已消除。

I3-I5 冒险，停 2 拍。

故执⾏时间为 5+4+3+2=14拍。

例2：MIPS 流⽔线，前半拍写 GPRs。

求转发法处理 RAW 冒险时的执⾏时间。

假设存在 EX-EX,MEM-EX 的转发线路。

ADD R4,R5,R6SUB R7,R4,R6OR R8,R4,R6SW R6,20(R4)LW R9,20(R8)I1-I2 冒险，利⽤ EX-EX 线路转发，停 0 拍。

I1-I3 冒险，利⽤ MEM-EX 线路转发，停 0 拍。

I1-I4 冒险，同拍内 GPRs 先写后读，停 0 拍。

I3-I5 冒险，利⽤ MEM-EX 线路转发，停 0 拍。

故执⾏时间为 5+4=9 拍。

例3：MIPS 流⽔线，前半拍写 GPRs。

求转发法处理 RAW 冒险时的执⾏时间。

假设仅存在 EX-EX 的转发线路。

ADD R4,R5,R6SUB R7,R4,R6OR R8,R4,R6SW R6,20(R4)LW R9,20(R8)I1-I2 冒险，利⽤ EX-EX 线路转发，停 0 拍。

I1-I3 冒险，⽆法转发，停 1 拍（注意不是 2 拍！）。

此时 I1-I4 冒险已经消除。

I3-I5 冒险，⽆法转发，停 1 拍。

故执⾏时间为 5+4+1+1=11 拍。

例4：MIPS 流⽔线，后半拍写 GPRs。

求转发法处理 RAW 冒险时的执⾏时间。

假设仅存在 EX-EX 的转发线路。

ADD R4,R5,R6SUB R7,R4,R6OR R8,R4,R6SW R6,20(R4)LW R9,20(R8)I1-I2 冒险，利⽤ EX-EX 线路转发，停 0 拍。

实验四组合电路中竞争与冒险(完成)

实验四组合电路中的竞争与冒险姓名：班级：学号：实验时间：一、实验目的1、观察组合电路中的竞争与冒险现象。

2、了解消除竞争与冒险现象的方法。

二、实验仪器及器件1、数字电路实验箱、数字万用表、示波器。

2、74LS00、74LS20三、实验原理1、竞争冒险现象及其成因在组合逻辑电路中信号的传输可能通过不同的路径而汇合到某一门的输入端上。

由于门电路的传输延迟，各路信号对于汇合点会有一定的时差。

这种现象称为竞争。

这个时候如果电路的输出产生了错误输出，则称为逻辑冒险现象。

一般说来，在组合逻辑电路中，如果有两个或两个以上的信号参差地加到同一门的输入端，在门的输出端得到稳定的输出之前，可能出现短暂的，不是原设计要求的错误输出，其形状是一个宽度仅为时差的窄脉冲，通常称为尖峰脉冲或毛刺。

2、检查竞争冒险现象的方法在输入变量每次只有一个改变状态的简单情况下，如果输出门电路的两个输入信号A和是输入变量A经过两个不同的传输途径而来的，那么当输入变量的状态发生突变时输出端便有可能产生两个尖峰脉冲。

因此，只要输出端的逻辑函数在一定条件下化简成或则可判断存在竞争冒险。

3、消除竞争冒险现象的方法（1）接入滤波电路在输入端并接一个很小的滤波电容Cf，足可把尖峰脉冲的幅度削弱至门电中的阈值电压以下。

（2）引入选通脉冲对输出引进选通脉冲，避开险象。

（3）修改逻辑设计在逻辑函数化简选择乘积项时，按照判断组合电路是否存在竞争冒险的方法，选择使逻辑函数不会使逻辑函数产生竞争冒险的乘积项。

也可采用增加冗余项方法。

选择消除险象的方法应根据具体情况而定。

组合逻辑电路的险象是一个重要的实际问题。

当设计出一个组合电路，安装后应首先进行静态测试，也就是用逻辑开关按真值表依次改变输入量，验证其逻辑功能。

然后再进行动态测试，观察是否存在冒险。

如果电路存在险象，但不影响下一级电路的正常工作，就不必采取消除险象的措施；如果影响下一级电路的正常工作，就要分析险象的原因，然后根据不同的情况采取措施加以消除。

指令级并行：动态分支预测技术

指令级并⾏：动态分⽀预测技术动态分⽀预测技术⽤于处理控制冒险。

其基本思想是，在遇到控制冒险时，预测转移⽅向，并执⾏该⽅向的指令，猜对时继续执⾏后续指令，猜错时回头执⾏另⼀⽅向的指令。

分⽀预测算法分为静态和动态两种。

静态预测算法直接进⾏固定的猜测或按指令能容进⾏猜测，其常见时机则分别为IF段和ID段。

动态预测算法根据转移历史来预测新的转移⽅向，其主要类型有饱和计数预测、相关预测、⾃适应预测等，均可以⽤于IF段预测。

基本预测器即饱和计数预测器通常将分⽀历史⽤两个⼆进制位表⽰，根据⾼位来预测，根据结果来更新，其本质是⼀个具有4各状态的DFA。

它只根据当前分⽀的分⽀历史来预测，在连续两次错误预测时改变预测⽅向，⽤于循环时性能较好。

实现上，需要⽤分⽀历史表来记录各分⽀指令地址对应的分⽀历史信息，设置查找更新机构来实现数据的更新。

相关预测器使⽤其它分⽀的⾏为来预测当前分⽀，(m,n)预测器包含m位全局历史和n*2^m位模式历史，根据前m个分⽀的⾏为去选⼀个预测器，根据这个预测器内的分⽀历史来预测当前⽅向。

其性能远好于基本预测器。

在此基础上再做改进，有锦标赛预测器，即全局/局部⾃适应预测器，由⾃适应选择器来决定是使⽤全局预测器还是局部预测器。

锦标赛预测器是⽬前最好的预测器。

预测时应当可以获得分⽀⽬标地址，否则预测是没有意义的，因此，仅有分⽀历史表BHT的信息不⾜以进⾏动态分⽀预测的实现，我们通常需要分⽀⽬标缓冲器BTB来实现转移历史的管理。

BTB是⼀个类似Cache的结构。

查找时，⽤PC查BTB，当标记与PC内容相等时命中。

当BTB缺失且执⾏结果为转移时建⽴新⾏。

当BTB命中时根据执⾏结果更新对应⾏的转移历史。

在设置BTB后，IF段时查BTB，命中时写⼊PC，否则PC正常⾃增。

ID段判断是否为BTB缺失的分⽀指令，此处可以进⾏静态预测。

EX段根据执⾏结果更新BTB。

当出现错误预测时，需要清空流⽔线以恢复现场，并重置PC。

模拟分支预测器实验报告-

return flse;
switch (brnch) {
}
cse 1:
defult:
if (btbs[index].prediction = 2) {
error(brnch vlue error in check_prediction);
correct_predictions++;
return flse;
此外还需要定义一个测试类对 BTB 的方法进行测试，以及完成一些初
集统计信息。
第1页共1页
始化工作。
本文格式为 Word 版，下载可任意编辑，页眉双击删除即可。
btbs[i] = new BTB();
public clss BTBTest {
}
public sttic finl int M = 1;
第1页共1页
本文格式为 Word 版，下载可任意编辑，页眉双击删除即可。
误，让预报错误数目加一。具体如下所示：
} else {
//brnch 字段为真实的转移结果，1 表示转移，0 表示不转移。
mispredictions++;
boolen check_prediction(int brnch, int index) {
使用 Computer rchitecture: Quntittive pproch (Fourth Edition) 程的优点。将 BTB 定义为一个类，然后将对它的属性的操作看做该类本身
光盘中所附带的 history.txt 文件，模拟分支预报器的行为。该文件格式的行为，这样不但能够起到数据隐 XX 的效果，而且实现起来也比较方便。
prediction 字段为 0 或者 1 时，说明预报转移不发生，为 2 或者 3 时，

实验四：控制冒险与分支预测

深圳大学实验报告课程名称：计算机系统(3)实验项目名称：处理器结构实验二学院：********专业：*******************指导教师：*******报告人：****学号：*****班级：*************实验时间：2017年12月6日星期三实验报告提交时间：2017年12月21日星期四教务处制注：1、报告内的项目或内容设置，可根据实际情况加以调整和补充。

一、试验目的——控制冒险与分支预测了解控制冒险分支预测的概念了解多种分支预测的方法，动态分支预测更要深入了解理解什么是BTB（Branch Target Buffer），并且学会用BTB来优化所给程序利用BTB的特点，设计并了解在哪种状态下BTB无效了解循环展开，并于BTB功能进行对比对WinMIPS64的各个窗口和操作更加熟悉二、实验内容按照下面的实验步骤及说明，完成相关操作记录实验过程的截图：首先，给出一段矩阵乘法的代码，通过开启BTB功能对其进行优化，并且观察流水线的细节，解释BTB在其中所起的作用；其次，自行设计一段使得即使开启了BTB也无效的代码。

第三，使用循环展开的方法，观察流水因分支停顿的次数减少的现象，并对比采用BTB结构时流水因分支而停顿的次数。

（选做：在x86系统上编写C语言的矩阵乘法代码，用perf观察分支预测失败次数，分析其次数是否与你所学知识吻合。

再编写前面第二部使用的令分支预测失败的代码，验证x86是否能正确预测，并尝试做解释）三、实验环境硬件：桌面PC软件：Windows四、实验步骤及说明背景知识在遇到跳转语句的时候，我们往往需要等到MEM阶段才能确定这条指令是否跳转（通过硬件的优化，可以极大的缩短分支的延迟，将分支执行提前到ID阶段，这样就能够将分支预测错误代价减小到只有一条指令），这种为了确保预取正确指令而导致的延迟叫控制冒险（分支冒险）。

为了降低控制冒险所带来的性能损失，一般采用分支预测技术。

分支预测——精选推荐

分⽀预测分⽀预测4.1 概述分⽀预测和Cache⼀起左右着处理器的性能，⼀个准确度很⾼的分⽀预测是提⾼处理器性能的关键部件。

但由于不同程序的不同特性，适⽤于某个程序的分⽀预测器可能在另⼀个程序上效果很差。

取指阶段要对跳转指令进⾏预测，避免流⽔线⽆⽤功造成浪费。

如果等到跳转结果计算出来再进⾏取指，就会造成性能浪费。

分⽀预测之所以能够实现，是由分⽀指令的特性决定的。

⽅向，主要分为跳转和不跳转。

跳转也分为⽆条件跳转和有条件跳转。

⽬标地址⽬标地址⼀般两种形式。

第⼀种是直接跳转，在指令中以⽴即数的形式给出PC的偏移值。

第⼆种是间接跳转。

指令中给出寄存器号，通过寄存器号访问寄存器获取其中的值作为⽬标地址。

⼀般寄存器中的值是其他指令的结果，如果要等到执⾏阶段才能正确获取这个结果，那么这段时间进⼊到流⽔线的指令可能都是错误的，加⼤了分⽀预测失败的惩罚。

静态分⽀预测：预测分⽀指令总是不跳转，处理器顺序取指。

在执⾏阶段获得了实际的跳转⽅向和⽬标地址后，再看是否将这段时间进⼊到流⽔线的指令进⾏抛弃。

动态分⽀预测：根据分⽀指令在过去⼀段时间的执⾏情况来决定预测的结果。

动态分⽀预测硬件开销⼤，早期⼯艺落后，成本⾼昂。

但现在⼯艺进步，动态分⽀预测更加适应发展。

理想的分⽀预测在流⽔线中越靠前越好，因此最好在获得指令地址进⾏取指令的同时进⾏快速分⽀预测（利⽤指令地址进⾏预测，⽽⾮指令本⾝）。

跳转指令情景类型：for(i=0;i<1000;i++)4.2 分⽀指令的⽅向预测基于两位饱和计数器的分⽀预测根据⼀条分⽀指令前两次的执⾏结果来预测本次的⽅向，本质是⼀个4状态的状态机。

strongly taken和weakly taken都预测发⽣跳转，strongly not taken 和weakly not token都预测不跳转。

核⼼思想：当⼀条分⽀指令连续两次执⾏的⽅向都⼀样时，那么分⽀指令在第三次执⾏时也会有同样的⽅向。

分支预测策略

基本概念：静态分支预测：基于编译器的编译信息对分支指令进行预测，预测信息不再改变动态分支预测：依据程序运行的实时信息，不断对预测信息进行更新，具有较高的预测准确率A：基于局部历史的分支预测机制：该预测机制利用局部历史寄存器作为索引信息，利用分支指令前几次执行的结果与此次跳转方向的相关性B：全局预测分支机制：利用前几条分支指令的跳转信息来索引一个2位的分支预测表C：组合分支预测机制：该机制将不同的分支指令信息组合起来，决定分支指令的预测结果BHR（Branch History Register）:用来存储最近k个分支指令的预测结果PHT（Pattern History Table）：动态分支预测是近来的处理器已经尝试采用的的技术。

最简单的动态分支预测策略是分支预测缓冲区（Branch Prediction Buff)或分支历史表(branch history table)。

BHT——Branch History Table，顾名思义，这是记录分支历史信息的表格，用于判定一条分支指令是否token；这儿记录的是跳转信息，简单点的，可以用1bit位记录，例如1表示跳转，0表示不跳转，而这个表格的索引是指令PC值；考虑在32位系统中，如果要记录完整32位的branch history，则需要4Gbit的存储器，这超出了系统提供的硬件支持能力；所以一般就用指令的后12位作为BHT表格的索引，这样用4Kbit的一个表格，就可以记录branch history了。

当然，通过大伙的不懈努力和分析，发现在BHT中用1bit位记录分支是否跳转还不够准确，用2bit位记录就非常好了，而用3bit或者更多位记录，效果与2bit类似。

所以在BHT中，一般就用2bit位记录分支是否跳转：例如11和10表示这条分支会跳转；01和00表示分支不会跳转。

这个2bit计数器大伙叫做饱和计数器。

BTB——用于记录一条分支指令的跳转地址，由于这儿存储的是指令地址，例如32位地址，因此，这个表格就不能做到存储BHT那样多的内容了，如果也支持4K条指令，则需要128Kbit的存储空间，这几乎可以赶上一个L1Cache的容量了，所以BTB一般很小，就32项或者64项。

12-44.4 控制冒险的解决方法 - 课件

第四章第四节(4) 控制冒险的解决方法有四种方法可以解决流水线控制冒险①硬件阻塞（stall）②软件插入“NOP”指令③分支预测④延迟分支有四种方法可以解决流水线控制冒险①硬件阻塞（stall）②软件插入“NOP”指令③分支预测④延迟分支延迟分支后那条指令的执行，直到分支指令完成（产生新的PC值）❑简单（静态）预测❑动态预测❑简单（静态）预测⏹总是预测条件不满足，即：继续执行分支指令的后续指令⏹可使用启发式规则：在特定情况下总是预测转移成功（taken），其他情况则预测转移不成功。

比如循环顶（底）部分支总是预测为转移不成功（成功）。

能达到65%~85%的预测准确率❑动态预测❑简单（静态）预测⏹总是预测条件不满足，即：继续执行分支指令的后续指令⏹可使用启发式规则：在特定情况下总是预测转移成功（taken），其他情况则预测转移不成功。

比如循环顶（底）部分支总是预测为转移不成功（成功）。

能达到65%~85%的预测准确率❑动态预测⏹根据程序执行的历史情况，进行动态预测调整，能达到90%的预测准确率❑简单（静态）分支预测方法⏹总是预测条件不满足，即：继续执行分支指令的后续指令⏹预测错误时，需把流水线中三条本不该执行的指令丢弃掉Cycle 4Cycle 5Cycle 6Cycle 7Cycle 8Cycle 9Cycle 10Cycle 11IfetchReg/DecExec Mem Wr IfetchReg/Dec Exec Mem Wr 16: R-type IfetchReg/Dec Exec Mem Wr IfetchReg/Dec Exec Mem Wr 24: R-type12: Beq(target is 1000)20: R-typeClk IfetchReg/DecExecMemWr1000: Target of Beq❑简单（静态）分支预测方法⏹总是预测条件不满足，即：继续执行分支指令的后续指令⏹预测错误时，需把流水线中三条本不该执行的指令丢弃掉Cycle 4Cycle 5Cycle 6Cycle 7Cycle 8Cycle 9Cycle 10Cycle 11IfetchReg/DecExec Mem Wr IfetchReg/Dec Exec Mem Wr 16: R-type IfetchReg/Dec Exec Mem Wr IfetchReg/Dec Exec Mem Wr 24: R-type12: Beq(target is 1000)20: R-typeClk IfetchReg/DecExecMemWr1000: Target of Beq延迟损失时间片C ：预测错误给流水线带来的延迟损失。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

深圳大学实验报告课程名称：计算机系统(3)实验项目名称：处理器结构实验二学院：********专业：*******************指导教师：*******报告人：**** 学号：***** 班级：************* 实验时间：2017年12月6日星期三实验报告提交时间：2017年12月21日星期四教务处制注：1、报告内的项目或内容设置，可根据实际情况加以调整和补充。

第三，使用循环展开的方法，观察流水因分支停顿的次数减少的现象，并对比采用BTB结构时流水因分支而停顿的次数。

（选做：在x86系统上编写C语言的矩阵乘法代码，用perf观察分支预测失败次数，分析其次数是否与你所学知识吻合。

为了降低控制冒险所带来的性能损失，一般采用分支预测技术。

分支预测技术包含编译时进行的静态分支预测，和执行时进行的动态分支预测。

这里，我们着重介绍动态分支预测中的BTB（Branch Target Buffer）技术。

BTB即为分支目标缓冲器，它将分支指令（对应的指令地址）放到一个缓冲区中保存起来，当下次再遇到相同的指令（跳转判定）时，它将执行和上次一样的跳转（分支或不分支）预测。

一种可行的BTB结构示意图如下：注：1、报告内的项目或内容设置，可根据实际情况加以调整和补充。

注：1、报告内的项目或内容设置，可根据实际情况加以调整和补充。

在采用了BTB 之后，在流水线各个阶段所进行的相关操作如下：注意，为了填写BTB ，需要额外一个周期。

一、矩阵乘法及优化在这一阶段，我们首先给出矩阵乘法的例子，接着将流水线设置为不带BTB功能（configure->enable branch target buffer）直接运行，观察结果进行记录；然后，再开启BTB 功能再次运行，观察实验结果。

将两次的实验结果进行对比，观察BTB是否起作用，如果有效果则进一步观察流水线执行细节并且解释BTB起作用原因。

矩阵乘法的代码如下：.datastr: .asciiz "the data of matrix 3:\n"mx1: .space 512mx2: .space 512mx3: .space 512.textinitial: daddi r22,r0,mx1 #这个initial模块是给三个矩阵赋初值daddi r23,r0,mx2daddi r21,r0,mx3input: daddi r9,r0,64daddi r8,r0,0loop1: dsll r11,r8,3dadd r10,r11,r22dadd r11,r11,r23daddi r12,r0,2daddi r13,r0,3sd r12,0(r10)sd r13,0(r11)daddi r8,r8,1slt r10,r8,r9bne r10,r0,loop1mul: daddi r16,r0,8daddi r17,r0,0loop2: daddi r18,r0,0 #这个循环是执行for(int i = 0, i < 8; i++)的内容loop3: daddi r19,r0,0 #这个循环是执行for(int j = 0, j < 8; j++)的内容daddi r20,r0,0 #r20存储在计算result[i][j]过程中每个乘法结果的叠加值loop4: dsll r8,r17,6 #这个循环的执行计算每个result[i][j]dsll r9,r19,3dadd r8,r8,r9dadd r8,r8,r22ld r10,0(r8) #取mx1[i][k]的值dsll r8,r19,6dsll r9,r18,3dadd r8,r8,r9注：1、报告内的项目或内容设置，可根据实际情况加以调整和补充。

dadd r8,r8,r23ld r11,0(r8) #取mx2[k][j]的值dmul r13,r10,r11 #mx1[i][k]与mx2[k][j]相乘dadd r20,r20,r13 #中间结果累加daddi r19,r19,1slt r8,r19,r16bne r8,r0,loop4dsll r8,r17,6dsll r9,r18,3dadd r8,r8,r9dadd r8,r8,r21 #计算result[i][j]的位置sd r20,0(r8) #将结果存入result[i][j]中daddi r18,r18,1slt r8,r18,r16bne r8,r0,loop3daddi r17,r17,1slt r8,r17,r16bne r8,r0,loop2halt不设置BTB功能，运行该程序，观察Statistics窗口的结果截屏并记录下来。

接着，设置BTB功能（在菜单栏处选择Configure项，然后在下拉菜单中为Enable Branch Target Buffer选项划上钩）。

并在此运行程序，观察Statistics窗口的结果并截屏记录下来。

在这里，我们仅仅观察比较Stalls中的最后两项------Branch Taken Stalls和Branch Misprediction Stalls。

接下来，对比其结果。

我们就结合流水线执行细节分析造成这种情况发生的原因。

（30分，结果的获取10分，细节分析20分）二、设计使BTB无效的代码在这个部分，我们要设计一段代码，这段代码包含了一个循环。

根据BTB的特性，我们设计的这个代码将使得BTB的开启起不到相应的优化作用，反而会是的性能大大降低。

提示：一定要利用BTB的特性，即它的跳转判定是根据之前跳转成功与否来决定的。

给出所用代码以及设计思路，给出运行结果的截屏证明代码实现了目标。

注：1、报告内的项目或内容设置，可根据实际情况加以调整和补充。

（30分，代码及思路20，获取结果并证明目标实现10分）三、循环展开与BTB的效果比对首先，我们需要对循环展开这个概念有一定的了解。

什么是循环展开呢？所谓循环展开就是通过在每次迭代中执行更多的数据操作来减小循环开销的影响。

其基本思想是设法把操作对象线性化，并且在一次迭代中访问线性数据中的一个小组而非单独的某个。

这样得到的程序将执行更少的迭代次数，于是循环开销就被有效地降低了。

接下来，我们就按照这种思想对上述的矩阵乘法程序进行循环展开。

要求将上述的代码通过循环展开将最里面的一个执行迭代8次的循环整个展开了，也就是说，我们将矩阵相乘的三个循环通过代码的增加，减少到了两个循环。

比较，通过对比循环展开（未启用BTB）、使用BTB（未进行循环展开）以及未使用BTB 且未作循环展开的运行结果。

比较他们的Branch Tanken Stalls和Branch Misprediction Stalls的数量，并尝试给出评判。

（30分，循环展开代码及思路20分，评判10分）四、结束语写下对于这次试验的所得与感想。

（报告撰写质量10分）注：1、报告内的项目或内容设置，可根据实际情况加以调整和补充。

一、矩阵乘法及优化1.不设置BTB功能，运行该程序，观察Statistics窗口的结果截屏并记录下来。

2.接着，设置BTB功能（在菜单栏处选择Configure项，然后在下拉菜单中为Enable Branch Target Buffer选项划上钩）。

并在此运行程序，观察Statistics窗口的结果并截屏记录下来。

注：1、报告内的项目或内容设置，可根据实际情况加以调整和补充。

3.我们发现Branch Taken Stalls减少了，Branch Misprediction Stalls增加了。

3.1在Cycles窗口中进行对比，我们可以发现在没有BTB的时候：3.1.1第一次分支跳转错误，但是没有进行任何记录。

产生了一次控制冒险（还有一次数据冒险这里不再讨论）。

注：1、报告内的项目或内容设置，可根据实际情况加以调整和补充。

3.1.2第二次分支跳转仍然错误，但是没有进行记录。

又产生了一次控制冒险（还有一次数据冒险这里不再讨论）。

3.2我们可以发现在有BTB的时候：3.2.1第一次分支跳转错误，但是进行了记录。

产生了一次控制冒险，和一次记录BTB的阻塞。

（还有一次数据冒险这里不再讨论）。

注：1、报告内的项目或内容设置，可根据实际情况加以调整和补充。

3.2.2第二次由于有过记录，分支跳转正确。

没有产生控制冒险，由于预测正确，也没有产生由于记录BTB的阻塞。

（还有一次数据冒险这里不再讨论）。

3.2.3在最后一次预测中，分支跳转错误，产生了一次控制冒险和一次由于记录BTB引起的阻塞。

（还有一次数据冒险这里不再讨论）。

因此，在开启BTB后，预测错误会增加两个阻塞，预测正确会减少一个阻塞。

即Branch Taken Stalls减少，Branch Misprediction Stalls增加。

二、设计使BTB无效的代码1.在这个部分，我们要设计一段代码，这段代码包含了一个循环。

根据BTB的特性，我们设计的这个代码将使得BTB的开启起不到相应的优化作用，反而会是的性能大大降低。

1.1编写代码，计算0-18所有偶数的和.data.text注：1、报告内的项目或内容设置，可根据实际情况加以调整和补充。

注：1、报告内的项目或内容设置，可根据实际情况加以调整和补充。

daddi r8,r0,0 # 计数器daddi r9,r0,0 # 总和daddi r11,r0,18 # 最大值loop: beq r8,r11,enddaddi r8,r8,1bne r10,r0,zerodadd r9,r9,r8daddi r10,r0,1j loopzero: daddi r10,r0,0j loopend: halt1.2关闭BTB1.3开启BTB1.4通过反复切换跳转和不跳转，让BTB的预测错误，增大预测成本。

实验四控制冒险与分支预测

合集下载

分支程序的设计实验报告

分支结构控制实验报告

实验四分支程序与循环程序

实验四分支和循环程序设计实验(精)

实验四组合电路中的竞争与冒险

Java程序设计任务驱动式教程任务四挑战选择(使用分支控制流程)

实验四分支循环结构程序设计-4页文档资料

实验四组合电路的竞争冒险

简述影响指令执行时间的主要不确定因素

流水线分析例题

实验四组合电路中竞争与冒险(完成)

指令级并行：动态分支预测技术

模拟分支预测器实验报告-

实验四：控制冒险与分支预测

分支预测——精选推荐

分支预测策略

12-44.4 控制冒险的解决方法 - 课件

文档推荐

最新文档

实验四控制冒险与分支预测

合集下载

分支程序的设计实验报告

分支结构控制实验报告

实验四分支程序与循环程序

实验四分支和循环程序设计实验(精)

实验四 组合电路中的竞争与冒险

Java程序设计任务驱动式教程 任务四 挑战选择(使用分支控制流程)

实验四分支循环结构程序设计-4页文档资料

实验四 组合电路的竞争冒险

简述影响指令执行时间的主要不确定因素

流水线分析例题

实验四 组合电路中竞争与冒险(完成)

指令级并行：动态分支预测技术

模拟分支预测器实验报告-

实验四：控制冒险与分支预测

分支预测——精选推荐

分支预测策略

12-44.4 控制冒险的解决方法 - 课件

文档推荐

最新文档

实验四组合电路中的竞争与冒险

Java程序设计任务驱动式教程任务四挑战选择(使用分支控制流程)

实验四组合电路的竞争冒险

实验四组合电路中竞争与冒险(完成)