Intel IA-32处理器结构与原理

格式：ppt
大小：657.50 KB
文档页数：60

下载文档原格式

chapter2IA-32处理器体系结构

第2章 IA-32体系结构章体系结构
要点：要点：
1.基本概念基本概念 2.IA-32处理器体系结构处理器体系结构 3.IA-32的内存管理的内存管理
计算机科学系－计算机科学系－计算机导论课件
1
1.基本概念
微机的基本结构指令执行周期程序是如何运行的
计算机科学系－计算机科学系－计算机导论课件
计算机科学系－计算机科学系－计算机导论课件
16
P6处理器系列
奔腾Pro 奔腾
–提升了指令的执行速度
奔腾Ⅱ 奔腾Ⅱ
– MMX技术 MMX
奔腾Ⅲ 奔腾Ⅲ
– SIMD（流扩展），128位寄存器
奔腾Ⅳ 奔腾Ⅳ
– NetBurst结构 –面向高性能的多媒体应用程序
计算机科学系－计算机科学系－计算机导论课件
10
2.2 基本执行环境
地址空间
– 保护模式：4GB（32位地址，0～232-1） – 实地址模式：1MB（20位地址，0～220-1）
基本寄存器
– 寄存器（Register）是CPU内部的高速储存单元，访问速度比常规内存快得多。 – 由8个32位通用寄存器、6个16位段寄存器和一个存放处理器标志的寄存器（EFLAGS）和一个指令指针（EIP）组成。
2
1.1 微机的基本结构
数据总线
寄存器
中央处理器（CPU））
ALU CU 时钟
内存储器
I/O设备＃1 设备＃设备
I/O设备＃2 设备＃设备
控制总线
地址总线
计算机科学系－计算机科学系－计算机导论课件
3
1.1 微机的基本结构总线（bus）：一组用于在计算机各部分之间传送总线数据的并行线。

微机原理第2章 IA32结构微处理器及其体系结构

出版社
用于控制CPU能否相应可屏蔽中断请求。
若置IF＝1，则允许CPU去接收外部的可屏蔽的中断请求；(STI)
若使IF＝0，则屏蔽上述的中断请求；对内部产生的中断不起作
用。(CLI)
微计算机机原理 · 第 2 版电子工业出版社
③ 追踪标志TF（Trace Flag）/单步中断标志置TF=1，程序执行当前指令后暂停。置TF=0，程序执行当前指令后不暂停。用于调试程序，每执行完一条指令都可以停下来检查执行结果的状态。
② 辅助进位标志AF（Auxitiary Carry Flag）
字节操作时，低半字节（一个字节的D3）向高半字节有进位或电子借位，则AF＝1，否则为0。标志用于十进制算术运算指令中。工业 ③ 溢出标志OF（Overflow Flag）出版社在算术运算中，带符号数的运算结果超出了8位、16位带符号数
EU负责指令的执行。
由数据寄存器、指针寄存器与算术逻辑单元（ALU）组成。取指部分与执行指令部分是分开的，二者可以重叠进行
微计算机机原理 · 第 2 版电子工业出版社

在 8086 中，由于 BIU 和 EU 是分开的，所以，取指和执行可以重叠进行。
8086指令执行顺序
SP：堆栈指针，与段寄存器SS配合确定堆栈在内存中的位置。
BP（Base Pointer Register）：寻址堆栈操作数时，也是寻址堆栈段。 SI（Source Index Register）和DI（Destination Index Register）常用
于串操作。
微计算机机原理 · 第 2 版电子工业出版社

单元2IA32处理器架构-

六個階段都一直處於使用狀態中。一般而言，對於 k 階段的執行程序而言， n 個指令須要 k + (n - 1) 個時脈週期的執行時間。
浪費掉的時脈週期 ( 陰影部份 )
• 當階段之一需要二或者更多的時脈周期的時候，時脈周期再一次被浪費。
當階段數有 k 個 ( 其中一個階段須要 2 個週期 ) 時， n 個指令將須要 (k + 2n - 1）個週期來完成指令的執行
System path
多工
• 作業系統能夠同時執行多個任務。. • 相同任務裡同時執行多條線。 • 將 CPU 時間切割以後分配給每個執行緒。 • 任務的迅速切換。
• 所有程式同時執行的錯覺。 • 處理器一定要支援切換的任務。
IA-32處理器架構
• 運作模式 • 基本執行環境 • 浮點運算單元 • ntel微處理器沿革
• 控制單元負責在執行機器指令時，協調所有相關步驟的順序。 • 算術邏輯單元負責執行所有的算術運算和邏輯運算，其中算術運算包括
加法與減法運算，邏輯運算包括 AND、OR 和 NOT 運算。
時脈器 (Clock)
• 每一個與 CPU 和系統匯流排相關的運算都是藉著一個內部時脈器，以固定速率送出脈衝來進行同步
memory op1 op2
PC
program
I-1 I-2 I-3 I-4
fetch
read registers
registers instruction
I-1 registerdecLeabharlann dewrite write
flags (output)
ALU execute
多重管線操作
• Pipelining makes it possible for processor to execute instructions in parallel

第2章 IA-32架构

14
寄存器名
特
殊
用
途
SI
在字符串处理指令中作源变址寄存器用在间接寻址中作变址寄存器用
DI
在字符串处理指令中作目标变址寄存器用在间接寻址中作变址寄存器用
BP
在间接寻址中作基址指针用
SP
在堆栈操作中作堆栈指针用
15
2. 段寄存器组
8086CPU的BIU中设置4个16位段寄存器： •代码段寄存器CS（Code Segment） •数据段寄存器DS（Data Segment） •附加数据段寄存器ES（Extra Segment） •堆栈段寄存器SS（Stack Segment）
21
现将各标志位的定义说明如下：（1）CF（Carry Flag）进位标志位。如果做加法时最高位（字节操作是D7位，字操作是D15位）产生进位或做减法时最高位产生借位，则CF=1，否则CF=0。（2）PF（Parity Flag）奇偶标志位。如果操作结果的低八位中含有偶数个1，则PF=1，否则PF=0。（3）AF（Auxiliary Carry Flag）辅助进位标志位。如果做加法时D3 位有进位或做减法时 D3 位有借位，则 AF=1，否则AF=0。
第2章 IA-32结构微处理器及其体系结构
1
主要内容：
微型机的基本结构； 8088（8086）微处理器的工作原理、
引线及结构；
总线的一般概念。
2
§2.1 微处理器的主要性能指标
2.1.1 字长 2.1.2 指令数 2.1.3 运算速度 2.1.4 访存空间 2.1.5 高速缓存大小 2.1.6 虚拟存储空间 2.1.7 是否能构成多处理器系统 2.1.8 工艺形式及其他
12
寄存器名

IA-32处理器的功能结构

的数据堆栈段（Stack Segment）主存中堆栈所在的区
域。程序使用的堆栈一定在堆栈段。代码段寄存器CS，堆栈段寄存器SS，数据段寄存器
DS，附加段寄存器ES 。FS和GS都属于数据段性质的段寄存器段寄存器属于专门的寄存器，不能与通用寄存器一样使用，只能用于保存与段基地址有关的信息
总线接口单元
指令队列、指令指针、段寄存器、地址加法器和总线控制逻辑
管理与系统总线的接口，负责对存储器和外设访问
执行单元
ALU、通用寄存器、标志寄存器和控制电路负责指令译码、数据运算和指令执行
指令执行的两个主要阶段：取指和执行
取指：从主存取出指令代码进入指令队列执行：译码指令、并发出有关控制信号实现指令功能
处理器按照无符号整数求得结果设置进位标志CF 设置溢出标志OF
程序员决定操作数是无符号数，关心进位操作数是有符号数，注意溢出
IA-32处理器的功能结构
溢出标志的判断方法
处理器硬件判断规则
最高位和次高位同时有进位或同时无进位，无溢出；最高位和次高位进位状态不同，有溢出
人工判断的简单规则
数据存储格式举例
例2-4 在0x1000开始的存储单元依次存放的
字节是0x12，0x34，0x56，0x78，如图2-7所
示。分别以字节、字和双字访问存储单元，
其结果如何？
0x1004
...
0x1003
0x78
0x1002
0x56
0x1001
0x34
0x1000
0x12
图2-7各单元存储情况
IA-32处理器的功能结构
执行CLI指令设置IF=0 执行STI指令设置IF=1
IA-32处理器的功能结构

微机原理第13章 IA-32结构微处理器的结构与工作方式

�
13.2.7 任务切换 13.
任何多用户/ 任何多用户 / 多任务操作系统的一个非常重要的属性, 属性 , 就是它在各任务或各过程之间有快速切换的能微处理器通过硬件支持, 力.IA-32微处理器通过硬件支持,提供任务切换指令微处理器通过硬件支持直接支持这种操作. 直接支持这种操作.
13.3 虚拟虚拟8086方式方式
第13章 13章
IA-32微处理器的工作方式 IA-32微处理器的工作方式
IA-32微处理器有两种主要的工作方式:实地址微处理器有两种主要的工作方式: 微处理器有两种主要的工作方式方式和保护虚地址方式. 方式和保护虚地址方式.
13.1 13.2 13.3
实地址方式保护虚地址方式虚拟8086 8086方式虚拟8086方式
13.2.3 描述符 13.
在保护虚地址方式下的每一个段, 在保护虚地址方式下的每一个段 , 都有一个相应的描述符.描述符由8个字节组成个字节组成, 的描述符.描述符由个字节组成,包含了此段的基地段的大小( 位址 ( 32位) , 段的大小 ( 20位) , 段的类型等一些主位要特性. 要特性. 微处理器中, 在IA-32微处理器中,主要有两种类型描述符: 微处理器中主要有两种类型描述符: 代段码和数据段描述符; 代段码和数据段描述符; 特种数据段和控制描述符. 特种数据段和控制描述符. 在后一种里又分为特种数据段描述符和控制( 在后一种里又分为特种数据段描述符和控制 ( 门 ) 描述符两大类. 描述符两大类.
微处理器芯片中增加了一种虚拟8086方式. 方式. 在IA-32微处理器芯片中增加了一种虚拟微处理器芯片中增加了一种虚拟方式这是在保护虚地址方式下的一种方式, 这是在保护虚地址方式下的一种方式,即IA-32微处理微处理器总体上是工作在保护虚地址方式,支持多用户, 器总体上是工作在保护虚地址方式 , 支持多用户 , 多任务操作系统的运行,而在多任务的环境中, 任务操作系统的运行 , 而在多任务的环境中 , 有的任务可以工作在虚拟8086方式. 也即在一个多用户 , 多方式. 务可以工作在虚拟方式也即在一个多用户, 任务的操作系统(பைடு நூலகம்例如UNIX系统) 中,其主体是工系统) 任务的操作系统( 例如系统作在IA-32微处理器的保护虚地址方式,可以做到有的微处理器的保护虚地址方式, 作在微处理器的保护虚地址方式任务运行于32位的保护方式运行UNIX支持下的软件; 位的保护方式, 支持下的软件; 任务运行于位的保护方式,运行支持下的软件有的任务运行在80286的应用软件;也有的任务运行在的应用软件; 有的任务运行在的应用软件虚拟8086方式,执行DOS的应用软件. 虚拟方式,执行的应用软件. 方式的应用软件

微机原理第2章IA32微处理器的功能结构

（3）系统标志和IOPL字段
1、中断允许标志I
2、追踪标志T 3、IOPL特权级字段
条件转移指令
说明：指令中的字母N表示not，如果不带N说明标志为0转移，如果带N说明标志为1转移。
1、根据单个标志位的转移指令
JC
CF
JNC
JO OF
JNO
JE / JZ ZF
JNE /JNZ
JP PF
JNP
JS
SF JNS
JCXZ （CX = 0 转）
4、指令指针
8086CPU中的指令指针IP，它总是保存下一次将要从主存中取出指令的偏移地址，偏移地址的值为该指令到所在段段首址的字节距离。在目标程序运行时， IP的内容由微处理器硬件自动设置，程序不能直接访问IP，但一些指令却可改变IP的值，如转移指令、子程序调用指令（ JMP、CALL、RET、IRET ）等。
实地址；保护模式；虚拟8086模式；
2.3 IA-32结构微处理器的执行环境
2.3.2 基本执行环境
（1）存储器地址空间（8086）
220=1MB，地址由00000-FFFFF(H)编码
若存放的信息是字节，则按顺序存放若存放的信息是字，则将字的低位字节存放在低地址，高位字节存放在高地址若存放的信息是双字，则将双字的低位字存放在低地址，高位字存放在高地址
计算机体系结构是连接硬件和软件的一门学科，它研究的内容不但涉及计算机硬件，也涉及计算机软件。
计算机体系结构（应用）、组成（设计）及物理实现（制造）
“系统结构” 是指概念性结构和功能特性（功能模块），就相当于动物的器官组成及其功能特性，如鸡有胃，胃可以消化食物。至于鸡的胃是什么形状的、鸡的胃部由什么组成就不是“系统结构”研究的问题了，而是“系统组成”研究的问题。所谓“系统组成”就是在逻辑上如何实现这种功能（功能模块的组成器件），比如“上帝”给鸡设计了一个一定大小的胃，这个胃的功能是消化食物，那消化系统的逻辑实现，就是要通过鸡喙吃进食物和砂石,再通过胃的蠕动、依靠砂石的研磨来消化食物。而计算机物理实现，主要着眼于器件技术和微组装技术（器件的物理实现）。拿上面的例子来说，这个胃由哪些组织组成几条肌肉和神经来促使它运动就是"鸡实

chapter2 IA-32处理器体系结构

计算机科学系－汇编语言程序设计
7
PC
I-1
存储器
OP1 OP2
程序
I-2
I-3
I-4
读
寄存器
寄存器
I-1
指令队列
解码写写标志（输出）
ALU
执行
图2.2 指令执行周期

如果指令的执行过程使用了内存操作数，那么需要5种基本操作： –取指令：控制单元取得指令，将其从存储器拷贝到CPU中并
增加程序计数器PC的值。
u
v
S5 S6

现在假设在6级流水线中再引入一条流水线，奇数指令进入u流水线，偶数指令进入v流水线，这样就消除周期的浪费。那么对于k级的双流水线处理器，执行n条指令只需要k+n
I-1 I-1 I-2 I-3 I-2 I-1 I-3 I-2 I-1 I-3 I-2 I-3
个时钟周期。
6级超标量流水线处理器的指令执行情况
计算机科学系－汇编语言程序设计
20

2. 多任务

操作系统运行的可以是一个进程或一个执行线程。一个进程可能包含多个相互独立的任务，每个任务被称为一个执行线程。当操作系统能够同时运行多个任务时，就被认为是多任务的。由于CPU一次只能执行一条指令，如何实现多任务呢？通过OS的调度程序(scheduler)为每个任务分配一小部分CPU时间(称为时间片)，在时间片内，CPU将执行一部分该任务的指令，并在时间片结束的时候停止执行。通过在多个任务之间的快速切换，给人以同时运行多个任务的假象。

CPU通过插入CPU插槽的引脚同计算机的其余部分相连接，大部分引脚与数据总线、控制总线和地址总线相连接。

intelIA-32架构简介

intelIA-32架构简介intel IA-32架构简介IA32的cpu操作模式1保护模式:这个模式是cpu的native状态.它可以在一个保护的多任务的环境中直接执行"real-address mode"的8086的软件.这个特性叫做virtual-8086模式.这个模式也就是cpu的一般工作模式.因为这个模式基本上打开了cpu的所有特性.2 real-address模式:这个模式它实现了一个8086处理器的环境的扩展.换句话说,可以说是模拟了一个8086的程序环境.计算机在重启或者开机的时候就处于这个模式,因此每次开机需要操作系统来切换到保护模式.这个模式中很多cpu的特性都是被关闭的.3 system management 模式(SMM)这个模式提供给操作系统一个执行平台指定的功能,提供了一个透明的架构.比如系统安全或者电源管理.当进入到smm中后,cpu保存当前的运行上下文,然后跳转到一个完全隔离的地址空间.然后smm指定的代码会被执行.当从smm返回时,处理器会返回刚才保存的状态.IA-64的cpu操作模式:IA-64加了一个模式就是IA-32e.这个模式包含下面两种子模式.1 compatibility 模式这个模式主要是用来不重新编译32位或者16位的程序,而能直接在64位处理器上运行.2 64位模式这个模式他所要求的环境必须是64位的操作系统,以及64位的应用程序.这个模式下能存取64位的线性地址空间.一个64位的操作系统既能在64位模式运行64位的应用程序,也能在兼容模式下运行32位程序(不重新编译).执行环境:1 地址空间IA-32 最大有4GB 线性地址空间,以及64GB物理地址空间内存存取是虚拟为一个栈来进行的.内存模型,也就是程序用来存取内存的方式:1 flat memory模型在这个模型下,内存看起来就是单独的持续的地址空间.这个空间叫做线性地址空间.代码,数据以及栈都是保存在这个地址空间内.2 segments内存模型.这个模型下,内存看起来就是由一些不连续的地址空间组成的,这些地址空间就称为段.数据,代码,以及栈包含在不同的段里面.要在一个段里面寻址,则程序必须生成一个逻辑地址.逻辑地址由一个段选择符和一个位移组成.在内部,所有的段都被映射为线性地址,因此要存取一个内存位置,处理器必须翻译逻辑地址到线性地址.3 Real-address mode memory model这个模式主要是针对8086处理器的.下面这张图表示了3种内存模型：寄存器:下面这张图表示了IA-32架构的所有寄存器：段选择符必须保存到段寄存器中.一共6个段寄存器.分别代表不同的段.cs,ss,分别代表代码段以及栈段.剩下的都是数据段寄存器.General-Purpose Registers有8个,分别是EAX, EBX, ECX, EDX, ESI, EDI, EBP, 和 ESP.ebp和esp为帧指针和栈指针.数据类型:1 byte,words,doublewords,quadwords以及doublequadwords.分别是8位,16位,32位,64位,128位.这里要注意doublequadwords只有在拥有sse扩展的处理器才存在.下面这张图表示了所有的数值类型:存取words,doublewords,quadwords以及doublequadwords 的地址最好都要自然对齐,一般是4字节或者8字节对齐.如果是一次没有对齐的内存存取,则处理器将会请求两次内存存取,才能取到对应的内存数据.还有一些指令操作doublequadwords时也要求对齐.如果是非对齐的存储的话,会产生一个general-protection exception (#GP).而他一般是16字节对齐.IA-32的浮点是符合IEEE 754的标准的.具体格式可以看下面的表:2 指针类型.near pointer和far pointerfar pointer是一个逻辑地址由段选择符和位移组成:还有一些类型比如String,BCD等,这里都没有介绍,详细的请去看intel的官方手册.函数调用:主要是4条指令 CALL,RET,ENTER以及LEAVE.栈只不过是在内存中虚拟出来的一块类似数组的区域(或者说是段)而已,段寄存器SS保存有栈的地址.使用PUSH和POP指令来操作数据的压栈,入栈.这里要注意栈是向下增长的.下图就是栈的结构:初始化和确立一个栈为当前栈,也就是栈的切换需要下面几个步骤:1 建立一个stack段.2 load这个段选择符到SS寄存器.这里能使用MOVE,POP或者LSS.3 load栈指针到ESP寄存器.栈的对齐:栈的地址(其实也就是栈的段描述符)必须是16位或者32位对齐.依赖于段的宽度.因此我们经常可以看到汇编中这一句：and $0xfffffff0,%esp这句也就是对其的语句。

IA-32指令系统概述

Intel处理器已停产现有产品IA-32/x64指令系统概述•x86是Intel开发的一类处理器体系结构的泛称–包括Intel 8086、80286、i386和i486等，因此其架构被称为“x86”–由于数字并不能作为注册商标，因此，后来使用了可注册的名称，如Pentium、PentiumPro、Core 2、Core i7等–现在Intel把32位x86架构的名称x86-32改称为IA-32–IA是Intel Architecture的缩写•由AMD首先提出了一个兼容IA-32指令集的64位版本–扩充了指令及寄存器长度和个数等，更新了参数传送方式–AMD称其为AMD64，Intel称其为Intl64（不同于IA-64）–命名为“x86-64” ，有时也简称为x64IA-32的体系结构是怎样的呢？寄存器个数及各自功能？寄存器宽度？存储空间大小？编址单位？指令格式？指令条数？指令操作功能？寻址方式？数据类型？小端/大端？标志寄存器各位含义？PC位数？I/O端口编址方式？……控制器CPU PC 输入设备输出设备MAR MDR A L U 标志寄存器IR 地址数据控制GPRs 01存储器01234控制器A L U 标志寄存器地址数据控制GPRs 017ffffffff80483d680483d580483d405589e5EIP bfff0000MDR IR MAR beeefffc IA-32的体系结构是怎样的呢？8个GPR（0~7），一个EFLAGs，PC为EIP 可寻址空间4GB（编号为0~0xFFFFFFFF）指令格式变长，操作码变长，指令由若干字段（OP、Mod、SIB等）组成……计算机中数据的存储•计算机中的数据存放在哪里？寄存器文件通用寄存器组GPRs 存储器指令中需给出的信息：操作性质（操作码）源操作数1 或/和源操作数2 （立即数、寄存器编号、存储地址）目的操作数地址（寄存器编号、存储地址）存储地址的描述与操作数的数据结构有关！相当于宿舍书架相当于图书馆书架IA-32支持的数据类型及格式IA-32架构由16位架构发展而来，因此，虽然字长为32位或更大，但一个字为16位，长度后缀为w；32位为双字，长度后缀为l long double实际长度为80位，但分配96位=12B（按4B对齐）IA-32的寄存器组织IA-32的寄存器组织反映了体系结构发展的轨迹，字长不断扩充，指令保持兼容ST(0) ~ ST(7)是80位，MM0 ~MM7使用其低64位80286/386•6个条件标志8086IA-32的寻址方式•寻址方式–如何根据指令给定信息得到操作数或操作数地址•操作数所在的位置–指令中：立即寻址–寄存器中：寄存器寻址–存储单元中（属于存储器操作数，按字节编址）：其他寻址方式•存储器操作数的寻址方式与微处理器的工作模式有关–两种工作模式：实地址模式和保护模式•实地址模式（基本用不到）–为与8086/8088兼容而设，加电或复位时–寻址空间为1MB，20位地址：(CS)<<4+(IP)•保护模式（需要掌握）–加电后进入，采用虚拟存储管理，多任务情况下隔离、保护–80286以上微处理器的工作模式–寻址空间为232B，32位线性地址分段（段基址+段内偏移量）保护模式下的寻址方式•SR段寄存器（间接）确定操作数所在段的段基址•有效地址给出操作数在所在段的偏移地址•寻址过程涉及到“分段虚拟管理方式”，将在第6章讨论存储器操作数跳转目标指令地址SKIPIA-32的寄存器组织返回寻址方式int x；float a[100];short b[4][4];char c;double d[10];a[i]的地址如何计算？104+i×4i=99时，104+99×4=500 b[i][j]的地址如何计算？504+i×8+j×2i=3、j=2时，504+24+4=532 d[i]的地址如何计算？544+i×8i=9时，544+9×8=616b31b0xa[0]a[99]b[0][1]100104b[0][0]b[3][3]b[3][2]c500504532536544d[0]d[9]616Linux系统：double型变量按4B边界对齐windows系统：double型变量按8B边界对齐各变量应采用什么寻址方式？x、c：位移/ 基址a[i]：104+i×4，比例变址+位移d[i]：544+i×8，比例变址+位移b[i][j]：504+i×8+j×2，基址+比例变址+位移int x ；float a[100];short b[4][4];char c;double d[10];b31b0xa[0]a[99]b[0][1]100104b[0][0]b[3][3]b[3][2]c500504532536544d[0]d[9]616将b[i][j]取到AX中的指令可以是：“movw 504(%ebp ,%esi ,2), %ax”其中，i×8在EBP中，j在ESI中，2为比例因子位移量和立即数都可以是：1B/2B/4BSIB 中基址B和变址I都可是8个GRS中任一个；SS给出比例因子操作码：opcode; W：与机器模式（16 / 32位）一起确定寄存器位数（AL / AX / EAX）; D：操作方向（确定源和目标）寻址方式（ModRM字节）：mod、r/m、reg/op三个字段与w字段和机器模式（16/32）一起确定操作数所在的寄存器编号或有效地址计算方式IA-32机器指令格式8d 04 02 leal (%edx,%eax,1), %eax 1000 110100 000 10000 000 010存储器操作数总结•IA-32是典型的CISC（复杂指令集计算机）风格ISA–8个通用寄存器（8位、16位、32位）–2个专用寄存器：EIP（PC）、标志寄存器EFLAGS –6个段寄存器（间接给出段基址）–存储器地址空间为4GB，按字节编址，小端方式–寻址方式•立即、寄存器、存储器（SR :[B]+[I]*s+A ）•相对寻址–变长指令字、变长操作码•汇编语言格式–Intel格式汇编–AT&T格式汇编（本课程使用）段基址+有效地址（偏移量）8(%edx,%eax,4)。

第二章 IA-32结构微处理器

控制总线
通用寄存器组
地址寄存器组
地址总线
内部数据总线
数据总线
暂存器
累加器
ALU
1.算术逻辑单元（运算器） 2.寄存器组 3.指令处理单元（控制器）
2.1.2 8088微处理器的功能结构
从程序员和使用者的角度看到的结构，又称编程结构。 8088的内部结构从功能上分成两个单元
1. 总线接口单元BIU（Bus Interface Unit）负责CPU对存储器和外设进行访问，即负责与存储器及I/O接口之间的数据传送操作 2. 执行单元EU（Execution Unit）负责指令的译码、执行和数据的运算
第二章
IA-32结构微处理器
第2章：IA-32结构微处理器教学重点
8088/8086微处理器结构
1.基本结构 2.功能结构 3.寄存器结构 4.存储器结构
2.1 8086/8088微处理器
8086/8088微处理器是Intel公司推出的第三代CPU芯片，它们的内部结构基本相同，都采用16位结构进行操作及存储器寻址，但外部性能有所差异，两种处理器都封装在相同的40脚双列直插组件（DIP）中。 8086微处理器的一般性能特点： 1、16位的内部结构，16位双向数据信号线； 2、20位地址信号线，可寻址1M字节存储单元； 3、较强的指令系统； 4、利用第16位的地址总线来进行I/O端口寻址，可寻址64K个I/O端口； 5、中断功能强，可处理内部软件中断和外部中断，中断源可达256个； 6、单一的＋5V电源，单相时钟5MHz。
控制标志－－可由程序根据需要用指令设置，用于控制处理器执行指令的方式
DF IF TF
标志寄存器FLAGS
15 12 11 10 9 8 7 6 5 4 3 2 1 0

第2章 Intel IA-32处理器结构与原理

18
现代微机原理与接口技术(第2版)
2.快速执行引擎
NetBurst微结构中配置了一种时钟缓冲器电路，可以使该结构下2个执行简单指令的ALU和2个存储地址 AGU运行在两倍的CPU核心频率下
3.高级动态执行
• 一个高达126条指令的超大指令窗口，避免了处理器为了等待配对指令而出现暂时的停顿，也减少了因 Cache没命中，到主存中获取数据而产生等待的次数。 • 一个4KB的分支目标缓冲器BTB记录更多的过去分支的历史细节，再配以改进的分支预测算法，使分支预测失误率比Pentium III下降了33％。
10
现代微机原理与接口技术(第2版) 2.1.2 Pentium处理器的内部结构与工作原理
分支目标缓冲器
分支检测和目标地址预取地址
TLB 代码 Cache 8KB 256位预取缓冲存储器指令译码部件
①
控制 ROM
指令指针
②
64位数据总线 32位地址总线控制
总线接口部件
19
现代微机原理与接口技术(第2版)
4. 执行跟踪Cache（execution trace Cache）
放弃L1 指令Cache的设计，采用执行跟踪Cache，它在译码器的后面，按程序流顺序存放已经译码好的最多12,000条微指令，
5. 高速系统总线
采用了一种 “四倍速”技术—quad pumping，使得前端总线能很方便的工作再4倍于系统总线的频率上。
除法器
32位 32位 32位乘法器 80位 80 位
11
现代微机原理与接口技术(第2版)

整数处理部件浮点处理部件分离型cahce 指令预取指令配对

第2章 IA32结构微处理器及其体系结构

微计算机机原理 · 第 2 版电子工业出版社

堆栈（ stack ） : 为支持过程或子程序调
用并在过程或子程序之间传递参数，堆栈和堆栈管理资源包含在基本执行环境中。堆栈定位在内存中。

I/O端口:8086结构支持数据在处理器和输
入输出（I/O）端口之间的传送。
微计算机机原理 · 第 2 版电子工业出版社
2.1
IA-32 微处理器是8086的延伸

如上章所述， IA-32 结构微处理器的增长基本上按摩尔定律发展，已经经历许多代。但从使用者（包括程序员）的角度来看，它是以8086 处理器为基础，是一个兼容的微处理器系列，是8086 在功能上和性能上的延伸。
微计算机机原理 · 第 2 版电子工业出版社
8086是IA-32系列处理器的基础。
任一种 IA-32 处理器芯片在上电后，就是处在8086的实模式。根据需要，用指令进入各种操作模式。

从编程来说，几乎没有用汇编语言来使用浮点指令、MMX指令与XMM指令的，都是通过高级语言来使用这些指令的。绝大部分程序员，除了编写操作系统代码的外，面对 IA-32 处理器的指令，实际上是面对8086指令。
微计算机机原理 · 第 2 版电子工业出版社
2.3.1
基本执行环境概要

在8086处理器上执行的程序或任务都需要有一组执行指令的资源用于存储代码、数据和状态信息。这些资源构成了8086处理器的执行环境。

地址空间：8086处理器上运行的任一任务或
程序能寻址1MB（220）字节的线性地址空间。

IA-32

IA-32处理器体系结构第一节、微机的基本结构一、CPU主要单元CPU(Central processor unit)由以下几个部分组成：1）控制单元，负责总线操作，指令调度，数据访问调度等2）算术逻辑单元，负责对输入数据进行处理3）寄存器，存储用于CPU执行计算、地址访问、指令指针、标志位等的数据4）时钟，发送时钟脉冲，以便执行指令操作，时钟脉冲时间称为一个时钟周期二、BUS总线CPU通过总线和外部设备执行通信1）控制总线用于传输IO指令2）地址总线用于指示IO地址3）根据指令和地址，IO设备通过数据总线读/写数据三、CPU基本结构图示1）从内存中取出指令2）取数据：寄存器、内存操作数3）解指令4）执行5）输入操作数到算术逻辑单元6）更新标志寄存器，数据输出到寄存器或内存第二节、内核处理机制一、Pipelining 使用多级流水线当前流水线单元处理一条操作指令并移入下一个环节时，当前单元马上接受上游传递的任务指令，而不是等待所有处理单元完成时，称为多级流水线技术（Pipelining）。

k级流水线处理一条指令的周期是k，n条指令的周期是k + (n - 1)，一条指令执行k个时钟周期，二条指令需要k + 1个时钟周期，前一条指令执行完毕，跟随的指令处于流水线的最下游，n条指令的执行周期依此类推。

二、Super scalar 超标量体系结构当某级流水线处理指令需要1个以上时钟周期，则上游指令必须进入等待，使用多条流水线以便在同一级流水线的同一个时钟周期处理多条指令。

三、内存读取因为IO设备、CPU指令执行、系统总线之间的不同步，CPU执行单元等待操作数从内存中取出称为等待状态。

读内存数据的周期分解：1）将内存地址放入数据总线2）设定读标志为低位，以通知存储器准备数据3）存储器响应读标志，在指定地址取出数据放置到数据总线4）数据被CPU获取，恢复读标志的高位状态四、Cache memory CPU高速缓存利用CPU内置的一级、二级缓存，提高CPU指令访问内存操作数的效率，当请求的内存操作数位于L1或L2缓存时，CPU就无需从慢得多的RAM设备请求数据，称为缓存命中。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

执行引擎 Local Local APIC APIC L2 Cache
总线接口
14
系统总线
系统总线
AMD的双核
Intel的Pentium D双核
15
4. Intel的EM64T技术
• 完全兼容现在的IA-32结构 • 具有传统IA-32模式和IA-32e模式，IA-32e模式包括64位模式和兼容模式（允许现有程序无需修改就运行在传统IA-32模式和兼容模式下） • 64位模式下具有以下特性： 64位平板线性地址增加8个新的通用寄存器增加8个新的流SIMD扩展（SSE, SSE2和 SSE3) 64位宽的通用寄存器和指令指针寄存器
7
2.3 NetBurst微结构的处理器
2.3.1 NetBurst微结构概述
1. 超级流水线技术衡量CPU的性能指标是CPU完成应用程序所需的总时间。其计算公式如下： CPU性能=CPU的主频×IPC IPC是每时钟执行的指令条数。要提高CPU性能，可采用提高CPU主频和提高IPC。要提高主频→减少每个流水级的执行周期→要减小每个流水级的任务量→将任务再分解→增加流水线深度
• 保护模式 - 支持多任务操作，并保护每个任务的数据和程序 - 存储器采用虚拟地址空间、线性地址空间和物理地址空间三种方式来描述，具有存储保护功能 - 虚拟地址空间64TB（246） - 4级管理，可以使用分页或分段技术管理内存 - Windows、Linux操作系统均运行在该模式下
27
• 虚拟8086模式（V86模式） - 在保护模式下可以同时模拟多个8086处理器的工作
25
• Intel高级数字多媒体增强技术 (Intel® Advanced Digit Media Boost) 引入128 位SIMD执行单元可以在一个时钟内完成128位的SIMD整型和浮点运算。
26
2.5 IA-32处理器基本执行环境
• 实地址模式 - 与8086/8088兼容，但可以处理32位数据 - 1MB内存空间，分段管理，所有程序全在0 (核心)级 - MS-DOS运行在此模式下，PC机开机首先进入的也是该模式 - 对内存和程序甚至操作系统没有任何保护能力
18
Core微结构的处理器系列
桌面平台的Conroe 移动平台的Merom 服务器平台的Woodcrest Core处理器 Core 2处理器单核的Core Solo 双核的Core Duo, Core 2 Duo 四核的Core 2 Quad
19
2.4.2 Conroe处理器内部per-Threading, HT)技术
• 允许物理上单个的处理器采用共享执行资源的方法同时执行两个或更多的分离代码流（线程） • HT技术由单处理器上的2个或者多个逻辑处理器组成，每个逻辑处理器都有自己的IA-32结构状态(AS) • 每个逻辑处理器都有自己的IA-32通用寄存器、段寄存器、控制寄存器、调试寄存器等 • 逻辑处理器共享的资源包括执行引擎和系统总线接口
9
4. 执行跟踪Cache（execution trace Cache）
放弃L1 指令Cache的设计，采用执行跟踪Cache，它在译码器的后面，按程序流顺序存放已经译码好的最多12,000条微指令，
5. 高速系统总线
采用了一种 “四倍速”技术—quad pumping，使得前端总线能很方便的工作再4倍于系统总线的频率上。
5
关于乱序执行技术
为了提高指令流的执行效率，乱序执行核心监视很多条指令，然后在不损失数据完整性的前提下，采用能充分发挥多个处理部件并行工作的指令顺序来执行。这个指令顺序可能和原始程序的不一样。 1）A=B+C 2）P=A*2 3）Q=D-E
1）和3）可配对同时执行
6
2.2.2 Pentium III处理器内部结构及工作原理
23
• Intel 智能内存访问（Intel® Smart Memory Access）内存消歧技术利用装载（load）数据指令和存储（store）数据指令之间的乱序执行来提高乱序执行部件的效率，其原则是尽量将 load指令提到它前面不冲突的store指令之前执行。高级预取技术解决了确保被使用的数据已经位于最靠近能获得最小内存延迟的地方的问题。
24
• Intel高级智能Cache (Intel® Advanced Smart Cache) －带来了新的双核结构采用了共享L2 Cache的双核结构可以在两个核心间动态调整L2 Cache的分配
AS
执行引擎 AS 执行引擎
Local APIC Local APIC L2 Cache 总线接口系统总线
MOV AX, 200 MOV CX, AX
MOV AX, 200 MOV AX, 412
4
2.2 P6微结构的处理器
2.2.1 P6微结构概述
L2 Cache
后端总线
Pentium II • 采用12级3流水超标量结构 • 多路分支预测 FSB 前端总线 -预测分支未来的方向，为处理器预北桥内存先译码分支之后的指令提供依据 • 动态数据流分析 - 处理器分析几条指令的数据相关性和资源可用性 - 以优化的执行顺序高效地乱序执行这些指令 • 推测执行 - 在假设分支走向基础上，执行其中一路指令流 • 双独立总线结构 - 后端总线连接到L2 Cache上 - 前端总线FSB主要负责主存储器的信息传送操作
6. 高级传输Cache
采用8路相联的片内L2 Cache ，与核心同频工作，与 CPU核心的专用总线宽度为256位，是过去的4倍，这样主频为2.8GHz的Pentium 4其数据带宽将为89.6GBps 。
10
2.3.2 Pentium 4处理器内部结构及工作原理
11
2.3.3 NetBurst微结构处理器的新技术
除法器
32位 32位 32位乘法器 80位 80 位
3
指令配对规则
• 配对的指令必须是简单指令 • 两条指令之间不可存在“写后读”或“写后写”这样的寄存器相关性 • 一条指令不能同时既包含位移量又包含立即数 • 带前缀（JCC指令的OF除外）的指令只能出现在U 流水中 • 浮点运算指令不能和任何指令配对（FCXH除外）
第2章 Intel IA-32处理器结构与原理
张明武
scauzhang@
华南农业大学信息（软件）学院
1
2.1 Pentium处理器
2.1.1 Pentium处理器的特性 • 80x86系列微处理器兼容 • 有64位数据总线、 32位地址总线，寻址空间4GB。 • RISC型超标量结构 - 两个5级整数指令流水线，一个8级浮点流水线。 • 具有超级流水线技术的高性能浮点运算器。 • 数据-代码分离式高速缓存，符合MESI协议。 • 增强的错误检测和报告功能。 • 利用片上分支目标缓冲器提高分支指令预测准确性。 • 常用的指令不采用微程序设计，而改用硬件实现。 • 支持64位外部数据总线突发传输方式 • 通过APIC总线支持多处理器系统
16
5. Intel的虚拟化技术

在硬件层面上提供多虚拟系统功能一个机器可以虚拟成多个机器，甚至同时可以运行多个相同或不同的操作系统。虚拟机监控程序（VMM）为每个操作系统提供一个虚拟的硬件环境
17
2.4 Core微结构的处理器
2.4.1 Core微结构的引入
NetBurst微结构的缺陷： • IPC表现不佳，同频情况下Pentium 4有时还不如前代的Pentium III • 频率提高后，功耗随之上升，功耗过高，影响了主频的进一步提高。 Power = Cdynamic×电压×电压×频率其中Cdynamic是面积与处于活跃状态的数据位×翻转的触发器数量的乘积。
比较项目
内存管理
实地址模式
分段管理
虚拟8086模式
既分段又分页
存储空间
多任务
1MB
不支持
每个8086程序任务寻址1MB，总寻址空间4GB 支持，虚拟8086模式是IA-32保护模式中多任务的一个任务
• 系统管理模式 - 为操作系统和正在运行的应用程序提供透明的电源管理和系统安全平台功能 - 进入本模式系统将转到一个独立的地址空间运行，并保存当前程序或任务的基本环境
Pentium D IA-32处理器 AS A S 执行引擎执行引擎 Pentium EE IA-32处理器 AS AS
AS
AS
Local APIC Local APIC
L2 Cache 总线接口 L2 Cache 总线接口
执行引擎 Local Local APIC APIC L2 Cache 总线接口
1. SIMD技术
• 57条MMX指令操作8个64位长的MMX寄存器内的紧缩字节（8个字节打包成一个64位长的数据）、字或双字整型数上执行SIMD • 70条SSE指令处理在8个128位的XMM寄存器中的单精度浮点数和在MMX寄存器中的紧缩整数。高速缓存控制指令通过增加主存到Cache和处理器到主存的数据流，改善存储性能，SIMD浮点指令使处理器能同时执行4个浮点操作。 • 144条SSE2指令处理在XMM寄存器中的紧缩双精度浮点数和在MMX与XMM寄存器中的紧缩整数。 • 13条SSE3指令增强SSE, SSE2和x87FPU数学能力的性能。 12
2
2.1.2 Pentium处理器的内部结构与工作原理
分支目标缓冲器
分支检测和目标地址预取地址
TLB 代码 Cache 8KB 256位预取缓冲存储器指令译码部件
①
控制 ROM
指令指针
②
①=指令预取 ②=首次译码 ③=二次译码 ④=指令执行 ⑤=写回R
浮点部件
控制寄存器组

Intel IA-32处理器结构与原理

合集下载

chapter2IA-32处理器体系结构

微机原理第2章 IA32结构微处理器及其体系结构

单元2IA32处理器架构-

第2章 IA-32架构

IA-32处理器的功能结构

微机原理第13章 IA-32结构微处理器的结构与工作方式

微机原理第2章IA32微处理器的功能结构

chapter2 IA-32处理器体系结构

intelIA-32架构简介

IA-32指令系统概述

第二章 IA-32结构微处理器

第2章 Intel IA-32处理器结构与原理

第2章 IA32结构微处理器及其体系结构

IA-32

文档推荐

最新文档

Intel IA-32处理器结构与原理

合集下载

chapter2IA-32处理器体系结构

微机原理第2章 IA32结构微处理器及其体系结构

单元2IA32处理器架构-

第2章 IA-32架构

IA-32处理器的功能结构

微机原理 第13章 IA-32结构微处理器的结构与工作方式

微机原理第2章IA32微处理器的功能结构

chapter2 IA-32处理器体系结构

intelIA-32架构简介

IA-32指令系统概述

第二章 IA-32结构微处理器

第2章 Intel IA-32处理器结构与原理

第2章 IA32结构微处理器及其体系结构

IA-32

文档推荐

最新文档

微机原理第13章 IA-32结构微处理器的结构与工作方式