针对DSP指令生成与二进制翻译的汇编器实现

格式：pdf
大小：1.42 MB
文档页数：4

下载文档原格式

/ 4

DSP原理及应用(杨风开)部分课后习题解答

1-1程序存储器中保存的是什么？程序的最终表现形式是什么？答：（1）程序存储器中保存的是二进制数据，即物理上的高低电平信号。

（2）程序的最终表现形式是机器码，即用二进制表示的高低电平。

1-2 何为总线？总线的图形表示形式是怎样的？（画图说明）P5 P8答：（1）总线是连接多个设备、供多个设备使用的一系列性质相同的连线。

（2）总线用双线箭头表示。

1-5 计算机系统由哪两部分构成？两大部分间通过什么连接？P5答：（1）由CPU和外设构成；（2）通过总线连接。

1-6 何为单片机？何为DSP？P5 P7答：（1）单片机是将CPU和外设功能集成在一块芯片上的计算机系统；（2）DSP是特殊的单片机，特指数字信号处理器。

1-8 经典的数字信号处理方法有哪些？P7答：（1）时域中的数字滤波（2）时域、频域的快速傅里叶变换（FFT）1-10 区别单片机和DSP的标志是什么？P7答：是加连乘指令。

DSP有加连乘指令而单片机没有。

1-14 DSP有几个移位定标寄存器？作用是什么？P11 P12答：（1）有3个（ACC与a输入数据总线、b输出数据总线、c乘积寄存器之间）（2）作用a使数据在传送过程中按指定方式移位；b按指定方式对数据进行小数处理（定标）数据的移位和定标均在传送过程中自动发生，不需要花费CPU时间。

1-17 在DSP中做乘法运算时，一个乘数必须来自TREG，运算结果保存在PREG。

1-22 DSP有哪3个独立地址空间？每个空间容量是多少？P18答：有程序存储器、数据存储器和I/O。

每个空间容量是64K字。

1-24 DARAM和SARAM有什么区别？P18~20答：（1）DARAM是双访问RAM，SARAM是单访问RAM；（2）DARAM在CPU内部，而SARAM在芯片内部，CPU外部。

1-27 LF25407型DSP片内有多大容量FLASH程序存储器？FLASH程序存储器属于那一部分电路？P22答：有32K容量FLASH程序存储器。

DSP课后习题答案李建

第一章：一、数字信号处置的实现方式一样有哪几种？(1) 在通用的运算机上用软件实现(2) 在通用运算机系统中加上专用的加速处置机实现(3) 用通用的单片机实现，这种方式可用于一些不太复杂的数字信号处置(4) 用通用的可编程 DSP 芯片实现，可用于复杂的数字信号处置算法(5) 用专用的 DSP 芯片实现(6) 用基于通用 dsp 核的asic 芯片实现二、简单的表达一下 dsp 芯片的进展概况？答：第一时期， DSP 的雏形时期（ 1980 年前后）代表产品： S2811。

要紧用途：军事或航空航天部门第二时期， DSP 的成熟时期（ 1990 年前后）代表产品： TI 公司的 TMS320C20 要紧用途：通信、运算机领域第三时期， DSP 的完善时期（ 2000 年以后）代表产品：TI 公司的 TMS320C54 要紧用途：各行业领域3、可编程 dsp 芯片有哪些特点？(1)采纳哈佛结构:冯.诺依曼结构，哈佛结构，改良型哈佛结构(2)采纳多总线结构(3)采纳流水线技术(4) 配有专用的硬件乘法-累加器(5) 具有特殊的 dsp 指令(6) 快速的指令周期(7) 硬件配置强(8) 支持多处置器结构(9) 省电治理和低功耗4、什么是哈佛结构和冯.诺依曼结构？它们有什么区别？哈佛结构：该结构采纳双存储空间，程序存储器和数据存储器分开，有各自独立的程序总线和数据总线，可独立编址和独立访问，可对程序和数据进行独立传输，使取指令操作、指令执行操作、数据吞吐并行完成，大大地提高了数据处置能力和指令的执行速度，超级适合于实时的数字信号处置。

冯.诺依曼结构：该结构采纳单存储空间，即程序指令和数据共用一个存储空间，使用单一的地址和数据总线，取指令和取操作数都是通过一条总线分时进行。

当进行高速运算时，不但不能同时进行取指令和取操作数，而且还会造成数据传输通道的瓶颈现象，其工作速度较慢。

区别：哈佛：该结构采纳双存储空间，程序存储器和数据存储器分开，有各自独立的程序总线和数据总线，可独立编址和独立访问，可对程序和数据进行独立传输，使取指令操作、指令执行操作、数据吞吐并行完成，大大地提高了数据处置能力和指令的执行速度，超级适合于实时的数字信号处置。

第4章 DSP软件开发过程

3．子段

子段（Subsections）是大段中的小段。链接器可以像处理段一样处理子段。采用子段可以使存储器图更加紧密。子段的命名句法为：基段名：子段名子段也有两种，用 .sect 命令建立的是已初始化段，用.usect命令建立的是未初始化段。例：.sect”.text:_func”

连接器的主要任务是根据连接命令或连接命令文件(.cmd文件)，将一个或多个COFF目标文件连接起来，生成存储器映像文件(.map)和可执行输出文件(.out)。

自定义段：.sect，.usect
汇编器在汇编的过程中，根据汇编命令将相同段的代码或数据连在一起构成目标文件；连接器将各个文件的相同段连接起来，并分配存储单元。
图4-3 目标文件中的段与目标存储器的关系
COFF文件中的符号

COFF文件中有一个符号表，用于存储程序中的符号信息。链接器对符号重定位时使用该表，调试工具也使用该表来提供符号调试。
1．未初始化段

未初始化段主要用来在存储器中保留空间，通常将它们定位到RAM中。这些段在目标文件中没有实际内容，只是保留空间而已。程序可以在运行时利用这些空间建立和存储变量。未初始化段是通过使用.bss和.usect汇编伪指令建立的，两条伪指令的句法分别为：
.bss 符号
符号，字数 .usect

1．段定义伪指令
为便于链接器将程序、数据分段定位于指定的（物理存在的）存储器空间，并将不同的obj文件链接起来。段的使用非常灵活，但常用以下约定： .text — 此段存放程序代码。 .data — 此段存放初始化了的数据。 .bss — 此段存入未初始化的变量。 .sect '名称' — 定义一个有名段，放初始化了的数据或程序代码。

DSP精讲汇编语言程序开发工具

.usect段——未初始化段，由汇编命令建立的命
名段（自定义段）。
2019年1月25日 DSP原理及应用 6
第4章汇编语言程序开发工具
3. 段与目标存储器的对应关系
目标文件中的段与目标存储器之间的关系
目标文件
目标存储器
.bss
RAM
E2PROM
.data
.text
ROM
2019年1月25日
DSP原理及应用
可用.usect和.sect两个伪指令产生命名段。
2019年1月25日
DSP原理及应用
11
第4章汇编语言程序开发工具
3. 命名段 .usect伪指令产生类似.bss的段，为变量在RAM 中保留存储空间。 .sect伪指令产生类似.text和.data的段，可以包含代码或数据。.sect伪指令产生可重新定位地址的命名段。产生命名段伪指令格式：符号 .usect “段名”，字数 .sect “段名” 可以产生多达32767个不同的命名段。段名可长达200个字符。
段起点——是任选项。若选用，它为段程序计数器SPC定义一个起始值。
若默认，则SPC从0开始。
2019年1月25日 DSP原理及应用 10
第4章汇编语言程序开发工具
4.3.2 汇编器对段的处理 3. 命名段（自定义段）命名段由用户指定，与默认的.text，.data和 .bss段的使用相同，但它们被分开汇编。
2019年1月25日 DSP原理及应用 1
第4章汇编语言程序开发工具
4.2 汇编语言程序的编辑、汇编和链接过程
示意图
. cmd 链接命令文件
.asm 源文件 .obj 目标文件 .out 输出文件
文本编辑器

DSP28335汇编教程

DSP28335汇编教程当硬件执行指令时，寻找指令所指定的参与运算飞操作数的方式——寻址方式。

根据程序的要求采用不同的寻址方式，可以有效地缩短程序的运行时间和提高代码执行效率。

汇编指令是可执行指令，每一条指令对应一条机器码，用来控制处理器仲的执行部分进行各种操作。

在本章节当中将主要以基于C28x的DSP芯片为例，为读者讲解DSP的寻址方式和汇编指令系统，其中大部分内容也可适用于其他Ti公司的DSP产品。

6.1汇编语言指令集概述在学习C28x系列DSP的寻址方式和汇编指令指令之前，先来对一些基础的知识进行讲解一下先，在汇编程序当中开发人员会常常使用到许多的特殊符号和标志，它们都具有特殊的含义，在学习汇编之前读者们必须先理解这些符号和标志含义，在这里会对其中最常用最重要的操作数符号和寄存器经行详细说明。

在进行汇编讲解之前先来了解一下开发的核心——CPU。

在TMS320C2000系列中，CPU 内核为：C20x/C24x／C240x：C2xLP：C27x/C28x：C27x、C28x这些CPU的硬件结构有一定差别，指令集也不相同，但是，在C28x芯片中可以通过选择兼容特性模式，使C28xCPU与C27xCPU及C2xLPCPU具有最佳兼容性。

可通过状寄存器STl的位OBJMODE和位AMODE的组合，选定模式。

C28x芯片具有3种操作模式：1.C28x模式：在该模式中，用户可以使用C28x的所有有效特性、寻址方式和指令系统，因此，一般应使C28x芯片工作于该种模式。

2.C27x目标——兼容模式：在复位时，C28x的CPU处于C27x目标-兼容模式。

在该模式下，目标码与C27xCPU完全兼容，且它的循环—计数也与C27xCPU兼容。

3.C2xLP源——兼容模式：该模式允许用户运行C2xLP的源代码，这些源代码是用C28x代码生成工具编译生成的。

在下面的讲解当中会牵涉到模式的转换，希望读者要搞清楚每一个模式的对应关系。

计算机系统(课后习题答案)

DSP 芯片：称数字信号处理器，也是一种微控制器，其更适合处理高速的数字信号，内部集成有高速乘法器，能够进行快速乘法和加法运算。
嵌入式系统：利用微控制器、数字信号处理器或通用微处理器，结合具体应用构成的控制系统。
【1-6】冯·诺伊曼计算机的基本设计思想是什么？ [答案]
采用二进制形式表示数据和指令。指令由操作码和地址码组成。将程序和数据存放在存储器中，计算机在工作时从存储器取出指令加以执行，自动完成计算任务。这就是“存储程序”和“程序控制”（简称存储程序控制）的概念。指令的执行是顺序的，即一般按照指令在存储器中存放的顺序执行，程序分支由转移指令实现。计算机由存储器、运算器、控制器、输入设备和输出设备五大基本部件组成，并规定了 5 部分的基本功能。
【2-6】将下列压缩 BCD 码转换为十进制数：（1）10010001 （2）10001001 （3）00110110
[答案] （1）91 （2）89 （3）36 （4）90
（4）10010000
【2-7】将下列十进制数用 8 位二进制补码表示：（1）0 （2）127 （3）－127 （4）－57
“计算机系统基础”习题解答
第 1 章计算机系统概述
【1-1】简答题（1）计算机字长（Word）指的是什么？（2）处理器的“取指－译码－执行周期”是指什么？（3）总线信号分成哪 3 组信号？（4）外部设备为什么又称为 I/O 设备？（5）Windows 的控制台窗口与模拟 DOS 窗口有什么不同？ [答案] （1）处理器每个单位时间可以处理的二进制数据位数称计算机字长。（2）指令的处理过程。处理器的“取指—译码—执行周期” 是指处理器从主存储器读取指令（简称取指），翻译指令代码的功能（简称译码），然后执行指令所规定的操作（简称执行）的过程。（3）总线信号分成 3 组，分别是数据总线、地址总线和控制总线。（4）因为外设以输入（Input）和输出（Output）形式与主机交换数据。（5）Windows 的控制台窗口是基于 32/64 位 Windows 操作系统，模拟 DOS 窗口是基于 16 位 DOS 操作系统。

DSP课后习题答案--李建

第一章：1、数字信号处理的实现方法一般有哪几种？(1）在通用的计算机上用软件实现（2）在通用计算机系统中加上专用的加速处理机实现(3）用通用的单片机实现，这种方法可用于一些不太复杂的数字信号处理(4）用通用的可编程DSP 芯片实现,可用于复杂的数字信号处理算法（5）用专用的DSP 芯片实现(6）用基于通用dsp 核的asic 芯片实现2、简单的叙述一下dsp 芯片的发展概况？答：第一阶段，DSP 的雏形阶段（1980 年前后）代表产品：S2811。

主要用途：军事或航空航天部门第二阶段，DSP 的成熟阶段（1990 年前后)代表产品：TI 公司的TMS320C20 主要用途：通信、计算机领域第三阶段，DSP 的完善阶段（2000 年以后)代表产品：TI 公司的TMS320C54 主要用途：各行业领域3、可编程dsp 芯片有哪些特点?(1）采用哈佛结构：冯.诺依曼结构,哈佛结构，改进型哈佛结构(2)采用多总线结构(3）采用流水线技术（4）配有专用的硬件乘法-累加器（5) 具有特殊的dsp 指令（6）快速的指令周期(7) 硬件配置强(8）支持多处理器结构（9）省电管理和低功耗4、什么是哈佛结构和冯.诺依曼结构？它们有什么区别？哈佛结构：该结构采用双存储空间,程序存储器和数据存储器分开，有各自独立的程序总线和数据总线，可独立编址和独立访问,可对程序和数据进行独立传输，使取指令操作、指令执行操作、数据吞吐并行完成, 大大地提高了数据处理能力和指令的执行速度，非常适合于实时的数字信号处理。

冯.诺依曼结构：该结构采用单存储空间，即程序指令和数据共用一个存储空间，使用单一的地址和数据总线，取指令和取操作数都是通过一条总线分时进行。

当进行高速运算时，不但不能同时进行取指令和取操作数，而且还会造成数据传输通道的瓶颈现象，其工作速度较慢。

区别: 哈佛：该结构采用双存储空间，程序存储器和数据存储器分开，有各自独立的程序总线和数据总线,可独立编址和独立访问,可对程序和数据进行独立传输,使取指令操作、指令执行操作、数据吞吐并行完成，大大地提高了数据处理能力和指令的执行速度，非常适合于实时的数字信号处理。

第七章_DSP的汇编伪指令

• 符号.usect“段名”，字数 • 符号.sect“段名”，字数(建立的块可重定位) • 符号.asect“段名”，地址(建立具有绝对地
址的块) • .usect建立的段是在RAM中为变量保留空间
(类似于.bss段)，.sect建立的是包含代码或数据的段(类似于.text段和.data段)。 • 汇编器确定汇编语言程序的各个部分属于哪一个特定的段，汇编器有六个命令来完成这种功能，即:用于创建未初始化段.bss， .usect和用于创建已初始化.text, .data, .sect，.asect，如果程序未作说明，则统一汇编到.text段中。
宏语言可以使用户：
定义自己的宏，或重新定义正执行的宏简化长的或复杂的汇编代码访问由归档器建立的宏库在一个宏内定义条件块和可重复的块在一个宏内操作字符串控制展开列表
定义宏
在程序中使用宏之前，首先必须定义它。可以用两种方法来定义：
（1）在源文件开始处定义；（2） .include/.copy文件中定义；（3）在宏库中定义。
汇编伪指令
伪指令（Assembler Directives）
段定义伪指令
❖.bss
在该段中保留若干字
❖.data
汇编入已初始化的数据段
❖.sect “section name” 汇编入已命名的段
❖.text
汇编入可执行的代码段
.bss page,128 在 .bss段中为page定义128个字。
写入一个命令文件link.cmd ：
定义宏举例
* add3 p1, p2, p3 （形参） * p3 = p1 + p2 + p3
add3 .macro p1, p2, p3 lacc p1 add p2 add p3 .endm

DSP原理与应用——汇编语言程序开发工具

*******************************
，8
*******************************
** 仍然在段中
**
*******************************
0456h
行号目标代码段名
100d f010 0001 f842 0001 110a f166 000a F868 0006
●
——定义已初始化段
第6章汇编语言程序开发工具
6.3.2 汇编器对段的处理 1. 未初始化段
未初始化段就是在’C54x存储器中保留空间，通常它们被定位在区。在目标文件中，这些段中没有确切的内容。
由这些段定义的空间仅作为临时存储空间，在程序运行时，可以利用这些存储空间存放变量。
未初始化段分为默认的和命名的两种，分别由汇编器伪指令和产生。
段——是存储器中占据相邻空间的代码或数据块。一个目标文件中的每个段都是分开的和各不相同的。
目标文件都包含以下3种形式的段：段(文本段) 段Байду номын сангаас数据段) 段(保留空间段)
第6章汇编语言程序开发工具
6.3.1 文件的基本单元
2. 段的基本类型目标文件中的段有两种基本类型。
(1) 初始化段初始化段
软件仿真器：是一种模拟芯片各种功能并在非实时条件下进行软件调试的调试工具，它不需目标硬件支持，只需在计算机上运行。
初学者工具：是公司提供给初学者进行编程练习的一套廉价的实时软件调试工具。
第6章汇编语言程序开发工具
()
第6章汇编语言程序开发工具
C5402 实物图
第6章汇编语言程序开发工具
HEX代码转换工具

DSP指令

A FF 8765 0055H
B 00 0087 6500H
C
1
A
14
5. 测试指令 BIT *AR2＋，12
指令操作前
指令操作后
TC
X TC
1
AR2
0100H AR2
0101H
数据存储器
0100H
7688H 0100H
7688H
A
15
程序控制指令
分支转移指令调用子程序指令中断指令返回指令堆栈操作指令重复指令其它控制指令
A 00 5678 8933H
B 00 6BAC 1D89H
AR3
00FEH
C16
1
0100H 0101H
1534H 9456H
A
8
6. 特殊运算指令
TMS320C54x指令系统还提供了15条特殊的运算指令。在需要的场合灵活应用这些指令，可以大大提高程序的编写速度和执行速度，缩短程序的长度，减少指令执行的周期。
A AR3 数据存 1200H
A
0100H AR3
1500H 0100H
指令操作后 00 00FF 0700H
0101H
1500H
A
13
4. 移位指令 SFTL A，－8，B
指令操作前
A FF 8765 0055H
B FF 8000 0000H
C
0
指令操作后
A
24
1. 加载指令
举例
指令操作前
指令操作后
A 00 0000 2000H
A 00 4567 1234H
ST # 0100H，AR2
AR2 数据存储器
0000H AR2

CCS_V3.3 for DSP 汇编编程应用笔记

在“Project”在选择“compile file”：编译，“Build”：建立目标文件，“Rebuild all”重新建立所有文件。编译、连接完成后会在 Debug 文件夹中生成相应的.out/.map 文件：
4.软件调试仿真（两种调试版本：Debug 和 Release）
4.1 主要调试功能： 1. 设置断点 2. 在断点处自动更新窗口 3. 查看变量 4. 查看和编辑存储器和寄存器 5. 观察调用堆栈 6. 对流向目标系统或者从目标系统留出的数据采用探针工具观察，并收集存储映像 7. 绘制选定对象的信号曲线 8. 估算执行统计数据 9. 观察反汇编和 C 指令 4.2 载入文件编译、建立完成并没有错误后，便可以开始调试。在“File”中选择“Load Progam”（就是将生成的可执行文件加载到软件的模拟器中进行调试），在弹出的对话框中选择项目生成文件.out 文件（可执行文件）。加载成功后就会有个一个黄色的箭头指向主程序起始地址。点击“打开”。图二十二所示。现在便可以真正调试了。
自己写的东西，难免有不严谨或者错误的地方，希望浏览的童鞋批判性浏览，欢迎留言讨论相关问题！
使用 CCS3.3 的简要说明
目录：
1. 仿真设置（软/硬件仿真设置）
2. 打开、创建工程（包括添加源文件和相关文件）
3. 工程项目编译（编译、建立所有文件、重新建立所有文件）
4. 软件调试仿真（调试工具及仿真效果查看）
2.2 创建工程项目在菜单“Project”中新建工程如下图:
图七(其中的 c5402sim.gel 为 C5402 芯片的初始化文件) 2.3 创建并添加源文件
在“file”文件菜单中选择新建，软件自动弹出新的文件编辑框，在文件编辑框中输入要编写的软件程序。点击 “保存”，弹出文件设置对话框，选择保存到工程项目的根目录下，输入文件名和扩展名。并保存文件（主要是.asm 或者.c 文件）。

【经典】微机原理与接口技术第五版钱晓捷课后答案

〔习题
酷睿2多核处理器。
〔习题
高级语言与具体的计算机硬件无关，其表达方式接近于所描述的问题，易为人们接受和掌握，用高级语言编写程序要比低级语言容易得多，并大大简化了程序的编制和调试，使编程效率得到大幅度的提高。而汇编语言是为了便于理解与记忆，将机器指令用助记符代替而形成的一种语言。汇编语言的语句通常与机器指令对应，因此，汇编语言与具体的计算机有关，属于低级语言。它比机器语言直观，容易理解和记忆，用汇编语言编写的程序也比机器语言易阅读、易排错。机器语言的每一条机器指令都是二进制形式的指令代码，计算机硬件可以直接识别。高级语言程序通常也需要翻译成汇编语言程序，再进一步翻译成机器语言代码。
单片机：是指通常用于控制领域的微处理器芯片，其内部除CPU外还集成了计算机的其他一些主要部件，只需配上少量的外部电路和设备，就可以构成具体的应用系统。
DSP芯片：称数字信号处理器，也是一种微控制器，其更适合处理高速的数字信号，内部集成有高速乘法器，能够进行快速乘法和加法运算。
嵌入式系统：利用微控制器、数字信号处理器或通用微处理器，结合具体应用构成的控制系统。
〔习题
为了更好地进行编程实践，请进入Windows操作系统下的控制台环境（或MS-DOS模拟环境），练习常用命令。
计算机由存储器、运算器、控制器、输入设备和输出设备五大基本部件组成，并规定了5部分的基本功能。
〔习题
最上层是用户层。
第5层是高级语言层。
第4层是汇编语言层。
第3层是操作系统层。
第2层是机器语言层。
第1层是控制层。
第0层是数字电路层。
普通计算机用户和软件人员对计算机系统的认识并不一样。普通计算机用户看到的计算机，也就是我们最熟悉的计算机，属于用户层，而软件人员看到的属于高级语言层或是汇编语言层。

第4章汇编语言程序开发工具

可扩展的开发系统仿真器(XDS510)：可用来进行系统级的集成调试，是进行DSP芯片软硬件开发的最佳工具。
评价模块EVM板：是一种低成本的开发板，可进行DSP芯片评价、性能评估和有限的系统调试。
2019年5月17日
DSP原理及应用
11
第4章汇编语言程序开发工具
4.2 汇编语言程序的编辑、汇编和链接过程
当调试完成后，通过Hex代码转换工具，将调试后的可执行目标代码转换成EPROM编程器能接受的代码，并将该代码固化到EPROM中或加载到用户的应用系统中，以便DSP目标系统脱离计算机单独运行。
2019年5月17日
DSP原理及应用
4
第4章汇编语言程序开发工具
1. ’C54x应用软件开发流程
开发过程的宏目源文件的是产生一个可C源文以件由’C54x目标系
文本编辑器
.obj 目标文件
汇编器
-l
.out 输出文件
链接器 - o
-m
调试程序
. lst 列表文件
. map 存储器映像文件
十六进制转换程序
HEX500
2019年5月17日
DSP原理及应用
13
第4章汇编语言程序开发工具
4.2 汇编语言程序的编辑、汇编和链接过程
1. 编辑利用各种文本编辑器，如笔记本、WORD、EDIT
汇编语言源程序可以在任何一种文本编辑器中进行。如笔记本、WORD、EDIT、TC等。
当汇编语言源程序编写完成后，还必须经过汇编和链接后才能运行。
2019年5月17日
DSP原理及应用
12
第4章汇编语言程序开发工具
4.2 汇编语言程序的编辑、汇编和链接过程

DSP复习题答案

DSP复习题一、填空1.’C54x DSP中传送执行指令所需的地址需要用到 PAB 、CAB、DAB和EAB 4条地址总线。

2.DSP的内部存储器类型可分为随机存取存储器（RAM）和只读存储器（ROM）。

其中RAM又可以分为两种类型：单寻址RAM（SARAM）和双寻址RAM（DARAM）。

3.’C54x DSP的内部总存储空间为192K字，分成3个可选择的存储空间：64K字的程序存储空间、64K字的数据存储空间和64K字的 I/O空间。

4.从功能结构上，’C54X DSP的CPU可以划分成运算部件和控制部件两大部分。

5.’C54x DSP的寻址方式有七种，分别为立即寻址、绝对寻址、累加器寻址、直接寻址、间接寻址、存储器映象寄存器寻址、堆栈寻址。

6.在’C54x DSP寻址和指令系统中，Xmem和Ymem表示 16位双寻址操作数，Dmad为16位立即数，表示数据存储器地址，Pmad为16位立即数，表示程序存储器地址。

7.’C54x DSP芯片采用了6级流水线的工作方式，即一条指令分为预取指、取指、译码、寻址、读数和执行6个阶段。

8.C54x DSP定时器由3个16位存储器映射寄存器组成：定时器寄存器（TIM）、定时器周期寄存器（PRD）和定时器控制寄存器（TCR）。

9.主机接口（HPI，Host Port Interface）是TMS320C54x 系列定点芯片内部具有的一种接口部件，主要用于DSP与其他总线或CPU进行通信。

10.’ C54x DSP的指令系统有助记符指令和代数指令两种形式。

11.COFF目标文件中.text段通常包含可执行代码，.data段通常包含己初始化的数据，.bss段中通常为未初始化的数据保留空间。

12.DSP芯片的开发工具可以分为代码生成工具和代码调试工具两类。

13.’C54x DSP的基本结构分为 CPU 、存储器系统以及片内外设与专用硬件电路三大类。

14.DARAM称为双寻址RAM，在单机器周期内能被访问 2 次，而SARAM（单15.寻址RAM），在单机器周期内个机器周期内只能被访问 1 次。

微机原理与接口技术（钱晓捷版）课后习题答案

微机原理与接口技术（钱晓捷版）课后习题答案“微机原理与接口技术”习题解答第1章微型计算机系统〔习题1.1〕简答题〔解答〕① 处理器每个单位时间可以处理的二进制数据位数称计算机字长。

② 总线信号分成三组，分别是数据总线、地址总线和控制总线。

③ PC机主存采用DRAM组成。

④ 高速缓冲存储器Cache是处理器与主存之间速度很快但容量较小的存储器。

⑤ ROM-BIOS是“基本输入输出系统”，操作系统通过对BIOS 的调用驱动各硬件设备，用户也可以在应用程序中调用BIOS中的许多功能。

⑥ 中断是CPU正常执行程序的流程被某种原因打断、并暂时停止，转向执行事先安排好的一段处理程序，待该处理程序结束后仍返回被中断的指令继续执行的过程。

⑦ 主板芯片组是主板的核心部件，它提供主板上的关键逻辑电路。

⑧ MASM是微软开发的宏汇编程序。

⑨ 指令的处理过程。

处理器的“取指—译码—执行周期” 是指处理器从主存储器读取指令（简称取指），翻译指令代码的功能（简称译码），然后执行指令所规定的操作（简称执行）的过程。

⑩ 机器语言层，即指令集结构。

（学生很多认为是：汇编语言层。

前4章主要涉及汇编语言，但本书还有很多处理器原理等内容）〔习题1.2〕判断题① 错② 错③ 对④ 错⑤ 对⑥ 错⑦ 错⑧ 对⑨ 错⑩ 错〔〔解答〕① Central Processing Unit，中央处理单元，处理器② 1MB，4GB ③ 216，64KB④ EXE，COM（BAT老师讲的）⑤ Instruction Set Architecture⑥ 目录⑦ MMX，SSE3 ⑧ 64⑨ IBM，DOS ⑩ PCI 〔习题1.4〕说明微型计算机系统的硬件组成及各部分作用。

〔解答〕CPU：CPU也称处理器，是微机的核心。

它采用大规模集成电路芯片，芯片内集成了控制器、运算器和若干高速存储单元（即寄存器）。

处理器及其支持电路构成了微机系统的控制中心，对系统的各个部件进行统一的协调和控制。

DSP编程技巧(共27讲)

了在编译程序时 CPU 的模式。补充一点是，cl2000 的帮助里看到的选项都是很长的名字，在 CCS 里面为了书写方
便(因为选项框就那么点面积啊)，一般用别名来代替；没有别名的则直接使用选项名字。
处理器选项
别名
含义
--silicon_version=28 -v28
为 C28x 架构的 DSP 产生目标文件；不选择的话模式为 C27x 模式，也
4.归档器 archiver：也可以叫压缩器，看一下我们常用的压缩软件 winrar 的全称 winrar archiver 就不难理解了。
5.实时支持库：包括标准 C 和 C++的运行支持函数、编译器公用程序函数、浮点运算函数和 C 编译器支持的 I/O 函数。
6.十六进制转换程序：把编译、链接等步骤生成的可执行文件，转换为十六进制文件，例如.HEX 格式，然后可以烧写到 EEPROM、FLASH 等外部存储器之中。
具体说来，编译器的选项有多大 20 个大类，超过一百个具体的选项。当然这些选项是有轻重之分的，有的是
必须用到的，例如支持一下 FPU 等功能;有的则是不常接触的，例如 MISRA 这样的汽车工业软件可靠性检查，只有
在对软件进行标准化时才会用到。所以我们首先看一下最常用的选项，例如处理器的选项，它们的意义在于定义
2.汇编器的作用是将汇编语言代码转换为机器语言(目标文件)，这里的汇编代码包括前面由 C/C++生成的汇编代码和我们直接编写的汇编代码。
3.链接器是作用是把所有的库文件、目标文件等链接成为一个可执行的目标文件，其中包含程序的机器代码和数据，以及其他用来链接和加载该程序所需的信息(在 TI DSP 上是 COFF 格式，通俗地讲就是.out 二进制文件)，同时根据内存地址的分配对各目标文件进行重定位，并解析外部参考，例如在一个源程序里引用另一个源程序中定义的变量就可以理解为外部参考，假如一个目标文件引用了一个未定义的符号 symbol，则链接器搜索其他目标文件中定义的全局符号，找到匹配的符号修补指令。否则报告一个错误；所以有时候编译所有程序完成在链接的时候会提示 xxx symbol 为定义，说明对应的文件没有加到工程里面。

TMS320C55X dsp原理及应用汪春梅新的第3章_汇编指令第二次课

支持寻址模式操作数的指令应具有下表所示的句法元素：
句法元素描述
指令语句里含有Smem时，该指令可以访问数据存储器、 I/O空间或者MMR中的一个单字（16bits)。写该指令语句时，用一个兼容的寻址模式操作数来代替Smem。指令语句里含有Lmem时，该指令可以访问数据存储器或者MMR中的一个长字（32bits)。写该指令语句时，用一个兼容的寻址模式操作数来代替Smem。指令语句里含有Xmem and Ymem时，该指令可以对数据存储器同时作两次16bits的访问。写该指令语句时，用兼容的寻址模式操作数来代替Xmem and Ymem 。指令语句里含有Cmem时，该指令可以访问数据存储器的单字（16bits)。写该指令语句时，用一个兼容的寻址模式操作数来代替Cmem。指令语句里含有Baddr时，该指令可以访问累加器（AC0~AC3)、辅助寄存器（AR0~AR7)或T0~T3中的一个 bit或者两个bit。只有寄存器bit测试/设置/清除/取反指令支持Baddr。写任意一条此类指令语句时，用一个兼容的寻址模式操作数来代替Baddr 。
分析：
The assembler calculates Doffset:
； Main data page is 03. For run-time, ；DP is FFF0h. ； For assembly time, .dp is FFF0h. ；Load T2 with the value at local ；address FFF4h.
直接寻址模式中的寄存器bit直接寻址和PDP直接寻址与状态寄存器ST1-55的CPL位无关。
3.1.2 直接寻址模式
一、 DP 直接寻址 DP直接寻址的23位地址构成：高7位由 DPH 提供，用来确定主数据页；其余低16位为以下两部分的和：（1） DP 里的值。DP定义了在主数据页内的起始地址。（2）汇编程序计算的7-bit偏移量（Doffset）。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

中图分类号:TP314文献标识码:A文章编号:1009－2552(2011)03－0047－04针对DSP指令生成与二进制翻译的汇编器实现

肖贺，刘佩林(上海交通大学电子信息与电气工程学院，上海200240)摘要:DSP指令生成与优化和二进制翻译是现代编译工具值得关注的热点问题。针对DSP指令的特点提出一种通用的DSP指令生成(支持VLIW指令)与二进制翻译技术，并应用于GNU汇编器(GAS)。包含该技术的汇编器PCA(PostCompilationAssembler)先将输入的汇编指令转化成类似LISP的中间语言。PCA通过对此中间语言分析以及窥孔优化，最终生成高质量的目标平台DSP代码。关键词:DSP指令生成;VLIW指令;二进制翻译;编译后优化;窥孔优化ImplementationofassemblerforDSPcodegeneration

andbinarytranslationXIAOHe，LIUPei-lin(SchoolofElectronicInformationandElectricalEngineering，ShanghaiJiaotongUniversity，Shanghai200240，China)Abstract:DSPcodegenerationandoptimization，alongwithbinarytranslation，hasbecomeawell-concerningfocusofthemoderntoolchain．Thispaper，onaccountofthespecialtiesofDSPinstruction，proposedageneralmethodofDSPcodegenerating(includeVLIW)andbinarytranslation，whichappliedinGNUassembler(GAS)．GASwiththistechnology(calledPCA)firsttranslatessourceassemblyinstructionsintoLISP-likeintermediaterepresentation(IR);byanalyzingthebehaviorsoftheIRstatementsandemployingpost-compilationtechniquessuchaspeepholeoptimization，PCAwillproduceDSPcodesofhighqualitysuitableforthetargetplatform．Keywords:DSPcodegeneration;VLIW;binarytranslation;post-compilationoptimization;peepholeoptimization

0引言

在现代编译工具的研究中，为了尽可能地让编译器编译出适应于特定DSP架构的代码，设计者提出一种编译后优化的方法来控制编译器进行机器相关的优化。编译后优化的方法有很多，窥孔优化便是其中很重要的一种［1］。窥孔优化的基本思想是考察窥孔窗中的一组指令(一般是3～5个)，对这组指令进行局部优化，然后滑动窗的位置，对下一组指令执行优化操作直到所有指令扫描结束。目前成熟的DSP编译器通常会采用窥孔优化技术来生成与机器架构相关的特殊指令和优化代码［2－3］。

此外，现代工具链有一个很有前景的应用称之

为二进制翻译，也就是说，某一架构的汇编二进制程序通过特定的工具能够被翻译为能在另一种架构上执行的可执行代码，同时保证二进制程序不会有太明显的性能降低。据研究［4－5］表明，窥孔优化十分适用于二进制翻译。为了满足上述两方面的要求，提出一种采用编译后优化技术生成特定DSP指令和完成二进制翻译的汇编器PCA，它将窥孔优化技术从编译阶段推迟到汇编链接阶段。这样的编译结构有三方面的好处:首先，该汇编器结构为二进制翻译创造了可

收稿日期:2010－10－27作者简介:肖贺(1986－)，男，硕士研究生，主要研究方向为DSP处理器体系架构及其编译器汇编器实现。

—74—能。其次，该结构提出优化技术可以用于不同高级编程语言下的程序优化，也能适用于高级语言与汇编语言混合编程的情况。最后，在编译阶段得不到的许多程序相关信息例如符号信息，变量存储形式(内存或是寄存器)可以在汇编阶段获得，能够更加有效地进行优化。1整体设计提出的汇编器PCA首先将汇编代码(编译器生成或者手写汇编代码)翻译转化成一种通用的中间语言。PCA接着采用基于窥孔优化的指令翻译生成算法对中间语言进行分析与优化，最终生成所需要的目标代码。从流程框架和中间语言匹配两方面对PCA展开具体讨论。1．1PCA流程框架PCA是基于GNU汇编器GAS而开发的，而GAS是以行为单位进行扫描并生成最终二进制代码。这种传统的汇编器结构不适合进行二进制翻译和构造DSP指令，PCA对此结构进行了相应的调整。PCA的工作原理如图1所示。图1PCA工作流程图源汇编代码首先通过PCA的解析单元转换成中间语言IR(IntermediateRepresentation)，同时重建程序控制流信息，并生成符号表。被转换过的中间语言通过窥孔优化算法与预先定义的DSP架构指令库中的模式进行匹配与选择变换，同时更新优化后IR序列的符号表。最后，PCA将最终的中间语言序列和符号表生成可执行文件。1．2中间语言IR描述与匹配PCA采用类似于GCC中RTL语言［6］的IR结构作为其中间语言，如图2所示。可以看出，IR结构包含两个部分，操作部分opcode和操作数部分operands。图2IR结构图其中，opcode中的CODE域指定当前中间语言语句完成的行为，PCA定义了一组标准名来指定一些通用的操作，例如PLUS表示加法，MINUS表示减法，SHIFT表示移位操作等等。CODE集合亦可以根据特定的DSP指令架构而进行扩展。IR_TYPE域标识指令模板的分类，该分类使用于VLIW模板中。operands部分指定特定操作下操作数的特征，其中第一个操作数为目标操作数，其他为源操作数。它包含TYPE，operandx和WIDTH三个域。TYPE域指定操作数的类型，例如REG表示普通寄存器，SPR表示特殊寄存器，MEM内存，以及IMM表示立

即数。operandx域标识操作数的名称，例如REG:r7表示某条语句的一个操作数是寄存器型，名称是r7。不同的IR语句中相同的操作数名称表明了他

们对同一个操作数进行了操作。WIDTH域指定了操作数的位宽。2具体实现

给出了PCA的工作流程以及介绍了中间语言。结合DSP指令特点来详细说明PCA生成DSP指令代码的过程。2．1控制流重建

重建输入程序的控制流对于汇编器来说是一个比较大的挑战。为了有效地优化和解析源汇编代码的功能，PCA首先需要将直接转换过来的IR语句分割成不同的基本块。具体做法是PCA找出跳转语句，将它们作为基本块最后一条语句，并将它们的跳转目标作为基本块的第一条语句，以此来分割IR程序。接着通过分析基本块中各语句的OPERAND域标识得它们的依赖关系后，PCA以这些被分割的基本块为基本单元解析并生成DSP指令。2．2指令翻译生成算法

指令翻译生成算法的基本原理是IR中间语句匹配，所谓的中间语句匹配，是指当汇编指令经过解释器转换成中间语句后，该语句的OPCODE域，TYPE域和WIDTH域和某个预先定义的IR模板相

一致。IR支持嵌套结构以进行复杂的窥孔优化，即一个IR语句的操作数可以是一条IR语句结构。由于IR语句的作用是改变目标操作数的值，那么IR语句本身可以等价于一个与目标操作数相同的一个操作数。一般来说，DSP指令可以大致分为两类，一类称为增强指令，能够完成很强大的运算操作，另一类是VLIW指令，包含多个发射槽。PCA预先定义复杂

的IR模板，通过IR语句合并算法可以实现第一类—84—指令;通过指定指令封包的格式可以实现第二类指令。对于第一类增强指令，IR语言模板可以是一系列简单模板的嵌套。第二类指令的模板为一系列格式的指令包。而对于普通非DSP指令来说，翻译过程比较简单，本文不多赘述。指令翻译生成算法的流程图如图3所示。图3的左半部分实现IR语句合并生成DSP增强指令的过程。首先，PCA会根据DSP增强指令模板生成IR语句合并器。IR语句合并但与会根据操作数依赖关系将基本块中符合模板的多条IR语句合并起来。如果IR语句合并单元确实对当前IR语句执行了合并操作，则会对所有参与合并的IR语句进行标识，以便PCA将参与合并的IR语句从缓冲区内删除，否则，该IR语句将直接进入下一级模块。图3指令翻译生成算法流程图DSP指令封装过程如图3右半部分所示。PCA根据预先定义的DSP封包规则，生成一个IR语句封装器。IR语句封装器接收IR语句合并单元的输出IR语句，并根据封包规则对这些IR语句进行封装。例如，如果当前的DSP架构支持的是支持同时发射3条指令，那么PCA会根据IR语句的依赖关系将不相关的IR语句进行封装，若不存在3条这样的指令，那么则通过插入NOP指令来进行封装。若DSP架构不符合VLIW结构，则可通过指定封装规则为一次发射一条指令来实现此DSP单发射架构。2．3DSP指令变换匹配不符合DSP模板的IR语句存在两种情况，一种是通过相应的变换后可以符合某种DSP模板，另一种是无法符合任何DSP模板的。由于PCA最关注的问题是如何尽可能多地生成符合DSP模板的指令，因此PCA尽量转换第一类IR语句为匹配IR语句。对于PCA来说，匹配变换的方法有以下两种。(1)操作数位置交换:DSP指令的源操作数通

常不具有可交换性，例如，某DSP加法指令要求第一源操作数为内存操作数，第二源操作数为寄存器操作，那么第一源操作数为寄存器，第二源操作数为内存的IR加法语句无法直接匹配模板生成相应的指令;通过交换两源操作数的位置，可以使该IR语句匹配DSP加法模板。(2)操作数类型转换:DSP指令对操作数类型

一般有严格的限定，对于无法通过置换操作数位置的第一类IR语句，PCA通过类型变换来匹配某些IR模板;例如，某DSP移位法指令要求所有的操作

数为寄存器操作数，对于其中第一源操作数为立即数的IR移位语句，可以通过在该语句前插入一个将立即数搬移到寄存器操作的语句，然后再将此移位语句的所有操作数修改为相应的寄存器，以符合DSP移位模板生成特定的移位指令，可以看出，第一种匹配方法不会引入额外的代价(不会增加新的指令)，而第二类匹配方法则会带来额外的开销(插入新的指令)。在实际的DSP指令生成过程中，通过权衡计算匹配操作给PCA代码生成时候带来好处或者额外的开销，可以选择在特定的基本块中是否使用该匹配操作。3结果分析

针对DSP指令生成与二进制翻译的汇编器实现

合集下载

DSP原理及应用(杨风开)部分课后习题解答

DSP课后习题答案李建

第4章 DSP软件开发过程

DSP精讲汇编语言程序开发工具

DSP28335汇编教程

计算机系统(课后习题答案)

DSP课后习题答案--李建

第七章_DSP的汇编伪指令

DSP原理与应用——汇编语言程序开发工具

DSP指令

CCS_V3.3 for DSP 汇编编程应用笔记

【经典】微机原理与接口技术第五版钱晓捷课后答案

第4章汇编语言程序开发工具

DSP复习题答案

微机原理与接口技术（钱晓捷版）课后习题答案

DSP编程技巧(共27讲)

TMS320C55X dsp原理及应用汪春梅新的第3章_汇编指令第二次课

文档推荐

最新文档

针对DSP指令生成与二进制翻译的汇编器实现

合集下载

DSP原理及应用(杨风开)部分课后习题解答

DSP课后习题答案李建

第4章 DSP软件开发过程

DSP精讲汇编语言程序开发工具

DSP28335汇编教程

计算机系统(课后习题答案)

DSP课后习题答案--李建

第七章_DSP的汇编伪指令

DSP原理与应用——汇编语言程序开发工具

DSP指令

CCS_V3.3 for DSP 汇编 编程应用笔记

【经典】微机原理与接口技术 第五版 钱晓捷 课后答案

第4章 汇编语言程序开发工具

DSP复习题答案

微机原理与接口技术（钱晓捷版）课后习题答案

DSP编程技巧(共27讲)

TMS320C55X dsp原理及应用 汪春梅新的第3章_汇编指令第二次课

文档推荐

最新文档

CCS_V3.3 for DSP 汇编编程应用笔记

【经典】微机原理与接口技术第五版钱晓捷课后答案

第4章汇编语言程序开发工具

TMS320C55X dsp原理及应用汪春梅新的第3章_汇编指令第二次课