当前位置：文档之家› 定点DSP实现浮点运算时的定标问题

定点DSP实现浮点运算时的定标问题

程序变量的Q值确定--定点DSP实现浮点运算时的定标问题2008-08-27 18:45

在前面几节介绍的例子中，由于x，y，z的值都是已知的，因此从浮点变为定点时Q值很好确定。在实际的DSP应用中，程序中参与运算的都是变量，那么如何确定浮点程序中变量的Q值呢？从前面的分析可以知道，确定变量的Q值实际上就是确定变量的动态范围，动态范围确定了，则Q值也就确定了。

设变量的绝对值的最大值为|max|，注意|max|必须小于或等于32767。取一个整数n，使满足2n-1<|max|<2n

则有

2-Q=2-15*2n=2-(15-n)

Q=15-n

例如，某变量的值在-1至+1之间，即|max|<1，因此n=0，Q=15-n=15。

既然确定了变量的|max|就可以确定其Q值，那么变量的|max|又是如何确定的呢？一般来说，确定变量的|max|有两种方法。一种是理论分析法，另一种是统计分析法。

1. 理论分析法

有些变量的动态范围通过理论分析是可以确定的。例如：

(1)三角函数。y=sin(x)或y=cos(x)，由三角函数知识可知，|y|<=1。

(2)汉明窗。y(n)=0.54一0.46cos[nπn/(N-1)]，0<=n<=N-1。因为-1<=cos[2πn/(N-1)]<=1，所以0.08<=y(n)<=1.0。

(3)FIR卷积。y(n)=∑h(k)x(n-k)，设∑|h(k)|=1.0，且x(n)是模拟信号12位量化值，即有|x(n)|<=2^11，则|y(n)|<=2^11。

(4)理论已经证明，在自相关线性预测编码(LPC)的程序设计中，反射系数ki满足下列不等式：|ki|<1.0，i=1，2，...，p，p为LPC的阶数。

2. 统计分析法

对于理论上无法确定范围的变量，一般采用统计分析的方法来确定其动态范围。所谓统计分析，就是用足够多的输入信号样值来确定程序中变量的动态范围，这里输入信号一方面要有一定的数量，另一方面必须尽可能地涉及各种情况。例如，在语音信号分析中，统计分析时就必须来集足够多的语音信号样值，并且在所采集的语音样值中，应尽可能地包含各种情况。如音量的大小，声音的种类(男声、女声等)。只有这样，统计出来的结果才能具有典型性。

当然，统计分析毕竟不可能涉及所有可能发生的情况，因此，对统计得出的结果在程序设计时可采取一些保护措施，如适当牺牲一些精度，Q值取比统计值稍大些，使用DSP 芯片提供的溢出保护功能等。

DSP芯片的定点运算2008-09-09 11:20 DSP芯片的定点运算

1．数据的溢出：

1> 溢出分类：

上溢（overflow）：

下溢（underflow）

2>溢出的结果：

Max

Min

Max

unsigned char

255

signed char

-128

127

unsigned int

65535

signed int

-32768

32767

上溢在圆圈上按数据逆时针移动；下溢在圆圈上顺时钟移动。

例：signed int ：32767+1＝－32768；-32768-1＝32767

unsigned char：255+1＝0；0-1＝255

3>为了避免溢出的发生，一般在DSP中可以设置溢出保护功能。当发生溢出时，自动将结果设置为最大值或最小值。

2．定点处理器对浮点数的处理：

1> 定义变量为浮点型（float，double），用C语言抹平定点处理器和浮点处理器的区别，但是程序的代码庞大，运算速度也慢。

2> 放大若干倍表示小数。比如要表示精度为0.01的变量，放大100倍去运算，运算完成后再转化。但是这个做法比较僵硬，如要将上面的变量重新定义成0.001精度，又需要放大1000倍，且要重新编写整个程序，考虑溢出等问题。

3> 定标法：Q格式：通过假定小数点位于哪一位的右侧，从而确定小数的精度。

Q0：小数点在第0位的后面，即我们一般采用的方法

Q15 小数点在第15位的后面，0～14位都是小数位。

转化公式：Q＝（int）（F×pow（2，q））

F＝（float）（Q×pow（2，－q））

3．Q格式的运算

1> 定点加减法：须转换成相同的Q格式才能加减

2> 定点乘法：不同Q格式的数据相乘，相当于Q值相加

3> 定点除法：不同Q格式的数据相除，相当于Q值相减

4> 定点左移：左移相当于Q值增加

5> 定点右移：右移相当于Q减少

4．Q格式的应用格式

实际应用中，浮点运算大都时候都是既有整数部分，也有小数部分的。所以要选择一个适当的定标格式才能更好的处理运算。一般用如下两种方法：

1> 使用时使用适中的定标，既可以表示一定的整数复位也可以表示小数复位，如对于2812的32位系统，使用Q15格式，可表示－65536.0～65535.999969482区间内的数据。

2> 全部采用小数，这样因为小数之间相乘永远是小数，永远不会溢出。取一个极限最大值（最好使用2的n次幂），转换成x/Max的小数（如果Max是取的2的n次幂，就可以使用移位代替除法）。

5．Ti的qmath.lib库说明：

见TI的文档C28x IQMath Library (SPRC087a).zip的详细说明。TI公司给出了一个Q格式的数学库qmath.lib

注意Q格式函数使用的时序和空间要求，尽量避重就轻。

浮点数结构详解

附录D What Every Computer Scientist Should Know About Floating-Point Arithmetic 注 – 本附录是对论文《What Every Computer Scientist Should Know About Floating- Point Arithmetic》（作者：David Goldberg，发表于 1991 年 3 月号的《Computing Surveys》）进行编辑之后的重印版本。版权所有 1991，Association for Computing Machinery, Inc.，经许可重印。 D.1摘要许多人认为浮点运算是一个深奥的主题。这相当令人吃惊，因为浮点在计算机系统中是普遍存在的。几乎每种语言都有浮点数据类型；从 PC 到超级计算机都有浮点加速器；多数编译器可随时进行编译浮点算法；而且实际上，每种操作系统都必须对浮点异常（如溢出）作出响应。本文将为您提供一个教程，涉及的方面包含对计算机系统设计人员产生直接影响的浮点运算信息。它首先介绍有关浮点表示和舍入误差的背景知识，然后讨论 IEEE 浮点标准，最后列举了许多示例来说明计算机生成器如何更好地支持浮点。类别和主题描述符：（主要）C.0 [计算机系统组织]：概论—指令集设计；D.3.4 [程序设计语言]：处理器—编译器，优化；G.1.0 [数值分析]：概论—计算机运算，错误分析，数值算法（次要） D.2.1 [软件工程]：要求/规范—语言；D.3.4 程序设计语言]：正式定义和理论— 语义；D.4.1 操作系统]：进程管理—同步。一般术语：算法，设计，语言其他关键字/词：非规格化数值，异常，浮点，浮点标准，渐进下溢，保护数位，NaN，溢出，相对误差、舍入误差，舍入模式，ulp，下溢。 D-1

浮点数的表示和基本运算

浮点数的表示和基本运算 1 浮点数的表示通常，我们可以用下面的格式来表示浮点数 S P M 其中S是符号位，P是阶码，M是尾数对于IBM-PC而言，单精度浮点数是32位（即4字节）的，双精度浮点数是64位（即8字节）的。两者的S，P，M所占的位数以及表示方法由下表可知 S P M表示公式偏移量 1823(-1)S*2(P-127)*1.M127 11152(-1)S*2(P-1023)*1.M1023 以单精度浮点数为例，可以得到其二进制的表示格式如下 S(第31位)P(30位到 23位) M(22位到 0位) 其中S是符号位，只有0和1，分别表示正负；P是阶码，通常使用移码表示（移码和补码只有符号位相反，其余都一样。对于正数而言，原码，反码和补码都一样；对于负数而言，补码就是其绝对值的原码全部取反，然后加1.）为了简单起见，本文都只讨论单精度浮点数，双精度浮点数也是用一样的方式存储和表示的。 2 浮点数的表示约定单精度浮点数和双精度浮点数都是用IEEE754标准定义的，其中有一些特殊约定。（1）当P = 0, M = 0时，表示0。（2）当P = 255, M = 0时，表示无穷大，用符号位来确定是正无穷大还是负无穷大。

（3）当P = 255, M != 0时，表示NaN（Not a Number，不是一个数）。当我们使用.Net Framework的时候，我们通常会用到下面三个常量 Console.WriteLine(float.MaxValue); // 3.402823E+38 Console.WriteLine(float.MinValue); //-3.402823E+38 Console.WriteLine(float.Epsilon); // 1.401298E-45 //如果我们把它们转换成双精度类型，它们的值如下 Console.WriteLine(Convert.ToDouble(float.MaxValue)); // 3.40282346638529E+38 Console.WriteLine(Convert.ToDouble(float.MinValue)); //-3.40282346638529E+38 Console.WriteLine(Convert.ToDouble(float.Epsilon)); // 1.40129846432482E-45 那么这些值是如何求出来的呢？根据上面的约定，我们可以知道阶码P的最大值是11111110（这个值是254，因为255用于特殊的约定，那么对于可以精确表示的数来说，254就是最大的阶码了）。尾数的最大值是11111111111111111111111。那么这个最大值就是：0 11111110 11111111111111111111111。也就是 2(254-127) * (1.11111111111111111111111)2 = 2127 * (1+1-2-23) = 3.40282346638529E+38 从上面的双精度表示可以看出，两者是一致的。最小的数自然就是- 3.40282346638529E+38。对于最接近于0的数，根据IEEE754的约定，为了扩大对0值附近数据的表示能力，取阶码P = -126，尾数 M = (0.00000000000000000000001)2 。此时该数的二进制表示为：0 00000000 00000000000000000000001 也就是2-126 * 2-23 = 2-149 = 1.40129846432482E-45。这个数字和上面的Epsilon 是一致的。如果我们要精确表示最接近于0的数字，它应该是 0 00000001 00000000000000000000000 也就是：2-126 * (1+0) = 1.17549435082229E-38。 3 浮点数的精度问题浮点数以有限的32bit长度来反映无限的实数集合，因此大多数情况下都是一个近似值。同时，对于浮点数的运算还同时伴有误差扩散现象。特定精度下看似

浮点数表示方法与运算

在计算机系统的发展过程中，曾经提出过多种方法表达实数，典型的比如定点数。在定点数表达方式中，小数点位置固定，而计算机字长有限，所以定点数无法表达很大和很小的实数。最终，计算机科学发展出了表达范围更大的表达方式——浮点数，浮点数也是对实数的一种近似表达。 1.浮点数表达方式我们知道任何一个R 进制数N 均可用下面的形式表示：N R =±S ×R ±e 其中，S—尾数，代表N 的有效数字； R—基值，通常取2、8、16；e—阶码，代表N 的小数点的实际位置(相当于数学中的指数)。比如一个十进制数的浮点表达1.2345×102，其中1.2345为尾数，10为基数，2为阶码。一个二进制数的浮点表达0.001001×25，0.001001为尾数，2为基数，5为阶码；同时0.001001×25也可以表示成0.100100×23，0.100100为尾数，2为基数，3为阶码。浮点数就是利用阶码e 的变化达到浮动小数点的效果，从而灵活地表达更大范围的实数。 2.浮点数的规格化一个数用浮点表示时，存在两个问题：一是如何尽可能多得保留有效数字；二是如何保证浮点表示的唯一。对于数0.001001×25，可以表示成0.100100×23、0.00001001×27等等，所以对于同一个数，浮点有多种表示(也就是不能唯一表示)。另外，如果规定尾数的位数为6位，则0.00001001×27会丢掉有效数字，变成0.000010×27。因此在计算机中，浮点数通常采用规格化表示方法。当浮点数的基数R 为2，即采用二进制数时，规格化尾数的定义为：1/2<=|S|<1。若尾数采用原码(1位符号位+n 位数值)表示，[S]原=S f S 1S 2S 3…S n (S f 为符号位的数符)，则满足S 1=1的数称为规格化数。即当尾数的最高有效位S 1=1，[S]原=S f 1S 2S 3…S n ,表示该浮点数为规格化数。对0.001001×25进行规格化后，表示为0.100100×23。 3.浮点数的表示范围求浮点数的表示范围，实质是求浮点数所能表示的最小负数、最大负数、最小正数和最大正数。

定点DSP和浮点DSP的区别与比较

定点与浮点运算DSP 的比较 DSP数字信号处理器是一种特别适合于进行数字信号处理的微处理器，主要用于实时快速地实现各种数字信号处理算法。定点运算DSP 在应用中已取得了极大的成功，而且仍然是DSP 应用的主体。然而，随着对DSP 处理速度与精度、存储器容量、编程的灵活性和方便性要求的不断提高、自80 年代中后期以来，各DSP 生产厂家陆续推出了各自的32bit浮点运算DSP。和定点运算DSP 相比，浮点运算DSP 具有许多优越性：浮点运算DSP 比定点运算DSP 的动态范围要大很多。定点DSP 的字长每增加1bit,动态范围扩大6dB。16bit 字长的动态范围为96dB。程序员必须时刻关注溢出的发生。例如，在作图像处理时，图像作旋转、移动等，就很容易产生溢出。这时，要么不断地移位定标，要么作截尾。前者要耗费大量的程序空间和执行时间，后者则很快带来图像质量的劣化。总之，是使整个系统的性能下降。在处理低信噪比信号的场合，例如进行语音识别、雷达和声纳信号处理时，也会发生类似的问题。 32bit 浮点运算DSP 的动态范围可以作到1536dB，这不仅大大扩大了动态范围，提高了运算精度，还大大节省了运算时间和存储空间，因为大大减少了定标，移位和溢出检查。由于浮点DSP 的浮点运算用硬件来实现，可以在单周期内完成，因而其处理速度大大高于定点DSP。这一优点在实现高精度复杂算法时尤为突出，为复杂算法的实时处理提供了保证。 32bit 浮点DSP 的总线宽度较定点DSP 宽得多，因而寻址空间也要大得多。这一方面为大型复杂算法提供了可能、因为省的DSP 目标子程序已使用到几十MB 存储器或更多；另一方面也为高级语言编译器、DSP 操作系统等高级工具软件的应用提供了条件。 DSP 的进一步发展，必然是多处理器的应用。新型的浮点DSP 已开始在通信口的设置和强化、资源共享等方面有所响应。 TMS320C6000家族为高性能DSP，包括： TMS320C62X定点DSP系列、TMS320C64X定点DSP系列、TMS320C67X定点DSP系列。 TMS320C62X系列工作频率：150-300MHz，运行速度：1200-2400MIPS，内部2个乘法器、6个算术逻辑单元，超长指令字（VLIW）结构，大容量的片内存储器和大范围的寻址能力，4个DMA接口，2个多通道缓存串口，2个32位片内外设。 TMS320C64X系列工作频率：400-600MHz，运行速度：3200-4800MIPS，具有特殊功能的指令集。 TMS320C67X系列，为高性能浮点DSP 工作频率：100-225MHz，运行速度：600-1350MIPS，具有4个浮点/定点算术逻辑单元，2个定点算术逻辑单元，2个浮点/定点乘法器。

DSP定点运算-Q格式

DSP芯片的定点运算---Q格式(转) 2008-09-03 15:47 DSP芯片的定点运算 1．数据的溢出： 1>溢出分类：上溢（overflow）：下溢（underflow） 2>溢出的结果： Max Min 上溢在圆圈上按数据逆时针移动；下溢在圆圈上顺时钟移动。例：signed int ：32767+1＝－32768；-32768-1＝32767 unsigned char：255+1＝0；0-1＝255 3>为了避免溢出的发生，一般在DSP中可以设置溢出保护功能。当发生溢出时，自动将结果设置为最大值或最小值。 2．定点处理器对浮点数的处理： 1>定义变量为浮点型（float，double），用C语言抹平定点处理器和浮点处理器的区别，但是程序的代码庞大，运算速度也慢。 2>放大若干倍表示小数。比如要表示精度为0.01的变量，放大100倍去运算，运算完成后再转化。但是这个做法比较僵硬，如要将上面的变量重新定义成 0.001精度，又需要放大1000倍，且要重新编写整个程序，考虑溢出等问题。 3>定标法：Q格式：通过假定小数点位于哪一位的右侧，从而确定小数的精度。 Q0：小数点在第0位的后面，即我们一般采用的方法 Q15 小数点在第15位的后面，0～14位都是小数位。转化公式：Q＝（int）（F×pow（2，q）） F＝（float）（Q×pow（2，－q）） 3．Q格式的运算 1>定点加减法：须转换成相同的Q格式才能加减 2>定点乘法：不同Q格式的数据相乘，相当于Q值相加 3>定点除法：不同Q格式的数据相除，相当于Q值相减 4>定点左移：左移相当于Q值增加 5>定点右移：右移相当于Q减少 4．Q格式的应用格式实际应用中，浮点运算大都时候都是既有整数部分，也有小数部分的。所以要选择一个适当的定标格式才能更好的处理运算。一般用如下两种方法： 1>使用时使用适中的定标，既可以表示一定的整数复位也可以表示小数复位，如对于2812的32位系统，使用Q15格式，可表示－65536.0～65535.999969482 区间内的数据。

浮点数的加减乘除运算步骤

设两个浮点数X=Mx※2Ex Y=My※2Ey 实现X±Y要用如下5步完成： ①对阶操作：小阶向大阶看齐 ②进行尾数加减运算 ③规格化处理：尾数进行运算的结果必须变成规格化的浮点数，对于双符号位的补码尾数来说，就必须是001×××…×× 或110×××…××的形式, 若不符合上述形式要进行左规或右规处理。 ④舍入操作：在执行对阶或右规操作时常用“0”舍“1”入法将右移出去的尾数数值进行舍入，以确保精度。 ⑤判结果的正确性：即阶码是否溢出若阶码下溢（移码表示是00…0），要置结果为机器0；若阶码上溢（超过了阶码表示的最大值）置溢出标志。例题：假定X=0 .0110011*211，Y=0.1101101*2-10（此处的数均为二进制）?? 计算X+Y；解：[X]浮：0 1010 1100110 [Y]浮：0 0110 1101101 符号位阶码尾数第一步：求阶差：│ΔE│=|1010-0110|=0100 第二步：对阶：Y的阶码小，Y的尾数右移4位 [Y]浮变为0 1010 0000110 1101暂时保存第三步：尾数相加，采用双符号位的补码运算 00 1100110 +00 0000110 00 1101100 第四步：规格化：满足规格化要求第五步：舍入处理，采用0舍1入法处理故最终运算结果的浮点数格式为：0 1010 1101101，即X+Y=+0. 1101101*210

①阶码运算：阶码求和（乘法）或阶码求差（除法）即[Ex+Ey]移= [Ex]移+ [Ey]补 [Ex－Ey]移= [Ex]移+ [－Ey]补 ②浮点数的尾数处理：浮点数中尾数乘除法运算结果要进行舍入处理例题：X=0 .0110011*211，Y=0.1101101*2-10 求X※Y 解：[X]浮：0 1 010 ******* [Y]浮：0 0 110 1101101 第一步：阶码相加 [Ex+Ey]移=[Ex]移+[Ey]补=1 010+1 110=1 000 1 000为移码表示的0 第二步：原码尾数相乘的结果为： 0 10101101101110 第三步：规格化处理：已满足规格化要求，不需左规，尾数不变，阶码不变。第四步：舍入处理：按舍入规则，加1进行修正所以X※Y= 0.1010111※2+000

DSP实验手册实验一CCS使用及DSP的运算(精)

当为正数时，符号位为0，为负数时，符号位为1 当采用二进制补码进行数的运算时，具有如下的两个优点：可以将加法与减法统一成加法运算符号位可以进行扩展，而其数值不变，这可以使一个比较小的数存放到比较大的寄存器当中例： 1×2 + 0×1 = -2 （11110）2 = 1×（-16）+ 1×8 + …… + 当将其符号位扩展三位，放入一8位的寄存器中 1×2 + 0×1 = -2 （11111110）2 = 1×（-128）+ 1×64 + …… + 这将为运算提供极大的方便，因而在定点的DSP 中，大多数情况采用二进制补码形式。 C5000系列的DSP 硬件只支持定点运算，浮点运算要通过软件来实现。其运算字长为16位，也就是说，DSP 所能表示的整数的范围也就决定了，其范围为－32768到32767。而在很多情况下，数学运算过程中不一定是整数，而且动态范围也不是固定不变的。如何解决这个问题？对于只支持定点运算的CPU 来说，在硬件上并没有提供小数点定位的机制。只有靠软件中人为地假设将小数点放在16位数据中的不同位置，就可以表示不同大小与不同精度的数据了，这就是数的定标。数的定标有Q 与S 两种表示方法。在Q 表示法中，Q 代表（Quantity of Fractional Bits）数中尾数部分的位数，即小数点右边的位数。而S 表示法中，S 代表数中整数部分的位数，即小数点左边的位数。实用中一般用Q 表示法，例：Q 0表示小数点在第0位的右边，即为整数。Q 15表数小数点在第15位的右边，即为小于1的小数（以二进制补码表示，第15位为符号位）。下表给出了16位数的16种不同的Q 表示法。并列出了它们所能表示的十进

DSP中的浮点小数与定点小数

DSP中的浮点小数与定点小数在DSP世界中，由于DSP芯片的限制,经常使用定点小数运算。所谓定点小数，实际上就是用整数来进行小数运算。下面先介绍定点小数的一些理论知识，然后以C语言为例，介绍一下定点小数运算的方法。在TI C5000 DSP系列中使用16比特为最小的储存单位，所以我们就用16比特的整数来进行定点小数运算。先从整数开始，16比特的储存单位最多可以表示0x0000到0xffff，65536种状态，如果它表示C语言中的无符号整数的话，就是从0到65535。如果需要表示负数的话，那么最高位就是符号位，而剩下的15位可以表示32768种状态。这里可以看出，对于计算机或者DSP芯片来说，符号并没有什么特殊的储存方式，其实是和数字一起储存的。为了使得无论是无符号数还是符号数，都可以使用同样的加法减法规则，符号数中的负数用正数的补码表示。我们都知道-1 + 1 =0，而0x0001表示1，那么-1用什么来表示才能使得-1 + 1 =0呢？答案很简单：0xffff。现在就可以打开Windows的计算器，用16进制计算一下0xffff+0x0001，结果是0x10000。那么0x10000和0x0000等价麽，我们刚才说过用16比特来表达整数，最高位的1是第17位，这一位是溢出位，在运算寄存器中没有储存这一位，所以结果是低16位，也就是0x0000。现在我们知道负数的表达方式了。举个例子：-100。首先我们需要知道100的16进制，用计算器转换一下，可以知道是0x0064，那么-100就是0x10000 - 0x0064，用计算器算一下得0xff9c。还有一种简单的转换符号的方法，就是取反加一：把数x写成二进制格式，每位0变1，1变0，最后把结果加1 就是-x了。好，复习了整数的相关知识之后，我们进入定点小数运算环节。所谓定点小数，就是小数点的位置是固定的。我们是要用整数来表示定点小数，由于小数点的位置是固定的，所以就没有必要储存它（如果储存了小数点的位置，那就是浮点数了）。既然没有储存小数点的位置，那么计算机当然就不知道小数点的位置，所以这个小数点的位置是我们写程序的人自己需要牢记的。先以10进制为例。如果我们能够计算12+34=46的话，当然也就能够计算1.2+3.4 或者0.12+0.34了。所以定点小数的加减法和整数的相同，并且和小数点的位置无关。乘法就不同了。12*34=408，而1.2*3.4=4.08。这里1.2的小数点在第1位之前，而4.08的小数点在第2位之前，小数点发生了移动。所以在做乘法的时候，需要对小数点的位置进行调整？！可是既然我们是做定点小数运算，那就说小数点的位置不能动！！怎么解决这个矛盾呢，那就是舍弃最低位。也就说 1.2*3.4=4.1，这样我们就得到正确的定点运算的结果了。所以在做定点小数运算的时候不仅需要牢记小数点的位置，还需要记住表达定点小数的有效位数。上面这个例子中，有效位数为2，小数点之后有一位。现在进入二进制。我们的定点小数用16位二进制表达，最高位是符号位，那么有效位就是15位。小数点之后可以有0 - 15位。我们把小数点之后有n位叫做Qn，例如小数点之后有12位叫做Q12格式的定点小数，而Q0就是我们所说的整数。 Q12的正数的最大值是0 111.111111111111，第一个0是符号位，后面的数都是1，那么这个数是十进制的多少呢，很好运算，就是0x7fff / 2^12 =

DSP芯片的简介

[摘要] 让你说出知道的芯片的名称，你可能会一时想不起，也不能一一罗列DSP 芯片都有哪些。或许是对DSP芯片深刻的了解才了然于心，由于种种原因的忘却；或许是因为大家在说DSP芯片好，既然大家都说好，那才是真的好，至于怎样好，可能是似懂非懂。那好吧，不管是懂还是不懂，现在让我们从新的视角来读懂这个芯片的世界，让你发现不曾明白的细节让你说出知道的芯片的名称，你可能会一时想不起，也不能一一罗列DSP芯片都有哪些。或许是对DSP芯片深刻的了解才了然于心，由于种种原因的忘却；或许是因为大家在说DSP芯片好，既然大家都说好，那才是真的好，至于怎样好，可能是似懂非懂。那好吧，不管是懂还是不懂，现在让我们从新的视角来读懂这个芯片的世界，让你发现不曾明白的细节。 DSP芯片，也称数字信号处理器，采用特殊的软硬件结构，是一种专注于进行数字信号处理运算的微处理器，其主要应用是实时快速地实现各种数字信号处理，是数字信号处理理论实用化过程的重要技术工具。在语音处理、图像处理等技术领域得到了广泛的应用。那根据对DSP芯片的理解来对比与其他芯片的最要的区别是什么？杭州海康威视数字技术股份有限公司的高级嵌入式开发经理黄田认为，DSP芯片与其它芯片的最大区别在于它拥有针对各种算法设计的大量专用指令，比如各种向量运算。另外DSP芯片在设计时更多地考虑到数据总线的带宽以及吞吐量，避免数据访问成为影响算法性能的瓶颈。芯片的基本结构为了快速地实现数字信号处理运算，DSP芯片一般都采用特殊的软硬件结构。下面简单介绍DSP芯片的基本结构。（1）哈佛结构主要特点是将程序和数据存储在不同的存储空间中，即程序存储器和数据存储器是两个相互独立的存储器，每个存储器独立编址，独立访问。与两个存储器相对应的是系统中设置了程序总线和数据总线，从而使数据的吞吐率提高了一倍。由于程序和数据在两个分开的空间，因此取指和执行能完全重叠。（2）流水线操作流水线与哈佛结构相关，DSP芯片广泛采用流水线以减少指令执行时间，从而增强了处理器的处理能力。处理器可以并行处理二到四条指令，每条指令处于流水线的不同阶段。下面所列是一个三级流水线操作的例子： CLLOUT1

浮点数计算方式

2.3.4二进制转10进制及10进制转为二进制【例2-3-4】把二进制110.11转换成十进制数，及十进制转为二进制。解：（110.11）2 =1×22＋1×21＋1×20＋1×2-1＋1×2-2 ＝4＋2＋0＋0.5＋0.25＝（6.75）10 把十进制转换为二进制解： 2 6 0 2 3 1 1 1 所以实数部分为110 0.75×（2×2-1）＝0.75×2×2-1 ＝1×2-1＋0.5×2-1 ＝1×2-1＋1×2-2 所以结果为：（110.11）2 2.3.5 浮点数在计算机中存储形式当前主流微机中广泛采用的IEEE754标准浮点格式。按IEEE754标准，常用的浮点数（32位短实数）的格式如图2-3所示。

IEEE754标准浮点格式 N=2e.M （M为浮点尾数，为纯小数，e为浮点数的指数（阶码））尾数部分决定了浮点数的精度，阶码决定了表示范围32为浮点数（IEEE754标准格式0—22为尾数M，23-30为阶码E，31为符号位S），阶码用移码表示。阶码E=指数真值e+127 规格化真值x=(-1)^S*(1.M)*2^(E-127) 将(82.25)10 转换成短浮点数格式。 1）先将(82.25)10 转换成二进制数 (82.25)10 =(1010010.01)2 2）规格化二进制数(1010010.01)2 1010010.01=1.01001001×2 6 尾数M=01001001 3）计算移码表示的阶码=偏置值+阶码真值： E=127+6=133=10000101 4）以短浮点数格式存储该数因此：符号位=0 S=0表示该数为正数阶码=10000101 由3）可得尾数=01001001000000000000000 由2）可得；尾数为23位，不足在后面添15位0 所以，短浮点数代码为： 0；10000101；01001001000000000000000 表示为十六进制代码为：42A48000H

DSP定点运算

一ＤＳＰ定点算数运算 1 数的定标在定点DSP芯片中，采用定点数进行数值运算，其操作数一般采用整型数来表示。一个整型数的最大表示范围取决于DSP芯片所给定的字长，一般为16位或24位。显然，字长越长，所能表示的数的范围越大，精度也越高。如无特别说明，本书均以16位字长为例。DSP芯片的数以2的补码形式表示。每个16位数用一个符号位来表示数的正负，0表示数值为正，l则表示数值为负。其余15位表示数值的大小。因此，二进制数0010000000000011b=8195 二进制数1111111111111100b= -4 对DSP芯片而言，参与数值运算的数就是16位的整型数。但在许多情况下，数学运算过程中的数不一定都是整数。那么，DSP芯片是如何处理小数的呢？应该说，DSP芯片本身无能为力。那么是不是说DSP芯片就不能处理各种小数呢？当然不是。这其中的关键就是由程序员来确定一个数的小数点处于16位中的哪一位。这就是数的定标。通过设定小数点在16位数中的不同位置，就可以表示不同大小和不同精度的小数了。数的定标有Q表示法和S表示法两种。表1.1列出了一个16位数的16种Q表示、S表示及它们所能表示的十进制数值范围。从表1.1可以看出，同样一个16位数，若小数点设定的位置不同，它所表示的数也就不同。例如， 16进制数2000H=8192，用Q0表示 16进制数2000H=0.25，用Q15表示但对于DSP芯片来说，处理方法是完全相同的。从表1.1还可以看出，不同的Q所表示的数不仅范围不同，而且精度也不相同。Q越大，数值范围越小，但精度越高；相反，Q越小，数值范围越大，但精度就越低。例如，Q0 的数值范围是一32768到+32767，其精度为1，而Q15的数值范围为-1到0.9999695，精度为1/32768=0.00003051。因此，对定点数而言，数值范围与精度是一对矛盾，一个变量要想能够表示比较大的数值范围，必须以牺牲精度为代价；而想精度提高，则数的表示范围就相应地减小。在实际的定点算法中，为了达到最佳的性能，必须充分考虑到这一点。浮点数与定点数的转换关系可表示为：浮点数(x)转换为定点数(xq)：xq=(int)x* 2Q 定点数(xq)转换为浮点数(x)：x=(float)xq*2-Q 例如，浮点数x=0.5，定标Q=15，则定点数xq=L0.5*32768J=16384，式中LJ表示下取整。反之，一个用Q=15表示的定点数16384，其浮点数为163幼*2-15=16384/32768=0.5。浮点数转换为定点数时，为了降低截尾误差，在取整前可以先加上0.5。表1.1 Q表示、S表示及数值范围 Q表示 S表示十进制数表示范围 Q15 S0.15 -1≤x≤0.9999695 Q14 S1.14 -2≤x≤1.9999390 Q13 S2.13 -4≤x≤3.9998779 Q12 S3.12 -8≤x≤7.9997559 Q11 S4.11 -16≤x≤15.9995117 Q10 S5.10 -32≤x≤31.9990234 Q9 S6.9 -64≤x≤63.9980469 Q8 S7.8 -128≤x≤127.9960938 Q7 S8.7 -256≤x≤255.9921875

DSP芯片的定点运算

第3章 DSP 芯片的定点运算 3.1 数的定标在定点DSP 芯片中，采用定点数进行数值运算，其操作数一般采用整型数来表示。一个整型数的最大表示范围取决于DSP 芯片所给定的字长，一般为16位或24位。显然，字长越长，所能表示的数的范围越大，精度也越高。如无特别说明，本书均以16位字长为例。 DSP 芯片的数以2的补码形式表示。每个16位数用一个符号位来表示数的正负，0表示数值为正，1则表示数值为负。其余15位表示数值的大小。因此二进制数0010000000000011b ＝8195 二进制数1111111111111100b ＝-4 对DSP 芯片而言，参与数值运算的数就是16位的整型数。但在许多情况下，数学运算过程中的数不一定都是整数。那么，DSP 芯片是如何处理小数的呢？应该说，DSP 芯片本身无能为力。那么是不是说DSP 芯片就不能处理各种小数呢？当然不是。这其中的关键就是由程序员来确定一个数的小数点处于16位中的哪一位。这就是数的定标。通过设定小数点在16位数中的不同位置，就可以表示不同大小和不同精度的小数了。数的定标有Q 表示法和S 表示法两种。表3.1列出了一个16位数的16种Q 表示、S 表示及它们所能表示的十进制数值范围。从表3.1可以看出，同样一个16位数，若小数点设定的位置不同，它所表示的数也就不同。例如： 16进制数2000H ＝8192，用Q0表示 16进制数2000H ＝0.25，用Q15表示但对于DSP 芯片来说，处理方法是完全相同的。从表3.1还可以看出，不同的Q 所表示的数不仅范围不同，而且精度也不相同。Q 越大，数值范围越小，但精度越高；相反，Q 越小，数值范围越大，但精度就越低。例如，Q0的数值范围是-32768到+32767，其精度为1，而Q15的数值范围为-1到0.9999695，精度为 1/32768 = 0.00003051。因此，对定点数而言，数值范围与精度是一对矛盾，一个变量要想能够表示比较大的数值范围，必须以牺牲精度为代价；而想提高精度，则数的表示范围就相应地减小。在实际的定点算法中，为了达到最佳的性能，必须充分考虑到这一点。浮点数与定点数的转换关系可表示为：浮点数(x)转换为定点数()：Q q x 2x (int)*= 定点数(q x )转换为浮点数(x)：Q q x -*=2)float (x 例如，浮点数 x=0.5，定标 Q ＝15，则定点数q x ＝??16384327685.0=?，式中 ??表示下取整。反之，一个用 Q ＝15 表示的定点数16384，其浮点数为16384×2-15 ＝16384/32768=0.5。

浮点数在计算机中的存储方式

C语言和C#语言中，对于浮点类型的数据采用单精度类型（float）和双精度类型(double)来存储，float数据占用32bit,double数据占用64bit,我们在声明一个变量float f= 2.25f的时候，是如何分配内存的呢？如果胡乱分配，那世界岂不是乱套了么，其实不论是float还是double在存储方式上都是遵从IEEE 的规范的，float遵从的是IEEE R32.24 ,而double 遵从的是R64.53。无论是单精度还是双精度在存储中都分为三个部分： 1.符号位(Sign) : 0代表正，1代表为负 2.指数位（Exponent）:用于存储科学计数法中的指数数据，并且采用移位存储 3.尾数部分（Mantissa）：尾数部分其中float的存储方式如下图所示：而双精度的存储方式为: R32.24和R64.53的存储方式都是用科学计数法来存储数据的，比如8.25 用十进制的科学计数法表示就为:8.25*,而120.5可以表示为:1.205*,这些小学的知识就不用多说了吧。而我们傻蛋计算机根本不认识十进制的数据，他只认识0，1，所以在计算机存储中，首先要将上面的数更改为二进制的科学计数法表示，8.25用二进制表示可表示为1000.01,我靠，不会连这都不会转换吧?那我估计要没辙了。120.5用二进制表示为：1110110.1用二进制的科学计数法表示1000.01可以表示为

1.0001*,1110110.1可以表示为1.1101101*,任何一个数都的科学计数法表示都为1.xxx*,尾数部分就可以表示为xxxx,第一位都是1嘛，干嘛还要表示呀？可以将小数点前面的1省略，所以23bit的尾数部分，可以表示的精度却变成了24bit，道理就是在这里，那24bit能精确到小数点后几位呢，我们知道9的二进制表示为1001，所以4bit能精确十进制中的1位小数点，24bit就能使float能精确到小数点后6位，而对于指数部分，因为指数可正可负，8位的指数位能表示的指数范围就应该为:-127-128了，所以指数部分的存储采用移位存储，存储的数据为元数据+127，下面就看看8.25和120.5在内存中真正的存储方式。首先看下8.25，用二进制的科学计数法表示为:1.00001* 按照上面的存储方式，符号位为:0，表示为正，指数位为:3+127=130 ,位数部分为,故8.25的存储方式如下图所示: 而单精度浮点数120.5的存储方式如下图所示:

定点dsp与浮点dsp的比较

定点dsp与浮点dsp的比较 DSP数字信号处理器是一种特别适合于进行数字信号处理的微处理器，主要用于实时快速地实现各种数字信号处理算法定点运算DSP数字信号处理器在应用中已取得了极大的成功，而且仍然是D SP应用的主体。然而，随着对DSP处理速度与精度、存储器容量、编程的灵活性和方便性要求的不断提高、自80年代中后期以来，各DSP生产厂家陆续推出了各自的32bit浮点运算DSP。定点DSP指令集定点DSP指令集是按两个目标来设计的： ·使处理器能够在每个指令周期内完成多个操作，从而提高每个指令周期的计算效率。 ·将存贮DSP程序的存储器空间减到最小（由于存储器对整个系统的成本影响甚大，该问题在对成本敏感的DSP应用中尤为重要）。和定点运算DSP相比，浮点运算DSP具有许多优越性：浮点运算DSP比定点运算DSP的动态范围要大很多。定点DSP的字长每增加1bit,动态范围扩大6dB。16bit字长的动态范围为96dB。程序员必须时刻关注溢出的发生。例如，在作图像处理时，图像作旋转、移动等，就很容易产生溢出。这时，要么不断地移位定标，要么作截尾。前者要耗费大量的程序空间和执行时间，后者则很快带来图像质量的劣化。总之，是使整个系统的性能下降。在处理低信噪比信号的场合，例如进行语音识别、雷达和声纳信号处理时，也会发生类似的问题。而32bit浮点运算DSP的动态范围可以作到1536dB，这不仅大大扩大了动态范围，提高了运算精度，还大大节省了运算时间和存储空间，因为大大减少了定标，移位和溢出检查。由于浮点DSP的浮点运算用硬件来实现，可以在单周期内完成，因而其处理速度大大高于定点DSP。这一优点在实现高精度复杂算法时尤为突出，为复杂算法的实时处理提供了保证。 32bit浮点DSP的总线宽度较定点DSP宽得多，因而寻址空间也要大得多。这一方面为大型复杂算法提供了可能、因为省的DSP目标子程序已使用到几十MB存储器或更多；另一方面也为高级语言编译器、DSP操作系统等高级工具软件的应用提供了条件。 DSP的进一步发展，必然是多处理器的应用。新型的浮点DSP已开始在通信口的设置和强化、资源共享等方面有所响应 ====================================================== TI科学家谈浮点DSP未来发展自十多年前浮点数字信号处理器(DSP)诞生以来，便为实时信号处理提供了算术上更为先进的备选方案。不过，定点器件至今仍是业界的主流--当然低成本是主要原因。定点DSP每器件产品的价格很低，这对大规模大众市场应用而言是相当重要的优势。相比较而言，浮点DSP能够实现更快速而简便的开发，因此对开发成本比单位制造成本重要的小规模应用而言，更是最佳的选择。

DSP定标问题解决

好，我先抛点玉吧 DSP芯片的定点运算 3.1 数的定标在定点DSP芯片中，采用定点数进行数值运算，其操作数一般采用整型数来表示。一个整型数的最大表示范围取决于DSP芯片所给定的字长，一般为16位或24位。显然，字长越长，所能表示的数的范围越大，精度也越高。如无特别说明，本书均以16位字长为例。 DSP芯片的数以2的补码形式表示。每个16位数用一个符号位来表示数的正负，0表示数值为正，1则表示数值为负。其余15位表示数值的大小。因此二进制数0010000000000011b＝8195 二进制数1111111111111100b＝-4 对DSP芯片而言，参与数值运算的数就是16位的整型数。但在许多情况下，数学_运算过程中的数不一定都是整数。那么，DSP芯片是如何处理小数的呢？应该说，DSP芯片本身无能为力。那么是不是说DSP芯片就不能处理各种小数呢？当然不是。这其中的关键就是由程序员来确定一个数的小数点处于16位中的哪一位。这就是数的定标。通过设定小数点在16位数中的不同位置，就可以表示不同大小和不同精度的小数了。数的定标有Q表示法和S表示法两种。表3.1列出了一个16位数的16种Q表示、S表示及它们所能表示的十进制数值范围。从表3.1可以看出，同样一个16位数，若小数点设定的位置不同，它所表示的数也就不同。例如： 16进制数2000H＝8192，用Q0表示 16进制数2000H＝0.25，用Q15表示但对于DSP芯片来说，处理方法是完全相同的。从表3.1还可以看出，不同的Q所表示的数不仅范围不同，而且精度也不相同。Q越大，数值范围越小，但精度越高；相反，Q越小，数值范围越大，但精度就越低。例如，Q0的数值范围是-32768到+32767，其精度为1，而Q15的数值范围为-1到0.9999695，精度为1/32768 = 0.00003051。因此，对定点数而言，数值范围与精度是一对矛盾，一个变量要想能够表示比较大的数值范围，必须以牺牲精度为代价；而想提高精度，则数的表示范围就相应地减小。在实际的定点算法中，为了达到最佳的性能，必须充分考虑到这一点。浮点数与定点数的转换关系可表示为：浮点数(x)转换为定点数( )：定点数( )转换为浮点数(x)：例如，浮点数x=0.5，定标Q＝15，则定点数＝，式中表示下取整。反之，一个用Q＝15 表示的定点数16384，其浮点数为16384×2-15 ＝16384/32768=0.5。表3.1 Q表示、S表示及数值范围 Q表示S表示十进制数表示范围 Q15 S0.15 -1≤X≤0.9999695 Q14 S1.14 -2≤X≤1.9999390 Q13 S2.13 -4≤X≤3.9998779 Q12 S3.12 -8≤X≤7.9997559 Q11 S4.11 -16≤X≤15.9995117 Q10 S5.10 -32≤X≤31.9990234 Q9 S6.9 -64≤X≤63.9980469 Q8 S7.8 -128≤X≤127.9960938 Q7 S8.7 -256≤X≤255.9921875

DSP实验手册实验一 CCS使用及DSP的运算

实验一 CCS使用及DSP基本数学运算一、实验目的： 1、熟悉CCS集成开发环境，掌握工程的生成方法； 2、熟悉SEED-DTK5416实验环境； 3、掌握CCS集成开发环境的调试方法； 4、了解数在计算过程中的定标，掌握数的定点、浮点表示方法，定点、浮点基本运算以及定点、浮点间的相互转换。二、实验内容： 1、 DSP源文件的建立； 2、 DSP程序工程文件的建立； 3、编译与链接的设置，生成可执行的DSP文件； 4、进行DSP程序的调试与改错； 5、学习使用CCS集成开发工具的调试工具； 6、观察实验结果；三、实验知识背景：在DSP编程过程中，数以二进制、十进制、与十六制表示均可。在定点DSP的运算过程中，数一般采用二进制与二进制补码的形式进行运算的。其中二进制数只能代表正数不能代表负的数，而二进制补码记数系统弥补了这一缺点。它的构成如下；在二进制的基础上，加一符号位。符号位位于二进制数的最高位当为正数时，符号位为0，为负数时，符号位为1 当采用二进制补码进行数的运算时，具有如下的两个优点：可以将加法与减法统一成加法运算符号位可以进行扩展，而其数值不变，这可以使一个比较小的数存放到比较大的寄存器当中例：（11110）2 = 1×（-16）+ 1×8 + …… + 1×2 + 0×1 = -2 当将其符号位扩展三位，放入一8位的寄存器中（11111110）2 = 1×（-128）+ 1×64 + …… + 1×2 + 0×1 = -2 这将为运算提供极大的方便，因而在定点的DSP中，大多数情况采用二进制补码形式。 C5000系列的DSP硬件只支持定点运算，浮点运算要通过软件来实现。其运算字长为16位，也就是说，DSP所能表示的整数的范围也就决定了，其范围为－32768到32767。而在很多情况下，数学运算过程中不一定是整数，而且动态范围也不是固定不变的。如何解决这个问题？对于只支持定点运算的CPU来说，在硬件上并没有提供小数点定位的机制。只有靠软件中人为地假设将小数点放在16位数据中的不同位置，就可以表示不同大小与不同精度的数据了，这就是数的定标。数的定标有Q与S两种表示方法。在Q表示法中，Q代表（Quantity of Fractional Bits）数中尾数部分的位数，即小数点右边的位数。而S表示法中，S代表数中整数部分的位数，即小数点左边的位数。实用中一般用Q表示法，例：Q0表示小数点在第0位的右边，即为整数。Q15表数小数点在第15位的右边，即为小于1的小数（以二进制补码表示，第15位为符号位）。下表给出了16位数的16种不同的Q表示法。并列出了它们所能表示的十进

DSP总结

最近在对前做的一个DSP项目进行改版，正好借此机会把学习的东西总结一番，此总结针对TI的TMS320F2812而言，编译器为CCS3.1。希望对自己或大家有所帮助。第1章DSP芯片的定点运算 1．数据的溢出： 1>溢出分类：上溢（overflow）：下溢（underflow） 2>溢出的结果：例：signed int ：32767+1＝－32768；-32768-1＝32767 unsigned char：255+1＝0；0-1＝255 3>为了避免溢出的发生，一般在DSP中可以设置溢出保护功能。当发生溢出时，自动将结果设置为最大值或最小值。 2．定点处理器对浮点数的处理： 1>定义变量为浮点型（float，double），用C语言抹平定点处理器和浮点处理器的区别，但是程序的代码庞大，运算速度也慢。 2>放大若干倍表示小数。比如要表示精度为0.01的变量，放大100倍去运算，运算完成后再转化。但是这个做法比较僵硬，如要将上面的变量重新定义成0.001精度，又需要放大1000倍，且要重新编写整个程序，考虑溢出等问题。 3>定标法：Q格式：通过假定小数点位于哪一位的右侧，从而确定小数的精度。 Q0：小数点在第0位的后面，即我们一般采用的方法 Q15 小数点在第15位的后面，0～14位都是小数位。转化公式：Q＝（int）（F×pow（2，q）） F＝（float）（Q×pow（2，－q）） 3．Q格式的运算 1>定点加减法：须转换成相同的Q格式才能加减 2>定点乘法：不同Q格式的数据相乘，相当于Q值相加 3>定点除法：不同Q格式的数据相除，相当于Q值相减 4>定点左移：左移相当于Q值增加

文档之家