快速浮点加法器的FPGA实现

格式：pdf
大小：199.28 KB
文档页数：3

下载文档原格式

/ 3

高速流水线浮点加法器的FPGA实现

高速流水线浮点加法器的FPGA实现
0 引言
现代信号处理技术通常都需要进行大量高速浮点运算。

由于浮点数系统
操作比较复杂，需要专用硬件来完成相关的操作(在浮点运算中的浮点加法运算
几乎占到全部运算操作的一半以上)，所以，浮点加法器是现代信号处理系统中
最重要的部件之一。

FPGA 是当前数字电路研究开发的一种重要实现形式，它
与全定制ASIC 电路相比，具有开发周期短、成本低等优点。

但多数FPGA 不
支持浮点运算，这使FPGA 在数值计算、数据分析和信号处理等方面受到了限制，由于FPGA 中关于浮点数的运算只能自行设计，因此，研究浮点加法运算
的FPGA 实现方法很有必要。

1 IEEE 754 单精度浮点数标准
浮点数可以在更大的动态范围内提供更高的精度，通常，当定点数受其
精度和动态范围所限不能胜任时，浮点数标准则能够提供良好的解决方案。

IEEE 协会制定的二进制浮点数标准的基本格式是32 位宽(单精度)和64
位宽(双精度)，本文采用单精度格式。

图1 所示是IEEE754 单精度浮点数格式。

图中，用于单精度的32 位二进制数可分为三个独立的部分，其中第0 位到22
位构成尾数，第23 位到第30 位构成指数，第31 位是符号位。

实际上，上述格式的单精度浮点数的数值可表示为：
上式中，当其为正数时，S 为0；当其为负数时，S 为1；(-1)s 表示符号。

指数E 是ON255 的变量，E 减127 可使指数在2-127 到2128 变化。

尾数采用科学计算法表示：M=1．m22m21m20……m0。

m22，m21，…，m0，mi 为Mp。

浮点LMS算法的FPGA实现

／１１ｅ
图１文献［］１定义的２４位浮点数据格式
该格式的浮点数所表示的具体值可用下面的通式
表示：Ｖ＝ｍｘ２。（）１
阵列）实现的自定义２４位浮点格式和一种高效结构的多输入ＦＡ（Ｐ浮点加法器）这种结构的多输入ＦＡ，Ｐ与传统的级联结构相比不仅可增加运算速度，还能大
理的数据都是经ＡＤ采样送出的信号，／其分辨率一般
取１２～１６位，１有效位数即可满足绝大多数的取８位
情况。同时，前ＦＧ目ＰＡ芯片内集成的乘法器均是１８Ｘ１的硬核。据此，８位文献［］１自定义了一种２４位的
ＹＩ＝（）Ｉ（）ＩｎＸ（）Ｉ（）２（）３（）４（）５ｅ／（）＝ｒ／Ｉ（）一Ｙ／Ｉ（）ＩＶ（）＝Ｘ（）（）／Ｉ／ｅ／ＩＩｒ（＋１ｅ／Ｉ）＝ｒ（）＋ＺｅｎＶ（）ｎ
５・８
维普资讯
第３３卷第６期
杜
勇，：等浮点Ｌ算法的ＦＧＭＳＰＡ实现
・计算机与自动化技术・
对阶操作
Ｅｌ一
：
２浮点Ｌ算法的ＦＧＭＳＰＡ实现
比较器Ｉｌ
． ——Ｌ＿．１Ｃｎｉ
般说来，输入浮点加法器需要以下操作步双
骤：
二笪！１翌坠卜
ａ）对阶操作：比较指数大小，指数小的操作数对的尾数进行移位，使操作数的阶码相同。

浮点运算的FPGA实现

数必须满足
，还要对运算结果进行规格化，即判断尾
数的最高位。若为零则将尾数左移一位、阶码加一，直到阶码最
高为为１。由于对阶时小阶码数尾数右移，造成和的尾数位长大
于２３位。若采用截断处理则相对误差较大，故采用舍入操作以
减小误差。另外，当和较大，超过表示范围；或当运算结果过小，
超过浮点数的分辨率时会造成运算错误。故须增加电路判断运
技
术
创
新
图４乘法运算仿真图四中数据验证了同号、异号及数据过大强制清零等几种情况下乘法操作的正确性。其中５２４２８８０（十进制）＝１０１０００···０、４４５６４４８（十进制）＝１０００１００ ···０、５５７０５６０（十进制）＝１０１０１０１００···０；６５５３６００（十进制）＝１１００１００···０、４７１８５９２（十进制）＝１００１０００···０、７３７２８００（十进制）＝１１１００００１００···０。
算结果是否正确。
－２０８－３６０元／年邮局订阅号：８２－９４６
《现场总线技术应用２００例》
您的论文得到两院院士关注
ＰＬＤＣＰＬＤＦＰＧＡ应用
加法运算流程另外，对阶时阶码小的数据尾数右移，而规格化时还有可能左移，这可能造成有效数据位的丢失。故为保证计算精度，须增加加法器的位宽。由于规格数首位为１，同阶数据产生进位无需左移数据；而不同阶数据的和亦可保证高位为１，故同号加法操作时不会产生这种情况，只有异号加法操作存在这种情况。显然同阶数无需右移操作，当阶差为二或更大时对阶后尾数差将大于四分之一，即次高位为１，规格化时只需左移一位数据。而阶差为１时也只可能右溢出一位数据。故在保证浮点数精度不变的情况只须将加法器增加一位。对于减法运算，只需将被减数符号取反然后进行加法运算即可。ＱＵＡＲＴＵＳＩＩ下进行仿真其结果如图３（数据采用十进制）２．２浮点乘／除法运算浮点乘法实现相对简单，只需将两符号异或、阶码做和、尾数做积。即：ｅ３＝ｅ１＋ｅ２－１２７，ｆ３＝ｆ１×ｆ２，。然后进行规格化。由于有条件 1/ 2 £ f1, f2 < 1成立，使得满足 1/ 4 £ f3 < 1即可知ｆ３的最高位和次高位中至少一位为１。从而使规格化操作流程大大简化。最后对运算结果进行舍入操作，同时仍需检查运算结果是否有数据溢出的问题。

高速浮点运算单元的FPGA实现

本文以实时信号处理为应用背景 ,首先介绍了单精度浮点格式 ,然后从速度和占用资源这两个角度出发 , 详细介绍了浮点乘法单元和浮点加法单元的流水线结构。经过仿真验证 ,在 V irtex24系列 FPGA (现场可编程门阵列 )上 ,浮点加法器的最高运行速率达到 405 MHz, 而浮点乘法器的最高运行速率达到 429 MHz。
24位构成尾数部分。由它表示的浮点数的值 V 可以
表示为 :
V = ( - 1) s ×2E - 127 ( 1. M )
(1)
2 浮点加法运算单元
本文采用改进的流水线型浮点加法器结构 [ 5 ] ,如图 2所示。可以用对阶移位、加 /减操作和结果选择 3 个主要功能模块来描述。设 2 个浮点操作数分别为 A、B ,其中 Ea、Eb 为指数操作数 , M a、M b 为尾数操作数 , Sa、Sb 为符号位 , E、M 、S 分别是结果的指数、尾数和符号位。
第 35卷第 11期 2009年 11月
ቤተ መጻሕፍቲ ባይዱ
信 Info rm
息化研 atization Re
究 sea
rch VNool. v3. 52N0o0.911
高速浮点运算单元的 FPGA实现
张小妍 ,邵杰
(南京航空航天大学信息科学与技术学院 ,江苏省南京市 210016)
对较小的尾数进行移位操作无疑是限制此模块主频提高的瓶颈。首先 ,移位位数取决于指数差 shift_ num [ 7 ∶0 ] ,必须先求出指数差 ,然后判断指数差是否大于有效位的位长 ,再进行移位。对于 32位浮点加法运算单元 ,这样串行执行的时延太长。因此 ,在求指数差的同时 ,将移位的中间结果进行输出寄存。同时用 3 个 8选 1数据选择器和 1个 4选 1数据选择器 ,插入 2级流水线结构实现该移位器 ,如图 3 所示。经仿真测试 ,单独移位单元的工作频率可以达到 500 MHz。

FPGA中的浮点四则运算

FPGA中的浮点四则运算由于定点的四则运算比较简单，如加减法只要注意符号扩展，小数点对齐等问题即可。

在本文中，运用在前一节中描述的自定义浮点格式FPGA中数的表示方法（下），完成浮点四则运算的实现过程1.自定义浮点格式加（减）法运算基于FPGA 实现的浮点加法运算包括了一系列对尾数和指数部分的操作：移位、交换、格式化、舍入和格式化等。

如下图所示，自定义浮点流水加法器实现结构主要分为两部分：基本加法器部分和格式化操作部分。

在图(a)中的基本加法器，首先比较两个操作数的指数部分，较大的指数加上1之后，寄存输出（保证流水输出）作为加法和的指数部分；另一方面根据指数部分的比较结果，交换尾数的位置，即需要对较小的尾数进行右移对齐；之后尾数部分相加，得到的结果高位截取后输出作为加法和的尾数部分。

由于操作数A 和B 的尾数部分首先需要符号位拓展之后进行才进行下一步操作，而最后的和是直接高位截取输出的，故导致加法结果比实际值小一倍，这就是前面指数需要加上1输出的原因。

对于(b)中的格式化操作，首先对来自基本加法器的尾数和指数进行预处理，然后计算尾数部分的符号位个数。

最后根据计算得到的符号位个数，左移尾数后输出尾数部分，而指数则减去符号位数作为指数部分输出。

如果是一次而输入加法则以这样的结构即可，但如果涉及多次加法，以流水形式完成，则在结构上可以作更好的优化。

如下是四输入和八输入加法器的结构：如上所示的情况，可知，这样的方法可以减少格式化操作，而格式化操作在整个运算过程中消耗相对比较多的资源，因此这样的实现结构可以有效的减少硬件资源的消耗。

3. 乘加运算浮点乘法运算较为简单，对应的尾数部分进行相乘，指数部分进行相加。

尾数相乘部分采用XILINX 乘法器IP即可。

需要注意的是，乘法结果输出的位宽指定，在乘法器IP中，按一般流程下来，乘完之后的结果是保留两位符号位（假设乘数都是一个符号的情况），即多出一个符号位，按小数乘法分析的话，值的情况是比实际结果小一倍，在截位输出的时候需要做一定的取舍（是从最高位开始截位输出，还是次高位开始截位输出；如果从最高位截位输出，则结果比实际值小一倍，如果从次高位截位输出只有一种情况会溢出，即两个乘数都为-1的情况，这种情况如果从次高位截位输出则会错误，其余情况都是正确的）。

基于FPGA的全流水浮点乘累加器的设计及实现

基于FPGA的全流水浮点乘累加器的设计及实现作者：李世平陈铠来源：《电子技术与软件工程》2016年第02期摘要为提升浮点乘累加的流水性能，本文提出了一种基于FPGA全流水浮点乘累加器的设计和实现方法。

通过无阻赛流水累加和串形全加等技术，实现了任意长度单精度浮点复向量的乘累加计算，且相邻两个向量之间无流水间隙。

该累加器在Xilinx的XC7VX690T FPGA上实现，乘法器和逻辑资源消耗不到1%，最高运行频率可达279MHz。

【关键词】FPGA 浮点乘累加全流水1 引言随着半导体技术的不断发展，FPGA的功能和性能显著提升，正逐渐成为雷达、通信等诸多领域数字系统设计的重点，通常被用做复杂信号处理算法的硬件加速。

浮点乘累加作为信号处理算法中的常用基本单元，在矩阵乘、矩阵协方差、FIR等计算过程中都有着广泛应用。

传统累加器是通过将加法器的输出反馈到输入端来实现，对于浮点运算而言，由于浮点加法计算较复杂，需要经历对阶、尾数运算、结果规格化、舍入处理和溢出判断五个步骤，一般会有7～14级的流水延迟，进而会导致流水线阻塞，因此需要研究采用合理的累加结构来提高流水性能。

Ling Zhuo等人提出了一种面向矩阵运算的流水累加结构，提高了流水性能，但该结构控制机制复杂，且缓存资源消耗大，正比于流水延迟量的平方；袁松等人采用了分级流水线方法，缓存消耗较小，但在中小规模矩阵累加时会出现流水线暂停，而且输出时延较大，与矩阵总数据个数成正比。

本文提出了一种基于FPGA的全流水浮点乘累加器结构，能够实时完成任意长度单精度浮点复向量的乘累加计算，且相邻两个向量之间无流水间隙，该累加器在Xilinx的XC7VX690T FPGA上实现，乘法器和逻辑资源消耗不到1%，最高运行频率可达279MHz，目前已成功在矩阵协方差、求逆等算法实现过程中推广应用。

2 方案设计基于FPGA的全流水乘累加器结构如图1所示。

A和B为两个等长度的浮点向量，valid 表示输入数据有效，last表示当前处理向量的最后一个数据；Q为输出累加结果，Qvalid为累加结果的有效标志。

用FPGA实现浮点FFT处理器的研究

国防科技大学学报第26卷第6期JOURNAL OF NATIONAL UNIVERSITY OF DEFENSE TECHNOLOGY Voi.26No.62004文章编号：1001-2486（2004）06-0061-04用FPGA实现浮点FFT处理器的研究*王远模，赵宏钟，张军，付强（国防科技大学电子科学与工程学院，湖南长沙410073）摘要：针对定点FFT处理器精度不高的缺点，提出了浮点格式FFT处理器的FPGA硬件实现方案。

详细阐述了FFT处理器的自定制浮点格式确定、算法选择和浮点加法实现等关键技术。

该处理器已投入使用，工作性能稳定，系统时钟80MHz，完成1024点FFT/IFFT运算只需64!s，误差小于-80dB。

关键词：FPGA；FFT；蝶形运算中图分类号：TN47 文献标识码：AThe Realization of Flolating-point FFT Processor with FPGA ChipWANG Yuan-mo，ZHAO Hong-zhong，ZHANG Jun，FU Oiang（Coiiege of Eiectronic Science and Engineering，Nationai Univ.of Defense Technoiogy，Changsha410073，China）Abstract：The FPGA reaiization of a fioating-point FFT processor is proposed to get over the poor precision of the fixed-point FFT processor.The definition of the fioating-point format，the seiection of arithmetic and the key technigues of the FPGA reaiization are discussed.Such a processor has been put into service and has stabie performance.Its operating freguency is 80MHz and it can finish1024point FFT/IFFT in64!s with an error iess than-80dB.Key words：FPGA；FFT；butterfiy computation在现代雷达、通信、图像处理等领域中，数字信号处理系统经常要进行高速、高精度的FFT运算。

基于FPGA的浮点运算器IP核的设计与实现

基于FPGA的浮点运算器IP核的设计与实现摘要
本文介绍了基于FPGA的浮点运算器IP核的设计与实现。

在实现过程中，我们采用Verilog HDL实现了一个32位浮点运算器的IP核，它能提
供执行加法、减法、乘法、除法以及规范化的功能，并具有很高的精确度。

在Xilinx FPGAs上实现，该IP核实现了高性能和可靠性。

实验结果表明，这种FPGA浮点运算器IP核的性能可以满足各种应用需求。

关键词：FPGA；浮点运算；IP核；Verilog HDL
1. Introduction
随着技术的发展，浮点运算在计算机体系结构中越来越重要。

它不仅
可以提高运算精度，而且可以准确表达计算机的结果。

为了实现高质量的
数字信号处理（DSP）系统，FPGA浮点运算器IP核变得越来越重要。

FPGA的浮点运算器IP核提供了一个高性能、可靠的实现环境，使得
浮点运算器在DSP系统中得以良好的应用。

此外，基于FPGA的浮点运算
器IP核还具有可编程性、低功率、灵活性和低成本等优势。

本文讨论了使用Verilog HDL实现基于FPGA的浮点运算器IP核的设
计与实现。

它包括浮点运算器的功能、实现及性能等方面的介绍。

2. Design and Implementation of FPGA Floating Point Unit
2.1 Floating Point Unit Design
在本文中，我们采用Verilog HDL实现了一个具有32位数据宽度的
浮点运算器IP核。

此外，它还具有加法、减法、乘法、除法以及规范化
的功能。

快速浮点加法器的FPGA实现

—202— 快速浮点加法器的FPGA 实现郭天天，张志勇，卢焕章（国防科技大学ATR 实验室，长沙 410073）摘要：讨论了3种常用的浮点加法算法，并在VirtexII 系列FPGA 上实现了LOP 算法。

实验结果表明在FPGA 上可以实现快速浮点加法器，最高速度可达152MHz ，资源占用也在合理的范围内。

关键词：浮点加法器；移位器；前导1预测；FPGAFPGA Implementation of Fast Floating-point AdderGUO Tiantian, ZHANG Zhiyong, LU Huanzhang(ATR Lab, NUDT, Changsha 410073)【Abstract 】Three commonly used Floating-point addition algorithms are discussed, and the LOP algorithm is implemented on VirtexII series FPGA. The implementing results show that the fast floating-point adder can be implemented on FPGA, the highest running frequency is 152MHz and the area cost is rational compare to the entire resources.【Key words 】Floating point adder ；Shifter ；Leading-one predicator ；FPGA计算机工程Computer Engineering 第31卷第16期Vol.31 № 16 2005年8月August 2005·开发研究与设计技术·文章编号：1000—3428(2005)16—0202—03文献标识码：A中图分类号：TP302浮点加/减法是数字信号处理中的一个非常频繁并且非常重要的操作。

基于FPGA的浮点运算器IP核的设计与实现

基于FPGA的浮点运算器IP核的设计与实现摘要浮点运算作为数字信号处理的最基本的运算，具备动态范围大的特点，不仅成为衡量微处理器性能的主要指标之一，而且广泛适用于复杂的数学计算、科学应用和工程设计中，随着多媒体技术的蓬勃发展，浮点运算单元的应用范围越来越广泛，它已经走入了千家万户，用来解决复杂的数字图像处理，移动物体模型的建立，三维动画设计与演示等等。

随着FPGA的出现以及EDA技术的成熟，采用FPGA实现数字信号处理的方法已经显示出巨大的潜力，利用FPGA技术设计浮点乘法器可以缩短产品的开发周期。

本设计提出了一种基于VHDL语言的浮点乘法器的硬件实现方法，就是用VHDL 语言描述设计文件和原理图方式设计，以Altera公司的Cyclone系列产品为硬件平台，以Quartus为软件工具进行模拟仿真，实现了任意以IEEE754标准表示的23位单精度浮点数的乘法运算。

设计中对阶码的溢出进行了研究并进行了处理，同时对结果进行了规格化处理，通过利用FPGA在线可编程的技术，设计出的浮点乘法器更加方便灵活，克服了专用乘法器的不足，更能广泛的应用到各个领域。

关键词：IEEE754，单精度浮点数，乘法器，硬件描述语言，FPGA，QuartusTHE DESIGN AND IMPLEMENTATION OF FLOATING-POINT UNIT IP CORE BASED ON FPGAABSTRACTAs the most basic operation of digital signal processing, floating-point calculation is equipped with the characteristic of dynamic range, it is not only the main measure of microprocessor performance indexes, but also is widely used in complex mathematical calculation, science applications and engineering design. with the vigorous development of multimedia technology, floating point arithmetic unit has been widely used, and it has come home, been used to solve complex problems, such as digital image processing, the establishment of the moving object model, 3-d animation design and demonstrate, etc. With the maturity of FPGA presence and EDA technology, it has shown great potential to realize digital signal processing by the method of using FPGA, it can cut short the development cycle by using the FPGA technology design floating-point on time-multiplier. The design is proposed based on VHDL language of floating on time-multiplier, the hardware realization method is described with VHDL language schematic design documents and Altera design, by the way the Cyclone series products for hardware platform, with Quartus for software tools for simulation,it realized any twenty-three single precision floating-point multiplication which is in the IEEE754 standard. Design of order yards was studied and spill the processing, and the results are the normalized processing, by using the on-line programmable FPGA technology, design the floating-point greater flexibility on time-multiplier, overcome the deficiency of special on time-multiplier, more can widely used in various fields.KEY WORDS：IEEE754，float，multiplier unit，VHDL，FPGA，Quartus目录前言 (1)第1章绪论 (3)§1.1 引言 (3)§1.2 浮点数的格式 (3)§1.2.1 一般浮点数表示方法 (3)§1.2.2 IEEE754标准表示的浮点数 (4)§1.2.3 浮点数的规格化 (5)§1.2.4 特殊浮点数 (5)§1.3 浮点乘法器的原理 (6)第2章EDA工具介绍 (8)§2.1 EDA技术及其发展 (8)§2.2 EDA设计流程及其工具 (8)§2.2.1 设计流程 (8)§2.2.2 HDL简介 (10)§2.2.3 Quartus II简介 (10)第3章整体框架设计及功能模块介绍 (11)§3.1 设计思路 (11)§3.2 预处理模块 (11)§3.3 定点乘法器 (12)§3.3.1 IEEE754舍入模式 (12)§3.3.2 定点乘法器原理 (13)§3.3.3 定点乘法器模块 (13)§3.4 计算尾数模块 (15)§3.5 计算阶码及溢出处理 (16)§3.5.1 定点加减法原理 (16)§3.5.2 溢出概念与检测方法 (17)§3.5.3 阶码运算原理 (18)§3.5.4 补码模块 (18)§3.5.5 阶码相加模块 (19)§3.5.6 溢出模块 (20)§3.6 数据显示模块 (21)§3.6.1 数据模块 (21)§3.6.2 显示模块 (22)第4章仿真结果及实验验证 (24)§4.1 顶层原理图 (24)§4.2 顶层仿真 (25)§4.2.1 一般情况 (25)§4.2.2 特殊情况 (25)§4.2.3 显示情况 (26)§4.3 引脚锁定 (26)§4.4 硬件平台 (27)§4.4.1 FPGA简介 (27)§4.4.2 芯片选择 (28)§4.5 下载验证 (28)结论 (30)参考文献 (31)致谢 (33)附录 (34)前言21世纪是信息化的时代，信息产业已经成为衡量一个国家经济科技实力的重要标志，集成电路则是信息技术与信息产业的基础，是电子信息产业的命脉。

基于FPGA的浮点运算器IP核的设计与实现

基于FPGA的浮点运算器IP核的设计与实现基于现场可编程门阵列（FPGA）的浮点运算器，是一种专门设计用于实现浮点数运算的IP核。

浮点运算器在科学计算、数字信号处理（DSP）、图像处理等领域中具有广泛的应用。

本文将探讨基于FPGA的浮点运算器IP核的设计与实现。

首先，我们需要确定浮点运算器的功能要求和性能指标。

常见的浮点运算器包括加法器、乘法器和除法器，它们能够进行浮点数的加法、乘法和除法运算。

浮点运算器的性能指标包括浮点数位数、运算精度、时钟频率、吞吐量、功耗等。

然后，我们可以选择合适的FPGA芯片进行设计。

不同的FPGA芯片具有不同的资源和性能特点，我们需要根据浮点运算器的功能需求和性能指标，选择具备足够资源和性能的FPGA芯片。

接下来，我们需要进行浮点运算器的架构设计。

浮点运算器的架构通常分为两个主要部分：浮点数运算单元和控制单元。

浮点数运算单元包括加法器、乘法器和除法器，它们实现具体的浮点数运算操作。

控制单元用于控制浮点数运算的流程和时序。

在浮点数运算单元的设计中，我们需要选择合适的浮点数格式。

常见的浮点数格式有IEEE754和自定义浮点数格式。

IEEE754浮点数格式是最常用的浮点数表示方法，它包括单精度浮点数（32位）、双精度浮点数（64位）和扩展精度浮点数（80位）。

自定义浮点数格式可以根据具体应用需求设计，例如定点数格式、定点数加浮点数格式等。

浮点运算器的设计可以采用各种硬件实现方法，如组合逻辑电路、查找表、乘法器阵列和流水线等。

我们需要根据浮点数运算的复杂度和性能要求选择合适的实现方法。

对于较复杂的浮点数运算，可以采用流水线架构来实现并发计算，提高性能和吞吐量。

在控制单元的设计中，我们需要确定浮点数运算的流程和时序。

控制单元可以采用状态机的方式实现，它根据具体的浮点数运算操作，生成相应的控制信号，控制浮点数运算单元的工作状态和时序。

最后，我们需要进行浮点运算器的验证和测试。

验证和测试是设计中非常重要的环节，它可以帮助我们发现并修复设计中的错误和缺陷。

基于FPGA的PLC浮点运算系统的设计与实现

基于FPGA的PLC浮点运算系统的设计与实现曹鹏;张彤;冯磊【摘要】Aiming at slowness and low accuracy problem of traditional PLC floating-point controller,a PLC floating-point operation system based on FPGA is proposed.According to compilation principle,the program conversion software IEC_ TO_FPGA is designed.The standard IEC 61131-3 structured text language is converted Verilog HDL language.By studying the IEEE754 standard floating-point representations addition and subtraction,multiplication and division rules,the hardware description language Verilog HDL is used to achieve a single-precision floating-point basic addition and subtraction,multiplication and division.In the Quartus II environment,the generated program is simulated,which verifies the feasibility of the FPGA-PLC floating point computing system.%针对传统PLC 应用领域中控制器浮点运算速度慢、精度低的问题,提出了基于FPGA的PLC浮点运算系统的实现方案.根据编译原理设计了程序转化软件IEC_TO_FPGA,实现了IEC 61131-3标准的结构化文本语言到Verilog HDL语言的转换.通过研究IEEE754标准的浮点数的表示及加减、乘除运算规则,利用硬件描述语言Verilog HDL实现了单精度浮点数基本的加减、乘、除的运算功能.在Quartus II环境下,将转换生成的程序进行功能仿真,验证了FPGA-PLC浮点运算系统的可行性.【期刊名称】《桂林电子科技大学学报》【年(卷),期】2017(037)003【总页数】6页(P228-233)【关键词】PLC;FPGA;结构化文本;浮点运算【作者】曹鹏;张彤;冯磊【作者单位】桂林电子科技大学机电工程学院,广西桂林 541004;桂林电子科技大学机电工程学院,广西桂林 541004;桂林电子科技大学机电工程学院,广西桂林541004【正文语种】中文【中图分类】TP273+.5因为可编程逻辑控制器(PLC)具有良好的稳定性和易用性，所以被广泛应用于各个行业中[1]。

基于FPGA的高速浮点加法器的实现

第一作者简介：秀芳（９７）女，族，士，授，究方向：王１６一，汉博教研无线通信。通讯作者简介：振龙（９５）男，族，士研究生，究方侯１８一，汉硕研向：息传输及处理。信
２浮点加法器的硬件实现过程
的硬件实现注入了新的活力。
位、双精度６４位。以单精度浮点数为例，计了３设２
位的高速浮点加法器。
ｓ
— 一Ｅ —
—— —— ——— ÷ ・——— 一Ｍ — — ——— —＋
文献［］计了高速的ＦＴ处理器，内部正２设Ｆ１Ｉ其是使用了浮点算法单元。由于其使用的是１６位浮点算法，整个设计的精度方面还有待提高。文献在［］３利用ＶｒｏＤｅｉｇＨＬ语言设计了一种浮点加法器，ｌ系统最高时钟频率达到８ＭＨ，是应用在实时信０ｚ但号处理领域，钟频率还有很大的提高。文献［时４］
ＳｍＳｉＥ进行联合仿真结果表明，系统的运行精度可以达到１数量级，时该设计可参数化、作为独立的子系统应用于其０同可
他数字信号处理领域。
关键词
ＩＥ７４ＥＥ５
可编程逻辑门阵列
第ｌ０卷
第２５期
２１００年９月
科
学
技
术
与

基于Verilog HDL语言的FPGA浮点数加减法运算的实现

工艺与技术！Gongyi yu Jishu基于Verilog HDL语言的FPGA浮点数加减法运算的实现谢文彬(淮安生物工程高等职业学校，江苏淮安223200)摘要#针对数控系统中刀具补偿、插补计算常采用浮点运算的问题，基于F P G A技术特点，采用V e r i l o g H D L语言实现32位浮点数的加减法运算，并通过仿真，验证其正确性。

关键词'浮点运算g Verilog H D L语言；现场可编程门阵列；仿真0引言浮点运算方式较定点运算有计数范围宽、有效精度高的特点，是目前大多数计算机系统采用的表式，是数控系统中刀具补偿、插补计算常采用的运算方法。

目前比较的方法是用D S P数实现浮点运算。

浮点表结构复杂，完全使用D S P软件实现™定程度D S P的运算度文主要研宄利用Verilog H D L语言进行F P G A浮点运算加减法方法的实现。

Verilog H D L是基于C语言的硬件描述语言，对数有特的优势。

1浮点数加减法运算的实现过程文浮点数的运算基于精度，位、阶码位、尾码位组成（以上由I E E E754[1]标准定义）。

在符合 I E E E754 的浮点数加减运算过程中，减法运算也可 '加法运算，数的可。

浮点数加法可较对等。

其加减法运算 [2]女(1) 是加法运算是减法运算。

(2) 1较浮点数的3 对位，加位(4 对阶完浮点数的尾码需要进行求和或求差。

5用F P G A实现浮点数加减法运算的模块结构如图1所示。

图1浮点数加减法基本算法模块结构在规格化模块中要对结果进行前导1检测、初次规格化、尾数结果，表多的有效数且用数，时大于等于1/2小于1，高位为1，一位，一称为“右规”，左移一位，阶码减™称为“左规”，规格化可增加有效数的位数，提高运算结精度[3]。

根据浮点数运算器可得到使用硬件描述语言设计运算的端口定表1所表1浮点运算模块端口输输名称位数名称位数c l k501S11r s t n1S21Y132E18Y232E28F123F223Y32y i c h u f l a t1Y E8Y_F23F o u t25在输入端口信号中，clk50为50 M H z时钟信号;rst_n为模块复位，低电平有效;Y1为被加数或被减数;Y2加数减数。

用VHDL语言在CPLD FPGA上实现浮点运算

浮点数的运算是数字信号处理的最基本的运算 ,浮点数具备动态范围大的特点 ,但是由于浮点运算器件的电路比较复杂 ,所以大多数的 EDA 软件目前尚不支持浮点运算 ,浮点运算器件只能自行设计 ,在设计过程还要考虑运算精度、运算速度、资源占用、设计复杂度的折衷.
1 浮点数格式简介
浮点数据通常表示为 : N = ( - 1) S ×M ×RE. 其中 M 是浮点数的尾数 , R 是基数 , E 是阶码 , S 是数据的符号位[4] .
VHDL 支持乘法运算 ,一个简单的 4 ×4 输出 8 位的乘法器描述如下 : Entity MULT is PORT(
A ,B : in UNSIGNED (3 downto 0) ;
© 1995-2004 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved.
步骤. 具体实现时把规格化、舍入操作和判断结果正确性做在同一部分 , 整个浮点加减法器简
化为 :对阶、尾数运算、规格化 3 部分.
211 对阶
对阶操作 , 就是使两个数据的阶码相等 , 这时才能
进行尾数的加减运算. 在对阶操作时 , 总是使小阶向大阶对齐. 实现的方法是 , 将原来阶码小的数的尾数部分右移 , 并相应地增加其阶码. 传统的做法是将原来阶码小的数的尾数部分右移 1 位 , 其阶码加 1 , 直至阶码相等. 这样比较简单 , 但是会使一次浮点加减法运算的时间不确定 , 不利于流水线的流畅运作. 现采ghua Tongfang Optical Disc Co., Ltd. All rights reserved.
第5期
沈明发等 : 用 VHDL 语言在 CPLD/ FPGA 上实现浮点运算

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

实验结果表明在FPGA 上可以实现快速浮点加法器，最高速度可达152MHz ，资源占用也在合理的范围内。

在现代数字信号处理应用中，浮点加减运算几乎占到全部浮点操作的一半以上。

浮点算法比定点算法更复杂，占用更多资源。

目前在大多数数字信号处理系统中，一般都是由DSP 芯片来完成浮点运算。

用DSP 芯片完成浮点运算的好处是容易实现，精度高，缺点是加重DSP 芯片的负担，系统速度可能会受到影响。

在某些情况下需要使用专门的浮点处理部件才能满足系统要求。

FPGA 具有可编程、资源丰富、开发周期短、小批量成本低等优点，它已经成为数字电路研究开发的一种重要实现形式，并广泛应用于各种数字信号处理系统当中。

原来在FPGA 中实现浮点处理部件是很困难的，主要是由于早期的FPGA 速度较慢，资源较少，浮点算法对它来说过于复杂。

例如一个32位的浮点加法器就要占用Altera 8188 72%的资源，时钟频率最大只有10MHz [1]，这样的效果当然不能令人满意。

近年来随着集成电路工艺水平的不断提高，以及体系结构方面的发展，FPGA 的容量、速度、资源等方面都有了很大的提高。

例如Xilinx 公司最新的FPGA 已经采用90nm 工艺，最高时钟频率达到420MHz ，容量达到1 000万逻辑门以上，内部还包括处理器、数字锁相环、块RAM 、大量的寄存器等多种资源，支持多种I/O 接口标准[6]。

FPGA 的速度和容量已经不再是瓶颈了，所以研究浮点处理部件的FPGA 实现具有很强的实际意义。

本文将介绍在Xilinx 公司的VirtexII 系列FPGA 上快速浮点加法器的一种实现形式。

1 浮点格式常用的浮点格式为IEEE 754标准，IEEE 754标准有单精度浮点数、双精度浮点数和扩展双精度浮点数3种，单精度为32位，双精度为64位，扩展双精度为80位以上，位数越多精度越高，表示范围也越大。

在通常的数字信号处理应用中，单精度浮点数已经足够用了，本文将以它为例来设计快速浮点加法器。

单精度浮点数如图1所示。

图1 IEEE 754单精度浮点数格式其中s 为符号位，s 为1时表示负数，s 为0时表示正数；e为指数，取值范围为[1，254]，0和255表示特殊值；f 有22位，再加上小数点左边一位隐含的1总共23位构成尾数部分。

由它表示的浮点数v 的值如下式所示。

(127)(1)2(1.)s e v f −=−•• 32位浮点数可以表示的范围为38381.210 3.410−+±×−±×。

在某些情况下可能不需要32位的精度，那么可以用24位或者16位来表示浮点数，如16位浮点数表示如图2所示。

图2 16位浮点数格式16位浮点数v 的值如下式所示。

(31)(1)2(1.)s e v f −=−••16位浮点数可以表示的范围为9108.581510 6.98510−±×−±×。

2 浮点加法器算法浮点加法一般包括求阶差、对阶、尾数求和、规格化和舍入等步骤，具体的算法在各种文献[1,2]上都有详细的叙述，这里就不再一一介绍了。

目前比较常用的浮点加法有3种[3]，如图3所示。

图中用到的符号描述如下：a E ，b E ：加数a 和加数b 的指数；aM，b M ：加数a 和加数b 的尾数；diff ：两个指数的绝对差，diff＝b a M M −；作者简介：郭天天(1974—)，男，博士生，主研方向为ASIC 与实时系统、DSP 与FPGA 应用等；张志勇，博士生；卢焕章，教授、博导定稿日期：2004-07-08 E-mail ：ttguo0452@位数位数—203—bmans：指数较小的加数通过移位器后的尾数；SUM ：尾数和；aexp：较大的那个指数。

e mbe m（a ）标准算法（b ）LOP 算法（c ）双通道算法图3 3种常用的浮点加法算法图3(a)所示为标准的浮点加法算法，a E ，b E 送入指数比较器进行比较，得到阶差diff ，前移位器将指数较小的那个数的尾数右移diff 位，得到新的尾数b mans ，然后送入定点加法器进行尾数相加。

如果尾数相加产生了进位，那么把和右移一位，指数加一。

规格化单元对结果进行规格化。

在规格化单元里有一个前导1检测电路（Leading-One- Detector ），可以检测出尾数中第一个1的位置，后移位器根据此位置对尾数进行左移，同时指数减去相应的值。

图3(b)为LOP 算法，它与标准算法的区别在于用前导1预测电路（Leading-One-Predicator ）代替了前导1检测电路（Leading-One-Detector ）。

LOP 电路可以与尾数加法并行执行，这样可以减少整个系统的延迟。

图3(c)为双通道算法。

它有两个并行的数据通道，当指数差大于1时，选择far 通道，指数对阶时分配较长的时间，尾数运算结果规范化时的移位分配较少的时间；否则选择close 通道，此时尾数最多移一位，甚至不用移位，这样可以去掉前移位器。

在上述3种算法中，标准算法延迟最大，占用资源最少；双通道算法延迟最小，占用资源最多；而LOD 算法介于两者中间。

本文将以LOD 算法为例，实现32位的浮点加法器。

为了专注于算法的实现，下面讨论的都是无符号浮点数相加。

3 浮点加法器的实现选用Xilinx 公司的VirtexII 系列FPGA 来实现32位浮点加法器，具体器件为XC2V1000-5。

下面本文将根据器件的特点介绍，浮点加法器中几个关键部件的实现方案。

3.1 移位器实现移位器的方法有很多，例如用选择器来实现，在VirtexII 器件中也可以用内置的块乘法器实现移位[4]，也可以用3态缓冲器来实现移位。

用选择器实现移位时，如果采用2选1选择器，则所需级数太多；如果采用4选1、8选1选择器则延时比较大。

在VirexII 系列FPGA 中内置了一些18位的硬件乘法器，这些乘法器可以用来实现移位器[4]，但通常的做法是把这些乘法器留给乘法运算用。

所以本文选用3态缓冲器来实现移位器。

具体实现如图4所示。

I I I I 321上图所示为一个由3态缓冲器构成的4位移位器，可以看出整个移位器的延时基本固定，即只有1级3态缓冲器的延时，不随位数的增加而增加，这给流水操作增加了不少方便，有一点要注意，移位位数是one-hot 编码。

这种实现方式需要内置的3态缓冲器，不过对于本文使用的FPGA 来说不成问题。

本文设计的24位深度移位器占用资源为24个slices ，最大延时为2.685ns 。

3.2 加法器VirtexII 系列FPGA 中有专用的超前进位逻辑，可以构成快速行波进位加法器。

虽然行波进位加法器结构由于速度比较慢一般不被专用IC 采用，但在可编程逻辑器件上，行波进位加法器由于结构最为工整，且速度能满足大多数应用的要求，是用得最多的加法器结构。

VirtexII 系列FPGA 的每个slice 可以实现两个如图5所示的全加器。

其中i i i s ds c =⊕，1i i i i i c ds b ds c +=+，i i i ds a b =⊕。

此全加器与普通全加器不同，它有专用的快—204—速进位逻辑，可以在低级进位到达时，更快速地输出该位的运算结果；此外在FPGA 内部同一列的两个slice 之间专门为进位信号保留了一条最短连线。

本文使用Xilinx 公司的开发工具ISE5.1中的Core Generator 生成24位的行波进位加法器，占用资源为12个slices ，最大延时为3.089ns 。

3.3 前导1预测电路前导1预测电路包括预编码模块和前导1检测模块。

预编码模块的原理是：首先通过执行一个有效位的二进制符号－数字（signed-digit ）减法获得O=A-B ，然后根据Oi 串决定前导1的位置。

具体算法请看文献[5]。

前导1检测模块一般采用真值表的方式实现，具体算法参见文献[7]。

前导1预测n A n B A B n A n B n B n A图6 VirtexII 中的前导1预测电路其中A 是被减数，B 是减数，LUT 实现的函数是11()&(&)i i i i F A B A B −−=⊕。

这种实现方式也需要用到FPGA 中的快速行波进位，进位依次从最高位到最低位。

LOP 电路的延时和行波加法器的延时大致相当。

这种实现方案可能会产生一位的误差，需要在规格化单元中进行修正，修正的操作可以通过移位完成。

3.4 实验平台实验平台是自制的DSP-FPGA 实验板，如图7所示。

图7 实验平台板上有一片XC2V1000FPGA ，一片C6701-150DSP ，以及各种存储器资源等。

基于FPGA的FIR滤波器设计开题报告

页数:8
FIR数字滤波器的FPGA实现

页数:4
第4章 FIR滤波器的FPGA设计与实现——dsp课件PPT

页数:74
FPGA实现FIR抽取滤波器的设计

页数:8
基于FPGA的FIR滤波器设计与实现

页数:43
FIR带通滤波器的FPGA实现

页数:4
基于FPGA的FIR滤波器设计

页数:34
基于Matlab与Verilog+HDL的FIR滤波器设计与实现

页数:2
二维FIR滤波器的FPGA实现

页数:3
FIR滤波器的FPGA实现方法

页数:7

快速浮点加法器的FPGA实现

合集下载

高速流水线浮点加法器的FPGA实现

浮点LMS算法的FPGA实现

浮点运算的FPGA实现

高速浮点运算单元的FPGA实现

FPGA中的浮点四则运算

基于FPGA的全流水浮点乘累加器的设计及实现

用FPGA实现浮点FFT处理器的研究

基于FPGA的浮点运算器IP核的设计与实现

快速浮点加法器的FPGA实现

基于FPGA的浮点运算器IP核的设计与实现

基于FPGA的浮点运算器IP核的设计与实现

基于FPGA的PLC浮点运算系统的设计与实现

基于FPGA的高速浮点加法器的实现

基于Verilog HDL语言的FPGA浮点数加减法运算的实现

用VHDL语言在CPLD FPGA上实现浮点运算

文档推荐

最新文档