DSP技术与应用
- 格式:doc
- 大小:286.00 KB
- 文档页数:11
DSP技术及相关应用
数字信号处理(Digital Signal Processing,简称DSP)是一门涉及许多学科而又广泛应用于许多领域的新兴学科。
DSP技术作为数字化最重要的基础技术之一,凭借其无与伦比的信息处理能力,无论在应用的广度还是深度方面,都正以前所未有的速度向前发展。
DSP技术已经在通信等领域得到极为广泛DSP技术图解的应用。
数字信号处理是利用计算机或专用处理设备,以数字形式对信号进行采集、变换、滤波、估值、增强、压缩、识别等处理,以得到符合人们需要的信号形式。
DSP技术的应用领域
1、通信领域的应用
2、仪器仪表领域的应用
3、汽车电子系统中的应用
4、图形图像处理
5、控制领域的应用
(1)电机和机器人控制
(2)激光打印机、扫描仪和复印机
(3)网络控制及传输设备
— 1 —。
dsp技术及应用期末考试题及答案一、选择题(每题2分,共20分)1. 数字信号处理(DSP)技术主要应用于以下哪个领域?A. 计算机编程B. 通信系统C. 机械制造D. 农业科学答案:B2. 下列哪个不是数字信号处理的基本步骤?A. 采样B. 量化C. 编码D. 滤波答案:C3. 在数字滤波器设计中,低通滤波器的截止频率通常定义为:A. 滤波器的中心频率B. 滤波器的带宽C. 滤波器的半功率点D. 滤波器的增益答案:C4. 数字信号处理中,傅里叶变换的主要作用是将信号从哪个域转换到哪个域?A. 时域到频域B. 频域到时域C. 空间域到时间域D. 时间域到空间域答案:A5. 下列哪个算法不是用于数字信号处理中的快速傅里叶变换(FFT)?A. Cooley-Tukey算法B. Rader算法C. 快速卷积算法D. 快速排序算法答案:D二、填空题(每空2分,共20分)6. 数字信号处理中,_______ 是指信号在时间上是离散的。
答案:采样7. 在数字信号处理中,_______ 是指信号在幅度上是离散的。
答案:量化8. 一个数字滤波器的阶数是指滤波器中延迟元素的_______。
答案:数量9. 数字信号处理中的窗函数用于_______ 信号,以减少频谱泄露。
答案:截断10. 快速傅里叶变换(FFT)是一种高效的算法,用于计算_______。
答案:离散傅里叶变换(DFT)三、简答题(每题10分,共30分)11. 简述数字信号处理中采样定理的重要性及其内容。
答案:采样定理是数字信号处理中的基本理论,它规定了在不失真地恢复模拟信号的条件下,采样频率应大于信号最高频率的两倍。
这一定理对于信号的数字化和信号的重建至关重要。
12. 解释什么是数字滤波器,并简述其分类。
答案:数字滤波器是一种对数字信号进行滤波处理的系统,它可以通过软件实现,也可以通过硬件实现。
数字滤波器主要分为低通滤波器、高通滤波器、带通滤波器和带阻滤波器,它们分别用于通过或阻止信号的特定频率成分。
第1章绪论1. DSP的2种含义:(1). 数字信号处理理论:即数字信号处理(运算),它是利用计算机或专用处理设备,以数字形式对信号进行采集、变换、滤波、估值、增强、压缩、识别等处理,以得到符合人们需要的信号形式。
(2). 数字信号处理器:是一种特别适用于进行数字信号处理运算的微处理器,其主要应用是实时快速地实现各种数字信号处理、运动控制算法。
2. 采用DSP芯片的数字控制系统具有的显著特点:1)实时性高;2)采样频率高,运算量大。
第2章TMS320x28x的结构1. 哈佛总线结构:程序/数据空间的写操作共用数据总线DWDB,两个操作不能同时进行;从程序空间读(PAB、PRDB),从数据空间读(DRAB、DRDB),向数据空间写(DWAB、DWDB)这3个操作可以同时进行。
哈佛结构是一种将程序指令存储和数据存储分开的存储器结构。
可以减轻程序运行时的访存瓶颈。
2. F2812中有些寄存器的内容是受保护的,其目的是为了避免用户程序错误地改变这些寄存器的值。
当受保护后,允许CPU对该寄存器进行读操作,但任何写操作均被忽略。
如果寄存器是EALLOW保护的,在对该寄存器进行写操作前必须首先执行EALLOW 指令使能;而完成后执行EDIS指令则可以禁止写操作。
3. F2812的外部接口(XINTF)采用异步、非复用的扩展总线,与SCI、SPI的区别是什么?F2812的XINTF映射到5个独立的存储空间。
当访问相应的存储空间时,就会产生一个片选信号。
每个空间都可以独立地设置访问建立、有效和跟踪时间,同时还可以通过XREADY信号来与外设的访问速度和时序匹配。
不使用XREADY信号时,2SYSCLKOUT≤访问周期≤54SYSCLKOUT第3章系统控制、中断1. DSP内部时钟:CLKIN、SYSCLKOUT、HSPCLK、LSPCLK之间的关系,包括它们的最大值、默认值等.2. 高速外设(并口):EVA,EVB,ADCHSPCLK=SYSCLK/(1~14)75MHz复位后的缺省值为:SYSCLK/23. 低速外设(串口):SCIA,SCIB,SPI,McBSpLSPCLK=SYSCLK/(1~14)37.5MHz复位后的缺省值为:SYSCLK/44. CPU定时器和EV中通用定时器的区别?F281×器件上有3个32位CPU定时器(TIMER0/1/2)每个事件管理器包括通用定时器、比较器和PWM单元、捕获单元(CAP)与正交脉冲编码电路(QEP)EV定时器的特点:CPU定时器特点1)计数器字长16位;322)高速外设时钟作为内时钟输入;CPU时钟3)有外部时钟输入引脚(每个EV一个),可用作计数器;仅定时器4)比较寄存器可为QEP、CAP、PWM提供时间基准,触发特定的事件;5)如果不用PWM等功能,可用作通用定时器/计数器。
基于dsp技术及应用课程设计一、教学目标本课程的教学目标是使学生掌握DSP技术的基本原理、特点和应用,培养学生运用DSP技术解决实际问题的能力。
具体目标如下:1.知识目标:(1)了解DSP技术的起源、发展和现状。
(2)掌握DSP芯片的基本结构、工作原理和性能指标。
(3)熟悉DSP编程语言和开发环境。
(4)掌握DSP算法和数字信号处理的基本方法。
2.技能目标:(1)能够使用DSP芯片进行数字信号处理。
(2)具备DSP程序设计和调试的能力。
(3)能够运用DSP技术解决实际工程问题。
3.情感态度价值观目标:(1)培养学生对新技术的敏感性和好奇心。
(2)培养学生勇于创新、积极进取的精神风貌。
(3)使学生认识到DSP技术在现代社会中的重要地位和作用。
二、教学内容根据课程目标,教学内容主要包括以下几个方面:1.DSP技术概述:DSP技术的起源、发展和现状,DSP芯片的市场需求和应用领域。
2.DSP芯片:DSP芯片的基本结构、工作原理和性能指标,DSP芯片的分类和选型。
3.DSP编程语言和开发环境:C语言、汇编语言和DSP专用编程语言,DSP开发环境和工具的使用。
4.DSP算法和数字信号处理:数字信号处理的基本方法,DSP算法的实现和优化。
5.DSP应用实例:DSP技术在通信、音视频处理、图像处理等领域的应用实例。
三、教学方法为了达到课程目标,我们将采用以下教学方法:1.讲授法:通过讲解DSP技术的基本原理、特点和应用,使学生掌握相关知识。
2.讨论法:学生进行小组讨论,培养学生的思考能力和团队合作精神。
3.案例分析法:分析DSP技术在实际工程中的应用实例,提高学生的实践能力。
4.实验法:安排实验室实践环节,让学生动手操作,加深对DSP技术的理解和掌握。
四、教学资源为了支持教学内容和教学方法的实施,我们将准备以下教学资源:1.教材:选用权威、实用的教材,如《DSP技术及应用》。
2.参考书:提供相关的参考书籍,丰富学生的知识体系。
dsp原理及应用技术 pdf
DSP(Digital Signal Processing)即数字信号处理,是利用数
字计算机来对连续或离散时间的信号进行采样、量化、编码和数字算法处理的技术。
它通过数字计算手段对信号进行采样、滤波、谱分析、编码压缩等处理,能够更加精确和灵活地分析和处理各种类型的信号。
DSP技术广泛应用于通信、音频、视频、雷达、医学图像处理、语音识别、控制系统等领域。
以下是几种常见的DSP应
用技术:
1. 数字滤波:通过数字滤波器实现对输入信号的滤波功能,包括低通滤波、高通滤波、带通滤波等,可用于信号去噪、频率选择等应用。
2. 数据压缩:通过数学算法对信号进行压缩编码,减少数据存储和传输的带宽需求,如音频压缩算法(MP3)、图像压缩算法(JPEG)等。
3. 语音处理:利用DSP技术对语音信号进行去噪、增强、压缩、识别等处理,可应用于语音通信、语音识别、语音合成等领域。
4. 图像处理:通过DSP算法对图像进行增强、分割、检测等
处理,广泛应用于医学图像处理、目标检测、图像识别等领域。
5. 音频处理:通过DSP技术对音频信号进行均衡、混响、降
噪、音效处理等,可应用于音频播放、音效合成、音乐处理等领域。
6. 通信信号处理:包括调制解调、信号解码、信道均衡等处理,用于移动通信、无线电频谱分析、信号检测等应用。
7. 实时控制系统:通过DSP算法对反馈信号进行采样和处理,实现控制系统的实时控制和调节,如机器人控制、自动驾驶等。
总之,DSP技术在各个领域都发挥着重要作用,通过数字计
算的精确性和灵活性,能够高效地处理和分析各种类型的信号,满足不同应用的需求。
数字信号处理技术的发展与应用数字信号处理技术(Digital Signal Processing,DSP)在现代科技发展中起着举足轻重的作用,它涉及了信号的采集、转换、处理和传输等各个环节,是信息技术领域中的重要一环。
本文将从数字信号处理技术的发展历程、原理及应用领域等方面展开介绍,以期为读者提供一份关于数字信号处理技术的全面了解。
一、数字信号处理技术发展历程数字信号处理技术起源于20世纪60年代,当时科学家们在模拟信号处理技术的基础上开始尝试数字化信号的处理。
随着计算机技术的飞速发展,数字信号处理技术也得到了迅速的发展。
1972年,数字信号处理芯片如国际商业机器公司(IBM)的TDT-1开始问世,为数字信号处理技术的发展提供了技术保障。
此后,数字信号处理技术逐渐应用于通信、医疗、雷达、声音处理等领域,并在军事、航空航天、地质勘探等领域发挥了重要作用。
1990年代,随着信号处理技术和计算机技术的飞速发展,数字信号处理技术得到了进一步的提升和应用。
数字信号处理技术不仅在传统领域有了更深的应用,还在音视频处理、图像处理等新兴领域得到了广泛的应用。
近年来,随着深度学习和人工智能等技术的发展,数字信号处理技术在模式识别、智能控制等领域也得到了更为广泛的应用,成为科技发展的重要驱动力。
数字信号处理技术是一种利用数字计算机等设备对信号进行采集、处理和传输的技术。
它的核心原理是将模拟信号转换为数字信号,然后利用数字计算机等设备对数字信号进行处理。
数字信号处理技术的基本原理包括采样、量化、编码、数字信号处理和解码等环节。
首先是采样环节,它是将模拟信号按照一定的规则转换成离散的数字信号,这样就可以在数字计算机等设备中进行处理。
然后是量化环节,它是将采样得到的信号按照一定规则,转换成一系列离散的数值。
接下来是编码环节,它是将量化的数字信号按照一定的标准编码成二进制代码,这样就可以在数字计算机中进行存储和处理。
接着是数字信号处理环节,它是利用数字计算机等设备对数字信号进行处理,这一环节包括滤波、变换、编码、解码等操作。
一、填空题第一章1.数字信号处理特点大量的实时计算(FIR IIR FFT),数据具有高度重复(乘积和操作在滤波、卷积和FFT中等常见)。
2.信号处理的作用信号改善;信号检测、估计等3.信号处理的方法信号波形分析/变换、滤波、现代谱估计/分析、自适应滤波等。
4.信息系统包括采集、传输、处理、等。
5.数字信号处理常用算法有FIR 滤波、IIR 滤波、离散傅里叶变换、卷积、离散余弦变换等6.处理器速度的提高得益于器件水平、处理器结构、并行技术等。
7.DSP结构特点包括采用哈佛结构体系、采用流水线技术、硬件乘法器、多处理单元、特殊的DSP指令。
8.DSP芯片按用途分为通用型DSP 、专用型DSP 。
9.DSP芯片按数据格式分为浮点型、定点型。
第二章1.C28x芯片具有C27X、C28X、C2XLP操作模式。
2.C28x芯片模式选择由ST1中的AMODE和OBJMODE位组合来选定模式。
3.CPU内核由CPU、仿真逻辑、接口组成。
4.CPU主要特性是保护流水线、独立寄存器空间算术逻辑单元(ALU)、地址寄存器算术单元(ARAU)、循环移位器乘法器。
5.CPU信号包括存储器接口信号、时钟和控制信号、复位和中断信号、仿真信号。
6.TMS320F2812组成特点是32位、定点、改进哈佛结构、循环的寻址方式。
8.存储器接口有3组数据总线。
9.存储器接口地址总线有PAB、DRAB、DWAB、10.CPU中断控制寄存器有IFR 、IER 、DBGIER。
11.ACC累加器是32位的,可表示为ACC、AH、AL。
12.被乘数寄存器是32 位的,可表示为XT、T、TL 。
13.乘数结果寄存器是32位的,可表示为P 、PH、PL。
14.数据页指针寄存器16 位的,有65536 页,每页有64个存储单元。
数据存储空间容量是4M字。
15.堆栈指针复位后SP指向地址是0x000400h 。
第三章1.DSP芯片内部包含存储器类型有片内双访问存储器(DARAM)、片内单访问程序/数据RAM(SARAM)、掩膜型片内ROM存储器、闪速存储器(Flash)一次性可编程存储器(OTP)。
基于DSP的音频处理算法实现与应用研究一、引言近年来,随着数字信号处理技术的发展,DSP技术在音频处理方面得到了广泛的应用。
音频处理算法是一种数字信号处理技术,采用DSP芯片作为处理核心,可进行音频信号处理、增强、压缩、编码等操作。
本文将介绍DSP技术在音频处理方面的应用,研究DSP的音频处理算法的实现与应用。
二、DSP技术在音频处理中的应用1. DSP芯片的特点DSP芯片是一种专门用于数字信号处理的计算机芯片,其特点在于高速、高效、灵活、可编程等。
其高速度处理能力使其成为音频信号处理方面的首选芯片。
2. 调音台调音台是音频处理中常用的一种设备。
调音台通过运用DSP技术,可实现均衡器、混响、压缩等音频信号处理,可大大提高音频效果。
3. 数字信号处理器数字信号处理器(DSP)是一种专门用于数字信号处理的芯片,其高效率、高速度使其在音频信号处理方面广泛应用。
DSP处理结果准确性高、重复性好等特点使其成为音频处理中重要的处理芯片。
4. 数字信号处理算法数字信号处理算法是音频处理技术的核心。
压缩、编码、降噪、降低反响、尾压缩等处理算法都是通过DSP技术实现的。
5. DSP技术在音乐制作中的应用在音乐制作中,DSP技术可以实现音频采样、混音等处理,使音乐作品得到更好的音质。
DSP技术通常与运动分析系统、信号处理器等设备一起使用,可满足音乐制作的不同需求。
三、基于DSP的音频处理算法实现1. 声音信号的采样与转换音频信号采样是指将模拟音频信号转换为数字信号的过程。
采样误差是音频信号处理中不可避免的问题。
采样频率与精度的选择决定了采样的质量。
2. 声音信号滤波滤波是指对音频信号进行处理,以去除杂音和消除失真,提高音质。
频率响应平滑,抗干扰能力强的滤波算法是音频信号处理中常用的算法之一。
3. 声音信号的压缩和解压缩音频信号压缩算法可以将音频信号压缩到较小的存储空间内,同时保持与原始信号相近似的音质。
压缩技术可通过动态范围控制、无损压缩、有损压缩等多种算法实现。
课程结业论文TM1300 DSP系统以太网通信接口的设计课程名称:DSP原理及应用任课教师:许善祥所在学院:信息技术学院专业:电气工程及其自动化班级:电气(2)班学生姓名:学号:中国·大庆2015 年 5 月DSP技术在计算机工程中的应用基于DSP的MPEG4视频编码技术研究与实现摘要视频编码是多媒体通信中的核心技术,它不但关系到通信带宽,也关系到通信过程中的图像质量。
随着多媒体技术在网络的广泛应用,视频编码技术更加显得重要。
与之相适应,各种多媒体数据压缩编码标准也在不断地发展和完善。
MPEG.4是现在最重要最有影响的多媒体数据编码国际标准之一。
基于对象的编码思想使其具有高压缩比、可扩展性、可交互性等许多特点。
ADI公司的Blacfin系列的DSP在图像处理方面有其出色的表现和较低的价格而获得关注。
本文基于ADSP.BF561 DSP的特点,探讨了MPEG.4在BF561上的视频数据的实时编码的实现。
本论文首先系统介绍了MPEG.4编码的特点以及选用BF561的原因,接着分析了MPEG.4的主要技术,并介绍了MPEG.4简单编码框架编码器的软件实现方案,给出了方案流程图,在VC++环境下用C语言实现了MPEG.4简单框架的视频压缩功能。
其次,研究了核心算法DCT变换和运动估计的优化算法,通过分析运动向量的分布相关性,结合提前中止准则,提出了基于起点预测的改进菱形运动估计算法。
另外根据BF561双核的特点,设计了一种基于宏块层并行算法。
最后,本文从硬件平台特征出发,在存储器设置、DMA控制和代码等方面对编码方案进行优化。
经本方案优化后,编码器的编码效果得到很大的提高,能够在BF561处理器上实现CIF格式30帧/秒的码率,达到预期的目标。
第一章绪论1.1课题提出21世纪的人类社会将是信息化社会,数字化后的信息,尤其是数字化后的视频信息具有海量数据性,它给信息的存储和传输造成很大的困难,己成为人类有效地获取和使用信息的瓶颈问题之一。
1895年电影的诞生第一次将视频信号带给了人类社会,随着电视的发明和普及,视频信号走进了千家万户。
数字技术的广泛应用,对视频信号的存储和传输带来了一次革命,但是从模拟转换到数字的原始视频信号的数据量是惊人的,单纯地靠提高存储容量或信道传输速率的做法是不切实际的,以传输未经处理的标准清晰度电视(SDTV,Standard Definition Television)的图像格式为例,704像素(水平)*480像素(垂直),帧频60HZ/隔行扫描,其每秒的数据量是:704*480*30*1.5(4:2:0)=15206400Bytes。
更不用说,现在流行的高清电视(HDTV,Hign Definition Television),其数据量是标清的5倍多,这显然远远超出了目前Intemet通信信道的能力,而且直接把未经处理的视频数据发送到通信信道上,也是对通信带宽的极大浪费。
因此,研究有效的视频压缩编码方法具有很重要的现实意义。
视频压缩编码技术是多媒体应用的核心技术,对视频编码的研究已成为信息技术领域的研究重点,并制定了一系列的视频标准。
其中MPEG-4利用很窄的带宽【l】,使用帧重建技术,压缩数据,以最少的代价获得最佳的图像质量。
因此,其广泛应用于实时、高效、适合网络传输等特点的领域,如数字监控、可视电话和手机视频等。
本课题设计了实时MPEG.4视频编码系统,能够实现CIF格式(352*288)数据每秒30帧的处理能力,结合该系统功耗低、体积小、性价比突出的特点,在进一步改进的基础上,具有广阔的工程应用前景。
1.2数字视频编码发展历程第一代编码方法。
1948年Oliver提出了第一个编码理论~脉冲编码调制(PCM,Pulse Coding Modulation)。
同年Shannon的经典论文《通信的数学原理》中首次提出并建立了信息率失真函数概念;1959年Shannon进一步确立了码率失真理谢21。
以上工作奠定了经典信息编码的理论基础,在此基础上视频编码理论和技术取得了长足的发展,其主要的编码方法有:预测编码、变换编码和统计编码,也称为三大经典编码方法。
其中预测编码的基本思想是:根据数据的统计特性得到预测值,然后传输图像像素与其预测值的残值信号,使传输的码率降低,达到压缩的目的。
变换编码的基本思想是:由于数字图像像素间存在高度相关性,因此可以进行某种变换来消除这种相关性。
变换编码不直接对空域图像像素编码,而是先将它变换到频域,得到一组变换系数。
虽然变换并不对数据进行压缩,但经过变换后,能量相对集中,通过后续的量化、编码就能达到压缩的目的。
变换编码方法中的离散余弦变换(DCT,Discrete CosineTransform)和小波变换在视频/图像压缩中得到了广泛应用。
统计编码的基本思想是:根据信息码字出现概率的分布特征而进行压缩编码,寻找概率与码字长度间的最优匹配。
统计编码主要针对无记忆信源,它又可分为定长码和变长码(VLC,Variable Length Coding)。
Hufman编码和算术编码是两种常见的变长码字编码方法。
第一代编码技术【3】只是以信息论和数字信号处理技术为理论基础,旨在去除图像数据中的线性相关性,其压缩比不是很高,对于视频图像来讲一般在40:1左右。
为了克服第一代视频编码技术的局限性,Kunt等人于1985年提出了第二代视频编码技术。
而第二代编码技术不再局限于信息论的框架,从更为底层的基础上探索视频图像信息的表述机制,充分利用人的视觉生理心理特性和图像信源的各种特征,实现从“波形’’编码到“模型”编码的转变,以期获得更高压缩比。
第二代编码方法主要有:基于分形的编码方法、基于模型的编码方法、基于区域分割的编码方法和基于神经网络的编码方法等。
分形编码是一种不对称的编码技术,适于自相似性较强的自然景物图像。
基于模型或知识的方法,是把计算机视觉和计算机图形学中的方法应用到视频编码,在编码端通过各种分析手段,提取所建模型的特征与状态参数,在解码端通过这些参数通过模型及相关知识生成所建模的信源。
基于区域分割与合并的视频编码方法,是根据图像的空域特征将图像分成纹理和轮廓两部分,然后分别对它们进行预处理、编码。
预处理将图像分割成纹理和轮廓两部分,对纹理可采用预测编码和变换编码,对轮廓则采用链码方法进行编码,较好地保存了对人眼十分重要的边缘轮廓信息,因此,在压缩比很高时解码图像质量仍然很好。
神经网络法是模仿人脑处理问题的方法,通过各种人工神经元网络模型对数据进行非线性压缩,目前还处在探索阶段。
第二代基于内容和语义的编码方法为视频压缩编码开拓了广阔的前景,但同时也大大增加了分析的难度和实现的复杂度,要得到充分应用还有赖于进一步深入研究以及相关辅助学科的同步发展。
第二章MPEG.4视频编码技术和双核DSP561开发基础课题选用了BF561进行MPEG.4视频编码技术进行研究与开发。
进行深入探讨之前,对课题涉及到的两大关键点:MPEG.4视频编码技术和DSP处理器BF561进行详细的介绍。
MPEG.4视频编码部分重点介绍了与本文开发相关的SP框架下的关键技术;BF561部分重点介绍与并行处理、存储和DMA相关的基础内容。
这些基础内容与论文后续章节的论述密切相关,为论文提供基础知识。
2.1 MPGE-4标准开发基础2.1.1发展简况ISO于1991年5月提出关于视频音频编码的MPEG-4项目,设有系统、音频、视频、需求、实现研究、测试及自然合成混合编码等几个小组。
MPEG.4于1998年11月成为国际标准,ISO于1999年1月公布了MPEG.4(视频和音频对象的压缩)标准的第一版,随后又于1999年12月公布了此标准的第二版,MPEG.4的正式ISO命名为ISO/IECl4496。
在拟定MPEG.4的初期,其主要目标是低码率视频通讯,MPEG.4 V2.0版本的“Simple Profile"支持无线多媒体通信。
其支持5-64Kbiffs的甚低比特率视频通信业务的算法和工具,支持极低分辨率(从每行每列几个象素到CIF级分辨率)和极低帧率(O--15Hz)的图像序列。
随着研究工作的进一步深入,MPEG.4逐渐发展为一个功能强大的多媒体编码标准,它不仅仅是一个低码率的音像编码标准,其编码速率己扩展到涵盖从64Kbps到10Mbps的范围。
MPEG-4旨在提供在多媒体环境中有效存储、传送以及操作视频数据的核心标准技术,建立一种能被多媒体传输、多媒体存储、多媒体检索等应用领域普遍采纳的统一的多媒体数据格式。
由于所要覆盖的应用范围如此广阔,而且各种应用本身的要求又如此不同,因此,为了提高和改善编码效率,MPEG-4提供了如下新功能【9】:1.具有对被称为视听对象(AVO,Audio Visual Objects)的混合媒体数据的高效编码能力。
这些混合媒体数据包括:视频图像、图形、文本、音频、语音等。
2.具有用合成文本(Script)组合成的混合媒体对象来产生多媒体信息表现的能力。
3.压缩的数据在噪声信道传输中具有恢复差错的鲁棒性。
在MPEG.4制定之前,MPEG.1、MPEG.2、H.261、H.263都是采用第一代压缩编码技术,着眼于图像信号的统计特性来设计编码器,属于波形编码的范畴。
第一代压缩编码方案把视频序列按时问先后分为一系列帧,每一帧图像划分为宏块进行运动补偿和编码,这种编码方案存在以下缺陷【Io】:1.将图像固定地分成相同大小的块,在高压缩比的情况下会出现严重的块效应,即马赛克效应。
2.不能对图像内容进行访问、编辑和回放等操作。
3.未充分利用人类视觉系统(HVS,Human Visual System)的特性。
MPEG-4则代表了基于模型/对象的第二代压缩编码技术,它充分利用了人眼视觉特性,抓住了图像信息传输的本质,从轮廓、纹理思路出发,支持基于视觉内容的交互功能,适应了多媒体信息的应用由播放型转向基于内容的访问、检及操作的发展趋势,如图2.1.2 MPEG-4的核心思想A V(Audio Video)In]x,-t象是MPEG.4为支持基于内容编码而提出的重要概念。
对象是指在一个场景中能够访问和操纵的实体,对象的划分可根据其独特的纹理、运动、形状、模型和高层语义为依据。
在MPEG-4中所见的视音频己不再是过去MPEG-l、MPEG.2中图像帧的概念,而是一个个视听场景(AV场景),这些不同的AV场景由不同的AV对象组成。
AV对象是听觉、视觉、或者视听内容的表示单元,其基本单位是原始AV对象,它可以是自然的或合成的声音、图像。
原始AV对象具有高效编码、高效存储与传输以及可交互操作的特性,它又可进一步组成复合AV对象。