几种网络视频编码技术的分析
- 格式:doc
- 大小:101.00 KB
- 文档页数:9
网络视频编码与传输技术的研究一、引言随着互联网技术的飞速发展,网络视频已经成为人们娱乐、学习、工作等方面不可或缺的一部分。
而网络视频编码与传输技术也是网络视频实现的重要保障,本文将从编码技术和传输技术两方面进行探讨。
二、网络视频编码技术1. 常见编码算法目前常见的视频编码算法有H.264/AVC、VP9、AV1等。
其中,H.264/AVC是目前广泛应用的一种编码算法,可在相同码率下实现更好的视频质量。
VP9和AV1则是一种开源的编码算法,具有更高的压缩性能。
2. 码率控制码率控制是视频编码过程中重要的一环,通过控制视频的码率可以达到平衡视频质量和传输带宽的目的。
常用的码率控制方法有恒定码率(CBR)和可变码率(VBR)。
其中,CBR的优点是码率稳定,但是会导致视频质量不稳定;VBR则可以保证视频质量稳定,但是会导致码率波动较大。
3. 画面编码技术画面编码技术是视频编码过程中的核心部分,其目的是对视频画面进行压缩。
常见的画面编码技术有帧内编码(I帧)、预测编码(P帧)和双向预测编码(B帧)。
其中,I帧是独立的帧,可以直接解码;P帧和B帧则是通过对前一帧或前后多帧进行预测编码实现画面压缩。
三、网络视频传输技术1. 单播与组播单播和组播是网络视频传输中常用的两种方式。
单播是一对一的传输方式,适用于点对点通信;组播则是一对多的传输方式,适用于一对多的通信需求。
组播传输方式可以有效减少网络带宽占用,提高传输效率。
2. CDN 技术CDN(内容分发网络)技术是网络视频传输中一种重要的优化技术。
其基本原理是通过将视频内容在多个服务器间缓存,使得用户可以从离其最近的服务器上获取视频内容,降低用户等待时间和网络传输距离。
3. FEC 技术前向纠错(FEC)技术是网络视频传输中的一项技术,其目的是通过冗余数据包的方式避免传输过程中的丢包现象。
具有更好的容错能力。
四、总结网络视频编码和传输技术是网络视频实现的关键技术,本文从编码技术和传输技术两方面进行了探讨。
视频实时编码技术研究随着互联网的不断普及,视频内容的使用和传输也变得越来越频繁。
但是,视频文件的体积往往很大,需要较多的网络带宽和存储空间。
为了解决这个问题,视频实时编码技术应运而生。
视频实时编码技术是指以一定的压缩率对视频信号进行实时压缩编码,使得传输过程中需要的带宽和存储空间降低,实现视频内容的高效传输。
目前常用的视频实时编码技术主要有H.264、VP9和AV1三种。
H.264是目前使用最为广泛的视频编码标准,已经被广泛应用于视频会议、视频播放、手机通信等领域。
VP9是谷歌公司推出的视频编码标准,其压缩率比较高,在视频清晰度较高的情况下,依然能够保持较小的文件体积。
AV1则是一种新兴的视频编码标准,比VP9更为先进。
不同的视频编码标准具有不同的特点和应用场景。
在应用过程中,需要根据实际需求选择合适的编码标准,进行灵活使用和组合,最大程度地发挥视频实时编码技术的优势。
视频实时编码技术的应用范围非常广泛。
其中,视频会议系统是最为典型的应用场景之一。
在这种场景下,对于视频信号的实时传输和处理要求非常高,需要使用高效的视频编码技术进行数据压缩和传输,以确保视频质量不受影响,传输流畅且稳定。
此外,视频实时编码技术还广泛应用于视频直播、在线教育、移动终端视频播放等领域。
在这些领域中,视频内容的实时传输和展示是非常重要的,视频实时编码技术的应用可以大大提高传输速度和用户体验。
总之,视频实时编码技术是一种非常重要的技术,它可以使视频内容的传输更加高效,并且应用范围非常广泛。
在未来,随着视频内容的多样化和传输速度的进一步提高,视频实时编码技术将发挥越来越重要的作用。
视频编码算法分析视频编码算法是一种将视频信号压缩的技术。
通过对视频信号进行压缩,可以减少数据传输所需的带宽,并使视频在传输和存储过程中占用更少的空间。
本文将对常见的视频编码算法进行分析,包括H.264、HEVC和AV1。
一、H.264编码算法H.264是一种广泛应用的视频编码算法,也被称为高级视频编码(Advanced Video Coding,简称AVC)。
它采用了一系列先进的压缩技术,包括帧内预测、帧间预测、运动估计、变换编码和熵编码等。
在H.264编码中,帧内预测通过在当前帧中寻找与之前已编码帧相似的像素块来减小冗余信息。
帧间预测则利用帧内预测的结果和运动向量进行帧间像素块的预测,从而进一步减小冗余。
运动估计是H.264编码的关键技术之一。
它通过对相邻帧进行运动检测和估计,找到最佳的运动向量来描述帧间的运动。
运动估计可以减少帧间差异,从而有效地压缩视频数据。
变换编码主要利用了离散余弦变换(Discrete Cosine Transform,简称DCT)来将时域数据转换为频域数据。
通过对频域数据进行量化和编码,可以进一步减小视频数据的体积。
最后,H.264使用了基于Huffman编码的熵编码来进一步压缩数据。
熵编码通过对常出现的模式进行编码来减小数据传输所需的比特数。
总体来说,H.264编码算法在提供较高视频质量的同时,能够有效地压缩视频数据,减少传输和存储所需的带宽和空间。
二、HEVC编码算法HEVC是高效视频编码(High Efficiency Video Coding,简称HEVC)的缩写。
它是H.264的继任者,采用了更先进的压缩技术,能够提供更高质量的视频并进一步减小数据的体积。
与H.264相比,HEVC在帧内和帧间预测、运动估计、变换编码和熵编码等方面进行了改进和优化。
例如,HEVC引入了一种新的预测模式,称为HEVC中的变换单元(Transform Unit,简称TU),可以进一步提高帧内和帧间的预测精度。
网络通信中的音视频编码与解码技术随着互联网的普及和科技的进步,网络通信的需求也日益增加。
音视频通信作为其中重要的一部分,发挥着越来越重要的作用。
通过网络实现音视频通信需要依赖于音视频编码与解码技术,它们扮演着传输和呈现音视频数据的关键角色。
一、音视频编码技术音视频编码技术是将音频或视频信号转化为数字数据的过程,以便在网络中传输和存储。
在这个过程中,编码器将原始的音频或视频信号采样并进行压缩处理。
音频和视频的编码技术各自有不同的算法和标准。
1. 音频编码技术音频编码是将声音信号转换为数字数据的过程,使其能够以高效的方式进行存储和传输。
常见的音频编码技术包括MP3、AAC、Opus等。
其中,MP3是一种流行的音频编码格式,它通过减少声音的数据量来实现压缩。
AAC(Advanced Audio Coding)是MP3的升级版本,它提供了更高的音频质量和更低的比特率。
2. 视频编码技术视频编码是将视频信号转换为数字数据的过程,使其能够以高效的方式进行存储和传输。
常见的视频编码技术包括、、VP9等。
是目前被广泛应用的视频编码标准,它具有高效的压缩率和优秀的视频质量。
是的升级版本,相比于,它能够更好地处理高分辨率视频。
二、音视频解码技术音视频解码技术是将经过编码的音视频数据转换为原始的音视频信号的过程。
当音视频数据在接收端接收到后,解码器将数据进行解压缩和解码处理,以便将其转化为可播放的音视频信号。
1. 音频解码技术音频解码是将经过编码的音频数据还原为原始音频信号的过程。
解码器通过解析压缩的音频数据,并对其进行还原和重构,使得原始音频信号能够得以恢复。
常见的音频解码技术包括MP3解码器、AAC解码器等。
2. 视频解码技术视频解码是将经过编码的视频数据还原为原始视频信号的过程。
解码器会解析压缩的视频数据,并还原出原始的视频帧。
视频解码技术需要处理的计算量较大,因为视频数据通常具有较高的分辨率和帧率。
常见的视频解码技术包括解码器、解码器等。
数字媒体技术应用专业技术的视频编码技巧随着数字媒体技术的快速发展,视频编码技术成为数字媒体领域中的重要一环。
视频编码技巧的应用不仅能够提高视频传输的效率和质量,还能够满足不同场景下的需求。
本文将介绍一些数字媒体技术应用专业技术的视频编码技巧。
一、压缩编码技术在数字媒体领域中,视频编码的一个重要目标就是实现高效的压缩。
压缩编码技术能够将视频信号的冗余信息去除,从而减少视频数据的存储和传输所需的带宽。
在视频编码中,常用的压缩编码技术包括运动估计、变换编码和熵编码等。
1. 运动估计运动估计是视频编码中的一项核心技术,它能够通过对连续帧之间的像素变化进行分析,找出像素的运动轨迹。
通过运动估计,可以将视频帧之间的冗余信息去除,从而实现视频的压缩。
常用的运动估计算法包括全搜索法、三步搜索法和快速搜索法等。
2. 变换编码变换编码是视频编码中的另一个重要技术,它能够将时域上相关的像素变化转换为频域上的系数。
通过变换编码,可以将视频信号的能量集中在少数频率上,从而实现视频数据的压缩。
常用的变换编码技术包括离散余弦变换(DCT)和小波变换等。
3. 熵编码熵编码是视频编码中的最后一步,它能够将变换编码后的系数进行编码,从而减少视频数据的存储和传输所需的比特数。
常用的熵编码技术包括霍夫曼编码和算术编码等。
二、画质优化技术除了压缩编码技术外,数字媒体技术应用专业技术的视频编码还需要考虑画质的优化。
画质优化技术能够提高视频的清晰度和细节表现,从而提升用户的观看体验。
常用的画质优化技术包括去噪、增强和抗锯齿等。
1. 去噪在视频编码过程中,由于传输和存储等环节的干扰,视频信号中常常会受到噪声的影响。
去噪技术能够通过滤波等方法去除视频信号中的噪声,从而提高视频的清晰度和细节表现。
2. 增强增强技术能够通过增加视频的对比度、饱和度和锐度等,使视频的画面更加鲜明和生动。
常用的增强技术包括直方图均衡化、锐化和饱和度调整等。
3. 抗锯齿抗锯齿技术能够通过抑制视频信号中的锯齿现象,使视频的边缘更加平滑和清晰。
监控系统中的视频编码与解码技术随着科技的进步和人们对安全意识的提高,监控系统在我们的生活中扮演着越来越重要的角色。
而作为监控系统中不可或缺的一部分,视频编码与解码技术在保障监控系统高效运行和视频数据传输方面起着至关重要的作用。
本文将介绍监控系统中常用的视频编码与解码技术,以及它们的原理和应用。
一、概述监控系统是通过视频监控设备采集、编码、传输和解码等技术手段,实时监视和记录被监控区域的情况,为人们提供安全保障。
而视频编码与解码技术则是将采集的视频信号转换为数字信号,并通过网络传输到监控中心或存储设备中。
因此,视频编码与解码技术必须具备高效、稳定、低延迟的特点,以确保监控数据的实时性和可靠性。
二、常用视频编码技术1. H.264编码H.264是一种高效的视频编码标准,也被广泛应用于监控系统中。
它采用基于区块的运动补偿和变长度编码等技术,能够在保证视频质量的前提下实现更高的压缩率。
H.264编码技术具备良好的画质表现和较低的码率需求,可以有效减少存储空间和传输带宽的占用。
2. MPEG-4编码MPEG-4是一种通用的视频压缩标准,广泛应用于媒体传输和存储等领域。
在监控系统中,MPEG-4编码采用了更为先进的视频压缩算法,可以提供更高的压缩比和更好的视频画质。
此外,MPEG-4编码还支持多个视频流进行编码,可以满足复杂监控系统中不同需求的视频传输要求。
三、视频解码技术视频解码技术是指将编码后的视频数据解析并还原成原始的视频图像,以便在监控中心或监控设备上进行显示和观看。
常见的视频解码技术包括硬件解码和软件解码。
1. 硬件解码硬件解码是利用专门的硬件电路来实现视频解码的过程,具备高效率和稳定性的优势。
目前,监控系统中常用的硬件解码器包括专用的解码芯片和GPU(图像处理器)。
硬件解码技术可以实现实时解码和多路解码,并具备较低的延迟和占用系统资源的特点。
2. 软件解码软件解码是通过计算机或嵌入式系统的软件实现视频解码的过程。
视频编码概念和主要编码算法视频编码是将数字视频信号转换为数字视频的过程,它使用编码算法来减少视频数据的冗余,并在保持视觉质量的同时减小文件大小。
视频编码对于视频传输、存储和分享非常重要。
视频编码的主要目标是通过移除冗余和统计特性来降低视频信号的数据率,而同时保持所需质量的最佳可视效果。
视频编码算法通常包含两个主要阶段:预处理和压缩编码。
预处理阶段是对视频信号进行处理和转换,以突出其中的重要信息,并减少冗余。
这些预处理技术包括空间和时间滤波、亮度和色彩空间转换等。
压缩编码阶段是将预处理后的视频数据压缩为尽可能小的比特流,通常使用有损压缩算法。
下面是几种主要的视频编码算法:1. MPEG(Moving Picture Experts Group)算法:MPEG是一组用于压缩和传输视频和音频数据的标准。
MPEG算法基于空间和时间冗余的概念,通过运动估计、运动补偿和离散余弦变换等技术来压缩视频数据。
2. H.264/AVC(Advanced Video Coding)算法:H.264是一种广泛使用的视频编码标准,具有高效的压缩性能。
它采用了运动估计、变换编码和熵编码等多种技术,并引入了一些新的特性,如帧内预测和熵编码上下文建模,以提高编码效率。
3. VP9算法:VP9是Google开发的一种开放源码视频编解码器,用于实现高效的视频压缩。
VP9算法采用了类似于H.264的技术,并引入了一些新的特性,如可变块大小和有损连续运动估计,以提高编码效率和视频质量。
4. AV1算法:AV1是一种由Alliance for Open Media开发的新一代开放源码视频编解码器。
AV1采用了先进的编码技术,如双向预测、变换编码和可变块大小等,以提供更好的压缩效率和视频质量。
这些视频编码算法的选择取决于具体的应用需求和技术要求。
不同的编码算法有不同的性能和兼容性,用户需要根据实际情况选择最适合的算法。
总之,视频编码是对数字视频信号进行处理和压缩的过程。
网络视频基础知识随着互联网的发展和网络带宽的提高,网络视频已经成为人们日常娱乐和学习的重要方式。
无论是在家中观看电影、追剧,还是在办公室学习教育视频,网络视频都已经深入到我们的生活中。
在使用网络视频的过程中,了解基础知识非常重要,下面将为您介绍一些网络视频的基本概念和常用技术。
一、视频编码格式视频编码格式是指将视频信号转换成数字信号的一种技术,它对视频信号进行压缩和解压缩,以达到提高视频压缩比和保持视频质量的目的。
目前常见的视频编码格式有H.264、H.265、VP9等。
H.264是应用最广泛的视频编码格式,它能够在保持良好视频质量的同时,实现较高的压缩比,适用于各种网络环境。
H.265是H.264的升级版,它在保证同等画质的情况下,能够进一步减少视频数据量,降低带宽需求。
二、视频流媒体视频流媒体是一种通过互联网传输视频数据的技术。
在视频流媒体中,视频数据会被分成一系列的小数据包,通过网络传输到用户的终端设备,然后再根据播放需求进行解码和播放。
常见的流媒体协议有HTTP、RTMP、HLS等。
HTTP协议是目前应用最广泛的流媒体协议,它可以通过普通的HTTP服务器进行视频的传输,并且在传输过程中能够适应网络带宽的变化,提供更好的观看体验。
三、自适应码率技术自适应码率技术是一种根据用户的实际网络环境和设备性能来自动调整视频码率的技术。
在视频播放过程中,自适应码率技术可以根据网络带宽的情况,选择合适的视频码率进行播放。
如果网络带宽不稳定或者较低,自适应码率技术会自动选择较低的码率,以保证视频的连续播放和较好的观看体验。
而当网络带宽较高时,自适应码率技术则会选择较高的码率,以提供更清晰的视频质量。
四、4K、8K视频4K、8K视频是指视频的分辨率达到了4K(3840×2160像素)或者8K(7680×4320像素)。
随着显示设备的发展和技术的进步,4K、8K视频已经逐渐进入人们的视野。
视频编解码技术的优缺点对比在现代社会中,视频编解码技术已经成为了日常生活不可或缺的一部分。
从电视广播到网络直播,从短视频到电影,视频编解码技术贯穿了我们的生活方方面面。
然而,不同的视频编解码技术却存在着各自的优缺点。
本文将探讨几种常见的视频编解码技术,对其进行优缺点对比。
一、编码编码是当前应用最广泛的视频编码技术之一。
它通过采用高效的算法和复杂的编码原理,实现了视频数据的高压缩比率,能够在相同带宽下传输更高质量的视频。
然而,编码也存在一些缺点。
首先,它需要较高的计算复杂度,对硬件要求较高。
其次,编码标准有较多的设置选项,配置不得当会导致视频质量下降和压缩效率低下。
此外,编码面临版权费用问题,商用实施受到一定限制。
二、编码编码是编码的后继者,也被称为HEVC(High Efficiency Video Coding)。
相比于编码,编码在压缩效率和视频质量上更有优势,能够在相同带宽下传输更高分辨率的视频。
此外,编码还能够支持更多的功能,如HDR(高动态范围)和更高的帧率。
然而,编码也存在一些缺点。
首先,由于其较高的复杂度,编码需要更高的计算资源,对硬件的要求较高。
其次,编码算法仍然相对复杂,导致编码时延较长。
此外,编码也存在版权费用问题,商业应用较为受限。
三、AV1编码AV1编码是一种由开源社区联合Google、亚马逊等公司推动发展的视频编码技术。
AV1编码采用了革命性的技术,比如多线程处理和优化的运动预测算法,以提供更高的编码效率和更好的视频质量。
与和相比,AV1编码具有更高的压缩效率,能够在更低的比特率下保持更高的视觉质量。
同时,AV1编码也开放、免费,并没有版权问题。
然而,AV1编码目前还处于发展阶段,实际应用还相对较少,对硬件设备的要求和兼容性尚待进一步解决。
综上所述,不同的视频编解码技术各有优缺点。
编码在应用广泛的同时,也面临着较高的计算复杂度和版权费用的问题。
编码在提供更高压缩率和视频质量的同时,计算复杂度和版权费用仍然是需要考虑的因素。
视频编码算法与质量分析研究随着网络传输速度的提升和大规模视频应用的普及,视频编码算法的研究和质量分析成为了一个重要的研究领域。
本文将对视频编码算法与质量分析进行探讨,并介绍一些常见的视频编码算法和质量评估方法。
一、视频编码算法1. H.264编码算法H.264是一种先进的视频编码标准,也被称为AVC (Advanced Video Coding)。
它采用了多个高级的编码技术,如帧内预测、帧间预测和变换编码等。
H.264编码算法能够提供更高的视频压缩比和更好的视频质量,因此被广泛应用于视频传输和存储中。
2. HEVC编码算法HEVC(High Efficiency Video Coding)是目前最新的视频编码标准,也被称为H.265。
与H.264相比,HEVC在相同视频质量的情况下能够提供更高的压缩比,减少了视频传输和存储的带宽需求。
HEVC编码算法的优化主要包括更强的预测算法和更高效的变换编码。
3. VP9编码算法VP9是由Google开发的开源视频编码算法,旨在提供更高的压缩效率和更好的视频质量。
VP9采用了更先进的编码技术,如无损压缩、多帧压缩和自适应压缩等。
与H.264和HEVC相比,VP9编码算法在主观视觉质量和客观评估指标上表现出色。
二、视频质量分析1. 主观评估主观评估是通过人眼观看视频并进行评估,从而获得视频质量的一个评价方法。
在主观评估中,一般使用主观质量评分(Subjective Quality Assessment)来衡量视频的观看体验。
通过请一些观众观看同一段视频,并对其进行评分,可以得到平均主观质量评分。
2. 客观评估客观评估是使用一系列计算模型和指标来评估视频质量的方法。
常见的客观评估指标包括峰值信噪比(PSNR)、结构相似性指标(SSIM)和视频多维度指标(VQM)等。
这些指标可以通过对原始视频和压缩视频之间的差异进行计算,从而评估视频的质量。
3. 异构评估由于视频编码算法的差异,不同编码算法在相同质量下的性能表现也会有所不同。
几种网络视频编码技术的分析、比较与发展摘要:本文主要介绍了MPEG,H.264,AVS等3种主流网络视频编码标准。
并从编码的关键技术,创新改进等方面对这三种标准进行了分析比较。
以期在未来的实际应用中,能够更好的做出选择。
1 引言网络技术的快速发展,高速数据传输以及大数据容量的传输,而短时间内无法突破硬件存储容量的限制,推动了网络视频编码技术的革新、发展。
通过各种网络视频编码标准的算法优化,给人们提供了一个良好的视听娱乐体验,本文将从目前主流的几种标准,即MPEG-4,H.264以及AVS对比分析各自的关键技术特点以及创新优势。
2 几种主流标准介绍2.1 MPEG-4标准MPEG(Moving Pictures Experts Group)即动态图像专家组是目前影响最大、应用最广的多媒体技术标准。
他包括MPEG-1、MPEG-2、MPEG-4、MPEG-21等众多分支[1]。
每一个分支都侧重于不同的应用,本文主要针对MPEG-4标准进行阐述。
2.2 H.264标准H.264是ITU-T和ISO/IEC联合制定的一种视频编码标准,他具有高效的编码标准和易于网络传输的特点,H.264标准同时定义了四个档次,即基本档次,主档次、扩展档次和高级档次,以满足视频电话、视频会议、视频存储、视频广播等众多领域的应用。
2.3 AVS标准AVS(Audio Video coding Standard,音视频编码标准)是《信息技术先进音视频编码》系列标准的简称,是我国具备自主知识产权的第二代信源编码标准,也是数字音视频产业的共性基础标准。
3 一般性视频编码结构介绍3.1 视频编码结构介绍视频编码理论和其他科学研究一样,离不开数学模型的支撑。
视频编码器采用模型来描述一个视频流。
这种模型使得压缩数据尽可能占用最少的bit数,同时又保证重建后的视频流能较好地近似原视频流,做到压缩效率和图像质量的平衡。
图3-1 视频编码模型视频编码器如图3-1所示,分为三个主要功能单元:时域模型、空域模型和嫡编码器。
时域模型的输入是未压缩的原始视频流,通常原始视频流相邻帧之间具有很大的相似性,根据这个特点,时域模型建立预测帧来降低时域冗余;频域模型的输入是残差图像,它利用相邻像素点的相似性,消除残差图像的频域冗余;熵编码器对时域参数如运动矢量和变换系数进行压缩,消除存在的统计冗余,并输出压缩后的比特流和数据用于视频的存储和传输。
压缩后的视频码流包括编码的运动矢量参数、变换系数和头信息。
目前国际上的视频编解码标准多种多样,但这些标准大多遵循这一设计模型,细化后包括前端的运动估计和补偿(又称为DPCM)、变换预编码和熵编码等。
这个模型又常常被称为DPCM/DCT视频编解码器混合模型。
任何兼容H.26x系列和MPEG系列的视频编码器都必须实现一套类似的基本编码和解码功能。
图3-2是一套典型的混合DPCM/DCT编码框图,目的是将当前帧压缩成比特流。
图3-2 DPCM/DCT视频编码框图[4]3.2 时域模型时域模型的作用就是消除连续帧之间的时域冗余。
在时域模型中,当前帧减去预测帧得到残差图像。
预测帧越准确,所得的残差图像的能量越小。
残差图像经过编码后被传输到解码器。
解码器通过与残差图像相加来恢复当前图像以重建相应的预测帧。
预测帧的重建可以参考一帧或多帧之前或之后的图像(称为参考帧),其精度可以通过参考帧和当前帧之间的运动补偿来提高。
对于运动图像为了使预测误差尽可能小,从而达到减少码率的目的,就一定要采用适当的预测方法,这个方法就是运动补偿预测。
运动补偿预测有两个过程。
第一个过程是对运动物体的位移做出估计,即运动物体从上一帧到当前帧位移的方向和像素数要做出估计,也就是要求出运动矢量,这个过程叫做运动估计。
第二个过程是按照运动矢量,将上一帧做位移,求出对当前帧的估计,这个过程称为运动补偿。
图像分割是运动补偿预测的基础。
理想上是将图像分割成不同运动的物体,但实现比较困难,所以通常采用两种较简单的方法。
一种方法是对每个像素的位移进行递归估计;另一种是把图像分为矩形子块,适当选择块的大小,估计出运动子块的位移,进行预测传输。
得到运动物体的位移估值后,即可将其送入预测器。
与图像分割的两种方法相对应,运动估计有两种方法:一个是以像素为基础的运动估计算法,也就是对每一个像素做估计,实现较为复杂;另一个是以像素矩阵块为基础的块匹配法(BMA),是目前常用的运动估计算法。
即先将一帧图像分成MxN小块,假定在同一块中的像素具有相同的位移,运动估计按每一块进行计算。
为了得到最佳匹配块,要进行运动估计中的搜索。
搜索的方法很多,有全像素搜索法、快速搜索法和三步法等。
块匹配法中图像子块通常选为NxN的方块。
由于只有在块较小时才可以近似认为块内各点作相等的平移,以满足BMA法的基本假设。
但若块太小,则估值结果易受干扰噪声影响,不够可靠,而且传送运动矢量场所需的比特数过多:块太大可减轻其影响,但BMA法的基本假设难以满足。
所以通常取护16(H.264和AvS)或8(MPEG-4),即16、16或8、8的块作为匹配单元是上述因素折衷的结果。
3.3频域模型频域模型一般包括变换编码和量化两部分。
变换用于消除数据相关性,而量化用于降低变换域数据精度。
变换的目的是减少变换系数的相关性,可以把这样的性质称之为相关减弱性质。
适当选取基函数,可使系数的相关性减少。
与相关减弱性质相联系的性质是能量集中。
将大部分能量集中于一部分变换系数,可以去除大多数系数也不会严重影响图像。
以熟知的傅立叶变换为例,变换后相当于图像信号由空间域变换到了频域。
由于一般图像的能量基本集中在低频部分,于是变换后像素方块的能量集中于左上角。
这时只需对低频区域的变换系数进行编码,高频区域则既不编码,也不传输,即达到了压缩编码的目的。
理论分析表明,K-L正交变换(KLT)是能达到有效的能量集中的最佳变换,但它实现起来很难,所以在工程实践中很少使用;离散傅立叶变换曾被认为是一种适合的变换,原因是它有固定的基函数组,可以用FFT算法对它做快速运算,包括正向和反向运算。
尤其重要的是,普通图像经DFT变换能量的主要部分集中于低频区域;但是后来发现DCT(DisereteCosineTransform),离散余弦变换、的性能比DFT更好。
DeT具有能量更加集中的优点而且不会牺牲其他方面的质量,己有的高效算法仍然适用,而且DCT可以用DFT的快速算法。
除了DFT和DCT,人们还提出了许多其他的变换,如哈特利变换和正弦变换,但从计算效率和能量集中这两方面来看,DCT仍占优势,所以目前诸多图像编码的国际标准均采用DCT作为编码的主要环节之一。
一个连续的标量,可以是一个像素的幅值,也可以是变换系数。
要用有限的比特数来表示它,那就只能用有限的L个量化电平中的一个来代表它,这个过程叫做t化。
正交变换(如DCT)本身并没有抛弃变换后的高频系数分t。
对于一个8:3的图像块来说,输入的是64个值,输出的仍然是64个值,只不过能量全部集中到了左上角的直流和低频分量中,而右下角的高频系数分量趋于O。
在量化过程中通过设置合理的步长将趋于O的值都置成O,对于这些O值既不分配码字也不传输。
于是8x8的图像块可以用少数的直流和低频系数表示。
这一部分我们在下一节中做详细介绍。
3.4熵编码器熵编码将描述视频流的一串符号编码成适于传输或存储的压缩比特流。
熵编码的输入有量化后的传输系数、运动矢量、标记点头信息和辅助信息。
熵编码中用得最多的三种编码方法是基于概率分布特性的Huffinan编码、算术编码和基于相关性的游程编码。
其中最常用的是Huff比an编码和游程编码,本小节将重点介绍这两种编码。
(1)Huffman编码Huffman于1952年提出了Huffman编码,这是完全依据字符出现的概率来构造平均长度最短的异字头码字的一种编码方法。
它的依据是:在变长编码中,若各码字长度严格按照所对应符号出现概率的大小逆序排列,则其平均长度为最小。
Huffman编码的具体实现步骤如下:①将信源符号出现概率按减小的顺序排列;②将两个最小的概率进行组合相加,并继续这一步骤,始终将较高的概率分支放在上部,直到概率达到1.0为止;③对每对组合中的上边一个编码为1,下边一个编码为0(或相反,即对上边一个编码为O,下边一个编码为1);④画出每个信源符号概率到1.0处的路径,记下沿路径的1和O:⑤对于每个信源符号都写出1、0序列,则从右到左就得到Huflhlan码。
Huffillan编码的效率比较高,一般在95%以上,但应该指出的是,由于“0’’和月”的指定是任意的,故由上述过程编出的码并不是唯一的一种,但因其平均码长是一样的,所以并不影响编码效率和数据压缩性能。
(2)游程编码所谓游程(RUn.Length,缩写为RL)就是指由字符(或信号采样值)构成的数据流中各个字符重复出现而形成的字符串长度.如果给出了形成串的字符、串的长度及串的位置,就能恢复出原来的数据流。
而游程编码(甩C)就是用二进制码字给出上述信息的一类编码方法。
游程编码的数据压缩效率取决于整个数据流中重复字符出现次数、平均游程长度及所采用的编码结构。
对于灰度值少,特别是二值图像编码效率较高,二维压缩比可达10:1,在应用时常常和其他编码方法混合使用,如Huffman编码或DCT编码。
MPEG-4的墒编码就是采用哈夫曼编码和游程编码相结合的方法。
4 三种网络视频编码的比较4.1 MPEG-4的视频编码运动图像专家组于2000年公布的MPEG-4标准不仅仅是压缩算法,它还是数字电视、交互式绘图应用、交互式多媒体等整合及压缩技术的国际标准。
MPEG-4将众多的多媒体应用集成于一个完整的框架内,建立起一种能被多媒体传输、存储、检索等应用领域普遍采用的统一数据格式。
MPEG-4除采用第一代视频编码的核心技术(如变换编码、运动估计与运动补偿、量化、熵编码)外,还提出了一些新的有创见性的关键技术,如下:(1)视频对象提取技术:MPEG-4把视频/图像分割成不同对象或把运动对象从背景中分离出来,然后针对不同对象采用相应编码方法,以实现高效压缩。
目前视频对象分割的一般步骤是:先对原始视频/图像数据进行简化以利于分割,然后对视频/图像数据进行特征提取(如:颜色、纹理、运动、帧差、位移帧差乃至语义等特征);再基于某种均匀性标准来确定分割决策,根据所提取特征将视频数据归类;最后是进行相关后处理,以实现滤除噪声及准确提取边界。
(2)VOP视频编码技术:视频对象平面(VOP,Video Object Plane)是视频对象(VO)在某一时刻的采样。
MPEG-4在编码过程中针对不同VO采用不同的编码策略,111x,-J-前景VO的压缩编码尽可能保留细节和平滑;对背景VO则采用高压缩率的编码策略,甚至不予传输而在解码端由其他背景拼接而成。