视频解码论文
- 格式:doc
- 大小:128.00 KB
- 文档页数:6
视频编解码原理范文视频编解码(Video Coding and Decoding)是将数字视频信号进行压缩编码和解压缩解码的过程。
通过视频编解码可以实现将高数据量的视频信号转换为低数据量的压缩码流,从而减小存储需求和传输带宽。
视频编解码的实现需要涉及信号处理、压缩算法、编解码器等多个方面的知识。
1.采样和量化:视频编码首先对原始视频信号进行采样。
采样是将连续的模拟视频信号转换为离散的数字视频信号。
然后,通过量化将离散信号的幅值量化为离散数值。
采样和量化是数字视频处理的基础,影响编码质量和数据量大小。
2.预测编码:视频编码通过利用时域或空域上邻近像素的统计特性,对当前帧的像素进行预测。
预测误差通常较小,因此,只需传输和存储预测误差,而不需要完整的像素数据。
其中著名的预测方法包括运动估计和运动补偿。
3. 变换编码:视频编码通常使用离散余弦变换(Discrete Cosine Transform,DCT)对预测误差进行变换编码。
DCT将整个图像分解为多个频域系数,其中高频系数较少,低频系数较多,从而进一步减小数据量。
使用DCT编码后的数据通常分为多个编码块,每个编码块经过量化后,保留重要的低频系数,舍弃不重要的高频系数。
4.熵编码:变换编码后的数据仍然具有较高的冗余性,熵编码用于对变换编码后的系数进行进一步压缩。
熵编码常用的方法有哈夫曼编码和上下文自适应二进制算术编码。
5.解码:视频解码是视频编码的逆过程,将压缩码流还原为原始视频数据。
解码过程首先进行熵解码,再进行量化逆运算、逆变换和预测误差补偿,最后得到完整的重建视频帧。
视频编解码技术主要应用于数字视频传输、存储和广播等领域。
在互联网视频传输中,如实时视频会议、网络直播和视频点播,视频编解码可以将高清视频信号压缩为较低码率的视频流,实现实时传输和广泛分发。
在数字电视和视频存储中,视频编解码可以将高清视频信号存储在有限的存储介质中,提供高质量的视频服务。
基于深度学习的视频编码算法的研究一、前言随着移动互联网的快速发展,视频成为最受欢迎的媒体类型之一,据预测,到2022年,全球视频流量将占整个 IP 数据流量的80%以上。
而高效的视频编码算法是保证视频质量和网络流畅的关键所在。
深度学习的广泛应用,使得其在视频编码领域也得到了广泛的研究和应用,本文将针对基于深度学习的视频编码算法的研究进行探讨。
二、视频编码算法的发展历程1.传统视频编码算法传统的视频编码算法采用基于标准的离散余弦变换(DCT)和运动估计等技术来将视频压缩编码。
代表性的编码标准包括H.264、AVC和HEVC等,这些编码标准虽然已经可以满足当前视频压缩的需求,但其编码复杂度高且无法应对网络环境的变化,且其与深度学习的结合也受到了一定的限制。
2.基于深度学习的视频编码算法随着深度学习技术的发展,在对视频的编码和压缩方面也提供了不少新思路和方法。
与传统的视频编码算法不同,基于深度学习的视频编码思路一般都是以图像上的深度学习模型(主要是卷积神经网络)为基础,通过对图像序列的逐帧处理,实现对视频编码的压缩。
三、基于深度学习的视频编码算法研究1.基于卷积神经网络的视频编码算法在基于深度学习的视频编码算法中,基于卷积神经网络的视频编码算法应用最为广泛。
针对这种算法,主要的思路是将视频分为I帧、P帧和B帧,I帧作为关键帧,不进行编码压缩;P帧和B帧作为非关键帧,采用卷积神经网络进行编码压缩。
2.基于生成式对抗网络的视频编码算法除了基于卷积神经网络的视频编码算法外,基于生成式对抗网络的视频编码算法也是一种被广泛研究的方法。
这种方法主要通过让生成式对抗网络学习如何通过有损压缩来创建视频副本,并通过副本中的有损编码器来学习压缩,实现对视频编码压缩的优化。
3.其他基于深度学习的视频编码算法除了以上两种基于深度学习的视频编码算法外,目前还存在一些其他的算法,例如,《Deep Remaster》中提出的以带有运动信息的残差帧为关键帧的算法、Camera-Generated Image Compression使用自编码器实现的算法等。
基于深度学习的高清视频编码算法研究随着互联网的不断发展和普及,视频内容已经成为人们日常生活中不可或缺的组成部分。
视频内容的优化和压缩一直是研究的热点之一,因为这不仅涉及到视频播放流畅度的问题,也直接影响到网络带宽的利用率。
目前,基于深度学习的高清视频编码算法研究成为了学术界和工业界的热点。
一、深度学习在视频编码中的应用深度学习在计算机视觉领域的应用已经被广泛研究和应用。
近年来,深度学习开始尝试在视频编码中得到应用。
基于深度学习的高清视频编码算法采用了自动编码器、卷积神经网络等技术,能够对高清视频信号进行压缩,从而实现高效的视频传输。
同时,深度学习方法还可以克服传统视频编码算法中的瓶颈,例如图像锐利度、噪声抗性等问题。
二、基于深度学习的高清视频编码算法的研究基于深度学习的高清视频编码算法主要关注以下几个方面:1.自适应帧率:自适应帧率是基于深度学习的高清视频编码算法中的一个重要特征。
它可以动态调整视频帧率,使得视频传输更加流畅,同时能够节省网络带宽。
2.多尺度编码:多尺度编码是基于深度学习的高清视频编码算法中的另一个重要特征。
它采用了多种尺度的编码算法,可以更好地处理视频的各种场景,同时保证视频的清晰度和流畅度。
3.自适应码率控制:自适应码率控制是基于深度学习的高清视频编码算法中的一个重要模块。
它可以通过调整数据包的大小和传输速率,保证视频的传输质量和速度的平衡。
三、基于深度学习的高清视频编码算法的优势与传统视频编码算法相比,基于深度学习的高清视频编码算法具有以下优势:1.高压缩比:基于深度学习的高清视频编码算法可以实现较高的视频压缩比,从而可以节省网络带宽。
2.较低的码率:由于基于深度学习的高清视频编码算法采用了自适应帧率和多尺度编码等技术,因此能够在保证视频清晰度的同时,保持较低的码率。
3.良好的数据压缩质量:基于深度学习的高清视频编码算法能够提高视频的清晰度和画质,通过算法优化可以避免在数据压缩过程中出现较大的数据误差。
视频编码与解码技术在视频传输中的应用随着互联网的迅猛发展,视频成为了人们日常生活中不可或缺的一部分。
然而,视频文件的传输和存储需要大量的带宽和空间,为了解决这个问题,视频编码和解码技术应运而生。
视频编码和解码技术是将视频信号转换为数字信号并压缩传输的重要工具,本文将深入探讨视频编码与解码技术在视频传输中的应用。
视频编码技术是将视频信号转换为数字信号的过程。
在视频编码的过程中,首先需要将视频信号分解成多个不同的部分,如颜色、亮度、动作等。
然后将每个部分进行采样、量化和编码,通过在时间和空间上的冗余性去除,以减少数据量。
最常见的视频编码标准是H.264,它通过运动估计、变换和熵编码等技术,将视频文件压缩到较小的容量,以便在有限的带宽上传输。
视频解码技术是将压缩的数字信号转换回原始视频信号的过程。
在视频解码的过程中,首先需要对传输过来的视频文件进行解码,解码器将编码器压缩的数据解码为原始数据。
接下来,解码器会进行逆量化、逆变换和逆运动估计等操作,以还原出原始视频信号。
最后,将解码后的视频信号通过显示设备展示给观众。
在视频传输过程中,视频编码与解码技术扮演着重要的角色。
首先,视频编码技术可以有效地压缩视频文件的大小,从而减少传输所需的带宽。
这不仅为用户提供了更流畅的观看体验,也降低了网络负担。
例如,在在线视频平台上观看高清视频时,通过视频编码技术,可以大大减少视频文件的大小,使其可以顺利地在低带宽环境下进行传输。
其次,视频编码与解码技术还可以提高视频传输的稳定性和鲁棒性。
在视频传输过程中,由于网络延迟、丢包等问题,会导致传输中断或画面质量下降。
通过视频编码技术,可以将视频文件分为多个小的数据包进行传输,即使在网络不稳定的情况下,也可以通过丢弃一些数据包或重组丢失的数据包来保持画面质量的稳定性。
另外,视频编码与解码技术还可以提供多样化的视频传输方式,满足不同应用的需求。
例如,通过视频编码技术,可以实现实时视频传输,如视频会议、网络直播等。
video coding for machine的文章摘要:一、视频编码技术概述1.视频编码技术的背景与发展2.视频编码的基本原理二、机器学习在视频编码中的应用1.传统视频编码方法与局限性2.机器学习在视频编码中的优势3.主流的基于机器学习的视频编码技术三、深度学习在视频编码中的应用1.深度学习技术的发展及其在视频编码领域的应用2.深度学习视频编码方法的典型代表3.深度学习视频编码技术的未来发展趋势四、我国在视频编码技术的研究与应用1.我国在视频编码技术研究的发展历程2.我国在视频编码技术领域的优势与特点3.我国视频编码技术在实际应用中的案例分析五、视频编码技术的未来展望1.新一代视频编码技术的研发趋势2.视频编码技术在多媒体领域的融合与应用3.视频编码技术在5G、物联网等新兴领域的应用前景正文:一、视频编码技术概述随着信息技术的飞速发展,视频数据在全球范围内呈现出爆炸式增长。
为了更有效地存储和传输这些海量数据,视频编码技术应运而生。
视频编码技术通过对视频数据进行压缩、解压缩处理,实现了对视频数据的高效利用。
1.视频编码技术的背景与发展从早期的模拟视频信号编码,到数字视频编码,再到如今的网络视频编码,视频编码技术经历了几个阶段的发展。
从简单的预测编码、变换编码,到复杂的主流视频编码标准如H.264/AVC、H.265/HEVC,视频编码技术不断革新,以满足日益增长的音视频数据需求。
2.视频编码的基本原理视频编码的基本原理主要包括空间预测、时间预测、变换编码、熵编码等。
通过这些技术,可以将视频数据压缩至较低的码率,同时在接收端解码后恢复出高质量的视频信号。
二、机器学习在视频编码中的应用随着机器学习技术的兴起,它开始在视频编码领域发挥重要作用。
传统的视频编码方法依赖于固定的编码框架和参数设置,而机器学习通过对大量数据的学习,可以自适应地调整编码策略,从而提高编码性能。
1.传统视频编码方法与局限性传统视频编码方法虽然取得了一定的压缩效果,但受限于固定的编码策略和参数设置,往往无法针对不同场景和应用场景进行优化。
视频编码技术的研究及应用随着互联网飞速发展,人们对视频信息的需求也越来越多。
视频编码技术作为实现视频信息传输的重要手段,其在视频压缩、传输和存储等方面起着至关重要的作用。
在这篇文章中,我们将探讨视频编码技术的研究和应用,并展望未来的发展趋势。
一、视频编码技术的基础原理视频编码技术的基础原理就是将视频信号转换为数字信号,然后通过压缩技术减小信号的数据量,最后进行传输和存储。
具体来说,视频编码技术通过以下几个步骤实现:1. 帧率转换。
将视频采样的连续图像转换成一系列的帧,通常每秒钟25-30帧。
2. 空间采样转换。
将视频中各个图像块采样成数字信号。
3. 量化。
将数字信号的精度减小,以达到压缩的目的。
4. 变换。
将视频信号变换至频域,以达到更好的数据压缩效果。
5. 熵编码。
利用数据编码的观念,减小视频数据的冗余程度。
二、视频编码技术的研究现状和应用1. H.264编码技术H.264编码技术是当前最流行的视频编码技术之一,它可以将原始视频信号的数据量减小80%以上,实现高清视频信号的压缩存储。
在视频传输领域,H.264码流的压缩比高,传输速率低,较好地解决了网络带宽不足的问题。
2. VP9编码技术VP9是一种开源的视频编码技术,它是Google开发的新一代视频编码格式。
与H.264相比,VP9解码更加快速,具有更好的图像质量和更小的文件大小,同时可以支持4K和8K超高清视频信号的传输。
3. 视频监控系统中的应用视频编码技术在现代视频监控系统中也起着至关重要的作用。
在视频监控系统中,采集到的视频信号需要经过编码和压缩,同时可以实现视频数据的存储和远程传输。
通常会使用H.264、H.265和VP9等编码格式。
4. 视频共享平台中的应用视频编码技术也广泛应用于各种视频共享平台,如YouTube、Netflix等。
在这些平台上,视频编码技术可以大大减小视频数据量,提高用户观看视频的体验。
同时,视频编码技术也可以支持视频的快速下载和在线播放。
视频编解码技术的研究发展近年来,随着互联网的飞速发展,视频成为人们生活中不可或缺的一部分,各种视频应用也如雨后春笋般涌现出来,其中包括直播、短视频、视频会议、视频监控等等。
这些视频应用背后的技术支持就是视频编解码技术。
本文将介绍视频编解码技术的研究发展及其未来发展方向。
一、编解码技术简介编解码技术是视频压缩的关键技术,它包括视频压缩编码和解压缩解码两个部分。
视频压缩编码就是将原始视频信号通过编码器进行压缩,减少数据量,然后通过网络传输到接收端;而解压缩解码则是接收端将压缩后的视频信号调出来并进行解码,还原成原始视频信号,最终显示给用户。
二、编解码技术的历史自1951年首个模拟视频压缩编码器问世以来,编解码技术经历了长足的发展。
到了1970年代,数字视频压缩编码和解压缩解码开始取代模拟视频技术。
1980年代初,由MPEG组织提出的MPEG-1标准,标志着数字视频技术进入了成熟期。
在MPEG-1标准之后,MPEG-2标准成为了数字电视和DVD的技术标准,MPEG-4标准则实现了互联网视频传输和流媒体技术的广泛应用。
随着新一代视频编解码标准的不断推出,如H.264、H265/HEVC等,视频编解码技术得以持续完善。
三、编解码技术的现状目前,视频编解码技术已经具备高效、高清、多功能的特点,同时也存在着传输速度慢、码率高、图像质量不够等问题。
为了解决这些问题,学术界和工业界不断投入研究,提出了一系列新的视频编解码技术,并不断完善现有标准。
3.1 H.264H.264是目前应用最广泛的编解码标准之一,具有高压缩比、高质量和高效率等优点。
其编码算法采用了先进的运动估算技术,能够使视频的数据量减小十倍以上。
H.264标准广泛应用于高清视频、移动视频通讯和互联网视频等领域,并得到了市场的广泛认可。
3.2 H265/HEVCH265/HEVC是目前最新的视频编解码标准,具有更高的压缩比、更高的视频质量和更低的码率。
摘要摘要随着移动互联网的兴起以及基础网络设施的建造,大众对消费类电子高清显示的要求越来越高。
高清显示需要大量的数据支持,在带宽资源受限时,数据的传输能力较低。
因此,需要高效率的编码器控制传输数据的码率。
目前市场上有很多视频编解码标准,但是逻辑较为复杂,在芯片中占用面积较大。
为解决带宽及硬件成本问题,视频标准协会制定了显示码流压缩(Display Stream Compression,DSC)标准。
DSC 标准能够用较低的硬件成本实现,占用带宽资源较少,且能够达到视觉无损的效果。
本文基于DSC标准对编解码器进行硬件设计及仿真验证。
首先介绍了主流压缩算法,分析了各种压缩算法的特点及其适用情况。
其次通过对DSC算法的学习,研究了编解码器中各个模块的数据处理流程和原理,确定了本文在设计中应用的基础理论。
最后重点阐述编解码器中各模块的电路和时序设计,并依次对设计模块进行仿真验证。
本文通过设计各个模块完成了编解码器的基本要求:为提高视觉效果,对原始像素进行平坦度检测并调整量化参数,从而保证像素间的差异性;实现了编解码器的格式转换功能,支持RGB和YUV两种格式的数据处理,进一步提高了设计的适用性;采用三种重构值计算方式以及两种编码方式,减小传输数据量,大大降低了传输成本;采用流水线设计和类似于乒乓buffer的寄存器结构,满足编解码器速率要求,提高了数据处理效率;利用恒定码率的控制方式,保证每个区块的编码数量相同,提高了编码数据的稳定性;通过精确计算存储模块的大小,减小了整体硬件设计面积。
各个模块电路和时序设计完成后,在验证环境中根据不同的测试用例检验设计是否满足功能要求。
本文通过算法学习、硬件设计、模块验证等过程,在硬件上实现了DSC编解码器的基本要求。
本次设计满足YUV和RGB两种常见色彩空间的数据处理;实现了编码器1pixel/clock、解码器3pixels/clock的速率要求;支持3种重构值计算方式以及两种编码方式;最大支持2K的图像分辨率;支持最大压缩比为3:1。
浅述H.264视频的RTP荷载格式本文概况本文讲述了一种有关于互联网社区的internet标准跟踪协议,而这需要进一步进行讨论和建议改善。
请参考最新版本“互联网官方协议标准”(标准1)中的国家标准化及其地位的内容。
本文的发布不受任何限制。
版权声明版权所有(c)因特网协会(2005年)1 介绍1.1 h.264编解码器本文指定一个rtp荷载规范用于itu-t h.264 视频编码标准(iso/iec 14496 part 10 [2])(两个都称为高级视频编码avc).h.264建议在2005年5月被itu-t采纳, 草案规范对于公共回顾可用[8]. 本文h.264 缩写用于编解码器和标准,但是本文等价于采纳 iso/iec相似的编码标准.h.264 视频编解码器又非常广泛的应用覆盖所有格式的数字压缩视频格式,从低带宽的internet流应用到hdtv广播和数字影院应用。
和当前的技术状态比较, 整个h.264的性能被报告节省50%的位率。
例如,数字卫星tv质量被报告在1.5 mbit/s,就可以实现,而当前的mpeg 2的操作点在大约3.5 mbit/s [9].该编解码器规范自己概念上区分[1]视频编码层(vcl)和网络抽象层(nal).vcl包含编解码器的信令处理功能;以及如转换,量化,运动补偿预测机制;以及循环过滤器。
他遵从今天大多数视频编解码器的一般概念,基于宏快的编码器,使用基于运动补偿的图像间预测和残余信号的转换编码。
vcl编码器输出片断: 一个位串包含整数数目宏快的宏块数据,以及片断头信息(包含片断内第一个宏快的空间地址,初始量化参数以及相似信息).片断内的宏快按照扫描顺序安排,除非指定一个不同的宏块分配,通过使用被称为灵活宏块顺序语法flexible macroblock ordering syntax.图像内的预测只用于一个片断内部。
更多信息在[9]提供.(nal)编码器封装vcl编码器输出的片断到网络抽象层单元(nal units),它适合于通过包网路传输或用于面向包的多路复用环境。
课程论文题目: 视频编解码方案介绍及研究姓名: 王鹏学号: 20071023日期: 2010-12-21摘要随着网络和多媒体技术的迅猛发展,宽带多媒体应用受到人们的广泛欢迎,P2P技术的引入使得大规模流媒体的部署和应用成为可能。
然而,视频巨大的数据量对网络带宽的占用、网络服务质量、传输实时性等方面提出了更高要求。
此外,现有接入网络的异构性导致的服务能力差异,以及用户随时加入或退出而造成的服务网络拓扑动态变化等问题给P2P流媒体系统的设计带来极大挑战,传统的生成单流的视频压缩技术已不能满足用户需求。
多描述编码与分层编码都生成多个压缩子流,不同的是,分层编码的基本层数据丢失则增强层将毫无用处;而多描述编码生成的各个子描述地位相同,任一子流都能独立解码重建原始视频。
多描述编码不仅能降低系统延时,还能使得视频的传输与现有网络基础架构更匹配。
本文研究了各种多描述编码算法并设计了视频图像空间亚采样加H.264编码的多描述编码方案,将标清格式的视频节目划分为4个码率低于ADSL上行链路带宽的子描述,以适应现有接入网络的异构性关键词:视频编码研究H.264如何在现有网络基础设施条件下,设计合理可行的多描述视频编解码方案是本文的主要工作之一,设计时主要考虑两个问题:(1) 编码端应将视频编成几个描述;(2) 如何划分子描述,即具体的多描述编码算法。
一.多描述视频编解码方案设计1.1 子描述数目的确定一般来说,子描述个数越多,解码端解码的可能性越大,然而系统的复杂度也随之变高,且由于冗余的存在,编码效率越低。
现有的城域网中,70%的用户使用ADSL接入。
由于ADSL网络上下行链路带宽不对称,下行链路带宽是上下链路带宽的4倍。
为最大程度地利用ADSL的网络带宽进行数据分发,同时兼顾系统的复杂度及编码效率,设定本文多描述编解码方案的描述个数为4。
这样,通过一定的多描述编码算法,使得每个子描述的码流低于ADSL的上行链路带宽,以确保每个ADSL用户至少能够为其他用户提供一个子描述,其他高带宽用户也能根据需要提供1个或多个子描述。
此外,由于所有子描述的码流之和低于ADSL的下行链路带宽,则ADSL接收端有能力接收到所有的描述进行解码合并,达到最佳视频重建质量。
1.2 多描述编码算法目前,国内外学者已经提出了众多多描述编码算法(详见2.4节)。
这些算法中提供2个描述的编码方案居多,较难扩展到多于2个描述的情况。
部分算法提出多个描述划分的方案[32],但实现复杂度高,难以应用于实时系统中。
此外,在P2P VOD的实时应用系统中,多描述解码的速度也是必须考虑的因素之一。
从算法可行性、实现复杂度、解码速度等实际因素考虑,本文选用最简单直接的基于空间亚采样的多描述编码方案,其基本思想如下:对原始视频序列中的每一帧进行象素级的空间1/4亚抽样,生成4个低分辨率的视频子流,对每个视频子流进行独立的压缩编码,生成最终的4个多描述子流。
采用不同的信道对4个多描述子流进行传输。
客户端对接收到的n(n<=4)个子描述分别进行相应的压缩解码,生成n个低分辨率的视频子流,对其中的每一帧按照空间亚采样的顺序进行合并,得到重建视频。
由于传输中的包丢失不可避免,在合并第m帧的数据时,若有子描述丢失,则使用相应的插值算法获得质量可接受的重建帧。
在本文系统中,采用YUV 4:2:0格式、标清大小(720×576)的视频序列。
对原始视频序列进行空间1/4下采样之后,每个子序列的码率仍然较大:360×288×8×1.5×25=29.7Mbps 。
此外,进行空间亚采样后,相邻象素间的相关性降低,运动补偿的效率也大大降低。
为了保证每个子描述的码率低于512kbps ,本文采用当前同等图像质量下压缩码率最高的H.264编码方案。
图4-3给出本文的多描述编解码模型:图4-1 基于空间亚采样的多描述编解码模型由于YUV 图像存储格式,H.264编码标准与本文算法的实现密切相关,在随后的章节中对YUV 图像格式及H.264编码标准进行简要介绍。
二.YUV 图像格式简介YUV 格式(亦称YCrCb )是被欧洲电视系统所采用的一种颜色编码方法,主要用于优化彩色视频信号的传输,使其向后兼容老式黑白电视。
其中,Y 表示明亮度,即灰度值;而U 和V 表示的则是色度,作用是描述影像色彩及饱和度,用于指定象素的颜色。
YUV 的优点之一是,色度频道的采样率可比Y 频道低,同时不会明显降低视觉质量。
2.1 YUV 主要采样格式YUV 主要有四种采样格式,如图4-2所示(色度分量用圈表示,亮度分量用叉表示):图4-2 YUV 主要采样格式1) YUV 4:4:4YUV 三个频道的采样率相同,因此在生成的图像里,每个象素的三个分量信息完整(每个分量通常8比特)。
2) YUV 4:2:2每个色差频道的采样率是亮度信道的一半,所以水平方向的色度抽样率只是4:4:4的一半,即2:1的水平下采样,没有垂直下采样。
对于每两个U样例或V样例,每个扫描行都包含四个Y样例。
3) YUV 4:1:14:1:1的色度抽样,是在水平方向上对色度进行4:1抽样,没有垂直下采样。
对于每个U样例或V样例,每个扫描行都包含四个Y样例。
对于低端用户和消费类产品这仍然是可以接受的。
4) YUV 4:2:04:2:0并不意味着只有Y,Cb分量而没有Cr分量,它指得是对每行扫描线来说,只有一种色度分量以2:1的抽样率存储。
相邻的扫描行存储不同的色度分量,也就是说,如果一行是4:2:0的话,下一行就是4:0:2,再下一行是4:2:0...以此类推。
对每个色度分量来说,水平方向和竖直方向都是2:1下采样,所以可以说色度的抽样率是4:1。
2.2 YUV存储格式YUV存储格式[34]主要分为打包(packed)YUV和平面(planar)YUV两种:打包YUV格式中,亮度分量Y、两个色度分量U和V是紧挨着存放在一个单独的矩阵中的;而平面YUV格式把Y、U、V三个分量分别存放在不同的矩阵中,每一个矩阵看作是一个平面,最终看到的图像是将三个平面融合在一起得到的。
对于YUV4:4:4格式而言,采用打包格式是很合适的,但YUV另外几种格式都是通过亚采样来获得的,其亮度分量与色度分量的分辨率不相同,大都采用平面格式存放。
下面以4×4大小的图像为例,分别给出YUV4:4:4打包矩阵以及两种YUV4:2:0格式I420及YV12的平面矩阵。
图4-3 4×4大小4:4:4打包YUV矩阵图4-4 两种YUV4:2:0格式的平面矩阵可见,在I420平面格式的YUV矩阵中,所有的Y样本以unsigned char的数组形式出现在内存的最开始,接下来就是所有的U(Cb)样本,步幅是Y的一半,而且有一半Y的行数;接下来是所有V(Cr)样本,和V有同样的步幅行数。
YV12跟I420的差别仅在于U和V的存储次序不同。
三.H.264标准简介H.264/MPEG-4 AVC[35]是1995年自MPEG-2视频压缩标准发布以后的最新、最有前途的视频压缩标准,由ITU-T和ISO/IEC的联合开发组共同开发。
通过该标准,在同等图象质量下的压缩效率比以前的标准提高了2倍以上,因此,H.264被普遍认为是最有影响力的行业标准。
3.1 H.264的特征H.264和以前的标准一样,也是DPCM加变换编码的混合编码模式,但它采用“回归基本”的简洁设计,不用众多的选项,就可以获得比H.263++好的多的压缩性能。
加强了对各种信道的适应能力,采用“网络友好”的结构和语法,有利于对误码和丢包的处理,应用范围较宽,以满足不同速率、不同解析度以及不同(存储)场合的需求。
它既保留了以往压缩技术的优点和精华又具有其他压缩技术无法比拟的许多优点。
1) 低码流(Low Bit Rate):和MPEG2和MPEG4 ASP等压缩技术相比,在同等图像质量下,采用H.264技术压缩后的数据量只有MPEG2的1/8,MPEG4的1/3;2) 高质量的图象:H.264能提供连续、流畅的高质量图象;3) 容错能力强:H.264提供了在不稳定网络环境下解决容易发生的丢包等错误的必要工具;4) 网络适应性强:H.264提供了网络适应层(NAL: Network Adaptation Layer),使得H.264的文件能容易地在不同网络上传输(例如互联网,CDMA,GPRS,WCDMA,CDMA2000等)。
3.2 H.264的档次H.264着重于解决压缩的高效率和传输的可靠性,其应用面十分广泛。
具体说来,H.264规定了三种档次,并支持一类特定的应用。
1)基本档次( baseline profile):利用I片和P片支持帧内和帧间编码,支持利用基于上下文的自适应的变长编码进行的熵编码(CAVLC)。
主要用于可是电话、会议电视、无线通信等实时视频通信。
2)主要档次( main profile):支持隔行视频,采用B片的帧间编码和采用加权预测的帧内编码;支持利用上下文的自适应的算术编码(CABAC)。
主要用于数字广播电视与数字视频存储。
3)扩展档次( extend profile):支持码流之间有效的切换(SP和SI片)、改进误码性能(数据分割),但不支持隔行视频和CABAC,主要应用于流媒体。
各个档次具有不同的功能,扩展档次包括了基本档次的所有功能,而不能包括主要档次的全部功能。
每一档次设置不同的参数(如取样速率、图像尺寸、编码比特率等),得到对应的编解码器性能的不同级。
3.3 H.264的编码数据格式H.264支持4:2:0的连续或隔行视频的编码和解码,算法在概念上可以分为两层:视频编码层(VCL: Video Coding Layer)和网络提取层(NAL: Network Abstraction Layer)。
VCL负责高效的视频内容表示,包括核心压缩引擎和块、宏块及片的语法级别的定义,它的设计目标是尽可能地独立于网络的情况下进行高效的编解码;而NAL则负责将VCL产生的比特字符串适配到各种各样的网络和多元环境中,它覆盖了所有的片级别以上的语法级别,同时支持以下功能:独立片解码、起始码惟一保证、SEI以及流格式编码数据传送。
H.264的编码视频序列包括一系列的NAL单元,每个NAL单元包含一个原始字节序列负荷(RBSP)及一组对应于视频编码数据的NAL头信息。
NAL单元序列的结构如图4-5所示,其中,NAL单元的头信息定义了RBSP单元的类型,其余部分则为RBSP数据。
图4-5 NAL单元序列结构H.264标准并未定义NAL单元的传输方式,实际中根据不同的传输环境选择不同的传输方式。