H264码流结构的分析

格式：pdf
大小：255.92 KB
文档页数：4

下载文档原格式

[AVS-M与H.264(Baseline)视频解码器结构的分析]H.M.E视频

H.264是JVT组织起草的一个覆盖多种应用和面向多种传输环境的国际标准，它规定了三种档次，基本档次(Baseline profile)、主要档次(Mainprofile)和扩展档次(Extended profile)，其中基本档次利用I片和P片支持帧内和帧间编码。

支持利用基于上下文的自适应的变长编码进行的熵编码(CAVLC)，主要用于会议电视、可视电话和无线通信等实时视频通信。

AVS(Audio video coding)标准是由我国自主制定，拥有自主知识产权的音视频编解码技术标准。

AVS―M(Mobile video)是AVS系列标准中的第七部分――移动视频，应用于数字存储媒体、宽带视频业务、远程监控和可视电话等。

AVS-M和H.264(Baseline)视频解码器在结构上十分相似，但又各有其核心思想。

本文基于JMl0.2和WM3源代码对两解码器的关键技术作了详细分析。

程序中并未单独有H.264(Baseline)的代码，是笔者从JMl0.2中抽取出来分析的，下文中H.264均表示从基本档次上考虑。

两种标准的解码器结构AVS-M和H.254视频解码器都只需考虑I帧和P帧(为了两标准视频解码器更好地比较，本文对H.264只考虑帧图像，不考虑场图像)的解码。

总体思想是从比特流中解出头信息，产生预测块，熵解码得到的量化系数经反量化、反变换得到残差块。

预测块和残差块相加后，经过滤波器即可得到重建的图像，其结构框图如图1所示。

在实际应用当中，这两种标准设计出来的解码器应用领域有所不同，现就以下几个方面分析两种标准的差异。

1 比特流信息①NALU(Network AbstractLayer UnitX两标准中的比特流都是以NAL为单位，每个NAL 单元包含一个RBSP，NALU的头信息定义了RBSP所属类型。

类型一般包括序列参数集(SPS)、图像参数集(PPS)、增强信息(SEI)、条带(Slice)等，其中，SPS和PPS属于参数集，两标准采用参数集机制是为了将一些重要的序列、图像参数(解码图像尺寸、片组数、参考帧数、量化和滤波参数标记等)与其他参数分离，通过解码器先解码出来。

H264码流结构分析和rtp打包结构详解

H264码流结构分析和rtp打包结构详解分类：linux应⽤程序之---流媒体（18）⽹络抽象层单元类型 (NALU):NALU头由⼀个字节组成,它的语法如下:+---------------+|0|1|2|3|4|5|6|7|+-+-+-+-+-+-+-+-+|F|NRI| Type |+---------------+F: 1个⽐特.forbidden_zero_bit. 在 H.264 规范中规定了这⼀位必须为 0.NRI: 2个⽐特.nal_ref_idc. 取00~11,似乎指⽰这个NALU的重要性,如00的NALU解码器可以丢弃它⽽不影响图像的回放.Type: 5个⽐特.nal_unit_type. 这个NALU单元的类型.简述如下:0 没有定义1-23 NAL单元单个 NAL 单元包24 STAP-A 单⼀时间的组合包25 STAP-B 单⼀时间的组合包26 MTAP16 多个时间的组合包27 MTAP24 多个时间的组合包28 FU-A 分⽚的单元29 FU-B 分⽚的单元30-31 没有定义h264仅⽤1-23,24以后的⽤在RTP H264负载类型头中RTP 头的结构:0 1 2 30 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+|V=2|P|X| CC |M| PT | sequence number |+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+| timestamp |+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+| synchronization source (SSRC) identifier |+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+| contributing source (CSRC) identifiers || .... |+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+负载类型 Payload type(PT): 7bitsrfc⾥⾯对⼀些早期的格式定义了这个payload type。

数字电视H.264编码技术分析及应用展望

数字电视H.264编码技术分析及应用展望典型的数字电视系统是在发送端的数字电视节目源(主要由视频、音频等数据组成)先经过信源编码处理．得到压缩编码后的视频、音频码流，随后进行信源编码，需要辅助数据与控制数据的支持。

信道编码实现检错、纠错功能，以提高数字电视传输信号的抗干扰能力，以便之适应信道传输特性，再进行载波调制以实现频谱搬移最后送入传输信道。

目前数字视频领域，有两大制定视频编码标准的组织，它们是ITU-T与ISO／IEC。

ITU-T制定的标准包括H．261、H．263、H．264，主要应用于实时视频通信领域，如会议电视。

MPEG系列标准是由ISO／IEC制定的，主要应用于视频存储(VCD、DVD)、广播电视、因特网或无线网上的流媒体等。

H．264具有较强的抗误码特性，可适应丢包率高、干扰严重的无线信道中的视频传输。

1 编码技术分析1．1 帧内预测编码帧内编码用来缩减图像的空间冗余。

为了提高H．264帧内编码的效率，在给定帧中充分利用相邻宏块的空间相关性，相邻的宏块通常含有相似的属性。

因此，在对一给定宏块编码时，首先可以根据周围的宏块预测(典型的是根据左上角的宏块，因为此宏块已经被编码处理)，然后对预测值与实际值的差值进行编码，这样，相对于直接对该帧编码而言，可以大大减小码率。

如图1。

1．2 帧间预测编码帧间预测编码利用连续帧中的时间冗余来进行运动估计和补偿。

H．264的运动补偿支持以往的视频编码标准中的大部分关键特性。

(1)不同大小和形状的宏块分割对每一个16×16像素宏块的运动补偿可以采用不同的大小和形状。

(2)高精度的亚像素运动补偿在H．263中采用的是半像素精度的运动估计，而在H．264中可以采用1／4或者1／8像素精度的运动估值。

在要求相同精度的情况下，H．264使用1／4或者1／8像素精度的运动估计后的残差要比H．263采用半像素精度运动估计后的残差来得小。

这样在相同精度下，H．264在帧间编码中所需的码率更小。

【知识点】H264,H265硬件编解码基础及码流分析

【知识点】H264,H265硬件编解码基础及码流分析前⾔⾳视频开发需要你懂得⾳视频中⼀些基本概念,针对编解码⽽⾔,我们必须提前懂得编解码器的⼀些特性,码流的结构,码流中⼀些重要信息如sps,pps,vps,start code以及基本的⼯作原理,⽽⼤多同学都只是⼀知半解,所以导致代码中的部分内容虽可以简单理解却不知其意,所以,在这⾥总结出了当前主流的H.264,H.265编码相关的原理,以供学习.1. 概览1.1. 为什么要编码众所周知,视频数据原始体积是巨⼤的,以720P 30fps的视频为例,⼀个像素⼤约3个字节,如下所得,每秒钟产⽣87MB,这样计算可得⼀分钟就将产⽣5.22GB。

数据量/每秒=1280*720*33*3/1024/1024=87MB因此,像这样体积重⼤的视频是⽆法在⽹络中直接传输的.⽽视频编码技术也就因运⽽⽣.关于视频编码原理的技术可以参考本⼈其他⽂章,这⾥不做过多描述.1.2. 编码技术经过很多年的开发迭代,已经有很多⼤⽜实现了视频编码技术,其中最主流的有H.264编码,以及新⼀代的H.265编码,⾕歌也开发了VP8,VP9编码技术.对移动端⽽⾔,苹果内部已经实现了如H.264,H.265编码,我们需要使⽤苹果提供的VideoToolbox框架来实现它.1.3. 编码分类软件编码(简称软编)：使⽤CPU进⾏编码。

硬件编码(简称硬编)：不使⽤CPU进⾏编码，使⽤显卡GPU,专⽤的DSP、FPGA、ASIC芯⽚等硬件进⾏编码。

优缺点软编：实现直接、简单，参数调整⽅便，升级易，但CPU负载重，性能较硬编码低，低码率下质量通常⽐硬编码要好⼀点。

硬编：性能⾼，低码率下通常质量低于硬编码器，但部分产品在GPU硬件平台移植了优秀的软编码算法（如X264）的，质量基本等同于软编码。

iOS系统中的硬编码苹果在iOS 8.0系统之前，没有开放系统的硬件编码解码功能，不过Mac OS系统⼀直有，被称为Video ToolBox的框架来处理硬件的编码和解码，终于在iOS 8.0后，苹果将该框架引⼊iOS系统。

H.264讲解

帧内预测
图4
帧内预测 16×16亮度预测模式
– 宏块的全部16×16亮度成分可以整体预测，有4种预测模式，如表2和图5所示。
图5 16×16预测模式
帧内预测
表2 16×16预测模式
描模式
述
模式0（垂直）模式1（水平）模式2（DC）模式3（平面）
由上边像素推出相应像素值
由左边像素推出相应像素值
H.264/AVC编解码器 H.264解码器
– 由图 1 可知，由编码器的 NAL 输出一个压缩后的 H.264压缩比特流。由图2，经熵解码得到量化后的一组变换系数 X，再经反量化、反变换，得到残差 Dn’。利用从该比特流中解码出的头信息，解码器就产生一个预测块PRED，它和编码器中的原始PRED 是相同的。当该解码器产生的PRED与残差Dn’相加后，就产生 uFu’ ，再经滤波后，最后就得到滤波后的Fn’，这个Fn’就是最后的解码输出图像。
这样表示9中预测模式只需要8个值 (0 to 7)
帧内预测
帧间预测
树状结构运动补偿
– 每个宏块（16×16像素）可以4种方式分割：一个 16×16，两个16×8，两个8×16，四个8×8。其运动补偿也相应有四种。而8×8分割还可以有四种方式的分割：一个8×8，两个4×8或两个8×4及4个 4×4。这种分割下的运动补偿则称为树状结构运动补偿。
当A (或者 B）的预测模式不可用时，
prediction mode of A＝ 2.
例如 A 和 B块的预测模式分别为 3 和1
most probable mode for block C =1
帧内预测
编码器为每个4x4 块发送一个标记 flag,解码器按照如下方式解码 If flag==1, prediction mode=most_probable_mode If flag==0 If rem_intra4×4_pred_mode< most_probable_mode prediction mode=rem_intra4×4_pred_mode else prediction mode=rem_intra4×4_pred_mode+1

H264编码原理以及I帧、B和P帧详解，H264码流结构分析

H264编码原理以及I帧、B和P帧详解，H264码流结构分析H264码流结构分析/chenchong_219/article/details/379905411、码流总体结构：h264的功能分为两层，视频编码层（VCL）和⽹络提取层（NAL）。

H.264 的编码视频序列包括⼀系列的NAL 单元，每个NAL 单元包含⼀个RBSP。

⼀个原始的H.264 NALU 单元常由 [StartCode] [NALU Header] [NALU Payload] 三部分组成，其中 Start Code ⽤于标⽰这是⼀个NALU 单元的开始，必须是"00 00 00 01" 或"0000 01"。

其中RBPS有分为⼏种类型：NAL的解码单元的流程如下：2、 NAL Header：占⼀个字节，由三部分组成forbidden_bit(1bit)，nal_reference_bit(2bits)（优先级），nal_unit_type(5bits)（类型）。

forbidden_bit:禁⽌位。

nal_reference_bit：当前NAL的优先级，值越⼤，该NAL越重要。

nal_unit_type ：NAL类型。

参见下表⼏个例⼦：3、 ffmpeg解析H264流程分析这是⼀段实际的码流在上⾯的图⽚中,共有三个起始码:0x00 0000 01const uint8_t*ff_h264_decode_nal(H264Context*h, const uint8_t *src,int *dst_length, int*consumed, int length)中分析过程为：h->nal_ref_idc= src[0] >> 5;h->nal_unit_type= src[0] & 0x1F;此处src[0]即为06，写成⼆进制位0000 0110，则h->nal_ref_idc = 0，h->nal_unit_type = 6可以判断这个NALU类型为SEI，重要性优先级为0。

H.264码流结构解析

H.264码流结构解析1.H.264简介MPEG（Moving Picture Experts Group）和VCEG（Video Coding Experts Group）已经联合开发了一个比早期研发的MPEG 和H.263性能更好的视频压缩编码标准，这就是被命名为A VC（Advanced Video Coding），也被称为ITU-T H.264建议和MPEG-4的第10 部分的标准，简称为H.264/A VC或H.264。

这个国际标准已经与2003年3月正式被ITU-T所通过并在国际上正式颁布。

为适应高清视频压缩的需求，2004年又增加了FRExt部分；为适应不同码率及质量的需求，2006年又增加了可伸缩编码SVC。

2.H.264编码格式H.263定义的码流结构是分级结构，共四层。

自上而下分别为：图像层(picturelayer)、块组层(GOB layer)、宏块层(macroblock layer)和块层(block layer)。

而与H.263相比，H.264的码流结构和H.263的有很大的区别，它采用的不再是严格的分级结构。

H.264支持4:2:0的连续或隔行视频的编码和解码。

H.264压缩与H.263、MPEG-4相比，视频压缩比提高了一倍。

H.264的功能分为两层：视频编码层（VCL, Video Coding Layer）和网络提取层（NAL, Network Abstraction Layer）。

VCL数据即编码处理的输出，它表示被压缩编码后的视频数据序列。

在VCL数据传输或存储之前，这些编码的VCL数据，先被映射或封装进NAL单元中。

每个NAL单元包括一个原始字节序列负荷（RBSP, Raw Byte Sequence Payload）、一组对应于视频编码的NAL头信息。

RBSP的基本结构是：在原始编码数据的后若干比特0”，以便字节对齐。

面填加了结尾比特。

一个bit“1”“图1 NAL单元序列3.H.264传输H.264的编码视频序列包括一系列的NAL单元，每个NAL单元包含一个RBSP，见表1。

一种高效可编程H_264_AVC比特流解析结构设计

VIDEO ENGINEERINGNo．S2Vol.332009（Sum No．332）1引言在过去的MPEG-2或其他视频编码系统的设计中，通常采用专用的头解码器作为前端解码，这是由于比特流结构的变化很小[1-2]。

由于诸如MPEG-4和H.264/AVC 等先进压缩编码标准的应用，有了越来越多的编码工具和高压缩性能。

比特率的格式随着不同的标准而变化，越来越复杂和灵活的比特率结构被提了出来。

这些都激发了对多标准的通用解析器设计的研究。

另一方面，能灵活适应新标准的可编程处理器的使用也大大缩短了设备的面市时间。

比特流解析是依据压缩标准的数据流格式从比特流中抽取头信息和编码数据。

比特流解析可以作为解码系统的预处理单元。

通常在编程器上采用并行结构以提高视频处理效率，但这样对比特流的解析未必高效，这是因为大多数采用熵编码的编码工作都是可变长度的。

这便是从比特流寄存器中获得不确定比特数的位级序列处理法。

在当前或前一个码字或当前比特流指针位置确定之前，下一步要抽取的码字是事先并不知道的。

所以，对于串行的比特流解析和VLD 任务来说，采用常用的16位或32位DSP 效率并不高。

在文献[3]提出的多功能VLD 芯片能够解析H.261和JPEG 比特流。

一个基于RISC 核的比特流解析和VLD 结构[4]提高了常规RISC 对比特流的处理能力。

文献[1]提出一种基于硬件结构的用于MPEG-4视频的解析。

在H.264中增加了许多新的特性，如扩展的Golomb 编码、背景适应的VLC 和背景适应的算术熵编码等。

笔者提出了针对H.264/AVC 比特流解析基于硬件的可编程结构，可解析符合H.264/AVC 标准的ES 比特流以及熵解码，也能够扩展到其他一些视频标准比特流解析应用中。

2H.264/AVC 比特流结构分析比特流结构是将专门的定长和变长码字序列串联起来的编码规则。

根据参考文献[5]，H.264/AVC 将视频编码层（VCL ）打包后进一步生成网络抽象层（NAL ）单元。

H264基础简介

H264基础简介前⾔H264是属于视频的编码层的标准格式，视频编码显然是为了压缩⼤⼩。

我们看下⼀个完全没压缩的视频数据⼤⼩。

假设视频是⾼清（1280 * 720），每秒30帧，也就是每秒的数据1280 * 720 *30 / 8(字节) /1024（KB）/1024(MB) = 3.11MB那么90分钟的电影就要16.7GB，这个数据量显然在当前⽹络下是不现实的。

视频压缩的原理就是去除视频冗余部分，下⾯列举下1，时间冗余时间冗余是序列图像(电视图像、动画)和语⾳数据中所经常包含的冗余。

图像序列中的两幅相邻的图像，后⼀幅图像与前⼀幅图像之间有较⼤的相关性，这反映为时间冗余。

同理，在语⾔中，由于⼈在说话时发⾳的⾳频是⼀连续的渐变过程，⽽不是⼀个完全的在时间上独⽴的过程，因⽽存在时间冗余。

2，空间冗余空间冗余是图像数据中经常存在的⼀种冗余。

在同⼀幅图像中，规则物体和规则背景(所谓规则是指表⾯颜⾊分布是有序的⽽不是杂乱⽆章的)的表⾯物理特性具有相关性，这些相关性的光成像结构在数字化图像中就表现为数据冗余。

,3，知识冗余有许多图像的理解与某些基础知识有相当⼤的相关性,例如：⼈脸的图像有固定的结构。

⽐如，嘴的上⽅有⿐⼦。

⿐⼦的上⽅有眼睛，⿐⼦位于正脸图像的中线上等等。

这类规律性的结构可由先验知识相背景知识得到，我们称此类冗余为知识冗余。

4，结构冗余有些图像从⼤域上看存在着⾮常强的纹理结构，例如布纹图像和草席图像，我们说它们在结构上存在冗余。

5，视觉冗余⼈类视觉系统对于图像场的任何变化，并不是都能感知的。

例如，对于图像的编码和解码处理时，由于压缩或量⽐截断引⼊了噪声⽽使图像发⽣了⼀些变化，如果这些变化不能为视觉所感知，则仍认为图像⾜够好。

事实上⼈类视觉系统⼀般的分辨能⼒约为26灰度等级，⽽⼀般图像量化采⽤28灰度等级，这类冗余我们称为视觉冗余。

通常情况下，⼈类视觉系统对亮度变化敏感，⽽对⾊度的变化相对不敏感；在⾼亮度区，⼈眼对亮度变化敏感度下降。

RTP协议全解（H264码流和PS流）

RTP协议全解（H264码流和PS流）写在前面：RTP的解析，网上找了很多资料，但是都不全，所以我力图整理出一个比较全面的解析，其中借鉴了很多文章，我都列在了文章最后，在此表示感谢。

互联网的发展离不开大家的无私奉献，我决定从我做起，希望大家支持。

1、RTP Header解析图11) V：RTP协议的版本号，占2位，当前协议版本号为22) P：填充标志，占1位，如果P=1，则在该报文的尾部填充一个或多个额外的八位组，它们不是有效载荷的一部分。

3) X：扩展标志，占1位，如果X=1，则在RTP报头后跟有一个扩展报头4) CC：CSRC计数器，占4位，指示CSRC 标识符的个数5) M: 标记，占1位，不同的有效载荷有不同的含义，对于视频，标记一帧的结束；对于音频，标记会话的开始。

6) PT: 有效荷载类型，占7位，用于说明RTP报文中有效载荷的类型，如GSM音频、JPEM 图像等,在流媒体中大部分是用来区分音频流和视频流的，这样便于客户端进行解析。

7) 序列号：占16位，用于标识发送者所发送的RTP报文的序列号，每发送一个报文，序列号增1。

这个字段当下层的承载协议用UDP的时候，网络状况不好的时候可以用来检查丢包。

同时出现网络抖动的情况可以用来对数据进行重新排序，序列号的初始值是随机的，同时音频包和视频包的sequence是分别记数的。

8) 时戳(Timestamp)：占32位，必须使用90 kHz 时钟频率。

时戳反映了该RTP报文的第一个八位组的采样时刻。

接收者使用时戳来计算延迟和延迟抖动，并进行同步控制。

9) 同步信源(SSRC)标识符：占32位，用于标识同步信源。

该标识符是随机选择的，参加同一视频会议的两个同步信源不能有相同的SSRC。

10) 特约信源(CSRC)标识符：每个CSRC标识符占32位，可以有0～15个。

每个CSRC标识了包含在该RTP报文有效载荷中的所有特约信源。

注：基本的RTP说明并不定义任何头扩展本身，如果遇到X=1，需要特殊处理取一段码流如下：80 e0 00 1e 00 00 d2 f0 00 00 00 00 41 9b 6b 49 €?....??....A?kIe1 0f 26 53 02 1a ff06 59 97 1d d2 2e 8c 50 01 ?.&S....Y?.?.?P.cc 13 ec 52 77 4e e50e 7b fd 16 11 66 27 7c b4 ?.?RwN?.{?..f'|?f6 e1 29 d5 d6 a4 ef3e 12 d8 fd 6c 97 51 e7 e9 ??)>.??l?Q??cfc7 5e c8 a9 51 f6 82 65 d6 48 5a 86 b0 e0 8c ??^??Q??e?HZ其中，80 是V_P_X_CCe0 是M_PT00 1e 是SequenceNum00 00 d2 f0 是Timestamp00 00 00 00是SSRC把前两字节换成二进制如下1000 0000 1110 0000按顺序解释如下：10 是V；0 是P；0 是X；0000 是CC；1 是M；110 0000 是PT；排版不如word看的清晰，大家凑合着看吧。

H264码流结构中SPS结构分析

H264码流结构中SPS结构分析SPS: sequence parameter sets01. Profile_idc它指的是码流对应的profile.1.1 基线profile(Baseline profile)遵循基线profile的SPS: sequence parameter sets01. Profile_idc它指的是码流对应的profile.1.1 基线profile(Baseline profile)遵循基线profile的码流应该遵循以下的约束:a) 只有I和P切片存在b) NAL单元流不应该有范围在2到4的nal_unit_type值,包括2和4.c) 序列参数集(sps)的frame_mbs_only_fag(之后介绍)应该等于1d) 图象参数值(psp)的weighted_pred_flag和weighted_bipred_idc都应该为0e) 图象参数值(psp)的entropy_coding_mode_flag应该等于0f) 图象参数值(psp)的num_slice_groups_minus1应该在0到7之间,包括0和7**psp部分参数含义在关于psp的文章中给出。

g) 对于基线profile对应的level度应该满足.符合基线profile的码流的profile_idc被赋66.符合一定level的基线Baseline的解码器应该可以解码所有的profile_idc等于66的码流或constrained_set0_flag(等会介绍)为1而且level_idc(在level部分介绍)少于或等于一个指定的level的码流。

1.2 主profile(Main profile)符合主profile的码流应该遵循以下的约束:a) 只有I,P,B切片存在.b) NAL单元流不包括nal_unit_type值范围在2-4之内的值。

包括2和4.c) 不能允许有随意顺序的切片d) 图像参数集(psp)的num_slice_groups_minus1应该只为0e) 图像参数集(psp)的redundant_pic_cnt_present_flag应该只为0f) 对于主profile所要求的level级需要达到。

!!!!!H264码流分析--2...

H264码流分析--2...264分析两大利器：264VISA和Elecard StreamEye Tools 学了264有将近3个月有余，好多时候都在学习老毕的书和反复看JM86的代码，最近才找到264分析两大利器：264VISA和Elecard StreamEye Tools。

不由得感叹，恨不逢同时。

简单的说下这两个软件：264visa强力的h264实时分析工具，能分析各种场合下的h264资源，适用于h264开发者，学习者。

在图像分析上，VISA还是比EYE更加厉害，它包括了滤波前以及预测残差等等数据的输出。

H264Visa下载（点击下载）下面来说下另一款软件：Elecard StreamEye ToolsElecard StreamEye Suite是一套用于专业视频压缩领域的功能强大的工具，能够帮助用户进行有效的对于视频序列的深入分析。

感觉STREAM EYE的界面更加亲民，而且他的视频窗口可缩放，比较好操作，但是功能上面还是不如VISA强大，不过初学的话也是可以接受了。

Elecard StreamEye Suite（点击下载）Elecard StreamEye (StreamEye) toolsElecard StreamEye Suite是一套用于专业视频压缩领域的功能强大的工具，能够帮助用户进行有效的对于视频序列的深入分析。

Elecard StreamEye ：编码视频的可视化表现，流结构分析，这些流是MPEG-1/2/4 or AVC/H.264 VES(视频基本流)、SS（MPEG1的系统流）、,PS(MPEG2的程序流)、TS(mpeg2的传输流)。

YUV viwer：是看YUV视频文件数据序列的，和其他的文件来比较，找到是否二进制的图像是匹配的，并且观看比较结果。

应用程序允许用户计算度量的质量，比如PSNR,NQI和VQM。

Stream Analyzer：用于编码媒体流的语法分析，以及人类可读形式的展示。

H.264码流结构的分析

Ｈ．２６４码流结构的分析作者：高庆王志刚来源：《电脑知识与技术》2008年第36期摘要：H.264是新一代视频编码标准，具有广泛的应用前景。

本文主要研究了H.264码流的问题。

首先，介绍了H.264的简单框架；其次，对码流结构进行了分析，并概括出了码流结构图；最后，结合一个简单试验，给出了从H.264码流中取得图像宽度和高度的方法。

关键词：H.264；NAL；码流结构中图分类号：TP37文献标识码：A 文章编号：1009-3044(2008)36-2751-02Analysis on the structure of coding streaming in H.264GAO Qing, WANG Zhi-gang(School of Computer Science & Technology, Soochow University,Suzhou 215006,China)Abstract: H.264 is the newest video coding standard, and it will be widely used. In this article, the problem of the structure of coding streaming in H.264 is discussed. Firstly, the simple profile of H.264 video is introduced. Secondly, the structure of coding streaming is discussed , and then give the graph on it. Finally, by a simple experiment, give the method of getting picture’s width and height from the coding stream.Key words: H.264;NAL;structure of coding streaming1 引言H.264是新一代视频编码标准，具有广泛的应用前景，是ITU-T的视频编码专家组（VCEG）和 ISO/IEC的活动图像编码专家组（MPEG）的联合视频组开发的一个新的数字视频编码标准，它既是ITU -T的H.264，又是ISO/IEC的MPEG-4的第10部分。

【视频编解码·学习笔记】5.NALUnit结构分析

【视频编解码·学习笔记】5.NALUnit结构分析在上⼀节中通过⼀个⼩程序，可以提取NAL Unit所包含的的字节数据。

H.264码流中的每⼀个NAL Unit的作⽤并不是相同的，⽽是根据不同的类型起不同的作⽤。

下⾯将对NAL Unit中的数据进⾏解析。

⼀、NAL Unit结构⼀个NAL Unit都是由⼀个NAL Header和⼀个NAL Body组成。

对于基本版本的H.264标准（不考虑SVC和MVC扩展），⼀个NAL Header的长度固定为1，即8bit。

这8bit的含义分别为：forbidden_zero_bit：每⼀个NAL Header的第⼀个bit，规定必须为0；nal_ref_idc：第2和3位，主要表⽰NAL的优先级。

当该值为正时，表⽰当前NAL Unit中包含了SPS、PPS和作为参考帧的Slice等重要数据。

nal_unit_type：表⽰NAL Unit的类型，包括VCL层和⾮VCL层的多种数据类型。

常见的nal_unit_type取值有：7表⽰SPS，8表⽰PPS，5表⽰IDR帧，1表⽰⾮IDR帧等。

查询H.264⽂档7.3节，可以看到NAL Unit语法结构：7.4节介绍了每⼀个语法结构的内容和作⽤⼆、NAL Unit的有效负载数据及其封装在NAL Header之后，NAL Unit的其余部分，即NAL Body包含了有效负载数据的封装。

从NAL Body到实际的语法元素的码流共3层封装：第⼀层：EBSP——扩展字节序列载荷EBSP全称为Extended Byte String Payload，等同于NAL Body的数据本⾝。

在EBSP中包含了⼀个特殊的字节0x03，表⽰防⽌竞争校验字节：emulation_prevention_three_byte：设置该值的⽬的是为了防⽌NAL Body内部出现于NAL Unit起始码0x 00 00 01或0x 00 00 00 01冲突。

H.264句法和语法总结

H.264句法和语法总结H.264句法和语法总结 (1)（一）句法元素的分层结构 (2)（二）NAL层句法 (4)（三）序列参数集层（SPS)句法 (6)（四）图像参数集语义 (8)（五）片头句法 (10)（六）参考帧队列重排序（REORDERING）句法 (14)（七）加权预测句法 (15)（八）参考图像序列标记(MARKING)操作的语义 (16)（九）片层数据句法 (17)（十）宏块层句法 (19)（十一）宏块层预测句法 (19)（十二）子宏块预测句法 (20)（十三）残差句法 (20)（十四）CA VLC残差句法 (21)NAL技术 (23)H264基本概念之宏块、片和片组 (26)H.264起始码 (28)MPEG4起始码 (29)（一）句法元素的分层结构/xfding/archive/2010/04/10/5467952.aspx在H.264 定义的码流中，句法元素被组织成有层次的结构，分别描述各个层次的信息，如下图所示在H.264 中，句法元素共被组织成序列、图像、片、宏块、子宏块五个层次。

在这样的结构中，每一层的头部和它的数据部分形成管理与被管理的强依赖关系，头部的句法元素是该层数据的核心，而一旦头部丢失，数据部分的信息几乎不可能再被正确解码出来，尤其在序列层及图像层。

在 H.264 中，分层结构最大的不同是取消了序列层和图像层，并将原本属于序列和图像头部的大部分句法元素游离出来形成序列和图像两级参数集，其余的部分则放入片层。

参数集是一个独立的数据单位，不依赖于参数集外的其他句法元素。

由于参数集是独立的，可以被多次重发或者采用特殊技术加以保护。

复杂通信中的码流中可能出现的数据单位：IDR: 一个序列的第一个图像叫做 IDR 图像（立即刷新图像），IDR 图像都是 I图像。

H.264 引入 IDR 图像是为了解码的重同步，当解码器解码到 IDR 图像时，立即将参考帧队列清空，将已解码的数据全部输出或抛弃，重新查找参数集，开始一个新的序列。

H264码流解析及NALU

H264码流解析及NALU639 /* bitstream filters */640 REGISTER_BSF(AAC_ADTSTOASC, aac_adtstoasc);641 REGISTER_BSF(CHOMP, chomp);642 REGISTER_BSF(DUMP_EXTRADATA, dump_extradata);643 REGISTER_BSF(H264_MP4TOANNEXB, h264_mp4toannexb);644 REGISTER_BSF(HEVC_MP4TOANNEXB, hevc_mp4toannexb);645 REGISTER_BSF(IMX_DUMP_HEADER, imx_dump_header);646 REGISTER_BSF(MJPEG2JPEG, mjpeg2jpeg);647 REGISTER_BSF(MJPEGA_DUMP_HEADER, mjpega_dump_header);648 REGISTER_BSF(MP3_HEADER_DECOMPRESS, mp3_header_decompress);649 REGISTER_BSF(MPEG4_UNPACK_BFRAMES, mpeg4_unpack_bframes);650 REGISTER_BSF(MOV2TEXTSUB, mov2textsub);651 REGISTER_BSF(NOISE, noise);652 REGISTER_BSF(REMOVE_EXTRADATA, remove_extradata);653 REGISTER_BSF(TEXT2MOVSUB, text2movsub);H264码流的NAL起始字节分析这是⼀段H264码流，00 00 00 01这是对应forbidden_zero_bit的f(1)，接着后⾯的nal_ref_idc的u(2)，这个怎么解呀，有点晕。

H.264NALU语法结构

H.264NALU语法结构补充笔记：关于VCL：VCL层是指视频编码层，VCL NAL 单元是指那些nal_unit_type 值等于 1 到 5(包括 1 和 5)的 NAL 单元，这些单元都包含了视频数据。

所有其他的 NAL 单元都称作非 VCL NAL 单元，PPS 和SPS都是非VCLNAL单元。

关于字节流NAL单元的格式：（起始码中0的长度）除了流开头的字节流NAL单元，大多字节流NAL单元的开头没有leading_zero_8bits （一个字节的0）;nal_unit_type等于7（SPS）或8（PPS）时，或字节流NAL单元语法结构在解码顺序时包含一个访问单元的第一个NAL单元，码流中会出现 zero_byte （一个字节的0）；所有字节流NAL的单元的开头，都会存在start_code_prefix_one_3bytes （三个000001字节）。

所以，如果不考虑流的开头，没有特殊性的字节流NAL单元，都是只有3字节的起始码（即起始码中0的个数为2）。

一个访问单元的第一个NAL单元是指：在基本编码图像的最后一个 VCL NAL 单元之后的第一个任何下列NAL 单元代表了一个新的访问单元的开始：—访问单元分隔 NAL 单元(存在时)—序列参数集 NAL 单元(存在时)—图像参数集 NAL 单元(存在时)— SEI NAL 单元(存在时)— nal_unit_type 值在 14-18 之间(包括)的 NAL 单元—基本编码图像的第一个 VCL NAL 单元(总是存在)下文转自：/yangzhongxuan/article/details/8003494名词解释场和帧：视频的一场或一帧可用来产生一个编码图像。

在电视中，为减少大面积闪烁现象，把一帧分成两个隔行的场。

片：每个图象中，若干宏块被排列成片的形式。

片分为I 片、B片、P片和其他一些片。

I片只包含I宏块，P片可包含P和I宏块，而B片可包含B和I宏块。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

H.264码流结构的分析作者：高庆，王志刚， GAO Qing， WANG Zhi-gang作者单位：苏州大学,计算机科学与技术学院,苏州,215006刊名：电脑知识与技术英文刊名：COMPUTER KNOWLEDGE AND TECHNOLOGY年，卷(期)：2008，4(36)被引用次数：0次1.ITU-TRec H.264/ISOfiEC 14496-10:2005.H.264 Advanced video coding for generic audiovisual services2.严晓飞H.264码流结构的分析及其实现的优化 20073.RICHARDSONI.H2 6 4 andMPEG-4Videocompression 20031.会议论文Ding Jia.Han Chunguang A NEW ARCHITECTURE FOR NAL PARSING AND ENTROPY DECODING CO-DESIGN IN H.264/AVC2007This paper propose a novel efficient implementation of NAL parsing and Entropy decoding co-design based on SoC platform.Entropy coding in H.264/AVC is optimized for compression efficiency while bringing great complexity to implementation,the process of which is interweaved with NAL paring.It propose a novel architecture for the co-design of NAL parsing and Entropy decoding,by software and hardware cooperation.NAL Scan is designed in combination with DEMUX,by hardware,and NAL Parsing is implemented by software on an embedded RISC CPU,with CAVLC and CABAC decoder as the hardware accelerators.For typical HD 1080i format video,experimental result shows that the software part consumes only 2 MIPS.With the clock constraint of 200MHz,the cost for CABAC Decoder is about 26100 gates under a 0.18um CMOS technology,and CAVLC 5100 gates.That design is proved to achieve the real-time processing requirement.2.学位论文戴春泉H.264变字长解码器的硬件设计与实现2004H.264是一个全新的视频编码标准,它具有压缩效率高,适合网络传输等特点,应用前景非常广阔.世界上有很多公司和研究机构都投入了对这个新标准的开发和研究.由于H.264的解码复杂度很高,软件实现难以满足实时性的要求,所以需要采用硬件解码.该文设计了适用于H.264的硬件变字长解码部件.该设计将变字长解码分成两个模块处理,解NAL(Network Adaptation Layer)单元模块和变字长解码模块,之间用FIFO缓冲数据.在解NAL单元模块使用4个比较单元并行工作,并行解码NAL单元数据,提高了效率.变字长解码模块的核心是基于桶形移位器的并行解码结构,使用该结构的解码速度比一次一位的串行结构更快.针对UVIC(Universal Veriable Length Code)编码结构很固定的特点,设计了"第一个1"探测器电路,能够方便解码UVLC编码.设计实现了CAVLC(Context Adaptive Veriable Length Code)的解码,由于CAVLC解码得到的残差系数的顺序是先高频系数后低频系数,所以需要用栈保存所有的残差系数.我们使用了ping-pong结构的双缓冲区提高了解码速度,这比不使用ping-pong结构的缓冲解码速度平均提高了22.9﹪.对帧内预测模式使用并行加流水的结构,提高了解码速度.在设计方法上采用自顶向下的设计方法,设计了c语言模型验证解码算法并为仿真提供测试向量.在设计的每一步都进行仿真,以保证设计的正确性.最后作了FPGA验证以及ASIC综合,在FPGA上能够实时解码标准清晰度视频,用0.18μm CMOS工艺实现可以实时解码高清晰度视频. 3.期刊论文魏聪颖.牛建伟.吉海星.胡建平.WEI Cong-Ying.NIU Jian-Wei.JI Hai-Xing.HU Jian-Ping基于实时流媒体传输系统的H.264组包算法研究-计算机科学2007,34(8)有线和无线网络上的实时流媒体传输技术已成为研究热点而其中组包策略的选取是其中的一个关键问题.本文首先设计了一种基于RTP的H.264实时流媒体传输系统模型,在此基础上提出了适用于H.264实时视频流传输的RTP组包算法HMP.该算法针对H.264 NAL视频流特点,在考虑到视频流关联性的同时加入了对重要信息的保护.实验结果证明,HMP算法在网络丢包率较大的情况下仍能获得良好视觉质量.4.学位论文查日勇H.264/AVC视频编码标准的研究及其在JM中的实现2004该论文主要讨论了当前最新标准H.264,也被称为MPEG-4第10部分的相关技术及其在JM软件中实现.首先该文对整个标准的制定背景,应用范围和它的自身特点作了简要的介绍.然后对其中某些关键技术如分层技术,预测技术,块变换与量化技术,以及熵编码技术和它们在JM中如何实现作了比较详细地论述.最后在各章中我们还对它们的性能进行了分析.5.期刊论文任竞H.264/AVC视频编码标准的研究-微型电脑应用2004,20(5)H.264/MPEG-4 AVC是ITU-T的VCG(Video Coding Experts Group)和ISO/IEC的MPEG(MovingPicture Experts Group)最近联合开发的新一代数字视频编码标准.它的应用范围包括可视电话、视频会议、TV、DVD以及硬盘存储、流媒体、数字摄影、数字视频制作等等.和现有的视频编码标准,如MPEG-1、MPEG-2、MPEG-4 ASP相比,H.264/MPEG-4 AVC可以提供至少一倍以上的更加出色的压缩效率.H.264/MPEG-4 AVC的核心技术与之前的标准相同,仍采用基于预测变换的混合编码架构,基本处理没有过大的改变(预测,变换,量化,熵编码),但其通过对每个细节特别处理从而到整体效率的提升,另外NAL概念的标准化使其利于适应各种网络条件下的传输.日前JVT(Joint VideoTeam)已经为标准正式审批提交了最后的草案(2003年三月),关于2003年5月获得批准.6.学位论文杜常青基于H.264/AVC视频通信的差错恢复技术研究2005H.264/AVC标准是由运动图像专家组MPEG和ITU下属的视频编码专家组VCEG联合制定的新一代低比特率视频压缩编码标准。

提供更高的压缩比以及改进对网络环境的鲁棒性是标准设计的重点。

H.264/AVC采用分层结构，包括视频编码层(VLC)和网络适应层(NAL)。

VLC完成传统信号处理任务并产生包括编码宏块的比特流，NAL则调整VCL产生的比特流来适应网络的传输。

与以往的标准相比，它采用了更多的先进技术，使得在同样的码率下运用H.264标准编码可以获得更好的主客观质量。

随着视频通信和计算机技术的发展，基于不可靠网络的视频图像的通信受到越来越广泛的应用。

差错恢复技术是在不可靠网络上实时视频传输的保证。

在H.264中，除了能够获得很高的编码效率外，还引入了一系列改进差错恢复的工具。

特别是网络适应层(NAL)中参数集和NALUs的概念，以及视频编码层(VCL)的FMO和数据分割，在尽力而为IP网络环境下视频通信时性能明显提高。

本文以H.264及JM系列软件为主要依据，详细研究了H.264/AVC采用的差错恢复工具，着重探讨了差错恢复技术在基于分组的网络(IP网)视频通信中的应用。

本文使用RTP作为实时传输协议，探讨了H.264/AVC编码视频在尽力而为的网络中的应用。

7.期刊论文马海燕.MA Hai-yan H.264的网络传输适应性解决方案-北京广播学院学报（自然科学版）2005,12(1) 文章对最新的视频编码标准H.264在网络友好性和容错性方面的解决方案作了全面的剖析.首先简要地回顾了它从先前标准中继承的技术,如数据分割等,随后重点介绍了H.264特有的几个创新技术以及它们在抗误码方面的不俗表现.8.学位论文崔晓艳一种适用于H.264标准的新型熵解码器设计2007H.264标准是由国际电信标准化部门ITU-T和制定MPEG的国际标准化组织ISO/国际电工协会IEC共同制订的一种视频编码国际标准格式。

H.264标准产生的初衷就是制定一个新的视频编码标准，以实现视频的高压缩比和良好的网络适应性。

本文对H.264的码流结构做了详细的介绍，分析了指数哥伦布码、基于上下文的自适应变长码的编码和解码方法，设计了一种适用于H.264标准的熵解码器。

此解码器由解NAL包、指数哥伦布解码器和CAVLC解码器几部分组成，各模块之间用FIFO来做数据的缓冲。

解NAL包模块主要由一个96位的移位寄存器来实现。

指数哥伦布解码器采用了首“1”探测器的电路，通过简单计算来得到解码数据。

由于传统的CAVLC解码器使用了多个码表，码字的长度也不固定，使解码算法的复杂度很高。

因此，我们设计了一种基于码流中第一个1的位置，即1前面连续 O 的个数 M 的方法，来重建码表，快速判断码长和确定码字，以提高解码速度。

此解码器由Verilog HDL硬件描述语言进行设计实现，并对各模块进行了功能仿真，用以检测设计的正确性。

最后做了FPGA综合，在FPGA上能够满足实时解码标准清晰度视频的要求。

9.期刊论文万帅.王新岱新一代视频压缩标准H.264-中国有线电视2003,""(18)JVT(Joint Video Team)开发的新一代的低比特率视频标准H.264具有出色的编码效率和压缩性能.其基本框架和已有的视频编码标准类似,但它包含许多特有的重要的技术特征,系统介绍这些特征及其性能,H.264对于研究多媒体通信和新一代的网络业务有着重要的意义.10.期刊论文唐乐.赵刚.文进.刘波涛.TANG Le.ZHAO Gang.WEN Jin.LIU Bo-tao H.264/AVC算法技术特点剖析-现代计算机（专业版）2005,""(12)H.264是由ITU-T和ISO共同提出的最新数字化视频编码标准,为了提高图像的压缩比,它采用了分层设计、帧间预测、帧内预测、熵编码以及整数变换等技术.本文将时这些关键技术进行阐述.本文链接：/Periodical_dnzsyjs-itrzyksb200836081.aspx授权使用：西安交通大学(wfxajd)，授权号：d1d7d4ce-12f5-4dbf-8c4b-9e1a00a5bff7下载时间：2010年10月25日。