h.264的编码过程

格式：doc
大小：37.00 KB
文档页数：5

下载文档原格式

/ 5

H264编码原理详解

H264编码原理详解前言•在日常生活中我们知道，电脑中的视频文件先要通过视频采集设备对物体进行采集，然后通过编码核心部件得到mp4,rmvb等格式进行保存。

有没有可能不经过上述核心编码部件采集之后直接进行显示呢？答案是可以的。

那为什么还要进行编码呢？答案是原始采集到的视频数据为YUV格式，这种格式不经过处理的话特别大，对于网络传输和永久保存非常不利，为了解决这个问题，就需要对原原始的视频数据进行压缩处理。

而H264则是目前一种流传广泛，成熟的视频压缩算法。

•先来看一个例子在学习H.264编码之前，我们先了解一下在手机相机拍摄视频的过程，如果Camera采集的YUV图像不做任何处理进行传输，那么每秒钟需要传输的数据量是多少？Camera采集的YUV图像通常为YUV420，根据YUV420的采样结构，YUV图像中的一个像素中Y、U、V分量所占比例为1：1/4：1/4，而一个Y分量占1个字节，也就是说对于YUV图像，它的一个像素的大小为(1+1/4+1/4)Y=3/2个字节。

如果直播时的帧率设置为30fps，当分辨率为1280x720，那么每秒需要传输的数据量为1280720(像素)30(帧)3/2(字节)=39.5MB；当分辨率为1920x720，那么每秒需要传输的数据量接近60MB，这对于手机的存储空间有很大考验，因此，我们就必须在拍摄形成视频文件保存在本地之前对采集的视频数据进行压缩编码。

H26X简介H261•目前国际上制定视频编解码技术的组织有两个，一个是“国际电联（ITU-T）”，它制定的标准有H.261、H.263、H.263+等，另一个是“国际标准化组织（ISO）”它制定的标准有MPEG-1、MPEG-2、MPEG-4等。

•H.261是1990年ITU-T制定的一个视频编码标准，属于视频编解码器。

设计的目的是能够在带宽为64kbps的倍数的综合业务数字网(ISDN forIntegrated Services Digital Network)上质量可接受的视频信号。

H.264编码流程图

•编码器的核心是基于运动补偿预测（motion compensated prediction, MCP）。

有两条数据通道：前向通道和重建通道。

在前向通道中，编码器的输入是帧Fn，每帧画面是以16×16像素大小的宏块为单位组成的，每个宏块分别进行帧内或帧间预测编码。

在图中，帧间预测的参考帧被限定为前一帧Fn’，但是实际上，参考帧的数量可以多达五帧。

•当前宏块减去其预测值P得到残差宏块Dn，Dn经过块变换和量化得到量化系数X，对量化变换系数进行重排序和熵编码，得到的系数以及一些用于解码的附加信息（例如宏块预测模式、量化步长、运动矢量信息等）经由网络抽象层NAL (network abstraction layer)进行传输和存储。

•在重建通道中，宏块量化系数X被解码，用于构建重建帧（用于做预测）。

如图所示，系数被反量化、反变换后，产生差值宏块Dn’(由于量化过程引入误差，Dn’与先前的Dn并不一致)。

预测宏块P与Dn’相加构成重建宏块uFn’。

再引入滤波器减小块效应失真，得到重建的Fn’。

在编码器中引入重建通道的目的是为了使编码器和解码器使用相同的参考帧来构成预测宏块P，否则，预测宏块P在编码器和解码器中将不一致，这将造成误差积累或编解码器间的“漂移（drifting）”。

H.264 NAL层解析(0x00000001,编码,打包,NALU)

处理过程：
1．将VCL层输出的SODB封装成nal_unit，Nal_unit是一个通用封装格式，可以适用于有序字节流方式和IP包交换方式。
2．针对不同的传送网络（电路交换|包交换），将nal_unit 封装成针对不同网络的封装格式。
第一步的具体过程：
VCL层输出的比特流SODB（String Of Data Bits），到nal_unit之间，经过了以下三步处理：
20：编码片段扩展
21 – 23：保留
24 – 31：未规定
3．H.264的NAL层处理
结构示意图：
NAL以NALU（NAL unit）为单元来支持编码数据在基于分组交换技术网络中传输。它定义了符合传输层或存储介质要求的数据格式，同时给出头信息，从而提供了视频编码和外部世界的接口。
NALU：定义了可用于基于分组和基于比特流系统的基本格式
(1)NALU的分块以按RTP次序号升序传输；
(2)能够标记第一个和最后一个NALU分块；
(3)可以检测丢失的分块。
NALU合并
一些NALU如SEI、参数集等非常小，将它们合并在一起有利于减少头标开销。已有两种集合分组：
(1)单一时间集合分组(STAP)，按时间戳进行组合；
(2)多时间集合分组(MTAP)，不同时间戳也可以组合。
具体方法：
nal_unit( NumBytesInNALunit ) {
forbidden_zero_bit
nal_ref_idc
nal_unit_type
NumBytesInRBSP = 0
for( i = 1; i < NumBytesInNALunit; i++ ) {
if( i + 2 < NumBytesInNALunit && next_bits( 24 ) = = 0x000003 ) {

【知识点】H264,H265硬件编解码基础及码流分析

【知识点】H264,H265硬件编解码基础及码流分析前⾔⾳视频开发需要你懂得⾳视频中⼀些基本概念,针对编解码⽽⾔,我们必须提前懂得编解码器的⼀些特性,码流的结构,码流中⼀些重要信息如sps,pps,vps,start code以及基本的⼯作原理,⽽⼤多同学都只是⼀知半解,所以导致代码中的部分内容虽可以简单理解却不知其意,所以,在这⾥总结出了当前主流的H.264,H.265编码相关的原理,以供学习.1. 概览1.1. 为什么要编码众所周知,视频数据原始体积是巨⼤的,以720P 30fps的视频为例,⼀个像素⼤约3个字节,如下所得,每秒钟产⽣87MB,这样计算可得⼀分钟就将产⽣5.22GB。

数据量/每秒=1280*720*33*3/1024/1024=87MB因此,像这样体积重⼤的视频是⽆法在⽹络中直接传输的.⽽视频编码技术也就因运⽽⽣.关于视频编码原理的技术可以参考本⼈其他⽂章,这⾥不做过多描述.1.2. 编码技术经过很多年的开发迭代,已经有很多⼤⽜实现了视频编码技术,其中最主流的有H.264编码,以及新⼀代的H.265编码,⾕歌也开发了VP8,VP9编码技术.对移动端⽽⾔,苹果内部已经实现了如H.264,H.265编码,我们需要使⽤苹果提供的VideoToolbox框架来实现它.1.3. 编码分类软件编码(简称软编)：使⽤CPU进⾏编码。

硬件编码(简称硬编)：不使⽤CPU进⾏编码，使⽤显卡GPU,专⽤的DSP、FPGA、ASIC芯⽚等硬件进⾏编码。

优缺点软编：实现直接、简单，参数调整⽅便，升级易，但CPU负载重，性能较硬编码低，低码率下质量通常⽐硬编码要好⼀点。

硬编：性能⾼，低码率下通常质量低于硬编码器，但部分产品在GPU硬件平台移植了优秀的软编码算法（如X264）的，质量基本等同于软编码。

iOS系统中的硬编码苹果在iOS 8.0系统之前，没有开放系统的硬件编码解码功能，不过Mac OS系统⼀直有，被称为Video ToolBox的框架来处理硬件的编码和解码，终于在iOS 8.0后，苹果将该框架引⼊iOS系统。

H264熵编码具体算法

1.CAVLC概念
CAVLC即基于上下文的自适应变长编码。CAVLC的本质是变长编码，它的特性主要体现在自适应能力上， CAVLC可以根据已编码句法元素的情况动态的选择编码中使用的码表，并且随时更新拖尾系数后缀的长度，从而获得极高的压缩比。H.264标准中使用了CAVLC对4*4模块的亮度和色度残差数据进行编码。
解析除拖尾系数外的非零系数的幅值level1确定后缀长度suffixlength2根据码流查表96得到前缀levelprefix3根据前缀和后缀得到levelcodelevelprefixsuffixlengthlevelsuffix4levelcode为偶数levellevelcode22levelcode为奇数levellevelcode125根据设定的阈值确定是否updatesuffixlegth6cavlc与uvlc比较在相同码率的情况下用cavlc编码的psnr的值高于用uvlc编码的psnr的值并且随着比特率的增加cavlc的优势更加明显h264avc68cavlc基于上下文自适应的可变长编码69cabac基于上下文的自适应二进制算术熵编码610码率控制611去方块滤波612其余特征cabac1
∴经查表可知码流为0000100 ∴code=0000100
4.3 编码每个拖尾系数的符号对于每个拖尾系数(±1)只需要指明其符号，
其符号用一个比特表示(0表示+ ，1表示-)。编码的顺序是按照反向扫描的顺序，从高频数据开始。例：设有一个4*4块数据（假定NC=0）
0 3 -1 0
0 -1 1 0
0 3 -1 0 0 -1 1 0
1000
0000 ∴TotalZeros=3 又∵TotalCoeffs(非零系数的数目)=5 ∴查表可得码流为111 ∴code=0000100 011 1 0010 111

X.264,H.264,divX等编码标准介绍

【基本定义】x264是一种免费的、具有更优秀算法的H.264/MPEG-4 AVC视频压缩编码格式。

它同xvid一样都是开源项目，但x264是采用H.264标准的，而xvid是采用MP EG-4早期标准的。

由于H.264是2003年正式发布的最新的视频编码标准，因此，在通常情况下，x264压缩出的视频文件在相同质量下要比xvid压缩出的文件要小，或者也可以说，在相同体积下比xvid压缩出的文件质量要好。

它符合GPL许可证。

[编辑本段]【X.264起源】X.264起源于H.264技术，是H.264的的变种版本。

与H.264相比，X.264是针对业余市场推出的一个免费编码格式，是H.264的子集，只能能实现H.264的部分功能。

X.264多见于网络上流传的重压缩的视频内容[编辑本段]【X.264特点】特点：日前，x264是最新的AVC编码格式之一。

■ 采用CAVLC/CABAC多种算法编码■ 内置所有macroblock格式（16x16, 8x8, and 4x4 ）X.264界面■ Inter P：所有的分割块（从16x16到4x4 ）■ Inter B：分割块从16x16到8x8■ 码率控制：恒定的分层编制，单次或多次的ABR压制，可选的VBV压制■ 场景剪切侦测■ 支持B-frame■ 能够任意编制B-frame命令行■ 无损模式■ 8x8和4x4的格式能够进行翻转或旋转■ 自定义精确的矩阵模板■ 可在多个CPU平行编码■ 隔行扫描[编辑本段]【技术区别】x264x264是一个基于h.264的免费开源的视频Codec，属于后起之秀，已经受到众多Riper的青睐，但是与Xvid相比，其在解码时对硬件的要求更高。

H.264H.264是由国际电信联盟（ITU-T）所制定的新一代的视频压缩格式。

H.264最具价值的部分无疑是更高的数据压缩比。

在同等的图像质量条件下，H.264的数据压缩比能比当前DVD系统中使用的MPEG-2高2-3倍，比MPEG-4高1.5-2倍。

H.264视频编码介绍资料

• H263++在H263+基础上增加了3个选项，增强码流在恶劣信道上的抗误码性和编码效率。 • 选项U—增强型参考帧选择，提供增强的编码效率和信道错误再生能力。 • 选项V—数据分片选择，提供增强型的抗误码能力(特别是在传输过程中本地数据被破坏的情况下)，通过分离视频码流中DCT的系数头和运动矢量数据，采用可逆编码方式保护运动矢量。 • 选项W—在H263+的码流中补充信息，保证增强型的反向兼容性。
H.264解码器
H.264采用的新技术
• H.264标准中诸如帧间预测、变换、量化、熵编码等基本功能模块与前几个标准（MPEG-1, MPEG-2, MPEG-4, H.261, H.263）并无太大 • • • • • • • 区别，变化主要体现在功能模块的具体细节上。分层设计帧间预测编码帧内预测编码整数变换量化处理熵编码环路滤波
TTS图解
• 如图所示，搜索步骤如下：
– 第一步：从搜索起点开始，以最大搜索长度的一半为步长，在周围距离步长的 8个点处进行块匹配计算并比较，图中用正方形表示，1号为该次搜索最优点。 – 第二步：将步长减半，中心点移到上一步的最小匹配点，重新在周围距离步长的8个点处进行块匹配计算并比较，图中用圆形表示，2号为该次搜索最优点。 – 第三步：在上一步得到的最小匹配点的中心及周围8个点处找出最匹配点，该点即为所求，图中用菱形表示，3号为该次搜索最优点
块的搜索与匹配
• 搜索起点的选择很重要。 • 块搜索算法：
①全搜索法FS ②三步搜索法TTS ③菱形搜索法DS ④六边形搜索法注：有不少对上述方法的改进及新方法。
• 块匹配准则：
①最小绝对差MAD ②最小均方误差MSE ③归一化互相关函数NCCF ④求和绝对误差SAD

H.264视频编码基本知识

H.264视频编码基本知识一、视频编码技术的发展历程视频编码技术基本是由ISO/IEC制定的MPEG-x和ITU-T制定的H.26x两大系列视频编码国际标准的推出。

从H.261视频编码建议，到H.262/3、MPEG-1/2/4等都有一个共同的不断追求的目标，即在尽可能低的码率（或存储容量）下获得尽可能好的图像质量。

而且，随着市场对图像传输需求的增加，如何适应不同信道传输特性的问题也日益显现出来。

于是IEO/IEC和ITU-T两大国际标准化组织联手制定了视频新标准H.264来解决这些问题。

H.261是最早出现的视频编码建议，目的是规范ISDN网上的会议电视和可视电话应用中的视频编码技术。

它采用的算法结合了可减少时间冗余的帧间预测和可减少空间冗余的DCT变换的混合编码方法。

和ISDN信道相匹配，其输出码率是p×64kbit/s。

p取值较小时，只能传清晰度不太高的图像，适合于面对面的电视电话；p取值较大时（如p＞6），可以传输清晰度较好的会议电视图像。

H.263 建议的是低码率图像压缩标准，在技术上是H.261的改进和扩充，支持码率小于64kbit/s的应用。

但实质上H.263以及后来的H.263+和H.263++已发展成支持全码率应用的建议，从它支持众多的图像格式这一点就可看出，如Sub-QCIF、QCIF、CIF、4CIF甚至16CIF等格式。

MPEG-1标准的码率为1.2Mbit/s左右，可提供30帧CIF（352×288）质量的图像，是为CD-ROM光盘的视频存储和播放所制定的。

MPEG-l标准视频编码部分的基本算法与H.261/H.263相似，也采用运动补偿的帧间预测、二维DCT、VLC游程编码等措施。

此外还引入了帧内帧（I）、预测帧（P）、双向预测帧（B）和直流帧（D）等概念，进一步提高了编码效率。

在MPEG-1的基础上，MPEG-2标准在提高图像分辨率、兼容数字电视等方面做了一些改进，例如它的运动矢量的精度为半像素；在编码运算中（如运动估计和DCT）区分"帧"和"场"；引入了编码的可分级性技术，如空间可分级性、时间可分级性和信噪比可分级性等。

视频压缩编码标准H.264详解

视频压缩编码标准H.264详解视频压缩编码标准H.264详解——新疆大学2006级工硕郭新军JVT（Joint Video Team，视频联合工作组）于2001年12月在泰国Pattaya 成立。

它由ITU-T和ISO两个国际标准化组织的有关视频编码的专家联合组成。

JVT的工作目标是制定一个新的视频编码标准，以实现视频的高压缩比、高图像质量、良好的网络适应性等目标。

目前JVT的工作已被ITU-T接纳，新的视频压缩编码标准称为H.264标准，该标准也被ISO接纳，称为AVC（Advanced Video Coding）标准，是MPEG-4的第10部分。

H.264标准可分为三档：基本档次（其简单版本，应用面广）；主要档次（采用了多项提高图像质量和增加压缩比的技术措施，可用于SDTV、HDTV和DVD等）；扩展档次（可用于各种网络的视频流传输）。

H.264不仅比H.263和MPEG-4节约了50％的码率，而且对网络传输具有更好的支持功能。

它引入了面向IP包的编码机制，有利于网络中的分组传输，支持网络中视频的流媒体传输。

H.264具有较强的抗误码特性，可适应丢包率高、干扰严重的无线信道中的视频传输。

H.264支持不同网络资源下的分级编码传输，从而获得平稳的图像质量。

H.264能适应于不同网络中的视频传输，网络亲和性好。

一、H.264视频压缩系统H.264标准压缩系统由视频编码层（VCL）和网络提取层（Network Abstraction Layer，NAL）两部分组成。

VCL中包括VCL编码器与VCL解码器，主要功能是视频数据压缩编码和解码，它包括运动补偿、变换编码、熵编码等压缩单元。

NAL则用于为VCL提供一个与网络无关的统一接口，它负责对视频数在H.264中采用了6阶FIR滤波器的内插获得1/2像素位置的值。

当1/2像素值获得后， 1/4像素值可通过线性内插获得，对于4:1:1的视频格式，亮度信号的1/4 像素精度对应于色度部分的1/8像素的运动矢量，因此需要对色度信号进行1/8像素的内插运算。

解码器流程图 Visuo H.264(JM12.2)

H.264(JM12.2)解码流程理解版本： 1时间：2010.2-2010.3邮件：zjhzchen@主要包括以下两个方面：1.解码标准原理2.JM代码中的解码流程一、H.264解码标准解码器功能框图如下：解码器功能框图详细的解码流程如下：详细的解码流程二、JM12.2的解码主控流程解码总流程帧解码流程（decode one frame）解码一帧的流程读一个片（read_new_slice）解码IDR包括图像的帧号，计算POC，为存储图像分配空间，错误恢复的重设置解码IDR灵活移动宏块的初始化（FmoInit）1. mapUnitToSliceGroupMap变量mapUnitToSliceGroupMap的计算流程2. MbToSliceGroupMap函数NextMbAddress( n )的流程图像序列号的计算（decode_poc）参考帧列表的重排序（reorder_lists）解码一个片（decode_one_slice ）为直接预测模式做一些准备工作：获取co_located 图像、计算mv_scale解码一个片熵解码：包括解出宏块类型、预测模式、MVD 、CBP 、残差（包括反量化操作）等反变换及运动补偿：反量化反变换、运动补偿、像素重构等写入各个8*8块的预测模式及运动向量到错误隐藏变量中保存相关的片参数计算宏块，块，像素的坐标；宏块结构语法元素的初始化；相邻块的可用性；以及滤波参数开始一个宏块（start_macroblock）开始一个宏块读一个宏块（read_one_macroblock）// intra frame将亮度块中的16个4*4块的预测模式设置为2（直接预测），运动向量置0宏块（也即P_Skip类型宏块）。

无残MVD。

直接利用预测MV得到像素预=像素预测值从NAL中读取运动矢量信息（readMotionInfoFromNAL）从NAL中读运动矢量信息从NAL中读取CBP以及残差信息（readCBPandCoeffsFromNAL）如果当前宏块不是帧内16*16或者I_PCM类型宏块则从码流中读取CBP从NAL中读取CBP和残差信息解码一个宏块（decode_one_macroblock）解码一个宏块的流程注：此处的解码包括预测信息，残差的反变换以及图像的重建将宏块的预测模式以及运动信息写入错误隐藏变量中（ercWriteMBMODEandMV）将预测模式和运动信息写到错误隐藏变量中退出图像（exit_picture）退出图像图像的去块滤波（DeblockPicture）图像的去块滤波图像的错误检测以及处理图像的错误检测以及处理store_picture到解码缓冲区（store_picture_in_dpb）IDR内存管理（idr_memory_management）IDR内存管理adaptive-内存管理控制（adaptive_memory_management）参考图像的自适应内存控制标记过程分配LongTermFrameIdx给一个短期参考图像插入图像到DPB（insert_picture_in_dpb）插入图像到DPBflush-DPB（flush_dpb）将DPBB.fs的参考标记置为0Flush-DPB。

H264基础简介

H264基础简介前⾔H264是属于视频的编码层的标准格式，视频编码显然是为了压缩⼤⼩。

我们看下⼀个完全没压缩的视频数据⼤⼩。

假设视频是⾼清（1280 * 720），每秒30帧，也就是每秒的数据1280 * 720 *30 / 8(字节) /1024（KB）/1024(MB) = 3.11MB那么90分钟的电影就要16.7GB，这个数据量显然在当前⽹络下是不现实的。

视频压缩的原理就是去除视频冗余部分，下⾯列举下1，时间冗余时间冗余是序列图像(电视图像、动画)和语⾳数据中所经常包含的冗余。

图像序列中的两幅相邻的图像，后⼀幅图像与前⼀幅图像之间有较⼤的相关性，这反映为时间冗余。

同理，在语⾔中，由于⼈在说话时发⾳的⾳频是⼀连续的渐变过程，⽽不是⼀个完全的在时间上独⽴的过程，因⽽存在时间冗余。

2，空间冗余空间冗余是图像数据中经常存在的⼀种冗余。

在同⼀幅图像中，规则物体和规则背景(所谓规则是指表⾯颜⾊分布是有序的⽽不是杂乱⽆章的)的表⾯物理特性具有相关性，这些相关性的光成像结构在数字化图像中就表现为数据冗余。

,3，知识冗余有许多图像的理解与某些基础知识有相当⼤的相关性,例如：⼈脸的图像有固定的结构。

⽐如，嘴的上⽅有⿐⼦。

⿐⼦的上⽅有眼睛，⿐⼦位于正脸图像的中线上等等。

这类规律性的结构可由先验知识相背景知识得到，我们称此类冗余为知识冗余。

4，结构冗余有些图像从⼤域上看存在着⾮常强的纹理结构，例如布纹图像和草席图像，我们说它们在结构上存在冗余。

5，视觉冗余⼈类视觉系统对于图像场的任何变化，并不是都能感知的。

例如，对于图像的编码和解码处理时，由于压缩或量⽐截断引⼊了噪声⽽使图像发⽣了⼀些变化，如果这些变化不能为视觉所感知，则仍认为图像⾜够好。

事实上⼈类视觉系统⼀般的分辨能⼒约为26灰度等级，⽽⼀般图像量化采⽤28灰度等级，这类冗余我们称为视觉冗余。

通常情况下，⼈类视觉系统对亮度变化敏感，⽽对⾊度的变化相对不敏感；在⾼亮度区，⼈眼对亮度变化敏感度下降。

H.264数字视频压缩技术详解

Ｈ．２６４数字视频压缩技术详解　ＤＶＲ在短短的几年里就成为了全球安防产业最受瞩目的产品明星，极大的推动了安防产业数字化的进程。

而作为ＤＶＲ技术的核心，视频编码技术的发展更是日新月异，不断的在安防产业掀起一波又一波新的技术革命，ＭＰＥＧ－４的出现掀起了一次技术革命，Ｈ．２６４以其较ＭＰＥＧ－４更高的视频压缩比和更强的网络传输功能无疑会引发另一场新的改革浪潮。

１、视频编码技术的发展历程　自上个世纪８０年代以来，ＩＳＯ／ＩＥＣ制定的ＭＰＥＧ－ｘ和ＩＴＵ－Ｔ制定的Ｈ．２６ｘ两大系列视频编码国际标准的推出，开创了视频通信和存储应用的新纪元。

从Ｈ．２６１视频编码建议，到Ｈ．２６２／３、ＭＰＥＧ－１／２／４等都有一个共同的不断追求的目标，即在尽可能低的码率（或存储容量）下获得尽可能好的图像质量。

而且，随着市场对图像传输需求的增加，如何适应不同信道传输特性的问题也日益显现出来。

于是ＩＥＯ／ＩＥＣ和ＩＴＵ－Ｔ两大国际标准化组织联手制定了视频新标准Ｈ．２６４来解决这些问题。

　Ｈ．２６１是最早出现的视频编码建议，目的是规范ＩＳＤＮ网上的会议电视和可视电话应用中的视频编码技术。

它采用的算法结合了可减少时间冗余的帧间预测和可减少空间冗余的ＤＣＴ变换的混合编码方法。

和ＩＳＤＮ信道相匹配，其输出码率是ｐ×６４ｋｂｉｔ／ｓ。

ｐ取值较小时，只能传清晰度不太高的图像，适合于面对面的电视电话；ｐ取值较大时（如　ｐ＞６），可以传输清晰度较好的会议电视图像。

Ｈ．２６３　建议的是低码率图像压缩标准，在技术上是Ｈ．２６１的改进和扩充，支持码率小于６４ｋｂｉｔ／ｓ的应用。

但实质上Ｈ．２６３以及后来的Ｈ．２６３＋和Ｈ．２６３＋＋已发展成支持全码率应用的建议，从它支持众多的图像格式这一点就可看出，如Ｓｕｂ－ＱＣＩＦ、ＱＣＩＦ、ＣＩＦ、４ＣＩＦ甚至１６ＣＩＦ等格式。

　ＭＰＥＧ－１标准的码率为１．２Ｍｂｉｔ／ｓ左右，可提供３０帧ＣＩＦ（３５２×２８８）质量的图像，是为ＣＤ－ＲＯＭ光盘的视频存储和播放所制定的。

H.264和H.265编码标准的区别

H.264和H.265编码标准的区别，你真的了解吗？“H.264”和“H.265”这两个名词，在录播行业的应用宣传中频频露脸。

这其实是两种视频编码标准，本期小课堂就来简单介绍这两种标准和它们的区别。

H.264和H.265属于H.26x系列视频编码标准，由国际数字视频编码技术的标准化组织VCEG(Video Code Expert Group)制定，应用于实时视频通信领域，其中H.262和H.264则由VCEG和运动图像专家组MPEG(Motion Picture Expert Group)两个组织共同定制。

一、先来了解一下H.26x系列视频编码的发展进程。

H.261最早的运动图像压缩标准，应用于双向声像业务，如可视电话、视频会议。

H.262在25fps(PAL)或30fps(NTSC)的固定帧率下达到720x576像素成像，在消费类电子视频设备中广泛使用。

H.263为低码流通信而设计的标准草案，后续修订发布了标准版的H.263+和H.263++，进一步提高压缩编码性能和应用的灵活度。

二、接下来就是我们今天科普的“主人公”了。

H.264是在传统的混合编码系统基础上进行优化，相同的重建图像质量下，H.264比H.263+减小50%码率，具有更高的压缩比、更好的IP和无线网络信道适应性。

高压缩率减少了图像数据量，低于2Mbps的速度可以实现标清(分辨率在1280P*720以下)数字图像传送。

而H.265标准，则围绕H.264去粗取精，融入全新的SAO(一种参考帧补偿技术)技术，提高帧间预测的准确度。

在并行实现方面也采用了WPP(WavefrontParallelProcessing)和Tile 技术，充分发挥当前主流处理器的多核并行能力。

H.265整体改善了码流、编码质量、延时和算法复杂度之间的关系，达到最优化设置。

反复的质量比较测试表明，相同的图象质量下，通过H.265编码的视频码流大小比H.264减少大约39-44%，低于1.5Mbps的传输带宽下，即可实现1080P。

H264码流解析及NALU

H264码流解析及NALU639 /* bitstream filters */640 REGISTER_BSF(AAC_ADTSTOASC, aac_adtstoasc);641 REGISTER_BSF(CHOMP, chomp);642 REGISTER_BSF(DUMP_EXTRADATA, dump_extradata);643 REGISTER_BSF(H264_MP4TOANNEXB, h264_mp4toannexb);644 REGISTER_BSF(HEVC_MP4TOANNEXB, hevc_mp4toannexb);645 REGISTER_BSF(IMX_DUMP_HEADER, imx_dump_header);646 REGISTER_BSF(MJPEG2JPEG, mjpeg2jpeg);647 REGISTER_BSF(MJPEGA_DUMP_HEADER, mjpega_dump_header);648 REGISTER_BSF(MP3_HEADER_DECOMPRESS, mp3_header_decompress);649 REGISTER_BSF(MPEG4_UNPACK_BFRAMES, mpeg4_unpack_bframes);650 REGISTER_BSF(MOV2TEXTSUB, mov2textsub);651 REGISTER_BSF(NOISE, noise);652 REGISTER_BSF(REMOVE_EXTRADATA, remove_extradata);653 REGISTER_BSF(TEXT2MOVSUB, text2movsub);H264码流的NAL起始字节分析这是⼀段H264码流，00 00 00 01这是对应forbidden_zero_bit的f(1)，接着后⾯的nal_ref_idc的u(2)，这个怎么解呀，有点晕。

h264的编码过程

H.264编码算法的实现在H.264编码具体实现过程中，采用了目前国际上应用最广泛的开源编码器X.264作为实现的基础。

X.264和JM系列编码器、T.264编码器相比有着优秀的性能和出色效果。

由于X.264没有提供直接的开发API，所以在本系统中的编码部分重新封装了X.264的编码API，便于软件系统的设计和使用。

以下是本系统中H.264编码的具体实现过程：1) RGB和YUV颜色空间的转换在系统中通过Logitech摄像头获得的视频数据为RGB24格式，但是X.264的输入流为标准的YUV（4：2：0）的图像子采样格式。

因此，在编码前需要将RGB颜色空间转换为YUV的颜色空间。

实现的函数调用有InitLookupTable（）用于初始化色彩空间转换；RGB2YUV420（int x_dim, int y_dim, unsigned char *bmp, unsigned char *yuv, int flip）；用于实际的转换。

由于人眼的生理特性，经过图像子采样后，实际的图像大小已经减小为采样前的1.5个样本点，即减小了一半的数据量。

2) 设置H.264编码参数使用x264_param_default（x264_param_t *param）对当前需要编码的图像参数进行设置。

包括数据帧数量（param .i_frame_total）、采样图像的长宽度和高度（param .i_width，param .i_height）、视频数据比特率(param .rc.i_bitrate) 、视频数据帧率（param .i_fps_num）等参数进行设置，以完成编码前预设置。

3) 初始化编码器将上步中的设置作为编码器初始化的参数，x264_t*x264_encoder_open ( x264_param_t *param )。

如果初始化失败将返回NULL，在这里需要对编码器初始化结果进行处理。

4) 分配编码空间如果编码器初始化成功，则需要为本次处理分配内存空间Void x264_picture_alloc（x264_picture_t *pic, int i_csp, int i_width, int i_height）。

H.264编码原理

H.264通信1012 严亮 1020119208 一．原理H.264是一种高性能的视频编解码技术。

目前国际上制定视频编解码技术的组织有两个，一个是“国际电联（ITU-T）”，它制定的标准有H.261、H.263、H.263+等，另一个是“国际标准化组织（ISO）”它制定的标准有MPEG-1、MPEG-2、MPEG-4等。

而H.264则是由两个组织联合组建的联合视频组（JVT）共同制定的新数字视频编码标准，所以它既是ITU-T的H.264，又是ISO/IEC的MPEG-4高级视频编码（Advanced Video Coding，AVC），而且它将成为MPEG-4标准的第10部分。

因此，不论是MPEG-4 AVC、MPEG-4 Part 10，还是ISO/IEC 14496-10，都是指H.264。

H.264最大的优势是具有很高的数据压缩比率，在同等图像质量的条件下，H.264的压缩比是MPEG-2的2倍以上，是MPEG-4的1.5～2倍。

举个例子，原始文件的大小如果为88GB，采用MPEG-2压缩标准压缩后变成3.5GB，压缩比为25∶1，而采用H.264压缩标准压缩后变为879MB，从88GB到879MB，H.264的压缩比达到惊人的102∶1！H.264为什么有那么高的压缩比？低码率（Low Bit Rate）起了重要的作用，和MPEG-2和MPEG-4 ASP等压缩技术相比，H.264压缩技术将大大节省用户的下载时间和数据流量收费。

尤其值得一提的是，H.264在具有高压缩比的同时还拥有高质量流畅的图像，正因为如此，经过H.264压缩的视频数据，在网络传输过程中所需要的带宽更少，也更加经济。

H.264和以前的标准一样，也是DPCM加变换编码的混合编码模式。

但它采用“回归基本”的简洁设计，不用众多的选项，获得比H.263++好得多的压缩性能；加强了对各种信道的适应能力，采用“网络友好”的结构和语法，有利于对误码和丢包的处理；应用目标范围较宽，以满足不同速率、不同解析度以及不同传输（存储）场合的需求。

H.264编码四种编码形式

H.264编码四种画质级别一、D1是数字电视系统显示格式的标准共分为以下5种规格D1 480i格式 525i 720×480 水平480线隔行扫描和NTSC模拟电视清晰度相同行频为15.25kHz 相当于我们所说的4CIF720×576D2 480P格式 525p 720×480 水平480线逐行扫描较D1隔行扫描要清晰不少和逐行扫描DVD规格相同行频为31.5kHzD3 1080i格式 1125i 1920×1080 水平1080线隔行扫描高清放松采用最多的一种分辨率分辨率为1920×1080i/60Hz 行频为33.75kHzD4 720p格式 750p 1280×720 水平720线逐行扫描虽然分辨率较D3要低但是因为逐行扫描市面上更多人感觉相对于1080I实际逐次540线视觉效果更加清晰。

不过个人感觉来说在最大分辨率达到1920×1080的情况下D3要比D4感觉更加清晰尤其是文字表现力上分辨率为1280×720p/60Hz 行频为45kHzD5 1080p格式 1125p 1920×1080 水平1080线逐行扫描目前民用高清视频的最高标准分辨率为1920×1080P/60Hz,行频为67.5KHZ。

其中D1 和D2标准是我们一般模拟电视的最高标准并不能称的上高清晰D3的1080i标准是高清晰电视的基本标准它可以兼容720p格式而D5的1080P只是专业上的标准并不是民用级别的上面所给出的60HZ只是理想状态下的场频而它的行频为67.5KHZ 目前还没有如此高行频的电视问世实际在专业领域里1080P的场频只有24HZ/25HZ和30HZ。

需要指出的一点是D端子是日本独有的特殊接口国内电视几乎没有带这种接口的最多的是色差接口而色差接口最多支持到D4 理论上肯定没有HDMI 纯数字信号支持到1080P)的最高清晰度高但在1920 1080以下分辨率的电视机上一般也没有很大差别.二、H.264有四种画质级别分别是BP、EP、MP、HP1、BP-Baseline Profile 基本画质。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

H.264编码算法的实现
在H.264编码具体实现过程中，采用了目前国际上应用最广泛的开源编码器X.264作为实现的基础。

X.264和JM系列编码器、T.264编码器相比有着优秀的性能和出色效果。

由于X.264没有提供直接的开发API，所以在本系统中的编码部分重新封装了X.264的编码API，便于软件系统的设计和使用。

以下是本系统中H.264编码的具体实现过程：
1) RGB和YUV颜色空间的转换
在系统中通过Logitech摄像头获得的视频数据为RGB24格式，但是X.264的输入流为标准的YUV（4：2：0）的图像子采样格式。

因此，在编码前需要将RGB颜色空间转换为YUV的颜色空间。

实现的函数调用有InitLookupTable（）用于初始化色彩空间转换；
RGB2YUV420（int x_dim, int y_dim, unsigned char *bmp, unsigned char *yuv, int flip）；用于实际的转换。

由于人眼的生理特性，经过图像子采样后，实际的图像大小已经减小为采样前的1.5个样本点，即减小了一半的数据量。

2) 设置H.264编码参数
使用x264_param_default（x264_param_t *param）对当前需要编码的图像参数进行设置。

3) 初始化编码器
将上步中的设置作为编码器初始化的参数，
x264_t*x264_encoder_open ( x264_param_t *param )。

如果初始化失败将返回NULL，在这里需要对编码器初始化结果进行处理。

4) 分配编码空间
如果编码器初始化成功，则需要为本次处理分配内存空间
Void x264_picture_alloc（x264_picture_t *pic, int i_csp, int i_width, int i_height）。

5) 图像编码
将以上步骤初始化后的数据作为编码输入，使用下面的方法进行编码：
int x264_encoder_encode( x264_t *h,x264_nal_t **pp_nal, int
*pi_nal,x264_picture_t *pic_in,x264_picture_t *pic_out )；
6) 资源回收
编码完成后，需要回收系统资源和关闭编码器，使用以下函数调用实现回收。

void x264_picture_clean( x264_picture_t *pic )；
void x264_encoder_close( x264_t *h )；
至此，完成了H.264编码，编码后的数据量将大大减小。

我们可以对编码后的数据做相关的进一步处理。

4 H.264编码算法的完整源代码
文件：VideoEncoderX264.h
class CVideoEncoderX264 :
{
public:
CVideoEncoderX264(void);
~CVideoEncoderX264(void);
virtual bool Connect(CVideoEnDecodeNotify* pNotify, const CVideoEnDecodeItem& Item);
virtual void Release(void);
virtual void Encode(BYTE* pInData, int nLen, BYTE* pOutBuf, int& nOutLen, int& nKeyFrame);
private:
x264_picture_t m_Pic;
x264_t *h;
x264_param_t param;
void Flush(void);
};
文件：VideoEncoderX264.cpp
bool CVideoEncoderX264::Connect(CVideoEnDecodeNotify* pNotify, const CVideoEnDecodeItem& Item)
{
CBase::Connect(pNotify, Item);
ParseSize(Item.m_stSize);
x264_param_default( &param );
param.i_threads = 1;
param.i_frame_total = 0;
param.i_width = m_nWidth;
param.i_height = m_nHeight;
param.i_keyint_min = Item.m_nKeyInterval;
param.i_keyint_max = Item.m_nKeyInterval * 10;
param.i_fps_num = Item.m_nFps;*/
param.i_log_level = X264_LOG_NONE;
if( ( h = x264_encoder_open( &param ) ) == NULL )
{
return false;
}
x264_picture_alloc( &m_Pic, X264_CSP_I420, param.i_width, param.i_height );
return true;
}
void CVideoEncoderX264::Release(void)
{
Flush();
x264_picture_clean( &m_Pic );
x264_encoder_close( h );
CBase::Release();
}
void CVideoEncoderX264::Encode(BYTE* pInData, int nLen, BYTE* pOutBuf, int& nOutLen, int& nKeyFrame)
{
if(nLen != param.i_width * param.i_height * 3)
return;
param.i_frame_total ++;
memcpy(m_Pic.img.plane[0], pInData, param.i_width * param.i_height); memcpy(m_Pic.img.plane[1], pInData + param.i_width * param.i_height, param.i_width * param.i_height / 4);
memcpy(m_Pic.img.plane[2], pInData + param.i_width * param.i_height * 5 / 4, param.i_width * param.i_height / 4);
m_Pic.i_pts = (int64_t)param.i_frame_total * param.i_fps_den;
static x264_picture_t pic_out;
x264_nal_t *nal = NULL;
int i_nal, i;
if( &m_Pic )
{
m_Pic.i_type = X264_TYPE_AUTO;
m_Pic.i_qpplus1 = 0;
}
//TraceTime("x264_encoder_encode begin");
if( x264_encoder_encode( h, &nal, &i_nal, &m_Pic, &pic_out ) < 0 ) { return;
}
//TraceTime("x264_encoder_encode end");
int nOutCanUse = nOutLen;
nOutLen = 0;
for( i = 0; i < i_nal; i++ )
{
int i_size = 0;
if( ( i_size = x264_nal_encode( pOutBuf + nOutLen, &nOutCanUse, 1, &nal[i] ) ) > 0 )
{
nOutLen += i_size;
nOutCanUse -= i_size;
}
}
nKeyFrame = pic_out.i_type==X264_TYPE_IDR;// ||
(pic_out.i_type==X264_TYPE_I && coCfg->x264_max_ref_frames==1);
}
void CVideoEncoderX264::Flush(void)
{
x264_picture_t pic_out;
x264_nal_t *nal;
int i_nal, i;
int i_file = 0;
if( x264_encoder_encode( h, &nal, &i_nal, NULL, &pic_out ) < 0 ){
}
}。

曼彻斯特码原理与应用

页数:6
曼彻斯特编码和差分曼彻斯特

页数:2
曼彻斯特解码原则+125K EM4100系列RFID卡解码源程序分析

页数:38
曼彻斯特解码原则+125K EM4100系列RFID卡解码源程序分析

页数:38
曼彻斯特编解码器

页数:11
曼彻斯特编码

页数:4
曼彻斯特码

页数:5
曼彻斯特解码原则 125K EM4100系列RFID卡解码源程序分析资料

页数:38
简单的曼彻斯特编码的C语言实现

页数:3
曼彻斯特编码

页数:2

h.264的编码过程

合集下载

H264编码原理详解

H.264编码流程图

H.264 NAL层解析(0x00000001,编码,打包,NALU)

【知识点】H264,H265硬件编解码基础及码流分析

H264熵编码具体算法

X.264,H.264,divX等编码标准介绍

H.264视频编码介绍资料

H.264视频编码基本知识

视频压缩编码标准H.264详解

解码器流程图 Visuo H.264(JM12.2)

H264基础简介

H.264数字视频压缩技术详解

H.264和H.265编码标准的区别

H264码流解析及NALU

h264的编码过程

H.264编码原理

H.264编码四种编码形式

文档推荐

最新文档