x264的CABAC熵编码技术

格式：pdf
大小：149.16 KB
文档页数：2

下载文档原格式

浅析H.264标准中的CAVLC编码

浅析H.264标准中的CA VLC编码[摘要]本文是在阅读了讲解H.264/A VC中熵编码相关内容的书籍后的感想，主要介绍了熵编码的基本原理，H.264/A VC中熵编码的方法，重点介绍了基于上下文自适应的可变长编码(CA VLC)，并将它和基于上下文二进制算术编码(CABAC)进行了比较。

【关键词】熵编码;编码算法;编码比较H.264是在网络技术和视频业务不断发展的情况下产生的新一代视频压缩编码标准，它是由国际标准化组织与国际电讯联盟组成的联合视频小组开发的。

与原有标准相比，H.264提出了许多新技术，在诸多方面都超越了原有的视频技术，减少了占用的硬件资源,降低了实现复杂性。

其中就包括全新的熵编码技术。

1、熵编码编码使用长度不同的比特串对字母进行编码有一定的困难。

尤其是几乎所有几率的熵都是一个有理数。

使用整数位元(bit)哈夫曼编码建议了一种将位元进位成整数的算法，但这个算法在特定情况下无法达到最佳结果。

为此有人加以改进，提供最佳整数位元数。

这个算法使用二叉树来设立一个编码。

这个二叉树的终端节点代表被编码的字母，根节点代表使用的位元。

熵编码模型要确定每个字母的比特数算法需要尽可能精确地知道每个字母的出现机率。

模型的任务是提供这个数据。

模型的预言越好压缩的结果就越好。

此外模型必须在压缩和恢复时提出同样的数据。

在历史上有许多不同的模型。

静态模型静态模型在压缩前对整个文字进行分析计算每个字母的机率。

这个计算结果用于整个文字上。

优点：编码表只需计算一次，因此编码速度高。

除在解码时所需要的机率值外结果肯定不比原文长。

缺点：计算的机率必须附加在编码后的文字上，这使得整个结果加长。

计算的机率是整个文字的机率，因此无法对部分地区的有序数列进行优化。

动态模型在这个模型里机率随编码过程而不断变化。

多种算法可以达到这个目的：前向动态：机率按照已经被编码的字母来计算，每次一个字母被编码后它的机率就增高。

反向动态：在编码前计算每个字母在剩下的还未编码的部分的机率。

音视频编码一些参数解析：码流、码率、比特率、帧速率、分辨率、高清的区别

⾳视频编码⼀些参数解析：码流、码率、⽐特率、帧速率、分辨率、⾼清的区别GOP/ 码流 /码率 / ⽐特率 / 帧速率 / 分辨率GOP(Group of picture)关键帧的周期，也就是两个IDR帧之间的距离，⼀个帧组的最⼤帧数，⼀般的⾼视频质量⽽⾔，每⼀秒视频⾄少需要使⽤ 1 个关键帧。

增加关键帧个数可改善质量，但是同时增加带宽和⽹络负载。

需要说明的是，通过提⾼GOP值来提⾼图像质量是有限度的，在遇到场景切换的情况时，H.264编码器会⾃动强制插⼊⼀个I帧，此时实际的GOP值被缩短了。

另⼀⽅⾯，在⼀个GOP中，P、B帧是由I帧预测得到的，当I帧的图像质量⽐较差时，会影响到⼀个GOP中后续P、B帧的图像质量，直到下⼀个GOP开始才有可能得以恢复，所以GOP值也不宜设置过⼤。

同时，由于P、B帧的复杂度⼤于I帧，所以过多的P、B帧会影响编码效率，使编码效率降低。

另外，过长的GOP还会影响Seek操作的响应速度，由于P、B帧是由前⾯的I或P帧预测得到的，所以Seek操作需要直接定位，解码某⼀个P或B帧时，需要先解码得到本GOP内的I帧及之前的N个预测帧才可以，GOP值越长，需要解码的预测帧就越多，seek响应的时间也越长。

CABAC/CAVLCH.264/AVC标准中两种熵编码⽅法，CABAC叫⾃适应⼆进制算数编码，CAVLC叫前后⾃适应可变长度编码，CABAC：是⼀种⽆损编码⽅式，画质好，X264就会舍弃⼀些较⼩的DCT系数，码率降低，可以将码率再降低10-15%（特别是在⾼码率情况下），会降低编码和解码的速速。

CAVLC将占⽤更少的CPU资源，但会影响压缩性能。

帧：当采样视频信号时，如果是通过逐⾏扫描，那么得到的信号就是⼀帧图像，通常帧频为25帧每秒（PAL制）、30帧每秒（NTSC 制）；场：当采样视频信号时，如果是通过隔⾏扫描（奇、偶数⾏），那么⼀帧图像就被分成了两场，通常场频为50Hz（PAL制）、60Hz（NTSC制）；帧频、场频的由来：最早由于抗⼲扰和滤波技术的限制，电视图像的场频通常与电⽹频率（交流电）相⼀致，于是根据各地交流电频率不同就有了欧洲和中国等PAL制的50Hz和北美等NTSC制的60Hz，但是现在并没有这样的限制了，帧频可以和场频⼀样，或者场频可以更⾼。

中文版MeGUI的x264编码配置

中文版MeGUI的x264编码配置在MeGUI用内置工具AVS创建一个简单脚本（这里暂时不介绍AVS的各种滤镜使用参数），要求在点击DirectShowsource（手工、专业）能弹出视频预览窗就可以保存AVS了。

此时内建的AVS会自动加载到MeGUI 主界面，进入本文主题压制参数x264配置。

用内置工具建AVS脚本保存后会自动加载到MeGUI界面（AVS的保存最好和视频同在一起）视频输出，注意MeGUI分配的路径是和源视频同一处的，如果本身源视频就是mkv的那么视频输出要改一下视频名称或是存放路径,以免被覆盖转制出错。

没有勾选―显示高级设置‖英文―Show Advanced Setting‖设置界面没有显示完全。

勾选―显示高级设置‖后，配置界面完全显示出来，主要主要面板：编码模式有这么几种：ABR \ Const.Quantizer \ 2pass –1st pass \…… \ Const.Quality，说说常用的，ABR:平均码率，做动画基本不用，Const Quality:恒定质量模式（追求质量不计码率和容量大小的片子使用），一次编码，做动画基本不用，xPass:x次处理，能做到动态高码率，静态低码率，看到很多动画在激烈的打斗场面的时候都会有很高的码流，甚至有10m,20m的说，但是，在静态画面的时候码流较低，这是为了使体积都用在最需要的时候，如果激烈战斗的动态画面码率低的话那么就什么都看不清楚了…所以2pass 对于压缩后片子的整体质量有所提高。

对于那么多的编码模式，最终要用的都是：Auto-2PASS，两次的编码压缩使得码率低，体积更小，质量也高，但是消耗的时间是CQ模式的大约一倍，CQ模式相当于只跑了第2PASS，而2PASS模式还要跑完第一PASS才跑第二PASS。

（加入列队编码时注意到，自动二次编是要跑完两个x264才完成视频输出,时间久就是因为这样来的。

）BITRATE：码率设置，以kbps为单位，片源好以1500kbps以上压制成1024X576的片子体积能减三倍以上，当然码率越高和源的差别越小。

基于H.264的CABAC熵编码器实现研究

ＨＯＵＣｈｏａ
（ｏｅｅｏｏＣｌｇｆＣｍｍｕｉａｉｎｆｍｔｎＥｇｎｅｉｇｎｃｔｎａｄＩｏａｉｎｉｅｒ，ｏｎｒｏｎＣｏｇｉｇＵｉｅｓｔｏＰｓｎｅｅｏｍｕｉｔｎ，ｈｎｑｎ００５Ｃｉａ）ｈｎｑｎｎｖｒｉｆｏｔａｄＴｌｃｍｎｃｉｓＣｏｇｉｇ４０６，ｈｎｙｓａｏ
熵编码的编码器方案，方案能满足编码器硬件实现的需求。该
关键词：２４ＣＢＣ熵编码；码器Ｈ．６；ＡＡ编中图分类号：Ｐ１．１Ｔ９９３文献标识码：Ａ
ＲｅｅｒｈａｄＩｐｅｅｔｔｏｆＣＡＢｓａｃｎｍｌｍｎａｉｎｏＡＣｔｏｙＥｎｏｅｓｄｏ２４ＥｎｒｐｃｄｒＢａｅｎＨ．６
编码的需求的，因而设计一个ＣＢＣ的硬件加速ＡＡ
器就显得尤为重要。本文将对ＣＢＡＡＣ熵编码的算法进行简单介绍和分析，后将提出一种最ＣＢＣ熵编码加速器的设计架构。ＡＡ
基于上下文的自适应二进制算术编码（ＡＡＣＢＣ，
第１期
２１０２年０３月
电
光
系
统
Ｎｏ．１
ＥｌｃｒｎｃａｄＥｌｃｒ — ｐｉａｙｔｍｓｅｔｏｉｎｅｔｏｏｔｃｌＳｓｅ
Ｍａ．２２ｒ０１

X264-libx264编码库

X264-libx264编码库X264编码库libx264实现真正的视频编解码，该编解码算法是基于块的混合编码技术，即帧内/帧间预测，然后对预测值变换、量化，最后熵编码所得。

编码帧的类型分为I帧（x264_type_i）、P帧（x264_type_p）、B帧（x264_type_b），在H264中叫做图像⽚Slice。

X264把整帧图像看作⼀个Slice，⽚中有slice_type_i、slice_type_p、slice_type_b之分。

I帧只有slice_type_i，P帧有slice_type_i、slice_type_p，B帧三种⽚都有。

X264的H264视频编码过程可以分为三个步骤：⾸先根据规则判定当前帧的编码类型，如果是B帧，要缓冲存放、获取；然后对待编码图像进⾏帧内预测、帧间预测、整数DCT变换、量化和熵编码；最后把压缩的H264数据进⾏NAL层打包输出。

X264编码器有关的重要结构体：x264_image_t：实际参与编码的编码帧图像信息。

typedef struct{int i_csp; //图像空间颜⾊int i_plane; //图像平⾯数⽬int i_stride[4]; //每个图像平⾯的跨度，也就是每⼀⾏数据的字节数uint8_t *plane[4]; //每个图像平⾯存放数据的起始地址，plane[0]是Y平⾯，plane[1]是U平⾯，plane[2]是V平⾯}x264_image_t; //待编码的图像x264_picture_t：x264编码器定义便于控制的图像帧，描述⼀帧的特征。

包含x264_image_t和x264_param_t结构体。

typedef struct{int i_type; //帧的类型，初始化为auto，在编码过程⾃⾏控制int i_qpplus1; //此参数减1代表当前帧的量化参数值int i_pic_struct; //帧的结构类型int b_keyframe; //输出是否是关键帧int64_t i_pts; //⼀帧的显⽰时间戳int64_t i_dts; //输出解码时间戳x264_param_t *param;x264_image_t img;x264_image_properties_t prop;x264_hrd_t hrd_timing;void *opaque;} x264_picture_t; //x264编码视频帧x264_param_t：初始化编码器。

高清CABAC解码器的优化设计和实现

高清CABAC解码器的优化设计和实现陈杰;丁丹丹;虞露【摘要】Aiming at the problem that the strong data dependency and low parallelism in Context-based Adaptive Binary Arithmetic Coding (CABAC), this paper proposes an optimized real time CABAC decoding architecture for H.264/AVC high profile in HD application. The architecture is based on the two-level storage structure and adopts syntax element prediction and merging strategies, optimizes the decoding decision processing and reuses the de-binarization circuits. Test results show that the architecture achieves a high performance with a low cost, and it is sufficient for HD application in FPGA.%针对基于上下文的自适应二进制算术编码(CABAC)解码过程中数据依赖性强、并行度低的问题,提出一种优化的硬件结构来实现H.264/AVC高级档次高清视频序列的实时解码.该结构基于二级存储结构,采用语法元素合并和预测技术,对解码判决过程进行优化并对反二值化模块的电路进行复用.测试结果表明,该系统在较小的面积下能达到较高的性能,在FPGA上可以满足高清视频序列的实时CABAC 解码需求.【期刊名称】《计算机工程》【年(卷),期】2012(038)023【总页数】4页(P273-276)【关键词】H.264/AVC高级档次;视频编码;基于上下文的自适应二进制算术编码解码;二级存储结构【作者】陈杰;丁丹丹;虞露【作者单位】浙江大学信息与通信工程研究所,杭州310027;浙江大学信息与通信工程研究所,杭州310027;浙江大学信息与通信工程研究所,杭州310027【正文语种】中文【中图分类】TP3911 概述H.264/AVC是MPEG和ITU-T共同制定的新一代高性能视频编码标准，在相同图像质量下，其压缩效率要远远高于 MPEG2、H.263、MPEG4等标准[1]。

x264命令行参数解释

x264命令行参数解释使用格式：x264 默认选项 -o 输出文件输入文件 [长x宽]输入支持格式：RAW/y4m/avi/avs(编译时可选)输出支持格式：264/mkv/mp4(编译时可选)x264的许多参数可以有-/--两种输入法，笔者也不知道为什么。

以下等价参数用“参数1/参数2 <必需数值格式>”表示，参数尾部()内为个人推荐。

-h/--help 帮助帧类型选项：-I/--keyint <整数> 最大IDR帧间距，默认250-i/--min-keyint <整数> 最小IDR帧间距，默认25--scenecut <整数> 画面动态变化限，当超出此值时插入I帧，默认40-b/--bframes <整数> 在IP帧之间可插入的B帧数量最大值，范围0~16，默认0--no-b-adapt 关闭自适应B帧判定(-b设为1时可用，其他不推荐)--b-bias <整数> 控制插入B帧判定，范围-100~+100，越高越容易插入B帧，默认0--b-pyramid 允许B帧做参考帧--no-cabac 关闭内容自适应二进制算术编码(CABAC，高效率的熵编码)(会提高速度，但严重影响质量)-r/--ref <整数> 最大参考帧数，范围0~16，默认1--nf 关闭环路滤波(一种除马赛克算法)-f/--filter <alpha:beta>设置环路滤波的AlphaC和Beta的参数，范围-6-6，默认都为0码率控制选项：-q/--qp <整数> 固定量化模式并设置使用的量化值，范围0~51，0为无损压缩，默认26-B/--bitrate <整数> 设置平均码率--crf <整数> 质量模式，量化值动态可变(目前不太成熟，质量不如设置固定量化值)--qpmin <整数> 设置最小量化值，范围0~51，默认10--qpmax <整数> 设置最大量化值，范围0~51，默认51--qpstep <整数> 设置相邻帧之间的量化值差，范围0~50，默认4--ratetol <小数> 平均码率模式下，瞬时码率可以偏离的倍数，范围0.1~100.0，默认1.0 --vbv-maxrate <整数> 平均码率模式下，最大瞬时码率，默认0(与-B设置相同)--vbv-bufsize <整数> 码率控制缓冲区的大小，单位kbit，默认0--vbv-init <小数> 码率控制缓冲区数据保留的最大数据量与缓冲区大小之比，范围0~1.0，默认0.9--ipratio <小数> I帧和P帧之间的量化系数，默认1.40--pbratio <小数> P帧和B帧之间的量化系数，默认1.30--色度-qp-offset <整数> 色度和亮度之间的量化差，范围-12~+12，默认0-p/--pass <1|2|3> 多次压缩码率控制1：第一次压缩，创建统计文件2：按建立的统计文件压缩并输出，不覆盖统计文件，3：按建立的统计文件压缩，优化统计文件--stats <字符串> 统计文件的名称，默认"x264_2pass.log"--rceq <字符串> 速率控制公式，默认"blurCplx^(1-qComp)"--qcomp <小数> 线性量化控制，0.0为固定码率，1.0为固定量化值，默认0.6，只用于2-pass 和质量模式--cplxblur <小数> 根据相邻帧平滑量化值比例的最大值，范围0~99.9，默认20.0，只用于2-pass和质量模式--qblur <小数> 对统计文件结果平滑量化值比例的最大值,范围0~99.9，默认0.5，只用于2-pass--zones <z0>/<z1>/…分段量化，格式为：<开始帧>,<结束帧>,<选项>，可选项为：q=<整数>(量化值)或b=<小数>(码率倍数)分析选项：-A/--analyse <字符串> 动态块划分方法，默认"p8x8,b8x8,i8x8,i4x4"。

cabac 熵编码

cabac 熵编码
Cabac（Context-Adaptive Bit Allocation Code，自适应比特分配编码）是一种熵编码方法，主要用于图像和视频压缩领域。

它是一种基于上下文的熵编码技术，能够根据图像或视频中的上下文信息自适应地分配比特资源，从而实现更高的压缩比和更好的图像质量。

Cabac编码的主要特点如下：
1. 自适应比特分配：Cabac编码根据图像块的纹理复杂度和边缘信息，自适应地分配比特资源，使得重要的图像细节得到更好的保护。

2. 上下文感知：Cabac编码利用前一帧或当前帧的其他相关像素的信息，为每个像素分配合适的比特数，从而提高编码效率。

3. 编码效率高：与传统的霍夫曼编码相比，Cabac编码具有更高的编码效率，能够在相同的压缩比下实现更好的图像质量。

4. 适应性强：Cabac编码能够适应不同的图像和视频内容，实现高质量的压缩效果。

5. 兼容性好：Cabac编码可以与其他熵编码方法相结合，如LZW、RLZ
等，形成混合编码方案，进一步提高压缩性能。

在我国，Cabac编码技术在数字电视、视频监控等领域得到了广泛应用。

随着压缩技术的不断发展和优化，Cabac编码在图像和视频压缩领域的优势将继续凸显。

图像编码中的熵编码方法详解(一)

图像编码是一门关于将图像数据进行压缩和编码的技术。

熵编码是图像编码中常用的一种方法，其通过统计图像数据中的统计特性，将出现频率较高的像素值编码为较短的二进制码，而出现频率较低的像素值编码为较长的二进制码，从而达到压缩图像数据的目的。

本文将详细介绍熵编码的原理和常见的熵编码方法。

一、熵编码的原理熵编码的原理基于信息论中的熵概念，熵是度量信息量的一个指标，表示一个随机变量平均需要多少信息来表示。

在图像编码中，熵即为图像数据中的不确定性或不规律性，熵越高，图像数据的复杂度越大。

熵编码的目标是利用统计特性将出现频率较高的像素编码为较短的码字，而出现频率较低的像素编码为较长的码字。

这样一来，出现频率较高的像素值编码后的二进制码的长度较短，从而达到压缩图像数据的目的。

二、哈夫曼编码哈夫曼编码是最常见的一种熵编码方法，它通过构建一颗哈夫曼树来实现编码。

首先，统计图像中每个像素值的出现频率，然后构建一颗哈夫曼树。

在哈夫曼树中，出现频率较高的像素值编码为较短的码字，而出现频率较低的像素值编码为较长的码字。

最后，根据构建好的哈夫曼树，对图像数据进行编码。

三、算术编码算术编码也是一种常用的熵编码方法，它将整个图像看作一个整体，通过将图像中的每个像素值产生的条件概率进行累乘，得到整个图像的条件概率。

然后，根据条件概率对图像数据进行编码，编码时通过二分搜索来确定编码的区间。

四、自适应编码自适应编码是一种逐行或逐列扫描整个图像进行编码的方法。

在自适应编码中，每次编码一个像素值，然后根据编码结果来更新编码表，使得出现频率较高的像素值编码为较短的二进制码。

自适应编码的优点是适应性强，可以根据图像的统计特性动态地调整编码结果。

五、总结熵编码是图像编码中的一种重要方法，通过统计图像数据的统计特性，将出现频率较高的像素值编码为较短的码字，从而达到压缩图像数据的目的。

常见的熵编码方法包括哈夫曼编码、算术编码和自适应编码等。

不同的熵编码方法适用于不同的图像数据特性和编码需求，选择合适的编码方法可以提高图像的压缩率。

H264熵编码具体算法

1.CAVLC概念
CAVLC即基于上下文的自适应变长编码。CAVLC的本质是变长编码，它的特性主要体现在自适应能力上， CAVLC可以根据已编码句法元素的情况动态的选择编码中使用的码表，并且随时更新拖尾系数后缀的长度，从而获得极高的压缩比。H.264标准中使用了CAVLC对4*4模块的亮度和色度残差数据进行编码。
解析除拖尾系数外的非零系数的幅值level1确定后缀长度suffixlength2根据码流查表96得到前缀levelprefix3根据前缀和后缀得到levelcodelevelprefixsuffixlengthlevelsuffix4levelcode为偶数levellevelcode22levelcode为奇数levellevelcode125根据设定的阈值确定是否updatesuffixlegth6cavlc与uvlc比较在相同码率的情况下用cavlc编码的psnr的值高于用uvlc编码的psnr的值并且随着比特率的增加cavlc的优势更加明显h264avc68cavlc基于上下文自适应的可变长编码69cabac基于上下文的自适应二进制算术熵编码610码率控制611去方块滤波612其余特征cabac1
∴经查表可知码流为0000100 ∴code=0000100
4.3 编码每个拖尾系数的符号对于每个拖尾系数(±1)只需要指明其符号，
其符号用一个比特表示(0表示+ ，1表示-)。编码的顺序是按照反向扫描的顺序，从高频数据开始。例：设有一个4*4块数据（假定NC=0）
0 3 -1 0
0 -1 1 0
0 3 -1 0 0 -1 1 0
1000
0000 ∴TotalZeros=3 又∵TotalCoeffs(非零系数的数目)=5 ∴查表可得码流为111 ∴code=0000100 011 1 0010 111

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

码理论而言“ ，熵编码”（ｅｎｔｒｏｐｙｃｏｄｉｎｇ）的专业解释是：
● Ｉｎｔｒａ：所有巨大区块（ｍａｃｒｏｂｌｏｃｋ）类型（１６×１６，８ “应用机率方法，将较常出现的数字数据或模型以较少的
×８，４×４全部预测）；
位数来呈现；较少出现者则以较多的位数来呈现，以达
● ＩｎｔｅｒＰ：所有分割（ｐａｒｔｉｔｉｏｎ），从１６×１６递减至到压缩的目的。”Ｈｕｆｆｍａｎ、ｒｕｎｌｅｎｇｔｈ、ＭＰＥＧ－２、ＤＴＳ、Ｄｏｌｂｙ
2006 .12 / 电子与电脑
85
ＣＡＢＡＣ
相机所拍摄到的视频信号是没有稳定的统计特性的。想要获取这些信号的统计特性，大都必须依靠其视频内容和撷取的方法。传统的视频编码技术是将视频信号映像成一个长度可变的位串流（ｂｉｔｓｔｒｅａｍ）──该串流是由程序语法单元产生的。这种方法是有掌握到一些非稳定的统计特性，但是，还无法掌握到全部的统计特性。而且，一个程序语法单元的高次元（ｈｉｇｈｅｒ－ｏｒｄｅｒ）统计相依性，在大多数的视频编码技术中常被忽略。ＣＡＢＡＣ可以提高编码效率，并且能掌握住那些被忽略的统计特性。
与ＡｔｅｍｅＨ．２６４并列冠军。它的编码特性简列于下（特殊与混乱程度的测度。熵的数值越高，则系统越混乱。”
术语，请参见Ｈ．２６４标准的解释）：
“熵”原先是来自于热力学的物理观念，因为它与机
● 支持ＣＡＶＬＣ／ＣＡＢＡＣ熵编码；
率和统计学有关，所以也被引用到信息论中。就信息编
● 多重参考（Ｍｕｌｔｉ－ｒｅｆｅｒｅｎｃｅｓ）；
D数字音像 igital A / V ｘ２６４的ＣＡＢＡＣ熵编码技术
■ 谦君
ｘ２６４是目前被全世界各地专业人士下载次数极高的原始程序代码。ｘ２６４是Ｌｉｎｕｘ社群的杰作，它官方网站位于Ｖｉｄｅｏｌａｎ组织中（ｗｗｗ，ｖｉｄｅｏｎｌａｎ．ｏｒｇ），它同时嘉惠了全球许多厂商和软件工程师。通过它，我们可以揭开Ｈ．２６４／ＡＶＣ的大部份技术秘密，加快视频产品的应用与开发速度。这是过去Ｈ．２６３标准在公布之后几年内，未曾有过的体验。
ｘ２６４的特性
（ａｒｂｉｔｒａｒｙｆｒａｍｅｏｒｄｅｒ）； ● ８ｔｒａｎｓｆｏｒｍ）； ● 无损模式（ｌｏｓｓｌｅｓｓｍｏｄｅ）； ● 可定制的量化矩阵（ｃｕｓｔｏｍｑｕａｎｔｉｚａｔｉｏｎｍａｔｒｉｃｅｓ）； ● 多重切割的平行编码（ｐａｒａｌｌｅｌｅｎｃｏｄｉｎｇｏｆｍｕｌｔｉｐｌｅ
● 将Ｂ－ｆｒａｍｅｓ当作参考点，或随意的讯框顺序
84
CompoTe ch China / 2 006. 12
数字音像 Digital A / V
二进制算数编码”（Ｃｏｎｔｅｘｔ－ｂａｓｅｄＡｄａｐｔｉｖｅＢｉｎａｒｙＡｒｉｔｈ－ｍｅｔｉｃＣｏｄｉｎｇ），这两者都属于“无损式熵编码”（ｌｏｓｓｌｅｓｓｅｎｔｒｏｐｙｃｏｄｉｎｇ）。
ｘ２６４是用软件来实现ＣＡＢＡＣ的功能，这在它的程序代码中可以清楚理解。至于Ｈ．２６４编译码芯片则是将ＣＡＢＡＣ以及其它功能区块以硬件实现的，由于每家芯片公司的设计方法不同，Ｈ．２６４编译码芯片的内部架构也会有所差异。但是，它们都须遵照Ｈ．２６４的技术标准。
表：ＣＡＢＡＣ的主要特性
图１：ＣＡＢＡＣ的环境建模
ＣＡＢＡＣ是ＩＴＵ－Ｔ｜ＩＳＯ／ＩＥＣ的Ｈ．２６４／ＡＶＣ标准的一部份，它是被“影像通信群组”（ＩｍａｇｅＣｏｍｍｕｎｉｃａｔｉｏｎＧｒｏｕｐ；ＩＣＧ）开发出来的。简言之，ＣＡＢＡＣ是结合“可适应式二进制算数编码”和“环境建模”（ｃｏｎｔｅｘｔｍｏｄｅｌｉｎｇ）技术，可以达到适应性极强和减少“赘码”（ｒｅｄｕｎｄａｎｃｙ）的产生。ＣＡＢＡＣ的架构还包含了一个新的低复杂度的二进制算数编码方法，以及机率预估方法，这很适合以高效
图２：ＣＡＢＡＣ的二进制运算
率的硬件和软件来实现它。ＣＡＢＡＣ比一般水准（ｂａｓｅｌｉｎｅ）的Ｈ．２６４／ＡＶＣ熵编码技术优异，对视频广播而言，ＣＡＢＡＣ的视频品质大约是３０ｄＢ～３８ｄＢ，平均的位速率可以降低到９％～１４％。ＣＡＢＡＣ的主要特性如表１所示。图１是ＣＡＢＡＣ的环境建模的一个范例。它可以取得“运动向量的绝对值”（ｍｏｔｉｏｎｖｅｃｔｏｒａｂｓｏｌｕｔｅｖａｌｕｅ；ＭＶ）。图２是ＣＡＢＡＣ的二进制运算。
４×４；
Ｄｉｇｉｔａｌ、ＭＬＰ等都属于“熵编码”。
● ＩｎｔｅｒＢ：从１６×１６递减至８ｘ８的分割（包含跳略／
如前述，ｘ２６４使用ＣＡＶＬＣ／ＣＡＢＡＣ熵编码技术。这
直接）
种视频编译码技术是收集依时间变化的符号（ｓｙｍｂｏｌ）的统
● 速率控制：固定定量器（ｃｏｎｓｔａｎｔｑｕａｎｔｉｚｅｒ），单计数据，以及在这些符号之间存在的相依特性之统计数
一或多通ＡＢＲ，可选择的ＶＢＶ；
据，来达到减少位速率的目标。ＣＡＶＬＣ的全名是“可适
● 画面切割侦测（ｓｃｅｎｅｃｕｔｄｅｔｅｃｔｉｏｎ）；
应环境的长度可变式编码”（ＣｏｎｔｅｘｔＡｄａｐｔｉｖｅＶａｒｉａｂｌｅ
● 可适性的Ｂ－ｆｒａｍｅ配置；
ＬｅｎｇｔｈＣｏｄｉｎｇ），ＣＡＢＡＣ的全名是“植基于环境的可适性
ｓｌｉｃｅｓ）。
熵编码
２００５年１２月２６日，ｘ２６４通过Ｄｏｏｍ９组织（ｗｗｗ．
在汉语字典中“ ，熵”（ｅｎｔｒｏｐｙ）是外来语（应该是日文
ｄｏｏｍ９．ｏｒｇ）的编解码测试，并勇夺冠军。而且，在２００５汉字），它的拼音是ｄｉ。不过， “ｄｉ”是它的异译，正确的
年１２月１２日第二届ＭＳＵＭＰＥＧ－４ＡＶＣ／Ｈ．２６４比赛中，拼音应该是“ｓｈａｎｇ ”，其意义是：“对一个系统中无次序