多媒体数据压缩编码的国际标准
- 格式:doc
- 大小:108.00 KB
- 文档页数:12
mp3的国际标准
MP3(MPEG-1 Audio Layer 3)是一种常见的音频压缩格式,它有一系列的国际标准,包括:
1.MPEG-1标准:MP3最初是作为MPEG-1标准的一部分开发
的。
MPEG(Moving Picture Experts Group)是一个国际标准组
织,它制定了多媒体数据压缩的一系列标准。
MP3是MPEG-1
标准中的音频压缩部分。
2.MPEG-2标准:MP3的改进版本和扩展,如MP3Pro和AAC
(Advanced Audio Coding),是基于MPEG-2标准的。
MPEG-
2是对MPEG-1标准的扩展,适用于更广泛的应用,包括广播
和数字电视。
3.MPEG-2.5标准:MPEG-2.5是MPEG-2的一个补充标准,它包
括对较低比特率的音频流的支持,允许更高的压缩程度。
这对
于便携式播放器和互联网音乐传输非常有用。
4.ISO/IEC标准:MP3还有与国际标准化组织(ISO)和国际电工
委员会(IEC)合作制定的标准。
ISO/IEC 11172-3和ISO/IEC 13818-3等标准规定了MP3的技术细节,包括位流格式、音频
编码算法等。
这些标准规定了MP3的技术规范,包括音频压缩方法、采样率、比特率、声道配置等,以确保不同设备和软件之间的兼容性。
需要注意的是,尽管MP3在过去是一种主要的音频格式,但由于其他高效的音频编码格式的出现,如AAC,MP3在某些领域已经不再是首选
格式。
然而,MP3仍然是广泛使用的音频格式之一。
专题四:多媒体基础班级:学号:姓名:一、题型分析1.基础知识题:以多媒体基础知识的转换为核心,包括特征、软硬件、规划和设计等(1)知识梳理:①多媒体技术有三个显著的特征:集成性、交互性、实时性;②软硬件:A 常见硬件:CD—ROM驱动器、音频卡、视频卡、扫描仪、数码相机、数码摄像机等B 多媒体软件根据它的应用层面可以分为多媒体操作系统、多媒体数据采集和编辑软件、多媒体创作和集成软件三大部分多媒体数据采集和编辑软件有:Windows系统附件中的“录音机”、goldwave、PhotoShop、Flash、3DSMAX、Premiere多媒体创作和集成软件有:Authorware、Flash、PowerPoint、VB以页为基础的创作工具(ToolBook、PowerPoint);以图标和流程图为基础的创作工具(Authorware、IconAuthor);以时间为基础的创作工具(Flash 、Director);以程序语言为基础的创作工具(Visual Basic、Visual C++)③多媒体作品设计的一般步骤:需求分析、规划设计、脚本编写A 需求分析包括应用需求分析和创作需求分析B 规划设计包括系统结构设计和功能模块设计C 脚本编写:编写脚本大纲→文字脚本→动作脚本→元素媒体分解(2)例题分析:例1:小红从网络下下载了关于浙江旅游的多媒体作品,其文件名为“zjlv.pptx”,则制作该作品的创作工具是()A.以程序语言为基础B.以页为基础C.以时间为基础D.以图标为基础2.多媒体数据压缩题:以数据压缩的转换为核心,包含冗余类型、文件格式等(1)知识梳理:①数据压缩——可行理由:数据本身存在冗余、允许少量失真A 区分四种冗余:空间、结构、时间、视觉B压缩分为有损压缩、无损压缩。
JPEG(静态)、MPEG(动态)等属于有损压缩,用WINRAR 和WINzip等软件压缩属于无损压缩。
常用的多媒体数据编码和压缩的国际标准有:JPEG标准、MPEG标准、P*64标准②文件格式:A 文本文件:.txt;.doc(.docx).wps;.html;.pdfB 图形文件:.bmp;.jpg;.gif;.psd;.pngC 声音文件:.wav;.mid;.mp3D 动画文件:.flc;.gif;.fla;.swfE 视频文件:.avi;.mpg;.mov;.flv(2)例题分析:例2:关于数据压缩下列说法正确的是()A.数据之所以被压缩是因为数据本身存在着冗余,压缩不允许失真B.图像量化超出人类对图像的分辨能力体现了视觉冗余C.算法要简单是衡量压缩技术好坏的技术指标之一,压缩是解码过程D.JPEG是动态图像的压缩标准例3:小丽同学准备制作一个多媒体作品,其媒体元素分解表如下:已获取的素材文件有hy.jpg、bj.swf、wz.txt、sy.wav,其中填入表中①②③④位置的文件顺序正确的是()A.hy.jpg、bj.swf、wz.txt、sy.wav B.bj.swf、wz.txt 、sy.wav、hy.jpgC.sy.wav、hy.jpg、bj.swf、wz.txt D.wz.txt、bj.swf、hy.jpg、sy.wav3.声音编辑题:以GOLDWA VE为核心,结合声音的容量计算(1)知识梳理:①声音数字化:采样与量化采样频率;量化位数。
MP4AVC简介MP4AVC是一种视频压缩编码格式,也被称为MPEG-4 AVC(Advanced Video Coding)。
它是一种被广泛应用于数字媒体的视频压缩标准,旨在提供更高质量的视频和更低的比特率。
MP4AVC是一种基于块的编码方法,该方法使用帧内和帧间预测来减小视频的空间冗余。
通过使用运动矢量预测来移除帧间的冗余信息,并采用离散余弦变换(DCT)和量化方法来减小帧内的冗余。
MP4AVC具有高效的压缩比率和优秀的视频质量,因此被广泛应用于各种领域,包括数字电视广播、视频会议、多媒体应用、在线流媒体和移动通信等。
主要特性高压缩比MP4AVC使用一系列高级技术来实现高效的视频压缩。
其中包括变长编码(VLC)、上下文自适应变长编码(CAVLC)、运动估计和补偿、空间预测和变换编码等等。
这些技术有效地减小了视频数据的体积,提供了出色的压缩比率。
优秀的视频质量尽管 MP4AVC 使用了较高层次的压缩技术,但它仍能提供出色的视频质量。
这一点得益于其使用的运动矢量预测和空间预测方法,以及高级的变换编码技术。
这些技术减少了图像噪点和伪影,从而提高了视频的视觉质量。
现实时间传输MP4AVC非常适合现实时间传输,因为它可以在低带宽网络环境下提供高质量的视频传输。
这对于视频会议、实时监控和在线流媒体等应用非常重要。
平台兼容性MP4AVC是一个通用的视频编码标准,它可以在各种平台上使用,包括桌面计算机、移动设备和嵌入式系统等。
这种平台兼容性使其成为一种非常灵活和广泛应用的视频编码格式。
应用场景数字电视广播MP4AVC已成为数字电视广播领域的主流视频编码标准。
它能够在有限的带宽下提供高质量的视频传输,使用户可以享受到更清晰、更流畅的观看体验。
视频会议MP4AVC在视频会议中也得到广泛应用。
它可以在低带宽网络环境下实现高质量的视频传输,使参与者能够进行清晰、流畅的实时视频通话。
多媒体应用MP4AVC是多媒体应用中常用的视频编码格式之一。
mpeg视频压缩标准MPEG视频压缩标准。
MPEG(Moving Picture Experts Group)是一种数字视频压缩标准,它可以将视频信号的数据量减少到原来的1/50至1/100,而图像质量几乎没有损失。
MPEG视频压缩标准主要分为MPEG-1、MPEG-2、MPEG-4等几个版本,每个版本都有其特定的应用领域和优势。
本文将对MPEG视频压缩标准进行详细介绍。
MPEG-1是最早的MPEG压缩标准之一,它主要用于VCD(Video CD)的制作。
MPEG-1的压缩比约为26:1,适合于低码率的视频传输,但对于高清视频来说压缩效果并不理想。
MPEG-1的视频分辨率为352×240(NTSC)或352×288(PAL),音频采样率为44.1kHz。
由于其压缩效率较低,MPEG-1已经逐渐被MPEG-2和MPEG-4所取代。
MPEG-2是一种更为先进的视频压缩标准,它主要用于DVD、HDTV(High Definition Television)等高清视频的制作和传输。
MPEG-2的压缩比约为50:1,支持多种分辨率和帧率的视频,适用范围更广。
MPEG-2的音频采样率为48kHz,支持多达5.1声道的环绕声效果。
由于其高压缩比和良好的图像质量,MPEG-2成为了广播电视和影视制作领域的主流压缩标准。
MPEG-4是一种更为灵活和高效的视频压缩标准,它支持多媒体数据(如视频、音频、图形等)的压缩和传输。
MPEG-4可以根据不同应用场景的需求,采用不同的压缩算法和参数,因此可以适用于各种不同的应用领域。
MPEG-4的压缩比和图像质量都比MPEG-2更为出色,适用于互联网视频、移动多媒体通信等新兴领域。
除了以上几种主要的MPEG压缩标准之外,还有一些衍生的标准和技术,如MPEG-7(多媒体内容描述标准)、MPEG-21(多媒体框架标准)等,它们在多媒体内容的描述、存储、检索和交互等方面发挥着重要作用。
多媒体技术知识整理1.1.1 多媒体的含义和分类1、媒体的定义:人们用来与外界沟通和交流各种信息的载体,或者说是信息传递和信息存储的最基本的手段。
2、强调媒体的两层含义:一是存储信息的实体,二是指传递信息的载体,多媒体技术主要指后者。
3、国际通用定义媒体的分类:感觉、表示、显示、存储和传输五种媒体,信息源流最丰富的媒体(感觉媒体),最主要的媒体(表示媒体)。
4、表示媒体通常包含的几种媒体(多媒体数据的分类)文本:最基本声音(音频):三种表现形式(解说词、音效、背景音乐),具有很强的前后相关性,数据量大,实时性强图片、图像:图像主要以位图形式存放,是一种最基本的形式,图片一般以向量图形式存在。
视频影像:(静态和动态,真实的画面)动画:移动的主观设计的绘画(二维平面、三维立体),根据制作方法分为造型和帧动画两类。
05年高考题:分别指出WINDOWS系统中下列工具软件所处理的媒体,记事本(文本)、画图(图像)、录音机(声音)、CD唱机(声音)、媒体播放器(音频、视频)。
填空:___________、声音、图形、图像和动画等信息载体中的两个或多个的组合成为多媒体。
单:下列不属于多媒体技术中的媒体的范围是(A 存储信息的实体B 信息的载体 C 文本D 图像)A超文本是一个什么样的结构(A顺序的树形B非线性的网状C线性的层次D随机的链式)B 1.1.2 多媒体技术的概念1、多媒体技术的含义:以计算机技术为基础,综合处理图像、文本、声音、动画等多种媒体信息、具有交互式的综合与实时处理多种媒体信息的计算机系统,具有集成性、交互性和实时性的特点。
2、多媒体技术的基本特征:集成性(综合性)、交互性、实时性。
集成性注意把握处理媒体的设备的集成和多种类型数据的集成化处理两个方面,了解创作的含义,基类媒体的概念。
05年高考题:多媒体作品与影视作品的主要区别是(A、共享性B集成性C交互性D传播性) C交互性是多媒体技术最基本的特征。
⽬前主流的⼏种数字视频压缩编解码标准(转载)上⼀篇主要讲了H.264,接下来我们看⼀下其他编解码标准。
参看:参看:参看:JPEG联合图⽚专家组(JPEG,Joint Photographic Experts Group)是作为国际标准化组织(ISO)与电报电话国际协会(CCITT,国际电信联盟ITU的前⾝)的联合⼯作委员会于1987年成⽴的,于1988年成⽴JBIG(Joint Bi-level Image Experts Group),现在同属ISO/IECJTC1/SC29 WG1(ITU-T SG8),专门致⼒于静⽌图⽚(still images)压缩。
JPEG已开发三个图像标准。
第⼀个直接称为JPEG标准,正式名称叫“连续⾊调静⽌图像的数字压缩编码”(Digital Compression and Coding of Continuous-tone still Images), 1992年正式通过。
JPEG开发的第⼆个标准是JPEG-LS(ISO/IEC 14495, 1999)。
JPEG-LS仍然是静⽌图像⽆损编码,能提供接近有损压缩压缩率。
JPEG 的最新标准是JPEG 2000(ISO/IEC 15444, 等同的ITU-T编号T.800),于1999年3⽉形成⼯作草案,2000年底成为正式标准(第⼀部分)。
根据JPEG专家组的⽬标,该标准将不仅能提⾼对图像的压缩质量,尤其是低码率时的压缩质量,⽽且还将得到许多新功能,包括根据图像质量,视觉感受和分辨率进⾏渐进传输,对码流的随机存取和处理,开放结构,向下兼容等。
JPEG标准制定了四种⼯作模式:(1)顺序的基于DCT(Sequential DCT-based )模式,由DCT(离散余弦变换)系数的形成、量化和熵编码三步组成。
从左到右,从上到下扫描信号,为每个图像编码。
(2)累进的基于DCT(Progressive DCT-based)模式,⽣成DCT系数和量化中的关键步骤与基本顺序编码解码器相同。
多媒体知识点MicrosoftWord文档高二会考信息技术知识点+习题1、多媒体的含义媒体在计算机领域有两种含义:一是指存储信息的实体,如磁盘,光盘,磁带,半导体存储器等,中文常译为介质;二是指信息的表达方式,如文本,声音,图形和图像等,中文译作媒介,多媒体技术中的媒体是指后者,从字面上看,多媒体是由单媒体复合而成的。
2.多媒体及多媒体技术的概念:多媒体是指对多种媒体的综合,多媒体技术是指以计算机为平台综合处理多种媒体信息。
通常情况下,多媒体不仅指多媒体本身,也包括多媒体技术。
多媒体技术的主要特征表现:数字化、集成性、交互性、非线性、多样性。
多媒体的发展始于20世纪80年代。
多媒体的关健性技术包括以下几个方面:(1)数据压缩和解压缩技术;(2)大容量存储技术; (3)超大规模集成电路控制技术与专用芯片;(4)多媒体同步技术;(5)多媒体系统平台技术;多媒体的相关技术包括以下几个方面:(1)超文本与超媒体技术:传统文本是以线性方式组织的,而超文本是以非线性方式组织,超文本(超媒体)以节点为单位,节点之间以链连接而形成网络,其构成的三要素:节点、链、网络。
(2)多媒体网络与通信技术(3)智能输入与输出技术(4)多媒体软件技术多媒体技术的发展特点:多学科交汇; 顺应信息时代的需要; 促进和推动新产业的形成和发展; 多领域应用;3、多媒体技术的主要特征数字化:多媒体信息必须是数字信息。
数字化是多媒体信息处理的必然要求。
集成性:主要是指不同的媒体信息合理协调的结合在一起,形成一个完整的整体。
多样性:信息载体的多样性;处理输入信息的多样性。
交互性:指人可以介入到多种媒体加工,处理的过程中,从而使用户更有效的控制和应用各种媒体信息。
非线性:多媒体的信息结构形式一般是状结构。
4、多媒体应用各种各样的多媒体应用系统:多媒体信息咨询系统、多媒体辅助教育系统、多媒体电子出版物、多媒体视频会议系统、多媒体远程诊医系统、、多媒体视频点播系统、交互式电视、数字化图书馆、多媒体邮件、多媒体训练系统、虚拟现实。
MPEG标准主要有以下五个,MPEG-1、MPEG-2、MPEG-4、MPEG-7及MPEG-21等。
该专家组建于1988年,专门负责为CD建立视频和音频标准,而成员都是为视频、音频及系统领域的技术专家。
及后,他们成功将声音和影像的记录脱离了传统的模拟方式,建立了ISO/IEC1172压缩编码标准,并制定出MPEG-格式,令视听传播方面进入了数码化时代。
因此,大家现时泛指的MPEG-X版本,就是由ISO(International图一Organization for Standardization)所制定而发布的视频、音频、数据的压缩标准。
MPEG标准的视频压缩编码技术主要利用了具有运动补偿的帧间压缩编码技术以减小时间冗余度,利用DCT技术以减小图像的空间冗余度,利用熵编码则在信息表示方面减小了统计冗余度。
这几种技术的综合运用,大大增强了压缩性能。
MPEG-1MPEG-1标准于1992年正式出版,标准的编号为ISO/IEC11172,其标题为“码率约为1.5Mb/s用于数字存贮媒体活动图像及其伴音的编码”。
MPEG-1层1 数字盒式录音带MPEG-1层2 DAB,VCDMPEG-1层3 Internet,MP3音乐MPEG-1 audio layer 1类型:Audio制定者:MPEG所需频宽:384kbps图二压缩率 4:1特性:编码简单,用于数字盒式录音磁带,2声道,VCD中使用的音频压缩方案就是MPEG-1层Ⅰ。
优点:压缩方式相对时域压缩技术而言要复杂得多,同时编码效率、声音质量也大幅提高,编码延时相应增加。
可以达到“完全透明”的声音质量(EBU音质标准)缺点:频宽要求较高应用领域:voip版税方式:Free备注:MPEG-1声音压缩编码是国际上第一个高保真声音数据压缩的国际标准,它分为三个层次:--层1(Layer 1):编码简单,用于数字盒式录音磁带--层2(Layer 2):算法复杂度中等,用于数字音频广播(DAB)和VCD等--层3(Layer 3):编码复杂,用于互联网上的高质量声音的传输,如MP3音乐压缩10倍MUSICAM(MPEG-1 audio layer 2,即MP2)类型:Audio制定者:MPEG所需频宽:256~192kbps压缩率 8:1--6:1特性:算法复杂度中等,用于数字音频广播(DAB)和VCD等,2声道,而MUSICAM由于其适当的复杂程度和优秀的声音质量,在数字演播室、DAB、DVB等数字节目的制作、交换、存储、传送中得到广泛应用。
MPEG标准简介介绍MPEG编码标准的发展过程,简要介绍MPEG-1、MPEG-2、MPEG-4、MPEG-7、MPEG-21等几个标准的基本特点和应用。
MPEG是国际标准化组织下的MPEG活动图像专家组(Moving Picture Experts Group),于1988年成立,是一个为数字视频、音频之制定压缩标准的组织。
MPEG组织最初得到的授权是制定用于“活动图像”编码的各种标准,随后扩充为“及其伴随的音频”及其组合编码。
后来针对不同的应用需求,解除了“用于数字存储媒体”的限制,成为现在制定“活动图像和音频编码”标准的组织。
目前为止,在视频压缩领域MPEG成为最热也是应用最多的压缩技术。
随着互联网和宽带的发展,MPEG技术越来越多的在各个领域得到应用。
MPEG的任务是开发运动图像及其声音的数字编码标准,目前已提出MPEG-1、MPEG-2、MPEG-4、MPEG-7和MPEG-21标准。
MPEG-1:数字电视标准,1992年正式发布。
MPEG-2:数字电视标准。
MPEG-3:已于1992年7月合并到高清晰度电视(High-Definition TV,HDTV)工作组。
MPEG-4:多媒体应用标准(1999年发布)。
MPEG-7:多媒体内容描述接口标准(正在研究)。
1、MPEG-1标准及其应用MPEG-1标准于1993年8月公布,是针对1.5Mbps以下数据传输率的数字存储媒质运动图像及其伴音编码的国际标准。
它提供的重要特性包括基于帧的视频随机访问,通过压缩比特流的快进/快退搜索,视频的倒放,以及压缩比特流的可编辑性。
MPEG1用于在CD—ROM上存储同步和彩色运动视频信号。
可优化为中等分辨率,并在其优化模式下,采用所谓的标准交换格式(SIF)。
MPEG1现已成为常规视频标准的一个子集,该子集称为CPB流。
基本的MPEG-1视频压缩技术基于宏快结构、运动补偿和宏块的有条件倒填。
MPEG1对色差分量采用4∶1∶1的二次采样率。
多媒体数据压缩编码的国际标准国际标准化协会( ISO),国际电子学委员会(IEC),国际电信协会(ITU)等国际组织,于90年代领导制定了三个重要的多媒体国际标准,①JPEG标准,②H.261标准;③MPEG 标准。
我们在概述中只对这三个标准的制定做简单的介绍:静态图像压缩编码的国际标准(JPEG)联合图像专家小组,多年来一直致力于标准化工作,他们开发研制出,连续色调、多级灰度、静止图像的数字图像压缩编码方法。
这个压缩编码方法称为JPEG算法。
JPEG算法被确定为JPEG国际标准,它是国际上,彩色、灰度、静止图像的第一个国际标准。
JPEG标准是一个适用范围广泛的通用标准。
它不仅适于静图像的压缩;电视图像序列的帧内图像的压缩编码,也常采用JPEG压缩标准。
在JPEG编码中用到了我们已学过的变换编码、预测编码和熵编码等原理和方法。
这一章前面几节讲的内容是这一部分的基础。
因此我们把重点放在JPEG的编码算法的具体实现上。
JPEG 标准定义了两种基本压缩算法:一是:基于DCT 变换有失真的压缩算法。
二是:基于空间预测编码DPCM的无失真压缩算法。
我们将重点讲述基于DCT变换有失真的压缩算法。
1.基于离散余弦变换(DCT)的有失真压缩编码(1)基于DCT的有失真编码处理过程图基于DCT解码器处理步骤首先来看"基于DCT的编码器处理步骤"图。
从这幅图我们可以看出JPEG编码的处理过程,从总的来说是这样的:对于一幅图像首先将其分成许多个"8×8"的小块,也就是每个小块有8×8=64个像素;分成多少个小块要看图像的分辨率,分辨率高,分的块就多,分辨率小,分的块就少。
然后对(每一个)8×8的块进行DCT变换(二维),经过DCT变换后就得到频域的64个离散余弦变换系数,得到64个离散余弦变换系数后,要对这64个系数进行量化,量化是根据"表说明"也就是量化表进行的,量化表是JPEG组织根据人的眼睛视觉特性规定好的,直接用量化表去除得到的64个系数就是量化,量化后得到的仍是一个(8×8)64的系数,而这一系数已是低频集中在左上角的一个8×8的系数了。
最后再利用熵编码表对其进行熵编码,熵编码后的到的就是已压缩的图像数据。
这是一个总的过程,我把刚才说的归纳如下:(2)基于DCT的有失真编码处理总过程:在对总体有了一个认识后,再细说各部分是如何具体实现的。
(3)各步骤的具体实现① 将图像分成8×8的块对于第一步,将图像分成8×8的块,我们想解释的是:按什么次序分?是按从左到右,从上到下的次序来分,并按该顺序送入DCT编码器,一个接一个的变换。
第二个要说的是:被压缩的图像可以是黑白图像,也可以是彩色图像,对于黑白图像每小块只有64个灰度值作为下一步的输入;对于彩色图像不仅要有64个亮度值,而且还有色差值,这两种值要分别做DCT变换。
分法:从左到右,从上到下黑白图像:64个灰度值彩色图像:64个亮度分量,64个色差分量例如:分辨率为576行×720列的彩色图像有亮度子块:576/8×720/8=6480个有色差子块:576/8×360/8=3240图像分成8×8的块② 进行DCT变换JPEG在编码时用的是离散余弦正变换(FDCT)其数学表达式为:FDCT变换:(1)(1)式中:其输入数据是:把原始图像分成8×8的多个子块的同时将原始图像的采样数据从无符号整数变成有符号的整数。
即若采样精度为P位,采样数据在范围内,则变换成在范围内,以此作为DCT的输入。
输出数据是:DCT变换系数--64个基信号的幅值。
每个8×8二维源图像采样数据块,实际上是64点离散信号,该信号是空间二维参数x和y的函数。
FDCT把这些信号作为输入,然后把它分解成64个正交基信号,每个正交基信号对应于64个独立二维(2D)空间频率中的一个,这些空间频率是由输入信号的频谱组成。
FDCT的输出是64个基信号的幅值,或称DCT系数,每个系数值由64点输入信号唯一地确定。
即离散余弦变换的变换系数。
2. 量化量化的方法:JPEG在JPEG标准中采用线性均匀量化器。
均匀量化我们已经讲过了,在此稍提一下:就是"多到一"的映射,它的定义为:·均匀量化定义为,对64个DCT变换系数,除以量化步长,四舍五入取整,如下:(2)其中是量化器步长。
比如:下图是均匀量化的特性图,表示当输入值在“0--0.5”时量化输出的的结果为"0";当输入值在“0.5--1.5”时(4舍5入)量化输出的的结果为"1"。
这样实现多到一的映射。
图4.27 量化特性量化器步长是量化的关键,JPEG标准给出了一个参考标准--量化表,量化表就是给出了量化步长。
量化器步长应如何定义呢?人的眼睛对亮度比较敏感,对色差不敏感,对亮度和色差采用不同的量化步长。
因而有了亮度量化表和色度量化表,这两张表如下:亮度量化表色度量化表从这两张表可以看出,对亮度的量化步长划分的"细"一些,对色度的量化步长划分的"粗"一些;两张表都是在低频部分(左上角)步长小一些,在高频部分(右下角)步长大许多。
因为DCT变换后能量大部分集中在左上角,所以对其细一些。
这样一量化,量化就是用DCT系数除以量化表。
那么量化后高频部分会出现一些"0",就实现了压缩,而且失真也就是在此发生的。
再强调一下,JPEG标准的具体做法是用64个DCT系数除以(一一对应)量化表中的64个数。
下一步对量化后的结果进行熵编码3. DC系数的编码和AC系数的行程编码在做熵编码之前,先明确两个概念:DC系数和AC系数。
量化后得到的仍是64个系数,量化并没有改变系数的性质。
大家知到DCT变换是将数据域从时(空)域变换到频域,在频域平面上变换系数是二维频域变量u和v的函数。
对应于u=0,v=0的系数,称做直流分量,即DC系数,其余63个系数称做AC系数,即交流分量。
如图,红点位置上的系数就是直流系数,其它63个绿点位置上的系数就是交流分量。
DC系数:对应于u=0,v=0的系数,称做直流分量,即DC系数。
AC系数:其余63个系数称做AC系数,即交流分量。
DC系数是64个图像采样平均值。
因为在一幅图像中像素之间的灰度或色差信号变化缓慢,相邻的8×8块之间有更强的相关性,所以相邻块的DC系数值很接近,对量化后前后两块之间的DC系数差值,进行编码,可以用较少的比特数。
DC系数包含了整个图像能量的主要部分,远离直流系数的高频交流系数大多数为零或趋于零。
例如,下图是某一特定8×8图像块的量化后的DCT系数。
可见DC系数值最大,离直流系数远的大部分都为零。
例如,图4.28是某一特定8×8图像块的量化后的DCT系数。
48 12 0 0 0 0 0 0-10 8 0 0 0 0 0 02 0 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 08×8量化后的系数图示的数据大部分都是"0",用那一种编码来表示它呢?既能表示出系数的相对位置有能说明系数的值,而且编码效率又比较高。
JPEG中对交流分量用了一个"Z"字型编码解决了这一问题。
所谓"Z"字型编码就是编码时从左上方开始,沿箭头方向,以"Z"字形行程扫描,直到扫描结束。
"Z"字形排列沿"Z"字形路径行进,可使值为"0"AC系数集中,在这种情况下使用行程编码方法更有效。
63个AC系数行程编码的码字,可用两个字节表示,如图所示。
AC系数行程编码的码字4. 熵编码为了进一步达到压缩数据的目的,需对量化后的DC系数,和行程编码后的AC系数进行基于统计特性的熵编码。
JPEG建议使用两种熵编码方法:哈夫曼(Huffman)编码和自适应二进制算术编码(Adaptive Binary Arithmetic Coding)。
熵编码可分成两步进行,首先把DC和AC系数转换成一个中间格式的符号序列,然后给这些符号赋以变长码字。
(1)熵编码的中间格式表示对交流系数AC的中间格式,由两个符号组成。
符号1(行程,尺寸)符号2(幅值)这个中间格式符号就是上面所说的AC系数行程编码的码字。
可以这样理解:符号1就是:第一个字节(NNNN--行程,SSSS--尺寸)符号2就是:第二个字节(幅值--下一个非零值的实际值。
)在这需说明的是:关于符号1:当两个非零AC系数之间连续零的个数超过15时,用增加扩展符号1"(15,0)"的个数来扩充。
对于8×8块的63个AC系数最多增加三个"(15,0)"扩展符号1。
块结束(EOB)以(0, 0)表示。
关于符号2直接用二进制数编码表示,若幅值为负数用反码表示。
对于直流分量DC系数的差,符号1只代表尺寸信息,用以表示DC系数差值的幅值所需的比特数;符号2表示差值的幅值大小,(2)可变长度熵编码可变长度熵编码就是对符号1、2对序列的统计编码。
对DC系数和AC系数中的符号1,查"哈夫曼码表"进行编码。
"哈夫曼变长码表"和"哈夫曼变长整数表"是JPEG标准制定的。
必须作为JPEG编码器的一部分输入。
设"NNNN"的值为"n",SSSS的值为"s"则符号1可以写成符号1(n,s)例如符号1(3,4)表示非零两个符号之间有3个"0",下一个非零符号用4比特,对符号1的编码就是在"AC系数表中,查3/4所对应的编码。
/jxzy/jsfc/lzm/dmt/kcjs/js.htm/jxzy/jsfc/lzm/dmt/kcjs/ch04/js4-6-1.htm。