多媒体压缩技术
- 格式:doc
- 大小:33.50 KB
- 文档页数:3
多媒体技术第二讲多媒体数据压缩技术(第1—2节)课堂笔记及练习题主题:第二讲多媒体数据压缩技术(第1—2节)学习时间: 4月4日--4月10日内容:第二讲多媒体数据压缩技术第一节多媒体数据和信息转换一、多媒体间的信息转换为了便于交流信息,需要对不同的媒体信息进行转换。
下表是部分媒体之间说明:*易**较困难***很困难二、多媒体数据文件格式多媒体文件的格式很多,下表介绍常用文件格式的特点和应用场合。
三、多媒体数据的信息冗余多媒体计算机系统主要采用数字化方式,对声音、文字、图形、图像、视频等媒体进行处理。
数字化处理的主要问题是巨大的数据量。
一般来说,多媒体数据中存在以下种类的数据冗余:1)空间冗余:一些相关性的成像结构在数字化图像中就表现为空间冗余。
2)时间冗余:两幅相邻的图像之间有较大的相关性,这反映为时间冗余。
3)信息熵冗余(编码冗余):信息熵是指一组数据所携带的信息量。
如果图像中平均每个像素使用的比特数大于该图像的信息熵,则图像中存在冗余,这种冗余称为信息熵冗余。
4)结构冗余:有些图像从大域上看存在着非常强的纹理结构,例如布纹图像和草席图像,我们说它们在结构上存在冗余。
5)知识冗余:有许多图像的理解与某些基础知识有较大的相关性。
这类规律性的结构可由先验知识和背景知识得到,我们称此类冗余为知识冗余。
6)视觉冗余:人类视觉系统对于图像场的任何变化,并不是都能感知的。
这类冗余我们称为视觉冗余。
7)其他冗余:例如由图像的空间非定常特性所带来的冗余。
以上所讲的是多媒体数据的信息冗余。
设法去掉信号数据中的冗余,就是数据压缩。
第二节常用的数据压缩技术一、数据压缩编码方法1)根据解码后数据与原始数据是否完全一致来进行分类:① 可逆编码(无失真编码),如Huffman编码、算术编码、行程长度编码等。
② 不可逆编码(有失真编码),常用的有变换编码和预测编码。
2)根据压缩的原理进行划分:① 预测编码:它是利用空间中相邻数据的相关性,利用过去和现在出现过的点的数据情况来预测未来点的数据。
多媒体数据的压缩与传输优化技术随着科技的迅猛发展和互联网的普及,多媒体数据的传输需求越来越高。
然而,传输大量的多媒体数据不仅需要大量的带宽资源,还需要考虑数据压缩和传输优化技术,以提高传输效率。
本文将探讨多媒体数据的压缩与传输优化技术,并讨论它们在不同领域的应用。
一、多媒体数据的压缩技术多媒体数据压缩技术是将多媒体数据的冗余信息去除,以减少数据的存储空间和传输带宽的技术。
常见的多媒体数据压缩技术包括图像压缩、音频压缩和视频压缩。
1. 图像压缩图像压缩是将图像数据进行编码压缩,以减少存储空间和传输带宽,并保持较好的图像质量。
目前,常用的图像压缩方法包括无损压缩和有损压缩。
无损压缩通常用于要求图像质量没有任何损失的场景,而有损压缩则常用于需要降低图像质量但能大幅度减少数据量的场景。
2. 音频压缩音频压缩是将音频数据进行编码压缩,以减少存储空间和传输带宽,同时保持较好的音质。
常用的音频压缩方法包括无损压缩和有损压缩。
无损压缩适用于要求音质不受损的场景,而有损压缩则适用于需要大幅度减少数据量但允许一定音质损失的场景。
3. 视频压缩视频压缩是将视频数据进行编码压缩,以减少存储空间和传输带宽,同时保持较好的视觉质量。
常用的视频压缩方法包括帧内压缩和帧间压缩。
帧内压缩是指对视频帧内的像素进行压缩,而帧间压缩则是通过利用相邻帧之间的冗余信息进行压缩,能有效减少数据量。
二、多媒体数据的传输优化技术传输优化技术是指通过优化传输过程中的算法和协议,提高多媒体数据的传输效率。
常见的传输优化技术包括流媒体传输、分布式传输和错误控制。
1. 流媒体传输流媒体传输是指将多媒体数据以流的形式传输,实现边下载边播放的功能。
该技术有效节约了用户端的存储空间,并提供了较好的可观看体验。
流媒体传输常用的协议包括实时传输协议(Real-time Transport Protocol,RTP)和实时流传输协议(Real-time Streaming Protocol,RTSP)等。
面向多媒体数据的无损压缩技术研究在今天的数字化时代下,越来越多的多媒体数据被创建和传输。
无论是音频、视频、图片还是文本都已成为人们日常生活中不可或缺的组成部分。
随之而来的是数据的爆炸式增长,这给传输和存储带来了巨大的挑战。
为了解决这个问题,研究人员们一直在努力探索一种有效的数据压缩方式。
其中,无损压缩技术因为它可以在不降低数据质量的情况下将数据压缩到较小的空间,被广泛应用。
一、无损压缩技术的定义无损压缩技术是指将数据压缩到更小的空间长度,同时不损失数据本身,使其可以恢复到其原始状态的压缩技术。
与有损压缩技术相比,它不会丢失任何数据或信息,并且不会对质量进行任何改变。
因此,无损压缩技术在很多领域都有广泛的应用,如图片压缩、音频压缩和视频压缩等。
二、多媒体数据无损压缩技术的发展随着数字化时代的到来,多媒体数据的需求越来越大,因此相关压缩技术的发展也得到了更多的重视。
目前,无损压缩技术已经有了很多的发展,主要包括以下几个方面:1.总体压缩算法总体压缩算法是一种可以减少数据体积的压缩算法。
它在编码数据之前,通过对数据进行概率建模来尽可能多地减少数据的体积。
该方法被广泛应用于音频和视频压缩中。
2.图像压缩算法图像压缩算法基于不同的原理进行设计,例如直接编码、预测编码、离散余弦变换(DCT)、小波变换和自适应算法等。
利用这些算法,可以在保持图像质量的前提下,将图像压缩到更小的大小。
3.音频压缩算法音频压缩算法通常使用子带编码技术、预测编码技术和的DCT 技术等技术。
这些算法可以实现无损压缩和有损压缩,并且通常比图像压缩算法更有效。
4.视频压缩算法视频压缩算法通常使用预测编码和变换编码技术。
在预测编码中,通过预测视频下一帧的内容,然后只针对预测残差进行编码。
在变换编码中,通常使用DCT进一步压缩预测残差数据。
三、多媒体数据无损压缩技术的局限性虽然无损压缩技术在多媒体领域中取得了很大的成功,但是它还有一些局限性。
多媒体压缩技术在当今数字化的时代,多媒体信息如音频、视频、图像等在我们的生活中无处不在。
从在线视频播放到手机中的照片存储,从远程会议到虚拟现实体验,多媒体数据的生成和传播呈爆炸式增长。
然而,大量的多媒体数据需要占用巨大的存储空间和传输带宽,这给存储设备和网络带来了沉重的负担。
为了解决这个问题,多媒体压缩技术应运而生,它就像是一位神奇的魔法师,能够在不损失太多质量的前提下,将庞大的多媒体数据变得小巧玲珑。
多媒体压缩技术的基本原理其实并不复杂,就像是我们收拾行李时把衣物尽可能紧凑地叠放起来,以节省空间。
在多媒体世界里,数据也可以通过各种巧妙的方式被“压缩”。
首先,让我们来谈谈图像压缩。
图像是由一个个像素点组成的,每个像素点都包含了颜色和亮度等信息。
在图像压缩中,有一种常见的方法叫做无损压缩。
无损压缩就像是把一个拼图完整地放进一个小盒子里,虽然盒子变小了,但拼图的每一块都还在,没有任何缺失。
比如说,行程编码就是一种无损压缩方法。
它通过记录相同像素值连续出现的次数来减少数据量。
假设一幅图像中有一大片蓝色区域,使用行程编码就可以只记录“蓝色,连续出现 100 个像素”,而不是逐个记录每个蓝色像素的信息。
除了无损压缩,还有有损压缩。
有损压缩就像是为了把更多的衣服塞进箱子,稍微牺牲一些不太重要的衣物。
在图像有损压缩中,JPEG格式是非常常见的。
它会根据人眼对颜色和细节的敏感度,去除一些不太容易被察觉的信息。
比如,人眼对亮度的变化比较敏感,但对颜色的细微差别不那么敏感,JPEG 压缩就会更多地保留亮度信息,而对颜色信息进行较大程度的压缩。
接下来是视频压缩。
视频本质上是一系列快速播放的图像帧。
视频压缩不仅要考虑每一帧图像的压缩,还要利用帧与帧之间的相似性。
比如,在一段视频中,如果背景几乎不变,只有人物在移动,那么就不需要对每一帧的背景都进行完整的记录,只需要记录第一帧的背景,后续帧只记录人物移动的变化部分。
这种方法被称为帧间压缩。
多媒体数据的压缩与传输技术随着计算机和互联网的不断发展,多媒体数据在我们的生活中扮演着越来越重要的角色,如音频、视频、图像等。
随之而来的问题就是如何保证这些数据的高效传输和存储。
本文将探讨多媒体数据的压缩与传输技术,以及优化这些技术的方法。
一、多媒体数据的压缩技术多媒体数据的压缩技术是指通过对数据进行编码和压缩,减少数据传输和存储所占用的空间和带宽。
常见的压缩技术包括有损压缩和无损压缩两种。
1. 有损压缩有损压缩是指通过丢弃一部分数据来减小数据的大小,以达到压缩的目的。
这种压缩方法适用于音频和视频等数据,一般情况下,这些数据对人的感知有一定的误差容忍度,可以通过有损压缩的方法将数据体积大幅度压缩。
常见的有损压缩算法包括MP3、JPEG、MPEG等。
2. 无损压缩与有损压缩相比,无损压缩可以确保数据在压缩后不会有任何信息丢失。
无损压缩适用于图像和文本等数据,这些数据对精确性要求较高。
常见的无损压缩方法包括GIF、PNG和ALAC等。
二、多媒体数据的传输技术多媒体数据的传输技术一般分为实时传输和非实时传输两类。
1. 实时传输实时传输是指数据的传输需要在某个时间点到达并得到有效处理的传输方法。
此类传输方法通常用于视频通话、游戏直播等场景中。
因此,实时传输需要具备低延迟、高质量和可靠性三个特点。
常见的实时传输技术包括传统的TCP/IP协议与User Datagram Protocol(UDP)协议相对应的RTCP(Real-time Transfer Control Protocol)和RTP(Real Time Transport Protocol)协议。
同时,目前应用最广泛的实时传输协议是WebRTC技术。
2. 非实时传输非实时传输则是指数据的传输不需要在某个时间点到达并得到有效处理的传输方式,该传输方法常用于文件下载、在线视频播放等场景中。
此类数据传输相对于实时传输,对于时间要求更为宽松,但需要对数据传输的可靠性和完整性进行保证。
多媒体数据压缩1. 引言多媒体数据压缩是当今数字技术中的重要问题之一。
随着互联网的发展以及多媒体应用的广泛应用,对数据的传输和存储的需求也越来越大。
多媒体数据常常具有巨大的数据量,传输和存储所需的带宽和存储空间也相应增加。
为解决这一问题,多媒体数据压缩技术应运而生。
2. 多媒体数据压缩的基本原理多媒体数据压缩的基本原理是通过减少多媒体数据中的冗余信息来降低数据的传输和存储成本。
冗余信息是指数据中重复或不必要的部分,可以通过一定的算法进行识别和剔除。
多媒体数据压缩主要涉及到图像、音频和视频等不同类型的数据。
对于图像数据,常用的压缩算法包括无损压缩和有损压缩。
无损压缩通过对图像进行编码和解码来实现数据的压缩和恢复,保证了压缩前后数据的完全一致性。
有损压缩则通过牺牲一定的图像质量来实现更高的压缩比,常见的有损压缩算法包括JPEG和PNG等。
对于音频数据,压缩技术主要包括无损压缩和有损压缩。
无损压缩常用的算法有FLAC和ALAC等,它们主要通过减小数据中的冗余部分来实现音频数据的压缩。
而有损压缩则通过对音频信号进行一定的量化和编码来实现更高的压缩比,例如MP3和AAC等。
对于视频数据,压缩技术主要包括基于帧间压缩和基于帧内压缩。
帧间压缩通过对相邻帧之间的差异进行编码来实现数据的压缩,常见的压缩算法有MPEG-2和H.264等。
而帧内压缩则通过对单帧图像进行编码来实现压缩,常见的压缩算法有MPEG-1和H.265等。
3. 多媒体数据压缩的应用多媒体数据压缩技术在各个领域都有广泛的应用。
互联网上的图片和视频网站常常需要处理大量的多媒体数据,通过压缩技术可以减少带宽的占用和存储空间的消耗,提高网站的加载速度和用户体验。
在音频和视频传输领域,多媒体数据压缩技术可以实现音视频流的实时传输,满足实时通信和视频会议等应用的需求。
多媒体数据压缩技术还广泛应用于存储介质,例如CD、DVD和蓝光光盘等,通过压缩技术可以在有限的存储空间中存储更多的多媒体内容。
浅淡多媒体的压缩技术媒体是人与人之间实现信息交流的中介,也就是信息的载体,简称媒介。
多媒体就是多重媒体的意思,可以理解为直接作用于人感官的文字、图形、图像、动画、声音和视频等各种媒体的统称,即多种信息载体的表现形式和传递方式。
课本上它的定义是融合两种或两种以上媒体的人-机交互式信息交流和传播媒体。
本文将详细介绍多媒体的压缩和编码。
多媒体数据之所以能够压缩,是因为视频、图像、声音这些媒体具有很大的压缩力。
以目前常用的位图格式的图像存储方式为例,在这种形式的图像数据中,像素与像素之间无论在行方向还是在列方向都具有很大的相关性,因而整体上数据的冗余度很大;在允许一定限度失真的前提下,能对图像数据进行很大程度的压缩。
1.多媒体技术的社会需求社会需求是促进多媒体技术产生和发展的重要因素。
可以说,包括计算机本身在内,一切科学技术的发展都离不开社会需求这一重要条件。
社会需求随着人类文明的发展而不断增长,刺激着各个领域中的科学技术不断地进步和发展。
早在20世纪80年代初期,人们开始不满足于计算机对文字进行单一形式的处理和进行数学运算,希望计算机能做更多的事情,要求计算机在多领域、多学科处理多种信息。
这种越来越迫切的需求,造就了一门全新的技术—多媒体技术。
1.1图形和图像处理的需求图形和图像是人们辨别事物最直接和最形象的形式,很多难以理解和描述的问题用图形或图像表示,就能或得一目了然的效果。
1.2大容量数据存储的需要随着计算机处理范围的扩大,被处理的媒体种类不断增加,信息量加大,如何保存和处理大量的信息,成为多媒体技术需要解决的有一个问题。
1.3音频信号和视频信号处理的需求使用计算机处理并重放音频信号和视频信号,是人们对计算机技术提出的新要求。
计算机与使用者之间的操作层面叫做界面,它是计算机与人类沟通的重要渠道。
1.4信息交换的需求在现代社会中,信息是至关重要的。
为了满足人们对信息流动和交换的渴求,计算机被连接在一起,形成网络,互相之间进行信息传递和交换。
多媒体数据压缩编码技术概述多媒体数据压缩编码技术是一种通过减少或去除冗余数据来减小多媒体文件的存储空间或传输带宽的过程。
这些技术广泛应用于图像、音频和视频等各种形式的多媒体数据。
下面将对多媒体数据压缩编码技术的主要方法进行概述。
1. 无损压缩编码:无损压缩编码技术可以将多媒体数据压缩到较小的大小,而不会丢失原始数据。
该技术通过利用多媒体数据中的冗余和统计特性来实现压缩效果。
其中,哈夫曼编码、算术编码和Lempel-Ziv编码等是常用的无损压缩编码方法。
2. 有损压缩编码:有损压缩编码技术可以在一定程度上丢失原始数据,并将其转换为较小的文件大小。
这种压缩方法适用于某些多媒体数据,如音频和视频等,因为人类的感知系统对这些数据中的一些细微变化不太敏感。
有损压缩编码方法包括离散余弦变换(DCT)、小波变换、运动补偿和预测编码等。
3. 基于上下文的压缩编码:这种压缩编码技术利用多媒体数据内部的上下文信息来实现更高的压缩效果。
上下文信息包括像素点的位置、颜色和周围像素点的关系等。
基于上下文的编码方法有助于提高压缩比,并减少信号的失真。
包括了一些流行的基于上下文的压缩编码算法,如JPEG(图像)、MP3(音频)和H.264/AVC(视频)。
4. 神经网络压缩编码:近年来,神经网络技术在多媒体数据压缩编码领域取得了显著的进展。
这些技术利用深度学习的方法来学习多媒体数据中的复杂模式,并使用这些模式进行压缩编码。
神经网络压缩编码方法通常能够在保持较高视觉和听觉质量的同时,实现更高的压缩比。
综上所述,多媒体数据压缩编码技术是一种通过减少或去除冗余数据来减小多媒体文件的存储空间或传输带宽的过程。
该技术涵盖了无损压缩编码、有损压缩编码、基于上下文的压缩编码和神经网络压缩编码等方法。
这些技术在多媒体数据领域发挥着重要的作用,帮助人们有效地处理和传输大量的多媒体数据。
5. 图像压缩编码技术:图像压缩编码技术是多媒体数据压缩编码中的一个重要领域。
第5章多媒体数据压缩技术本章要点:● 多媒体数据压缩技术概述● 量化● 统计编码● 变换编码● 数据压缩编码国际标准5.1 多媒体数据压缩技术概述(必要、可行、分类)5.1.1 多媒体数据压缩编码的必要性由于多媒体元素种类繁多、构成复杂,使得数字计算机面临的是数值、音乐、动画、静态图像和电视视频图像等多种媒体元素,且要将它们在模拟量和数字量之间进行自由转换、信息吞吐、存储和传输。
目前,虚拟现实技术还要实现逼真的三维空间、3D立体声效果和在实境中进行仿真交互,带来的突出问题就是媒体元素数字化后数据量大得惊人,解决这一问题,单纯靠扩大存储器容量、增加通信干线传输率的办法是不现实的。
通过数据压缩技术可大大降低数据量,以压缩形式存储和传输,既节约了存储空间,又提高了通信干线的传输效率,同时也使计算机得以实时处理音频、视频信息,保证播放出高质量的视频和音频节目。
5.1.2 多媒体数据压缩的可能性安特尼·科罗威尔[意]意大利 1975年,300公斤分析冗余?图像数据压缩技术就是研究如何利用图像数据的冗余性来减少图像数据量的方法。
下面是常见的一些图像数据冗余:(1)空间冗余:是由于基于离散像素采样的方法不能表示物体颜色之间的空间连惯性导致的;(2)时间冗余:就是对于象电视图像、动画等序列图片,当其中物体有位移时,后一帧的数据与前一帧的数据有许多相同的地方;(3)结构冗余:在有些图像的纹理区,图像的像素值存在着明显的分布模式;(4)知识冗余:对于图像中重复出现的部分,我们可构造其基本模型,并创建对应各种特征的图像库,进而图像的存储只需要保存一些特征参数,从而可大大减少数据量;(5)视觉冗余:事实表明,人类的视觉系统对图像场的敏感性是非均匀和非线性的;6.1.3 多媒体数据压缩方法的分类1.有损与无损压缩:第一种分类方法是根据解码后数据是否能够完全无丢失地恢复原始数据,可分为:1)无损压缩:也称可逆压缩、无失真编码、熵编码等。
多媒体数据文件与压缩技术多媒体数据文件与压缩技术1. 概述1.1 介绍多媒体数据文件1.2 多媒体数据的特点1.3 压缩技术的重要性2. 多媒体数据文件的类型2.1 图像文件2.1.1 常见的图像文件格式2.1.2 图像文件压缩技术2.2 音频文件2.2.1 常见的音频文件格式2.2.2 音频文件压缩技术2.3 视频文件2.3.1 常见的视频文件格式2.3.2 视频文件压缩技术3. 图像压缩技术3.1 无损压缩技术3.1.1 RLE压缩算法3.1.2 Huffman压缩算法 3.1.3 LZW压缩算法3.2 有损压缩技术3.2.1 JPEG压缩算法3.2.2 WebP压缩算法4. 音频压缩技术4.1 无损压缩技术4.1.1 FLAC压缩算法4.1.2 ALAC压缩算法4.2 有损压缩技术4.2.1 MP3压缩算法4.2.2 AAC压缩算法5. 视频压缩技术5.1 无损压缩技术5.1.1 Lagarith压缩算法5.1.2 FFV1压缩算法5.2 有损压缩技术5.2.1 H.264压缩算法5.2.2 VP9压缩算法6. 本文所涉及的法律名词及注释- 数据文件:根据著作权法第2条第2款的规定,指用来记录、存储、预示、发送以及接收各种形式的作品的一切物质载体。
- 压缩技术:指通过对多媒体数据文件进行编码或转换来减小文件的大小,从而节省存储空间和提高传输效率的技术。
- 无损压缩:压缩后的文件与原始文件完全一致,没有任何数据损失。
- 有损压缩:压缩后的文件与原始文件存在一定的数据损失,但可以通过不同的算法设置来控制损失程度。
- RLE:Run Length Encoding,一种基于重复数据的无损压缩算法。
- Huffman:一种基于数据出现频率的无损压缩算法,采用可变长度编码。
- LZW:Lempel-Ziv-Welch,一种基于字符串替换的无损压缩算法。
- JPEG:Joint Photographic Experts Group,一种广泛应用于图像压缩的有损压缩算法。
多媒体压缩技术
学号2012442
计算机科学与技术2012级1班
摘要:数字化的多媒体数据的存储空问越来越大,给数据的保存和传遥带来了困难。
本文通过对多媒体数据压缩方法的分类、标准的介绍,说明各种多媒体数据压缩方法的应用范围.为多媒体数据的使用者提供一定借鉴。
关键词:多媒体;压缩技术;数据存储
Multimedia compression technology
Student number 2012442107 xiangxiaoxiang
Computer science and technology class 1 of grade 2012
Abstract:Digital multimedia data storage empty asked more and more big, has brought the data preservation and remote transmission. This article through to the classification of multimedia data compression method, standard is introduced, the application scope of all kinds of multimedia data compression method. To provide certain reference for users of multimedia data.
Key words: multimedia; Compression technology; Data is stored
多媒体是先进的计算机技术和视频、音频、通信等技术集成的产物。
多媒体信息主要包括图像、声音、文本三大类。
其中视频、音频等信号的信息量是非常大的。
例如,NTSC图像以640×480PPI、24bits/Pixel、每秒30帧的质量传输时,其据率达28M字节/秒或221M位/秒。
以这个速率保存15秒未压缩视频图像将占420字节的存储空间,显然一般台式计算机接受是有困难的。
另一个原因是图像。
音频和视频这些媒体具有很大的压缩潜力。
因为在多媒体数据中,存在着空间冗余,时间冗余,结构冗余.知识冗余,视觉冗余.图像区域的相同性冗余,纹理的统计冗余等。
它们为数据压缩技术的应用提供了可能的条件。
因此在多媒体系统中必须采用数据压缩技术,它是多媒体技术中一项十分关键的技术。
一、多媒体数据压缩标准——无失真压缩方法
无失真压缩技术由于大原理上大多采用概率统计编码.因而一般对在内容上重复较多的文件压缩倍数比较大,而对没有重复或重复较小的文件则压缩倍数就较低。
压缩技术分为无失真压缩和有失真压缩两种。
无失真压缩就是压缩后再还原出来的数据同没有压缩的原始数据一样,不存在任何误差。
常见的压缩软件有zip,Gzip等。
平均压缩比一般在两倍左右,如典型的Double Space技术。
对硬盘内各类数据及文件的压缩比约为两倍。
目前在无失真压缩中压缩效果较好的当属算术编码,常用的算法有预测编码,矢量量化技术、Huffman编码。
算术编码等等。
有失真压缩后再还原出来的数据和没有压缩的原始数据间相比存在一定的误差。
由于允许有一定误差.因而这类技术常常可以取得较大的压缩比。
二、视频图像的压缩编码标准
我们常用的多媒体数据压缩标准中采用较多的MPEG系列。
视频图像的压缩编码方法MPEG具有高度的压缩比并保持高质量,它有4个版本。
其中前两个版本MPEG 一1和MPEG一2应用比较广泛。
MPEG一4已推出几年.但近年来才活跃起来.MPEG 一7则是更先进的下一个版本.它是一个多媒体内容描述接口。
MPEG一1标准(ISO /IECl 1 1 172)1992年制定。
是针对1.5Mbps以下数据传输率的数字存储媒体
运动图像及其音频码设计的国际标准.主要用于在CD--ROM(包括video—CD、CD —I等)存储彩色的同步运动视频图像。
它针对SIF(标准交换格式)帧大小:NTSC 制为352×240 PPI;PAL制为352X288 PPI。
帧速率:对于NTSC制为29.97fps,PAL为25fps。
视频数据速率:1150kbps。
帧类型:基于帧。
音频设置:立体声,224kbps位速率;44100HZ频率。
每秒可播放30帧画面.具备CD音质。
常用于用于数字话网络上的视频传输。
如非对称数字用户线路、视频点播、教育网络等。
VCD是一个特殊的CD--ROM格式,它包含一个特殊的MPEG一1格式的视频文件.并且该文件完全符合白皮书的规格,因此使用MPEG一1的压缩算法。
可以将一部120min长的电影压缩到1.2GB左右。
所以它被广泛地运用到VCD制作和一些视频片段的下载,目前绝大多数VCD都是用MPEG一1格式进行压缩的。
MPEG一2标准ISO/IECl3818,制定于1994年,设计目标是高级工业标准的图像质量以及更高的传输率。
是针对3—10Mbps的数据传输率制定的运动图像及其音频编码的国际标准。
较新的MPEG一2版本.已用于卫星数码电视和DVD光盘.提供了更大的灵活性和更高的质量。
其在NTSC制式下的分辨率可达720X486。
PA制式中可达720X576。
视频数据速度6000kbps。
Lpcm音频,48000HZ,立体声。
能够在MPEG一1兼容的基础上实现了低码率和多声道扩展:MPEG一2可以将一部
120rain长的电影压缩到4—8GB、音频编码为我们提供了左、右、中及两个环绕声道.一个加重低音声道及多达7个伴音声道。
因此它提供的就是平常我们所说的高品质的DVD品质,它可用于8种语言进行配音。
由于MPEG一2在设计时的巧妙处理。
使得MPEG一2解码器也可播放MPEG一1格式的数据,目前市场上浒的VCD、CD、也适用于HDTV。
使得原HD丁V设计的MPEG一3还没来得及投放市场就已抛弃了。
它传输的视频图像出现轻度扭曲。
而MPEG一3设计的传输速率是在20Mbits/sev 一40Mbits/sec之间。
目前在网络上广泛应用的音乐格式MP3并不是
MPEG一3而是MPEG一1的第三层。
三、多媒体应用的带宽和数字影像质量要求
由于MPEG一2改变压缩比有一个较宽的范围的特点,为适应不同的带宽要求。
画面的质量高低以及存储容量的要求,除了作为DVD的指定指标外。
MPEG一2目前还广泛用于广播、有线电视网、电缆网络等,并提供了广播级别的数字视频。
特别是目前高清晰度画面质量的数码电视投放市场。
对于普通用户来说都能得到高品质的DVD画面和加重低音、多伴音声道的广泛应用。
MPEG一4于1998年”月公布,而人们是1999年在计算机多媒体应用方面才接触到的。
视频编码与音频编码类似,也支持对自然和合成的视觉对象的编码,合成的视觉对象包括2D、3D动画和人面部表情动画等.同时为我们提供了丰富的AV 场景。
它主要解决交互网络中广播环境下以及磁盘应用中、多媒体应用的操作问题,通过传输多路合成比特信息来建立客户端和服务器端的交互和传输。
MPE一4它不仅支持自然声音.也支持合成声音。
将音频的合成编码和自然声音的编码相结合。
并支持音频的对象特征。
MPEG一4的出现对于数字电视、动态图像、万维网、实时多媒体监控、低比特率下的移动多媒体通信、DVD上的交互多媒体应用、计算机网络的可视化合作实验场景应用、演播电视等都产生较大的推动作用。
MPEG一1、MPEG一2、MPEG一4适用于不同带宽和数字影像质量的要求.优于其它压缩/解压缩方案。
它是按国际化标准来研究制定,具有很好的兼容性。
这对于多媒体数据库和Internet多媒体应用的发展是至关重要的。
它的压缩比最高可以200:1,而且对数据的损失很小。
其后继的MPEG一7则是基于内容的描述。
它不是一种压缩算法的标准,而是一种面向内容的描述语言和格式的标准。
其应用领域十分广泛。
最重要的一点是,有了基于内容的描述之后,我们就可以对多媒体信息进行分类、检索、识别和加工制作。
参考文献:
【1】《多媒体技术指南》【M】.北京,电子工业园出版社
【2】《多媒体计算机技术》【M】.北京,清华大学出版社
【3】《多媒体技术应用基础》[M】.西安电子科技大学出版社
【4】陈维亮.视频监控系统中运动检测算法与MPEG一4速率控制的研究【D】.北京邮电大学.2003。