《多媒体技术》 第二讲 多媒体数据压缩技术(第1—2节)课堂笔记及练习题
- 格式:doc
- 大小:141.00 KB
- 文档页数:4
第二章作业作业总体要求:1.认真独立的完成2.让文件名重新命名为自己的学号,然后通过http://10.66.4.241提交。
一.选择题1.下列说法中不正确的是【B】。
A.有损压缩法会减少信息量B.有损压缩法可以无失真地恢复原始数据C.有损压缩法是有损压缩D.有损压缩法的压缩比一般都比较大2.下列属于无损压缩的是【B 】。
A.WA VE文件压缩成MP3文件 B.TXT文件压缩成RAR文件C. BMP文件压缩成JPEG文件D.A VI文件压缩成RM文件3.图像序列中的两幅相邻图像,后一幅图像与前一幅图像之间有较大的相关,这是【 D 】。
A. 空间冗余B.时间冗余C.信息熵冗余D.视觉冗余4.衡量数据压缩技术性能好坏的主要指标是【C】。
(1)压缩比(2)算法复杂度(3)恢复效果(4)标准化A. (1)(3)B. (1)(2)(3)C. (1)(3)(4)D.全部5.MPEG标准不包括下列哪些部分【C 】。
A.MPEG视频B.MPEG音频C.MPEG系统D.MPEG编码6.下列属于静态图像编码和压缩标准的是【B 】。
A.JPEG B.MPEG-1C.MPEG-2 D.MPEG-47.声音信号是声波振幅随时间变化的【A 】信号.A.模拟B.数字C.无规律D.有规律8.在数字视频信息获取与处理过程中,下述顺序正确的是【A 】。
A.采样、A/D变换、压缩、存储、解压缩、D/A变换B.采样、D/A变换、压缩、存储、解压缩、A/D变换C.采样、压缩、A/D变换、存储、解压缩、D/A变换D.采样、压缩、D/A变换、存储、解压缩、A/D变换9.一般来说,表示声音的质量越高,则【C 】A.量化位数越多和采样频率越低B.量化位数越少和采样频率越低C.量化位数越多和采样频率越高D.量化位数越少和采样频率越高10.5分钟双声道、16位采样位数、44.1kHZ采样频率声音的不压缩数据量是【 B 】。
A. 48.47MBB. 50.47MBC. 105.84MBD. 25.23MB11.下列采集的波形声音【 D 】的质量最好。
多媒体数据压缩1. 引言多媒体数据压缩是当今数字技术中的重要问题之一。
随着互联网的发展以及多媒体应用的广泛应用,对数据的传输和存储的需求也越来越大。
多媒体数据常常具有巨大的数据量,传输和存储所需的带宽和存储空间也相应增加。
为解决这一问题,多媒体数据压缩技术应运而生。
2. 多媒体数据压缩的基本原理多媒体数据压缩的基本原理是通过减少多媒体数据中的冗余信息来降低数据的传输和存储成本。
冗余信息是指数据中重复或不必要的部分,可以通过一定的算法进行识别和剔除。
多媒体数据压缩主要涉及到图像、音频和视频等不同类型的数据。
对于图像数据,常用的压缩算法包括无损压缩和有损压缩。
无损压缩通过对图像进行编码和解码来实现数据的压缩和恢复,保证了压缩前后数据的完全一致性。
有损压缩则通过牺牲一定的图像质量来实现更高的压缩比,常见的有损压缩算法包括JPEG和PNG等。
对于音频数据,压缩技术主要包括无损压缩和有损压缩。
无损压缩常用的算法有FLAC和ALAC等,它们主要通过减小数据中的冗余部分来实现音频数据的压缩。
而有损压缩则通过对音频信号进行一定的量化和编码来实现更高的压缩比,例如MP3和AAC等。
对于视频数据,压缩技术主要包括基于帧间压缩和基于帧内压缩。
帧间压缩通过对相邻帧之间的差异进行编码来实现数据的压缩,常见的压缩算法有MPEG-2和H.264等。
而帧内压缩则通过对单帧图像进行编码来实现压缩,常见的压缩算法有MPEG-1和H.265等。
3. 多媒体数据压缩的应用多媒体数据压缩技术在各个领域都有广泛的应用。
互联网上的图片和视频网站常常需要处理大量的多媒体数据,通过压缩技术可以减少带宽的占用和存储空间的消耗,提高网站的加载速度和用户体验。
在音频和视频传输领域,多媒体数据压缩技术可以实现音视频流的实时传输,满足实时通信和视频会议等应用的需求。
多媒体数据压缩技术还广泛应用于存储介质,例如CD、DVD和蓝光光盘等,通过压缩技术可以在有限的存储空间中存储更多的多媒体内容。
多媒体数据压缩多媒体数据压缩1. 引言随着科技的不断发展,多媒体数据已经成为现代社会生活的重要组成部分。
音频、图像和视频等多媒体数据的传输和存储需求不断增加,同时由于其数据量较大,对网络带宽和存储空间造成了巨大压力。
为了解决这一问题,多媒体数据压缩技术应运而生。
2. 多媒体数据压缩概述多媒体数据压缩是通过消除冗余信息和利用信号处理算法来减小多媒体数据的尺寸,以达到减少存储空间和传输带宽的目的。
常见的多媒体数据压缩方法有有损压缩和无损压缩。
2.1 有损压缩有损压缩是指在压缩多媒体数据时,一定程度上牺牲了一些数据的质量,从而达到较高的压缩比例。
音频和视频的压缩一般采用有损压缩方法。
在有损压缩中,一些冗余或不重要的数据将被舍弃或减少,从而减小数据的尺寸。
2.2 无损压缩无损压缩是指压缩多媒体数据时,完全保留原始数据的质量,不丢失任何信息。
图像和文本的压缩一般采用无损压缩方法。
无损压缩通过利用数据的统计特性和编码技术,将冗余信息进行编码和重新表示,从而减小数据的尺寸。
3. 多媒体数据压缩算法多媒体数据压缩算法主要包括数据预处理、变换编码和熵编码三个过程。
3.1 数据预处理数据预处理是多媒体数据压缩的第一步,它主要通过降低原始数据的冗余性来减小数据的尺寸。
常用的数据预处理方法有去除冗余像素、空间上的局部特性分析和时间上的相关性分析等。
3.2 变换编码变换编码是指通过对多媒体数据进行变换,将信号的冗余信息转化为频域的权值,从而减少数据的尺寸。
常用的变换编码方法有离散余弦变换(DCT)和小波变换等。
3.3 熵编码熵编码是指基于信息论的编码方法,通过统计数据的出现频率,将频率高的数据用较短的编码表示,频率低的数据用较长的编码表示,从而减小数据的尺寸。
常用的熵编码方法有霍夫曼编码和算术编码等。
4. 多媒体数据压缩标准为了实现多媒体数据在不同平台和设备间的互通性,国际上制定了一系列的多媒体数据压缩标准。
常见的多媒体数据压缩标准有:- 音频压缩标准:MP3、AAC、FLAC等;- 图像压缩标准:JPEG、PNG、GIF等;- 视频压缩标准:MPEG-2、H.264、AVC、H.265、HEVC等。
第一章一、单选题(1)由美国Commodore公司研发的世界第一台多媒体计算机系统是( B )。
A. Action Media 750 B. Amiga C. CD-I D. Macintosh(2)由美国Apple公司研发的多媒体计算机系统是( D )。
A. Action Media 750B. AmigaC. CD-ID. Macintosh(3)媒体有两种含义,即表示信息的载体和( B )。
A. 表达信息的实体B. 存储信息的实体C. 传输信息的实体D. 显示信息的实体(4)( A )是指用户接触信息的感觉形式,如视觉,听觉和触觉等。
A. 感觉媒体B. 表示媒体C. 显示媒体D. 传输媒体(5)( B )是用于处理文本、音频、图形、图像、动画和视频等计算机编码的媒体A 感觉媒体 B表示媒体 C 显示媒体 D存储媒体(6)多媒体技术是将( C )融合在一起的新技术。
A. 计算机技术,音频技术,视频技术B. 计算机技术,电子技术,通信技术C. 计算机技术,视听技术,通信技术D. 音频技术,视频技术,网络技术(7)多媒体技术的主要特性有( D )A 多样性、集成性、交互性B 多样性、交互性、实时性、连续性C 多样性、集成性、实时性、连续性 D多样性、集成性、交互性、实时性(8)计算机主机与显示器之间的接口是( C )。
A. 网卡B.音频卡C. 显示卡D. 视频压缩卡(9)( D )属于多媒体外部设备。
A. 显示适配器B. 音频卡C. 视频压缩卡D. 数字摄像头(10)多媒体软件可分为( C )。
A. 多媒体系统软件,多媒体应用软件B. 多媒体系统软件,多媒体操作软件,多媒体编程语言C. 多媒体系统软件,多媒体支持软件,多媒体应用软件D 多媒体操作系统,多媒体支持软件,多媒体著作工具(11)多媒体素材制作工具是( D )A. FrontPageB. AuthorwareC. PowerPointD. Flash(12)Adobe Premiere应属于( D )。
多媒体技术电子教案:多媒体数据压缩编码技术一、多媒体数据压缩编码技术概述多媒体技术是指利用计算机技术将文字、图像、音频、视频等多种形式的信息进行集成,并能够对它进行处理、传输和存储,以提供更好的用户体验。
在多媒体技术中,数据压缩编码技术是非常重要的一个部分。
数据压缩编码技术可以将多媒体数据进行压缩,以便更有效地存储和传输。
该技术可以通过减少数据冗余、淘汰不必要的数据等方式来降低多媒体文件的大小。
数据压缩编码技术有很多种不同的方法,如无损压缩和有损压缩等。
二、无损压缩技术无损压缩技术是将多媒体数据进行无损压缩,即在不损失数据质量的情况下,将文件大小进行压缩。
常见的无损压缩技术包括:Run Length Encoding(RLE)、标志赋值编码、霍夫曼编码等。
1. Run Length Encoding(RLE)Run Length Encoding(RLE)是一种简单的数据压缩编码技术,它通过识别文件中连续出现的相同数据并进行编码来压缩多媒体数据。
例如,当一张图像中有大量相同的像素时,RLE可以将它们表示为一个像素值和一个重复次数的序列,从而达到压缩数据的目的。
2. 标志赋值编码标志赋值编码也是一种简单的无损压缩技术,它可以通过对多媒体数据中的不同符号/颜色赋予不同的标志来将其进行压缩。
例如,一种常见的标志赋值编码技术是算术编码。
3. 霍夫曼编码霍夫曼编码是一种无损压缩技术,它利用统计学原理来压缩多媒体数据。
该编码技术通过对多媒体数据中出现频率较高的符号/颜色分配短码,对出现频率较低的符号/颜色分配长码,从而达到对数据进行压缩的目的。
三、有损压缩技术有损压缩技术是将多媒体数据进行有损压缩,即在一定程度上损失数据质量的情况下,将文件大小进行压缩。
常见的有损压缩技术包括:数据降采样、量子化、离散余弦变换(DCT)、离散小波变换(DWT)等。
1. 数据降采样数据降采样也是一种简单的有损压缩技术,它通过减少音频和视频数据的采样率和比特率来达到压缩文件大小的目的。
第一章《多媒体技术概论》思考练习题答案填空题:1、国际电讯联盟(ITU)将媒体分为五大类,分别为感觉媒体、表示媒体、表现媒体、存储媒体、传输媒体。
2、多媒体技术中所说的媒体一般指感觉媒体,图像编码应属表示媒体。
3、多媒体信息的主要特点包括信息媒体的多样性、集成性、交互性、实时性,还有数据的海量性、媒体信息表示的空间性和方向性等。
4、多媒体技术的发展历程大致可分为三个阶段,即启蒙发展阶段、标准化阶段、普及应用阶段。
5、ISO和ITU联合制定的数字化图像压缩标准主要有JPEG标准、MPEG系列标准、H.26X 标准。
简答题:1、什么是多媒体?答:从多媒体技术专业角度讲,可理解为:多媒体的“多”是其多种媒体的表现,多种感官的作用,多种设备的使用,多学科的交汇,多领域的应用;“媒“是指人与客观世界的中介;“体”是言其综合、集成一体化。
2、什么是多媒体技术?答:是指多媒体信息的数字化、设计与制作技术、及各种媒体集成一体化,经数据压缩处理和存储,并由新传播媒介发布的具有交互性的多媒体信息技术。
3、JPEG标准(ISO/IEC 10918标准)?答:适用彩色和单色、多灰度连续色调、静态图像压缩国际标准。
4、MPEG-1(ISO/IEC 11172标准)?答:用于数字运动图像,其伴音速率为1.5Mbps的压缩编码。
5、我国国家信息产业部批准成立的数字音频视频的编码技术标准工作组(A VS)的主要工作是什么?答:开展具有自主产权的数字音视频产业的共性基础标准的研究。
并面向我国的信息产业需求,制定数字音视频的压缩、解压缩、处理和表示等共性技术标准A VS,服务于数字音视频产业应用。
第二章多媒体数据压缩技术复习思考题答案填空题:1、多媒体数据能不能被压缩,关键是多媒体数据中是否存在“_____”,即“多媒体数据压缩的可能性”。
答:数据冗余2、“信息量”与“数据量”之间的关系是__________。
答:信息量=数据量-冗余量3、多媒体数据冗余信息包括____、_____、_____、____、____、_____、_____、图像区域的相同性冗余、其它冗余。
中公金融人: 第1页 中公教育学员专用资料多媒体技术第一节 多媒体技术概论1、多媒体技术的概念多媒体一词来自于英文“Multimedia ”,它是一个复合词。
多媒体技术是利用计算机对文字、图像、图形、动画、音频、视频等多种信息进行综合处理、建立逻辑关系和人机交互作用的产物。
2、多媒体技术的处理对象(1)文字:采用文字编辑软件生成文本文件,或者使用图像处理软件形成图形方式的文字。
(2)图像:主要指具有23~232彩色数量的.gif 、.bmp 、.tga 、.tif 、.jpg 格式的静态图像。
图像采用位图方式,并可对其压缩,实现图像的存储和传输。
(3)图形:图形是采用算法语言或某些应用软件生成的矢量化图形,具有体积小、线条圆滑变化的特点。
(4)动画:动画有矢量动画和帧动画之分,矢量动画在单画面中展示动作的全过程;而帧动画则使用多画面来描述动作。
帧动画与传统动画的原理一致。
代表性的帧动画文件有.flc 、.fla 等动画文件。
(5)音频信号:音频通常采用.wav 或.mid 格式,是数字化音频文件。
还有.mp3压缩格式的音频文件。
(6)视频信号:视频信号是动态的图像。
具有代表性的有.avi 格式的电影文件和压缩格式的.mpg 视频文件。
3、动画制作软件分三类:(1)绘制和编辑动画软件:AnimatorPro 、AnimationStudio 、Flash 等软件用于制作各种形式的平面动画。
3DStudio 、3DStudioMax 、Cool3D 、Maya 等软件用于制作各种各样的三维动画。
(2)动画处理软件:Premiere 、GIFConstructionSet 网页动画处理软件等。
(3)计算机程序:Authorware 多媒体平台软件、VisualBasic 等计算机语言。
4、多媒体技术的应用领域1)在教育领域方面CAI计算机辅助教学、CAL计算机辅助学习、CBI计算机化教学、CBL计算机化学习CAT计算机辅助训练、CMI计算机管理教学2)在家庭娱乐方面3)在过程模拟领域方面:化学反应、火山喷发、海洋洋流、天气预报等方面。
多媒体数据压缩多媒体数据压缩1. 引言随着科技的不断发展,多媒体数据的使用越来越广泛。
无论是在互联网、移动通信还是娱乐媒体领域,多媒体数据都扮演着重要的角色。
由于多媒体数据的文件大小较大,传输和存储成本较高。
多媒体数据压缩技术的发展显得至关重要。
2. 多媒体数据压缩的意义多媒体数据压缩是指通过一系列算法和技术将多媒体数据的文件大小减小,并保持其视听效果的过程。
多媒体数据压缩的意义在于:减小文件大小:多媒体文件的压缩可以减小文件的存储和传输成本,提高多媒体数据在网络中的传输速度。
提高传输质量:压缩后的多媒体文件传输速度更快,能够在网络传输过程中保持更好的质量,减少传输延迟。
提升用户体验:多媒体数据压缩可以减小存储空间的占用,用户可以更便捷地访问和共享多媒体文件,提升用户体验。
3. 多媒体数据压缩的方法多媒体数据压缩可以通过不同的方法实现,以下是常用的几种方法:3.1 图像压缩图像压缩是指对图像数据进行压缩,以减小图像文件的大小。
常见的图像压缩算法有:无损压缩算法,如GIF格式,通过移除冗余信息来减小文件大小,但不会丢失数据。
有损压缩算法,如JPEG格式,通过舍弃一些细节信息来减小文件大小,但会造成一定程度的图像质量损失。
3.2 音频压缩音频压缩是指对音频数据进行压缩,以减小音频文件的大小。
常见的音频压缩算法有:无损压缩算法,如FLAC格式,通过消除冗余信息来减小文件大小,但不会损失音频质量。
有损压缩算法,如MP3格式,通过减少音频数据的精度和采样率来减小文件大小,但会引入一定程度的音频质量损失。
3.3 视频压缩视频压缩是指对视频数据进行压缩,以减小视频文件的大小。
常见的视频压缩算法有:无损压缩算法,如H.264格式,通过消除冗余信息来减小文件大小,但不会损失视频质量。
有损压缩算法,如MPEG格式,通过减少视频数据的精度和帧率来减小文件大小,但会引入一定程度的视频质量损失。
4. 多媒体数据压缩的发展趋势随着科技的不断进步,多媒体数据压缩技术也在不断发展。
《多媒体技术原理及应用》学科复习◎第一章绪论本章内容:本章主要讲述多媒体技术的概念、多媒体技术的发展历程、多媒体技术的研究内容、多媒体技术的应用及发展前景本章主要考点:概念、简答1、什么是多媒体技术?简述其主要特点。
所谓多媒体技术(Multimedia Computing)就是计算机交互式综合处理多种媒体信息──文本、图形、图象和声音,使多种信息建立逻辑连接,集成为一个系统并具有交互性。
多媒体技术的三个特点:集成性、实时性、交互性。
集成性:媒体信息集成,表现媒体设备的集成。
实时性:声音、视频、动画等媒体是强实时的;提供时基媒体实时处理的能力。
交互性:与家用声像电器区别的关键特征,用户不能通过介入媒体内容。
2、如何理解多媒体技术是人机交互方法的一次革命?多媒体技术是人机交互方法的一次革命,之所以这样说关键在于它的交互性。
交互性是多媒体技术独一无二的最具特色和优势的根本特性,它可以通过采用图形交互界面、窗口交互操作实现人和计算机之间信息的输入与输出。
多媒体技术的应用越来越广泛,所以规定相关的标准是很重要的,这样使它的应用和发展更加标准化和全球化,更有利它的发展进程。
3、多媒体技术的应用及前景。
典型应用领域:教育和培训、咨询和演示、娱乐和游戏、管理信息系统(MIS) 、视频会议系统计算机支持协同工作、视频服务系统4、多媒体技术未来发展的方向是:(D)(1)高分辨率,提高显示质量;(2)高速度化,缩短处理时间;(3)简单化,便于操作;(4)智能化,提高信息识别能力。
(A)(1)(2)(3)(B)(1)(2)(4)(C)(1)(3)(4)(D)全部★第二章多媒体数据压缩技术(重点)本章内容:本章主要讲述数字音频编码、数字图像编码、数字视频编码、常用的数据压缩技术、多媒体数据转换本章主要考点:概念、简答、数字音频存储量、电视信号的数据量、哈夫曼编码、算术编码1、声音是由振动的声波所组成,在任一时刻t,声波可分解为一系列正弦波线性叠加:f(t)= ΣA n sin(nωt+φn),其中, ω称为基频或基音,它决定声音的高低;nω称为ω的n次谐波分量或称为泛音,与声音的音色有关; A n是振幅,表示声音的强弱;φn是n次谐波的初相位。
多媒体技术概要第1章1.1 多媒体是什么?机交互式信息交流和传播媒体。
使用的多媒体是融合两种或者两种以上媒体的一种人- (video)。
媒体包括文字、图形、图像、声音、动画和视像1.4 无损压缩是什么?,重构后的数据与原来的数据也称还原或解压缩)无损压缩是用压缩后的数据进行重构( 完全相同的数据压缩技术。
如磁盘文件压缩就是一个应无损压缩用于要求重构的数据与原始数据完全一致的应用,。
/42~1用实例。
根据当前的技术水平,无损压缩算法可把普通文件的数据压缩到原来的1/ 等算法。
常用的无损压缩算法包括哈夫曼编码和LZW有损压缩是什么?1.5但不影响重构后的数据与原来的数据有所不同,有损压缩是用压缩后的数据进行重构,人对原始资料表达的信息造成误解的数据压缩技术。
视像和图像、有损压缩适用于重构数据不一定非要和原始数据完全相同的应用。
例如,因为它们包含的数据往往多于我们的视觉系统和听觉系统所能声音数据就可采用有损压缩,感受的信息,丢掉一些数据而不至于对图像、视像或声音所表达的意思产生误解。
是哪个组织制定的标准?1.9 H.261~H.264和G.711~G.731。
国际电信联盟(ITU)是哪个组织制定的标准?和MPEG-41.10 MPEG-1,MPEG-2。
国际电工技术委员会(IEC)ISO/IEC,即国际标准化组织(ISO)/无损数据压缩章第2}cb,{a,HartNat和(分别用Sh,3是由个事件组成的集合,计算该集合的决策量。
2.1假设)。
作单位 1.580 Sh (logH 3) Sh = = 20 1.098 Nat = = (log3) Nat e0.477 Hart = (log3) Hart = 10p(x)?1/256,级灰度表示的图像,如果每级灰度出现的概率均为2.2 现有一幅用256i i?0,,255,计算这幅图像数据的熵。
n11??(?log)?()log)??p(xpx)?256XH(22ii256256=8 (位),1i?8 比特,不能再少了。
多媒体技术第二讲多媒体数据压缩技术(第3—4节)课堂笔记及练习题主题:第二讲多媒体数据压缩技术(第3—4节)学习时间:2016年4月11日--4月17日内容:第三节运动图像压缩标准MPEG一、MPEG标准简介MPEG标准是面向运动图像压缩的一个系列标准。
分别在1.5Mbps,10Mbps,40Mbps传输速率下对图像编码,依次命名为MPEG-1,MPEG-2,MPEG-3(被取消)。
后来又增加了MPEG-4,随后还将增加MPEG-7标准。
一个典型的MPEG-l编、解码器原型几点说明:编码部分:①视频和音频编码器分别对MPEG标准的视频和音频进行编码,产生编码图像。
这些输出一般被称为基本码流(ES);②系统编码器和复接器产生多路复合流,它包含着基本码流以及系统层编码;③多路复合而成的码流以介质特定格式存储在数字存储介质(DSM)或网络上,标准不规定介质特定格式。
解码部分:①系统解码器执行两类操作:一类是作用在整个多路复合流上的操作,称为复合流操作;另一类是作用在单个基本流上的操作,称为特定流操作;②系统解码器从输入多路复合流中抽取定时信息,并对输入流进行分流处理,输出两个基本流分别给视频和音频解码器;③视频和音频解码器分别解码输出视频和声音信号;④系统、视频、音频和介质4个解码器之间用定时信息进行同步。
二、MPEG音频MPEG音频标准的特点:①音频信号采样率可以是32kHz,44.1kHz或48kHz。
②压缩后的比特流可以按4种模式之一(单声道模式、双—单声道模式、单音频通道模式、立体声模式、联合立体声模式)支持单声道或双声道;③压缩后的比特流具有预定义的比特率之一;④MPEG音频标准提供3个独立的压缩层次,用户可在复杂性和压缩质量之间权衡选择(层1最简单,使用比特率384kbps、层2的复杂度中等,使用比特率192kbps左右、层3最复杂,但音质最佳,使用比特率64kbps);⑤编码后的比特流支持循环冗余校验CRC(cyclic redundancy check);⑥MPEG音频标准还支持在比特流中载带附加信息。
天大《多媒体技术》学习笔记五主题:《多媒体技术》学习笔记内容:《多媒体技术》学习笔记五——多媒体数据压缩技术一、数据压缩基本原理数据压缩的目的是在传送和处理信息时尽量减少数据量,数据压缩的对象是数据而不是信息。
多媒体技术面临的最大难题是海量数据问题不进行数据压缩,将限制多媒体技术的发展。
1、多媒体信息的数据量文本:设屏幕显示分辨率为1024×768,字符为16×16点阵,每个字符用4个字节表示,则显示一屏字符所需要的存储空间为:(1024/16)×(768/16)×4B = 12288B(约12KB)图像:假定图像显示在1024×768分辨率的屏幕上,则满屏幕像点所占用的空间为:1024×768×log2256 = 768KB音频:假定模拟声音频率22050Hz,其数字采样频率44100Hz,采样精度为16bit,双声道立体声模式,则1min所需数据量为:44100Hz×2B×2×60s = 10MB/min2、数据压缩的条件数据冗余度(包括重复数据、可忽略数据)人类不敏感因素(包括颜色、声音、亮度等)3、数据冗余冗余基本概念:冗余——信息所具有的各种性质中多余的无用空间冗余度——多余的无用空间的程度信息量与冗余的关系:I = D-du 其中I为信息量;D为数据量;du为冗余量,包含D中冗余分类:空间冗余——规则物体的物理相关性时间冗余——视频与动画画面间的相关性统计冗余——具有空间冗余和时间冗余结构冗余——规则纹理、相互重叠的结构表面信息熵冗余—编码冗余,数据与携带的信息视觉冗余——视觉、听觉敏感度和非线性感觉知识冗余——凭借经验识别其他冗余——上述7种以外的冗余二、数据压缩算法数据压缩算法分为:无损压缩编码(压缩数据还原后,与原始数据一致,无损失),如霍夫曼编码、行程编码、算术编码等;有损压缩编码(压缩后再还原的数据有损失),如预测编码、变换编码、统计编码、行程编码、算数编码、LZW编码等。
多媒体技术第二讲多媒体数据压缩技术(第1—2节)课堂笔记
及练习题
主题:第二讲多媒体数据压缩技术(第1—2节)
学习时间: 4月4日--4月10日
内容:
第二讲多媒体数据压缩技术
第一节多媒体数据和信息转换
一、多媒体间的信息转换
为了便于交流信息,需要对不同的媒体信息进行转换。
下表是部分媒体之间
说明:*易**较困难***很困难
二、多媒体数据文件格式
多媒体文件的格式很多,下表介绍常用文件格式的特点和应用场合。
三、多媒体数据的信息冗余
多媒体计算机系统主要采用数字化方式,对声音、文字、图形、图像、视频等媒体进行处理。
数字化处理的主要问题是巨大的数据量。
一般来说,多媒体数据中存在以下种类的数据冗余:
1)空间冗余:一些相关性的成像结构在数字化图像中就表现为空间冗余。
2)时间冗余:两幅相邻的图像之间有较大的相关性,这反映为时间冗余。
3)信息熵冗余(编码冗余):信息熵是指一组数据所携带的信息量。
如果图像中平均每个像素使用的比特数大于该图像的信息熵,则图像中存在冗余,这种冗余称为信息熵冗余。
4)结构冗余:有些图像从大域上看存在着非常强的纹理结构,例如布纹图像和草席图像,我们说它们在结构上存在冗余。
5)知识冗余:有许多图像的理解与某些基础知识有较大的相关性。
这类规律性的结构可由先验知识和背景知识得到,我们称此类冗余为知识冗余。
6)视觉冗余:人类视觉系统对于图像场的任何变化,并不是都能感知的。
这类冗余我们称为视觉冗余。
7)其他冗余:例如由图像的空间非定常特性所带来的冗余。
以上所讲的是多媒体数据的信息冗余。
设法去掉信号数据中的冗余,就是数据压缩。
第二节常用的数据压缩技术
一、数据压缩编码方法
1)根据解码后数据与原始数据是否完全一致来进行分类:
① 可逆编码(无失真编码),如Huffman编码、算术编码、行程长度编码等。
② 不可逆编码(有失真编码),常用的有变换编码和预测编码。
2)根据压缩的原理进行划分:
① 预测编码:它是利用空间中相邻数据的相关性,利用过去和现在出现过的点的数据情况来预测未来点的数据。
通常用的方法是差分脉冲编码调制(DPCM)和自适应差分脉冲编码调制(ADPCM)。
②变换编码:该方法将图像光强矩阵(时域信号)变换到频域空间上进行处理。
一般采用正交变换,如离散余弦变换(DCT)、离散傅立叶变换(DFT)和Walsh-Hadamard变换(WHT),来实现压缩算法。
③ 量化与向量量化编码:对模拟信号进行数字化时要经历一个量化的过程。
为了使整体量化失真最小,就必须依照统计的概率分布设计最优的量化器;除了每次仅量化一个对像元点的做法外,也可以考虑一次量化多个点的做法,这种方
法称为向量量化。
④ 信息熵编码:根据信息熵原理,让出现概率大的用短码字表达,反之用长的码字表示。
最常见的方法如Huffman编码、Shannon编码以及算术编码。
⑤ 子带(subband)编码:将图像数据变换到频域后,按频域分带,然后用不同的量化器进行量化,从而达到最优的组合。
⑥ 模型编码:编码时首先将图像中的边界、轮廓、纹理等结构特征找出来,然后保存这些参数信息。
解码时根据结构和参数信息进行合成,恢复原图像。
二、预测编码
预测编码有线性预测和非线性预测两类。
DPCM(线性预测差分脉冲编码调制)的基本原理是基于图像中相邻像素之间具有较强的相关性,每个像素可通过以前已知的几个像素来作预测。
在预测编码中,编码和传输的并不是像素采样值,而是这个采样值的预测值与其实际值之间的差值。
DPCM系统中的误差来源是发送端的量化器,而与接收端无关。
事实上,这种量化误差是不可避免的。
三、变换编码
变换编码是利用频域中能量较集中的特点,在频域(变换域)上进行变换。
利用离散余弦变换(DCT)、离散傅立叶变换(DFT)和Walsh-Hadamard变换(WHT)等,使协方差矩阵接近为一个对角阵。
输入的图像经过其协方差矩阵正交变换后形成频域空间,像素之间相关性下降,能量集中在变换域中少数变换系数上,达到数据压缩的效果。
预测编码和变换编码都是有失真编码,或者说是不可逆编码。
四、信息熵编码
信息熵编码又称为统计编码,它是根据信源符号出现概率的分布特征而进行的压缩编码。
a. Huffman编码
Huffman编码方法的理论基础:在变长编码中,对出现概率大的信源符号赋予短码字,而对于出现概率小的信源符号赋予长码字。
如果码字长度严格按照所对应符号出现概率大小的逆序排列,则编码结果平均码字长度一定小于任何其他排列方式。
Huffman编码是一种常用的无失真编码。
b. 算术编码
其基本原理是将编码的信息表示成实数0和l之间的一个间隔(interval),信息越长,编码表示它的间隔就越小,表示这一间隔所需的二进制位就越多。
算术编码的特点是:
① 不必预先定义概率模型,自适应模式具有独特的优点;
② 信源符号概率接近时,建议使用算术编码。
Huffman编码和算术编码都是无失真编码。
本周应掌握的知识要点:
1、多媒体数据的信息冗余有哪些?
2、常用的数据压缩技术有哪些?基本原理与特点是什么?
练习:
一、问答题:
1、多媒体数据中存在哪些种类的数据冗余?
2、根据解码后数据与原始数据是否完全一致以及根据压缩的原理来进行分类,
分别可以将数据压缩方法分成哪些类?
1、答:一般来说,多媒体数据中存在以下种类的数据冗余:空间冗余、时间冗余、信息熵冗余、结构冗余、知识冗余、视觉冗余以及其他冗余。
2、答:根据解码后数据与原始数据是否完全一致,数据压缩方法一般被划分为两类:可逆编码(无失真编码,如Huffman编码、算术编码、行程长度编码等)、不可逆编码(有失真编码,常用的有变换编码和预测编码);根据压缩的原理进行划分,可以有以下几类:预测编码、变换编码、量化与向量量化编码、信息熵编码、子带编码、模型编码。
二、选择题:
1、常用的数据压缩编码方法中,具有“无失真”特点的编码方法是()。
A.Huffman编码
B.算术编码
C.变换编码
D.预测编码
2、多媒体包括()。
A.数值
B.图像
C.图形
D.音乐。