多媒体教学软件中图形数据的一种无损压缩方法
- 格式:pdf
- 大小:268.96 KB
- 文档页数:6
多媒体压缩技术在当今数字化的时代,多媒体信息如音频、视频、图像等在我们的生活中无处不在。
从在线视频播放到手机中的照片存储,从远程会议到虚拟现实体验,多媒体数据的生成和传播呈爆炸式增长。
然而,大量的多媒体数据需要占用巨大的存储空间和传输带宽,这给存储设备和网络带来了沉重的负担。
为了解决这个问题,多媒体压缩技术应运而生,它就像是一位神奇的魔法师,能够在不损失太多质量的前提下,将庞大的多媒体数据变得小巧玲珑。
多媒体压缩技术的基本原理其实并不复杂,就像是我们收拾行李时把衣物尽可能紧凑地叠放起来,以节省空间。
在多媒体世界里,数据也可以通过各种巧妙的方式被“压缩”。
首先,让我们来谈谈图像压缩。
图像是由一个个像素点组成的,每个像素点都包含了颜色和亮度等信息。
在图像压缩中,有一种常见的方法叫做无损压缩。
无损压缩就像是把一个拼图完整地放进一个小盒子里,虽然盒子变小了,但拼图的每一块都还在,没有任何缺失。
比如说,行程编码就是一种无损压缩方法。
它通过记录相同像素值连续出现的次数来减少数据量。
假设一幅图像中有一大片蓝色区域,使用行程编码就可以只记录“蓝色,连续出现 100 个像素”,而不是逐个记录每个蓝色像素的信息。
除了无损压缩,还有有损压缩。
有损压缩就像是为了把更多的衣服塞进箱子,稍微牺牲一些不太重要的衣物。
在图像有损压缩中,JPEG格式是非常常见的。
它会根据人眼对颜色和细节的敏感度,去除一些不太容易被察觉的信息。
比如,人眼对亮度的变化比较敏感,但对颜色的细微差别不那么敏感,JPEG 压缩就会更多地保留亮度信息,而对颜色信息进行较大程度的压缩。
接下来是视频压缩。
视频本质上是一系列快速播放的图像帧。
视频压缩不仅要考虑每一帧图像的压缩,还要利用帧与帧之间的相似性。
比如,在一段视频中,如果背景几乎不变,只有人物在移动,那么就不需要对每一帧的背景都进行完整的记录,只需要记录第一帧的背景,后续帧只记录人物移动的变化部分。
这种方法被称为帧间压缩。
windows画图工具mspaint图片批量无损压缩vbs数码相机与手机拍照像素很高,照片普遍偏大,占用空间且上传诸多不便。
其他软件压缩又存在失真现象,windows画图工具mspaint重新保存后根本看不出有压缩失真现象,手工保存费时费力,可否编程处理呢?网上基本搜不到,现偶遇到一些vbs应用,稍作修改,效果还不错。
下面vbs主要实现windows自动重复打开保存操作,所以在运行中不要点击鼠标,以免程序中断操作。
一、打开记事本,粘贴如下程序,并保存为(mspaint批量压缩.vbs)文件:'功能:将当前图片目录(如F:\12)下的jpg图片自动保存一次'Set ws = CreateObject("Wscript.Shell")'ws.run "mspaint zsc.jpg",1dimfso,pic_file,directory,tmpname,current_url,new_urlsetfso = CreateObject("Scripting.FileSystemObject")'设置文件目录所在位置current_url=inputbox("输入文件所在的目录(不支持中文目录),如D:\floder(最后不要带\)")set directory = fso.getfolder(current_url)'打开画图软件setws = WScript.CreateObject("WScript.Shell")ws.Run "C:\WINDOWS\system32\mspaint.exe",1WScript.Sleep 1000for each pic_file in directory.filestmpname=lcase(pic_)ws.AppActivate "paint"WScript.Sleep 200'打开文件ws.Sendkeys "^o "WScript.Sleep 200ws.SendKeyscurrent_url&"\"&tmpnameWScript.Sleep 200ws.SendKeys "~"WScript.Sleep 200'保存ws.Sendkeys "^s "WScript.Sleep 200nextws.Sendkeys "%fx"二、运行(mspaint批量压缩.vbs)文件,此程序文件不要放在磁盘根目录,需要放在下一级目录或者桌面,360会误报。
专利名称:图形文件的无损压缩方法专利类型:发明专利
发明人:马晓军
申请号:CN03156599.9
申请日:20030910
公开号:CN1595452A
公开日:
20050316
专利内容由知识产权出版社提供
摘要:本发明公开了一种应用于嵌入式个人终端设备的无损图形文件压缩方法;首先,采用预先设定的多个不同的压缩计数器长度参数对图形文件进行预压缩,选取最优的压缩计数器长度参数;然后,按选定最优的压缩计数器长度参数,对图形文件进行压缩;最后,将图片信息、压缩信息等头文件信息和压缩后数据写入文件,生成压缩文件。
本发明的压缩方法适用于从单色到真彩的所有图形文件,可以大大压缩嵌入式系统的存储空间,从而降低存储成本;由于本方法对解压缩的高效,不占用过多的系统资源,显示本方法压缩后图形对速度几乎没有影响,而且图形没有失真。
申请人:联想(北京)有限公司
地址:100085 北京市海淀区上地信息产业基地创业路6号
国籍:CN
代理机构:北京同立钧成知识产权代理有限公司
更多信息请下载全文后查看。
多媒体数据压缩1. 引言多媒体数据压缩是当今数字技术中的重要问题之一。
随着互联网的发展以及多媒体应用的广泛应用,对数据的传输和存储的需求也越来越大。
多媒体数据常常具有巨大的数据量,传输和存储所需的带宽和存储空间也相应增加。
为解决这一问题,多媒体数据压缩技术应运而生。
2. 多媒体数据压缩的基本原理多媒体数据压缩的基本原理是通过减少多媒体数据中的冗余信息来降低数据的传输和存储成本。
冗余信息是指数据中重复或不必要的部分,可以通过一定的算法进行识别和剔除。
多媒体数据压缩主要涉及到图像、音频和视频等不同类型的数据。
对于图像数据,常用的压缩算法包括无损压缩和有损压缩。
无损压缩通过对图像进行编码和解码来实现数据的压缩和恢复,保证了压缩前后数据的完全一致性。
有损压缩则通过牺牲一定的图像质量来实现更高的压缩比,常见的有损压缩算法包括JPEG和PNG等。
对于音频数据,压缩技术主要包括无损压缩和有损压缩。
无损压缩常用的算法有FLAC和ALAC等,它们主要通过减小数据中的冗余部分来实现音频数据的压缩。
而有损压缩则通过对音频信号进行一定的量化和编码来实现更高的压缩比,例如MP3和AAC等。
对于视频数据,压缩技术主要包括基于帧间压缩和基于帧内压缩。
帧间压缩通过对相邻帧之间的差异进行编码来实现数据的压缩,常见的压缩算法有MPEG-2和H.264等。
而帧内压缩则通过对单帧图像进行编码来实现压缩,常见的压缩算法有MPEG-1和H.265等。
3. 多媒体数据压缩的应用多媒体数据压缩技术在各个领域都有广泛的应用。
互联网上的图片和视频网站常常需要处理大量的多媒体数据,通过压缩技术可以减少带宽的占用和存储空间的消耗,提高网站的加载速度和用户体验。
在音频和视频传输领域,多媒体数据压缩技术可以实现音视频流的实时传输,满足实时通信和视频会议等应用的需求。
多媒体数据压缩技术还广泛应用于存储介质,例如CD、DVD和蓝光光盘等,通过压缩技术可以在有限的存储空间中存储更多的多媒体内容。
图形压缩的技巧
1. 降低图像分辨率:调整图像的分辨率可以减小图像的大小。
较低的分辨率会使图像看起来有些模糊,但如果不需要打印图像,则可以选择适当的分辨率来减少文件大小。
2. 压缩图像格式:使用像JPEG、PNG和WebP这样被广泛支持的图像格式,可以有效地减少文件大小。
这些格式都提供一定程度的压缩,但同时也不会影响图像的质量。
3. 剪裁图像:通过剪裁图像来减少文件大小,可以去掉图像中不需要的部分。
剪裁是非常有用的,特别是当你想要在网站上展示缩略图或小图片时。
4. 压缩图像质量:若要减小文件的大小,需要牺牲一些图像的质量。
可以通过减少图像中的颜色、减少像素等方式来进行图像压缩,这可能会导致一些细节丢失或者图像出现失真。
5. 合并图像:如果您需要在一个文件中显示多个图像,则可以将它们合并成一个文件以减少文件的大小。
在某些情况下,这可能还会为图像提供一些良好的组织方式。
119摘要:为了使大容量的多媒体数据在网络上有效的传输,必须对多媒体数据进行压缩。
对多媒体数据压缩中的几种无损压缩方法进行了比较,并对每种方法用一个例子说明。
关键词:数据压缩;霍夫曼树;LZW;二叉树引言随着网络发展的速度越来越快,视频,音频的广泛应用使得大数据量的传输显得尤为重要,如何更快、更多、更好地传输与存储数据成为数据信息处理的首要问题。
在压缩算法中分为无损压缩和有损压缩。
相对于有损压缩来说,无损压缩的占用空间大,压缩比不高,但是它100%的保存了原始信息,没有任何信号丢失并且音质高,不受信号源的影响,这点是有损压缩不可比拟的。
而且随着时间的推移,限制无损格式的种种因素将逐渐被消除,比如说硬盘容量的急剧增长以及低廉的价格使得无损压缩格式的前景无比光明。
1、无损压缩的原理以及几种常见算法本质上压缩数据是因为数据自身具有冗余性。
数据压缩是利用各种算法将数据冗余压缩到最小,并尽可能地减少失真,从而提高传输效率和节约存储空间。
常见的无损压缩算法有,游长编码;香浓-凡诺算法;霍夫曼算法;LZW算法;下面详细介绍这些算法或编码步骤,并比较其优缺点。
2、游长编码也叫行程编码,它是数据压缩中最简单的一种方法。
它的思想是:将图像一行中颜色值相同的相邻象素用一个计数值和该颜色值来代替。
例如:aabbbccccdddddeeeeee对其进行游长编码可得2a3b4c5d6e,可见其效率很高。
但它有两个致命缺点。
一:如果图象中每两个相邻点的颜色都不同,用这种算法不但不能压缩,反而数据量会增加,例如对abcdeabcde进行编码得1a2b3c4d5e1a2b3c4d5e,可见数据量反而增加了1倍。
二:容错性差。
还是以aabbbccccdddddeeeeee为例,如果在第二位a出错,例如丢失了a,那么编码后结果为1a3b4c5d6e,虽然只有一位发生了错误,但是在恢复数据时,将和原始数据完全不同。
所以说游长编码在要压缩信息源中的符号形成连续出现片段时才有效,并且它不是一种自适应的编码方式。
一种无失真多媒体数据压缩算法
MPEG(Motion Picture Experts Group)是一种无损多媒体数据
压缩算法,由美国标准协会(ANSI)发布,主要用于音频和视频的压缩。
该算法可以有效地减少文件大小,从而改善媒体数据的存储、传输和
共享方式。
MPEG压缩算法采用三种技术来实现无损数据压缩,分别为:预测、熵编码以及变形。
首先,通过预测分析,根据关联的点、平均行或块
去除数据中的重复部分(很多像素之间的差异很小),减少文件的大小。
其次,采用熵编码的技术,利用常用数据占用更少的空间这一特点,通过Huffman编码把常用的像素值表示为较短的比特序列,从而
达到压缩目的。
最后,通过变形技术,对数据进行可预测的非单调变换,使剩下的量化误差变小,从而实现有损压缩。
此外,MPEG压缩算法还采用双向预测、按照文件类型分块、支持
无损压缩等技术,以达到有效地压缩多媒体数据的目的。
MPEG压缩算
法的成功,为视频会议、互联网视频广播以及DVD技术的发展提供了
支持。
另外,它还被广泛应用于通讯、教育、娱乐等方面,在多媒体
数据传输和储存方面发挥了重要作用。
图像处理中的图像压缩算法使用方法图像压缩是一种图像处理技术,其目标是通过减少图像数据的存储空间,实现图像文件的压缩,同时尽量保持图像质量不受太大损失。
在图像处理中,常用的图像压缩算法有无损压缩和有损压缩两种。
无损压缩算法通过去除图像中的冗余信息和重复信息来减小文件大小,但不改变图像的视觉质量。
最常见的无损压缩算法是Huffman编码和LZW编码。
在使用这些算法时,首先要通过建立统计模型来找出出现频率较高的像素值或像素组合,并将其赋予较短的编码,出现频率较低的像素值或像素组合则赋予较长的编码。
这样,在存储图像时,可以用较少的位数表示像素值,从而实现对图像文件的无损压缩。
另一种常见的图像压缩算法是有损压缩算法。
与无损压缩相比,有损压缩算法可以更大幅度地减小文件大小,但会引入一定的失真。
最常用的有损压缩算法是JPEG算法。
JPEG算法通过使用离散余弦变换(DCT)将图像转换为频域表示,然后根据频域表示中每个频率分量的重要性进行量化,再经过熵编码得到压缩后的图像文件。
根据JPEG算法的使用方法,我们可以按照以下步骤进行图像的有损压缩:1. 将图像转换为YCbCr颜色空间:JPEG算法首先将RGB图像转换为YCbCr颜色空间,并对亮度通道(Y)和色度通道(Cb和Cr)进行分离。
这是因为人眼对亮度的感知比对色度的感知更为敏感,对图像进行压缩时,可以对色度信号进行更大程度的压缩而不会明显损失图像质量。
2. 分块和DCT:将图像分为8x8大小的非重叠块,对每个块进行离散余弦变换(DCT)。
DCT可以将图像从空域转换为频域,通过将高频信号量化为较低的频率分量,可以实现对图像的有效压缩。
3. 量化:DCT变换后的频率分量通过量化表进行量化。
量化表中包含了不同频率分量的量化步长,这些步长决定了频率分量的值域范围。
较高的量化步长会导致更多的信息丢失,从而达到更高的压缩比,但也会引入更多的失真。
根据用户需求,可以选择不同的量化表来控制压缩比和失真程度。
广州师院学报(自然科学版)JOU RNAL O F GUAN GZHOU NORM AL UN I V ER S IT Y(NA TU RAL SC IEN CE ED IT I ON) 1998年第6期N o.6,V o l.19多媒体教学软件中图形数据的一种无损压缩方法王若梅(广州师范学院计算机系510400)提 要 本文针对教学软件中图形的特点,利用熵分割法,提出了一种图形数据的无损压缩方法。
该方法在常规RL E压缩编码的基础进行改进,使被压缩数据的重复次数由64个提高到128个。
该方法能对制作图形进行有效压缩。
关键词 多媒体;图形;象素;熵;压缩编码;RL E中图分类号 O391.41 利用计算机多媒体进行教学,是现代教学中必不可少的教学手段。
多媒体技术使计算机能方便地处理文字、图像、声音、动画及视像等信息。
把教学内容科学地制作成各种计算机多媒体教学系统,利用计算机系统丰富多彩、生动活泼的画面,更能促使学生迅速理解学习内容,增强学习的兴趣。
因此,尽快设计制作计算机多媒体辅助教学系统,是十分必要的。
本文是对计算机多媒体教学系统制作中所需要的图形数据,提出一种数据压缩方法,使得多媒体教学系统中的图形能占用更少的空间,有更高的工作效率。
1 多媒体教学软件中图形的特点 下页几个图形(图1—4),是我们正在使用和制作中的计算机多媒体教学软件中的4幅(颜色分辨率为256)。
由于上述图形均为位图,因此较好地满足了多媒体教学软件所需要的视觉效果好、色彩丰富、实物图及示意图生动逼真的特点。
深入分析上述图形,更发现它们有如下特点: (1) 它们均为制作图形,为满足教学内容而采用计算机作图工具绘制。
收稿日期:1996-11-05 (2) 为使学生能理解画面上重点突出的知识,背景颜色均采用单一的,烘托性强的颜色。
(3) 画面有着大面积的象素是相同颜色值,重复数据多。
(4) 汉字使用量较大。
(5) 通过对人的视觉反映及计算机存贮器占用的综合考虑,图形以256色最佳。
图1 (背景色为浅绿色) 图2 (背景色为浅黄色)图3 (背景色为深黄色) 图4 (背景色为白色)2 点位图的一般压缩方法——RL E 编码 由于点位图每个象素数据都需要若干位存贮单元表示颜色的R GB 分量,因此位图25广州师院学报(自然科学版)1998年 数据量大,占用磁盘存贮空间多,所以位图数据存贮时,均需进行数据压缩。
现行的无损压缩多采用RL E 技术,即:对于图形中相同颜色的象素数据,仅存贮一个象素的颜色值以及具有相同颜色的象素数目,达到数据压缩的目的。
现有的图形处理方式为一般RL E 编码(注:RL E 编码参见文献[2]第5章第2节P 256)和RL E 压缩编码,简述如下: (1)一般RL E 编码: 一般RL E 编码有以下两种结构: 结构1: 字节1 字节2 字节3 b 7 b 6 b 5 b 4 b 3 b 2 b 1 b 0 b 7 b 6 b 5 b 4 b 3 b 2 b 1 b 0 b 7 b 6 b 5 b 4 b 3 b 2 b 1 b 0 标识 重复次数 数据 当相邻的数据相同时,以一个字节标识为此结构,一个字节记录重复次数,一个字节表示图形数据。
结构2: 字节1 字节2 字节3 b 7 b 6 b 5 b 4 b 3 b 2 b 1 b 0 b 7 b 6 b 5 b 4 b 3 b 2 b 1 b 0 b 7 b 6 b 5 b 4 b 3 b 2 b 1 b 0 标识 重复次数 数据 …… 字节N +2 b 7 b 6 b 5 b 4 b 3 b 2 b 1 b 0 …… 数据N 当相邻的数据不相同时,以一个字节标识为此结构,一个字节记录不相同的数据个数N ,紧接N 个字节表示N 个图形数据。
由此可见,一般RL E 编码最多可表示28=256个重复象素。
(2)RL E 压缩编码 RL E 压缩编码有以下两种结构: 结构1: 字节1 字节21 1 b 5 b 4 b 3 b2 b 1 b 0 b 7 b 6 b 5 b 4 b3 b 2 b 1 b 0 标识重复次数 数据 字节1定义如下: b 7b 6=11b 5b 4b 3b 2b 1b 0为下一字节的重复次数。
特别地,当图形数据前二位为11而相邻象素又不相同,编码如下: 字节1 字节21 1 0 0 0 0 0 1 b 7 b 6 b 5 b 4 b 3 b2 b 1 b 0 标识重复次数 数据 结构2: 当一个字节的首二位不为11时,该字节直接为图形数据。
由此可见,RL E 压缩编码最多可表示27=128个重复象素。
对于多媒体教学软件中图形,一般RL E 编码虽然能很好地压缩大面积重复颜色象素35 第6期王若梅:多媒体教学软件中图形数据的一种无损压缩方法数据,但对有汉字的地方,不仅不会压缩数据,反而会增大图形文件的数据量;RL E 压缩编码能压缩的数据量太少。
3 熵分割法进行图像分析 我们对经常使用的图像进行分析,基本思想如下:将调色板的256种颜色编号,分别为0-255,选择一个门限值,并依该门限分离图象的目标、背景,使得它们分别包含的信息量最大,信息量用熵来度量。
设f 0,f 1,…,f 255表示观测调色板编号的频率(直方图),概率可表示为:P i =f i N其中 ∑255i =0f i =N . N 是图象象素的总数;255是调色板编号最大数目。
又设A 、B 两类分别代表目标和背景,各具有不同的概率分布。
如果门限设置在编号数目s ,因为此时将P i 视作条件概率,则应使P i (i =0,1,2,…,s )下的总面积为1。
于是,进行归一处理,得到修正的A 类熵H (A )为H (A )=-∑si =0(P i P s )ln (P i P s)其中 P s =-∑s i =1P i .进一步得到H (A )=-1P s ∑s i =0(P i ln P i -P i ln P s )=ln P s +H s P s.其中 H s =-∑s i =0P i ln P i .类似地,B 类的熵H (B )定义为(其中m =255): H (B )=∑mi =s +1P i (1-P i )lnP i (1-P s )=-P i (1-P s )∑m i =s +1[ln P i -ln (1-P s )]=ln (1-P s )+H m -H s1-P s熵准则5(s )定义为 5(s )=H (A )+H (B )=ln P s (1-P s )+H s P s +H m -H s 1-P s 其中 H m =-∑si =0P i ln P i.使熵准则式5(s )极大的s 即为门限值。
以此算法,对上述图象进行计算,其门限值均为背景色编号值。
4 改进的RL E 压缩编码方法 根据上述推论,笔者提出一种改进的RL E 压缩编码方法: 改进RL E 压缩编码有以下两种结构: 结构1:45广州师院学报(自然科学版)1998年 字节1 字节21 b 6 b 5 b 4 b 3 b2 b 1 b 0 b 7 b 6 b 5 b 4 b3 b 2 b 1 b 0 标识 重复次数 数据 字节1定义如下: b 7=1b 6b 5b 4b 3b 2b 1b 0为下一字节的重复次数。
特别地,当图形数据前一位为1而相邻象素又不相同,编码如下: 字节1 字节21 0 0 0 0 0 0 1 b 7 b 6 b 5 b 4 b 3 b2 b 1 b 0 标识 重复次数 数据 结构2: 当一个字节的首位不为1时,该字节直接为图形数据。
由此可见,RL E 压缩编码最多可表示27=128个重复象素。
从教学图像中可看出:相邻象素不相同的地方大多数发生在有汉字的地方,而为了突出汉字的效果,一般采用深色,最多为黑色。
这使得该象素取值多为调色板的前127位,如黑色在调色板中为第0号。
因此在大多数情况下可避免出现结构一: 字节1 字节21 0 0 0 0 0 0 1 b 7 b 6 b 5 b 4 b 3 b2 b 1 b 0 标识 重复次数 数据的情况,直接使用结构2。
5 改进的RL E 压缩编码实例 笔者依据该方法,对我系多媒体计算机辅助教学系统中的多幅图形数据存放,数据均得到不同程度的压缩。
附:将图1,图2,图3,图4重新压缩,存放格式为HX ,各种图形格式的数据如下: 图1 图2 图3 图4・BM P 481078308278308278308278・PCX 315682700325792924637・HX 271352530910871421438 致谢:本文采用了朱志辉老师“多体计算机辅助教学系统”中的图形作为图1、图2、图3等图例,特此表示感谢。
参考文献1 朱志辉.多功能三维题库系统的设计.广州师院学报,1995;22 林福宗,陆达.多媒体与CD -ROM .清华大学出版社3 何世杰,蔡定楚,江淑芬,王海潜.V GA 显示原理与256色绘图特效55 第6期王若梅:多媒体教学软件中图形数据的一种无损压缩方法65广州师院学报(自然科学版)1998年 A M ethod of Com p ressing I m age D atain M u lti m edia T each ing Softw areW ang R uom ei(D ep t.of Co m p u ter,Guang z hou N or m al U niversity510400)Abstract T h is p ap er p resen ts a m ethod of com p ressing and coding i m age data,w h ich is an i m p rovem en t on the RL E coding,w ith the num ber of com p ressed data increased from64 to128.T he m ethod can effectively com p ress the i m age data of p ictu res. Keywords: m u lti m edia;grap h ics;b it-m apped i m age;p ictu re elem en t;en tropy; com p ressi on and coding;RL E。