栅格压缩编码和常见文件压缩方法的异同2
- 格式:doc
- 大小:29.00 KB
- 文档页数:3
1 、试分析 GIS 的几种主要的数据模型各自的优缺点。
答:GIS主要的数据模型有:矢量数据模型、栅格数据模型、矢量-栅格一体化数据模型、镶嵌数据模型、面向对象数据模型。
矢量数据模型:优点:1.便于面向现象(土壤类、土地利用单元等);2.数据结构紧凑、冗余度低;3.有利于网络分析;4.图形显示质量好、精度高。
缺点:1.数据结构复杂;2.软件与硬件的技术要求比较高;3.多边形叠合等分析比较困难;4.显示与绘图成本比较高。
栅格数据模型:优点:1.数据结构简单;2.空间分析和地理现象的模拟均比较容易;3.有利于与遥感数据的匹配应用和分析;4.输出方法快速,成本比较低廉。
缺点:1.图形数据量大;2.投影转换比较困难;3.栅格地图的图形质量相对较低;4.现象识别的效果不如矢量方法。
2 、简述栅格数据压缩编码的几种方式和各自优缺点。
答:1.游程长度编码结构优缺点:对于游程长度编码,区域越大,数据的相关性越强,则压缩越大,适用于类型区域面积较大的专题图,而不适合于类型连续变化或类别区域分散的分类图(压缩比与图的复杂程度成反比)。
这种编码在栅格加密时,数据量不会明显增加,压缩率高,并最大限度地保留原始栅格结构,编码解码运算简单,且易于检索,叠加,合并等操作,这种编码应用广泛。
2. 块码结构优缺点:具有可变分辨率,即当属性变化小时图块大,对于大块图斑记录单元大,分辨率低,压缩比高。
小块图斑记录单元小,分辨率高,压缩比低。
所以,与行程编码类似,随图形复杂程度的提高而降低分辨率。
3. 链式编码(弗里曼编码或边界链码)优缺点:可以有效的压缩栅格数据,特别是对计算面积、长度、转折方向和凹凸度等运算十分方便。
缺点是对边界做合并和插入等修改,编辑比较困难。
这种结构有些类似矢量结构,但不具有区域的性质,因此对区域空间分析运算比较困难。
4. 四叉树编码优缺点:对于团块图像,四叉树表示法占用空间要少得多,四叉树表示法基本上是一种非冗余表示法。
栅格数据编码方式
栅格数据编码方式有以下几种:
1. RLE编码(Run-Length Encoding):该编码方式根据一定的规则将连续的像素点压缩成一个值和重复次数的对应关系。
2. Huffman编码:该编码方式利用频率统计原理,对每个像素值进行编码,使频率较高的像素值的编码位数较少,而频率较低的像素值的编码位数较多,从而达到压缩的目的。
3. LZW编码(Lempel-Ziv-Welch编码):该编码方式是一种基于字典的压缩方法,通过建立一个字典表,将重复出现的字符用一个短编码来代替,从而减小了数据的存储大小。
4. Delta编码:该编码方式将连续的像素点之间的差值进行编码,从而可在一定程度上减小数据的存储大小。
5. JPEG2000编码:该编码方式是一种基于小波变换的压缩方法,可将图像分解为多个分辨率层级,并对每个层级进行小波变换编码,以实现高效压缩和解压缩。
一、名词解释(每题5分,共20分)1. 地理信息系统2. TIN模型3. 元数据4. 信息二、简答题(每题10分,共40分)1. 地理信息系统的组成。
2. 简述栅格数据及其主要编码方式。
3. 格网DEM分析的主要应用。
4. 根据下面示意图,给出其的矢量数据结构编码。
三、分析题(每题20分,共40分)1. 论述点、线、多边形数据之间的叠加分析的内容和方法。
2. 结合自己的实际工作,论述一个地理信息系统的应用实例一、名词解释1. 地理信息系统的定义是由两个部分组成的。
一方面,地理信息系统是一门学科,是描述、存储、分析和输出空间信息的理论和方法的一门新兴的交叉学科;另一方面,地理信息系统是一个技术系统,是以地理空间数据库为基础,采用地理模型分析方法,适时提供多种空间的和动态的地理信息,为地理研究和地理决策服务的计算机技术系统。
2. TIN即不规则三角网(Triangulated Irregular Network),是一种表示数字高程模型的方法。
TIN模型根据区域有限个点集将区域划分为相连的三角面网络,区域中任意点落在三角面的顶点、边上或三角形内。
如果点不在顶点上,该点的高程值通常通过线性插值的方法得到。
3. 元数据是关于数据的描述性数据信息,它应尽可能多地反映数据集自身的特征规律,以便于用户对数据集的准确、高效与充分的开发与利用。
元数据的内容包括对数据集的描述、对数据质量的描述、对数据处理信息的说明、对数据转换方法的描述、对数据库的更新、集成等的说明。
4. 信息是向人们或机器提供关于现实世界新的事实的知识,是数据、消息中所包含的意义,它不随载体的物理设备形式的改变而改变。
二、简答题1. 地理信息系统的组成。
一个完整的GIS主要由四个部分构成,即计算机硬件系统、计算机软件系统、地理数据(或空间数据)和系统管理操作人员。
其核心部分是计算机系统(软件和硬件),空间数据反映GIS的地理内容,而管理人员和用户则决定系统的工作方式和信息表示方式。
测绘科学技术:GIS原理及应用题库1、名词解释(江南博哥)OGC本题答案:即OpenGIS协会(OpenGISConsortium)其目的是使用户可以开放地操纵异质的地理数据,(李满春、陈奇、周炎坤、李响,《基于空间数据引擎的企业化GIS数据组织与处理》)促进采用新的技术和商业方式来提高地理信息处理的互操作性(Interoperablity),OGC会员主要包括GIS相关的计算机硬件和软件制造商,数据生产商以及一些高等院校,政府部门等,其技术委员会负责具体标准的制定工作。
2、名词解释线密度本题答案:用所有区域内的线的总长度除以区域的面积。
3、名词解释拓扑包含本题答案:是表示空间图形中,面状实体所包含的其他面状实体或线状、点状实体的关系。
4、名词解释火山灰质混合材料本题答案:凡天然的或人工的以氧化硅、氧化铝为主要成分的矿物质原料,磨成细粉和水后本身并不硬化,但与气硬性石灰石混合,加水拌和成胶泥状态后,能在空气中硬化,而且在水中继续硬化的,称为火山灰质混合材料。
5、问答题比较缓冲区查询与缓冲区分析的概念?本题答案:1.缓冲区查询与缓冲区分析不是一个概念的两种形式,缓冲区查询属于数据查询,而缓冲区分析属于数据的空间分析;2.缓冲区查询不对原有图形进行切割,只是根据用户需要给定一个点缓冲、线缓冲或面缓冲的距离,从而形成一个缓冲区的多边形,再根据多边形检索的原理,检索出言该缓冲区多边形内的空间地物。
而缓冲区分析对原有图形进行切割,形成一个点缓冲、线缓冲或面缓冲的距离,从而获得该缓冲区多边形内的空间地物。
6、问答题网络分析的基本思想是什么?本题答案:人类的活动总是趋向于按一定的目标选择达到最佳效果的空间位置,根本目的是研究、筹划如何安排一项基于网络数据的工程,并使其运行效果最好7、单选同一幅地图而言,矢量结构与栅格结构相比()A、图形精度高B、图形精度低C、图形精度相当D、无法比较本题答案:A8、名词解释 GIS应用模型本题答案:是根据具体的应用目标和问题,借助于GIS自身的技术优势,使观念世界中形成的概念模型,具体化为信息世界中可操作的机理和过程。
•栅格数据编码方法分为两大类:1直接栅格编码2压缩编码方法a链码b游程长度编码c块码d 四叉树直接编码就是将栅格数据看作一个数据矩阵,逐行(或逐列)逐个记录代码,可以每行都从左到右逐个象元进行记录,也可以奇数行地从左到右而偶数行地从右向左记录,为了特定目的还可采用其他特殊的顺序栅格数据编码方法直接栅格编码:•将栅格数据看作一个数据矩阵,逐行记录代码数据。
A A A AA BB B A ABB A A B B•1)每行都从左到右记录;AAAAABBBAABBAABB•2)奇数行从左到右,偶数行从右到左;•栅格数据量大,格网数多,由于地理数据往往有较强的相关性,即相邻象元的值往往是相同的。
所以,出现了各种栅格数据压缩方法。
•压缩编码的目的就是用尽可能少的数据量记录尽可能多的信息,其类型分为•信息无损编码•编码过程中没有任何信息损失,通过解码操作可以完全恢复原来的信息•信息有损编码•为了提高编码效率,最大限度地压缩数据,在压缩过程中损失一部分相对不太重要的信息,解码时这部分难以恢复1、行程编码(游程编码):将原始栅格阵列中属性值相同的连续若干个栅格单元映射为一个游程。
游程的结构为(A,P) 整数对。
块码是游程长度编码扩展到二维的情况,采用方形区域作为记录单元,每个记录单元包括相邻的若干栅格,数据结构由初始位置(行、列号)和半径,再加上记录单位的代码组成。
采用方形区域作为记录单元,每个记录单元包括相邻的若干栅格。
将栅格数据(线状地物面域边界)表示为矢量链的记录)首先定义一个3x3窗口,中间栅格的走向有8种可能,并将这8种可能0~7进行编码。
•2)记下地物属性码和起点行、列后,进行追踪,得到矢量链.其基本分割方法是将一幅栅格地图或图像等分为四部分。
逐块检查其栅格属性值(或灰度)。
如果某个子区的所有栅格值都具有相同的值。
则这个子区就不再继续分割,否则还要把这个子区再分割成四个子区。
这样依次地分割,直到每个子块都只含有相同的属性值或灰度为止。
栅格数据的主要编码方式什么是栅格数据编码方式?为什么需要栅格数据编码方式?栅格数据编码方式有哪些?如何选择合适的栅格数据编码方式?本文将逐一解答。
一、什么是栅格数据编码方式?栅格数据是一种用网格将空间分割成离散单元的空间数据,类似于棋盘。
每个单元格代表着空间中的一个像素值,这种像素值可以表示地表的不同属性,例如高程、温度、植被类型等。
栅格数据编码方式是将这些像素值以数字形式进行编码的过程,用来处理地理信息技术中所涉及的各种数据。
二、为什么需要栅格数据编码方式?栅格数据编码方式是在处理、操作和存储栅格数据时必不可少的过程。
它可以将栅格数据转化为计算机能够处理的数字格式,这样在进行数据分析、可视化和模型分析时,计算机可以快速地处理这些数据。
同时,栅格数据编码方式还可以大量减小栅格数据的存储空间,方便数据的共享和传输。
三、栅格数据编码方式有哪些?主要的栅格数据编码方式包括:1.无符号整数编码:在栅格数据中,每个像素值都表示为一个非负整数,通常采用二进制,而每个二进制位都可以表示一个唯一的像素值。
这种编码方式的数据大小较小,但是仅适用于无符号整数像素值。
2.有符号整数编码:有符号整数编码的范围很广,可以表示正数、负数和0,因此可以使用更多的像素值表示更多的信息,但是数据大小会相应地增加。
3.浮点数编码:这种编码方式可以表示非整数精细值,因此在处理地形、气象和海洋数据时非常有用。
浮点数编码的要点是数据精度,否则数据的近似值和处理结果将受到影响。
4.压缩编码:压缩编码的目的是将数据压缩到最小的尺寸,以便更好地存储和传输。
常见的压缩编码方案包括行程编码和差分编码。
5. RGB编码:基于颜色的编码方式,通常用于处理卫星影像和航空照片等真彩色或伪彩色的遥感数据。
四、如何选择合适的栅格数据编码方式?选择合适的栅格数据编码方式应该考虑以下因素:1.数据类型:选择哪种数据编码方式取决于数据类型,因为每个编码方式都有自己的优缺点。
栅格数据压缩编码和常见文件的压缩方法差异栅格数据压缩编码和常见文件的压缩方法具有很大的差异。
栅格数据在遥感和地理信息领域中广泛使用,包括遥感影像和列表等。
这些数据通常具有高分辨率,占用空间巨大,需要进行压缩以节省存储空间和传输带宽。
常见的文件压缩方法,如ZIP、RAR、GZIP等,对于栅格数据来说并不适用,需要使用专门的压缩编码方法。
栅格数据压缩编码方法通常分为有损压缩和无损压缩两种。
有损压缩会丢失一定程度的数据信息以减小文件大小,常见的有损压缩方法包括JPEG和JPEG2000。
而无损压缩则保留了所有数据信息,常见的无损压缩方法包括LZW、DEFLATE和LZ77等。
相比之下,常见文件的压缩方法通常采用的是无损压缩。
ZIP和RAR采用的是一种称为DEFLATE的压缩算法,可以将文件的数据压缩成更小的尺寸。
GZIP则是在DEFLATE基础上添加了头文件和尾文件,使得压缩文件可以被更好地识别和解压缩。
栅格数据压缩编码方法与常见文件压缩方法最大的区别在于,栅格数据需要考虑特殊的数据结构和特点。
例如,遥感影像通常是由像素点构成的,每个像素点包含多个波段的数据。
通过对波段之间的相关性进行利用,可以在保留数据信息的前提下实现数据压缩。
而常见文件则通常是由二进制数据组成,无法利用数据之间的相关性进行压缩。
因此,栅格数据的压缩编码方法需要在数据结构和数据特点的基础上进行设计和优化。
目前常见的栅格数据压缩编码方法包括Huffman编码、Arithmetic编码、RLE编码等。
这些编码方法也可以结合使用,以达到更好的压缩效果。
4.根据下面示意图,给出其的矢量数据结构编码。
4。
根据下面示意图,给出其的矢量数据结构编码.点:线:多边形模拟试题二4.下面两个多边形图层 A 和 B,图中标注的是多边形的属性,请画出 A 与 B 两个图层 Overlay 的结果图层 C 的示意图,并标注属性,其中 C 的属性为 C=A+B .“地理信息系统原理”课程考试试题一参考答案一、名词解释1。
地理信息系统的定义是由两个部分组成的。
一方面,地理信息系统是一门学科,是描述、存储、分析和输出空间信息的理论和方法的一门新兴的交叉学科;另一方面,地理信息系统是一个技术系统,是以地理空间数据库为基础,采用地理模型分析方法,适时提供多种空间的和动态的地理信息,为地理研究和地理决策服务的计算机技术系统。
2.TIN 即不规则三角网(Triangulated Irregular Network),是一种表示数字高程模型的方法。
TIN 模型根据区域有限个点集将区域划分为相连的三角面网络,区域中任意点落在三角面的顶点、边上或三角形内。
如果点不在顶点上,该点的高程值通常通过线性插值的方法得到。
3。
元数据是关于数据的描述性数据信息,它应尽可能多地反映数据集自身的特征规律,以便于用户对数据集的准确、高效与充分的开发与利用。
元数据的内容包括对数据集的描述、对数据质量的描述、对数据处理信息的说明、对数据转换方法的描述、对数据库的更新、集成等的说明。
4。
信息是向人们或机器提供关于现实世界新的事实的知识,是数据、消息中所包含的意义,它不随载体的物理设备形式的改变而改变。
二、简答题1。
地理信息系统的组成。
一个完整的 GIS 主要由四个部分构成,即计算机硬件系统、计算机软件系统、地理数据(或空间数据)和系统管理操作人员。
其核心部分是计算机系统(软件和硬件),空间数据反映 GIS 的地理内容,而管理人员和用户则决定系统的工作方式和信息表示方式.(1)计算机硬件系统:是计算机系统中的实际物理装置的总称,是 GIS 的物理外壳。
空间数据压缩名词解释
空间数据压缩是指对空间数据进行压缩处理,以减少数据的存储空间和传输带宽的需求,同时尽可能保持数据的质量和准确性。
以下是几个与空间数据压缩相关的常见名词解释:
无损压缩(Lossless Compression):无损压缩是一种压缩方法,通过使用压缩算法对数据进行编码,以减少存储空间和传输带宽的需求,但不会导致数据的任何信息损失。
无损压缩可以完全恢复原始数据,适用于需要准确还原数据的场景。
有损压缩(Lossy Compression):有损压缩是一种压缩方法,通过牺牲一定程度的数据质量来实现更高的压缩率。
有损压缩通常会删除或近似表示数据中的一些细节或冗余信息,从而减少数据的存储空间和传输带宽需求。
虽然有损压缩可以实现更高的压缩率,但会导致一定程度的数据质量损失。
矢量压缩(Vector Compression):矢量压缩是一种专门用于压缩矢量数据的压缩方法。
矢量数据通常包括点、线、面等几何要素的坐标和属性信息。
矢量压缩方法可以通过对几何要素进行编码或减少冗余信息来实现数据的压缩。
栅格压缩(Raster Compression):栅格压缩是一种专门用于压缩栅格数据的压缩方法。
栅格数据通常以像素矩阵的形式存储,每个像素包含一个或多个属性值。
栅格压缩方法可以通过编码相邻像素之间的变化或减少冗余信息来实现数据的压缩。
这些名词解释提供了一些常见的空间数据压缩相关术语的含义,有助于理解和应用空间数据压缩技术。
栅格压缩编码和常见文件压缩方法的异同一、关于栅格数据压缩编码栅格数据是按网格单元的行与列排列、具有不同灰度或颜色的阵列数据。
每一个单元(象素)的位置由它的行列号定义,所表示的实体位置隐含在栅格行列位置中,数据组织中的每个数据表示地物或现象的非几何属性或指向其属性的指针。
一个优秀的压缩数据编码方案是:在最大限度减少计算机运算时间的基点上进行最大幅度的压缩。
在栅格文件中,每个栅格只能赋予一个唯一的属性值,所以属性个数的总数是栅格文件的行数乘以列数的积,而为了保证精度,栅格单元分得一般都很小,这样需要存储的数据量就相当大了。
通常一个栅格文件的栅格单元数以万计。
但许多栅格单元与相邻的栅格单元都具有相同的值,因此使用了各式各样的数据编码技术与压缩编码技术。
其栅格数据存储压缩编码方法主要有:直接编码、链式编码、游程编码、块式编码、四叉树编码。
(1)直接栅格编码::是最简单最直观而又非常重要的一种栅格结构编码方法,通常称这种编码为图像文件或栅格文件。
直接栅格编码是将栅格数据看作一个数据短阵,逐行或逐列逐个记录代码。
可每行从左到右逐个记录,也可奇数行从左到右,偶数行从右到左记录,为特定目的也可采用其它特殊顺序。
通常称这种编码的图像文件为栅格文件,这种网格文件直观性强,但无法采用任何种压缩编码方法。
图2.1 (c)的栅格编码为:4,4,4,4,7,7,7,7;4,4,4,4,4,7,7,7;4,4,4,4,9,9,7,7;0,0,4,9,9,9,7,7;0,0,0,9,9,9,7,7;0,0,0,9,9,9,9,9;0,0,0,0,9,9,9,9;0,0,0,0,0,9,9,9。
可用程序设计语言按顺序文件或随机文件记录这些数据。
(2)链式编码:由某一原点开始并按某些基本方向确定的单位矢量链。
基本方向可定义为:东=0,南=3,西=2,北=1等,还应确定某一点为原点。
其特点:对多边形的表示具有很强的数据压缩能力;具有一定的运算功能,如面积和周长计算等;叠置运算如组合、相交等则很难实施,有效地压缩了栅格数据,尤其对多边形的表示最为显著,比较适于存储图形数据。
但对边界做合并和插入等修改编辑工作很难实施,而且对局部修改要改变整体结构,效率较低。
(3)游程编码:只在各行(或列)数据的代码发生变化时依次记录该代码以及相同代码重复的个数,即按(属性值,重复个数)编码。
游程用一对数字表达,其中,第一个值表示游程长度,第二个值表示游程属性值。
每一个新行都以一个新的游程开始。
表达游程长度的位数取决于栅格区域的列数,游程属性值则取决于栅格区域属性的最大类别数(分类的级别数)。
通常用两个字节表示游程长度(行数可达65536),一个字节表示游程属性值(256级)。
(4)块式编码:块式编码是将行程编码扩大到二维的情况,把多边形范围划分成由像元组成的正方形,然后对各个正方形进行编码。
特点:块式编码是将行程编码扩大到二维的情况;一个多边形所能包含的正方形越大,多边形的边界越简单,块式编码的效果就越好;多边形之间求并及求交方便;探测多边形的延伸特征较容易。
(5)四叉树编码而块状结构则用四叉树来描述,将图像区域按四个大小相同的象限四等分,每个象限又可根据一定规则判断是否继续等分为次一层的四个象限,无论分割到哪一层象限,只要子象限上仅含一种属性代码或符合既定要求的少数几种属性时,则停止继续分割。
否则就一直分割到单个像元为止。
而块状结构则用四叉树来描述。
按照象限递归分割的原则所分图像区域的栅格阵列应为2n×2n(n为分割的层数)的形式。
四叉树编码又称为四分树、四元树编码。
它是一种更有效地压编数据的方法。
它将2n×2n像元阵列的区域,逐步分解为包含单一类型的方形区域,最小的方形区域为一个栅格像元。
图像区域划分的原则是将区域分为大小相同的象限,而每一个象限又可根据一定规则判断是否继续等分为次一层的四个象限。
其终止判据是,不管是哪一层上的象限,只要划分到仅代表一种地物或符合既定要求的几种地物时,则不再继续划分否则一直分到单个栅格像元为止。
所谓四叉树结构,即把整个2n×2n像元组成的阵列当作树的根结点,n为极限分割次数,n+1为四分树的最大高度或最大层数。
每个结点有分别代表西北、东北、西南、东南四个象限的四个分支。
四个分支中要么是树叶,要么是树叉。
树叉、树叶用方框表示,它说明该四分之一范围全属多边形范围(黑色)或全不属多边形范围(空心四方块),因此不再划分这些分枝;树用圆圈表示,它说明该四分之一范围内,部分在多边形内,另一部分在多边形外,因而继续划分,直到变成树叶为止。
常规四叉树的特点如下:运算量较大,因为大量数据需要重复检查才能确定划分;占用的存储空间较大;容易而有效地计算多边形的数量特征;阵列各部分的分辨率是可变的,边界复杂部分分级多,分辨率高,而不需要表示许多细节的部分则分级少,分辨率低;栅格到四叉树及四叉树到简单栅格结构的转换比其他压缩方法容易;多边形中嵌套异类多边形的表示较方便。
四叉树的存储结构有以下几种:1.规则四叉树(Flash3.2.6)用五个字段表示树中的每个结点。
2.线性四叉树(Flash3.2.7)将四叉树转化成线性表,表的每一元素对应树中的一个结点。
3.一对四式四叉树(Flash3.2.8)五个字段表示每个结点,其中四个字段描述四个子结点的状态,一个存放其子结点记录的地址。
总之,四叉树编码是最有效的栅格数据压缩编码方法之一,还能提高图形操作效率,具有可变的分辨率。
不论任何形式的压缩数据编码,都是以增加了运算时间换取了存储空间,这就要考虑主要矛盾的主要方面,当我们想减少数据的冗余,有效地利用空间资源时,就不得不进行数据压缩编码,而让计算机多进行一些解码和处理复杂图形的运算。
因此,一个优秀的压缩数据编码方案是:在最大限度减少计算机运算时间的基点上进行最大幅度的压缩。
二、关于常见文件压缩方法文件压缩,原本是在那个存储空间甚至需要以字节来计算的时代,为了节省文件所占用的空间而诞生的。
总之压缩则是将一个大的文件通过一些压缩算法变成一个小文件。
而随着网络的普及,为了节省文件在网络上传输的流量及时间,对文件进行压缩也几乎成为了必备的过程。
根据所使用的压缩算法的不同,压缩文件也被区分为不同的格式。
图片中的列表是大多数常见的压缩文件格式,不过常用的并没有那么多,而在Windows系统上面常用的就更少了。
数据压缩是按照特定的编码机制用比未经编码少的数据比特表示信息的过程。
随着信息技术的高速发展,数据压缩的使用在网络时代越来越重要。
由于计算机处理的信息是以二进制数的形式表示的,因此压缩软件就是把二进制信息中相同的字符串以特殊字符标记来达到压缩的目的。
其实,所有的计算机文件归根结底都是以“1”和“0”的形式存储的,只要通过合理的数学计算公式,文件的体积都能够被大大压缩以达到“数据无损稠密”的效果。
对一些特殊的数据如相片、音频、视频的压缩算法也不同。
总的来说,压缩可以分为有损和无损压缩两种。
如果丢失个别的数据不会造成太大的影响,这时忽略它们是个好主意,这就是有损压缩。
有损压缩广泛应用于动画、声音和图像文件中,典型的代表就是影碟文件格式mpeg、音乐文件格式mp3和图像文件格式jpg。
但是更多情况下压缩数据必须准确无误,人们便设计出了无损压缩格式,比如常见的zip、rar等。
总之,我们今天说的压缩算法都是无损压缩,无损数据压缩指数据经过压缩后,信息不受损失,还能完全恢复到压缩前的原样。
“无损”一词是相对于有损数据压缩,有损数据压缩只允许一个近似原始数据进行重建,以换取更好的压缩率。
压缩软件(compression software)自然就是利用压缩原理压缩数据的工具,压缩后所生成的文件称为压缩包(archive),体积只有原来的几分之一甚至更小。
当然,压缩包已经是另一种文件格式了,如果你想使用其中的数据,首先得用压缩软件把数据还原,这个过程称作解压缩。
常见的压缩软件有winzip、winrar等。
常见的无损压缩算法有LZW、ZIP、RAR、7-Zip等。
ZIP是最常见的压缩文件格式,不需要单独为它安装一个压缩或者解压缩软件,因为使用的Windows系统已经集成了对ZIP压缩格式的支持。
总之,ZIP格式具有开放的算法编码,具有最广泛的使用范围,也被几乎所有的著名压缩工具所支持,目前互联网上下载大软件多数均采用ZIP格式发布。
ZIP压缩算法的特点是压缩和解压的速度快,它的缺点是对数据的压缩比不是很高。
直到ZIP的出现,以更高的压缩效率取代了ARJ。
现在的大多数操作系统都会集成对ZIP文件的支持,而所有的压缩软件也都会提供对ZIP文件的支持,这些体现出了ZIP格式的地位。
ZIP支持ZIP CAB TAR MIME等,其特点:与资源管理器集成一起,不离开资源管理器就可以作。
ZIP文件格式是一种流行的数据压缩和文档储存的文件格式,原名Deflate。
目前,ZIP格式属于几种主流的压缩格式之一,其竞争者包括RAR格式以及开放源码的7z格式。
从性能上比较,RAR及7-Zip格式较ZIP格式压缩率较高,而7-Zip由于提供了免费的压缩工具而逐渐在更多的领域得到应用。
该格式开放而且免费,越来越多的软件内嵌支持打开Zip文件。
虽然ZIP在压缩文件格式中地位很高,但现在相当多的下载网站都选择了用RAR格式来压缩他们的文件,最根本的原因就在于RAR格式的文件压缩率比ZIP更高。
同样的文件使用RAR格式进行压缩后得到的大小通常都会比使用ZIP压缩后更小,而我们对文件进行压缩的主要目的就是要减小文件大小以便于网络传输,正巧RAR格式又出现在网络刚刚开始普及的时候,所以RAR逐渐取代ZIP的地位也就是情理之中的事了。
对RAR文件进行压缩或者解压缩,首选的软件当然是WinRAR,与之前的WinZIP一样,它几乎也是现在每台电脑都必装的软件。
其特点:压缩率大速度快。
同时RAR是一种专利文件格式,用于数据压缩与归档打包,RAR编码器一直是有专利的。
所以这也就是为什么我们看到很多开源的压缩软件或者工具能够解压RAR,而不支持RAR打包的原因。
还有RAR压缩与解压缩比速度较慢。
但却还是提供了比较快速的压缩速度,以及比ZIP、ARJ更高的压缩比。
以及它支持创建分卷自扩展文件,具有良好的压缩包数据保护功能,目前互联网上的一些比较大的文件就是用RAR格式压缩的。
总之,RAR格式文件和ZIP格式文件的区别就是所支持的应用软件不同,RAR格式对应的是WINRAR,RAR的压缩要比ZIP的文件小的多。
其具体区别在于:第一个是WinZip 只有英文版+汉化包的,而且安装程序体积较大,WinRAR 则有官方的简体中文版,安装程序体积较小(还不到1MB) 。