当前位置:文档之家› DjVu技术白皮书

DjVu技术白皮书

DjVu技术白皮书

作者:姜强

邮件: jq@https://www.doczj.com/doc/3b2465030.html,

日期: 2007年4月

插件:

https://www.doczj.com/doc/3b2465030.html,/djvu.exe

目录

1. 序 (1)

2. 什么叫栅格信息 (2)

2.1. 文件大小 (2)

2.2. 图像压缩 (2)

2.3. 栅格信息的分辨率 (3)

2.4. 栅格信息的图像纠正 (3)

3. 矢量信息以及PDF格式 (5)

3.1. 矢量信息 (5)

3.2. PDF格式 (5)

3.2.1. PDF和分辨率 (6)

3.2.2. 图像的PDF (6)

4. 什么叫DjVu格式 (7)

4.1. D J V U格式和文档的形式 (7)

4.2. 文档形式和分辨率 (9)

4.3. 压缩专业文件和分辨率 (9)

5. DjVu格式VS标准图像格式?PDF文件 (11)

5.1. D J V U格式VS标准图像格式 (11)

5.1.1. 原图像的解像度和DjVu的画质 (12)

5.1.2. 相对于标准图像格式DjVu所具有的优点 (13)

5.2. D J V U格式与PDF格式 (14)

5.2.1. 图像PDF (15)

5.2.2. 附文本PDF (16)

6. DjVu格式简述

1.序

目前,互联网及网络的应用已经得到了飞速的发展,政府、企业、金融、院校、各行各业对网络有了更深的认识、更多的应用和更强的依赖。Internet的高速发展,给人们的工作和生活带来了极大的便利,对Internet的服务品质及访问速度的要求也越来越高。虽然带宽不断增加,但是越来越沉重的Web Data、互联网用户数量的急剧增加,导致Web服务器的负荷加重。网络访问速度慢,服务质量降低经常受到用户的抱怨。随着互联网的高速发展,要使一个企业、政府等在市场竞争中取得成功,改进Web站点的性能和质量,能够让用户快速访问web将成为未来互联网市场争夺的重中之重。

因特网的逐渐普及和扫描存储设备的成本逐步降低,越来越多的文件开始以数字化的形式在网上处理、传播和保存。人们对于信息的瞬间获取的需要,使得电脑屏幕成为各种信息的最佳显示媒介。然而当今世界上90%以上的信息仍然在纸上。大量纸质文件,包括经典古籍、书籍、绘画、彩色图片和照片都拥有十分珍贵的价值。而其中被发布在网络上的却寥寥无几。制约这些信息在网上发布的一个瓶颈就在于图像的原始文件大小问题。

现阶段,如果要保证文字和影像的清晰效果,就必须要用较高的分辨率来进行采集,其所得文件往往十分巨大,难以在网上浏览或下载。于是,为了达到差强人意的下载速度就不得不降低分辨率彩色图像不得已被转变成黑白,这也意味着图像的质量和可辨性将得不到保证。传统的网络图像格式,如JPEG、GIF和PNG等,在普通分辨率下的图像大小都十分巨大,且不具有文档结构,具有文档结构的如:PDF、TIF、PDG、CEB等格式确不能很好的表现绚丽的彩色信息。在过去数年中,人们对于有效处理彩色图像文件的技术的需求越来越强烈,而这种技术实际上就是一种有效的彩色图像压缩技术。当人们试图建立古代或历史文献的网上数字图书馆;制作电子商务网站的网上购物索引;或进行网络出版时;这种技术就显得尤为重要!低成本、高质量彩色扫描仪,以及高分辨率数码相机的出现,也为这类技术的应用提供了契机。

人们的需求也从传统的TIFF G4等黑白FAX格式,转变成为彩色的图像。所以TIFF、JPEG等标准格式得到了广泛利用,但是在画质和机能上还不能说是十分成熟。DjVu技术就是为了解决彩色文档信息而开发的。

2.什么叫栅格信息

2.1.文件大小

栅格信息是指所有图像。它的格式有Bitmap、JPEG、GIF、TIFF等各种式样。栅格数据在画面或是打印输出的时候,由纵横的像素集合来表示。图像通过各个像素的颜色和明亮度来表示。根据图像的文件大小は格式、压缩方法的不同而不同,、在画面上显示或者打印时,在内存上展开的非压缩文件的大小,无论是什么格式都是一样大的。非压缩文件大小根据图像的色数不同而不同。

2.2.图像压缩

图像压缩是指在保存非压缩文件时,将软盘尺寸变小。通常各种文件格式支持一个或多个图像压缩。

图像压缩大体上可以分为可逆压缩和非可逆压缩。可逆压缩可以真实再现初始数据的原始的各个像素点,与之相对非可逆压缩只能实现还原为近似于初始数据,因此非可逆文件展

开后和初始图像的展开数据的各个像素进行比较会有误差。

可逆压缩虽然可以真实的再现初始数据但是另一方面,存在压缩率低这一缺点,非可逆压缩虽然实现了较高的压缩率但是不能真实再现初始数据,伴随着压缩率的提高噪音也会变大,从而影响品质。

2.3.栅格信息的分辨率

栅格信息在表示、打印时使用分辨率作为单位。分辨率又称作DPI它是Dots par Inches 的简称。PDI是指每1英寸像素的数量,这个数值越高分辨率越高。高分辨率的图像由于相同单位像素数量多,所以可以真实再现更小的信息。

如上诉所示在纵横的实际尺寸固定时,分辨率越高数据量越大,非压缩的大小也就越大。另一方面,纵横的像素数固定,即使改变分辨率非压缩的大小也不变,如果按照原尺寸表示、打印时分辨率越高结果反而会越小。

2.4.栅格信息的图像纠正

通常图像被等大表示在显示器上时,画面上的1个像素和图像数据上的1像素相对应。

这时候有可能在显示器上被表示图像要比实际的尺寸大。这是因为显示器的分辨率和实际信息的分辨率不一样所引起的现象。通常画面的分辨率是72到96DPI,而信息的分辨率是300DPI、这样表示尺寸就比实际的信息尺寸大了。也就是说是因为将每1个像素的长由原来的1/300英寸拉伸到了1/72英寸。

在图像表示?印刷应用的时候,虽然可以放大、缩小,但是除了和像素等大以外的大小变更可能会引起图像的混乱。例如,将图像缩小时,非压缩数据尺寸的纵横像素有一部分被去掉了这样图像就变窄了。扩大的时候,由于各个像素也被等倍放大直线等得wedge会出现明显的被叫做飞边的凹凸不平。通常的图像表示?印刷应用的时候,放大或是缩小图像时为了防止图像变形要进行适当的纠正。纠正有以下几种:

这里所说的图像纠正通常情况下只用在旧图像放大或是缩小时,像素等大时按照原始数据来表示不需要纠正。

3.矢量信息以及PDF格式

3.1.矢量信息

栅格信息是通过纵横像素集合来表现的数据,和它相对应矢量信息是指将线、文字等用矢量的数式来表现。因此对于矢量化数据没有像素和分辨率这些概念。(虽然显示、打印等输出的情况还是会考虑分辨率和像素这是因为要依存于输出装置,并不是矢量化数据所需要的情报)矢量信息是通过全部的信息矢量化来表示,所以不需要保存像栅格信息那样大量的数据。例如,就是表示宽幅为1像素的直线,栅格数据的话需要直线长度的像素数据,与此相对矢量数据之需要将直线的基点坐标、直线的方向、长度数值保存。另外由于是通过数值来表示样子,即使放大缩小也不会出现飞边、像素点丢失。

但是,矢量数据是针对表现文字、画线wedge较高的图像,并不能表现象照片那样wedge 较低的复杂图像。

矢量信息可以用于CAD、GIS等任何一种作图软件。但是,矢量信息没有像TIFF、JPEG这样的标准化格式。矢量数据在其他方面还可以应用于Microsoft Office中的Power Point、Word的的Clip art等。

3.2.P DF格式

PDF是Adobe公司推行的送信用电子文件格式,在现在的各种各样应用中,支持发信用的电子文本实际上已经成为了。其主要特征如下。

●即使没有文档制作的应用程序,也可以免费使用PDF格式携带的Acrobat浏览

来阅读文件。

●通过平台?软件?版本等的兼容性完全独立,用代表平台做成和被制作体裁一样

●在各种各样的输出机器上使用可以得到同样的结果。

作为图像格式的PDF,可以说是矢量数据和栅格数据复合的文档。文本和线条作为矢量对象,信息作为信息对象加以分别保存。感觉就像是向正好是用纸尺寸的衬纸上连续贴上文本,线条信息。

3.2.1.PDF和分辨率

PDF格式,为了和单纯的象素集合体的格信息加以区分辨率这个概念变得复杂。例如,各种信息对象具有不同的分辨率,所有的具有一个打印的分辨率,重要的问题是,各种信息对象的分辨率独立于Page整体的分辨率,显示为各自对象物的分辨率,为了打印emulate 时需要Page分辨率。画面上被等倍表示的PDF文件,用纸的尺寸的实际尺寸表示这是用画面的分辨率(通常は72DPI)来表示,而不是打印机emulate的分辨率。Page分辨率并不是显示的数据密度,因为打印时需要打印emulate。

这样PDF的分辨率,和通过纵横数据的密度所示的栅格信息的分辨率在概念上完全不同。

3.2.2.图像的PDF

PDF文件可以在规定用纸大小的衬纸上,复数的放置信息、文本的对象。对象的数量也没有限制。

那么,在A4大小的衬纸上放置一个A4尺寸的300DPI信息的话会怎么样呢?这时,PDF文件和栅格文件具有了完全相同的意义。文件大小为信息的大小,信息的分辨率为文件的分辨率。

PDF的信息对象,支持二值、gray scale、全色,也支持G4、JPEG等压缩。这样的图像的PDF可以当作栅格信息来考虑。

4.什么叫DjVu格式

4.1.DjVu格式和文档的形式

DjVu格式是美国AT&T公司开发的用于彩色图像传送的图形格式。DjVu格式分为以下3类型。

DjVu格式和TIFF、JPEG同样是栅格信息。DjVu格式是通过它的先进的压缩方式、技术等,实现非常高的压缩率。特别是文档形式的DjVu文件在彩色图形压缩领域无一能比。文档形式的压缩率高的理由从以下3点加以说明。

●先进的压缩方式

如上所述,在文档格式中是先将图形的背景和文字、线条分离后,在各自的层

用各自相应的压缩方法进行压缩。使用彩色层的(前景?背景)IW44即使是采

用了很高的压缩率也可以保证比JPEG高的画质。另外,文本层的JB2压缩可

以实现最少要比TIFF的G4压缩还要小30%的程度。

●Segmentla的图像分离

Segmentla是指将图像的背景象片部分和文字、线条部分分离。因此背景彩色

图像对比高的部分被删除掉了,全部图像变得流畅,压缩也就变得容易了。

●背景的subsample

在文档或是图面里,图像中最重要部分是文字、图形等図形。虽然背景和模板

占了很大的数据量,但是文件的信息量并不是那么大。文档格式的DjVu,舍

弃了背景的分辨率,所以压缩率达到了飞跃的高度。把文件的信息量放在文字

和线条上,像照片和模板等这样的背景,在显示器上、印刷没有必要具有很高

的分辨率。

由于这个理由,DjVu文档形式实现了非常高的分辨率。在这里重要的一点事是,文档形式中,数据的信息量并不是捕捉数学的像素量,也就是说并不是捕捉色、纵横的像素数,而是捕捉图像wedge高的部分=文字、线条的数量。

从现在开始,文档形式最适宜原始图像来考虑一下问题。

●高的wedge零件构成的图像

文本

设计图面

地图

乐谱

●追求文字、线条部分的可读性的图像

目录、传单、宣传手册

杂志、一般书籍

一般文本

这样可以定义主要包含文字、照片的复杂文档。总之,文档形式可以说是适用于gray scale、彩色复合文档。

像以下这样的图像不应当使用文档压缩。

●全图为流畅的图像

风景照片

水彩画

●比起文字、线条更追求全图的美感的图像

写真集

绘画、美术品

这些图像,不仅有wedge高的部分,更追求图像的整体价值不可以使用segmentla分割。

就这样DjVu文档形式,在图像数据信息量捕捉方面捕捉wedg高的部分,舍弃信息价值低的部分,从而得到高的分辨率。

4.2.文档形式和分辨率

正如已经说过那样,文档形式将背景数据只作为subsample。DjVu的解码器对于通常的300DPI图像,背景为100DPI(1/3)、前景为25DPI(1/12)分别subsample。这样黑白mask layer分辨率就保持了初始数据的300DPI。在打印、画面描画时为了让重合的3个层完全重合,把分辨率不同的图像用标定表示。让全体重合时的分辨率就和mask layer的分辨率一样。也就和上面例子说的变成了300DPI。

4.3.压缩专业文件和分辨率

这样的压缩设定是指被称作专业文件的解码器的标准压缩参数设定。DjVu的解码器参数非常复杂,各个参数关联运作所以如果一个一个设定的话非常困难。最好参考这个专业文件的数据结果一边确认一边进行变更。通过专业文件初始图像种类(扫描、手书、线条等)被归结为100DPI到最大600DPI的图像参数设定。在彩色图像用文档形式压缩进行时,最低也要300DPI以上的分辨率。200DPI以下低分辨率的情况对比不是很明显,segmentla无法正常运作,或者使用subsample会使少量的数据变得更少也就无法得到满意的品质。

专业文件中也有200DPI以下图像的设定,但是在200DPI以下的专业文件里up sampie mask layer,背景和前景的subsample比率要比300DPIu、以上的文件设定的低。例如,100DPI 时,mask layer被up sampie为300DPI,背景不实行subsample,和原始数据保持一样的100DPI,前景subsample为25DPI(1/4)。这样,各层的分辨率各正好变成300DPI图像的同时保持了相同的分辨率。但是,因为在专业文件中增加了程序的分辨率,它的画质要比将300DPI的初始图像变换了的DjVu文件的画质要差。当然还是可以保持初始的100DPI图像程度的品质,因为up sampie压缩率并不是很低。

另外,所谓300DPI数值,即使选择JB2非可逆压缩也会对结果产生很大影响。DjVu的JB2压缩是利用被称作软件图形组合的图形组合来提高压缩率的。在影像中反复出现的图形在词典中被注册,在单一页中或者是复数页中,出现同样的图像并不是进行反复保存,而是参照词典,这样将冗长的数据消减。这个字典使用inda irekuto形式保存时可以确认扩展名为*.djbz文件。

JB2压缩本身并不是像OCR引擎那样进行字体识别,无论是文字还是线条都作为图像来识别,在词典上注册。这时,如果图像数据过于小的话,可能会出现“肉眼也可以开出并不是同一个数据但是被当成相同数据注册在词典上的”事情。特别是每个图像的数据量都非常小的时候,可能会发生非常相近的汉字被替换的现象。多数情况是因为初始影像的分辨率不足造成的。一个图像所需的最低数据量为40×40像素。这个数值在300DPI影像中大约为9point。总之1个文字的数据量如果在40×40像素以下的话,文字就有可能被替换。如果初始数据影像包含的小文字较多的话,必须要确认每个文字的数据量是不是充分。

5.DjVu格式VS标准图像格式?PDF文件

5.1.DjVu格式VS标准图像格式

当今,受到政府大力推进电子化政策,大量的文书被扫描后做成电子文档。而这其中大部分是以TIFF、JPEG等标准化图形格式保存的。如果将文件大小和DjVu比较的话,由于它的先进技术所适用的先进的压缩技术在多数的情况,要比标准化格式具有更高的压缩率。下表是它和A4?300DP图像用代表格式的比较。非压缩时的尺寸是黑白为大约1MB,彩色为大约25MB。

如上表所示,用黑白形式的话约为TIFF G4的1/2,写真形式的话约为JPEG的1/2,文档形式的话约为JPEG的1/20。当然文件大小以及压缩率是由初始图像的内容确定的。有一点非常醒目那就是DjVu无论是哪种形式都要比标准格式要小。

DjVu的照片压缩的话,背景的品质通过缺省设定为75,JPEG的画质通过使用Adobe Photoshop选择高品质制作而成。另外,因为DjVu的黑白压缩可以指定可逆,所以与TIFF 的G4压缩在画质方面可以说完全没有差距。这样比较的时候,画质方面是很重要的。一方面,文档压缩时,由于通过segumenta分离和补充范例,图像被整体扩大了,所以不能单纯地与JPEG进行比较。这种情况下,如前所述,并不是比较相对于原图像各像素的变化量,而是比较图像整体的文字和线画部分的可读性。如果从像素单位的角度来比较DjVu的文档压缩与原图像的话,大体上会与原图像有一些出入。这是因为通过分割的方式原图像被重塑,文字和线画部分得到了强调。

5.1.1.原图像的解像度和DjVu的画质

比较的时候,事先充分提高原文件的解像度是十分重要的。下面,比较A4?200 DPI图像的TIFF G4和JPEG。未压缩尺寸的话,黑白的约是474KB ,彩色的约是11MB 。TIFF?JPEG 的画质与300DPI的情况一样,与DjVu的输出结果相同。

200DPI的情况时,JPEG和DjVu的照片压缩和黑白压缩与300DPI的情况相同,比例为2:1,文档压缩的话,压缩率为1/10,大大地降低了。甚而,文档压缩的文件大小比300DPI的情况时更大。照片压缩的时候,JPEG压缩和IW44压缩都为非可逆压缩,所以各自都可以可变地设定压缩率。另外,因为TIFF G4和DjVu的JB2压缩是可逆压缩,所以压缩率有限制。原来的数据量变少的话,压缩率也会下降,彼此之间的压缩率也将逐渐接近。与此相对,文档压缩的时候,除了上述理由之外,解码器的profile(简档)设定也会有影响。低解像度图像由于数据不足,segumenta无法正确进行,因此200DPI的缺省profile(简档)的话,mask layer (屏蔽;层)的解像度被up sample(提高样品)到2倍。另外,背景的解像度up sample(提高样品)成mask layer (屏蔽,层)的1/4,前景up sample(提高样品)为背景的1/3。原图像为200DPI的时候,将mask layer (屏蔽,层)、背景、前景分别设定为400DPI、100DPI、33DPI。这与原图像压缩400DPI的图像时的压缩结果相同。也就是说,200DPI文档压缩的话,将原图像up sample(提高样品)以后再进行压缩。因此,与300DPI的结果相比,文件增大,而压缩率降低了。画质方面,虽然up sample(提高样品)成400DPI的了,但因为原本只是200DPI的,所以画质不会有显著的提高。由于segumenta

能够正确运转,所以能够进行这种up sample(提高样品)处理。画质方面,只能达到比挂上200DPI那样的segumenta少出错误的程度。

另外,在通过监视器和打印机比较输出结果的时候,应模拟原尺寸进行比较。通常的TIFF和JPEG阅读器的话,如果指定为100%,那么文件的1像素与画面的1像素相一致。例如,图像为300DPI的时候,与画面的96DPI的相符。这种情况下,应该以约为原图像用纸大小3倍的方式在画面上进行表示。另一方面,在DjVu中,以同原图像100%相同的大小进行表示。选择1对1的话,则以与画面像素相一致的方式进行表示。这时,由于DjVu 的背景和前景被sub sample(辅助样品)了,画质就仿佛降低了。但是,由于在DjVu中,文字的可读性得到了最大限度的强调,所以一直就未假设过以这样的大小来进行表示。因此,比较DjVu和标准格式时,需要把DjVu100%地表示,把TIFF和JPEG和DjVu像以同样大小的方式表示似的缩小。比较多的事例中,以这样的大小表示的话,DjVu不会出现劣于其他的情况。反而字变得好认了。

●低解像度图像的情况下,照片压缩能够得到和高解像度图像相同的压缩率。

●低解像度图像的情况下,黑白压缩的压缩率与高解像度相比有所降低。根据情

况不同,也可能出现与TIFF G4没有差别的现象。

●低解像度图像的情况下,文档压缩与高解像度图像相比文件变大,压缩率降低。

这是因为DjVu文件的解像度被up sampling(提高样品)的原因。

5.1.2.相对于标准图像格式DjVu所具有的优点

虽然DjVu在文件大小和压缩率方面要优于标准格式,但因为TIFF和TIFF是「标准」格式,因此存在着很多犹豫是否采用具有特别格式的DjVu的顾客,这一点确是事实。但是,采用DjVu,也会带来很多好处。特别在考虑网络送信的时候,以间接多页文件形式进行的每页字节服务,是其一大优点。

另外,对于已经持有已存的黑白TIFF的用户,需要在网络送信时进行图像转换。因为用JPEG的话,画质比较低,用GIF的话,文件又会变大,所以通常就原封不同地变换为G4压缩的图像PDF。与PDF的比较稍后将作详细探讨。相对于启动需要数十秒的反应缓慢的Acrobat阅读器, DjVu插件具有反应敏捷的优点。而且,即使是彩色图像,文档压缩时的每页的文件大小(为未压缩图像的1/2000)与JPEG相比也是极具优势的。

比较这样的压缩率的时候,原图像的解像度为300DPI这一点是十分重要的。特别是文档压缩的时候,对画质会有很大影响。200DPI以下的话,如前所述,由于up sample(提高

样品)的原因,压缩率得不到保障。综合考虑已存系统等情况,需要以低解像度方式转换时,不太会要求顾客进行大小比较。使用低解像度的理由多数与当时机器的规格和硬盘容量有关。但是,机器的规格和硬盘容量将来会以n倍的速度继续增加。如果具备在高解像度状态下处理图像的环境后再导入DjVu的话,可以防范将来可能会出现的问题(磁盘容量、传输速度、便捷性等)。

●顾客可能会在意DjVu不是标准图像格式这一点。

●在网络送信方面,DjVu的以页为单位的字节服务和反应敏捷的DjVu插件服务

两点是DjVu胜于TIFF和JPEG的解决方案。

●DjVu将会解决未来高解像度时代出现的各种问题。

5.2.DjVu格式与PDF格式

正如前面所提到的那样,PDF可划分为以下两种:把TIFF和JPEG提取到PDF中,然后以PDF的形式简化以后而形成的图像PDF以及带有通过Distiller等作成的文本和版面设计的附文本PDF。原本,PDF的目的是:通过把运用文字处理器和DTP等电子形式作成的文件转换为共通的PDF这种表示专用格式的方式进行文件的交换。这样作成的PDF带有通常文本和格式,提到实际的PDF运用,比起使用Distiller进行转换,更多的是把已存的TIFF等的图像转换成PDF,把Acrobat作为图像阅读器来进行使用。这种使用方法的背景是:PDF 作为业界事实上的标准被广泛地使用着。但是,考察一下实际使用情况的话,就会发现有很多情况是不适宜使用PDF的。在此,把PDF划分为图像PDF和附文本PDF,与DjVu进行比较。

5.2.1.图像PDF

下面是A4 300DPI图像的比较表。未压缩大小的话,黑白的约为1MB,彩色的约为25MB。高画质

图像PDF在性质上与JPEG和TIFF文件基本相同。因此,结果也大致相同。用Adobe Photoshop把JPEG压缩的PDF以高画质的方式保存的话,其大小会为JPEG文件的2倍以上,因此与DjVu的比率也会是2倍。

压缩率的结果是:G4和黑白压缩约为1/2,JPEG压缩和照片压缩约为1/4,JPEG压缩和文档压缩约为1/50。画质方面,与TIFF和JPEG文件的时候相同,与DjVu的输出结果相同。即使是用A4 200DPI进行比较,结果与TIFF?JPEG文件的情况也相同。

这时,文档压缩的文件大小比300DPI大,理由和TIFF?JPEG的情况相同。PDF格式原

本是用于画面表示和印刷的一种格式,并且这种格式附有运用PDFMaker和Distiller制作而成的字体和版面设计信息。出于这种格式的弹性,其延伸到作为图像格式来使用。由于作为一般图像格式的TIFF无法用WEB浏览器表示,所以经常可以看到转换为PDF后,使用已成为业界标准的Acrobat插件后再用浏览器表示的系统。这是由于PDF和Acrobat已成为事实上的标准,被像标准图像一样对待着。在这种时候,PDF格式是作为送信的便利方法被使用着的,至于压缩率和画质并没有被考虑。这样的用户可能会对DjVu的画质和压缩率有要求。

●与TIFF?JPEG文件相同的话题适合。

●可能会存在由于PDF为业界事实上的标准而不喜欢DjVu的用户。

5.2.2.附文本PDF

附文本PDF是PDF原本的格式。如果使用把字体和版面设计信息、图像等作为项目进行配置,分布于多种多样平台的Acrobat浏览器的话,就可以做到在任何环境下都同样的表示和印刷。如前所述,PDF格式的结构与raster image(光栅图像)有很大不同,因此,只单纯地比较文件大小是不全面的。

参考之前先尝试着通过A4 300DPI的DjVu文件和附文本PDF来对文件大小进行比较。

PDF文件是使用Adobe Distiller从Microsoft Word文档制作而成。PDF的job(工作)选项是用来将字体数据保存在文件内或者设定图像object(目的、目标)的解像度和压缩率等用的。在CJKScreen中,没有字体数据,而且提高了图像object(目的、目标)的压

缩率以及通过解像度与画面解像度的相统一缩小了文件大小。Press中,由于在文件内保存了所有的字体,而且图像object(目的、目标)的品质设定为最高,所以与CJKScreen相比,文件大小稍有增加。

仅仅比较大小的话,照片压缩是2/3,文档压缩的结果大体相同。但是,画质方面存在着很大差异。PDF的话,无论扩大为任何大小的格式纸都总是能以保持与原图像大致相同的品质来完成印刷。相对的,DjVu文档压缩的话,由于文字和线画被修改,画质并不是很优于PDF。可以说在cell(单元)单位的品质方面,PDF可以做到差不多100%地再现原图像。照片压缩的情况下,画质方面大致相同,只是小的文字看起来好像褪色了。这是因为IW44压缩为非可逆压缩。与JPEG压缩相比,虽然不容易出现noise(混乱),但整体上欠缺鲜明感。由于用Distiller作成的PDF文件通过缺省被设定在CJKScreen中,很多情况下,与DjVu的文档压缩同样的尺寸变得小了。尽管以这样的文件大小勉勉强强略胜一筹,但在品质方面却有很大欠缺。

但是,PDF和DjVu在到作成所用的workflow(工作流量)方面却大不相同。PDF是通过运用Distiller和Adobe公司的DTP软件等PDF对应应用程序制作而成。PDF是从电子化数据向DjVu转换,字体和版面设计、图像等与原图像完全相同。也就是说,为作成PDF,文字处理器和DTP应用程序的数据是必须的。与此不同,只要原图像是raster image(光栅图像),就可以作成DjVu。raster image(光栅图像)运用raster image(光栅图像)作成应用程序(照片扫描软件等)等,再通过扫描仪、数码相机获得数据。例如,考察一下把产品目录分别PDF化和DjVu化后的情况。近来,DTP已比较稳定,目录类基本上都由DTP 制作而成。PDF化的时候由这个DTP数据制作PDF。与此不同,DjVu是把最终完成的纸介的目录扫描后再转换为DjVu。

这时候,获得为PDF化所需的最终的DTP数据是非常困难的。很多时候,由于是在两个以上的设计事务所和一部分的负责人之间进行交换,无法在印刷前获得最终稿。另外,由于常常在即将印刷前需要进行校正,所以会出现未反映有关DTP数据最终修改状态的情况。也就是说,为了PDF化,必须事先考虑最终数据的完成日。另一方面,DjVu可通过扫描把最终完成的目录raster image(光栅图像)化,无需像PDF那样考虑作业流程。也就是说,与需要从目录数据的作成开始的PDF化不同,DjVu化只需要有现成的目录就可以了。可以说,如果可以事先电子化数据完成PDF化的话,PDF在文件大小和画质方面是一种很好的解决方案。与此不同,如果能够将已经完成好的目录等纸媒体通过扫描raster image(光栅图像)化或者已经raster image(光栅图像)化好的话,就可以DjVu化。这样的话,由于

PDF和DjVu的作成paradigm(范例)完全不同,所以不能相互替换。附文本PDF明显适合的系统中,使用DjVu好处也不少吧。

●附文本PDF在画质?文件大小方面,优势多。

●会出现附文本PDF和DjVu无法替换的情况。

●DjVu化过程中,作成raster image(光栅图像)是十分重要的。

相关主题
文本预览
相关文档 最新文档