当前位置:文档之家› 21世纪的计算机辅助翻译工具[2][山东外语教学]

21世纪的计算机辅助翻译工具[2][山东外语教学]

作者信息

作者1姓名:徐彬Xu Bin

工作单位:山东师范大学外国语学院

Foreign Language School, Shandong Normal University

邮政编码:250014

地址:济南市文化东路88号

作者1简介:徐彬(1973-),男,汉族,山东聊城。山东师范大学外国语学院,副教授,硕士。研究方向:翻译理论与实践、计算机

辅助翻译及机器翻译

作者1通讯地址:250014,济南市文化东路88号,山东师范大学外国语学院英语系

Email: binich@https://www.doczj.com/doc/568112402.html,

电话:135********

作者2姓名:郭红梅Guo Hongmei

工作单位:山东建筑大学外国语学院

College of Foreign Languages, Shandong Jianzhu

University

邮政编码:250101

地址:济南市临港开发区风鸣路

作者2简介:郭红梅(1971-),女,汉族,山东济南。山东建筑大学外国语学院,讲师,学士。研究方向:翻译理论与实践、英语教

学法

作者2通讯地址:250014,济南市转山西路8号,龙泉山庄A4-341

Email: guohongmei@https://www.doczj.com/doc/568112402.html,

电话:0531-********

山东师范大学外国语学院徐彬

山东建筑大学外国语学院郭红梅

内容摘要

计算机辅助翻译工具,是计算机辅助翻译(CA T)研究、教学和实践的基础。广义的CA T 工具,包括所有能服务于翻译流程的软件和硬件工具;狭义的CAT工具,则专指为提高翻译效率,优化翻译流程而设计的专门的计算机辅助翻译软件。后者的市场比广义的软硬件市场狭窄,因此不为翻译教学和研究界所熟悉。而前者,虽然多数计算机用户有所耳闻或接触,但多数情况下,由于认识上的局限性,无法有效整合所有工具的特长,使翻译效率最佳化。本文对广义和狭义的CA T工具作一详细介绍,望更多的翻译实践者、研究者了解掌握这些利器,在各自的领域做出更大成绩。

关键词:计算机辅助翻译(CAT);翻译记忆(TM);机器翻译(MT);项目管理

Applications of Computer-Aided Translation: An Overview

Abstract

CAT applications are the basis of conducting research, teaching and practice of CAT. In a broad sense, CAT applications include all the computer efficiency tools, either software or hardware; while in a narrow sence, they include special computer programs designed to streamline translating process and improve translating efficiency. As programs in the latter category have only a marginal share of the computing market, they are relatively unknown to the community of translation teaching and researching. And although most computer users know the fact that some programs can help translators improve their productivity, due to limitation of operating skills, many translators fail to integrate different tools to streamline their translating process. This paper introduces CAT applications both in the broad and narrow sence in hope that more translators and translation researchers can learn to use such tools to improve their productivity.

Keywords

computer-aided translation (CA T); translation memory (TM); machine translation (MT); project management

0.计算机辅助翻译工具:广义和狭义

计算机辅助翻译的工具可以分为两大类,一类是通用软件和硬件,即并非为翻译流程而专门开发的计算机软件。这些工具包括常用的文字处理软件、电子辞书软件,以及相关硬件,比如外部存储设施如可擦写光驱、数码相机、扫描仪等;另一类是专门的翻译软件。下面就这两类软件分别作一介绍和评述。

1.广义的CAT工具:通用软件

刚开始接触使用计算机来促进翻译工作,并不要求用户具有渊博的计算机技术知识,因为学会使用一些流行的商业应用软件,就能大幅提高译者的生产力。只要软件选择合理,使用得当,翻译流程就能得到优化。然而,多数翻译研究者和实践者,对于计算机如何能促进翻译效率的提高,认识还停留在比较初级的阶段。比如,在“计算机和科技翻译”一文中,周光复(1998)提到译者使用计算机可以提高翻译效率。他认为计算机以能从以下方面给译者带来帮助:

1.打字输入从总体来说提高了翻译速度。

2.汉字输入方案的造词功能可以大大提高翻译速度。

3.大多数文字处理软件都有强大的编辑功能。

4.文字处理软件都有强大的处理插图、表格和公式的功能。

5.语音输入软件进一步提高输入速度。

6.机器翻译前景广阔。虽然机器翻译的准确率还只能达到80%左右,译后的修改量

还比较大,但不管怎样,还是省去了大量的译文键入时间,大大提高了翻译速度。

这里,周光复关于计算机对于译者的帮助的阐述,还只是停留在了计算机“有用”的表面上,而且基本上仅限于“文字处理”一类应用,未能看到计算机对于翻译流程有可能带来的深刻影响。尤其是对于机器翻译的评价,有些高估其准确率。事实上,目前机器翻译的结果,对于熟练的笔译来说还是“改不胜改”,并不能提高翻译速度。下面笔者就先从多个方面阐述一下通用软、硬件对于翻译流程的促进,然后介绍计算机辅助翻译软件对翻译流程带来的变革。

1.1. 文字处理

许多人都把文字处理看作是计算机的最主要的用途。但是千万不要以为,“文字处理”就是

在键盘上打打字,知道怎么打开、保存文件就够了。文字处理软件有许多功能可以帮助译者提高效率。这类功能包括“自动更正”、“自动图文集”、“文件比较”、“版本”等等。另外拼写检查以及语法检查功能对翻译和校对都能提供不小的帮助。

Microsoft Word 2003版新增加的一个功能给译者和校对者都带来了莫大的便利:其“并排显示”功能能够将两个文档窗口左右并排显示在桌面上,供用户比较检查两个文档的异同。译者/校对者可以将原文显示在左边窗口内,在右边空白窗口内进行翻译/校对。相比于眼睛在桌面上的印刷文本和屏幕上的工作文本之间不停移动的工作方式,并排显示在屏幕上进行翻译和校对无疑更舒服。即使用户使用的是Word的较低版本,或是其他文字处理软件,虽然它们未提供类似的并排显示功能,也可以使用“窗口·拆分”功能来实现中英文对照翻译。

Microsoft Word的修订功能(Track changes)使用户可以跟踪文档的变化情况,忠实记录下文档中删除、添加的文字,以及校对者添加的批注等(插入的文字以下划线标识,删除的文字以删除线标识,并可各自设定不同的颜色)。这样,译者就不必抱怨或担心采用数字化的手段撰写初稿后进行校对的时候无法看到修订痕迹了。Word还有一个“版本”功能,可以分次记录每一次修订后的结果,保存于同一个文件内。这样用户就无需复制多个文档来保留版本差异。

图1:MS Word的修订和批注功能

“宏”是优秀的文字处理软件拥有的另一个极为有用的功能。宏指的是软件内多个操作命令的组合。例如,使用后面讲到的DéjàVu进行英汉翻译时,软件会自动将英文的标点符号插入到译文编辑区,并在每个句子末尾的标点符号后添加空格。这都不符合中文的行文规则。手工删除并重新键入正确的空格,会耗费译者大量的时间。此时我们就可以借助Word的“查找替换”功能,将“英文标点+空格”这样的组合批量替换为“中文标点”。因为要针对不同的标点符号重复许多次,我们就可以把每个操作“录制”到一起,形成一个“宏”,将其保存在Word的Normal模板中。日后再处理DéjàVu输出生成的汉语译文,运行这一宏,就可以批量修正所有的此类问题。①

说起文字处理,还有一个容易被人们忽视的小问题,就是汉字的输入法。使用DéjàVu这样的TM软件翻译的时候,系统会自动插入术语词库中已有的对应词,这时译者需要做的,是补充其他字词,并调整自动插入字词的顺序来完成一句话的翻译。这样的情况下,使用以词为单位的拼音输入法效率更高。据笔者的经验,近年来最优秀的以词为单位的拼音输入法,要数拼音加加(https://www.doczj.com/doc/568112402.html,/Pyjj/),其三重码设置配合以左右上档键和空格键选字,可以使用户抛开数字键快速选字选词,使拼音输入也可以不再需要看键盘,快速盲打,极大地改善了用户的工作方式。

除了以上便利,随着计算机技术的发展,语音识别越来越接近于实用。可以预见,某些熟练译员,将来可以采用“视译”的方式,口头翻译,由计算机转换成文字符号,使翻译更高效、更省力。现阶段比较成熟的语音识别软件有Dragon System、微软和IBM各自开发的系统,

具体请参考:

?IBM’s ViaV oice (https://www.doczj.com/doc/568112402.html,/software/voice/viavoice/)

?Dragon Systems’ NaturallyS peaking ( https://www.doczj.com/doc/568112402.html,/NATURAL.htm)

?Microsoft’s speech recognition module (https://www.doczj.com/doc/568112402.html,/office/previous/xp/speech.asp) in Microsoft Office XP and 2003.

1.2. 光学字符识别(OCR)

OCR是Optical Character Recognition(光学字符识别)的首字母缩写。对于译者来说,大量的源语文件是印刷品,要想在翻译这些资料的时候使用CAT软件,就必须首先将印刷品转换为电子文档。手工录入费时费力,而使用扫描仪扫描书籍,得到的是图象文件,其中的字符其实都是以像素的形式储存的,无法编辑、搜寻和引用,也无法导入TM软件建立翻译项目。要想将这些图像中的文字转换为可以编辑的字符,就必须借助OCR软件来实现。在汉字识别方面,比较成熟的有汉王系列的OCR软件。而对于英文,目前最佳的选择可能是俄罗斯的Abby FineReader,此外还有OmniPage、TextBridge等。配合普通的平板扫描仪,使用Abby FineReader可以在一天时间内轻松识别完成三、四百页的外语书。国外许多大学的电子图书馆中的书籍,就有不少是通过OCR配合专业扫描仪识别录入的。其代表比如Project Gutenberg (https://www.doczj.com/doc/568112402.html,/columnists/marge/a_la_marge_1103.html),以及弗吉尼亚大学图书馆的Electronic Text Center (https://www.doczj.com/doc/568112402.html,/) ,这些电子图书馆的建立,都大量使用了OCR技术。

1.3. 电子辞典

翻检字典,是做翻译少不了的必修功课。纸质词典检索方式单一,查阅不便。且受空间限制,一般译者很难备齐所有必须的词典。电子词典充分发挥当今计算机数据存储的优势,能在有限的空间内(电脑硬盘上的一小部分空间,或是几张光盘),存储大量的辞书数据。

对于英汉两种语言,较为常见的词典是《金山词霸》。其2006版收录“150余本词典辞书”“70余个专业词库”(https://www.doczj.com/doc/568112402.html,/cb06/why.htm),是习惯使用计算机做翻译工作的人得力的助手。另外,许多国外著名的辞书,也多有相应的电子版,比如牛津英语词典(https://www.doczj.com/doc/568112402.html,/)、韦氏、柯林斯等词典,都有各自的电子版本。这些英英词典,也是英汉两种语言的译者不可或缺的参考。

1.4. 电子百科全书

合格的翻译往往是“杂家”。但在资讯激增时代,做万事通、博物学家要比做某一科的专家难得多。对于翻译来说,时常会遇到必须借助百科全书的情况。和词典一样,纸版百科全书占用空间大,检索麻烦,电子百科全书相比之下具有便捷、迅速、廉价等诸多优点。常见的英文电子百科全书有Microsoft Encarta (https://www.doczj.com/doc/568112402.html,/)、大英百科全书Encyclopaedia Britannica (https://www.doczj.com/doc/568112402.html,/),以及网上的多语言免费百科全书Wikipedia

(https://www.doczj.com/doc/568112402.html,/wiki/Main_Page)等。对于从事英汉翻译的译者,电子版的《中国大百科全书》也是极佳的参考资料。.

1.5. 搜索引擎

不论是电子词典,还是电子百科全书,其更新速度,虽然比传统的纸版辞书要快,但仍往往跟不上时代的发展。另外,不论多么庞大的辞书,都不可能面面俱到,包罗万象。翻译实践中,往往会有意想不到的需求,遍访辞书都难求其解。此时,互联网这个人类有史以来创建的最大的资料库,就有可能发挥关键的作用。

互联网上的资料浩如烟海,若想高效率地检索,非得依靠搜索引擎不可。迄今为止,最受用户推崇的搜索引擎是Google。到笔者写稿这一刻,Google官方网站显示其索引的页面达到了80多亿个(实时资料请至https://www.doczj.com/doc/568112402.html,/intl/zh-CN/options/查询)。对于新、偏、难等语词问题,尤其是专有名词等问题,使用搜索引擎搜索,往往有意想不到的效果。比如笔者在翻译《宇宙为家》一书的时候,遇到了meme一词,词典尚未收录,求助于Google,则豁然可解。

还需要注意的是搜索引擎的详细技巧。利用有些特殊的功能,可以帮我们迅速实现表面上看来不可能的搜索任务。具体的搜索技巧,请至Google 帮助中心(https://www.doczj.com/doc/568112402.html,/support?hl=zh_CN)查询详细内容。

1.6. 桌面搜索

不少翻译都有搜集整理术语词库的职业习惯。在桌面搜索技术出现之前,搜集整理属于词库也是非常繁琐的过程。它涉及文件存储、词汇分类、格式统一、检索工具选择等等问题,费时费力。桌面搜索技术改变了这一切。Google在成为最成功的网络搜索引擎后,又开发释放出了一款桌面搜索软件“Google桌面”(https://www.doczj.com/doc/568112402.html,/zh/CN?promo=app-gds-zh-cn-v1-1)。它可以在用户所有的计算机范围内搜索文件,并为计算机上的以下项目类型编制索引(https://www.doczj.com/doc/568112402.html,/zh/features.html#searchremote):

?电子邮件(包括Gmail、Outlook、Outlook Express、Netscape Mail、Thunderbird 和Mozilla Mail)

?聊天记录(来自Google Talk、AOL Instant Messenger 和MSN Messenger)

?Web 历史记录(来自Internet Explorer、Firefox、Netscape 和Mozilla)

?Microsoft Word 文档

?Microsoft Excel 电子表格

?Microsoft PowerPoint 演示文稿

?PDF 文件

?媒体文件(图片、音频、视频)

?联系人

?约会

?任务

?备注

?日记

?Zip 文件(包括内容,而不仅仅是元数据)

?文本和其他文件

?受密码保护的Microsoft Office 文档(Word 和Excel)

?安全网页(HTTPS)

所谓的索引,是指Google桌面会对文件内容所包含的所有文字进行索引。比如一个Word 文件中含有“CAT(Computer Aided Translation):计算机辅助翻译”这样的辞条。使用词条中任意一部分或全部的组合,在Google桌面中搜索,都会得到这一词条及其出现于哪个文件中的信息。即使我们将这一Word文件加密,或是使用Zip压缩,Google也能检索得到。

由此看来,有了Google桌面,再搜集词条的时候就无需再做复杂的分类、格式统一等烦琐工作,只需将搜集到的术语文件保存在电脑硬盘上,文件格式可以是上述Google桌面所支持的任意一种,以后在翻译的过程中需要查询词汇,使用Google桌面就可以同时搜索我们所保存的所有相符术语文件。可以想见,Google桌面搜索技术,必将为越来越多的译者认识、使用,笔者甚至预见到未来的TM软件也有可能整合这一技术,使其更有效地使用计算机上的语词资料以及互联网这个最大的语料库。

2.狭义的CAT工具:翻译记忆软件

最初的对于计算机和翻译的关系的研究,集中在使计算机能够自动翻译文本这一角度。但全世界多个国家的机器翻译研究都先后遭遇了挫折。②人们渐渐认识到语言的复杂性和岐义性超越了现阶段的任何算法手段,好的译文,尤其是文学性篇章的好译文,目前还只能由人工翻译获得。基于此认识,以及近年来语料库的发展也给研究机器翻译的工程和语言专家带来了新的启示,人们开始关注下面的问题:如何应用计算机软件,最大限度地实现翻译流程的自动化,提高人工翻译的效率,保证人工翻译的质量,并能够管理翻译流程。

目前,实现上述目的的基本理念,是翻译记忆技术(Translation Memory, TM),即将翻译流程中涉及纯粹记忆的活动,比如术语的匹配和自动搜索提示、高度相似句子的记忆和复现,交给计算机来做,免除翻译人员反复查找名词之苦,使其能全力对付语义的转换和传递。

TM软件的设计,从界面看,主要有两大类。一类软件力图和主流的文字处理软件融合,连接或嵌入到这些软件中,好像是一种“寄生系统”,Trados、WordFast、WordFisher等即属于此类;另一类则拥有独立的界面,工作时将需要翻译的文件导入自己的翻译项目文件中,DéjàVu、SDLX等即属于此类。两类软件各有利弊。寄生系统的界面令初学者有亲切感,并能借助成熟的文字处理软件的特有图文编辑功能;但这样做对自身的限制也较大,主要问题是运行软件对计算机系统的要求高,容易造成死机。而独立界面的软件与此正好相反,其界面可能需要用户花更长的时间去熟悉,但这样的软件由于无需依附其他软件,独立运行,执行效率较高,消耗系统资源少,运行稳定。

2.1. 雅信

雅信CAT 是在国内应用比较广泛的一款CA T软件。根据其官方网站提供的信息

(https://www.doczj.com/doc/568112402.html,/),国内使用雅信的机构包括华东师大、中国社会科学院、外研社、中国国际广播电台等等。不少翻译服务机构也使用它。

使用雅信,如果是翻译纯文本文件或RTF格式的文件,翻译工作是在雅信的专用界面中进行。如果是翻译Word文件,则雅信会“连接”到Word,在Word界面下工作。不过,由于RTF基本上能完美保存Word文件的所有格式,因此我们也完全可以先把Word文件转换成RTF格式,直接在雅信的界面工作。

相比于国外的TM系统,雅信最特别的地方,是提供了多款英汉、汉英词典。对于这一点,不同的人在做不同的项目的时候,会有不同的评价。一般而言,对于打字速度偏慢的人来说,做英汉翻译的时候,雅信自带的词典会提供较大帮助。因为此时用户可以据词选义,辅以少量的文字录入,即可完成句子的翻译。不过雅信提供的词典,有编辑粗糙之嫌,且这些词典并非专门针对翻译而编辑。比如对于space shuttle,就有“航天飞机、太空梭、航天飞船、空间渡船、星际往返飞船、太空穿梭机、往返于地球和太空站之间运载人和物资的航天飞机、宇宙飞船”等诸多解释。其实在这些解释中,只有“航天飞机”是标准的译名,其他的译名,对于翻译来说都是无效的。将这些名词统统罗列出来,在翻译语境下,完全成了干扰,降低了翻译工作效率。另外,对于汉英翻译,雅信也会遇到汉语切分、分词的难题。众所周知,汉语篇章如何合理切分为词和词组,一直是计算机自动处理汉语的难题。在做汉英翻译的时候,由于分词不准确,雅信提供的参考词汇也就缺乏参考价值。

对于上述的问题,有一个解决办法,就是禁用系统词库。雅信也的确提供了这样的选项。禁用系统词库后,雅信就像Déjà Vu和Trados等系统一样,完全依赖用户建立的专门词库工作。如果某个项目足够大,在翻译之前,或在翻译之中不断添加词库,慢慢积累起足够多的词条,那么使用专用词库的效果,往往要好于使用大而全的词典。可惜的是,雅信的设计是把用户词库也存放在软件的安装文件夹中,这一做法往往会带来两个问题:1)不利于用户方便地备份用户词库,造成用户词库的意外损失;2)不利于依据项目分别建立专门的词库,管理不方便。

2.2. TRADOS

Trados于1984 年由两个德国工程师Jochen Hummel和Iko Knyphausen开发。目前它是市场占有率最高的翻译记忆软件,汪榕(2002)提到其全球市场占有率约为70%,主要客户包括微软、西门子、SAP、甲骨文公司(Oracle)等。另外,TRADOS在中国也设有办事处(https://www.doczj.com/doc/568112402.html,/IT/it2006.htm)。该软件的高市场占有率,相当程度上可能应该归功于“先来者优势”。当大多数翻译服务机构要求译员使用Trados之时,自由译者也只有选择该软件。当然,Trados的技术也深孚众望,相当成熟。它包含多个模块,每个模块各司其责:

?Tra nslator’s Workbench:翻译记忆模块,包含文档分析、预翻译、交互翻译、清理译文等功能。

?TagEditor:用于编辑翻译标记语言。一些桌面出版系统,如PageMaker、FrameMaker 等,使用的文件格式就属于标记语言。

?DTD Settings Wizard:供TagEditor和WinAlign 调用创建、编辑DTD设置文档。

?MultiTerm:术语管理模块,生成、编辑项目术语库。

?T-Windows:交互翻译PowerPoint、Excel、可执行文件以及Windows的剪贴板信息的模块

由于多模块设计等原因,Trados可能是翻译记忆软件中最难于掌握的软件之一。其主要原因,可以归因于Trados的学习曲线过于陡峭。普通的文字处理软件一般仅需要用户首先学会新建、打开、保存文件等基本操作,即可开始使用。Trados则不同。用户必须学会大部分的操作要领,才能真正完成从建立翻译项目,到执行翻译,乃至于输出翻译成果等过程。所以不少熟悉电脑操作和翻译记忆概念的人往往也要拿出70个小时以上的时间来学习掌握它的基本功能③。而要达到Trados的系统管理员的水平,为翻译小组提供项目管理的话,则需要更深入的学习。

2.3. Déjà Vu

Déjà Vu 是Atril Language Engineering公司(https://www.doczj.com/doc/568112402.html,)开发的翻译记忆系统,与Trados相比,尚不具有市场占有率的优势。但它是一个精悍的系统,许多职业译员将它视作最有潜力的TM软件。比如Danilo Nogueira在Translation Tools Today: A Personal View一文中提到,Déjà Vu是TM软件的Powerhouse。因此本文就对它作一较为详细的介绍。

2.3.1.界面特点

Déjà Vu的界面清晰简明(图2),其最新版本将文件浏览、自动术语和翻译记忆搜索等功能,集中在了一个统一的界面中。不过,用户也可以选择把其中的某个功能区窗口拖动到主窗口之外,这一点特别适合实用双显示器工作的人,他们可以把自动搜索窗口放置在一个单独的显示器上,获得更佳的视觉效果。另外,Déjà Vu工作界面的字体和颜色都可以调节,以最大限度适应用户的习惯。比如,对于翻译工作区,用户就可以选择较大的字号,好更方便地阅读屏幕文字。而对于参考区域,则可以选择稍小的字号,以便在有限空间内显示更多的参考内容。最值得一提的是用户还可以选择“冻结”编辑行的位置,这样,每完成一句翻译并确定后,下一句会自动递补到当前位置,免除了频繁使用键盘或鼠标卷屏调节编辑区域的麻烦。像这样的灵活的调节设置,在其他的计算机翻译辅助软件中是不常见的。

在Déjà Vu中工作,就好比是填写表格。用户面对的是一个双栏表格。左侧是源语,已经按句子进行了拆分。右侧是空白单元格,等待用户填入对应的译文。最右边的就是自动搜索等辅助工具,为译员提供实时的查询工作。

图2:Déjà Vu的工作界面

2.3.2.使用Déjà Vu的工作流程

使用Déjà Vu翻译,工作流程大致可以分为6个步骤。第1步是准备阶段,译员或项目主管创建术语库和翻译记忆库。这可能需要从零开始,也可以借助现有相关资料提取生成。

第2步是创建项目文件。在这一步中,译员或项目主管要完成3项任务:1) 导入源语文件;

2) 将项目文件和翻译记忆库及术语库挂接;3) 创建项目词典。

第3步是预翻译阶段,即让Déjà Vu自动搜索翻译记忆库,按照模糊匹配设定,看看待译文件中有无和记忆库中相匹配的数据。此时还可以打开“自动组合”(auto assemble)功能,让Déjà Vu自动将术语库和词典中已有的解释插入到对应的编辑框中。

进行完前3步,译员可以正式开始工作了。翻译过程在自动搜索功能的辅助下,会变得异常流畅。每当遇到新的术语,当确定好译文后,译员可以方便地将它存入项目词典或是术语库。这样,当第二次遇到该术语,Déjà Vu 会自动提示译员其对应译文,而且还可以将译文自动插入到编辑区。

第5步是校对和质量控制阶段。Déjà Vu有比较好的质量控制机制。它可以自动监察翻译项目中的术语使用情况,并在出现不匹配的句子中给用户提示。

翻译并编辑校对过后,译者就可以进入第6步,导出翻译后的结果了。导出的文件会保持和源文件一致的文件格式以及内部排版格式。这一特点对翻译网站内容特别有用。任何网站只需建设好源语版本,其他版本都在Déjà Vu中翻译,最后生成的其他语言版本也会继承和源

语版本同样的网站结构,无需二次开发,节省大量时间和资金。

2.3.3.Déjà Vu 的优势

Déjà Vu是翻译记忆软件中的后起之秀。随着用户逐渐增多,越来越多的人开始认识到这款软件的优越之处。

首先,Déjà Vu的术语管理极富特色。系统支持两级术语管理,分别是术语数据库和项目词典(lexicon)。项目词典因项目而异,因此其用途在于存储和项目紧密相关、特别有针对性的术语。在实际翻译过程中,针对原文,Déjà Vu会首先搜寻Lexicon,然后是术语库,最后才是翻译记忆的句库。这一点使其较之于其他翻译辅助软件具有了突出的优势。因为项目词典是最有针对性的,依据这样的主次关系,Déjà Vu 进行自动组合所得到的翻译素材,可用性强,能够大大节省译员的输入时间。相比之下,使用雅信CAT的时候,用户定义的词组和系统词典的解释会混杂在一起,没有主次,译员不得不面临分辨的苦恼。

DéjàVu术语管理的另一优点在于每个项目所使用的术语库和记忆库都是明确的数据库文件,用户可以将其和项目文件保存在同样的文件夹中,也可以单独保存数据文件。这种便利,使得保存、维护Déjà Vu的翻译资源特别有效,不容易出现误删除宝贵的数据文件这样的事。

其次,Déjà Vu有一种特殊的导出为外部视图的功能。译员可以将翻译完成的初稿,导出为双语对照的Word表格,供没有Déjà Vu的校对人员阅读修改。因为对于表格的每一行,DéjàVu都会生成一个序列号,因此修改校对完毕后,译员还可将外部视图文件导入回DéjàVu 的项目文件。

另外,Déjà Vu所支持的所有格式的文件,如果隶属于同一项目,就都可以导入到同一个项目文件中,共享同样的翻译记忆库、术语库和项目词典。这大大简化了项目管理,最大限度避免出现项目资源混乱等情况。

Déjà Vu是真正的多语言TM系统,只要是计算机操作系统支持的语言,都可以作为Déjà Vu 的翻译项目源语或目标语。而且针对一种源语可以设定多个目标语,这一点特别适合多国公司翻译内部资料。

Déjà Vu功能强大,优点也多,但它并不像常见的文字处理、幻灯演示软件那样容易被初学者领会。但介绍它的基本使用步骤,似乎超出了本文的范畴。大家若想尽快掌握其要领,可以参考笔者翻译的《Déjà Vu上手指南》(https://www.doczj.com/doc/568112402.html,/transtech)。

2.4. WordFast

与上述三款软件相比,WordFast是典型的小个子:该软件的下载文件大小仅仅为610 Kb。说到底,它是一套Word的宏命令,用户使用WordFast进行翻译时工作的界面,是熟悉的Word窗口。其用法、功能特别类似Trados,而且它确实可以和Trados互通有无,二者所使用的中间文件格式是兼容的。但之所以在这里介绍它,倒不是因为它麻雀虽小五脏俱全,而是因为它最近推出的一项叫做“The Wordfast Very Large Translation Memory (VLTM)”的项目④。凡是WordFast的用户,只要拥有不间断的互联网接入条件,即可参与该项目。说到底,就是WordFast网站的服务器,提供了超过20种语言对的翻译记忆数据库,而且每个记忆库的容量为超过10亿个(1,000,000,000)翻译单位。该项服务是免费的,用户在使用本地翻

译记忆库的同时,也可以得到VLTM的自动检索信息。这样,任何使用WordFast的译员,在尚未积累起自己的翻译记忆库之前,已经有机会借鉴其他人的翻译成果,而且据称这些翻译单位都是经过专业人员校对的。应该说,WordFast的这一创意,引领了翻译记忆软件未来发展的方向。由此出发,笔者甚至可以预言,在不远的将来,会出现一种完全基于浏览器的翻译记忆软件,用户工作的时候,除了能够自动创建并检索本地的术语库和翻译记忆库,同时也能检索所有参与用户自愿提供的并经过同行专家评审的网上数据库。这一前景,将使人们逐渐逼近通过使用超超大规模的翻译记忆库(即语料库)基本实现机器自动翻译的目标。⑤

3.应用TM软件的好处

使用TM软件几个显而易见的好处包括:

?方便校对

因为翻译的时候是以句子为基础,中英对照工作,因此可以随时方便地对照原文,免除了以纸介质工作的时候前后翻找之苦。

?保留格式

如上所述,保留源语文件格式,可以节省大量时间和资金。

?积累越多、效率越高

随着项目的进行,术语库、项目词典以及翻译记忆中的匹配资料会越聚越多,为将来的翻译提供了极具价值的参考。

?便于多人协作

对于大型项目,使用TM软件,可以轻松做到术语的统一,最大限度保证译文的质量。

4.结语

本文从广义和狭义两方面较全面而深入地介绍了计算机对翻译的促进、辅助作用。应该看到,目前国内综合性大学以及外语专业院校,为外语专业的学生开设相关课程的机构还很少。据穆雷(1998)的研究结果,大多数院校仅仅提供了“计算机”或“计算机文化”之类浅显地讲授计算机操作的公共课,计算机辅助翻译和机器翻译基本上还是空白。可是翻译的社会实践已经变了,通过Google搜索可知,大型国际组织(如欧盟[Blatt, 1998]、联合国)、国际性的翻译服务机构等,已经大面积采用翻译辅助软件。国内众多的翻译服务机构和自由译者也已经开始不同程度地应用本文提到的通用软件或翻译记忆软件。在这场翻译工具的变革中,翻译教学和科研领域落在了实践的后面。其直接的后果,就是翻译研究和实践之间正在出现越来越大的脱节。在计算机科学人员和翻译实践者的辛勤努力下,翻译实践,在翻译理论缺位的情况下,已然改变了整个翻译产业的景观。现在是翻译教学以及理论和研究界奋起赶上的时候了。首先教学必须跟上,向学生介绍翻译记忆的基本理念,帮助他们掌握核心的计算机操作技术,为他们走上社会之后的翻译实践服务。其次,翻译研究者要认识到,CA T软件不仅具有高度的实用价值,还具有科研价值。几乎任何一款翻译记忆软件,都同时可以用作双语平行语料库,对译学研究和对比语言学研究,都有较高的参考价值。而且,语言学,以及翻译理论的发展,也应该为计算机辅助翻译提供更多的思路和指导。

参考文献

[1]About Wikiwords. (n.d.). 查询日期2006年4月23日.

https://www.doczj.com/doc/568112402.html,/wikiwords?pg=about Blatt, Achim. (1998) Translation Technology at the European Commission: Description of a Workflow. Web: http://europa.eu.int/comm/translation/reading/articles/pdf/1998_01_tt_blatt1.pdf

[2]Nogueira, Danilo. (2006) Translation Tools Today: A Personal View. Translation Journal.

Web: https://www.doczj.com/doc/568112402.html,/journal/19tm.htm

[3]Gerasimov, Andrei. (2002) Trados—Is It a Must?Translation Journal.

https://www.doczj.com/doc/568112402.html,/journal/22trados.htm

[4]The Wordfast Very Large Translation Memory (VLTM) project. (n.d.). 查询日期2006年4月

23日. https://www.doczj.com/doc/568112402.html,/

[5]穆雷(eds.). 中国翻译教学研究[M]. 上海:上海外语教育出版社(1999)

[6]汪榕(2002). 翻译质量瓶颈的重大突破. 中国科技翻译, 15(1), 42.

[7]周光父. 计算机和科技翻译[J]. 上海科技翻译, 1998 (4), 16-19

注释

①这里仅仅是举了宏应用的一个小例子,熟练掌握并灵活使用这一功能,能够简化许多日常的文字处理操作。更多例子,可以参比较高阶的Word技术书籍。

②关于机器翻译所遭遇的挫折,可以参见ALPAC报告(https://www.doczj.com/doc/568112402.html,/wiki/ALPAC)和W.John Hutchins的文章MACHINE TRANSLATION: A BRIEF HISTORY (https://www.doczj.com/doc/568112402.html,/biblio/mtranslation.pdf)。1964年,美国国家科学院成立了Automatic Language Processing Advisory Committee,简称(ALPAC)。该委员会负责评估机器翻译的研究成果,结果该委员会的报告对机器翻译得出了负面的结论:MT速度更慢、更不准确,且是人工翻译成本的两倍,且指出没有立即的、可预见的迹象标明会出现可用的机器翻译系统。该报告等于宣告了机器翻译的死刑,在很大程度上阻碍了机器翻译的研究。应该指出的是,近年来机器翻译又开始复苏,而且人工智能的研究成果越来越预示着终有一天,人类能够实现机器翻译的梦想。

③俄罗斯自由译者Andrei Gerasimov在“Trados—Is It a Must?”一文中就提到:“It took me two weeks (full-time) to learn how to use the tool (despite the fact that I was thoroughly familiar with the TM concept and had used DéjàVu and Wordfast).”笔者个人的情况和Gerasimov的情况相似:我也是熟练的计算机用户,曾长期给《微电脑世界》等计算机期刊撰写应用文章,学习使用Trados也并不轻松,前后断续用了一个月的时间才真正适应这款软件。

④关于The Wordfast Very Large Translation Memory (VLTM)的详细信息,请参见WordFast的官方网站(https://www.doczj.com/doc/568112402.html,/)上的信息。值得指出的是,WordFast所提供的超大规模翻译记忆,包括了汉语(简体和繁体)。

⑤在基于规则的机器翻译模型研究遭受挫折后,利用超大规模双语或多语语料库作为后台支持,设计基于统计学和实例的机器翻译系统,是近年来机器翻译研究的主流方向。另外,关于超超大规模双语或多语语料库的检索,虽然对于个人电脑,其运算量可能还过大,但是对于能够进行并行运算的服务器来说应该不是难事。另外,这一设想所需的后台技术,已经出现了雏形,比如Google的桌面搜索软件,就可以在Google 索引的80亿个网页以及用户计算机硬盘中存储的所有资料中,按照关键词搜索获得所需资料。

相关主题
文本预览
相关文档 最新文档