从机器翻译到计算机辅助翻译的发展现状研究
- 格式:pdf
- 大小:315.30 KB
- 文档页数:6
引言概述:
正文内容:
一、计算机辅助翻译的基本原理
1.计算机辅助翻译的概念和发展历程
2.计算机辅助翻译的基本原理和工作流程
3.计算机辅助翻译的核心技术和关键功能
二、计算机辅助翻译软件的特点和分类
1.计算机辅助翻译软件的基本特点和优势
2.常见的计算机辅助翻译软件的分类和功能介绍
3.计算机辅助翻译软件的市场现状和趋势
三、计算机辅助翻译在各个领域的应用
1.计算机辅助翻译在文学翻译中的应用和挑战
2.计算机辅助翻译在法律翻译中的应用和优势
3.计算机辅助翻译在科技翻译中的应用和影响
4.计算机辅助翻译在医学翻译中的应用和前景
5.计算机辅助翻译在商务翻译中的应用和发展
四、计算机辅助翻译的优缺点及挑战
1.计算机辅助翻译的优点:提高翻译效率和准确性
2.计算机辅助翻译的缺点:存在机器翻译的限制和歧义
3.计算机辅助翻译的挑战:面临技术和人才的问题
五、未来计算机辅助翻译的发展趋势
1.自动化和智能化:技术的应用
2.多语种和多媒体翻译:面向全球化需求的发展方向
3.人机协同翻译:实现人与机器的有机结合
4.数据驱动和机器学习:挖掘大数据的价值
5.专业化和服务优化:满足不同行业和用户的需求
总结:
计算机辅助翻译作为一种革命性的翻译模式,为翻译行业带来了巨大的改变。
通过利用计算机的技术和相关软件的功能,计算机辅助翻译能够提高翻译效率,降低翻译成本,并且在各个领域都得到了广泛的应用。
计算机辅助翻译也面临着一些挑战,包括技术和人才的问题。
未来,随着和大数据技术的不断发展,计算机辅助翻译将进一步实现自动化和智能化,满足日益增长的翻译需求。
计算机辅助翻译:翻译者的新技术随着信息时代的到来,计算机逐渐走出工程技术人员的实验室进入了家庭,原本属于技术的研究工具,却为新时代的翻译人员开创了全新的天地。
计算机辅助翻译(Computer Aided Translation,简称CAT),就是利用利用计算机的巨大存储能力与快速检索能力,建立供翻译人员使用的机器词典、术语库、资料库等,以节省翻译人员的检索时间,显著提高工作效率。
计算机翻译在分析、转换及生成中,允许人的介入。
在某种情况下,如语言结构歧义时,人的介入会使问题轻而易举地得以解决。
计算机辅助翻译技术教学进入翻译课程体系设置的必要性,可以从以下几方面来理解:首先是翻译市场的需求。
随着中国越来越融人国际经济体系,翻译市场的总量迅猛增长,市场中的大部分翻译项目,是有关工程技术的文档翻译和商业本地化( lo-calization),一般这样的项目都具有时间紧任务重的特点。
要想在既定时间内,组织起足够数量的人力资源,保质保量完成任务,必须依赖计算机技术,对翻译的整个流程进行科学管理,合理分配;再者,当前的翻译机构必须倚重翻译技术,越来越多的大中型翻译机构要求加盟的专职和兼职译员掌握诸如Trados、Wordfast等主流的TM软件,唯其如此,译员才能顺利融入翻译公司的工作流程,和其他译员共享术语数据,保证项目的质量;还有,国内大学翻译专业尚无开设CAT技术课程。
为了尽快使中国的翻译教学与世界接轨,很有必要对CAT技术进行研究。
1 计算机辅助翻译基本过程1.1 已有翻译成果的重复利用词汇复用:系统提供大容量的专业词库,为用户节省查词典的时间,可自动进行词频记忆并按词频排序,用户只要点击鼠标或按快捷键即可完成句子翻译。
句子复用:采用先进的翻译记忆( TM)技术,把用户翻译的原文句子和译文自动记忆到数据库中。
翻译过程中,通过搜索引擎,自动查找记忆库,对需要翻译的内容进行快速分析、对比,保证相同的句子永远不要翻译第二遍。
计算机辅助翻译随着全球化的不断发展,语言交流得到了越来越多的关注,而计算机辅助翻译也因此崭露头角。
计算机辅助翻译(Computer Assisted Translation,CAT)是通过计算机技术来辅助翻译人员进行翻译的一种新型工具。
该技术包括计算机辅助翻译工具(Computer Assisted Translation Tools,CAT Tools)和机器翻译(Machine Translation,MT)两种方式。
一、计算机辅助翻译工具计算机辅助翻译工具主要是指一些软件,可以帮助翻译人员进行翻译。
这些工具大致可以分为三种:术语库,机器翻译和计算机辅助翻译软件。
1、术语库术语库主要是一个术语数据库,可以帮助翻译人员更快地查找与翻译内容相关的术语。
在翻译过程中,很多时候需要查找一些专业术语的翻译,但是如果没有相关的词典或者翻译软件,很难找到一个准确的翻译。
通过使用术语库,翻译人员就可以避免这种情况的发生,减少翻译时间和误差。
2、机器翻译机器翻译是一种将一种语言自动转换成另一种语言的技术。
机器翻译虽然无法完全替代翻译人员的工作,但是在处理大量相似的翻译任务时,可以减轻翻译员的工作负担,提高工作效率。
不过,由于机器翻译的精度还有待提高,因此在使用机器翻译时,翻译人员还需要对机器翻译的结果进行修改和完善。
3、计算机辅助翻译软件计算机辅助翻译软件可以帮助翻译人员更加高效地进行翻译工作。
这些软件包括翻译记忆库、文本对位工具、术语管理、实时统计等多种功能,实现了对翻译过程中文档的自动管理,可以帮助翻译人员更加高效地完成翻译任务。
二、机器翻译机器翻译是一种自然语言处理技术,通过计算机来实现将一种语言转换成另一种语言的过程。
机器翻译技术在短语、句子和段落等层次上进行翻译,目前已经取得了重要的研究进展,但由于语言歧义、语言多义性、文化差异和词汇多义性等问题,机器翻译的精确度和自然度与人工翻译仍存在一定差距。
三、未来发展计算机辅助翻译技术的不断发展与完善,正在给人类语言交流带来更多便利。
翻译国内外研究现状及发展趋势就目前我国翻译研究现状及发展趋势而言,首先因为我国庞大的人口以及对外开放程度的不断加深,翻译市场必将处于一个不断扩大的趋势。
我国翻译及语言服务产业规模不断扩大,人工智能技术应用更加广泛,翻译教育迅猛发展,行业标准化建设稳步推进。
球以语言服务为主营业务的企业总产值预计首次突破500亿美元。
中国含有语言服务业务的企业423547家,以语言服务为主营业务的企业达9656,企业全年总产值为554.48亿元,相较2019年年均增长11.1%。
北京是语言服务企业数量最多的地区。
2021年语言服务需求方急需语种排行前十位情况。
“一带一路”沿线国家的翻译业务量有显著增长,其中,阿拉伯语、俄语、德语、英语和白俄罗斯语为市场急需的五个语种。
语言服务需求方对翻译技术评价。
人工智能技术不断创新,机器翻译在行业的应用越来越广泛,具有机器翻译与人工智能业务的企业达 252家。
“机器翻译+译后编辑”的服务模式得到市场普遍认同,通过调研,超九成企业表示,采用该模式能提高翻译效率、改善翻译质量和降低翻译成本。
我国翻译教育迅猛发展,全国翻译硕士专业(MTI)院校达316所,累计招生约9.7万余人,全国翻译本科专业(BTI)的院校达301所。
翻译专题学术活动频繁,翻译研究与学科建设关注对讲好中国故事、对外话语体系建设、翻译活动在中国共产党百年征程中的重要作用等时代重要命题,凸显跨学科研究视域和翻译的社会文化价值。
行业标准化建设稳步推进,行业规范化管理水平进一步提升,行业标准助力企业高质量发展。
围绕翻译服务、人员基本能力要求、翻译技术、供应商选择、翻译计价、翻译培训等方面,中国译协已牵头组织编制5部国家标准,18部团体标准及行业规范。
近九成的受访企业表示行业标准有助于企业规范化运营与高质量发展。
据了解,中国翻译协会高度重视翻译及语言服务行业的发展,从2012年起组织实施行业调查,对翻译及语言服务行业现状、特征、问题及趋势等因素进行持续跟踪调研分析和解读,受到政府部门和国内外业界、学界、媒体界、企业界等广泛关注。
计算机辅助翻译概述课件计算机辅助翻译概述随着全球化的深入推进,翻译行业正面临着前所未有的机遇和挑战。
计算机辅助翻译(Computer-ded Translation, 简称CAT)作为一种将机器智能与人类智慧相结合的翻译技术,正日益受到行业的关注。
本文将对计算机辅助翻译的概念、发展历程、软件工具、技术实现以及未来发展趋势进行概述。
一、概念简介计算机辅助翻译是一种利用计算机技术来辅助或自动化翻译过程的方法。
与传统的机器翻译不同,计算机辅助翻译注重人机协作,将翻译记忆、术语管理、自动翻译等功能相结合,提高翻译效率和质量。
二、发展历程计算机辅助翻译的发展可以追溯到20世纪90年代,随着大型多语言翻译memory系统的出现,翻译行业开始走向数字化。
21世纪初,随着互联网和人工智能技术的迅速发展,计算机辅助翻译逐渐成为翻译行业的标配。
三、软件工具目前市场上有很多计算机辅助翻译软件,如谷歌翻译、百度翻译、有道翻译等。
这些软件根据不同的翻译需求,提供了多种翻译功能,如机器翻译、人工翻译、语音识别等。
此外,还有一些专门针对特定领域或行业的翻译软件,如SDL TRADOS、memoQ等。
四、技术实现计算机辅助翻译的技术实现主要包括语音识别、图像处理、机器学习等。
语音识别技术可以将语音输入转化为文本输出,图像处理技术可以将图像中的文字转化为文本,机器学习技术可以通过学习大量语料库,提高自动翻译的准确性和流畅性。
五、案例分析以一个典型的翻译案例为例,假设我们要翻译一篇科技论文。
在翻译过程中,我们可以利用计算机辅助翻译软件中的翻译记忆功能,将已经翻译过的句子存储在数据库中,以便下次翻译类似句子时可以快速查找和修改。
同时,我们还可以利用软件中的术语管理功能,统一管理论文中的专业术语和符号,确保翻译的准确性和一致性。
在语音识别和机器学习技术的支持下,计算机辅助翻译软件还可以自动识别需要翻译的句子,并通过学习已有的翻译案例,提高自动翻译的准确性和流畅性。
计算机辅助翻译随着全球化发展的潮流,翻译行业的重要性也日益凸显。
翻译不仅仅是简单地转换语言文字,更需要准确传达语言背后的文化和意义。
然而,对于翻译人员来说,面对海量的翻译任务和各种领域的专业术语,如何提高翻译质量和效率是一项巨大的挑战。
计算机辅助翻译(Computer-Aided Translation,简称CAT)应运而生。
它是指利用计算机技术来辅助翻译过程中的各个环节,提高翻译质量和效率的一种工具。
CAT工具包括术语库、双语词典、机器翻译等功能,以及提供自动对齐、术语管理、翻译记忆等功能,帮助翻译人员更好地完成工作。
首先,CAT工具中的术语库是提高翻译一致性的重要工具。
术语库是收集和管理重点领域的专业术语的数据库,翻译人员可在翻译过程中随时查询和使用。
通过术语库的使用,翻译人员能够更加准确地翻译专业术语,避免术语混淆和错误,从而提高翻译的质量和一致性。
其次,CAT工具中的双语词典为翻译人员提供了更多的参考和选择。
当遇到生词或者用词不确定时,翻译人员可以通过双语词典查询相应的释义和翻译。
双语词典的使用不仅能够帮助翻译人员充实自己的词汇量,还能够提供更多的翻译选择,增加翻译的准确性和多样性。
此外,CAT工具中的机器翻译功能则可以在翻译过程中提供参考。
通过机器翻译,翻译人员可以快速获取一个初步的翻译结果,然后进行进一步的修订和润色。
机器翻译的应用并不是取代翻译人员,而是提供参考和加速翻译的过程。
当然,机器翻译的准确性还有待提高,对于特定领域和复杂句子的翻译,仍然需要人工的干预和调整。
除了以上功能之外,CAT工具还提供了自动对齐、术语管理、翻译记忆等功能,这些功能都可以帮助翻译人员更高效地进行翻译。
自动对齐是指将原文和译文进行对照,并自动标记相同的翻译段落,从而实现翻译记忆的功能。
通过对翻译记忆的利用,翻译人员可以极大地提高翻译效率,节省时间和精力。
术语管理则可以帮助翻译人员更好地组织和管理术语,使同一专业领域内的翻译保持统一。
人工智能中的机器翻译技术自人工智能的快速发展,机器翻译这一技术逐步开始发挥作用,在全球范围内的交流中扮演着越来越重要的角色。
在计算机和人类交流中呈现出了巨大的优势。
本文将探究机器翻译技术在人工智能中的发展,分析其发展现状以及未来发展趋势。
一、机器翻译技术的发展历程在19世纪末期,最早的机器翻译试验就已经开始了。
随着计算机技术的不断发展,机器翻译技术的研究也在不断深入。
1960年代,机器翻译技术得到了快速的发展。
在该技术的初期,研究的重点是统计机器翻译模型。
其中词汇、语法规则及语料库是研究的重点。
随着计算机算力的不断提高,深度学习技术的兴起,机器翻译技术也得到了广泛应用。
现在,随着技术的不断发展,机器翻译技术已经实现了在多种语言之间自动翻译的功能。
随着技术的发展,机器翻译在实现自然流畅的翻译中仍存在许多挑战和难点。
二、机器翻译技术的应用机器翻译在全球商业和经济活动中发挥着越来越重要的角色。
在诸如国际会议、跨边境的合作等场合中,机器翻译技术不仅实现了语言的自动转换,更实现了跨文化沟通。
机器翻译技术已经越来越普及,许多公司都已经开始加入这个行列中。
比如Google,Microsoft,以及Facebook等大型科技公司都采用机器翻译技术来满足他们在全球化时代的需求。
这样的技术可以将公司资料以及产品说明从一种语言翻译至其他的语言。
三、机器翻译技术的发展现状虽然现代机器翻译技术已经能够在某些场合下完美地翻译出文章的意思,但是它所面临的挑战依然很大。
如今的机器翻译技术远远没达到像人类自然语言的水平,机器翻译在语法、词汇、习语等方面都依然存在一些问题。
因此,对于一些相关方面的专业性语言,机器翻译还需要面临语言表达深度问题。
此外,在不同领域中,机器翻译需要面临不同的技术难题。
比如,在一些语言之间存在大量的同音词,这就要求机器翻译技术能够进行有效、准确的翻译。
其中一些语言甚至包含多种意思相同或相近的词汇,这使得翻译软件的准确性大大降低。
人工智能机器翻译技术的研究与应用近年来,随着全球化进程的不断推进和人民出行、交流的增多,翻译成为了一项越发重要的工作。
然而,由于人工翻译成本高、效率低,翻译的限制和不便已日渐凸显。
于是,人工智能机器翻译技术作为一种新型翻译方式,受到了广泛关注和探索。
人工智能机器翻译技术已经发展成为可以翻译多个语种的自动化翻译系统,因此,本文将就人工智能机器翻译技术的研究及应用进行阐述。
一、人工智能机器翻译技术的发展历程人工智能机器翻译技术是指通过计算机程序对语言进行分析,再结合相应的翻译规则和语言库,实现自动翻译的技术。
虽然人工智能机器翻译技术是近年来发展起来的新技术,但其研究历史可以追溯到上世纪50年代。
上世纪50年代初,初步的人工智能机器翻译技术出现了,但它只能翻译一些句子,句子越长,翻译准确率越低。
60年代中期,自动机器翻译瞄准论文的翻译,研究集中在语言过程中使用的规则和不同的语法分析方法。
70年代,由于翻译规则的复杂性和人类语言的复杂性,自动翻译变得非常具有挑战性,难度逐步增加。
到80年代,翻译技术主要是基于直接翻译,即将源语言单词直接翻译成目标语言的单词。
90年代起,随着自然语言处理技术的发展和计算机性能的提高,人工智能机器翻译技术进入了一个新时代,众多新型自动化翻译系统的出现,如Google翻译、百度翻译等,它们的流畅度和准确性得到了很大的提升。
二、人工智能机器翻译技术的应用随着全球化的发展,不同国家、不同地区的人们交流沟通的需求越来越高,为满足这种需求,人工智能机器翻译技术被广泛应用于各种领域:1.交流沟通由于人工智能机器翻译技术可以很快地翻译成多种语言,因此使得人们的交流变得更为便利和高效。
日常生活中,比如在国际会议、商务洽谈等场合,通过翻译软件快速翻译,人们可以更加高效地进行沟通交流。
2.文化推广在文化推广方面,人工智能机器翻译技术能够使文化得到更广泛、快速的传播。
由于文化具有本土特色,如果我们想使某个文化更为广泛地传播出去,那么一定要通过向多个语言进行翻译实现。
人工智能时代的翻译技术研究内涵、分类与趋势一、本文概述随着技术的快速发展和广泛应用,翻译技术作为其中的一项重要分支,正在逐步改变我们的语言交流方式,并对全球的信息传播和文化交流产生深远影响。
本文旨在探讨时代的翻译技术研究内涵、分类与趋势。
我们将概述翻译技术在时代的内涵,包括其定义、特点和发展背景。
接着,我们将对翻译技术进行详细的分类,分析各类翻译技术的特点和应用场景。
我们将探讨翻译技术在时代的发展趋势,展望其未来的发展方向和潜在影响。
通过对翻译技术研究的深入分析,我们期望能够为相关领域的研究人员和实践者提供有价值的参考,推动翻译技术的进一步发展。
二、人工智能时代的翻译技术研究内涵在时代,翻译技术研究内涵得到了极大的丰富和深化。
翻译技术不再仅仅是传统的语言转换工具,而是演变为一门融合了计算机科学、语言学、认知科学等多学科的交叉研究领域。
其核心在于利用技术,实现自然语言处理、机器翻译、语言理解、知识表示等方面的突破,以提高翻译质量和效率。
自然语言处理:自然语言处理是翻译技术的基石,它涉及对文本、语音等自然语言的自动理解和生成。
在人工智能的推动下,自然语言处理技术得到了快速发展,包括词法分析、句法分析、语义理解等方面的研究,为翻译技术提供了强大的支持。
机器翻译:机器翻译是利用计算机自动将一种自然语言文本转换为另一种自然语言文本的过程。
随着深度学习、神经网络等技术的发展,机器翻译的质量和效率得到了显著提升,尤其是在神经机器翻译模型的推动下,机器翻译已经能够实现较为准确的跨语言翻译。
语言理解:语言理解是翻译技术的核心,它涉及对源语言文本的深入分析和理解,以便准确地传达其意义。
在人工智能时代,语言理解研究不仅关注语言的表面结构,还关注语言的深层含义、上下文信息以及语言与文化的关系等方面。
知识表示:知识表示是翻译技术中不可或缺的一部分,它涉及如何将人类语言中的知识转化为计算机可理解和处理的形式。
在人工智能时代,知识表示方法得到了不断创新和完善,如知识图谱、语义网络等,为翻译技术提供了丰富的知识资源和表示手段。
计算机辅助翻译与翻译教学的研究报告作者:李甜甜来源:《科教创新》2013年第04期摘要:本文首先对计算机辅助翻译的定义、概况、发展史进行简单的介绍,为接下来的讨论提供理论背景知识;其次,将对国内关于计算机辅助翻译与翻译教学的相关研究进行分析与归纳;最后,从中总结出心得体会,在今后的翻译教学中更好的应用计算机辅助翻译。
关键词:计算机辅助翻译翻译教学一、计算机辅助翻译的发展概况1.计算机辅助翻译计算机辅助翻译,简称CAT(Computer Aided Translation)。
它能够帮助翻译者优质、高效、轻松地完成翻译工作。
它不同于以往的机器翻译软件,不依赖于计算机的自动翻译,而是在人的参与下完成整个翻译过程,与人工翻译相比,质量相同或更好,翻译效率可提高一倍以上。
CAT使得繁重的手工翻译流程自动化,并大幅度提高了翻译效率和翻译质量。
2.机器翻译及其发展道路机器翻译(machine translation),又称为自动翻译,是利用计算机把一种自然源语言转变为另一种自然目标语言的过程,一般指自然语言之间句子和全文的翻译。
它是自然语言处理(Natural Language Processing)的一个分支,与计算语言学(Computational Linguistics)、自然语言理解(Natural Language Understanding)之间存在着密不可分的关系。
机器翻译的研究历史可以追溯到 20 世纪三四十年代。
1949年,W. Weaver 发表《翻译备忘录》,正式提出机器翻译的思想。
走过六十年的风风雨雨,机器翻译经历了一条曲折而漫长的发展道路,学术界一般将其划分为如下四个阶段:开创期(1947-1964)、受挫期(1964-1975)、恢复期(1975-1989)以及新时期(1990~现在)。
我国早在上世纪50年代就开始了机器翻译的研究,但是机器翻译得到真正的发展还是在“十年浩劫”以后,随着 Internet 的普遍应用,世界经济一体化进程的加速以及国际社会交流的日渐频繁,机器翻译迎来了一个新的发展机遇,中国也取得了前所未有的成就,相继推出了一系列机器翻译软件,例如“译星”、“雅信”、“通译”、“华建”等,机器翻译进入了一个发展的新纪元。
从机器翻译到计算机辅助翻译的发展现状研究 何兴建 成都体育学院
摘要:机器翻译,又称自动翻译,是利用计算机把一种自然源语言转变为另一种自然目标语言的过程,一般指自然语言之间句子和全文的翻译。它是自然语言处理的一个分支,与计算语言学、自然语言理解之间存在着密不可分的关系。我们所熟知并广泛使用的互联网翻译,包括谷歌翻译、有道翻译、百度翻译等,都是机器翻译服务。本文从机器翻译的发展历程入手,分析它的优势和不足,并引入计算机辅助翻译进行对比研究。最后,本文通过引入语料库和大数据的概念,探讨了机器翻译技术后续的发展方向,以便更好地为译者服务。 关键词 机器翻译;计算机辅助翻译;语料库;大数据 Abstract Machine translation, also known as automatic translation, is a process from a natural source language to another natural target language via computer. As a branch of natural language processing, machine translation has an inseparable relationship with computational linguistics and natural language understanding. Internet translation has widely been used by us. Such as Google Translation, Youdao Translation, Baidu Translation, etc., are all machine translation services. Starting from the development process of machine translation, this paper analyzes its advantages and disadvantages, and then introduces computer aided translation (CAT). Finally, through introducing the concept of corpus and big data, this paper discusses the follow-up development direction of CAT technology, in order that it can give better service for translators. Key words machine translation (MT); computer aided translation (CAD); corpus; big data
1. 研究背景:机器翻译简介和发展历程 随着国际贸易的发展和经济全球化的崛起,使得市场对专业翻译人才的需求不断增大。机器翻译技术在翻译行业中起着十分关键的辅助作用,可以大大减少翻译的工作量。所谓机器翻译,就是通过电子计算机程序,自动地把一种语言(源语言,source language)翻译成另一种语言(目标语言,target language)。从语言学的角度来讲,机器翻译就是自然语言处理技术的开发。机器翻译从总体模式上可分为三种类型:直接翻译法(Direct Translation)、中间语言法(Interlingual approach)以及转换法(Transfer approach)。 机器翻译的历史最早可追溯到20世纪三四十年代。20世纪30年代初,法国科学家G.B.阿尔楚尼提出了用机器来进行翻译的想法。1933年,苏联发明家П.П.特罗扬斯基设计了把一种语言翻译成另一种语言的机器,并在同年9月5日登记了他的发明。早在1956年,我国就把这项研究列入了全国科学工作发展规划,课题名称是“机器翻译、自然语言翻译规则的建设和自然语言的数学理论”。机器翻译经历了一条曲折而漫长的发展道路,学术界一般将其划分为如下四个阶段:开创期(1947‐1964)、受挫期(1964‐1975)、恢复期(1975‐1989)和新时期(1990‐至今)[1]。
中国机器翻译研究起步于1957年,是世界上第4个开始研究机器翻译的国家,60年代中期以后一度中断,70年代中期以来有了进一步的发展。现在,中国社会科学院语言研究所、中国科学技术情报研究所、中国科学院计算技术研究所、黑龙江大学、哈尔滨工业大学等单位都在进行机器翻译的研究。 在文献冯志伟著的《机器翻译研究》中,法国著名机器翻译专家沃古瓦(B.Vauquois)教授把基于语言规则的机器翻译方法总结为如下的图形(图1),我们可以把这个图形就做“机器翻译金字塔”(MT Pyramid):
图1机器翻译金字塔 Fig.1 machine translation pyramid
从机器翻译金字塔可以看出,一个完整的机器翻译过程是这样的:首先,输入源语言的句子,经过形态分析,得出句子中每个单词的形态信息和其他信息,再进行句法分析[2]。 机器翻译,尤其是以统计机器翻译方法具有很多优势,如开发速度快、周期短、无需人工干预等,在特定领域训练数据充分的情况下翻译性能基本可以达到实用水平。因此,统计方法成为众多机器翻译系统开发者的首选。例如,Google、Microsoft以及国内的有道、百度等互联网公司开发的在线多语言机器翻译系统;Asia Online、SDL Weaver等著名公司向企业和政府提供的翻译服务;及时通信工具Google Talk、MSN中的及时翻译服务,社交网络Facebook中的翻译服务;以及IBM、Google推出的实时语音翻译系统等等。可以看到,在通用领域,机器翻译已经开始进入人们的日常生活。
2. 机器翻译的现状及其存在的问题 从机器翻译的定义和发展可以看出,同人工翻译一样,机器翻译也离不开对自然语言的理解。但是与人对语言的理解不同,机器只能识别形式化的东西,因此要实现自然语言的理解任务,机器必须用形式化的语言去描述自然语言。下面将描述现存的机器翻译的现状以及存在的问题[3][4]。
(1)翻译死板 使用机器翻译只是句法结构和词汇的机械对应,对源语言的分析只是求解句法关系,完全不是意义上的理解。当碰到段落一句一句处理时,上下文又缺乏联系,翻译结果无法让读者看懂,和语言本身的灵活性存在差异。而人工翻译就能先理解整篇文章的意思,再根据需要适当地调整翻译顺序,这样读者就一目了然。 (2)词义选择和句子歧义问题 多义词是英文中普遍存在的,现在的机器翻译还不能从多个意思中选择适当地一个,这是阻碍其发展的一个难题。在没有语境的情况下,英语句子常常存在着歧义。例如对于这句话:He hit the boy with a stick. 人工翻译有两种译法:“他用木棍打了那个男孩”或者“他打了拿着木棍的男孩”,而机器翻译的结果就只有第一种。 (3)文化因素的问题 对带文化色彩的语句,机器翻译和人工翻译真实有着天壤之别。人工翻译可以通过音译加注,以对遗漏的文化信息进行补充,而机器翻译几乎是不可能的。如果都使用机器翻译,那么大量的文化信息就会在翻译过程中遗失,以至于在译文中得不到原文所表达的意思。众所周知,用词丰富是语言使用的基本原则,英语尤其如此,最忌讳重复使用一个词来表达相近的意思,而机器翻译似乎没有这种能力。机器翻译的常见问题如错误的代词、介词,断章取义的句法,不正确的选词,单复数混淆,错误的时态等。 中国数学家、语言学家周海中曾在论文《机器翻译五十年》中指出:要提高机译的质量,首先要解决语言本身问题而不是程序设计问题;单靠若干程序来做机译系统,肯定是无法提高机译质量的。同时,他还指出:在人类尚未明了“人脑是如何进行语言的模糊识别和逻辑判断”的情况下,机译要想达到“信、达、雅”的程度是不可能的。这也是制约机译质量提高的一大瓶颈[5]。
3. 计算机辅助翻译及其概况 通过上面的描述,单纯的机器翻译得到的译文仍有不足之处。在这种情况下,计算机辅助翻译应运而生。计算机辅助翻译(Computer Assisted Translation,CAT)的思想可以追溯到20世纪70年代,当时有人提出了“翻译记忆”的概念,即把以前的翻译结果存储在计算机中,以后在翻译相同或类似的文本时可以重复利用。从广义上来说,计算机辅助翻译仍然属于机器翻译,因为它利用的还是计算机强大的储存和快速检索能力,知识计算机本身不会翻译任何文本。计算机辅助翻译不同于机器翻译,机器翻译旨在用机器完全代替人的劳动来完成文本的翻译。而计算机辅助翻译则是通过利用一系列工具来辅助译者完成文本的翻译工作[6][7]。可以用一句通俗的话来区分二者,就是看“翻译的工作由谁来完成”。由此,二者无论
在设计理念上还是支持技术上都有很大的不同。计算机辅助翻译(CAT)的主要支持技术是翻译记忆(Translation Memory)和术语库(Terminology Database)。译者的人工翻译结果将为软件所记忆(翻译记忆),这样译者下次碰到类似的翻译文本时,软件将会从以前的翻译案例中自动匹配符合的译文,供译者选择。此外,译者还可以建立术语库来规范翻译项目中的术语,从而保证同一个项目中译文术语的一致性。目前主流的CAT软件有SDL Trados、Déjà Vu、Wordfast、SDLX、MemoQ、Transmit、Across、OmegaT、Okapi、Alchemy Catalyst、SDL Passolo、雅信CAT、雪人CAT以及朗瑞CAT等[8]。
计算机辅助翻译的工作原理是:系统根据自己的判断,将原文划分为单独的句子单元,如词或词组,并根据系统自带的词库、用户建立的词库或者系统记忆的词库,给出句子单元的翻译建议;同时,系统自动搜索翻译记忆库中相同或相似的翻译资源,给出参考译文[9][10]。
译者可以首先调整系统对句子单元的划分,然后根据系统给出的句子单元翻译建议,重组句子单元,完成信息重组;也可以根据系统显示的参考译文,重组句子单元,修改或直接采用参考译文。计算机辅助翻译把翻译过程中的机械、重复、琐碎的工作交给计算机来完成,译者重点把精力放在译文的组织上,这样充分发挥了计算机和译者的优势,提高了翻译的效率和质量。计算机辅助翻译的优势在于信息的存储和检索,它可以导入大量的专业词汇,减少翻译过程中译者查词检索的步骤。同时由于它具有自动记忆和搜索功能,如果当前句子曾经翻译过,系统会给出之前的翻译结果,以供译者参考。图2为计算机辅助翻译系统的工作流程图[11]: