巴比情结与机器翻译系统的研发
- 格式:doc
- 大小:26.00 KB
- 文档页数:3
机器翻译的发展历程机器翻译(Machine Translation,简称MT)是指利用计算机和相关的技术,将一种语言的文本自动转化为另一种语言的文本的过程。
它的发展历程可以概括为以下几个阶段:1. 早期阶段机器翻译的起源可以追溯到20世纪50年代。
当时,计算机还处于早期阶段,科学家们开始尝试利用计算机来进行翻译。
早期的机器翻译系统基于规则和字典,通过对源语言和目标语言之间的语法和词汇知识进行编码,来实现自动翻译。
尽管这些系统存在很多限制,但为机器翻译的发展奠定了基础。
2. 统计机器翻译阶段20世纪90年代,随着计算能力的提升和大规模语料库的建立,统计机器翻译(Statistical Machine Translation,简称SMT)成为主流。
SMT基于大量的双语平行语料,通过统计模型研究源语言和目标语言之间的概率分布,从而实现翻译。
SMT取得了很大的突破,并在实际应用中取得了一定的成功。
3. 神经机器翻译阶段在近年来,随着深度研究的兴起,神经机器翻译(Neural Machine Translation,简称NMT)成为机器翻译的新热点。
NMT使用神经网络模型,通过端到端的研究方法进行翻译。
与传统的SMT相比,NMT能够更好地处理句子的结构和语义,翻译质量有了显著提升。
4. 强化研究和迁移研究近年来,强化研究和迁移研究等技术被应用于机器翻译中,进一步提升了翻译质量和效果。
强化研究可以通过与环境的交互研究,提高翻译系统的自主决策能力。
迁移研究则可以将已经研究到的知识和模型迁移到新的任务中,从而提高机器翻译的效率和准确性。
5. 基于预训练模型的机器翻译最近,基于预训练模型的机器翻译方法逐渐受到重视。
这些方法利用大规模的无标注语料进行预训练,然后通过微调的方式进一步优化翻译质量。
这种方法在一些任务和语言对上已经取得了很好的效果。
总的来说,机器翻译经历了从规则和字典到统计模型,再到神经网络模型的发展过程。
机器翻译技术的发展及未来趋势分析一、引言随着全球化的深入发展,各国之间的交流与合作日益密切,语言翻译的需求也越来越大。
机器翻译技术,正是在这种大环境下应运而生。
机器翻译技术利用计算机来处理源语言和目标语言之间的转换,能够实现实时、高效、准确的翻译,大大提高了人们的翻译效率和质量。
本文将针对机器翻译技术的发展及未来趋势进行分析。
二、机器翻译技术的发展历程1.传统机器翻译技术传统机器翻译技术主要依靠语言规则和词典,通过对语言规则和词典进行分析和处理,将源语言转化为目标语言。
这种方法虽然能够处理一些简单的语言互译,但是对于大量的自然语言表达和潜在意义的捕捉,准确性还存在一定的局限。
2.神经机器翻译技术神经机器翻译技术是利用人工神经网络来模拟人脑的记忆和思考过程,通过大量的语料训练,能够自动学习语言之间的映射关系,并将源语言转化为目标语言。
相比于传统机器翻译技术,神经机器翻译技术更具有准确性和泛化性,已经成为现代机器翻译领域的主流技术。
三、机器翻译技术的发展趋势1.加强神经机器翻译技术的深度学习能力随着人工智能技术的发展,神经机器翻译技术也会进一步发展,增强其深度学习能力,提高其自主学习和理解语言意义的能力。
2.实现多语种、多模态的机器翻译传统的机器翻译技术主要针对单一语种进行翻译,未来的机器翻译技术将会实现多语种、多模态的翻译,将会应用于语音识别、声音处理、图像处理等领域。
3.通过深度融合来提高翻译质量深度学习和神经机器翻译技术的发展,将会带来多种信息的融合,例如声音、图像、文本等,这将会帮助机器翻译技术更全面地捕捉实际情境中的意义,并提高翻译质量。
四、机器翻译技术的应用1.机器翻译在商务领域的应用随着全球化的发展,商务活动的跨境交流越来越普遍。
机器翻译技术能够帮助商务人士进行跨文化交流,提高商务活动的效率和精度。
2.机器翻译在旅游领域的应用旅游是人们在生活工作之余,寻求放松和娱乐的方式。
随着社会经济和科技的发展,人们的旅游活动也越来越多样化和国际化。
机器翻译技术的发展历程和未来发展趋势随着全球化的发展以及人们不断增加的跨国交流需求,机器翻译技术日益成为现代人们工作和生活中不可或缺的一部分。
本文将深入探讨机器翻译技术的发展历程和未来发展趋势,以及机器翻译技术的应用和挑战。
一、机器翻译技术的发展历程机器翻译技术的发展历程可以追溯到20世纪50年代中期。
当时在美国进行的成果翻译项目开创了机器翻译的新时代。
然而,当时的机器翻译技术并不够成熟,其翻译的质量不令人满意。
直到1988年,IBM公司推出了其翻译系统的第一个商用版本,这标志着机器翻译技术已经走上商用化的道路,越来越多的企业开始用机器翻译技术代替人工翻译。
然而,机器翻译技术的质量依然存在缺陷。
传统机器翻译技术往往不能够避免语义错误,使得机器翻译的结果难以理解。
后来,随着机器学习和深度学习技术的发展,一些新的机器翻译技术开始崭露头角。
二、机器翻译技术的未来发展趋势1. 基于机器学习和人工智能技术随着机器学习和人工智能技术的不断发展,越来越多的机器翻译技术开始基于这些新技术。
这类新技术不仅能够更好地理解语言的含义,还可以对人类语言中的表达方式、习语、口语等非标准化元素进行处理。
2. 面向特定场景的机器翻译技术未来的机器翻译技术将不再是一种泛用的翻译技术,而是一种更加专业化的、针对特定场景的翻译解决方案。
例如,医疗、法律等领域的机器翻译技术都将更加专业化。
3. 翻译机器人未来的机器翻译技术可能会出现“翻译机器人”,这种机器人能够实时翻译并口头传递翻译结果,帮助人们在交流中跨越语言和文化障碍。
三、机器翻译技术的应用和挑战机器翻译技术的应用已经非常广泛。
例如,机器翻译技术可以用于商业合同、网络商品描述、跨语言在线检索、翻译新闻和文学作品等。
特别是在大数据、人工智能和物联网等技术盛行的当今社会,机器翻译技术的应用更是不可避免。
然而,机器翻译技术还存在着一些挑战,例如语义理解、文化差异、隐私保护等问题。
对于商业机密、个人隐私等敏感信息的翻译问题,机器翻译技术依然存在风险。
机器翻译技术的发展及应用前景随着全球化的趋势不断加剧,语言沟通的需求也越来越多。
机器翻译作为人工智能领域最重要的应用之一,正日益受到人们的重视和青睐。
本文将就机器翻译技术的发展及应用前景进行探讨。
一、机器翻译技术的发展历程机器翻译的历史可以追溯到20世纪40年代,当时科学家们就开始尝试通过机器翻译来解决语言障碍问题。
然而,由于当时计算机技术的局限性,机器翻译的效果并不理想。
直到20世纪80年代,神经网络技术取得了重大突破,为机器翻译技术的发展提供了关键性的支持。
此后,机器翻译领域的研究呈现出了迅速发展的态势。
随着统计机器翻译技术和神经机器翻译技术的不断推出,机器翻译的效果也日渐提升,逐渐取得了广泛的应用。
二、机器翻译技术的现状目前,机器翻译技术已经逐渐成为了人们日常生活、工作中不可或缺的工具。
在各种翻译场景中,机器翻译技术都有着广泛的应用,如文本翻译、语音翻译、OCR翻译等。
从技术层面上来看,目前最常用的机器翻译技术包括统计机器翻译和神经机器翻译两个领域。
其中,神经机器翻译技术是近年来的一个热点,它采用了更加高效的深度神经网络模型,在翻译质量和速度上都优于统计机器翻译。
然而,目前的机器翻译技术仍然存在许多问题和不足之处,包括词性歧义、句法结构不清和语块翻译不准确等。
因此,在未来的研究中,还需要不断探索新的机器翻译技术和方法,以达到更高的翻译质量和较快的翻译速度。
三、机器翻译技术的应用前景随着机器翻译技术的不断发展和完善,它在各个领域的应用也越来越广泛。
未来,机器翻译技术的应用前景将会在以下几个方面得到进一步拓展。
1、文化传播在全球化的背景下,机器翻译技术有望成为文化传播的桥梁。
通过机器翻译技术,人们可以轻松地了解各国文化和语言,促进不同文化之间的交流和互动。
2、商业交流在商业领域,机器翻译技术可以帮助企业进行跨境贸易和商业合作。
通过机器翻译技术,企业可以轻松进行各种语言的交流和沟通,降低沟通的难度和成本。
机器翻译技术的发展历程随着全球化和人们对跨国交流的需求增加,翻译行业成为了不可替代的一部分。
然而,传统的人工翻译方式在效率和成本方面都存在问题。
因此,机器翻译技术的发展成为了必不可少的一项工作。
那么,机器翻译技术的发展历程是怎样的呢?第一阶段:早期机器翻译技术20世纪50年代,人们开始尝试用计算机技术进行翻译。
这些早期的机器翻译系统主要基于词汇和语法规则的匹配,采用的是基于结构的翻译方法。
这种方法是基于语言结构,将输入的原文分解为词汇、短语和句子,再通过规则和词典来进行翻译。
然而,这种方法的局限性非常大,只能进行简单的翻译,并且容易失真。
因此,它很快就被放弃了。
第二阶段:统计机器翻译技术80年代,随着计算机技术和语言学的发展,机器翻译技术迎来了第二个发展阶段。
这一阶段的核心思想是基于统计的方法,即通过大量的平行语料库来训练和提高机器翻译的效果。
这种方法是基于数据的,根据语言间的概率关系来进行翻译。
因此,统计机器翻译技术可以处理更加复杂的语言结构和语义关系,并且在一定程度上能够实现准确的翻译。
第三阶段:深度学习翻译技术近年来,随着深度学习技术的发展,机器翻译技术又迈入了一个新的阶段。
深度学习是一种基于神经网络的机器学习技术,其核心思想是通过大量数据的训练,来提高机器的预测和判断能力。
因此,深度学习翻译技术可以更加准确地理解和翻译语言。
现在的机器翻译技术采用的是深度学习算法中的神经网络模型,它可以处理更加复杂的语言语义和上下文信息,并且拥有更高的翻译准确率。
另外,深度学习技术也可以对输入和输出的数据进行预处理,从而达到更好的翻译效果。
未来展望随着机器翻译技术的不断发展,人工对机器翻译的干预将会越来越少,机器翻译可以做到更加准确和快速。
另外,随着语音识别和自然语言处理技术的不断发展,机器翻译也将更加普及,成为日常生活和商业领域中不可缺少的一环。
总之,机器翻译技术的发展已经经历了从基于规则到基于统计再到基于深度学习的三个阶段。
机器翻译技术发展历程机器翻译技术是现代计算机科学领域的一项核心技术。
它将源语言文本自动翻译为目标语言文本,以帮助人们跨越语言障碍进行有效的语言交流。
虽然这种技术已经成为我们日常生活中不可或缺的一部分,但在这种便利的背后,是无数科学家、研究者和工程师的努力和创新,他们用自己的智慧和汗水不断推动着机器翻译技术的进步。
下面,我们一起回顾一下机器翻译技术的发展历程。
1. 初创阶段早在20世纪50年代,机器翻译就开始在世界范围内得到人们的关注和研究。
当时,最早的机器翻译实验室就在美国马萨诸塞州的麻省理工学院建立了起来。
不过,当时的机器翻译技术还处于一个非常初级的阶段,效果非常差,基本不能满足实际应用需求。
2. 经典方法阶段20世纪60年代和70年代,出现了一些新的机器翻译方法,其中比较经典的是词汇翻译和规则翻译。
词汇翻译主要是根据单词之间的相似性和替换规则进行机器翻译。
规则翻译则是根据语言规则分析句子结构,再进行转换和拼凑生成目标语言。
这一阶段的机器翻译取得了一些成就,但仍然存在着很多问题,例如对语句理解的不足、翻译质量不稳定等。
3. 统计方法阶段20世纪80年代和90年代,机器翻译技术进入了一个新的阶段——统计方法阶段。
这个阶段的机器翻译主要是利用大量的双语平行语料库来进行翻译,即计算机通过统计分析平行语料库中的数据信息来得出最优翻译结果。
这种方法相比经典方法显然更加实用和高效,是目前应用最广泛的机器翻译方法,如Google Translate、百度翻译等。
4. 深度学习阶段随着人工智能领域的不断发展,深度学习技术在机器翻译领域也开始得到广泛应用。
深度学习是一种基于神经网络的机器学习方法,它能够自动获取、提取和学习数据特征,从而实现非常精准的翻译。
5. 当前及未来随着互联网的不断普及和全球化的加速发展,机器翻译将在更广泛的领域和场合中得到应用,例如金融、医疗、文化交流、科学研究等。
同时,随着人工智能技术的日益成熟,机器翻译技术也将越来越智能化、自适应化和人性化,为我们带来更高效、准确和便利的翻译服务。
人工智能机器翻译技术的研究与应用近年来,随着全球化进程的不断推进和人民出行、交流的增多,翻译成为了一项越发重要的工作。
然而,由于人工翻译成本高、效率低,翻译的限制和不便已日渐凸显。
于是,人工智能机器翻译技术作为一种新型翻译方式,受到了广泛关注和探索。
人工智能机器翻译技术已经发展成为可以翻译多个语种的自动化翻译系统,因此,本文将就人工智能机器翻译技术的研究及应用进行阐述。
一、人工智能机器翻译技术的发展历程人工智能机器翻译技术是指通过计算机程序对语言进行分析,再结合相应的翻译规则和语言库,实现自动翻译的技术。
虽然人工智能机器翻译技术是近年来发展起来的新技术,但其研究历史可以追溯到上世纪50年代。
上世纪50年代初,初步的人工智能机器翻译技术出现了,但它只能翻译一些句子,句子越长,翻译准确率越低。
60年代中期,自动机器翻译瞄准论文的翻译,研究集中在语言过程中使用的规则和不同的语法分析方法。
70年代,由于翻译规则的复杂性和人类语言的复杂性,自动翻译变得非常具有挑战性,难度逐步增加。
到80年代,翻译技术主要是基于直接翻译,即将源语言单词直接翻译成目标语言的单词。
90年代起,随着自然语言处理技术的发展和计算机性能的提高,人工智能机器翻译技术进入了一个新时代,众多新型自动化翻译系统的出现,如Google翻译、百度翻译等,它们的流畅度和准确性得到了很大的提升。
二、人工智能机器翻译技术的应用随着全球化的发展,不同国家、不同地区的人们交流沟通的需求越来越高,为满足这种需求,人工智能机器翻译技术被广泛应用于各种领域:1.交流沟通由于人工智能机器翻译技术可以很快地翻译成多种语言,因此使得人们的交流变得更为便利和高效。
日常生活中,比如在国际会议、商务洽谈等场合,通过翻译软件快速翻译,人们可以更加高效地进行沟通交流。
2.文化推广在文化推广方面,人工智能机器翻译技术能够使文化得到更广泛、快速的传播。
由于文化具有本土特色,如果我们想使某个文化更为广泛地传播出去,那么一定要通过向多个语言进行翻译实现。
[标签:标题]篇一:机器翻译技术的现状及发展机器翻译技术的现状及发展摘要:本文在分析机器翻译内涵的基础上,阐述了机器翻译的历史和现状,探讨了机器翻译所面临的问题及机器翻译的发展趋势。
关键词:机器翻译;自然语言;发展趋势1.引言《圣经.创世纪》中第十一章巴别塔:“耶和华说:看哪,他们成为一样的人民,都是一样的言语,如今既作起这事来,以后他们所要作的事就没有不成就的了。
我们下去,在那里变乱他们的口音,使他们的言语彼此不通。
于是耶和华使他们从那里分散在全地上;他们就停工,不造那城了。
因为耶和华在那里变乱天下人的言语,使众人分散在全地上,所以那城名叫巴别(就是变乱的意思)[1]。
”这只是圣经故事,但告诉我们语言的不同确实是人们交流的极大障碍,因此人们一直在寻找打破语言障碍的途径和办法。
翻译则能克服语言障碍,使得不同语言人们之间能相互交流。
谭载喜在他的《西方翻译简史》一书中提到我国的翻译史时说:孔子周游列国,在各地言语发音不尽相同,彼此交流甚少的当时,也不得不通过象寄之才(即翻译人员)以“达其意,通其欲”。
随着互联网的日益发展,网络信息的激增,国际社会交流愈加频繁,机器翻译已成为克服交流时所产生的语言障碍的重要手段之一。
2.机器翻译的定义计算机翻译通常叫机器翻译(Machine Translation或MT),即全自动高质量机器翻译(Fully Automatic High Quality Machine Translation,简称FAHQMT或MT),就是人类利用计算机进行自然语言间的相互翻译,利用软件实现从一种自然语言文本到另一种自然语言文本的翻译[2]。
3.机器翻译的历史与现状在古希腊时代就有人提出利用机械装置来进行语言翻译的想法,其中之一是如何用机械手段来分析自然语言。
17世纪,人们首次提出使用机械字典克服语言障碍的设想。
1903年,古图拉特(Couturat)和洛(Leau)在《通用语言的历史》一书中指出,德国学者里格(W.Rieger)首次使用了“机器翻译”(Machine Translation)这个术语。
机器翻译技术的发展现状及趋势分析一、介绍机器翻译技术经过多年的发展,已经在一些场景下初见成效。
本文将分析机器翻译技术的现状及未来发展趋势。
二、机器翻译技术的现状早期的机器翻译技术依靠人工规则和语法分析进行翻译,但由于语言规则过于复杂,这种方法的效果不佳。
后来出现了基于统计学习的机器翻译技术,即利用机器学习算法在大量平行语料库中统计翻译概率,并根据概率值进行翻译。
这种方法在一定程度上提高了机器翻译的效果。
近年来,神经网络技术的兴起也给机器翻译技术带来了新的进展。
神经机器翻译依靠深度神经网络,以单词或短语为单位对语料库进行学习和翻译,能够更好地处理语言的上下文关系,从而提高翻译的准确性。
三、机器翻译技术的进展与应用机器翻译技术的进展离不开大量的语料库。
近年来,随着互联网的普及和数据存储技术的不断提升,文本和语音数据得到了更广泛的获取和利用,使得机器翻译技术得到更快的发展。
作为一项重要技术,机器翻译已经在多个领域得到了广泛的应用。
例如,旅游行业对多语言的需求驱动了机器翻译技术的应用;翻译公司也开始使用机器翻译来提高工作效率和翻译质量;科技公司在语音识别和语音合成方面也应用了机器翻译技术。
四、机器翻译技术发展的趋势随着人工智能技术的不断发展和深度学习算法的广泛应用,机器翻译技术取得了很大的进步。
未来,机器翻译技术发展的趋势主要有以下几个方面:1. 云端计算和边缘计算在计算硬件方面,云端计算和边缘计算将是未来的发展趋势。
云端计算可以提供更强大的计算能力,可以快速处理大量数据。
而边缘计算则可以提供更快速的响应时间,更好地适应实时翻译的需求。
2. 深度学习和增强学习神经网络技术在机器翻译技术的发展中占据着重要地位,未来的发展趋势也将继续大力推进基于深度学习和增强学习的机器翻译技术。
3. 多模态翻译未来机器翻译技术也将会向多模态翻译方向发展,例如图像、视频和语音等多种形式的输入数据。
4. 人工智能与自然语言处理相结合人工智能和自然语言处理的结合将会为机器翻译带来更加强大的支持,例如深度学习技术、情感分析、基于知识图谱的语义理解等方法的结合将会大大提高机器翻译的质量和效率。
机器翻译技术发展历程自20世纪40年代开始,随着人工智能技术以及计算机技术的不断发展,机器翻译技术的研究和开发也开始逐渐兴起。
在经过多年的不断努力和探索之后,机器翻译技术已经取得了重大进展,并且成为了现代社会中重要的翻译方式之一。
本文将介绍机器翻译技术的发展历程,深入探究机器翻译技术的前景和趋势。
1. 机器翻译技术的初期发展阶段20世纪40年代初期,机器翻译技术的开发首先被引入到军事领域中。
当时,军事情报部门需要将来自外部情报机构的不同语言、不同格式的情报资料翻译成本国语言以供军事指挥官参考。
因此,机器翻译技术开始应用于军事情报的翻译任务中。
当时的机器翻译技术主要采用基于规则的方法。
该方法的基本思想是将语言之间的转换关系通过一定的规则进行描述,并且根据这些规则进行自动翻译。
基于规则的机器翻译技术在初期获得了一些进展,但由于受到语言复杂性、歧义性等因素的影响,其效果并不理想。
2. 机器翻译技术的基于统计的发展阶段随着20世纪60年代末期计算机硬件和软件技术的飞速发展,机器翻译技术逐渐开始向基于统计的方法转换。
基于统计的机器翻译技术是指利用大量语料库数据进行统计分析,根据数据中的词汇、语法、句子结构等信息,提取出各种语言之间的翻译规则,进行自动翻译。
基于统计的机器翻译技术在相当长一段时间内都被认为是机器翻译的主流技术。
在这期间,机器翻译技术取得了很大的进展,但也存在一些缺点,如分词错误、词性标注错误、语法错误等。
此外,基于统计的机器翻译技术对于长句、歧义句等语言现象的处理还存在一定的困难。
3. 机器翻译技术的深度学习与神经网络时代进入21世纪以来,随着深度学习和神经网络技术的兴起,机器翻译技术也开始进入一个新的发展阶段。
基于深度学习和神经网络技术的机器翻译技术不再需要基于规则或者基于统计的方法,而是通过构建一个深度神经网络模型,在大量的数据训练下,学习到语言转换的规律并进行自动翻译。
深度学习和神经网络技术的应用为机器翻译技术的发展带来了全新的机遇,尤其是在处理长句、歧义句等语言现象方面,相较于其他方法效果更加理想。
巴比情结与机器翻译系统的研发
[摘要]重建巴比塔的情结促使科学家和语言学家联合起来试图利用计算机来进行自然语言的翻译和转换工作。
介绍了机器翻译的起源,论述了基于规则和基于语料库的机器翻译系统的特点和实例,探讨了目前机器翻译系统的缺陷及其将来研发方向。
[关键词]巴比情结机器翻译机器翻译系统的研发基于规则基于语料库
一、前言
《圣经》旧约中“创世纪”里巴比塔的故事发生在远古时代,但从那时到现在多少代人以来,人们还在不断地怀有一种情结,构筑同一个梦想:重建巴比塔,让世界各地操不同语言的人通过一种有效的方式可以任意沟通起来。
不过构筑语言的“巴比塔”绝非易事,因为虽然大多数语言有共性,但是其差异却很巨大。
这种浓厚的巴比情结积聚已久,人们长期无法释怀。
20世纪中期计算机的诞生又让人们萌生了新的希望,促使科学家和语言学家联合起来试图利用计算机来进行自然语言的翻译和转换工作,这就是机器翻译。
机器翻译是用计算机把一种语言(源语)翻译成另外一种语言(目标语)的一门新学科,涉及到语言学、计算机科学、数学等许多领域,是典型的多边缘交叉学科。
多年以来,人们在不断孜孜追求,对不同种类的机器翻译系统进行了研发,希冀找到一个适当方法解决语言之间的快速和准确翻译问题。
虽然时光发展到二十一世纪,计算机早已渗透到人们生活的方方面面,计算机技术的发展和运用已经达到了一个令人瞠目的程度,但是机器翻译却依然没有达到理想的水平。
机器翻译研究涉及到很多方面,由于文章篇幅限制,本文将集中讨论机器翻译系统的研发。
二、机器翻译的起源
用机器来进行翻译的理念最早可以追溯到古希腊时代,他们提出各种方案来替代种类繁多而形式各异的自然语言,其中就有用机械手段来分析语言的问题。
20世纪30 年代,法国人阿尔楚尼明确提出用机器来进行语言翻译的设想。
1933年,前苏联发明家特洛扬斯基设计了机械方法把一种语言翻译成另一种语言的机器,但由于当时技术水平的限制,他的翻译机没有制成。
1946年世界上第一台电子计算机诞生,它惊人的运算速度启发了人们考虑翻译技术的革新问题。
有关机器翻译的设想从那时起开始活跃起来,当时许多科学家相信可以通过对计算机编程实现“人工智能”。
冷战开始后,当时美国情报部门需要大量的有关前苏联的情报,由于情报是俄文资料,需要进行大量的俄英翻译,而由于人工翻译速度慢,需要进行机器的快速翻译。
在此时代背景下,Andrew Booth有幸得到了洛克菲勒基金的资助进行语言翻译的研究。
Booth和Weaver
在讨论计算机的应用范围时,提出了利用计算机进行语言自动翻译的想法。
1949年Weaver发表了有着深远意义的备忘录《翻译》,正式提出了机器翻译问题。
美国麻省理工学院有位名叫Norbert Wiener的数学家从事密码的解码研究,实际上是对一套符号的转型研究,类似语言翻译研究。
这可能是较早的机器翻译研究。
(沈满琳,1999:60)1954年1月Georgetown大学和IBM公司合作,建成了世界上第一个超出了词-词对译概念的真正机器翻译系统。
三、基于规则和基于语料库的翻译系统
最初开发出来的第一代机器翻译系统非常简单,计算机在词库里查找源文的每一个词语,然后用它在目标语中找出对应词汇进行替换。
这样的机器翻译系统至少有两个缺点:其一是词序调整不到位。
法语和英语同属于一个语系,两者之间40-50%的词序不同,日文与英语属于不同的语系,两者的词序100%不同,需要作基本的词序调整,与日语同源的汉语也大体相似。
其二是它所要求的系统资源限制。
为了有效地进行替换,需要引入每个词的不同变化形式,习语需要整体对待,但是这种做法不能穷尽每一种可能性。
为了解决这一难题,第二代翻译系统如Globalink和Systran的新版产品作了一些改进,这就是基于规则的翻译系统。
这些系统以基于转换的方法为代表,普遍采用以句法分析为主、辅以语义的基于规则方法,采用抽象的转换表示分层次实现策略。
其目的是试图合成一些语法规则,确定词语在句子中担负的功能,他们在程序中设计了一个语法分析树形图(parse tree),计算机通过词库确定每个词可能具有的词性,然后查阅语法规则,根据各种词应该怎样组合,辨认出其中一组修饰语、助动词等等,原句的句法分析完成后,替换词语再根据另一套语法规则重新组合,就转换到目标语中。
这种程序的转换能力强烈依赖于计算机的运算速度。
如英国Sheffield 大学的Yorick Wilks从经验论出发开发了一套自动程序,通过梳理海量的文字信息总结出一套规则。
他们开发的Penn Tree Bank里存储了数亿万词次的文本,计算机则分析这成千上万的句子,读出其中直觉涵盖的语言规则来。
这种方法实践了Norm Chomsky的语法理论。
Chomsky认为,人实际上通过直觉和反思而不是学习规则来掌握语法,Wilks的实验室已经成功地整理出包含18000条规则的英语语法。
基于规则的机器翻译系统包括乔治敦大学的机译系统、法国格勒诺布尔大学的俄法机译系统、加拿大的TAUM-METEO系统、日本的ATLAS、日本的实用性机译系统、法国纺织研究所的TITUS-IV 系统、美国的SYSTRAN系统、美国的WEIDNER系统、美国的PAHO系统、德国的METAL系统、德国的SUSY 系统、EUROTRA系统、日本的Mu系统与ODA计划、DLT系统以及我国的俄汉机译系统、英汉题录机译系统TITLE、汉-法/英/日/俄/德多语言机器翻译系统FAJRA、“译星”英汉系统、“高立”英汉系统、863-IMT/EC英汉系统、Matrix英汉系统、通译英汉-汉英系统、雅信英汉系统、Readworld英汉系统、Sino-Trans 汉英-汉日机译系统、E-to-J英日机器翻译系统等。
语料库语言学研究在20世纪80年代末、90年代初的再次兴起给曾一度陷入低潮的机器翻译研究一剂强心针。
从1989年开始,机器翻译领域视野发生了
改变,机器翻译研究进入了一个新时期,这就是基于语料库(corpus-based)的第三代机器翻译系统。
这种新系统包括基于统计(statistics-based)的和基于实例(example-based)的机器翻译系统,它们都是以大规模真实文本的加工为基础。
杨沐昀等(2001:19)认为,根据目前掌握的文献来看,完全基于统计的机器翻译系统以IBM的系统为代表,但是这类系统性能一般还没有达到标准。
完全基于实例的机器翻译系统也不是很成功,但是它们能在装载了记忆功能(Translation Memory)的机器翻译系统中得到了充分的利用。
如就在几年前,IBM公司的科学家开发了一个系统,他们不是研究任何语法规则,而是设计出一个程序,比较平行的原文和译文,计算和记忆各种译法的可能性,该方法虽然笨拙,但是相当有效。
他们把加拿大国会议事录的英法双语平行文本输入计算机,然后,以最原始、笨拙的方式来记录各种翻译的可能性和几率。
只要计算机的运算能力许可,甚至可以进行三词以上词语的排列组合。
IBM 翻译系统根据可能性统计找出替换词后,又利用这一语法来确定组合的顺序,电脑会尝试组合,直到得出一个组合几率最高的句子为止。
IBM机译系统尽管没有人工智能,也没有什么语义、词法活句子规则,但是这个纯数据系统译出来的句子正确率达到50%,与结合了最先进语言理论的系统相比,其表现并不逊色,因为像Babelfish这样的智能系统也只能达到65%。