当前位置:文档之家› 浅谈机器翻译与机器翻译教学(1)

浅谈机器翻译与机器翻译教学(1)

浅谈机器翻译与机器翻译教学(1)
浅谈机器翻译与机器翻译教学(1)

浅谈机器翻译与机器翻译教学

刘宏伟

(长沙师范学校外语系,湖南长沙410100)

摘要:机器翻译是利用翻译软件把文本内容从一种自然语言转换成另一种自然语言的过程。鉴于翻译市场、翻译学科的发展、翻译人才培养模式改革等需要,有必要进行机器翻译教学。机器翻译教学的主要内容包括:词典类翻译软件、教学全文和汉化翻译软件、教学在线翻译软件、教学翻译记忆软件教学等。

关键词:机器翻译;机器翻译教学;翻译软件

中图分类号:H059 文献标志码:A

近年来,社会对高质量的口笔译人才和研究人才的需求与日俱增。人们对翻译学科有了新的认识,译学界开始进行反思,建立独立翻译学科的意识日渐觉醒,对翻译学的讨论已经从“翻译学是否存在”深入到“翻译学作为一门独立的学科应该怎样发展。”[1]同时,在翻译学者的不懈努力下,经教育部批准,上海外国语大学于2004年自主设立了“翻译学”二级学科。2006年,复旦大学、广东外语外贸大学和河北师范大学经教育部批准设置翻译专业。2007年,经国务院学位委员会批准,中南大学等15所高校招生翻译硕士。到目前为止,全国共有13所本科院校设置了翻译专业,15所高校招生翻译硕士,2所高校招生翻译学博士。随着翻译学学科地位的不断提升,越来越多的研究人员把关注的目光投向了翻译研究和翻译实践,将现代技术融入翻译教学当中。开展机器翻译教学,培养技术类翻译人才以满足市场的需求,成为一个值得思考的问题。

一、机器翻译简介

(一)机器翻译的定义

不同学者给机器翻译下了不同的定义。有学者认为“机器翻译”就是“利用计算机进行翻译”[2]。机器翻译(MT),就是利用机器(计算机)翻译系统,把人类语言翻译的法则转变成电脑的运算法则,使得电脑根据运算法则,将输入的源语言(Source language)翻译成所需要的目标语言(Target language)。[3]另有学者认为“机器翻译”就是“利用计算机把一种自然语言转变成另一种自然语言的过程。用以完成这一过程的软件叫做机器翻译软件。”

[4]还有学者认为机器翻译包括三种概念:(a)机器翻译(machine translation):全部翻译由机器完成,但是其结果必须经人工修订;(b)辅助手段(computer aids for translators):翻译活动由人工进行,机器翻译只是作为人们翻译时使用的辅助工具;(3)非翻译人员为获取梗概大意偶尔使用的机器翻译系统(translation systems for the“occasional”non-translator user)。

[5]我们认为,“机器翻译”就是利用翻译软件把文本内容从一种自然语言转换成另一种自然语言的过程。

(二)机器翻译的发展历史

1.国外机器翻译的发展历史。20世纪30年代初,法国科学家G·B·阿尔楚尼最早提出机器翻译的设想。1933年,苏联科学家P·P·特罗扬斯基提出借助机器进行翻译的详细步骤,并设计出由一条履带和一块台板组成的依靠机械原理进行翻译工作的样机。1946年,英国和美国的两位工程师A·D·布思和W·韦弗首次提出利用计算机来进行翻译,并于1949年出版了《翻译备忘录》一书。[6]1954年,美国乔治敦大学和国际商用机器公司(IBM)首次联合试验使用电脑机译系统,并将由250个词组成的简单的俄文材料译成了基本上可以

接受的英文。这次试验的成功标志着机器翻译系统的真正诞生。此后,美国、苏联、日本、意大利、比利时、英国、德国等国便掀起了机器翻译热。

2.国内机器翻译的发展历史。1956年我国开始研究机器翻译。1959年,中国的机器翻译研究者成功地进行了中国首次机器翻译试验表演。文革中该项研究被长期搁置。20世纪80年代初机器翻译研究得以继续,受到高度重视。1987年中国军事科学院成功研制出“科译1号”,这标志着我国机译系统从无到有。1992年,中科院计算机研究所推出了在工作站上运行的“863智能型英汉翻译系统”。[7]此后,天津大通通译计算机软件研究所研制出“通译”翻译软件、中国软件总公司研制了“译星”翻译系统和中国科学院语言研究所研制出了“高立”翻译系统等。1997年底,东方快车以“智能汉化”为口号,在国内掀起翻译软件的高潮。1998年是中国翻译软件最红火的一年,国内出现了通译、译星、朗道、即时通、汉神、RoboWord、Internet宝典等几十种翻译软件。1999年8月,国内首个集记忆、交互、分析于一体的计算机辅助翻译软件——雅信CAT 1.0英汉版正式推出。20世纪末计算机辅助翻译(CAT: Computer-Aided Translation)随之诞生并高速发展。[8]

二、开展机器翻译教学的必要性

(一)翻译市场的需要。随着我国改革开放的不断深入,国际交往、涉外商贸和涉外旅游越来越频繁,翻译的需求正在以惊人的速度发展。特别是我国加入WTO后,国际化趋势愈加明显,这种需求将更加受人瞩目。根据国际本地化行业标准协会(LISA)和美国一家权威机构对世界翻译市场的调查显示,目前全球年翻译产值超过130亿美元(其中亚太地区占60%),2006年达到了227亿美元。2007年中国翻译市场产值超过300亿元,中国翻译市场需求正面临着急剧膨胀的趋势。据统计,中国在岗聘任的翻译专业人员约6万人,而此行业的保守需求值约50万,随着社会经济的发展,很快就会达到100万,目前翻译人才的缺口高达90%。[9]在这种情况下,充分利用计算机辅助翻译技术,提高翻译的速度,显得十分必要。据介绍,一般计算机每小时可翻译三万字左右,每屏译速只需15-20秒。因此,开展机器翻译教学,使翻译人员了解并运用相关的机器翻译软件,提高翻译的效率,成为当务之急。

(二)翻译学科发展的需要。目前,国际上不少大学根据翻译学科发展的需要,除了从事包括机器翻译在内的自然语言处理技术的研究、建立翻译教学与研究机构之外,还在翻译课程中对翻译技术和翻译工具使用的教学予以高度重视。然而,中国内地有关的高等教育机构对翻译新技术的教学却至今未能予以足够的重视,所开设的翻译课程几乎很少涉及翻译技术和一些新技术、新工具的使用。国外以及香港、台湾等地区的一些高校在机器翻译教学方面进行了许多研究和实践;香港、台湾一些翻译教学系所也开设了不少相关的课程,并与翻译公司结合进行翻译技术的教学实践,开办以计算机辅助翻译技术训练为主的研究生班等。反观中国内地,机器翻译和翻译技术的教学依然是一个比较陌生的概念。河北师范大学和中山大学等高校开设了机器翻译或计算机辅助翻译课程,在机器翻译教学上做过尝试,培养过一些学生,但是从其课程设置、培养模式和毕业生情况来看,培训成效尚不十分显著。因此,有必要开展机器翻译教学,使其通晓机器辅助翻译基础知识,熟练掌握相关翻译软件的运用,强化翻译职业技能。

(三)翻译人才培养模式改革的需要。有学者指出:“目前国内大多数高校培养翻译专业或英语专业(翻译方向)人才的目标定位主要是培养高校教师、文学翻译和口译人员,其培养模式基本上是沿袭传统的文学和语言学的翻译理论和实践方法。尽管当今的社会和市场对技术翻译人才的需求量相当大,国内的高校对技术翻译人才却没有予以足够的重视……这种现状无疑不利于我国的翻译人才尤其是技术翻译人才的培养。”[10]而国外翻译公司以及国内一些大型翻译公司招聘译员时,不仅要求译员经过专门的翻译培训,而且必须具备翻译软

件使用和其他高新技术使用的技能,这就要求高校开展机器翻译教学,把现代信息技术融入翻译教学当中,培养技术类翻译人才以满足市场的需求。

三、机器翻译教学的主要内容

机器翻译怎么教、应该教哪些内容,也是专家学者讨论研究的问题。根据市场对应用型翻译人才的需要,目前机器翻译教学不宜过深,应当注重实用性。机器翻译教学除简单介绍一下机器翻译的基本理论,如机器翻译的定义、发展历史及特点外,其教学重点介绍机器翻译软件的使用方法,并加强实践操练。根据软件的翻译特点,大致可以分为四大类:词典翻译类软件、在线翻译、全文和汉化翻译软件以及翻译记忆软件。机器翻译教学主要介绍翻译软件的运用。

(一)词典类翻译软件教学。词典翻译类是翻译软件的鼻祖,以词为翻译单位,最初的形式是电子词典。它利用计算机储量大的特点,储存了几万乃至几十万的词汇,能自动显示一个或多个目标词以供选择。与手工翻阅字典相比,它的最大优点是迅速方便。此类翻译软件按其承载介质或功能的不同可分为芯片词典、单机词典、网络词典。[11]目前,我国市场上的芯片词典主要有快译通、好易通、商务通、名人、锦囊、佳能等;网络词典主要有爱词(https://www.doczj.com/doc/be11997099.html,/)词海(https://www.doczj.com/doc/be11997099.html,/)、雅虎乐译(https://www.doczj.com/doc/be11997099.html,/)、百度词典搜索(https://www.doczj.com/doc/be11997099.html,/)等。单机词典主要有汉英机器词典、美国传统有声词典、牛津高级双解英汉词典、金山词霸、谷歌金山词霸、有道桌面词典、灵格斯词霸、东方大典等。这些词典属于光盘版词典,需要安装。其中国内词典类翻译软件最负盛名的是金山词霸。在机器翻译教学中,应当讲授词典类翻译的种类、软件特点及其功能,并使学生熟练掌握软件的安装和使用方法,在翻译实践中能够灵活地运用它们进行查词,提高翻译质量和效率。

(二)全文和汉化翻译软件教学。全文翻译类软件是以句子为单位进行翻译,有语法规则,译文可读性较词典类为好。翻译过程是:先输入原语文件,然后选择“即时翻译”或“全文翻译”功能。即时翻译可逐句翻译,一词多意时由人工选择,译完一句,再译一句;全文翻译则是一译到底,中间没有停留。就目标词的可读性而言,自然是即时翻译较好。汉化翻译软件的主要功能包括内码转换、动态汉化和电子词典等,能很好地满足用户汉化英文软件、英文网页,实现对屏幕英文信息的了解和文章的初步翻译等,对信息获取、了解文章大意具有很好的作用,大部分全文翻译软件具有汉化功能。全文和汉化翻译类软件主要有译星、IBM 翻译家、东方快车、金山快译、巴比伦、即时通汉化专家、译王、超强英汉翻译词典、译林专家翻译等。国内典型代表有北京实达铭泰公司开发的东方快车和金山公司开发的金山快译。在机器翻译教学当中,应当介绍全文和汉化翻译软件的种类、软件的特点及其功能,使学生熟练掌握软件的安装和使用方法,在翻译实践中能够灵活地运用他们进行全文翻译,提高翻译的速度。

(三)在线翻译软件教学。在线翻译或网上即时翻译浏览软件就是利用浏览器找到要查询的文本信息,启动翻译软件后翻译成目标文字插入浏览器中,译文的输出格式和源语言版面格式保持一致。该类软件提供网站网页转换、单词、语句、文章等的即时翻译、浏览翻译、上传翻译、邮件翻译等功能,支持英语、中文、日语、德语、俄语等多种语言相互翻译。主要在线翻译网站有:Google在线翻译(https://www.doczj.com/doc/be11997099.html,/language_tools);Yahoo!在线翻译(https://www.doczj.com/doc/be11997099.html,/);百度在线翻译(https://www.doczj.com/doc/be11997099.html,/list/104fy.htm);爱词霸在线翻译(https://www.doczj.com/doc/be11997099.html,/);金桥翻译中心(https://www.doczj.com/doc/be11997099.html,/);中国联通在线翻译(https://www.doczj.com/doc/be11997099.html,/);“世界通”网站(https://www.doczj.com/doc/be11997099.html,/);网络中国在线翻译网(https://www.doczj.com/doc/be11997099.html,/);华建在线翻译网(https://www.doczj.com/doc/be11997099.html,/trans/);“看世界”网站(https://www.doczj.com/doc/be11997099.html,/);“世界语”网站(https://www.doczj.com/doc/be11997099.html,/);自由翻译

网(https://www.doczj.com/doc/be11997099.html,/)以及外语时空(https://www.doczj.com/doc/be11997099.html,/trans/)等。在机器翻译教学当中,主要应向学生介绍各在线翻译网站的名称及主要功能,使学生有意识的利用在线翻译。

(四)翻译记忆软件教学。翻译记忆(Translation Memory,简称TM)是“译者运用计算机程序部分参与翻译过程的一种翻译策略。”[12]翻译记忆软件基本原理是利用翻译记忆自动重复使用翻译过的语句或者语句成分,使翻译人员免于翻译重复信息,从而提高工作效率和译文的质量。翻译记忆技术具有自动记忆和搜索功能,可以自动存储用户翻译的内容。当用户翻译某个句子时,系统自动搜索用户已经翻译过的句子,自动给出以前的翻译结果;对于相似的句子,也会给出翻译参考和建议。与人工翻译相比,借助工作站所得到的译文质量相同或更好,翻译效率可提高一倍以上。有了翻译工作站的辅助,翻译工作中机械、重复、琐碎的工作就可以交给计算机完成,翻译者只须将精力集中在创造性的思考上。国际上比较受欢迎的翻译记忆产品有Trados、SDLX、Dejavu、Star transit IBM Translation Manager等。国内主要有雅信CAT和华建等,其中北京雅信诚公司开发的专业软件雅信CA T是较成熟的翻译记忆软件。在机器翻译教学中,应当注重此类软件的特点与功能介绍,同时选取目前比较受欢迎的翻译记忆软件Trados(塔多思)和雅信CAT为例,重点讲解并操练,使学生能够比较灵活的运用此类翻译软件进行翻译。

四、机器翻译教学面临的问题

(一)缺乏必要的资金和设备。进行机器翻译教学,首先要解决教学所需的资金、设备以及教学的环境问题。缺乏必需的设备,机器翻译教学将是纸上谈兵,无法正常进行。除此之外,许多翻译软件的高昂价格也制约了机器翻译在翻译教学与培训中的广泛运用。据网上报价,购买一整套最新版的Trados或雅信CAT翻译软件需要花费几千元甚至上万元,建设一个计算机辅助翻译实训室要几十万。而且设备和软件需要不断地升级和维护,记忆库需要不断更新,这又将是一笔不小的费用。目前由于大部分高校教学与科研经费比较紧张,实训室建设投入资金很难得到保证。虽然有部分高校意识到了开展机器翻译教学的必要性,但由于没有必要的资金保障,开展这类教学也就举步维艰、困难重重。

(二)师资力量短缺。制约机器翻译教学的另一个重要因素是机器翻译教师的短缺。进行机器翻译教学的教师不仅要有丰富的翻译理论知识,同时要能够熟练操作计算机以及掌握机器翻译的原理、操作过程、行业要求,了解并熟悉现代翻译技术和翻译工具的使用等。然而,大多翻译教师教学任务繁重,有时还承担了一定的科研任务或校内外的翻译任务,对有关翻译软件了解不够。而且,绝大多数翻译教师是外语专业科班出身,现代技术运用能力不强,难以找到愿意并且能够承担机器翻译教学的合格师资。除此之外,有关领导和翻译教师对机器翻译教学重要性缺乏深入的认识,对于国内外的翻译教学也了解不够,也会阻碍机器翻译教学的开展。

(三)缺乏适合的机器翻译教材。机器翻译教学无法开展或开展相关教学或培训后效果不太理想的另一个重要原因是缺乏适合的教材。由于从事机器翻译研究的人员偏少,目前国内还没有出版系统的与机器翻译教学相结合、专为培养这方面翻译人才的教材,大多数教材需要从国外引进,而国外进口的教材,也不太适合中国学生的特点,这成为制约目前机器翻译教学的一个十分重要的因素。

总之,在专业翻译领域,机器翻译技术正得到越来越广泛的运用。因此,我们应当改变观念,改善机器翻译的教学条件,加强培训,提高机器翻译方面的师资水平,积聚力量编写相关教材,此外还应当密切与翻译公司或企业的合作,为开展机器翻译教学创造条件,积极开展这一方面的研究与实践,培养出具有较高专业素养,掌握各种编辑的技巧和文字处理技

术,能够运用各种翻译软件和现代技术快速高效地完成翻译任务的人才,为社会发展和经济建设服务。

参考文献:

[1]穆雷.翻译事业发展的新开端[EB/OL].https://www.doczj.com/doc/be11997099.html,/cxchun/articles/179154.html.

[2] MARIEKE N. The Soldiers are in the Coffee-An Introduction to Machine Translation[EB/OL].(2000-10-)[2002-07-05].https://www.doczj.com/doc/be11997099.html,.

[3]冯志伟.机器翻译研究[M].中国对外翻译出版公司,2004:1.

[4]黎斌,唐跃勤.谈我国机器翻译软件[J].四川教育学院学报,2004(3):52.

[6]卢文林.机器翻译发展概况[J].农业图书情报学刊,2002(4):24.

[7]张政.机器翻译刍议[J].中国科技翻译,2004(2):24.

[8]吕学强.机器翻译概述[J].辽宁师专学报,2002(3):8.

[9]李江涛.目前中国翻译人才缺口高达90%[J].世界教育信息,2006(4):5.

[10]袁亦宁.翻译技术与我国技术翻译人才的培养[J].中国科技翻译,2005(2):51-54.

[11]章宜华.计算机辅助翻译漫谈[J].上海科技翻译,2002(1).

[12]吕立松,穆雷.计算机辅助翻译技术与翻译教学[J].外语界,2007(3):37.

On the Machine Translation and Machine Translation Teaching

LIU Hong-wei

(Department of Foreign Language,Changsha Normal College,Changsha 410100,China)Abstract: Machine translating is a process during which translation soft wares are used to change one natural language into another. In view of the translation market,the development of translation discipline and the reforms of translating talents models,it is necessary to start machine translation teaching. The machine translation teaching includes translation soft wares of ictionaries,online translation soft wares,teaching translation memory soft wares and so on.

Key words:Machine translation; machine translation teaching; translation soft wares

机器翻译技术的现状及发展

机器翻译技术的现状及发展 篇一:翻译技术领域的现状与展望 翻译技术领域的现状与展望 作者/王华伟闫栗丽 翻译技术在中国的发展起步相对较晚,但近年来随着中国在全球化进程中扮演着越来越重要的角色,催生了对翻译技术发展的强烈需求。中国翻译行业在借鉴国外同行经验的基础上,于2007~2008年间在翻译技术领域取得了一系列成就,也还存在一些亟需改进的方面,而这也势必对我国的翻译行业产生深远的影响。 1. 国家政策的扶持和行业协会的推动 翻译技术的发展直接关乎整个翻译行业的翻译质量及效率,具备巨大的行业经济效益。对此,科技部、财政部都给与了足够的重视并拨出专项资金进行扶持。在 2008年的科技型中小企业技术创新基金扶持计划中,中文及多语种处理软件及基于先进语言学理论的中文翻译软件等赫然在列。而中国译协也在 2008年的第 18届世界翻译大会上专门辟出了翻译工具、术语管理和翻译标准等分论坛,着力推动翻译技术的探讨与发展。 2. 词典型翻译软件百花齐放 词典是使用范围最广的工具,它以使用便利的优势,几乎占据了每个计算机的桌面,无论语言学习者还是专业翻译人员,几乎都是必备工具。词典的发展从最早的单机版本发展至今,已经有很多种产品

类型,我们可以见到的有:电子词典、在线词典、手机词典等。“金山词霸”的网络版本“爱词霸”在这两年获得了长足的发展,如爱词霸网络释义、谷歌金山词霸等一系列特色功能的相继推出,将词典型翻译软件的应用领域从传统的桌面计算机拓展到网络、手机等,并取得了显著的成功。另外,类似Google这样的搜索引擎,因为信息量大,检索便利而成为很多专业翻译人员查词的重要辅助工具。 值得一提的是,最新推出的基于用户发布词汇的词典编撰系统之前的词典都是以各大出版社公开发行的词典中的词条作为主要数据库来源,为用户提供查询上的便利。但是传统出版词典的方式存在发布周期长、词汇更新慢的缺陷。互联网的出现,加快了信息传播的速度,也提高了用户对新词更新的速度要求,为了方便新词汇的发布,词典编纂系统也就应运而生了。这是一种基于用户的词典发布系统,用户可自由发起词典编纂项目,自发组织人员参与项目,发起人可以按照需要给小组成员分配不同的权限,将词汇添加等基本工作和审核人员明确区分,既确保了词典的专业性,也实现了专业语料的适时更新和发布。 3. 机器翻译应用软件融入普通网民生活 谷歌语言工具的推出打破了互联网语言的藩篱,用户可以方便简捷地将目标语言的网页转化成自己的母语进行浏览。事实上,这也是机器翻译软件的一个应用领域,而国内的相关软件如金山快译等,专注于为普通网民提供更为友好的英中日网站浏览体验,并在亚洲语言的机器翻译应用方面积累了大量的经验。其他如华建等长期从事机器

机器翻译技术介绍

机器翻译技术介绍
常宝宝 北京大学计算语言学研究所 chbb@https://www.doczj.com/doc/be11997099.html,

什么是机器翻译
研究目标:研制出能把一种自然语言(源语言)的文 本翻译为另外一种自然语言(目标语言)的文本的计 算机软件系统。 制造一种机器,让使用不同语言的人无障碍地自由交 流,一直是人类的一个梦想。 随着国际互联网络的日益普及,网上出现了以各种语 言为载体的大量信息,语言障碍问题在新的时代又一 次凸显出来,人们比以往任何时候都更迫切需要语言 的自动翻译系统。 但机器翻译是一个极为困难的研究课题,无论目前对 它的需求多么迫切,全自动高质量的机器翻译系统 (FAHQMT)仍将是人类一个遥远的梦。

机器翻译的基本方法
机器翻译的基本方法 ? 基于规则的机器翻译方法 ? 直接翻译法 ? 转换法 ? 中间语言法 ? 基于语料库的机器翻译方法 ? 基于统计的方法 ? 基于实例的方法 ? 混合式机器翻译方法
目前没有任何 一种方法能实现机 器翻译的完美理 想,但在方法论方 面的探索已经使得 人们对机器翻译问 题的认识更加深 刻,而且也确实带 动了不少不那么完 美但尚可使用的产 品问世。
20世纪90年代以前,机器翻译方法的主流一直是基于规则的方 法,不过,统计方法后来居上,目前似乎已成主流方法,从学术 研究的角度看,更是如此。(Google translate)

机器翻译的基本方法
20世纪90年代以前,机器翻译方法的主流一直是基于 规则的方法,因此基于规则的方法也称为传统的机器 翻译方法。 直接翻译法 ? 逐词进行翻译,又称逐词翻译法(word for word translation) ? 无需对源语言文本进行分析 ? 对翻译过程的认识过渡简化,忽视了不同语言之间 在词序、词汇、结构等方面的差异。 ? 翻译效果差,属于早期过时认识,现已无人采用 How are you ? 怎么 是 你 ? How old are you ? 怎么 老 是 你 ?

机器翻译

机器翻译 1 概述 机器翻译(machine translation),又称为自动翻译,是利用计算机把一种自然源语言转变为另一种自然目标语言的过程,一般指自然语言之间句子和全文的翻译。它是自然语言处理(Natural Language Processing)的一个分支,与计算语言学(Computational Linguistics )、自然语言理解( Natural Language Understanding)之间存在着密不可分的关系。 2 国内外现状 机器翻译思想的萌芽关于用机器来进行语言翻译的想法,远在古希腊时代就有人提出过了。在17世纪,一些有识之士提出了采用机器词典来克服语言障碍的想法。笛卡(Descartes)和莱布尼兹(Leibniz)都试图在统一的数字代码的基础上来编写词典。在17世纪中叶,贝克(Cave Beck)、基尔施(Athanasius Kircher)和贝希尔(Johann JoachimBecher)等人都出版过这类的词典。由此开展了关于“普遍语言”的运动。维尔金斯(JohnWilkins)在《关于真实符号和哲学语言的论文》(An Essay towards a Real Character andPhilosophical Language, 1668)中提出的中介语(Interlingua)是这方面最著名的成果,这种中介语的设计试图将世界上所有的概念和实体都加以分类和编码,有规则地列出并描述所有的概念和实体,并根据它们各自的特点和性质,给予不同的记号和名称。本世纪三十年代之初,亚美尼亚裔的法国工程师阿尔楚尼(G.B. Artsouni)提出了用机器来进行语言翻译的想法,并在1933年7月22日获得了一项“翻译机”的专利,叫做“机械脑”(mechanical brain)。这种机械脑的存储装置可以容纳数千个字元,通过键盘后面的宽纸带,进行资料的检索。阿尔楚尼认为它可以应用来记录火车时刻表和银行的帐户,尤其适合于作机器词典。在宽纸带上面,每一行记录了源语言的一个词项以及这个词项在多种目标语言中的对应词项,在另外一条纸带上对应的每个词项处,记录着相应的代码,这些代码以打孔来表示。机械脑于1937年正式展出,引起了法国邮政、电信部门的兴趣。但是,由于不久爆发了第二次世界大战,阿尔楚尼的机械脑无法安装使用。1903年,古图拉特(Couturat)和洛(Leau)在《通用语言的历史》一书中指出,德国学者里格(W. Rieger) 曾经提出过一种数字语(Zifferngrammatik),这种语法加上词典的辅助,可以利用机械将一种语言翻译成其他多种语言,首次使用了“机器翻译” (德文是ein mechanisches Uebersetzen)这个术语。 真正对机器翻译进行研究应该说是从布恩和韦弗开始的。他们研究的是自动词典万, 从1954年1月7日公开展示的IBM701型计算机开始, 机器翻译进人一个繁荣发展的时期。从那时起, 很多国家都投人了大量的人力、物力从事这方面的研究和开发。随着 Internet 的普遍应用,世界经济一体化进程的加速以及国际社会交流的日渐频繁,传统的人工作业的方式已经远远不能满足迅猛增长的翻译需求,人们对于机器翻译的需求空前增长,机器翻译迎来了一个新的发展机遇。国际性的关于机器翻译研究的会议频繁召开,中国也取得了前所未有的成就,相继推出了一系列机器翻译软件,例如“译星” 、“雅信” 、“通译” 、“华建”等。在市场需求的推动下,商用机器翻译系统迈入了实用化阶段,走进了市场,来到了用户面前。 中国机器翻译研究起步于1957年,是世界上第4个开始搞机器翻译的国家,60年代中期以后一度中断,70年代中期以来有了进一步的发展。现在,中国社会科学院语言研究所、中国科学技术情报研究所、中国科学院计算技术研究所、黑龙江大学、哈尔滨工业大学等单位都

人工智能与机器翻译习题答案.doc

2、产生式系统有哪些类型? 1正向、逆向、双向产生式系统 2可交换的产生式系统 3可分解的产生式系统 3、试举例说明不可撤|口|搜索方法的基本思想? 这种方法相当于沿着单独一条路搜索下去,利用问题给出的局部知识决定如何选取规则, 就是说根据当前可靠的局部知识选一条可应用规则并作用于当前综合数据库。接着再根据新状态继续选取规则,搜索过程一直进行,不必考虑撤回用过的规则。 9、试说明产生式系统规则不一致的原因及解决方法。 原因:规则集中存在的不一致是影响系统性能的重要因素之一。系统建立初期,由于规则集较小,内容也比较简单,设计人员能对每一条规则的条件和结论部分反复推敲和精心构造,这类问题容易防止。但随着时间的推移,新的规则不断加入,规则集合越来越大,内容也越来越丰富,这时规则间的相互影响和相互联系就随之变得复杂。在此情况下,规则的不一致就将自然产生, 解决:(1) 对于循环规则,可构造规则集的IF-THEN图,从起始规则的条件部分开始搜索,如果搜索过程中遇到的THEN部分已在前面出现,就可以中断搜索,规则集中包含的循环规则子集合需设计人员检查,解决; (2)对于冲突规则,构造IF-IF表,对规则集内有相同的IF规则子句构造规则树,形成推理图。同时建立THEN-THEN表用以判断是否有冲突规则出现。对相同IF部分的规则继续用它的各自THEN部分作为其它可以匹配的IF前提条件,递归地构造,如发现两个推理图上分别有节点在THEN-THEN表上是矛盾的,则检测出冲突规则,人工予以解决。 (3)对冗余规则和从属规则的检查类似于冲突规则链的方法.不同之处是前者在推理图中的遍历是试图发现有THEN部分等价的两条规则。 1、机器翻译主要有娜些方法?这些方法各有什么特点? 1基于分析和转换的机器翻译方法 这样的方法有两个特点:一是面向源语言分析,因为源语言中的一个句子已经由句法、语义分析等阶段分析完毕,生成了关于源语言句子的某种中间表示,转换以这种源语言中间表示作为输入;二是直接转换,即对于S表示,直接给出译文形式,一般不需要在目标语言内再作进一步转换,Tl~Tj可以直接包括目标语言的词汇,也可以是对应于Sl~Si的译文组块。 2基于中间语言的翻译方法 基于中间语言的机器翻译方法主要有两个优点。首先,独立的中间表示形式为多语种之间的互译的实现提供了一种经济有效的途径。假设要对N种语言进行互译,则有N*(N.1)个语言对。不同方向的翻译是不同的语言对。此时如果采用基于转换的方法,因为把一种语言翻译成另一种语言都需要一个不同的转换机制(或模块),所以N火(N?l)个语言对共需要N*(N-1)个独立的转换机制。而采用中间语言的方法,由于对每一种语言只需实现将该种语言翻译成中间语言和把中间语言翻译成该种语言的目标语言这样两个模块,所以总共只需要2N个模块。其次,中间语言不仅是对基于中间语言的机器翻译方法这一特定目的有意义, 同时,作为一种通用的自然语言表示,也值得深入研究。 4.1.3基于统计的机器翻译方法 基于统计的机器翻译方法,一般不要任何语言学知识,它的基木原理是实现源语言词汇到目标语言浏汇的映射。其思路受到语音识别研究的启发,因而应用了类似的方法来实现。研究者用

机器在线翻译与人工翻译的比较

现如今大家各个国家的人群交流的越来越多,以至于语言自然而然的要学习的更多,如果机器翻译也就是“一点翻译”与人工翻译摆在一起,大家都知道选择人工翻译,因为人工翻译准确性高并且是根据文章上下文进行翻译的,那机翻真的没有优点了么,错,机翻的优点有很多,比如单词准确性高,面对偏僻的词汇也是可以翻译的,翻译语句的时候虽然不是很精准,但是对于了解语言的我们来说也可以根据翻译进行大致的了解,话不多说,简单的来介绍一下如何在线翻译吧。 步骤一:我们要先在电脑上准备好需要进行翻译的文件,最好是将其添加至桌面上,或路径不复杂的文件框内,同时还需要借助电脑浏览器搜索一点翻译,进入相关的界面。 步骤二:通过搜索可以看到“一点翻译“在百度里面的页面,进入在线翻译的界面后,我们就可以在页面的中心位置通过上传文档按钮进入文档翻译的选项页面了。

步骤三:进入文档翻译的选项页面后,我们可以先对上传文档按钮上方的一些选项进行修改(也就是下图里面的选项)这样可以帮助我们更好的实现翻译。 步骤四:上面的选项修改好后,我们就可以开始将准备好的文件添加进来了,可通过点击上传文档按钮或者是拖拽的方式将文件添加进来。

步骤五:文件添加进来后,可再次去翻译的自定义选项是否修改好,若确定修改好后,就可以通过开始翻译按钮,对PDF文件进行翻译了。 步骤六:翻译的时间根据翻译的文件的大小来定制,耐心等待文件翻译结束后,我们可以通过预览按钮对翻译后的文件进行预览,也可以直接将翻译后的文件下载到电脑上进行保存。

在线翻译与人工翻译最大的优点是速度快,方便,准确性高,如果不是相对了解很透的语句的话建议在“一点翻译”内进行在线翻译,小编已经尝试过了,感觉蛮好的哦。

机器翻译研究现状与展望1 Machine TranslationPast,Present,future

机器翻译研究现状与展望1 戴新宇,尹存燕,陈家骏,郑国梁 (南京大学计算机软件新技术国家重点实验室,南京 210093) (南京大学计算机科学与技术系,南京 210093) 摘要:本文回顾机器翻译研究的历史,介绍典型的机器翻译方法,包括:基于规则、基于统计以及基于实例的机器翻译方法;针对机器翻译的研究现状,详细介绍和分析了基于混合策略的机器翻译方法,对统计以及机器学习方法在机器翻译中的应用进行了描述;论文还介绍了当前机器翻译评测技术;最后对机器翻译进行总结和展望。 关键字:机器翻译,基于规则,基于统计,基于实例,混合策略,机器学习 Machine Translation:Past,Present,future Dai Xinyu, Yin Cunyan, Chen Jiajun and Zheng Guoliang (State Key Laboratory for Novel Software Technology, Department of Computer Science & Technology Nanjing University, Nanjing 210093) Abstract:This paper firstly presents the history of machine translation, and introduces some classical paradigms of machine translation: RBMT, SBMT and EBMT. Secondly, we introduce the recent research on machine translation, and describe the hybrid strategies on machine translation in detail, and discuss the applications of machine learning for machine translation. We also analyze the current techniques about evaluation on machine translation. Finally, we draw a conclusion and prospect on the research of machine translation. Keywords:Machine Translation, RBMT, SBMT,EBMT, HSBMT, Machine Learning. 1本论文工作得到863课题资助(编号:2001AA114102, 2002AA117010-04) 戴新宇博士生,主要研究自然语言处理;尹存燕助教,主要研究自然语言处理;陈家骏教授,博士生导师,主要研究自然语言处理、软件工程;郑国梁教授,博士生导师,主要研究软件工程。

人工智能与机器翻译期末复习题

一、名词解释(5X3‘)15’ 1.兼类(P121):一个单词既可以作名词动词又可以作其他词类 2.机器翻译:用计算机软件代替人做的书面翻译 3.组合型歧义:一个字与前面的字成词,与后面的字成词,合起来也成词。 4.交集型歧义(P117):一个字与前面的字成词,与后面的字也成词。 5.人工智能:用计算机硬件、软件模拟人的行为,解决人类目前尚未认识清楚的问题。 6.人工智能软件的三大技术:知识表示、知识推理、知识获取。 7.语料库:单词、短语和句子组成的数据库。 8.知识工程:包括人工智能软件技术的工程。(知识工程是以知识为基础的系统,就是 通过智能软件而建立的专家系统) 9.深度学习:一步一步在丰富起来的特征规律引导下,由浅入深完成推理的方法。 10.语用分析:分析成语和习惯用语的方法。 二、题解P36 例2.1 、2.2 例2.1 设有下列语句: (1)高山比他父亲出名。 (2)刘水是计算机系的一名学生,但他不喜欢编程序。 (3)人人爱劳动。 为了用谓词公式表示这些语句,应先定义谓词: BIGGER(x,y):x比y出名 COMPUTER(x):x是计算机系的学生 LIKE(x,y):x喜欢y LOVE(x,y):x爱y M(x):x是人 定义函数father(x)表示从x到其父亲的映射此时可用谓词公式把上述三个语句表示为:(1)BIGGER(高山,father(x)) (2)COMPUTER(刘水)∧∽LIKE(刘水,程序) (3)(?x)(M(x) →LOVE(x,劳动)) 例2.2 设有下列语句: (1)自然数都是大于零的整数。 (2)所有整数不是偶数就是奇数。 (3)偶数除以2是整数。 定义谓词如下: N(x):x是自然数 I(x):x是整数 E(x):x是偶数 O(x):x是奇数 GZ(x):x大于零 另外,用函数S(x)表示x除以2。此时,上述三个句子可用谓词公式表示为: (?x)(N(x) →GZ(x)∧I(x)) (?x)(I(x) →E(x)∨O(x)) (?x)(E(x) →I(S(x))) 三、论述(4X5‘)20’ 1.阐述深度、广度、代价驱动搜索方法。(P68) 答:广度优先搜索法:对全部节点沿广度进行横向扫描,按各节点生成的先后次序,

编译:《机器翻译基本分类与基本工作原理》

机器翻译基本分类与基本工作原理 编译:洪洁传神语联网网络科技股份有限公司多语工程中心 编译:洪雷中国科学院大学外语系文章来源:多语工程技术研究中心《云翻译技术》第12期,转载请注明出处 摘要本篇综述对机器翻译基本工作原理和基本分类进行了归纳总结,并且对机器翻译的未来发展方向进行了初步探讨。 关键词机器翻译工作原理分类 机器翻译(Machine Translation,MT)是建立在多学科基础上的综合学科,现代理论语言学的发展,计算机科学的进步,信息学和概率统计学的应用,对机器翻译的发展和演变产生了重要影响。机器翻译的基本思想是利用计算机对自然语言进行翻译,而各种机器翻译系统采用的技术和理念不尽相同;面对各种各样的机器翻译系统,文献上有各种分类方式。本文根据所应用的基本工作原理对机器翻译系统分类作一综述。 1.基本类型的机器翻译系统:现有的机器翻译系统按照其基本工作原理,可以分为基于规则的(Rule-Based)机器翻译,基于实例的(Example-Based)机器翻译和统计型的(Statistical)机器翻译这三种基本类型。 1.1.基于规则的机器翻译系统(Rule-Based Machine Translation, RBMT):其基本工作原理基于一个假设,即语言无限的句子可以由有限的规则推导出来。基于这个假设的机器翻译方法又可以分为三类:直接翻译法(Direct Translation),中间语言法(Interlingual Approach),和转换法(Transfer Approach)。它们都需要用到大规模的双语词典,需要用到源语言推导规则,语言转换规则和目标语言生成规则;其不同点在于对语言进行的分析深度不同。如直译法几乎不需要进行语言分析,中间语言法和转换法需要对源语言和目标语言进行某种程度的语言分析。 1.1.1直接翻译法(Direct Translation):这种翻译方法直接对源文字中的字词进行逐个翻译,译后文字顺序按照原文顺序进行排列。这是基于规则的机器翻译的最早的工作方法。这种译法简单、直观,其弊端也是明显的:由这种方法得到的翻译结果质量很不令人满意。人们已经逐渐不再使用这种直接翻译法。

浅析语料库对于翻译研究的意义

浅析语料库对于翻译研究的意义 【摘要】基于语料库的翻译研究在当今已进入一个全新模式,多种语料库被开发应用在人工翻译和机器翻译等实践领域当中。本文对语料库的概念以及某些种类语料库在翻译活动中具体实用情况做出分析,揭示语料库对于翻译研究的意义。 【关键词】语料库;翻译;双语语料库;平行/对应语料库 An Analysis on the Significance of Corpus to Translating Research CHEN Dan (Eastern Liaoning University,Dandong Liaoning 118000,China) 【Abstract】Translating research based on corpus has stepped into a new mode today,and many kinds of corpora are developed and applied in practical fields of manual translation and machine translation. The thesis analyzes the concept corpus and the application of some corpora in translating,which exemplify the significance of corpus to translating research. 【Key words】Corpus;Translating;bilingual corpus;Parallel corpus “语料库”的英语单词corpus来源于拉丁语,意思是body,有“全集”的含义,即“语料的集合”。有的学者认为语料库是基于形式和目的的存储于电子数据库中的文本集合,是描述自然发生语言的集合;也有人认为它是按照明确的语言学标准选择并排序的语言运用材料的汇集,旨在用作语言的样本。国内语料库学者杨惠中对语料库的定义做了较为详细的界定。他指出,“语料库是指按照一定的语言学原则,运用随机抽样方法,收集自然出现的连续的语言运用文本或话语片段而建成的具有一定容量的大型电子文库”。 语料库所收集的语料是真实、自然的语言。不同于普通的文本数据库,它的设计和建设是以系统的理论语言学原则为依据,并且具有明确的目的性。语料库的结构严格依照既定程序设定,以一定研究目的为基础,按学科或语篇类型分类存储。语料库中的语料必须符合科学的语言研究,语料可以随机抽取或按统计学方法采集。 语料库的类型和分类标准很多。按用途分,语料库可分为通用语料库(general corpus)和专用语料库(specialized corpus);按语料选取时间,语料库可分为历时语料库(diachronic corpus)和共时语料库(synchronic corpus);按不同结构,语料库可分为平衡语料库(balanced corpus)和自然随机结构语料库(random structure corpus);按语料库的性质,语料库可分为原始语料库(raw corpus)和标注语料库(annotated corpus);按语言种类,语料库可分为单语语料库

机器翻译研究综述

机器翻译综述 1.引言 1.1机器翻译的历史 现代机器翻译的研究应该是从20世纪50年代开始,但是早在这以前很多人已经提出了相应的想法,甚至是远在古希腊时期就有人提出要用机器来进行语言翻译的想法。 在1946年,美国宾夕法尼亚大学的两位科学家设计并制造了世界上第一台电子计算机。与此同时,英国工程师同美国洛克菲勒基金会副总裁韦弗在讨论计算机的应用范围时,就提出了利用计算机实现语言的自动翻译的想法。在1949年,韦弗发表了一份名为《翻译》的备忘录,正式提出了机器翻译问题。他提出了两个主要观点: 第一,他认为翻译类似于解读密码的过程。 第二,他认为原文与译文“说的是同样的事情”,因此,当把语言A翻译为语言B时,就意味着从语言A出发,经过某一“通用语言”或“中 间语言”,可以假定是全人类共同的。 在这一段时间由于学者的热心倡导,实业界的大力支持,美国的机器翻译研究一时兴盛起来。 1964年,美国科学院成立语言自动处理咨询委员会,调查机器翻译的研究情况,给出了“在目前给机器翻译以大力支持还没有多少理由”的结论,随后机器翻译的研究就陷入了低潮期。直到70年代以后机器翻译的研究才重新进入了一个复苏期,随后机器翻译的发展又迎来了繁荣期 1.2机器翻译的主要内容 经过50多年的发展,在机器翻译领域中出现了很多的研究方法,总结如下:●直接翻译方法 ●句法转换方法 ●中间语言方法 ●基于规则的方法 ●基于语料库的方法 基于实例的方法(含模板、翻译记忆方法) 基于统计的方法 在当前的研究中,更多的是基于统计的方法进行的,因为基于统计的方法可以充分的利用计算机的计算能力,并且并不需要过多的语言学知识作为支撑,可以让更多的计算机科学家投入到实用系统的研究中,极大的促进了统计机器翻译的发展。 下面对各个方法逐一的进行介绍。

机器翻译和人工翻译-大学英语作文

学术英语作文 机器翻译是否会代替人工翻译 In the past decades, artificial intelligence has brought the light of reform to many areas, translation industry included. The new reform brought us machine translation. As an increasing popular topic, it has inspired people to think that maybe one day, they no longer need to learn foreign languages because machine translation will replace human translation. Though it is not 100% correct, there remains some reasonality within. Last year, A research team from Microsoft claimed that their machine translation (MT) system has achieved the level of professional human translators when it comes to general news report. Meanwhile, Google Translate tool has surpassed the proficiency of some advanced learners. And on Baidu World Conference, Yanhong Li showcased a real-time translation developed by his company. A trend revealed by all those tech giants’ news——an accurate and real-time translation by machine is promising in the future. Meanwhile, new techniques emerge constantly, accelerating the smartness and depth of machine learning. Taking neural network for example……(待补充70词) Thus, In the coming future, there’s no need for comm on people to learn foreign languages. Once the translation machines are smart and powerful enough to deal with academic environment and daily life while also portable to be carried with, people will use them to travel, study and live all around the world without language barriers. It will just look like the scenery in the movie The Wondering Earth -- Astronauts from various countries talk in their mother tongue. At the same time, a mini equipment installed in their suits translate their words. However, if you

浅谈机器翻译存在的问题

机器翻译及其问题浅析 摘要:由于信息技术高速发展,国际交流日益频繁,如何克服语言障碍已经成为国际社会共同面对的问题,而人工翻译的方式已经远远不能满足需求。利用机器翻译协助人们快速获取信息已成为必然趋势,但机器翻译仍存在一些影响译文可读性和准确性的问题。本文将简单介绍机器翻译并对常见问题进行浅析。 关键词:机器翻译问题语法应用 一、引言 机器翻译(Machine Tanslation,简称MT),又称自动翻译,是利用计算机来进行不用的自然语言之间的翻译,它是自然语言处理(Natural Language Processing)的一个分支,与计算语言学(Computational Linguistics )、自然语言理解(Natural Language Understanding)之间存在着密不可分的关系。它是横跨语言学、数学、计算机科学、翻译学及人工智能等的综合学科,也是信息时代语言应用的一个重要领域。 二、机器翻译的简介 (一)机器翻译简史 人类在近代就萌发了机器翻译的梦想,但是真正把设想付诸现实还是因为计算机的诞生和计算机技术的发展。机器翻译的研究历史课追溯到20世纪四五十年代。1946年第一台现代电子计算机ENIAC诞生,同一年,美国科学家韦弗(W. Weaver)和英国工程师布斯(A. D. Booth)在讨论电子计算机的应用范围时,提出了利用计算机进行语言自动翻译的想法。1949年,韦弗(W. Weaver)发表《翻译备忘录》,正式提出机器翻译的思想。经过六十年的曲折发展,到目前互联网的普遍应用,以及人们对翻译需求的迅猛增长,给机器翻译带来新的发展机遇。我国相继推出了一系列的机器翻译软件如“译星”、“雅信”、“通译”、“华建”等。在市场需求的推动下,商用机器翻译系统迈入了实用化阶段,走进了市场,来到了用户面前。 (二)机器翻译的主要方法 机器翻译的过程一般可简化为三个阶段:原文分析、原文译文转化和译文生成。表象上,机器翻译的核心问题是翻译的准确性;实质上,体现在技术层面则是机器翻译系统采用的方法论问题。在方法论层面,机器翻译系统可分为基于规则(Rule-Based )和基于语料库(Corpus-Based)两大类。 基于规则(Rule-Based )就是由词典和语法规则库构成翻译知识库。尽管语言学家经过长期努力创建了含有成千上万条规则的规则库,覆盖了相当大范围的语言现象,但却难以

人工智能与机器翻译.

人工智能与机器翻译(A,B 卷 七个大题:1. 名词解释 2.题解 3.智能知识 4.机器翻译方法 5. 技术阐述 6.分析题 7.应用题 A. 名词解释 : a. 机器翻译 :计算机程序做人的翻译。 b. 兼类 :一个单词既可以作名词动词又可以作其它词类。 c. 人工智能软件技术 :知识表示,知识推理,知识学习。 d. 人工智能 :用计算机模拟人的行为。 e. 交集型歧义 :一个字和前面的字可以成词,跟后面的字也可以成词。 f. 组合型歧义 :一个字可以和前面的字成词也可以同后面的字成词,连起来也可以成词。 g. 语法分析 :分析一句话的语法含义。 h. 语料库 :单词,短语,句子的集合。 i. 自然语言理解 :用计算机程序去理解一篇文章的含义。 B. 题解 : 第二章 P36 2-1,2-2 例 2.1 设有下列语句: (1 高山比他父亲出名。 (2 刘水是计算机系的一名学生,但他不喜欢编程序。

(3 人人爱劳动。 为了用谓词公式表示这些语句,应先定义谓词: BIGGER(x,y:x比 y 出名 COMPUTER(x:x是计算机系的学生 LIKE(x,y:x喜欢 y LOVE(x,y:x爱 y M(x:x是人 定义函数 father(x表示从 x 到其父亲的映射此时可用谓词公式把上述三个语句表示为: (1 BIGGER(高山, father(x (2 COMPUTER(刘水∧∽ LIKE (刘水,程序 (3 (任意 x (M(x->LOVE(x,劳动 例 2.2 设有下列语句: (1 自然数都是大于零的整数。 (2 所有整数不是偶数就是奇数。 (3 偶数除以 2是整数。 定义谓词如下: N(x:x是自然数 I(x:x是整数

机器翻译与自然语言处理研究生

机器翻译和自然语言信息处理专业硕士研究生培养方案 一、培养目标 1.能较好地掌握和运用马克思主义、毛泽东思想和邓小平建设有中国特色的社会主义理论,拥护党的基本路线,热爱祖国,遵纪守法,品德良好,学风严谨,具有较强的事业心和献身精神,积极为社会主义现代化建设事业服务。 2.在计算语言学、自然语言处理和机器翻译方面具有坚实的理论基础及系统的专门知识和技能,对于本专业的研究方向有比较全面深入的了解,具有独立从事研究工作的能力。比较熟练地掌握一种外国语,在有条件的情况下掌握两种外国语。能够用第一外语熟练地阅读本专业的外文资料,并具有一定程度的听、说和写作能力。 3.身心健康。 二、培养方式 通过系统理论学习、进行科学研究、参加学术交流和实践活动的方式,既要使硕士研究生牢固掌握基础理论和专门知识,又要培养他们从事科学研究和独立担负专门业务工作的能力。在指导方式上采取导师个别指导和指导小组集体培养相结合的方法。同时为了适应本专业领域跨学科交叉的特点,在专业课和专业基础课的教学中,注意安排硕士研究生到其他研究机构和高等院校选课。导师要严格要求、全面关心研究生的成长,定期交流,重视专业课和专业基础课的教学,重视专业外语的学习,指导学生做好开题报告,组织他们参加学术活动,鼓励并帮助他们发表学术论文。 三、研究方向 1.自然语言信息处理(Natural language information processing) 用计算机对人类特有的书面形式或口头形式的语言信息进行各种处理和加工,叫做自然语言信息处理。它的任务是对字、词、句、篇章的语音形式和书面形式进行输入、输出、统计、检索、识别、分析、理解和生成,涉及语言学、数学和计算机科学等学科的交叉领域。自然语言处理的应用目标是使人与计算机之间用自然语言进行交流。具体说是建立各种处理自然语言的计算机应用软件系统,比如:自然语言理解系统、计算机辅助教学系统、自动校对系统、文字自动识别系统、智能信息检索系统、文献自动分类系统、自动文摘系统,还有文本中的信息提取、网上智能搜索引擎,以及电子词典和术语数据库。 2 机器翻译(Machine translation) 机器翻译的任务是用计算机把一种语言翻译成另外一种语言。要建立一个机器翻译系统,首先需要确立分析和生成语言的基本观点,选择适用的语言学理论,构造系统的运行机制,组织各种必要的参数和规则,提出在计算机上实现的算法,然后设计程序。机器翻译的研究涉及了人文科学、自然科学和技术科学的多个领域,整个研究是理论方法和工程技术并举的。 四、学习年限 硕士研究生的学习年限一般为三年(包括论文答辩时间)。 五、课程设置与学分 1.公共必修课 1.克思主义理论课: 科学社会主义的理论与实践3学分 马克思主义经典著作选读3学分

机器翻译的现状和发展趋势_岳涛

72 计算机教育 2005.4 人/才/培/养/与/就/业机器翻译(Machine Trans-lation)是通过计算机来实现不同自然语言之间的翻译。机器翻译是自然语言处理(Natural LanguageProcessing)的一个分支,机器翻译与计算语言学(ComputationalLinguistics)、自然语言理解(Natural Language Understanding)存在着密不可分的关系。机器翻译的研究与发展取决于计算机科学、数学、语言学、人工智能等多学科的发展,因此机器翻译可以说是一个跨学科的综合性系统工程。人类步入21世纪以来,随着国际互联网(Internet)的迅猛发展,网络信息急剧膨胀,国际交流日益频繁以及地球村的形成,机器翻译正在逐渐成为克服人们之间进行交流时所面临的语言障碍的重要手段,同时也面临着很大的市场机遇和挑战。 历史的回顾 从美国人维弗(Warren?Weaver)于1949年发表《翻译》备忘录并正式提出机器翻译的思想以来,机器翻译已经走过了50多个风风雨雨的春秋。在这期间,机器翻译可以说经历了一条曲折而漫长的 发展道路。 1954年,在美国乔治敦大学(Georgetown University)进行了 人类历史上的第一次机器翻译的公开演示。尽管演示尚不算很成功,但是它却具有划时代的意义,因为它拉开了人们研究机器翻译 的序幕。 从20世纪50年代开始到20世纪60年代的前半期,机器翻译的研 究呈不断上升的趋势。美国和前苏联两个超级大国出于军事和政治经济目的,纷纷对机器翻译项目提供了大量的资金支持,而欧洲国家由于地缘政治和经济的需要也对机器翻译研究给予了相当大的重视。 1966年,美国科学院发表的ALPAC报告使当时正在蓬勃发展的机器翻译陷入了停滞的状态。现在来看,该报告是非常片面、狭隘和短视的。 从20世纪60年代中后期到整个70年代,整个机器翻译领域处于一个相对平稳发展的时期,而在某些国家,特别是加拿大和欧盟,机器翻译的研究却取得了比较显著的进步。尤其是在加拿大,由于双语文 化的影响,政府积极支持机器翻译的研发工作,1976年,加拿大蒙特利尔大学与加拿大联邦政府翻译局联合开发了提供天气预报服务的实用性机器翻译系统TAUM-METEO,该系统的成功开发标志着 机器翻译已经在某些领域达到了实用化的程度。 进入20世纪80年代以来,由于计算机科学、语言学研究的发展,特别是计算机硬件技术的大幅度提高以及人工智能在自然语言处理上的应用,机器翻译在全世界范围内开始复苏,并在随后的90年代取得了长足的进步。 20世纪90年代以来的机器翻译技术的新进展 1.机器翻译的分类 进入20世纪90年代,机器翻译领域的的研究方法基本上可以分为两大类,即基于规则(Rule-Based)和基于语料库(Corpus-Based)的方法。基于规则的方法又可以分为基于转换的方法和基于中间语言的方法,基于语料库的方法又可以分为基于统计的方法和基于实例的方法。传统的基于规则的方法又可以 机器翻译的现状和发展趋势 中国软件与技术服务股份有限公司 岳涛/文 ◆ 课外新知 ◆

机器翻译的特点及其与人工翻译的关系.doc

机器翻译的特点及其与人工翻译的关系 2020年4月

机器翻译的特点及其与人工翻译的关系本文关键词:机器翻译,翻译,关系 机器翻译的特点及其与人工翻译的关系本文简介:摘要:本文从机器翻译的发展出发,客观分析了机器翻译与人工翻译的优缺点,以此探讨应该用辩证和发展的眼光来看待机器翻译,学会利用科技来提高自身工作的效率与价值。关键词:机器翻译;人工翻译;人工智能;一、引言随着大数据、云计算和人工智能的发展,许多技术革新纷纷出现,人们的生活也随之变得更加 机器翻译的特点及其与人工翻译的关系本文内容: 摘要:本文从机器翻译的发展出发,客观分析了机器翻译与人工翻译的优缺点,以此探讨应该用辩证和发展的眼光来看待机器翻译,学会利用科技来提高自身工作的效率与价值。 关键词:机器翻译; 人工翻译; 人工智能; 一、引言

随着大数据、云计算和人工智能的发展,许多技术革新纷纷出现,人们的生活也随之变得更加便捷。机器翻译便是备受瞩目的技术之一。它指的是能够将口头或书面文字从一种语言翻译成另一种语言的自动化技术,全程无需人工参与。随着互联网为人们开辟了更广泛的多语言世界,这种语言服务变得非常宝贵。 二、机器翻译的发展 在过去几年中,机器翻译的研究和开发速度惊人。早在2016年,谷歌推出了神经机器翻译系统,同时使用基于短语的机器翻译作为其服务背后的关键算法,以弥合人机翻译之间的差距。后来,微软通过WMT2017Newstest证明其机器翻译系统已经可以产出与人工翻译几乎无法区分的译文。在中国,网易、搜狗和科大讯飞等互联网巨头也加入了竞争,积极发布人工智能翻译设备,以卸下人工翻译的沉重负担。 然而,机器翻译的发展并非一帆风顺。近日,腾讯的同声传译和转录机在博鳌论坛上译出了重复的短语和破碎的句子,引起了全世界对于AI翻译是否能够取代人工翻译的广泛关注和激烈辩论。在谈到人工智能是否能取代人类的问题时,我们应该记住,几乎所有技术都有其优点和缺点,机器

“计算机辅助翻译原理与实践”在“学堂在线”实现MOOC教学有感

1 开设MOOC的意愿动机、目标和 总体印象 1.1?开设MOOC的意愿动机 笔者一直对线上教育的理念比较认同,想要开设MOOC的想法可以追溯到很早之前。但本次开设MOOC课程,主要基于以下几个原因。 (1)提高课程影响力的现实需要。笔者于2005年回到北大,2006年正式开始授课。当时我们做的“计算机辅助翻译”课程可以说是中国大陆第一个计算机辅助翻译的硕士课程,具有开创性。在亚洲地区,香港中文大学于2002年开设了类似的课程,但该校是一个文科学校,与我们偏向理科方向的研究完全不一样。因此,在世界范围内我们也有自己的特色。 课程稳定下来之后笔者就开始思考怎样提高专业影响力了。由于我院是2002年北大新创建的学院,采用新的体制,学费较高,也没有奖学金,培养的都是专业硕士,全国一开始只有35所学校开设了类似的院系,而“计算机辅助翻译”专业在专业性质上来说又属于文理交叉偏文科,因此生源和院系在全社会的影响力都有一定局限性。 我们希望招到更好的学生,让更多学生知道我们的存在,这是开设MOOC比较功利性的目的。教学基础有了,在行业内也产生影响力了,我们想稳固、扩大该专业的影响力,并且为招生和提高学生的生源质量服务。 (2)课程上线的多次尝试为MOOC课程奠定了一定的基础。2008年左右,iTunes U上线,笔 “计算机辅助翻译原理与实践” 在“学堂在线”实现MOOC教学有感 俞敬松 (北京大学,北京?100871) 【摘要】本文基于对北京大学第一批MOOC课程开课教师的访谈改编而来,主要讨论了开课动机、对于MOOC课程的认识等提出自己的观点和主张。对于大规模开放课程而言,其影响力固然巨大,但是我们更重视的是由此为 契机,切实地持续改善校内学生的学习质量。视频录制以及在线课程管理是必须严肃对待的事情,但是并不 一定需要“豪华”的制作和大规模的投入。以学生学业为核心,探索改善课程的效果,评估课程对于学生学 业的改善程度,才是MOOC课程落地的根本驱动力量。 【关键词】大规模在线开放课程;MOOC;翻转课堂;课程设计 【中图分类号】G642 【文献标识码】A 【文章编号】2095-5065(2014)11-0068-07 收稿日期:2014-6-20 作者简介:俞敬松(1971—),男,北京人,博士研究生 在读,副教授,硕士生导师,研究方向为自然语言处理、大 数据技术、机器翻译等。 68

相关主题
文本预览
相关文档 最新文档