机器翻译简介 整理

  • 格式:ppt
  • 大小:3.08 MB
  • 文档页数:49

下载文档原格式

  / 49
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

明月几时有,把酒 问青天 MT: When the moon is, wine ask blue sky . HT: When will the moon be clear and bright? With a cup of wine in my hand, I ask the blue sky.

MT, the abbreviation of machine translation, is a sub-field of computational linguistics that investigates the use of software to translate text or speech from one natural language to another.

例6:He was in the seventh heaven last night. 金山快译:他昨晚是在第七天堂方面; 东方快车:昨晚他在第7天堂; 参考译文:昨晚他欣喜若狂。


例7: Oh! My eye! he said, Looking very low spirited. I am sorry for that. (Charles Dickens: David Copperfield,ch.5) 金山快译:/Oh!我的眼睛!他说,看起来非常无精神。我为 那感到抱歉。 东方快车:/oh!我的眼睛!他说,看起来很没有精神。我是抱 歉的为那。 参考译文:/噢,天哪!他看起来很丧气,说道: 这件事可糟了。
源自文库
4.新时期(1990~现在)
随着 Internet 的普遍应用,世界经济一体化进程 的加速以及国际社会交流的日渐频繁,传统的人工作业 的方式已经远远不能满足迅猛增长的翻译需求,人们对 于机器翻译的需求空前增长,机器翻译迎来了一个新的 发展机遇。国际性的关于机器翻译研究的会议频繁召开, 中国也取得了前所未有的成就,相继推出了一系列机器 翻译软件,例如“译星” 、 “雅信” 、 “通译” 、 “华建”等。在市场需求的推动下,商用机器翻译系统 迈入了实用化阶段,走进了市场,来到了用户面前。
3.恢复期(1975-1989)
进入 70 年代后,随着科学技术的发展和各国科技 情报交流的日趋频繁,国与国之间的语言障碍显得更为 严重,传统的人工作业方式已经远远不能满足需求,迫 切地需要计算机来从事翻译工作。同时,计算机科学、 语言学研究的发展,特别是计算机硬件技术的大幅度提 高以及人工智能在自然语言处理上的应用,从技术层面 推动了机器翻译研究的复苏,机器翻译项目又开始发展 起来,各种实用的以及实验的系统被先后推出,例如 Weinder 系统、EURPOTRA 多国语翻译系统、TAUMMETEO系统等。
Your brain has two parts:the left and the right.Your left brain has nothing right, and your right brain has nothing left。
你的大脑有两部分:左边的和好的。左脑 有什么权利,你的右脑有一无所有 你的大脑有两部分:左和右。你的左脑没有 正确的,你的右脑没剩下什么东西。

习语翻译
MT的表现中规中矩,对大多数习语的识别显然 还算不错,但稍艰深或涉及文化的成语则呈现出一 定差异,例如将“海誓山盟a solemn pledge of love”译作“eternal”不够全面,英文习语“ to carry coal to New castle 做徒劳无益的事(多此 一举, 白费力气)”直译为“运煤到纽卡斯尔”, “祸起萧墙Trouble breaks out at home”则干脆 译成了莫名其妙的“Harris”。
2.受挫期(1964-1975)
1964年,为了对机器翻译的研究进展作出评价,美国科 学院成立了语言自动处理咨询委员会(Automatic Language Processing Advisory Committee,简称ALPAC委员会),开 始了为期两年的综合调查分析和测试。 1966年11月,该委员会公布了一个题为《语言与机器》 的报告(简称ALPAC报告),该报告全面否定了机器翻译的 可行性,并建议停止对机器翻译项目的资金支持。这一报告 的发表给了正在蓬勃发展的机器翻译当头一棒,机器翻译研 究陷入了近乎停滞的僵局。无独有偶,在此期间,中国爆发 了“十年文革” ,基本上这些研究也停滞了。机器翻译步 入萧条期。
例4:I had a car stolen yesterday. 金山快译:我昨天偷一辆汽车。 东方快车:我把了一辆汽车昨天被偷窃。 例5:I used to have three cars. I couldn’t keep them all in my small garage. I parked somewhere around my house, but I had a car stolen yesterday. 金山快译:我过去一直有三辆汽车。我无法在我的小车 库中使他们保持所有的。我停车了在我的房子周围的某 处。但是我昨天偷一辆汽车。 东方快车:我过去常有3辆汽车。我都不能把他们放在我 的小车库。在我的房子附近我停车了某地。但是我把了 一辆汽车昨天被偷窃。
4. 语义歧义
他说:“她这个人真有意思(funny)”。她说: “他这个人怪有意思的(funny)”。于是人们以为他 们有了意思(wish),并让他向她意思意思(express)。 他火了:“我根本没有那个意思(thought)”!她也 生气了:“你们这么说是什么意思(intention)”?事 后有人说:“真有意思(funny)”。也有人说:“真 没意思(nonsense)”。
ChiShiTang at noon today We will have lunch in the cafeteria today
I saw a man with a telescope
I saw [a man with a telescope].
I [saw a man] with a telescope. 我看到一个人用望远镜 我看见一个男人与一个望远镜


成语典故翻译 在成语典故方面,MT翻译只能翻译出字面 意思,无法结合语境和历史文化背景,给 出合适恰当的翻译。


别狗咬吕洞宾,不识好人心。 MT: The dog bite lv dongbin does not know good hearts. HT: Don't bite the hand that feeds you.
On the big students qian wei-chang candlelight memorial
Shanghai University students mourn Qian Weichang with the candlelight
3.结构歧义
今天中午吃食堂
At noon today, meals in the cafeteria
MACHINE TRANSLATION
机器翻译
Machine Translation
• • • • Definition of MT History of Development Contrast between MT and HT Prospect of MT
The Definition of MT



例8:Our history teacher is a good talker. I'd like to ask him, Where’s the beef? Because we sure don't learn much from him. 金山快译:我们的历史老师是一个好说话的人。我想要问他, 牛肉在哪里?因为我们当然不从他得知多。 东方快译:我们的历史教师是一位好的空谈者。我很想问他, 牛肉在哪儿?因为向他我们没问题不学习很多。 参考译文:我们的历史老师很能夸夸其谈。我真想问问他,/管 用的货色在哪儿?因为我们真的没有从他那里学到多少东西。
The Limitation of MT

人名翻译
MT表现稍有逊色,例如将“彭定康”翻译为 “Patten”而没有译成全名“Christopher Francis pattern”,将 Google创始人之一 Larry Page的名字 翻译为“佩奇”而没有译成“拉里· 佩奇”,“金庸”的 名字只提供了“Jin Yong”而没有使用更加准确的 “Louis Cha”,不能不说是一种遗憾。
机器翻译的 现状
机器翻译的产生发展
1947 ~ 1964:草创时期 1970 ~ 1976:复苏阶段 1976 ~ 现在:繁荣时期
History of Development
1.开创期(1947-1964)
1954 年,美国乔治敦大学在 IBM 公司协同下,用 IBM-701计算机首次完成了英俄机器翻译试验,拉开了 机器翻译研究的序幕。 中国早在1956年,国家就把这项研究列入了全国科 学工作发展规划,课题名称是“机器翻译、自然语言翻 译规则的建设和自然语言的数学理论”。 从20世纪50年代开始到20世纪60年代前半期,美国 和前苏联两个超级大国出于军事、政治、经济目的,均 对机器翻译项目提供了大量的资金支持,而欧洲国家由 于地缘政治和经济的需要也对机器翻译研究给予了相当 大的重视,机器翻译一时出现热潮。
例2:The mountains began to throw their long blue shadows over the valley. 科智系统:这些高山开始越过这个(山)谷投他们的 长的蓝色的 影子。 功学系统:这些山开始掷他们的长蓝色阴影超过 这valley。 参考译文:群山已开始在山谷里投下它们蔚蓝色 的长影。
机器翻译遇到困难
1.词法歧义
自动化研究所取得的成就 自动化/研究所/取得/的/成就/。 自动化/研究/所/取得/的/成就/。 Achievements made by the Institute of Automation
2.新的词汇无法理解
上大学子烛光追思钱伟长 University sub candlelight memorial chang





例1:The sight and sound of our jet planes filled me with special longing. 科智系统:我们的喷气式飞机的情景和声音使我充满 特别的渴望。 功学系统:我们的喷射机的景象和声音充满我以(和) 特别的longing。 参考译文:看到我们的喷气式飞机,听到隆隆的机声, 令我特别神往。
基本翻译方法
1. 直接转换法
2. 基于规则的翻译方法
3. 基于中间语言的翻译方法
4. 基于语料库的翻译方法 - 基于实例的翻译方法 - 基于统计的翻译方法
Contrast between MT and HT
Machine Translation VS Human Translation The Limitation of MT

文学作品翻译
文学作品翻译方面,MT翻译基本上是逐字 翻译,根本无法传达作品的深层内涵。

满地黄花堆积,憔悴损,而 今有谁堪摘?


MT: Everywhere yellow flower accumulation gaunt who can pick the loss now ? HT: The ground is covered with yellow flowers faded and fallen in showers. Who will pick them up now?
什么是机器翻译
机器翻译 (machine translation, MT) 是利用计算机把一种语言(源语言, source language) 翻译成另一种语言(目标语言, target language) 的一门学科和技术。
MACHINE TRANSLATION
机器翻译的 产生发展
机器翻译遇到 的困难 添加文本