当前位置:文档之家› 机器使用手册翻译

机器使用手册翻译

机器使用手册翻译
机器使用手册翻译

使用手册的目的

使用手册作为设备一个组成部分,用来提供以下所有需要信息:

●操作者有关安全问题的正确认识;

●机器的手动操作、包装及安全条件下拆

卸、打开;

●正确的机器安装;

●操作及限制的全部知识;

●安全条件下的正确使用;

●正确、安全的保养;

●及其废弃物在安全条件下的处理(为了

符合及保护现有的工人的健康及环境

标准)。

工作场所的安全及卫生应具备。

此手册中包含的说明、设计及文件应技术保留,所有权归制造商,不能以任何方式部分或完全转载。

客户有责任确保,如果这份文件是由制造商修改,该有效版本可以使用。

索引

0序言

1.说明手册目的

2.怎样阅读

3.保存

4.更新

5.使用者,接受者

6.术语和图形

1 主要内容

1.生产商身份资料

2.机器说明

3.认证

4.安全标准

5.技术售后服务信息

6.客户的责任安排(客户的义务)2 主要描述

1.操作原理

2.主要部件

3.尺寸

4.环境条件

5.照明、光线

6.振动

7.噪音排放量

8.技术数据

9.工具

10.控制面板及按钮

11.标准提供

12.电磁环境

3 安全说明

1.一般警告

2.欲使用说明

3.禁止使用

4.危险区域

5.安全装置

6.标识

7.废弃物

4 安装

1.运输、搬运

2.储存、保护

3.安排

4.安装

5.固定

6.连接

7.初步检查

8.调试

9.测试

10.最终测试5机器使用

1.控制面板

2.使用

3.操作方式

4.正常停止

5.紧急停止

6.重置

7.状态改变

8.中断服务(暂停)6维护、保养

1.维修情况

2.中断设备

3.特别注意措施

4.清洗

5.加润滑油

6.日常维护

8. 错误诊断研究

9. 抽气机、泵

10. 搅拌

11. 过滤

7易损件及部件

1. 服务

2. 易损件

3. 部件

8附加说明

1.废弃物处理

2.断开处理处置

3.安全操作程序

9操作着面板使用

1.视频页面

第二章

一、

二、

1-数控面板

2-容器装置

3-配料装置

4-搅拌头

三、

四、

环境条件

①安装:地面坚固,平整,光线好

②温度允许范围:5~40°温度40°→湿度≤50%,平均温度35℃左右即可

温度20°→湿度≤90%,平均温度35℃左右即可

③注意:严禁在灰尘多,易发生火灾的场所操作设备。

五、

安装场所的照明,必须保证在机器安装的每点上能见度良好。由于机器没有独立的光源,工作环境必须提供一般照明,在机器的每个点上应保证有200~300件的勒克斯。

六、

七、

≤70dB(A)分贝

最大瞬时声压值≤63Pa帕

八、

机器的主要技术原理数据

热功率Kw 6

电机功率Kw 3

电压Volt 400

频率Hz 50

九、工具

这太机器提供有一个工具箱

十、控制面板&按钮

主电子控制面板有宗的一个中断电源开关,控制电路板组件左边有冷却风扇,起到防尘过滤的作用,每月应检查下,适当的时候要更换新的,控制面板的按钮对启动计算机很关键。十一、标准提供

本机提供全面的调试

它提供了:

1-用户和维修说明书

2-CE认证标签

十二、电磁环境

免疫排放限额统一标准

一、一般安全警告

配备了所有的保护和安全装置并提供认为必要的安全、正确的资料

基于这个原因,我们在每章中提供了人机互动时应注意的信息。

●最低操作者的资格要求

●必要的操作人数

●机器状态

●潜在风险

●必要的个人保护措施

●人为错误防止

●与合理预期不正确行为的禁令

重要!

制造商部承担由于以下原因所造成机器故障的损失:

—未培训的人员使用机器

—机器的不合适使用

—电动液压或气压供给不足

—不正确安装

—缺乏维护

—未经授权的修改或干预

—使用非原创或不具体的零部件模具

—未完全遵守相关说明

—违反具体的国际标准使用

—灾害及特殊事件

●篡改机器的任何部件

●移动无人看守的部分

●没完全准备好就运转机器

二、用途

白料&黑料用搅拌头搅拌

三、禁忌使用

四、危险区域

靠近电机(马达)磁场区域

黑料、搅拌头等管子破损或泄漏

五、

六、标签

安全罩

手套

防护眼镜

七、潜在危险

沿线可能会有黑料泄漏

如果发生这种情况,立即停止设备,参照各部件的安全说明弄清如何操作或处理。磁场风险

一、

二、贮存

●封闭区域

●在没有喷漆的地烦恼过(零部件处)打润滑油

●远离潮湿和高温范围

●避免设备接触腐蚀性物质

三、

安装安排

电路安排

四、

五、

非常水平的地面

六、

电气联接

充气连接

在容器的侧面有一个压缩空气机

气管样品1/4&1/2都行,1/2最好——(内径18mm)

七、初步检查

在启动设备前,必须进行以下操作:

●检查所有安全系统

●标识、保护罩检查

●检查在安装期间是否被损坏

●仔细检查电线,管子,控制面板,电路控制面板的连接

●所有外部能源的准确连接

●所有移动部件的定位

●检查充气连接是否牢固,保证无泄漏危险

八、

九、测试

在正式操作前,先试测是否有异常,尤其是电机旋转方向等

十、

第五章机器使用

一、控制面板

此设备配有一个控制面板,适用于电路的控制,详见第五部分附件二、开始使用

检查所有的安全设施是否完好,尤其是:

●紧急停止按钮开启

●安全屏罩保护未移动

数据设置

三、操作方式

全自动半自动

四、正常停止

总控制面板上按停止按钮,切断电源

至于其他的附件,按相关控制面板的停止键

五、紧急制动

设备的紧急制动由(fig.5.5.1)的红色紧急按钮控制,可以使设备所有的运动部件立即停止六、重置

紧急重置

紧急按钮顺时针旋转约为30°后可实现手动复位,机器可依相应的程序重新正常启动

七、工作改变

不可见的

八、服务中断

长时间不用机器的话,总的电源控制面板上切断电源是必须的,而且设备所需的其他气压、油压也需切断。

九、按钮面板控制

EMERGENCY BUTTON紧急按钮

Cycle button ARM循环按钮

Washing air button清洗按钮

Head washing cycle button搅拌头循环清洗按钮

Cycle button for Pouring流量循环按钮

Manual and/or Automatic手动/电动

此按钮面板主要由以下几个功能

1、Emergency button

2、Arm cycle button

3、Washing air button

4、Head washing button

5、Poring button

按钮功能描述

1、紧急按钮:

机器任何时候运行,所有运动部分均立刻停止。

2、循环按钮:

根据预设在操作面板的显示,把混合头臂完整的来回周期运动

3、清洗按钮:

当此按钮按下的时候,它能够对混合头压缩空气出口进行控制,此控制经常使用

4、搅拌头清洗按钮:

搅拌头在正确的清洗位置上的时候,循环清晰搅拌头。

5、流量按钮:

设备的流量循环控制。

第六章保养

1、保养现状

依据保养程序中所描述的条件下对机器进行保养。

2、机器分离

在做任何保养或维修时,必须将机器从电源上断开(隔离、独立出来再进行)。

3、特别注意项

当机器进行保养维护时,最好遵循以下建议:

●在开始工作前,在可见位置显示维修、保养标识;

●不要用溶剂和易燃材料;

●小心不要处置在冷却润滑剂的液体环境中;

●安装机器的高档部件时,请使用正确,合适的操作方式;

●未经维护人授权,不得拆卸机器部件;

●工作完毕,将打开或移动的安全罩壳及所有保护屏障都需正确固定,恢复原样。

4、清洁

5、润滑剂

定期给设备运动有关的部件,机械零件及齿轮架润滑剂

定期检查润滑剂的减少水平/程度。

根据Tab.6-6.1所描述的机器保养程序,有效地对机器进行保养。

6、常规保养

主要描述

每月检查1次紧急停止按钮,确保无问题,在生产运行或机器空状态的时候,检查紧急按钮停止的中断。

如果运转不正常(出故障),必须请专业人士检查故障或致电机器生产商的服务部门。

根据CEI44-5III标准所描述,每2年请检查测量地面电路的连续性。

常规保养根据操作者设备及使用的情况来进行,必不可少。

检查可见的个体的机器部件,检查是否需要更换或有无故障。

对于所有不需要应用到供电电压的零件保养,必须停止生产,从一般控制电源开关上隔离电源,在“O”位置,合适的时候可以挂锁。

注意:

在进行任何保养之前,操作者必须排除电源供应,切断主要电源开关,关闭电控面板,锁住,并将钥匙放在口袋里。

采用必要的个人保护措施:

●手套

●防滑靴

●合适的衣服

保养程序

根据表格中所示,以下操作必须执行的。

未能遵守这些要求,即使在保质期内,也与生产厂家无任何责任。

这些操作,尽管很简单,但必须由专业人员操作。常规保养程序包括诊断检查,中断(在系统控制下,为防止失误所必须的)

●机器的润滑状态

●易损件的状态

7、特别保养

不适用

8、故障诊断与研究

9、泵

白料黑料泵有一个润滑口。

每工作1000小时,在“A”处看内面是否有润滑油。

在顶端,通过“B”注入凡士林,通过调节“C”控制注入的数量。

搅拌头保养

10、混合头

每工作8小时或8小时以内,按照要求,要完全清洗下白/黑料搅拌头。以下所述操作必须执行,也适用于更换搅拌头,如下操作:

1)保持设备在安全条件下,移去电压;

2)气压释放并关掉流动的白/黑料;

3)用Allen扳手松开4个螺丝,停止混合室(桶);

4)将搅拌腔逆时针扭动并滑出;

5)用一个六角扳松开搅拌块,重新装上一个新的。

注意:用适合的产品清晰混合头。

过滤包养

11、过滤器

在白料和黑料的流管上有2个过滤器,用来过滤和阻止材料的悬浮杂质进入搅拌头。

黑料过滤器必须每月清洗一次,白料一年清洗一次。

要清洁,参照下图,首先关闭容器下方的龙头,松开顶部螺母M6,移去上部覆盖物并且拆下过滤路,用DOP油清洗,然后将过滤器重新安装。

DOP:通用型增塑剂(邻苯二甲酸二辛脂)

硅胶保养

11硅胶(干燥剂)(在湿度为100%条件下,能吸附并凝结相当于其自重40%的水汽,平均气孔为24埃,最佳吸温状态在21℃~32℃。)

再黑料桶,(依客户要求)有一个硅胶过滤路,是用于吸湿的。

此硅胶必须每年更换一次。

如果硅胶颜色有所不同(发生变化)需更换,更换时,松开盖子“A”(如图所示),装上新的硅胶。

注意:废弃的硅胶应按要求合法处理掉。

润滑剂

12、润滑剂

所有固定的机器上的轴承应事先打入正确熟量的润滑剂,用来保护内部零件并防止灰尘和湿气的腐蚀。

特别注意的是,不能加入过量的润滑油,因为这样会使机器封蜡变形、堵塞。

润滑剂添加的量大体是轴承空间的三分之一,但是当轴承低速运转时(“dn20000”),润滑剂应填满空间,保证/防止灰尘的侵入。

所有易损的部件必须定时检查。

推荐使用的EP矿物质润滑油;在50℃时粘度应为大约30°E(恩氏粘度?),相当于40℃时的425cst。

首次润滑油改变必须在机器运行500小时内,最好的是每3000小时改变一次。

对于合成的润滑油,首先必须将减速器内部很好的清洗下,消除运转时所留的润滑剂痕迹,避免润滑剂皂化。

以下是在工作温度的基础上所使用油一览表,对于工作温度为-3℃和180℃(短时间至约200℃)。

第七章易损附件

一、服务

关于机器使用、保养、安装等的任何信息,生产厂家可任意使用(毫无保留),对于客户来说,参照手册及说明即可将问题表述清楚。

二、

三、

第八章附加说明

一、

关于机器在使用时所产生的废弃物,使用方有责任依据当地法律法规将其正确处理掉。

润滑剂和特别使用物的处理应依据设备使用国家强制标准来规定。

二、(机器关后)的服务处理

当机器处理后,必须将其分离出来,发送到垃圾分离堆去。

对于机器的金属块,将钢的部件从其他金属/合金铝中分离出来,送去再利用。

三、安全工作程序

指导有关技术程序负责的工作人员,并告知他们:

●机器的安装使用

●紧急情形

四、白/黑线压开关

发泡剂在白/黑料线上有一个压力控制装置。

如上图所示,每个线有1个压力开关来控制最大压力量。

如果是特别工作原因或不同粘度的材料生产,量必须改变,具体看改变量的压力开关手册附件说明。

白料及黑料气压显示,低于发泡头旁的气压,正常

如果不稳定,说明帘片发泡头有空隙。

操作说明

五、白料1-2和黑料线更换

发泡机配有2个白料黑料线

选择该线工作必须先手动移动旋塞和/或阀,上图是白/黑线的整体画

务必关闭

黑料有两个泵一个3cc/rev,一个1.5cc/rev,鉴于保养的目的,每个泵配有一个邮箱吸关闭

1.5毫升/转速

A、B料桶料可再生产20~30米的时候,需立即更换料桶。

过滤器(白/黑料)一年一次拿出来清洗,

机器的特殊装置1套:①自动调节流量

②搅拌

③气压调节

气管中气先入

开始白料→实际注入中间时间7s(正常设定值)

测试时间是2s

四种不同的使用状态可供选择,总结如下:

Mode-1 黄色白料 1.5毫米泵抽吸力/绿3cc

Mode-2 黄色白料3cc

Mode-3 绿色白料 1.5cc

机器翻译技术介绍

机器翻译技术介绍
常宝宝 北京大学计算语言学研究所 chbb@https://www.doczj.com/doc/ea10598675.html,

什么是机器翻译
研究目标:研制出能把一种自然语言(源语言)的文 本翻译为另外一种自然语言(目标语言)的文本的计 算机软件系统。 制造一种机器,让使用不同语言的人无障碍地自由交 流,一直是人类的一个梦想。 随着国际互联网络的日益普及,网上出现了以各种语 言为载体的大量信息,语言障碍问题在新的时代又一 次凸显出来,人们比以往任何时候都更迫切需要语言 的自动翻译系统。 但机器翻译是一个极为困难的研究课题,无论目前对 它的需求多么迫切,全自动高质量的机器翻译系统 (FAHQMT)仍将是人类一个遥远的梦。

机器翻译的基本方法
机器翻译的基本方法 ? 基于规则的机器翻译方法 ? 直接翻译法 ? 转换法 ? 中间语言法 ? 基于语料库的机器翻译方法 ? 基于统计的方法 ? 基于实例的方法 ? 混合式机器翻译方法
目前没有任何 一种方法能实现机 器翻译的完美理 想,但在方法论方 面的探索已经使得 人们对机器翻译问 题的认识更加深 刻,而且也确实带 动了不少不那么完 美但尚可使用的产 品问世。
20世纪90年代以前,机器翻译方法的主流一直是基于规则的方 法,不过,统计方法后来居上,目前似乎已成主流方法,从学术 研究的角度看,更是如此。(Google translate)

机器翻译的基本方法
20世纪90年代以前,机器翻译方法的主流一直是基于 规则的方法,因此基于规则的方法也称为传统的机器 翻译方法。 直接翻译法 ? 逐词进行翻译,又称逐词翻译法(word for word translation) ? 无需对源语言文本进行分析 ? 对翻译过程的认识过渡简化,忽视了不同语言之间 在词序、词汇、结构等方面的差异。 ? 翻译效果差,属于早期过时认识,现已无人采用 How are you ? 怎么 是 你 ? How old are you ? 怎么 老 是 你 ?

机器翻译技术的现状及发展

机器翻译技术的现状及发展 篇一:翻译技术领域的现状与展望 翻译技术领域的现状与展望 作者/王华伟闫栗丽 翻译技术在中国的发展起步相对较晚,但近年来随着中国在全球化进程中扮演着越来越重要的角色,催生了对翻译技术发展的强烈需求。中国翻译行业在借鉴国外同行经验的基础上,于2007~2008年间在翻译技术领域取得了一系列成就,也还存在一些亟需改进的方面,而这也势必对我国的翻译行业产生深远的影响。 1. 国家政策的扶持和行业协会的推动 翻译技术的发展直接关乎整个翻译行业的翻译质量及效率,具备巨大的行业经济效益。对此,科技部、财政部都给与了足够的重视并拨出专项资金进行扶持。在 2008年的科技型中小企业技术创新基金扶持计划中,中文及多语种处理软件及基于先进语言学理论的中文翻译软件等赫然在列。而中国译协也在 2008年的第 18届世界翻译大会上专门辟出了翻译工具、术语管理和翻译标准等分论坛,着力推动翻译技术的探讨与发展。 2. 词典型翻译软件百花齐放 词典是使用范围最广的工具,它以使用便利的优势,几乎占据了每个计算机的桌面,无论语言学习者还是专业翻译人员,几乎都是必备工具。词典的发展从最早的单机版本发展至今,已经有很多种产品

类型,我们可以见到的有:电子词典、在线词典、手机词典等。“金山词霸”的网络版本“爱词霸”在这两年获得了长足的发展,如爱词霸网络释义、谷歌金山词霸等一系列特色功能的相继推出,将词典型翻译软件的应用领域从传统的桌面计算机拓展到网络、手机等,并取得了显著的成功。另外,类似Google这样的搜索引擎,因为信息量大,检索便利而成为很多专业翻译人员查词的重要辅助工具。 值得一提的是,最新推出的基于用户发布词汇的词典编撰系统之前的词典都是以各大出版社公开发行的词典中的词条作为主要数据库来源,为用户提供查询上的便利。但是传统出版词典的方式存在发布周期长、词汇更新慢的缺陷。互联网的出现,加快了信息传播的速度,也提高了用户对新词更新的速度要求,为了方便新词汇的发布,词典编纂系统也就应运而生了。这是一种基于用户的词典发布系统,用户可自由发起词典编纂项目,自发组织人员参与项目,发起人可以按照需要给小组成员分配不同的权限,将词汇添加等基本工作和审核人员明确区分,既确保了词典的专业性,也实现了专业语料的适时更新和发布。 3. 机器翻译应用软件融入普通网民生活 谷歌语言工具的推出打破了互联网语言的藩篱,用户可以方便简捷地将目标语言的网页转化成自己的母语进行浏览。事实上,这也是机器翻译软件的一个应用领域,而国内的相关软件如金山快译等,专注于为普通网民提供更为友好的英中日网站浏览体验,并在亚洲语言的机器翻译应用方面积累了大量的经验。其他如华建等长期从事机器

人工智能与机器翻译习题答案.doc

2、产生式系统有哪些类型? 1正向、逆向、双向产生式系统 2可交换的产生式系统 3可分解的产生式系统 3、试举例说明不可撤|口|搜索方法的基本思想? 这种方法相当于沿着单独一条路搜索下去,利用问题给出的局部知识决定如何选取规则, 就是说根据当前可靠的局部知识选一条可应用规则并作用于当前综合数据库。接着再根据新状态继续选取规则,搜索过程一直进行,不必考虑撤回用过的规则。 9、试说明产生式系统规则不一致的原因及解决方法。 原因:规则集中存在的不一致是影响系统性能的重要因素之一。系统建立初期,由于规则集较小,内容也比较简单,设计人员能对每一条规则的条件和结论部分反复推敲和精心构造,这类问题容易防止。但随着时间的推移,新的规则不断加入,规则集合越来越大,内容也越来越丰富,这时规则间的相互影响和相互联系就随之变得复杂。在此情况下,规则的不一致就将自然产生, 解决:(1) 对于循环规则,可构造规则集的IF-THEN图,从起始规则的条件部分开始搜索,如果搜索过程中遇到的THEN部分已在前面出现,就可以中断搜索,规则集中包含的循环规则子集合需设计人员检查,解决; (2)对于冲突规则,构造IF-IF表,对规则集内有相同的IF规则子句构造规则树,形成推理图。同时建立THEN-THEN表用以判断是否有冲突规则出现。对相同IF部分的规则继续用它的各自THEN部分作为其它可以匹配的IF前提条件,递归地构造,如发现两个推理图上分别有节点在THEN-THEN表上是矛盾的,则检测出冲突规则,人工予以解决。 (3)对冗余规则和从属规则的检查类似于冲突规则链的方法.不同之处是前者在推理图中的遍历是试图发现有THEN部分等价的两条规则。 1、机器翻译主要有娜些方法?这些方法各有什么特点? 1基于分析和转换的机器翻译方法 这样的方法有两个特点:一是面向源语言分析,因为源语言中的一个句子已经由句法、语义分析等阶段分析完毕,生成了关于源语言句子的某种中间表示,转换以这种源语言中间表示作为输入;二是直接转换,即对于S表示,直接给出译文形式,一般不需要在目标语言内再作进一步转换,Tl~Tj可以直接包括目标语言的词汇,也可以是对应于Sl~Si的译文组块。 2基于中间语言的翻译方法 基于中间语言的机器翻译方法主要有两个优点。首先,独立的中间表示形式为多语种之间的互译的实现提供了一种经济有效的途径。假设要对N种语言进行互译,则有N*(N.1)个语言对。不同方向的翻译是不同的语言对。此时如果采用基于转换的方法,因为把一种语言翻译成另一种语言都需要一个不同的转换机制(或模块),所以N火(N?l)个语言对共需要N*(N-1)个独立的转换机制。而采用中间语言的方法,由于对每一种语言只需实现将该种语言翻译成中间语言和把中间语言翻译成该种语言的目标语言这样两个模块,所以总共只需要2N个模块。其次,中间语言不仅是对基于中间语言的机器翻译方法这一特定目的有意义, 同时,作为一种通用的自然语言表示,也值得深入研究。 4.1.3基于统计的机器翻译方法 基于统计的机器翻译方法,一般不要任何语言学知识,它的基木原理是实现源语言词汇到目标语言浏汇的映射。其思路受到语音识别研究的启发,因而应用了类似的方法来实现。研究者用

一个汉英机器翻译系统的设计与实现

一个汉英机器翻译系统的 计算模型与语言模型* 刘群+詹卫东++常宝宝++刘颖+ (+中国科学院计算技术研究所二室北京100080) (++北京大学计算语言学研究所北京100871) 摘要:本文介绍我们所设计并实现的一个汉英机器翻译系统。在概要介绍本系统的主要目标和设计原则的基础上,着重说明系统的计算模型和语言模型,最后给出实验结果和进一步的打算。 关键词:自然语言处理机器翻译中文信息处理 一、引言 我国的机器翻译研究近年来取得了很大的发展。特别是英汉机器翻译系统的研制已经取得了较大的成功,达到了初步实用的阶段。相对而言,汉英机器翻译的研究却进展比较缓慢,离实用化还有相当的距离[1]。我们的目的是利用目前最新的计算机软件技术、相对成熟的机器翻译方法和先进的汉语语法理论,构造一个初步实用的汉英机器翻译系统。本文将对我们所开发的系统所采用的计算模型和语言模型作一个总体性的介绍,而不涉及过多的细节。 下面我们简要介绍一下本系统的几个主要设计原则: ⑴采用成熟的技术 我们的目的是构造一个真正实用的汉英机器翻译系统,因而在可供选择的若干技术路线面前,我们将尽量选用比较成熟的技术,而在现有技术难以解决问题时再尝试一些新技术。 ⑵开放的体系结构 开放的体系结构主要体现在系统的实现上所采用的软件构件技术[8]。整个系统采用一些相对独立的软件构件组成,因而可以方便地对系统进行修改、维护和扩充。翻译的过程严格按照独立分析、独立生成的原则进行组织,每一阶段的算法相互独立,对其中一个阶段算法的修改不会对其他算法造成影响。 ⑶方便的调试环境 本系统强调为语言工作者提供一个方便的调试环境。系统提供多窗口图形界面的知识库调试工具,支持课题组中多人同时通过网络对一个知识库进行操作。提供对翻译过程直观显示,用户可以清晰地看到翻译过程的每一步操作。提供翻译出错原因查找机制,用户 *本项目的研究受到863-306资助,合同号为863-306-03-06-2

机器翻译评测大纲

机器翻译评测大纲 一、评测对象 本次评测的对象包括:汉-英、英-汉、汉-日、日-汉机器翻译系统中的核心技术。 二、评测内容 本次评测组织两种语料的评测,一种是篇章语料,一种是对话语料。领域是面向奥运的相关领域,包括体育赛事、天气预报、交通住宿、旅游餐饮等。 本次评测的评测指标包括译文质量和翻译速度。 三、评测方法 1. 评测方式 本次评测为现场评测。采用的是以人工评测为主,人工评测和自动评测相结合的方式。 人工评测方式是:由评测组织单位将各个评测单位提交的评测结果汇总在一起,然后用计算机随机打乱译文句子的排列顺序。再将所有译文句子提交给多位专家进行人工评测。将专家评测的结果汇总,用计算机还原成原来的排列顺序,分别计算出各个评测单位的总得分。 2.评测步骤 ?在评测单位统一提供的评测环境上安装被测系统 ?评测单位给出评测数据 ?被测单位运行系统,提交评测结果 ?评测单位运行自动评测程序,得出自动评测结果 ?评测单位事后进行人工评测 ?公布评测结果 3.评测标准 (1)自动评测标准

机器翻译的自动评测目前比较成熟的标准有BLEU标准、NIST标准等。本次评测采用NIST标准。具体评测标准见附件。 (2)人工评测标准 本次评测按0 - 6个等级层次打分,最后采用百分制换算评测结果。 总的可理解率=(T1*20%+T2*40%+T3*60%+T4*80%+T5*90%+T6*100%)/ 总句数 其中:Ti为被评为第i等级的句数。

(3)翻译速度评测标准 由主持评测的工作人员现场记录翻译时间,各系统自动显示从第一个句子翻译开始到所有句子翻译完毕所用的时间(不计系统初始化所用时间,只记开始翻译到所有句子翻译完毕所用时间)。 4. 输入输出文件格式 下面以汉英机器翻译为例,说明输入输出文件格式。其中p标签为段落标记,s标签为句子标记。输入文件中每个s标签内部为一个句子。输出文件中每个s 标签与输入文件中的s标签一一对应。由于一个源语言句子可能翻译成一个或多个目标语言句子,所以输出文件中每个s标签内部可以有不只一个句子。Lang 为语言代码,汉语用“zh”表示,英语用“en”表示,日语用“ja”表示。汉语、英语、日语的输入和输出文件统一采用GBK编码。 (1)输入文件格式: 玻利维亚举行总统与国会选举 (法新社玻利维亚拉巴斯电)玻利维亚今天举行总统与国会选举,投票率 比预期更高,选民希望选出的新领导阶层能够振兴经济,改善人民的生活水准,抑制这个南美洲最贫穷国家的劳工骚动。 投票所于下午四时(台北时间七月一日清晨四时)关闭,选务人员说,选 举结果将于两小时之后开始发布。 稍早,玻利维亚总统与参与选举的候选人援引巴西赢得世足赛冠军为 例,鼓励民众踊跃投票,虽然联邦法律规定,凡达投票年龄的玻利维亚人都必须 投票。

人工智能与机器翻译期末复习题

一、名词解释(5X3‘)15’ 1.兼类(P121):一个单词既可以作名词动词又可以作其他词类 2.机器翻译:用计算机软件代替人做的书面翻译 3.组合型歧义:一个字与前面的字成词,与后面的字成词,合起来也成词。 4.交集型歧义(P117):一个字与前面的字成词,与后面的字也成词。 5.人工智能:用计算机硬件、软件模拟人的行为,解决人类目前尚未认识清楚的问题。 6.人工智能软件的三大技术:知识表示、知识推理、知识获取。 7.语料库:单词、短语和句子组成的数据库。 8.知识工程:包括人工智能软件技术的工程。(知识工程是以知识为基础的系统,就是 通过智能软件而建立的专家系统) 9.深度学习:一步一步在丰富起来的特征规律引导下,由浅入深完成推理的方法。 10.语用分析:分析成语和习惯用语的方法。 二、题解P36 例2.1 、2.2 例2.1 设有下列语句: (1)高山比他父亲出名。 (2)刘水是计算机系的一名学生,但他不喜欢编程序。 (3)人人爱劳动。 为了用谓词公式表示这些语句,应先定义谓词: BIGGER(x,y):x比y出名 COMPUTER(x):x是计算机系的学生 LIKE(x,y):x喜欢y LOVE(x,y):x爱y M(x):x是人 定义函数father(x)表示从x到其父亲的映射此时可用谓词公式把上述三个语句表示为:(1)BIGGER(高山,father(x)) (2)COMPUTER(刘水)∧∽LIKE(刘水,程序) (3)(?x)(M(x) →LOVE(x,劳动)) 例2.2 设有下列语句: (1)自然数都是大于零的整数。 (2)所有整数不是偶数就是奇数。 (3)偶数除以2是整数。 定义谓词如下: N(x):x是自然数 I(x):x是整数 E(x):x是偶数 O(x):x是奇数 GZ(x):x大于零 另外,用函数S(x)表示x除以2。此时,上述三个句子可用谓词公式表示为: (?x)(N(x) →GZ(x)∧I(x)) (?x)(I(x) →E(x)∨O(x)) (?x)(E(x) →I(S(x))) 三、论述(4X5‘)20’ 1.阐述深度、广度、代价驱动搜索方法。(P68) 答:广度优先搜索法:对全部节点沿广度进行横向扫描,按各节点生成的先后次序,

机器翻译研究现状与展望1 Machine TranslationPast,Present,future

机器翻译研究现状与展望1 戴新宇,尹存燕,陈家骏,郑国梁 (南京大学计算机软件新技术国家重点实验室,南京 210093) (南京大学计算机科学与技术系,南京 210093) 摘要:本文回顾机器翻译研究的历史,介绍典型的机器翻译方法,包括:基于规则、基于统计以及基于实例的机器翻译方法;针对机器翻译的研究现状,详细介绍和分析了基于混合策略的机器翻译方法,对统计以及机器学习方法在机器翻译中的应用进行了描述;论文还介绍了当前机器翻译评测技术;最后对机器翻译进行总结和展望。 关键字:机器翻译,基于规则,基于统计,基于实例,混合策略,机器学习 Machine Translation:Past,Present,future Dai Xinyu, Yin Cunyan, Chen Jiajun and Zheng Guoliang (State Key Laboratory for Novel Software Technology, Department of Computer Science & Technology Nanjing University, Nanjing 210093) Abstract:This paper firstly presents the history of machine translation, and introduces some classical paradigms of machine translation: RBMT, SBMT and EBMT. Secondly, we introduce the recent research on machine translation, and describe the hybrid strategies on machine translation in detail, and discuss the applications of machine learning for machine translation. We also analyze the current techniques about evaluation on machine translation. Finally, we draw a conclusion and prospect on the research of machine translation. Keywords:Machine Translation, RBMT, SBMT,EBMT, HSBMT, Machine Learning. 1本论文工作得到863课题资助(编号:2001AA114102, 2002AA117010-04) 戴新宇博士生,主要研究自然语言处理;尹存燕助教,主要研究自然语言处理;陈家骏教授,博士生导师,主要研究自然语言处理、软件工程;郑国梁教授,博士生导师,主要研究软件工程。

浅析语料库对于翻译研究的意义

浅析语料库对于翻译研究的意义 【摘要】基于语料库的翻译研究在当今已进入一个全新模式,多种语料库被开发应用在人工翻译和机器翻译等实践领域当中。本文对语料库的概念以及某些种类语料库在翻译活动中具体实用情况做出分析,揭示语料库对于翻译研究的意义。 【关键词】语料库;翻译;双语语料库;平行/对应语料库 An Analysis on the Significance of Corpus to Translating Research CHEN Dan (Eastern Liaoning University,Dandong Liaoning 118000,China) 【Abstract】Translating research based on corpus has stepped into a new mode today,and many kinds of corpora are developed and applied in practical fields of manual translation and machine translation. The thesis analyzes the concept corpus and the application of some corpora in translating,which exemplify the significance of corpus to translating research. 【Key words】Corpus;Translating;bilingual corpus;Parallel corpus “语料库”的英语单词corpus来源于拉丁语,意思是body,有“全集”的含义,即“语料的集合”。有的学者认为语料库是基于形式和目的的存储于电子数据库中的文本集合,是描述自然发生语言的集合;也有人认为它是按照明确的语言学标准选择并排序的语言运用材料的汇集,旨在用作语言的样本。国内语料库学者杨惠中对语料库的定义做了较为详细的界定。他指出,“语料库是指按照一定的语言学原则,运用随机抽样方法,收集自然出现的连续的语言运用文本或话语片段而建成的具有一定容量的大型电子文库”。 语料库所收集的语料是真实、自然的语言。不同于普通的文本数据库,它的设计和建设是以系统的理论语言学原则为依据,并且具有明确的目的性。语料库的结构严格依照既定程序设定,以一定研究目的为基础,按学科或语篇类型分类存储。语料库中的语料必须符合科学的语言研究,语料可以随机抽取或按统计学方法采集。 语料库的类型和分类标准很多。按用途分,语料库可分为通用语料库(general corpus)和专用语料库(specialized corpus);按语料选取时间,语料库可分为历时语料库(diachronic corpus)和共时语料库(synchronic corpus);按不同结构,语料库可分为平衡语料库(balanced corpus)和自然随机结构语料库(random structure corpus);按语料库的性质,语料库可分为原始语料库(raw corpus)和标注语料库(annotated corpus);按语言种类,语料库可分为单语语料库

机器翻译研究综述

机器翻译综述 1.引言 1.1机器翻译的历史 现代机器翻译的研究应该是从20世纪50年代开始,但是早在这以前很多人已经提出了相应的想法,甚至是远在古希腊时期就有人提出要用机器来进行语言翻译的想法。 在1946年,美国宾夕法尼亚大学的两位科学家设计并制造了世界上第一台电子计算机。与此同时,英国工程师同美国洛克菲勒基金会副总裁韦弗在讨论计算机的应用范围时,就提出了利用计算机实现语言的自动翻译的想法。在1949年,韦弗发表了一份名为《翻译》的备忘录,正式提出了机器翻译问题。他提出了两个主要观点: 第一,他认为翻译类似于解读密码的过程。 第二,他认为原文与译文“说的是同样的事情”,因此,当把语言A翻译为语言B时,就意味着从语言A出发,经过某一“通用语言”或“中 间语言”,可以假定是全人类共同的。 在这一段时间由于学者的热心倡导,实业界的大力支持,美国的机器翻译研究一时兴盛起来。 1964年,美国科学院成立语言自动处理咨询委员会,调查机器翻译的研究情况,给出了“在目前给机器翻译以大力支持还没有多少理由”的结论,随后机器翻译的研究就陷入了低潮期。直到70年代以后机器翻译的研究才重新进入了一个复苏期,随后机器翻译的发展又迎来了繁荣期 1.2机器翻译的主要内容 经过50多年的发展,在机器翻译领域中出现了很多的研究方法,总结如下:●直接翻译方法 ●句法转换方法 ●中间语言方法 ●基于规则的方法 ●基于语料库的方法 基于实例的方法(含模板、翻译记忆方法) 基于统计的方法 在当前的研究中,更多的是基于统计的方法进行的,因为基于统计的方法可以充分的利用计算机的计算能力,并且并不需要过多的语言学知识作为支撑,可以让更多的计算机科学家投入到实用系统的研究中,极大的促进了统计机器翻译的发展。 下面对各个方法逐一的进行介绍。

机器翻译的自动评测技术 机器翻译技术

机器翻译的自动评测技术机器翻译技术 本文介绍了机器翻译评测的基本原理以及常用评测标准,包括人工评测方法、基于n元匹配的BLEU和NIST自动评测方法。机器翻译领域最困难的任务之一就是对给定的翻译系统或者翻译算法 进行评价,我们称其为机器翻译评测。由于机器翻译所处理的对象――语言本身存在某种程度的歧义,无法像数学公式或者物理模型那样简单客观地描述出来,这使得为机器翻译结果进行客观的打分变得非常困难。最早的方法是人工评测,这种方法得到的结果一般是十分准确的,但评测的成本太高,周期过长(评测过程可能长达几周甚至数月),评价结果也会随着评价人的变化和时间的推移而不同,这使得评价结果不可重复,缺乏客观性,因此,机器翻译的自动评测应运而生。实践证明,机器翻译的评测尤其是自动评测对机器翻译研究的影响十分巨大,对研究发展和技术进步起着非常重要的引导作用。 基于n元匹配的自动评测方法 如果一个机器翻译评测系统只根据源语言文本就能自动地为若干译文打分并选择出其中最好的结果,那么这个评测系统本身就是一

个质量更好的机器翻译系统了。因此,自动评测最初的出发点就是给出一些标准的翻译结果,然后比较机器生成的译文与这些翻译之间的相似程度。我们称这些标准的翻译为参考译文(或者参考答案)。同一个句子可以有多个不同的参考译文,这些参考译文都表达同一个含义,但可能使用了不同的词汇,或者虽然使用了相同的词汇但在句中的词序不同。这样一来,机器翻译自动评测的问题转换为比较机器翻译系统输出的一个翻译结果和多个通过人工产生的正确的参考译文之间 的相似度的问题,使用不同的相似度计算方法即可得到不同的自动评测方法。 例如,考虑如下两个机器翻译系统生成的翻译结果: 源语言文本: 今年前两月广东高新技术产品出口37.6亿美元 系统译文1: The new high-tech products in Guangdong exported 3.76 billion dollars in the first two months this year

人工智能与机器翻译.

人工智能与机器翻译(A,B 卷 七个大题:1. 名词解释 2.题解 3.智能知识 4.机器翻译方法 5. 技术阐述 6.分析题 7.应用题 A. 名词解释 : a. 机器翻译 :计算机程序做人的翻译。 b. 兼类 :一个单词既可以作名词动词又可以作其它词类。 c. 人工智能软件技术 :知识表示,知识推理,知识学习。 d. 人工智能 :用计算机模拟人的行为。 e. 交集型歧义 :一个字和前面的字可以成词,跟后面的字也可以成词。 f. 组合型歧义 :一个字可以和前面的字成词也可以同后面的字成词,连起来也可以成词。 g. 语法分析 :分析一句话的语法含义。 h. 语料库 :单词,短语,句子的集合。 i. 自然语言理解 :用计算机程序去理解一篇文章的含义。 B. 题解 : 第二章 P36 2-1,2-2 例 2.1 设有下列语句: (1 高山比他父亲出名。 (2 刘水是计算机系的一名学生,但他不喜欢编程序。

(3 人人爱劳动。 为了用谓词公式表示这些语句,应先定义谓词: BIGGER(x,y:x比 y 出名 COMPUTER(x:x是计算机系的学生 LIKE(x,y:x喜欢 y LOVE(x,y:x爱 y M(x:x是人 定义函数 father(x表示从 x 到其父亲的映射此时可用谓词公式把上述三个语句表示为: (1 BIGGER(高山, father(x (2 COMPUTER(刘水∧∽ LIKE (刘水,程序 (3 (任意 x (M(x->LOVE(x,劳动 例 2.2 设有下列语句: (1 自然数都是大于零的整数。 (2 所有整数不是偶数就是奇数。 (3 偶数除以 2是整数。 定义谓词如下: N(x:x是自然数 I(x:x是整数

机器翻译系统评测规范

语言文字规范 GF 2006 — _______________________________________________________________________________ 机器翻译系统评测规范 (Assessment Specifications of Machine Translation Systems) 2006--发布 2006--试行_______________________________________________________________________________ 中华人民共和国教育部国家语言文字工作委员会发布

目录 前 言 1适用范围 (5) 2规范性引用文件 (5) 3术语和定义 (5) 4评测的一般原则和方法 (6) 5机器翻译系统的用户类型 (6) 6机器翻译评测题目的编制原则 (6) 7机器翻译的评测标准 (8) 8机器翻译评测的其他内容 (10)

前 言 本标准规定了机器翻译系统的评测规范。 本标准由教育部语言文字信息管理司提出立项,负责解释。 本标准由教育部语言文字信息管理司归口。 本标准由国家语言文字工作委员会语言文字规范(标准)审定委员会审定。本标准起草单位:教育部语言文字应用研究所 本标准主要起草人:冯志伟、肖航、富丽、章云帆

中华人民共和国教育部 国家语言文字工作委员会语言文字规范 GF2006 - 机器翻译系统评测规范 (Assessment Specifications of Machine Translation Systems) 1 适用范围 本标准规定了机器翻译系统的评测规范。 本标准适用于机器翻译系统的评测以及有关的管理工作。 2 规范性引用文件 下列文件中的条款通过本标准的引用而成为本标准中的条款。 ISO11179-3信息技术数据元的规范与标准化第3部分:数据元的基本属性 GB/T 12200.1 汉语信息处理词汇 01部分:基本术语 GB/T 13725 信息处理用现代汉语分词规范 GB3259-92 中文书刊名称汉语拼音拼写法 GB/T 15834-1995 标点符号用法 GB/T 15835-1995 出版物上数字用法的规定 GB/T 16159-1996 汉语拼音正词法基本规则 第一批异形词整理表 第一批异体字整理表 部分计量单位名称统一用字表 中国人名汉语拼音字母拼写法 中国地名汉语拼音字母拼写规则 普通话异读词审音表 3 术语和定义 下列术语和定义适用于本规范。 3.1 信息处理系统(information Processing systems) 基于计算机技术、网络互联技术、现代通讯技术和各种软件技术,集各种理论和方法于一体,提供信息服务的人机系统,是由人和计算机等共同组成的,能进行信息的收集、传输、分析、加工、处理、存储、更新和维护的系统。 3.2 评测规范(assessment specifications) 用于评测的规范,包括评测的一般原则、评测内容、评价指标、评测方法和文件格式等。 3.3 自然语言(natural language) 规则是根据当前用法而不是用显式的方式规定的语言。如汉语、英语、德语等。 3.5 中文信息处理(Chinese information processing, CIP) 用计算机对汉语的语音、语法、词汇、语义、语用等信息进行处理,又称汉语信息处理。

论机器翻译系统的评价体系

与人工翻译译文质量评价不同的是,对机器翻译的评价除了评价译文质量外,还要评价机器翻译系统的其它性能。近年来,机器翻译的评测越来越受到广泛的重视。在过去几年中,国际上进行了若干次有影响的评测活动,如,信息理解评测(MessageUn-derstandingConference,简称MUC)评测专有名词识别问题,文本检索评估(Text-REtrievalConference,简称TREC)评测信息检索的发展,还有许多机器翻译和语音技术的评测活动,所有这些评测活动都对机器翻译的发展影响很大。 机器翻译适用的范围相对较小,通常是“相对限定的专业领域”,“不是用于文学性很强或文化味很浓的文本,而是用于科普文献、 金融商业交易、行政管理备忘录、法律文件、说明书、农业及医学资料、工业专利、宣传册、报纸报道等”(Hutchins&Somers, 1992:3)。Nagao把机器翻译的适用范围限定在科技文献、文章题目、一般句子,而排除了诗歌、文学作品、法律文件、标书合同等(Nagao,1989)等。因此,人们对机器翻译进行评测时,限制所评测的文本的类型。尽管如此,在具体的机器质量评测上,也存在着不同的标准,它不仅仅只局限在纯粹的译文质量上,而且也涉及机器翻译系统的可操作性、机器翻译的可行性、机器翻译的类型评价、机器翻译的投入与产出比、机器翻译中的不同角色等等,鉴于这些复杂性,人们常常需要综合多个标准,以便全面、客观、公正地评价机器翻译系统。在这个意义上,正好与辜正坤的翻译多元系统互补论中通类基础标准系统(抽 象标准)中的(2)(信的标准:忠实标准、 准确标准、动态等值标准),和非类特殊基础标准系统(具体标准)中的(8)(科学技术著作翻译标准)标准不谋而合。阿诺德(D?Arnold)等人曾建议机器翻译评价应考虑下述因素(Arnoldetal.,1993): (1)机器翻译商品系统与机器翻译研究应该区 分开来; (2)从用户的角度评价机器翻译系统; (3)从需求和结果相适应的角度看待机器翻译质量。 机器翻译评价的指标体系直接决定着机器翻译研发人员的研发路线和机器翻译的发展方向,评价标准对机器翻译的开发与研究都会产生重要影响,上个世纪60年代美国著名的ALPAC报告对MT作出的评价造成的影响很大(Arnoldetal.,1993),所以,怎样客观、 公正地评价一个机器翻译系统,这本身就构成了一个重大研究课题(Bourbeau,1993, Steiner,1993&Arnoldetal.,1993)。 一、机器翻译类型与评价标准 1995年,布瓦泰(C?Boitet)首先区分了机器翻 译的四种类型: (1)用于浏览者(forthewatcher),称之为MT- W,旨在为读者查阅外文资料时提供帮助,这种情况下,他们宁愿接受那种“粗糙”的译文(有时经过一定程度的后编辑),也不愿意一无所获; (2)用于修订者(forthereviser),称之为MT-R,旨在自动生成“粗糙”的译文,它类似于人工翻译的草稿,因而可以为专业翻译人员免去费时费力的工作,使他们变成修订者; (3)用于翻译者(forthetranslator),称之为MT- T,旨在协助翻译人员的工作,提供在线词典、同义词库、翻译实例库等; (4)用于作者(fortheauthor),称之为MT-A,提 供给希望作品被译成一种或几种文字的作者,该作者愿意在系统控制下写作或者帮助系统消除译本中可能产生的歧义。 论机器翻译系统的评价体系 张政1,王贵明2 (1.北京工商大学 外语系,北京100037;2.北京理工大学 外语学院,北京100081) 摘 要:近年来,机器翻译的应用越来越广泛。本文主要对人们所关注的机器翻译系统的评价问题,就其类型与标 准、系统评价的内容、以及系统评价的主要方法等方面进行较详细的介绍和评议。关键词:机器翻译;评价体系中图分类号:G64 文献标识码:A 文章编号:1009-3370(2008)02-0112-06 收稿日期:2007-12-17 作者简介:张政(1958—),男,教授;王贵明(1960—),男,教授。E-mail:guimingwang@bit.edu.cn 第10卷第2期北京理工大学学报(社会科学版) Vol.10No.22008年4月 JOURNALOF BEIJINGINSTITUTEOFTECHNOLOGY(SOCIALSCIENCESEDITION)Apr.2008

机器翻译的现状和发展趋势_岳涛

72 计算机教育 2005.4 人/才/培/养/与/就/业机器翻译(Machine Trans-lation)是通过计算机来实现不同自然语言之间的翻译。机器翻译是自然语言处理(Natural LanguageProcessing)的一个分支,机器翻译与计算语言学(ComputationalLinguistics)、自然语言理解(Natural Language Understanding)存在着密不可分的关系。机器翻译的研究与发展取决于计算机科学、数学、语言学、人工智能等多学科的发展,因此机器翻译可以说是一个跨学科的综合性系统工程。人类步入21世纪以来,随着国际互联网(Internet)的迅猛发展,网络信息急剧膨胀,国际交流日益频繁以及地球村的形成,机器翻译正在逐渐成为克服人们之间进行交流时所面临的语言障碍的重要手段,同时也面临着很大的市场机遇和挑战。 历史的回顾 从美国人维弗(Warren?Weaver)于1949年发表《翻译》备忘录并正式提出机器翻译的思想以来,机器翻译已经走过了50多个风风雨雨的春秋。在这期间,机器翻译可以说经历了一条曲折而漫长的 发展道路。 1954年,在美国乔治敦大学(Georgetown University)进行了 人类历史上的第一次机器翻译的公开演示。尽管演示尚不算很成功,但是它却具有划时代的意义,因为它拉开了人们研究机器翻译 的序幕。 从20世纪50年代开始到20世纪60年代的前半期,机器翻译的研 究呈不断上升的趋势。美国和前苏联两个超级大国出于军事和政治经济目的,纷纷对机器翻译项目提供了大量的资金支持,而欧洲国家由于地缘政治和经济的需要也对机器翻译研究给予了相当大的重视。 1966年,美国科学院发表的ALPAC报告使当时正在蓬勃发展的机器翻译陷入了停滞的状态。现在来看,该报告是非常片面、狭隘和短视的。 从20世纪60年代中后期到整个70年代,整个机器翻译领域处于一个相对平稳发展的时期,而在某些国家,特别是加拿大和欧盟,机器翻译的研究却取得了比较显著的进步。尤其是在加拿大,由于双语文 化的影响,政府积极支持机器翻译的研发工作,1976年,加拿大蒙特利尔大学与加拿大联邦政府翻译局联合开发了提供天气预报服务的实用性机器翻译系统TAUM-METEO,该系统的成功开发标志着 机器翻译已经在某些领域达到了实用化的程度。 进入20世纪80年代以来,由于计算机科学、语言学研究的发展,特别是计算机硬件技术的大幅度提高以及人工智能在自然语言处理上的应用,机器翻译在全世界范围内开始复苏,并在随后的90年代取得了长足的进步。 20世纪90年代以来的机器翻译技术的新进展 1.机器翻译的分类 进入20世纪90年代,机器翻译领域的的研究方法基本上可以分为两大类,即基于规则(Rule-Based)和基于语料库(Corpus-Based)的方法。基于规则的方法又可以分为基于转换的方法和基于中间语言的方法,基于语料库的方法又可以分为基于统计的方法和基于实例的方法。传统的基于规则的方法又可以 机器翻译的现状和发展趋势 中国软件与技术服务股份有限公司 岳涛/文 ◆ 课外新知 ◆

基于实例的机器翻译

基于实例的机器翻译 ——方法和问题 王厚峰(北京大学) 关键字:基于实例的机器翻译,双语对齐,相似度计算,模板获取 摘要:本文介绍了基于实例的机器翻译方法,并对基于实例的机器翻译的若干问题,如双语实例的加工对齐、实例的相似度计算和实例模板提取等问题作了说明。 Method and Issues of Example-Based Machine Translation Wang Houfeng Keywords: EBMT, Bilingual Alignment, Similarity Measure, Template Acquisition. Abstract: The basic frame of Example based machine translation is concerned in this paper. Some key issues, such as bilingual alignment, similarity measure between input sentence and example, and template acquisition, are introduced. 引言 早期的机器翻译本质上都是基于语言规则或语言知识RBMT(Rule Based Machine Translation)的。如,词法规则,句法分析规则,转换规则,目标语生成规则等。这些规则都是根据语言专家的经验总结归纳出来的。直译法、转换生成方法、中间语言方法等都可以归为这一类。在上一世纪80年代中后期,这种纯粹基于语言知识的状况渐渐被基于语料库的机器翻译CBMT( Corpus-Based Machine Translation) 方法打破。 语料库方法中最有影响的是IBM公司的P.Brown 提出的基于统计的机器翻译SBMT (Statistics Based Machine Translation)。受语音处理的启发,P.Brown在1988年第二届TMI会议上提出了用隐马尔科夫模型HMM(Hidden Markov Model)进行机器翻译的想法,这一想法震惊了当时的与会者,并直接导致了语料库方法在自然语言处理上的迅速发展。 另一个影响更为广泛的机器翻译方法是日本的长尾真(Makoto Nagao)1981年提出的基于实例的机器翻译EBMT ( Example based Machine Translation),并于1984年发表[6]。基本思想是在已经收集的双语实例库中找出与待翻译部分最相似的翻译实例(通常是句子),再对实例的译文通过串替换,串删除以及串增加等一系列变形操作,实现翻译。 基于实例的翻译方法受到广泛关注是在进入90年代之后。其中,Sato[7,8]等人起到了很好的推动作用。 EBMT的基本思想 长尾真认为,人们在翻译简单句子时并没有做语言的深层分析,而是先将句子分解为几个片断(短语),然后,借助于已有片断的翻译,将分解的每个片断翻译成目标短语,最后在将这些短语组合起来形成一个长的句子。 基于上述思想,长尾真提出了基于实例的机器翻译EBMT的思想。对应地,EBMT也分为三大部分:将实例划分为片断,确定各个片断的翻译以及重组片断。 例2.1. (a) 她买了一本计算语言学入门书 假定计算机内已经存储了如下的实例对:

人工智能与机器翻译复习总结

一.名词解释(3X5) 1.机器翻译:机器翻译是人工智能研究的一个分支, 是用电脑代替人做翻译 工作。 2.组合型歧义:一个句子中,一个字既可以与前面的字构成一个词,也可 以与后面的字构成一个词,也可以合起来组成一个词。(词与词之间的串联产 生的) 3.交集型歧义:一个句子中,一个字既可以与前面的字构成一个词,也可 以与后面的字构成一个词。(词与词之间的交叉组合产生的) 4.语料库:由单词、短语、句子组成的电子库。 5.人工智能:人工智能是计算机科学的一个分支,任务旨在 模拟人类行为和认知过程。 6.人工智能软件技术:知识表示、知识推理、知识获取。 7.语法分析:分析一个句子有无语法错误。例如“兔子吃草” 是正确的,但“草吃兔子”是错误的。 8.兼类:兼类指同一个词具有不同的词类语法功能, 即这个词兼属不同的词 类。 二.基本概念(3x4) 1.人工智能应用领域:P11 (1)问题求解 (2)逻辑推理与定理证明 (3)自然语言理解 (4)自动程序设计 (5)专家系统 (6)机器学习 (7)人工神经网络

(8)机器人学 (9)模式识别 (10)机器视觉 (11)智能控制 (12)智能检索 (13)智能调度与指挥 (14)系统与语言工具 2.分析智能软件与通常软件的区别:P8 通用软件:采用两级层次加以组织:数据级、控制级 智能软件:采用三级层次加以组织:数据级、知识库、控制级 3.比较智能软件与通常软件的性质:P8 通用软件:(1)通用性。算法应能求解问题范围内的全部问题,而不是只能解决其中的某些特殊问题。 (2)确定性。算法中的问题求解状态、求解步骤应该是精确的、唯一的,并可以机械的执行。 (3)有效性。问题范围内的任何具体问题带入算法后,都可以经过有限步骤达到所期望的结果。 智能软件:(1)局部性。仅适用与求解一类问题中那些被认为合理或者常见的问题。 (2)试探性。常采用一般情况下能保证正常工作的方法进行问题求解,当这个方法失败时,允许采用其他方法。 (3)针对性。智能软件常利用求解问题的一些特殊规律,但这些规

相关主题
文本预览
相关文档 最新文档