当前位置:文档之家› 面向口语翻译的汉语语句改写方法1

面向口语翻译的汉语语句改写方法1

面向口语翻译的汉语语句改写方法1
面向口语翻译的汉语语句改写方法1

Journal of Chinese Language and Computing 12(1)63-77 63

V f语 译 汉语语 写

宗成庆+* 张玉洁*2山本和英* 坂本仁* 白井谕*

+中国科学院自动化研究所模式识别国家重点实验室

北京 100080, 2728信箱

cqzong@https://www.doczj.com/doc/9d8043872.html,

*日本ATR音声言语通信研究所,619-0288京都府

{yujie.zhang, kazuhide.yamamoto, masashi.sakamoto, satoshi.shirai}@atr.co.jp

摘要:在口语自动翻译系统中,当翻译引擎无法对输入语句(utterance)进行正确理解和翻译时,如果系统能够自动提供输入语句其它可能的表达方式,无疑将提高系统翻译的正确率。本文介绍汉语口语为源语言输入的汉-外口语自动翻译系统中,汉语口语语句自动改写方法研究的基本思想和初步成果。本文中作者提出了基于口语解析技术和语言自动生成技术相结合的汉语口语自动改写方法。该方法的基本思想是,首先利用口语自动解析技术提取输入语句的主要特征,包括语句类型,时态,句法成分等,并对复杂长句进行自动识别和切分,然后,根据解析结果利用语言生成技术实现输入语句的自动改写。

关键字:语句改写,口语自动翻译,口语解析

1. 问题背景

由于自然口语本身的灵活性和多变性,以及语音识别器可能产生错误的识别结果和一些基本口语信息(如停顿、语气等)丢失等因素,使得口语语音自动翻译研究面临许多困难[18]。在过去十几年的口语自动翻译研究中,人们提出了很多方法来提高自然口语解析器的鲁棒性(robustness)和翻译正确率[2,10],然而,目前的口语自动翻译技术仍然面临许多问题,如何处理复杂的口语句子,正确翻译和表达说话者的意图,仍然是目前口语翻译研究中需要解决的关键问题之一。

1本论文的研究工作得到中国国家自然科学基金资助(项目编号:60175012,69835003)和国家973项目资助(项目编号:G1998030504-01)。

2目前该作者的工作单位为:日本通信综合研究所 (CRL),通讯地址不变,新的e-mail地址为:yujie@crl.go.jp。

64 Chengqing Zong, Yujie Zhang, Kazuhide Yamamoto, Masashi Sakamoto and Satoshi Shirai

在研究口语翻译策略时,一种基本的思想是借鉴和模拟人在进行口语翻译时的基本模式。当说话者说出一句话的时候,充当翻译的人如果不能理解说话者的意图,那么,翻译需要询问说话者,在这种情况下说话者很可能会给出不同于原来句子的另外一种表达形式,要么替换刚才说出的话中比较生僻的词语,要么变换句子结构或者进行意思解释。这个过程实际上是由说话者自己完成了一个句子改写(说)的过程。这样,我们很自然地想到,如果在口语翻译系统中,当翻译引擎不能实现输入句子的正确翻译时,如果系统的源语言预处理模块能够自己实现输入句子的自动改写,并不断为翻译引擎提供原来语句另外可能的表达形式,对于提高翻译系统的鲁帮性和正确率无疑是十分有意义的。从另一个角度来讲,由于翻译模块能够处理的语言现象往往是有限的,如果系统源语言预处理模块能够生成输入语句的其它多种表达形式,那么这些表达式中只要有一个落入到系统可以处理的有限的句型集之内,系统就可以得到原输入输入语句的正确翻译结果。因此,基于这种考虑,日本ATR-SLT (Advanced Telcom-

Translation Laboratories) 的Yamamoto

等人提出了一种基于输入语句改写的

口语翻译模型,称之为Sandglass翻译

模型[12,13]。这种翻译模式的直接效果

是把复杂的源语言解析任务从翻译模

块中分离出来,让源语言本身来表达

输入语句的含义,翻译模块可以采用

简单的转换方法,例如:模板直接匹

配等方法,实现有限集内源语言到目

标语言的翻译转换。其基本思想如右图所示。

本文所要介绍的工作就是在上述背景下对汉日口语自动翻译系统中汉语口语语句改写任务的研究情况。论文第二部分简要介绍目前国际上进行语句改写技术研究的相关工作;第三部分对改写技术中存在的主要问题和基本方法进行简要分析;第四部分详细介绍作者提出的基于特征提取的汉语口语语句自动改写方法的基本思想和实现技术;第五部分给出部分试验结果;第六部分是本文的结束语。

2.相关工作

单就语句改写技术而言,也许并不是什么全新的研究课题。早在1983年Mckeown等人就提出了利用语句改写技术对问答系统(CO-OP)的输入句子进行简化

Chinese Utterance Paraphrasing for Spoken Language Translation 65

改写的思想[7]。然而,当时的方法仅限于规范句法结构的输入句子。1996年Chandrasekar等人提出了利用有限状态文法FSG (Finite State Grammar)简化长的复杂句子的基本方法。该方法利用标点符号和关系代词等定义一组规则和模板来简化复杂长句[3],而口语翻译系统中处理的是自然口语,不可能有任何标点符号可以利用。Dras等人提出了利用同步树联结文法TAG(Tree-Adjoining Grammars)改写句子的方法[4,5]。该方法不仅依赖于理想化的TAG文法,而且要求对输入句子进行很好的句法分析。这在口语处理系统中几乎很难做得到。Boguslavsky研究过基于词汇功能的俄语和英语同义词改写系统[1],通过同义词替换改写输入句子,但是,并没有涉及到句子结构改写。Sato 和Kondo等人分别研究过日语科技论文标题和日语句子的改写方法[11, 6],其主要目的是为了科技论文检索的需要。该研究方法是针对日文科技论文标题中多含有复杂名词短语,而且这些名词短语在语义上往往具有动词作用的特点,主要利用句法转换规则来分析复杂名词短语的内部结构并对其扩展,以获得与原标题具有相同意思的不同表达。Meteer研究过自然语言接口系统中的句子改写方法[8], Ramsay介绍了英语句子中非常规词序的短语的识别和处理方法[9]。

从目前句子改写方法研究的现状来看,一般都是针对文本输入进行的,一方面与口语句子相比,文本句子本来就相对规范。另一方面,文本句子中有很多可以利用的分析信息,如句子标点等。而口语句子无论在词序,句子结构和用词方法等很多方面,都有较大的灵活性[16],而且,口语处理中没有标点符号等信息可以利用。令人遗憾的是,在我们开始汉语口语句子改写方法研究之前,就我们所能找到的文献资料中,没有找到任何有关中文句子改写方法研究的论文。因此,本文的研究工作可以认为是对汉语语句改写方法研究的首次尝试和探索。

3.问题分析与方法探讨

从问题研究的内容和处理手段来看,句子改写涉及的问题同其它目的的任何一个自然语言处理系统一样,几乎触及到了分词(对于汉语和日语等而言)、句法分析甚至语义分析、语言生成等各个方面。但是,从对整个处理系统的作用来说,无论是口语翻译系统,人机对话系统,还是文摘抽取和生成等自然语言处理系统,其重要意义是不言而喻的。

作者认为,句子改写首先应该满足以下三个基本条件:

改写前后的句子使用同一种语言;

改写前后的句子具有相同的语义;

改写后的句子应尽量比改写前的句子简化。

要满足第一个条件十分简单,关键是如何实现第二条和第三条。我们认为,根据实现手段的不同,句子改写方法大致可以采取如下几种:

66 Chengqing Zong, Yujie Zhang, Kazuhide Yamamoto, Masashi Sakamoto and Satoshi Shirai

(1) 词汇级基于同义词替换的改写方法。该方法只是在词汇级进行同义词替换,并不改变句子结构。例如:

Ex.1 我想预定房间。

?我要预定房间。

?我打算预定房间。

但是,从口语翻译的角度看,该方法似乎并不实用,因为,同义词替换并不改变原来句子的结构,几乎不能为翻译模块减轻任何分析上的负担,反而增加了系统的复杂性。

(2) 句子级基于模板的改写方法。基于模板(pattern)方法的基本思想是,从大量收集的语料中统计归纳出固定的模板,系统根据输入句子与模板的匹配情况,决定如何生成不同的表达形式[14]。如:

Ex.2 模板:X1/PN 想/VV 去/VV X2/VV X3/NN?

? |- X1/PN 想/VV 去/VV X3/NN X2/VV

|- X3/NN X1/PN 想/VV 去/VV X2/VV

输入:我想去看看南大门。

输出:我想去南大门看看。

南大门我想去看看。

该方法的特点是易于实现,而且处理速度快,但问题是模板的通用性难以把握,如果模板设计的过于死板,则难以处理复杂的句子结构,而且,能够处理的语言现象将受到一定的约束。如果模板设计的过于灵活,往往产生错误的匹配,而且导致系统的生成能力太强,有时一个句子竟然能够生成上百个甚至几百个不同的表达。这对于翻译系统来说是不现实的。

(3) 统计改写方法。类似于统计翻译方法,语句改写也可以用统计方法来实现。实际上语句改写是翻译的一个特例,也就是把两种语言之间的统计转换变成同一种语言内的表达方式转换。该方法可以避免手工编写和修正系统所需要的规则等麻烦,而且易于实现机器学习。但是,象建立统计翻译系统一样,首先必须收集大量的语料并进行标注,这往往给系统实现带来较大的困难。

(4) 基于句子分析和语言生成技术的改写方法。该方法的出发点是在句法分析和语义分析的基础上,利用自然语言生成技术,产生输入语句的其它表达形式。我们认为,该方法可以不受事先收集的语料规模的限制,而且系统可以把输入句子的解析结果直接传给后面的翻译模块,从而避免很多重复的处理。并且,该方法中的句子生成是在分析结果的基础上进行的,从某种意义上说,生成是在分析的指导下实现的,因此,改写生成的句子更有可能具有良好的句子结构。基于这种考虑,我

?本文中引用的词性标记参阅Fei Xia “The Part-of-Speech Tagging Guidelines for the Penn Chinese Treebank (3.0)”,https://www.doczj.com/doc/9d8043872.html,/ctb/。

Chinese Utterance Paraphrasing for Spoken Language Translation 67

们在这种方法的基础上提出了基于输入句子特征提取的汉语口语语句改写方法[17]。该方法首先利用口语分析技术提取输入句子的主要特征,包括句型,时态,关键词,句法成分等,然后,根据分析结果,利用多种生成方法产生输入句子的其它表达形式。

4.基于特征提取的汉语语句改写方法

该方法的主要思想可以归纳为如下几点:(1)对复杂长句进行切分;(2)进行可改写成分和不可改写成分的识别与标记;(3)对各个部分进行chunk 分析,并分析chunk之间的依存关系;(4)抽取语句的主要特征信息,包括语句类型,时态,句子属性(原因,条件等)等;(5)根据分析结果,填充表示框架;(6)根据框架表示生成各种可能的表达方式。以下详细介绍部分主要模块的实现方法。

4.1 复杂长句切分

复杂长句切分是机器翻译研究中的一个难点之一。这里我们所说的复杂长句一方面指句子本身结构的确复杂、表达较长的句子,另一方面指由于语音识别机制无法从声学层次断定口语对话过程中的句子边界,而导致两个或多个简单句子粘合在一起的情况。这里我们提出三种方法对汉语口语中的复杂长句在不同层次上进行切分。

(1) 利用关键词对语句进行浅层切分。根据笔者对旅馆预定领域64480个对话语句的粗略统计,大约有48.6%的语句为疑问句,11.9%的语句为请示句。而在疑问句中,绝大多数都是以“吗”、“呢”或“吧”作为句子的结束标志。另外,从收集的语料中我们还抽取了其它一些标志句子结束或开始的关键词,如:“如果…的话”,“因为”,“所以”,“但是”等。利用这些关键词我们初步设计了14条浅层切分规则作为长句切分的第一类规则。

(2) 分词和词性标注后对语句进行中层切分。在输入句子被分词和词性标注后(在口语翻译系统中,语音识别模块输出的结果是已经经过词语切分的单词序列),我们根据句子表达特点利用汉语词性设计了句子切分的第二类规则。例如:# IJ || (1)

# 太 VA 了 || (2)

上面第(1)一条规则表示口语语句中的问候语将被单独切分出来作为一个独立的句子单位,如“你好”,“再见”等;第(2)条规则中的VA是形容词,这条规则表示类似“太贵了”,“太小了”等表达方式,均被切分为独立句子单位。

68 Chengqing Zong, Yujie Zhang, Kazuhide Yamamoto, Masashi Sakamoto and Satoshi Shirai

(3) 句法分析后,对语句进行深层次切分。深层次切分是指系统根据句子成分分析的结果确定句子边界。详细情况请参阅本文4.4节。

我们利用30个长句对系统的长句切分模块进行了初步测试。30个长句中共含有77个简单句或独词句,平均每个语句中含有2.57个简单句。结果有12个语句没有被切分,18个语句被切分成了54个简单句。其召回率为59.2%。其中,错误切分的主要原因出自深层次切分。

4.2 数词和时间词Chunk的预处理

在汉语口语表达中,表达方式、词序等都非常随便,但是,要保持原句的语义不变,有些信息是不能改变的,如电话号码,时间,价钱等。而且在很多特定的领域内,涉及数字的成分(包括时间、价格等)其出现频度相当高。根据我们对旅馆预定领域64480个语句的粗略统计,大约有21.98%的语句含有数词和时间词。更重要的是,时间词和数词在汉语句子中根据不同的语境可以充当不同的句子成分。如下面的例子:

A) 三个单人间。(定语)

B) 单人间三个。(谓语)

C) 九月十号星期一。

主语谓语

D) 九月十号我在办公室。(状语)

E) 我的电话号码是五零五三。(宾语)

从这些例子中我们可以看出,如果数词和时间词不做处理或处理不当,必然会给后面的句法分析等造成很多麻烦。尤其象例句C)中的情况,在汉语口语表达中十分普遍。如果不做任何识别和预处理,这两个时间短语很容易被如下规则:NT NT ? NP

归约为名词短语NP。因此,在我们的方法中,时间词和部分数词短语在句法分析之前首先被识别出来并被标记,然后系统把这些成分作为不可变成分保留到改写后的表达语句中。这些不变成分主要包括以下几种:

(1) 时间、日期:例如,2000年6月26日、下午两点钟、星期六上午,6点到8点等。

(2) 价格:例如,每天138元,每人120美元等。

(3) 数量词:例如,三天、两小时、第八层、403号等。

(4) 电话号码:例如,0774951301,62557788转3456。

这四类词作为本系统中的第一类chunk。该类chunk又可以分成两小类,其中,上述(1)(2)(3) 类作为第一小类,该小类chunk内除数字外允许做同义词替换,如:

Chinese Utterance Paraphrasing for Spoken Language Translation 69

“星期六上午”可以替换成“周六上午”或”礼拜六上午”;“每天138元”可以以替换成“一天138元”等。上述第(4)类作为第二小类chunk,该小类不做任何改动。

第一类chunk的识别是通过有限状态转换机(finite-state transducer, FST)实现的。我们用61个语句(含100处时间词和数词)FST进行了初步测试。测试结果如下表所示:

表1. FST 测试情况

类型 A B C D 数量61 16 15 1 比率(%) 65.6 17.2 16.1 1.1

表中A、B、C分别表示数词和时间词能够被完全正确处理、不做任何处理和部分处理但不引起任何错误三种情况。从表中我们可以看出,A、B、C三种情况约占98.9%,而不处理的时间词或数词不会对句法分析器产生任何不良影响。错误处理的仅占1.1%,其主要原因是由于对歧义词的错误识别引起的。如“十号”在处理语句中本来指“十号房间”,结果误识成了时间词。

4.3 其它Chunk的分析识别

第一类chunk识别后,系统进行第二类chunk的分析识别。第二类chunk主要指由名词短语(NP)、动词短语(VP)和介词结构(PP)组成的组块。有关这方面的研究已有很多人做过大量有益的工作[15, 19, 20],本文不想就此过多地讨论。在我们的系统中,使用了基于概率上下文无关文法PCFG (Probabilistic Context Free Grammar)规则的Chart 分析算法。规则的表示形式为:

A →α /P

其中,P为规则引用的概率,满足条件:

∑i P(A→αi) = 1

假定任意一个输入语句Utter i,经过第一类chunk识别后被分割成了n个部分,那么,系统将对每一部分进行NP, VP 和PP短语的分析识别。在我们实现的Chart 分析算法中,每次仅扩展前5个候选路径,候选路径的排序原则为:

(a) 较长短语优先被扩展;

(b) 节点少的短语优先被扩展;

(c) 概率大的短语优先被扩展。

需要指出的是,在本文第一部分中我们曾经提到,汉语口语的句子结构与书面语相比有较大差异,实际上经过分析我们发现,这种差异主要表现在句子的结构上

70 Chengqing Zong, Yujie Zhang, Kazuhide Yamamoto, Masashi Sakamoto and Satoshi Shirai

和词汇(短语)的次序上,而对于短语本身的组成规律而言,并没有什么大的差异。因此,我们直接采用了从宾夕法尼亚大学(University of Pennsylvania, UPenn)标注的中文树库Treebank中提取的短语规则,经过简单的调整和精简后,最终保留了244条PCFG规则。

我们用含有89处时间词和数词的54个语句分别对时间词和数词预处理前后的两种情况对Chart分析算法进行了测试,短语识别器的正确率分别为83.1%和89.6%。也就是说,时间词和数词预处理后比时间词和数词不做任何预处理时,短语识别器的正确率提高了 6.5%。

4.4 依存关系分析

经过chunk识别后,系统进行chunk之间的依存关系分析和成分识别。文献[15]和[19]在这方面做过很多深入的研究。考虑到本文的目标是句子改写,而不是翻译,因此,我们对依存关系的分类并没有象[15]和[19]那么详细。在我们的系统中,谓语与其他成分的依存关系划分为9类:主语关系,数量关系(Quantity),补语关系(Complement),直接宾语,间接宾语,状语,连动关系(Sequential Verb, SV)3,兼语(Pivot word, PW )4和兼语补语(Complement of pivot word, CPW)。

句子谓语有如下几种可能:1) 动词短语;2) 时间词短语; 3)数词短语;4) 名词短语。其中,名词短语仅指极少数情况。系统判断谓语成分时,按照从1)到4)的顺序可能性依次降低。

动词类型划分为如下五种:(1) 不带宾语的动词,如:休息,逃跑;(2) 仅能带一个宾语的动词,如:写,吃;(3) 可以带双宾语的动词,如:给,打;(4) 可以带句子宾语的动词,如:想,听说;(5) 可以带兼类宾语的动词,如:让,请等。

谓语一旦确定以后,系统将根据不同情况决定句子其它成分。例如,如果只有一个候选谓语时,主语,状语将在谓语左边断定,而其它成分在谓语右边确定。如果有多个候选谓语时,系统将分情况处理[17]。句子边界将根据谓语可能的辖域决定。例如,如果谓语动词,不能带宾语时,句子将以谓语动词为边界。如果谓语动词仅能带一个宾语时,句子边界将断定在宾语处。依此类推。

需要说明的是,这里我们所说的谓语在实际系统运行时,可能与句子真正的谓语有所差异,主要是因为汉语句子中的谓语动词识别往往是十分困难的,特别是存在兼语、连动或复合句等情况,例如:“我想预订两个单人间需要多少钱”,在这个语句中有两个动词短语“预订”和“需要”,系统分析时可能无法断定哪一个是谓语,因此,这种情况下,这两个动词可能均被视为谓语,于是,这个语句就被切分成两个子句“我想预订两个单人间”和“需要多少钱”。由于这些句子是处于整

3例如, 他拿了钥匙上楼了。

4例如, 我选他当主席。

Chinese Utterance Paraphrasing for Spoken Language Translation 71

个对话环境中的,因此,我们认为即使切分不准确,一般也不会对听话人的理解产生太大的影响。

本文第五部分给出了对依存关系分析器的测试结果。

4.5 框架表示

分析语句如果被切分成n ( n ≥ 1 )个简单句子和短语,则每一部分的分析结果将被填写到一个框架里。我们设计的框架主要由两部分构成:(1)主属性 (Head):反映语句的整体特征,包括句子类型(疑问句,陈述句,问候语和简单回答习语),句子属性(原因,转折等),时态和关键词;(2)特征值(Body):反映构成语句主要成分的具体特征。如图2所示。其中,特征值又有主特征值和子特征值(Sub-Body)之分,如果句子宾语是一个子句,那么宾语子句的特征值就是原来整个句子的子特征值。主特征值中的直接宾语通过一个指针指向子特征值框架。子特征值与主特征值具有相同的的槽结构(slot)。

Head: Type {Interrogative/Declarative/…}

: Keywords {Word1/Positon, …}

: Tense {Present/Past/…}

: Attribute {Condition/…}

Body: Subject;

: Adverbial1 / Adverbial2…;

: Predicate;

: Object1 ? {Sub-Body};

: Object2;

: Quantity;

: Complement;

: PW;

: CPW;

: SV1 / SV2;

图2. 框架结构

其中,PW,CPW,SV1和 SV2的含义见本文4.4部分中的说明。系统框架除了上述两个主要部分外,另外还有一个附加信息表,用于标识分析语句中的可改写成分和不可改写成分。

4.6语句改写生成方法

72 Chengqing Zong, Yujie Zhang, Kazuhide Yamamoto, Masashi Sakamoto and Satoshi Shirai

基于上述框架表示和输入语句本身,系统将通过如下四种不同方法生成输入语句的其它表达形式。

(1)通过变换状语位置改写输入语句

在汉语表达中,状语的位置在一定的范围内可以改变位置,而一般对句子的意思并不产生任何影响,尤其是时间状语和地点状语。例如,

Input:昨天晚上我按要求把帐结了。… (I-1)

分析结果:{昨天晚上} {我} {按要求} {把帐} {结了}

这里“”是“把”字结构,表示对象的状语。时间状语和“”表示的方式状语可以多次变换位置,于是可以得到如下句子:

(O-1) 我按要求昨天晚上把帐结了。

(O-2) 我昨天晚上按要求把帐结了。

(O-3) 按要求昨天晚上我把帐结了。

(O-4) 昨天晚上按要求我把帐结了。

(2) 通过变换疑问句表达方式改写输入语句

本方法是直接依据原输入语句和分析后得到的句子类型信息,利用特定模板实现句子改写。例如,模板:

有没有X ?有X 吗 | 有X 没有 | X有没有

这里X 为名词短语。该模板将输入语句“有没有双人间”改写为“有双人间吗”,“有双人间没有”,“双人间有没有”。

(3) 通过基于短语的模板变换输入语句

由于输入语句在被改写之前,分析器已经对其进行了短语分析和其它特征提取,因此,根据分析结果我们设计了若干改写模板。例如:

我想要个VA 点儿的NP

?最好给我个VA 点儿的NP

?我希望给我个VA 点儿的NP

?能给我个VA 点儿的NP吗

?能不能给我个VA 点儿的NP

……

这样,改写模块根据输入语句的关键词和短语与模板的匹配情况,对原语句进行改写替换。

(4) 利用框架主属性值改写语句

Chinese Utterance Paraphrasing for Spoken Language Translation 73

该方法的基本思想是,利用框架中的主属性值对输入语句的各个成分分别进行解释,通过多个简单句子描述原输入句子的含义。例如,输入语句(I-1)被解析后得到如下主属性值:

= Declarative;

= {我/2,结/7,帐/6};

= Past;

= Null;

通过解释改写后得到如下输出:

(O-1) 我结帐了。

(O-2) 昨天晚上我结帐了。

(O-3) 我按要求结帐了。

设计本方法的主要目的是考虑到长的输入语句有可能无法与固定模板匹配,而长句切分也有可能产生错误的切分结果。但是,一般来说,部分信息总有可能被提取出来,如时间状语,“把”字结构隐含的对象,关键动词等。这样,利用这些信息对各个成分分别解释可以提高部分生成正确的可能性,从而保证解析失败时,翻译系统仍然可以得到部分正确的翻译结果,以达到提高翻译系统鲁棒性的目的。

5. 试验结果

在我们目前的实验系统中,使用的PCFG规则有244条,句型识别规则43条,浅层长句切分规则14条。系统词典规模为6500个汉语词条,这些词条主要是从收集的64480个口语对话语句(主要是旅馆预定或旅游信息咨询领域)中提取出来的。测试语句是100个完全真实的口语对话语句,含107个简单句。本测试没有与语音识别模块连接,所以,输入为完全正确的文本,采用简单的正向最大分词方法(FMM)。如下是实验系统测试的初步结果。

(1) 句法成分分析器测试情况

测试标准是只有当输入语句的所有句法成分被全部解析正确时,该解析结果算正确,否则,即使有一个成分被解析错误,该解析结果就算错误。最后结果是61个简单句的句法成分被解析正确,正确率为57%。46个简单句的句法成分被解析错误,约占43%。解析错误的主要原因有如下三种:(A) 分词错误;(B) 短语分析结果错误;(C) 依存关系分析失败。表2给出了三种情况的分布比率。

74 Chengqing Zong, Yujie Zhang, Kazuhide Yamamoto, Masashi Sakamoto and Satoshi Shirai

表2. 成分解析错误原因分布情况

原因分词短语识别依存分析

个数 4 38 4

比率 (%) 8.7 82.6 8.7

从表中我们可以看出,短语分析产生的错误是导致成分分析错误的主要原因。

(2) 系统改写生成情况

输入的107个简单句有60个句子没有被改写,47个被改写的简单句生成了90个句子。根据输出质量,我们将改写后的句子划分成A, B, C三类,A类是生成的符合汉语语法、表达自然的句子;B 类是可以理解、能够接受的句子;C类是错误的、难以理解的句子。三种类型的输出分布情况如下:

表3. 改写生成结果统计情况

类型 A B C

个数56 14 20

比率 (%) 62.2 15.6 22.2

统计结果表明,大约有77.8%的改写结果是正确的或可以接受的。值得注意的是,46个句法成分被解析错误的句子,仍然被改写生成了48个句子,其中,有29个是正确的或可以接受的句子。如下表所示:

表4. 解析无关的改写生成结果统计

类型 A B C

个数22 7 19

比率 (%) 45.8 14.6 39.6

表4中A、B两类约占60.4%左右。由此可以看出,即使输入语句被解析错误时,改写模块仍然有可能得到相当数量的正确结果。

6. 结语与下一步的工作

尽管句子改写研究不是刚刚提出的新课题,但是,将其应用于口语自动翻译系统,却是刚刚开始的事情,许多问题有待于进一步探讨。笔者认为,在口语翻译系统中的改写方法,应该区别于后面的分析翻译机制,因为如果两者采用同样的分析技术,无论是基于规则的分析方法,还是基于HMM的统计方法,必然有些工作是

Chinese Utterance Paraphrasing for Spoken Language Translation 75

重复进行的,而且前端处理不了的问题,后端仍然无法解决。这样,更有理由将前端改写模块与后续的分析翻译模块合并为一个模块。另一方面,从改写模块与后续翻译模块的数据交换角度考虑,改写模块应该保留中间分析结果,如词性信息、短语结构信息,时态信息等,并把这些信息提供给翻译模块,这样才真正有助于减少整个系统的处理工作量。

从目前情况来看,语句改写面临许多困难的问题,这些问题集中体现在如下几个方面:

提高系统的短语解析能力,尤其是面向口语处理的鲁棒性;

研究如何提高句子生成的正确率。原则上讲,改写后的句子应该比输入句子更合乎语法逻辑,表达方式更自然,而不是更糟。

研究如何简化句子的结构。因为本改写模块的最终目的是提高口语翻译的正确率和鲁棒性。因此,改写后的句子理论上应该比输入句子的结构更简

化,更有利于翻译模块分析和翻译,尤其应该避免歧义结构。

改写结果的评价问题,尤其是改写前后句子语义的一致性检查。

总起来说,语句改写研究对于口语自动翻译和其它相关工作具有积极的意义。但是,也面临许多新的困难和挑战。本文工作仍在进行中,有关技术和实验结果将在以后的论文中详细介绍。

致谢作者衷心地感谢日本德岛大学任福继教授、日本ATR-SLT的大竹清敬博士和姚兰女士在本文工作中提供的帮助。

参考文献

[1]Boguslavsky, Igor, Nadezhda Frid et. al. Creating a Universal Networking Language

Module within an Advanced NLP System. Proc. Coling’2000. pp. 83-89.

[2]Carroll, John A. Statistical Parsing. In Handbook of Natural Language Processing.

Marcel Dekker, Inc. 2000.

[3]Chandrasekar, R., Christine Doran, and B. Srinivas. Motivations and Methods for Text

Si,plification. In proceedings of the 16th COLING. 1996. pp. 1041-1044.

[4]Dras, Mark. Representing Paraphrasing Using Synchronous TAGs. In proceedings of

the 35th Annual Meeting of the Association for Computational Linguistics (ACL), 1997. pp. 516-518.

[5]Dras, Mark. A Mets-Level Grammar: Redefining Synchronous TAG for Translation

and Paraphrase. In proceedings of the 37th Annual Meeting of the Association for Computational Linguistics (ACL), 1999. pp. 80-87.

76 Chengqing Zong, Yujie Zhang, Kazuhide Yamamoto, Masashi Sakamoto and Satoshi Shirai

[6]Kondo, Keiko, Satoshi Sato and Manabu Okumura. Paraphrasing by Case Alternation

(in Japanese). Information Processing Society of Japan (IPSJ) Journal. Vol. 42, No.3, March 2001. pp.465-477.

[7]Mckeown, Kathleen R. Paraphrasing Questions Using Given and New Information.

American Journal of Computational Linguistics. Vol. 9, No.1, Jan.-Mar. 1983.

[8]Meteer, Marie, Varda Shaked. Strategies for Effective Paraphrasing. Proc.

Coling’1988.

[9]Ramsay, Allan and Helen Seville. Understanding English Word Order. Proc.

Coling’2000. pp. 663-669.

[10]Samuelsson, Christer, Mats Wiren. Parsing Techniques. In Handbook of Natural

Language Processing. Marcel Dekker, Inc. 2000.

[11]Sato, Satoshi. Automatic Paraphrase of Technical Papers’ Titles (in Japanese).

Information Processing Society of Japan (IPSJ) Journal. Vol. 40, No.7, July 1999.

pp.2937-2945.

[12]Yamamoto, Kazuhide, Satoshi Shirai, Masashi Sakamoto and Yujie Zhang. S ANDGLASS:

Twin Paraphrasing Spoken Language Translation. Proc. ICCPOL’2001, Seoul, Korea.

pp.154-159.

[13]Yamamoto, Kazuhide. Machine Translation by Interaction between Paraphraser and

Transfer. To appear in Proc. of Coling 2002. Aug. 2002, Taipei.

[14]Zhang, Yujie, Kazuhide Yamamoto, Chengqing Zong and Masashi Sakamoto.

Paraphrasing Utterances by Reordering Words Using Semi-Automatically Acquired Patterns. To appear in proceedings of NLPRS. Nov., 2001, Tokyo, Japan.

[15]Zhou, Ming. A Block-Based Robust Dependency Parser for Unrestricted Chinese Text.

Preceedings of the Second Chinese Language Processing Workshop. Oct., 2000. pp.

78-84.

[16]Zong, Chengqing, Hua Wu, Taiyi Huang and Bo Xu. Analysis on Characteristics of

Chinese Spoken Language. In Proceedings of the 5th Natural Language Processing Pacific Rim Symposium (NLPRS). Beijing, China. October, 1999. pp. 358-362.

[17]Zong, Chengqing, Yujie Zhang, Kazuhide Yamamoto, Masashi Sakamoto and Satoshi

Shirai. Approach to Spoken Chinese Paraphrasing Based on Feature Extraction. In Proceedings of the 6th Natural Language Processing Pacific Rim Symposium (NLPRS).

November, 2001. Tokyo, Japan. pp.551-556.

[18]宗成庆,黄泰翼,徐波. 口语自动翻译系统技术评析.中文信息学报.Vol.13,

No.2,1999. pp.56-65.

[19]周明.中-日机器翻译系统J-北京. 计算语言学论文集. 清华大学出版社, 1999,

11。pp.312-319.

[20]周强.汉语组快分析算法. 计算语言学论文集. 清华大学出版社, 1999,11。

pp.242-247.

Chinese Utterance Paraphrasing for Spoken Language Translation 77 Chinese Utterance Paraphrasing for Spoken Language

Translation

Chengqing ZONG+*, Yujie ZHANG*5, Kazuhide YAMAMOTO*,

Masashi SAKAMOTO* and Satoshi SHIRAI*

cqzong@https://www.doczj.com/doc/9d8043872.html,

+National Laboratory of Pattern Recognition, Institute of Automation, CAS.

P.O.Box 2728, Beijing 100080, China

{yujie.zhang, kazuhide.yamamoto, masashi.sakamoto, satoshi.shirai}@atr.co.jp *ATR Spoken Language Translation Research Laboratories

2-2-2 Hikaridai Seika-cho Soraku-gun Kyoto 619-0288, Japan

Abstract:In a spoken language translation system, when the input utterance can’t be successfully parsed and translated, if the system can provide the other possible expressions of the input, it will be very helpful to improve the performance of the translation system. This paper introduces an approach to paraphrasing Chinese utterances. In this approach, an input utterance is first analyzed in terms of phrase structure, dependency of chunks, etc., by using multiple methods. Then, the main features of the input utterance are extracted, and the extraction results are represented by a frame. Finally, other possible expressions of the input are generated based on the analysis results by different methods. Preliminary results are shown in the paper.

Keywords: Utterance paraphrasing, Spoken language translation, spoken language parsing

5Now she is working at the Communications Research Laboratory (CRL) of Japan at the same address as given above, and her new e-mail address is:

yujie@crl.go.jp.

词根lecture 1

1.ag,act[L] = to do or drive________ *agent_______________________ *agency______________________ *agenda___________________ agile________________________ agitate___________________ *act___________________ *actor___________________ *actress___________________ acting___________________ re-act___________________ overact___________________ *action___________________ actionable___________________ *active___________________ *activate___________________ activism___________________ activist___________________ *activity___________________ *actual___________________ actuate___________________ *exact___________________ *react___________________ *reaction___________________ *reactive___________________ *interact___________________ *interaction___________________ *interactive___________________ transact___________________ *transaction___________________ 2.am(at)[L] = to love_____________ amiable___________________ *amateur [??m?t?(r)]_____________ amateurism___________________ amateurish___________________ amicable___________________ amicability___________________ amour___________________ amorous___________________ enamor___________________ enamored___________________ amatory___________________ 3.anim[L]=life__________________ *animal___________________

银行流水单翻译词汇(汇总)

中国各大银行名称缩写 中国建设银行——CCB(China Constuction Bank) 中国农业银行——ABC(Agricultural Bank of China) 中国工商银行——ICBC(Industrial and Commercial Bank of China) 中国银行——BOC(Bank of China) 中国民生银行——CMBC(China Minsheng Banking Co., Ltd) 招商银行——CMB(China Merchants Bank Ltd) 兴业银行——CIB (Industrial Bank Co., Ltd) 北京市商业银行——已经改名北京银行——BOB(Bank of Beijing) 交通银行——BCM(Bank of Communications) 中国光大银行——CEB(Chian Everbright Bank) 中信银行——(cvbnm` 广东发展银行——GDB(Guangdong Development Bank) 上海浦东发展银行——SPDB/SPDBank(Shanghai Pudong Development Bank) 深圳发展银行——SDB(Shenzhen Development Bank)

中国银行新线借记卡历史交易明细清单 Debit card transaction details history list 交易区间:2012/06/01 至2012/12/01 Trading range: to 打印日期:2012/12/17 打印网点: 11111 打印柜员:33333 Print date: Print branches:Print teller: 账号:1222222222 客户号:9999999 Account number: Customer number: 账户名:王三 Account name: WANG SAN 开户日期:2012/01/04 开户行:88881 Account opening date: Deposit bank: 产品大类:5500 产品子类:1999 Product Line: Subclass: 起息日:2012/01/12 到期日: Value date: Expiry date: 存折号:货币号: Bankbook number: Currency number: 交易日网点交易代码货币号交易金额交易余额摘要Trade date Branches Trade code Currency number Transaction amount Account balance Abstract 交易类别对方账号 Trade type Reciprocal account number

汉语口语速成提高篇模拟题(一)

《汉语口语速成》提高篇模拟题(一) 一、填空 (一)用合适的词语填空(8分) 容易、对了、主意、熟悉、口味、报废、一时、追求 1、我是新疆来的,对这里的环境我一点也不。 2、,今天我得去医院呢。 3、看来这个餐厅的菜都不合你的。 4、这个不错,我怎么就没有想到。 5、用了几十年了,这些机器该了吧。 6、说起来做起来难啊 7、上海的年轻人时髦,情调。 8、我想不起来把护照放在哪儿了。 (二)用恰当的词语替换名中划线的部分(8分) 1、他马上明白了老师的意见。() 2、欢迎你有空儿去我家玩。() 3、我是一个知足的人。() 4、车费我们俩一人付一半,怎么样?() (三)用“宁可…也,一方面…一方面,时…时,就拿…来说”词语填空(8分) 1、电视的声音大小。 2、汉字太难学了,汉字吧,我觉得跟天书一样。

3、老师希望你们要好好学习,要注意身体。 4、我不睡觉要干完这个工作。 二、用规定的词语组句(6分) 1、用“一旦…就”把下列所给出的词组成一个句子。 喝酒戒掉 2、用“越…越”把把下列所给出的词组组成一个句子。 这个菜吃喜欢 她减肥胖 三、用规定的词语改写句子(15分) 1、经济发展了,社会问题也越来越重。(随着) 2、现在最大的问题是我们没有钱。(关键) 3、他生病了还来上班。(照样) 4、你这样下去早晚会出事的。(非…不可) 5、没想到学校里有这么好的宾馆。(居然) 四、完成句子(23分) (一)、用定的词语完成句子(15分) 1、他把护照放在外衣口袋里,。(结果) 2、他想劝她别伤心了,可是没想到她。(反而) 3、下雨了,。(幸亏) 4、结婚后和父母生活在一起,(免不了) 5、他的汉语非常好,。(可以说)

中国文化相关词汇英文翻译

中国文化相关词汇英文翻译 元宵节:Lantern Festival 刺绣:embroidery 重阳节:Double-Ninth Festival 清明节:Tomb sweeping day 剪纸:Paper Cutting 书法:Calligraphy 对联:(Spring Festival)Couplets 象形文字:Pictograms/Pictographic Characters 人才流动:Brain Drain/Brain Flow 四合院:Siheyuan/Quadrangle 战国:Warring States 风水:Fengshui/Geomantic Omen 铁饭碗:Iron Bowl 函授部:The Correspondence Department 集体舞:Group Dance 黄土高原:Loess Plateau 红白喜事:Weedings and Funerals 中秋节:Mid-Autumn Day 结婚证:Marriage Certificate 儒家文化:Confucian Culture 附属学校:Affiliated school 古装片:Costume Drama 武打片:Chinese Swordplay Movie 元宵:Tangyuan/Sweet Rice Dumpling(Soup) 一国两制:One Country,Two Systems 火锅:Hot Pot 四人帮:Gang of Four 《诗经》:The Book of Songs 素质教育:Essential-qualities-Oriental Education 《史记》:Historical Records/Records of the Grand Historian 大跃进:Great Leap Forward(Movement) 《西游记》:The Journey to the West 除夕:Chinese New Year’s Eve/Eve of the Spring Festival 针灸:Acupuncture 唐三彩:Tri-color Pottery of the Tang Dynasty/The Tang Tri-colored pottery 中国特色的社会主义:Chinese-charactered Socialist/Socialist with Chinese characteristics 偏旁:radical 孟子:Mencius 亭/阁:Pavilion/Attic 大中型国有企业:Large and Medium-sized State-owned Enterprises 火药:gunpowder

汉语口语课教学的方法与技巧

汉语口语课教学的方法与技巧 一、韩国学生汉语口语表达的特点及存在的问题 (一)学习认真、口语表达比较严格遵循语法规则,语句较为规矩。韩国学生学习目的比较明确,大部分学生态度语言点。因此学生在口语表达中注重遵守语法规范,说说语句较为严格地模仿老师或教材上的例句。 (二)口语表达滞后。韩国学生由于有汉字基础,以及受传统教学方法分人影响,其读写能力较强。 (三)口语表达明显低于应有的汉语水平。 1. 部分学生口语表达缺乏流利性,对书面文字的依赖性较强。韩国学生一般都能认真准备老师布置的话题,但是从实际表现来看,学生表达时常常很紧张。由于他们汉子能力较强,所以常常过多依赖事先准备好的书面材料。因此在苦于表达时,重复、停顿的情况非常多见,影响表达的流利性。 2.一些初级汉语水平的学生,在口语交际中总是被动多余主动,消极多于积极,表现为开口率低,多采用回避策略,不愿主动发文和回答问题等。 3.语句表现上存在一些问题。一些学生由于缺乏自信,口语表达中语句水平不高,句式简单不够复杂。 (四)学生受母语影响较深。有的声母“ zh、ch、sh 、rf ”,还有韵母“ yu, e”以及声调中阳平和上声等发音没有明显改善。 二、韩国学生汉语口语表达存在问题的原因

(一)教育因素。 1. 教学方法较为传统。过去很长时间,韩国的汉语偏重于“教”,忽视“学”。教师注重知识传授,轻视技能培养。课堂以教师为中心,轻视技能培养。课堂以教师为中心,教学以知识传授为主,整个教学过程学生处于从属、被动的地位。 2. 应试思维的影响。韩国社会非常注重考试成绩,目前各界普遍认可HSK等汉语水平考试成绩。由于HSK考试在韩国开展的时间最长,影响最大,社会认可度最高,许多学生由于出于升学和找工作的需要,纷纷准备和参加HSK考试。 韩国学生以参加HSK(初、中等)考试最多,而HSK考试在题型设计上主要考查学生的语法、词汇、汉子水平,关注的是学生的听、读、写技能,而没有设计对学生的口语交际能力的考查题型。这就促使许多韩国学生放弃了口语交际的训练。 (二)文化因素。师道尊严。韩国社会有尊师重教的良好传统,教师受到普遍尊重。因此,在韩国,课堂气氛比较严肃,学生较为拘谨,教师和学生互动较少,这种状况也限制了学生课堂上口语技能的训练。 (三)性格因素。许多韩国学生课堂上内向、谨慎、好面子、自尊心较强,不太轻易表达自己的感受。上课时不轻易发言,发言也尽量少说。为避免犯错,他们常常将发言整理落实到书面,准备充分后才发言,这样虽然避免了一些临时性错误,当也影响了口语表达的即兴发挥水平和流畅性。 三、口语课堂教学环节与方法口语课是一门专项技能课,旨在培养

英语翻译常用词组汇总[1]

英语翻译常用词组汇总 be free from没有……的,不受……影响be identified as…被认为是… be known as被称做……,以……著称be known to为……所熟知 be popular with…受……欢迎 be prepared for对……做好准备 be regarded as被认为是…,被当做是… be satisfied with对……满意,满足于… be second to…次于… be sick of…对…感到厌倦 be used as…被用做… be used to…习惯于… get used to…习惯于… all of a sudden突然 all the time一直,始终 as a rule通常,照例 as far as...be concerned就...而言as to…至于…,关于… at best充其量,至多 before long 不久以后 beyond question毫无疑问 by all means尽一切办法,务必 every now and then时而,偶尔 in itself本质上,就其本身而言 sooner or later迟早,早晚 abide by… 遵守…,信守… agree with与…相一致同意…

be beneficial to… 有利于…,有益于… turn a blind eye to… 对…视而不见 by leaps and bounds飞速地,突飞猛进地 when it comes to一谈到…,就…而论 disagree with… 与…意见不一致不同意… give an opinion on… 对…发表意见 a dapt oneself to…=adjust oneself to…使自己适应于… attribute…to…把…归因于…,认为…是…的结果comment on…评论… concentrate on/upon…集中注意力于… on the contrary与之相反 convince somebody of something使某人确信某事deprive somebody of something剥夺某人某物 in detail详细地 be equipped with…装备有… in essence本质上 to…extent在…程度上 inform. somebody of something通知某人某事 lie in在于… major in主修… in the light of… 按照…,根据… on account of… 因为…,由于… in addition to… 除…之外 on (the/an) average平均,一般来说 on the basis of… 根据…,在…的基础上 at (the) best充其量,至多 on business因公,因事 in any case无论如何,总之

四级翻译词汇汇总

如何在强化阶段复习翻译,又如何在考试中夺取高分呢?我们认为:词汇和长难句是攻克翻译这座大山的不二法宝。 关注特殊词汇,学习日常生活词语 段落翻译的重点依然是词汇,特别是较为特殊的翻译类词汇,通过样卷分析,建议考生多关注一下和中国节日、历史事件、经济文化、旅游活动、社会发展等相关的词汇。大家可以关注以反映中国社会为主的一些英文杂志和报纸,例如中国日报及其网站。这份报纸的大部分内容确实超越了考生的实际水平,但考生可以学习一些涉及日常生活的词语。每天看看网站中的头条新闻,配合中文新闻的背景,就可以学到很多表达。中国日报网站下面的一个小栏目:language tips,有大量简单实用的双语文章,考生有时间可关注。同时,考生要购进一些难度不大的翻译书籍,注意中英文的切换规则。 写长难句可增加得分点 段落翻译的另一难点就是长难句的攻克,平时加大对长难句的分析,考试中才能写出精彩得分的句型。分析从句比较多的长难句,要找到句子的切分点,切分点主要有两种,一个是直接看到的,即连接词that、which、who、when等等;另外一个是潜在的,即各种动词形式,包括doing、to do(单独使用的)、done等等。 最后,注意做翻译一定要坚持两点,即打草稿和"写"。在头脑中形成的翻译不是翻译,落到纸上,仍然不一定是通顺的句子,所以,每次在做翻译时,一定要坚持把语言写出来,这样才能提

高语言组织能力。同时,长难句的翻译不是一气呵成的,要练习如何打草稿,保证不会因直接誊写出现涂改问题,通过平时的草稿练习,也锻炼下打草稿的清晰程度,避免在誊写时丢掉一些东西。 一、中国经济 企业文化corporate/entrepreneurial culture 企业形象corporate image (Cl); enterprise image 跨国公司cross-national corporation 创业精神enterprising spirit; pioneering spirit 外资企业foreign-funded enterprise 猎头公司head-hunter 假日经济holiday economy 人力资本human capital 航空和航天工业aerospace industry 飞机制造工业aircraft industry 电子工业electronic industry 汽车制造工业car industry 娱乐业entertainment industry 信息产业information industry 知识密集型产业knowledge-intensive industry 国有大中型企业large and medium-sized state-owned

中国特色文化词汇翻译

1. 元宵节:Lantern Festival 2. 刺绣:embroidery 3. 重阳节:Double-Ninth Festival 4. 清明节:Tomb sweeping day 5. 剪纸:Paper Cutting 6. 书法:Calligraphy 7. 对联:(Spring Festival) Couplets 8. 象形文字:Pictograms/Pictographic Characters 9. 人才流动:Brain Drain/Brain Flow 10. 四合院:Siheyuan/Quadrangle 11. 战国:Warring States 12. 风水:Fengshui/Geomantic Omen 13. 铁饭碗:Iron Bowl 14. 函授部:The Correspondence Department 15. 集体舞:Group Dance 16. 黄土高原:Loess Plateau 17. 红白喜事:Weddings and Funerals 18. 中秋节:Mid-Autumn Day 19. 结婚证:Marriage Certificate 20. 儒家文化:Confucian Culture 21. 附属学校:Affiliated school 22. 古装片:Costume Drama

23. 武打片:Chinese Swordplay Movie 24. 元宵:Tangyuan/Sweet Rice Dumpling (Soup) 25. 一国两制:One Country, Two Systems 26. 火锅:Hot Pot 27. 四人帮:Gang of Four 28. 《诗经》:The Book of Songs 29. 素质教育:Essential-qualities-oriented Education 30. 《史记》:Historical Records/Records of the Grand Historian 31. 大跃进:Great Leap Forward (Movement) 32. 《西游记》:The Journey to the West 33. 除夕:Chinese New Year’s Eve/Eve of the Spring Festival 34. 针灸:Acupuncture 35. 唐三彩:Tri-color Pottery of the Tang Dynasty/ The Tang Tri-colored pottery 36. 中国特色的社会主义:Chinese-charactered Socialist/Socialist with Chinese characteristics 37. 偏旁:radical 38. 孟子:Mencius 39. 亭/阁:Pavilion/ Attic 40. 大中型国有企业:Large and Medium-sized State-owned Enterprises 41. 火药:gunpowder 42. 农历:Lunar Calendar 43. 印/玺:Seal/Stamp 44. 物质精神文明建设:The Construction of Material Civilization and Spiritual Civilization

《汉语口语速成》提高篇 复习检测(二)

《汉语口语速成》提高篇复习检测(二) 一、填空题 (一)用以下词语填空 开销遍及只不过先进为难惹马虎过敏解释相处 1、我们公司__________全国各大城市,员工有近万人呢。 2、你这不是让我两头_________吗? 3、我的___________总是很大,老觉得钱不够用。 4、我_________批评他几句罢了。 5、我们学校体育娱乐__________全,而且非常先进。 6、可是我怕说了会___________他不高兴。 7、我们在一起住了三年,___________得非常好。 8、我再三向他们__________,他们才相信我。 9、怎么搞的?你总是这么_________。 10、名牌质量好,又不容易____________。 (二)用恰当的词语替换句中划横线的部分,要求不改变句意。 1、不知什么缘故,他前天被老板开除了。() 2、这些食品还能勉强维持三天。() 3、他人特别任性,谁的话也不听。() 4、我也不能一个人说了算哪。() 5、应该接受别人的批评。() 6、爸爸哪有功夫陪你玩。() (三)在括号中填上适当的词语 1、人们觉得结了婚才_______________成了家。 2、锻炼身体有___________________身体健康。 3、想开点儿!钱没了还可以再挣,你千万别想_________________。 4、最近这个孩子常常______________。 5、我们生活在一个_______________竞争和压力的时代。 6、随着经济的发展,社会将____________越来越多的问题。

二、用规定的词语组成句子 (一)用“不光……,还……”及下列词语组成句子 1、英语汉语 2、新疆西藏 (二)用“不是……就是……”及提示词组成句子 1、看不上买不起 2、读书写文章 (三)用“虽然……还是……”及提示词组成句子 1、做了原谅 2、旅游担心 三、用规定的词语改写句子 1、为了供孩子上大学,这位母亲一个人干了两份工作,非常辛苦。(宁可) 2、老板不在,我们休息一会吧。(趁) 3、他虽然没考好,可是他确实努力了。(毕竟) 4、就是有妻子,也会离婚。(恐怕) 5、两国交往增多以后,增进了两国人民的互相了解。(随着) 6、你知道这个问题最重要的部分在哪儿吗?(关键) 7、他最近睡得很少,有时只睡二、三个小时。(甚至) 四、完成句子 (一)用规定的词语完成句子: 1、真奇怪,我的病吃了那么都药也不好,不吃药了_______________。(反而) 2、这本书里的文章太难了,有的人_______________________。(甚至) 3、他出去的时候忘了锁门,_____________________________。(结果) 4、那商店的东西太贵了,一双袜子___________________________(居然) 5、____________________________________________,我想去面试。(招聘) 6、老师,____________________________________你今年多大了?(冒昧) 7、多穿点衣服_________________________________________。(省的) 8、北京好玩的地方________________________________________。(遍)

汇总《翻译》lecture1-12 阅读理解及练习答案(1)

Lecture1 III. 风洞的研究已经使汽车在减少风阻方面取得了很大的改进。当今,很多汽车的引擎盖都是弧线型的,以减少风阻。为了减少风阻,汽车的挡风玻璃设计得更加先进。汽车的前部下面安装了特制的条带以降低汽车底部的空气流动。其他一些改进包括可伸缩的大灯和减少散热格栅。一些设计师不再使用冷却器格栅;另外一些设计师为了减少风阻,打算取消挡泥板、导雨槽,甚至是汽车两侧的导流条。 Lecture2 II.紧邻脉络膜以内,位于眼球后部三分之二处是光的最终焦点,这个感光层被称之为视网膜。视网膜把目光所及的外部事物成像到这个感光层上。这个影像,就像单个薄薄的透镜影像一样,被倒射到视网膜上。眼睛放松时,它的有效焦距大约17mm,也就意味着视网膜成像与单个17mm透镜焦距的成像大小一样。在眼睛聚焦于近距离物体时,视网膜有效缩小为约14mm。 I. 1. The fundamental principles of modern communication are discussed in this paper. 2. Several simple dielectric test objects have been utilized. 3. The results obtained demonstrate that the above equation holds for all cases. 4. This scheme avoids the complexities of matrix inversion. II. 1. 本文提出了一种新的设计方法,重点放在其推导思路(guidelines of thought )上,它与以往的方法相比有不少优点。最后举例说明了该方法的应用。 2. 雷达通过无线电回波(echoes)来确定物体的存在(presence)、方向及距离(range)一台雷达机主要由六部分组成。当发射的能量碰到(strike)物体时,其一部分就反射回来,从而使接收机能接收到回波,并在荧光屏上把它转变成可见信号(visual signal)。Lecture3 失眠一般被归咎于焦虑和压力,而一项新研究表明身体染病也有可能导致失眠。研究者们对3445例患有慢性病或者处于压力中的成年人研究后发现,与严重失眠密切相关的因素依次为:压力、髋部疾病、充血性心脏病、消化系统溃疡、肺病以及背部疾病。同时,我们的生活受24小时日夜周期支配。如果24小时节律被扰乱,很多人都会感觉疲倦或者不舒服,从而引起失眠。也有些人会在连续几周失眠后生病。 用名词将下列句子的划线部分改写成主语: I. 1. A comparison of radio waves with water waves is made. 2. An analysis of the performance of his device is made in the 3. A brief introduction is given to fundamentals of a digital computer in 4. The cooling of the engine is achieved by a thermo-siphoned system. 5. Discharge of the contents of the tank is performed by a pump. 6. An increase in the thickness of the lagging will reduce the heat 7. The testing of machines by this method will entail/result in some 8. A temperature rise of 50oC [OR: A rise in/of temperature by 50oC] would result in a change in Zener voltage of 3.75%. 9. A study of these listings will greatly help the programmer in finding any errors made in writing the program. 10. A physical analysis of the diode shows that the current and voltage are related by the following equation. II. 改进下列句子使变得更简洁紧凑。 1. Using a telescope, we can see objects far away. 2. With no resistance in the circuit, the current would increase forever. 3. In these graphs the horizontal axis measures time increasing toward the right away from the vertical axis. 4. In this case electrons will possess more energy, thus increasing the brightness of the spot. 5. (Being) accurate in operation and high in speed, computers have found wide use in every field. Lecture4 II. 床头箱中包括了驱动和齿轮变速机构以及主轴。主轴夹住工作并使其以一定速度旋转。此速度的大小主要取决于工件直径

关于上好汉语口语课的一点感悟

关于上好汉语口语课的一点感悟 摘要:语音、词汇和语法是学习语言的三大要素,和学习英语一样,“听、说、读、写”也是学习汉语的基本技能。而人与人之间大多数的交流都是通过“说”这一基本要素完成的,因而口语课的重要性不言而喻。对外汉语教学的目的就是培养学生的交际能力,使他们掌握基本汉语口语。本文从目前笔者对外汉语课堂存在的问题入手,对于如何上好对外汉语口语课进行了感悟和反思。 关键词:对外汉语口语教学法 一、我对对外汉语听力课堂一些问题的感受: 这一段是我根据自己在对外汉语口语教学实践中遇到的问题来写,由于本人教学经验不多,因此在教学当中会遇到种种问题。现将遇到的问题大致归类,总结如下: 1、口语课要求学生开口说话,而这个和学生自身积极性有很大关系,有的学生 乐于表现自己,在课堂上愿意和老师与同学进行互动,因而得到了较好的学习效果;而另一些学生则出于不好意思或其他文化方面的原因,在课堂上沉默寡言,没有能够做到积极发言。导致的结果就是只有部分学生的口语能力得到了练习,而积极性未被调动起来的学生并没有得到充分的练习。从而使教学效果大打折扣。 2、教师在讲课时有的时候没有充分掌握启发、引导学生的方法,没有很好的找 到切入点,导致学生无话可说,上课气氛沉闷。换句话说就是没有能抓住学

生的兴趣点,不知道如何去组织课堂,在教学的实用性和趣味性方面做的不足。 3、由于口语学习是个循序渐进的过程,一般进步比较缓慢,有的学生看不到进 步,因而情绪上会有失落,产生挫折感,对学习失去信心。 二、关于上好对外汉语口语课的一点感想: 汉语由于其表达形式复杂多变,若想学好汉语必须有说的练习过程,而口语又是汉语中难以掌握的一部分。只要开口说,才能有充分掌握口语的希望。通过对自己说出来的话进行纠错,才能掌握汉语口语的规律,摆脱母语的干扰。以下,我想从以下几个方面来谈谈如何上好对外汉语课,帮助学生形成良好的汉语学习习惯。 1、教师的作用: 在教学中,教师是教学的组织者、活动的安排者、课堂的管理者。因此,教师首先应在教学前大致了解学生的汉语水平,了解课程的难度以及知否适应当前学生。教师要从口语课的性质和课程地位把握这门课的节奏。首先应该有一定合理的导入,对于所要讲的课给学生一个大致的轮廓,要学生知道将要讲什么,这些知识有什么用。可以通过介绍相关知识、适量的文字或图片提示来完成。在讲课阶段,首先要提供正确的语音示,这是最基本的,同时在声调、韵、语气、停顿等地方也必须严加注意。因为只有在正确的示下,学生们的练习才是有效的。可以通过多媒体动画手段来进行辅助教学。其次在解释生词的时候,最好能通过旁征博引的诱导来引导学生自己悟出生词的意思,这样记忆才会更加深刻。同时,因为是初级班,教师的语速应该比平时说话略微放慢,以方便学生理解。在总的原则上,教师只是起到辅助和引导的作用。严格来说,一堂成功的口语课,学生

金融英语lecture1money

Money If you can actually count your money, then you are not really a rich man. ——American oil billionaire J. Paul Getty What is money Economists define money as anything that is generally accepted in payment for goods or services or in the repayment of debts. Types of money A. Commodity money B. Convertible paper money C. Fiat money(or fiat currency): Usually paper money, is a type of currency whose only value is that a government made a fiat that the money is a legal method of exchange. Unlike commodity money or representative money it is not based in another commodity such as gold or silver and is not covered by a special reserve. D. Private debt money E. Electronic money Private debt money A loan that the borrower promises to repay in currency on demand. . IOU the checkable deposit at commercial banks and other financial institutions.

汉语口语速成 提高篇,语法, 整理1-10课

第一课 1、算:可以说是,可以这样认为---????-----????????. 在古北,三室一厅一个月九千块算便宜的。 今天15度,不算冷。 在我们部门,她算漂亮的。 2、尽管:随便,放心地做???+??/??(????) 今天我请客,你们尽管点。 有什么问题,你尽管和我说。 大小不合适,尽管告诉我。 3、来着:用在句尾,对以前提到的事情忘了或不太确定进行提问---??? 你叫什么来着? 老板刚刚说什么来着? 4、一下子:表示一次动作或很短的时间???/ ?????? 这个电饭锅很便宜,我一下子买了2个。 他2天没吃饭了,恨不得一下子把这么多好吃的全吃了。 5、并:并+不/没等否定词,强调实际情况和看到的、想象的不一样??,????? 别看他住别墅、开宝马,其实并不是有钱人。 韩国语看起来很简单,但是学起来并不容易。 6、对了:用在句子的开头表示突然想起来什么事情,或者作插入语表示转移话题。?? (老公要出门了)对了,我的手机没带,帮我找一下。 我女儿今年6岁了,对了,你孩子几岁了? 第二课 1、下来 从高到低?????????? 我在楼下等你,你快下来吧 动作持续到说话的时间或者过去的某一时刻 ?????????????????? 她已经尝试过好几次要减肥,可是每次都坚持不下来。 2、下去

从高到低?????????? 你男朋友在1楼等你,你快下去吧! 动作持续到将来某一时刻 为了能穿上这件衣服,不管减肥有多难,我都要坚持下去。 3、别提多……了???----- ?/???? 感冒又发烧,别提多难受了。 女儿6岁生日的时候,我们带她去迪士尼乐园,那天她别提多高兴了。 4、非……不可(?/ ???...???) 要想说一口流利的汉语,非学好发音不可。 这么冷的天,你穿这么少出去,非感冒不可。 酒后开车,非出事不可。 5、至于常用否定形式是“不至于”或者是反问句,表示事情没有严重到某个程度 ?????????? A:今天早上的报纸说:一对刚结婚没多久的小两口去商场买东西,因为意见不合,两个人要离婚了。 B:为这么点儿小事就离婚?不至于吧? 他怎么还没来?开车不至于这么慢吧? 转移到新的话题???????? 新的项目对公司来说非常重要,小王你负责这部分,小李你负责那部分,至于小张,你帮我整理一下这些材料吧。 今年的年假我打算先回家陪爸爸妈妈,至于旅游,明年再说吧。 6、千万+别/要/不要??---????. --??? 明天总部有人来检查,你千万别迟到。 公司规定周一到周五要穿正装上班,你千万不要穿牛仔裤、运动鞋。 过马路的时候千万要小心。 我有件事情想和你说,你千万别生气。 第三课 1、V惯/V不惯?????/??? 爸爸喝惯了白酒,喝不惯红酒。

文化特色英语词语翻译

总需求aggregate demand 总供给aggregate supply 企业文化corporate/entrepreneurial culture 企业形象corporate image (Cl); enterprise image 跨国公司cross-national corporation 创业精神enterprising spirit; pioneering spirit 外资企业foreign-funded enterprise 猎头公司head-hunter 假日经济holiday economy 人力资本human capital 航空和航天工业aerospace industry 飞机制造工业aircraft industry 电子工业electronic industry 汽车制造工业car industry 娱乐业entertainment industry 信息产业information industry 知识密集型产业knowledge-intensive industry 国有大中型企业large and medium-sized state-owned enterprises 轻工业light industry 博彩业lottery industry 制造业manufacturing industry 垄断行业monopoly industries 市场多元化market diversification 市场经济market economy 市场监管market supervision 购买力purchasing power 熊市bear market 牛市bull market 城镇化urbanization 房地产real estate 首付down-payment 业主home owner 个人购房贷款individual housing loan 经济全球化economic globalization 经济特区special economic zones (SEZ) 经济增长economic growth 泡沫经济bubble economy 关税tariff 纳税人tax payer 宏观经济macro economy

中国文化特色词语英译

中文摘要 特色词汇是中国研究中相当重要的一部分。中国特色词汇是表达中国文化中的特有事物,其中蕴藏着中国千百年文化的内涵,当中国的文化传出中国走向世界的时候,这些中国特色词汇又是怎样不失原味的被翻译成外语从而被外国人所接受的呢?本文将以中国特色词汇翻译成为例,介绍了一些中国特色词汇的被译成英语的方法,它们分别是音译、直译、意译等,通过这些方法可使大家基本了解中国特色词汇在英语交际是怎样被转换并被使用的,逐渐融合进传统英语中的,以满足人们日常生活中用英语交流的需要。除此之外,还将浅谈中国特色词汇所对应的特别的英文词汇出现的原因之一:中西文化差异造成的词汇空缺。并对文化差异进行细分详细阐述。还将提出一些关于中国特色词汇在英语国家传播的前景的看法。 关键词:中国特色词汇;文化差异;翻译 Abstract Chinese culture-loaded words are becoming increasingly important in the study of China English. Chinese culture-loaded words refer to the uniqueness of Chinese items, and of course, contain the connotation of Chinese culture. With the wide spread of Chinese culture to the world, how can they be understood and accepted by foreigners accurately in translation? The paper, by giving a good number of examples, introduces some methods of translating Chinese culture-loaded words, including transliteration, literal translation, free translation and so on. These methods help to understand how Chinese culture-loaded words are

相关主题
文本预览
相关文档 最新文档