基于汉英双语语料库的翻译等价单位自动获取研究
- 格式:pdf
- 大小:231.53 KB
- 文档页数:6
基于语料库的翻译教学研究
随着全球化的加速以及中外交往的不断增强,中文翻译已成为最为重
要的跨文化交流方式之一。
然而,在中文翻译教学中,传统的课堂教学方
法难以满足日益增长的翻译需求。
随着互联网和计算机技术的飞速发展,
语料库翻译成为一种新的翻译教学方式,为学生提供了更为实用和高效的
翻译实践经验。
语料库翻译是指利用大规模的平行语料库来进行翻译学习,通过分析
语料库中的句子构造、单词搭配、语法结构等,让学生了解不同语言之间
的差异和奥秘,从而提高其翻译技能。
与传统的翻译方法相比,语料库翻
译具有以下几个优点:
1.实用性强。
语料库翻译能够迅速提供学生所需的大量平行语料库,
使学生能够更好地了解翻译的实际应用情况,提高其翻译水平和适应能力。
2.掌握语言的特点和规律。
通过对语料库的分析,学生可以更好地掌
握词语的搭配和使用规则,从而更准确地把握翻译的精度和流畅度。
3.提高效率。
语料库翻译可以快速地进行批量翻译,并且能够自动检
测翻译的准确性和合理性,同时还能提供更详细的反馈和纠错建议,以帮
助学生快速修正错误。
由此可见,语料库翻译教学不仅可以提高学生的实际翻译技能,还可
以更好地帮助学生了解语言的规律和特点,从而更好地应对复杂多变的翻
译任务。
因此,未来中文翻译教学应该更多地融合语料库翻译的方法和技术,以更好地培养具有实际应用能力和创新潜力的翻译人才。
双语语料库在英汉翻译中的应用外语学院09.3班侯义茹摘要:本文介绍双语语料库的发展历程和现状及其研究价值,阐述了基于双语语料库的英汉翻译教学及研究,讨论了计算机辅助翻译的重要性和应用。
随着国与国之间密切的往来,语言获得日新月异的发展,双语语料库也以其大量的对译材料为语言和翻译研究提供了新途径,基于双语语料库开展的英汉翻译研究日益广泛和实用。
关键词:双语语料库;翻译研究;教学;语言交流The Usage of Bilingual Corpus in English - ChineseTranslationHou Yiru Class 3, Grade 09 Foreign Language DepartmentAbstract:This paper introduces the development and value of bilingual corpus. At the same time, it tells us English - Chinese translation studies based on bilingual corpus and it discusses the importance and application of computer-aided translation. With the intimate contractions between countries, languages develop day by day, so bilingual corpus open up a new way to language and translation studies. English - Chinese translation studies based on bilingual corpus is wide and practical.Key words:bilingual corpus,translation studies,teaching,language exchange一、引言“语料库几乎在语言学所有的领域引发了一场革命”。
学术期刊论文摘要汉英双语语料库构建研究-英语论文-语言学论文——文章均为WORD文档,下载后可直接编辑使用亦可打印——论文摘要指以提供文献内容梗概为目的,不加评论和补充解释,简明、确切地记述文献重要内容的短文。
(国家标准GB 47) 学术论文摘要概括论文的主要信息,对研究的目的、方法、结果和最终结论有一个比较完整的说明,对于论文的发表、收录、检索及科研人员的学术交流等起着重要的作用。
当今时代,英语已成为国际交往的世界性语言,英文学术论文摘要的重要性日益显现。
近年来,不少中外学者(如Swales1990、段平2002、滕延江2008、邓军涛2013 等) 对论文摘要的语言特点与翻译进行了比较广泛深入的分析,其成果无疑有利于该领域的实践与发展。
然而,大多数相关研究都是基于研究者个人的经验,选取的例句和掌握的语料比较有限。
不少学习者和研究人员撰写及翻译摘要的能力还比较欠缺。
鉴于此,本课题组决定建设学术期刊论文摘要汉英双语语料库,一方面从大的语料基础上客观描述英文摘要的文体特征和进行汉英翻译研究,同时将该语料库用作翻译教学平台,试验并总结数据驱动的教学方法,推动学术研究与翻译教学共同发展。
一、学术期刊论文摘要汉英双语语料库的建设(一) 语料库与双语语料库语料库是指按照一定的语言学原则,运用随机抽样方法,收集自然出现的连续语言运用文本或话语片段而建成的具有一定容量的大型电子文本库(杨惠中,2002) 。
语料库具有语料真实、丰富、代表性强以及融合了计算机技术等特点,在语言研究和教学方面具有较大的优势与应用价值。
按照语料的语种,语料库可以分成单语、双语和多语语料库。
双语和多语语料库还可分为平行语料库和可比语料库。
平行语料库收集原文与译文双语对照的文本,按设定的标准对语料进行句子或段落的对齐。
可比语料库收集具有可比性的语料,分别放置于不同的文本库,主要用于语言对比研究。
关于双语语料库的作用,不少专家从不同角度进行了探讨。
基于Babel英汉平行语料库的英汉介词对比分析王磊;许霄羽【摘要】介词是英汉两种语言中较为特殊的一类词,在实际使用中都非常活跃。
通过对英汉介词的简要阐述,在以前的研究基础上,尝试基于Babel英汉平行语料库,对其中出现频率最高的前十个英语介词和汉语介词的使用频率,兼类情况及其对应关系做以对比分析,以期对英译汉中的介词翻译能有所启示。
另外,介词在英译汉时可以采取直译、增译、省译和转译四种方法。
%Preposition is a type of extraordinary words with very active use. By general introduction to English and Chinese prepositions, based on the previous studies, this paper tries to make use of Babel English-Chinese Parallel Corpus and make a contrastive analysis on the frequency, multiple part of speech and the corresponding relationship between the top ten English and Chinese prepositions, hoping it could shed light on our English-Chinese translation. Moreover, the author points out that we can adopt four methods in doing such translation practice,including literal translation,addition, omission and conversion.【期刊名称】《辽宁医学院学报(社会科学版)》【年(卷),期】2015(000)002【总页数】4页(P126-128,132)【关键词】平行语料库;英语;汉语;介词对比【作者】王磊;许霄羽【作者单位】西北工业大学,陕西西安 710129;西北工业大学,陕西西安710129【正文语种】中文【中图分类】R194英语介词通常可以根据位置来判断,而汉语介词则主要依据其作用加以区别。
基于语言模型的中英文翻译研究随着全球化的推进,跨国交流愈发频繁,而语言交流是沟通的基础。
然而,由于不同地区的语言和文化差异,语言交流难免会遇到一些难题,尤其是在翻译上。
针对这个问题,自然语言处理和机器翻译技术的发展为翻译提供了一种新的思路。
其中,基于语言模型的中英文翻译成为了研究热点。
什么是语言模型?语言模型是自然语言处理中的重要研究内容之一,主要用于计算概率分布,表示自然语言中的词序列。
具体而言,它通过对语言现象的观察来推断语言的统计规律,并将这些规律用数学模型进行描述,从而给出某个语言序列出现的概率。
在实际应用中,语言模型可以用于词语预测、自动翻译、语音识别等方面。
其中,基于语言模型的机器翻译已经成为社会关注的热门领域。
接下来,我们将以中英文翻译为例,介绍基于语言模型的翻译模型及其应用。
基于语言模型的中英文翻译架构基于语言模型的中英文翻译模型的架构主要包括三个部分:前处理、翻译模型和解码器。
其中,前处理负责分词、词性标注、对齐等任务;翻译模型使用双语语料库进行训练,构建源语言和目标语言之间的概率转移模型;解码器负责由已训练好的模型生成目标语言句子。
在具体实现中,中英文句子经过前处理后,进入翻译模型。
翻译模型的最终目标是尽可能高效地计算源语言和目标语言之间的概率转移。
为此,翻译模型通常使用基于词典、短语和句法树等不同层次的知识表示方法。
这些层次的知识表示方法之间的互动,能够有效地解决单层次翻译模型所存在的局限性,提高翻译的准确性和流畅度。
接下来,解码器用于生成目标语言句子。
在该过程中,解码器将翻译模型生成的概率转移模型应用于源语言句子的不同部分,并根据最大概率选择最优匹配的目标语言单词。
随之而来的问题是,在翻译过程中如何避免诸如语法和词语歧义等本质性的错误。
这个问题的解决在一定程度上归结于随机漫步和束搜索算法的运用。
当解码器无法生成一个类似源语言文本的目标语言句子时,随机漫步算法可以帮助解码器得到具有启发性的解,而束搜索算法则可以更加高效地集中搜索器的时间和空间资源以改善算法性能。
第37卷第1期2021年1月(社会科学版)Journal of Shandong University of Technology(Social Sciences)Vol.37,No.1Jan.2021基于语料库的中外译者英译风格研究——以《管子》的两个英译本为例李静,任强[摘要]基于语料库的翻译研究旨在通过量化对比的方法对译文进行分析和解读。
《管子》双语语料库的英译文本取材于中国学者翟江月和美国汉学家李克的英译全本中的代表性篇章,对两位中外译者翻译策略和翻译风格的量化对比分析从词汇和语篇两个层面展开。
研究表明,由于两位中外译者翻译典籍的目的和策略不同,在译本中体现的语言风格也各具特色。
李克的译本承载信息量更大,阅读难度指数更高,句子更为靠近原文的结构,译文凸显文化的异质性。
翟江月的译本词汇难度略低,更注重译本读者的阅读感受,突出译文的明了性,译文使用了更多的功能词、定冠词和介词等,可读性更好。
[关键词]翻译风格;《管子》英译本;语料库[中图分类号]H315.9[文献标识码]A一、弓I言随着综合国力和国际竞争力的不断提升,我国日益走近世界舞台中央。
加强文化软实力建设,提高国际传播能力,讲好中国故事,构建与我国社会经济发展优势相适应的国际话语体系,则显得尤为迫切和必要。
典籍外译作为解读中国文化,促进中国文化“走出去”的一个重要窗口,日益受到国家相关部门和业界的重视,对典籍翻译的研究也逐渐成为一个新的学科发展方向。
对典籍的翻译一般由两部分人员完成。
一部分是国外的汉学家。
他们长期从事中国古典文化和经典的研究,出于研究需要或个人的热爱,翻译了大量的中国典籍。
另一部分是国内译者。
他们或是外语专业、擅长语言表达的外语人,或是非外[文章编号]1672-0040(2021)01-0072-06语专业、在某一领域具有研究专长且具有较强语言表达能力的学者。
不同身份、不同背景的译者因为各自的目的不同,在翻译典籍时所采用的策略和语言处理方式各有特点,译文所展现出来的风格也不相同。
语料库与双语对比研究报告摘要:本文介绍了语料库与双语对比研究的背景和意义,并通过对比分析中文和英文语料库的数据,探讨了语言的相似性和差异性。
研究结果表明,语料库和双语对比研究在语言学和翻译学领域发挥着重要作用,为语言学家和翻译学家提供了珍贵的研究资源和理论支持。
引言:语言是人类最重要的交流工具之一,研究语言的相似性和差异性对于理解不同文化、促进跨文化交流和翻译学的发展具有重要意义。
语料库是一种用于收集和整理大量语言样本的工具,对于研究语言的规律性和变异性、揭示语言使用的特点和趋势具有重要作用。
而双语对比研究则通过比较不同语言的语料库,深入探讨语言的异同,为翻译学研究提供理论支持。
方法:本研究以中文和英文为例,通过对比分析中英文语料库的数据,探讨语言的相似性和差异性。
首先,使用网络爬虫技术,从互联网上收集大量的中英文文本,包括新闻报道、学术论文、小说等多种文本类型。
然后,使用自然语言处理技术对这些文本进行分词、标注词性等预处理工作。
最后,通过对比分析两种语言的语料库,总结归纳出语言的共性和差异性。
结果与讨论:通过对比分析中英文语料库的数据,我们发现了一些有趣的现象。
首先,在词汇方面,中文与英文之间存在很大差异。
中文以词语为基本单位,而英文以单词为基本单位。
中文中的词语往往由两个或多个字组成,具有更高的信息密度,而英文单词则更加简洁明了。
其次,句法结构方面,中文是主谓宾结构,而英文则更加注重主语和谓语的位置。
此外,中文中的主谓宾成分可以省略,而英文则不常出现省略。
再次,在表达方式方面,中文更加注重修辞和比喻的运用,而英文则更加直接明了。
结论:语料库与双语对比研究为研究语言的相似性和差异性提供了重要的理论支持和研究资源。
通过对比分析中英文语料库的数据,我们可以更深入地理解语言的规律和特点,揭示不同语言的异同之处。
这对于语言学家和翻译学家来说都具有重要意义,可以促进翻译质量的提高和跨文化交流的发展。
然而,本研究还存在一些局限性,如仅研究了中英文之间的差异,没有涉及其他语言。
校园英语 / 高等教育研究英汉双语平行语料库在翻译教学中的运用研究哈尔滨理工大学荣成校区/夏菲菲 张祎【摘要】本文探讨了英汉双语平行语料库在翻译教学中的运用,主要是针对一线翻译教师如何自建小型语料库并在翻译课堂上予以运用,因为一线翻译教师的实践是语料库在翻译中运用最为重要的环节。
本文对于语料的准备、处理、标注和检索都进行了比较具体的总结。
尤其是对标注部分进行了重点阐述,因为这一点最能体现自建小型语料库的优势。
【关键词】英汉双语平行语料库 翻译教学 标注一、引言语料库是指在随机采样的基础上收集到有代表性的真实语言材料集合,是语言运用的样本。
兴起于上世纪60年代的语料库研究已经被广泛运用到语言研究与教学的各个领域。
然而语料库与翻译领域的结合相对较晚。
传统的翻译教学模式主要包含理论技巧讲解、举例说明和练习巩固三个步骤,该翻译教学模式仍然广泛使用在我国和很多国外的外语专业翻译课堂上,为翻译教学做出了巨大贡献,也培养了大批优秀的翻译人才。
然而该模式也存在很多问题。
首先传统翻译课堂以教师讲解为主,学生难以发挥主观能动性进行自主学习,被动接受技巧知识难以将所学知识进行内化。
同时由于课时和教材的限制,传统翻译教学无法提供大量实例供学生学习,有限的语言输入量无法帮助学生将所学知识真正内化为翻译能力。
而语料库恰好可以帮助解决传统翻译教学中学生被动学习和语料输入量不足的问题。
因为在语料库条件下进行翻译教学,学生可以采取“发现式学习和数据驱动的学习方式训练掌握翻译技巧,提高翻译技能,熟悉翻译职业特征”。
语料库分为单语语料库和双语或多语语料库。
前者主要收集本族语者的语言实例,后者顾名思义是由两种或者两种以上的语言材料组成,其中平行语料库作为能将源语言文本和其对应的译语文本进行全文检索并对照显示的语料库对翻译教学的辅助作用尤为明显。
二、平行语料库与翻译教学的研究现状平行语料库与翻译教学的结合起步较晚,国外相关的应用研究有近二十年的历史,发展较快的是西语间的平行语料库的建立。
基于双语平行语料库的翻译教学模式研究一、概述随着全球化进程的不断加速,语言作为国际交流的重要桥梁,其重要性日益凸显。
翻译作为语言转换的核心活动,不仅在跨文化交际中扮演着不可或缺的角色,而且在全球经济一体化、科技进步、文化交融等方面发挥着越来越重要的作用。
传统的翻译教学模式在很大程度上依赖于教师的个人经验和对翻译技巧的传授,这往往导致翻译教学效果的不确定性以及学生翻译能力的参差不齐。
为了提高翻译教学的质量和效率,探索一种科学、系统的翻译教学模式成为当务之急。
1. 翻译教学的重要性及其在现代教育中的地位在全球化日益加剧的今天,翻译教学的重要性愈发凸显。
它不仅是语言学习的重要组成部分,更是连接不同文化、推动国际交流的关键桥梁。
翻译教学的目标不仅仅是教授语言技巧,更重要的是培养学生的跨文化交流能力,使他们能够在全球化背景下有效地进行沟通。
在现代教育中,翻译教学占据着举足轻重的地位。
随着信息技术的快速发展,人们接触到的信息越来越多样化,翻译能力成为了获取信息、理解世界的重要工具。
现代教育体系中普遍将翻译教学纳入语言教学的核心环节,强调其在语言教育中的核心地位。
翻译教学对于培养学生的综合素质也具有重要作用。
在翻译过程中,学生不仅需要掌握语言知识,还需要理解文化、历史、社会等多方面的背景信息。
这种综合性的学习体验有助于培养学生的批判性思维、创新思维和问题解决能力,使他们在未来的学习和工作中更具竞争力。
研究基于双语平行语料库的翻译教学模式具有重要意义。
通过利用双语平行语料库这一资源丰富的工具,教师可以更加有效地进行翻译教学,帮助学生提高翻译技能,培养跨文化交流能力。
同时,这种教学模式也有助于推动现代教育的改革和发展,使教育更加适应全球化时代的需求。
2. 双语平行语料库在翻译教学中的潜在价值双语平行语料库为翻译教学提供了真实、自然的语料资源。
相较于传统的教材和教学资料,语料库中的语料更加贴近实际语言使用,能够帮助学生更好地理解和把握源语言和目标语言之间的对应关系,提高翻译的准确性和地道性。
基于语料库的文学翻译研究包括对章节文本、口语对话以及新闻文本等翻译文本的无监督自动翻译。
在文学翻译研究中,研究人员利用机器学习、深度学习和语言模型等技术,分析语料库中的文本,以获取有意义的翻译结果。
首先,研究人员建立语料库,以收集到的样本文本作为输入,并对输入的文本进行分析,以提取语料库中的结构特征、句子结构和文本语义等信息。
然后,利用机器学习算法或深度学习方法来分析它们,以自动生成翻译文本。
最后,收集语料库中的翻译文本来训练翻译模型,并使用翻译模型来生成翻译文本。
Research on literary translation based on corpus includes unsupervised machine translation of literary texts such as chapter texts, oral dialogues, and news texts. In literary translation research, researchers use machine learning, deep learning, and language models to analyze texts in the corpus and extract meaningful translation results. First, the researchers build a corpus to collect sample texts as inputs and analyze the input texts to extract structural features, sentence structures, and textual semantics information from the corpus. And then the machine learning algorithms or deep learning techniques are used to analyze them and automatically generate translation texts. Finally, the translation texts collected from the corpus areused to train the translation model and the translation model to generate translation texts.。
102020年48期总第540期ENGLISH ON CAMPUS基于语料库的翻译教学研究——以《商务英汉翻译》为例文/贾 敏【摘要】在数字信息技术迅猛发展的背景下,将语料库手段应用于翻译领域的教学改革正在逐渐兴起。
本文结合《商务英汉翻译》课堂教学中独有的商务行业特征,讨论了将语料库语计算机信息技术运用到课堂翻译教改实践中的可行性。
研究发现,学生通过观察双语语料库中大量真实的对译语料,归纳总结其所呈现的翻译策略和方法,能够提高商务语篇特定词汇及长句的翻译能力,并有利于形成课后自主学习模式。
【关键词】 语料库;对译语料;商务英语语篇;翻译策略【作者简介】贾敏(1978-),女,四川仁寿人,中国计量大学人文与外语学院,讲师,硕士,研究方向:商务翻译、话语分析教学与研究。
【基金项目】2018年中国计量大学校级教改项目:基于语料库的《商务英汉翻译》课改研究(HEX2018031)。
面的背景知识与行业术语,了解商务领域的语言特征与语篇特点,这对《商务英汉翻译》课程教学提出了新挑战。
如基础的翻译理论教学主要包括词义的选择、词类的转换、增词翻译法、减词翻译法、重复翻译法、词义引申翻译法、正说反译与反说正译法等词汇的翻译技巧;以及主语的翻译、被动语态的翻译、语序的调整、从句的翻译、分句与合句翻译法等方面的基础训练。
而商务翻译实际操作部分则包括不同主题的商务类文本如商务函电、商务合同、信用证、公示语、产品说明书、企业网站、企业简介、商务广告、等方面的篇章段落翻译。
通过课题的研究,需要学生再学期的针对性教学之后,能过掌握商务翻译的主要特征,并通过语料库计算机辅助翻译手段,完成商务类垂直领域的译后校对翻译工作。
在面对不同类型商务文本的时候,需要考虑到词汇的特殊翻译标准和翻译技巧。
如以商务合同为例,因其涉及法律法规,需要措辞严密准确以避免模棱两可,故多使用同义并列词语,如“ during the execution of the works or after their completion”“before or after the repudiation or other termination of the contract”“arise any dispute in connection with, or arising out of”等,以及使用约定俗成的hereinafter,hereby,hereof,herewith,thereinafter等古体词。
校园英语 / 翻译探究基于英汉平行语料库的翻译语言分析——以“tend to + 动词”结构为例曲阜师范大学外国语学院/邹涛【摘要】本文基于英汉平行语料库,对“tend to + 动词”结构及其汉语译文对应结构进行检索和分析。
分析结果显示:1.存在该结构与“倾向于”的对应,但不是主要形式,主要对应形式是,“tend to”对应汉语概率及频率副词修饰不定式动词对应的汉语谓语;2.与该结构对应的“倾向于”可以替换成概率副词;3.有少数零对应和对应能愿动词的情况。
【关键词】翻译语言 tend to 对应 平行语料库引言对翻译语言特征的系统描写出现在上世纪80年代至90年代。
这些方面的研究发现,译语语言通常会“偏离”(decenter)目的语而更靠向源语。
之所以出现偏离,是因为译语语言受到源语文本的干预,其中的一些语言形式明显偏离了目的语语言的一般模式。
如Blum-Kulka(1986)发现译语语言中衔接手段会受源语文本影响。
译语文本在产生过程中或多或少受到源语语言对目的语施加的影响,这样的译文语言通常被称为翻译腔。
但也有人认为,翻译语言是两种语言之间的“中间地带”。
这种处于中间阶段的语言在翻译理论中被称为“语际语”,既包含着源语的分析特征,也有目的语语篇的合成特征。
然而,对于翻译语言的研究要突破直觉和感性认识,就需要充分的语料支持。
因此,语料库语言学与描述翻译学的结合恰恰起到了推动作用。
Baker(1993)预见,语料库能收录大量源语文本及译语文本,辅以新的语料库研究方法,翻译学者能揭示译语文本的内在规律。
Tymoczko(1998)也表示基于语料库的翻译研究能使翻译学者查询并获得大量数据。
这些数据能帮助翻译学者更全面客观地描写和分析翻译语言。
随着众多英汉/汉英平行语料库的创建和应用,涌现出一批针对汉语翻译语言的研究。
其中,汉语翻译语言中词汇-句法特征受到广泛的关注。
秦洪武、王克非(2004)利用“北外通用汉英平行语料库”,发现“so…that”的主要对应形式是零对应,而非“如此……以致”等“前后对应”结构,且汉语原文中没有与“so…that”对应的固定结构;胡开宝(2009)基于莎士比亚戏剧翻译语料库,分析了“把”字句在《哈姆雷特》两个译本中的分布和应用,以及英语语句译为“把”字句的规律和特点,得出其动因分别为认知、句法和语用;胡显耀、曾佳(2010)基于“当代汉语翻译小说语料库”, “兰开斯特现代汉语语料库”及其汉语原创小说子库,分析了现代汉语翻译小说中“被”字句的使用频率及其对应结构,并指出汉语翻译语言中“被”字句体现出“传统化”的特征,即趋从和夸大汉语自身传统的趋势;许文胜、张柏然(2006)利用学英汉名著翻译语料库,对英汉因果关系连词的使用进行了对比分析;类似的研究还涉及“and”的汉语翻译、人称代词及连接词的翻译等。
基于语料库学习者汉英翻译中省译策略的初探①———兼谈对于汉英翻译测试的几点思考潘鸣威(上海外国语大学)摘要:本文以中国英语专业学习者语料库(CEM)中的翻译字库作为研究对象,从定量和定性两个角度考察了学生对汉英翻译中冗余信息运用省译策略进行处理的情况。
研究说明了学习者对于汉语冗余信息的处理上还未能熟练运用省译策略,并且实际的运用情况也较不均衡。
最后,在本研究结论的基础上,本文提出了一些对于汉英翻译测试的思考。
Abstract:Gearing the translation sub-corpus of Corpus for English Majors as the re-search target,this paper,both quantitatively and qualitatively,aims to probe intolearners'employment of omission strategy in dealing with redundant information in Chi-nese-English translation.The findings reveal learners'comparatively poor performancein resorting to omission in their translation and also indicate that their use of such strate-gy in different situations varies greatly.In the end,some reflections upon Chinese-Eng-lish translation testing are yielded based on the current research findings.关键词:省译冗余学习者语料库Key Words:omission redundancy learner corpus一、引言省译策略是汉英翻译中的一种重要技巧,其目的是为了使译文简洁,符合译入语的表达习惯和修辞特点。