基于语篇的中介语语料库回指偏误标注研究
- 格式:pdf
- 大小:212.11 KB
- 文档页数:6
基于语料库的中美英语新闻语篇立场标记语研究开题报告一、研究背景随着社交媒体和网络技术的不断发展,新闻信息的传播速度越来越快。
中美英语新闻的异质性和差异性逐渐凸显,其语言特点和立场表达方式也日益复杂。
在这种背景下,如何有效地理解和分析中美英语新闻中的语篇立场,成为了一个重要的问题。
语篇立场标记(stance markers)是用于表达说话者或作者的态度、情感、观点、偏见或政治取向的语言现象。
在新闻领域,语篇立场标记的研究具有实际应用和理论价值。
了解新闻语篇中的立场标记,可以帮助我们更准确地理解新闻事件的内涵,更好地进行新闻媒体的选择和评价。
二、研究目的和意义本研究旨在探讨中美英语新闻语篇中的立场标记,并对其进行分类和分析。
通过语料库的收集和语料分析的方法,选取中美英语新闻样本,结合文本分析和计量分析的方法,探究新闻语篇中的立场标记在中美英语语境中的异同和差异,以及其在新闻报道中的功能和意义。
本研究的意义如下:1. 为实现更好的新闻报道和媒体评价提供理论和方法支持。
2. 为加深中美英语语言和文化之间的交流和合作提供参考。
3. 为学术研究提供范例和启示,有助于深入理解语言学和跨文化交际领域的相关问题。
三、研究内容和方法本研究的主要内容和方法如下:1. 收集中美英语新闻语料,并对其进行预处理和整理。
2. 对新闻语料中的立场标记进行识别和分类。
3. 分析和比较不同语境中的立场标记使用情况和类型分布。
4. 探讨立场标记在新闻报道中的功能和表达意义。
5. 采用文本分析和计量分析的方法,对语料数据进行统计和图表展示。
四、研究预期结果1. 本研究将对中美英语语境中的立场标记进行全面的探究和分类,揭示出立场标记在不同语境下的功能和表达意义。
2. 通过对语料数据的分析和挖掘,本研究将为新闻媒体的选择和评价提供更为准确和全面的依据。
3. 本研究可以为学术研究提供范例和启示,为深入理解语言学和跨文化交际领域的相关问题提供参考。
2021年41期总第585期ENGLISH ON CAMPUS【摘要】《义务教育英语课程标准(2011年版)》强调学习外语的过程是一个积极主动的学习过程,运用多种学习策略发展语言、思维、交流合作等能力,关注学生情感和个性差异以人为本。
《普通高中英语课程标准(2017年版2020年修订)》也提出要着力发展核心素养,使学生具有理想信念、社会责任感、科学文化素养、终身学习能力、自主发展能力和沟通合作能力的培养目标。
本文借助华南师范大学外国语言文化学院英语教育教学语料库(CEEC)平台,通过分类、统计、对比和分析中外各10节英语课堂实例中的教师课堂反馈用语,发现国内教师与国外对比存在很多亮点与不足,希望能在此基础上对国内的EFL英语教师如何在课堂上实施反馈提供借鉴。
【关键词】教师课堂反馈;课程标准;国内外对比【作者简介】吴浚彦,广东技术师范学院。
一、引言Nunan认为,教师话语在课堂组织和习得过程中至关重要。
教师课堂反馈作为教师话语的一个组成部分,近年来受到了热烈的讨论。
西方对教师课堂反馈有很多研究,国内这方面的研究却很少。
此外,随着《义务教育英语课程标准(2011年版)》和《普通高中英语课程标准(2017年版2020年修订)》的发布,学生的情感、学习策略、自主发展能力和沟通合作能力在课堂上得到了强调,其中教师的反馈非常重要。
为了研究我国新课标实施后教师课堂反馈的特点,本文对国内外的15类英语课堂教师反馈用语进行了比较研究,初步探讨了新课标实施后我国教师反馈用语的特点,旨在研究国内外教师反馈用语的异同,国内教师反馈用语体现的教学策略,激发学生的兴趣,促进学习,尤其是学习策略和自主能力发展的有效性。
二、文献综述反馈是听者对信息的接收和理解所提供的信息的通用术语。
教师反馈一般可分为积极反馈和消极反馈,两者均有多种形式。
1.积极反馈。
积极反馈是指教师在学生做出反应后给予表扬,如“good”或“right”。
由于本文研究语言反馈而非语言信号,如点头或微笑不在讨论范围内。
对外汉语偏误汇总对外汉语偏误分析的综述随着汉语的国际地位的提升和学习人数的增多,汉语作为第二语言的学习,学习者在习得过程中,出现偏误现象,影响着教学和语用效果,本文主要从近几十年的对外汉语教学中的语音语调、汉字、语法(词法、句法)三个方面对偏误现象研究和分析进行梳理,做一下总结。
英国应用语言学家科德(S.P.Coeder)在1967年首先提出失误(mistake)和偏误(error)两种类型。
者对目的语的掌握情况和实际的语言能力,因此在研究中具有重要的意义。
偏误分析(Error Analysis)EA) 和第二语言习得(Second Language Acquisition)SLA) 研究是以1967 年Corder 论文TheSignificanee of Learner.s Errors 的发表为标志的。
1972 年,Selinker 提出/中介语理论,为深入研究/偏误和习得奠定了理论基础。
在中国,1984 年鲁健骥的5中介语理论与外国人学习汉语的语音偏误分析6的发表,标志着对外汉语教学界研究这一领域的开始。
一、语音语调的偏误分析(一) 双音节词偏误分析夏晴《韩国留学生学习普通话时二字组及其在语流中的声调偏误分析》(2006)在其论文中则侧重在语流中探讨韩国留学生的两字调偏误。
最后得出结论:韩国留学生在汉语声调的学习中,四声的习得情况最好,一声和二声其次,三声情况最为严重。
侯晓虹、李彦春《初级汉语水平韩国留学生汉语双音节词声调的发音规律研究》(2006)以巧名初级汉语水平的韩国留学生为对象,调查了他们在16种双音节词语组合模式的发音过程中声调的偏误问题。
并根据不同声调组合的不同难度情况,提出了相应的声调发音训练的对策。
董倩倩《日本留学生轻声声调习得偏误初探》(2012)指出:“轻声双音节词前字被误读成阴平的偏误所占比例最大。
并从音调和音高两方面分析了原因。
(二)调域调型偏误分析罗音《俄罗斯人学习汉语语音偏误分析》(2007)从静态声调和动态声调分析俄罗斯留学生汉语声调习得,指出俄罗斯留学生学习汉语语音时产生的偏误大部分是由于母语负迁移导致的。
语料库标注说明“HSK动态作⽂语料库”语料标注及代码说明“HSK动态作⽂语料库”从字、词、句、篇、标点符号等⾓度,对所收⼊的作⽂语料中存在的外国⼈使⽤汉语的中介语偏误进⾏全⾯标注。
1 、字处理(包括标点符号)[C]:错字标记,⽤于标⽰考⽣写的不成字的字。
⽤[C]代表错字,在[C]前填写正确的字。
例如:地球[C](“球”是错字)、这[C]。
[B]:别字标记,⽤于标⽰把甲字写成⼄字的情况。
别字包括同⾳的、不同⾳⽽只是形似的、既不同⾳也不形似但成字的等等。
把别字移⾄[B]中B的后⾯,并在[B]前填写正确的字。
例如:提[B题]⾼、考虑[B虎]。
[L]:漏字标记,⽤于标⽰作⽂中应有⽽没有的字。
⽤[L]表⽰漏掉的字,并在[L]前填写所漏掉的字。
例如:后悔[L],表⽰“悔”在原⽂中是漏掉的字。
农[L]药,表⽰“农”在原⽂中是漏掉的字。
[D]:多字标记,⽤于标⽰作⽂中不应出现⽽出现的字。
把多余的字移⾄[D]中D的后⾯。
例如:我的[D的],表⽰括号中的“的”是多余的字(原⽂中写了两个“的”)。
[F]:繁体字标记,⽤于标⽰繁体字。
把繁体字移⾄[F]中F的后⾯,并在[F]前填写简体字。
例如:记忆[F憶]、单{F單}纯、养{F養}分{F份}。
注意:1)繁体字标记标⽰的是使⽤正确的繁体字,如果该繁体字同时⼜是别字,则先标繁体字标记,再标别字标记。
例如:俭朴[F樸[B僕]]。
2)繁体字写错了,标为:后[F後[C]]。
[Y]:异体字标记,⽤于标⽰异体字。
把异体字移⾄[Y]中Y的后⾯,并在[Y]前填写简体字。
例如:偏[Y徧]、沉[Y沈]。
[P]:拼⾳字标记,⽤于标⽰以汉语拼⾳代替汉字的情况。
把拼⾳字移⾄[P]中P的后⾯,并在[P]前填写简体字。
例如:缘[Pyúan]分、保护[Phù]。
[#]:⽆法识别的字的标记,⽤于标⽰⽆法识别的字。
每个不可识别的字⽤⼀个[#]表⽰。
例如:更[#][#]保存⾃⼰的⽣命,……[BC]:错误标点标记,⽤于标⽰使⽤错误的标点符号。
偏误分析周小兵第三讲偏误分析传统的偏误分析(error analysis)是跟对比分析联系在一起的,可服务于教学。
如,通过偏误分析来排列教学顺序,弥补教材的不足等。
做法是收集常见错误并进行分类,但没有心理学理论的指导。
随着学习研究的深入,人们发现偏误不仅跟母语干扰有关,还跟目的语规则泛化相连。
它还成为中介语研究、习得顺序研究中重要的组成部分。
一、偏误分析的程序以下以语法偏误研究为例,讨论偏误分析具体步骤。
,一,语料收集与选择偏误应是学习者的真实语料(书面/口头)。
偏误收集,可分为开放式和聚焦式两类。
1(开放式语料收集指没有具体目标的偏误收集。
研究者可随时随地收集各类偏误。
来源可以是各类作业,谈话,翻译文本,翻译影视节目等。
收集过程中要进行筛选工作,挑选出最有价值的偏误点。
2(聚焦式语料收集指确定偏误点之后的语料收集。
语料收集可分为两大类4小类。
(1)横向(cross-sectional)与纵向(longitude-sectional) 横向指研究者收集学习者某一特定阶段出现的偏误。
纵向指研究者收集学习者较长时间出现的偏误。
横向、纵向两种方法各有千秋。
横向方法虽然是短时间的,但可以收集较多学习者的偏误。
纵向方法虽然是长时间的,但只能收集较少学习者的偏误。
(2)自然与非自然自然法指通过谈话或作文来收集偏误。
非自然法指通过语法练习和测试来收集偏误。
前者(尤其是自由谈话)收集的语料比较自然、真实;学习者更关注表达内容,偏误频率比较高。
后者收集的语料不够自然、真实;学习者更关注表达形式,偏误频率没有那么高。
但研究者最想要的某一类或某几类偏误,在自然法收集的语料中比例不高;而在专门设计的语法练习、测试中却比较多。
非自然语料的收集有许多做法。
陈珺、周小兵(2005)为考察留学生使用度量差比句和“不比”句的情况,设计了以下两类试题:A类:请用每一题中的词组成一个完整的句子:1,分钟他我比三快B类:请用括号中的词完成下面的句子:2,甲:你要是没钱用~就先拿去用吧。
“之间”偏误汇总【6】:我的国家是欧州和亚州{[之间]}的? {【中下】【土耳其】} (混用,在…之间)【8】:土耳其在ou州和亚州{[之间]}的一个乔,如果不算底中海的话还是算在三州之间的很重要的地方所以土耳其的风竟美丽极了。
{【本三】【土耳其】} (混用,是…中间)【9】:土耳其是欧州和亚州{[之间]}。
{【本三】【土耳其】} (混用,在…之间)【13】:可是{[之间]}还发生过一些事情,两位姐姐嫁了,母亲肯定很高兴,遗憾我不在! {【华教本二A】【马达加斯加】} (中间)【38】:还有大学四年{[之间]},差不多获得了免学费。
{【中上】【日本】} (期间)【39】:那三年{[之间]},我的意识一直向着练习打排球,有的课上课时也不上了。
{【中级】【日本】} (期间)【40】:我寒假{[之间]}在日本一直打工了。
{【中级】【日本】} (期间)【41】:你们都知道,寒假{[之间]}有圣dan节和元旦。
{【中级】【日本】}(中间)【46】:我女友打算黄金周{[之间]}来到广州呆一个星期。
{【中下】【日本】}(期间)【62】:朋友{[之间]}有一位是中国人,我和她比较亲切。
{【中上】【柬埔寨】}(中间)【73】:我们也可以说,对她来说幸福就是饮食和家庭而不是男女感情{[之间]}。
{【华教本二B】【越南】} (错序)【94】:一年{[之间]}我学到不少知识,此外我还了解自己处理问题。
{【华教本二B】【老挝】} (中间/期间)【95】:我希望在四年{[之间]}我汉语水平更高,更进步。
{【华教本二B】【老挝】}(中间/期间)【105】:我不喜欢不公平,因为我们都是一样的人,为什么要无道理而分明是哪种人,和受到不同的对待,不管那是什么理由,什么关系{[之间]},我都难以接受。
{【华教本一B】【老挝】}(冗余)【121】:而且在学习{[之间]},学到了不少的新知识,让我很开心的学习,甚至给我将来的打算有所现实。
hsk动态作文语料库偏误标注方法研究汉语言文学研究中的偏误标注方法有一百多种,对汉语来说,对应关系是主要标注形式,它对单字的标注起着至关重要的作用。
对一些特殊偏误进行细化也能够帮助我们更好地去理解和掌握。
本论文以“ hsk动态作文语料库”为例进行偏误分析,以增加偏误分析的真实性。
首先介绍偏误标注的原则,然后对偏误标注的方法、原则和过程进行阐述,最后提出对未来发展的建议。
在选择“ hsk动态作文语料库”时,因为该语料库包含中英文各类话题和体裁,数量大且覆盖面广,语料信息全面。
作为对汉语的研究具有一定代表性。
本文对一篇“ hsk动态作文语料库”中的中文部分进行了偏误标注,并将它们分为8个大类,详细分析了它们之间的联系和区别。
从标注的效果看,每一类都包含5条偏误,由此可见,对其他的类也进行分析很有必要。
在选词方面,这篇作文包括了对现代汉语中使用频率较高的大部分词语的标注,这对于今后汉语中词汇量的扩充和语言文字规范的实施有积极的促进作用。
1.选词原则(1)词汇要真实可靠。
在标注时,我们所收集到的都是各种规范书籍中出现的、真实存在的词汇,这样既保证了汉语的规范,又减少了对语料的依赖。
(2)词语所反映的意义要准确,这是偏误标注的根本。
(3)词语的搭配关系要合理。
这种合理不仅仅是对某一语句或者整个语段的合理,而是指整个语段内的合理。
(4)在使用新词汇时要考虑到其接受度,如果新词汇在理解上比较困难,那么它在使用上就会受到限制。
2.切词原则( 1)切词要符合汉语习惯。
切词主要是指对词语在各种语境下使用时的差异进行分析。
( 2)在对不同语境下的词语进行切词时,要结合相应的语境,尤其是对成语进行切词时,要考虑到成语在不同语境下的用法差异,这样才能保证切词正确。
(3)切词还需要考虑到词语之间的搭配关系。
只有把词语和短语的搭配情况弄清楚了,才能保证词语选择得恰当。
(4)在对词语的切词时,要考虑到词语的级别。
如果词语属于常用词汇,那么就要选择常用的词语;如果词语属于比较罕见的词汇,那么就要选择一些比较难理解的词语。
翻译语料的言语失误标注原则鉴于目前国内的学习者语料库如杨惠中老师和桂诗春老师(CLEC),SWECL(Spoken and written English of Chinese Learners), 大学英语口语语料库(卫乃兴)等所用的标准均为error-tagging system. 为了保持统一和可对比性,便于以后对我国不同类型的英语学习者的语料进行对比,故我们决定采用统一体系,然后在一些不同之处作说明。
CLEC的标注体系“采取两级分类,第一级是大类,每一类里再用数目字细分。
如[cc]为词语搭配不当,[cc1]表示名词和名词的搭配,[cc2]表示名词和动词的搭配,[cc3]表示动词和名词的搭配,等等”这个赋码相对简单合理,易于系统操作。
由于错误标注是手工操作,参与标注的人比较多,如果分类表过于繁复,就难于掌握,届时标注的准确性和连贯性皆难以得到确保。
因此,在实际操作层面,可操作性在很大程度上确定了标注的准确性和统一连关性,也是学习者语料库建库成败的关键。
语语料库标注的一大问题(Hunston, 2003)。
不仅是一如何其他的标注方式如扬达复老师提出的从五个纬度标注,此外,一些错误的类型难以判断,特别是一种错误引起另一种错误,或者错误的本身可以从不同的层面上进行界定,在这种情况下,统一遵循学习者预料的客观性。
作为学习者语料,这是进行中介与对比研究的基础,标注是一项必不可少、又费时费力的浩大工程。
这是进行对比分析的依据,同时也对中介语研究的关键步骤。
同时为了确保标注的正确性和统一性,除对标标注小组成员进行培训,熟悉赋码,还定期会面,讨论标注过程中出现的一些问题,这些讨论一方面有助于统一对某些错误的认识,同时也有助于市的一些分析变得更加深入和丰富。
句子之间的标注以衔接词和连词为主,另一在现有的格式上好操作的标注体现在叙述性人称代词的使用,如。
其他语言层面的标注没有进行,语篇标注的其他层面,如语用角度的言语行为等。