当前位置:文档之家› 莫言作品_蛙_的语料库检索分析_陈婵

莫言作品_蛙_的语料库检索分析_陈婵

莫言作品_蛙_的语料库检索分析_陈婵
莫言作品_蛙_的语料库检索分析_陈婵

第5期总第128期

2014年9月浙江工商大学学报JOURNAL OF ZHEJIANG GONGSHANG UNIVERSITY

No.5Vol.128Sep.2014收稿日期:2014-04-11

基金项目:国家社会科学基金项目

“英语学术论文语篇的话语策略研究”(13BYY157)作者简介:陈婵,女,浙江工商大学外国语学院讲师,主要从事语料库文体学和话语分析研究;程乐,男,浙江大学外国语言文化与国际交流学院教授、博士生导师,法律话语与翻译中心主任,主要从事语料库、符号学以及专门传意等研究,系本文通讯作者。

莫言作品《蛙》的语料库检索分析

陈婵1,程乐2

(1.浙江工商大学外国语学院,杭州310018;2.浙江大学外国语言文化

与国际交流学院,杭州310058)

要:文章利用语料库检索软件Antconc ,对莫言的小说《蛙》从主题、故事情节和人物

形象塑造等方面进行了较为深入的分析。首先,利用Antconc 的主题词功能提取出主题词并进行归类,结果不仅印证了《蛙》的主题与计划生育密切相关,而且也反映出《蛙》与莫言其

他作品之间的延续性以及作品中乡土立场和人文立场的统一。然后,利用Antconc 的索引功

能对主要角色“姑姑”进行检索,对每一条检索结果根据其描述内容和情感倾向做了人工标

注并统计,分析结果显示,对“姑姑”的感情生活、容貌性情以及身世等方面看似与主题无关

的描写实际上对小说人物塑造、情节发展都起到了至关重要的作用。

关键词:语料库;莫言;蛙;主题词;检索

中图分类号:I06文献标志码:A 文章编号:1009-

1505(2014)05-0026-09A Corpus-based Analysis of Mo Yan's Novel Frog

CHEN Chan 1,CHENG Le 2

(1.School of Foreign Languages ,Zhejiang Gongshang University ,Hangzhou 310018,China ;

2.School of International Studies ,Zhejiang University ,Hangzhou 310058,China )

Abstract :The present paper applies the corpus retrieval software ,Antconc ,to study Mo Yan's novel Frog from the per-spectives of theme ,plot ,and means of character shaping.The extracted keywords not only confirm the theme of Frog is closely related to family planning ,but also reflect the continuity between Frog and other works of Mo Yan as well as the unity of local standpoint and humanistic position in the novel.Furthermore ,by annotating manually all the retrieval results of the major role “Aunt ”according to their contents and emotional tendency ,the paper finds that the seemingly irrelative descriptions of aunt's love and family life ,appearance and temperament ,actually play a critical role in character shaping and plot development.

Key words :corpus ;Mo Yan ;Frog ;key words ;retrieval

一、引言

2012年,莫言获得了瑞典诺贝尔委员会颁发的诺贝尔文学奖,

成为第一位获得该奖项的中国籍作家。他的主要代表作品有《红高粱家族》《丰乳肥臀》《酒国》《檀香刑》《生死疲劳》《蛙》等。其中

,《蛙》是莫言最近的一部长篇小说。该小说于2009年由上海文艺出版社出版,并于2011年获得第八届茅盾文

学奖。《蛙》选择了计划生育这个带有普遍性而又极具中国特色的题材,通过讲述从事妇产科工作50多年的乡村女医生姑姑的人生经历,生动而感人地表现出中国乡村六十年波澜起伏的生育史,并折射出

我们中华民族在生存斗争中所经历的困难和考验[1]。

文章采用基于语料库的研究方法,以莫言的长篇小说《蛙》为研究对象,

首先利用语料库检索软件Antconc 的主题词功能提取出主题词并进行归类,分析小说的主题以及作者的写作风格;然后,利用Antconc 的索引功能对主要角色“姑姑”进行检索,对每一条检索结果根据其描述内容和情感倾向做了

人工标注并统计,深入探讨“姑姑”这一人物形象特点以及人物塑造手段。本研究目的在于,通过语料

库方法对莫言作品《蛙》进行量化分析和定性研究,为已有的文学阐释提供实证支持的同时,挖掘前人

研究中尚未发现的文本意义,并探讨基于语料库的研究方法在揭示中国文学作品显性和隐性内容方面应用的可能性和有效性。

二、研究背景

作为中国当代最具代表性的作家之一,莫言的作品已经被无数学者研究分析过。研究者通过查询

中国期刊网发现,截至2014年3月,以“莫言”为关键词的论文共有2993篇,其中以“蛙”为关键词的论文

有149篇。这149篇论文分别从主题意义、叙事视角、角色剖析、悲剧美学、语言风格等方面对《蛙》进行了描述性的分析。然而,迄今还未发现有运用语料库手段对该小说进行文本解析的例子。

语料库语言学是20世纪80年代才崭露头角的一门交叉学科,凭借大规模语料库提供的客观翔实的语言证据来从事语言学研究和指导自然语言信息处理系统的开发。语料库和语料库语言学的实用

价值在于:1)提供真实语料;2)提供统计数据;3)验证现行的理论;4)构建新的理论[2]。基于语料库的

研究方法被广泛应用于各种类型的话语分析中,例如,意识形态话语分析(Stubbs ,

1996;Fairclough ,2000)[3,4]、法律话语分析(Coulthard ,1994;Cheng and Cheng ,2014)[5,6]、性别话语分析(Coates ,1999;

Nevalainen ,2000)[7,8]等等。

而进入21世纪的最近十几年,

语料库语言学与文体学的逐渐融合催生了另一种新的研究范式———语料库文体学。语料库文体学是利用语料库的手段对文学文本从语音、词汇、句法、语义等方面进行定量描写和定性分析,从而对文学作品的主题、人物形象塑造、叙事发展以及作家写作风格等进

行研究。语料库文体学是对传统文体学的一种有效补充[9]。通过对文学文本进行量化分析,语料库文

体学可以为基于个人阅读体验、以阐释性为主的传统文体学提供实证支持,并使分析结果变得更为客

观、可靠[10]。

Semino 和Short [11]对语料库文体学进行了较为全面的综述,针对不同文类中言语、书写与思想表

达的形式与功能进行了定量和定性分析。Wynne [12]

介绍了各种语料库文体学研究方法,并简要回顾了

语料库语言学给文学批评在方法论方面的启示。

Mahlberg [13]介绍了利用语料库研究19世纪文学作品的优势及方法,并提出定量描写和定性分析必须相互结合。

除了综述性评论之外,一些学者选择特定的文学作品进行了实证性研究。其中,以Dickens 和Jane Austen 的作品为典型代表。Tabata [14]和Mahlberg [15]均以Dickens 的23部作品作为语料库进行了文体学分析:前者通过研究作者的个人写作风格及语言特点的发展过程,发现其早期的作品倾向于正式文7

2第5期陈婵,程乐:莫言作品《蛙》的语料库检索分析

82浙江工商大学学报2014年

体,而晚期作品则呈现出更多的口语化特征;后者通过分析语料库中出现的高频词簇,发现和身体部位相关的词簇往往是推动故事情节发展的重要线索。

Starcke[16]于2006年对Jane Austen的作品《劝导》进行了语料库文体学研究,分析了其中的高频词簇及其同现,着重探讨了典型词簇“she had been”和“she could not”在刻画小说中女性内心世界的作用。2009年[17]又以同一作者的另一部作品《傲慢与偏见》为研究对象,着重探讨了其中的关键词和高频词簇及其语义域,从崭新的角度重新阐释了该作品的主题、人物形象以及人物的社会关系。

另外,Hardy[18]利用语篇分析软件TEXTANT分析了Flannery O'Connor作品中的词汇搭配,发现单词eye构成的搭配出现频率较高并具有显著意义,可以反映出作者对人体内部或精神方面的意义非常关注。Stubbs[19]通过对比Conrad的小说《黑暗的心》和英国国家语料库的单词和词簇,表明基于语料的定量分析不仅能够给广泛认可的文学阐释提供文本细节支持,而且能够帮助发现前人研究中未注意到的新的信息。

国内一些学者也曾利用语料库检索软件对外国文学作品进行过分析(张海云和谢群芳,2010;张仁霞和戴桂玉,2010;郑文韬和郑飞,2012;陈婵,2014)[20-23]。但是,目前基于语料库的文学作品研究仍主要局限于分析外国作品,真正利用语料库工具来分析中国文学作品的研究却几乎没有。究其原因,一是由于语料库检索软件大都是由西方学者开发并主要应用于英美文学研究;二是由于中文自身的特殊性,它不像西方一些词在分词上具有自身显著的特征,因此给基于语料库的文学研究带来了一定的困难。针对这一现状,笔者先对中文生语料进行预处理,利用ANSJ分词软件对文本分词;然后再利用语料库检索软件Antconc进行主题词分析和高频词检索。

三、基于语料库检索的《蛙》的分析

(一)主题和情节检索

通过提取和分析文学作品中具有超常频率的词或词组,可以确定文本的主题词和表达该主题的词集[24]。主题词的提取原理是通过对比一个连续的整篇文本和一个更大的参照语料库,把文本中词频具有显著差异的词语提取出来,生成一个主题词表。因此,统计主题词需要建立两个语料库,一是观察语料库,二是参照语料库。在本研究中,观察语料库是莫言的长篇小说《蛙》,总字数为189,120。而参考语料库共有两个,一是研究者自建的茅盾文学获奖作品集(除莫言作品外),其中搜集了茅盾文学奖1至8届的大部分获奖作品,共24部作品,包括《茶人三部曲》《白鹿原》《平凡的世界》等等,总字数为8,751,570,下文简称为参考语料库(1);二是莫言除《蛙》之外的另外10篇小说,包括《红高粱家族》《丰乳肥臀》《酒国》《檀香刑》等等,总字数为1,215,630,简称为参考语料库(2)。具体内容如表1所示:

表1语料库明细

语料库名称语料库内容语料库总字数观察语料库莫言小说《蛙》189,120字参照语料库(1)1-8届茅盾文学奖获奖作品,共24部作品,如《茶人三部曲》《白鹿原》

8,751,570字《平凡的世界》等

参照语料库(2)莫言除《蛙》以外的其他10部代表作品,如《红高粱家族》《丰乳肥臀》

1,215,630字《酒国》《檀香刑》等

选择上述两个参考语料库的原因如下:

1)参考语料库(1)中的历届茅盾文学奖获奖作品是当代中国文学的杰出代表,基本可以反映当

代中国文学作品的价值取向和总体写作风格。

对比《蛙》和其他的茅盾文学奖作品,可以找出《蛙》与当代其他代表作品在小说主题、故事情节、人物形象塑造等方面的异同。根据本文研究目的,以该语料库为主要参考语料库。

2)对比《蛙》和参考语料库(2)中莫言的其他10部代表作品,以期找出《蛙》和莫言其他作品在小说主题、故事情节、人物形象塑造等方面的异同。根据本文研究目的,以该语料库为次要参考语料库。

3)对比莫言的代表作品(观察语料库+参照语料库(2))和历届茅盾文学奖获奖作品,找出作家莫言个人的写作风格、文本特征、主题选择和价值取向等等。

在进行主题词检索之前,先利用中文分词软件ANSJ 对所有的语料进行分词。由于当前的中文分词软件还尚需完善,所以计算机自动分词结果还不能完全让人满意。因此,研究者对《蛙》语料库的分词结果进行了人工校对,主要纠正了一些有关人名的分词结果的错误。然后,利用Antconc 中的Key-word List 功能,分别比照参考语料库(1)、(2),生成小说《蛙》的主题词表(1)、(2)。同时我们也对莫言的其他作品(即参考语料库(2))根据参考语料库(1)生成了主题词表(3)。如上文所述,本研究主要是通过对比中国当代具有代表性的文学作品,找出小说《蛙》在主题、情节和人物塑造等方面的特点,因

此以下的分析主要以主题词表(1)为依据,而主题词表(2)、

(3)仅作为参考。研究者对主题词表(1)中的主题词进行了聚类,根据分析需要,词汇“我”既归于人物角色类,又归于称谓类,具体见表2:

表2

分类后的《蛙》主题词表类别

主题词1

人物角色姑姑(万心),我(蝌蚪、万足),小狮子,陈鼻,陈眉,王肝,蝌蚪,王仁美,袁腮,王胆,郝大手,秦河,李手,王脚,王小倜2

称谓我,您,我们,你们,你3

与生育相关的词汇孩子、泥娃娃、生、婴儿、人、计划生育、接生、代孕、怀孕、身体、结扎、腿、死、产妇、妇科、奶、胎、妇婴、基因、男孩4

地点名词高密、公社、卫生院、医院、东北乡、平度、娘娘庙5

和题目《蛙》有关的词汇青蛙、蛙、牛蛙6其他木筏(筏)、黑衣、吃、哭、狗、煤、剧本、话剧、喝、地瓜、嫁、穿

从人物角色一栏来看,“姑姑”是整本小说中出现频率最高的实义词,

出现频率共1188次,其关键值为9022.814,排在第一位,验证了小说《蛙》正是围绕着姑姑跌宕起伏的一生展开的。紧接着的人物

角色是“我(蝌蚪)”和“小狮子”,出现频率分别为3443和331,关键值分别为2947.511和2644.206,可

以看出,小说除了描绘姑姑具有传奇色彩的一生外,还连带描写了小说中

“我”———一位剧作家的人生经历。在主题词表中处于显著位置的还有陈鼻、陈眉、王仁美、王胆等主要角色,说明这些人物在推动故事情节发展和揭示小说主题思想上起到了重要作用。从主题词表不难看出,小说中的主要角色大都以人身上的器官来取名,如姑姑万心,“我”万足,陈鼻和陈耳、陈眉父女,王肝和王胆双胞胎兄妹等等。

作者在小说里说这是古老的风气所致,“大约是那种以为‘贱命者长生’使然,抑或是母亲认为孩子是

自己身上一块肉的心理演变”

[25]5。而实际上,这种命名方式暗藏着作者对人肉体本身的尊敬,以及对生命的尊敬和崇拜[26]。

笔者进一步分析了主题词表(2)中的关键人物角色,发现与主题词表(1)差别不大。但是在进一

步分析主题词表(3)可以发现,正如《蛙》以亲属姑姑为主要人物角色,莫言的其他作品中也不乏有类

9

2第5期陈婵,程乐:莫言作品《蛙》的语料库检索分析

似的人物,

如《红高粱》中的“奶奶”、《丰乳肥臀》中的“母亲”、《酒国》中的“岳母”等等。在称谓一栏中,出现频率最高的是“我”,共出现3443次,其关键值高达2147.511,也是主题词表中

除“姑姑”外,排名最高的实义词。另外,“您”排在主题词表的第11位,在文中主要是指日本作家“杉谷

义人”,也是书信写作的对象。笔者同时通过Antconc 的Concordance Plot 功能查看了“我”的情节展示

图(图1),可以发现“我”在文中贯穿始终,表明采用第一人称视角的写作手法是小说《蛙》的一大语

言特色。这样的叙事方法在小说创作中极为常见,可以使叙事接受者在理解故事情节时采取类似立

场,并直接参与情节的安排,从而使虚构的小说故事更加可信[27]

图1人称代词

“我”在小说《蛙》中的情节展示图生育是《蛙》的主题。从主题词表中也可以看出,和生育相关的主题词非常多,具体还可以再细分

为三类:一类是关于生命的词汇,如婴儿、男孩、人等;一类是关于计划生育的,如计划生育、产妇、结扎;最后一类还涉及到了颇为新潮又备受争议的话题,如代孕、基因。

主题词表(1)中的地点名词有:高密、公社、卫生院、医院、东北、平度、乡、娘娘庙。然而,当查看主题词表(2)时,发现高密、东北乡、平度、娘娘庙等词,其关键值则明显偏低,说明这类地点词语在莫言其他作品中也频繁出现,这也反映出小说《蛙》与莫言其他作品之间的延续性,还是以“高密东北乡”为写作背景,反映出作者深深的乡土情结。而公社、卫生院、医院等主题词,在两个主题词表中均具有较大的关键值,再次印证了小说的主题与计划生育密切相关。

与题目《蛙》相关的词汇有青蛙、牛蛙和蛙。小说题目“蛙”,可谓一语双关。一方面由于“蛙”音近

于“娃”和“娲”,象征着人类旺盛的繁育能力和生命的延绵不息;另一方面也由“蛙”作为一个关键节点推动故事发展,如小说后半部分由姑姑害怕青蛙带出姑姑晚年的转变和忏悔。

最后,在其他一栏中,也可以再细分为两类,一类反映了作家莫言的乡土情结,如高密东北乡频繁出现的木筏、狗。通过检索莫言的其他作品,可以发现,木筏和狗在其他作品中也经常出现,如《丰乳肥

臀》中“木筏”共出现了43次,而“狗”在

《丰乳肥臀》《红高粱》《酒神》《檀香刑》等作品中的出现频率都极高;另一类如“煤”“地瓜”“吃”“喝”等,则沿袭了作家莫言在其他作品中对食和欲的极端描写,比如

自然灾害之年

“我”和“王胆”等众伙伴吃煤的惊人场景。从以上分析可以看出,乡土立场与人类立场的统一在作品《蛙》的艺术表现上体现得非常典型[28]13。和莫言的其他作品相同,《蛙》仍以

“高密东北乡”为写作背景,以现实和幻想相结合的写作方式,通过对当地自然地理、民俗风情等的描写,表现出乡村农民生活的生与死、悲与喜、负罪与救赎等深刻的主题;同时,借助乡土立场的表现手法,作者莫言巧妙地避免了与政治之间的正面冲突,从而从

人类立场上凸显出“计划生育”这一在当今中国仍旧比较敏感的政治话题。

(二)对主要人物“姑姑”的检索

利用Antconc 中的Concordance 功能,可以穷尽列举出所有人物出现时的上下文,借此可以检索出对某一人物角色的所有描摹,这非常有利于研究者进行角色性格和小说人物塑造技巧的分析。由于小说最后部分的话剧在写作风格上与其他部分截然不同,而且相对独立,所以在做关键词检索之前,研究者先对观察语料库进行了部分删减,去掉了小说最后部分的话剧。然后,以小说中的关键人物“姑姑”为关键词进行了数据提取,一共找到945条结果。接着,把检索到的结果根据其内容分成了7类,并根据在小说中出现的次序按英文字母标注,分别为姑姑的生平(A )、姑姑的容貌性情(B )、姑姑早年从事的接生工作(C )、姑姑的情感婚姻(D )、姑姑的计划生育工作(E )、姑姑的晚年生活(F )、其他(G )。

为了更好地了解作者是如何塑造出“姑姑”这个充满矛盾的人物角色,研究者对每一条含有“姑姑”的

03浙江工商大学学报2014年

描述做了情感标注,其判断的标准是根据关键词“姑姑”在上下文中出现的褒义词和贬义词,以及描述

是否能给人带来幸福/非幸福、满足/非满足、安全/非安全感。共分为三类并以阿拉伯数字标注:正面

描写(1)、负面描写(2)和中性描写(3)。例如,[E 1]表示描述的内容与姑姑的计划生育工作相关,

1表示描述内容偏正面。然后,研究者利用Antconc 的Concordance 功能,对各项内容进行检索统计,结果显示如表3:

表3

有关“姑姑”的检索结果分类类型

总数1(正面描写)2(负面描写)3(中性描写)姑姑的身世(A )

438035姑姑的容貌性情(B )

4992020姑姑早年从事的接生工作(C )

152481103姑姑的情感婚姻(D )

14856776姑姑的计划生育工作(E )

3457176162姑姑晚年生活(F )

9604551其他(G )

11201597总次数94577324544

从上表可以看出,描述姑姑的计划生育工作(E )的内容是最多的一项,共345条,再次证明了计划生育是小说的主题内容;对于该项的描述,负面描述远远大于正面描述。作为公社计划生育的领导者、组织者、实施者,忠于党的事业的姑姑近乎疯狂地用非人性的方式遏制人口的过快增长,扼杀了无数

胎儿的性命,成为让无数家庭闻风丧胆的“活阎王”“杀人恶魔”,即使是对自己的侄媳妇,也是丝毫不

留情,并最终造成了一尸两命的悲惨结局。以下是通过Antconc 软件的Concordance 搜到的部分具有代表性的语句:

“[E 2]姑姑冷冷地说:你知道我们的土政策是怎么规定的吗?—

——喝毒药不夺瓶!想上吊给根绳!”

[25]124“[E 2]姑姑挥动着血手说———她就是钻到死人坟墓里。我也要把她掏出来!”

[25]148为了突出矛盾并让人物形象更为鲜明,作者让姑姑每一次残酷地执行命令都显得非常悲壮,她让别人流了产,丢了命,她自己也受到血腥的报复,甚至落到了众叛亲离的地步:

“一圈绷带,又一圈绷带。血从绷带里渗出。又一圈绷带。[E 2]姑姑头晕耳鸣,眼冒金星星,视物皆

血红。所有的人脸都像公鸡冠子一样,连树都是红的,像一团团扭曲向上的火焰。

”[25]109

然而,作为有血有肉的性情中人,在扼杀超生胎儿的过程中,其实姑姑的内心也存在着矛盾,并备受煎熬:

“[E 3]姑姑道,也许,我真应该跟他走,一拍屁股走了,眼不见,心不烦,谁愿意生谁就敞开屁股生

吧,生他二十亿,三十亿,天塌下有高个子顶着。我操这些心干什么?[E 2]姑姑这辈子,吃亏就吃在太

听话了,太革命了,太忠心了,太认真了。”[25]126和计划生育工作形成鲜明对比的是小说的前半部分,关于姑姑早年从事的接生工作(C ),

共152条。姑姑作为一名受过教育的乡村接生员,为高密东北乡的生命繁衍做出了巨大的贡献,并被村里人像一个救世主和观音菩萨一样顶礼膜拜。所以在这个阶段,作者描绘姑姑的词句中很多具有褒义并把姑姑描绘得颇具传奇色彩。以下为部分检索结果:

“[C 1]姑姑虽是初次接生,但她头脑冷静。遇事不慌,五分的技艺,能发挥出十分的水平。[C 1]姑姑是天才的妇产科医生,她干这行儿脑子里有灵感,手上有感觉。见过她接生的女人或被她接生过的

女人,都佩服得五体投地。

”[25]18姑姑的情感婚姻(D )也是小说浓墨重彩描写的一部分,

检索结果共148条。在小说最初,对姑姑和1

3第5期陈婵,程乐:莫言作品《蛙》的语料库检索分析

23浙江工商大学学报2014年

飞行员王小倜的爱情描写,或许是全书中最具浪漫色彩的部分。然而,姑姑的爱情由于王小倜的叛逃而无疾而终,并最终给姑姑带来了一连串的苦难与噩梦,比如姑姑的自杀和文革中被以生活作风为借口批斗。也正因为与王小倜爱情的失败,使姑姑“从血泊中站立起来,以火一样热情投入了工作”[25]53,从此不再考虑个人的情感问题。而之后出现的仰慕者,诸如杨林、秦河,或完全单相思,或给姑姑造成更大的伤害;而最终成为姑姑丈夫的郝大手,他们的结合也并非出于爱情,而完全是出于赎罪的需要,所以关于姑姑情感婚姻的描述,绝大部分都为中性或者负面:

“[D2]姑姑切开了左腕上的动脉,用右手食指蘸着血,写下了血书:我恨王小倜!我生是党的人,死是党的鬼!”[25]51

“我们感到,[D2]姑姑与郝大手不般配。我们从很小的时候就期待着[D3]姑姑嫁人,[D2]姑姑与王小倜的那段经历曾给我们带来了巨大的荣耀,但结局却无比凄凉。”[25]216

对姑姑的晚年生活(F)的检索结果共96条。步入晚年的姑姑开始反思个人曾经绝对坚信的“真理”,进入大悲悯、大救赎的新境界。由于曾经扼杀的生命再也无法挽回,所以姑姑最终嫁给了泥塑大师郝大手,并给自己构造了一个虚妄和想象的世界,用捏泥人、赋予泥人灵性的方式求得死去生命的再生和复活,以求得到自我精神的解脱。然而,姑姑的最终救赎之路是失败的,因此最终噩梦还是伴随着姑姑,精神上的枷锁仍然无法松开[26]。因此,这部分的描写大都比较悲凉、阴暗,充满着诡异的色彩,特别是姑姑在蛙地里遭到青蛙攻击的那段,让读者不由地竖起汗毛:

“[F2]姑姑说她原本是最爱听初生儿哭声的,对于一个妇产科医生来说,初生婴儿的哭声是世上最动听的音乐啊!可那天晚上的蛙叫声里,有一种怨恨,一种委屈,仿佛是无数受了伤害的婴儿的精灵在发出控诉。”[25]221

“我恼恨地说,这种伤天害理的事儿,我再也不会做了!我这辈子,亲手给人家流掉的孩子,已经有两千多个了!这种事儿,我再也不干了。[F2]姑姑抬起胳膊,沾沾脸上的泪。”[25]219

对姑姑的容貌性情(B)描写共有49条。通过浏览检索结果可以发现,小说前后部分的描写形成鲜明对比。在小说的开始部分,姑姑被视为“送子娘娘”的时候,关于姑姑的容貌性情描写,大都是偏于正面的,姑姑不仅根正苗红,而且模样端正、智勇双全:

“[B1]姑姑那时虽然只有十七岁,但因为从小经历不凡,又加上一个黄金般璀灿的出身,已经成为我们高密东北乡影响巨大、众人仰目而视的重要人物。当然,[B1]姑姑的容貌也是出类拔萃的。”[25]16

但是,在姑姑成为计划生育的严格执行者之后,小说中关于姑姑的容貌性情方面的描写也急转为负面,如:

“[B2]姑姑右手叉腰,左手拇指、小指、无名指蜷曲,食指和中指并拢挺直,伸向前方,身着七十年代大流行的‘的确良’军干服,衣袖高挽,身体胖大,白发苍苍,像一个‘文革’后期的县社干部。”[25]39不过,在小说的最后部分,在姑姑再一次重操旧业,为陈眉代孕的孩子接生的时候,作者又再一次给出了正面的描述:

“[B1]姑姑穿着白大褂,戴着大口罩,乱蓬蓬的头发塞进白帽子里,目光热烈而兴奋,让我想起那些伏枥的老骥。”[25]282

小说的开头部分对姑姑的身世(A)作了交代。作为烈士遗孤,姑姑可谓是根正苗红。在幼年时期被侵华的日军抓到平度城里时,就曾有过与日军司令杉谷斗智斗勇的传奇经历。因此,这部分的描写为中性或者正面:

“解放后,像[A1]姑姑这样的烈士后代,有许多机会可以远走高飞,但大奶奶热土难离,[A3]姑姑舍不得离开大奶奶。县里领导问[A3]姑姑想干什么,[A3]姑姑说要继承父业,于是就进了专区卫生学校。[A3]姑姑从卫生学校毕业时才十六岁,在镇卫生所行医。”[25]16

从以上的分析可以看出,在塑造“姑姑”这一人物形象时,作者是从不同的角度、分多个层次来刻

画的。小说主要描写了姑姑人生的三大阶段:乡村的新法接生员、计划生育政策的执行者、晚年的忏悔

者。在描写姑姑早年的接生工作时,作者把姑姑描绘成一位让人顶礼膜拜的“活菩萨”“送子娘娘”,颇

具传奇色彩,这一部分的描写大都以正面为主;而作为计划生育的执行者,姑姑又被描绘成令人闻风

丧胆的“杀人魔王”“活阎王”,这一阶段的描写充满了血腥、暴力,以负面描写为主;而到了晚年,姑姑又从一个曾经坚定的党的政策的拥护者,一下子转变成一个虔诚的忏悔者,这部分的描写充满了伤感和诡异,偏向于负面描写。三个阶段的姑姑人物形象完全不同,前后形成鲜明对比。但这看似不连贯的三部分,却在作者的巧妙安排下成为连贯的整体。而作者对姑姑身世、外貌性情、爱情婚姻等看似不重

要的描写正是塑造“姑姑”这一前后具有巨大反差的人物形象的重要手段。首先,在作品最初,作者给

姑姑设定了一个又红又专的革命后代身份,这一安排给后文姑姑雷厉风行、说一不二、甚至有些草莽

豪气的性格增添了说服力,也为姑姑对“党的事业”的狂热追求做出了铺垫。另外,作者通过对姑姑的

外貌品性的描写使人物形象更加的立体、丰满。第一阶段的姑姑不仅是根正苗红,而且样貌也十分突出;而第二、第三阶段的姑姑则体态臃肿、沧桑老迈,这一相貌上的反差也进一步渲染了后期的悲剧色彩。对姑姑爱情婚姻的描写实际上也起到了情节上承上启下的作用。姑姑的爱情可以说是“冰火两重

天”,从和飞行员恋爱的幸福至高点突然跌落至“叛徒玩腻了的烂货”的最低谷,从而看破红尘,以火一般的热情投入到党的事业当中,并残酷无情地执行计划生育工作,一直到晚年出于赎罪的需要嫁给并不爱的泥塑艺人郝大手。综上所述,从语料库检索的结果可以看出,在塑造姑姑这一主要角色时,作家莫言分多个层次、从不同角度描写了姑姑跌宕起伏、矛盾纠结而又波澜壮阔的一生。同时,也可以看出《蛙》的主旨并不仅仅是对“姑姑”这一复杂人物形象简单的颂赞或批评,更是对计划生育政策的批判性反思,以及对粗暴的反人性行为的严厉谴责[28]13。

四、结语

基于语料库的研究方法已经成为文学研究的一种趋势。然而,目前的研究仍主要局限于分析外国

作品,而对中国文学作品的研究却几乎没有。本文利用语料库检索软件Antconc ,

对莫言的小说《蛙》从主题、故事情节和人物形象塑造等方面进行了较为深入的分析,并探讨了基于语料库的研究方法在揭示中国文学作品显性和隐性内容方面应用的可能性和有效性。

首先,利用Antconc 的主题词功能提取出主题词并进行归类分析,结果不仅印证了《蛙》的主题与

计划生育密切相关,而且也反映出《蛙》与莫言其他作品之间的延续性以及作品中乡土立场和人文立

场的统一。然后,利用Antconc 的索引功能对主要角色“姑姑”进行检索,对每一条检索结果根据其描述内容和情感倾向做了人工标注并统计,分析结果显示,对“姑姑”的感情生活、容貌性情以及身世等方面看似与主题无关的描写实际上对小说人物塑造、情节发展起到了至关重要的作用;同时,作品通

过对“姑姑”这一复杂人物形象的塑造,间接折射出作者对计划生育政策的批判性反思以及对粗暴的反人类行为的严厉谴责。

研究表明,语料库检索同样可以成为研究中国文学作品行之有效的方法和工具;基于语料库的研究方法不仅可以为传统的定性的文学评论提供数据验证,而且能够挖掘深层次的文本意义,从而帮助读者更好地理解小说的主题、情节和人物形象塑造手段。

参考文献:

[1]范建华.中国人生存状态和精神变迁的标本—

——莫言新作《蛙》中姑姑形象分析[J ].名作欣赏,2010(10):37-38.[2]任艳,陈建生.语料库文体学在文学批评中的应用[

J ].中国轻工教育,2013(1):28-31.[3]STUBBS M.Text and Corpus Analysis :Computer-assisted Studies of Language and Culture [M ].Oxford and Cambridge :

Blackwell ,1996.

33第5期陈婵,程乐:莫言作品《蛙》的语料库检索分析

43浙江工商大学学报2014年

[4]FAIRCLOUGH N.New Labour,New Language[M].London:Routledge,2000.

[5]COULTHARD M.On the Use of Corpora in the Analysis of Forensic Texts[J].Forensic Linguistics,1994,1(1):27-44.[6]CHENG W,CHENG L.Epistemic Modality in Court Judgments:A Corpus-driven Comparison of Civil Cases in Hong Kong and Scotland[J].English for Specific Purposes,2014,33:15-26.

[7]COATES J.Women Behaving Badly:Female Speakers Backstage[J].Journal of Sociolinguistics,1999,3(1):65-80.[8]NEVALAINEN T.Gender Differences in the Evolution of Standard English[J].Journal of English Linguistics,2000,28:38-59.

[9]卢卫中,夏云.语料库文体学:文学文体学研究的新途径[J].外国语,2010(1):47-53.

[10]赵永刚.当代文学批评的语料库语言学方法探索[J].湖北社会科学,2011(4):131-133.

[11]SEMINO E,SHORT M.Corpus Stylistics:Speech,Writing and Thought Presentation in a Corpus of English Writing [M].London:Routledge,2004.

[12]WYNNE M.Stylistics:Corpus Approaches[M]//K BROWN.Encyclopedia of Language and Linguistics(2nd edition).Oxford:Elseveier Science,2006.

[13]MAHLBERG M.Corpus Linguistics and the Study of Nineteenth Century Fiction[J].Journal of Victorian Culture,2010,15(2):292-298.

[14]TABATA T.Investigating Stylistic Variation in Dickens Through Correspondence Analysis of Word-class Distribution[M]/ /T SAITO,S YAMAZAKI.English Corpus Linguistics in Japan.Amsterdam:Rodopi,2002.

[15]MAHLBERG M.Clusters,Key Clusters and Local Textual Functions in Dickens[J].Corpora,2007,2(1):1-31.

[16]STARCKE B.The Phraseology of Jane Austen's Persuasion:Phraseological Units as Carriers of Meaning[J].ICAME Journal,2006,30:87-104.

[17]STARCKE B.Keywords and Frequent Phrases of Jane Austen's Pride and Prejudice—A Corpus-stylistic Analysis[J].In-ternational Journal of Corpus Linguistics,2009(4):492-523.

[18]HARDY D.Narrating Knowledge in Flannery O'Connor's Fiction[M].Carolina:University of South Carolina Press,2003.[19]STUBBS M.Conrad in the Computer:Examples of Quantitative Stylistic Methods[J].Language and Literature,2005,14(1):5-24.

[20]张海云,谢群芳.基于语料库的文学作品检索分析———以越南中篇小说《志飘》为例[J].解放军外国语学院学报,2010(3):57-61.

[21]张仁霞,戴桂玉.语料库检索分析在文学批评领域中的应用———以海明威《永别了,武器》为例[J].广东外语外贸大学学报,2010(9):34-38.

[22]郑文韬,郑飞.论马格维奇的自我救赎———基于语料库的《远大前程》文本检索分析[J].北京航空航天大学学报:社会科学版,2012(2):97-100.

[23]陈婵.爱丽丝·门罗作品中的词簇特征及其功能分析———一项基于语料库的文体学研究[J].解放军外国语学院学报,2014(3):151-159.

[24]杨惠中.语料库语言学导论[M].上海:上海外语教育出版社,2002.

[25]莫言.蛙[M].北京:作家出版社,2012:177.

[26]范云晶.肉身和精神双重悲剧的沉痛书写———论莫言的新作《蛙》[J].名作欣赏,2011(6):44-47.

[27]曹波.让叙事者站在故事之外———论海明威《永别了,武器》中的叙事策略[J].四川外语学院学报,2001(5):34-36.[28]贺仲明.为什么写作?———论莫言创作的乡村立场及其意义[J].东岳论丛,2012(12):10-14.

(责任编辑杨文欢)

莫言作品赏析

莫言作品赏析 莫言简介: 莫言男,原名管谟业,1955年二月生于山东高密,童年时在家乡小学读书,后因文革辍学,在农村劳动多年。1976年参军,任战士、政治教员、宣传干事。曾在解放军艺术学院和鲁迅文学院研究生班学习。1981年开始发表小说诗歌文学作品,著有《莫言文集》五卷,长篇小说《红高梁家族》、《天堂蒜薹之歌》、《丰乳肥臀》、《酒国》、《红树林》、《檀香刑》,中篇小说《透明的红萝卜》、《红高梁》、《牛》,短篇《拇指铐》等。1997年转业到最高人民检察院《检察日报》报社工作,并为报社的影视部撰写连续剧本。中国作家协会会员。 他是中国新一辈极具活力的作家之一。自八十年代以一系列乡土小说诗歌文学作品崛起。虽然早期被归类为“寻根派”作家,但其写作风格素以大胆著称,小说中总是充满进攻型的语言。例如成名作《红高粱家族》里,不断出现的血腥场面中充满着强烈的感情控诉,但在“屎尿横飞”的场景之间,其实正是演义着一段现代革命的历史。故事中那片广袤狂野的高粱地,也被描绘成一个把历史、传统、城乡纵横交错的辽阔炫丽空间。 在经历《红高粱》的写作高峰后,继续寻求突破,创作了大量中短篇小说诗歌文学作品《金发婴儿》、《爆炸》、《欢乐》、《红蝗》、《筑路》、《雨中的河》、《流水》、《弃婴》、《猫事荟萃》、《玫瑰玫瑰香气扑鼻》及数部极具份量的长篇小说,不少小说集如《红耳朵》及《传奇莫言》亦先后在台湾推出。由于童年大部份时间在农村度过,自谓一直深受民间故事或传说影响,故乡高密的一景一物就正是他创作的灵感泉源。小时在乡下流传的鬼怪故事,也成为他许多荒诞小说的材料。《十三步》中出现了神秘的南美洲魔幻写实,描写一个人的“变身”,以华丽的语言带出一浪接一浪的神秘。《酒国》则以充满浪漫色彩的描写,绘划出一个盛产名酒地方的故事。《红树林》实现了小说题材的时空转换和创作方法的探索更新,是对自己的一大超越。 千言万语,何若莫言!莫言自谓“莫”言,笔下却是千言万语。不论题材为何,他那滔滔不绝、丰富辗转的词锋,总是他的注册商标。这大约是小说家自嘲或自许的游戏了。 《檀香刑》

BCC语料库使用指南

1 、字处理(包括标点符号) [C]:错字标记,用于标示考生写的不成字的字。用[C]代表错字,在[C]前填写正确的字。 例如:地球[C](“球”是错字)、这[C]。 [B]:别字标记,用于标示把甲字写成乙字的情况。别字包括同音的、不同音而只是形似的、既不同音也不形似但成字的等等。把别字移至[B]中B的后面,并在[B]前填写正确的字。 例如:提[B题]高、考虑[B虎]。 [L]:漏字标记,用于标示作文中应有而没有的字。用[L]表示漏掉的字,并在[L]前填写所漏掉的字。 例如: 后悔[L],表示“悔”在原文中是漏掉的字。 农[L]药,表示“农”在原文中是漏掉的字。 [D]:多字标记,用于标示作文中不应出现而出现的字。把多余的字移至[D]中D的后面。 例如:我的[D的],表示括号中的“的”是多余的字(原文中写了两个“的”)。[F]:繁体字标记,用于标示繁体字。把繁体字移至[F]中F的后面,并在[F]前填写简体字。 例如:记忆[F憶]、单{F單}纯、养{F養}分{F份}。 注意: 1)繁体字标记标示的是使用正确的繁体字,如果该繁体字同时又是别字,则先标繁体字标记,再标别字标记。

例如:俭朴[F樸[B僕]]。 2)繁体字写错了,标为:后[F後[C]]。 [Y]:异体字标记,用于标示异体字。把异体字移至[Y]中Y的后面,并在[Y]前填写简体字。 例如:偏[Y徧]、沉[Y沈]。 [P]:拼音字标记,用于标示以汉语拼音代替汉字的情况。把拼音字移至[P]中P的后面,并在[P]前填写简体字。 例如:缘[Pyúan]分、保护[Phù]。 [#]:无法识别的字的标记,用于标示无法识别的字。每个不可识别的字用一个[#]表示。例如:更[#][#]保存自己的生命,…… [BC]:错误标点标记,用于标示使用错误的标点符号。把错误标点移至[BC]中BC的后面,并在[BC]前填写正确的标点符号。 例如:勤奋、[BC,]刻苦的精神。 [BQ]:空缺标点标记,用于标示应用标点符号而未用的情况。把[BQ]插入空缺标点之处,并在[BQ]中BQ的后面填写所缺的标点符号。 例如:周围的环境很安静[BQ,]生活也非常平凡。 [BD]:多余标点标记,用于标示不应用标点符号而用了的情况。把多余的标点移至[BD]中BD的后面。 例如:我家周围的[BD,]美丽风景。 2、词处理:(包括成语) {CC}:错词标记,用于标示错误的词和成语。包括4种情况: 1)把词的构成成分写错顺序的。

语料库研究的优势及问题的理论解析

语料库语言学的理论解析 摘要:本文试图剖析有关语料库语言学的几个理论问题,以期揭示语料库语言学的本质。第一:语料库语言学是不是独立的新兴学科?第二:语料库提供的数据到底可以给语言学家带来什么?第三:语料库语言学的真正任务是什么,它应该成为怎样一项研究?回答好这几个问题实际上也就回答了语料库语言学的性质和理论地位,以及这项研究向何处去的问题。这将有助于我们更好地从事基于语料库的语言研究和实践。 关键词:语料库语言学;基于语料库的研究方法;理论架构;语料库数据;发展前景 Abstract: This paper attempts to answer some theoretical questions of corpus-based language studies. Three theoretical considerations are addressed to capture the nature of corpus linguistics. 1) Is Corpus Linguistics an independent branch under the umbrella of linguistics? 2) What can corpus data offer to linguists? and 3) What kind of research that Corpus Linguistics should be? Answers to the three theoretical questions will conduce to a fuller understanding of the nature of corpus-based language studies and their development. Key words: Corpus linguistics; corpus-based approach; theoretical construct; corpus data; future directions 1.0 导言 目前利用语料库从事研究的学者主要有两类。一类是计算语言学家。他们主要从事自然语言处理(NLP)的研究,诸如语音合成、语音识别和机器翻译等等。他们的终极目标并非要揭示语言的本质,而是注重技术层面的研究,比方如何改进算法,如何完善词库的建设以实现技术上的突破。另一类就是语言学家,他们则希望借助这一强大的工具去揭示语言的本质这一学科目标,这正是本文所要关注的。 本文缘起于语言研究者中的一种争论,即“语料库语言学”是否配得上这个名称,它是一种新兴的理论视角还是“暴发户造谱牒”?而本文要探讨的正是有关于语料库语言学研究的理论意义。或者说,语言学家从语料库所提供的信息中到底可以获得什么?这是本文试图解决的核心问题。语料库建设、开发和利用在国内外语言学界日渐兴起,在国内也有相当数量介绍性和综述性文献涌现,为语料库语言学在我国的发展奠定了一定的理论基础。此外,一些语言学者和语言教师(包括外语教师和对外汉语教师)也设计、建立了一些自己的语料库以服务于教学科研。 然而真正对语料库的理论问题进行深入探讨的著述却为数不多。本文将试图剖析语料库语言学的几个理论问题,以期对语料库语言学的优势和不足有进一步的认识。第一:语料库语言学是不是独立的新兴学科?第二:语料库提供的数据到底可以给语言学家带来什么?第三:语料库语言学的真正任务是什么,它应该成为怎样一项研究?回答好这几个问题实际上也就回答了语料库语言学的性质和理论地位,以及这项研究向何处去的问题。这将有助于我们更好地从事基于语料库的语言研究和实践。 2.0 语料库语言学是不是独立的新兴学科? 2.1 语料库语言学是一种理论架构 完全赞成语料库语言学是一种理论架构的几乎没有。只是某些学者比较强调语料库语言学的理论意义。比如,Halliday(1991;1992;1993)指出,语料库语言学作为一种理论架构(theoretical construct),将语料收集和理论概括统一了起来,从而使我们对语言的理解产生一种质变。这种新的理论架构有助于考察同时作为系统和实例(instance)的语言的本质。因为在Halliday的语言学思想当中,实际话语是语言系统的实例再现(instantiation)。而语言系统,或者说是语法体系是一种统计概率上(probabilistic)的自然结果。这一思想与所谓

语料库检索分析在高级英语语篇教学中的应用_语料库检索

语料库检索分析在高级英语语篇教学中的应用_ 语料库检索 语料库检索分析在高级英语语篇教学中的应用_语料库检索摘要语料库语言学通过对自然文本的检索、统计,实现文本的语篇结构、文体风格、语言特征等的量化分析。语料库软件工具如Wordsmith、Concordancer软件等为语篇教学提供了量化分析手段。本文依据语料库语言学的研究方法,主要运用Wordsmith、Antconc软件,以课文"Blackmail"为小型教学语料库,探索高级英语语篇教学的新途径。 关键词语料库检索分析;高级英语;语篇教学1.引言高级英语是英语专业高年级阶段的一门主干课程,其教学目标是"通过阅读和分析内容广泛的材料,扩大学生知识面,加深学生对社会和人生的理解,培养学生对名篇的分析和欣赏能力、逻辑思维与独立思考的能力,巩固和提高学生英语语言技能"1。鉴于此,围绕高级英语课程的教学研究与改革长期以来备受专家、学者和广大师生的关注,如朱传枝2、杨志亭3、刘采敏和楚向群4、李洁平5、黄文英6等。十多年来,随着语言教学理论研究的深入以及计算机网络和多媒体技术的快速发展,高级英语课程改革成绩斐然,教学效果显著提高。然而,在语篇教学中不难发现,由于缺乏科学的文本分析手段和工具,学生对语篇的分析和欣赏"多来自

教师在反复阅读全文的基础上根据某种理论框架或自身独特的理解能力及审美取向所做的解释"7,或者依赖于教学参考书籍上的注解,学习效果大打折扣,成为了困扰教师的一大教学瓶颈。语料库语言学的出现为高级英语语篇教学提供了有力的理论和技术支持,对于解决教学中存在的难题有着重大的启示和意义。 2.语料库与语料库检索分析软件的应用20世纪90年代以来,语料库语言学的迅速发展"给语言研究以及语言应用研究带来了一场革命性的变化"8,而"基于语料库的研究方法已经逐渐扩展到语言教学、话语分析、翻译研究、词典编纂和自然语言处理等多个领域"9。语料库语言学以真实的语言数据为研究对象,通过对大量语言事实进行分析,寻找语言应用的规律和模式。由于语料库研究中的统计数据以实际使用中语言现象的出现概率为依据,且基于语料库而得到的数据避免了偶然性,从而提升了分析结果的可信度。 因此,语料库语言学为语言研究和教学提供了一种全新的模式。 随着计算机信息技术的日新月异,语料库为语言研究提供了空前广泛的语言资料。目前,国际上影响较大的语料库有英国COBUILD语料库(CollinsBirminghamUniversityInternationalLanguageDatabas e)、BNC英语国家语料库(TheBritishNationalCorpus)、CIC 语料库CambridgeInternationalCorpus、ICE语料库

多语种在线语料库检索平台使用简明手册.pdf

多语种在线语料库检索平台使用简明手册 许家金 中国外语与教育研究中心 、访问及登录 访问(用户名:和密码:),可点击使用相应的语料库。目前平台上已安装英语、汉语、德语、日语、俄语、阿拉伯语、冰岛语等数十个语料库。 图:主界面 、功能概要 按()对语料库分析工具的时代划分,属于第四代语料库工具,即在线语料库分析工具。四代工具的突出代表是美国杨百翰()大学教授创建的系列语料库检索界面()。类似的在线语料库检索系统还有、、、等。而当前主流的语料库工具属于第三代,其中以、和等为代表。 第四代语料库工具,将语料库与分析工具合二为一,越来越受到普通用户的青睐。在线语料库工具通常将语料库文本按特定格式建成索引(),存储在服务器上。用户检索响应速度要远高于三代软件在本地电脑上的检索速度。其操作也较三代语料库软件简便得多。 四代语料库工具可完成三代语料库几乎所有的功能,其中又以所能实现的功能最多最全。更重的是,是开源软件。概括说来,可以实现以下功能。 ()在线生成语料库的词频表(); ()查询()字词、语言结构等,以获取大量语言实例或相应结构的出现频次(),并可以按语体、年代、章节、学生语言水平级别、写作题材等分别呈现查询结果; ()计算特定词语在语料库中的典型搭配(); ()计算语料库中的核心关键词(),等。

、使用实例 标准查询模式 在简单查询模式()下,可输入单词、短语等进行检索。 图:语料库查询界面 图:查询结果界面

点击查询结果页面右上角下拉菜单,显示(新查询)时,按键,即可重新回到语料库检索界面。相当于返回按钮。 新查询,返回语料库检索首页 查询结果随机抽样 频数分解、分解频数 查询结果的分布展示 查询结果排序设定 搭配计算 下载保存查询结果 (随机取样),比如,可从万行结果中,随机抽取行。 (频数分解)表示在进行复杂查询时,对命中的不同词项分别计算频数。比如,查询时,会按这个词项分别报告命中频数和频率。 图:动词查询(频数分解)结果示例 :按语体、年代、章节、学生语言水平、写作题材等分别呈现查询结果 图:语料库中"lov.*"的分布情况()

语料库常用统计方法

3.5语料库常用统计方法 第3章前几节对语料库应用中的几种主要技术做了介绍。通过语料检索、词表和主题词表的生成,可以得到一定数量的句子、词汇或结构。为能更好说明所得到的结果的真正意义,常常需要对它们加以统计学分析。本章主要介绍语料分析中的一些常用统计方法。 3.5.1 语料库与统计方法 介绍相关统计方法之前,首先需要了解为什么语料库应用中需要运用统计方法。在2.1节讲到文本采集时,我们知道文本或会话构成了最终的语料库样本。这些样本是通过一定的抽样方法获得的。研究中,我们需要描述这些样本的出现和分布情况。此外,我们还经常需要观察不同语言项目之间在一定语境中共同出现(简称共现)的概率;以及观察某个(些)语言项目在不同文本之间出现多少的差异性。这些需要借助统计学知识来加以描写和分析。 理论上说,几乎所有统计方法都可以用于语料库分析。本章只择其中一些常用方法做一介绍。我们更注重相关统计方法的实际应用,不过多探讨其统计学原理。这一章我们主要介绍语料分析中的频数标准化(normalization )、频数差异检验和搭配强度的计算方法。 3.5.2 频数标准化 基本原理 通常语料检索、词表生成结果中都会报告频数(frequency, freq 或raw frequency )。那么某词(如many )在某语料库中出现频数为100次说明什么呢?这个词在另一个语料库中出现频数为105次,是否可以说many 在第二个语料库中更常用呢?显然,不能因为105大于100,就认定many 在第二个语料库中更常用。这里大家很容易想到,两个语料库的大小未必相同。按照通常的思维,我们可以算出many 在两个语料库中的出现百分比,这样就可比了。这种情况下,我们是将many 在两个语料库中的出现频数归到一个共同基数100之上,即每100词中出现多少个many 。这里通过百分比得到的频率即是一种标准化频率。有些文献中标准化频率也称归一频率或标称频率,即基于一个统一基准得出的频率。 实例及操作 频数标准化,首先需要用某个(些)检索项的实际观察频数(原始频数,raw frequency )除以总体频数(通常为文本或语料库的总词数),这样得到每一个单词里会出现该检索项多少次。在频数标准化操作中,我们通常会在此基础上乘以1千(1万、1百万)得到平均每千(万、百万)词的出现频率。即: 1000?=总体频数 观测频数标准化频率(每千词) (注:观测频数即检索词项实际出现的次数;总体频数即语料库的大小或总形符数。) 例如,more 在中国学生的作文里出现251次,在英语母语者语料中出现475次。两个语料库的大小分别为37,655词次和174,676词次。我们可以根据上面的公式很容易计算出251和475对应的标准化频率。另外,我们还可以利用Excel 或SPSS 等工具来计算标准化频率。比如,可以将实际观察频数和语料库大小如图3.5.1输入相应的单元格,然后在C1单元格里输入=(A1/B1)*1000即可得到中国学生每千词使用more 约为6.67次。要得到母语

最新-莫言的经典名句及赏析 精品

莫言的经典名句及赏析 1、假如你想要一件东西,就放它走。 它若能回来找你,就永远属于你;它若不回来,那根本就不是你的。 2一个人会落泪,是因为痛;一个人之所以痛,是因为在乎;一个人之所以在乎,是因为有感觉;一个人之所以有感觉,仅因为你是一个人!所以,你有感觉,在乎,痛过,落泪了,说明你是完整不能再完整的一个人。 难过的时候,原谅自己,只不过是一个人而已,没有必要把自己看的这么坚不可摧。 3如果真的有一天,某个回不来的人消失了,某个离不开的人离开了,也没关系。 时间会把最正确的人带到你的身边,在此之前,你所要做的,是好好的照顾自己。 4你可以沉默不语,不管我的着急;你可以不回信息,不顾我的焦虑;你可以将我的关心,说成让你烦躁的原因;你可以把我的思念,丢在角落不屑一顾。 你可以对着其他人微笑,你可以给别人拥抱,你可以对全世界好,却忘了我一直的伤心。 ------你不过是仗着我喜欢你,而那,却是唯一让我变得卑微的原因。 5生命中有一些人与我们擦肩了,却来不及遇见;遇见了,却来不及相识;相识了,却来不及熟悉;熟悉了,却还是要说再见。 ------对自己好点,因为一辈子不长;对身边的人好点,因为下辈子不一定能遇见。 6【人的一生】0岁出场,10岁成长,20岁彷徨,30岁定向,40岁打拼,50岁回望,60岁告老,70岁搓麻,80岁晒太阳,90岁躺床上,100岁挂墙上。 生的伟大,死的凄凉,能牵手的时候,请别肩并肩,能拥抱的时候,请别手牵手,能相爱的时候,请别说分开。 一生就这么短暂而已。 7时候,希望自己快点长大,长大了,却发现遗失了童年;单身时,开始羡慕恋人的甜蜜,恋爱时,怀念单身时的自由。 ———很多事物,没有得到时总觉得美好,得到之后才开始明白我们得到的

基于语料库的海明威作品《雨中的猫》分析

基于语料库的海明威作品《雨中的猫》分析 ——以写作风格和小说主题为例 王树振 (天津师范大学外国语学院,天津, 300387) 【摘要】美国著名作家厄内斯特·海明威的短篇小说《雨中的猫》(1922),自发表以 来便引起文学评论界的极大关注。在作品中,通过对一个日常生活片段的叙述,作者 揭示了女性生存困境的主题。而基于语料库的文学研究,则是通过利用语料库检索软 件来考察作者的写作风格、解读作品的主题。在前人研究的基础之上,笔者拟运用语 料库语言学的方法对这部小说进行更深入的研究。通过使用Wordsmith和AntConc等 语料库检索软件,笔者拟对《雨中的猫》进行词语、句子及篇章结构进行统计分析, 最后不仅能够分析得出海明威用词简单、句子简短的写作风格,还能利用关键词检索 和自动生成的语境,来了解小说的主要内容和人物形象的塑造,这为解读小说的主题 提供了新的研究方法和途径。 【关键词】语料库检索;写作风格;主题 近年来, 国内外不少学者将语料库研究方法应用到文学领域,利用语料库检索软件对文本进行分析, 如Sinclair(1991)、Biber(2000)、张厚振(2004)、肖普勤(2005)等。他们的研究大胆创新,为后来的文学研究者带来很大的启示。正如Sinclair(1991: 36)所论述的那样,“(语料库检索)最激动人心的方面不是对描述进行直观的分类,而是为找到新的方法、新的证据以及新的描述提供可能。在这里,计算机技术的客观性和表面的正当性变成了一种优势,而不是没有放弃直觉前提下的一种责任。当然,我们要尽力找到符合证据的解释,而不是为了迎合现有的解释而去修改我们的证据。” 《雨中的猫》是美国著名小说家海明威的著名短篇,故事情节主要围绕一只雨中的猫展开,叙述了旅居意大利的一对美国夫妻的一段生活场景。本文用Wordsmith及AntConc的Wordlist、Concordance和Keyword对《雨中的猫》的文本特征、主要内容、人物形象和文本主题进行分析,以展示语料库检索软件在文学分析方面的强大功能。 一、基于词表的文本总体特征分析 基于语料库的语言研究一般采取定性与定量相结合的研究方法,要进行定量研究就要涉及文本检索和数据统计。Wordsmith软件中的Wordlist工具可以对文本的基本信息进行统计,自动生成词表(图1)。它可以提供文本中的简略统计数据,从而有助于分析文本的总体统计特征和基本情况。

莫言经典代表作

莫言,山东高密人,1955年2月17日生。出身于农民家庭,小学未毕业即辍学,在农村劳动多年,其间曾经到棉花加工厂做过临时工。1976年2月应征入伍,在部队历任战士、班长、教员、干事、创作员等职。1997年10月转业到报社工作。先后毕业于解放军艺术学院文学系和北京师范大学研究生班,获文艺学硕士学位。 莫言自1980年代中以一系列乡土作品崛起,充满着“怀乡”以及“怨乡”的复杂情感,被归类为“寻根文学”作家。莫言的作品深受魔幻现实主义影响,写的是发生在山东高密东北乡的“传奇”。莫言在他的小说中构造独特的主观感觉世界,天马行空般的叙述,陌生化的处理,塑造神秘超验的对象世界,带有明显的“先锋”色彩。他的作品被译成多国文字,日本诺贝尔文学奖获得者大江健三郎认为,莫言是中国问鼎诺贝尔文学奖的人选。 1980年开始创作,著有长篇小说《红高粱家庭》、《天堂蒜薹之歌》、《十三步》、《酒国》、《丰乳肥臀》、《檀香刑》等八部,中篇小说《透明的红萝卜》、《爆炸》、《白棉花》等二十四篇,短篇小说《白狗秋千架》、《枯河》、《拇指铐》等六十余篇,电影、电视、话剧剧本等多部。 代表作《红高粱》内容摘要: 1987年《红高粱》获第四届全国中篇小说奖。根据此小说改编并参加编剧的电影《红高粱》获第38届柏林电影节金熊奖。 1986年发表的中篇小说《红高粱》,为莫言的成名之作。书中创造了莫言的文学王国“高密东北乡”,通过“我”的叙述,描写了抗日战争期间,“我”的祖先在高密东北乡轰轰烈烈、英勇悲壮的人生故事。《红高粱》曾荣获第4届全国中篇小说奖,被译成近二十种文字在全世界发行。据此改编的电影《红高粱》获第38届柏林电影节金熊奖。 《红高梁》是莫言的成名作之一,是一部宣扬生命个性、赞美生命的中国新时期小说,它曾被张艺谋改编为电影并获得第38届西柏林国际电影节“金熊奖“,轰动中外。小说中所描绘的具有中国特色的民族印象,散发的中国民族魂,无疑使这部作品具有了与以往“寻根小说”所表达的主题的相异性。小说展现出的一系列独特意象:“颠轿”、“野合”、“敬酒神”等撼人心魄的情景,那方圆百亩随风摇曳、舒展活泼且情感热烈的棵棵高梁;那人迹罕至、充满神奇色彩的十八里坡;那血红的太阳、血红的天空与血红的高梁……所有这一切,都能给我们以强烈的艺术感染力。 代表作《丰乳肥臀》内容摘要: 1996年《丰乳肥臀》获首届大家.红河文学奖。 1997年《丰乳肥臀》夺得中国有史以来最高额的“大家文学奖”,获得高达十万元人民

出自莫言作品的经典句子

出自莫言作品的经典句子 1、黄昏是青春短暂的悲伤。 2、回首。才看见我们是以快乐的心情写悲伤的青春。 3、 即使世界遗忘了你, 也总会有那么几个人在你生命的伊始之日, 道一声: 生日快乐! 4、极度的顺从是悖逆。 5、 结婚是两个人的事, 离婚, 便是那只西伯利亚的蝴蝶, 远远地拍拍翅膀, 全城就可来场飓风。 6、久远是迷途里酝酿的酒。愈陈愈香。 一点点语录网 7、恋爱时钞票拿来更换靓衣买到浪漫,婚姻时钞票要用来供奉柴米油盐解 决尿不湿。 8、恋爱是心理享受,婚姻是刻板方程式。 9、恋爱是一加一等于零两人亲得像一个人,婚姻是一加一等于三生个孩子 完成优生。 10、满腹经纶是黔驴之技。易于迁延与迟滞。 11、安然的在被窝中躺过一世春秋。浑噩自知。 12、把每一个句子 后面加一个完结的句号,记作虚无而迷惘的守候。 13、不管是男人还是女人,都是在爱情中学习爱,在失败中总结经验 ,以更好的姿态重新爱。 14、呆坐在眼睛里的空洞和茫然,凝结成氤氲的哀伤,在青春的天空渐渐延 伸和漫散。 15、当笔下肆意挥洒的心情化为文字,我将用它记录永生。 16、当时光碾过青春,我将以快乐注解悲伤。 17、因了命途中的你们,我才没有荒芜了青春。 18、有些人,在不经意间,就忘了;有些人,你想方设法,都忘不了。 19、月光下,我用繁冗拖沓的文字祭奠我的青春,纪念我死去的友情和迟到 的爱情。 20、在年生里。我们因无知荒唐而美丽。 21、这个世界不是我们的敌人,也不是我们的朋友。这个世界可能是天堂, 也可能是地狱, 这全取决于我们的态度, 取决于我们如何去看它, 如何去制造它。 22、智慧与非智慧,区别便在其中。笨女人将自己的优越五分夸张成十分,
1/5

北京语料库检索使用说明

北京语料库检索使用说明 首页 一关于CCL语料库及其检索系统 二关于查询表达式 2.1 特殊符号 2.2 基本项 2.3 简单项 2.4 复杂项 2.5 过滤项 2.6 子句 2.7 查询表达式 三关于查询结果 四在结果中查找 五举例 一关于CCL语料库及其检索系统 1.1 CCL语料库及其检索系统为纯学术非盈利性的。不得将本系统及其产生的检索结果用于任何商业目的。CCL不承担由此产生的一切后果。 1.2 本语料库仅供语言研究参考之用。语料本身的正确性需要您自己加以核实。 1.3 语料库中所含语料的基本内容信息可以在“高级搜索”页面上,点击相应的链接查看。比如: “作者列表”:列出语料库中所包含的文件的作者 “篇名列表”:列出语料库中所包含的篇目名 “类型列表”:列出语料库中文章的分类信息 “路径列表”:列出语料库中各文件在计算机中存放的目录 “模式列表”:列出语料库中可以查询的模式

1.4 语料库中的中文文本未经分词处理。 1.5 检索系统以汉字为基本单位。 1.6 主要功能特色: ?支持复杂检索表达式(比如不相邻关键字查询,指定距离查询,等等); ?支持对标点符号的查询(比如查询“?”可以检索语料库中所有疑问句); ?支持在“结果集”中继续检索; ?用户可定制查询结果的显示方式(如左右长度,排序等); ?用户可从网页上下载查询结果(text文件); 二关于查询表达式 本节对CCL语料库检索系统目前支持的查询表达式加以说明。 2.1 特殊符号 查询表达式中可以使用的特殊符号包括7个: | $ # + - ~ ! 这些符号分为三组: Operator1: | Operator2: $ # + - ~ Operaotr3: ! 符号的含义如下: (一) Operator1: Operator1是二元操作符,它的两边可以出现“基本项”(关于“基本项”的定义见2.2) (1) | 相当于逻辑中的“或”关系。 (二) Operator2:Operator2是二元操作符,它的两边可以出现“简单项”(关于“简单项”的定义见2.3) (2) $ 表示它两边的“简单项”按照左边在前、右边在后的次序出现于同一句中。两个“简单项”之间相隔字数小于或等于Number (3) # 表示它两边的“简单项”出现于同一句中,不考虑前后次序。两个“简单项”之间相隔字数小于或等于Number

基于语料库、体裁分析和建构

基于语料库、体裁分析和建构 【摘要】本文回顾了英语概要写作国内外的研究现状,通过大学英语概要写作语料库研究了英语概要写作的语场特征,提出了基于语料库、体裁分析和建构主义教学模式相结合的支架式英语概要写作教学模式,本研究对于提高英语读、写结合教学具有重要意义。 【关键词】概要写作语料库体裁建构主义 概要(summary)是一种对原始文献(或文章)的基本内容进行浓缩的语义连贯的短文。它以迅速掌握原文内容梗概为目的,不加主观评论和解释,但必须简明、确切地表述原文的重要内容。概要写作(summary writing)是一种控制性的作文形式,它能使学生通过阅读原文,吸收原文的文章结构与语言方面的长处,写出内容一致、结构近似、语言简洁的短文。这种写作既要准确理解原文,又要能综合概括;既能培养欣赏能力,又能训练书面表达能力。 1 英语概要写作研究综述 曾炳辉(1989)在《英语概要写作与智力训练》中论述了概要写作是训练抽象概括能力即思维能力的最好的形式之一;郑文(2007)就大学英语读写过程中存在的输入和输出的矛盾,提出利用阅读教材作为写作输入,培养篇章图式;利用概要写作训练作为写作输出,揭示学生篇章图式的不足,提高学生的读写水平;张新玲和曾用强(2009)在《读写结合写作测试任务在大型考试中的构念效度验证》中从构念效度的实质方面入手对这类任务在我国大规模考试中所得分数进行效度验证,发现所取样本考生的读写结合写作测试应答数据和构念理论相拟合。 而国外学者,已经开始运用语料库,体裁分析理论,语篇分析理论和形式结构分析理论研究概要写作,如Rosalie Friend的“Effects of Strategy Instruction on Summary Writing of College Students”;Daniel Marcu的“From text discourse structures to text summaries”;Esther Uso Juan和Juan Carlos Palmer Silveira的“A Product-Focused Approach to Text Summarisation”;Sa-Kwang Song,Dong Hyun Jang,Sung Hyon Myaeng的“Text Summarization Based on Sentence Clustering wi th Rhetorical Structure Information”以及Jade Goldstein Stewart的“Genre Oriented Summarization”等。 2基于语料库的英语概要写作研究 语料库语言学研究的诞生可以追溯到19世纪末,二十世纪中叶以后随着计算机的广泛普及与使用,现今语料库的规模越来越大、种类越来越多,利用语料库进行语言研究和语言学习的人也就越来越方便。本研究建立了大学英语概要写作语料库,其目的是通过语料库来研究大学英语概要写作的篇章及体裁的一部份特点,为大学英语概要写作的教学及测试评价提供一定的依据。大学英语概要写作语料库中包括两个子语料库:概要写作原文库,概要写作库。每个子语料库按

名家散文赏析-莫言

名家散文赏析: 静静的想念 莫言 好久没有写了,这人,闲着闲着就懒了,什么也不想做了,大脑可能要生锈了吧,或许,真的是这样子了。 清明节又到了,没能回家,好几年了,想回家去看看你们的,可每次都没能回去。呆在宿舍,静静就这样,静静地想你们。我们这,这几天下雨了,不知你们那怎样,你们可好

您离开我们已经好多年了,家人都很想你们,回家过年,大家聚在一起,吃吃喝喝,谈天说地,但总觉得少了点什么。家里的条件比起以前是好的得多了,可是你们却已经不在了。出生在艰苦的岁月,受尽旧社会的折磨,好不容易社会好了么,你们又都不在了。 奶奶在的时候吧,我们总嫌您唠叨,一天大事小事都要说,那时的我们很不能理解您怎么会有那么多的话要说,等到我们兄妹长大,能够理解其中包含的意思的时候,您却已经

不在了。再也听不过不到您唠叨的声音了。 爷爷奶奶要是在的话该多好,家里多了好几口人,要是你们还在,都可以和重孙们一起玩了。无论在哪里,看到老人,我都会想起你们来,太多的回忆,太多的思念。 还记得小学的时候,每天放学回家,奶奶都已经给我们煮好了可口的饭菜,别家的小孩都在找爸妈拿钥匙的时候,我们已经吃饱了。初中的时候,一星期回家一次,每次,我和哥哥回家,奶奶都特别的高兴,拉着我们问这问那的,生怕我们饿着,晚上

睡觉冷着,姑妈她们给她买的好吃的,她都留给我们回来吃,要去学校的时候,吃的用的都往我们包里塞,那时候,真的很幸福。 放假回家,奶奶还给我们兄妹讲她们那几年的奋斗史,怎样度过那些艰苦的岁月,土匪怎么来抢人,抢东西的,怎么集体劳动的,村里的小孩被老虎叼去,修护城河的艰苦。。。奶奶的经历,就是一本很厚的书,所有的苦难,所有的辛酸,用血和汗写成的一本书。

语料库话语分析综述

近十年国内基于语料库的话语研究综述 A Review of Ten - year Research on Corpus-Based Discourse Analysis in China 摘要:文章从基于语料库的话语研究领域出发,通过对2002年至2011年发表在国内八种核心期刊上的论文进行统计与分析,发现这些研究在研究领域取得了很大的进步,涉及到话语各个方向,对于实践有重大指导作用,但同时也出现一些问题值得我们关注。 Abstract: From corpus-based discourse analysis, this thesis finds this field has made great progress, relates to many directions of discourse and has a significant guiding role for the practice, but also brings many problems worthy our attention. All of these are derived from the research and analysis of thesises published in 8 kinds of core journals from 2002 to 2011 in China. 关键词: 语料库话语基于语料库的话语研究 0. 引言 现代语料库语言学是20世纪中后期兴起的一门语言研究科学。语料库是指按一定的语言学原则,运用随即抽样的方法,收集自然出现的连续的语言运用文本或话语片段而建成的具有一定容量的大型电子文库。在20 世纪后半叶的西方语言学界, Chomsky的观点大行其道,秉承该学说的语言研究者唯直觉语料独尊。他们躲在书斋,满足于依靠自己的直觉语料从事语言研究。随着社会语言学、话语分析、语用学、语料库语言学的兴起,越来越多的语言学家认识到光靠直觉语料来研究语言是远远不够的,人们还必须借助语料库语料以及其他各种语料,只有这样我们才能更好地揭示语言的本质,克服直觉语料的局限与不足。这样基于语料库的话语研究越发引起大家的重视,并取得了丰硕的成果。国内基于语料库的话语研究虽然起步较晚,但是成果仍然颇丰。 1. 研究样本 由于近几年运用语料库来做话语研究已经成为语言研究的热点,笔者通过检索主题与关键词,将文献定在2002年至2011年这十年期间,研究样本来源为发表在八种外语类核心期刊的22篇文章。这是因为这8种外语类期刊有一定的权

语料库检索程序concapp使用简介

Wikipedia:语料库一词在语言学上意指大量的文本,通常经过整理,具有既定格式与标记。百度百科:关于语料库的三点基本认识:语料库中存放的是在语言的实际使用中真实出现过的语言材料;语料库是以电子计算机为载体承载语言知识的基础资源;真实语料需要经过加工(分析和处理),才能成为有用的资源。 Concapp由香港理工大学虚拟语言学习中心发布,是一款针对语料库的检索软件,主要支持英语语料的处理,汉语和日语语料的处理不够理想。 Concapp在英文科技论文写作中,可以帮助我们了解其他文献(尤其是native speaker的论文)中一些词的用法。 使用: 1.concapp只能处理txt格式的文档,首先应将所用文献由pdf转为txt。 2.Concapp无需安装,直接双击exe文件(小于1M)即可运行。

3.单击菜单栏concordance选项,单击concordance search(F5)。 或直接单击菜单栏下的图标(图中标黑框)。 弹出对话框

其中Unicode是使用双字节对字符进行编码的统一码。一般选择ANSI,单击OK。 弹出对话框 对话框中,在Search string栏输入检索词。 File栏:Open是对打开的文件进行检索,Directory则是对目标文件夹中的文件进行检索。Search Option栏:Word/phrase: 搜索单词和短语,Prefix:搜索前缀,Suffix: 搜索后缀,Any string: 搜索出现在任何位置 例如,输入检索词efficiency。单击OK

弹出对话框 从中可以选择文件。可以选择一个或几个txt文档,或者单击最下面的Select all matching files,从而选中该文件夹中的全部txt文档。 弹出窗口

如何利用语料库辅助语言教学与研究(BNC)

如何利用语料库辅助语言教学与研究(BNC) 一、绪言 语料库是专门用于语言材料检索和统计的工具,包括为某一目的而收集的大量电子文本(加标注或未加标注)和专门的语料检索和管理程序。其最大的特点是能快速提供大量真实的语言材料并进行相关统计(如词频和搭配词等),已广泛运用于词典、教材、语法书和词汇表等的编纂及语言研究中。然而,语料库在日常外语课堂教学和学生自主学习中并没有得到广泛运用,至少在中国是如此。这一方面是由于对语料库在教学中的运用缺乏有力推广,加价格、市场等因素使得购买商用语料库有难度,自己建设语料库又需花费较大精力,另一方面人们对如何获取网上免费语料库资源缺乏了解。 语料库在日常英语课堂教学和学生自主学习中能够起到多种作用。作为一种高效的语言检索工具,它所提供的大量真实语言实例能提示从构词、词短语到句法结构乃至语篇几乎所有语言单位的语言生态(language ecology),包括语境、搭配规律、使用频率、语义和语用等。语料库的获得和个人建设虽然面临诸多困难,但幸运的是,开放的互联网为广大英语教师和英语学习者提供了接触和使用语料库的机会。 二、网络语料库的运用 1.英语单语语料库 目前,语料库运用于日常英语课堂教学的主要还是英语单语语料库,互联网上的情况也是如此。网上有许多大型通用语料库(单语)提供在线检索,其免费服务虽功能有所限制,但已能满足中学英语教学和学生自主学习的需求。如1亿词次的英语国家语料库(BNC)()和5600万词次的柯林斯在线词库(Collins Wordbanks Online)(www. Collins. https://www.doczj.com/doc/8813530674.html,/corpus/CorpusSearch.aspx)。二者均是当今较权威的英语语料库,其语料语域广泛,有较好代表性,且均做了词性赋码(Part-of-speech tags)。这些在线检索提供通配符功能(wildcard)、连续和非连续的词组或搭配检索功能(word combination),并能指定检索词词性,功能强大,检索方便,可在日常中学英语教学中加以运用。

莫言作品_蛙_的语料库检索分析_陈婵

第5期总第128期 2014年9月浙江工商大学学报JOURNAL OF ZHEJIANG GONGSHANG UNIVERSITY No.5Vol.128Sep.2014收稿日期:2014-04-11 基金项目:国家社会科学基金项目 “英语学术论文语篇的话语策略研究”(13BYY157)作者简介:陈婵,女,浙江工商大学外国语学院讲师,主要从事语料库文体学和话语分析研究;程乐,男,浙江大学外国语言文化与国际交流学院教授、博士生导师,法律话语与翻译中心主任,主要从事语料库、符号学以及专门传意等研究,系本文通讯作者。 莫言作品《蛙》的语料库检索分析 陈婵1,程乐2 (1.浙江工商大学外国语学院,杭州310018;2.浙江大学外国语言文化 与国际交流学院,杭州310058) 摘 要:文章利用语料库检索软件Antconc ,对莫言的小说《蛙》从主题、故事情节和人物 形象塑造等方面进行了较为深入的分析。首先,利用Antconc 的主题词功能提取出主题词并进行归类,结果不仅印证了《蛙》的主题与计划生育密切相关,而且也反映出《蛙》与莫言其 他作品之间的延续性以及作品中乡土立场和人文立场的统一。然后,利用Antconc 的索引功 能对主要角色“姑姑”进行检索,对每一条检索结果根据其描述内容和情感倾向做了人工标 注并统计,分析结果显示,对“姑姑”的感情生活、容貌性情以及身世等方面看似与主题无关 的描写实际上对小说人物塑造、情节发展都起到了至关重要的作用。 关键词:语料库;莫言;蛙;主题词;检索 中图分类号:I06文献标志码:A 文章编号:1009- 1505(2014)05-0026-09A Corpus-based Analysis of Mo Yan's Novel Frog CHEN Chan 1,CHENG Le 2 (1.School of Foreign Languages ,Zhejiang Gongshang University ,Hangzhou 310018,China ; 2.School of International Studies ,Zhejiang University ,Hangzhou 310058,China ) Abstract :The present paper applies the corpus retrieval software ,Antconc ,to study Mo Yan's novel Frog from the per-spectives of theme ,plot ,and means of character shaping.The extracted keywords not only confirm the theme of Frog is closely related to family planning ,but also reflect the continuity between Frog and other works of Mo Yan as well as the unity of local standpoint and humanistic position in the novel.Furthermore ,by annotating manually all the retrieval results of the major role “Aunt ”according to their contents and emotional tendency ,the paper finds that the seemingly irrelative descriptions of aunt's love and family life ,appearance and temperament ,actually play a critical role in character shaping and plot development. Key words :corpus ;Mo Yan ;Frog ;key words ;retrieval

相关主题
文本预览
相关文档 最新文档