当前位置:文档之家› 语料库研究的优势及问题的理论解析

语料库研究的优势及问题的理论解析

语料库研究的优势及问题的理论解析
语料库研究的优势及问题的理论解析

语料库语言学的理论解析

摘要:本文试图剖析有关语料库语言学的几个理论问题,以期揭示语料库语言学的本质。第一:语料库语言学是不是独立的新兴学科?第二:语料库提供的数据到底可以给语言学家带来什么?第三:语料库语言学的真正任务是什么,它应该成为怎样一项研究?回答好这几个问题实际上也就回答了语料库语言学的性质和理论地位,以及这项研究向何处去的问题。这将有助于我们更好地从事基于语料库的语言研究和实践。

关键词:语料库语言学;基于语料库的研究方法;理论架构;语料库数据;发展前景

Abstract: This paper attempts to answer some theoretical questions of corpus-based language studies. Three theoretical considerations are addressed to capture the nature of corpus linguistics. 1) Is Corpus Linguistics an independent branch under the umbrella of linguistics? 2) What can corpus data offer to linguists? and 3) What kind of research that Corpus Linguistics should be? Answers to the three theoretical questions will conduce to a fuller understanding of the nature of corpus-based language studies and their development.

Key words: Corpus linguistics; corpus-based approach; theoretical construct; corpus data; future directions

1.0 导言

目前利用语料库从事研究的学者主要有两类。一类是计算语言学家。他们主要从事自然语言处理(NLP)的研究,诸如语音合成、语音识别和机器翻译等等。他们的终极目标并非要揭示语言的本质,而是注重技术层面的研究,比方如何改进算法,如何完善词库的建设以实现技术上的突破。另一类就是语言学家,他们则希望借助这一强大的工具去揭示语言的本质这一学科目标,这正是本文所要关注的。

本文缘起于语言研究者中的一种争论,即“语料库语言学”是否配得上这个名称,它是一种新兴的理论视角还是“暴发户造谱牒”?而本文要探讨的正是有关于语料库语言学研究的理论意义。或者说,语言学家从语料库所提供的信息中到底可以获得什么?这是本文试图解决的核心问题。语料库建设、开发和利用在国内外语言学界日渐兴起,在国内也有相当数量介绍性和综述性文献涌现,为语料库语言学在我国的发展奠定了一定的理论基础。此外,一些语言学者和语言教师(包括外语教师和对外汉语教师)也设计、建立了一些自己的语料库以服务于教学科研。

然而真正对语料库的理论问题进行深入探讨的著述却为数不多。本文将试图剖析语料库语言学的几个理论问题,以期对语料库语言学的优势和不足有进一步的认识。第一:语料库语言学是不是独立的新兴学科?第二:语料库提供的数据到底可以给语言学家带来什么?第三:语料库语言学的真正任务是什么,它应该成为怎样一项研究?回答好这几个问题实际上也就回答了语料库语言学的性质和理论地位,以及这项研究向何处去的问题。这将有助于我们更好地从事基于语料库的语言研究和实践。

2.0 语料库语言学是不是独立的新兴学科?

2.1 语料库语言学是一种理论架构

完全赞成语料库语言学是一种理论架构的几乎没有。只是某些学者比较强调语料库语言学的理论意义。比如,Halliday(1991;1992;1993)指出,语料库语言学作为一种理论架构(theoretical construct),将语料收集和理论概括统一了起来,从而使我们对语言的理解产生一种质变。这种新的理论架构有助于考察同时作为系统和实例(instance)的语言的本质。因为在Halliday的语言学思想当中,实际话语是语言系统的实例再现(instantiation)。而语言系统,或者说是语法体系是一种统计概率上(probabilistic)的自然结果。这一思想与所谓

语言学规则是浮现特征(emergent properties)的说法颇为暗合(李平,2002)。也就是说,因为严格设计并创建的语料库所包含的应该是真实文本和真实话语,其中语言实例在出现频率上的优势即是对其背后语法体系的概率体现。另外,我们知道Halliday功能主义思想中的一个重要概念就是“意义的选择”(Halliday, 1985)。这种意义的选择反映了语言运作的内在机制。语料库辅之以计算工具,便可以将这些机制进行抽象概括从而形成语法。

这里特别值得一提的是,上述思想是与Chomsky的心灵主义相对立的。Chomsky历来认为语言是一种天赋能力,而自然语料都是杂乱无章的。其中包括很多显然不会出现的,或者错误的句子,还有很多诸如迟疑,注意力的不集中和外界的干扰等等。所以他主张我们研究的应该是理想的听话人/说话人的语言能力(Chomsky, 1965)。因而Chomsky提倡通过内省和诱发的手段来获得语言资料,而反对使用语料库进行语言研究的。

2.2 语料库语言学是一种基于语料库的研究方法

然而,尽管众多语言学家承认语料库对语言研究的巨大贡献,他们并不认为语料库语言学像语言学其他分支一样成为独立的学科领域。

Tognini-Bonelli(2001)对语料库语言学的性质进行了重新思考。她指出语料库语言学并不是一个真正意义上的科学研究领域,只不过是为语言研究提供了一种方法论基础,同时它又给语言学的研究提供了新的哲学思路。所以它是介于理论和方法论之间的一种东西。应该说她的这一观点代表了相当多语言学家的看法。

比如,Leech(1992)说过,“……[语料库语言学]倒是更应该被看作是从事语言研究的一种方法论基础。理论上(而且常常在实践当中)语料库语言学与其他语言学分支轻松结合:我们能够借助语料库研究语音学,句法……。”(p. 105)

Leech在这里明确指出了语料库语言学的工具性和方法论价值。但同时他又表示:

“语料库语言学不仅界定了一种研究语言的方法论,……而且事实上界定了该项研究课题的一些哲学/理论视角。”(pp. 105-6)

换言之,借助于语料库语言学所提供的方法,语言学家一方面可以验证由内省得到的语言规则,也可以基于语料库提供的数据推演出语法、语用规则。由于不同类型的语料库和丰富的标注手段的出现,语料库语言学使我们的研究视野更加开阔,研究手段也愈加强大了。

综上所述我们认为,基于语料库的研究方法(corpus-based approach)这一提法倒是更能准确地反映语料库语言学的性质和定位。

3.0 语料库提供的数据到底可以给语言学家带来什么?

明晰了语料库语言学的理论定位之后,接下来我们要看一看语料库数据真的能反映语言的本来面貌吗?从现有的语料库的规模、类型来看,语料库所提供的数据有以下特点:

3.1 产品/过程对立问题

从某种意义上讲,语料一旦入库,它所记录的便是语言的产品(product)而不是语言的过程(process)。虽然在定义“语料库”的时候,总少不了提到“自然语言”和“真实文本”这样的概念。但是,实际现场即席话语中的很多鲜活的内容(如:情景语境和文化语境)入库之后即不复存在。毕竟多数语料库所记录的都是文本的或少量的声音信息。由大规模的多媒体数据构成的语料信息还很少见。一则是数据收集的工作量巨大;更重要的是在实际操作中,一旦进行录像,就难免会引起受调查者主观上的注意,从而影响语料的信度和效度。因此在尽可能多地收集多媒体语料的同时,还要认识到收集语料的局限和现有语料的先天不足。面对已有的语料,要想真正研究语言的本质和实际运作,还需借助诸如句法学、话语分析、语用学、社会学、人类学、民俗学等其他理论手段,对语言使用的真实状态进行描写,接近其本质特征。

3.2 取样范畴和代表性问题

毋庸置疑,所有语料库建库人都力图使其创建的语料库足以代表或反映其所要研究的目标语域或整个语团的语言事实。因此在创建初期都会对语料库的设计、取样进行科学的分析(Biber, 1993; Biber, 1994; Greenbaum, 1991; Nelson, 1996)。但是有一点我们必须认识到,我们无论如何也无法穷尽“某种语言的全体使用者说出来(或写下来)的和尚未说出来(或写下来的)所有话语”(顾曰国,1999:3),因为它是一个开放集。我们是无法真正捕获理论上的语言的全貌的。因而为了尽可能地(至少在统计上)反映语言的实际状况,取样的方法在一定程度上可以满足我们研究的需要。与之紧密关联的一个重要概念是“代表性”问题。也就是说所收集的语料是否可以在统计上代表各种类型的真实话语。此时,语料库的大小绝不是一个关键问题。因为在现有技术条件下,一个人可以在数小时之内收集数以亿计(词次)的电子文本。当然,真实的口语语料的收集则要困难得多。

另外,语料类型的代表性还应与研究需要紧密结合。建库人可以根据需要收集某一语域的口语或书面语的共时语言实例;也可以收集该语域历时的语言实例(比如:赫尔辛基英文文本语料库历时部分);还可以建用于翻译或对比研究的双语或多语的平行语料库;还有像国际英语语料库(ICE)那样的某一语言的不同变体之间的语料库;还有研究一语、二语或外语学习者(口语、笔语)语料库等等。从理论上来讲,只要我们按照严格的统计取样(辅以前期实验性取样并验证)的办法去收集,就可以获得我们所想要的具有足够代表性的语料。

3.3 有无多重标注和强大的处理工具

语料库标注的好坏,类型的多寡和有无适合专项研究的处理软件很大程度上决定了语料库的有用程度。自从最早的计算机化的Brown和LOB语料库进行了POS(Part-of-Speech)标注之后,利用这两个语料进行研究的成果激增。当然我们也注意到迄今为止,只有词汇层次的标注较为成熟,基本上可以实现正确率很高的自动标注。这也就是为何在利用语料库所从事的研究中,词典编纂以及相关的教材开发方面的成果最为显著。

其实语料库标注可以被理解为一种元语言形式。它是对原始语料进行一种初步的静态的注解。词性标注是这样,某些句法层的标注也是这样。曾经还听说有人将所有语料进行主位、述位的标注,以便对其施行系统功能分析。因此如果对口语语料再进行音段和超音段的标注,那将会给对话语的动态分析带来极大方便(参见:Chafe, 1993; Chafe et al, 1991; Du Bois et al, 1993)。

说到语料库的处理工具,主要有转写工具(transcriber)、检索工具(concordancer),对齐工具(aligner)和其它一些统计工具等等。这些计算机程序的出现使语料库语言学的定性与定量相结合的方法成为可能。因为一方面它可以根据语言学家的研究需要,生成针对某一种语言形式的数量信息或者分布状况。目前已经有很多比较成熟的语料库工具软件。但是,为了更好地服务研究的需要,设计符合研究者自身要求的专项软件非常必要。

3.4 异例与不规范语言实例的处理

这是一个极其重要的问题,也是生成语法学派重点攻击的一个方面。Chomsky(1965)指出:“语言学理论主要关心的是理想的听话人(说话人),他们处在完全同质的语言社团中,……他不受与语法无关的条件的影响,如记忆力的限制、外界的干扰、注意力和兴趣的转移和口误……”

而语料库所提供的数据因为要体现其真实性(authenticity),所以遵循的原则是尽可能将实际话语原原本本地记录下来。因而说话当中的迟疑、口误都被录入语料库。那么,如此“泥沙俱下”的语料是语言学家所要追求的目标吗?对此,有些学者认为这正是语言的丰富性之所在,反映了语言的本来面目。这一点在理论上似乎无可厚非,然而在实际话语中,支离破碎的句子在出现频率上要远高于语法上规范的句子(Aarts, Jan, 1991: 58),那么这是否意味着我们应该忠实地将这些破碎的甚至是错误的句子写进语法书,或是口语教科书,并告

诉孩子们、学生们我们说话时应该如此呢?显然这不是一个理性的处理办法。语法作为一种规范或者一种准则,必须进行一定的抽象和概括。而对于传统语法所忽略的一些话语在动态使用中的一些特征和机制当然也应当补充进去。

综上所述,要想获得理想的语料库数据,我们就应该采取科学的取样方法,尽可能囊括各种类型的口头和书面话语,包括各种语体,语言的各种变体。对语料进行尽可能多的适合不同研究需要的标注。对于口头话语的记录,既要有文字形式的标注,还要有语法、韵律层次等的标注(比如学习者的中介语语料库,就需要错误类型标注)。而且,在均衡取样的情况下,语料库规模应该越大越好。

4.0 语料库语言学的真正任务是什么,它应该成为怎样一项研究?

语料库语言学应该成为怎样一项研究呢?基于前文所讲的语料库的优势和不足,我们认为语料库语言学应该强化其定量定性相结合方法。这就需要语料库语言学家在掌握计算、统计这样的定量方法的同时,注意充分地运用理论语言学方面的最新成果,弥补定量分析的一些弱点。这就对语料库语言学家的素质提出了要求。此外,我们知道基于语料库的语言研究最终是为了解释语言,那么,语料库语言学对语言学会产生什么样的影响呢?

4.1 语料库语言学家的职责

语料库语言学要想真正揭示语言在实际使用中的情况,首先需要有前文所提到的理想的语料库以及相应的工具软件和一整套适合语料库语言学的语言研究理论。这一重任就落到了语料库语言学家的人身上。他们应该是怎样的一种身份或者具备怎样的素质才算比较理想呢?(1)语言学家+计算机科学家;(2)具备语言学理论知识的计算机科学家;(3)具备计算机知识的语言学家。一般看来,应该是第一种组合,而事实我们认为第三种才是一种比较切合实际的要求。首先,语料库语言学的研究对象是语言;其次,研究中对计算机知识的要求并不是很高,具备计算机知识的语言学家只需要知道哪些功能在技术上能实现就可以了,编程的工作交由专门的技术人员去完成便可以了。对语言的本质应该是语言学家的终极目标,语料库语言学家自然也不例外。他们应该在前人近百年的研究的基础上更进一步,完成很多语言学家因为技术手段上的制约想完成却无法完成的任务。

4.2 语料库语言学的语言学地位

自1961年最早的Brown计算机化语料库的诞生,到了上个世纪八、九十年代语料库语言学掀起的一股热潮传播至今。那么它对语言学的发展到底会产生怎样的影响呢?虽然如前文所述,语料库语言学为语言学的研究提供了新的哲学思路,但我们认为它在语言研究方法论上的意义更加深远。它使我们有办法利用语料库提供的数据将我们对语言规律的朴素的认识(folk beliefs),上升为语言学理论(linguistic theory);或者用这些数据来纠正我们常识中对于语言规律理解的种种谬误。这种通过定量定性相结合的方法得出结果更加有说服力。从目前语料库语言学的发展来看,它还无法获得与其他经典语言学的领域相当的地位。至于将来随着计算机技术和语料库研究方法上的发展,语料库语言学能否为传统语言学带来一些重大变革还将有待时间的检验。

5.0 结语

从前文的分析中我们不难看出,语料库语言学是一门语言研究和相应的计算机技术相伴相生的产物,是语言研究中定量和定性方法相互结合的典范,为揭示语言的本质做出其应有的贡献。虽然说语料库语言学是研究语言的一件强有力的武器,但同时我们必须对它的优势和不足有清醒的认识,它绝不是包医百病的良药。最大限度的开发利用语料库资源,并且充

分结合其它相关学科的理论成果,才是对待语言研究的科学的和审慎的态度。

参考文献

[1] Aarts, Jan. Intuition-based and Observation-based Grammars [A]. In Aijmer, K and B.

Altenberg (eds) [C], 1991: 44-62.

[2] Aijmer, K and B. Altenberg (eds). English Corpus Linguistics: Studies in Honour of Jan

Svartvik [C]. London and New York: Longman, 1991.

[3] Armstrong, Susan (ed). Using Large Corpora [C]. Cambridge, Mass: MIT Press, 1994.

[4] Biber, Douglas. Representativeness in Corpus Design. Literary and Linguistic Computing [J].

1993 (4): 243-57.

[5] Biber, Douglas. Using Register-diversified Corpora for General Language Studies [A]. In

Armstrong, Susan (ed) [C], 1994: 179-202.

[6] Chafe, Wallace John W. Du Bois and Sandra A. Thompson. Towards a New Corpus of Spoken

American English [A]. In Aijmer, K, Altenberg, B. (eds) [C], 1991: 64-82.

[7] Chafe, Wallace. Prosodic and Functional Units in Language [A]. In Edwards, Jane A., Lampert,

M. D. (eds) [C], 1993: 33-43.

[8] Chomsky, Norm. Aspects of the Theory of Syntax [M]. Cambridge, Mass: MIT Press, 1965.

[9] Du Bois, John W. Stephan Schuetze-Coborn, Susanna Cumming, and Danae Paolino. Outline

of Discourse Transcription [A]. In Edwards, Jane A., Lampert, M. D. (eds) [C], 1993: 45-89.

[10] Edwards, Jane A., Lampert, M. D. (eds). Talking Data: Transcription and Coding in

Discourse Research [C]. Hillsdale, NJ: Lawrence Erlbaum, 1993.

[11] Greenbaum, Sidney (ed). Comparing English Worldwide: The International Corpus of

English [C]. Oxford: Clarendon Press, 1996.

[12] Greenbaum, Sidney. The Development of the International Corpus of English [A]. In Aijmer,

K and B. Altenberg (eds) [C], 1991: 83-91.

[13] Halliday, M. A. K. Corpus Studies and Probabilistic Grammar [A]. In Aijmer, K and B.

Altenberg (eds) [C], 1991: 30-43.

[14] Halliday, M. A. K. Language as System and Language as Instance: The Corpus as a

Theoretical Construct [A]. In Svartvik, Jan (ed) [C], 1992: 61-77.

[15] Halliday, M. A. K. Quantitative Studies and Probabilities in Grammar [A]. In Michael Hoey

(ed). Data, Description, Discourse: Papers on English Language in Honour of John McH.

Sinclair (on his sixtieth birthday) [C]. London: Harper Collins, 1993: 1-25.

[16] Halliday, M. A. K. An Introduction to Functional Grammar (2nd Edition)[M]. London:

Edward Arnold, 1994.

[17] Leech, Geoffrey. Corpora and Theories of Linguistic Performance [A]. In Svartvik, Jan (ed)

[C], 1992: 105-22.

[18] Nelson, Gerald. The Design of the Corpus [A]. In Greenbaum, Sidney (ed) [C], 1996: 27-35.

[19] Svartvik, Jan (ed). Directions in Corpus Linguistics. Proceedings of Nobel Symposium 82,

Stockholm, 4-8, August 1991 [C]. Berlin and New York: Mouton de Gruyter, 1992.

[20] Tognini-Bonelli, Elena. Corpus Linguistics at Work [M]. Amsterdam and Philadelphia: John

Benjamins, 2001.

[21] 顾曰国. 使用者话语的语言学地位综述[J]. 当代语言学,1999 (3).

[22] 李平. 语言习得的联结主义模式[J]. 当代语言学,2002 (3).

语料库研究的优势及问题的理论解析

语料库语言学的理论解析 摘要:本文试图剖析有关语料库语言学的几个理论问题,以期揭示语料库语言学的本质。第一:语料库语言学是不是独立的新兴学科?第二:语料库提供的数据到底可以给语言学家带来什么?第三:语料库语言学的真正任务是什么,它应该成为怎样一项研究?回答好这几个问题实际上也就回答了语料库语言学的性质和理论地位,以及这项研究向何处去的问题。这将有助于我们更好地从事基于语料库的语言研究和实践。 关键词:语料库语言学;基于语料库的研究方法;理论架构;语料库数据;发展前景 Abstract: This paper attempts to answer some theoretical questions of corpus-based language studies. Three theoretical considerations are addressed to capture the nature of corpus linguistics. 1) Is Corpus Linguistics an independent branch under the umbrella of linguistics? 2) What can corpus data offer to linguists? and 3) What kind of research that Corpus Linguistics should be? Answers to the three theoretical questions will conduce to a fuller understanding of the nature of corpus-based language studies and their development. Key words: Corpus linguistics; corpus-based approach; theoretical construct; corpus data; future directions 1.0 导言 目前利用语料库从事研究的学者主要有两类。一类是计算语言学家。他们主要从事自然语言处理(NLP)的研究,诸如语音合成、语音识别和机器翻译等等。他们的终极目标并非要揭示语言的本质,而是注重技术层面的研究,比方如何改进算法,如何完善词库的建设以实现技术上的突破。另一类就是语言学家,他们则希望借助这一强大的工具去揭示语言的本质这一学科目标,这正是本文所要关注的。 本文缘起于语言研究者中的一种争论,即“语料库语言学”是否配得上这个名称,它是一种新兴的理论视角还是“暴发户造谱牒”?而本文要探讨的正是有关于语料库语言学研究的理论意义。或者说,语言学家从语料库所提供的信息中到底可以获得什么?这是本文试图解决的核心问题。语料库建设、开发和利用在国内外语言学界日渐兴起,在国内也有相当数量介绍性和综述性文献涌现,为语料库语言学在我国的发展奠定了一定的理论基础。此外,一些语言学者和语言教师(包括外语教师和对外汉语教师)也设计、建立了一些自己的语料库以服务于教学科研。 然而真正对语料库的理论问题进行深入探讨的著述却为数不多。本文将试图剖析语料库语言学的几个理论问题,以期对语料库语言学的优势和不足有进一步的认识。第一:语料库语言学是不是独立的新兴学科?第二:语料库提供的数据到底可以给语言学家带来什么?第三:语料库语言学的真正任务是什么,它应该成为怎样一项研究?回答好这几个问题实际上也就回答了语料库语言学的性质和理论地位,以及这项研究向何处去的问题。这将有助于我们更好地从事基于语料库的语言研究和实践。 2.0 语料库语言学是不是独立的新兴学科? 2.1 语料库语言学是一种理论架构 完全赞成语料库语言学是一种理论架构的几乎没有。只是某些学者比较强调语料库语言学的理论意义。比如,Halliday(1991;1992;1993)指出,语料库语言学作为一种理论架构(theoretical construct),将语料收集和理论概括统一了起来,从而使我们对语言的理解产生一种质变。这种新的理论架构有助于考察同时作为系统和实例(instance)的语言的本质。因为在Halliday的语言学思想当中,实际话语是语言系统的实例再现(instantiation)。而语言系统,或者说是语法体系是一种统计概率上(probabilistic)的自然结果。这一思想与所谓

论比较优势理论及其在我国的应用

《当代经济》2008年第1期(下) CONTEMPORARYECONOMICS !!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!!!" !!!!!!!!!" 论比较优势理论 及其在我 #唐琼魏东升 我国的资源不仅人均占有量低,而且浪费严重,进一步加剧了经济增长与资源短缺的矛盾。建国50多年来,我国的GEP增长了10多倍,但矿产资源消耗增长了 40多倍。2006年,按现行汇率初步测算,中国GDP总量占世界的比重约5.5%,但重要能源资源消耗占世界的比重却较高,比如能源消耗24.6亿吨标准煤,占世界的15%左右;钢材消费量为3.88亿吨,占30%;水泥消耗12.4亿吨,占54%。即使考虑到汇率因素,中国的资源产 出效率也是比较低的。 2、 我国的环境状况不容乐观(1)水体污染相当严重 据环保总局监测,2005年全国七大水系的411个地表水监测断面中有27%的断面为劣V类水质,全国约 1/2的城市市区地下水污染严重,一些地区甚至出现“有河皆干、有水皆污”的现象。城乡居民饮用水安全存在极大隐患。据环保总局最新调查数据,全国113个重点环保城市的222个饮用水地表水源的平均水质达标率仅为 72%,不少地区的水源地呈缩减趋势,有的城市没有备用 水源,有3亿多农村人口的饮用水存在安全问题。水污染事故频繁发生。据环保总局统计,2005年全国共发生环境污染事故1406起,其中水污染事故693起,占全部环境污染事故总量的49.2%。 目前,我国七大水系的26%是五类和劣五类,九大湖 泊中有七个是五类和劣五类,流经城市的河段普遍遭到污染,一些地区甚至已经是 “有河皆干、有水皆污”。与此同时,1/5的城市空气污染严重,1/3的国土面积受到酸雨影响。 (2)空气污染严重 目前,数亿国人呼吸不到干净的空气,由于空气污染引起的健康损失约占GDP的1.8%。 (3)耕地污染严重 据不完全统计,目前全国受污染的耕地约有1.5亿亩,污水灌溉污染耕地3250万亩,固体废弃物堆存占地和毁田200万亩,合计约占耕地总面积的10%以上,其中多数集中在经济较发达的地区。全国每年因重金属污染的粮食达1200万吨,造成的直接经济损失超过200亿元。 我国的人口和资源环境状况决定了我国只能倡导适度消费,而不能提倡高消费。 【参考文献】 [1]陈昕:救赎与消费—— —当代中国日常生活中的消费主义[M].江苏人民出版社,2003. [2]倪瑞华:可持续发展的伦理精神[M].中国社会科学出版社,2004. [3]郑红娥:社会转型与消费革命—— —中国城市消费观念的变迁[M].北京大学出版社,2006. [4]蔡玉高、 朱国亮、徐清扬:粗放发展:滚滚车轮下的山河之伤[J].半月谈内部版,2007(9). [5]陈文玲:我国消费需求发展趋势及深层次矛盾[J].宏观经济研究,2007(1). 【摘要】传统的贸易理论强调的比较利益结构都是建立在一国产业的比较优势的基础上的,是以“ 生产规模报酬不变”和“完全竞争”为条件的,而新贸易理论大量运用产业组织市场结构、不完全竞争、规模经济和产品差异来构建新的理论模型。我国在利用自己的比较优势和要素禀赋发展产业间贸易的同时,也应该利用国外需求结构的不同、规模经济和产品差异来发展我国产业内的贸易。 【关键词】比较优势竞争优势贸易创造效应比较优势陷阱一、引言 随着通讯、网络和信息技术等的快速发展,经济全球化的进程进一步的加快,世界经济逐渐成为相互联系、不可分割的整体,国际间的贸易发挥着越来越重要的作用。国际贸易在国际分工的条件下进行,而目前的国际分工是由旧的国际社会政治经济秩序和各国资源的禀赋差异决定的。人民币升值后,国际市场竞争越来越激烈,为了更好地适应国际市场经济环境的挑战,我国必须更好地发挥自己的比较优势,避开比较优势陷阱,更好地利用国际贸易带来的有利条件,充分利用好国际国内两种资源和国际国内两个市场,在贸易中更好地利用贸易的创造效应,避免其贸易转移效应。 二、比较优势理论综述1、 传统的贸易理论。英国古典经济学家亚当?斯密创立了绝对贸易理论。他认为贸易绝非像重商主义者认为的一种零和博弈,相反斯密认为贸易是一种正和博弈。在市场经济中利益的驱动下,主观上为自己利益的微观经济主体可通过分工和贸易利用自己的绝对优势客观上为社会工作,从而实现自利与互利、个体利益和社会利益的相互联系。社会各经济主体 (各国)按照自己的特长实行分工,进行专业化生产,然后通过国际市场进行贸易,从而实现各自的绝对利益。 斯密的绝对利益原理很好地解释了国际贸易产生的重要原因,为国际贸易的发生提供了重要的理论依据,但是绝对贸易理论并不能很好地解释一个国家在生产任何商品方面都没有绝对优势时仍然能参与国际分工的现象。 针对绝对比较优势的缺陷,大卫?李嘉图提出比较优势理论。大卫?李嘉图认为,一个国家(地区)的经济发展不论处于怎样的状态,经济力量是强还是弱,技术水平是高还是低,无论有没有绝对优势,都能够确定自己的相对优势,然后利用自己的相对优势进行国际分工和贸易使国际资源得到充分合理地利用,从而使得贸易的双方都能获利。在李嘉图的绝对优势理论中最关键的是机会成本。一个国家即使总体上处于劣势,可以从诸多的劣势中找到自己的相对优势。李嘉图的相对优势理论回答了斯密的绝对优势理论无法回答的问题,但到底是什么原因造成了各国在生产不同产品上的比较成本有差别 理论探索 152

语料库与语料库建设

语料库和语料库建设 一、什么叫语料库 1、定义 语料库,通俗意义上指的是语言材料库。严格意义上的语料库(corpus)是指按照一定的 语言学原则,运用随机抽样方法,收集自然出现的连续的语言运用文本或话语片断而建成的具有一定容量的大型电子文本库。 目前,语言学家对于语料库的定义不尽相同,如辛克莱(Sinclair)认为语料库是“按照明确的语言学标准选择并排序的语言运用材料汇集,旨在用作语言的样本”。阿特金斯等(Atkins & Clear)认为语料库是“按照明确的设计标准,为某一具体目的而集成的大型文本库”。赫努(Renouf)认为语料库是“由大量收集的书面语或口头语构成,并通过计算机储存和处理,用于语言学研究的文本库”。我们看到,以上关于语料库的几种定义相同之处在于都谈到语料库是语言材料的汇集;不同之处在于前两个定义指出语料库的设计是有明确的设计标准的,赫努的定义明确指出语料库“通过计算机储存和处理”这一特点。 语料库不同于电子文档,语料库的建设有特定的研究目的和具体用途,因此在语料抽样范围和文类覆盖方面都力求取得平衡,在收集语料时需要考虑到每一文类、体裁、语域、主题类型等的抽样比例。而大型文档目标在于搜集任何可获得的语言材料或所限定的数种文类语料,其语言材料之间的关系较为松散。 语料库具有以下特征:1、语料库的设计与建设有系统的语言学理论指导,语料库的开发具有明确而又具体的目的;如,布朗语料库用于对20世纪60年代的美国英语的研究,LOB是与布朗语料库对齐的同时期的英国英语语料库,可用以对英国英语进行研究,也可与布朗语料库加以对比进行美国英语和英国英语的对比研究。2、语料库的语料是按照明确的语言学原则采用随机抽样的方法得到的语言运用的自然语料,不是随意的语言材料的堆积,更不是由某个个人杜撰出来的。语料库的容量和语料采用随机抽样方式都保证了语料具有代表性,由此保证基于语料库的语言研究的科学性、客观性。3、语料文本是连续的文本或话语片断,而不是孤立的句子或词汇,可以借以获得语法关系、用法、词语搭配以及语篇信息。4、语料库以当代先进的计算机技术为技术手段,语料库语料通过电子文本形式储存并且是通过计算机处理的,具有资源优势和处理速度优势。5、基于语料库的研究以量化研究为基石,以概率统计为手段,以数据驱动为基本理念。6、语料库既是一种研究方法,又代表着一种新的研究思维。 二、语料库产生的背景及发展历史 对真实语言材料的搜集与研究是语言学研究的优秀传统。尤其是在20世纪50年代中期, 在语言研究中占主导地位的是重语言材料的经验主义。这种学术氛围无疑促进了对语料的重视。1959年夸克(R.Quirk)等人着手进行的“英语用法调查”(Survey of English Usage)通过系统的调查建立了第一个现代英语语料库,在此基础上完成的《现代英语语法》( A Grammar of Contemporary English)和《英语语法大全》(A Comprehensive Grammar of the English Language)对现代英语进行了系统全面的描写,在英语语言学界产生了广泛的影响。但在当时这项浩大的工程是通过手工的方式完成的。

对外直接投资理论综述

对外直接投资理论综述 摘要:对外直接投资已有近半个世纪的历史并形成了对外直接投资理论。本文对传统的对外直接投资理论中发达国家和发展中国家的对外直接投资理论进行了综述,并论述了对外直接投资理论的最新进展,希望能对我国对外直接投资的发展起到一定的理论指导作用。 关键词:投资对外直接投资理论研究综述 对外直接投资(Foreign Direct Investment,FDI),是指一国的企业、团体等在国(境)外以现金、实物、无形资产等方式投资,并以控制国(境)外企业的经营管理权为核心的经济活动。对外直接投资的内涵主要体现在一个经济体通过投资于另一个经济体而实现其持久利益的目标。改革开放以来,我国在积极引进外资的同时,也在不断进行对外直接投资的尝试,特别是近几年来对外直接投资发展较快。初具规模,已成为我国对外经济合作的一个重要组成部分。因此,研究对外直接投资理论具有重要的意义。 一、传统对外直接投资理论 (一)发达国家的对外直接投资理论 对外直接投资起源于发达国家,对外直接投资的理论研究始于20世纪60年代,其研究对象是跨国公司的对外直接投资行为,研究的核心是跨国公司对外直接投资的动机、决定因素、行为方式和条件等。目前国外对对外直接投资的研究较多,已经形成了比较完善的理论体系。 1.垄断优势论 美国学者海默(Hymer,1960)在其博士论文《国内企业的国际化经营:对外直接投资的研究》中,运用西方微观经济学中关于厂商垄断竞争的原理来说明跨国公司对外直接投资的动因, 提出了“垄断优势论”,指出大企业凭借其特定的垄断优势从事对外直接投资,开了对外直接投资理论研究的先河。该理论后来经过其导师金德尔伯格(Kindleberger,1969,1975)的补充发展,现称之为“海默一金德尔伯格传统”。垄断优势论首次提出对外直接投资应该从不完全竞争出发,在市场不完全的情况下,企业才能够以自己的各种垄断优势,如技术优势、资金优势、规模经济优势等,对他国进行直接投资。它研究的对象只是实力厚、具有明显垄断优势的美国跨国公司。根据该理论,没有垄断优势的企业无法进行对外直接投资。而20世纪80年代以来,没有垄断优势的发展中国家跨国公司对外直接投资的兴起, 则对此理论提出了质疑。另外,垄断优势理论也无法解释产品出口、

语料库研究与综述.

语料库研究与应用综述 一概述 语料库通常指为语言研究收集的、用电子形式保存的语言材料,由自然出现的书面语或口语的样本汇集而成,用来代表特定的语言或语言变体。经过科学选材和标注、具有适当规模的语料库能够反映和记录语言的实际使用情况。人们通过语料库观察和把握语言事实,分析和研究语言系统的规律。语料库已经成为语言学理论研究、应用研究和语言工程不可缺少的基础资源。 语料库有多种类型,确定类型的主要依据是它的研究目的和用途,这一点往往能够体现在语料采集的原则和方式上。有人曾经把语料库分成四种类型:(1)异质的(Heterogeneous):没有特定的语料收集原则,广泛收集并原样存储各种语料;(2)同质的(Homogeneous):只收集同一类内容的语料;(3)系统的(Systematic):根据预先确定的原则和比例收集语料,使语料具有平衡性和系统性,能够代表某一范围内的语言事实;(4)专用的(Specialized):只收集用于某一特定用途的语料。除此之外,按照语料的语种,语料库也可以分成单语的(Monolingual)、双语的(Bilingual)和多语的(Multilingual)。按照语料的采集单位,语料库又可以分为语篇的、语句的、短语的。双语和多语语料库按照语料的组织形式,还可以分为平行(对齐)语料库和比较语料库,前者的语料构成译文关系,多用于机器翻译、双语词典编撰等应用领域,后者将表述同样内容的不同语言文本收集到一起,多用于语言对比研究。 语料库建设中涉及的主要问题包括: (1)设计和规划:主要考虑语料库的用途、类型、规模、实现手段、质量保证、可扩展性等。 (2)语料的采集:主要考虑语料获取、数据格式、字符编码、语料分类、文本描述,以及各类语料的比例以保持平衡性等。 (3)语料的加工:包括标注项目(词语单位、词性、句法、语义、语体、篇章结构等)标记集、标注规范和加工方式。 (4)语料管理系统的建设:包括数据维护(语料录入、校对、存储、修改、删除及语料描述信息项目管理)、语料自动加工(分词、标注、文本分割、合并、标记处理等)、用户功能(查询、检索、统计、打印等)。 (5)语料库的应用:针对语言学理论和应用领域中的各种问题,研究和开发处理语料的算法和软件工具。 我国语料库的建设始于80年代,当时的主要目标是汉语词汇统计研究。进入90年代以后,语料库方法在自然语言信息处理领域得到了广泛的应用,建立了各种类型的语料库,研究的内容涉及语料库建设中的各个问题。90年代末到新世纪初这几年是语料库开发和应用的进一步发展时期,除了语言信息处理和言语工程领域以外,语料库方法在语言教学、词典编纂、现代汉语和汉语史研究等方面也得到了越来越多的应用。 语料库与语言信息处理有着某种天然的联系。当人们还不了解语料库方法的时候,在自然语言理解和生成、机器翻译等研究中,分析语言的主要方法是基于规则的(Rule-based)。对于用规则无法表达或不能涵盖的语言事实,计算机就很难处理。语料库出现以后,人们利用它对大规模的自然语言进行调查和统计,建立统计语言模型,研究和应用基于统计的(Statistical-based)语言处理技术,在信息检索、文本分类、文本过滤、信息抽取等应用方向取得了进展。另一方面,语言信息处理技术的发展也为语料库的建设提供了支持。从字符

国际儿童口语语料库录写系统的赋码原则初探

国际儿童口语语料库录写系统的赋码原则初探* 王立非1,刘斌2 (1.南京大学, 江苏南京 210093; 2.解放军国际关系学院,江苏南京 210039) 摘要:国际儿童口语语料库是目前世界上最完整的口语语料库之一, 对开展口语语料库研究和语言习得研究具有重要价值,本文探讨该语料库 的录写系统的赋码原则与具体操作问题,对促进我国英语口语语料库的建 立和研究具有借鉴作用和启示意义。 关键词:国际儿童口语语料库;英语口语语料;语料库语言学 中图分类号:文献标识码:文章编号:The CHILDES Corpus: Coding and Operation of the CHAT Tool WANG Lifei1, LIU Bin2 (1. Nanjing University Nanjing, Jiangsu Prov., 210093; 2. PLA International Studies University, Nanjing, Jiangsu Prov., 210039, China) Abstract: This paper describes the basic coding and operating principles of CHAT for the CHILDES talk-bank, a very valuable corpus for studies on spoken English and language acquisition. It aims to promote the development and use of the CHILDES as a reference for constructing the EFL spoken corpus in China. Key words: CHILDES;English spoken corpus;corpus linguistics 1.引言 新世纪的语言学研究已进入计算机时代,基于语料库的研究成果不断涌现,国际儿童口语语料库CHILDES(Child Language Data Exchange System)就是众多语料库中的一员,已有一千项基于这个语料库的研究成果发表。该语料库由美国麦克阿瑟基金会资助,于1984年开始筹建,经过近20年的建设,已成为目前世界上最大的儿童口语语料库。到目前为止,该语料库已收集了包括英语、汉语在内的25种语言。用户可直接从网上免费登录、使用或下载(https://www.doczj.com/doc/1c3299967.html,/CHA T.html)语料。CHILDES语料库由三部分组成,第一部分是儿童英语口语语料库(DATA-BASE),第二部分为文本赋码系统(CHAT),第三部分为语料分析程序(CLAN),均可在网上免费下载。本文探讨该语料库的录写系统的文本赋码原则和操作,目的是对我国建设英语口语语料库提供借鉴与启示。 2.录写赋码系统的途径与原则

国贸贸易毕业论文-比较优势理论在中国对外贸易中的应用

摘要比较优势理论自产生之日起,就一直受到学术界的普遍关注,将其视为国际贸易理论的基础。但这一理论的应用却并非一帆风顺。对于中国这样一个比较优势相当明显的发展中国家,如何充分利用好我国对外贸易的比较优势成为国内学者的研究重点。本文首先分析了比较优势理论的内涵和发展,重点讲述了当代影响比较优势的几个要素。并根据比较优势的内涵的发展,将这一理论分为比较成本理论、要素禀赋理论、当代比较优势理论三个阶段。其次论述了当代中国对外贸易的现状。最后论述了比较优势理论对中国对外贸易的借鉴意义。以中国三类出口商品的显性比较优势变化趋势图为依据,分析了我国对外贸易中比较优势的变化,并对如何借鉴比较优势,提高我国的比较优势素质做出了一定的建议。重视发展我国对外贸易的比较优势,能够加快我国外贸体制改革的进程和企业跨国经营战略的实施,最终推动中国对外贸易的发展。关键词:对外贸易;比较优势;策略建议Abstract Theory of comparative advantage gets the universal solicitude of academic circle fromits producing day,and it is regarded as the foundation of international trading theory. But theapplication of this theory is not plain sailing. For China such a developing country thatcomparative advantage is fairly obvious how to make good use of the comparativeadvantages became the focus of academic research.

语料库语言学的发展及研究现状

当代语言学(试刊)1998年第1期4-12页,北京 语料库语言学的发展及研究现状 丁信善 1.0引言 语料库语言学已经成为语言研究的主流。基于语料库的研究不再是计算机专家的独有领域,它正在对语言研究的许多领域产生愈来愈大的影响。 这是J.Thomas等人1996年为祝贺语料库语言学的主要奠基人和倡导者G.Leech六十诞辰而出的语料库语言学研究论集的开场白。近年来,对语料库语言学类似的评说频频见于导论和方法论的书及教科书中,它不仅仅是语料库语言学家们的自誉,而正在成为整个语言学界的共识。 2.0语料库语言学的定义 关于语料库语言学的定义,现引述三例: a. 根据篇章材料对语言的研究称为语料库语言学。 (K.Aijmer&B.Aitenberg,1991,p.1) b. 基于现实生活中语言运用的实例进行的语言研究称为语料库语言学。 (T.M c Enery&A. Wilson,1996,p.1) c. 以语料为语言描写的起点或以语料为验证有关语言的假说的方法称为语料库语言学。 (D. Crystal,1991,p.86) 由上述几个定义可见,语料库语言学不是研究语言自身某个方面,而是一种以语料库为基础的语言研究方法。它实际上包括两个方面:一是对自然语料进行标注,二是对已经标注的语料的研究和利用的方法。从方法论的角度,它不仅可以用于研究语言系统的各个层面,而且可以应用于语言学之外的其他领域。 3.0语料库语言学的历史发展 语料库语言学作为一种研究语言的方法,可以追溯到上个世纪,甚至更为久远。现在一般以乔姆斯基转换生成语法的兴衰时间为参照,将其发展大致分为以下几个阶段: 3.1语料库语言学的早期发展 早期的语料库语言学指的是本世纪五十年代中期以前,即乔姆斯基提出转换生成语法理论之前的所有基于语言材料的语言研究。此类研究主要集中在以下几个方面: (1)语言习得是应用语料研究方法较早且较普遍的领域。19世纪70年代在欧洲兴起了儿童语言习得研究的第一个热潮,当时的许多研究就是基于父母详细记载其子女话语发展的大量日记的。据悉,这些日记作为原始材料,不仅是当时W.Preyer和W.Stern等人的理论假说的依据,而且时至今日仍是许多学者的研究语料之一。自本世纪30年代以来,语言学家和心理语言学家提出了众多关于儿童在不同年龄段的语言发展模式。这些模式大都是建立在对儿童自然话语大量材料的研究分析上的。 (2)利用自然语料开展音系研究,在西方当首推美国早期的结构主义语言学家,如F.Boas和 E.Sapir等人。他们注重 野外工作 ,强调语料获取的自然性和语料分析的客观性。这些都为后来的语料语言学所继承和发展。 本文承蒙哥本哈根大学翻译与词典学研究中心主任C.Dollerup博士提供有关欧洲语料库网络的材料,特此致谢。

国际贸易论文--自由贸易理论概述与比较优势理论对我国的启示

自由贸易理论概述与比较优势理论对我国的运用 ——程康 A09经济 090801107 摘要:对自由贸易理论进行总结,并通过通过对比较优势理论的产生背景、国内应用现状和理论局限性的多角度反思,对我国使用比较优势理论的问题。 (一)自由贸易理论 自由贸易理论,创始者是亚当斯密,其核心是自由贸易可使参与贸易的双方均获得贸易利益。他创造性的提出了分工学说,建立绝对贸易理论,以强大的实证分析和逻辑推理,最终让大家认清重商主义贸易政策的‘0和游戏’规则的真实面目,使得自由贸易得到广泛的认同,并得以发展。 纵观自由贸易理论,可分成三个阶段。第一阶段就是在第一产业革命时期的古典贸易理论,以亚当·斯密的绝对成本论、大卫·李嘉图的比较成本论和约翰·穆勒的相互需求原理为发展主线。绝对成本论认为一国应放弃成本绝对高的,而选择成本绝对低的进行专业化生产,并彼此进行交换,这样两国的劳动生产率都会提高,成本会降低,劳动和资本能得到正确的分配和运用,这样是增加国民财富的最佳途径。但它不足以解释一个国家若全面属于劣势的情况下,该如何进行贸易。于是后来,比较优势理论就此产生了。大卫李嘉图根据“两优相较择其重,两劣相较取其轻”的比较利益法则,选择优势较大或劣势较小,即具有比较优势的产品进行专业化生产,而放弃优势较小或劣势较大产品的生产,并出口具有比较优势的产品,进口具有比较劣势的产品。大卫李嘉图虽然解决了亚当斯密理论的尴尬,但仍有着“静态化”“完美化”的不足。理论总是在不断的实践及学者的改善中越发成熟,此后,约翰穆勒提出了相互需求理论,该理论从各国家自身的需求强度着手,认为两国交易的条件由相互需求强度决定。 相互需求理论仍然存在的诸多不足和响应时代的学者似乎并没有让自由贸易理论止步于此。随着第二次产业革命和马克思主义诞生,传统的劳动价值理论最终被摒弃,取而代之的是马克思主义的科学劳动价值论。自由贸易理论迎来了第二阶段---新古典贸易理论,以赫克歇尔和俄林提出的生产要素禀赋学说为发展主线。理论认为,不同商品的生产需要投入不同的生产要素比例,而不同国家所拥有的生产要素是不同的,因此,一国应生产那些能密集地利用其较充裕的生产要素的商品并出口,以换取那些需要密集地使用其较稀缺的生产要素的进口商品。然而,里昂惕夫用该理论方法对美国对外贸易商品结构进行分析试图验证他确信不疑的生产要素禀赋论时,却惊奇的发现美国出口的是劳动密集型产品,进口的是资本密集型产品,这让理论与贸易实践完全背离,使人们不得不再另辟蹊径寻找自由贸易理论真谛。

CCL语料库与检索系统方案

一关于CCL语料库及其检索系统 (如果时间紧张,可直接跳到最后的举例部分!) 1.1 CCL语料库及其检索系统为纯学术非盈利性的。不得将本系统及其产生的检索结果用于任何商业目的。CCL不承担由此产生的一切后果。 1.2 本语料库仅供语言研究参考之用。语料本身的正确性需要您自己加以核实。 1.3 语料库中所含语料的基本内容信息可以在“高级搜索”页面上,点击相应的链接查看。比如: “作者列表”:列出语料库中所包含的文件的作者 “篇名列表”:列出语料库中所包含的篇目名 “类型列表”:列出语料库中文章的分类信息 “路径列表”:列出语料库中各文件在计算机中存放的目录 “模式列表”:列出语料库中可以查询的模式 1.4 语料库中的中文文本未经分词处理。 1.5 检索系统以汉字为基本单位。 1.6 主要功能特色: ?支持复杂检索表达式(比如不相邻关键字查询,指定距离查询,等等); ?支持对标点符号的查询(比如查询“?”可以检索语料库中所有疑问句); ?支持在“结果集”中继续检索; ?用户可定制查询结果的显示方式(如左右长度,排序等); ?用户可从网页上下载查询结果(text文件); 二关于查询表达式 本节对CCL语料库检索系统目前支持的查询表达式加以说明。 2.1 特殊符号 查询表达式中可以使用的特殊符号包括8个: | $ # + - ~ ! : 这些符号分为四组: Operator1: | Operator2: $ # + - ~ Operaotr3: !

Delimiter: : 符号的含义如下: (一) Operator1: Operator1是二元操作符,它的两边可以出现“基本项”(关于“基本项”的定义见2.2) (1) | 相当于逻辑中的“或”关系。 (二) Operator2:Operator2是二元操作符,它的两边可以出现“简单项”(关于“简单项”的定义见2.3) (2) $ 表示它两边的“简单项”按照左边在前、右边在后的次序出现于同一句中。两个“简单项”之间相隔字数小于或等于Number (3) # 表示它两边的“简单项”出现于同一句中,不考虑前后次序。两个“简单项”之间相隔字数小于或等于Number (4) + 表示它两边的“简单项”按照左边在前、右边在后的次序出现于同一句中。两个“简单项”之间相隔字数刚好等于Number (5) - 表示它左边的“简单项”出现于句子中,并且,在右边相隔Number个字的范围内,-号右边的“简单项”不出现。 (6) ~ 表示它左边的“简单项”出现于句子中,并且,在左边相隔Number个字的范围内,~号右边的“简单项”不出现。 (三)Operator3:Operator3是一元操作符。 (7) ! 表示它后面的“简单项”是本次查询的主关键字符串,显示查询结果时以该“简单项”作为中心来进行定位。 注意: Operator2后面的Number是必须的,不能省略。Number=0表示相 邻,Number=1表示间隔1个单位,其余依此类推。 (四)Delimiter:西文冒号 : 是分隔符 (8) : 跟在 path,author,name,type,pattern 等关键字后面,用于分隔关键字和它们的取值。这样形成的查询式我们称之为“过滤项”(见下面2.5) 注意:上述特殊字符不能作为基本项在语料库中进行检索。path,author等关键字可以作为基本项进行检索。 2.2 基本项 指不包含特殊符号和空格的连续字符串

国际贸易理论综述

一、国际贸易理论的产生和发展 国际贸易如此重要,对国际贸易的研究也就成为必然。最早于15世纪末16世纪初,即在西方国家的资本原始积累阶段,对国际贸易的研究就已出现。当时的主要理论为重商主义。重商主义主要研究对外贸易怎样能够为一国带来财富,而所谓财富,则完全由金银货币来衡量。在他们看来,国内市场上的贸易是有一部分人支付货币给另一部分人,从而使一部分人获利,另一部分人受损。国内贸易的结果只是社会财富在国内不同集团之间的再分配,整个社会财富的总量并没有增加。而对外贸易可以使一国从国外获得金银货币从而使国家致富。因此,重商主义对贸易的研究主要集中在如何进行贸易,具体来说,怎样通过鼓励商品输出、限制商品进口以增加货币的流入从而增加社会财富。 对怎样能够做到多输出少进口,晚期的重商主义与早期的观点有所不同。早期重商主义强调绝对的贸易出超,主张控制商品进口和货币外流。晚期重商主义(16世纪下半期到17世纪末)则从长远的观点看,认为在一定时期内的外贸入超是允许的,只要最终的贸易结果能保证出超,保证货币最终流回国内就可以。但无论早期还是晚期,重商主义都主张限制进口,对贸易的研究是很有局限的。 18世纪末叶,重商主义的贸易观念受到古典经济学派的挑战,并被自由贸易的思想取代。古典经济学的主要代表亚当.斯密(Adam Smith)的基本经济思想是“自由放任”,这一原则也被用于国际贸易理论。在其著名的《国富论》中,斯密从个人之间的交换推论到国家之间的交换。他认为,既然每个人只生产自己擅长生产的东西,然后用来交换别人擅长生产的东西比自己什么都生产合算,那么各国间的分工和交换也应该是同样合算的。因此,他认为无论出口还是进口,一国都能获得利益。古典经济学的另一名主要代表大卫.李嘉图(David Richardo)在《政治经济学和赋税原理》一书中也对自由贸易的好处作了说明。 从古典经济学开始,对国际贸易的研究就不再局限于怎样进行贸易,而开始对贸易产生的原因与结果以及与之相应的政策进行分析。从古典的斯密、李嘉图,到20世纪的瑞典经济学家赫克歇尔(Eli Heckscher)、俄林(Bertil Ohlin),到当代的里昂惕夫(Wassily Leontief)、萨缪尔森(Paul Samuelson)、巴格瓦蒂(Jagdish Bhagwati)、琼斯(Renold Jones)、克鲁格曼(Paul Krugman)等,许多经济学家从各种角度,在各个方面对国际贸易的理论与政策进行分析论证。方法越来越精细,手段越来越严密,国际贸易理论成为经济学的一个独立分支并得到不断发展。 二、国际贸易理论的基本框架 国际贸易理论是国际经济学中非常重要的一个部分,其基础是微观经济学。可以说,国际贸易理论是开放条件下的微观经济学。国际贸易理论研究的范围不仅包括商品和服务的国际流动,也包括生产要素的国际流动和技术知识的国际传递。生产要素和技术知识一方面作为某种特殊商品有其本身的国际市场,另一方面作为要素投入对商品和服务的生产起着重要作用。国际贸易理论研究商品、服务和生产要素国际流动的原因和方向,也研究流动的结果。这些结果包括对各国生产、消费、商品价格和社会各集团利益的影响。 与商品、服务、生产要素的国际流动及技术知识的国际转移有关的各种商业、产业和消费政策也都是国际贸易理论研究的对象。商业或贸易政策直接影响贸易的数量和价格,产业政策和消费政策则通过对国内的生产和消费的干预间接地影响贸易。国际贸易研究还包括经济增长、技术变动对贸易的影响,即从动态上分析国际贸易的变动的原因与结果。 从研究的性质来看,国际贸易理论也像其它经济学一样,可以分成实证的(Positive)理论和规范的(Normative)理论。所谓实证分析,主要揭示各种经济变量之间的关系,分

语料库

关于语料库的三点基本认识:语料库中存放的是在语言的实际使用中真实出现过的语言材料;语料库是以电子计算机为载体承载语言知识的基础资源;真实语料需要经过加工(分析和处理),才能成为有用的资源; 在语言学中,语料库(Corpus)指大量文本的集合,库中的文本(称为语料)通常经过整理,具有既定的格式与标记,特指计算机存储的数字化语料库。 语料库是语料库语言学研究的基础资源,也是经验主义语言研究方法的主要资源。应用于词典编纂,语言教学,传统语言研究,自然语言处理中基于统计或实例的研究等方面。 分类 语料库有多种类型,确定类型的主要依据是它的研究目的和用途,这一点往往能够体现在语料采集的原则和方式上。有人曾经把语料库分成四种类型:(1)异质的(Heterogeneous):没有特定的语料收集原则,广泛收集并原样存储各种语料;(2)同质的(Homogeneous):只收集同一类内容的语料;(3)系统的(Systematic):根据预先确定的原则和比例收集语料,使语料具有平衡性和系统性,能够代表某一范围内的语言事实;(4)专用的(Specialized):只收集用于某一特定用途的语料。 除此之外,按照语料的语种,语料库也可以分成单语的(Monolingual)、双语的(Bilingual)和多语的(Multilingual)。按照语料的采集单位,语料库又可以分为语篇的、语句的、短语的。双语和多语语料库按照语料的组织形式,还可以分为平行(对齐)语料库和比较语料库,前者的语料构成译文关系,多用于机器翻译、双语词典编撰等应用领域,后者将表述同样内容的不同语言文本收集到一起,多用于语言对比研究。目前已经累积了大量各种类型的语料库,如:葡萄牙语种树库、面向文本分类研究的中英文新闻分类语料库、路透社文本分类训练语料库、中文文本分类语料库、大开放字幕库OpenSubtitles的多语言平行语料数据(OpenSubtitles Corpus)、《圣经》双语语料库("Bible" bilingual corpus)、Short messages service(SMS ) corpus(短消息服务(SMS)语料)等。 特征 语料库有三点特征 1.语料库中存放的是在语言的实际使用中真实出现过的语言材料,因此例句库通常不应算作语料库; 2.语料库是承载语言知识的基础资源,但并不等于语言知识;

比较优势理论综述

比较优势理论综述 李雪莹经济学2班32012030080 摘要:亚当·斯密在《国富论》中对重商主义进行了批判,提出了自由贸易的思想,构建了绝对优势理论。但当一国在两种商品生产中均无绝对优势时,绝对优势理论无法说明两国如何开展贸易。英国经济学家大卫·李嘉图将绝对优势理论进一步推进,提出了著名的比较优势理论。此后更是涌现出大批学者对比较优势进行研究。 关键字:比较优势成本劳动生产率 在18世纪后期,英国在第一次工业革命进程后已成为世界第一的商业和殖民地强国,贸易保护已经是不必要的存在。在这个时期,亚当·斯密的经典著作《国民财富的性质和原因的研究》(简称《国富论》)应运而生。亚当·斯密在该书中对重商主义限制从外国进口国内能生产的货物、对本国有逆差的国家的商品进口进行限制等方面进行了批判。此外,在批判重商主义的基础上,提出了自由贸易的思想,构建出著名的绝对优势理论。 下面对绝对优势理论给出一个例子: 表1-1分工前 上表说明英国一天可生产5匹毛呢或者3桶酒,而葡萄牙一天可以生产3匹毛呢或者5桶酒。由此可见,英国在毛呢的生产上具有绝对优势,而葡萄牙在酒的生产上有据对优势。在没有国际贸易时,2天两国一共可生产8匹毛呢和8桶酒。 表1-2分工后

假设分工后,两国以绝对优势进行生产,英国只生产毛呢,则2天可以生产10匹毛呢,葡萄牙只生产酒,则2天可以生产10桶酒。此时,2天两国一共可以生产10匹毛呢和10桶酒。世界总产量增加,增加了2匹毛呢和2桶酒。 表1-3交易后 若两国以5匹毛呢换5桶酒进行交易。交易后,英国和葡萄牙均拥有5匹毛呢和5桶酒。英国比不进行分工和贸易时多了2桶酒,葡萄牙比不进行分工和贸易时多了2匹毛呢。英国和葡萄牙的福利都增加了,世界总福利增加。 绝对优势理论证明了,当某国在某种商品的生产上拥有绝对优势时,贸易的发生会带来世界福利的增加。 但当一国在两种商品生产中均无绝对优势时,绝对优势理论就无法说明两国如何开展贸易。由此可见,亚当·斯密的绝对优势理论只有在满足一国在某种商品的生产上有绝对优势的前提下适用,该理论存在着严重的局限性。 二、大卫李嘉图比较优势理论 战后英国的粮食价格下跌。为阻挡谷物的进口,避免利益受损,土地所有者们设法制定了向进口谷物征收一定费用的法律,《谷物法》因此诞生。大卫·李嘉图知道,如果废除《谷物法》会使资本所有者获益,土地所有者受损。但作为伦敦商人,他更偏向于资本家们,而不是闲懒的地主贵族。比较优势理论无疑是带有政治色彩的。大卫·李嘉图实际上代表了某一个集团的利益时,强调的是整个国家的收益。这是一个聪明十足的现代策略,他也是将经济学理论作为一种政治工具来适用的先驱。 李嘉图认为,产品的比较优势来自于不同产品之间劳动生产率的相对差别,一国相对劳动生产率较高的产品具有比较优势,相对劳动生产率较低的产品则具有比较劣势。即便一国在每一种商品的生产上都比其他国家绝对地缺乏生产率,它依然能够通过生产和出口那些“与外国相比生产率差距相对较小”的产品在国际分工中占有一席之地;而在每一种产品生产上都比其他国家绝对地具有高生产率的国家,也只能生产和出口“与外国相比生产率差距较大”的产品来获得分工

语料库整理要求及方法

一、需整理的多是ppt语料,也有些word文档的语料(见Boston Consulting-需做库-12.10文件夹)。整理要求如下: 1、利用Align Assist工具将ppt中原文译文提取出来,并根据中英文内容一句句对齐。如图: 2、利用Align Assist工具对ppt中的内容进行提取时,软件会遗漏部分内容。因此需要在对齐之后将软件自动提取后遗漏的句对逐句复制补充进去。 3、对齐完成后,将对齐结果分别保存为tmx格式及aares格式,tmx为最终需要的语料格式,但无法修改且预览不便。aares为临时语料文件,可修改,可即时预览。因此,请大家对齐时两种格式都保存下来。保存方法见第二部分。 二、整理方法: 1、安装Align Assist语料对齐工具(安装程序见AlignAssist_Setup_1.5.1文件夹)。双击AlignAssist_Setup_1.5.1.exe的程序进行安装。语言选择为english。

2、双击运行。将要对齐的原文文件和译文文件分别添加进去。

注意原文和译文语言方向。根据文件夹要求确定英文、中文何为原文,何为译文。 例:project1-中到英,则中文文件为source file,英文文件为target file。 源文本和译文本添加完成后,点击Align。进入如下界面。 3、注意split、merge、delete、swap的用法。 (1)split:将一句话断开为两句

随意举例:将第六句原文“当前全球经济正经历深度调整,各国需联手培育新的经济增长点和竞争优势。”断为:“当前全球经济正经历深度调整,”及“各国需联手培育新的经济增长点和竞争优势。”选中第六句原文,边框变黑。 单击上方菜单split。 进入下图界面。将第二小句内容剪切粘贴到cell 2部分,然后单击ok。 即分句完成。

相关主题
文本预览
相关文档 最新文档