现在标准阿拉伯语的主观性和情感分析
- 格式:pdf
- 大小:220.01 KB
- 文档页数:4
阿拉伯点解读阿拉伯语(Arabic)是印欧语系现代语言家族波斯亚语支中的一门主要语言,也是世界上最广泛使用的三大语言之一,被说得最多的第六大语言。
阿拉伯语在游牧著名的阿拉伯世界的范围发源并且流传一直到目前,已经有超过一亿多人使用它作为大家首选的语言。
一、历史沿革阿拉伯语是一种纯正的古老的伊斯兰语言,追溯到九世纪以前的维扎尔语时期。
它的现代标准形式是以阿拉伯伊斯兰教权威玛里西姆哈佛为最重要的原料,而由学者们建构而成新的整体体系。
自此以后,阿拉伯语逐渐得到更为普及,最终辐射到伊斯兰世界的大概九个国家。
二、语言特点阿拉伯语具有丰富的语言文化历史,相比较其他同属于印欧语系的语言,它所具有的特点更加独特。
它有一定的发音结构,除拉丁字母外,还有一种在伊斯兰世界普遍使用的字母体系——伊斯兰语字母;同时,阿拉伯语在语言组织上更加注重修辞,善于平衡语句,犹如詩句;此外,信仰与文化背景影响下,阿拉伯语词汇有高度集中特点,受宗教原则严格控制,总结而言,口语表达能力非常出色,也更容易进行学习。
三、广泛使用阿拉伯语目前主要分布于中东、北非等地,因伊斯兰文化历史深厚,宗教传统浓重,使得阿拉伯语的使用范围不断扩大。
无论是在商业、教育、新闻传媒甚至是政治,都可以看到它在发挥着重要的作用。
而随着国际经济和贸易的发展,阿拉伯语也成为现代通用语言和外语之一,越来越受到广泛使用。
四、文化内涵阿拉伯语文化是将由阿拉伯语词汇组成的有机文化体系,它具有强烈的宗教思想,以及经久不衰的传统文化和艺术特征。
文明古巴比伦由阿拉伯古老文明延伸而来,而今日的阿拉伯文明大多保留着古巴比伦的文化遗产。
它以伊斯兰教为主,并对其它宗教、中文、英语等语言文化有着融合竞争的态度。
其文化非常活跃,可以免费参观众多博物馆,可以在文艺中体验伊斯兰教与阿拉伯文明的精髓。
五、语言教学阿拉伯语教学主要以语法、口语与写作为重点,采取的书写形式也是拉丁字母和伊斯兰语字母混合的形式。
学习阿拉伯语的体会阿拉伯语三分钟范文
研究阿拉伯语的体会
在研究阿拉伯语的过程中,我有着许多宝贵的体会。
阿拉伯语
是一门富有魅力和历史底蕴的语言,掌握它不仅能够拓宽视野,还
能够更好地了解阿拉伯文化和文明。
首先,研究阿拉伯语让我更好地感受到了语言的多样性和美妙
之处。
阿拉伯语是一门非常有规律性的语言,它的语法结构清晰,
发音纯净。
我发现,通过研究阿拉伯语,我能够更好地理解语言背
后的系统和逻辑。
这种体验对我在研究其他语言时也有很大的帮助。
其次,研究阿拉伯语让我更加深入地了解阿拉伯文化和文明。
阿拉伯国家有着悠久的历史和丰富多样的文化遗产。
通过研究阿拉
伯语,我能够更深入地了解阿拉伯文学、艺术和宗教。
我发现,阿
拉伯语是了解这些方面的重要工具,它能够让我更好地与阿拉伯人
民进行交流和交流文化。
另外,研究阿拉伯语也对我的个人发展产生了积极的影响。
阿拉伯语是世界上使用人数最多的语言之一,掌握它可以让我在职场上有更多的竞争力。
而且,研究阿拉伯语也让我变得更加开放和包容,能够更好地理解和尊重不同文化和。
总结起来,研究阿拉伯语是一段非常有意义的旅程。
它不仅让我掌握了一门富有魅力的语言,还让我更加深入地了解了阿拉伯文化和文明。
这种研究体验不仅拓宽了我的视野,也为我的个人发展打下了坚实的基础。
探究阿拉伯语中的语气和语态阿拉伯语是一种广泛使用的语言,拥有丰富的语法体系和语言特点。
其中,语气和语态是阿拉伯语中非常重要的概念。
本文将探讨阿拉伯语中的语气和语态,旨在帮助读者更深入地了解阿拉伯语的语法结构和表达方式。
一、阿拉伯语中的语气语气是语言中表达说话者情感、态度和语义意义的方式。
在阿拉伯语中,语气可以通过词汇、语法结构和语调等方式来实现。
1.陈述语气陈述语气是阿拉伯语中最常见的语气形式之一。
它用于陈述事实、描述客观现象以及进行客观分析等。
一般情况下,陈述语气没有明显的语法标志,根据上下文可以确定。
例如:سردم. (Ahmad mudarris.)- 阿赫迈德是一位老师。
دمحأ2.祈使语气祈使语气用于表达命令、请求、劝告等。
在阿拉伯语中,祈使语气可以通过单独的动词形式来实现,也可以通过使用命令词,如"بهذا"(前往)、"أرقا"(读)等来达到语气的目的。
例如:بهذاةسردملا. (Idhab ila almadrasah.)- 去学校。
ىلإ3.虚拟语气虚拟语气用于表达假设、愿望、推测等非实际情况。
在阿拉伯语中,虚拟语气可以通过多种语法结构来实现,如使用虚拟依从句等。
例如:ءيشلاهسفن. (Law kuntu fi makānik, laʿamaltuتلمعل،كناكمتنكيفولalshay' nafsaha.)- 如果我在你的位置上,我会做同样的事。
二、阿拉伯语中的语态语态是语言中表示主语与谓语之间关系的形式。
在阿拉伯语中,主要有两种语态,即主动语态和被动语态。
1.主动语态在主动语态中,动作的执行者是主语。
主动语态在阿拉伯语中是默认的语态,即如果不特意标记为被动语态,那么句子默认为主动语态。
例如:باتكلا. (Ahmad yaqra'u alkitab.)- 阿赫迈德正在读这本书。
أرقيدمحأ2.被动语态在被动语态中,动作的承受者是主语。
阿姆哈拉语的语音特点如何体现文化内涵阿姆哈拉语是埃塞俄比亚的官方语言之一,拥有着独特的语音特点,这些特点不仅仅是语言形式上的表现,更深深蕴含着埃塞俄比亚丰富的文化内涵。
阿姆哈拉语的语音系统较为复杂。
它包含了众多的元音和辅音,元音的长短和音质变化丰富。
这种丰富的元音系统使得阿姆哈拉语在发音上具有较强的音乐性和节奏感。
例如,长元音的存在使得词语在发音时更富有韵律,就如同诗歌朗诵一般,富有韵味。
这种音乐性和节奏感反映了埃塞俄比亚人民对艺术和美的追求,在他们的文化中,音乐、舞蹈和诗歌都占据着重要的地位。
通过语言的韵律,人们能够感受到文化中对表达情感和传递美感的重视。
辅音的特点也十分显著。
阿姆哈拉语中的某些辅音发音较为独特,需要特定的发音部位和方式。
这种特殊的辅音发音要求反映了埃塞俄比亚文化中的精确和细致。
在日常生活和交流中,人们注重准确地表达自己的想法和感受,这种对精确性的追求也体现在语言的语音特点上。
阿姆哈拉语的声调也是其语音特点之一。
不同的声调可以改变词语的意义,这要求使用者在交流中对声调有准确的把握。
声调的变化不仅增加了语言的表达力,也反映了埃塞俄比亚文化中对细微差异的关注。
在社会交往和人际关系中,人们善于捕捉细微的情感和态度变化,通过语言的声调来传达更丰富、更细腻的信息。
从语言的语速和语调方面来看,阿姆哈拉语在不同的情境下会有不同的表现。
在正式的场合,语速可能较为缓慢,语调平稳,以显示庄重和严肃;而在日常的交流中,语速可能加快,语调更加活泼,充满活力。
这种语速和语调的变化反映了埃塞俄比亚文化中对不同场合和社交情境的重视。
人们懂得根据场合调整自己的语言表达方式,以适应社会规范和文化传统。
阿姆哈拉语的语音特点还与宗教文化有着密切的联系。
在宗教仪式和宗教经典的诵读中,特定的语音和语调被赋予了神圣的意义。
例如,某些元音和辅音的组合在宗教语境中具有特殊的象征意义,通过准确的发音来表达对宗教的虔诚和敬畏。
这种宗教与语言语音的紧密结合,体现了宗教在埃塞俄比亚文化中的核心地位,以及语言作为宗教传承和表达的重要工具。
实用的阿拉伯语学习方法导语:最近发现,有好多阿语学子对阿拉伯语的学习看不到眉目而苦恼。
下面分享实用的阿拉伯语学习方法,欢迎参考!在初级阶段,模仿为主。
听说领先,精讲多练。
就是到了中级阶段和高级阶段,听说能力都是重中之重。
听是前提,说是表达。
克服怕错怕羞的心理障碍,从大声朗读入手,勇于听说,锻炼口才,与人交流,敢说巧说。
如下几种方法易行有效:(1)模仿录音:注意语音的轻重缓急和语调的抑扬顿挫,体味阿语的节奏感、韵律美和表述方式。
然后口述听懂的内容,就会潜移默化。
(2)交流互动:学语言就要多言语,力争声音宏亮、口齿清楚。
情景教学,模拟演练,学生是主演,老师是导演。
课上师生互动,课下同学互动,个人自问自答,枯燥变为精彩。
(3)限时连续提问,个人或小组就熟悉的题目限时三分钟提出二十五个内容有深度表达有质量的问题,提高表达能力,训练思维能力。
(4)“死去活来”讨论会:几个同学就熟悉的题材展开讨论。
合作学习,相互促进。
不要背课文,而是运用课文中的词汇句型灵活表达自己的想法。
我们学课文,如同买建材学设计,然后用来盖自己的房子。
走进课文,闯出教材。
这就是人们常说的“死去活来”,即学用结合,学中用,用中学,思维高度运转,享受思考的乐趣,挖掘自己的潜力,潜力如同地下水。
(5)接龙讲故事:几个同学接龙讲述熟悉的故事,一人一两句,多人有条理并有声有色地讲述一个完整的故事。
看似是场好戏,寓学于乐,即启迪思维,又练习听说。
个人能力有限,与人共赢才能成功。
“三人行,必有我师。
”合作伙伴的多寡决定着成功的大小。
我们倡导听说领先,还要读写跟上,读说一板一眼,书写迅速标准。
经常练习“听写”是一种重要的有效的方法,并会书法的手写体。
阿拉伯语是“先懂后读”的语言。
书面文字只写出辅音字母,只给读者75%的意思,另外的25%那么要靠读者运用词法和句法知识去正确判断出来。
语法是看不见摸不着但可分析出来的语言的灵魂。
到了中级阶段,语言知识学多了,就应在继续提高听说能力根底上,逐步采用:在研读课文时,要剖析每个派生词的来历,了解每个词组的构成,分析每个句子中各单词的语法成分。
阿拉伯语语法点分析方法阿拉伯语是诸多世界语言中的一种,很多人在学习阿拉伯语时都会遇到语法难题。
本文将介绍一些阿拉伯语语法点分析的方法,帮助读者更好地理解和应用阿拉伯语语法。
一、词性分析在阿拉伯语中,每个词都有特定的词性。
词性指的是词在句子中的功能和意义。
常见的阿拉伯语词性包括名词、动词、形容词、副词、代词等。
通过词性分析,可以更准确地理解句子的结构和意义。
例如,对于以下的阿拉伯语句子:ةيدهلاةليمجلا.مكلىلعًاركش(Shukran lakum 'ala al hadiya al jamila.)词性分析可以得出以下结果:- ًاركش (shukran) 是副词,表示感谢;- مكل (lakum) 是代词,表示“你们”;- ىلع (ala) 是介词,表示“在...之上”;- ةيدهلا (al hadiya) 是名词,表示“礼物”;- ةليمجلا (al jamila) 是形容词,表示“美丽的”。
二、句法分析句法是研究句子结构和句子成分之间关系的学科。
在阿拉伯语中,句子的主语、谓语、宾语等成分在句子中的位置和形式都有一定规律。
通过句法分析,可以帮助读者更好地理解句子结构,并正确地使用各个成分。
例如,对于以下的阿拉伯语句子:ةءارقلا.انأبحأ(Ana uhibbu al qira'a.)句法分析可以得出以下结果:- انأ (Ana) 是主语,表示“我”;- بحأ (uhibbu) 是谓语,表示“喜欢”;- ةءارقلا (al qira'a) 是宾语,表示“阅读”。
三、时态和语气分析在阿拉伯语中,时态和语气对句子的意义起着重要作用。
正确理解和运用时态和语气是学习阿拉伯语的关键之一。
通过时态和语气分析,可以确保句子表达准确、流畅。
例如,对于以下的阿拉伯语句子:ًادغ.بهذأسةسردملاىلإ(Sa'adhhab ila al madrasa ghadan.)时态和语气分析可以得出以下结果:- بهذأس (sa'adhhab) 是将来时态,表示“我将去”;- ىلإ (ila) 是介词,表示“到...”;- ةسردملا (al madrasa) 是名词,表示“学校”;- ًادغ (ghadan) 是副词,表示“明天”。
阿拉伯语母语者的表达习惯有哪些特点阿拉伯语作为世界上主要的语言之一,拥有着丰富的文化内涵和独特的表达方式。
对于非阿拉伯语学习者来说,了解阿拉伯语母语者的表达习惯不仅有助于更好地学习这门语言,还能增进对阿拉伯文化的理解和交流。
一、语音和语调阿拉伯语的语音特点十分显著。
其元音和辅音的发音方式与许多其他语言有所不同。
例如,阿拉伯语中有一些独特的喉音和顶音,这对于初学者来说可能具有一定的挑战性。
在语调方面,阿拉伯语通常具有较为平稳和流畅的特点。
句子的重音和节奏往往与词汇的重要性以及语法结构相关。
重读音节可能会更加强调,以突出重点或表达特定的情感。
二、词汇使用1、丰富的词汇阿拉伯语拥有丰富的词汇,涵盖了生活的各个方面。
从宗教、哲学到日常生活、科学技术,都有专门的词汇来准确表达。
2、借词由于历史和文化交流的原因,阿拉伯语中也吸收了不少外来词汇,尤其是来自波斯语、土耳其语和英语等。
然而,这些借词在使用过程中往往会经过一定的改造和适应,以符合阿拉伯语的语法和发音规则。
3、比喻和象征阿拉伯语母语者在表达中常常运用比喻和象征的手法,使语言更加生动形象。
他们会用自然界的事物、动物或者传统的故事来形容某种情感、状态或情况。
三、语法结构1、动词变位阿拉伯语的动词变位非常复杂,根据主语、时态和语气的不同,动词会有多种形式的变化。
这种变位系统不仅反映了动作发生的时间和状态,还能表达说话者的态度和意图。
2、名词的性、数、格名词在阿拉伯语中有阳性、阴性和中性之分,同时还有单数、复数和双数的变化。
这些变化不仅影响名词本身的形式,还会对与之相关的形容词、代词和动词产生影响。
3、语序阿拉伯语的基本语序通常是“主语宾语动词”,但在实际表达中,为了强调某些成分或者遵循特定的语言习惯,语序也会有所调整。
四、修辞和表达方式1、夸张为了增强表达的效果,阿拉伯语母语者经常使用夸张的手法。
这种夸张并非是为了虚假宣传,而是为了更强烈地表达情感或突出事物的重要性。
摘要:语用学中的语用含义与言语行为的得体与否直接关系到外交、外事工作,有时甚至会影响到国家民族宗教政策对外的宣传。
本文以埃及当代著名小说家纳吉布·马哈福兹小说《始与末》为例,分析阿拉伯语会话含义与言语行为的独特之处。
关键词:阿拉伯语语用含义言语行为研究★基金项目:陕西省教育厅2014年度科研计划专项资金资助项目阿拉伯语语用含义与言语行为研究以纳吉布马哈福兹小说《始与末》为例(14jk1590)一、引言阿拉伯语语用含义和言语行为非常有益且有必要,在实际的语言教学与研究过程中,我们发现阿拉伯语语句的语用功能与广泛的文化因素、情景因素、宗教因素有着密切的关系,其语用受到其文化环境和场景的直接影响,尤其是阿拉伯伊斯兰文化与西方文化之间有着非常鲜明的差异,所以,由文化所决定的会话含义和言语行为在理解和使用上也会表现出很大的差异。
阿拉伯语的语用含义和言语行为与西方语用学理论相比,有其独特与不同之处。
迄今为止,西方语言哲学家不仅为语用学的产生奠定了理论基础,而且在该领域的研究已达到成熟且建树颇多,不胜枚举。
但在研究阿拉伯语的语用含义和言语行为时要注意,虽然二者有相似之处,但也不可全体照搬西方语用学理论。
为了能够更好地了解阿拉伯人会话含义的独特特征、合作原则和礼貌原则以及其言语行为所体现的语境对实施言语行为的影响和语用方面的文化差异所在。
通过对埃及当代著名小说家1988年诺贝尔文学奖得主纳吉布马哈福兹具有代表性的小说《始与末》中的人物对白、情景和语境所体现的会话含义和言语行为中具有代表性的且贴近社会生活的小说中主人公的会话和言语行为来分析并阐述阿拉伯语中会话含义和言语行为的主要特征体现,了解在格莱斯会话含义的理论框架下,阿拉伯语中语言的表达方式和应用特点,清晰地剖析阿拉伯人会话含义的主要特征、文化语境和宗教因素对阿拉伯人日常生活的言语行为有着直接且深远的影响。
二、新格莱斯会话含义理论在小说《始与末》文本中的体现格莱斯认为在所有语言的交际活动中,说话人和听话人之间存在一种默契,一种双方都应遵守的原则即合作原则,遵循合作原则,产生的是一般含义,而违背该原则,则产生特殊含义,而在此过程中,会话含义中的礼貌理论、语境和情景构建对会话含义有着直接的影响。
摘要:修辞是探讨如何修饰语言的表达,使文意在准确明了的基础上更加生动形象,具有吸引力的一门学科。
阿拉伯语修辞学是一门有着悠久历史的学科,其体系可以分为三个部分:辞达学,辞巧学和辞华学。
阿拉伯语修辞学不仅使阿拉伯语在文意方面更加畅达,清晰,而且使其在表达上更加生动,鲜明。
不但加强了语气,而且突出了文字表达的效果,使阿拉伯语在不同文体中形成了独特的风格,进而促进了阿拉伯语风格学的形成。
除此之外,阿拉伯语修辞学还扩大了阿拉伯语的词汇量,因而在阿拉伯语词汇学的发展中也起到了不可低估的作用。
关键字:阿拉伯语;修辞学;作用;价值;阿拉伯语修辞学修辞学是语言学的一门分科,它探讨了如何修饰语言的表达,主要涉及两个方面的内容:一是材料的选取和组织,即根据不同的场景和文体,选择具有能够表达特定语境的词汇和句式。
二是修饰格式的运用,即根据不同文意所要表达的侧重点和效果,选择与之相匹配的修辞格(表现手法),增强文句的可读性和鉴赏性。
阿拉伯语修辞主要研究在具体语言环境里如何对语言进行选择、加工,以便“最有效地运用语言”。
它的范围十分广泛,包括了一切语言形式,书面的和口头的,文学性的和非文学性的。
其历史悠久,可追溯到伊斯兰教兴起之前,即蒙昧时期的诗人,演说家就十分注意对词句的推敲。
比喻、借喻、谐音等修辞手法在他们的作品里屡见不鲜。
《古兰经》降世后随着人们的不断研究,摘抄出了其中很多具有修辞现象的经文。
阿拉伯语修辞学在阿巴斯时期达到巅峰,此后随着文学和各门学科的衰退而停滞不前。
因而在现当代不断有人发出革新修辞学的呼声。
阿拉伯语有两个突出的特点:句式具有音乐美感和抑扬顿挫的节奏感、词汇量丰富。
许多字符具有共同的结构和元音分布。
因而在字符的种类、音符、数量上进行有规律的组合和排列即可产生精美绝伦的韵律感。
这便为阿拉伯语修辞中的“谐音”奠定了语音方面的基础。
众所周知,阿拉伯人以其“舌头”闻名天下,除去阿拉伯语字母本身具有乐感外,还与修辞中谐音的的作用密不可分。
现代标准阿拉伯语的主观性和情感分析
摘要:尽管现在主观性和情感分析已经应用在一系列小说的研究上,但是很少有尝试去给语言的丰富的形态建立一个主观性和情感分析系统。
在目前的研究中,我们的努力,部分地填补了这一空白。
我们提出了一个新开发的人工标注的现代标准阿拉伯语(MSA)语料库和一个新的完全对立的词库。
这个语料库是一些新闻专线文档在句子级注释的集合。
我们还描述了一个可以用于开发注释数据的自动主观性和情感分析标记系统。
我们研究在主观性和情感分析分类工作中预处理设置不同级别的影响,我们证明这个系统可以大大的提高对丰富的语法明确的解释的效率。
1,介绍
主观性和情感分析已经被应用在一系列小说方面的研究,在自然语言界,主观性指意见表达、评估、感情和猜测(班菲尔德,1982;wiebe,1984),因此包含情绪。
主观性分类过程是指从分类文本中区分出主观性(例如:穆巴拉克,可恶的独裁者,下台)和客观性(例如:穆巴拉克下台),主观性文本是情感和极性的进一步分类,对于情绪分类,任务是指辨别出主观性文本是积极地(例如:一个优秀的照相机),消极的(例如:我讨厌这相机),中立的(例如:我相信这将是一个会议),或者,有时是混合的(例如:它很好,但是我讨厌它)文本。
大多数的主观性和情感分析文献都集中在英语或者其他欧洲殖民地的土著语言,很少有研究去解决丰富的语言语法的问题,例如阿拉伯语,土耳其希伯来语,捷克语等。
(Tsarfaty et al., 2010)。
一般来说,大量语言语法问题是对自然语言处理系统的重大的挑战,主观性和情感分析也不例外,在一些语言语法上,由于缺少主观性和情感分析的资源,这个问题甚至更加明显,例如有注释的语料库,和有极性的词典。
在当前的研究中,我们的任务是从新闻专线类别现代标准阿拉伯语文本句子级的主观性和情感分析研究。
我们在应用阿拉伯树图资料库(Maamouri et al., 2004),和使用两个独立语言以及阿拉伯语的特性的已标记的文本的基于数学形态学特征的三个不同的过程设置去进行实验,我们的工作表明,在我们的模型中明确的应用基于数学的形态学特征证明这个系统的性能,我们也估计在改善分类性能应用一个覆盖面广
的极性词典和演示应用一个定做的资源的影响。
2,方法
从我们知道的知识,没有带注释的现代标准阿拉伯语主观性和情感分析数据存在。
因此我们决定建立一个我们自己的主观性和情感分析注释数据。
2.1数据集和注释
语料库:两个受过大学教育的母语为阿拉伯语的人士在PATB中的第一部分V3.0注释了2855个句子。
这些句子组成这部分PATB的第一个400份文档总计约PATB第一部分数据集的54.5%,对于每个句子,注释者指定了4个可能的标签:(1)客观的(OBJ),(2)主观的-积极地(S-POS),(3)主观的-消极的(S-NEG),(4)主观的-中立的(S-NEUT)。
然后(Wiebe et al., 1999),如果一个句子的标签是OBJ第一印象就是根据报告的信息判断句子是客观的。
否则,这个句子就是其他三个之中一个主观性分类,多个注释者一起可以达到88.06%。
在我们的数据集中级别的描述如下:1281个客观的,1574个主观的,有491个被认为是S-POS,689个是S-NEG,394个事S-NEUT。
此外,在我们的数据集中的每个句子都是用一个领域的标签手动标注的。
这个领域标签来自于新闻专线分类和采用(Abdul-Mageed, 2008)。
极性词典:我们手动创建了一个有3982个形容词且贴有以下标记的{积极地,消极的,中性}标签的的词典。
这些形容词从属于新闻领域。
2.2 自动分类
标记化方案和设置:我们在PATB上的金色标记的文本上进行实验,我们采用PATB+A1的标记化方案,我们采用PATB+AL标记化方案,这种方案后接的和附属词都是从主茎中分离得出。
我们尝试使用三个不同的针对词干词的预处理单词配置:(1)表面,词干的表面是由最小的曲折词素组成的;(2)词元,词干词是减少他们的词元引用形式,举个动词的例子来说,男性第三人称单数的完成时;(3)词干,就是表面减去屈折语素,这种配置能导致非适当的阿拉伯语词汇(按信息检索),表1说明了这三种配置方案的例子。
特点:我们采用的产品特征主要有两种:独立的语言特征和形态特征。
独立的语言特征:这种特性已经被应用于各种各样的SSA研究。
域:如下(Wilson,2009),我们用一个特征来表明句子归属的文档的域。
正如前面所提到的,每一个句子都有一个文档域手动的标签与之关联。
独特性:如韦伯等其他人(2004)应用的一个独特性。
即单词,发生在我们的语料库的的绝对次数小于五,就替换为令牌“独特”。
N-GRAM:我们对N-GRAM小于等于4的所有可能的组合进行试验。
形容词:对于主观分类,(我们在一个句子中根据Bruce & Wiebe的添加一个有形容词特征的来表明是否有任何形容词存在于我们手动创建的极性词典中),我们按照布鲁斯·韦博(1999年)中添加一个具有二分特征的形容词,不论这些我们手动创建的形容词是否能在句子里创造出来极性词典。
对于情绪分类,我们应用两个特性,积极性的形容词和消极性的形容词,在一个句子中的任何一个二分特征表明是积极性的形容词还是消极性的。
MSA形态学特征:MSA表现出了非常丰富的形态系统,它是商业的,凝集的,基于派生性和屈折性的。
我们明确了人、状态、性别、时态、外貌、和数字的形态特征模型。
我们不适用POS信息,我们假设我们模型中是未评论的的文本。
2.3 方法:两级分类过程
在目前的研究中,我们采用两级分类方法。
在第一个阶段(即主观的),我们建立一个二分分类器从主观性容器中分出客观的,第二阶段(即情感)我们采用二分分类法从S-NEG中区分出SPOS。
我们忽视试验中的中立信息。
我们使用一个SVM(支持向量机)分类器,SVM包
(J oachims, 2008)。
我们尝试各种各样的核心程序和参数设置使线性内核产生最好的性能。
我们用存在向量运行实验:在每个句子矢量中,每个容器的值都是二进制的,不是0就是1(不管有多少次特性发生)。
实验条件:我们首先使用3个词形归并的全部运行实验,并应用各种各样的N-grams和N-gram组合甚至迭加其他性能设置表面,引理,枝干。
形态特征(即变形)仅仅添加了枝干设置。
独立语言特性(即从下面的设置{DOMAIN,ADJ,UNIQUE})加入到引理和枝干
+语素设置,这是三个设置中,附着词素就是在句子向量中保持独立特性的分裂词。
3 结论和评价
我们把我们的数据80%划分用于5层交叉检验,20%用于测试。
相对于实
验测试数据,这80%用作运行数据。
我们有两个设置,一个开发环境(DEV),一个测试设置(TEST)。
在开发环境中,我们运行典型的5层交叉检验,就是我们锻炼四层改善测试第五层,然后取平均值。
在测试设置中,我们仅仅和开发环境中产生的最好的配置一样。
在测试方式中,我们仍然只运行前四层但是我们的测试数据是唯一的,平均在不同的运行范围。
值得注意的是,测试数据大于任何给定的开发环境数据(总体数据的20%用于测试,16%。
)。
我们用F-measure(F)报告结果。
此外,对于测试,我们的报告上仅仅只有在Stem+Morph setting和Stem+Morph+ADJ ,Stem+Morph+DOMAIN, Stem+Morph+UNIQUE上面的实验。
下面,我们仅仅报告在N-GRAM以及它们的组合上最好的执行结果。
每种情况中,我们的基线是训练机中的大部分分类。
3.1 主观性
在所有的词元化设置中,枝干是最好的,执行73.1%F(with 1g+2g),表面71.97%F(with 1g+2g+3g),引理72.74%F(with 1g+2g)。
另外,添加屈折形态学特性提高了分类(and hence the Stem+Morph setting, when ran under the same 1g+2g condition as the Stem, is better by 0.15% F than the Stem condition alone))。
对于语言独立性,we found that whereas the ADJ feature does not help neither the Lemma nor Stem+Morph setting, the DOMAIN feature improves the results
slightly with the two settings. In addition,独立特性有助于分类和引理,但是会伤害Stem+Morph。
表2表明,尽管。