当前位置:文档之家› 情感计算综述

情感计算综述

情感计算综述
情感计算综述

情感计算综述

控制工程1102班李晓宇 2111103172

摘要:情感计算是人工智能的一个分支。情感计算的目的是通过赋予计算机识别、理解、表达和适应人的情感的能力来建立和谐人机环境,并使计算机具有更高的、全面的智能。本文分别从情感计算的研究历史、应用前景、研究内容和理论框架来阐述情感计算,以便使更多的人了解情感计算。

关键字: 情感计算;情感识别;情感理论框架

Summary of Affective Computing

Abstract:Affective computing is a branch of artificial intelligence. The aim of affective computing is to give computers to recognize, understand, adapt to people's emotional expression and the ability to establish harmonious human environment, and to have higher computer, full of intelligence.This paper explain affective computing through the study of history of affective computing ,applications in the future, research content and theoretical framework, so that more people understand the affective computing.

Key word: Affective computing; emotion recognition; the theoretical framework of emotional

1、引言

情感计算的概念是在1997年由MIT媒体实验室Picard教授提出,她指出情感计算是与情感相关,来源于情感或能够对情感施加影响的计算。中国科学院自动化研究所的胡包刚等人也通过自己的研究,提出了对情感计算的定义:“情感计算的目的是通过赋予计算机识别、理解、表达和适应人的情感的能力来建立和谐人机环境,并使计算机具有更高的、全面的智能”。

在较长一段时期内,情感一直位于认知科学研究者的视线以外。直到20世纪末期,情感作为认知过程重要组成部分的身份才得到了学术界的普遍认同。当代的认知科学家们把情感与知觉、学习、记忆、言语等经典认知过程相提并论,关于情感本身及情感与其他认知过程间相互作用的研究成为当代认知科学的研究热点,情感计算( affective computing )也成为一个新兴研究领域。

众所周知,人随时随地都会有喜怒哀乐等情感的起伏变化。那么在人与计算机交互过程中,计算机是否能够体会人的喜怒哀乐,并见机行事呢?情感计算研究就是试图创建一种能感知、识别和理解人的情感,并能针对人的情感做出智能、灵敏、友好反应的计算系统,即赋予计算机像人一样的观察、理解和生成各种情感特征的能力。

2、研究现状

让计算机具有情感能力首先是由美国MIT大学Minsky教授(人工智能创始人之一)提出的。他在1985年的专著《The Society of Mind》中指出,问题不在于智能机器能否有任何情感,而在于机器实现智能时怎么能够没有情感。从此,赋予计算机情感能力并让计算机能够理解和表达情感的研究、探讨引起了计算机界许多人士的兴趣。这方面的工作首推美国MIT 媒体实验室Picard教授领导研究小组的工作。情感计算一词也首先由Picard教授于1997年出版的专著《Affective Computing》中提出并给出了定义,即情感计算是关于情感、情感产生以

及影响情感方面的计算。

目前情感计算的研究普遍受到学术界和企业界的关注,国际知名公司,如IBM和British Telecom等均成立了专门的情感计算研究小组。国际知名大学也纷纷建立情感计算研究小组。总的来说,情感计算的研究均处于起步阶段。MIT目前的工作侧重于有关情感信号的获取(如各类传感器的研制)、情感计算的应用和可穿戴计算机。日本学者的研究侧重于感性信息处理方面。在情感计算的研究过程中,与之密切相关的可穿戴计算机的研究近几年来也得到了迅猛的发展(于1997年10月在美国波士顿召开第一次国际研讨会后已连续举行多次国际会议)。这种计算机的特点是可以巧妙地构成日常穿戴的一部分(如眼镜、手表、项链、手镯、腰带、鞋、帽、服装等),使计算机和其穿戴者始终保持形影不离。可穿戴计算机可为情感计算的研究提供一个很好的研究平台,另外情感计算的最终表现形式可能是可穿戴计算机或植入人体的芯片,从而将情感计算、移动计算和计算机融合而真正成为个性化的人机融合。虽说情感计算是一门新兴学科,但以往的研究也为其提供了一定的知识积累。从情感方面来讲,人类心理学和生理学的研究为情感计算提供了坚实的基础;从相关研究内容来讲,如人脸及面部表情识别、人脸及面部表情合成、手语识别与合成、气味识别等也是学术界一直研究的重点;同样各种医学器械、测谎仪等的研制成功也为情感计算提供了一定的依据。

目前人工智能的研究发展已经达到了较高的水平,同时它的研究内容也在逐步扩展和延伸。对人的情感和认知的研究是人工智能的高级阶段,它的研究将会大大促进拟人控制理论、情感机器人、人性化的商品设计和市场开发等方面的进展,为最终营造一个人与人、人与机器和谐的社会环境做出贡献。心理学家认为,人工智能下一个重大突破性的发展可能来自与其说赋予机器更多的逻辑智能,倒不如说赋予计算机更多的情感智能。对人的情感和认知的研究是在人工智能理论框架下的一个质的进步。因为从广度上讲它扩展并包容了感情智能,从深度上讲感情智能在人类智能思维与反应中体现了一种更高层次的智能。对人的情感和认知的研究必将为计算机的未来应用展现一种全新的方向。在这个领域的研究中主要包括情感计算(Affective Computing)、人工心理(Artificail Psychology)和感性工学(Kansei Engineering)等。

2.1 国际研究现状

MIT对情感计算进行全方位研究,正在开发研究情感机器人,最终有可能人机融合。其媒体实验室与HP公司合作进行情感计算的研究。IBM公司的“蓝眼计划”,可使计算机知道人想干什么,如当人的眼瞄向电视时,它竟知道人想打开电视机,它便发出指令打开电视机。此外该公司还研究了情感鼠标,可根据手部的血压及温度等传感器感知用户的情感。CMU主要研究可穿戴计算机。日本在对感性信息处理的研究中,有众多研究单位参与,主要集中在研究所和高校。特别值得一提的是,日本欧姆龙公司研制生产的机器玩具曾风行一时,最高价达4000美元。随后其它公司也进行机器狗等玩具的生产。显然情感计算的研究不仅具有重要的科学和学术价值,也存在着巨大的商机,有很好的经济效益。

2.1 国内研究现状

国内研究主要侧重于单元理论与技术的研究与实现。哈尔滨工业大学以高文教授为主,研究多功能情感机,主要包括表情识别,人脸识别,人脸检测与跟踪、手语识别、手语合成、表情合成、唇读等内容,并与海尔公司合作研究服务机器人。中国科学院计算技术研究所王兆其的研究组正在研究带有表情和动作的虚拟人。北京工业大学正进行多功能感知机同情感计算的融合研究。中国科学院自动化研究所主要研究基于生物特征的身份验证。南京航空航天大学、南京机械高等专科学校研究语音情感计算。重庆大学主要研究智能服务、增强现实、环境感知、台智能手表等,注重软件方面的研究。海南大学主要研究军用无线局域网结构中的可穿戴计算机。中科院心理学所、生物所主要注重人生理学、心理学方面的研究。特别是

中科院计算所高文教授提出的多功能感知技术,为情感计算的研究提供了很好的知识积累。更为重要的是国家自然科学基金项目将和谐人机环境中的情感计算理论研究列为1998年信息技术高技术探索第六主题。这说明,情感计算的研究在我国也逐步得到认识,其工作也在渐渐展开。

3、情感计算的应用前景

很显然,开展认知科学研究不仅仅是为了满足人类智慧上的好奇心,更重要的是服务于人类,提高人类的生活质量。情感计算有广泛的应用前景。计算机通过对人类的情感进行获取、分类、识别和响应,进而可以帮助使用者获得高效而又亲切的感觉,并有效减轻人们使用电脑的挫败感,甚至帮助人们理解自己和他人的情感世界。计算机的情感化设计能帮助我们增加使用设备的安全性,使经验人性化,使计算机作为媒介进行学习的功能达到最佳化。在信息检索中,通过情感分析的概念解析功能,可以提高智能信息检索的精确度和效率。在电子商务领域,在设计购物网站和股票交易网站等时充分利用人的情感因素的作用,以改变客流量。针对人的肢体运动,可以设计一系列运动和身体信息捕获设备,例如,将智能座椅应用于汽车的驾座上,用于动态监测驾驶人员的情感状态,并提出适时警告。多模式的情感交互技术能构筑更贴近人们生活的智能空间或虚拟场景,而机器人、智能玩具、游戏等产业则能构筑出更加拟人化的风格和更加逼真的场景。

情感计算是一个高度综合化的研究和技术领域。通过计算科学与心理科学、认知科学的结合,研究人与人交互、人与计算机交互过程中的情感特点,设计具有情感反馈的人与计算机的交互环境,将有可能实现人与计算机的情感交互。情感计算研究将不断加深对人的情感状态和机制的理解,并提高人与计算机界面的和谐性,即提高计算机感知情境,理解人的情感和意图,作出适当反应的能力。

4、情感计算的基本内容

人们期盼着能拥有并使用更为人性化和智能化的计算机。在人机交互中,从人操作计算机,变为计算机辅助人;从人围着计算机转,变为计算机围着人转;计算机从认知型,变为直觉型。显然,为实现这些转变,人机交互中的计算机应具有情感能力。情感计算研究就是试图创建一种能感知、识别和理解人的情感,并能针对人的情感做出智能、灵敏、友好反应的计算系统。

情感被用来表示各种不同的内心体验(如情绪、心境和偏好),情绪被用来表示非常短暂但强烈的内心体验,而心境或状态则被用来描述强度低但持久的内心体验。情感是人与环境之间某种关系的维持或改变,当客观事物或情境与人的需要和愿望符合时会引起人积极肯定的情感,而不符合时则会引起人消极否定的情感。

情感具有三种成分:⑴主观体验,即个体对不同情感状态的自我感受;⑵外部表现,即表情,在情感状态发生时身体各部分的动作量化形式。表情包括面部表情(面部肌肉变化所组成的模式)、姿态表情(身体其他部分的表情动作)和语调表情(言语的声调、节奏、速度等方面的变化);⑶生理唤醒,即情感产生的生理反应,是一种生理的激活水平,具有不同的反应模式。

概括而言,情感的重要作用主要表现在四个方面:情感是人适应生存的心理工具,能激发心理活动和行为的动机,是心理活动的组织者,也是人际通信交流的重要手段。从生物进化的角度我们可以把人的情绪分为基本情绪和复杂情绪。基本情绪是先天的,具有独立的神经生理机制、内部体验和外部表现,以及不同的适应功能。人有五种基本情绪,它们分别是当前目标取得进展时的快乐,自我保护的目标受到威胁时的焦虑,当前目标不能实现时的悲伤,当前目标受挫或遭遇阻碍时的愤怒,以及与味觉(味道)目标相违背的厌恶。而复杂情

绪则是由基本情绪的不同组合派生出来的。

情感测量包括对情感维度、表情和生理指标三种成分的测量。例如,我们要确定一个人的焦虑水平,可以使用问卷测量其主观感受,通过记录和分析面部肌肉活动测量其面部表情,并用血压计测量血压,对血液样本进行化验,检测血液中肾上腺素水平等。

确定情感维度对情感测量有重要意义,因为只有确定了情感维度,才能对情感体验做出较为准确的评估。情感维度具有两极性,例如,情感的激动性可分为激动和平静两极,激动指的是一种强烈的、外显的情感状态,而平静指的是一种平稳安静的情感状态。心理学的情感维度理论认为,几个维度组成的空间包括了人类所有的情感。但是,情感究竟是二维,三维,还是四维,研究者们并未达成共识。情感的二维理论认为,情感有两个重要维度:⑴愉悦度(也有人提出用趋近-逃避来代替愉悦度);⑵激活度,即与情感状态相联系的机体能量的程度。研究发现,惊反射可用做测量愉悦度的生理指标,而皮肤电反应可用做测量唤醒度的生理指标。

情感是一种内部的主观体验,但总是伴随着某种外部表现,即表情。面部表情、姿态表情、语调表情三种表情被称之为体语,构成了人类的非言语交往方式。面部表情是指通过眼部、颜面和口部肌肉的变化来表现各种情感状态。面部表情不仅是人们常用的较自然的表现情感的方式,也是人们鉴别情感的主要标志。研究表明,人脸的不同部位具有不同的表情作用,例如,眼睛对表达忧伤最重要,口部对表达快乐与厌恶最重要,前额能提供惊奇的信号,而眼睛、嘴和前额等对表达愤怒很重要。使用特定的仪器可以对面部的微小表情变化进行研究,甚至可以区分真笑和假笑:人在真笑时面颊上升,眼周围的肌肉堆起,大脑左半球的电活动增加;而人在假笑时仅有嘴唇的肌肉活动,下颚下垂,大脑左半球的电活动不明显。脸部运动编码系统FACS通过不同编码和运动单元的组合,可以在脸部形成复杂的表情变化,其成果已经被应用于人脸表情的自动识别与合成。还有MPEG-4 V2视觉标准,定义了3个重要的参数集,即人脸定义参数、人脸内插变换参数和人脸动画参数,其表情参数具体数值的大小代表人激动的程度,可以组合多种表情以模拟混合表情。目前面部表情的研究侧重于对三维图像的更细致的描述和建模,也注重使用复杂的纹理和较细致的图形变换算法,以达到生动的情感表达效果。

人的姿态即身体表情,一般伴随着交互过程而发生变化,并表达着一些信息。而语调表情是通过语音的高低、强弱、抑扬顿挫来表达说话人的情感。在人际交往中,语音是人们最直接的交流通道。通过语音人很容易就能感受到对方的情感变化,就像“你真行!”这句话,既可以表示赞赏,也同样可以表示讽刺或妒忌。情感语音研究目前主要侧重于情感的声学特征的分析。语音中的情感特征往往通过语音韵律的变化表现出来(如当一个人发怒时,讲话的速率可能变快,音量变大,音调变高等),但也可同时通过一些音素特征(如共振峰、声道截面函数等)表现出来。中国科学院心理研究所、中国科学院自动化研究所、清华大学计算机系等机构都在从事相关研究。

在人机交互研究中已使用过很多种生理指标,例如,皮质醇水平、心率、血压、呼吸、皮肤电活动、掌汗、瞳孔直径、事件相关电位、脑电EEG等。生理指标的记录需要特定的设备和技术,在进行测量时,研究者有时很难分离各种混淆因素对所记录的生理指标的影响。情感计算研究的内容包括三维空间中动态情感信息的实时获取与建模,基于多模态和动态时序特征的情感识别与理解,及其信息融合的理论与方法,情感的自动生成理论及面向多模态的情感表达,以及基于生理和行为特征的大规模动态情感数据资源库的建立等。

5、情感计算的理论框架

情感的产生与运行是一个非常复杂的过程,情感计算必须建立在科学的情感理论的基础

之上,才是现实的,没有一个全新的科学的情感理论作指导,要研发真正意义上的情感机器人是不可能的。这种全新的情感理论必须突破心理学的局限,也必须突破社会科学的局限,成为一门独立的、横跨自然科学与社会科学的交叉性科学理论,其根本目的在于:情感数字化。这种全新的情感理论就是“数理情感学”,它以“统一价值论”为理论前提,采用数理逻辑方法分析情感现象与情感规律的科学。

归纳起来,“统一价值论”与“数理情感学”主要通过如下步骤共同完成情感机器人的理论框架。

(1)实现所有不同价值的统一度量

①改造物理学的“耗散结构论”,从物理学角度定义“价值”概念(即广义有序化能量),使价值理论建立在自然科学的基础之上;②实现生活资料使用价值的统一度量;然后,实现劳动价值的统一度量;③实现生产资料使用价值的统一度量。这样一来,所有价值都有着统一、明确而稳定的度量标准或度量尺度:能量尺度(焦耳)。

(2)推导出“广义价值规律”

①由“最大有序化法则”推导出“最大价值率法则”(价值率就是单位时间内产出价值与投入价值的比值,在经济领域,价值率就是利润率);②由“最大价值率法则” 推导出“选择倾向性法则”或“中值价值率法则”;③由“中值价值率法则” 推导出“广义价值规律”。广义价值规律的基本内涵就是:事物的价值率不断趋近于主体的中值价值率。或者说,事物的价值率高差(即事物的价值率与主体的中值价值率之差)不断趋于零。

(3)揭示认知、情感与意志的哲学本质及相互关系

①知(认知)、情(情感)、意(意志)是人类心理活动的三种基本形式,分别是对事实关系、价值关系和自身行为关系的一种主观反映;②价值关系是一种特殊的事实关系,自身行为关系是一种特殊的价值关系,因此,情感是一种特殊的认知,意志又是一种特殊的情感;③认知主要是关于“是如何”的认识,情感主要是关于“应如何”的认识,意志主要是关于“怎么办”的认识;④情感以认知为基础,认知以情感为导向,意志以情感为基础,情感以意志为导向。

(4)建立情感的数学模型

①情感与价值观的哲学本质都是“人脑对于事物价值特性的一种主观反映”,其中,情感是对事物价值特性的间接性和相对性反映,而价值观是对事物价值特性的直接性和绝对性反映;②价值观的客观目的在于识别“事物的价值率”,可以采用所有不同事物的价值率所组成的数学矩阵来描述一个人的价值观系统(即W={ωi×j}m×n);③情感的客观目的在于识别“事物的价值率高差”,可以采用所有不同事物的价值率高差所组成的数学矩阵来描述一个人的情感系统(即M={μi×j}m×n);④情感矩阵与相应的作用系数矩阵一起,可以进行交集运算与并集运算;⑤情感系统中的每个情感元素又可以由若干个情感子元素所组成的情感矩阵来构成,从而构成二维和多维的情感矩阵。

(5)建立意志的数学模型

①意志的哲学本质都是“人脑对于自身行为价值特性的一种主观反映”;②意志的客观目的在于识别和处理“自身行为的价值率”,可以采用所有不同行为方式的价值率高差所组成的数学矩阵来描述一个人的意志系统(即X={xi×j}m×n);③意志矩阵与相应的作用系数矩阵一起,可以进行交集运算与并集运算;④意志系统中的每个意志元素又可以由若干个意志子元素所组成的意志矩阵来构成,从而构成二维和多维的意志矩阵,即超复杂行为的意志由若干复杂行为的意志矩阵所组成,复杂行为的意志又由若干简单行为的意志矩阵所组成,简单行为的意志由若干本能行为的意志矩阵所组成。

(6)阐述情感运行的内在逻辑程序

①情感表达的逻辑程序大致是:接收事物的刺激信号,提取该事物的价值观,比较人自

身的中值价值率,确定情感的强度与方向,选择情感表达模式,接收和处理情感表达所产生的反馈信号;②情感识别的逻辑程序大致是:接收事物的刺激信号,检测和提取特征参数,比较情感模式,产生情感反映,存储情感信息到情感矩阵之中;③情感计算的逻辑程序大致是:将事物的价值率高差“对数转换”为情感强度,对情感强度进行交集、并集运算,产生新的情感强度,将情感强度“指数还原”为新事物的价值率高差;④情感修正的逻辑程序大致是:人通过感觉与思维,了解到某事物的实际价值率高差,与大脑中情感矩阵所记忆该事物的主观价值率高差,存在一定的差异,人就会修正对于该事物的情感强度。

(7)阐述意志运行的内在逻辑程序

①意志表达(即行为实施)的逻辑程序大致是:接收某种价值目标事物的刺激信号,提取能够最有效实现该价值目标的多种相关行为的主观价值率(即行为价值观),比较自身的中值价值率,确定多种相关行为的意志强度与意志方向,选取具有最大意志强度的相关行为,并组织实施该相关行为。②意志计算(即行为设计)的逻辑程序大致是:确立价值目标(根据自身生存与发展的需要),设计整体方案(按照最大价值率法则,把超复杂行为分解为若干个复杂行为,并通过意志的并集运算与交集运算,计算出该超复杂行为的意志强度),制定实施细则(按照最大价值率法则,把复杂行为分解为若干个简单行为,并通过意志的并集运算与交集运算,计算出该复杂行为的意志强度),落实具体行为(按照最大价值率法则,把简单行为分解为若干个本能行为,并通过意志的并集运算与交集运算,计算出该简单行为的意志强度),将上述各个层次的意志强度“指数还原”为相应的行为价值率高差。③意志修正的逻辑程序大致是:人通过感觉与思维,了解到某行为的实际价值率高差,与大脑中意志矩阵所记忆该行为的主观价值率高差,存在一定的差异,人就会修正对于该事物的意志强度。

(8)设立情感与意志的调控机制

①建立各种情感模式与价值变化的对应关系,并根据实际需要,设置与调控各种情感模式;②推导出“情感强度第一定律”(即情感强度与事物的价值率高差的对数成正比,μ=Kmlog(1+ΔP)),并根据实际需要,设置与调控情感的强度系数;③对情感“八大动力特性”(强度性、稳定性、细致性、层次性、效能性、周期性、时序性与差异性)进行精确定义,并根据实际需要,设置与调控情感的动力特性;④对意志的“八大动力特性”进行精确定义,并根据实际需要,设置与调控意志的动力特性。情感调控的客观目的就是为了使情感的动力特性与主体所处的价值关系的变化特性相适应。意志调控的客观目的就是为了使意志的动力特性与主体各种行为价值关系的变化特性相适应。

6、总结与展望

情感计算为计算机科技发展提出了一个新的课题。情感计算是建立和谐人机环境的基础之一,同时情感计算是融多学科为一体的学科,它的发展必将带动相关科学的发展。可穿戴计算机和后PC时代的芯片式计算机将为情感计算提供方便的研究平台和表现形式,无论从科学意义、学术价值,还是事实需求,情感计算将有巨大的发展潜力和应用价值。

参考文献:

[1] 罗森林,潘丽敏。情感计算理论与技术[J]。系统工程与电子技术2003 25(7)。

[2] 仇德辉。统一价值论[M]。中国科学技术出版社,1998年。

[3] 仇德辉。数理情感学[M]。湖南人民出版社,2001年。

[4] 仇德辉。情感机器人的可行性研究报告[EB/OL]。

http:∥https://www.doczj.com/doc/2f9942508.html,/u/8402/archives/2009/62186.html#80307 2009-5-26/2009 -9-29。

[5] 胡包钢.。和谐人机环境中的情感计算理论研究[R]。国家自然科学基金申请书,1993年。

[6] 罗林森,译。情感计算[M]。北京理工大学出版社,2005。

[7] 张迎辉,林学照。情感可以计算——情感计算综述[J]。计算机科学,2008,35(5):5-8。

[8] 耿文秀,查波,译。情感智商[M]。上海:上海科学技术出版社,1997。

[9] 胡包钢,谭铁牛。情感计算———计算机科技发展的新课题[N] 。科学时报(第三版),

CTTT.H.CB.

文本情感分析综述

文本情感分析综述? 赵妍妍+, 秦兵, 刘挺 (哈尔滨工业大学计算机科学与技术学院信息检索研究中心, 黑龙江哈尔滨 150001) A Survey of Sentiment Analysis * ZHAO Yan-Yan+, QIN Bing, LIU Ting (School of Computer Science and Technology, Harbin Institute of Technology, Harbin 150001, China) + Corresponding author: Phn: +86-451-86413683 ext 800, E-mail: zyy@https://www.doczj.com/doc/2f9942508.html, Abstract: Sentiment analysis is a novel research topic with the quick development of online reviews, which has drawn interesting attention due to its research value and extensive applications. This paper surveys the state-of-the-art research on sentiment analysis. First, three important tasks of sentiment analysis are summarized and analyzed in detail, including sentiment extraction, sentiment classification, sentiment retrieval and summarization; then the evaluation and corpus for sentiment analysis are introduced; finally the applications of sentiment analysis are concluded. This paper aims to take a deep insight into the mainstream methods and recent progress in this field, making detailed comparison and analysis. It is expected to be helpful to the future research. Key words: sentiment analysis; sentiment extraction; sentiment classification; sentiment retrieval and summarization; evaluation; corpus 摘 要: 文本情感分析是随着网络评论的海量增长而迅速兴起的一个新兴研究课题,其研究价值和应用价值受到人们越来越多的重视.本文对文本情感分析的研究现状与进展进行了总结.首先将文本情感分析归纳为三项主要任务,即情感信息抽取,情感信息分类以及情感信息的检索与归纳,并对它们进行了细致的介绍和分析;进而介绍了文本情感分析的国内外评测和资源建设情况;最后介绍了文本情感分析的应用.文本重在对文本情感分析研究的主流方法和前沿进展进行概括,比较和分析,以期对后续研究有所助益. 关键词: 文本情感分析;情感信息抽取;情感信息分类;情感信息的检索与归纳;评测;资源建设 中图法分类号: TP391文献标识码: A 随着Web2.0的蓬勃发展,互联网逐渐倡导“以用户为中心,用户参与”的开放式构架理念.互联网用户由单纯的“读”网页,开始向“写”网页、“共同建设”互联网发展,并由被动地接收互联网信息向主动创造互联网信息迈进.因此,互联网(如:博客和论坛)上产生了大量的用户参与的,对于诸如人物、事件、产品等有价值的评论信息.这些评论信息表达了人们的各种情感色彩和情感倾向性,如“喜”、“怒”、“哀”、“乐”,和“批评”、“赞扬”等.基于此,潜在的用户就可以通过浏览这些主观色彩的评论,来了解大众舆论对于某一事件或产品的看法.由于越来越多的用户乐于在互联网上分享自己的观点或体验,这类评论信息迅速膨胀,仅靠人工的方法难以应对网上海量信 ?Supported by the National Natural Science Foundation of China under Grant Nos. 60803093, 60975055 (国家自然科学基金) and the “863” National High-Tech Research and Development of China via grant 2008AA01Z144(863计划探索类专题项目)

顾客忠诚度 ---文献综述

顾客忠诚度评价方法 一、顾客忠诚度的定义 第一个明确提出顾客忠诚这个名词是科普兰德,这一概念并很快就被认可,越来越多的学者开始在这一领域研究。早期研究中,学者们主要从消费者的再购率、消费者从本企业购买的产品数量在他们购买的同类产品总量中所占的比例、消费者的购买方式、消费者对企业的口头宣传、消费者与企业关系的持久性等方面计量消费者忠诚感.Tucker(1964)首次对顾客忠诚进行了数字化的度量,他认为“顾客忠诚的最好表述是顾客的行为,顾客连续购买某一品牌产品3次,既可以认为顾客忠诚于这个品牌”。Newman和Werbel(1973)从排他险角度对顾客忠诚进行了定义,他认为“品牌忠诚定义为重复购买某一品牌,并且只考虑该品牌,而且不需要收集其他品牌信息”。Bloemer和Ksaper(1995)将顾客忠诚分为两类:真实的顾客忠诚和不真实的顾客忠诚,真实的顾客忠诚是来源于公司产品或者服务的品牌承诺,而不真实的顾客忠诚则来源于顾客的惰性。他认为真实的顾客忠诚是偏向的、行为反应、在一系列类似的备选品牌中选择、以及是导致品牌承诺的心理过程的函数。而不真实的忠诚的定义则是是惰性的函数。基于认知、意动、情感、和行为这四个维度,Richard Ol iver(1999)对忠诚度做出了这样的定义:“顾客忠诚是顾客对在其未来进行购买某种类似产品或者服务时的一种发自内心的一种承诺,这种承诺会导致顾客在选择产品或者服务的时候,趋向选择同一品牌或者公司的产品”。Rowley(2005)认为顾客忠诚可以分为四个类型:俘获(captive)型、便利寻找者(convenience一seeker)、满意(contented)型和承诺(committed)型。国内学者罗海

文本情感分析论文总结

文本情感分析 赵妍妍,秦兵,刘挺- 软件学报, 2010 - https://www.doczj.com/doc/2f9942508.html, 按粒度,情感分析可分为词语级、短语级、句子级、篇章级、多篇章级;按文本类别,可分为基于新闻评论和基于产品的情感分析。 情感分析的研究任务:情感信息的抽取、分类以及检索与归纳。 一、情感信息抽取(评价词语、评价对象、观点持有者) 1.评价词语的抽取:基于语料库的抽取;基于词典的抽取;基于图的方法。 2.评价对象的抽取:基于规则/模板的方法(词序列、词性、句法规则、关联规则挖掘);评 价对象最为产品属性,考察评价对象与领域指示词的关联度来获取;多粒度的话题模型方法。 3.观点持有者抽取:命名实体识别技术(人名或机构名)、语义角色标注;分类任务,看做 序列标注问题,使用CRF融合特征抽取;名词短语作为候选,使用ME模型计算。 4.组合评价单元的抽取: 主观表达式:Wiebe的主观表达式库(抽取n元词语/词组作为候选,对比训练预料判断) 评价短语抽取(程度副词-评价词语):情感词典的方法;依存句法解构(ADV,ATT,DE)。 评价搭配抽取(评价词语-评价对象):基于模板的方法(8个共现模板、句法关系模板)。 二、情感信息分类 1.主客观信息分类:文本是否含情感知识方法;组合评价单元判断;情感模板识别;基于 分类器和分类特征的二元分类任务(词语特征,标点、人称代词、数字特征,基于图); 2.主观信息情感分类(句子级、篇章级):基于情感知识、基于特征分类的方法(n-gram词语 特征和词性特征、位置特征、评价词特征)。 三、情感信息的检索与归纳 1.情感信息检索 2.情感信息归纳 基于产品属性的情感文摘:识别评论信息中的产品属性,抽取描述产品属性的情感句,判断其倾向性。 基于情感标签的情感文摘:标签可定义为评价搭配形式,建立标签库,相似度聚类的方法聚类得到相似的情感标签,每一类视为潜在的话题(即产品属性)。 基于新闻评论的文摘 四、情感分析的评测与资源 1.情感分析的评测:TREC,NTCIR的MOAT(新闻观点检测,情感问答,跨语言情感分析), 国内的COAE。 2.情感分析的语料:康奈尔大学的影评数据集,UIC的Hu和Liu的产品领域的评论语料, Wiebe的MPQA新闻评论深度标注语料,MIT的多角度餐馆评论语料,中科院的中文酒店评论语料。 3.词典资源:GI(general inquirer)评价词词典,NTU评价词词典(繁体中文),主观词词典(英 文),HowNet评价词词典(简体中文、英文) 问题:情感信息抽取忽略词语所在语境的影响;评价对象的情感分类,而非句子级或篇章级;基于情感标签的情感文摘的深入研究;

文本情感分类研究综述

Web文本情感分类研究综述 王洪伟/刘勰/尹裴/廖雅国 2012-9-27 14:55:59 来源:《情报学报》(京)2010年5期【英文标题】Review of Sentiment Classification on Web Text 【作者简介】王洪伟,男,1973年生,博士,副教授/博士生导师,研究方向:本体建模和情感计算,E-mail:hwwang@https://www.doczj.com/doc/2f9942508.html,。同济大学经济与管理学院,上海200092; 刘勰,男,1985年生,硕士研究生,研究方向:数据挖掘与情感计算。同济大学经济与管理学院,上海200092; 尹裴,女,1986年生,硕士研究生,研究方向:商务智能。同济大学经济与管理学院,上海200092; 廖雅国,男,1954年生,博士,教授,研究方向:人工智能与电子商务。香港理工大学电子计算学系,香港 【内容提要】对用户发表在Web上的评论进行分析,能够识别出隐含在其中的情感信息,并发现用户情感的演变规律。为此,本文对Web文本情感分类的研究进行综述。将情感分类划分为三类任务:主客观分类、极性判别和强度判别,对各自的研究进展进行总结。其中将情感极性判别的方法分为基于情感词汇语义特性的识别和基于统计自然语言处理的识别方法。分析了情感分类中的语料库选择和研究难点。最后总结了情感分类的应用现状,并指出今后的研究方向。

Analyzing the users' reviews on the Web can help us to identify users' implicit sentiments and find the evolution laws of their emotion. To this end, this paper is a survey about the sentiment classification on the Web text. We divided the process of classification into three categories:subjective and objective classification,polarity identification and intensity identification and respectively summarize the resent research achievements in these fields. We also sorted the methods of polarity identification into two types: one is based on the emotional words with semantic characteristics, while the other statistic methods of natural language processing. What is more, the choice of corpus and potential research problems are discussed. At last, this paper summarized the status quo of application and pointed out the direction of future research. 【关键词】Web文本/情感分类/综述/主观性文本Web texts/Sentiment classification/Survey/Subjective text 随着互联网的流行,Web文本成为我们获取信息、发表观点和交流情感的重要来源。特别是随着Web2.0技术的发展,网络社区、博客和论坛给网络用户提供了更宽广的平台来交流信息和表达意见。这些文章和言论往往包含有丰富的个人情感,比如对某部大片的影评,对某款手机的用户体验等,其中蕴含着巨大的商业价值。如何从这些Web文本中进行情感挖掘,获取情感倾向已经成为当今商务智能领域关注的热点。所谓情感分析(sentiment analysis),就是确定说话人或作者对某个特定主题的态度。其中,态度可以是他们的判断或者评估,他们(演说、写作时)的情绪状态,或者有意(向受众)传递的情感信息。因此,情感分

情感分析简述

情感分析简述 分类:NLP2012-04-08 12:38 1022人阅读评论(3) 收藏举报情感classification算法测试translationmatrix 情感分析,我研究了也有半年有余了,ACL Anthology上关于情感分析的论文也基本看过了一遍,但是到目前还没有什么成就的。以下是我为一位同学毕业设计写的情感分析方面的综述,引用的论文基本上是ACL 和COLING还有EMNLP上历年关于情感分析的论文,本文应该学术性比较强一点,本文虽不打算发表,但由于将来可能还有用,以及关于学术上的原因,请大家如果要引用请务必标明出处 (https://www.doczj.com/doc/2f9942508.html,/s/blog_48f3f8b10100irhl.html)。 概述 情感分析自从2002年由Bo Pang提出之后,获得了很大程度的研究的,特别是在在线评论的情感倾向性分析上获得了很大的发展,目前基于在线评论文本的情感倾向性分析的准确率最高能达到90%以上,但是由于深层情感分析必然涉及到语义的分析,以及文本中情感转移现象的经常出现,所以基于深层语义的情感分析以及篇章级的情感分析进展一直不是很大。情感分析还存在的一个问题是尚未存在一个标准的情感测试语料库,虽然Bo Pang实验用的电影评论数据集(https://www.doczj.com/doc/2f9942508.html,/people/pabo/movie-review-data/)以及Theresa Wilson等建立的MPQA(https://www.doczj.com/doc/2f9942508.html,/mpqa/)是目前广泛使用的两类情感分析数据集,但是并没有公认的标准加以确认。 目前情感分析的研究基本借鉴文本分类等机器学习的方法,还没有根据自身的特点形成一套独立的研究方法,当然在某种程度上也可以把情感分析看出一种特殊的文本分类。比较成熟的方法是基于监督学习的机器学习方法,半监督学习和无监督学习目前的研究不是很多,单纯的基于规则的情感分析这两年已很少研究了。既然目前很多情感分析的研究基于机器学习,那么特征选择就是一个很重要的问题,N元语法等句法特征是使用最多的一类特征,而语义特征(语义计算)和结构特征(树核函数)从文本分类的角度看效果远没有句法特征效果好,所以目前的研究不是很多的。 由于基于监督学习情感分析的研究已经很成熟了,而且在真实世界中由于测试集的数量要远远多于训练集的数量,并且测试集的领域也不像在监督学习中被限制为和训练集一致,也就是说目前情感分析所应用的归纳偏置假设在真实世界中显得太强的,为了和真实世界相一致,基于半监督学习或弱指导学习的情感分析和跨领域的情感分析势必是将来的研究趋势之一。 在情感分析的最初阶段基于语义和基于规则的情感分析曾获得了比较大的重视,但是由于本身实现的复杂性以及文本分类和机器学习方法在情感分析应用上获得的成功,目前关于这方面的研究以及很少了,但是事实上,语义的相关性和上下文的相关性正是情感分析和文本分类最大的不同之处,所以将基于语义和规则的情感分析与基于机器学习的情感分析相结合也将是未来的研究趋势之一。 以下将分别对情感分析的起源,目前基于监督学习,无监督学习,基于规则和跨领域的情感分析的一些研究工作进行简单的介绍。 起源 虽然之前也有一些相关工作,但目前公认的情感分析比较系统的研究工作开始于(Pang et al., 2002)基于监督学习(supervised learning)方法对电影评论文本进行情感倾向性分类和(Turney,2002)基于无监督学习(unsupervised learning)对文本情感情感倾向性分类的研究。(Pang et al., 2002)基于文本的N元语法(ngram)和词类(POS)等特征分别使用朴素贝叶斯(Naive Bayes),最大熵(Maximum Entropy)和支持向量机(Support Vector Machine,SVM)将文本情感倾向性分为正向和负向两类,将文本的情感进行二元划分的做法也一直沿用至今。同时他们在实验中使用电影评论数据集目前已成为广泛使用的情感分析的测试集。(Turney ,2002)基于点互信息(Pointwise Mutual Information,PMI)计算文本中抽取的关键词和种子词(excellent,poor)的相似度来对文本的情感倾向性进行判别(SO-PMI算法)。 在此之后的大部分都是基于(Pang et al., 2002)的研究。而相对来说,(Turney et al.,2002)提出的无监督学习的方法虽然在实现上更加简单,但是由于单词之间的情感相似度难以准确的计算和种子词的难以确定,继续在无监督学习方向的研究并不是很多的,但是利用SO-PMI算法计算文本情感倾向性的思想却被很多研究者所继承了。 监督学习 目前,基于监督学习的情感分析仍然是主流,除了(Li et al.,2009)基于非负矩阵三分解(Non-negative Matrix Tri-factorization),(Abbasi et al.,2008)基于遗传算法(Genetic Algorithm)的情感分析之外,使用的最多的监督学习算法是朴素贝叶斯,k最近邻(k-Nearest Neighbor,k-NN),最大熵和支持向量机的。而对于算法的改进主要在对文本的预处理阶段。 一个和文本分类不同地方就是情感分析有时需要提取文本的真正表达情感的句子。(Pang et al., 2004)基于文本中的主观句的选择和(Wilson el al.,2009)基于文本中的中性实例(neutral instances)的分析,都是为了能够尽量获得文本中真正表达情感的句子。(Abbasi et al.,2008)提出通过信息增益(Information Gain,IG)的方法来选择大量特征集中对于情感分析有益的特征。 而对于特征选择,除了N元语法和词类特征之外,(Wilson el al.,2009)提出混合单词特征,否定词特征,情感修饰特征,情感转移特征等各类句法特征的情感分析,(Abbasi et al.,2008)提出混合句子的句法(N元语法,词类,标点)和结构特征(单词的长度,词类中单词的个数,文本的结构特征等)的情感分析。 除了对于文本的预处理,对于监督学习中情感分析还进行了以下方面的研究的。(Melville et al., 2009)和(Li et al.,2009)提出结合情感词的先验的基于词典的情感倾向性和训练文本中后验的基于上下文的情感情感倾向性共同判断文本的情感倾向性。(Taboada et al.,2009)提出结合文本的题材(描述,评论,背景,解释等)和文本本身的特征共同判断文本的情感倾向性。(Tsutsumi et al.,2007)提出利用多分类器融合技术来对文本情感分类。(Wan, 2008)和(Wan, 2009)提出结合英文中丰富的情感分析资源来提高中文情感分析的效果。 基于规则/无监督学习

文本情感分析研究现状

文本情感分析研究现状 机器之心专栏 作者:李明磊 作为NLP 领域重要的研究方向之一,情感分析在实际业务场景中 存在巨大的应用价值。在此文中,华为云NLP 算法专家李明磊为 我们介绍了情感分析的概念以及华为云在情感分析方面的实践和 进展。 基本概念 为什么:随着移动互联网的普及,网民已经习惯于在网络上表达意见和建议,比如电商网站上对商品的评价、社交媒体中对品牌、产品、政策的评价等等。这些评价中都蕴含着巨大的商业价值。比如某品牌公司可以分析社交媒体上广大民众对该品牌的评价,如果负面评价忽然增多,就可以快速采取相应的行动。而这种正负面评价的分析就是情感分析的主要应用场景。 是什么:文本情感分析旨在分析出文本中针对某个对象的评价的正负面,比如「华为手机非常好」就是一个正面评价。情感分析主要有五个要素,(entity/实体,aspect/属性,opinion/观点,holder/观点持有者,time/时间),其中实体和属性合并称为评价对象(target)。情感分析的目标就是从非结构化的文本评论中抽取出这五个要素。

图1 情感分析五要素 举例如下图: 图2 情感分析五要素例子 上例中左侧为非结构化的评论文本,右侧为情感分析模型分析出的五个要素中的四个(不包括时间)。其中实体「华为手机」和属性「拍照」合并起来可以作为评价对象。评价对象又可细分为评价对象词抽取和评价对象类别识别。如实体可以是实体词和实体类别,实体词可以是「餐馆」、「饭店」、「路边摊」,而实体类别是「饭店」;属性可以是属性词和属性类别,如属性词可以是「水煮牛肉」、「三文鱼」等,都对应了属性类别「食物」。实体类别和属性类别相当于是对实体词和属性词的一层抽象和归类,是一对多的关系。词和类别分别对应了不同的

情感计算综述

情感计算综述 控制工程1102班李晓宇 2111103172 摘要:情感计算是人工智能的一个分支。情感计算的目的是通过赋予计算机识别、理解、表达和适应人的情感的能力来建立和谐人机环境,并使计算机具有更高的、全面的智能。本文分别从情感计算的研究历史、应用前景、研究内容和理论框架来阐述情感计算,以便使更多的人了解情感计算。 关键字: 情感计算;情感识别;情感理论框架 Summary of Affective Computing Abstract:Affective computing is a branch of artificial intelligence. The aim of affective computing is to give computers to recognize, understand, adapt to people's emotional expression and the ability to establish harmonious human environment, and to have higher computer, full of intelligence.This paper explain affective computing through the study of history of affective computing ,applications in the future, research content and theoretical framework, so that more people understand the affective computing. Key word: Affective computing; emotion recognition; the theoretical framework of emotional 1、引言 情感计算的概念是在1997年由MIT媒体实验室Picard教授提出,她指出情感计算是与情感相关,来源于情感或能够对情感施加影响的计算。中国科学院自动化研究所的胡包刚等人也通过自己的研究,提出了对情感计算的定义:“情感计算的目的是通过赋予计算机识别、理解、表达和适应人的情感的能力来建立和谐人机环境,并使计算机具有更高的、全面的智能”。 在较长一段时期内,情感一直位于认知科学研究者的视线以外。直到20世纪末期,情感作为认知过程重要组成部分的身份才得到了学术界的普遍认同。当代的认知科学家们把情感与知觉、学习、记忆、言语等经典认知过程相提并论,关于情感本身及情感与其他认知过程间相互作用的研究成为当代认知科学的研究热点,情感计算( affective computing )也成为一个新兴研究领域。 众所周知,人随时随地都会有喜怒哀乐等情感的起伏变化。那么在人与计算机交互过程中,计算机是否能够体会人的喜怒哀乐,并见机行事呢?情感计算研究就是试图创建一种能感知、识别和理解人的情感,并能针对人的情感做出智能、灵敏、友好反应的计算系统,即赋予计算机像人一样的观察、理解和生成各种情感特征的能力。 2、研究现状 让计算机具有情感能力首先是由美国MIT大学Minsky教授(人工智能创始人之一)提出的。他在1985年的专著《The Society of Mind》中指出,问题不在于智能机器能否有任何情感,而在于机器实现智能时怎么能够没有情感。从此,赋予计算机情感能力并让计算机能够理解和表达情感的研究、探讨引起了计算机界许多人士的兴趣。这方面的工作首推美国MIT 媒体实验室Picard教授领导研究小组的工作。情感计算一词也首先由Picard教授于1997年出版的专著《Affective Computing》中提出并给出了定义,即情感计算是关于情感、情感产生以

Web文本情感分类研究综述

情报学报  ISSN1000-0135 第29卷第5期931-938,2010年10月 JOURNALOFTHECHINASOCIETYFORSCIENTIFIC ANDTECHNICALINFORMATIONISSN1000-0135Vol.29 No.5,931-938October 2010 收稿日期:2009年6月29日 作者简介:王洪伟,男,1973年生,博士,副教授桙博导,研究方向:本体建模和情感计算,E-mail:hwwang@tongji.edu.cn。刘勰,男,1985年生,硕士研究生,研究方向:数据挖掘与情感计算。尹裴,女,1986年生,硕士研究生,研究方向:商务智能。廖雅国,男,1954年生,博士,教授,研究方向:人工智能与电子商务。 1) 本文得到国家自然科学基金项目(70501024,70971099);教育部人文社会科学资助项目(05JC870013);上海市重点学科建设项目(B310);香港研究资助局项目(polyU5237桙08E)资助。 doi:10.3772桙j.issn.1000-0135.2010.05.023 Web文本情感分类研究综述 1) 王洪伟1  刘 勰1  尹 裴1  廖雅国 2 (1畅同济大学经济与管理学院,上海200092;2畅香港理工大学电子计算学系,香港) 摘要 对用户发表在Web上的评论进行分析, 能够识别出隐含在其中的情感信息,并发现用户情感的演变规律。为此,本文对Web文本情感分类的研究进行综述。将情感分类划分为三类任务:主客观分类、极性判别和强度判别,对各自的研究进展进行总结。其中将情感极性判别的方法分为基于情感词汇语义特性的识别和基于统计自然语言处理的识别方法。分析了情感分类中的语料库选择和研究难点。最后总结了情感分类的应用现状,并指出今后的研究方向。 关键词 Web文本 情感分类 综述 主观性文本 LiteratureReviewofSentimentClassificationonWebText WangHongwei1 ,LiuXie1 ,YinPei1 andLiuN.K.James 2 (1畅SchoolofEconomicsandManagement,TongjiUniversity,Shanghai200092;2畅DepartmentofComputing,HongKongPolytechnicUniversity,HongKong) Abstract Analyzingtheusers’reviewsontheWebcanhelpustoidentifyusers’implicitsentimentsandfindtheevolution lawsoftheiremotion.Tothisend,thispaperisasurveyaboutthesentimentclassificationontheWebtext.Wedividedtheprocessofclassificationintothreecategories:subjectiveandobjectiveclassification,polarityidentificationandintensity identificationandrespectivelysummarizetheresentresearchachievementsinthesefields.Wealsosortedthemethodsofpolarityidentificationintotwotypes:oneisbasedontheemotionalwordswithsemanticcharacteristics,whiletheotherstatisticmethodsof naturallanguageprocessing.Whatismore,thechoiceofcorpusandpotentialresearchproblemsarediscussed.Atlast,thispaper summarizedthestatusquoofapplicationandpointedoutthedirectionoffutureresearch. Keywords Webtexts,sentimentclassification,survey,subjectivetext 随着互联网的流行,Web文本成为我们获取信 息、发表观点和交流情感的重要来源。特别是随着Web2畅0技术的发展,网络社区、博客和论坛给网络用户提供了更宽广的平台来交流信息和表达意见。这些文章和言论往往包含有丰富的个人情感,比如 对某部大片的影评,对某款手机的用户体验等,其中 蕴含着巨大的商业价值。如何从这些Web文本中进行情感挖掘,获取情感倾向已经成为当今商务智能领域关注的热点。所谓情感分析(sentimentanalysis),就是确定说话人或作者对某个特定主题的 — 139—

开题报告(文献综述)-在线评论分析系统的情感分析

开题报告(文献综述)-在线评论分析系统的情感分析本科毕业设计(论文)开题报告 论文题目在线评论分析系统的情感分析开题报告内容: 一、选题的背景及意义 近年来,在“大数据”(Big Data)时代的背景下,随着电子商务行业的蓬勃发展,网络购物平台、手机APP应用市场平台等不仅为用户提供了大量商品信息,同时还允许用户参与商品评论。它不仅为商家提供了一个信息的展示平台以发布新产品的规格数据,也为消费者提供了一个产品使用体验交流以及质量评价的平台。因此很多网络用户在购买或使用某类产品前,往往会选择先上网浏览一些该产品的相关信息,尤其是其他用户的使用体验,多方比较产品的性能,从而使自己的消费和选择更趋理性化。分析这些评论信息,蕴含着巨大的商业价值和社会价值,具有很大的现实意义。 然而,这些主观性评论文本每天以指数级的速度增长,仅靠人工方式难以进行 收集、处理和分析。因此采用计算机技术来自动地分析这些主观性文本表达的情感,成为目前数据挖掘(Data Mining)研究的一个热点,而这个热点的研究方向就是文本情感分析(Sentiment Analysis)。 文本情感分析,也称为意见挖掘(Opinion Mining),是指通过分析和挖掘文本中的表达情感、观点和立场的主观性信息并判断其情感倾向。它涉及自然语言处理(Natural Language Processing)、计算机语言学(Computational Linguistics)、机器学习(Machine Learning)、信息检索(Information Retrieval)等众多领域,在计算机科学、管理学、政治学、经济学和社会学方向都有广泛的应用。进入21 世纪以后,情感分析这个领域变得活跃起来,吸引越来越多的学者投入其中。目前

文本情感分析综述

随着企业信息化与互联网的发展,信息以爆炸性速度飞速增长,其中包括了大量的非结构化与半结构化数据。非结构化与半结构化数据,主要是文本型数据,阐述5w问题,即who,when,where,what,Why。如何充分利用非结构化数据与半结构化数据,分析其包含的潜在信息,拥有支持决策,成为了众多企业与研究者关注的重点。尤其,针对互联网(如博客和论坛)上大量的用户参与的、对于诸如人物、事件、产品等有价值的评论信息。这些评论信息表达了人们的各种情感色彩和情感倾向性,如喜、怒、哀、乐和批评、赞扬等。基于此,潜在的用户就可以通过浏览这些主观色彩的评论来了解大众舆论对于某一事件或产品的看法。由于越来越多的用户乐于在互联网上分享自己的观点或体验,这类评论信息迅速膨胀,仅靠人工的方法难以应对网上海量信息的收集和处理,因此迫切需要计算机帮助用户快速获取和整理这些相关评价信息。因此,如何从这些Web文本中进行情感挖掘,获取情感倾向已经成为当今商务智能领域关注的热点。情感分析(sentiment analysis)技术也就应运而生(本文中提及的情感分析,都是指文本情感分析)。 文本情感分析(sentiment analysis),又称为意见挖掘,是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。其中,主观情感可以是他们的判断或者评价,他们的情绪状态,或者有意传递的情感信息。因此,情感分析的一个主要任务就是情感倾向性的判断,Pang等人在文献1中将情感倾向分为正面、负面和中性,即褒义、贬义和客观评价。研究初期,大量研究者都致力于针对词语和句子的倾向性判断研究,但随着互联网上大量主观性文本的出现,研究者们逐渐从简单的情感词语的分析研究过渡到更为复杂的情感句研究以及情感篇章的研究。文本情感分析主要可以归纳为3项层层递进的研究任务,即情感信息的抽取、情感信息的分类以及情感信息的检索与归纳[2]。情感信息抽取就是将无结构的情感文本转化为计算机容易识别和处理的结构化文本。情感信息分类则是利用情感信息抽取的结果将情感文本单元分为若干类别,供用户查看,如分为褒、贬、客观或者其他更细致的情感类别。情感信息检索和归纳可以看作是与用户直接交互的接口,强调检索和归纳的两项应用。 情感分析是一个新兴的研究课题,具有很大的研究价值和应用价值,正受到国内外众多研究者的青睐。目前实现情感分析的技术主要包括基于机器学习法和基于语义方法两类。本文主要针对这两大方法的研究进展进行比较分析,接着介绍国内外现有的资源建设情况,最后介绍情感分析的几个重要应用和展望它的发展趋势。 1 基于统计机器学习法 随着大规模语料库的建设和各种语言知识库的出现,基于语料库的统计机器学习方法进入自然语言处理的视野。多种机器学习方法应用到自然语言处理中并取得了良好的效果,促进了自然语言处理技术的发展。机器学习的本质是基于数据的学习(Learning from Data)。利用机器学习算法对统计语言模型进行训练,最后用训练好的分类器对新文本情感进行识别。2002年,Pang 等人就在文献[1]中提出用机器学习的方法进行情感倾向的挖掘工作,他们以互联网上的电影评论文本作为语料,采用了不同的特征选择方法,应用朴素贝叶斯(Naive Bayes)、最大熵(Maximum Entropy)、向量机(SVM)对电影评论分别进行分类,实验表明SVM 的分类性能最好,准确率达到87.5%。该研究引起学术界的关注,之后用于倾向性判断的机器学习算法的改进被陆续提出,基本的算法有:支持向量机(SVM)、朴素贝叶斯(NB)、K-近邻(KNN)、简单线性分类器(SLC)和最大熵(ME)等。他们在另一项工作中,将文本极性分类问题转换成求取句子连接图的最小分割问题,实现了一个基于minimum-cut的分类器。[7]。Whitelaw等人[11]关注研究带形容词的词组及其修饰语(如“extremely boring”或“not really verygood”),他们提取带形容词的词组作为特征,基于这些特征,用向量空间模型表示文

语音情感识别研究进展综述_韩文静

软件学报ISSN 1000-9825, CODEN RUXUEW E-mail: jos@https://www.doczj.com/doc/2f9942508.html, Journal of Software,2014,25(1):37?50 [doi: 10.13328/https://www.doczj.com/doc/2f9942508.html,ki.jos.004497] https://www.doczj.com/doc/2f9942508.html, +86-10-62562563 ?中国科学院软件研究所版权所有. Tel/Fax: ? 语音情感识别研究进展综述 韩文静1, 李海峰1, 阮华斌2, 马琳1 1(哈尔滨工业大学计算机科学与技术学院,黑龙江哈尔滨 150001) 2(清华大学计算机科学与技术系,北京 100084) 通讯作者: 韩文静, E-mail: hanwenjing07@https://www.doczj.com/doc/2f9942508.html, 摘要: 对语音情感识别的研究现状和进展进行了归纳和总结,对未来语音情感识别技术发展趋势进行了展望. 从5个角度逐步展开进行归纳总结,即情感描述模型、具有代表性的情感语音库、语音情感特征提取、语音情感识 别算法研究和语音情感识别技术应用,旨在尽可能全面地对语音情感识别技术进行细致的介绍与分析,为相关研究 人员提供有价值的学术参考;最后,立足于研究现状的分析与把握,对当前语音情感识别领域所面临的挑战与发展趋 势进行了展望.侧重于对语音情感识别研究的主流方法和前沿进展进行概括、比较和分析. 关键词: 人机交互;情感计算;情感描述模型;情感语音库;情感声学特征;语音情感识别 中图法分类号: TP391文献标识码: A 中文引用格式: 韩文静,李海峰,阮华斌,马琳.语音情感识别研究进展综述.软件学报,2014,25(1):37?50.https://www.doczj.com/doc/2f9942508.html,/ 1000-9825/4497.htm 英文引用格式: Han WJ, Li HF, Ruan HB, Ma L. Review on speech emotion recognition. Ruan Jian Xue Bao/Journal of Software, 2014,25(1):37?50 (in Chinese).https://www.doczj.com/doc/2f9942508.html,/1000-9825/4497.htm Review on Speech Emotion Recognition HAN Wen-Jing1, LI Hai-Feng1, RUAN Hua-Bin2, MA Lin1 1(School of Computer Science and Technology, Harbin Institute of Technology, Harbin 150001, China) 2(Department of Computer Science and Technology, Tsinghua University, Beijing 100084, China) Corresponding author: HAN Wen-Jing, E-mail: hanwenjing07@https://www.doczj.com/doc/2f9942508.html, Abstract: This paper surveys the state of the art of speech emotion recognition (SER), and presents an outlook on the trend of future SER technology. First, the survey summarizes and analyzes SER in detail from five perspectives, including emotion representation models, representative emotional speech corpora, emotion-related acoustic features extraction, SER methods and applications. Then, based on the survey, the challenges faced by current SER research are concluded. This paper aims to take a deep insight into the mainstream methods and recent progress in this field, and presents detailed comparison and analysis between these methods. Key words: human-computer interaction; affective computing; emotion representation model; emotional speech corpora; emotion-related acoustic feature; speech emotion recognition 人类之所以能够通过聆听语音捕捉对方情感状态的变化,是因为人脑具备了感知和理解语音信号中的能 够反映说话人情感状态的信息(如特殊的语气词、语调的变化等)的能力.自动语音情感识别则是计算机对人类 上述情感感知和理解过程的模拟,它的任务就是从采集到的语音信号中提取表达情感的声学特征,并找出这些 声学特征与人类情感的映射关系.计算机的语音情感识别能力是计算机情感智能的重要组成部分,是实现自然 ?基金项目: 国家自然科学基金(61171186, 61271345); 语言语音教育部微软重点实验室开放基金(HIT.KLOF.2011XXX); 中央 高校基本科研业务费专项资金(HIT.NSRIF.2012047) 收稿时间:2013-05-08; 定稿时间: 2013-09-02; jos在线出版时间: 2013-11-01 CNKI网络优先出版: 2013-11-01 13:49, https://www.doczj.com/doc/2f9942508.html,/kcms/detail/11.2560.TP.20131101.1349.001.html

如何查找文献综述

华南师范大学政治与行政学院2015—2016学年第一学期 硕士研究生 课 程 论 文 课程名称:如何查找文献与综述 授课老师:蓝宇蕴 论文名称:大学生网络不道德行为问题研究综述 班级:应用心理 学生姓名:吴杰 学号: 2015022369

大学生网络不道德行为问题研究综述 摘要随着网络的发展, 上网己成为大学生课余生活的重要内容和社会化的 重要途径。网络在开阔大学生视野、促进学习、丰富知识的同时, 也引起了大学 生各种网络不道德行为问题, 并且越来越受到国内外专家学者的重视。学者们纷 纷从心理学、法律、网络技术和管理学等角度分析和研究此问题, 这些研究对思 想政治工想政治教育的阵地建设无疑具有重要的借鉴作用。 关键词网络不道德行为;表现;原因;对策 当今世界已进入网络时代, 大学生已成为网民队伍的主力军, 网络己经深 入大学生生活的各个方面, 为大学生提供了广阔的学习文化知识空间和便捷的条件, 同时网络中的消极影响使大学生产生了许多的网络不道德行为, 且日益增多, 严重影响了大学生的健康成长和网络的有序发展,引起了国内外专家学者的高度关注。这些关注反映了人们的警觉, 也代表了这方面最新的研究成果。本文对此从四个方面加以综述, 以期对网络思想政治工作具有重要的启迪和借鉴意义。 一、关于大学生网络不道德行为的界定 “大学生网络不道德行为”是什么? 这是人们在研究大学生网络不道德行为的时候遇到的第一个问题。厘清大学生网络不道德行为的真正内涵是进一步研究的基础。如何科学、准确地界定网络行为的性质, 即哪些网络行为是“道德”的, 那些网络行为是“不道德” , 仍是一个十分棘手的问题。因为, 现实社会的伦理道德规范是否可以原封不动地移植到网络空间, 使之同样适用于网络社会,关于这一问题还存在着争议, 加之历史、文化、教育体制及意识形态方面的差异, 这方面的国际比较和借鉴也不多, 还有待进一步深入研究。因此,目前关于大学生网络不道德行为的界定几乎没有人触及。尽管如此, 一些研究者仍从自身对大学生网络不道德行为的问题的理解, 以不同的视角对于大学生网络不道德行为相关的概念作出了界定。比如, 徐艳国在《大学生网络越轨行为影响因素的社会学分析》中认为, “我们通常把违反现实社会规范的网络行为称为网络越轨行为”。崔建良、谢清志、刘艳丽在《大学生网络行为道德失范的原因与对策》中认为, 大学生网络行为道德失范, 是指大学生在使用网络过程中表现出的有违理性、不符合道德和法律规范要求的行为。还有人认为所谓网络行为失范, 是指在网络空间中发生的, 违反法律法规、有关管理规定和道德规范的行为。 二、关于大学生网络不道德行为问题的种种表现

相关主题
文本预览
相关文档 最新文档