当前位置:文档之家› 互联网商品评论情感分析研究综述

互联网商品评论情感分析研究综述

互联网商品评论情感分析研究综述
互联网商品评论情感分析研究综述

互联网商品评论情感分析研究综述

作者:张紫琼, 叶强, 李一军, ZHANG Zi-qiong, YE Qiang, LI Yi-jun

作者单位:哈尔滨工业大学管理学院,哈尔滨,150001

刊名:

管理科学学报

英文刊名:JOURNAL OF MANAGEMENT SCIENCES IN CHINA

年,卷(期):2010,13(6)

被引用次数:13次

参考文献(77条)

1.Pang B;Lee L;Vaithyanathan S Thumbs up? Sentiment classification using machine learning techniques [外文会议] 2002

2.Turney P Thumbs up or Thumbs down? Semantic orientation applied to unsupervised classification of reviews[外文会议] 2002

3.DoubleClick Search before the Purchase-Understanding Buyer Search Activity as it Builds to Online Purchase 2005

4.Miniwatts Marketing Group Internet Usage Statistics-The Internet Big Picture-World Internet Users and Population Stats 2009

5.姚天昉;程希文;徐飞玉文本意见挖掘综述[期刊论文]-中文信息学报 2008(03)

6.Lyons J Semantics 1977

7.Wiebe J Learning subjective adjectives from corpora[外文会议] 2000

8.Hatzivassiloglou V;Wiebe J Effects of adjective orientation and gradability on sentence

subjectivity[外文会议] 2000

9.Grefenstette G;Qu Y;Evans D A Validating the coverage of lexical resources for affect analysis and automatically classifying new words along semantic axes[外文会议] 2004

10.Riloff E;Wiebe J;Wilson T Learning subjective nouns using extraction pattern bootstrapping 2003

11.Riloff E;Wiebe J Learning extraction patterns for subjective expressions[外文会议] 2003

12.Kim S-M;Hovy E Automatic detection of opinion bearing words and sentences 2005

13.叶强;张紫琼;罗振雄面向互联网评论情感分析的中文主观性自动判别方法研究 2007(01)

14.Andreevskaia A;Bergler S Mining WorldNet for fuzzy sentiment:Sentiment tag extraction from wordnet glosses 2006

15.Esuli A;Sebastiani F Determining term subjectivity and term orientation for opinion mining 2006

16.Takamura H;Inui T;Okumura M Latent variable models for semantic orientations of phrases 2006

17.Yu H;Hatzivassiloglou V Towards answering opinion questions:Separating facts from opinions and identifying the polarity of opinion sentences 2003

18.Hiroshima N;Yamada S;Furuse O Searching for sentences expressing opinions by using declaratively subjective clues 2006

19.Wilson T;Wiebe J;Hwa J Just how mad are you? Finding strong and weak opinion clauses[外文会议] 2004

20.Pang B;Lee L A sentimental education:Sentiment analysis using subjectivity summarization based on inimum cuts 2004

21.Kobayashi N;Iida R;Inui K Opinion mining on the web by extracting subject-aspect-evaluation relations[外文会议] 2006

22.Bethard S;Yu H Thornton A,et al.Automatic extraction of opinion propositions and their holders 2004

23.Ng V;Dasgupta S;Arifin S M N Examining the role of linguistic knowledge sources in the automatic identification and classification of reviews 2006

24.Wiebe J;Mihalcea R Word sense and subjectivity[外文会议] 2006

25.Mihalcea R;Banea C;Wiebe J Learning multilingual subjective language via cross-lingual

projections[外文会议] 2007

26.Cui H;Mittal V;Datar M Comparative experiments on sentiment classification for online product reviews[外文会议] 2006

27.Kim S-M;Hovy E Determining the sentiment of opinions[外文会议] 2004

28.Yi J;Nasukawa T;Bunescu R C Sentiment analyzer:Extracting sentiments about a given topic using natural language processing techniques 2003

29.Liu B;Hu M;Cheng J Opinion observer:Analyzing and comparing opinions on the web 2005

30.Hu M;Liu B Mining and summarizing customer reviews[外文会议] 2004

31.Nasukawa T;Yi J Sentiment analysis:Capturing favorability using natural language processing 2003

32.Kim S-M;Hovy E Extracting opinions,opinion holders,and topics expressed in online news media text 2006

33.Zhuang L;Jing F;Zhu X-Y Movie review mining and summarization 2006

34.Popescu A-M;Etzioni O Extracting product features and opinions from reviews 2005

35.姚天昉;娄德成汉语语句主题语义倾向分析方法的研究[期刊论文]-中文信息学报 2007(05)

36.Gamon M Sentiment classification on customer feedback data:Noisy data,large feature vectors,and the role of linguistic analysis 2004

37.Ku L W;Liang Y T;Chen H H Opinion extraction,summarization and tracking in news and blog corpora 2006

38.Das S R;Chen M Y Yahoo! for Amazon:Sentiment extraction from small talk on the web[外文期刊] 2007(09)

39.Ye Q;Zhang Z;Law R Sentiment classification of online reviews to travel destinations by supervised machine learning approaches 2009(03)

40.Dave K;Lawrence S;Pennock D Mining the peanut gallery:Opinion extraction and semantic classification of product reviews 2003

41.Chaovalit P;Zhou L Movie review mining:A comparison between supervised and unsupervised classification approaches 2005

42.Pang B;Lee L Seeing stars:Exploiting class relationships for sentiment categorization with respect to rating scales 2005

43.Mao Y;Lebanon G Isotonic conditional random fields and local sentiment flow[外文会议] 2007

2007

45.Devitt A;Ahmad K Sentiment polarity identification in financial news:A cohesion-based approach 2007

46.Hatzivassiloglou V;McKeown K Predicting the semantic orientation of adjectives 1997

47.Wilson T;Wiebe J;Hoffmann P Recognizing contextual polarity in phrase-level sentiment analysis 2005

48.Turney P Measuring praise and criticism:Inference of semantic orientation from association[外文期刊] 2003(04)

49.Kanayama H;Nasukawa T Fully automatic lexicon expansion for domain-oriented sentiment analysis 2006

50.Kaji N;Kitsuregawa M Building lexicon for sentiment analysis from massive collection of html documents 2007

51.Ghose A;Ipeirotis P G;Sundararajan A Opinion mining using econometrics:A case study on reputation systems 2007

52.Kamps J;Marx M;Mokken R J Using WordNet to measure semantic orientation of adjectives 2004

53.Esuli A;Sebastiani F Determining the semantic orientation of terms through gloss classification 2005

54.Takamura H;Inui T;Okumura M Extracting semantic orientation of words using spin model 2005

55.Esuli A;Sebastiani F SentiWordNet:A publicly available lexical resource for opinion mining 2006

56.Esuli A;Sebastiani F PageRanking WorldNet synsets:An application to opinion mining 2007

57.Eguchi K;Lavrenko V Sentiment retrieval using generative models 2006

58.Morinaga S;Yamanishi K;Tateishi K Mining product reputations on the web[外文会议] 2002

59.Hu M;Liu B Mining opinion features in customer reviews[外文会议] 2004

60.李实;叶强;李一军;Law Rob中文网络客户评论的产品特征挖掘方法研究[期刊论文]-管理科学学报 2009(02)

61.Kanayama H;Nasukawa T;Watanabe H Deeper sentiment analysis using machine translation technology [外文会议] 2004

62.Godes D;Mayzlin D Using online conversations to study word of mouth communication[外文期刊]

2004(04)

63.Chen P-Y S;Wu S-Y;Yoon J The impact of online recommendations and consumer feedback on sales 2004

64.Liu Y Word-of-mouth for movies:Its dynamics and impact on box office revenue[外文期刊] 2006(03)

65.Duan W;Gu B;Whinston A B Do online reviews matter?-An empirical investigation of panel data[外文期刊] 2008(04)

66.Duan W;Gu B;Whinston A B The dynamics of online word-of-mouth and product sales-An empirical investigation of the movie industry 2008(02)

67.Chevalier J A;Mayzlin D The effect of word of mouth on sales:Online book reviews[外文期刊]

2006(08)

68.Dellarocas C;Zhang X;Awad N F Exploring the value of online product ratings in revenue

69.Zhang Z;Ye Q;Law R The impact of e-word-of-mouth on the online popularity of restaurants:A comparison of consumer reviews and editor reviews 2010

70.Ye Q;Law R;Gu B The impact of online user reviews on hotel room sales 2009(01)

71.Ye Q;Gu B;Chen W Measuring the value of managerial responses to online reviews-A natural experiment of two online travel agencies 2008

72.Clemons E K;Gao G;Hitt L M When online reviews meet hyperdifferentiation:A study of the craft beer industry[外文期刊] 2006(02)

73.Antweiler W;Frank M Z Is all that talk just noise? The information content of internet stock message boards[外文期刊] 2004(03)

74.Mishne G;Glance N Predicting movie sales from blogger sentiment[外文会议] 2006

75.Liu Y;Huang J;An A ARSA:A sentiment-aware model for predicting sales performance using blogs 2007

76.Ghose A;Ipeirotis P G Designing novel review ranking systems:Predicting usefulness and impact of reviews 2007

77.Pavlou P A;Dimoka A The nature and role of feedback text comments in online

marketplaces:Implications for trust building,price premiums,and seller differentiation[外文期刊] 2006(04)

本文读者也读过(5条)

1.周立柱.贺宇凯.王建勇.ZHOU Li-zhu.HE Yu-kai.WANG Jian-yong情感分析研究综述[期刊论文]-计算机应用2008,28(11)

2.郝媛媛.叶强.李一军.HAO Yuan-yuan.YE Qiang.LI Yi-jun基于影评数据的在线评论有用性影响因素研究[期刊论文]-管理科学学报2010,13(8)

3.赵妍妍.秦兵.刘挺.ZHAO Yan-Yan.QIN Bing.LIU Ting文本情感分析[期刊论文]-软件学报2010,21(8)

4.李维杰.LI Wei-jie情感分析与认知[期刊论文]-计算机科学2010,37(7)

5.李实.叶强.李一军.Rob Law.LI Shi.YE Qiang.LI Yi-jun.Rob Law中文网络客户评论的产品特征挖掘方法研究[期刊论文]-管理科学学报2009(2)

引证文献(14条)

1.王刚.杨善林基于RS-SVM的网络商品评论情感分析研究[期刊论文]-计算机科学 2013(z2)

2.唐晓波.肖璐基于情感分析的评论挖掘模型研究[期刊论文]-情报理论与实践 2013(7)

3.王祖辉.姜维基于粗糙集的在线评论情感分析模型[期刊论文]-计算机工程 2012(16)

4.徐健基于网络用户情感分析的预测方法研究[期刊论文]-中国图书馆学报 2013(3)

5.赵洁.温润基于新词扩充和特征选择的微博观点句识别方法[期刊论文]-情报学报 2013(9)

6.陈江涛.张金隆.张亚军在线商品评论有用性影响因素研究:基于文本语义视角[期刊论文]-图书情报工作

2012(10)

7.张玉峰.何超基于Web评论挖掘的动态竞争情报分析研究(上)——问题分析与模型构建[期刊论文]-情报理论与实践 2012(6)

8.邱爽关于博客评论情感倾向对个人投资者行为影响分析[期刊论文]-科技视界 2014(27)

9.黄海量.杜宁华不公正评价对在线交易的影响和作用机理研究[期刊论文]-管理科学学报 2012(10)

10.明均仁融合语义关联挖掘的文本情感分析算法研究[期刊论文]-图书情报工作 2012(15)

11.李健在线商品评论对产品销量影响研究[期刊论文]-现代情报 2012(1)

12.胡新明.夏火松在线评论中用户商品属性偏好识别方法研究[期刊论文]-情报杂志 2012(9)

13.杨善林.罗贺.丁帅基于云计算的多源信息服务系统研究综述[期刊论文]-管理科学学报 2012(5)

14.熊伟.郭扬杰酒店顾客在线评论的文本挖掘[期刊论文]-北京第二外国语学院学报 2013(11)

引用本文格式:张紫琼.叶强.李一军.ZHANG Zi-qiong.YE Qiang.LI Yi-jun互联网商品评论情感分析研究综述[期刊论文]-管理科学学报 2010(6)

(叶强和李一军对文本分析这一块应该研究的较多)互联网商品评论情感分析研究综述_张紫琼

第13卷第6期2010年6月 管理科学学报 J OURNA L O F M ANAGE M ENT SCIENCES I N CH I NA V o.l13N o.6 Jun.2010互联网商品评论情感分析研究综述1 张紫琼,叶强,李一军 (哈尔滨工业大学管理学院,哈尔滨150001) 摘要:互联网评论情感分析是W eb信息挖掘的一个新兴领域,近年来受到计算机科学、经济学、管理学等相关学科的广泛关注.目前,情感分析领域的研究主要集中在主观性内容识别、褒贬情感分类以及在线评论的经济价值挖掘等几个方面,大部分研究借鉴文本挖掘、信息检索、机器学习、自然语言处理、统计学等方面的技术和方法,也提出了一些针对评论情感分析的特定方法.对在线评论情感分析领域的研究现状与进展动态进行归纳和分析,重点论述现有研究采用的主要方法和关键技术,以及研究中存在的问题,最后提出了未来的研究方向. 关键词:情感分析;在线评论;主观性识别;褒贬分类;在线口碑效应 中图分类号:TP18;C931文献标识码:A文章编号:1007-9807(2010)06-0084-13 0引言 情感分析(senti m ent analysis),又称评论挖掘或意见挖掘(op i n i o n m i n i n g),是指通过自动分析某种商品评论的文本内容,发现消费者对该商品的褒贬态度和意见[1-2].利用对互联网上商品评论信息的挖掘与分析结果,消费者可以了解人们对某种商品的态度倾向分布,优化购买决策;生产商和销售商可以了解消费者对其商品和服务的反馈信息,以及消费者对自己和对竞争对手的评价,从而改进产品改善服务,赢得竞争优势. 随着信息技术及其应用在过去十几年中的快速发展,互联网不仅对企业的业务流程带来了巨大的变革,也对消费者的行为模式产生了深刻的影响.DoubleC lick I nc.[3]进行了一项针对美国服装业、计算机硬件设备业、运动与健身产品行业及旅游业网络客户的研究,发现这些行业中都有近一半以上的消费者在做出购买决定前会在互联网上搜索相关商品的介绍及其他消费者对商品的评论信息,互联网商品评论对于消费者的购买决策有着重要的影响.据统计,截至2009年9月,全球上网人数已达17.34亿人[4],充分挖掘消费者的喜好偏爱对商家具有重要的意义. 作为W eb信息挖掘的一个新兴领域,在线评论情感分析涉及的研究内容十分广泛,如自动识别互联网中传播的商品评论信息、识别被评论的商品属性、判断客户意见的褒贬态度以及挖掘在线评论与商品销售情况的关系等.姚天昉等[5]对情感分析的研究现状进行了总结,主要内容包括:1介绍情感分析的定义和研究的目的;o从主题的识别、意见持有者的识别、情感描述的选择和情感的分析四个方面进行评述,并介绍了一些成型的系统;?讨论中文情感分析的研究现状.而本文分别从篇章、语句和词语等不同粒度上,围绕情感分析技术的基础性工作,主观性内容识别和褒贬情感分类两方面展开评述,并对在线评论将如何影响消费者的购买行为以及如何影响商品销售情况的工作进行整理和分析. 针对在线评论挖掘开展的研究越来越多,然而相关研究仍然处在探索阶段,在方案设计和技术运用方面都比较分散,缺乏统一的实验平台和 1收稿日期:2009-02-16;修订日期:2010-03-18. 基金项目:国家自然科学基金资助项目(70971033;70890082);新世纪优秀人才支持计划资助项目(NCET-08-0172). 作者简介:张紫琼(1982)),女,黑龙江大庆人,博士生.Em ai:l ziqiong@h https://www.doczj.com/doc/ac11885899.html,

文本情感分析综述

文本情感分析综述? 赵妍妍+, 秦兵, 刘挺 (哈尔滨工业大学计算机科学与技术学院信息检索研究中心, 黑龙江哈尔滨 150001) A Survey of Sentiment Analysis * ZHAO Yan-Yan+, QIN Bing, LIU Ting (School of Computer Science and Technology, Harbin Institute of Technology, Harbin 150001, China) + Corresponding author: Phn: +86-451-86413683 ext 800, E-mail: zyy@https://www.doczj.com/doc/ac11885899.html, Abstract: Sentiment analysis is a novel research topic with the quick development of online reviews, which has drawn interesting attention due to its research value and extensive applications. This paper surveys the state-of-the-art research on sentiment analysis. First, three important tasks of sentiment analysis are summarized and analyzed in detail, including sentiment extraction, sentiment classification, sentiment retrieval and summarization; then the evaluation and corpus for sentiment analysis are introduced; finally the applications of sentiment analysis are concluded. This paper aims to take a deep insight into the mainstream methods and recent progress in this field, making detailed comparison and analysis. It is expected to be helpful to the future research. Key words: sentiment analysis; sentiment extraction; sentiment classification; sentiment retrieval and summarization; evaluation; corpus 摘 要: 文本情感分析是随着网络评论的海量增长而迅速兴起的一个新兴研究课题,其研究价值和应用价值受到人们越来越多的重视.本文对文本情感分析的研究现状与进展进行了总结.首先将文本情感分析归纳为三项主要任务,即情感信息抽取,情感信息分类以及情感信息的检索与归纳,并对它们进行了细致的介绍和分析;进而介绍了文本情感分析的国内外评测和资源建设情况;最后介绍了文本情感分析的应用.文本重在对文本情感分析研究的主流方法和前沿进展进行概括,比较和分析,以期对后续研究有所助益. 关键词: 文本情感分析;情感信息抽取;情感信息分类;情感信息的检索与归纳;评测;资源建设 中图法分类号: TP391文献标识码: A 随着Web2.0的蓬勃发展,互联网逐渐倡导“以用户为中心,用户参与”的开放式构架理念.互联网用户由单纯的“读”网页,开始向“写”网页、“共同建设”互联网发展,并由被动地接收互联网信息向主动创造互联网信息迈进.因此,互联网(如:博客和论坛)上产生了大量的用户参与的,对于诸如人物、事件、产品等有价值的评论信息.这些评论信息表达了人们的各种情感色彩和情感倾向性,如“喜”、“怒”、“哀”、“乐”,和“批评”、“赞扬”等.基于此,潜在的用户就可以通过浏览这些主观色彩的评论,来了解大众舆论对于某一事件或产品的看法.由于越来越多的用户乐于在互联网上分享自己的观点或体验,这类评论信息迅速膨胀,仅靠人工的方法难以应对网上海量信 ?Supported by the National Natural Science Foundation of China under Grant Nos. 60803093, 60975055 (国家自然科学基金) and the “863” National High-Tech Research and Development of China via grant 2008AA01Z144(863计划探索类专题项目)

文本情感分析论文总结

文本情感分析 赵妍妍,秦兵,刘挺- 软件学报, 2010 - https://www.doczj.com/doc/ac11885899.html, 按粒度,情感分析可分为词语级、短语级、句子级、篇章级、多篇章级;按文本类别,可分为基于新闻评论和基于产品的情感分析。 情感分析的研究任务:情感信息的抽取、分类以及检索与归纳。 一、情感信息抽取(评价词语、评价对象、观点持有者) 1.评价词语的抽取:基于语料库的抽取;基于词典的抽取;基于图的方法。 2.评价对象的抽取:基于规则/模板的方法(词序列、词性、句法规则、关联规则挖掘);评 价对象最为产品属性,考察评价对象与领域指示词的关联度来获取;多粒度的话题模型方法。 3.观点持有者抽取:命名实体识别技术(人名或机构名)、语义角色标注;分类任务,看做 序列标注问题,使用CRF融合特征抽取;名词短语作为候选,使用ME模型计算。 4.组合评价单元的抽取: 主观表达式:Wiebe的主观表达式库(抽取n元词语/词组作为候选,对比训练预料判断) 评价短语抽取(程度副词-评价词语):情感词典的方法;依存句法解构(ADV,ATT,DE)。 评价搭配抽取(评价词语-评价对象):基于模板的方法(8个共现模板、句法关系模板)。 二、情感信息分类 1.主客观信息分类:文本是否含情感知识方法;组合评价单元判断;情感模板识别;基于 分类器和分类特征的二元分类任务(词语特征,标点、人称代词、数字特征,基于图); 2.主观信息情感分类(句子级、篇章级):基于情感知识、基于特征分类的方法(n-gram词语 特征和词性特征、位置特征、评价词特征)。 三、情感信息的检索与归纳 1.情感信息检索 2.情感信息归纳 基于产品属性的情感文摘:识别评论信息中的产品属性,抽取描述产品属性的情感句,判断其倾向性。 基于情感标签的情感文摘:标签可定义为评价搭配形式,建立标签库,相似度聚类的方法聚类得到相似的情感标签,每一类视为潜在的话题(即产品属性)。 基于新闻评论的文摘 四、情感分析的评测与资源 1.情感分析的评测:TREC,NTCIR的MOAT(新闻观点检测,情感问答,跨语言情感分析), 国内的COAE。 2.情感分析的语料:康奈尔大学的影评数据集,UIC的Hu和Liu的产品领域的评论语料, Wiebe的MPQA新闻评论深度标注语料,MIT的多角度餐馆评论语料,中科院的中文酒店评论语料。 3.词典资源:GI(general inquirer)评价词词典,NTU评价词词典(繁体中文),主观词词典(英 文),HowNet评价词词典(简体中文、英文) 问题:情感信息抽取忽略词语所在语境的影响;评价对象的情感分类,而非句子级或篇章级;基于情感标签的情感文摘的深入研究;

产品评论挖掘研究综述.

2008, 44(36 1引言 随着 Web 的广泛使用,用户购买和使用产品之后会在 Web 上发表对产品的评论, 这些评论中包含用户对产品的性能或功能等方面持有肯定还是否定的态度。生产厂商和用户对产品评论的分析可以获得大量的有用信息:生产厂商不仅可以了解用户对产品目前已提供的性能的评价和产品的不足, 还可以了解用户的需求,找出用户最感兴趣和最希望提供的功能, 从而改进产品[1]。用户购买产品之前可以了解已经购买了该产品的用户关于该产品的使用体验,了解产品各个方面的性能, 还可以对同类型的产品按照性能进行对比, 从而合理地购买产品 [2]。 目前用户一般通过在 Web 上填写问卷调查表的方式或直接使用自然语言发表一段评论的方式来表达对产品的态度。问卷调查表属于结构化数据, 可以使用成熟的数据库技术进行分析并显示统计结果, 自然语言描述的产品评论属于无结构化数据, 生产厂商和用户要想从产品评论中获取信息, 只有通过人工阅读方式来获取信息, 而这是一个消耗时间且容易产生错误的过程。因此产生了对用户评论挖掘的研究, 目的是通过采用 自然语言处理技术, 对自然语言描述的无结构的用户产品评论 中进行数据的自动挖掘, 找到有用的信息, 并以直观的方式对挖掘结果进行表示。 2产品评论挖掘框架 产品评论挖掘是文本挖掘研究领域中最近几年兴起的研究热点, 以 Web 上发表的用户产品评论作为挖掘对象, 采用自然语言处理技术,从大量文本数据中发现用于对该产品各方面性能的评价。目前产品评论挖掘分为产品特征提取、主观句定位、用户态度提取、态度极性判定和挖掘结果显示 5个子任务 (如图 1 。

情感分析简述

情感分析简述 分类:NLP2012-04-08 12:38 1022人阅读评论(3) 收藏举报情感classification算法测试translationmatrix 情感分析,我研究了也有半年有余了,ACL Anthology上关于情感分析的论文也基本看过了一遍,但是到目前还没有什么成就的。以下是我为一位同学毕业设计写的情感分析方面的综述,引用的论文基本上是ACL 和COLING还有EMNLP上历年关于情感分析的论文,本文应该学术性比较强一点,本文虽不打算发表,但由于将来可能还有用,以及关于学术上的原因,请大家如果要引用请务必标明出处 (https://www.doczj.com/doc/ac11885899.html,/s/blog_48f3f8b10100irhl.html)。 概述 情感分析自从2002年由Bo Pang提出之后,获得了很大程度的研究的,特别是在在线评论的情感倾向性分析上获得了很大的发展,目前基于在线评论文本的情感倾向性分析的准确率最高能达到90%以上,但是由于深层情感分析必然涉及到语义的分析,以及文本中情感转移现象的经常出现,所以基于深层语义的情感分析以及篇章级的情感分析进展一直不是很大。情感分析还存在的一个问题是尚未存在一个标准的情感测试语料库,虽然Bo Pang实验用的电影评论数据集(https://www.doczj.com/doc/ac11885899.html,/people/pabo/movie-review-data/)以及Theresa Wilson等建立的MPQA(https://www.doczj.com/doc/ac11885899.html,/mpqa/)是目前广泛使用的两类情感分析数据集,但是并没有公认的标准加以确认。 目前情感分析的研究基本借鉴文本分类等机器学习的方法,还没有根据自身的特点形成一套独立的研究方法,当然在某种程度上也可以把情感分析看出一种特殊的文本分类。比较成熟的方法是基于监督学习的机器学习方法,半监督学习和无监督学习目前的研究不是很多,单纯的基于规则的情感分析这两年已很少研究了。既然目前很多情感分析的研究基于机器学习,那么特征选择就是一个很重要的问题,N元语法等句法特征是使用最多的一类特征,而语义特征(语义计算)和结构特征(树核函数)从文本分类的角度看效果远没有句法特征效果好,所以目前的研究不是很多的。 由于基于监督学习情感分析的研究已经很成熟了,而且在真实世界中由于测试集的数量要远远多于训练集的数量,并且测试集的领域也不像在监督学习中被限制为和训练集一致,也就是说目前情感分析所应用的归纳偏置假设在真实世界中显得太强的,为了和真实世界相一致,基于半监督学习或弱指导学习的情感分析和跨领域的情感分析势必是将来的研究趋势之一。 在情感分析的最初阶段基于语义和基于规则的情感分析曾获得了比较大的重视,但是由于本身实现的复杂性以及文本分类和机器学习方法在情感分析应用上获得的成功,目前关于这方面的研究以及很少了,但是事实上,语义的相关性和上下文的相关性正是情感分析和文本分类最大的不同之处,所以将基于语义和规则的情感分析与基于机器学习的情感分析相结合也将是未来的研究趋势之一。 以下将分别对情感分析的起源,目前基于监督学习,无监督学习,基于规则和跨领域的情感分析的一些研究工作进行简单的介绍。 起源 虽然之前也有一些相关工作,但目前公认的情感分析比较系统的研究工作开始于(Pang et al., 2002)基于监督学习(supervised learning)方法对电影评论文本进行情感倾向性分类和(Turney,2002)基于无监督学习(unsupervised learning)对文本情感情感倾向性分类的研究。(Pang et al., 2002)基于文本的N元语法(ngram)和词类(POS)等特征分别使用朴素贝叶斯(Naive Bayes),最大熵(Maximum Entropy)和支持向量机(Support Vector Machine,SVM)将文本情感倾向性分为正向和负向两类,将文本的情感进行二元划分的做法也一直沿用至今。同时他们在实验中使用电影评论数据集目前已成为广泛使用的情感分析的测试集。(Turney ,2002)基于点互信息(Pointwise Mutual Information,PMI)计算文本中抽取的关键词和种子词(excellent,poor)的相似度来对文本的情感倾向性进行判别(SO-PMI算法)。 在此之后的大部分都是基于(Pang et al., 2002)的研究。而相对来说,(Turney et al.,2002)提出的无监督学习的方法虽然在实现上更加简单,但是由于单词之间的情感相似度难以准确的计算和种子词的难以确定,继续在无监督学习方向的研究并不是很多的,但是利用SO-PMI算法计算文本情感倾向性的思想却被很多研究者所继承了。 监督学习 目前,基于监督学习的情感分析仍然是主流,除了(Li et al.,2009)基于非负矩阵三分解(Non-negative Matrix Tri-factorization),(Abbasi et al.,2008)基于遗传算法(Genetic Algorithm)的情感分析之外,使用的最多的监督学习算法是朴素贝叶斯,k最近邻(k-Nearest Neighbor,k-NN),最大熵和支持向量机的。而对于算法的改进主要在对文本的预处理阶段。 一个和文本分类不同地方就是情感分析有时需要提取文本的真正表达情感的句子。(Pang et al., 2004)基于文本中的主观句的选择和(Wilson el al.,2009)基于文本中的中性实例(neutral instances)的分析,都是为了能够尽量获得文本中真正表达情感的句子。(Abbasi et al.,2008)提出通过信息增益(Information Gain,IG)的方法来选择大量特征集中对于情感分析有益的特征。 而对于特征选择,除了N元语法和词类特征之外,(Wilson el al.,2009)提出混合单词特征,否定词特征,情感修饰特征,情感转移特征等各类句法特征的情感分析,(Abbasi et al.,2008)提出混合句子的句法(N元语法,词类,标点)和结构特征(单词的长度,词类中单词的个数,文本的结构特征等)的情感分析。 除了对于文本的预处理,对于监督学习中情感分析还进行了以下方面的研究的。(Melville et al., 2009)和(Li et al.,2009)提出结合情感词的先验的基于词典的情感倾向性和训练文本中后验的基于上下文的情感情感倾向性共同判断文本的情感倾向性。(Taboada et al.,2009)提出结合文本的题材(描述,评论,背景,解释等)和文本本身的特征共同判断文本的情感倾向性。(Tsutsumi et al.,2007)提出利用多分类器融合技术来对文本情感分类。(Wan, 2008)和(Wan, 2009)提出结合英文中丰富的情感分析资源来提高中文情感分析的效果。 基于规则/无监督学习

基于商品评论文本的情感分析研究

龙源期刊网 https://www.doczj.com/doc/ac11885899.html, 基于商品评论文本的情感分析研究 作者:陶莉娜李超萍李健高荣 来源:《现代信息科技》2018年第04期 摘要:随着互联网络科技的迅速发展,越来越多的用户开始网上购物,网络中的商品评 论数据也随之增加。如何在大量的评论数据中提取有用的信息,使数据价值最大化是值得重视的问题。本文针对京东网站商品的评论数据进行了情感分析,从中提取有用的信息,帮助商家了解消费者的需求,发现商品的不足之处,并制定改进方案,以提高商品的竞争力。 关键词:数据挖掘;商品评论;情感分析 中图分类号:TP391.1 文献标识码:A 文章编号:2096-4706(2018)04-0019-03 Abstract:With the rapid development of internet technology,more and more users have begun to shop online,and the product review data on the internet has also increased. However,how to extract useful information from a large amount of review data and maximize the value of data is a problem worthy of attention. This article analyzes the sentiment data of https://www.doczj.com/doc/ac11885899.html, website products,provides useful information to help businesses understand the needs of consumers,discovers the inadequacies of products,and formulates improvement programs to improve the competitiveness of products. Keywords:data mining;commodity reviews;sentiment analysis 1 主要技术实现 1.1 网络爬虫 网络的迅速发展使互联网成为大量信息的载体,有效地提取并利用这些信息对我们来说是一个很大的挑战。为了快速的提取有用信息,我们采取网络爬虫技术,它的好处是获取成本小,可以将网页上的内容按照一定的格式规范进行有针对性地获取。 1.2 基于文本情感分析 文本的情感分析是指利用计算机语言、自然语言处理和文本挖掘来辨别文本主观情感信息的一种手段。一般来说,情感分析是对说话者当时的言语评论或建议的一个情感状况辨析。其研究内容包括非结构化文本的分词、情感倾向性分类和情感强度等,它涉及到自然语言处理、文本分词、机器学习等多个研究领域。本文的研究重点是对商品评论文本所表达的正向或负向情感进行分类[1]。

文本情感分析研究现状

文本情感分析研究现状 机器之心专栏 作者:李明磊 作为NLP领域重要的研究方向之一,情感分析在实际业务场景中 存在巨大的应用价值。在此文中,华为云NLP算法专家李明磊为 我们介绍了情感分析的概念以及华为云在情感分析方面的实践和 进展。 基本概念 为什么:随着移动互联网的普及,网民已经习惯于在网络上表达意见和建议,比 如电商网站上对商品的评价、社交媒体中对品牌、产品、政策的评价等等。这些评价中都蕴含着巨大的商业价值。比如某品牌公司可以分析社交媒体上广大民众对该品牌的评价,如果负面评价忽然增多,就可以快速采取相应的行动。而这种正负面评价的分析就是情感分析的主要应用场景。 是什么:文本情感分析旨在分析出文本中针对某个对象的评价的正负面,比如「华为手机非常好」就是一个正面评价。情感分析主要有五个要素,(entity/实体, aspect/属性,opinio n/观点,holder/观点持有者,time/时间),其中实体和属性合并称为评价对象(target)。情感分析的目标就是从非结构化的文本评论中抽取出这五个要素

、 (entity 体, 输入文木 holder/?点持有者,time/ 时 |i 图i情感分析五要素 举例如下图: 我觉得华为手机非常牛逼。(华为手机* 图2情感分析五要素例子 上例中左侧为非结构化的评论文本,右侧为情感分析模型分析出的五个要素中的四个(不包括时间)。其中实体「华为手机」和属性「拍照」合并起来可以作为评价对象。评价对象又可细分为评价对象词抽取和评价对象类别识别。如实体可 以是实体词和实体类别,实体词可以是「餐馆」、「饭店」、「路边摊」,而实 体类别是「饭店」;属性可以是属性词和属性类别,如属性词可以是「水煮牛肉」、 「三文鱼」等,都对应了属性类别「食物」。实体类别和属性类别相当于是对实体词和属性词的一层抽象和归类,是一对多的关系。词和类别分别对应了不同的

在线评论特征的维度综述_李恒

在线评论特征的维度综述 李 恒 (云南民族大学管理学院, 云南昆明650500)摘要:在线评论是网络口碑一种主要形式,是网络消费者购买前主要参考之一。文章重点综述近十年国内主要文献在进行在线评论研究时所用到其本身特征维度,旨在为后续研究在线评论提供全面分析的基础。关键词:网络口碑;在线评论;特征维度中图分类号:F713.36 文献标识码:A 文章编号:1006-8937(2015)03-0119-02 1在线消费者评论的概况 十多年来,电子商务的快速发展使消费者购物逐渐从实体购物转到网络购物,占比份额逐步扩大。消费者发布在销售网站上的在线评论则成为网络消费者最重要的参考渠道。它是网络口碑(包括微博、社区等形式)一种重要形式,是实际的或以前的顾客根据产品或服务购买和使用经历,在在线销售网站等网络平台对其以文本形式为主发表的评价意见。据ChannelAdvisor调查,91%的用户在购买前,会参考互联网用户所写的产品评论信息。因此,关于在线评论的研究成为众多学者研究的重点。 从2006年开始,在线消费者评论的研究逐渐成为研究热点。不过,浏览近十年相关文献可以发现,众多学者对在线评论本身特征维度研究的不多,大多是选取其中重要的三四个维度进行相关研究,虽具一定代表性,但相较众多在线评论特征维度而言,这样的研究不全面。 因此,本文重点在前人研究基础上,归纳总结众学者关于在线评论研究中所用到的其本身特征维度,以期为后续研究在线评论提供全面分析基础。 2在线消费者评论特征的维度 本文对现有在线消费者评论的文献整理发现,在线评论特征主要有评论星级和文本评论两种形式,共12种特征维度。主要有评论星级、评论标题、评论质量、评论数量、评论长度、评论差异性、评论效价、评论类型、评论可读性、评论强度、评论及时性、评论时效性共计12种。 2.1评论星级 评论星级是实际购买者在购买产品或服务后以其体验感受在销售网站下进行的星级评价,是总体评价。一星代表极端负面评价,五星代表极端正面评价,三星反映中立态度。现阶段对于评论星级的研究有三种观点: ①星级高的评论比星级低的评论更有用。②星级低的评论更有用。 ③中立评价更有用,而且可信度更高。 2.2文本评论 2.2.1 评论标题 由于评论标题直接影响着消费者对于评论正文的阅读,所以对于评论标题的研究也是一个重点。以往对于评论标题的研 究,主要是从评论标题长度和评论标题正负情感倾向两个方面来研究。得出评论标题正负情感倾正向影响评论有用性。但是评论标题观点评价倾向对评论有用性不存在正向影响,评论标题平均主观表达倾向对评论有用性不存在负向影响。另外,对于体验型产品,标题长度对评论的感知有用性没有显著影响。2.2.2 评论内容的一般特性 ①质量。评论质量是在线消费者评论本身特征的重要维度之一。质量高的评论由于能够真实、具体、清晰的反映事物本质属性,深刻影响消费者购买决策,因此评论质量一直是研究热点。郭国庆(2010)发现评论质量越高,潜在消费者感知可信度越高;李宏(2011)得出负面在线评论质量的高低对消费者的满意度及购买决策具有显著影响;王远怀(2013)得出在线评论质量对于网络购买决策有明显影响。总之,高质量评论比低质量评论更有说服力,更能对消费者购买决策产生影响。 ②数量。评论数量是指网络消费者在购买某一个具体产品或服务后所发表的评论总数。它在一定程度上代表该产品受追捧程度,可为消费者提供更多的参考,因此也是在线评论本身特征重要维度之一。大多数对评论数量的研究发现评论数量与销量、消费者购买意愿及决策有正向影响。例如周晶晶(2010)得出评论数量正向影响消费者品牌评价和品牌知晓,进而影响消费者购买决策;王远怀(2013)得出评论数量与消费者购物意愿呈正相关。但当评论数量过多,会使消费者出现信息超载现象,使得评论数量作用不明显(Park&Lee,2008)。 ③长度。评论长度是指评论中包含的字数。一般长度越长,包含的产品或服务信息越多,因此可以为消费者提供更全面参考。对于评论长度研究,郝媛媛(2010)等都证明了评论字数越多,评论有用性越高,若评论中夹杂一些个人体验感受或具体产品和服务属性,评论的可信度也越高(龚思兰,2013)。但由于人的工作记忆容量有限,当评论长度超过消费者处理信息的工作记忆上限时,会造成消费者认知超载而难以决策,此时评论长度与评论有用性是负相关(殷国鹏,2012)。 ④差异性。评论差异,即评论离散度。它表示消费者对产品或服务态度和观点上的分歧,通常采用评分的方差或标准差来度量。目前对于评论差异研究不多,主要是研究评论差异对销量的影响。Godes和Mayzlin(2004)在研究网络口碑对消费者电视剧评价产生作用时,用了熵这个变量来测量网络口碑离散度,值越高,表示对电视剧的评论在不同的新闻组之间的离散程度越高。龚诗阳(2013)得出评论差异对销量有显著的负向影响。 作者简介:李恒,大学本科, 研究方向:企业管理。企业技术开发 TECHNOLOGICAL DEVELOPMENT OF ENTERPRISE 第34卷第3期Vol.34No.3 2015年1月Jan.2015

b在线评论有用性研究综述

/ CHINA MANAGEMENT INFORMATIONIZATION 在线评论有用性研究综述 苗蕊 (东北财经大学管理科学与工程学院,辽宁大连116025) [摘 要]在线评论是网络口碑的一种重要形式,是消费者制定购买决策的重要依据。特别是在当今信息过载的环境下,如 何帮助消费者找到对他们决策有帮助的在线评论已经成为一个重要的研究问题。本文对现有的有关在线评论有用性的研究进行了综述,分析了存在的问题,并给出了未来的研究方向。 [关键词]网络口碑;在线评论;有用性;文献综述 doi:10.3969/j.issn.1673-0194.2014.18.077[中图分类号]G203[文献标识码]A [文章编号]1673-0194(2014)18-0126-03 [收稿日期]2014-04-11 [基金项目] 国家自然科学基金资助项目(71301021);东北财经大学青年科研人才培育项目(DUFE2014Q43)。 [作者简介] 苗蕊(1982-),女,吉林通化人,东北财经大学管理科学与工程学院讲师,博士,主要研究方向:管理信息系统,电子商务等。 1 引 言 近些年,由于电子商务与Web2.0的快速发展,互联网用户创作的网络口碑(online word-of-mouth ,包括社区、博客、微博和社交网站等形式)已经成为消费者在选择、购买商品或服务时的重要信息源(Duan ,et al.,2008)。在线评论(online review )是网络口碑的一种重要形式,一般指潜在或实际消费者在电子商务或第三方评论等网站上发表商品或服务的正面或负面观点(Chen &Xie ,2008)。在线评论是消费者网络购买决策的重要依据,根据国际著名市场研究公司Jupiter Research 的调查,超过75%的消 费者在线购买商品之前,会参考在线评论信息。特别是在当今信息过载的环境下,有价值的在线评论可以帮助消费者减少购买的不确定性,做出更好的购买决策,提高消费者对在线评论网站的感知有用性和粘性,因此,对在线评论有用性的研究有非常重要的理论与实践意义。 Mudambi 将在线评论有用性定义为在线评论在消费者决策过程的感知价值(Mudambi &Schuff ,2010),即消费者对其他互联 网用户提交的评论对自己购买决策是否有帮助的一种主观感知。目前已有许多文献对什么样的评论是有用评论做了研究,并给出了一些影响在线评论有用性的特征,本文将对这些研究进行梳理,分析其中存在的问题并给出未来的研究方向。 2在线评论有用性研究现状分析 本文对现有研究中所选择的影响评论有用性的特征进行了 分析,发现这些特征可以分为3类:评论特征、评论者特征和评论阅读者即消费者特征。 2.1评论特征 评论特征包括评论长度、评论星级、评论的语义特征、评论可读性、评论的写作风格和评论及时性等,其中,评论长度和评论星级是使用的最多的两个特征。 评论长度通常以评论包含的字数来度量,评论越长,评论中包含的有关商品或服务的信息越多,则阅读该评论时,越能降低消费者对于商品或服务的不确定性,因此评论越有用,而大多数的研究也证明了这一点(Mudambi &Schuff ,2010;郝媛媛等,2010;Ghose &Ipeirotis ,2011;Pan &Zhang ,2011;彭岚等,2011; Korfiatis ,et al.,2012;殷国鹏等,2012;王平&代宝,2012;严建 援等,2012;Siering &Muntermann ,2013;廖成林等,2013),且对搜索型商品而言,评论长度的作用更明显(Mudambi &Schuff , 2010;Pan &Zhang ,2011;王平&代宝,2012;Siering & Muntermann ,2013)。但Baek 等(2013)的研究表明虽然评论字数越多,评论有用性越高,但这一效应的边际值在下降。而Racherla 和Friske (2012)的研究则不支持评论长度与评论有用性间的正 相关关系,他将这一结果解释为当消费者面对大量在线评论带来的信息过载问题时,他们不愿意去阅读那些长评论,而更喜欢那些短小切题的评论。殷国鹏(2012)和Gan 等(2012)从认知负荷理论出发,提出当消费者阅读在线评论时,由于工作记忆的容量有限,尽管在一定范围内,丰富的评论信息会有助于消费者的决策,但是,一旦评论信息的处理需求达到工作记忆的上限,那么就会造成消费者的认知超载从而使得人们难以较好地进行决策,因而,当在线评论长度超过一定范围时,与消费者对其有用性评价之间是负相关关系。Schindler 和Bickart (2012)的实验研究也得出了相同的结论。 评论星级是评论者在提交评论时,以星级形式给予商品或服务的一个总体评价,它是评论极性的一种表现。一星(极低等级)反映对商品或服务极端负面的评价,五星(极高等级)反映极端正面的评价,三星则反映了中立的态度。目前的研究对于评论星级对评论有用性的影响方向的观点不一,但总体有3种观点。①确认倾向会使得消费者去寻找证据来确认其对商品或服务的初始态度,即买或者不买,所以极端评论比中性评论更有用(Forman , et al.,2008;Cao ,et al.,2011;Ghose &Ipeirotis ,2011)。因为很多 消费者是想要购买商品才去阅读评论的,对商品抱有一种正向的倾向,所以星级高的评论比星级低的评论更有用,特别是对体验商品而言(Pan &Zhang ,2011;Korfiatis ,et al.,2012)。②消费者存在一种负向倾向,特别是在面对大量的正面信息的情况下。而在线评论中正向评论的数量要大于中性和负向评论的数量,所以在这种情况下,星级低的评论更有用(Racherla &Friske ,2012;廖成林等,2013)。③中立评价和双边信息会提高信息来源的可信性。对于体验商品,由于个人经验和品味在评价中起到了很大的作用,极端评价的可信性会受到质疑,所以中性评论相对于极端评论更有用(Mudambi &Schuff ,2010;殷国鹏等,2012;Siering &Muntermann ,2013)。殷国鹏(2012)和Baek 等(2013)研究了单条评论的星级和产品平均星级间的差异与评论有用性间的关系,由于消费者从众心理的存在,所以这一差异越大,评论有用性越低。评论的语义特征包括评论中正/负向的情感,主/客观表述以及商品信息等,这些特征的提取需要借助人工标注、内容分析法和文本挖掘等方法。郝媛媛等(2010)利用文本分类的方法标注评论 中国管理信息化 C hina Management Informationization 2014年9月第17卷第18期 Sep.,2014Vol .17,No .18 126

Web文本情感分类研究综述

情报学报  ISSN1000-0135 第29卷第5期931-938,2010年10月 JOURNALOFTHECHINASOCIETYFORSCIENTIFIC ANDTECHNICALINFORMATIONISSN1000-0135Vol.29 No.5,931-938October 2010 收稿日期:2009年6月29日 作者简介:王洪伟,男,1973年生,博士,副教授桙博导,研究方向:本体建模和情感计算,E-mail:hwwang@tongji.edu.cn。刘勰,男,1985年生,硕士研究生,研究方向:数据挖掘与情感计算。尹裴,女,1986年生,硕士研究生,研究方向:商务智能。廖雅国,男,1954年生,博士,教授,研究方向:人工智能与电子商务。 1) 本文得到国家自然科学基金项目(70501024,70971099);教育部人文社会科学资助项目(05JC870013);上海市重点学科建设项目(B310);香港研究资助局项目(polyU5237桙08E)资助。 doi:10.3772桙j.issn.1000-0135.2010.05.023 Web文本情感分类研究综述 1) 王洪伟1  刘 勰1  尹 裴1  廖雅国 2 (1畅同济大学经济与管理学院,上海200092;2畅香港理工大学电子计算学系,香港) 摘要 对用户发表在Web上的评论进行分析, 能够识别出隐含在其中的情感信息,并发现用户情感的演变规律。为此,本文对Web文本情感分类的研究进行综述。将情感分类划分为三类任务:主客观分类、极性判别和强度判别,对各自的研究进展进行总结。其中将情感极性判别的方法分为基于情感词汇语义特性的识别和基于统计自然语言处理的识别方法。分析了情感分类中的语料库选择和研究难点。最后总结了情感分类的应用现状,并指出今后的研究方向。 关键词 Web文本 情感分类 综述 主观性文本 LiteratureReviewofSentimentClassificationonWebText WangHongwei1 ,LiuXie1 ,YinPei1 andLiuN.K.James 2 (1畅SchoolofEconomicsandManagement,TongjiUniversity,Shanghai200092;2畅DepartmentofComputing,HongKongPolytechnicUniversity,HongKong) Abstract Analyzingtheusers’reviewsontheWebcanhelpustoidentifyusers’implicitsentimentsandfindtheevolution lawsoftheiremotion.Tothisend,thispaperisasurveyaboutthesentimentclassificationontheWebtext.Wedividedtheprocessofclassificationintothreecategories:subjectiveandobjectiveclassification,polarityidentificationandintensity identificationandrespectivelysummarizetheresentresearchachievementsinthesefields.Wealsosortedthemethodsofpolarityidentificationintotwotypes:oneisbasedontheemotionalwordswithsemanticcharacteristics,whiletheotherstatisticmethodsof naturallanguageprocessing.Whatismore,thechoiceofcorpusandpotentialresearchproblemsarediscussed.Atlast,thispaper summarizedthestatusquoofapplicationandpointedoutthedirectionoffutureresearch. Keywords Webtexts,sentimentclassification,survey,subjectivetext 随着互联网的流行,Web文本成为我们获取信 息、发表观点和交流情感的重要来源。特别是随着Web2畅0技术的发展,网络社区、博客和论坛给网络用户提供了更宽广的平台来交流信息和表达意见。这些文章和言论往往包含有丰富的个人情感,比如 对某部大片的影评,对某款手机的用户体验等,其中 蕴含着巨大的商业价值。如何从这些Web文本中进行情感挖掘,获取情感倾向已经成为当今商务智能领域关注的热点。所谓情感分析(sentimentanalysis),就是确定说话人或作者对某个特定主题的 — 139—

文本情感分类研究综述

Web文本情感分类研究综述 王洪伟/刘勰/尹裴/廖雅国 2012-9-27 14:55:59 来源:《情报学报》(京)2010年5期【英文标题】Review of Sen time nt Classificati on on Web Text 【作者简介】王洪伟,男,1973年生,博士,副教授/博士生导师,研究方向:本体建模和情感计算,E-mail:hwwa ng@t on https://www.doczj.com/doc/ac11885899.html,.c n 。同济大学经济与管理学院,上海200092; 刘勰,男,1985年生,硕士研究生,研究方向:数据挖掘与情感计算。同济大学经济与管理学院,上海200092; 尹裴,女,1986年生,硕士研究生,研究方向:商务智能。同济大学经济与管理学院,上海200092; 廖雅国,男,1954年生,博士,教授,研究方向:人工智能与电子商务。香港理工大学电子计算学系,香港 【内容提要】对用户发表在Web上的评论进行分析,能够识别出隐含在其中的情感信息,并发现用户情感的演变规律。为此,本文对Web文本情感分类的研究进行综述。将情感分类划分为三类任务:主客观分类、极性判别和强度判别,对各自的研究进展进行总结。其中将情感极性判别的方法分为基于情感词汇语义特性的识别和基于统计自然语言处理的识别方法。分析了情感分类中的语料库选择和研究难点。最后总结了情感分类的应用现状,并指出今后的研究方向。 Analyzing the users' reviews on the Webcan help us to identify users' implicit

sen time nts and find the evoluti on laws of their emoti on. To this end, this paper is a survey about the sen time nt classificati on on the Web text. We divided the process of classificati on into three categories:subjective and objective classification,polarity iden tificati on and in ten sity ide ntificati on and respectively summarize the rese nt research achieveme nts in these fields. We also sorted the methods of polarity identification into two types: one is based on the emotional words with semantic characteristics, while the other statistic methods of natural Ianguage processing. What is more, the choice of corpus and pote ntial research problems are discussed. At last, this paper summarized the status quo of applicatio n and poin ted out the direct ion of future research. 【关键词】Web文本/情感分类/综述/主观性文本Web texts/Sentiment classificati on/Survey/Subjective text 随着互联网的流行,Web文本成为我们获取信息、发表观点和交流情感的重要来源。特别是随着Web2.0技术的发展,网络社区、博客和论坛给网络用户提供了更宽广的平台来交流信息和表达意见。这些文章和言论往往包含有丰富的个人情感,比如对某部大片的影评,对某款手机的用户体验等,其中蕴含着巨大的商业价值。如何从这些Web文本中进行情感挖掘,获取情感倾向已经成为当今商务智能领域关注的热点。所谓情感分析(sentiment analysis),就是确定说话人或作者对某个特定主题的态度。其中,态度可以是他们的判断或者评估,他们(演说、写作时)的情绪状态,或者有意(向受众)传递的情感信息。因此,情感分析的一个重要问题就是情感倾向性的判断,即判断作者的观点是褒义的、积极的,还是贬义的、消极的。这类问题也被称为情感分类(sentiment classification) 。

相关主题
文本预览
相关文档 最新文档