当前位置:文档之家› 基于在线评论情感分析的快递服务质量评价

基于在线评论情感分析的快递服务质量评价

基于在线评论情感分析的快递服务质量评价
基于在线评论情感分析的快递服务质量评价

第43卷第3期 2017年3月

北京工业大学学报

JOURNAL OF BEIJING UNIVERSITY OF TECHNOLOGY

Vol.43 No.3

Mar. 2017

基于在线评论情感分析的快递服务质量评价

王洪伟\宋媛\杜战其u,郑丽娟3,华瑾4,张艺伟1

(1.同济大学经济与管理学院,上海200092 ; 2.上海海洋大学工程学院,上海201306;

3.聊城大学商学院,山东聊城252000;

4.上海通用汽车销售有限公司,上海201206)

摘要:由于问卷调查分析法受访者少,问卷质量也低,为此,以海量的在线消费者评论为数据,采用情感分析技 术,提出一种快递服务质量评价方法.选取大众点评网上S F和ST两家快递企业的评论语料为例进行实验分析,首 先,应用服务质量测评模型SERVQUAL量表和物流服务质量评价的相关理论,结合文本分析方法,建立一套基于 在线评论情感分析的快递服务质量评价指标体系;其次,对评论语料进行抓取、分句、标识等预处理,比较不同特征 选择算法在不同分类算法下的查全率与查准率,最终以信息增益和支持向量机作为最佳组合,抽取614个特征项 用于有用性文本的识别;然后,基于HowNet的语义相似度极性计算方法和副词量级划分方法对在线评论进行情感 极性和强度分析;最后,应用TF-IDF法,结合评论文本确定评价指标的权重,对快递企业服务质量计算综合评价得 分.与大众点评网的星级评分进行对比,实验结果表明:该方法与现有方法相比,能够直观地比较S F和ST两家快 递企业在快递服务质量各项评价指标上的差异,并且两者的得分趋势相吻合.

关键词:在线评论;情感分析;快递服务;质量评价

中图分类号:U461; TP308 文献标志码:A 文章编号:0254 -0037(2017)03 -0402 -11

doi:10.11936/bjutxb2016010063

Evaluation of Service Quality for Express Industry Through

Sentiment Analysis of Online Reviews

WANG Hongwei1,SONG Y uan1,DU Zhanqi1,2,ZHENG Lijuan3,HUA Jin4,ZHANG Yiwei1

(1. School of Economics and Management,Tongji University,Shanghai 200092,China;

2. College of Engineering,Shanghai Ocean University,Shanghai 201306,China;

3. School of Business,University of Liaocheng,Liaocheng 252000,Shandong,China;

4. Saic General Motors Sales C o.,L td.,Shanghai 201206,China)

A b stra c t :The evaluation m ethod based on questionnaire survey has lim ited respondents with low quality,

therefore,an evaluation method of express service quality was put forward in this paper through sentim ent analysis of massive online reviews by selecting online reviews of express com panies SF and ST from dianping. com for experim ent analysis. F irst,the SERVQUAL model of service quality evaluation and the related theory of quality evaluation of logistics service was applied com bined with text analysis,to establish an index system of quality evaluation of express service through sentim ent analysis. Then online reviews such as capturing,phrasing and m arking were preprocessed,and the recall ratio and precision ratio under different feature selection algorithm and different classification algorithm were com pared. 614 features were extracted and the useful text were identified by choose IG and SVM as the best combination.

收稿日期:2016-01-27

基金项目:国家自然科学基金资助项目(71371144,71601082);上海市哲学社会科学规划课题资助项目(2013BGL004)

作者简介:王洪伟(1973—),男,教授,博士生导师,主要从事商务智能与情感计算方面的研究,E-mail:hwwang@tongji.

edu. cn

谈产品设计中的情感设计.

第 24卷第 12期 吉林工程技术师范学院学报 V ol 24N o 12 2008年 12月 Journal of Jili n T eachers Institute of Eng i neering and T echno logy D ec 2008 收稿日期 :2008-06-10 作者简介 :张雷 (1974- , 男 , 吉林通化人 , 吉林大学艺术学院在读硕士研究生 , 主要从事艺术设计研究。 谈产品设计中的情感设计 张雷 1 , 李伯峰 2 (1. 吉林大学艺术学院 , 吉林长春 130012; 2. 东辽县电视大学社会科学系 , 吉林东辽 136200 [摘要 ]本文着重阐述了情感因素在产品设计中的重要作用 , 并指出设计师在设计产品时不仅要表现 自身的情感 , 更重要的是应通过产品设计最大限度地满足受众心理和情感上的需求 , 实现人性化设计 , 最终在产品和人之间建立一种深刻的情感层次上的关系 , 实现人与物的高度统一。 [关键词 ]产品设计 ; 情感化设计 [中图分类号 ]J06 [文献标识码 ]A

[文章编号 ]1009-9042(2008 12-0017-02 On Em otional Factor of Product Design Z HANG Lei 1 , LI Bo-feng 2 (1. C olle ge of A r t , J ilin Un i ver sit y, Changchun J ilin 130012, Ch i na ; 2. D e p ar t m ent of Soci al Science , D ongliao TV UN iversity, D ong liao J ili n 136200, China Abstract :The artic le m a i n l y e m phasizes the i m portant ro le of e m o tional facto rs i n product de si g n . It is po i n ted out that designer shou l d not on l y express own e m otion , mo re i m portantly fur t h estm eet t h e audience de m ands o f psychology and e mo tion , realize hum an ized desi g n . Only i n th is w ay , can the deep e m otional relationsh i p bet w een product and hum an be established . Thus the high un ity bet w een hum an and ob ject can be rea lized . Key w ords :product desi g n ; e m oti o n desi g n 在现代社会 , 随着物质财富的日益丰富 , 人们更 加注重情感和精神需求。产品不再被看作是一种单纯的物质形态 , 而更应该是设计师与大众情感交流的媒介。现实生活中 , 我们经常可以看到有个性、有创意的甚至是一些看似怪诞的设计 , 这些都不足为奇 , 因为设计越来越追求一种无目的性的、不可预料的和无法准确测定的抒情价值。消费者根据个人感受和意向来选择商品 , 社会已进入文化和精神的消费时代。 一、产品设计中情感的含义

文本情感分析论文总结

文本情感分析 赵妍妍,秦兵,刘挺- 软件学报, 2010 - https://www.doczj.com/doc/af14549255.html, 按粒度,情感分析可分为词语级、短语级、句子级、篇章级、多篇章级;按文本类别,可分为基于新闻评论和基于产品的情感分析。 情感分析的研究任务:情感信息的抽取、分类以及检索与归纳。 一、情感信息抽取(评价词语、评价对象、观点持有者) 1.评价词语的抽取:基于语料库的抽取;基于词典的抽取;基于图的方法。 2.评价对象的抽取:基于规则/模板的方法(词序列、词性、句法规则、关联规则挖掘);评 价对象最为产品属性,考察评价对象与领域指示词的关联度来获取;多粒度的话题模型方法。 3.观点持有者抽取:命名实体识别技术(人名或机构名)、语义角色标注;分类任务,看做 序列标注问题,使用CRF融合特征抽取;名词短语作为候选,使用ME模型计算。 4.组合评价单元的抽取: 主观表达式:Wiebe的主观表达式库(抽取n元词语/词组作为候选,对比训练预料判断) 评价短语抽取(程度副词-评价词语):情感词典的方法;依存句法解构(ADV,ATT,DE)。 评价搭配抽取(评价词语-评价对象):基于模板的方法(8个共现模板、句法关系模板)。 二、情感信息分类 1.主客观信息分类:文本是否含情感知识方法;组合评价单元判断;情感模板识别;基于 分类器和分类特征的二元分类任务(词语特征,标点、人称代词、数字特征,基于图); 2.主观信息情感分类(句子级、篇章级):基于情感知识、基于特征分类的方法(n-gram词语 特征和词性特征、位置特征、评价词特征)。 三、情感信息的检索与归纳 1.情感信息检索 2.情感信息归纳 基于产品属性的情感文摘:识别评论信息中的产品属性,抽取描述产品属性的情感句,判断其倾向性。 基于情感标签的情感文摘:标签可定义为评价搭配形式,建立标签库,相似度聚类的方法聚类得到相似的情感标签,每一类视为潜在的话题(即产品属性)。 基于新闻评论的文摘 四、情感分析的评测与资源 1.情感分析的评测:TREC,NTCIR的MOAT(新闻观点检测,情感问答,跨语言情感分析), 国内的COAE。 2.情感分析的语料:康奈尔大学的影评数据集,UIC的Hu和Liu的产品领域的评论语料, Wiebe的MPQA新闻评论深度标注语料,MIT的多角度餐馆评论语料,中科院的中文酒店评论语料。 3.词典资源:GI(general inquirer)评价词词典,NTU评价词词典(繁体中文),主观词词典(英 文),HowNet评价词词典(简体中文、英文) 问题:情感信息抽取忽略词语所在语境的影响;评价对象的情感分类,而非句子级或篇章级;基于情感标签的情感文摘的深入研究;

基于主题的情感分析

实验报告 课程名称:数据挖掘课设 实验名称:基于主题的文本情感分析 实验地点:行远楼 专业班级:软件1533学号:2015005677 学生姓名:高聪江 指导教师:王莉 2017年1月1日

课题代码: import pandas as pd import jieba # from sklearn.feature_extraction.text import CountVectorizer # from sklearn.feature_extraction.text import TfidfTransformer from jieba import analyse # import jieba.posseg as pseg # from sklearn import feature_extraction df = pd.read_csv('/home/jiangshen/Downloads/' '数据挖掘_大数据/数据挖掘程序题/基于主题的文本情感分析/train.csv') #---------整理情感语料 zongGeShu = len(df.values) qingGanCi_Train = {} for i in range(0,zongGeShu): valueMin001 = str(df.values[i][4]) keyMin001 = str(df.values[i][3]) preValue = valueMin001.split(sep=';') preKey = keyMin001.split(sep=';') del preKey[-1] del preValue[-1] for k in range(0,len(preKey)):

产品设计中的情感设计

产品设计中的情感设计 产品设计在人与产品之间应注重人的情感化和个性化,设计师只有准确地把握“形”和“态”的关系,才能求得情感上的广泛认同。在欣赏一项设计时应该需要有情感,如果设计不能激发起人们的情感,它不能算是好的设计。一座城市、一座建筑物、一件家具、或一件日用产品,除去功能外,它还必须能够吸引、打动其使用者;要能触动使用者的心弦,使他们或爱或恨,激起购买者的热情。产品的形式与情感不是分离的,只有产品的外观和功能同它们唤起的感情结合在一起时,产品才具有审美价值。 情感作为心理学的名词是指人对周围和自身以及对自己行为的态度,它是人对客观事物的一种特殊反映形式,是主体对外界刺激给予肯定或否定的心理反应,也是对客观事物是否符合自己需求的态度和体验。 在一个具体产品中,情感是由设计师→产品→大众的一种高层次的信息传递过程。在设计中,只有具有情感才能激发他人的激情,以感性赋予产品,使其造型充满人文关怀,实现产品的情感价值。这产生于丰富的知识及力求实现某种强烈想法的创造性的基础上。如图1 两款可爱的开瓶器。将冰冷的工具变化成使人亲昵的人偶外型,使之不再只是因为使用而拥有,更多于喜欢而拥有,充满对这产品的感情的投入。 人们在谈及一款产品设计时,经常会用到“挺漂亮的”、“有创意”、“我好喜欢”等词汇,其实从审美心理学的角度来讲,这些词汇都是对于设计师、产品和受众之间的情感征兆的描述,产品的形态美不再仅仅是一种视觉感受,它体现在产品与用户的交互过程中。外观精美极具刺激性的产品销售量增长之快超乎我们的想象。设计不是为了设计者,也不是为了这个人的感情,而是为了实现设计的价值,为了满足使它们得以生产的客观需求的方式,为了这些需求所经受的形式发展以及设计所代表的思想。人接受设计可能有各种不同的方式,有的要使用,有的只是喜欢,但却都不愿被强加他们某些反应,也不愿重温或模仿他人的激情。 在产品设计中情感是一种高层次的信息传递过程。应用这些设计的人当然想要感受情感——他们自己的激情。设计师的情感表现在产品中是一种编码的过程;大众在面对一些产品时会产生一些心理上的感受,这是一种解码或者说审美心理感应的过程。设计仅仅戒除它自己的感情还远远不够,必须融合并激发使用者的情怀而自己保持一种中间色调。在充满灵感和激

情感分析简述

情感分析简述 分类:NLP2012-04-08 12:38 1022人阅读评论(3) 收藏举报情感classification算法测试translationmatrix 情感分析,我研究了也有半年有余了,ACL Anthology上关于情感分析的论文也基本看过了一遍,但是到目前还没有什么成就的。以下是我为一位同学毕业设计写的情感分析方面的综述,引用的论文基本上是ACL 和COLING还有EMNLP上历年关于情感分析的论文,本文应该学术性比较强一点,本文虽不打算发表,但由于将来可能还有用,以及关于学术上的原因,请大家如果要引用请务必标明出处 (https://www.doczj.com/doc/af14549255.html,/s/blog_48f3f8b10100irhl.html)。 概述 情感分析自从2002年由Bo Pang提出之后,获得了很大程度的研究的,特别是在在线评论的情感倾向性分析上获得了很大的发展,目前基于在线评论文本的情感倾向性分析的准确率最高能达到90%以上,但是由于深层情感分析必然涉及到语义的分析,以及文本中情感转移现象的经常出现,所以基于深层语义的情感分析以及篇章级的情感分析进展一直不是很大。情感分析还存在的一个问题是尚未存在一个标准的情感测试语料库,虽然Bo Pang实验用的电影评论数据集(https://www.doczj.com/doc/af14549255.html,/people/pabo/movie-review-data/)以及Theresa Wilson等建立的MPQA(https://www.doczj.com/doc/af14549255.html,/mpqa/)是目前广泛使用的两类情感分析数据集,但是并没有公认的标准加以确认。 目前情感分析的研究基本借鉴文本分类等机器学习的方法,还没有根据自身的特点形成一套独立的研究方法,当然在某种程度上也可以把情感分析看出一种特殊的文本分类。比较成熟的方法是基于监督学习的机器学习方法,半监督学习和无监督学习目前的研究不是很多,单纯的基于规则的情感分析这两年已很少研究了。既然目前很多情感分析的研究基于机器学习,那么特征选择就是一个很重要的问题,N元语法等句法特征是使用最多的一类特征,而语义特征(语义计算)和结构特征(树核函数)从文本分类的角度看效果远没有句法特征效果好,所以目前的研究不是很多的。 由于基于监督学习情感分析的研究已经很成熟了,而且在真实世界中由于测试集的数量要远远多于训练集的数量,并且测试集的领域也不像在监督学习中被限制为和训练集一致,也就是说目前情感分析所应用的归纳偏置假设在真实世界中显得太强的,为了和真实世界相一致,基于半监督学习或弱指导学习的情感分析和跨领域的情感分析势必是将来的研究趋势之一。 在情感分析的最初阶段基于语义和基于规则的情感分析曾获得了比较大的重视,但是由于本身实现的复杂性以及文本分类和机器学习方法在情感分析应用上获得的成功,目前关于这方面的研究以及很少了,但是事实上,语义的相关性和上下文的相关性正是情感分析和文本分类最大的不同之处,所以将基于语义和规则的情感分析与基于机器学习的情感分析相结合也将是未来的研究趋势之一。 以下将分别对情感分析的起源,目前基于监督学习,无监督学习,基于规则和跨领域的情感分析的一些研究工作进行简单的介绍。 起源 虽然之前也有一些相关工作,但目前公认的情感分析比较系统的研究工作开始于(Pang et al., 2002)基于监督学习(supervised learning)方法对电影评论文本进行情感倾向性分类和(Turney,2002)基于无监督学习(unsupervised learning)对文本情感情感倾向性分类的研究。(Pang et al., 2002)基于文本的N元语法(ngram)和词类(POS)等特征分别使用朴素贝叶斯(Naive Bayes),最大熵(Maximum Entropy)和支持向量机(Support Vector Machine,SVM)将文本情感倾向性分为正向和负向两类,将文本的情感进行二元划分的做法也一直沿用至今。同时他们在实验中使用电影评论数据集目前已成为广泛使用的情感分析的测试集。(Turney ,2002)基于点互信息(Pointwise Mutual Information,PMI)计算文本中抽取的关键词和种子词(excellent,poor)的相似度来对文本的情感倾向性进行判别(SO-PMI算法)。 在此之后的大部分都是基于(Pang et al., 2002)的研究。而相对来说,(Turney et al.,2002)提出的无监督学习的方法虽然在实现上更加简单,但是由于单词之间的情感相似度难以准确的计算和种子词的难以确定,继续在无监督学习方向的研究并不是很多的,但是利用SO-PMI算法计算文本情感倾向性的思想却被很多研究者所继承了。 监督学习 目前,基于监督学习的情感分析仍然是主流,除了(Li et al.,2009)基于非负矩阵三分解(Non-negative Matrix Tri-factorization),(Abbasi et al.,2008)基于遗传算法(Genetic Algorithm)的情感分析之外,使用的最多的监督学习算法是朴素贝叶斯,k最近邻(k-Nearest Neighbor,k-NN),最大熵和支持向量机的。而对于算法的改进主要在对文本的预处理阶段。 一个和文本分类不同地方就是情感分析有时需要提取文本的真正表达情感的句子。(Pang et al., 2004)基于文本中的主观句的选择和(Wilson el al.,2009)基于文本中的中性实例(neutral instances)的分析,都是为了能够尽量获得文本中真正表达情感的句子。(Abbasi et al.,2008)提出通过信息增益(Information Gain,IG)的方法来选择大量特征集中对于情感分析有益的特征。 而对于特征选择,除了N元语法和词类特征之外,(Wilson el al.,2009)提出混合单词特征,否定词特征,情感修饰特征,情感转移特征等各类句法特征的情感分析,(Abbasi et al.,2008)提出混合句子的句法(N元语法,词类,标点)和结构特征(单词的长度,词类中单词的个数,文本的结构特征等)的情感分析。 除了对于文本的预处理,对于监督学习中情感分析还进行了以下方面的研究的。(Melville et al., 2009)和(Li et al.,2009)提出结合情感词的先验的基于词典的情感倾向性和训练文本中后验的基于上下文的情感情感倾向性共同判断文本的情感倾向性。(Taboada et al.,2009)提出结合文本的题材(描述,评论,背景,解释等)和文本本身的特征共同判断文本的情感倾向性。(Tsutsumi et al.,2007)提出利用多分类器融合技术来对文本情感分类。(Wan, 2008)和(Wan, 2009)提出结合英文中丰富的情感分析资源来提高中文情感分析的效果。 基于规则/无监督学习

基于商品评论文本的情感分析研究

龙源期刊网 https://www.doczj.com/doc/af14549255.html, 基于商品评论文本的情感分析研究 作者:陶莉娜李超萍李健高荣 来源:《现代信息科技》2018年第04期 摘要:随着互联网络科技的迅速发展,越来越多的用户开始网上购物,网络中的商品评 论数据也随之增加。如何在大量的评论数据中提取有用的信息,使数据价值最大化是值得重视的问题。本文针对京东网站商品的评论数据进行了情感分析,从中提取有用的信息,帮助商家了解消费者的需求,发现商品的不足之处,并制定改进方案,以提高商品的竞争力。 关键词:数据挖掘;商品评论;情感分析 中图分类号:TP391.1 文献标识码:A 文章编号:2096-4706(2018)04-0019-03 Abstract:With the rapid development of internet technology,more and more users have begun to shop online,and the product review data on the internet has also increased. However,how to extract useful information from a large amount of review data and maximize the value of data is a problem worthy of attention. This article analyzes the sentiment data of https://www.doczj.com/doc/af14549255.html, website products,provides useful information to help businesses understand the needs of consumers,discovers the inadequacies of products,and formulates improvement programs to improve the competitiveness of products. Keywords:data mining;commodity reviews;sentiment analysis 1 主要技术实现 1.1 网络爬虫 网络的迅速发展使互联网成为大量信息的载体,有效地提取并利用这些信息对我们来说是一个很大的挑战。为了快速的提取有用信息,我们采取网络爬虫技术,它的好处是获取成本小,可以将网页上的内容按照一定的格式规范进行有针对性地获取。 1.2 基于文本情感分析 文本的情感分析是指利用计算机语言、自然语言处理和文本挖掘来辨别文本主观情感信息的一种手段。一般来说,情感分析是对说话者当时的言语评论或建议的一个情感状况辨析。其研究内容包括非结构化文本的分词、情感倾向性分类和情感强度等,它涉及到自然语言处理、文本分词、机器学习等多个研究领域。本文的研究重点是对商品评论文本所表达的正向或负向情感进行分类[1]。

文本情感分析研究现状

文本情感分析研究现状 机器之心专栏 作者:李明磊 作为NLP领域重要的研究方向之一,情感分析在实际业务场景中 存在巨大的应用价值。在此文中,华为云NLP算法专家李明磊为 我们介绍了情感分析的概念以及华为云在情感分析方面的实践和 进展。 基本概念 为什么:随着移动互联网的普及,网民已经习惯于在网络上表达意见和建议,比 如电商网站上对商品的评价、社交媒体中对品牌、产品、政策的评价等等。这些评价中都蕴含着巨大的商业价值。比如某品牌公司可以分析社交媒体上广大民众对该品牌的评价,如果负面评价忽然增多,就可以快速采取相应的行动。而这种正负面评价的分析就是情感分析的主要应用场景。 是什么:文本情感分析旨在分析出文本中针对某个对象的评价的正负面,比如「华为手机非常好」就是一个正面评价。情感分析主要有五个要素,(entity/实体, aspect/属性,opinio n/观点,holder/观点持有者,time/时间),其中实体和属性合并称为评价对象(target)。情感分析的目标就是从非结构化的文本评论中抽取出这五个要素

、 (entity 体, 输入文木 holder/?点持有者,time/ 时 |i 图i情感分析五要素 举例如下图: 我觉得华为手机非常牛逼。(华为手机* 图2情感分析五要素例子 上例中左侧为非结构化的评论文本,右侧为情感分析模型分析出的五个要素中的四个(不包括时间)。其中实体「华为手机」和属性「拍照」合并起来可以作为评价对象。评价对象又可细分为评价对象词抽取和评价对象类别识别。如实体可 以是实体词和实体类别,实体词可以是「餐馆」、「饭店」、「路边摊」,而实 体类别是「饭店」;属性可以是属性词和属性类别,如属性词可以是「水煮牛肉」、 「三文鱼」等,都对应了属性类别「食物」。实体类别和属性类别相当于是对实体词和属性词的一层抽象和归类,是一对多的关系。词和类别分别对应了不同的

产品设计中的情感化因素.

产品设计中的情感化因素 阚志刚 (长春理工大学文学院 , 吉林长春 ,130022 摘要 :通过对产品设计中功能与形式关系、产品形式的审美因素、情绪与情感的分析 , 论述情感化因素在产品设 计中产生的影响 , 阐释在产品设计中如何应用情感化因素及其重要意义。 关键词 :产品设计 ; 情感化 ; 审美因素中图分类号 :F27312文献标识码 :A Emotional F actors in (The Liberal Arts School of and T echnology , Changchun Jilin , 130022 Abstract :analyzing the relationship of function and forms , aesthetic factors of product form , em otion and affection , the article discusses that em otion factors have an effect on product design and expounds how to use the em otion factors and the im portance of e 2m otion factors in product design. K ey w ords :product design , em otion , aesthetic factors 产品设计是为人的使用而进行的设计 , 其组成部分包括可用性、美观性和实用性。在创造一个产品时 , 设计者需要考虑多种因素 , 如材料的选择、加工方法、产品的营销方式、制作的成本和实用性 , 以及理解和使用产品的难易程度等。但是 , 多数人没有认识到 , 在产品的设计和使用中还有很浓重的情感成分。有时 , 设计里含有的情感成分可能比实用成分对产品的成功更重要。在产品商业竞争日趋激烈的今天 , 市场上不同品牌的大多数同类产品在功能、质量、价格等方面都十分相似 , 因此 , 现今的商家通常将产品卖点聚焦在消费者购买和拥有该产品的“ 情感利益” 上。

基于深度学习的中文短文本情感分析

基于深度学习的中文短文本情感分析 随着互联网不断发展,网络评论平台不断增加,用户评论数量也 爆发式增长。利用情感分析技术能够有效的挖掘文本包含的情感信息,目前已成为社会舆情监督和厂家获取反馈信息的重要途径,具有很高的研究价值。本文的研究目的是探究中文短文本中所包含的情感信息,主要解决文本情感极性褒贬义分类问题。传统的情感分析方法主要有两种:基于情感词典的方法和基于机器学习的方法。但由于文本语料简短,含有大量未登录词使得上述方法存在数据稀疏问题,且过分依 赖领域专家的标注。近年来出现的深度学习技术能够很好的解决上述问题。因此,本文采用深度学习的方法对中文短文本进行情感分析。主要研究内容如下:首先,在文本数据预处理过程,针对目前网络上存在的大量未登录词,设计了一种新词发现方法,主要是利用词语的内 部凝固度、边界自由度及语言规则对候选新词进行过滤。将识别的新词加入词库,提高分词的准确率。其次,传统的词向量仅考虑了文本中的语义语法信息,会将语义相近,情感极性却相反的词语映射到相邻 的位置,导致最终分类结果错误。为了解决此问题,本文在传统词向量的基础上融合了情感信息,提出一种情感词向量的生成方法。最后, 针对循环神经网络在处理时序信息发生的梯度消失问题,本文提出基于GRU(Gated Recurrent Unit)的情感分析模型,将循环神经网络的隐层节点替换为GRU单元,用于情感分析。本文利用Python中的Keras 深度学习库构建提出的GRU情感分析模型,通过实验,找到模型最佳 参数,并在最佳参数下进行情感分析,其分类的准确率达到92.01%。

将其与机器学习模型SVM及深度学习模型LSTM,CNN进行对比实验,结果表明,在所有指标下,本文提出的以情感词向量作为输入的情感分析模型明显优于其他模型。

产品设计的情感因素

产品设计的情感因素 周海海 摘要:现代社会,物质生产日益丰富。从某种程度上说,人们对于情感的需求甚至超过了对物质的需求。对于产品设计而言,在产品与人之间建立某种情感联系是人性化设计的最终目标。同时,产品设计并不是完全意义上的艺术创作,因为设计师不仅要在设计中表现自身的情感,更重要的是,设计师应通过产品设计最大限度的满足受众心理和情感上的需求。 主题词:产品设计;情感;人性化设计 ABSTRACT Modern society, the material production is abundant day by day. To some degree, the demands for the emotion of people have even exceeded the demand for the material. As to product design, it is a final goal designed in humanization to set up a certain emotion and get in touch between products and people. Another, product design is not an artistic creation in the complete meaning. Because designers should not merely display one's own emotion in the design, the more important thing is, the designer should maximum meet psychology and demand of emotion of masses through product design. KEYWORDS product design emotion humanization design 人们在谈及到一款产品设计时,经常会用到“挺漂亮的”,“有创意”,“有点意思”等等词汇,其实从审美心理学的角度来讲,这些词汇都是对于设计师、产品和受众之间的情感征兆的描述。 一,情感在产品设计中的含义 情感作为心理学的一名词是指人对周围和自身以及对自己行为的态度,它是人对客观事物的一种特殊反映形式,是主体对外界刺激给予肯定或否定的心理反应,也是对客观事物是否符合自己需求的态度和体验。在产品设计中情感是设计师→产品→大众的一种高层次的信息传递过程。在这一过程中,产品扮演了信息载体的角色,它将设计师和大众紧密的联系在一起。如(图1)所示。设计师的情感表现在产品中是一种编码的过程;大众在面对一产品时会产生一些心理上的感受,这是一种解码或者说审美心理感应的过程。最后,设计师从受众的心理感受中获得一定的线索和启发,并在设计中最大限度的满足受众的心理需求。 图1

中文微博情感分析评测结果(2012)

2012年CCF自然语言处理与中文计算会议 中文微博情感分析评测结果 1.提交结果编号 本次评测共有34支队伍提交53组有效结果,提交结果编号及所属参评单位对应情况如表1所示。 表1 提交结果编号与参评单位对照表 提交结果编号参评单位 1 北京工商大学 2 北京工商大学 3 北京航空航天大学计算机学院 4 北京航空航天大学计算机学院 5 北京理工大学海量语言信息处理与云计算应用工程技术研究中心1 6 北京理工大学网络搜索挖掘与安全实验室 7 北京理工大学海量语言信息处理与云计算应用工程技术研究中心2 8 北京理工大学海量语言信息处理与云计算应用工程技术研究中心2 9 大连理工大学 10 大连理工大学 11 广东工业大学DMIR实验室 12 哈尔滨工业大学语言技术研究中心网络智能研究室 13 哈尔滨工业大学语言技术研究中心网络智能研究室 14 哈尔滨工业大学计算机科学与技术学院/机器智能与翻译研究室 15 哈尔滨工业大学计算机科学与技术学院/机器智能与翻译研究室 16 哈尔滨工业大学(威海) 17 海军工程大学信息安全系 18 黑龙江大学计算机科学技术学院 19 湖南工业大学计算机与通信学院 20 湖南工业大学计算机与通信学院 21 湖南科技大学外国语学院 22 华侨大学计算机科学与技术学院 23 华侨大学计算机科学与技术学院 24 华中科技大学 25 南京大学计算机科学与技术系自然语言处理研究组 26 南京理工大学 27 南京理工大学 28 清华大学计算机系智能技术与系统国家重点实验室信息检索组 29 清华大学计算机系智能技术与系统国家重点实验室信息检索组 1参评队伍联系人为刘全超 2参评队伍联系人为王金刚

024047中文文本情感倾向性分析

中文文本情感倾向性分析1 黄萱菁 赵 军 复旦大学 关键词:情感倾向 语料库 引言 大约在两年半前,《新华网》、《环球时报》等大众媒体纷纷转载了英国《新科学家》杂志的一则报道,英国Corpora软件公司开发了一套名为“感情色彩(Sentiment)”的软件2,它能判断报纸刊登的文章对一个政党的政策是持肯定态度还是否定态度,或者网上的评论文章是称赞还是贬低一种产品,并以此帮助政府和一些大公司全面了解公众对他们的看法。这则报道之所以引起了舆论的广泛关注,是因为它介绍了一个非常新颖而又很有价值的研究方向—文本情感倾向性分析。 所谓文本情感倾向性分析,就是对说话人的态度(或称观点、情感)进行分析,即对文本中的主观性信息进行分析。由于立场、出发点、个人状况和偏好的不同,民众对生活中各种对象和事件所表达出的信念、态度、意见和情绪的倾向性必然存在很大的差异。在论坛、博客(blog)等反应草根观点的网络媒体上,这种差异表现得尤为明显。 长期以来,要了解关于某个问题的报道是正面的还是反面的,是消极的还是中立的,往往需要求助于调查公司。这些公司的员工仔细阅读有关某个机构、个人、事件或问题的所 1 本项研究受国家自然科学基金课题资助(60673038,60673042)。 2 https://www.doczj.com/doc/af14549255.html,/products/sentiment.aspx 图1 英国Corpora软件公司的“感情色彩(Sentiment)”的软件

专题报道 有文字,然后就这些评论的态度做出反馈。这不仅耗费了大量人力和财力,而且过程相当缓慢。由此可见,文本情感倾向性的自动分析具有很好的商业应用前景。 文本情感倾向性分析属于计算语言学的范畴。以前,在计算语言学以及相关领域,研究人员普遍关注的是客观性信息的分析和提取,对主观性信息分析与提取的研究尚处于起步阶段,其中存在的很多问题都需要进行全面探索。这项研究涉及到计算语言学、人工智能、机器学习、信息检索和数据挖掘等多方面研究内容,因此文本情感倾向性分析也具有重要的学术研究价值。 总体来看,文本情感倾向性分析的研究大致可以分成词语情感倾向性分析、句子情感倾向性分析、篇章情感倾向性研究以及海量信息的整体倾向性预测等四个研究层次。接下来将首先介绍在各个层次所取得的研究进展,其次介绍情感倾向性分析标准语料库的建设和系统评测,最后是本文的结论。 词语情感倾向性分析 对词语的情感倾向进行研究是文本情感倾向分析的前提。具有情感倾向的词语以名词、动词、形容词和副词为主,包括人名、机构名、产品名、事件名等命名实体。其中,除部分词语的褒贬性(或称为极性,通常分为褒义、贬义和中性三种)可以通过查词典3的方式得到之外,其余词语的极性都无法直接获得。此外,词语的情感倾向还包括倾向性的强烈程度。例如,“谴责”的强度就远远超过了“批评”和“指责”,而这种强度很难由词典编撰者用人工的方式进行量化。另外,词语的极性往往取决于特定的上下文环境,例如,“骄傲”在表示“自豪”概念时,是褒义词;而在表示“自满”概念时,则是贬义词。 词语情感倾向分析包括对词语极性、强度和上下文模式的分析。其分析结果甚至可以写入到语义词典中,如北京大学计算语言学研究所以基于人民日报基本标注语料库的真实文本为实例,进行统计归纳得到词语的情感倾向,而后在现代汉语语法信息词典中实现形式化[1]。词语情感倾向分析目前主要有以下三种方法:1.由已有的电子词典或词语知识库扩展生成情感倾向词典。英文词语情感倾向信息的获取主要是在WordNet4和General Inquirer5的基础上进行的文献[3-4] ;而中文词语情感倾向信息的获取依据主要有HowNet[5]。这种方法的主要思想是,给定一组已知极性的词语集合作为种子,对于一个情感倾向未知的新词,在电子词典中找到与该词语义相近并且在种子集合中出现的若干个词,根据这几个种子词的极性,对未知词的情感倾向进行推断。这种方法对种子词数量的依赖比较明显。 2.无监督机器学习的方法。这种方法与第1种方法类似,也是假设已经有一些已知极性的词语作为种子词,对于一个新词,根据它和种子词的紧密程度对其情感倾向性进行推断。不同的是,第1种方法的词语紧密程度的度量是以词典信息为依据判断,而这种方法是根据词语在语料库中的同现情况判断其联系紧密程度。根据文献[6-7]的经典方法,假设以“真”、“善”、“美”作为褒义种子词,“假”、“恶”、“丑”作为贬义种子词,则任意其它词语的语义倾向定义为,将与各褒义种子词的点态互信息量(Point of Contact Information,PMI)之和,减去与各贬义种子词的点态互信息量之和后所得的结果。语义倾向的正负号就可以表示词语的极性,而绝对值 3 例如,General Inquirer [Stone,1966],知网:heep://https://www.doczj.com/doc/af14549255.html, 4 WordNet 5 通用查询者,最早为KWIC编写的程序之一,该程序根据基于理论编写的词典给单词分类。

商品评论情感分析系统的设计与实现

商品评论情感分析系统的设计与实现 近几年随着电子商务的不断发展成熟,网上购物越来越普及。消 费者在浏览电子商务网站的同时,也可以将对各种商品的评论发表到 网站上。如何充分挖掘、高效利用这些商品评论信息显得格外重要, 情感分析技术由此产生。目前主流的情感分析研究方法有基于情感知识的方法和基于机器学习的方法。基于情感知识的情感分析方法关键是针对词语的情感倾向进行研究,具有一定的局限性。基于机器学习 的情感分析方法目前主要利用传统的机器学习方法。随着深度学习的兴起,越来越多的学者将Deep Learning运用到情感分析领域。因此,本文探究运用深度学习方法进行情感分析研究,提高评论文本情感分 类的准确率。本文目标是构建一个高效准确的商品评论情感分析系统。实验所用的商品评论数据集,一部分利用Scrapy框架从京东网站上 爬取,一部分来自网上公开的数据集。对中文数据进行分词、词性筛选、去停用词,通过合理改进Word2Vec模型实现将预处理过的评论文本转换成词向量矩阵,输入到后续的情感分析分类器中。本文重点是 情感分析分类器的设计。卷积神经网络TextCNN能够降低数据规模和复杂程度,深层次捕捉文本数据的n元语法特征。门控循环单元GRU 模型简单、训练时间短,能够有效解决长短时间序列的变化问题,获得全局文本特征。本文提出新模型TextCNN-GRU作为系统的分类器。该模型先进入嵌入层完成词向量化训练,接着CNN部分提取文本局部最 优特征,GRU部分获得全局的句子表达,最后输出情感分类。为了提升模型的效果,本文在参数选择上设置很多对比实验,有词向量维度、

GRU层层数、滑动窗口大小等。通过TextCNN-GRU混合模型与单一模型TextCNN、GRU以及传统机器学习模型SVM、Naive Bayes、KNN比较,表明TextCNN-GRU在情感分析上比其他5种模型有更高的准确率,很好说明TextCNN-GRU能够综合TextCNN和GRU各自优势,取得更好的分类效果。

基于在线评论情感分析的快递服务质量评价

第43卷第3期 2017年3月 北京工业大学学报 JOURNAL OF BEIJING UNIVERSITY OF TECHNOLOGY Vol.43 No.3 Mar. 2017 基于在线评论情感分析的快递服务质量评价 王洪伟\宋媛\杜战其u,郑丽娟3,华瑾4,张艺伟1 (1.同济大学经济与管理学院,上海200092 ; 2.上海海洋大学工程学院,上海201306; 3.聊城大学商学院,山东聊城252000; 4.上海通用汽车销售有限公司,上海201206) 摘要:由于问卷调查分析法受访者少,问卷质量也低,为此,以海量的在线消费者评论为数据,采用情感分析技 术,提出一种快递服务质量评价方法.选取大众点评网上S F和ST两家快递企业的评论语料为例进行实验分析,首 先,应用服务质量测评模型SERVQUAL量表和物流服务质量评价的相关理论,结合文本分析方法,建立一套基于 在线评论情感分析的快递服务质量评价指标体系;其次,对评论语料进行抓取、分句、标识等预处理,比较不同特征 选择算法在不同分类算法下的查全率与查准率,最终以信息增益和支持向量机作为最佳组合,抽取614个特征项 用于有用性文本的识别;然后,基于HowNet的语义相似度极性计算方法和副词量级划分方法对在线评论进行情感 极性和强度分析;最后,应用TF-IDF法,结合评论文本确定评价指标的权重,对快递企业服务质量计算综合评价得 分.与大众点评网的星级评分进行对比,实验结果表明:该方法与现有方法相比,能够直观地比较S F和ST两家快 递企业在快递服务质量各项评价指标上的差异,并且两者的得分趋势相吻合. 关键词:在线评论;情感分析;快递服务;质量评价 中图分类号:U461; TP308 文献标志码:A 文章编号:0254 -0037(2017)03 -0402 -11 doi:10.11936/bjutxb2016010063 Evaluation of Service Quality for Express Industry Through Sentiment Analysis of Online Reviews WANG Hongwei1,SONG Y uan1,DU Zhanqi1,2,ZHENG Lijuan3,HUA Jin4,ZHANG Yiwei1 (1. School of Economics and Management,Tongji University,Shanghai 200092,China; 2. College of Engineering,Shanghai Ocean University,Shanghai 201306,China; 3. School of Business,University of Liaocheng,Liaocheng 252000,Shandong,China; 4. Saic General Motors Sales C o.,L td.,Shanghai 201206,China) A b stra c t :The evaluation m ethod based on questionnaire survey has lim ited respondents with low quality, therefore,an evaluation method of express service quality was put forward in this paper through sentim ent analysis of massive online reviews by selecting online reviews of express com panies SF and ST from dianping. com for experim ent analysis. F irst,the SERVQUAL model of service quality evaluation and the related theory of quality evaluation of logistics service was applied com bined with text analysis,to establish an index system of quality evaluation of express service through sentim ent analysis. Then online reviews such as capturing,phrasing and m arking were preprocessed,and the recall ratio and precision ratio under different feature selection algorithm and different classification algorithm were com pared. 614 features were extracted and the useful text were identified by choose IG and SVM as the best combination. 收稿日期:2016-01-27 基金项目:国家自然科学基金资助项目(71371144,71601082);上海市哲学社会科学规划课题资助项目(2013BGL004) 作者简介:王洪伟(1973—),男,教授,博士生导师,主要从事商务智能与情感计算方面的研究,E-mail:hwwang@tongji. edu. cn

相关主题
文本预览
相关文档 最新文档