当前位置:文档之家› 基于集成学习的中文微博情感分类方法

基于集成学习的中文微博情感分类方法

基于集成学习的中文微博情感分类方法
基于集成学习的中文微博情感分类方法

基于集成学习的中文微博情感分类方法

摘要针对微博的情感分类方法多种多样,但是他们的效果各有千秋。因而选取了两种比较典型方法:一、基于支持向量机(SVM)的方法,二、基于条件随机场模型(CRFs)的方法。方法一是选取合适的特征值,并将之向量化,再使用SVM进行分类;方法二首先进行序列标注,然后使用合适的特征模板来进行特征特取,最后导入CRFs模型进行分类。在此基础上,以这两种分类器为核心,提出了一种加权平均的集成分类方法。最终实验结果表明:集成分类器的效果优于单一分类器的效果。

关键词情感分类;支持向量机;条件随机场;集成分类

随着互联网以及智能手机的普及微博语料的规模也呈几何方式增长。对微博语料进行研究,这之中拥有巨大的商业价值;所以如何有效地使用和分析这些语料信息成为当前的迫切需求,这促进了文本情感分析技术的发展[1][2]。

国内外关于情感分类的研究方法,主要有两种:基于语义的方法以及机器学习的方法。基于语义的方法通常通过构造正负情感词典以及结合语义结构的方法对文本中的情感进行分类;机器学习的方法,主要是通过选取文本的分类特征,比如DF,信息熵等,训练出不同分类器。基本上可以分为有监督和无监督两类。常用的算法包括朴素贝叶斯、支持向量机等[3]。

本文提出了一种基于加权平均的集成分类方法:在此种方法中,我们首先对中文微博进行预处理,再通过两种典型的机器学习方法(SVM,CRFs)对微博进行情感分类,最后在这两种方法上进行集成学习。

1 相关算法简绍

1.1 支持向量机

支持向量机是Cortes&Vapnik 1995年首先提出的,根据Vapnik&Chervonenkis 的统计学习理论[4],如果数据服从某个固定的分布,要使机器的实际输出和理想输出之间的偏差最小,简单的来说就是使得错误概率的上限最小[5]。

SVM模型将数据表示为向量x(i),即空间中的点,在这个空间中建立一个可以将不同类别的向量分开的超平面,法向量表示为w,并且使得两类之间的间隔最大。其目标函数如公式(1)所示:

3)训练模型。

4)将训练好的模型用于新测试数据。

2.2.2 CRFs的实验方法

微博运营六大策略

微博运营六大策略 一、互动策略 1、评论策略 常规评论、可简单回复或者不回复 无效评论、例如纯广告、“转发微博”等 观点类评论,此类评论同策是对文案内容的补充及意见,很有意义 负面性评论,即反对性观点或攻击性言语 2、转发策略 常规转发 观点转发 咨询类转发 负面性转发 3、私信策略(私信策略六原则) 及时原则:第一时间回复,快速反应是王道 分类原则:对目标微博进行分类整理 对等原则:私信对方地位对等 互动原则:建立多层次的沟通互动机制,包括@、私信、转发、评论以及QQ、短信、电话综合应用 闭环原则:每个客户的情况都要闭环 持续原则:生意不在仁义在,不成交的客户也持续沟通 4、监控策略 对企业相关关键词进行定点搜索监控 5、关键词搜索策略 对企业相关关键词进行搜索,摘取好的内容和对象进行互动 二、组织策略 1、组织人员管理 人员配置 职能职责 人员培训 人员考核 人员激励 2、企业微博运营管理工具 批量关注工具 粉丝管理工具 定时工具 3、微博运营知识库管理 业内意见领袖 行业知识动态 行业信息来源 三、危机应对策略 1、概念 危机的定义 危机的分类 危机的发展过程

危机的类型 微博危机管理原则:时间原则 责任原则 态度原则 机会原则 2、微博危机预防机制 主动发现:关键词监控 搜索机制:通过相关标签 3、微博危机处理流程 统一指挥,主要负责人知悉; 注意倾听,及早响应(感谢关注、友好赞赏、诚意邀请参观公司、请对方给出意见与建议等); 第一时间刷微博进行@覆盖; 不在事发评论席进行评论,尽可能降低舆情的热度; 事后恢复,弥补事件造成的损失; 建立危机应对预案,确保紧急时刻能做到“兵来将挡水来土掩“; 完善网络微博发言人机制,统一指挥、统一口径; 加强与网友日常沟通,培养忠实粉丝和客户,防患于未然; 注重企业领导人及员工在微博的一言一行; 4、微博危机公关总结 四、定位策略 首先要明确的第一点就是开设微博的目的,界定微博的定位是做销售产品,还是品牌宣传,还是为了扩大个人影响力,然后才能在此基础上发布相关内容,吸引目标粉丝群,才能针对其销售产品,做到最大化利益。 五、装修策略 1、微博模板 微博模板的设置一定要遵循两个原则:美观性原则和一致性原则。 2、微博头像 企业微博头像可使用公司logo,子账户可根据自身属性设置,但切忌频繁变动。 3、微博昵称 微博昵称不宜过长,应尽量与定位一致,尽量避免出现生僻字和中英文混搭现象。 4、个性域名 个性域名一经确定将无法修改,所以应谨慎选取,同时最好是与企业保持一致性。 5、认证信息 对微薄进行认证可以提高真实性,增加权威性,提高曝光率。 6、企业介绍或个人介绍 企业介绍可以让浏览者对企业或个人有一个最直观的认识。 7、公告栏 8、建议企业微博可利用公告栏放置告示性文字,如通知、活动信息等。 9、友情链接 微博是增加企业网站链接曝光率的一种有效途径,企业可通过微博对网站进行宣传和推广。 10、展示视频 展示视频可放置宣传企业文化、品牌等信息的视频。 11、首页图片

微博营销案例分析

近些年来,新兴媒体不断涌现,凭借其各自新颖独特的传播方式得到了众多的支持者,越来越受到大家的重视。而微博以其强大的时效性、原创性、便捷性、创新交互性,吸引了广大的互联网用户,在众多互联网社交平台中异军突起,成为了新兴媒体中的佼佼者,并将将其作用发挥的淋漓尽致。基于微博广大的用户群和其信息交互快速的特点,一大批企业进驻微博,利用微博成为其品牌推广的营销平台。微博营销凭借低门槛、传播快、见效快、多平台的特点,成为了一种重要的互联网的营销模式。其中就不乏许多成功的微博营销案例: 一、原生品牌——西少爷肉夹馍 西少爷肉夹馍是由数十名热爱西安美食的互联网、金融等领域从业者发起,以“古法烤制”的关中肉夹馍为核心产品,主推西安美食,旨在让更多的人品尝到正宗的西安味道。 西少爷肉夹馍一经推出就受到了广大食客的欢迎。其第一家位于北京五道口的门店在开业当天就销售了1200个肉夹馍,100天卖出20万个肉夹馍,百度指数显示“西少爷”肉夹馍一周时间关注度曾直线飙升1000%。而西少爷肉夹馍之所以受到如此的追捧,微博营销功不可没。 ●利用微博的信息传播功能打造知名度 品牌知名度是关键的品牌资产。在竞争激烈的细分市场中,提升品牌知名度并使其产生实际的销售收益对企业至关重要。俗话说:万事开头难。打造品牌也是一样,最难的是如何打开知名度。对于一个新品牌创建,“西少爷”肉夹馍的方法值得借鉴:从微博微信疯传的创业故事《我为什么要辞职去卖肉夹馍》开始。 《我为什么要辞职去卖肉夹馍》是把四位创业者的经历和感受糅合在一起写出的创业故事。四位创业者是百度、腾讯等公司的员工,看似风光无限的大公司员工,其实都承受

情绪状态的分类

情绪状态的分类 随着教师资格证考试的临近,备考的压力越来越大,时间紧、任务重,很多学员抱怨复习难度比较大,甚至于不少学员抱着放弃的念头,为了学员能够更加有效的复习,在这里把教育心理学情绪状态分类相关的知识点进行梳理,方便大家复习。 情绪这部分知识属于教资比较常考的知识点,甚至在教师招聘的考试中也是常考知识点,虽然常考,不过在教师资格考试中常常以单选题的形式出现,考题比较简单,在复习的时候找到做题的关键点即可。 首先,根据情况状态分类分为三类心境、激情、应激。 心境:就是我们的心情,和我们平时所了解的心情是一个意思,指的是个体一种微弱、平静、持续时间较长且带有感染作用的情绪状态。从定义中我们找到了两个特征:长期性和弥散性 什么是长期性呢?长期性就是说持续时间比较长,可能持续几个小时,几周或者更长的时间,比如说你期末考试考的比较好,可能一整个暑假你都会很开心,这就是长期性的体现。第二个就是弥散性,什么是弥散性?弥散性就是扩散的意思,比如你的心情会影响到别的事物,比如杜甫的一句诗,也是我们考试中最常出现的一个题,“感时花溅泪,恨别鸟惊心”指的是心境、激情、还是应激?首先我们要对和这句话做个解析,诗的意思是对乱世别离的悲凉情景,花也为之落泪,鸟也为之惊心。但是花本来是很美好的事物,鸟的叫声也是很悦耳的声音,为什么会惊心呢,这是由于作者心境弥散性的原因,也就是心情不好,看到人任何事物心情都不好,举个例子,当你心情不好的时候,即使你看见你喜欢的食物,你是否也不会有胃口了?这就是心境的体现。 激情,指的是一种强烈的、爆发式的而时间相对短暂的情绪状态。关键词就是短暂和强烈,这种情绪状态在我们日常生活很常见。如果说我们在看体育运动的时候,会经常发现这

微博运营六大策略(经典)

微博运营六大策略 1 定位策略 首先要明确的第一店就是开设微博的目的,界定微博的定位是左销售产品,还是品牌宣传,还是为了扩大个人影响力。然后才能在此基础上发布相关内容,吸引目标粉丝群,才能针对其销售产品,做到最大化利益。 2 装修策略 A.微博模板微博模板的设置一定要遵循两个原则,美观性原则和一致性原则。 B.微博头像企业微博头像可使用公司logo,子账号可根据自身属性设置,但切忌频繁 变动 C.微博昵称微博昵称不宜太长,应尽量与定位一致,尽量避免出现生僻字和中英文混 搭现象 D.个性域名个性域名一经确定将无法修改,所以应谨慎选取,同时最好是与企业保持 一致性 E.认证信息对微博进行认证可提高真实性,增加权威性,提高曝光率 F.企业介绍企业介绍可让浏览者对企业有一个最直观的认识 G.公告栏建议企业微博可利用公告栏放置告示性文章,如通知,活动信息等 H.友情链接微博是增加企业网站链接曝光率的一种有效途径,企业可通过微博对网站 进行宣传和推广 I.展示视频展示视频可放置宣传企业文化,品牌等信息的视频 J.首页图片相当于首页界面的宣传和广告,用语展示企业的产品,动态等等 K.我的标签标签的左右有两种,一种是展示效应,一种是搜索效应 L.子品牌企业可在为日本界面上设置品牌子账号,对企业子账号或关联微博进行推广 M.领导人企业领导人的展示,但被设置为领导人的微博需要保持更新,因为其代表企业的形象 N.我加入的群按行业分企业行业相关匹配性

按地区分目标群体所在地的组织 按内容分共同感兴趣的话题组 3 内容策略 A. 栏目设置相关性 互动性 趣味性 B. 栏目设置行业相关知识,作为定时栏目 行业相关热点,作为非定时栏目 C. 栏目发布时间定时发布一般定在粉丝活跃度较高时间段发布 9-12點,12-17點17-19點19-22點22-24點0-3點 即时发布新鲜热点即时发布 D. 内容发布流程定时栏目内容收集统一整理并审核审核通过定时发布 非定时栏目即时取材编辑即时审核审核通过即时发布 E. 内容发布定制定制是指標對你的目標群體來選擇內容,要讓這部分人感興趣 非定制:是指那種適合任何粉絲的內容 建議粉絲沒超過10000時不要發佈自己企業或産品的資訊(除非你的粉絲很有效或者真要發,每天不能超過一條)

基于三支决策的中文微博文本情感分类研究

基于三支决策的中文微博文本情感分类研究随着移动互联网的飞速发展,以微博为代表的网络信息交流平台被广泛应用,中文微博文本中蕴含了大量有价值的信息,对它进行情 感分类,就可以了解民众对某个事件或者某件产品的态度和看法,微 博文本情感分类的结果在消费者研究、市场分析、舆情监控中有着广泛的应用,如何从微博文本中快速地分出正面和负面的情感信息是本文研究的出发点。近年来,用分类技术和NLP技术对微博文本进行情感分类已成为研究的热点,本文以中文微博文本情感分类为主线,提 出了基于三支决策的半监督中文微博文本情感分类方法,展开了如下研究工作:(1)对情感特征选择方法和权重计算方法进行了研究。在情感分类中,高维特征会造成冗余,常用的特征选择方法只考虑了情感 特征词在类别中的作用而没有考虑它们的情感特性,加上微博文本稀疏、不规则等特性,致使微博文本情感分类的分类效果往往不太理想。为了提高微博文本情感分类的准确率,本文提出了一种基于Z-score 的微博文本情感特征选择方法,通过实验来比较采用CHI、VCHI、 Z-score特征选择算法进行微博文本情感分类时的分类效果,验证了基于Z-score的微博文本情感特征选择方法的有效性。(2)对主观中文微博文本的分类进行了研究。情感分类中,无监督学习方法往往分类精度很低,监督学习方法必须在标注大量语料的条件下才能够获得理想的分类效果,这要耗费很高的人力成本,半监督学习方法则可以 在少量标注语料的情况下充分利用未标注语料信息来提高分类的准 确率。本文将三支决策理论引入到微博文本情感分类中,充分利用三

支决策在对不确定对象分类时准确率高的优点,结合 R-self-training算法在处理语料不平衡问题的优势,提出了一种基于三支决策的半监督微博文本情感分类方法。实验表明,本文提出的方法在标注语料较少的情况下能有效地提高微博文本情感分类的分类效果。

微博营销案例分析

微博营销案例分析 CKBOOD was revised in the early morning of December 17, 2020.

近些年来,新兴媒体不断涌现,凭借其各自新颖独特的传播方式得到了众多的支持者,越来越受到大家的重视。而微博以其强大的时效性、原创性、便捷性、创新交互性,吸引了广大的互联网用户,在众多互联网社交平台中异军突起,成为了新兴媒体中的佼佼者,并将将其作用发挥的淋漓尽致。基于微博广大的用户群和其信息交互快速的特点,一大批企业进驻微博,利用微博成为其品牌推广的营销平台。微博营销凭借低门槛、传播快、见效快、多平台的特点,成为了一种重要的互联网的营销模式。其中就不乏许多成功的微博营销案例: 一、原生品牌——西少爷肉夹馍 西少爷肉夹馍是由数十名热爱西安美食的互联网、金融等领域从业者发起,以“古法烤制”的关中肉夹馍为核心产品,主推西安美食,旨在让更多的人品尝到正宗的西安味道。 西少爷肉夹馍一经推出就受到了广大食客的欢迎。其第一家位于北京五道口的门店在开业当天就销售了1200个肉夹馍,100天卖出20万个肉夹馍,百度指数显示“西少爷”肉夹馍一周时间关注度曾直线飙升1000%。而西少爷肉夹馍之所以受到如此的追捧,微博营销功不可没。 ●利用微博的信息传播功能打造知名度 品牌知名度是关键的品牌资产。在竞争激烈的细分市场中,提升品牌知名度并使其产生实际的销售收益对企业至关重要。俗话说:万事开头难。打造品牌也是一样,最难的是如何打开知名度。对于一个新品牌创建,“西少爷”肉夹馍的方法值得借鉴:从微博微信疯传的创业故事《我为什么要辞职去卖肉夹馍》开始。

情绪的几种分类

一、情绪成分包括内在体验、外显表情和生理激活三种成分。1)情绪带有独特的主观体验色彩,具有某种愉快、享乐、忧愁或悲伤等多种享乐色调。2)外显表情,特别是面部表情。3)神经系统一定部位的激活为情绪的发生和活动提供能量。 二、构建情绪理论的时候,存在三种取向:维量(维度)观点、类型(种类)观点和层次论观点。 维量观点认为:维量是情绪的一种特性。冯特1896年将情绪分为愉快--不愉快、紧张--松弛、兴奋--沉静三个维量。伊扎德提出的体验量表包括快乐度、紧张度、冲动度和确信度。 类型观点:一种按唤醒/激活或效价,可以区分积极情感和消极情感。Watosn认为高动机、热情和愉快的投入标志为积极情感;而忧虑、不愉快的投入和焦虑为消极情感。另一种从生物进化角度划分为基本情绪和复合情绪。伊扎德提出人类的基本情绪有11种,如惊奇、兴趣、厌恶、痛苦等;复合情绪由不同组合派生出来,如羡慕、羞愧、自卑等。 层次观点:位于情绪层次中位水平(基线水平)的是六种情绪:爱、快乐、悲伤、愤怒、惊奇和恐惧。其中每个中位水平情绪又有下位概念,如爱有三个类别:1)喜爱、爱好、爱慕、友善;2)心愿、痴迷、激励;3)盼望…… 三、俞国良、董妍2007年编制的青少年学业情绪问卷分为四个维度,包含13个具体学业情绪

积极高唤醒(高兴、骄傲、希望、兴趣) 积极低唤醒(放松、平静、满足) 消极高唤醒(焦虑、愤怒、羞愧) 消极低唤醒(厌倦、无助、沮丧、疲乏--心烦) 四、有文献说大学生学业情绪的种类有:高兴、焦虑、厌烦、烦躁、成就感、沮丧、轻松、平静、生气、羞愧、失望、厌恶、惊奇、希望、无奈 Pekrun等人提出9种学业情绪:愉快、自豪、希望、放松、气愤、焦虑、羞愧、失望、厌倦。马惠霞在此基础上增加了兴趣一项。Pekrun 把愉悦度和定向结合起来,将学业情绪分为积极活动定向情绪(高兴、平静……)、消极活动定向情绪(厌倦、生气、烦躁)、积极结果定向情绪(成就感)、消极结果定向情绪(羞愧、焦虑和沮丧)

微博增设栏目

据观察易发现,新活广播、Ucity的微博与社联官方微博的不同之处在于它们发布的微博话题很广,关系到我们学生的方方面面。对于学校各种活动它们都会进行预告和说明,且有许多衣食住行方面的内容,比较贴近学生的生活,学生可以获取自己感兴趣的信息。而我们社联的官方微博基本上只发布有关社联社团活动的信息,没有涉及到学生生活的其他方面,较难吸引学生关注。而我们社联的又是为社团服务的,所以也因尽可能的为各社团提供各方面信息,如其他高校同一性质的社团举办的一些比较特别的、有参考价值的活动相关内容我们可以发微博@它们。 因此,我认为我们社联官方微博可以增设以下栏目: 1、名称:#社团校外信息频道# 内容:主要发布其他高校相关社团的特色活动等各方面信息,并@我校相关社团。 来源:密切关注其他高校各社团的微博或博客,从中找出一些特色品牌活动,然后转发为微博或编辑相关内容的微博。注意时效性。 2、名称:#华师社联生活频道# 内容:各类我校衣食住行方面的信息,内容不能太官方,要贴近学生的生活。 来源:原创,许多比较专门发布这方面信息的微博,例如广州吃货小窝、大学城小八卦等等。 3、名称:#华师社联艺术频道# 内容:电影推荐、音乐推荐、美文、哲理故事、旅游介绍等。 来源:原创,各类相关微博,如一块去旅行、全球经典音乐、精彩电影等。接受私信投稿。 4、名称:#华师社联社团活动时光机# 内容:社团、社联往期活动回顾 来源:每月一次总的活动回顾 5、名称:#校园活动速递# 内容:校内外活动预告 来源:转发各大组织的微博 6、名称:#社团百科# 内容:社团的简介并@社团微博 来源:各大社团的简介,开学前已经收集过。 PS:以上栏目都接受各类私信投稿…

面向中文微博文本的情感分类研究

目录 摘要....................................................................................................................................... I ABSTRACT .......................................................................................................................... II 第一章绪论.. (1) 1.1 研究背景 (1) 1.2 研究意义及应用领域 (2) 1.3 研究现状 (3) 1.3.1 主客观文本分类研究现状 (3) 1.3.2 微博情感分类研究现状 (4) 1.3.3 微博倾向性分析相关评测 (6) 1.4 研究思路 (6) 1.5 本文的主要工作 (7) 1.6 本文的结构安排 (7) 第二章微博情感分类相关技术 (8) 2.1 微博文本情感分类基本流程 (8) 2.2 语料库构建技术 (8) 2.3 微博文本预处理技术 (9) 2.3.1 微博文本分词 (9) 2.3.2 微博停用词及特殊符号的过滤 (10) 2.4 微博情感词典构建技术 (11) 2.4.1 情感词典资源介绍 (11) 2.4.2 微博情感词的识别与倾向性判断 (12) 2.5 微博情感特征选择算法与特征权值计算 (15) 2.5.1 微博情感特征选择算法 (15) 2.5.2 微博特征权值计算方法 (17) 2.6 微博情感分类算法 (17) 2.6.1 基于情感词的微博情感分类算法 (17) 2.6.2 基于朴素贝叶斯的微博情感分类算法 (18) 2.6.3 基于K近邻的微博情感分类算法 (19) 2.6.4 基于支持向量机的微博情感分类算法 (20) 2.7 微博情感分类效果的评价指标 (21) 2.8 本章小结 (22) IV

第五章 情绪

第五章情绪 考点纲要 一、考试内容 情绪的含义;情绪的分类;认知对情绪的影响;情绪对认知的影响;情绪与行为的关系;健康情绪的必要条件;暴怒情绪的控制;过度焦虑情绪的控制;过度紧张情绪的控制;抑郁情绪的控制;自卑情绪的控制。 二、考核要求 1.识记:(1)情绪的含义;(2)情绪的分类。 2.理解:(1)认知对情绪的影响、情绪对认知的影响;(2)健康情绪的必要条件;(3)情绪与行为的关系。 3.应用:暴怒情绪、过度焦虑情绪、过度紧张情绪、抑郁情绪、自卑情绪的控制。 知识点讲解 一、情绪与认知 1.情绪的含义 情绪是人类对于各种认知对象的一种内心感受或态度。它是人们对于自己所处的环境和条件,对于自己的工作、学习和生活,对于他人的行为的一种情感体验。因此,情绪这个概念又与情感这一概念相对应。“情绪这个概念可以既用于人类也可用于动物,情感这个概念只用于人类”。事实上,情感是情绪过程的主观体验,是情绪的感受方面需要是情绪产生的重要基础。根据需要是否获得满足,情绪具有肯定或否定的性质。 情绪总是在一定的情境中产生的。在不同的情境中情绪会表现出不同的体验特质。仅就情绪体验的性质而言,情绪表现为强度、紧张度、快感度和复杂度等几个维度。 2.情绪的分类 情绪的分类依分类标准而定。心理学家根据各自不同的标准将情绪分为不同类型。有些心理学家根据情绪的演化过程或刺激类型将情绪分为六类。第一类是原始的基本情绪,常常具有高度的紧张性,它们表现为快乐、愤怒、悲哀与恐惧四种形式;第二类是由感觉刺激引发的情绪,常常是温和的或强烈的,它们表现为疼痛、厌恶和轻快;第三类是与自我评价相关的情绪,这主要取决于评价标准,表现为成功感与失败感、骄傲与羞耻、内疚与悔恨等;第四类是与别人有关的情绪.经过一定的时间,这类情绪常常转化为持久的情绪倾向或态度,主要表现形式是爱与恨;第五类是与欣赏有关的情绪.它们是惊奇、敬畏、美感和幽默;第六类是最为持久的情绪状态。即是心境。 我国心理学家林传鼎从总结我国古代情绪分类的角度。把情绪分为十八类:安静、喜悦、贪欲、忧愁、愤激、恐惧、恭敬、烦闷、惊骇、爱抚、爱怜、悲痛、恨怒.骄慢、嫉妒、惭愧、耻辱、憎恶。

中文微博情感分析评测结果(2012)

2012年CCF自然语言处理与中文计算会议 中文微博情感分析评测结果 1.提交结果编号 本次评测共有34支队伍提交53组有效结果,提交结果编号及所属参评单位对应情况如表1所示。 表1 提交结果编号与参评单位对照表 提交结果编号参评单位 1 北京工商大学 2 北京工商大学 3 北京航空航天大学计算机学院 4 北京航空航天大学计算机学院 5 北京理工大学海量语言信息处理与云计算应用工程技术研究中心1 6 北京理工大学网络搜索挖掘与安全实验室 7 北京理工大学海量语言信息处理与云计算应用工程技术研究中心2 8 北京理工大学海量语言信息处理与云计算应用工程技术研究中心2 9 大连理工大学 10 大连理工大学 11 广东工业大学DMIR实验室 12 哈尔滨工业大学语言技术研究中心网络智能研究室 13 哈尔滨工业大学语言技术研究中心网络智能研究室 14 哈尔滨工业大学计算机科学与技术学院/机器智能与翻译研究室 15 哈尔滨工业大学计算机科学与技术学院/机器智能与翻译研究室 16 哈尔滨工业大学(威海) 17 海军工程大学信息安全系 18 黑龙江大学计算机科学技术学院 19 湖南工业大学计算机与通信学院 20 湖南工业大学计算机与通信学院 21 湖南科技大学外国语学院 22 华侨大学计算机科学与技术学院 23 华侨大学计算机科学与技术学院 24 华中科技大学 25 南京大学计算机科学与技术系自然语言处理研究组 26 南京理工大学 27 南京理工大学 28 清华大学计算机系智能技术与系统国家重点实验室信息检索组 29 清华大学计算机系智能技术与系统国家重点实验室信息检索组 1参评队伍联系人为刘全超 2参评队伍联系人为王金刚

微博营销成功案例分析定稿版

微博营销成功案例分析 HUA system office room 【HUA16H-TTMS2A-HUAS8Q8-HUAH1688】

Weimedia--微营销分析 完美“优雅女”营销案例分析 weimedia微媒体平台是华人基业公司旗下核心业务之一,是中国最专业的微博营销平台,是国内最早深入研究微博营销广告技术平台的公司。北京华人基业科技有限公司成立于2004年,总部设立于北京,长期服务于国内300多家知名企业,旗下拥有4大核心自主技术广告平台,定位于互联网全程效果整合营销专业服务,拥有大批互联网营销、管理、技术等专业人才、优质媒体资源和自主核心技术平台。 网络营销的方法和案例非常多,在较为浮躁的中国互联网环境下,一个好的创意是网络营销活动中最主要的灵魂。去年的“贾君鹏事件”就是一个非常好的创意,也用事实说明了事件营销的效果和所产生的推动力,往往比其他营销方法要好的多。今天我就具体以最近发生的一起事件营销“后宫优雅事件”为例,来分析一下在社会化网络环境下的微博事件营销的过程和方法。 事件营销策划 事件营销就是通过制造具有新闻价值的事件,并让这一新闻事件得以传播,来转弯抹角的做广告,达到广告的效果。比如某公司要推广某一款网络游戏,使用知名度高的明星代言往往需要较高的费用,推广时候的广告费也不菲,而如果通过事件营销的方式打造一个知名度很高的网络红人来代言这个网络游戏,不仅仅可以节省大量费用,还以低廉的成本进行了网络推广营销。

营销策划人可谓用心良苦,从去年12月就开始计划利用互联网来打造这个具有较高知名度的“网络红人”—“后宫优雅”。这个案例的营销平台选择的是“新浪微博”,这是一个2009年后半年开始逐渐热闹起来的社会化网络平台,注册用户约有几十万,有不少“名人”入驻。由于网络的虚拟性和匿名性,注册的微博用户背后的身份往往无从知晓,于是做好几方面准备之后就可以开始进行事件营销。 事先的准备工作包括,寻找一个虚拟的“网络美女”,并预备几十张左右的自拍照片,然后寻找一个写作团队,能够持续地写出有趣的段子。准备好这一切后,就可以开微博帐号进行炒作。微博前期的炒作主要以“美女”、“炫富”、“明星八卦”为着重点,总而言之就是“找骂贴”。典型的症状包括,自称来自“新加坡”,“后宫三千,独我优雅”。号称有私人飞机,认识很多明星,和阿娇去日本泡温泉,被范冰冰专门因为安慰过,经常行来于夏威夷、香港等地,投资几千万给电影《阿凡达》,并与许多大牌娱乐圈艺人私交甚好等等。 值得一提的是,该微博的写作团队具有较高的文案写作水准,在初期炒作阶段,发表的段子非常诙谐幽默,颇具有娱乐效果,可读性很高,使得不少新浪微博的名人都转发其段子,在12月中旬时,“后宫优雅”具有了约四千左右的粉丝数。 平媒介入 12月下旬,平面媒体、报刊杂志开始报道和炒作“优雅女”,使得“后宫优雅”的知名度急剧上升,并在2009年12月29日达到了一个小高峰,用户关注度增长惊人,搜索量也开始猛增,也开始有网友对其进行人肉搜索,“后宫优雅”的微博在29日粉丝数

情绪与情感的种类

情绪与情感的种类 一、情绪的种类 1、心境 心境是一种微弱而持久的情绪状态,它构成人的心理活动的背景。当一个人出现愉快心境的时候,无论遇到什么事情都会感到是愉快的;当一个人处在苦闷心境的时候,无论遇到什么事情都会感到闷闷不乐。这就是心境。 心境具有弥漫性的特点。所谓弥漫性,是指心境并不是对某一特定事物的情绪体验,而是某一种特定情绪发生后并不马上消失,还要保留一段时间。在此时间内,人们把这种特定情绪投射到其他事物上面,使这些事物都带上先前的情绪性质和特点。 心境产生的原因是多方面的。如工作的好坏,学习万贯的优劣,生活习惯的改变,人际关系的融洽程度,甚至季节的变化等,都可能引起某种心境的原因。但在很多情况下,人并不能意识么引起心境的原因。 心境对人的工作、学习和健康有很大的影响。积极的心境有助于工作和学习,能促使人的主观能动性的发挥,提高人的活动效率,并且有助于人的健康。消极的心境使人意志消沉,降低人的活动效率,妨碍工作和学习,有害于人的健康。因此,要善于调节和控制自己的心境,形成和保持积极、良好的心境。 2、激情 激情是一种强烈的、爆发式的、时间短暂的情绪状态。如暴怒、恐惧、绝望、狂喜等都属于这种情绪体验。在激情状态下,主体往往伴随明显的生理和外部表情变化,如心跳加快,血压升高,呼吸急促,大发雷霆,暴跳如雷等。 激情通常是由对个人有重大意义的事情引起的。如重大成功、惨遭失败和亲人突然去世等,都是对当事人有巨大意义的能引起激情状态的强烈刺激。 激情有积极和消极之分。积极的激情常常能调动人的身心的巨大潜能,激励人们奋不顾身地克服艰难险阻,朝着正确的目标奋进。消极的激情往往使人产生“意识狭窄”现象,致使注意范围缩小,自我控制能力减弱,从而使行为失去控制,做出后悔莫及的事情,对此我们应该采取措施加以控制。 3、应激 应激是出乎意料的紧迫情况所引起的急速而高度紧张的情绪状态,在应激状态下,整个机体的激活水平高涨,使人的肌张力、血压、内分泌、心率、呼吸系统发生明显的变化。由于身体各部分机能的改变,从而使个体发生不同的心理和行为变化。 在应激状态中,人可能有两种行为反应。一种是行为紊乱,忙中生错,不能准确地采取符合当时目的的行动。同时,由于意识的自觉性降低,也会出现思维混乱、分析判断能力减弱、感知和记忆力下降、注意力的分配与转移困难等情况。另一种是虽然身心紧张,但精力旺盛,思维敏捷,活动量增强,从而能更好地利用过去的经验和生理激活状态,急中生智,摆脱困境,化险为夷。 二、情感的种类 1、道德感 道德感是人们运用一定的道德标准评价自身或他人行为时产生的情感体验。如果自己或他人的行为符合道德标准,便会产生肯定的道德体验,如敬佩、爱慕、赞赏、欣慰等;不符合时,便产生否定的道德体验,如厌恶、羞愧、憎恨等。 道德感是人类所特有的一种高级情感。它是人们把自己的或别人的行为与已有的社会行为规范加以比较的后果,体现了客观事物与主体的道德需要之间的关系。 道德标准是社会历史的发展的产物,道德感也受社会历史条件的制约。不同的时代、不同阶级和不同的社会制度具有不同的道德标准,因而也具有不同的道德感。在阶级社会中,许多道德感带有明显的阶级性。 道德感对人的实践活动有重要作用。它可以帮助人们按照道德准则的要求,正确地去衡量周围人们的各种思想行为,同时也可以使自己的思想、行为自觉地符合社会道德准则,做一个道德

四大微博的共同点和差异

四大微博的共同点和差异一、登陆页面(以下图片顺序为新浪、腾讯、搜狐、网易) 微博登陆界面(新浪、腾讯) 微博登陆界面(搜狐、网易)

从客户端上的登陆页面操作中得出,用户名和密码都是默认记录的,都支持多用户切换。 二、注册 (新浪、腾讯微博注册界面)

通过界面截图可以用看到,四大微博客户端都可以用邮箱进行注册,其中搜狐和腾讯微博都是可以用QQ号进行注册。 三、客户端首页

从外形上看,新浪微博和搜狐微博的首页相似度比较高,腾讯的首页则是保持自己的蒲公英样式。但还是从使用上作出了区别。四款客户端都是运用向上向下拉伸进行内容的更新,符合用户使用网页的习惯。四个微博都有新的消息通知,新的微博、评论、粉丝、@消息等等在各个模块的图标上都有提示,功能上无太大差异。 下面,我们从用户体验方面,通过注册流程、发表内容和交互细节几个方面来进行对比。 新浪:新浪微博支持新浪博客、新浪UC、新浪邮箱账号、直接登录,在注册时,需要填写注册邮箱、密码和验证码三类选项,注册完之后到邮箱点击验证连接激活。 初次登录新浪微博需要设置昵称、居住地、姓名三项信息,昵称不允许重复,不允许使用“非法字符”。例如假设一位用户名“王刚”,而王刚这个名字已经被演员王刚注册,则该用户无法使用自己喜欢的昵称;假设以为用户名为“王新浪”,因含有“新浪”字样也无法注册。 网易:注册网易微博流程同样是填写注册邮箱、密码和验证码三类选项,注册完成后到邮箱点击验证链接激活。初次登录网易微博需要设置名字和个性网址。名字也与新浪相同,不允许重复。一个细节是,名字中输入不当字符如含有“网易”字样,无论怎样变换系统都提示“名字有人用了”,与事实不符。 搜狐:搜狐微博支持搜狐博客、校友录、搜狐邮箱、QQ等登陆。 初次登录搜狐微博需要设置昵称、性别、第一条微博。昵称设置相比新浪、网易略微宽松一些,含有“搜狐”等字样的昵称不会作为非法字符,但昵称同样具有唯一性。 腾讯:腾讯微博注册将和QQ号码注册统一,点击注册将跳转到QQ号码注 册页面。 发布微博:发布信息,是微博最最核心的应用,其重要性不言而喻。我 们发现四家微博在发布信息上有较大差异,其中最明显的是搜狐微博与网易微博在字数限制上并没有按照传统的140字来设定。在多媒体方面新浪微博则更为 丰富。 新浪:

不同人格倾向微博用户的情绪表达分析

不同人格倾向微博用户的情绪表达分析 微博平台作为中文区最大的社交网络媒体早已成为网民发表观 点与表达情绪的重要阵地。社交网络媒体文本中蕴含的情绪信息能够对他人产生影响,并且有可能在公共事件传播上起到不可忽视的作用,这就使得有必要探究个体在此类环境中的情绪表达特点。人格作为影响情绪表达的重要因素,以往在研究人格对情绪表达的影响时,通常 以压力情景作为实验场景,将情绪表达作为个体面对压力时的情绪应对策略。对于社交网络媒体环境下,人格对情绪表达的影响还研究得比较少。因此,本研究选择微博平台,对不同人格倾向用户的情绪表达特点进行分析。由于利用传统问卷获取大量微博用户的人格分数费时费力,本研究首先选择建立分类模型以实现对微博用户的人格预测, 再使用在线文本分析技术对不同人格类型微博用户的情绪表达特点 进行分析。在研究一中,首先利用前人研究结果中与大五人格各维度最相关的表达词汇作为种子词,进行翻译和分类。再随机爬取3374名中文活跃微博用户的原创微博作为语料库,利用Word2Vec和语料库 对翻译后的种子词进行扩充。再基于协商一致原则,由两名心理学硕士对扩充后的词汇进行筛选,形成初版人格词库。随后,选取三种分类机器学习算法对初版人格词库进行验证,并且利用随机森林结果中的特征重要性对初版人格词库中的词汇进行筛选,形成最终版的人格词库和人格预测模型。在研究二中,根据研究一得到的人格词库和人格预测模型对从微博平台随机爬取的1868名微博用户打上人格标签, 分为高低两种人格倾向。再根据已有的情绪词库、否定词库和词汇匹

配技术进行情感分析,计算含有每种情绪类别情绪词的微博条数占比,并利用贝叶斯t检验对高低两种人格倾向用户的结果进行分析。最后对大五人格各维度下高倾向用户的情感分析结果进行总结。据此,本研究得到以下结论:(1)从混合情绪角度出发,高开放性微博用户会表达更少消极情绪;高尽责性微博用户会表达更少消极情绪;高外倾性 微博用户会表达更多积极情绪,表达更加情绪化;高宜人性微博用户 会表达更多积极情绪,更少消极情绪;高神经质微博用户会表达更多 消极情绪,表达更加情绪化。(2)从8种基本情绪的角度出发,高开放性微博用户会表达更少愤怒情绪;高尽责性微博用户会表达更少愤怒情绪;高外倾性微博用户会表达更多的快乐和喜爱情绪;高宜人性微 博用户会表达更多快乐、喜爱和期待情绪,表达更少愤怒、焦虑和厌恶情绪;高神经质微博用户会表达更多愤怒、焦虑、厌恶和悲伤情绪。

微博营销案例分析

微博营销案例分析The document was prepared on January 2, 2021

近些年来,新兴媒体不断涌现,凭借其各自新颖独特的传播方式得到了众多的支持者,越来越受到大家的重视。而微博以其强大的时效性、原创性、便捷性、创新交互性,吸引了广大的互联网用户,在众多互联网社交平台中异军突起,成为了新兴媒体中的佼佼者,并将将其作用发挥的淋漓尽致。基于微博广大的用户群和其信息交互快速的特点,一大批企业进驻微博,利用微博成为其品牌推广的营销平台。微博营销凭借低门槛、传播快、见效快、多平台的特点,成为了一种重要的互联网的营销模式。其中就不乏许多成功的微博营销案例: 一、原生品牌——西少爷肉夹馍 西少爷肉夹馍是由数十名热爱西安美食的、等领域从业者发起,以“古法烤制”的关中肉夹馍为核心产品,主推美食,旨在让更多的人品尝到正宗的味道。 西少爷肉夹馍一经推出就受到了广大食客的欢迎。其第一家位于北京五道口的门店在开业当天就销售了1200个肉夹馍,100天卖出20万个肉夹馍,百度指数显示“西少爷”肉夹馍一周时间关注度曾直线飙升1000%。而西少爷肉夹馍之所以受到如此的追捧,微博营销功不可没。 ●利用微博的信息传播功能打造知名度 品牌知名度是关键的品牌资产。在竞争激烈的细分市场中,提升品牌知名度并使其产生实际的销售收益对企业至关重要。俗话说:万事开头难。打造品牌也是一样,最难的是如何打开知名度。对于一个新品牌创建,“西少爷”肉夹馍的方法值得借鉴:从微博微信疯传的创业故事《我为什么要辞职去卖肉夹馍》开始。 《我为什么要辞职去卖肉夹馍》是把四位创业者的经历和感受糅合在一起写出的创业故事。四位创业者是百度、腾讯等公司的员工,看似风光无限的大公司员工,其实都承受

面向微博文本的情感分析模型研究

面向微博文本的情感分析模型研究 随着互联网和移动通讯的飞速发展,人们参与网络活动越来越频繁,微博每天都产生了大量数据,其包含了用户对事物的情感表达和 评论分析,如何从这些信息中挖掘出情感倾向有着巨大的价值。因此,本文对微博文本展开了情感分析模型的研究。通过调研国内外文献,目前对于情感分析模型的研究主要有情感词典方法、机器学习方法和深度学习方法。本文通过爬取微博数据,对这三种方法进行对比实验,寻找最优的情感分析模型。基于传统情感词典方法的研究。利用波森情感词典,将文本数据分词后遍历词典并加权得到其情感极性,然后 在此基础上利用添加情感副词的方式提升情感词典的效果。情感词典方法的优点是速度快,易于判断主观情感比较明确的句子,但是其缺 点是针对不同场景的迁移能力弱,并且人工构建针对某一领域的情感词典耗时耗力。基于机器学习方法的研究。首先对文本数据进行数据预处理,将经过预处理后的数据分词结果通过Word2vec中Skip-gram 方法转化为词向量,同时利用腾讯开源词向量进行对比输入,然后利 用主流的机器学习分类方法(Logistic回归、随机梯度下降法、朴素贝叶斯、支持向量机、随机森林、XGBoost)进行有监督学习,最后对比每种模型的测试集混淆矩阵,发现腾讯开源词向量训练的模型效果均优于Word2vec方法训练出来的词向量。在这些方法中,随机森林、XGBoost这类利用集成思想方法训练的模型效果远远优于单一的分类模型。虽然机器学习方法模型的准确率对比传统情感词典有了很大的提升,但是不足之处是每个训练器都涉及到大量的调参,并对于不同

业务场景的迁移能力不强,机器学习方法已经发展到了瓶颈。基于深度学习方法的研究。通过对经典的多层感知机神经网络、循环神经网络、卷积神经网络和自注意力机制进行对比实验,各类深度学习模型的准确率比情感词典和机器学习的准确率有了较大的提升,其中自注意力机制模型在测试集的准确率达到了91.12%。通过对所有模型进行对比实验,发现自注意力机制所训练的模型无论在训练速度上还是在模型测试集的准确率等方面均优于其他模型。并且它利用序列内部的自我关注,加快了模型收敛的速度。所以,自注意力机制的模型是情感分析任务中综合表现效果最好的模型。

面向微博热门话题的主客观分类方法研究

面向微博热门话题的主客观分类方法研究 【摘要】:随着Web2.0的快速发展,互联网的载体已经不仅仅是单一的电脑,手机、平板电脑等移动终端已经悄然进入了人们的视野。人们获取、分享信息也不单单通过社区、博客,而是能够随时随地发表微博,实现即时分享。微博用户的大幅度增长吸引了一大批学者对其发表言论进行研究,面向微博热门话题的主客观分类问题是其中的重要课题之一。到目前为止,国内外学者主要针对无话题的微博文本进行研究,而面向热门话题的微博文本研究尚处于起步阶段。热门话题下的微博言论文本具有话题分散性,即用户发表的言论常常与当前的热门话题不相关,这个现象会导致针对微博热门话题的主客观分类方法准确率不高。基于此,本文将面向微博热门话题的主客观分类问题看成是两个子问题——话题相关性分类子问题和主客观分类子问题,对两个子问题独立建模,再使用Logistic回归对两个结果集建模,得出当前热门话题下的主观性观点表达。本文的主要研究内容如下:(1)研究了基于同义词词林的话题相关度计算方法。在话题相关性分类子问题中,主要研究当前微博语料是否与所关注的热门话题相关,如何度量两者之间的相关程度是此问题的关键之处。本文以同义词词林扩展版作为资源,通过计算当前词与热门话题词的距离来刻画两者之间相关程度,以此来简化话题相关度的计算方法。(2)研究了基于汉语框架语义网生成有效观点词集的方法。在主客观分类判断子问题中,主要是判断当前微博是否属于主观观点表达。其中构建有效的观点词集是

该问题中重要的步骤之一。本文利用汉语框架语义网中框架间关系和词元,以“观点”框架内词元为种子集,构建了有效的观点词集。(3)研究了将话题相关性模型结果和主客观分类模型结果统一的方法,使用Logistic回归模型将两重结果统一在一个模型下,得到热门话题下的主观文本。(4)本文使用无话题相关性分类的主客观分类方法作为Baseline,并与多分类主客观分类方法与分步主客观分类方法进行对比分析。分析了使用Logistic回归模型并行融合话题相关性分类结果与主客观分类结果的重要性。【关键词】:热门话题主客观分类话题相关性分类Logistic回归模型 【学位授予单位】:山西大学 【学位级别】:硕士 【学位授予年份】:2013 【分类号】:TP393.092;TP391.1 【目录】:摘要4-6Contents6-8中文摘要8-9ABSTRACT9-11第一章绪论11-171.1研究背景及意义11-131.2国内外研究现状13-141.3本文研究内容14-151.4论文组织结构15-17第二章问题描述及相关资源17-232.1面向微博热门话题的主客观分类问题描述17-182.1.1话题相关性分类子问题描述182.1.2主客观分类子问题描述182.2相关资源18-212.2.1同义词词林及扩展版18-192.2.2汉语框架语义网19-212.3

微博营销成功案例分析

Weimedia--微营销分析 完美“优雅女”营销案例分析 weimedia微媒体平台是华人基业公司旗下核心业务之一,是中国最专业的微博营销平台,是国内最早深入研究微博营销广告技术平台的公司。北京华人基业科技有限公司成立于2004年,总部设立于北京,长期服务于国内300多家知名企业,旗下拥有4大核心自主技术广告平台,定位于互联网全程效果整合营销专业服务,拥有大批互联网营销、管理、技术等专业人才、优质媒体资源和自主核心技术平台。 网络营销的方法和案例非常多,在较为浮躁的中国互联网环境下,一个好的创意是网络营销活动中最主要的灵魂。去年的“贾君鹏事件”就是一个非常好的创意,也用事实说明了事件营销的效果和所产生的推动力,往往比其他营销方法要好的多。今天我就具体以最近发生的一起事件营销“后宫优雅事件”为例,来分析一下在社会化网络环境下的微博事件营销的过程和方法。 事件营销策划 事件营销就是通过制造具有新闻价值的事件,并让这一新闻事件得以传播,来转弯抹角的做广告,达到广告的效果。比如某公司要推广某一款网络游戏,使用知名度高的明星代言往往需要较高的费用,推广时候的广告费也不菲,而如果通过事件营销的方式打造一个知名度很高的网络红人来代言这个网络游戏,不仅仅可以节省大量费用,还以低廉的成本进行了网络推广营销。 营销策划人可谓用心良苦,从去年12月就开始计划利用互联网来打造这个具有较高知名度的“网络红人”—“后宫优雅”。这个案例的营销平台选择的是“新浪微博”,这是一个2009年后半年开始逐渐热闹起来的社会化网络平台,注册用户约有几十万,有不少“名人”

入驻。由于网络的虚拟性和匿名性,注册的微博用户背后的身份往往无从知晓,于是做好几方面准备之后就可以开始进行事件营销。 事先的准备工作包括,寻找一个虚拟的“网络美女”,并预备几十张左右的自拍照片,然后寻找一个写作团队,能够持续地写出有趣的段子。准备好这一切后,就可以开微博帐号进行炒作。微博前期的炒作主要以“美女”、“炫富”、“明星八卦”为着重点,总而言之就是“找骂贴”。典型的症状包括,自称来自“新加坡”,“后宫三千,独我优雅”。号称有私人飞机,认识很多明星,和阿娇去日本泡温泉,被范冰冰专门因为安慰过,经常行来于夏威夷、香港等地,投资几千万给电影《阿凡达》,并与许多大牌娱乐圈艺人私交甚好等等。 值得一提的是,该微博的写作团队具有较高的文案写作水准,在初期炒作阶段,发表的段子非常诙谐幽默,颇具有娱乐效果,可读性很高,使得不少新浪微博的名人都转发其段子,在12月中旬时,“后宫优雅”具有了约四千左右的粉丝数。 平媒介入 12月下旬,平面媒体、报刊杂志开始报道和炒作“优雅女”,使得“后宫优雅”的知名度急剧上升,并在2009年12月29日达到了一个小高峰,用户关注度增长惊人,搜索量也开始猛增,也开始有网友对其进行人肉搜索,“后宫优雅”的微博在29日粉丝数增长到八千多。经过人肉搜索,网友发现“优雅女”的身份真实性存在很大疑问,有人称其照片为盗用他人照片,而“优雅女”则发帖称自己的相册被盗了。 围观吹牛

相关主题
文本预览
相关文档 最新文档