【CN110008477A】一种中文情感评价单元抽取方法【专利】
- 格式:pdf
- 大小:2.33 MB
- 文档页数:36
专利名称:一种情感分析方法、装置和电子设备
专利类型:发明专利
发明人:苏萌,左云鹏,高体伟,苏海波,刘译璟,王勋,孙伟申请号:CN201911397843.9
申请日:20191230
公开号:CN111191438A
公开日:
20200522
专利内容由知识产权出版社提供
摘要:本发明公开了一种情感分析方法、装置和电子设备,方法包括:确定待分析文本中的待分析句子;基于预设主体信息库,对每个待分析句子进行主体匹配,预设主体信息库中包含多个主体信息;当待分析句子中匹配到目标主体时,利用主体情感自注意力机制确定待分析句子中的每个词对目标主体的加权系数,主体情感自注意力机制结合依存文法建模形成;确定待分析句子中的情感词以及情感词的极性;利用情感词、情感词的极性以及加权系数,确定待分析句子对于目标主体的情感值;合并待分析文本中所有匹配到目标主体的待分析句子的情感值,确定待分析文本对于目标主体的情感值。
通过本发明,能够准确地确定文本中的目标主体的情感倾向。
申请人:北京百分点信息科技有限公司
地址:100096 北京市海淀区建材中路27号14幢一层101层
国籍:CN
代理机构:北京国昊天诚知识产权代理有限公司
更多信息请下载全文后查看。
(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号 (43)申请公布日 (21)申请号 201910352425.1(22)申请日 2019.04.29(71)申请人 湖南检信智能科技有限公司地址 410000 湖南省长沙市长沙高新开发区尖山路39号中电软件园大楼总部G0241房(72)发明人 李剑峰 (74)专利代理机构 北京联瑞联丰知识产权代理事务所(普通合伙) 11411代理人 郑自群(51)Int.Cl.G10L 25/63(2013.01)(54)发明名称一种语音情感分析系统(57)摘要本发明公开了一种语音情感分析系统,包括语音心理分析模块,用于通过人说话语音进行实时或音视频文件分析,获得被测试者说话片段的多种心理参数,所述心理参数包括害怕、排斥、冲突、期待、压力、兴奋、逻辑、比率、概率、分心、犹豫、认知、紧张、坏感、想象、思考、潜意识、潜在情绪中的一种或多种,并基于此给出综合研判分析结果。
本发明可以对任何渠道获得的音频、视频进行分类记录和分析,还可以进行独立的语音情绪的分析和联合内容分析。
权利要求书1页 说明书5页 附图1页CN 110047518 A 2019.07.23C N 110047518A权 利 要 求 书1/1页CN 110047518 A1.一种语音情感分析系统,其特征在于,包括:语音心理分析模块,用于通过人说话语音进行实时或音视频文件分析,获得被测试者说话片段的多种心理参数,所述心理参数包括害怕、排斥、冲突、期待、压力、兴奋、逻辑、比率、概率、分心、犹豫、认知、紧张、坏感、想象、思考、潜意识、潜在情绪中的一种或多种,并基于此给出综合研判分析结果;面部表情分析模块,用于通过人脸面部图像的实时或视频文件分析,获得被测试者每一时刻或在说话片段中的平静、愉悦、悲哀、愤怒、惊讶、惧怕、厌恶、轻蔑、关注、烦倦、困惑、心率、眼动、微表情强度、唤醒度中的一种或多种参数指标,并基于此抓出异常时刻表情;生理指标分析模块,用于通过人体的生理指标,包括皮电、呼吸、血氧、指脉、血压、心率、体动中的一种或多种,获得被测试者任一时刻的心理活动以及紧张度;量表测试模块,用于集成常用量表,并给出分析报告,并同步解读被测试者语音、表情和心理活动中的一种或多种。
(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号 (43)申请公布日 (21)申请号 201810595441.9(22)申请日 2018.06.11(71)申请人 电子科技大学地址 610000 四川省成都市高新区(西区)西源大道2006号(72)发明人 王雄 张磊 任婧 徐世中 王晟 (74)专利代理机构 成都行之专利代理事务所(普通合伙) 51220代理人 唐邦英(51)Int.Cl.G06F 17/27(2006.01)(54)发明名称一种中文长文本情感分析方法(57)摘要本发明公开了一种中文长文本情感分析方法,所述方法包括:步骤1:文本预处理;步骤2:条件随机场抽取核心句;步骤3:对核心句进行情感分析;步骤4:定义核心句的情感极性权值;步骤5:扩展当前情感分析所使用的情感词典;步骤6:得到最终情感分析结果;采用条件随机场抽取核心句,引入句子情感极性权值来分析整篇文章,提高中文长文本情感分析的准确率。
权利要求书2页 说明书5页 附图3页CN 110096696 A 2019.08.06C N 110096696A1.一种中文长文本情感分析方法,其特征在于,所述方法包括:步骤1:文本预处理:将待情感分析的文章根据标点号进行断句,然后对断句后的每一句话进行分词、过滤停用词操作;步骤2:条件随机场抽取核心句:使用条件随机场得到整篇文章的评价对象,包含该评价对象的句子为该篇文章的核心句;步骤3:对核心句进行情感分析:采用基于情感词典的情感分析算法,分析每句话的情感极性,根据判断结果定义初始情感分数;步骤4:定义核心句的情感极性权值:采用情感极性权值来区分不同句子情感极性的强弱,根据最终的情感权值分数分析整篇文章情感极性;步骤5:扩展当前情感分析所使用的情感词典:采用点互信息率和斯坦福语义树把情感词典中未包含的情感词加入进去,扩展情感词典的使用范围;步骤6:得到最终情感分析结果。
专利名称:一种中文评论分析方法专利类型:发明专利
发明人:董君
申请号:CN201911372086.X 申请日:20191227
公开号:CN111046651A
公开日:
20200421
专利内容由知识产权出版社提供
摘要:本发明一种中文评论分析方法包括如下步骤:将主语、谓语、宾语、其他语中按每项匹配的汉语拼音的字母个数构建图表;根据所述图表框选的面积而判定匹配值,若匹配值大于等于预设阈值,则判定所述中文评论与所述字幕数据匹配,并将所述中文评论与所述流媒体合成并输出至用户终端,若小于预设阈值,则判定所述中文评论与所述字幕数据不匹配,而删除所述中文评论。
本发明通过上述方式可根据中文评论的读法而将与流媒体关联的、特别是与流媒体的字幕数据关联的中文评论挑选出并与流媒体合成,从而剔除掉非法评论。
申请人:淄博职业学院
地址:255000 山东省淄博市联通路西首淄博职业学院
国籍:CN
代理机构:深圳紫晴专利代理事务所(普通合伙)
代理人:陈映辉
更多信息请下载全文后查看。
(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号 (43)申请公布日 (21)申请号 201610898432.8(22)申请日 2016.10.14(66)本国优先权数据201610192686.8 2016.03.30 CN(71)申请人 广东工业大学地址 510006 广东省广州市番禺区广州大学城外环西路100号(72)发明人 郝志峰 梁礼欣 蔡瑞初 温雯 (74)专利代理机构 广州市红荔专利代理有限公司 44214代理人 张文(51)Int.Cl.G06F 17/27(2006.01)G06F 17/30(2006.01)(54)发明名称一种面向中文微博的情感倾向分析方法(57)摘要本发明公布了一种面向中文微博的情感倾向分析方法。
包括如下模块:欠采样技术模块,微博文本预处理模块,利用Word2vec扩展微博模块,特征提取模块,情感分析模型训练模块,情感倾向性判别模块。
最终利用训练好的AWCRF模型对待预测的微博进行情感倾向判别。
本发明的优势是能够有效地解决中文微博数据集在情感倾向分布不平衡时的情感倾向分类问题,实施简单,识别率高,具有很强的实际价值和现实意义。
权利要求书1页 说明书3页 附图1页CN 106569996 A 2017.04.19C N 106569996A1.一种面向中文微博的情感倾向分析方法,其特征在于包括如下模块:(1)欠采样技术模块,利用Affinity Propagation算法来减少训练集中多数类样本的数量从而平衡训练集,以降低数据集情感倾向分布的不平衡性对分类效果的影响;(2)微博文本预处理模块,对微博文本进行清洗,并进行分词、词性标注和停用词处理等操作;(3)利用Word2vec扩展微博模块,通过利用Word2vec来求微博中每个词的前K个相似词从而扩展微博;(4)特征提取模块;加载相关词典,对前面预处理过的微博进行特征提取;(5)情感分析模型训练模块,在上面已经平衡和扩展后的训练集上训练AWCRF模型;(6)情感倾向性判别模块,利用训练好的AWCRF模型对待预测的微博进行情感倾向判别。
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 (43)申请公布日 (21)申请号 201910301318.6
(22)申请日 2019.04.15
(71)申请人 江西财经大学
地址 330013 江西省南昌市昌北国家经济
技术开发区双港东大街169号
(72)发明人 万常选 喻聪 刘德喜 刘喜平
江腾蛟 张子靖
(74)专利代理机构 西安铭泽知识产权代理事务
所(普通合伙) 61223
代理人 俞晓明
(51)Int.Cl.
G06F 17/27(2006.01)
G06F 16/30(2019.01)
(54)发明名称
一种中文情感评价单元抽取方法
(57)摘要
本发明涉及信息抽取技术领域,公开了一种
中文情感评价单元抽取方法;挖掘候选评价对象
与候选情感词,获得候选评价对象与候选情感词
之间的对齐关系,构建候选评价对象与候选情感
词之间的情感关系和语义关系的关联图;计算候
选评价对象与候选情感词之间的情感关系强度,
计算候选评价对象之间的语义相似度和候选情
感词之间的语义相似度,同时计算不同节点的词
语信息熵,调整随机游走影响因子;借助随机游
走模型获取候选评价对象与候选情感词的置信
度,置信度高于预设阈值的候选评价对象与候选
情感词,被分别抽取作为最后的候选评价对象和
最后的候选情感词;这种情感评价单元抽取方
法,不需要大量的人工标注数据,且提取的精确
率、
召回率较高。
权利要求书6页 说明书23页 附图6页CN 110008477 A 2019.07.12
C N 110008477
A
权 利 要 求 书1/6页CN 110008477 A
1.一种中文情感评价单元抽取方法,其特征在于,包括以下步骤:
S1、基于词对齐模型挖掘候选评价对象与候选情感词,借助依存句法规则修正词对齐模型的假设问题,通过词语扩展解决词对齐模型的多词性问题,根据挖掘出的候选评价对象与候选情感词,获得候选评价对象与候选情感词之间的对齐关系,也称为情感关系,并基于对齐关系构建候选评价对象与候选情感词之间的情感关系和语义关系的关联图;
S2、采用词语之间的共现信息计算候选评价对象与候选情感词之间的情感关系强度,借助主题模型或词向量分别计算候选评价对象之间的语义相似度和候选情感词之间的语义相似度,同时基于词对齐模型的对齐情况计算不同节点的词语信息熵,衡量一个节点所对应候选评价对象或候选情感词的信息量大小,根据候选评价对象与候选情感词之间的情感关系强度、候选评价对象之间的语义相似度和候选情感词之间的语义相似度以及词语信息熵自适应地调整随机游走影响因子;基于候选评价对象与候选情感词之间的情感关系和语义关系,借助随机游走模型获取候选评价对象与候选情感词的置信度,置信度高于预设阈值的候选评价对象与候选情感词,被分别抽取作为最后的评价对象和最后的情感词。
2.如权利要求1所述的中文情感评价单元抽取方法,其特征在于,所述步骤S1中的借助依存句法规则修正词对齐模型的假设问题,其依存句法规则包括:
规则1、若句子中包含定中关系ATT,且ATT中的修饰词的词性满足{形容词|动词|外文词性},ATT中的核心词的词性满足{名词|动词|外文词性},同时ATT中的核心词也是核心HED的修饰词,则ATT中的修饰词和核心词相互对齐,其他词语与自身对齐或者与“NULL”对齐;
规则2、若句子中包含主谓关系SBV,且SBV中的修饰词的词性满足{名词|动词|外文词性}、SBV中的核心词的词性满足{形容词|动词|外文词性},同时SBV中的核心词也是核心HED的修饰词,则SBV中的修饰词和核心词相互对齐,其他词语与自身对齐或者与“NULL”对齐;
规则3、若句子中包含动补结构CMP,且CMP中的修饰词的词性满足{形容词|动词|副词|外文词性}、CMP中的核心词的词性满足{动词|外文词性},同时CMP中的核心词也是核心HED 的修饰词,则CMP中的修饰词和核心词相互对齐,其他词语与自身对齐或者与“NULL”对齐;
规则4、若句子中包含动宾关系VOB,且VOB中的修饰词的词性满足{名词|动词|外文词性}、VOB中的核心词的词性满足{动词|外文词性},同时VOB中的核心词也是核心HED的修饰词,则VOB中的修饰词和核心词相互对齐,其他词语与自身对齐或者与“NULL”对齐;
规则5、若句子匹配上述规则1、规则2、规则3或规则4中的任何一个,同时句子中包含并列关系COO,且COO中的修饰词与核心词满足同一匹配规则,则COO中的修饰词的对齐方式与核心词的对齐方式一致,其他词语的对齐方式与句子所匹配规则的对齐方式一致;
规则6、若句子没有匹配规则1、规则2、规则3或规则4中的任何一个,则按原始假设的对齐方式进行对齐;原始假设的对齐方式的规则如下:名词及名词短语只能与形容词或动词对齐;相反,形容词及动词只能与名词或名词短语对齐;其他词语只能与自身对齐,若以上还是找不到对齐方式,则与“NULL”对齐。
3.如权利要求1所述的中文情感评价单元抽取方法,其特征在于,所述步骤S1中的词对齐模型,词对齐过程包括以下步骤:
S11、在词对齐模型中,评价对象与情感词之间的情感关系挖掘可看作是机器翻译中的
2。