基于模糊积分的网络舆情态势理解方法
- 格式:pdf
- 大小:352.76 KB
- 文档页数:6
万方数据万方数据万方数据万方数据万方数据基于直觉模糊推理的网络舆情预警方法作者:李弼程, 王瑾, 林琛, LI Bi-cheng, WANG Jin, LIN Chen作者单位:解放军信息工程大学,信息工程学院,郑州,450002刊名:计算机应用研究英文刊名:APPLICATION RESEARCH OF COMPUTERS年,卷(期):2010,27(9)1.钱爱兵基于主题的网络舆情分析模型及其实现[期刊论文]-现代图书情报技术 2008(4)2.谢海光;陈中润互联网内容及舆情深度分析模式[期刊论文]-中国青年政治学院学报 2006(3)3.柯宏发;陈永光电子战干扰目标的多属性多层次威胁评估模型[期刊论文]-系统工程与电子技术 2006(09)4.刘同明;夏祖勋;解洪威数据融合技术及其应用 19985.都云程;王海洋;王洪俊TRS网络舆情监控解决方案[期刊论文]-信息网络安全 2008(06)6.雷英杰;王宝树直觉模糊关系及其合成运算[期刊论文]-系统工程理论与实践 2005(02)7.雷英杰;王宝树直觉模糊逻辑的语义算子研究[期刊论文]-计算机科学 2004(11)8.ATANASSOV K More on intuitionistic fuzzy sets 1989(01)9.ATANASSOV K Intuitionistic fuzzy sets 1986(01)10.网络舆情"智库" 200911.李弼程;邵美珍;黄洁模式识别原理与应用 200812.王三民模糊推理及态势估计研究 200413.GONSALVES P;CUNNINGHAM R;TON N Intelligent threat assessment processor(ITAP) using genetic algorithms and fuzzy logic 200014.袁斌;耿伯英;杨红梅基于支持向量机的海战场辐射源威胁评估[期刊论文]-火力与指挥控制 2008(02)15.雷英杰;王宝树;路艳丽基于自适应直觉模糊推理的威胁评估方法[期刊论文]-电子与信息学报 2007(12)16.雷英杰;王宝树;王毅基于直觉模糊推理的威胁评估方法[期刊论文]-电子与信息学报 2007(09)17.王向华;覃征;刘宇径向基神经网络解决威胁排序问题[期刊论文]-系统仿真学报 2004(07)18.Goonie网络舆情监控分析系统 200819.Autonomy面向中国市场推出三款企业搜索产品 200620.方正智思舆情预警辅助决策支持系统 200621.吴绍忠;李淑华互联网络舆情预警机制研究[期刊论文]-中国人民公安大学学报(自然科学版) 2008(03)本文链接:/Periodical_jsjyyyj201009029.aspx。
基于直觉模糊推理的网络舆情预警方法
李弼程;王瑾;林琛
【期刊名称】《计算机应用研究》
【年(卷),期】2010(027)009
【摘要】为解决网络舆情预警等级问题,提出了一种基于直觉模糊推理的网络舆情预警方法.借鉴战场态势分析思想,对网络舆情态势分析的原理进行了阐述,选取了适合计算机实现的七个网络舆情态势分析模式对预警等级进行判断.选择七个舆情话题进行实验,实验结果表明,该方法能够准确地估计出威胁等级,符合专家经验判断,说明该方法是可行的.
【总页数】5页(P3312-3315,3325)
【作者】李弼程;王瑾;林琛
【作者单位】解放军信息工程大学,信息工程学院,郑州,450002;解放军信息工程大学,信息工程学院,郑州,450002;解放军信息工程大学,信息工程学院,郑州,450002【正文语种】中文
【中图分类】TP391
【相关文献】
1.基于直觉模糊推理的网络舆情监测预警评估方法研究 [J], 张艳丰;李贺;彭丽徽
2.基于模糊推理的网络舆情预警方法 [J], 林琛;李弼程;王瑾
3.基于直觉模糊Petri网的加权直觉模糊推理 [J], 孙晓玲;王宁
4.基于直觉模糊蕴涵式运算直觉模糊近似推理方法 [J], 杨会成;陈昊
5.基于直觉模糊推理的直觉模糊时间序列模型 [J], 王亚男;雷英杰;王毅;范晓诗
因版权原因,仅展示原文概要,查看原文内容请购买。
基于大数据的网络舆情分析与情绪态势预测研究简介:随着互联网的高速发展,人们在网络上表达观点和情感的方式也日益增多。
大数据的出现给网络舆情分析和情绪态势预测提供了更广阔的空间和更丰富的数据源。
本文将重点探讨基于大数据的网络舆情分析和情绪态势预测的研究。
一、大数据的网络舆情分析方法:1. 文本挖掘技术:利用自然语言处理和机器学习技术,对大规模文本数据中的关键词、主题、情感倾向等进行抽取和分析,进而识别和判断网络舆情的走向和态势。
2. 社交网络分析:从社交网络中获取用户之间的关系和交互信息,识别和分析网络舆情在社交网络中的传播路径和影响力,从而更加准确地预测舆情态势。
3. 可视化技术:通过大数据可视化的方式,将网络舆情数据以图表的形式展示出来,帮助决策者更直观地理解网络舆情的情况,提供参考依据。
二、大数据的网络舆情情绪态势预测方法:1. 情感分析:通过文本挖掘和机器学习技术,对网络舆情中的情感进行判断和分类,从而预测舆情的情绪态势,如积极、消极或中立。
2. 时间序列分析:分析网络舆情在不同时间段的变化趋势和情绪变化,依此来预测网络舆情的长期走向。
3. 迁移学习:利用历史数据中的网络舆情情绪变化模式,结合当前的网络舆情数据,建立预测模型,实现对网络舆情情绪态势的预测。
三、基于大数据的网络舆情分析与情绪态势预测的应用:1. 政府决策:政府可以通过对网络舆情的分析和情绪态势的预测,了解民众对政策的态度和情感倾向,进而调整决策方向和策略。
2. 企业舆情及品牌管理:通过对网络舆情的分析和情绪态势的预测,企业可以及时了解公众对其产品和品牌的评价和态度,进而进行舆情应对和品牌管理。
3. 社会事件应对:当社会上发生重大事件或突发情况时,通过对网络舆情的分析和情绪态势的预测,可以帮助相关部门了解民众情绪的变化趋势,及时制定应对策略。
四、面临的挑战与展望:1. 数据质量和难处理:网络舆情数据庞大且复杂,如何筛选和清洗有效数据,以及有效处理这些数据仍然是一个挑战。
网络舆情的挖掘与分析方法探究随着互联网技术的发展,网络舆情逐渐成为了一种重要的社会现象,并成为人们了解社会民意和情绪变化的重要途径。
而要深入了解网络舆情,就需要掌握网络舆情的挖掘与分析方法。
本文将从数据采集、数据处理、数据挖掘和数据可视化等方面探究网络舆情的挖掘与分析方法。
一、数据采集数据采集是网络舆情挖掘的第一步,它的目的是获取网络上的相关信息,以便后续的处理和分析。
常见的数据来源包括社交网络、新闻媒体、论坛博客等。
对于大规模的数据采集,可以借助数据抓取工具和爬虫技术来实现。
但需要注意的是,数据采集不能随意侵犯他人的隐私,否则会涉及到法律问题。
同时,为了确保数据的质量和准确性,需要选择权威的信息来源,避免被虚假信息误导。
二、数据处理数据采集后,需要对数据进行处理和清洗,以消除重复信息和噪声信息,剔除无用信息,保留有意义的信息。
常见的数据处理技术包括数据去重、数据过滤、数据归一化、数据匹配等。
同时,还需要对数据进行分类和分组,以便后续的数据挖掘和分析。
数据处理技术的好坏直接影响到网络舆情分析的结果,因此需要进行合理的数据处理。
三、数据挖掘数据挖掘是网络舆情挖掘的核心环节,它的主要目的是通过对数据的分析和挖掘,从中发掘潜在的规律、趋势和模式。
常见的数据挖掘技术包括聚类分析、关联规则挖掘、分类算法等。
其中,聚类分析是一种将数据分成若干类别的技术,它可以从中找出相似性较高的数据点;关联规则挖掘是一种从数据中发掘有意义的关联关系,如购物篮分析、协同过滤等;分类算法是一种将数据归为不同类别的技术,如朴素贝叶斯分类器、决策树分类器等。
综合运用这些数据挖掘技术,可以得出有价值的网络舆情分析结果。
四、数据可视化数据挖掘得出的结果往往非常庞杂,需要通过数据可视化技术来展现出来,让人们更加直观地了解数据的意义和趋势。
数据可视化技术包括图表展示、动态交互可视化、地图可视化等。
通过这些可视化的方式,可以让用户更快速、更直观地理解数据信息,并从中挖掘出更深层次的结论。
网络舆情分析和管理的技术与方法网络科技的发展,越来越让人们对网络舆情产生越来越多的关注。
当下,网络舆情已经成为社会发展的重要组成部分,并对企业、政府甚至个人的形象和利益产生重大的影响。
因此,如何有效地分析和管理网络舆情,已经成为现代社会所面临的一项核心任务。
本文将从技术和方法两个角度出发,深入探讨网络舆情分析和管理的技术与方法。
技术角度:数据挖掘与情感分析网络舆情的分析和管理,首先要依靠的是大数据处理技术和情感分析技术。
数据挖掘技术可以通过收集、筛选和分析网络上的大量数据,来发现潜藏的信息,找到热点话题和焦点事件。
来自社交媒体、新闻网站、论坛等各种渠道的数据可以通过数据挖掘技术进行处理和分析,从而帮助我们快速了解社会热点,分析人群的喜好、需求和情感。
情感分析技术是将自然语言处理、数据挖掘、机器学习等技术相结合的一种方法,其主要目的是分析文本中的情感色彩。
通过情感分析,我们可以知道对某一话题的舆情是正面还是负面,或者是中性的。
这项技术也可以帮助пользователи分析出评论者的情感色彩,如果很多评论是负面的,那么管理者可以立即采取措施来改变状况,而不是事后才来处理。
借助数据挖掘技术和情感分析技术,我们可以更好地掌握网络舆情,并可以更好把握网络舆情发展的方向,从而设计相应策略,预防和控制负面舆情,保护企业、政府乃至个人的形象和利益。
方法角度:预警机制与危机管理网络舆情的发展很快,一个中性的话题可能很快就会变成一个热点话题,进而发展成危机事件。
因此,在网络舆情分析和管理中,制定预警机制和危机管理方案至关重要。
预警机制是指在网络舆情出现前,及时预测和发现潜在的危机因素,及时采取措施避免负面舆情的形成。
它需要对网络舆情发展的方向和规律进行深入研究和分析,以构建一个准确的预警指标体系,在早期发现网络舆情信息,从而及时开展管理。
预警机制的建立能够在舆情瞬息万变的情况下,让管理者快速得出结论,掌握决策窗口,可以在负面舆情发生之前采取措施,有效避免了负面事件的影响。
基于直觉模糊推理的校园网络舆情信息监测研究
常红林
【期刊名称】《长江信息通信》
【年(卷),期】2024(37)1
【摘要】在开展网络舆情信息监测时,由于语言值具有犹豫属性,导致监测结果的可靠性较低,为此,提出基于直觉模糊推理的校园网络舆情信息监测研究。
以Scrapy 框架为基础,对校园网络平台中目标事件相关的网络舆情信息进行采集,在舆情信息监测阶段,引入了直觉模糊推理机制,利用语言真值直觉模糊矩阵校园网络舆情信息模糊集进行简化处理后,利用语言值犹豫度参数计算各组数据的语言值相容度,将不受六元语言真值直觉模糊关系影响的语言值作为监测结果。
在测试结果
中,Precision达到了67.88%,F1值也达到了53.12%。
【总页数】3页(P161-163)
【作者】常红林
【作者单位】荆楚理工学院文学与传媒学院
【正文语种】中文
【中图分类】TN919.72
【相关文献】
1.基于直觉模糊推理的网络舆情监测预警评估方法研究
2.基于直觉模糊推理的网络舆情预警方法
3.基于直觉模糊推理的微博舆情危机预警研究
4.考虑风险偏好的网络舆情预警模型
——基于直觉模糊和Choquet积分5.基于D-S证据融合和直觉模糊贝叶斯网络双向推理的景区游客拥挤踩踏故障诊断分析
因版权原因,仅展示原文概要,查看原文内容请购买。
网络舆情分析的算法和模型研究随着互联网技术的不断发展,网络舆情的分析、研究和预警越来越受到大家的关注。
网络舆情是指在互联网上出现的、反映群众情绪和态度的信息,包括新闻报道、文章评论、微博、朋友圈等。
网络舆情的分析和研究,对于政府决策、公共舆论导向、媒体监管等方面都有着极其重要的作用。
然而,由于网络舆情的复杂性和高度随机性,其分析和预测成为了一个十分具有挑战性的研究课题。
网络舆情的分析主要依赖于相应的算法和模型。
近年来,这方面的研究已经取得了一定的进展。
下面,本文在不涉及政治方面的前提下,就网络舆情分析的算法和模型研究展开探讨。
一、文本分类算法文本分类是网络舆情分析的基本方法之一。
它是将文本数据分为不同类别的过程。
文本分类的算法多种多样,其中较为常见的有贝叶斯算法、支持向量机算法和神经网络算法等。
不同的算法适用于不同类型的数据。
贝叶斯算法是基于贝叶斯定理的一种分类算法。
它基于训练集中的数据,计算出每个类别的条件概率,从而根据输入的文本数据确定其类别。
贝叶斯算法是一种简单快速的分类算法,但是其准确度较低,适用于处理大规模文本分类的问题。
支持向量机是一种比较常用的分类算法,其基本思想是将数据映射到高维空间中,从而通过超平面将数据分为不同的类别。
支持向量机具有较高的分类准确率和较好的泛化能力。
神经网络是一种模仿人脑神经结构进行信息处理的算法。
它通过构建多层神经元网络进行文本分类。
神经网络模型的分类准确率高,但是由于其网络结构复杂、参数多,因此运算速度较慢。
二、情感分析模型情感分析是网络舆情分析的重要内容之一。
情感分析主要是针对文本信息中涉及的情感色彩进行分析,从而了解舆论对于某一事件、事物或人物的倾向性。
推特情感分析模型是一种常用的情感分析模型。
它采用机器学习技术,通过对推特中已标注的情感语料库进行训练,从而对未标注的文本数据进行情感分类。
推特情感分析模型已经被广泛应用于各种领域,包括市场调研、舆情分析等。
基于大数据的网络舆情态势感知与分析研究近年来,随着互联网的快速发展和普及,网络舆情成为了社会管理、舆论引导以及公共决策的重要参考依据。
然而,随之而来的是信息的爆炸增长,海量的网络数据难以直接获取和分析。
在这样的背景下,基于大数据的网络舆情态势感知与分析成为了研究的热点之一。
一、大数据在网络舆情感知中的作用网络舆情感知是指通过采集、处理和分析网络上产生的大量数据,对公众舆情态势进行实时监测和分析的过程。
大数据技术的应用为网络舆情感知提供了强大的支撑。
首先,大数据技术可以实现对网络信息的全面采集。
通过网络爬虫等技术手段,可以获取各类社交媒体、新闻网站、论坛、微博等平台上的数据,形成大规模的数据集。
其次,大数据技术可以对获取的大量数据进行高效存储和处理。
通过分布式存储和计算技术,可以实现对海量数据的存储和分析。
最后,大数据技术可以帮助用户从庞大的数据中提取有用信息。
通过数据挖掘和智能分析算法,可以识别出网络上的关键信息和重要事件,为舆情感知提供有力的支撑。
二、基于大数据的网络舆情感知方法基于大数据的网络舆情感知主要包括数据采集、数据处理和数据分析三个阶段。
1. 数据采集数据采集是网络舆情感知的第一步,也是最关键的一步。
数据采集可以通过爬虫技术和API接口进行。
爬虫技术是一种通过模拟人工访问网页、获取网页内容的技术。
通过构建合适的爬虫程序,可以实现对各类网络平台上的数据进行采集。
而API接口则是通过调用平台提供的数据接口,实现数据的抓取和获取。
数据采集的关键在于选择合适的数据源和采集方式,以及设计合理的数据采集策略。
2. 数据处理数据处理是指对采集到的原始数据进行清洗、预处理和整理的过程。
原始数据往往存在着噪声、冗余和非结构化等问题,需要通过数据清洗、去重和排序等操作进行预处理。
此外,对于不同的数据类型,需要采用适当的数据结构进行整理和存储。
数据处理的关键在于建立适用的数据模型和算法,以提高处理效率和准确性。
网络舆情分析的方法与实践随着互联网的快速发展,网络舆情已成为社会治理和企业管理中不可忽视的重要因素。
网络舆情分析的方法与实践成为了亟需探索的课题。
本文将从数据采集、情感分析和可视化展示三个方面介绍网络舆情分析的方法与实践。
数据采集是网络舆情分析的首要环节。
网络上的信息量庞大且迅速,如何高效地获取和过滤数据是关键。
一种常见的数据采集方法是网络爬虫技术。
通过编写爬虫程序,可以自动化地从互联网上获取数据,并按照一定的规则进行过滤和整理。
例如,可以利用关键词进行搜索,获取与特定事件或话题相关的文章、帖子、微博等信息。
情感分析是网络舆情分析的关键一环。
在海量的信息中,了解用户对某一事件或话题的情感倾向对舆情分析至关重要。
情感分析可以通过机器学习的方法进行,如利用自然语言处理和文本挖掘技术提取关键词、词频等特征,并使用情感词典或训练好的分类模型进行情感判断。
通过对一段文字进行情感分析,可以识别出其中的正面、负面或中性情感倾向,从而了解大众对事件的看法和态度。
可视化展示是网络舆情分析的重要工具。
大量的数据经过分析后,如何将结果生动直观地呈现给用户,是提高信息传递和决策效率的关键。
一种常见的可视化展示方法是利用图表、地图等工具来展示数据和分析结果。
例如,可以利用词云、折线图等图表,直观地展示舆情的关键词及其出现频率。
同时,将数据与地理信息相结合,通过热力图等方式展示舆情的地域分布情况,可以帮助用户更好地理解舆情的影响范围和程度。
网络舆情分析的实践可以应用于各个领域。
在政府机构中,网络舆情分析可以用于政策决策和治理手段的制定。
通过及时了解民意、排查社会矛盾,政府可以更加准确地判断民意动向,及时调整政策。
在企业管理中,网络舆情分析可以用于品牌形象的维护和市场竞争的分析。
通过了解用户对产品或服务的评价和意见,企业可以及时调整经营策略,提升用户满意度和市场竞争力。
在新闻媒体中,网络舆情分析可以帮助新闻机构及时发现热点话题,把握民众关注的热点和焦点,提高新闻报道的准确性和关注度。
第12卷第5期 201 1年10月 信息工程大学学报
Journal of Information Engineering University Vo1.12 NO.5
Oct.20l1
基于模糊积分的网络舆情态势理解方法 王 瑾,李弼程,黄 洁 (信息工程大学信息工程学院,河南郑州,450002) 摘要:由于网络舆情态势理解模式中各属性之间具有一定的相关性,网络舆情态势理解可以看 成一个关联的多属性决策问题。考虑到模糊测度和模糊积分处理关联的多属性决策问题的优 势,文章提出一种基于模糊积分的网络舆情态势理解方法。该方法利用Choquet模糊积分融 合网络舆情话题的倾向性、关注度、敏点及焦点4个属性,分析话题与公众之间联系的紧密程 度,实例验证了方法的正确性和有效性。 关键词:模糊测度;模糊积分;网络舆情;态势理解 中图分类号:TP391 文献标识码:A 文章编号:1671—0673(2011)05—0584—06
Situation Comprehension of Online Public Opinions Based on Choquet Fuzzy Integral
WANG Jin。LI Bi—cheng,HUANG Jie (Institute of Information Engineering,Information Engineering University,Zhengzhou 450002,China) Abstract:As attributes for the situation comprehension of online public opinions are inter—related, the situation comprehension of online public opinions can be considered as an issue of RMADM(Re- lationship Multi—attribute Decision Making).Considering the predominance of the fuzzy measure and fuzzy integral in dealing with RMADM issues,this paper proposes a method on situation comprehen— sion of online public opinions based on Choquet fuzzy integra1.In this method,four attributes of top— ics,including the trend,attention,sensitive point and focus,are fused using Choquet fuzzy inte— gral,and the relationship between topics and the public is analyzed.The validity and effectiveness of this method are tested empirically. Key words:fuzzy measure;fuzzy integral;online public opinions;situation comprehension
随着信息传播技术的发展和普及,互联网已成为一种重要的信息渠道,它为人们获取和发布信息提供 了新的平台。现阶段,网络媒体已被公认为是继报纸、广播、电视之后的“第四媒体”,网络成为反映社会 舆情的主要载体,在舆情传播中起着重要的作用。 舆情是指在一定的社会空间内,围绕中介性社会事件的发生、发展和变化,民众对社会管理者产生和 持有的社会政治态度。它是较多群众关于社会中各种现象、问题所表达的信念、态度、意见和情绪等表现 的总和 。 网络舆情是指在互联网上传播的公众对某一关注事件或话题所表现的有一定影响力、具有倾向性的 意见或言论的情况,是社会舆情的一种重要表现形式。话题是包括一个核心事件或者活动以及所有与之 直接相关的事件和活动。事件是通常在特定时间、地点发生的事情,可以简单地认为话题就是若干对某事
收稿日期;2011-02-27;修回日期:2011-04-30 基金项目:国家社科基金重大招标项目(09&ZD014);国家863计划资助项目(2007AA01Z439) 作者简介:王瑾(1981一),男,硕士生,主要研究方向为信息融合; 李弼程(1970一),男,教授,博士生导师,主要研究方向为智能信息处理。 第5期 王 瑾等:基于模糊积分的网络舆情态势理解方法 585 件相关报道的集合;而故事则是对某个事件的相关报道。 网络舆情与社会舆情在内容表现形态方面具有一致性,但网络舆情在很大程度上影响着社会舆情的 发展方向。网络舆情表达快捷,信息多元和方式互动等特点使得其形成迅速,对社会影响越来越大。因 此,需要对网络舆情进行及时掌控 。 通常,态势分析和威胁估计是两个军事术语,即战场的态势分析和威胁估计 ]。文献[4]利用军事 领域中的战场态势分析与威胁估计思想研究网络舆情态势分析与预警,构建了适合计算机实现的网络舆 情态势分析模式,并给出了相应的模式提取技术。网络舆情态势是指网络舆情形成、发展和消亡演化过程 中各舆情要素的属性、要素之间的关系以及它们随时间和空间动态的变化趋势。其中,舆情要素主要包括 话题和公众。网络舆情分析,即网络舆情态势分析,就是从海量网络信息中发现舆情话题,并分析和获取 网络舆情态势。 对于一个网络舆情话题,根据话题的主题、点击率、评论数和评论人等信息,利用网络舆情话题数据的 采集、舆情信息的抽取、以及话题检测与追踪等手段,可以抽取出网络舆情话题的一些属性。利用这些属 性,可以分析出网络舆情在传播过程中的发展态势。网络舆情态势分析上可以借鉴军事态势分析方法,包 括模板匹配 、多属性决策、规划识别 ’ 及贝叶斯网络 。。。等。 目前网络对话题及话题相关报道的排行,主要是通过对话题的报道数、报道的点击率、评论数等信息 的统计来实现的。由话题产生的舆情表现的是公众对该话题的态度,需要从多个方面来考虑,如果仅仅采 用对话题排行的方法来分析舆情态势稍显不足。 模糊积分利用弱的单调性和连续性代替可加性,对包含关联属性评价问题中指标和指标集的重要性 进行建模,考虑了关联属性对结果的影响。因此,本文利用模糊积分来分析网络舆情态势,提出一种基于 Choquet模糊积分的网络舆情态势分析方法。新方法采用信息融合的思想,利用Choquet模糊积分融合网 络舆情话题的倾向性、关注度、敏点及焦点4个属性,分析话题与公众之间联系的紧密程度,实例验证了方 法的正确性和有效性。
1 模糊测度与模糊积分 设(X,n)为一可测空间,Q为 的子集组成的or一代数。模糊测度和概率测度类似,但不一定满足可 加性。 n上的一个模糊测度g是从Q到[0,1]的映射,满足¨。。” : ①边界条件g( ):0,g(X)=1; ②单调性VA,B∈Q,若A B,贝0 g(B) g(A); ③连续性若A C_A2 …C_A ,则limg(A )=g(1imA )。
一个模糊测度g称为g -模糊测度,若了A>一1,V A,B X,A n B= ,有 g(AUB)=g(A)+g(B)+Ag(A)g(B) (1) 当A=0时,g .模糊测度是一个概率测度。 假设X={ , :,…, }为一有限集合,令Q=2 ,表示 的所有子集组成的集合。映射:Xi—g。= g({ }),i=1,2,…,n,称为模糊密度函数。对于集合A={ I2'…, }∈n,其g 一模糊测度由(2)式给 出: m m一1 m g(A)=
, g。¨ 摹 g。g +..・+Am-Ig …g 一 (1+Ag )一1] (2)
其中,A≠0。 由g(X)=1可得A满足:
A+1喜H(1+Ag ) (3) 对于给定的{g。) : ,0<g <1,存在唯一的A∈(一1。+∞),A≠O,使得(3)式成立。 模糊积分根据模糊测度来定义,一般采用g -模糊测度(A》一1,A≠0)。 586 信息工程大学学报 ( ,n)为一可测空间,函数h: 一[0,1]为Q一可测函数,函数h在集合A 上的关于模糊测度g的 Sugeno模糊积分定义为
一J ( )og(。) ; j 【min(m i nh( ),g(A f3 E))]=。 su【。p,。][n in( ,g(A r、Fa))] (4) 其中,F。={ 仨XI h( ) }。 假设X={ 。, :,…, }为一有限集合,Q=2 ,h( )按降序排列,即h( 。) h( )≥… h( ),则 函数h在集合 上的关于模糊测度g的Sugeno模糊积分可以由下式计算得到:
f h( )og(・):m lx[min( ( ),g(A。))] (5) JX 1 其中,A :{ , :,…, }。
当测度具有可加性时,Sugeno模糊积分与Lebesgue积分不一致,于是Murofushi和Sugeno又提出了所 谓的Choquet模糊积分。 h在 集上关于测度g的Choquet模糊积分定义为
j ( )og(・)=2.g(A )[h( )一h( +。)]=2 h( )[g(A )一g(A 一 )] (6) J l ‘ J 其中,A ={ 。, 2,…, },h( ,)≥h( 2)≥…≥h( ),h(x +。)=0,A0=中。
2基于Choquet模糊积分的态势理解 2.1 网络舆情态势理解 在军事态势分析的功能模型中,态势分析可以分为3个步骤,即态势觉察、态势理解和态势预测 。 在网络舆情态势分析中,可以借鉴该模型。在态势觉察中对态势元素的各种属性变化分析的基础上,可以 对态势元素变化的意图进行理解。网络舆情态势理解是指分析话题的重要性、话题的指向对象或者话题 需要达成的目的、公众元素的传播阶段、传播速度以及舆情的发展阶段、话题与公众之间的联系紧密程度 等内容。本文就是根据态势各要素的属性,分析话题与公众之间联系的紧密程度。即根据倾向性、关注 度、敏点及焦点等4个属性,分析话题与公众之间联系的紧密程度。 倾向性就是提取公众对舆情话题所表现的情感信息,评估民众对舆情话题的态度倾向性,包括:中立、 支持或反对、强烈支持或反对。对舆情话题的态度倾向性程度进行归一化,得到归一化倾向性程度 .E [0,1]。 。=0表示中立; 。=1表示强烈支持或者反对。不论是支持或者反对,其公众的倾向性越强,与 话题的联系就越紧密。因此可以认为, 越高,公众与话题的联系就越紧密。 关注度是估计在过去某一时间段内舆情话题被关注的程度。一般用该舆情话题的相关网页数进行衡 量。对舆情关注度进行归一化,得到归一化关注度 E[0,1]。可以认为, 越高,公众与话题的联系就 越紧密。 敏点是指某一时间段内在热点排行榜上位次上升较多的舆情话题,其实现技术是统计各舆情话题在 热点排行表的位次上升情况,用上升幅度来表示,上升幅度大于给定阈值的舆情话题为敏点。一般地,敏 点值越大,公众与话题联系就越紧密。对上升幅度进行归一化,得到归一化上升幅度 ∈[0,1]。可以认 为, 越高,公众与话题的联系就越紧密。 焦点是指持续的热点舆情话题。其实现技术是统计在持续数个数据统计期内在热点排行榜上保持较 高位次的舆情话题。一般地,持续时间越长,联系越紧密。对持续时间进行归一化,得到归一化持续时间 ∈[0,1]。可以认为, 越高,公众与话题的联系就越紧密。 根据倾向性、关注度、敏点、焦点4个属性可以推断出公众与话题联系的紧密程度。公众与话题的联 系可以分为紧密、中等和稀疏3种情况,可以利用模糊集来表示。设公众与话题联系论域为C=[0,1],3 个模糊子集分别为c.表示“稀疏”;C:表示“中等”;C 表示“紧密”。 每一个属性对公众与话题的联系程度可以用模糊子集进行评价。根据分析,对于模糊子集C。,属性 值越大,评价值就应该越小;对于C:,在中心位置评价值最大;对于模糊子集C,,属性值越大,评价值也就 越大。因此,可以考虑利用高斯函数对评价值进行赋值,即