信息聚合概念的构成与聚合模式研究
- 格式:doc
- 大小:36.50 KB
- 文档页数:22
分体论聚合-概述说明以及解释1.引言1.1 概述概述分体论聚合是一个涉及哲学、科学和社会领域的概念,它指的是将分体论和聚合理论相结合的一种新型思维模式。
分体论强调事物的分离与独立性,而聚合理论则强调事物的整体性与集合性。
分体论聚合的概念将这两种理论相互融合,旨在探讨事物的多样性与一体性的关系,以及在不同领域中的应用和意义。
本文将着重阐述分体论聚合的概念、意义和未来发展,并展望它在社会和科学领域的重要作用。
1.2 文章结构文章结构部分的内容:在本文中,我们将首先介绍分体论的概念,包括其起源、主要理论观点和相关研究现状。
接着,我们将探讨聚合的定义,以及其在不同领域中的应用和意义。
最后,我们将详细讨论分体论聚合的意义,分析其在现实生活和学术研究中的作用和影响。
通过对这些内容的分析和讨论,我们旨在深入探究分体论聚合的优势和未来发展方向,为读者提供全面的认识和理解。
1.3 目的本文旨在探讨分体论和聚合的概念,并分析分体论聚合在各个领域中的意义与影响。
我们将对分体论和聚合进行深入的解释,以便读者能够更好地理解这两个概念在不同场合下的应用。
同时,通过对分体论聚合的优势和未来发展的展望,我们希望读者能够认识到这一概念在社会和科技进步中的重要性,并对其发展趋势有更清晰的认识。
最终,本文旨在为读者提供一个全面的了解分体论聚合的机会,促进人们对这一概念的认识和应用。
2.正文2.1 分体论的概念分体论,是指一种哲学观点,认为整体是由不同的部分所组成的。
在分体论的观点中,整体和部分之间存在着密切的关系,部分的存在和相互作用构成了整体的形态和特性。
分体论认为世界上的一切事物都可以被分解为不同的部分,每个部分都有其特定的功能和作用。
而这些部分的相互作用和关联,决定了整体的形态和运作方式。
分体论强调了整体和部分间的相互依存关系,强调了系统的综合性和整体性。
分体论的概念对于理解事物的内在运作机制和相互关系具有重要意义。
它帮助我们更好地理解事物的结构和运作方式,有助于我们分析和解决复杂问题。
10 .填空:软件资源包括系统软件和应用软件两大部分。
11 .数据资源是信息系统的核心内容,是系统运行的物质基础。
12 .在信息系统运行过程中,人始终处于中心地位,计算机只要是辅助工具。
13 .简答:信息系统的六个功能(1)信息的收集(2)信息的存储(3)信息的处理(4)信息的传输(5)信息的输出(6)系统运行的控制14 .存储介质主要是指计算机的存储设备,如磁带、磁盘、光盘等。
磁带只能顺序存取,磁盘和光盘可直接存取。
15 .信息传输的指标是传输速度和误码率。
16 .信息系统的建立它的作用表现为三个方面:(1)支持组织的运作(2)支持组织的管理决策(3)支持组织获取战略竞争优势。
17 .信息系统的物理结构按照其在空间上的拓扑结构分为集中式和分布式两大类。
分布式又可分为一般分布式与客户机服务器模式。
18 .信息系统的层次结构可以分为物理层、系统层、支撑层、数据层、功能层和用户层六个层次。
19 .信息系统发展的三个阶段(1)电子数据处理系统(2)管理信息系统(3)决策支持系统。
决策支持系统是一种以计算机为工具,应用决策科学及有关学科的理论与方法,以人机交互方式辅助决策者解决“非结构化”与“半结构化”决策问题的信息系统。
20 .简答:信息系统的新的发展,四个方向:(1)智能决策支持系统(2)群体决策支持系统(3)主管信息系统EIS(4)计算机集成制造系统21 .EIS主管信息系统五个功能:(1)信息挖掘(2)信息交流(3)组织管理(4)决策支持(5)办公助理22 .计算机集成系统三个方面:计算机继承制造系统是将CAD(计算机辅助设计卜CAM(计算机辅助制造)、MIS等不同类型的子系统注意连接起来一起工作。
23 .信息系统的开发方法和技术很多:生命周期法、原型法、结构化技术、面向对象方法等。
24 .生命周期法五个方面:系统规划、系统分析、系统设计、系统实施、系统运行和系统维护等五个阶段。
25 .原型法将系统调查、分析、设计、实施等融为一体。
202011News Dissemination新闻传播在中国的资讯信息分发市场上,算法推荐的内容超过50%。
[1]算法已经渗透到从数据源,到分发的新闻生产的各个流程之中,通过搜索引擎或新闻聚合器查看在线新闻或定制新闻推荐等等,已经成为公众新的媒介消费方式,并引导着新闻生产的变革。
诸如,“百度”“今日头条”“抖音”“新浪新闻”“一点资讯”等聚合类移动新闻客户端,在熟练运用算法分发内容之外,开始尝试算法自动生成新闻。
路透社新闻研究所发布的《数字新闻报告2019》显示,超过四分之三(78%)的受访者认为,有必要向人工智能(AI )投入更多,以便拯救新闻业的未来,但是并不能因此就不再雇佣新的编辑。
智能算法提高了信息生产、管理、分发的效能,正在数字内容分发、在线广告、电子商务、金融等领域加速应用,但是算法的运用在优化效率的同时并未完成主流价值观的优化,还引发了全社会对偏见、歧视、隐私、安全等问题的关注。
算法偏见带来的后果必然是结论错误,甚至引起新闻信息认知的偏差,使媒体作为时代风云瞭望者的地位受到挑战,极端的算法偏差甚至可能成为新闻信息传播的误导者。
一、算法偏见的概念及其表现形式(一)算法偏见的概念算法偏见(Algorithm of prejudice )的定义,现阶段并无统一说法。
算法偏见也被称为算法歧视,是指由于算法自身的因素或突发性错误等瑕疵使算法运行过程中出现偏差,导致不公平、不合理结果的系统性可重复出现的错误。
[2]算法推荐的技术核心是人工智能技术,如果没有人工在背后操控,算法就不能发挥作用,所以算法的价值观是包含了诸多人为因素的集合体。
由于人为因素的介入,使得多维度的主观化噪音有意或者无意地渗透到算法生产中去。
算法偏见的详尽诠释应该是,作为人工智能系统核心的算法,在机器学习的过程中,由于输入数据的偏见、算法模型设计的局限、组织机构的偏见及算法设计者的偏见,引发的对公众、用户的不公正偏见和区别对待。
第五章韩礼德为代表的系统功能语言学派韩礼德(M.A.K.Halliday)的系统功能语言理论是20世纪后半叶国际上最有影响的语言学理论之一,其旺盛的生命力显示,它加深了人们对语言的认识,并将在新世纪语言学研究中发挥更大作用。
本文从伦敦学派及其奠基人弗斯的理论研究对韩礼德系统功能语言学的启迪和传承关系谈起,对韩氏理论的几个发展阶段和主要观点、重要成员作一综合性述评,以理清它的发展脉络和理论奉献。
1.弗斯与伦敦语言学派伦敦学派奠基人弗斯曾在伦敦大学学院的语音系同著名语音学家琼斯(Daniel Jones,1881—1967)一起做研究。
1938年,他受聘于伦敦大学东方与非洲研究学院,并于1944年成为英国历史上第一个普通语言学教授。
弗斯的语言学理论是他在伦敦大学工作期间形成的,他和他的同事又长期在伦敦大学工作,因此以他为首的语言学派被称为“伦敦学派”。
这个学派与美国结构主义语言学、乔姆斯基生成语法学派、布拉格学派、丹麦的哥本哈根学派等同为20世纪语言学界最为人瞩目的语言学派(王宗炎1985:94)。
弗斯的学生韩礼德继承和发展了弗斯的语言学理论,并建立了新弗斯学派。
韩礼德在伦敦大学获得汉语语言文学学士学位后,于1947年到北京大学跟随罗常培教授学习汉语音系学、词典学和比较历史语言学。
后来师从王力教授研究现代汉语方言。
1949年回伦敦,被剑桥大学录取为博士研究生,导师便是伦敦大学东方与非洲研究学院的弗斯教授。
弗斯的语言学思想对韩礼德的影响特别大。
弗斯(1957)认为,语言中的意义(即使用中的语言项目的功能)非常重要,语言中言语产生的社会语境也非常重要。
弗斯受伦敦经济学院人类学教授马林诺夫斯基(B.Malinowski,1884—1942)语言研究的影响,强调言语使用的社会语境,其目标是根据马林诺夫斯基的“情景语境”(context of situation)建立一种语言学理论。
遗憾的是,弗斯自己没有到达这个目标。
异构数据融合中的数据聚合与分析技术研究随着互联网的快速发展和智能设备的普及,大量异构数据在各个领域中不断产生,这些数据涵盖了不同类型、不同格式和不同来源的信息。
如何有效地融合和分析这些异构数据,成为了当前研究领域中的一个重要问题。
本文将对异构数据融合中的数据聚合与分析技术展开深入研究,探讨其在实际应用中的意义和挑战。
一、异构数据融合与聚合在异构数据融合过程中,首先需要将来自不同来源、格式和类型的数据进行聚合。
这一过程包括了对原始数据进行预处理、清洗、集成和转换等步骤。
预处理环节主要用于去除噪声、填补缺失值等操作,以提高后续分析过程中得到结果的准确性。
清洗环节则是对原始数据进行去重、纠错等操作,以确保后续处理得到高质量结果。
在实际应用场景中,常常需要将来自多个来源的异构数据库进行集成。
这涉及到数据库之间模式映射与转换的问题。
模式映射是指将不同数据库中的数据映射到一个统一的概念模型中,以便进行数据集成和分析。
转换则是指将不同数据库中的数据进行格式转换,以满足统一概念模型的要求。
这些过程需要通过专门的技术和工具来实现,以确保数据集成过程的准确性和效率。
二、异构数据分析技术异构数据融合完成后,接下来需要对融合后的数据进行分析。
异构数据分析技术主要包括了特征提取、特征选择、聚类、分类和预测等方法。
特征提取是指从融合后的异构数据中提取出具有代表性和有意义特征,以便后续分析过程中能够更好地表达和描述原始数据。
常用的特征提取方法包括主成分分析、线性判别分析等。
在特征选择过程中,需要从提取出来的特征集合中选择出对问题解决具有重要意义且冗余较小的特征子集。
这一步骤旨在减少维度并提高模型训练效率。
聚类是将融合后得到高维度、大规模异构数据库划分为若干个类别的过程。
常用的聚类算法包括k-means、DBSCAN等。
聚类过程可以帮助我们发现数据中的隐藏模式和结构。
分类是将融合后的数据划分为预定义类别的过程。
常用的分类算法包括决策树、支持向量机等。
网约车自营模式与聚合模式的比较研究1. 研究背景和意义随着互联网技术的快速发展,网约车行业在全球范围内迅速崛起,为人们出行提供了便利。
在网约车市场中,自营模式和聚合模式是两种主要的运营方式。
自营模式是指平台自己拥有并管理所有的车辆和司机,而聚合模式则是将多个网约车平台的资源整合在一起,由第三方进行管理和分配。
这两种模式在市场竞争、用户体验、行业监管等方面都存在一定的差异。
对这两种模式进行深入比较研究,对于理解网约车市场的发展趋势、优化行业竞争格局以及提升用户体验具有重要的理论和实践意义。
1.1 网约车行业的发展历程随着互联网技术的快速发展,网约车行业在全球范围内迅速崛起。
2008年,美国优步公司(Uber)成立,成为全球第一家网约车公司。
其他国家和地区也纷纷涌现出网约车平台,如我国的滴滴出行、美国的Lyft等。
这些网约车平台通过手机应用程序为用户提供便捷的叫车服务,极大地改变了人们的出行方式。
网约车行业的起步可以追溯到2013年。
滴滴出行作为国内最早的网约车平台之一,开始在北京、上海等城市试运营。
2014年,随着政策的放开和市场需求的增长,滴滴出行逐渐扩大业务范围,成为国内最大的网约车平台。
我国的网约车行业迎来了快速的发展,吸引了越来越多的资本和创业者进入这一领域。
在网约车行业的发展过程中,自营模式和聚合模式是两种主要的运营模式。
自营模式是指网约车平台自己拥有车辆和司机资源,直接为用户提供服务。
而聚合模式则是借助第三方平台,将多个网约车司机的信息整合在一起,由用户选择合适的司机进行叫车。
这两种模式各有优缺点,对网约车行业的发展产生了重要影响。
1.2 自营模式与聚合模式的特点及比较自营模式是指网约车平台自己拥有车辆和司机资源,直接进行运营和管理。
在这种模式下,平台需要承担车辆的购置、维修、保险等成本,同时也要负责司机的招聘、培训、考核等工作。
自营模式的优点主要体现在以下几个方面:自主控制:自营模式下,平台可以直接掌控整个运营过程,包括车辆、司机、订单等方面,有利于实现对服务质量的把控。
异构数据融合中的数据聚合与分析技术研究随着信息技术的快速发展和互联网的普及,大数据已经成为当今社会中的热门话题。
大数据的产生和应用给我们带来了许多机遇和挑战。
然而,由于大数据的异构性,如何对不同来源、不同格式、不同结构的数据进行聚合与分析成为了一个亟待解决的问题。
本文将对异构数据融合中的数据聚合与分析技术进行研究。
一、异构数据融合1. 异构数据概念异构数据是指来源于不同系统、不同领域、不同结构和格式的多种类型和多源头信息。
这些信息可能来自于传感器网络、社交媒体、云计算等各种渠道,它们具有高度复杂性和多样性。
2. 异构数据融合挑战由于异构数据具有高度复杂性和多样性,使得它们难以直接进行整合。
主要存在以下挑战:(1)结构差异:来自不同系统或领域的异构数据可能存在着完全不同或部分相似但没有一致性结构。
(2)语义差异:异构数据可能使用不同的术语和语义,导致数据的语义不一致。
(3)数据质量:异构数据的质量可能不同,包括准确性、完整性和一致性等。
(4)规模和速度:异构数据可能具有海量的规模和高速的产生速度,对处理能力提出了更高要求。
3. 异构数据融合方法为了解决异构数据融合的挑战,研究者们提出了一系列方法:(1)模式匹配:通过识别和匹配异构数据中相似或相同的模式来进行融合。
(2)语义映射:通过建立不同源头之间的映射关系来解决语义差异问题。
(3)规范化:将异构数据转化为统一格式或结构,以便进行整合分析。
(4)知识图谱:通过建立知识图谱来描述和组织异构数据之间的关系。
二、数据聚合与分析技术1. 数据聚合概念在进行大规模分析之前,需要将来自多个源头、多个格式、多个结构的异构数据进行聚合。
聚合是将多个来源或者格式不同但具有相似结构或含义的信息整合在一起形成一个统一的数据集的过程。
2. 数据聚合方法数据聚合方法可以分为以下几类:(1)物理聚合:将异构数据物理存储在一起,形成一个统一的存储空间,如数据仓库或数据湖。
(2)逻辑聚合:通过逻辑操作,将异构数据进行关联和整合,形成一个统一的视图。
随着数字化时代来临,用户的复杂信息需求在主流信息组织和检索模式中未得到充分的考虑和支持,人们迫切寻求能有一种帮助按需求从众多分散来源中获取信息,并以整合方式呈现的信息服务方式,这就是信息聚合的来源。
信息聚合即概念聚合,作为信息组织与检索研究的新问题,概念聚合受到了许多领域的关注,为聚合研究提供了理论基础和发展的路向。
一、概念聚合解释与构成概念聚合指的是根据用户的复杂信息需求,对来源分散的多类型信息资源进行采集、筛选、组织、整合和呈现的信息组织与检索方式。
构成概念聚合的三大要素分别是情景、聚合对象以及关系,其中情景决定聚合的领域、目标、资源特征、用户特征、工具和方法,是聚合模式的决定因素;信息是聚合控制的基本对象,面向信息融合和知识发现的各种应用是聚合结果;关系是聚合的基本依据,包括情景、聚合对象和用户三者本身蕴含的关系以及三者之间的关系。
二、概念聚合模式分析以信息聚合的主要构成要素为模式分析的立足点,围绕情景、关系和聚合对象粒度三种主要的聚合依据,按照其研究和实践的侧重点不同,划分为情景聚合、语义聚合、引用聚合、社会网络聚合和粒度聚合五种主要模式。
1、基于情景的聚合情景聚合是指领域、用户、时间、地点等可影响聚合目标、聚合对象特征、聚合方法和工具的应用的社会环境因素。
情景聚合模式即基于应用目标、用户需求、行为或时间地点等客观情景因素进行的信息对象的采选、整合与动态呈现。
该模式可分为基于情景感知的事件信息聚合基于实时信息的新闻或消息聚合和基于个性化用户模型的聚合三种表现形式。
2、基于关系的聚合基于关系的聚合是指特定情境下依据聚合对象之间的各类关系进行聚合,主要包括基于语义关系的聚合、基于引用关系的聚合和基于社会关系的聚合。
3、基于聚合对象粒度的聚合基于聚合对象粒度的聚合主要是指对文本信息资源的解构与重组,相关研究按照知识融合与发现的深度依次为基于信息单元的聚合、信息融合和基于知识元的聚合三大类型。
因而,粒度聚合模式下的研究和实践除了具有聚合对象粒度较小的共同特征外,还可能同时具有情景聚合模式、关系聚合模式的特征。
信息聚合概念的构成与聚合模式研究0 引言网络和数字化环境下,海量信息资源为用户带来丰富数据和信息的同时,也给用户带来了信息超载的难题。
因此,信息组织和检索在解决海量网络信息开发利用的同时,还肩负着搭建从信息资源到用户多样化信息需求之间桥梁的重任。
然而,以往信息组织的研究和实践偏重信息资源的开发利用,而真实情境下用户的复杂信息需求在主流信息组织和检索模式中未得到充分的考虑和支持。
例如,在当前典型的信息检索系统中,用户往往需要对来源分散的信息进行逐一检索和相关性判别,并对结果进行人工整合,才能解决一个具体的问题,这为时间紧迫的用户带来了负担[1]。
因而,用户需要能帮助他们按照需求从多个分散来源中获取信息并以整合方式呈现的信息服务方式——信息聚合由此而生。
简言之,信息聚合是指根据用户的复杂信息需求,对来源分散的多类型信息资源进行采集、筛选、组织、整合和呈现的信息组织与检索方式。
聚合搜索 (Aggregated Search)的概念在信息科学国际会议ACM SIGIR 2008中被提出时,就被认为是信息检索的新范式[2]与新趋势[3]。
在国内,国家社会科学基金和国家自然科学基金立项支持的与“聚合”有关的项目至今累计达十余个。
可见,信息聚合作为信息组织与检索研究的新问题正得到包括图书情报学在内的诸多领域的关注。
适时厘清信息聚合的内涵与概念构成,明晰其发展历史和已有基础,进而对现有的聚合理论研究与实践模式进行梳理,可为聚合研究提供理论基础和发展的路向。
1 信息聚合概念的构成《牛津现代英汉双解字典》中,“聚合”一词与英文“Aggregation”对应,是指异类成分组成的集合,或由很多细小单元组成的集合组成一个整体 [4]。
杜晖指出,聚合的概念来源于化学领域,是描述高分子化学领域中单体小分子通过相互连接成为新的高分子化合物的专用术语[5]。
可见,信息组织领域中的聚合概念应具有多来源信息单元的融合和重组的含义,指多源信息单元的聚合,包含聚合对象粒度这一要素。
北卡罗来纳大学信息与图书馆学院信息检索领域的研究人员Arguello等提出了内容聚合的概念,认为内容聚合是指特定情境下围绕核心内容(Core Content)和垂直内容(VerticalContent)进行信息筛选、组织、排序与呈现的任务与方法[6]。
与前述的聚合对象粒度这一要素相比,内容聚合的概念关注的多源异构的信息“内容”实际上与“聚合对象”对应,同时还增加了“情景”要素。
情景是由宏观社会环境下的信息组织和检索环境以及用户需求共同决定的。
作为聚合对象的信息内容的粒度,主要根据宏观社会环境下用户的复杂信息需求而定,同时还受到来源信息粒度及信息组织和检索系统性能的影响。
情景和聚合对象两个要素之间衍生出第三要素,即涵盖聚合对象与用户之间关系以及聚合对象之间关系的“关系”要素。
因而,信息组织领域中的信息聚合可视为面向用户需求的、基于多维聚合关系的、多来源、多粒度信息对象的筛选、组织、排序与呈现,包括聚合情景、聚合对象粒度、聚合对象之间关系及用户和聚合对象之间关系这三大构成。
与信息聚合相近的概念还有信息整合、信息联合(Syndication)、信息融合和信息集成等。
此外,网络聚合搜索通常被等同于统一搜索(Unified Search)、混合垂直搜索(Blended Vertical Search)或通用搜索(Universal Search)[3]等概念。
正如本文开篇所提到的,信息聚合与这些概念的区别在于,这些概念主要从信息资源开发利用的角度提出,忽略了聚合所关注的“情景”要素以及由情景要素所带来的聚合对象、聚合对象之间关系和聚合对象与用户之间关系的差异。
可见,信息聚合是在当前搜索系统并未满足用户复杂多样的信息需求的情况下,以“情景”因素的融入为主要特征,在相应技术和理论基础上发展而来的信息组织与搜索模式的革新。
内容聚合的概念可包括情景、聚合对象和关系三大要素,其中情景决定聚合的领域、目标、资源特征、用户特征、工具和方法,是聚合模式的决定因素;信息是聚合控制的基本对象,面向信息融合和知识发现的各种应用是聚合结果;关系是聚合的基本依据,包括情景、聚合对象和用户三者本身蕴含的关系以及三者之间的关系。
2 聚合模式分析方法虽然近年来信息聚合问题成为信息组织与检索研究的新热点,但Arguello认为内容聚合的现象可追溯到更传统的表现形式,如:报纸可视为最早的“聚合媒体”,数字环境下聚合系统则表现为内容过滤系统,万维网初期更多呈现为主题导航式的手工的内容聚合、网络内容的自动聚合和新闻推荐等形式。
当前技术环境下,内容聚合者则采用复合的、实时的、基于地理空间信号、语义分析和社会信息分析的方式进行[6]。
国内对于信息聚合的研究也涵盖了馆藏资源聚合和网络资源聚合等方面,如,伍革新和程秀峰提出数字图书馆语义检索从功能上可以划分为面向服务的聚合与检索、面向用户的聚合与检索、面向知识推理与知识创新的聚合与检索[7]。
可见,信息聚合具有多样化的应用领域和应用模式,加上学界对于信息聚合概念的认识和聚合类型划分尚不一致,当前与聚合模式相关的研究和实践是多样而又分散的。
本研究以信息聚合的概念构成为基础,对当前国内外关于信息聚合的典型应用和研究前沿进行梳理,归纳出聚合的主要模式。
为获取国内外图情领域关于信息聚合研究与实践的信息,本研究搜集并整理了以下项目和资料:全球iSchool图书情报学院的教师科研项目、 2009~2013年间图书情报领域的国际会议论文、2009~2013年间图情领域的五种国际期刊的论文(Journal of the American Society for Information Science and Technology,Journal of Documentation,Journal of Information Science,Information Processing and Management,Scientometrics)、我国国家自然科学基金和国家社会科学基金资助项目论文和CNKI中的学位论文,并以此为线索进行扩展。
在此范围内,选取资料完整的、有代表性的研究和实践案例进行分析,对聚合模式进行归纳和梳理。
通过分析发现,这些项目和研究中包含的聚合模式主要是以情景、对象、关系中的一种或几种为依据进行的信息聚合,涵盖特定情境下多类型信息资源的采集、抽取、组织、分析、应用等多个方面的内容。
围绕这些特征,我们提出本研究模式分析的思路,即:以信息聚合的主要构成要素为模式分析的立足点,围绕情景、关系和聚合对象粒度三种主要的聚合依据,按照其研究和实践的侧重点不同,划分为情景聚合、语义聚合、引用聚合、社会网络聚合和粒度聚合五种主要模式。
以此为框架,以聚合情景分析为基础,以聚合机制解释和聚合应用介绍为主要内容,对现阶段信息聚合研究和实践的基本模式及其具体表现形式进行梳理,具体如图1所示。
这三种聚合模式并非相互排斥、独立存在,而是互相包容和渗透。
值得注意的是,以下各模式下所讨论的研究和实践例子除了具备该模式的显著特征外,也可能同时具有其他模式的特征和要素,甚至是其中几种模式的复合体。
图1 基于信息聚合概念构成的聚合模式与表现形式3 信息聚合的主要模式与表现3.1 基于情景的聚合情景是指领域、用户、时间、地点等可影响聚合目标、聚合对象特征、聚合方法和工具的应用的社会环境因素。
情景聚合模式即基于应用目标、用户需求、行为或时间地点等客观情景因素进行的信息对象的采选、整合与动态呈现。
该模式可分为基于情景感知的事件信息聚合、基于实时信息的新闻或消息聚合和基于个性化用户模型的聚合三种表现形式。
3.1.1 基于情景感知的事件信息聚合大数据环境下,科研、商业、政府管理、军事和社会生活中使用的各类传感器产生的多媒体信息是海量信息的主要组成之一。
基于情景感知的事件信息聚合模式是指通过对来自多个传感器的实时、海量的多媒体信息进行事件情景识别、事件相关信息或数据抽取和事件整合的聚合模式。
基于大规模多媒体传感器的应用系统被称为情景感知的应用[8]。
相关研究和实践包括:Ramachandran以视频监控为例构建情景感知的应用模型,在监测器识别和异常事件触发的基础上,通过多传感器和追踪器进行事件信息(如:位置等)的持续聚合和联合追踪,形成面向实际应用的相关知识[8]。
Gao等构建了一个情景信息监测的系统,通过异构信息流聚合方法提供个性化信息和行动提醒。
该系统通过统一的数据模型聚合异构网络数据流,并监测个人或整合数据流的时间和空间特性,从而对复杂情景进行监测并提供个性化信息服务与提醒[9]。
Dao等构建涵盖网络、实体和社会系统的事件信息管理平台,以帮助领域专家实现大规模动态事件数据的监测和实时情景预测。
该平台设计半自动的情景识别模型,通过输入来自传感器的或书面报告的、实时的或档案信息中的同构或异构数据格式,对数据流实现浅层或深层的混合式整合,从而产生可视化的分析方法或行动和警告,并帮助发现隐藏的时间模式[10]。
3.1.2 基于实时情景信息的聚合实时情景信息主要是指用户所处的地理位置、时间甚至是社会关系网络等即时的或历时的情景信息。
基于实时信息的聚合是当前聚合研究的热点。
相关研究和实践包括:Wenze和Kieling 开展首个对多来源的位置—社会网络数据进行聚合、建模和分析的研究,从Facebook、Google+、Twitter和Foursquare中抽取数据并生成物化的空间架构,在此基础上生成扩展的用户模型并实现基于用户模型的相似性分析,从而应用到用户间的场景式推荐中[11]。
Singh等在研究中提出,微博等社会网络程序产生的空间—时间—主题数据的整合,可帮助检测事件,并理解同一事件在不同时间—空间粒度中发展的情景。
作者受到传统图像像素代表某位置中光子强弱的聚合的启发,将处于不同地理位置的用户兴趣层次作为社会聚合的像素,将这种社会像素以时间—空间的方式联系起来即可形成社会图像和音频。
作者提出通过情景监测操作器实现基于时间、空间和主题社会像素的图像和音频聚合[12]。
Liu 提出的LocalSavvy原型系统,将不同地点对于相同新闻事件的官方与非官方等不同观点聚合到统一界面,同时进行摘要呈现,用户可对不同的观点进行比较,从而丰富用户新闻阅读体验[13]。
3.1.3 基于个性化用户模型的聚合基于个性化用户模型的聚合可分为面向用户个体的建模与聚合和面向用户群体的建模与聚合。
其中,面向个体的用户模型聚合可划分为个性化新闻推荐中的用户建模(如:主题跟踪和语义标签匹配模型[14]、基于用户交互行为特征的多变量优化模型[14]、动态的行为学习模型[15]等)和场景模型构建(如:基于生活事件法的电子政务服务场景模型[16-17])。