跨媒体分析与检索 - 首页-中国计算机学会信息网
- 格式:pdf
- 大小:1.30 MB
- 文档页数:5
基于深度典型相关性分析的跨媒体语义检索王述;史忠植【期刊名称】《中国科学技术大学学报》【年(卷),期】2018(048)004【摘要】基于典型相关性分析的跨媒体检索是一种将不同媒体特征通过相关性分析映射到同构的最大相关子空间,并在子空间中完成跨媒体数据间的相似性比较和检索的方法.典型相关性分析(canonical correlation analysis,CCA)是一种线性模型,并不能很好地挖掘跨媒体数据中的复杂相关关系.为此针对深度典型相关性分析(deep CCA,DCCA)的结构进行改进,使用隐含狄利克雷分布(latent Dirichlet allocation,LDA)发现文本语义信息并学习语义映射,提出了跨媒体深度相关性学习模型(cross-media correlation learning with deep canonical correlation analysis,CMC-DCCA)以及跨媒体语义相关性检索方法(cross-media semantic correlation retrieval,CMSCR).在维基百科文本图像数据集上的实验证明,CMC-DCCA模型能够较好地挖掘跨媒体数据中的复杂相关关系,CMSCR在跨媒体检索中具有较好的性能.【总页数】9页(P322-330)【作者】王述;史忠植【作者单位】中国科学院计算技术研究所智能信息处理重点实验室,北京100190;中国科学院大学工程科学学院,北京100049;中国科学院计算技术研究所智能信息处理重点实验室,北京100190【正文语种】中文【中图分类】TP391【相关文献】1.基于深度学习的数字图书馆跨媒体语义检索方法研究 [J], 彭欣2.基于语义相关性与拓扑关系的跨媒体检索算法 [J], 代刚;张鸿3.基于潜语义主题加强的跨媒体检索算法 [J], 黄育;张鸿4.基于不同模态语义匹配的跨媒体检索 [J], 陈祥;于治楼5.基于Tag-rank和典型相关性分析的在线商品跨媒体检索研究 [J], 李广丽;陈婧琳;刘斌;殷依;张红斌因版权原因,仅展示原文概要,查看原文内容请购买。
信息检索与利用课程报告(中文部分)(参考样本)周×班,选课表序号:×,学号:××,姓名:×××拟研究题目:网络群体性事件与网络舆论监督一、题目分析:近几年来,中国的网民人数随着不断上升的网络普及率也急剧增加,截至08年底,我国的网络普及率达到22.6%,首次超过世界平均水平的21.9%,网民人数也达到了2.98亿。
而如此众多的网民人数也导致了越来越多的网络事件的发生,从比较早期的“虐猫事件”,到后来震惊中外的“铜须事件”,从轰轰烈烈的“华南虎照”到年初引起众怒的“躲猫猫”,甚至由于魔兽世界开服问题所引发的“贾君鹏事件”,如今网络舆论监督也逐渐成为焦点话题。
本课题拟了解有关网络信息、网络舆论对网络事件的监督。
二、检索策略制定:1、选择检索数据库:cnki数据资源系统(期刊库)2、检索表达式:1.网络监督信息自由 2.网络舆论监督 3.网络群体事件3、检索结果:1)进入cnki数据资源系统检索界面→点击期刊,通过关键词精确匹配进行简单检索,其结果是:网络监督命中741条;信息自由259条;网络舆论监督108条;网络群体事件31条。
2)进入cnki数据资源系统检索界面→点击期刊→条件限定(选择全部期刊,以关键词网络监督;限定年度范围:2011-2013)→点击检索→命中记录344条;若条件限定(选择核心期刊,以关键词网络监督;限定年度范围:2011-2013)→点击检索→命中记录67条。
3)进入cnki数据资源系统检索界面→点击期刊→条件限定(关键词:网络舆论监督and信息自由;年度不限)→点击检索→命中记录0条;若条件限定(关键词:网络舆论监督or信息自由;年度不限)→点击检索→命中记录10000条;若条件限定(关键词:网络舆论监督not信息自由;年度不限)→点击检索→命中记录741条。
网络监督、信息自由、网络舆论监督、网络群体事件四个关键词的组配请自己完成。
计算机信息检索的方法与策略1. 计算机信息检索过程中的相关概念(1)数据库:数据库是“至少由一个文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合”。
通俗地说,数据库就是在计算机存储设备上按一定方式存储的相互关联的数据集合。
数据库是计算机技术与信息检索技术相结合的产物,是现代重要的信息资源,也是信息检索的重要资料来源。
根据载体的不同,数据库可分为:联机数据库(online-database),光盘数据库(CD-ROM-database)和网络数据库(networked-database)三种。
(2)检索界面:指在进行计算机检索时,检索者与计算机交互对话的界面。
(3)检索方式:以检索过程的繁简程度或从何入手来区分的不同检索过程。
在数据库中往往设有初级检索/简单检索/基本检索(单途径检索);高级检索(多途径组合检索);专业检索(构造检索式);按类检索;按刊检索(刊物查询、刊名导航),篇目检索/论文查询;引文检索等方式供选择。
(4)检索途径:又叫检索入口、检索项,也有的数据库称之为检索字段。
指输入的检索条件所查询的数据区域。
不同数据库所设的途径并不相同。
一般都设有篇名、作者、关键词、全文等途径。
(5)检索词:检索词是检索者给出的字、词、字符或短语,用于查找含有它(它们)的记录。
(6)排序:指检索结果输出时的排列顺序。
输出结果按相关度排序时,则检索结果按检索词在检索字段中发现的频度由高到低依次排列。
无相关度时,输出结果则按文献的出版日期逆序排列或随机排列。
(7)二次检索:指在前一次检索结果的基础上,进一步限定检索条件所进行的再次检索。
二次检索可以多次使用,逐步缩小检索范围。
(8)限制条件:在检索对象的时间、文献类型、语种、同义词等方面做限制,与检索途径配合使用,以精化检索结果。
(9)检索词匹配:指输入的检索词在数据库的可检索字段值中的位置关系。
一般表示为前方一致、后方一致、完全一致(精确匹配)、任意一致(模糊匹配)等。
智能跨媒体信息搜索与分析第一章:引言随着信息技术的快速发展和普及,大量的跨媒体信息被不断生产和传播,如何高效准确地搜索和分析这些信息,成为了智能信息检索与分析领域研究的热点之一。
智能跨媒体信息搜索与分析是指通过计算机技术对不同媒体格式的信息(如文本、图像、视频、音频等)进行跨媒体检索与分析,以提供更加智能化、个性化的搜索服务,解决用户在不同场景下获取信息的需求。
本文将从技术、应用、发展动态等方面对智能跨媒体信息搜索与分析进行深入分析。
第二章:技术基础智能跨媒体信息搜索与分析的实现依赖于多种技术,包括自然语言处理、机器学习、图像识别、声音识别、大数据分析等。
其中,自然语言处理技术是智能跨媒体信息搜索与分析的核心之一。
自然语言处理技术可以对人类语言进行识别、解析、生成和理解,从而实现文本信息的自动分类、摘要、翻译和重点提取等。
在图像识别方面,计算机可以通过训练神经网络,对图像进行识别和分类。
在声音识别方面,计算机可以通过语音辨识技术对不同语言进行识别和转换。
大数据分析技术则能够帮助计算机处理各种媒体格式的数据并进行分析,提供更准确、可靠的搜索结果。
第三章:应用场景智能跨媒体信息搜索与分析技术的应用场景十分广泛。
一方面,它可以帮助个人在日常生活中快速获取信息,如通过语音识别技术获取天气信息、交通信息等;通过图像识别技术快速查询菜单;通过自然语言处理技术搜索新闻信息等。
另一方面,企业可通过智能跨媒体信息搜索与分析技术分析市场数据、舆情数据等,帮助企业做出更准确的决策。
在医疗领域,智能跨媒体信息搜索与分析技术可用于帮助医生诊断和治疗疾病。
第四章:国内外发展动态目前,全球范围内的搜索引擎公司都在积极探索采用智能跨媒体信息搜索与分析技术提供更加人性化、个性化的服务。
如谷歌在2015年推出的Google Now能够根据用户的搜索习惯、定位等信息,提供个性化信息服务。
另外,国内的搜索引擎公司,例如百度、搜狗、360搜索等,也在不断加大在智能跨媒体信息搜索与分析技术研究和实践上的投入。
网络信息检索工具的现状分析与发展方向研究摘要:本文将主要阐述目前主要网络信息检索工具的特点,搜索引擎和网络资源目录的对比分析,并结合日常生活中的检索实例,对几种中文检索数据库进行了对比,浅谈网络信息检索工具的发展方向,并根据上述内容提出一些看法和建议。
关键词:信息;检索;信息检索;检索工具;搜索引擎;网络资源目录【s ummary 】This paper will mainly explains mainly the characteristics of network information retrieval tools, search engine and network resource directory of comparative analysis, and combined with the daily life of the retrieval examples, several Chinese retrieval database are compared, showing the network information retrieval tool development direction, and according to the above content, puts forward some opinions and Suggestions.【keyword】information; retrieval; information retrieval; search tool;Search engine; Catalogues of network resources引言根据中国互联网络信息中心2012年1月16日发布的《第29次中国互联网络发展状况统计报告》显示,目前我国网民规模已突破5亿。
由此可见,互联网已经在网民生活中占据一定地位.与此同时,互联网上的信息已是海量,搜索引擎则是网民在汪洋中搜寻信息的工具,是互联网上不可或缺的工具和基础应用之一。
跨媒体内容分析与检索技术研究随着信息化时代的到来,媒体内容的数量和种类越来越丰富。
人们从不同的媒体平台获取信息,例如新闻网站、社交媒体、视频网站等等,这些平台所提供的媒体内容信息形式各异,使得我们需要一种能够在跨媒体平台环境下实现内容的分析和检索技术。
本文将分析跨媒体内容分析与检索技术的研究现状和展望。
一、跨媒体内容定义跨媒体内容是指在不同的媒体平台上存在的同一主题或事件相关的内容。
以新闻报道为例,同一事件可能会在不同的新闻站点上以文本、视频、图片等多种形式进行报道。
跨媒体内容的存在导致了内容的多样性和复杂性,因此需要一种能够跨越不同媒体平台,实现对跨媒体内容进行分析和检索的技术。
二、跨媒体内容分析跨媒体内容分析是指利用机器学习、自然语言处理等技术,从跨越不同媒体平台的数据源中抽取出有用信息,分析并提取跨媒体内容的特征。
通过这些特征,我们可以对跨媒体内容进行分类、聚类、相似性计算等分析处理,从而实现对跨媒体内容的理解和把握。
跨媒体内容分析技术目前已经得到了广泛的应用,例如新闻事件监测、社交媒体口碑分析、视频内容自动标注等等。
以视频内容自动标注为例,我们可以利用图像处理和自然语言处理技术,从视频画面中识别出物体和人物等图像信息,从语音中提取出说话内容等文本信息,将这些信息进行处理和分析,最终自动生成视频的标注信息。
三、跨媒体内容检索跨媒体内容检索是指用户利用跨媒体内容特征,从跨越不同媒体平台的数据源中检索出与特定主题或事件相关的相关内容。
以新闻报道为例,当用户想要查找某个事件的相关报道时,可以从不同的新闻站点上检索相关的文本、图片、视频等媒体内容,并将这些内容进行统一的展示。
当前,跨媒体内容检索已经有了一定的应用场景。
例如,在社交媒体监测领域,我们可以从不同的社交媒体平台中检索出与某个品牌相关的关注度和评论情况,从而为企业决策提供数据支持。
四、跨媒体内容分析与检索技术挑战跨媒体内容分析与检索技术仍然存在着多个挑战。