第二讲 网络信息检索基本方法
- 格式:ppt
- 大小:2.09 MB
- 文档页数:73
网络信息检索方法与途径作为知识经济时代不可缺少的工具,因特网正将全世界丰富的信息资源带到我们每个人的面前。
可以说,人们所需要的信息绝大多数都可在因特网上获得,而且大多数都可以免费获得,关键在于能否准确地找到。
用户若想花最少的时间和金钱,获得网络上丰富的信息,掌握一定的检索方法和技巧必不可少。
图书馆作为信息的集散地,在网络的影响下纷纷向着电子化、数字化、网络化方向发展,为了使更多的读者充分利用图书馆资源并实现资源共享,众多图书馆建立了馆藏机读目录数据库并提供网络服务。
目前。
网上有6000多个电子图书馆,包括美国国会图书馆在内的600多所著名公共图书馆、大学图书馆及4000多个学术机构的馆藏机读书目数据库,通过网络对外开放,它可以完全不受时间、距离的限制,这也是在网络环境下的图书馆优于传统图书馆的地方。
网络的开放性及交互性使得网上有很多动态性很强的信息,如网上新闻、政策法规、通告、会议消息、论文集、研究成果、产品消息、广告、BBS等,这些网上动态信息都是网络信息资源的重要组成部分。
网络信息检索是一种基于超文本方式的信息查询方式,超文本查询是以结点为单位组织各种信息,一个结点是一个“信息块”。
在信息的组织上采用网状结构,结点之间通过关系链加以链接,构成表达特定内容的信息网络。
网络信息检索策略设计遵循快、准、全及低成本的原则,以实现检索策略最优化。
与传统信息检索相比,网络信息检索具有如下特点:(1)具备网状链拉结构。
能够按照不同查询条件链接结构,按照不同查询条件链接点信息,以供浏览、查询,具有较强的索引功能。
(2)信息丰富。
结点媒体多样化,每个结点都能集成文本、图形、图像、声音、视频、动画等多种媒体,并能用多窗口图形界面予以表现。
(3)导航能力强。
可引导读者在复杂的网络信息图中漫游而不至于迷失方向。
用户可以利用导航机制了解其所在网络图中的位置。
(4)良好的编辑功能。
包括修改、增加、删除结点和链接的能力,对结点内的信息也具有良好的编辑能力,可以进行多窗口编辑。
计算机的信息检索技术有哪些详解信息检索的基本原理与方法信息检索是指通过计算机技术,从大量数据中快速找到所需信息的过程。
随着互联网的普及和信息爆炸的时代,信息检索技术的重要性日益突出。
本文将详解信息检索的基本原理与方法,以及常见的信息检索技术。
一、信息检索的基本原理信息检索的基本原理是通过索引和检索两个步骤实现的。
首先,在建立索引的阶段,将待检索的数据进行预处理,提取出关键词和相关信息,并建立索引文件。
索引文件包含了每个文档中所有的关键词及其所在位置的信息。
其次,在检索的阶段,用户输入检索词,系统根据索引文件快速定位到相关文档,并将其返回给用户。
二、信息检索的方法1. 布尔检索法布尔检索法是最早的信息检索方法之一,它通过逻辑运算符(例如AND、OR、NOT)将用户检索词与索引文件中的关键词进行匹配,从而找到满足要求的文档。
这种方法简单直接,但需要用户具有一定的逻辑思维能力。
2. 向量空间模型向量空间模型将文档表示为向量,并利用向量之间的相似度进行检索。
在该模型中,每个文档可以看作是一个向量,而检索词也可以转换为向量。
通过计算文档向量与检索向量之间的相似度,可以确定与用户需求最匹配的文档。
3. 概率检索模型概率检索模型基于信息检索的概率理论,利用检索词在文档中出现的概率和文档的相关性进行检索。
常见的概率模型包括贝叶斯模型和语言模型。
这种方法能够更准确地计算文档与检索词的相关性,提高检索结果的质量。
4. 自然语言处理技术自然语言处理技术在信息检索中起着重要的作用。
通过对自然语言的分析和理解,能够更好地理解用户查询的意图,并将其转化为机器可理解的形式。
常见的自然语言处理技术包括词法分析、句法分析和语义分析。
三、常见的信息检索技术1. 网页搜索技术网页搜索技术是信息检索中最常见的应用之一。
通过搜索引擎,用户可以快速找到互联网上的相关信息。
网页搜索技术常用的算法包括页面排名算法(例如PageRank算法)和关键词匹配算法(例如倒排索引)。
网络信息检索的方法与策略随着互联网的普及和发展,信息化时代的到来,网络信息已经成为人们获取信息和知识的主要渠道,而信息检索技能也逐渐成为了人们必备的基本技能。
网络信息检索可以帮助我们快速准确地找到需要的信息,提高我们的工作和学习效率。
但是,网络信息检索也需要一定的方法和策略,本文将从以下几个方面介绍网络信息检索的方法与策略。
一、确定搜索关键词网络信息检索的第一步是确定搜索关键词。
搜索关键词是我们检索信息的重要依据,只有正确选择关键词,才能得到准确的搜索结果。
在选择关键词时,我们要根据所要求的信息内容,从多方面考虑,尽可能的综合考虑,选择与其相关的词汇。
同时也可以尝试使用相关性搜索,即相似或相关的词汇,以得到更加精细的搜索结果。
二、选择搜索引擎网络搜索引擎是我们在网络中检索信息的主要工具,它可以帮助我们快速地找到与我们想要查询的信息相关的网站和资料。
目前,市面上有许多搜索引擎可供选择,如谷歌、百度、搜狗等,不同的搜索引擎有着各自的优缺点和特点,我们要根据实际需要选择合适的搜索引擎。
三、使用高级搜索网络搜索引擎大多数提供了高级搜索的功能,通过高级搜索,我们可以更加准确、快速地找到所需的信息。
高级搜索可以根据我们的需求,调整搜索结果的时间、格式、语言、位置、网站等多个维度,以得到更加符合我们需求的搜索结果。
四、查看搜索结果在查看搜索结果时,我们要根据所需信息的重要性和优先级,仔细查看每个搜索结果的标题和简介,以决定进一步查看详细信息的必要性和关注度。
同时,我们要注意排除一些与自己搜索内容无关的信息和广告等。
五、筛选和整理信息在通过搜索引擎获取到需要的信息后,我们还需要对这些信息进行筛选和整理,以便更好地使用和管理。
筛选和整理的重点是抓取有用的信息,剔除无用信息。
可以将信息进行分类、整理,制定个人信息管理系统,新近信息有计划地进行整理和更新。
六、保持持续学习网络信息检索是一个不断学习和提高的过程,我们需要始终保持学习的态度和意识,定期学习和了解新的搜索技巧和方法,以逐步提高自己的搜索能力和效率。
网络信息的检索方式网络信息检索方式指网络信息检索系统或数据库在检索首页界面或网页的各个不同检索区上设置的检索人口的总称。
检索方式有:简单检索、复合检索、高级检索、分类(浏览)检索、导航检索、专家检索等。
1.简单检索(SimPle Search) 也有称初级检索、自由词检索、基本检索。
指在数据库首页的检索词输入框(或称查询提问框)内输入一个单词或词组,提交检索工具查询的一种检索方式。
这是最基本的检索方式。
2.复合检索(Combine Search) 也称布尔逻辑组配检索(Bo01ean Search),或简称组配检索。
复合检索指在任意字段情况下在检索式输入框内输入复合逻辑检索式提交检索工具查询的一种检索方式。
3.高级检索(Advanced Search) 高级检索指在已设定的高级检索窗口中输入多个检索词,运用逻辑组配关系,查找同时满足多个检索条件的数据,在高级检索界面上一次性实现本应多次检索的结果的一种检索方式。
4.目录检索(Category Search)(或称分类检索) 有些检索工具,如雅虎、万方,提供分类目录检索。
目录检索是指目录按类名分类,每类又分若干子类目,层层逐级展开,最后点击末级类名,显示网页名链接和简短内容摘要,点击链接,显示相关网页内容(如雅虎),或显示该类的文献记录(如万方、维普)。
5.导航检索(NaVigation Search)或称浏览检索(Browse Search) 导航检索与目录检索相似,指在系统设置的导航区内按检索树格式逐级展开和进行浏览选择的检索方式。
导航检索有学科分类导航检索和刊名导航检索。
分类导航检索在选择到分类未级时会显示该类的全部文献记录。
刊名导航则在按刊名分类或字顺查到所需刊名时会显示该刊年份和期号,在选定期号后即会显示该期的目录,以供选择某文的题录、文摘或全文,如维普。
6.专家检索(Expen Search) 指系统在检索页面上设置一个较大的提问框供用户输入检另策略。