第四讲_网络信息检索工具1
- 格式:ppt
- 大小:9.97 MB
- 文档页数:75
摘要进入20世纪90年代以后,互联网的发展风起云涌,人类社会的信息化、网络化进程大大加快。
与之相适应的信息检索的交流平台也迅速转移到以WWW为核心的网络应用环境中,信息检索步入网络化时代,网络信息检索已基本取代了手工检索。
网络信息资源的迅猛增长,使人们获得有用信息越来越困难,网络检索工具应运而生,文章介绍了网络信息检索工具的类型和功能,提出了检索工具的发展趋势。
关键字:网络信息检索;检索工具;因特网;web资源检索目录摘要 (I)1 信息检索的定义 (1)2网络信息检索简介 (1)2.1网络信息检索定义 (1)2.2 网络信息检索的原理 (1)2.3网络信息检索与传统信息检索的区别 (2)2.4网络信息检索技巧 (2)3网络信息检索工具类型 (3)3.1非web资源检索工具 (3)3.2web资源检索工具 (3)4网络信息检索工具的功能 (4)5网络信息检索展望 (5)5.1网络信息检索的展望 (5)5.2网络信息检索工具展望 (5)参考文献 (6)浅谈网络信息检索及其检索工具1 信息检索的定义什麽是信息?信息是消息,人们在学习、工作、日常生活中随时随地都在接受和利用信息;信息是资源,它具有使用价值和价值;信息是财富,且是无价之财富;信息是生产力要素,更是一种不可估量的促进生产力发展的新动力。
因此,人类社会的发展,科技技术的进步,都离不开信息资源的开发和利用。
而且,信息资源的真实状况及开发利用程度,已经成为衡量一个国家经济、文化、科技以及综合国力的重要指标。
我们怎样快速的查找信息和有序的整理信息?信息检索是最快的途径。
信息检索是指将信息按一定的方式组织和存储起来,并根据信息用户的信息需求查找所需信息的过程和技术。
人们获取信息源的方式主要有:①传统的信息检索方法,通过人工查询在图书馆等提供文献的机构进行文献的查询和获取活动;②联机信息检索相对于前者来说具有实时性、完整性、共享性、广泛性等优点;③网络信息检索是指通过网络信息检索工具检索存在于Internet信息空间中各种类型的网络信息资源。
网络信息检索工具的类型信息检索的步骤一、分析研究课题,明确检索要求课题的主题内容、研究要点、学科范围、语种范围、时间范围、文献类型等二、选择信息检索系统,确定检索途径1、选择信息检索系统的方法:(1)在信息检索系统齐全的情况下,首先使用信息检索工具指南来指导选择;(2)在没有信息检索工具指南的情况下,可以采用浏览图书馆所的信息检索工具室所陈列的信息检索工具的方式进行选择;(3)从所熟悉的信息检索工具中选择;(4)主动向工作人员请教;(5)通过网络在线帮助选择。
2、选择信息检索系统的原则:(1)收录的文献信息需含盖检索课题的主题内容;(2)就近原则,方便查阅;(3)尽可能质量较高、收录文献信息量大、报道及时、索引齐全、使用方便;(4)记录来源,文献类型,文种尽量满足检索课题的要求;(5)数据库是否有对应的印刷型版本;(6)根据经济条件选择信息检索系统;(7)根据对检索信息熟悉的程度选择;(8)选择查出的信息相关度高的网络搜引引擎确定检索词的基本方法:选择规范化的检索词;使用各学科在国际上通用的、国外文献中出现过的术语作检索词;找出课题涉及的隐性主题概念作检索词;选择课题核心概念作检索词;注意检索词的缩写词、词形变化以及英美的不同拼法;联机方式确定检索词。
四、制定检索策略,查阅检索工具1、制定检索策略的前提条件是要了解信息检索系统的基本性能,基础是要明确检索课题的内容要求和检索目的,关键是要正确选择检索词和合理使用逻辑组配。
2、产生误检的原因可能有:一词多义的检索词的使用;检索词与英美人的姓名、地址名称、期刊名称相同;不严格的位置算符的运用;检索式中没有使用逻辑非运算;截词运算不恰当;组号前忘记输入指令“s”;逻辑运算符号前后未空格;括号使用不正确;从错误的组号中打印检索结果;检索式中检索概念太少。
3、产生漏检的原因或检索结果为零的原因可能有:没有使用足够的同义词和近义词或隐含概念;位置算符用得过严、过多;逻辑“与”用得太多;后缀代码限制得太严;检索工具选择不恰当;截词运算不恰当;单词拼写错误、文档号错误、组号错误、括号不匹配等。
网络信息检索的工具(一)摘要]搜索引擎是人们使用Internet信息资源的重要工具。
本文对目前的中文搜索引擎进行了简要的分析,指出了其存在的缺陷和发展的方向。
关键词]信息检索中文搜索引擎存在的问题发展方向随着Internet信息资源的迅速增长,如何在浩瀚的信息海洋中准确、方便、快速地找到自己所需的信息,成了迫切需要解决的问题,从1995年开始出现的信息检索工具——搜索引擎很好地解决了这一问题。
然而各种搜索引擎,特别是尚处于发展初期的中文搜索引擎还存在着很多的缺陷有待改进,本文旨在分析目前中文搜索引擎存在的主要问题,并为解决此类问题提出一些建议和方法。
一、搜索引擎的概念和及类型搜索引擎又称检索引擎,是指运行在Internet上,以信息资源为对象,以信息检索的方式为用户提供所需数据的服务系统,主要包括信息存取、信息管理和信息检索三大部分。
目前,中文搜索引擎主要有三种类型:目录式搜索引擎、机器人搜索引擎(又称全文搜索引擎)和元搜索引擎。
1.目录式搜索引擎。
目录式搜索引擎是以人工或半人工方式收集信息,建立数据库,由编辑人员在访问了某个web站点后,对该站点进行描述,并根据站点的内容和性质将其归为一个预先分好的类别。
由于目录式搜索引擎的信息分类和信息搜集有人的参与,其搜索的准确度较高,导航质量也不错。
但因其人工的介入,维护量大,信息量少,信息更新不及时都使得人们利用它的程度有限。
国内著名的新浪、搜狐、中文雅虎都属于这种类型。
2.机器人搜索引擎。
这是一种目前运用较广泛的搜索引擎。
国内以百度,google、天网为代表。
它是使用自动采集软件Robot,搜集和发现信息,并下载到本地文档库,再对文档内容进行自动分析并建立索引。
对于用户提出的检索要求,通过检索模块检索索引,找出匹配文档返回给用户。
机器人搜索引擎具有庞大的全文索引数据库。
其优点是信息量大,范围广,较适用于检索难以查找的信息或一些较模糊的主题。
缺点是缺乏清晰的层次结构,检索结果重复较多,需要用户自己进行筛选。