网络信息检索及其检索工具
- 格式:doc
- 大小:74.00 KB
- 文档页数:8
第三章网络信息检索工具【知识框架】信息检索的一般流程网络经贸信息资源的概念与类型网络资源查询方法及检索工具▪按检索机制分:目录型(Subject directory, catalogue)索引型:搜索引擎(Search Engine)混合型(Hybrid tools)▪按检索内容分:综合型专题型特殊型▪按包含检索工具数量分:单一型(Singular search tools)集合型(Collective search tools):元搜索引擎(Metasearch Engine或Megasearch Engine 目录型检索工具(Subject directory catalogue)搜索引擎(Search Engine)▪单一搜索引擎▪集成搜索引擎检索工具的工具——指南类检索工具和元搜索引擎▪(一)网络资源指南(Resource Guide)也称学科门户SIG▪(二)元搜索引擎集合式搜索引擎、索引式搜索引擎▪(三)手工检索工具的“工具书指南”、网址簿网络版参考咨询工具(Reference Tools)智能搜索代理和搜索软件补充教材第二章:检索工具与语言检索策略【主要内容】1、信息资源检索的一般流程分析问题▪问题分类▪分析已知和欲知信息▪分析需求主题▪广泛利用文献▪选择检索范围选择检索工具▪熟悉各种检索工具从检索工具中查找所需信息获取原文2、网络信息资源的概念和类型1)按传输方式分:●WWW●FTP●Usenet/Newsgroup●LISTSERV/Mailing List●Telnet●Gopher●WAIS2)按内容加工一次加工信息▪网上图书、期刊、报纸、专利、政府出版物、会议资料等 二次加工信息▪文摘索引数据库、搜索引擎、网站导航等三次加工信息▪百科全书、手册指南等参考型网站3)格式与后缀3、网络检索工具的分类按检索机制分:▪目录型(Subject directory, catalogue)▪索引型:搜索引擎(Search Engine)▪混合型(Hybrid tools)按包含检索工具数量分:▪单一型(Singular search tools)▪集合型(Collective search tools):元搜索引擎(Metasearch Engine或Megasearch Engine4、目录型检索工具(Subject directory catalogue)1)网络资源目录这是一种独立型检索工具,网站自身包含可检索的数据库。
张龙飞 080905238信息检索工具与方法概述信息社会给人们带来了浩如烟海的信息,令人们享受不尽,同时也感到无所适从。
如何从泛滥的信息大潮中获有价值的东西,成了人们面临的迫切问题。
因此,信息检索能力的高低,绝顶了人们发展的潜力。
传统的教育模式注重书本知识的输入,不注意培养独立工作的能力和获取知识的技术和手段,结果培养出的人很难适应社会的发展。
面对信息社会的挑战,现代教育应该发展人们的综合水平,提高技术手段的培养。
因此,必需掌握最新的技术-----信息检索。
以下是根据我个人的了解对信息检索技术进行的阐述和概括。
信息检索是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。
即从信息集合中找出所需要的信息的过程,也就是我们常说的信息查寻。
那么,我们为什么要进行检索工作呢?在科研开发领域里,重复劳动在世界各国都不同程度地存在。
据统计,美国每年由于重复研究所造成的损失,约占全年研究经费的38%,达20亿美元之巨。
日本有关化学化工方面的研究课题与国外重复的,大学占40%、民间占47%、国家研究机构占40%,平均重复率在40%以上;我国的重复率则更高。
在这么多的信息之中要找到不重复而又有效的信息内容就必需进行检索。
要进行信息检索首先要有检索工具。
检索工具是指用以报导、存贮和查找文献线索的工具。
它是附有检索标识的某一范围文献条目的集合,是二次文献。
一般说来,检索工具应具备以下五个条件:①明确的收录范围;②有完整明了的文献特征标识;③每条文献条目中必须包含有多个有检索意义的文献特征标识,并标明供检索用的标识;④全部条目科学地、按照一定规则组织成为一个有机整体;⑤有索引部分,提供多种必要的检索途径。
目前可供人们使用的检索工具有很多,不同的检索工具各有特点,可以满足不同的信息检索的需求。
检索工具有不同的分类方法,按加工文献和处理信息的手段不同可分为:手工检索工具和机械检索工具;按照出版形式不同可分为:期刊式检索工具,单卷式检索工具,卡片式检索工具,胶卷式检索工具;按照载体形式不同可分为:书本式检索工具,磁带式检索工具,卡片式、缩微式、胶卷式检索工具。
网络信息资源检索工具和技巧作者:刘成来源:《企业导报》2016年第10期摘要:信息资源包括文献信息、图书馆信息、中文数据库、事实、数据、特种文献、科技论文和网络信息。
怎样查找出有效的信息是信息资源检索的目的,网络信息资源检索是信息资源检索的一个组成部分。
通过网络信息资源的特点,从搜索引擎的原理、类型、功能和趋势介绍了常用的中文搜索引擎、英文搜索引擎等检索工具和方法,使我们合理有效的进行网络学术资源的获取。
关键词:信息资源;技巧;检索工具一、网络信息资源的类型(1)按人类信息的方式划分为:非正式出版信息(如电子邮件、电子会议)、半正式出版信息(如各学术团体、机构等单位宣传自己的信息)、正式出版信息(如网络数据库、电子图书、电子版报纸、专利)。
(2)按信息来源划分为:政府信息、FTP信息资源、用户服务组信息组资源、公众信息资源、商用信息资源。
(3)按信息存储的方式划分为:电子邮件型资源、图书馆目录资源、书目与索引资源、全文资料及电子了出版物资源、数据库信息资源。
(4)按网络传输协议划分为:WWW,万维网;Telnet,远程登录;TFP,文件传输;用户服务组信息资源;WAIS,数据库索引查询服务。
二、网络检索工具(1)搜索引擎:网络上提供信息检索服务的工具系统。
工作原理为三步:第一步从互联网上抓取网页;然后建立索引数据库;最后在索引数据库中搜索排序。
(2)搜索引擎类型:①全文搜索引擎:通过从互联网上提取的各个网站信息而建立的数据库中检索与用户查询条件匹配的记录,按一定的排列顺序结果返回给用户,如Google、百度等。
②目录索引类搜索引擎:按目录分类的网站链接列表。
③元搜索引擎:一种调用其他独立搜索引擎的引擎,它是对多个独立搜索引擎的融合、调用、控制和优化利用。
(3)搜索引擎的检索功能主要包括:单词检索,大小写敏感检索,概念检索,词组/短语检索,布尔逻辑检索与AND,或OR,非NOT,词间位置限定检索,嵌套检索,截词检索和通配配符检索,多语种检索和检索结果的翻译等。
摘要进入20世纪90年代以后,互联网的发展风起云涌,人类社会的信息化、网络化进程大大加快。
与之相适应的信息检索的交流平台也迅速转移到以WWW为核心的网络应用环境中,信息检索步入网络化时代,网络信息检索已基本取代了手工检索。
网络信息资源的迅猛增长,使人们获得有用信息越来越困难,网络检索工具应运而生,文章介绍了网络信息检索工具的类型和功能,提出了检索工具的发展趋势。
关键字:网络信息检索;检索工具;因特网;web资源检索目录摘要 (I)1 信息检索的定义 (1)2网络信息检索简介 (1)2.1网络信息检索定义 (1)2.2 网络信息检索的原理 (1)2.3网络信息检索与传统信息检索的区别 (2)2.4网络信息检索技巧 (2)3网络信息检索工具类型 (3)3.1非web资源检索工具 (3)3.2web资源检索工具 (3)4网络信息检索工具的功能 (4)5网络信息检索展望 (5)5.1网络信息检索的展望 (5)5.2网络信息检索工具展望 (5)参考文献 (6)浅谈网络信息检索及其检索工具1 信息检索的定义什麽是信息?信息是消息,人们在学习、工作、日常生活中随时随地都在接受和利用信息;信息是资源,它具有使用价值和价值;信息是财富,且是无价之财富;信息是生产力要素,更是一种不可估量的促进生产力发展的新动力。
因此,人类社会的发展,科技技术的进步,都离不开信息资源的开发和利用。
而且,信息资源的真实状况及开发利用程度,已经成为衡量一个国家经济、文化、科技以及综合国力的重要指标。
我们怎样快速的查找信息和有序的整理信息?信息检索是最快的途径。
信息检索是指将信息按一定的方式组织和存储起来,并根据信息用户的信息需求查找所需信息的过程和技术。
人们获取信息源的方式主要有:①传统的信息检索方法,通过人工查询在图书馆等提供文献的机构进行文献的查询和获取活动;②联机信息检索相对于前者来说具有实时性、完整性、共享性、广泛性等优点;③网络信息检索是指通过网络信息检索工具检索存在于Internet信息空间中各种类型的网络信息资源。
2网络信息检索简介随着信息技术的飞速发展,信息已成为全社会的重要资源,对信息的占有程度及信息处理水平的先进程度已成为衡量一个国家或地区现代化程度的重要标志,而网络上丰富的信息在更大程度上改变了人们的工作和生活的方式。
Internet是当今世界上规模最大、覆盖面最广、信息资源最丰富、发展最为迅速的信息网络,基于Internet的网络信息检索的研究,无论对研究人员还是一般用户来说,都有着很强的现实性和实用性。
2.1网络信息检索定义网络信息检索是指通过网络信息检索工具检索存在于Internet信息空间中各种类型的网络信息资源。
2.2 网络信息检索的原理网络信息检索工具是网络信息检索技术的实物体现。
目前,常用的网络信息检索模型有布尔逻辑模型、模糊逻辑模型和概率模型等几种方式。
(1)布尔逻辑模型——这是一种简单而常用的严格匹配模型。
用户可以根据检索项在文档中的布尔逻辑关系提交查询,搜索工具根据事先建立的倒排文档结构确定查询结果。
标准的布尔逻辑模型为二元逻辑,所搜索的文档要么与查询相关,要么与查询无关。
利用这种模型进行查询,其查询结果一般没有按照内容的相关特性排序。
(2)模糊逻辑模型——它在查询结果处理中引进了模糊逻辑比较,并且按照相关的优先次序排列查询结果,这样就可以克服布尔逻辑模型信息查询结果的无序性。
(3)概率模型——它是基于贝叶斯概率原理而提出的,根据词条、文档间的内在联系,利用词条间和词条与文档间的概率相依性来进行信息检索。
2.3网络信息检索与传统信息检索的区别检索方式网络信息检索传统信息检索比较方面检索时间快慢检索指标查全率高查准率高检索费用相对低相对高(信息使用费、服务费、通讯费)信息内容范围数字化、多媒体信息纸制文献信息检索信息质量查全率高查准率高2.4网络信息检索技巧目前常用的信息检索方法有两种:一种是利用搜索引擎进行关键词、主题词或自然语言检索。
最著名的搜索引擎有AltaVista、Excite、HotBot、Info seek等;另一种是按主题分类指南进行检索,如Yahoo ! 就是按主题组织资源、逐次分类,供读者按需查词的;有的检索工具两种方式可以随时切换使用, 如Info seek。
相比之下, 前者信息的获取太杂乱, 鱼龙混杂, 精确度太低, 需通过多次筛选才能找到所需信息。
而后者的信息组织系统性较强,精确度较高。
但主要问题在于获取率较低且很难反映信息之间的关联性。
由此可见, 两种方法各有利弊, 读者要根据检索的目的来挑选和使用检索工具,同时要学习一些提高检索效果的方法和技巧。
(l) 检索关键词具体化;(2) 运用词组检索;(3) 巧用Boolean逻辑词:AND、OR 和NOT。
3网络信息检索工具类型网络信息检索工具是指在因特网上提供信息检索服务的计算机系统,其检索的对象是存在于因特网信息空间中各种类型的网络信息资源。
按检索资源的类型,可分为两大类:即非web资源检索工具和web资源检索工具。
3.1非web资源检索工具非web 资源检索工具是以 FTP、Telnet、Gopher等为检索对象。
(1)FTP类的检索工具这是一种实时的联机检索工具,用户首先要登陆到对方的计算机,登陆后即可以进行文献搜索及文献传输有关的操作。
使用 FTP(文件传输协议)几乎可以传输任何类型的正文文件、二进制文件、图像文件、声音文件、数据压缩文件等。
在这类检索工具中,Archie是最常用的。
Archie是自动标题检索软件,它借助于 FTP来访问。
用户只需告诉其要检索文件名的有关信息便可获得文件所在的主机名、路径。
与一般检索工具不同的是,它不用主题来实现相应的检索,而只能根据文件名和目录名进行检索。
它是获取免费软件和共享软件资源不可缺少的工具。
(2)Telnet 类的检索工具它指的是借助远程登陆在网络通信协议的支持下,在远程计算机上登陆,使自己的计算机暂时成为远程计算机的终端,进而可以实时访问,使用远程计算机中对外开放的资源。
使用Telnet协议进行远程登陆时需要满足以下条件:本地计算机上必须装有包含Telnet协议的客户程序;必须知道远程主机的IP地址或域名;必须知道登录标识与口令。
(3)基于菜单式的检索工具----GopherGopher是一种交互式、菜单式信息查询软件,它将各种信息资源加以分类,再用菜单的形式显示给用户。
目前通过Gopher可以进行以下类型信息查询:文本文件信息查询、 Telnet信息查询、电话簿查询、专有格式文件查询。
3.2web资源检索工具web信息资源是指建立在超文本、超媒体技术基础上,集文本、图形、图像、声音为一体,并以直观的图形用户界面展现和提供信息的网络资源形式,与之对应的 web 检索工具多种多样,大体分为三类:搜索引擎、目录型检索工具、多元搜索引擎。
(1)搜索引擎搜索引擎使用自动索引软件来发现、收集并标引网页 ,建立数据库;以 Web形式提供给用户一个检索界面,供用户输入检索关键词、词组或短语等检索项;代替用户在数据库中找出与提问匹配的记录 , 并返回结果且按相关度排序输出。
使用此类工具的检索方法被称为“关键词搜索”,可以在主页查询,也可以在类目下查询。
此类检索工具的优点是信息量大且新 , 速度快;缺点是准确性较差。
著名的搜索引擎如Meta Vista、Excite、天网、悠游等。
根据其逻辑功能的不同,可分为:搜索器、分析器、索引器、检索器、用户接口。
(2)目录型检索工具它是按照某种分类体系编制的一种可供检索的等级结构式目录。
分类方法以学科分类为主,也有采用图书分类方法的。
使用此类工具的检索方法被称为“分类搜索”,这是一种“自顶向下、逐步细化”的搜索方法。
自顶开始,每一层都分布有若干“链接点”,选择其中一个,就可沿此分支进入下一层,直到出现所需目标。
此类检索工具的优点是检索质量较高,缺点是检索到的信息数量有限,且新颖性不够。
有代表性的目录型检索工具如 Y ahoo、G alaxy、Lycos、网易、263 等。
现在,搜索引擎和目录型检索工具逐渐整合在一起,以增强检索能力。
(3)多元搜索引擎多元搜索引擎是将多个搜索引擎集成在一起,并提供一个统一的检索界面 , 且将一个检索提问同时发送给多个搜索引擎,同时检索多个数据库,再经过聚合、去重之后输出检索结果。
其优点是省时,缺点是由于不同搜索引擎的检索机制、所支持的检索算法、对提问式的解读等均不相同,导致检索结果的准确性差。
常用的多元搜索引擎有DOGPI LE、INFEREN等。
4网络信息检索工具的功能网络检索工具产生和发展的历史虽然不长,但它的功能却非常强大,关键词检索(Keyword)是最基本功能,包括以下几个方面:(1)布尔逻辑检索布尔检索在网络信息资源检索中使用的相当广泛,常用的布尔逻辑算符有 3 种: 逻辑或(运算符为 OR/ or ,有时也可用“|”符号表示)、逻辑与(运算符为 AND/ and ,有时也可用“&”、“+ ”号表示)、逻辑非(运算符为NOT/ not,有时也可用“!”、“-”号表示)。
(2)词组检索词组检索是将一个词组作为一个独立运算单元,进行严格匹配以提高检索的精度和准确度。
词组检索是一般数据库中最常用的方法,是通过使用逗号、双引号和括号进行检索。
(3)字段检索字段检索是一种用于限定提问关键词在数据库记录中出现的区域,控制检索结果的相关性,提高检索效果的手段,多以字段限定方式实现。
(4)截词检索为提高查全率而设计,绝大多数网络检索都支持这一功能,有的是自动截词 , 有的是有条件的截词,尤其在西文检索工具中更是广泛使用。
(5)位置检索位置检索是指允许指定 2 个单词之间的词序和词距的检索。
词序指单词之间前后顺序 , 词距指 2 个单词之间间隔单词数。
其操作符多为“NEAR”。
(6)概念检索概念检索是指使用某一检索提问词进行检索时 , 能同时对该词的同义词、近义词、广义词、狭义词同样进行检索 , 以达到扩大检索 , 避免漏检的目的。
5网络信息检索展望5.1网络信息检索的展望人类已经进入了信息社会,信息社会化与社会信息化是当今重要的时代特征。
信息检索作为传递、搜索信息的手段发展愈来愈快。
如果不懂得信息检索,要在浩如烟海的各种信息中寻找自己需要的信息,就如同大海捞针一般困难,掌握了信息检索的方法和技巧,就可以使信息的查询过程更有条理性、计划性,避繁就简,事半功倍。
所以,我们应充分利用信息资源,避免重复劳动。
科学研究具有继承和创造两重性,纵观科学技术发展史,积累、继承和借鉴前人的研究成果是科技发展的重要前提。
更新自身知识积累,适应社会发展需要。
在信息社会,人们需要终生学习,不断更新知识,才能适应社会发展的需求。