当前位置:文档之家› 第三章网络信息检索工具

第三章网络信息检索工具

第三章网络信息检索工具
第三章网络信息检索工具

第三章网络信息检索工具

【知识框架】

信息检索的一般流程

网络经贸信息资源的概念与类型

网络资源查询方法及检索工具

?按检索机制分:

目录型(Subject directory, catalogue)

索引型:搜索引擎(Search Engine)

混合型(Hybrid tools)

?按检索内容分:

综合型

专题型

特殊型

?按包含检索工具数量分:

单一型(Singular search tools)

集合型(Collective search tools):元搜索引擎

(Metasearch Engine或Megasearch Engine 目录型检索工具(Subject directory catalogue)

搜索引擎(Search Engine)

?单一搜索引擎

?集成搜索引擎

检索工具的工具——指南类检索工具和元搜索引擎

?(一)网络资源指南(Resource Guide)

也称学科门户SIG

?(二)元搜索引擎

集合式搜索引擎、索引式搜索引擎

?(三)手工检索工具的“工具书指南”、网址簿

网络版参考咨询工具(Reference Tools)

智能搜索代理和搜索软件

补充教材第二章:

检索工具与语言

检索策略

【主要内容】

1、信息资源检索的一般流程

分析问题

?问题分类

?分析已知和欲知信息

?分析需求主题

?广泛利用文献

?选择检索范围

选择检索工具

?熟悉各种检索工具

从检索工具中查找所需信息

获取原文

2、网络信息资源的概念和类型

1)按传输方式分:

●WWW

●FTP

●Usenet/Newsgroup

●LISTSERV/Mailing List

●Telnet

●Gopher

●WAIS

2)按内容加工

一次加工信息

?网上图书、期刊、报纸、专利、政府出版物、会议资料等 二次加工信息

?文摘索引数据库、搜索引擎、网站导航等

三次加工信息

?百科全书、手册指南等参考型网站

3)格式与后缀

3、网络检索工具的分类

按检索机制分:

?目录型(Subject directory, catalogue)

?索引型:搜索引擎(Search Engine)

?混合型(Hybrid tools)

按包含检索工具数量分:

?单一型(Singular search tools)

?集合型(Collective search tools):元搜索引擎(Metasearch Engine或Megasearch Engine

4、目录型检索工具(Subject directory catalogue)

1)网络资源目录

这是一种独立型检索工具,网站自身包含可检索的数据库。网络资源目录又称网站目录、分类站点目录、专题目录或主题指南、站点导航系统、主题词典型检索工具等。这是一种将网络资源搜集后,按某种分类法进行组织整理,并和检索法集成在一起的信息检索方式。

特点:

?人工设计和编制的、供检索的等级结构式目录(指南、导航系统)

?所收录资源经过鉴选和组织

?减少了检索中的噪音,提高了检索的准确性

?数据库的规模相对较小

?新颖性不强,(会有“死链接”dead link)

?用户要熟悉其分类体系

目录型检索工具比较适合于查找综合性、概括性的主题概念,或对检索准确度要求较高的课题

原理:

网络资源目录一般:

?采用人工方式采集网络信息;

?通常以某种分类体系为依据,将网络信息资源分为若干领域的主体范畴,然后再细分为各学科专题目录。

网络资源目录的分类通常采用主题分类法、学科分类法、体系分类法。一个网络资源目录包括许多层,第一层是总目录,将网络资源分成若干领域的主题范畴,然后链接到第二层专题目录,再链接到第三层子目录,依次而下,直至具体的信息资源,形成一个由信息链组成的树状结构。

有代表性的目录型检索工具:Yahoo 分类目录检索;开放目录项目(Open Directory Project ,简称ODP);

5、搜索引擎(Search Engine)

特点:

-收录、加工信息的范围广、速度快;

-检索功能强,一般可称为网络资源的关键词索引;

-检索时直接输入关键词或词组、短语,无需判断类目归属,比较方便;

-标引过程缺乏人工干预,准确性较差

-检索误差(噪音)较大

搜索引擎适合于检索特定的信息,及较为专、深、具体或类属不明

确的课题

工作过程:

单一搜索引擎的结构一般由三部分构成:信息采集、索引数据库、用户检索。用户所熟悉的只是占搜索引擎很小部分的人机交互界面——用户通过这一界面输入需要检索的信息,系统则反馈给用户相关的信息。构成搜索引擎主要内容的是不为用户熟悉的后台部分,即作为搜索软件程序的“Robot”、“Crower”、“Spider”。这类程序能自动地在网上漫游,从一个或一组URL开始访问,并进行本地索引,同时记录该URL所指的HTML文件中所有的新的URL链接,不停地以找到的URL为起点进行本地索引,直到再没有满足条件的新的URL地址或超出了某些限制。

自动采集信息是搜索引擎的主要功能。自动索引程序要对HTML文档中的超文本标记进行分析,提取出符合用户需要的主要内容,并存放在信息库中。这些软件会定期或不定期地拷贝所访问的国际互联网主机的内容,然后由提供检索服务的公司或单位统一进行标引和组织。

自动索引程序将采集和标引的信息汇集成索引数据库,并随时顺着链接跟踪网上新加入的主页,为其建立索引,这是搜索引擎提供检索服务的基础。

不同检索工具的数据库一般根据各自的信息资源采集的范围和侧重点设计而成,分类体系差别较大,没有统一的、严格的标准,收录的范围不一样,规模也不一样。数据库收录的内容一般有:网站的名称、标题、网址URL、网页的长度、相关的超文本链接点、关键词、内容简介或摘要等。

工作原理:

搜索引擎通常使用两种技术实现信息检索。

?一是使用网站分类技术,即把网站进行树状的归类,对每个网站都有简略的描述(如雅虎)。

其优点是为网络信息导航带来方便;

缺点是这种描述不能深入到网站内部,造成信息丢失。

?二是使用全文检索技术,全文处理的对象是文本,通过网页抓取程序对大量网页数据建立由字(词)组成的倒排索引,以便使用户用关键词对文档进行查询,系统则返回含该关键词的网页。

6、单一搜索引擎的结构

单一搜索引擎的结构一般由三部分构成:信息采集、索引数据库、用户检索.

7、检索工具的工具——指南类检索工具和元搜索引擎

1)网络资源指南(Resource Guide)

网络资源指南,一般被称为指南类检索工具, “网络检索工具的工具”,是为用户筛选质量好、效率高、符合需求的网络检索工具,并指出检索途径和方法的网络指南。

特点:网络指南多为大范围的网络链接,一般不直接提供检索结果,但却为人们检索其他各类网络信息提供重要的检索入口。这类指南可以克服搜索引擎检索结果杂乱的弱点,通过对网络专业信息资源的挖掘、采集、加工、整理和序化重组,形成一个专门为专业用户服务的信息资源指南,使检索更为系统、有序、快捷。这类指南使用的名称也多种多样,如虚拟图书馆的“咨询中心”、资源链接中心、资源索引(Resources Index)等。

2)学科信息门户

学科信息门户,亦称门户网站、信息门户(Subject Information Gateway),是将特定学科领域的信息资源、工具和服务集成为整体,为用户提供可靠的网络学科信息导航、方便的信息检索和服务入口。

作用:

通常为用户提供对因特网上信息和应用的“密集”访问方式,将来自不同信息源的信息集中在一个页面上,帮助用户通过统一的入口检索不同网站的信息,而无需逐个访问单独的网站。这种信息组织方式,再加上个性化服务和各种附加服务(如公共信息、邮件、信息订阅等),逐渐演变成为网络信息检索的又一高质量工具。

特点:

1)在线提供对若干站点和文档的链接;

2)通过人工筛选信息;

3)智能地产生包括注解和评论在内的内容描述信息(如元数据),有的提供信息的分类和主题标引;

4)智能地构建分类浏览结构;

5)支持手工构建单个信息资源的(书目)元数据。

与搜索引擎的比较:

学科信息门户:

?主要不是通过自动化手段来获取和组织信息,而是采用人工选择和标引保证信息的质量,使之在数量上少而精;

?在信息组织上采取分类浏览结构;

?在检索手段上不仅支持传统的基于数据库的字段检索、截断检索等功能,还支持在主题词表、后控词表支持下的智能检索.

3)元搜索引擎

元搜索引擎又称为集合式搜索引擎、索引式搜索引擎,它将多个搜索引擎集成在一起,并提供一个统一的检索界面。当用户发出检索请求后,通过转义在多个单一搜索引擎中查询,对查询结果进行处理(归并、删除重复、校验连接、按相关度排列结果),然后返还给用户。换言之,这是一种“引擎的引擎”,或“引擎指南”,使用户能在更广的范围内,更方便快捷地进行检索。

这类搜索引擎的代表是WebCrawler、InfoMarket等。

元搜索引擎的类型:

元搜索引擎可分为三种类型:搜索引擎目录、多元搜索引擎和多元搜索引擎的其他衍变形式。

搜索引擎目录

?这是一种采用关键词检索、非独立型的检索工具。

?它把主要的搜索引擎集中在一起,并按类型或检索问题编排组织成目录,帮助用户根据需要来选择适合的搜索引擎。搜索引擎目录集中罗列检索工具,使用

户能方便地选择相应的工具进行检索,检索的还是某一搜索引擎的数据库,与

普通单一搜索引擎的检索是一样的。

常用的搜索引擎目录有ALL-in-one、CUSI、iTools!、悠游、北极星等;

还有:iTools: https://www.doczj.com/doc/7516926837.html,/;百度常用搜索导航:https://www.doczj.com/doc/7516926837.html,/life/;https://www.doczj.com/doc/7516926837.html,

多元搜索引擎

?这也是一种采用关键词检索、非独立型的检索工具。多元搜索引擎将多个搜索引擎集成在一起,提供一个统一的检索界面,并将一个检索提问同时发给多个

搜索引擎,同时检索多个数据库。用户输入检索式后,检索工具将其译码,将

检索式同时传送到几个搜索引擎,再将检索结果统一汇集整理后提交给用户。较有代表性的元搜索引擎:

Dogpile: https://www.doczj.com/doc/7516926837.html,

Metacrawler: https://www.doczj.com/doc/7516926837.html,/

https://www.doczj.com/doc/7516926837.html,: https://www.doczj.com/doc/7516926837.html,

万纬搜索: https://www.doczj.com/doc/7516926837.html,/

多元搜索引擎的其他衍变形式

?(1)“一站式搜索引擎”(one-stop search engine)没有多元搜索引擎的调度机制和显示机制,因此不能综合显示结果。在编制原理上它与网络资源目录的原理

极为相似,在一级标题下列出二级标题,甚至三级标题。用鼠标点击各级标题

得到搜索该主题的搜索网页或网站,然后再根据网站的检索原理进行检索。这

种检索工具除可采用标题检索外,还可以使用关键词进行检索。

这类检索工具主要有:

?Web-search(https://www.doczj.com/doc/7516926837.html, )、

?https://www.doczj.com/doc/7516926837.html, (https://www.doczj.com/doc/7516926837.html, )、

?https://www.doczj.com/doc/7516926837.html, (https://www.doczj.com/doc/7516926837.html, )等。

?(2)链接多个搜索引擎的搜索引擎的工作原理是用户在检索框中输入检索式后,检索式同时在几个搜索引擎上运行,然后在一祯屏幕上显示出在几个搜索

引擎上检索的结果。与上述多元搜索引擎不同的是,它不是利用显示机制综合

检索结果,而只是列出搜索引擎的名称及网址,并在搜索引擎下列出检索结果。

这类检索工具有:Dogpile (https://www.doczj.com/doc/7516926837.html,)等.

8、网络版参考咨询工具(Reference Tools)

书目类检索工具有报道出版信息的出版商网站、在版书目数据库、出版在线;报道文献收藏信息的数字图书馆目录、联机目录。仅中国国家图书馆的书目类检索工具就有国家书目数据库、中国数字图书馆书目数据库、民国时期中文图书书目数据库、民国期刊书目数据库、中文报纸书目数据库、善本目录数据库等。

论文类检索工具包括以定期连续发行、及时记录与通报报刊论文为主的索引、文摘、专科书目、网络版的期刊篇名数据库等,以及会议录书目、会议录索引、学位论文索引及文摘。

9、智能搜索代理和搜索软件

1)搜索代理

智能搜索代理是另外一种检索互联网信息的工具。它对用户信息需求、偏好进行甄别、归纳、总结,分析用户的兴趣爱好,并借助学习好的规则,自动、独立地代理用户查找其感兴趣的信息。

特点:

第一,智能性。具有丰富的知识和一定的推理能力;

第二,代理性。在功能上是用户的某种代理,它可以代替用户完成一些任务,并将结果主动反馈给用户;

第三,移动性。可以在网络上漫游到任何目标主机,并在目标主机上进行信息处理操作;

第四,主动性。能根据用户的需求和环境的变化,主动向用户报告并提供服务.

比较成功的智能搜索代理有WebWatcher、Letizia、365agent网站的“情报通”等。

2)搜索软件

搜索软件的最大特点是可以同时启动Internet上的多个搜索引擎进行搜索,在这个意义上,它与元搜索引擎的功能相似,但这类软件不提供在线服务,而是通过下载并安装在本地计算机上运行,故又称为桌面元搜索引擎或软件式搜索引擎。

另外一个特点是安装和使用不复杂,用户在个人计算机上就可以实现,并且可以自定义检索时运行的搜索引擎集合,以实现对多个搜索引擎的并行搜索。

再次,搜索软件往往具有重要的后期处理功能。

补充:教材第二章信息检索的基本知识

1.检索工具【p36-41】

工具书的分类:2大类,14小类

?所谓工具书是专供查找知识信息的文献。它系统汇集某方面的资料,按特定方法加以编排,以供需要时查考用的文献。

?工具书的类型

?二次文献:提供线索的指示型检索工具

?书目、馆藏目录

?索引

?文摘

?工具书指南

?三次文献:提供具体信息的参考型检索工具

?词典引语工具书

?百科全书、类书、政要

?传记资料、手册、机构名录、地理资料

?统计资料、年鉴、表谱图册、政府文献

1)书目

?书目是指一批相关文献的记录,其基本功能是反映某一地区、某一时期在某一领域中出版物的信息。

?是馆藏书目或联合目录的补充工具。

?描述性书目

?评论性书目

?注释性书目

?书目的分类(p125-127)

?按照书目的编制目的和社会职能:登记书目、同胞书目、参考数据、推荐书目、书目之书目等

?按收录内容与范围:综合性书目、专科书目、地方文献书目和个人著述目录

?按时间:现行书目、回溯性书目、预告书目等。

2)索引

?索引是揭示文献内容出处、提供文献查考线索的检索工具。

?篇目索引:以篇为检索单元,对于研究某一专深领域或希望得到最新资料的用户价值大。

?期刊索引

?报纸索引

?会议录索引

?文集索引

?内容索引:附在专著或年鉴、百科全书等工具书之后的书后索引,微观,按主题词、人名、地名、时间、概念等内容编排。

3)文摘

?文摘是一种既揭示文献外部特征,又通过摘录文献要点报导文献内容的检索工具。

?指示性文摘:主题、研究方法、结论、用途、参考价值

?报导性文摘:内容、观点、方法、设施

?文科还采用描述性文摘。

?按编写目的,可分为普及性文摘和学术性文摘。

?按编写方式,可分为题录式文摘、指示性文摘和报道性文摘。

?按出版方式,可分为报刊式文摘、附录式文摘和卡片式文摘。如:《化学文摘(CA)》、《科学文摘(SA)》、《中华文摘》、《经济参考文摘》等。

4)字典、词典(Dictionary)

是汇集各种语言中的字词及短语,分别给予拼写、发音和词义解释等项信息,并按字顺组织起来方便读者随时查检特定词语信息的语言工具书。

?语言词典,传记词典、地名词典及各个学科的知识词典。

?语文词典、专科词典和综合词典。

5)年鉴:(Yearbooks/Annuals and Almanacs):

是逐年出版,提供相应年份内各行现行资料的工具书。常有幸被称为“微型百科全书”。既是各类动态性资料和实事、数据的综合性查考工具,也是编制百科全书类工具书的基本信息源。

6)百科全书Encyclopaedia

百科全书是一种重要的知识密集型工具书,它总结和组织了世界上累积的知识,是百科知识的汇总。是一种理想的参考工具书。要查以下问题,就会利用百科全书,如:概念、定义、背景性材料、人物传记资料、地名、组织机构、规范材料、图像材料、事件、活动、奇特事务等一般事实性咨询问题。

7)手册(Handbook/ Manuals):

以简明、缩写方式提供专门领域内基本的既定知识和实用资料的工具书。便于查检专门知识与具体实用资料。常以叙述和列表或图解方式来表述内容,并针对某一专业学科或专门部门,收集相关的事实、数据、公式、符号、术语以及操作规程等专门化的具体资料。手册可分为综合性和专科性两种。

8)图录表谱Tables

图录是以图像揭示事物的工具书,表谱是以编年或表格形式记载事物发展的工具书。图录表谱的主要特点是直观形象和简明清晰。

2检索入口

文献特征:外表特征{题名、著者、序号};内容特征{分类、主题、关键词}

3.检索语言

自然语言与规范语言。

分类语言与主题语言。

直接以代表文献内容特征和科学概念的概念词作为检索标志,并按其外部形式组织起来的一种检索语言。

【习题】

一、单项选择题

1. 5.Alta Vista属于哪种搜索引擎:()

A. 单一搜索引擎

B. 索引搜索引擎

C. 网络搜索软件

D 引擎的引擎

2.对一批相关的图书报刊进行著录,并按一定的次序编排而成的登记、报道和宣传书刊文献的检索工具是:()

A. 书目

B. 索引

C. 文摘

D. 期刊

3.CNKI可以提供下列哪些检索途径( )

A.文献外表特征(刊名、作者、ISSN)、

B.文献内容特征(分类、关键词、主题词)

C.中文摘要

D.引文索引

E.A、B & C

* 4.“元搜索”就是:()

A.基于模式的概念,允许对某种特性的文本片段进行检索

B.利用元搜索引擎先对综合性搜索引擎进行主题相关的检索,再分析返回的页面C.从已经组合好的文档集中检索出信息

D.沿着一条条链,从一个视图切换到另一个视图的操作

*5. 元搜索引擎是指:( )

A.网络蜘蛛

B.信息索引程序

C.用全文检索技术实现的搜索引擎

D.网络指南

E.将多个搜索引擎集成在一起,并提供一个统一的检索界面的搜索引擎

6.下列不属于搜索引擎目录的是:( )

A.ALL-in-one

B.悠游

C.新浪

D.iTools!

E.北极星

7. 检索的一般程序为:( )

A.分析问题、选择检索工具、确定检索入口、获取原文

B.选择检索工具、确定检索入口、分析问题、获取原文

C.分析问题、确定检索入口、选择检索工具、获取原文

D.选择检索工具、分析问题、确定检索入口、获取原文

E. 确定检索入口、分析问题、选择检索工具、获取原文

8.对一批相关的图书报刊进行著录,并按一定的次序编排而成的登记、报道和宣传书刊文献的检索工具是:()

A. 书目

B. 索引

C. 文摘

D. 期刊

9.以原文为基础浓缩而成的摘要称为:()

A. 题录性文摘

B. 报道性文摘

C. 指示性文摘

D 专业性文摘

10.下列属于文献外部特征的是()

A. 分类

B. 主题

C. 关键词

D. 题名

11.WWW的超链上,用户的浏览顺序和所到站点完全由自己决定,这一特性称为:()

A. 超文本系统

B. 交互性

C. 分布式

D. 动态性

12.以提供文献内容梗概为目的,不加评论和补充解释的工具是:()

A. 书目

B. 索引

C. 摘要

D. 年鉴

13.检索公司及产品信息一般选用哪种检索工具:()

A. 企业名录

B. 索引

C. 文摘

D. 年鉴

14.将报刊书籍中某些重要的有意义的信息按一定方式编排,并注明出处,以供检索的工具是:()

A. 摘要

B. 手册

C. 书目

D. 索引

15.可以描述文献之间内在关系的索引是:()

A. 书评索引

B. 文集索引

C. 引文索引

D. 期刊索引

16.与传统联机检索相比,哪一项不属于Internet的优势:()

A. 交互式作业方式

B. 系统透明度较高

C. 信息检索空间可拓宽

D. 安全有保障

17.以下哪项不属于文摘的作用:()

A. 通报最新科学文献

B. 节省阅读时间

C. 引导检索原文

D. 多途径提供更深层次的信息

18.揭示文献的主要内容和基本观点的文摘是:()

A. 题录性文摘

B. 报道性文摘

C. 指示性文摘

D. 专业性文摘

19.下列哪一种属于单一搜索引擎的一般结构:( )

A. 索引数据库

B. 信息采集、索引数据库、用户检索

C 用户检索

D 信息采集、索引数据库

E 索引数据库、用户检索

20.WWW把信息放在不同的站点上,这一特性称为:()

A. 超文本系统

B. 交互性

C. 分布式

D. 动态性

二.多项选择

1.以所需文献的内容特征为依据的检索入口途径主要包括()()()()

A 著者途径

B分类法途径

C主题法途径

D关键词法途径

E 标题途径

2.光盘检索的优势是()()()()

A检索系统配置简单

B检索费用低廉

C系统操作和检索步骤比较简单

D更新快

E联机检索前进行预检和用户培训的有用工具

3.书目按照收录内容与范围分类,可以为( ) ( ) ( ) ( ) A综合性书目

B专科书目

C地方文献书目

D登记书目

E个人著述书目

4.单一搜索引擎的结构一般由以下三部分构成. ()()()()

A 信息采集

B超文本系统

C索引数据库

D用户检索

E路由器

5.以下搜索引擎属于元搜索引擎的是()()()()

A WebCrawler

B北极星

C AltaVista

D Yahoo!

E Cyber411

6.主题法的显著特点在于下列三个方面()()()()A系统性

B快捷性

C专指性

D直接性

E集中性

7.文摘的作用主要有()()()()

A通报最新科学文献

B节省阅读时间

C引导检索原文

D 揭示学科间交叉和渗透的关系

E能获得因语言障碍无法得到的科学文献

三.匹配题

1. Internet采用了层次型结构的命名机制()()()()

rec 1)用于网络支持中心

edu 2)用于军事部门

net 3)用于娱乐休闲机构

mil 4)用于教育部门

2.网络传输协议指定访问所需文档时使用的协议,有几种形式:()()()()http:// 1)访问web服务器

ftp:// 2)使用文件传输协议连接到FTP服务器上

telnet:// 3)访问本地计算机中的文件

file:// 4)使用远程登录协议启动一个会话,访问某台主机

3. 工具书的书名、目录、版权页等信息可以帮助我们了解工具书:()()()()

书名、副书名1)用来了解改编和材料更新的时间

出版者项2)了解工具书的结构

版权期和重印期3)用来判断工具书的权威性

目录4)用来了解工具书的编撰目的和收录范围用来

4.以下网络信息获取方式属于哪一种用户行为:()()()()

从已经组合好的文档集中检索出信息1)航行

检查返回的结果,然后选择某个返回项2)浏览

沿着一条条链,从一个视图切换到另一个视图的操作3)查看

随意的、无指导的对信息结构的探查4)选择

四.名词解释

*1. 元搜索引擎

*2. 主题检索语言

*3 桌面元搜索引擎

*4 智能搜索代理

5 单一搜索引擎

6.网络资源目录:

7.学科信息门户

8.超文本

五.简答题

*1.请简述搜索型检索工具的特征和作用。

*2.简述学科信息门户的信息组织特点。

*3.简述搜索引擎目录的工作原理。

4.请举例简述目录型检索工具的特征。

5. 搜索引擎通常采用哪两种技术实现信息检索?

6.作为一种网络信息检索工具,学科信息门户与搜索引擎有什么不同?

7.通过企业名录能获得哪些市场信息?

8.按检索机制分,网络信息检索工具有哪些类型?

9.学科信息门户的信息组织方式及其作用。

六.分析题

1.请解释单一搜索引擎的检索原理。

2.智能搜索代理有什么特点?

*3.解释两种类型的元搜索引擎及其作用。

4.论述学科信息门户作为一种网路信息检索工具的特点及其作用。

5. 请举例解释网络资源指南类检索工具。

6. 描述两种类型的元搜索引擎及其在搜集市场信息中的作用。7.智能搜索代理有什么特点?

网络信息检索及其检索工具

摘要 进入20世纪90年代以后,互联网的发展风起云涌,人类社会的信息化、网络化进程大大加快。与之相适应的信息检索的交流平台也迅速转移到以WWW为核心的网络应用环境中,信息检索步入网络化时代,网络信息检索已基本取代了手工检索。 网络信息资源的迅猛增长,使人们获得有用信息越来越困难,网络检索工具应运而生,文章介绍了网络信息检索工具的类型和功能,提出了检索工具的发展趋势。 关键字:网络信息检索;检索工具;因特网;web资源检索

目录 摘要 .......................................................................................................................................... I 1 信息检索的定义. (1) 2网络信息检索简介 (1) 2.1网络信息检索定义 (1) 2.2 网络信息检索的原理 (1) 2.3网络信息检索与传统信息检索的区别 (2) 2.4网络信息检索技巧 (2) 3网络信息检索工具类型 (3) 3.1非web资源检索工具 (3) 3.2web资源检索工具 (3) 4网络信息检索工具的功能 (4) 5网络信息检索展望 (5) 5.1网络信息检索的展望 (5) 5.2网络信息检索工具展望 (5) 参考文献 (6)

浅谈网络信息检索及其检索工具 1 信息检索的定义 什麽是信息?信息是消息,人们在学习、工作、日常生活中随时随地都在接受和利用信息;信息是资源,它具有使用价值和价值;信息是财富,且是无价之财富;信息是生产力要素,更是一种不可估量的促进生产力发展的新动力。因此,人类社会的发展,科技技术的进步,都离不开信息资源的开发和利用。而且,信息资源的真实状况及开发利用程度,已经成为衡量一个国家经济、文化、科技以及综合国力的重要指标。我们怎样快速的查找信息和有序的整理信息?信息检索是最快的途径。 信息检索是指将信息按一定的方式组织和存储起来,并根据信息用户的信息需求查找所需信息的过程和技术。人们获取信息源的方式主要有:①传统的信息检索方法,通过人工查询在图书馆等提供文献的机构进行文献的查询和获取活动;②联机信息检索相对于前者来说具有实时性、完整性、共享性、广泛性等优点;③网络信息检索是指通过网络信息检索工具检索存在于Internet信息空间中各种类型的网络信息资源。 2网络信息检索简介 随着信息技术的飞速发展,信息已成为全社会的重要资源,对信息的占有程度及信息处理水平的先进程度已成为衡量一个国家或地区现代化程度的重要标志,而网络上丰富的信息在更大程度上改变了人们的工作和生活的方式。Internet是当今世界上规模最大、覆盖面最广、信息资源最丰富、发展最为迅速的信息网络,基于Internet的网络信息检索的研究,无论对研究人员还是一般用户来说,都有着很强的现实性和实用性。 2.1网络信息检索定义 网络信息检索是指通过网络信息检索工具检索存在于Internet信息空间中各种类型的网络信息资源。 2.2 网络信息检索的原理 网络信息检索工具是网络信息检索技术的实物体现。目前,常用的网络信息检索模型有布尔逻辑模型、模糊逻辑模型和概率模型等几种方式。 (1)布尔逻辑模型——这是一种简单而常用的严格匹配模型。用户可以根据检索项在文档中的布尔逻辑关系提交查询,搜索工具根据事先建立的倒排文档结构确定查询

网上搜索的方法和技巧

网上搜索的方法和技巧 我们已经知道网上有多种多样的教育资源,从技术上讲,它们是在Internet的多种服务功能的支持下实现的,包含WWW、e-mail、Usenet、FTP、BBS等,其中发展最快,也是最为流行的是WWW。因此我们着重介绍WWW信息的检索方法。 据1999年底的统计,网上大约有15亿个网页,并且以每天增加190万个网页的速度在增长,到2002年已达到80亿个网页。要想在这么大的一个资源库中查找一条具体 的信息,犹如大海捞针一般。因此,有人发出这样的感叹:"我们淹没在数据资料的的海 洋中,却又在忍受着知识的饥渴"。 现在出现了许多种在网上查找信息的方法。这些方法可以分为两类:一类是有既定目标的查找,一类是没有目标的查找,而后者往往是指一种网上"冲浪"游戏。在具有既定目标的情况下,如果已有信息线索,可以用浏览器航行的办法寻找信息对象;如果信息线索未定,则需要利用搜索工具首先获得信息线索。 搜索工具又有传统工具和现代工具之分。传统工具是在索引数据库中进行主题树/目录检索或KWDSEs(关键词搜索引擎)进行建设而索引库的建设是一个极其繁重的任 务,现在已经可以利用"机器人"程序来帮忙,它们通过跟踪最新建立的HTML网页的URL对整个网络进行浏览,可以在网上从这一个网站爬到另一个网站,并记录下它们访问过的网页的各自特征(这种只有十来年历史的搜索技术就被称为传统工具了,你觉得 奇怪吗?)。而现代搜索工具是利用智能代理来工作,它们不是对整个网络进行索引,而 是在接到一个新任务时就出发,去搜索网上资源并提取有价值的信息。因此,智能代理 是利用神经网络技术进行搜索,它试图去发现自然语言与样本网页的模式及它们之间的 相互关系,这些将与新近发现的网上资源相匹配,最后以一串网址的形式供用户访问。 图2_3_10显示了网上信息检索工具的选择方法。

网络信息检索与利用参考试题与答案

网络信息检索与利用 一、名词解释题: 网络信息资源:是将文字、图像、声音、动画等各种形式的信息,以数字化形式存储并借 助计算机与网络通讯设置发布,收集、组织、存储、传递、检索和利用信息资源。www:信息检索 数据库:是至少有一个文档组成并能满足某一特定目的或某一特定数据处理系统需要的一 种数据集合。 联机检索:指用户利用计算机联合通过通讯网络与世界各地的信息检索系统联机,从检索系统的数据库中查找出所需信息的过程。它允许用户以智能机对话,联机会话,这样交互的方式直接访问检索系统及数据库、检索是实时在线进行。 查全率:是指检出文献中合乎需要的文献数量占数据库中存在的合乎该需要的所有文献的 比例。 查准率:是指检出文献中合乎需要的文献的数量占检出文献的全部数量。 关键词:关键词又称自由词,它属于自言语言范畴。关键词是直接来自文献本身,能够反映文献主题概念,具有实际检索意义的词语。以搜索引擎为代表的基于关键词的检索工具能够利用全文索引技术。 布尔逻辑检索:又称布尔代数是指使用,and,or,not等运用符,查找含有某种词语特定 主配形式的网页。 搜索引擎:是一个可以用文件名查找文件的系统。 元搜索引擎:是一种基于搜索引擎的网络检索工具。它是将多个搜索引擎集合在一起,通过一个统一的检索界面接收并处理用户的查询提问。在进行检索时调用一个或者多个独立搜索引擎的数据库。 桌面元搜索引擎:顾名思义,桌面元搜索引擎不是通过网上调用方式在线使用,而是直接在用户的计算机上进行,相当于用户自己拥有一个元搜索引擎,所以称之为桌面元搜索引擎。 All-in-One式元搜索引擎:又称搜索引擎元目录,它将主要的搜索引擎集中起来,并按类 型或检索问题等编排组织成目录帮助导引用户根据检索需求来选择适用的搜索引擎。联 合书目数据库:联合目录是揭示报道若干个文献收藏单位的文献入藏情况,汇总若干个单 位馆藏的书目信息的目录。 参考信息:是指人名、地名、机构、事件、统计数据等一类数据,事实信息,是人们的工 作研究和日常生活中经常要查考、引用的信息。 二、简答题和论述题: 1. 网络信息资源的种类分哪几种? 答:可分为五种:1.web信息资源。其中有www有关的重要概念:(1)超文本传输协议HTTP(2)超文本标记语言HTML(3)通用资源定位程序URL(4)主页(home page)(5)链接(link)(6)浏览器 2.Telnet:是通过远程登录后,可以访问共享的远程系统中的资源。 3.FTP信息资源,是因特网适用的文件传输协议。 4.用户组信息资源,是有一

网络信息检索期末考试试卷及答案

绵阳师范学院历史文化与旅游管理学院 第一部分(基础知识部分,共三大题,共60) 一、填空题(每空1分,共30分) 1 ?信息是自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互关系、相互作用等运动状态的表达。 2. 知识是在改造客观世界的实践中获得的对客观事物存在和运动规律的认知和总结,是人的大脑通过思维重新组合的系统化的信息的集合。 3. 情报是人们用来解决特定问题所需要的、经过激活过程活化了的具有使用价值的知识或信息。 4. 文献是在存储检索利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、载体上或依附载体而存有信息或数据的载体。 5 ?会议文献是指在国内外学术或非学术会议上发表的论文或报告。 6 ?学位论文是高等院校和科研机构的毕业生为获取各级学位在导师指导下撰写和提交和科学研究、科学实验的书面报告。 7.著录是对文献内容和形式特征进行选择和记录的过程。 8 ?数据检索是指特定的数值型数据为对象的检索。 9. 在印刷型资源时代,事实与数据检索工具主要依靠各类参考工具书完成各种数据或事实的查询。 10. Internet 是基于TCP/IP协议的网络。 11. 二级域名https://www.doczj.com/doc/7516926837.html,是指教育机构。 12. 目前WW环境中使用较多的网页浏览器有Microsoft公司的IE浏览器和360公司的360安全浏览器。 13. 每种网络信息检索工具一般由信息米集子系统、数据库和检索代理软件三部分组成。 14. 大多数搜索引擎允许用户使用布尔逻辑运算符,以及与之对应的: “ +”表示限定搜索结果中必须包含的词汇,“-”表示限定搜索结果中 不能包含的词汇。 15. 一些搜索引擎提供了按链接和网域等进行搜索范围的限制,比如, 用site表示搜索结果局限于某个网站。比如,用in title 表示到某个URL地址指定的网页标题内进行检索。比如,用UnJ表示到某个URL地址指定的地址内进行检索。 16. 搜索引擎中,在普通查询词前面加一个filetype 表示对文档类型限定。或例如:访问百度文档的地址也可以达到此效果,它的网址是: https://www.doczj.com/doc/7516926837.html,/ 17. CNKI数据库下载的全文格式很多,如:caj,pdf,nh,caa,kdh 需要下载安装CAJViewer全文浏览器软件或亚全文浏览器软件才能阅读这些资源。 18 .维普资讯网的高级检索中,查询语句“ K= (CAD+CAM*R=a械”表示的意思是查找文献或文摘中含有“机械”,并且关键词中含有CAD或CAM勺文献或文摘 19. OPAC中文或者英文的解释是联机图书馆公共检索目录 20. 国内提供电子图书服务的网络站点很多,常用的有书生之家数字图书馆、方正Apabi数字图书馆、中国数字图书馆等。 二「单项选择题(每题1分,共20 分) 1. 下面哪项不是情报构成的三 要素之一( D ) B .经过传递 D.通过购买获取 B?最主要的信息资源 D.按知识门类或专题组织、浓缩而 A ) o A. 期刊文献 B.科技报告 C?专利文献 D.学位论文 4. 报纸区别于其它文献的特征是( B )o A. 创新性 B.及时性 C.学术性 D.全面性 5. 有法律约束力和一定的时效性,经权威机构批准的规章性文献是 (A )o A.标准文献 B.学位论文 C?档案文献 D.科技报告 6. 一般存在相应二次文献的是( A ) A.期刊 B.产品样本 A.本质是知识 C?经过用户使用产生效益 2. —次文献是(A )0 A.最原始的信息资源 C.对文献的集中提炼和有序化 成 3. 下面哪一项是白色文献(

专业文献检索第三章课件

第三章文献信息检索基本原理及方法 3.1.1 文献信息检索的基本含义 一、文献信息检索的基本含义 检索”即“查找”之意。信息检索,是将信息按照一定的方式组织、存储起来,并针对用户的需要查找所需信息的过程。因此信息检索包含了信息的存储和检索两个不可分的部分。我们通常所说的信息检索是指狭义的信息检索,即从检索工具和检索系统中查找所需信息的过程及其所采取的一系列方法和策略。 3.1.2 文献信息检索的类型 按检索手段:(1)手工检索:依靠手工操作来完成检索过程,所用文献一般是以纸张为载体。 (2机械检索:主要是指利用计算机进行文献信息检索,也称作计算机信息检索,所用的文献多以非纸张为载体, 手工检索和计算机检索的关系:手检是基础,机检是发展方向。 信息检索发展历史:信息检索作为一门技能,其历史可以追溯到图书目录和文摘、索引产生的时代。19世纪30年代——手工检索逐渐成熟,以印刷型文献为检索对象。最近50年——计算机信息检索。 手工检索阶段:公元前26年,我国第一步综合性的书目检索工具《七略》问世,它是以当时诸子百家的学术分类思想为基础,以汉代天禄阁的藏书为对象,按“部次甲乙”来组织文献典籍,这也是世界上第一部书本式的文献检索工具。近现代,利用图书馆馆藏书目工具为读者提供查找图书、期刊或事实信息。如卡片目录。还有各种书本式的目录、文摘、索引等检索工具。 手工检索阶段的主要特点是: ?遵循既定的标引规则来著录各项的内容; ?以印刷型文献(如图书、期刊、会议、专利、标准、学位论文等)为主要检索对象; ?以各类文摘、题录和目录性工具书为主要的检索工具; ?检索方法简单、灵活; ?检索策略便于修改,检索过程可及时发现问题,及时修改和补充; ?检索效率比较低,费时费力,且查全率较低; ?进行复杂问题的多途径检索时,需要反复查找许多检索工具; ?用户主要是专业技术研究人员。 3.1.2 文献信息检索的类型 按检索要求划分: 相关性检索——是系统不直接回答用户所提出的技术问题本身,而是只提供与之相关的文献供用户参考。 确定性检索——是以数据或事实为检索对象,系统要直接问答用户提出的技术问题,即直接提供用户需要的确切的数据或事实。 文献信息检索的类型 根据检索对象划分 ●书目检索:是以文献线索为检索对象的文献检索,即检索检索系统存储的是以二次文献为对象(目录、索引、文摘) 的信息,他们是文献信息的外部特征与内容特征的描述集合体,信息用户通过检索,获取的是原文的“替代物”。用户通过检索获得的是与检索课题有关的一系列文献线索,然后再通过阅读决定取舍。 ●全文检索:是以文献所含的全部信息作为检索内容的文献检索,即检索系统提供的是整篇文章或整部图书的全部内 容,检索时可以查找到原文以及有关的句、段、接、章等文字,并可进行各种频率统计和内容分析。全文检索主要

信息检索工具

浅谈信息检索工具

————————————————————————————————作者:————————————————————————————————日期: 2

摘要 文章由信息检索的分析和发展状况出发,阐述了一些常用的信息检索工具和相关技术。然后对常用的信息检索工具做了一个简要的评价,并由此讨论了信息检索工具的现状和发展趋势。 关键词:信息检索工具、技术、评价标准、发展趋势 Abstract Post by information retrieval and analysis of development, and expounds a number of commonly used information retrieval tools and related technologies.Then used the information retrieval tools to do a brief evaluation, and then discuss the status of information retrieval tools and trends. Keywords: information retrieval tools, techniques, evaluation criteria, trends

第一章信息检索分析及发展状况 步入21世纪,人们对信息检索的完备、准确、快捷会有更加严格的要求和期盼,与时俱进、不断完善的信息检索技术将得到越来越广泛的应用,信息的检索与访问方式无疑将发生深刻的变化。然而网上的信息浩如烟海,一个搜索引擎很难收集全所有主题的网络信息,即使信息主题收集得比较全面,由于主题范围太宽,很难将各个主题都做得精确又专业,使得检索结果中出现太多无用的信息。如何在浩瀚的信息海洋中准确、方便、快速地找到自己所需的信息,成了一个迫切需要解决的问题。 信息检索主要是指信息的表示、存储、组织和访问,即根据用户的查询要求,从信息数据库中检索与之有关的信息资料。信息检索的目的是获取所需信息,而这要基于比较完善的检索工具和技术。 1.1从传统检索到信息分析 目前,随着信息检索技术的发展,信息检索已经由手工检索、计算机检索发展到了网络化、智能化、认知化阶段,这一阶段的信息检索平台具备了初步的信息分析功能,从而使传统检索信息向信息分析层次发展。例如,在ISIWeb of Science检索平台上,当某一主题的检索结果出来后,检索者还可以利用该平台提供的信息分析功能,对检索结果从以下几个方面进行深入分析:①按照论文发表时间进行分析,了解不同时间阶段课题研究的状态;②按照国家分析,了解该领域的主要研究国家以及国内该领域研究情况;③按照机构分析,了解领域的主要研究机构;④按照作者分析,了解该领域的核心研究人员;⑤按照来源期刊分析,了解该领域研究论文发表的重点期刊以及对某刊物收录论文情况进一步了解;⑥按照学科进行分析,了解该课题涉及哪些学科领域以及对感兴趣学科进行更深入的分析。很显然,通过对检索结果从6个方面进行深入分析,将使读者对检索结果作进一步的深入了解。 1.2信息检索的发展状况 信息检索经过先组式索引检索、穿孔卡片检索、缩微胶卷检索发展到计算机信息检索。计算机信息检索大致可分为脱机检索、联机检索、国际联机检索、光盘检索、超文本的网络检索几个阶段。 目前,以文献单元描述体结构为基础、手工检索方式为主导的传统文献检索已发展到以信息单元组织结构为基础、网上浏览式信息查询方式的信息检索,计算机信息检索呈现联机检索、光盘检索以及网络检索多元并存的格局,面对用户群体、互相竞争、互相融合,谋求个性化基础上的共同发展。如下表所示,传统检索技术和网上检索技术无论是在检索策略还是在检索手段上都发生了本质的变化。 传统检索技术与网上检索技术的比较 传统检索技 网上检索技术 术

网络信息检索的工具

致力于打造高品质文档 网络信息检索的工具 [摘要] 搜索引擎是人们使用Internet信息资源的重要工具。本文对目前的中文搜索引擎进行了简要的分析,指出了其存在的缺陷和发展的方向。[关键词] 信息检索中文搜索引擎存在的问题发展方向 随着Internet信息资源的迅速增长,如何在浩瀚的信息海洋中准确、方便、快速地找到自己所需的信息,成了迫切需要解决的问题,从1995年开始出现的信息检索工具——搜索引擎很好地解决了这一问题。然而各种搜索引擎,特别是尚处于发展初期的中文搜索引擎还存在着很多的缺陷有待改进,本文旨在分析目前中文搜索引擎存在的主要问题,并为解决此类问题提出一些建议和方法。一、搜索引擎的概念和及类型 搜索引擎又称检索引擎,是指运行在Internet上,以信息资源为对象,以信息检索的方式为用户提供所需数据的服务系统,主要包括信息存取、信息管理和信息检索三大部分。 目前,中文搜索引擎主要有三种类型:目录式搜索引擎、机器人搜索引擎(又称全文搜索引擎)和元搜索引擎。 1.目录式搜索引擎。目录式搜索引擎是以人工或半人工方式收集信息,建立数据库,由编辑人员在访问了某个web站点后,对该站点进行描述,并根据站点的内容和性质将其归为一个预先分好的类别。由于目录式搜索引擎的信息分类和信息搜集有人的参与,其搜索的准确度较高,导航质量也不错。但因其人工的介入,维护量大,信息量少,信息更新不及时都使得人们利用它的程度有限。国内著名的新浪、搜狐、中文雅虎都属于这种类型。 2.机器人搜索引擎。这是一种目前运用较广泛的搜索引擎。国内以百度,google、天网为代表。它是使用自动采集软件Robot,搜集和发现信息,并下载到本地文档库,再对文档内容进行自动分析并建立索引。对于用户提出的检索要求,通过检索模块检索索引,找出匹配文档返回给用户。 机器人搜索引擎具有庞大的全文索引数据库。其优点是信息量大,范围广,较适用于检索难以查找的信息或一些较模糊的主题。缺点是缺乏清晰的层次结构,检索结果重复较多,需要用户自己进行筛选。 3.元搜索引擎。元搜索引擎是一种调用其他搜索引擎的引擎。它是通过一个统一的用户界面,帮助用户在多个搜索引擎中选择和利用合适的搜索引擎来实现检索。中文元搜索引擎开发较少,较成熟的则更少,万纬搜索是目前有一定影响的中文元搜索引擎。 二、现阶段中文搜索引擎存在的主要问题 1.信息覆盖面有限。现阶段搜索引擎所覆盖的数据库的规模是非常有限的,据美国科学期刊Natures一篇报告中称,全球最大的搜索引擎也只能覆盖现有网页的16%。中文搜索引擎因起步慢、中文信息所占互联网全部信息的比例小(只占全部网络信息的5%)等原因在这方面尤为突出。 2.查全率不高。查全率是指检索出的相关信息量与存储在检索系统中的全部相关信息量的百分比,是判断检索系统质量的度量之一。

王乃成信息检索工具的工作原理

课题:信息检索工具的工作原理 课型:新授课 课时:1 课时 教学目标: 1.了解常用的英特网信息检索工具类型;能描述信息检索工具的基本工作原理和特点。 2.体验因特网信息检索工具的优缺点。 3. 掌握常用因特网信息检索工具的使用方法,能熟练使用信息检索工具获取所需信息。 内容分析: 本节为“因特网信息资源检索”中的重点部分,介绍了全文和目录索引类搜索引擎的工作原理,这是学习的重点。教材中通过搜索奥运信息的例子来说明在网上检索信息的过程, 以达到简化原理、帮助学生理解的目的。教学中应尽量选取贴近生活的例子来说明复杂的工 作原理,降低难度,以提高学生的检索能力为最终目的。 教学过程: 1.情境引入 已搜索一首歌曲为基础,提出问题:同学们想像一下信息检索工具该如何工作呢?有几种方法能达到,让学生们互相讨论,并展开对比讨论,选出最恰当的方法。 2.教学过程 方法一:全文搜索引擎的工作原理 (1)提出问题 ①去超市购买一枝钢笔的过程。 购物→描述商品特征→取货→交给顾客 ②利用全文搜索引擎查找夏季奥运会的由来,并观察操作的一般过程。如图 1-1 ~ 1-3 所示。 图 1-1 百度检索首页

图 1-2 百度检索结果页面 图 1-3 百度检索答案举例页面 总结 全文搜索引擎检索信息的过程: 搜索关键字或词→数据库中检索→搜索结果。 (2)通过上述范例引申 从专业的角度拓展给学生讲解搜索引擎的组成。 ①搜索器:负责定期地自动到各个网站上,把网页抓下来,并顺着上面的链接,持 续不断地抓取网页。 ②索引器:把搜索器抓来的网页进行分析,按照关键词句进行索引,并存入服务器 的数据库中。 ③检索器:面向用户,接收用户提交的查询字串,在索引数据库中查询,并将结果 反馈给用户。 巩固练习:搜索江苏省2012年高考方案 进一步总结,得出全文搜索引擎的工作包括三个过程。 ①搜索器在因特网中发现、搜集网页信息。 ②索引器对所搜集的信息进行提取和组织,并建立索引库。 ③由检索器根据用户输入的查询关键词,在索引库中快速检出相关文档,进行文档与查询内容的相关比较,对检出的结果进行排序,并将查询结果返回给用户。 方法二:目录索引类搜索引擎的基本工作原理 (1)提出问题 ①如果去学校图书馆借阅“短篇小说集”,该怎么去做,描述一般过程。 借阅图书→找书目→找相应书籍→从书架拿出 ②利用目录类搜索引擎查找“北京大学”的信息,如图 1-4 ~ 1-7所示。

网络信息检索期末考试试卷及答案

绵阳师范学院历史文化与旅游管理学院 一、填空题(每空1分,共30分) 1.信息是自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互关系、相互作用等运动状态的表达。2.知识是在改造客观世界的实践中获得的对客观事物存在和运动规律的认知和总结,是人的大脑通过思维重新组合的系统化的信息的集合。3.情报是人们用来解决特定问题所需要的、经过激活过程活化了的具有使用价值的知识或信息。 4.文献是在存储检索利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、载体上或依附载体而存有信息或数据的载体。 5.会议文献是指在国内外学术或非学术会议上发表的论文或报告。6.学位论文是高等院校和科研机构的毕业生为获取各级学位在导师指导下撰写和提交和科学研究、科学实验的书面报告。 7.著录是对文献内容和形式特征进行选择和记录的过程。 8.数据检索是指特定的数值型数据为对象的检索。 9.在印刷型资源时代,事实与数据检索工具主要依靠各类参考工具书完成各种数据或事实的查询。 10.Internet是基于TCP/IP协议的网络。 11.二级域名https://www.doczj.com/doc/7516926837.html,是指教育机构。 12.目前WWW环境中使用较多的网页浏览器有Microsoft公司的IE浏览器和360公司的360安全浏览器。 13.每种网络信息检索工具一般由信息采集子系统、数据库和检索代理软件三部分组成。 14.大多数搜索引擎允许用户使用布尔逻辑运算符,以及与之对应的:“+”表示限定搜索结果中必须包含的词汇,“-”表示限定搜索结果中不能包含的词汇。 15.一些搜索引擎提供了按链接和网域等进行搜索范围的限制,比如,用site表示搜索结果局限于某个网站。比如,用intitle表示到某个URL地址指定的网页标题内进行检索。比如,用link表示到某个URL地址指定的地址内进行检索。 16.搜索引擎中,在普通查询词前面加一个filetype表示对文档类型限定。或例如:访问百度文档的地址也可以达到此效果,它的网址是:https://www.doczj.com/doc/7516926837.html,/ 17.CNKI数据库下载的全文格式很多,如:caj,pdf,nh,caa,kdh 需要下载安装CAJViewer全文浏览器软件或Vip全文浏览器软件才能阅读这些资源。 18.维普资讯网的高级检索中,查询语句“K=(CAD+CAM)*R=机械”表示的意思是查找文献或文摘中含有“机械”,并且关键词中含有CAD或CAM的文献或文摘 19.OPAC中文或者英文的解释是联机图书馆公共检索目录 20.国内提供电子图书服务的网络站点很多,常用的有书生之家数字图书馆、方正Apabi数字图书馆、中国数字图书馆等。 二、单项选择题(每题1分,共20分) 1.下面哪项不是情报构成的三要素之一( D )。 A.本质是知识 B.经过传递 C.经过用户使用产生效益D.通过购买获取 2.一次文献是( A )。 A.最原始的信息资源B.最主要的信息资源 C.对文献的集中提炼和有序化D.按知识门类或专题组织、浓缩而成 3.下面哪一项是白色文献( A )。 A.期刊文献B.科技报告 C.专利文献D.学位论文 4.报纸区别于其它文献的特征是( B )。 A.创新性B.及时性 C.学术性D.全面性 5.有法律约束力和一定的时效性,经权威机构批准的规章性文献是(A )。 A.标准文献B.学位论文 C.档案文献D.科技报告 6.一般存在相应二次文献的是( A )。 A.期刊B.产品样本 C.档案 D.报纸 7.常见的事实和数据检索工具书不包括( D )。 A.百科全书B.年鉴

2.信息检索工具2018

信息检索工具2018 1、免费电子期刊按免费卷期范围不同可划分为全刊免费,()和少量文献免费三种类型 * ? A.过刊免费 ? B.并行出版刊 ? C.纯电子版免费期刊 ? D.试用期内免费刊 2、医学文献只有经过()后,才能进入检索系统,提供使用 * ? A.编排 ? B.编号 ? C.标引 ? D.分类 3、《中华内科杂志》在Medline光盘检索所得的医学文献著录格式中刊名形式是() * ? A.Zhong –hua– Nei– Ke– Za–Zhi ? B.ChungHua – NeiKo – TsaChih ? C.Zhonghua – Neike – Zazhi ? D.Chung – Hua – Nei – Ko – Tsa – Chih 4、搜集2018 年的哪种类型的信息最能表征未来一段时期的研究内容() * ? A.PubMed 收录的2018 年发表的论文 ? B.2018 年向美国国家专利与商标局申请的专利 ? C.美国国立卫生研究院(NIH)2018 年立项/启动的项目 ? D.中华医学会2018 年召开的学术会议 5、下列哪些方式不可以帮助筛选某个领域内的综述类、述评类或观点性文献() * ? A.文献类型为Review ? B.主题词组配副主题词trends ? C.文献类型为Clinical Trials

? D.标题中出现“the future of …”“Trends in …”的文献 6、中国图书馆图书分类法的分类号由() * ? A.字母与数字混合编制 ? B.纯数字编制 ? C.纯字母编制 ? D.数字分级编制 7、Medline收录的文献起源于()年 * ? A.1966 ? B.1978 ? C.1981 ? D.1990 8、索书号的组成是() * ? A.分类号和期刊号 ? B.标准书刊号和登录号 ? C.标准书刊号和书次号 ? D.分类号和书次号 9、CBMDisc中的有关中医方面的文献是按照()进行主题标引的 * ? A.医学主题词表(MeSH) ? B.中国图书资料分类法 ? C.中医药学主题词表 ? D.杜威十进制分类法 10、国内大多数大学图书馆采用的图书分类法是() * ? A.中国大学图书馆图书分类法 ? B.中国人民大学图书馆图书分类法 ? C.中国图书馆图书分类法

网络信息检索试题及答案1.

第一部分 1、一条及时的信息可能使濒临破产的企业起死回生,一条过时的信息可能分文不值,甚至是企业丧失难得的发展机遇,造成严重后果,这说明信息具有(C特征。 A、差异性 B、传递性 C、时效性 D、共享性 2、培养学生养成良好的信息素养,主要从四个方面进行,其中不包含(B: A、信息意识 B、信息心理 C、信息能力 D、信息道德 3、哈佛大学经济学专业学生能够依据图书馆中哪些极为平常、完全公开的图书资料,撰写出核专家都感到惊异的“制造核弹的方法”的报告,反映出良好的信息素养是(。 A、获取知识的捷径 B、科学研究的向导 C、终身教育的基础 D、创新知识的源泉

4、按照信息处理的级别来划分,可以将信息分为零次、一次、二次和三次信息,下面(是一次信息的别称。 A、灰色信息 B、原始信息 C、检索性信息 D、参考性信息 5、“便于保存传递、但需要借助阅读机阅读”是以感光材料记录文字及相关信息的(信息载体类型的特点。 A、印刷型 B、电子型 C、声像型 D、微缩型 6、谈谈你对“信息”的理解。 特征:客观性和普遍性、差异性、传递性、时效性、可转换性、共享性。 7、下列文献哪个是二次文献?(A A.文摘 B.会议文献 C.辞典 D.百科全书

8、“文章草稿”、“私人笔记”及“会议记录”属于(A。 A.零次文献 B.一次文献 C.二次文献 D.三次文献 9、下列选项中哪一项属于“国内统一刊号”(C。 A.ISBN7-04-014623-1 B.ISSN0254-4164 https://www.doczj.com/doc/7516926837.html,11-2127/TP D.0254-4164/TP 10、根据国标GB/T7714-2005规定,下面的横线上的信息是对(C参考文献的著录条目描述。 萧钰.出版业信息化迈入快车道[EB/OL].(2001-12-19[2002-04- 15].http:∥www.….htm. A、标准文献 B、期刊(杂志 C、电子文献 D、会议文献 11、根据国标GB/T7714-2005规定,下面的横线上的信息是对(B参考文献的著录条目描述。

4.检索工具与参考工具

文献信息检索与利用课程教案 授课内容:第五讲检索工具与参考工具 5.1 检索工具的概念 检索工具是指以存储、报道和检索文献的工具。如前所述,科技文献的数量庞大、交叉重复、高度分散,而且增长的速度越来越快,这就给文献的利用带来很大的困难。为此人们在长期的实践过程中,提出了压缩文献内容的办法,即提取文献特征,加以标引,并按一定的顺序排列起来,从而形成检索工具,便于人们用较少的时间从不同角度获取大量文献。 一般检索工具必须具备四个基本条件: ⑴必须详细记录文献的外部特征和内容特征。 ⑵必须具有既定的检索标识。如主题词、分类号、著者姓名和文献序号等。 ⑶必须根据标识的顺序,系统地、科学地排列文献,使其成为一个有机的整体。 ⑷能够提供多种检索途径。 5.2 检索工具的作用: ⑴检索工具能将不同类型、不同语种的文献按学科或主题加以集中组织在

一起,避免了直接检索的分散性、盲目性和偶然性,从而在查全率和查准率两个方面都能保证其检索效率。 ⑵借助于检索工具检索文献可以缩短检索过程、节省读者的时间。检索者不必去阅读大量分散的各种类型及文种的原始文献,因为检索工具使科技人员所面对的不再是文献的全文,而是反映原文状况的一些著录事项,因而大加快了检索速度。 ⑶检索工具中的标识〔分类号、主题词等〕是按照一定的检索语言来排列的因此,它可以提供有规律的检索途径,使检索者可以根据需要灵活地从多种角度进行检索。 ⑷帮助科技人员消除了语言文字的障碍。目前世界上出版的科技文献所使用的语言有60~70种之多,科技人员直接查阅文献时,常常受到语种的限制而漏查一些有重要参考价值的文献,而一种检索工具可以用一种语言来收录和报道不同文种的文献,检索者只要掌握少数几种语言后,就能查阅多种文字的文献资料。 5.3检索工具的类型: ⑴文献检索工具 文献检索工具是进行文献检索时提供原始文献的线索不提供原文的的控制 型检索工具。这一大类检索工具的功用是向用户提供经过加工、整理、并按照一定方式排列的文献资料线索、出处等。换言之,就是此类工具书不直接提供读者所需要资料的原文信息,但读者可凭借此类工具书提供的线索,在浩如烟海的文献中,较方便地找到自己所需的文献资料(原始文献),从而获取有用信息。这类检索工具大都是连续出版物,一般是被称作文摘、题录(目录)索引的这样一些二次文献,如“《全国报刊索引》、《科学文摘》、《工程索引》”等。 ①目录(Catalogue) 目录是对出版物进行报道和对图书资料进行科学管理的工具。它是历史上出现最早的一种检索工具类型。对于科技文献检索来说,下列目录比较重要。 国家书目:这是对一个国家出版的全部图书所作的登记统计性书目,可以反映一个国家的文化、科学和出版事业的水平。例如:《全国总书目》和《全国新书目》就是我国的国家书目。它对检索图书信息很有用处,但由此查到的图书,其内容却比较陈旧。 出版社与书店目录:这是及时报道图书出版情况的目录,往往称之为“在版目录”(Books-in-Print)。这类图书目录对于检索国内外科技新书,有比较重要

第三章网络信息检索工具

第三章网络信息检索工具 【知识框架】 信息检索的一般流程 网络经贸信息资源的概念与类型 网络资源查询方法及检索工具 ?按检索机制分: 目录型(Subject directory, catalogue) 索引型:搜索引擎(Search Engine) 混合型(Hybrid tools) ?按检索内容分: 综合型 专题型 特殊型 ?按包含检索工具数量分: 单一型(Singular search tools) 集合型(Collective search tools):元搜索引擎 (Metasearch Engine或Megasearch Engine 目录型检索工具(Subject directory catalogue) 搜索引擎(Search Engine) ?单一搜索引擎 ?集成搜索引擎 检索工具的工具——指南类检索工具和元搜索引擎 ?(一)网络资源指南(Resource Guide) 也称学科门户SIG ?(二)元搜索引擎 集合式搜索引擎、索引式搜索引擎 ?(三)手工检索工具的“工具书指南”、网址簿 网络版参考咨询工具(Reference Tools) 智能搜索代理和搜索软件 补充教材第二章: 检索工具与语言 检索策略 【主要内容】 1、信息资源检索的一般流程 分析问题

?问题分类 ?分析已知和欲知信息 ?分析需求主题 ?广泛利用文献 ?选择检索范围 选择检索工具 ?熟悉各种检索工具 从检索工具中查找所需信息 获取原文 2、网络信息资源的概念和类型 1)按传输方式分: ●WWW ●FTP ●Usenet/Newsgroup ●LISTSERV/Mailing List ●Telnet ●Gopher ●WAIS 2)按内容加工 一次加工信息 ?网上图书、期刊、报纸、专利、政府出版物、会议资料等 二次加工信息 ?文摘索引数据库、搜索引擎、网站导航等 三次加工信息 ?百科全书、手册指南等参考型网站 3)格式与后缀 3、网络检索工具的分类 按检索机制分: ?目录型(Subject directory, catalogue) ?索引型:搜索引擎(Search Engine) ?混合型(Hybrid tools) 按包含检索工具数量分: ?单一型(Singular search tools) ?集合型(Collective search tools):元搜索引擎(Metasearch Engine或Megasearch Engine 4、目录型检索工具(Subject directory catalogue) 1)网络资源目录 这是一种独立型检索工具,网站自身包含可检索的数据库。网络资源目录又称网站目录、分类站点目录、专题目录或主题指南、站点导航系统、主题词典型检索工具等。这是一种将网络资源搜集后,按某种分类法进行组织整理,并和检索法集成在一起的信息检索方式。 特点:

网络信息检索工具研究论文(详细)

网络信息检索工具研究 摘要网络信息资源的迅猛增长,使人们获得有用信息越来越困难,网络检索工具应运而生,文章介绍了网络信息检索工具的类型和功能,提出了检索工具的发展趋势。 关键词因特网;网络检索;检索工具 Abstract The quick increase of net in formation makes it more and more difficult for people to get useful information. Net search tools emerged as the times require. The paper introduce several kinds and functions of net search tools , put forward the development tendency of net search tools. Key words Internet ; net search ; search tool 席卷而来的因特网正将全世界的丰富信息资源带到我们每一个人面前,已成为知识经济时代不可或缺的基本工具。然而在这样无边无尽的信息世界,找寻所需要的信息却成为一个极大的难题。网络信息检索工具由此产生并迅速繁荣发展,毫无疑问地成为这一信息海洋的航标与灯塔。了解网络信息检索工具,熟悉其功能,将大大提高我们的检索效率。 1 网络信息检索工具的类型 网络信息检索工具是指在因特网上提供信息检索服务的计算机系统,其检索的对象是存在于因特网信息空间中各种类型的网络信息资源。按检索资源的类型,可分为两大类:即非web资源检索工具和web资源检索工具。 1.1非web资源检索工具 非web 资源检索工具是以 FTP、Telnet、Gopher等为检索对象。 (1)FTP类的检索工具 这是一种实时的联机检索工具,用户首先要登陆到对方的计算机,登陆后即可以进行文献搜索及文献传输有关的操作。使用 FTP(文件传输协议)几乎可以传输任何类型的正文文件、二进制文件、图像文件、声音文件、数据压缩文件等。在这类检索工具中,Archie是最常用的。Archie是自动标题检索软件,它借助于FTP来访问。用户只需告诉其要检索文件名的有关信息便可获得文件所在的主机名、路径。与一般检索工具不同的是,它不用主题来实现相应的检索,而只能根据文件名和目录名进行检索。它是获取免费软件和共享软件资源不可缺少的工具。(2)Telnet 类的检索工具 它指的是借助远程登陆在网络通信协议的支持下,在远程计算机上登陆,使自己的计算机暂时成为远程计算机的终端,进而可以实时访问,使用远程计算机中对外开放的资源。 使用Telnet协议进行远程登陆时需要满足以下条件:本地计算机上必须装

常用信息检索与处理工具使用总结

常用信息检索与处理工具使用总结 专业:电子商务0901 姓名:殷雅妹 【内容摘要】由于互联网上的各类网站种类繁多,信息庞杂,而且网站域名多为英文和缺少规律的特点使得中国网民尤其是新网民不能方便找到他所需要的网站。与网络信息采集相关的软件及工具为广大网民提供了平台。随着互联网的普及和深入,其相关软件不断改进,现在已经成为网民非常重要的一个平台及信息检索工具。 【关键词】信息检索即时通讯上传下载信息分析 【目录】1.信息检索软件及工具﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍ 1.1概述﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍ 1.2分类﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍ 1.3百度和谷歌的差别﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍ 2.网络即时通讯工具﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍ 2.1种类﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍ 2.2共同点﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍ 3.上传下载软件及工具﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍ 3.1“网络蚂蚁”下载器﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍ 3.2 FTP简介﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍ 4.信息分析软件及工具﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍ 4.1信息分析的主要技术﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍ 4.2 SPSS软件简介﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍ 4.3 SAS软件简介﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍ 5.结语﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍ 一、信息检索软件及工具 1、概述 搜索引擎是指根据一定的策略、运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后,为用户提供检索服务的系统。它主要是用于检索网站、网址、文献信息等内容。随着网络技术的发展,各种搜索引擎层出不穷,

最新网络信息检索的工具

网络信息检索的工具 [摘要] 搜索引擎是人们使用Internet信息资源的重要工具。本文对目前的中文搜索引擎进行了简要的分析,指出了其存在的缺陷和发展的方向。 [关键词] 信息检索中文搜索引擎存在的问题发展方向 随着Internet信息资源的迅速增长,如何在浩瀚的信息海洋中准确、方便、快速地找到自己所需的信息,成了迫切需要解决的问题,从1995年开始出现的信息检索工具——搜索引擎很好地解决了这一问题。然而各种搜索引擎,特别是尚处于发展初期的中文搜索引擎还存在着很多的缺陷有待改进,本文旨在分析目前中文搜索引擎存在的主要问题,并为解决此类问题提出一些建议和方法。一、搜索引擎的概念和及类型 搜索引擎又称检索引擎,是指运行在Internet上,以信息资源为对象,以信息检索的方式为用户提供所需数据的服务系统,主要包括信息存取、信息管理和信息检索三大部分。 目前,中文搜索引擎主要有三种类型:目录式搜索引擎、机器人搜索引擎(又称全文搜索引擎)和元搜索引擎。 1.目录式搜索引擎。目录式搜索引擎是以人工或半人工方式收集信息,建立数据库,由编辑人员在访问了某个web站点后,对该站点进行描述,并根据站点的内容和性质将其归为一个预先分好的类别。由于目录式搜索引擎的信息分类和信息搜集有人的参与,其搜索的准确度较高,导航质量也不错。但因其人工的介入,维护量大,信息量少,信息更新不及时都使得人们利用它的程度有限。国内

著名的新浪、搜狐、中文雅虎都属于这种类型。 2.机器人搜索引擎。这是一种目前运用较广泛的搜索引擎。国内以百度,google、天网为代表。它是使用自动采集软件Robot,搜集和发现信息,并下载到本地文档库,再对文档内容进行自动分析并建立索引。对于用户提出的检索要求,通过检索模块检索索引,找出匹配文档返回给用户。 机器人搜索引擎具有庞大的全文索引数据库。其优点是信息量大,范围广,较适用于检索难以查找的信息或一些较模糊的主题。缺点是缺乏清晰的层次结构,检索结果重复较多,需要用户自己进行筛选。 3.元搜索引擎。元搜索引擎是一种调用其他搜索引擎的引擎。它是通过一个统一的用户界面,帮助用户在多个搜索引擎中选择和利用合适的搜索引擎来实现检索。中文元搜索引擎开发较少,较成熟的则更少,万纬搜索是目前有一定影响的中文元搜索引擎。 二、现阶段中文搜索引擎存在的主要问题 1.信息覆盖面有限。现阶段搜索引擎所覆盖的数据库的规模是非常有限的,据美国科学期刊Natures一篇报告中称,全球最大的搜索引擎也只能覆盖现有网页的16%。中文搜索引擎因起步慢、中文信息所占互联网全部信息的比例小(只占全部网络信息的5%)等原因在这方面尤为突出。 2.查全率不高。查全率是指检索出的相关信息量与存储在检索系统中的全部相关信息量的百分比,是判断检索系统质量的度量之一。 国内绝大多数的网站组织的信息大多都是通过浏览方式获得内容。即使是经过精心组织、编排非常合理的网站,也会有70%~80%的网页不能被搜索引擎检索到。中文目录式搜索引擎因需人工介入、维护量大,在这方面表现较明显。

相关主题
文本预览
相关文档 最新文档