当前位置:文档之家› 信息检索复习题(综合最终)

信息检索复习题(综合最终)

信息检索复习题(综合最终)
信息检索复习题(综合最终)

1、信息存储与检索:广义地说是“信息存储与检索”(Information Storage and Retrieval),它是指将信息按照一定的方式组织和存储起来,并能根据信息用户的需要找出其中相关信息的过程。从本质上讲信息检索是一种有目的和组织化的信息存取活动,其中包括了“存”和“取”两个基本环节。对于“存”来说,主要指面向来自各种渠道的大量或海量信息而进行的高度组织化的存储;对于“取”来说,则要求面向随机出现的各种用户信息需求所进行的高度选择性的查找。

2、文本检索:指以各种自然语言符号系统所表示的信息作为主要检索对象的信息检索活动。

3、数值(据)检索:主要是针对数值型数据的查询而发展起来的一类较有特色的信息检索。

4、音\视频检索:主要针对各种数字化音频与视频信息而进行查询的一类新兴的信息检索操作。

5、电子信息源:指以数字化形式(即二进制码)将文字、图像、声音、动画等存储在光、磁等存储介质(如CD-ROM、磁盘)上,并能通过计算机、通信设备再现出来的信息资源。

6、书目数据库:一种专门存储二次文献信息的数据集合,亦称二次文献数据库,通常收录有关主题领域的各种书目信息,包括文摘、题录、目录等,以向用户提供文献信息,指引用户查找、使用原始文献。

7、文献索引数据库:主要是简要地通报有关领域某一时期发表的文献,供人们查阅与检索。它提供确切的文献来源信息,即能准确鉴别相对应的原始文献

8、全文数据库:一种源数据库,主要存储文献全文或其中的主要部分,可以将包括题名、著者、摘要、关键词、正文、参考文献和著作日期在内的数据全部收入数据库,供用户查询利用。

9、网络信息资源:指以电子数据的形式将文本、图像、声音、动画等多种形式的信息存放在光磁等非印刷型载体的介质中,并通过网络通信、计算机或终端等方式再现出来的电子信息源。

10、集中式系统:是资源有空间上集中配置的系统,单机检索系统是典型的集中式系统,它将软件、数据和主要外部设备集中在一套计算机系统之中。

11、分布式检索系统:是指通过计算机网络把分布在不同地点的计算机硬件、软件、数据库等设备和资源联系在一起,以服务于一个共同的系统目标而是实现的相互通信、相互操作和资源共享的系统。

12、用户界面:是用户与计算机之间的通信媒体或手段,是人机双向信息交换的软件和硬件。

13、搜索引擎:广义的搜索引擎泛指网络(尤其是万维网)上提供信息检索服务的工具或系统。狭义的搜索引擎主要指利用网络自动搜索软件或人工方式,对万维网信息资源进行采集分析与标引,并将索引信息组织成数据库,以网站形式为网络用户提供检索服务的一类信息服务系统。

14、收录范围:是指检索系统的数据库所覆盖的学科面、所收录的文献类型和数量,它现在已经演化成网站或搜索引擎的规模。

15、响应时间:是指从提问接收到检索结果提供所消耗的时间。

16、用户负担:是指用户在检索过程中花费的精力的总和。

17、输出形式:是检索系统提供的检索结果的形式,可能是书目信息,也可能是全文信息等。

18、相关性(评价核心):主要是指检索系统针对用户的信息需求从文档集合中检出的文档与用户需求之间的一种匹配关系。

问答题目:

1、什么是信息检索?它有哪些主要类型?

所谓“信息检索”,广义地说是“信息存储与检索”,它是指将信息按照一定的方式组织和存储起来,并能根据信息用户的需要找出其中相关信息的过程。从本质上讲信息检索是一种有目的和组织化的信息存取活动,其中包括了“存”和“取”两个基本环节。对于“存”来说,主要指面向来自各种渠道的大量或海量信息而进行的高度组织化的存储;对于“取”来说,则要求面向随机出现的各种用户信息需求所进行的高度选择性的查找。狭义理解是主要关注如何从存储的信息集合中快速获取各种需要的信息。

信息检索的主要类型

早期分类方法:文献检索、事实检索、数据检索三种类型

文献检索是指以文献(包括文摘、题录或全文)为检索对象的一类信息查询活动。

事实检索主要针对从文献中提取出来的各种事实(或知识项)所进行的检索活动。

数据检索主要以经过选择、整理、鉴定的各种数据信息,例如人口、国民生产总值、建筑材料的各种性能参数等作为检索对象的一类检索操作。

新分类方法:文本检索、数值检索以及音/视频检索

文本检索:是指以各种自然语言符号系统所表示的信息作为主要检索对象的信息检索活动。

数值检索:主要是针对数值型数据的查询而发展起来的一类较有特色的信息检索。

音/视频检索:是主要针对各种数字化音频与视频信息而进行查询的一类新兴的信息检索操作。

2、试分析阐述信息检索的基本原理。

信息检索的基本原理抽象概括为一句话,即对信息集合与需求集合的匹配与选择。

●信息集合是指有关某一领域的,经采集、加工的信息集合体。信息集合是一种公共知识结构,有可能弥补某个

特定用户的知识结构缺陷,即可以向用户提供所需要的知识或信息,或是获取知识的线索,或是提供某种信息去激活人脑中存储的知识。

●用户的信息需求是在社会实践活动中产生的。众多用户不同形态的信息需求的汇集,就形成了需求集合的存在,

信息需求的产生与满足,是实施信息检索行为的前提与基础,也是实施信息检索行为的目的所在。

●信息检索提供一种“匹配”机制,主要功能在于能够把需求集合与信息集合依据某种相似性标准进行比较与判

断,进而选择出符合用户需要的信息。要求匹配机制至少包裹两个要素:第一是匹配标准,即相似性标准;第二是执行匹配的动因。

3、如何鉴别高质量期刊?

国内外公认的鉴别方式有二:核心期刊和同行评审期刊。

●核心期刊是指刊载某一学科或专业有关的信息较多,且学术水平较高,能够反映该学科最新成果和前沿动态,

受到该专业读者特别关注并成为检索与阅读首选的那些期刊。核心期刊的确定一般运用文献计量学的方法,通过对期刊和刊载论文的一些计量指标的统计和分析来确定。

●同行评审期刊是国外高水平期刊对来稿评审普遍采取的方式。具体做法是:作者将文稿寄交编辑部并经初审合

格后,为了审查论文的学术质量需将论文稿送交有关专家(即同行)进行审阅。所选专家来自不同的机构,他们一般对该刊物比较了解,而且有相当高的专业背景和造诣,大多都有投稿的经历或本身就是高产作者。同行评审的主要目的是对稿件的质量进行控制,确保提交的论文是可读的、可信的和有意义的。因此,人们普遍认为同行评审期刊的学术水平高于一般期刊。

4、我国出版的专利文献有哪些?

目前我国出版的专利文献主要包括专利说明书、专利公报以及专利索引等,既有一次文献,也有二次文献。它们是:(1)《发明专利公报》、《实用新型专利公报》和《外观设计专利公报》;

(2)《发明专利申请公开说明书》、《发明专利说明书》、《实用新型专利说明书》;

(3)专利年度索引

5、书目数据库的特征。

(1)书目数据库中的数据来源于期刊论文、会议论文、研究报告、专利文献、学位论文、图书、政府出版物等各种不同的一次文献,是经过加工、提炼过的数据,因此其信息密度高,文献报道范围广,数据量大,连续性和积累性强。

(2)书目数据库的数据结构比较简单,记录格式较为固定。

(3)书目数据库的生产者多为学术机构、政府机构、图书馆信息服务机构等非赢利性组织,书目数据库的开放性比较好,使用上没有太多限制。

(4)相对于手工检索工具来说,书目数据库还具有检索途径多、速度快的特点。但相对于网络信息资源而言,书目数据库的更新周期比较长。

6、全文数据库的特点?

与其他数据库或信息源(尤其是书目数据库)相经,全文数据库有许多优点,主要表现在以下几方面:

(1)可直接利用。用户检索全文数据库得到的结果是原始文献的全文信息,而不像书目数据库那样得到的是文摘或书目之类的二次文献,从而省去了通过二次文献去查找一次文献的环节。因而,全文数据库又称为自足性数据库。(2)简化数据标引和建库工作。绝大多数全文数据库采取自然语言的计算机自动标引技术,节省了大量的人力、物力和财力。此外,全文库的建立还可以省去许多用户并不产心的著录项目,比如出版介质、出版单位、印刷单位、价格等等,这些信息对用户的检索意义不大,但是却在书目数据库的创建中占用了信息加工人员的大量精力。(3)避免了文献二次加工中人为的差错。由于全文数据库包括了二次文献和参考文献在内的几乎所有数据,而这些数据均出自原文,从而避免了文献二次加工可能出现的差错。

(4)后处理能力强。由于全文数据库收录的是全文信息,且数据库的容量都比较大,容易产生检索结果中包含一些不相关的信息,因此,全文检索系统一般会对实施检索所得到的检索结果进行各种优化,诸如检索结果的聚类、图形图像的处理、信息过滤、反馈机制的使用等。通过增强检索系统的后处理能力,可以进一步满足用衣个性化检索需求。

(5)信息量非常大,对检索技术的要求很高

7、一个通用信息检索系统的基本结构如何?它主要有哪些功能模块构成?

?信息检索系统的物理层面以及逻辑层面

?物理构成角度看,计算机化信息检索系统是指由系统的硬件、软件、数据资源等构成的一个实体系统。分为硬件部分、软件部分以及数据资源。物理空间的分布情况看,又可分为集中式和分布式检索系统。

?信息检索系统的逻辑结构主要是指它所包括的功能模块(或子系统)及其相互关系。一个通用的计算机化信息检索系统,通常应该具有“信息存储”和“信息查询”两大基本功能。

?功能模块:

?(1)信息采集子系统;

?(2)信息标引处理子系统;

?(3)创建/更新数据库及索引文档子系统;

?(4)用户界面子系统;

?(5)检索匹配子系统;

?(6)知识组织工具子系统。

8、什么是标引深度和标引的专指度?

●标引深度又称“网罗度”,是衡量标引详尽性的指标,其含义是标引词对数据库每条记录各方面内容表达和识

别的详尽程度。

●专指度用于衡量标引词对信息记录特定内容描述的精细程度。网罗度越高,越有利于提高检索的查全率;专指

度越高,则越有利于提高检索的查准率。

9、什么是自动标引?自动标引处理的基本流程如何?自动标引中自动抽词标引和自动赋词标引

自动标引:通过利用计算机对标引特征的出现频率、出现位置、提问频率等进行统计,进而采用一定的加权策略来实现。

在自动标引的处理过程中,标引词的来源和选取方式各有不同,据此可以把自动标引区分为自动抽词标引和自动赋词标引两种类型。自动抽词标引是指利用计算机直接从文献的题名、文献或正文中抽取关键词来标识文献内容,并自动生成关键词索引文档(或倒排档);而自动赋词标引则是让计算机模仿标引员的赋词标引方式,通过分析文献内容,从词表中选取与文献主题相符或密切相关的词语符号做索引词。

基本流程如下:从“待标引机读文本”开始到“索引文档生成”结束的,描述了自动抽词标引的基本处理过程,而涉及到“概念转换”和“规范词汇”环节,表达了实现自动赋词标引需要额外增加的两项重要处理要求。见P44图

10、何谓文档?在数据库中,文档结构有哪些类型?

文档是按一定结构组织的若干逻辑记录构成的信息集合。它是数据库数据组织的基本形式,作为一个处理单位,文档可以存储在磁带或磁盘上,或内存储器上。

类型:

(1)顺序文档:是文档在计算机存储器中的一种存放形式,文档中的全部记录按顺序一个接一个地存放,记录的物理位置通常按照存取号由小到大排列,记录之间的逻辑顺序与物理顺序一致,因此又称为链式文档或线性文档。也叫主文档

(2)倒排文档:是把数据库记录中的一切可检字段或属性值(主题词、著者名、自由词、出版年等)抽出来,作为检索标识,按某种顺序重新加以组织后得到的一种文档。

(3)随机文档:是与顺序文档相对的另一种存储方式。文档中的记录按随机方式存放在支持直接存取的磁盘、磁鼓或内存中。

11、什么是精确匹配?什么是局部匹配?

精确匹配: 指要求结果记录(标识)中包含的需求模式必须与提问式所表达的模式完全匹配,才能作为命中结果输出。

局部匹配: 是指只要求结果记录(标识)中包含的需求模式与提问式所表达的模式部分匹配,即为命中。

12、信息检索系统的物理结构?及其优缺点?

信息检索系统的物理结构分为集中式和分布式两大类

集中式系统是资源有空间上集中配置的系统,单机检索系统是典型的集中式系统,它将软件、数据和主要外部设备集中在一套计算机系统之中。

优点是

●信息资源集中,便于管理资源利用率高;

●专业人员相对集中,有利于发挥其作用;

缺点:

维护代价越来越大,系统的安全性较差

分布式检索系统是指通过计算机网络把分布在不同地点的计算机硬件、软件、数据库等设备和资源联系在一起,以服务于一个共同的系统目标而是实现的相互通信、相互操作和资源共享的系统。

优点:

可以根据用户应用需求来配置资源,提高系统对用户检索需求和环境变化的应变能力;

便于扩展,具有较强的健壮性,通常网络上某个节点的故障不会影响到其他节点系统的工作。

13、给出与下列布尔检索式等价的逆波兰式和准波兰式:

(1)A+B*C 逆波兰式ABC*+

(2)(A+B)*(C+D)+E 逆波兰式AB+CD+*E+

(3)A+B*(C+D+E)+F 逆波兰式ABCDE++*+F+

(4)(A+B)*C+D*(E-F) 逆波兰式AB+C*DEF-*+

14、截词检索主要有哪些类型?请举例说明?

截词检索有多种不同方式,按截断位置可分为后截词、前截词、中截词三种类型。

后截词检索:

将截词符号放在一个字符的右方,以表示其右的有限或无限个字符不影响该字符串的检索匹配,属于【前方一致】检索

例:brows*,检索结果为browse,browser…;

acid??,检索结果为acidic;

词的单复数,如book?

年代,199?(90年代)19??(20世纪)

前截词检索:

与后截词相对,将截词符号放在一个字符串的左方,以表示其左的有限或无限个字符不影响该字符串的检索,属于后方一致检索

例:*magnetic检索结果为electromagnetic paramagnetic 等

中截词检索:

把截词符号放在一个检索词的中间,,中截词只允许检索词的有限截断。

例:Defen?e 检索结果为defense等。

15、位置符号(nW)和(nN)的运算含义分别是什么?请举例说明二者的区别。

(1)(W)和(nW)

(W)算符的运算含义是:在检索式中,它所连接的两上检索词必须在文本信息中按照前后顺序紧挨着出现,两上检索词之间除可以有一个空格、一个标点符号或一个连接号外,不得夹有任何其他单词、字母或汉字。换言之,采用(W)算符连接后的多元词,已成为一个固定的语组。

(nW)算符是从(W)算符引申出来的,它与(W)的区别是:允许在连接的两个检索词这间最多夹入n个其他单元词,即和(nW)要求在检索结果中出现时,两个检索词之间的相互距离不超过n个单词(或汉字)。

(2)(N)和(nN)

(N)算符的运算含义是:在检索式中,它所连接的两个检索词必须在文本信息中紧密相连着出现,两上检索词之间除可以有一个空格、一个标点符号或一个连接号外,不得夹有任何其他单词、字母或汉字,但与(W)算符的区别是,(N)算符两侧的检索词出现顺序可以颠倒。

(nN)则要求它所连接的两个检索词在检索结果中出现时,相互距离不超过n个单词(或汉字),且两个词出现的先后顺序也可以变换。

16、聚类检索的实施过程是什么?

聚类检索的实施,首先要以系统中的文献聚类处理为基础。而文献聚类,则是指针对系统中的全部文献向量,使用一定的相似性(或相异性)度量指标和聚类方法,计算出文献与文献之间的相似度,并把相似度较高的文献聚集在一起,形成一个个的文献类目,进而生成文献的聚类文档。

17、什么是用户检索行为?它包括哪些内容?

用户检索行为指用户为获取所需信息,在与检索系统交互过程中的一系列身体活动和心理活动。

主要包括:

检索前提问式的构造、重构检索式、提问式的长度、布尔算符的使用、短语的使用、截词算符及位置算符的使用、相关性反馈、检索策略、检索类型、检索问题的解决、检索结果的评价、检索周期、由任务类型决定的检索时间和检索方式选择等方面。

补充:用户友好的信息检索界面体现在哪些方面?

对于信息检索系统来说,友好的用户界面表现为:能够理解用户的查询意图;能够适应用户的认知和操作行为;能够帮助用户有效使用系统;能够迅速准确地找到所需信息;能够以用户最习惯或方便的方式向用户提供结果信息;无需太多的学习和训练。并应遵循以下原则:信息检索系统的功能性原则;尽量让用户“最省力”;

注意系统信息的显示;提供反馈与帮助体系

(1)能够理解用户的查询意图

(2)能够适应用户的认知和操作行为

(3)能够帮助用户有效的使用系统

(4)能够迅速准确的找到所需信息

(5)能够以用户最习惯或方便的方式向用户提供结果信息

(6)无需太多的学习和训练

18、用户信息需求的层次和类型有哪些?

用户信息需求是用户的一种心理活动和反映,作为表现人的高级需求的一种形式,他是一个取决于各种主、客观因素的动态量值。

a)用户潜在的真实的信息需求,这是最原始状态或称第一层次;

b)用户意识到或感知到的信息需求;

c)用户表达出的信息需求;

d)当用户进入某信息检索系统进行具体的查询操作时,把已经用自然语言表达出的信息请求转换成符合检索系统语法要求的提问式。

意大利米扎罗提出的用户信息需求层次论和美国情报学家沃格特的用户信息需求类型的划分。

米扎罗在论述信息检索的相关性问题时,提出用户的信息需求可以分成四个层次。

首先是用户潜在的真实的信息需求(Real Information Need,简称PIN)。

其次是用户意识到或感知到的信息需求(Perceived Information Need,简称PIN)。

第三个状态或层次是用户表达出的信息需求(Request,或称请求)。

第四种状态或层次是指当用户进入某信息检索系统进行具体的查询操作时,把已经用自然语言表达出的信息请求转换成符合检索系统语法要求的提问式(Query)。

美国情报学家沃格特认为,用户的信息需求一般可分为以下三个类型:

首先是对新信息的需求,即需要能及时获得、迅速传递的最新信息。

用户的第二类信息需求是想了解某一理论、方法、事件等的片段性信息,以解决其研究或日常工作中遇到的具体问题。

信息用户的另一类需求基于对某一课题或项目进行系统、详尽的了解,以便掌握问题的历史、发展和现状。即全面性,即要求检索得全面、系统、彻底。

沃格特的三种信息需求类型的划分,不仅为信息检索系统的检索性能提出了要求,也为提高信息检索服务的质量提供了可操作的方法。

19、何为检索策略?检索策略研究包括哪些内容?

检索策略是为实现检索目标而制定的全盘计划和方案,是对整个检索过程的谋划和指导。

检索策略的研究包括:要达到什么目标、要求什么范围、选择什么检索系统、通过什么检索途径、选择什么检索标识和逻辑组配方法以及需要哪些反馈调整措施等一系列问题的考虑和具体查询步骤的安排。

20、常用计算机检索策略有哪些?

1)积木型(build-block)策略:把用户的检索请求或检索课题剖析成若干个不同的概念面,先分别对这几个概念面进行搜索,并在每个概念面中尽可能全和多的列举相关词、同义词,近义词,并用布尔算符‘or’连接成子检索式,然后再用布尔算符‘and’把所有子检索式连接起来,构成一个总检索式

2)引文珠形增长(citation pear-growing)策略:从已知的关于检索问题的少数几个专指词开始检索,以便至少检出一篇命中文献或一条相关信息,然后审阅这批文献或信息条目,从中选出一些新的相关检索词,补充道检索式中去。

3)逐次分馏(successive fractions)策略:先确定一个相当大的,范围较广的检索初始对象集合,然后提高检索的专指度,得到一个较小的命中结果集合,继续提高检索式的专指度,一步一步缩小命中结果集合,直到得到数量适用,用户满意的结果为止。有利于保证检索的全面性,提高查全率。

4)最专指面优先(most specific facet first)策略:用户检索时,首先选择从课题中最专指的概念面入手,浏览结果后如发现检得的文献已经比较专指,通常就不再需要把其他概念面加入到检索式中去。获得更高的查准率,比较简洁,节约时间。

5)最低登录量面优先(lowest postings facet first)策略:首先查找数据库的倒排文档,确定检索词的登录量值,然后以登录量最少的那个概念面为检索入口开始检索。登录量是指索引词在倒排文档中出现的次数。

21、受控词汇的选择及优点

受控词汇:是一种经过检索系统规范化处理的检索词汇,它们一般取自标题表、叙词表、分类表等词汇工具。

优点:

(1)是容易准确地选择宽度适当的检索词,能全面理解该检索词所代表的概念以及和其他检索词所人表的概念之间的关系,便于调节检索范围。

(2)使用受控检索词进行检索时,检索者的智力负担比较小,容易获得较理想的检索结果。

22、如何使用扩检和缩检方式对检索式进行反馈调整?

对于需要较高查全率的检索课题,可以从扩检入手,检索式的调整可以选用以下方法:

1降低检索词的专指度,从词表等词汇工具或检索中间结果中选择一些上位词或相关词补充到检索式中;

2扩大检索式的网罗度,例如删去某个不重要的概念面;

3实施族性检索,如采用分类号或类目词检索,或进行检索式的扩展,如用OR将一组同义词、近义词加入检索式中;4进行截词检索,采用后截断或前截断等方式;

5取消某些限制过严的检索条件,例如年代、语种、文献类型等方面的限制要求。

对于需要较高查准率的检索课题,一般可以在一定查全率的基础上进行缩检,可使用的调节方法主要有:

1提高检索式的专指度,增加或换用下位词或专指度较高的自由词,或者直接使用短语进行检索;

2用AND连接一些进一步限定主题概念的相关检索项,增加检索词在检索结果中的同时出现频率;

3进行字段限制检索,或者使用位置算符控制检索词的顺序与出现位置;

4利用NOT限制与检索提问不相关信息的输出,减少检索噪音;

6进行二次检索,或对检索结果进行后处理,例如聚类、挖掘等。

23、ISI引文索引数据库收录科学期刊的标准有哪些?

1基本标准:期刊的出版时限;国际化的编辑规范;提供英文题目、文摘和关键词;同行审议

2国际化程度:为了能够满足世界各国用户的需要,ISI重点考虑收录国际化程度较高的期刊,即那些包含多国来源文献作者和多国引用文献作者的期刊。

3期刊编委会和编辑部状况:期刊编委会的组成要具有国际性、权威性;编委会成员要在SCI收录期刊物上有较高的发文量;编委会成员对期刊的编审要高度参与和投入;编辑部要拥有高水平的编辑人员。

4引文分析指标:

①影响因子:指期刊所载论文的平均被引率,等于该刊给定时期内的总被引量与可引文献量之比。

②即年指标:指当年发表的论文当年被引用的次数,是评价期刊论文被利用速度的指标。

③期刊论文作者尤其是编委会成员撰写论文的被引次数。

24、何谓JCR,它的主要功能是什么?

期刊引用报告服务(Journal Citation Reports,简称JCR)

JCR是一个独特的综合性、多科学期刊统计报告,它以期刊论文间的引证关系为基点,以年为为单位、系统、客观地统计ISI数据库收录期刊当年所载论文的数量、论文的引用文献数量、论文被引用次数等原始数据,进而计算出期刊的影响因子、即年指数、被引半哀期等反映期刊质量的定量指标,因此,它是科学家和图书情报部门选择特定学科领域核心期刊的重要参考依据,是期刊学术质量评价的重要统计的依据。

25、搜索引擎的基本结构如何?

信息检索的基本原理就是将用户的需求集合与信息集合相匹配的过程。作为网络检索工具,搜索引擎就是要通过匹配网络用户的信息需求与网络信息资源,从而找出用户所需的信息,一般包括数据采集、数据分析、数据组织、数据检索和信息挖掘5个功能模块。

●数据采集:负责按照一定的方式和要求对网络上的WWW站点等资源进行搜集,并将搜集到的WWW网页信息经过

网络传输,存储到搜索引擎的搜索端数据库中。

●数据分析:负责对收集到的网页信息进行分析,按照特定的算法,从中提取有检索或查询价值的内容。

●数据组织:负责形成规范的索引数据库或便于浏览的层次型分类目录结构。

●数据检索:负责帮用户用一定的检索方式来检索索引数据库或浏览分类目录结构,以获取用户所需信息。

●信息挖掘:负责提取用户相关关信息,以利用这些信息来提高检索服务的质量。

26、网络搜索程序的遍历策略有哪些?

网络搜索程序的遍历策略包括:IP地址搜索策略、深度优先搜索策略、宽度优先搜索策略、深度---宽度结合搜索策略、启发式搜索策略。

深度优先搜索策略:是早期开发Robot时使用得较多的方法。它的目的是要达到被搜索结构的叶结点(即那些不包含任何超链的HTML文件)

宽度优先搜索策略:在宽度优先搜索中,先搜索完一个网页中所有的超链接,然后再继续搜索下一层,直到底层为止。

27、元搜索引擎的基本结构如何?

其基本原理是调用各独立搜索引擎进行检索,并提供统一的用户界面和结果输出。元搜索引擎的基本结构按照功能分为三大部分:用户接口、查询代理和结果汇总。

用户接口:用户接口是用户浏览器与元搜索引擎交互的界面。元搜索引擎采用统一的检索界面,供用户输入查询请求。用户接口包括请求提交和检索接口两部分组成。其中请求提交负责将用户的检索请求分发给成员搜索引擎;检索接口负责把检索请求“转换”成满足不同成员搜索引擎特定要求的格式。用户接口的主要任务是将检索请求分发给各成员搜索引擎,完成查询请求的转换,分别生成适用于不同独立搜索引擎的特定的查询语言。

查询代理:负责元搜索引擎和相应的独立搜索引擎的交互,以获得用户需要的查询结果。对于并行工作的元搜索引擎,它链接的每一个成员搜索引擎都对应着一个查询代理。

汇总输出:负责把各个查询代理获得的检索结果统一起来,进行必要的调整(检索结果的分级排序、去重等),然后从中选择最能满足用户需要的查询结果,并以标准页面的形式呈现给用户。

28、什么是信息检索的查全率和查准率?它们的计算公式分别是什么?

查全率:(Recall Ratio,简称R)是衡量系统在实施某一检索作业时检出相关文献能力的一种测度指标,其计算方

查准率:(Precision Ratio,简称P)是衡量系统在实施某一检索作业时检索精确度的一个测度指标,其计算方法为:Precision=检出的相关文献量/检出的文献总量=a/(a+b)

查全率和查准率作为检索系统性能评价中的两个重要而经典的指标,它们结合起来,描述的系统检索成功率。29、目前主要有哪些查全率和查准率的替代性计算指标?

查全率和查准率的替代性计算指标包括:平均查全率和平均查准率、调和数F、E测度指标。

平均查全率和平均查准率的具体计算方法有3点平均值计算和11点平均值计算两种方式。

●其中3点平均值的计算方法是:选择查准率值分别为(0.25,0.50,0.75)或(0.2,0.5,0.8)时,对这3点上

的查全率求平均值;或者,选择查全率值分别为(0.25,0.50,0.75)或(0.2,0.5,0.8)时,对这3点上的查准率求平均值;

●11点平均值的计算方法则是将计算平均值的点扩展为(0.0,0.1,0.2,0.3,……,1.0)等11个,其余与3点平

均值方法相同。著名的TREC评价试验就采取了11点平均值的指标计算方法。

不论是平均查全率还是平均查准率的计算,都要求检索系统能够对检索结果实施线性的相关度排序输出。

30、你认为搜索引擎的性能评价指标主要有哪些?

研究人员对搜索引擎的性能评价问题已进行了广泛的探讨,其中常用的性能价指标主要涉及以下8个方面。

●数据库规模与内容:具体的考察因素(或指标)包括:收录范围、数据库内容、更新频率、重复率、死链接率

等。

●索引方法:主要考察的内容包括:索引方式(自动还是人工)、索引范围与深度等。

●检索功能:主要包括两在方面:基本检索功能(包括布尔检索、截词检索、位置/短语检索、限制检索等)和

高级(或辅助)检索功能(包括概念检索、相似检索、多语种检索等)。

●检索结果处理:主要考察指标包括:排序方式、显示内容/格式、后处理功能(如摘要、聚类、翻译等)。

●分类功能:主要涉及内容包括:分类类目体系的深度、数量、合理性等。

●用户界面:主要考虑的因素包括:界面布局、联机帮助、界面定制、界面广告量等。

●汉字处理:需要考虑的具体方面包括:词语切分、多内码处理/转换、中英文混合检索等。

●其他:(例如响应时间、系统稳定性等)。

31、TREC是一项什么试验?请简述它的试验组织过程?

TREC是一项致力于对文本信息检索技术进行大规模评价研究的试验活动。作为国际文本检索领域最具权威性的一项年度评测活动,TREC的参与者必须拥有自己研究、开发的检索系统;必须使用由TREC主办方提供的统一测试语料库和检索提问,在自己的检索系统上进行试验,最后,通过提交试验结果数据,由主办方统一进行检索系统的性能评价与排名。TREC检索评价活动的组织形式可以概括为:年度周期、春季发布试验数据、夏季展开检索试验、年终会议提交评价结果。

每年年初(约在1-2月),NIST会通过各种方式向有关机构、研究部门发出或发布参加新一届TREC活动的主题,并发出评价活动的通知或邀请。随后,主办者向会员发送参加试验需要使用的标准数据和检索提问式。收到试验数据后,各参会会员按照试验要求对自己的检索系统进行测试。8月份提交测试结果数据。9-10月份,NIST邀请、组织联邦政府部门的职业信息分析员对各个检索系统获得的结果数据进行统一的定量分析和评价,并按试验结果进行系统排名。11月份左右,TREC举行大会,参加评价活动的会员可以根据各自情形,选择会议发言或会下交流等形式,对检索系统涉及到的技术、合作、商业化等问题进行讨论与沟通。至此,一年一度的TREC活动宣告结束。

2014年4月份考试文献检索与应用第一次作业

2014年4月份考试文献检索与应用第一次作业 一、单项选择题(本大题共69.99999分,共 25 小题,每小题 2.8 分) 1. 国际标准连续性出版物编号的缩写形式为( ) A. ISBN B. ISSN C. CNKI D. VIP 2. 从物理构成来讲,数字资源检索系统由()几部分构成 A. 软件和数据库 B. 硬件、软件、数据库 C. 硬件系统和软件 D. 服务器和数据库 3. 关于人工语言描述错误的是( ) A. 人工语言是根据信息检索的需要而由人工创制的 B. 人工语言将同义词、近义词、相关词、多义词及缩略词规范在一起,由人工控制 C. 人工语言的维护成本不如自然语言 D. 人工语言可分为分类检索语言、主题检索语言、代码检索语言 4. 检索工具的类型有() A. 目录型检索工具、题录型检索工具和索引型检索工具 B. 目录型检索工具、题录型检索工具、文摘型检索工具和索引型检索工具 C. 目录型检索工具、文摘型检索工具和索引型检索工具 D. 目录型检索工具、题录型检索工具和索引型检索工具 5. 以下哪种文献属于零次文献? A. 期刊 B. 图书 C. 原始录音 D. 学位论文集 6. 以下哪个不属于中文期刊数据库? A. CNKI期刊数据库 B. 万方期刊 C. Kluwer期刊数据库 D. 维普期刊 7. 专利具有的特性有: () A. 排他性 B. 地域性 C. 时效性 D. 以上全部 8. 检索基本方法有() A. 工具法、追溯法 B. 常用法、循环法 C. 工具法、追溯法、循环法 D. 追溯法、循环法

9. 关于检索系统的工作原理的四种描述,以下描述错误的是()。 A. 检索系统包括信息的存储和检索两部分 B. 信息的存储包括标引过程 C. 检索其实匹配的过程 D. 用户检索都是一次性返回结果,不需要反馈 10. 要在SCI中查找重庆大学王万录教授的文献,请问以下检索式正确的是( ) A. AD=Chongqing Univ* and AU=Wang wl B. AD=Chongqing Univ and AU=Wang wl C. AD=Chongqing Univ* and AU=Wang wl D. AD=Chongqing Univ* and AU=Wang wanglu 11. 以下关于文献的四种描述,哪一个描述是错误的?() A. 文献的加工级别有零次文献、一次文献、二次文献和三次文献; B. 文献是指人类用来传递知识的各类印刷型书籍。 C. 按照文献的载体形式,文献可分为手写型文献、印刷型文献、缩微型文献、视听型文献和电子型文献五种类型。 D. 文献有存储知识、传递知识和教育娱乐三项基本功能。 12. 以下哪项检索属于数据检索? A. 地理成绩超过89分的学生人数 B. 查看美国的建国日期 C. 检索关于网络检索技术的文献 D. 某同类产品中,那种牌号的销量最差 13. 以下哪个不属于电子图书系统() A. 方正Apabi B. CNKI C. 书生之家 D. 超星电子图书 14. 图书的国际标准书号的缩写形式为( ) A. ISBN B. ISSN C. CNKI D. VIP 15. 信息检索的类型有( ) A. 文献检索 B. 数据检索 C. 事实检索 D. 以上全部 16. 关于学位论文及其数据库的描述错误的是() A. 学位论文研究内容新,时代性、实用性强,有很高的信息价值 B. 我国有学士学位论文、硕士学位论文、博士学位论文三种类型,学位论文数据库都包含博硕学位论文和学士学位论文 C. 开发学位论文数据库有利于最大限度挖掘学位论文的利用价值 D. 开发学位论文数据库有利于保存和提供历史素材. 17. 以下对专利的四种论述,哪一个是正确的? A. 专利是指一个国家授予创造发明人在以后的时间内对该发明创造的独占实施

文献检索考试题目及答案

在实际检索中,文献的检索方法主要有:直查法、追溯法、工具法和综合法。 最早的数学文献是:美索不达米亚泥版的楔形文,公元前1800年的埃及纸草书、莫斯科纸草书、莱茵德纸草书 著名的数学文献检索工具有SCI(科学引文索引)、EI(工程索引)、ISTP(科技会议录索引) 参考文献:列出作者在研究范围内所看过的国内外文献。参考文献与引言呼应,反映作者跟踪技术发展的眼界和敏锐性,反映作者知识的广度和深度,反映作者有资格说自己是创新。数量不可过少,例如中国科协期刊优秀论文评选要求研究性学术论文参考文献不少于20篇。参考文献不限于中文但,教科书不可多,不宜过陈旧。 什么是学术造假与剽窃?一般而言,剽窃的形式有哪些?司法实践中对剽窃 是如何界定的?剽窃与参考文献的区别是什么 学术造假行为通常被分为三类:伪造、篡改、剽窃 剽窃的定义:剽窃是指把他人的作品当成自己的作品。 学术腐败:学术腐败,主要是指利用学术权力谋取不正当的利益。 参考文献标准格式: 参考文献应限于作者直接阅读的、最主要的、发表在正式出版物上的文献。文献序号按其在文内出现的先后顺序编排,并在文内标注,参考文献的序号以方括号加注于被注文字的右上角,内容按序号顺序排列于文后。 论文参考文献的格式 期刊:[编号]作者.题目.期刊名(外文可缩写),出版年,卷号(期号);起止页码。 著作:[编号]作者.书名.版次(初版不写).出版地:出版者,出版年,起止页码。 论文集:[编号]作者.题目.见(英文用In)主编姓名.论文集名.出版地:出版者,出版年.起止页码。 选择题 1.( B )的主要功能是检索、通报、控制一次文献,帮助人们在较短时间内获取较多的文献信息。 A.零次文献B.二次文献C.一次文献D.三次文献 2.一次文献、二次文献、三次文献是按照( A )进行区分的。 A.加工深度B.原创的层次C.印刷的次数D.评论的次数 3.从文献的( B )角度区分,可将文献分为印刷型、缩微型等。 A.内容公开次数B.载体类型C.出版类型D.公开程度 4.具有固定名称、统一出版形式和一定出版规律的定期或不定期的连续出版物,称为

网络信息检索试题及答案(DOC)

第一部分 1、一条及时的信息可能使濒临破产的企业起死回生,一条过时的信息可能分文不值,甚至是企业丧失难得的发展机遇,造成严重后果,这说明信息具有( C )特征。 A、差异性 B、传递性 C、时效性 D、共享性 2、培养学生养成良好的信息素养,主要从四个方面进行,其中不包含( B ): A、信息意识 B、信息心理 C、信息能力 D、信息道德 3、哈佛大学经济学专业学生能够依据图书馆中哪些极为平常、完全公开的图书资料,撰写出核专家都感到惊异的“制造核弹的方法”的报告,反映出良好的信息素养是()。 A、获取知识的捷径 B、科学研究的向导 C、终身教育的基础 D、创新知识的源泉 4、按照信息处理的级别来划分,可以将信息分为零次、一次、二次和三次信息,下面()是一次信息的别称。 A、灰色信息 B、原始信息 C、检索性信息 D、参考性信息 5、“便于保存传递、但需要借助阅读机阅读”是以感光材料记录文字及相关信息的()信息载体类型的特点。 A、印刷型 B、电子型 C、声像型 D、微缩型 6、谈谈你对“信息”的理解。 特征:客观性和普遍性、差异性、传递性、时效性、可转换性、共享性。 7、下列文献哪个是二次文献?( A ) A. 文摘 B. 会议文献 C. 辞典 D.百科全书 8、“文章草稿”、“私人笔记”及“会议记录”属于( A )。 A. 零次文献 B. 一次文献 C. 二次文献 D. 三次文献 9、下列选项中哪一项属于“国内统一刊号”(C )。 A. ISBN 7-04-014623-1 B. ISSN 0254-4164 C. CN 11-2127/TP D. 0254-4164/TP 10、根据国标GB/T 7714-2005规定,下面的横线上的信息是对( C )参考文献的著录条目描述。 萧钰.出版业信息化迈入快车道[EB/OL] .(2001-12-19) [2002-04- 15]. http:∥www. ….htm. A、标准文献 B、期刊(杂志) C、电子文献 D、会议文献 11、根据国标GB/T 7714-2005规定,下面的横线上的信息是对( B )参考文献的著录条目描述。 昂温G,昂温P S .外国出版史[M]. 陈生铮,译. 北京:中国书籍出版社, 2001:15-20 A、期刊(J) B、图书 C、科技报告(R) D、会议文献(Z) 12、下面哪些资料属于三次信息?(ACFLOP) A、《2009年山东省统计年鉴》 B、美国《工程索引》 C、《新华字典》 D、《新华文摘》 E、《机械工业出版社2012年图书征订目录》 F、《计算机科学技术百科全书》 G、《计算机工程与应用》 H、《网络营销》 I、《NASA报告》。 J、《博士论文:论网络时代的商务模

江南大学阶段性机考信息检索与利用第1阶段测试题

考试科目:《信息检索与利用》第1章至第3章(总分100分) 一、单项选择题(每题2分,共20分) 1、( ) 是人类知识的总汇,被誉为“工具书之王”、“没有围墙的大学”。 A、四库全书 B、年鉴 C、辞海 D、百科全书 2、优先算符用()表达。 A、() B、* C、? D、“” 3、以下信息资源中,()是三次信息资源。 A、期刊 B、学位论文 C、年鉴 D、专利 4、图书是不少于()页并构成一个书目单元的文献。 A、48 B、49 C、58 D、59 5、百度(Baidu)检索框中输入多个词,词与词之间用空格隔开表示()关系。 A、逻辑或 B、逻辑非 C、逻辑与 D、短语或词组 6、查全率和查准率之间存在( )关系。 A、互逆 B、正比 C、交叉 D、包含 7、开放存取期刊简称()期刊。 A、OCR B、OA C、Open D、Access 8、国家科技图书文献中心简称(),是基于网络环境的科技信息资源服务机构。 A、OCLC B、NTSL C、NTIS D、NSTL 9、()是为特定目的而搜集的有使用价值的知识或信息。 A、文献 B、情报 C、文献 D、档案 10、()是将文献主题概念按知识学科性质进行分类和系统排列,并用号码表达各种概念的检索语言。 A、分类语言 B、主题语言 C、代码语言 D、Java语言 二、多项选择题(每题2分,共20分) 1、信息素养是一种综合的能力素养,包括()等多方面因素。 A、信息意识 B、信息知识 C、信息能力 D、信息伦理道德 2、信息资源按加工程度可以划分为()。 A、零次信息资源 B、一次信息资源 C、二次信息资源 D、三次信息资源 3、二次信息资源主要包括()等具有标引和检索性质的信息资源。 A、目录 B、题录 C、文摘 D、索引 4、以下连续出版物有()。 A、期刊 B、丛书 C、报纸 D、年鉴 5、在线不列颠百科全书的检索方式包括()。 A、专家检索 B、高级检索 C、快速检索 D、浏览检索

信息检索试题及答案

《信息检索》课程考查试题 一、单选题(6题*10分/题=60分) 1.请标出文献:马品仲. 大型天文望远镜研究. 中国的空间科学技术,1993,13(5)P6-14,ISSN1000-758X 属于哪种文献类型____C________。 A、图书 B、科技报告 C、期刊 D、报纸 2.常用的检索系统有_______D_____。 A、目录检索系统 B、文摘检索系统 C、全文检索系统 D、以上都是 3.可以将信息检索的一般步骤归纳为_____A_____五个步骤。 A、界定问题、选择信息源、制定策略并实施检索、评价信息、分析和利用信息 B、选择信息源、界定问题、制定策略并实施检索、评价信息、分析和利用信息 C、制定策略并实施检索、界定问题、选择信息源、评价信息、分析和利用信息 D、选择信息源、界定问题、制定策略并实施检索、评价信息、分析和利用信息 4.需要着手写一篇有关商业智能系统研究现状的报告,应着重查询以下____D_______个信息源。 A、网页 B、报纸 C、杂志 D、各类文献数据库 5.常用的网络免费学术资源有______D______。 A、虚拟图书馆 B、开放获取资源 C、免费专利资源 D、以上都是6.Science Citation Index与其他文献检索刊物不同之处在于_______B____。 A、它具有团体索引 B、它具有引文索引 C、它可以了解某著者发表论文情况 D、它可以了解科研的最新动态 二、判断题(8题*5分/题=40分) 1.信息检索过程是一个检索的操作过程,如选择数据库、确定关键词、构造检索式等。错2.对于要求一定深度、研究性的信息问题,应主要检索搜索引擎检索网络信息源。错3.选择信息源是信息检索的第一步。错 4.信息检索无时不有、无处不在。对 5.图书是各类信息源中最具时效性的一种。错 6.期刊文献、会议文献和学位论文都是一次文献。对 7.在Ei Compendex数据库中,提供的检索结果排序方式只有“Publication year”一种方式。错 8.随着数字技术的飞速发展,电子型文献将越来越受欢迎,印刷型文献慢慢就没有用武之地了。错 (本答案已被确认)

文献检索试题答案

2013年文献检索考试试题答卷学号: 0141 姓名: 李冷班级:2010级医学检验班 检索题目:鲍曼不动杆菌的多重耐药 课题分析:鲍曼不动杆菌(一cinetobacterbaumannii,A.b)是革兰阴性中的条件致病菌,近年来感染率逐年上升,已成为医院感常见细菌之一。鲍曼不动杆菌生存能力强,可长期在院内定植,甚至造成感染的暴发流行,鲍曼不动杆菌耐药机制复杂.常现多重耐药或泛耐药, 了解近年来鲍曼不动杆菌的临床感染特征和对常用抗菌物的耐药状况及耐药性变迁,对控制鲍曼不动杆菌院内感染及指导临床合理运用抗菌药物有重要意义。 ⊙课题涉及的学科范围(按中图法确定) R 医学学科分类号::R378.991 [医药、卫生 >临床医学 > 诊断学 >实验室诊断 >微生物学检验] ⊙课题用的检索工具 数据库期刊、图书、专利数据库、学位论文 ⊙明确课题涉及的时间范围 2005—2013年 ⊙检索途径 内部特征检索途径:分类途径、主题途径、关键词途径

一、数据库选取——维普期刊数据库 1.1、检索年限:2005—2013 1.2、检索主题词:鲍曼不动杆菌的多重耐药 1.3、检索关键词:鲍曼不动杆菌;多重耐药;耐药机制 1.4、检索同义词:耐药性;条件性致病革兰阴性菌 1.5、英文关键词:acinetobacter baumanii drug resistance...... 1.6、检索式:题名=鲍曼不动杆菌多重耐药机制与时间 =2005-2013与学科=临床医学,中国医学,基础医学,预防医学卫生学...... 与范围=全部期刊 1.7、检索结果:查找到相关期刊文章32篇;密切相关的有 25篇 二、图书检索选取:读秀中文学术搜索 、检索主题词:鲍曼不动杆菌+多重耐药 、检索结果:检索到中文图书1种 三、专利数据库:中华人民共和国国家知识产权局专利检索 专利检索:名称鲍曼不动杆菌有125条结果 四、学位论文:万方数据资源系统

《信息检索与利用》期末复习1

《信息检索与利用》期末复习 试题题型 一、填空题(每空3分,共15分) 二、选择题(每题3分,共30分) 三、判断题(每题3分,共30分) 四、简答题(共25分) 1.(12分) 2.(13分) 复习题 第一章信息资源检索基础知识 一、填空题 1.___________________________是自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互关系、相互作用等运动状态的表达。信息 2.___________________________是在改造客观世界的实践中获得的对客观事物存在和运动规律的认知和总结,是人的大脑通过思维重新组合的系统化的信息的集合。知识 3.___________________________是人们用来解决特定问题所需要的、经过激活过程活化了的具有使用价值的知识或信息。情报 4.___________________________是在存储检索利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、载体上或依附载体而存有信息或数据的载体。文献 5.___________________________是指在国内外学术或非学术会议上发表的论文或报告。会议文献 6.___________________________是高等院校和科研机构的毕业生为获取各级学位在导师指导下撰写和提交和科学研究、科学实验的书面报告。学位论文 7.___________________________是对文献内容和形式特征进行选择和记录的过程。著录8.___________________________是指特定的数值型数据为对象的检索。数据检索 9.___________________________是指以特定的事实为目标的检索。事实检索 10.事实与数据检索工具主要依靠各类___________________________完成各种数据或事实的查询。参考工具书 11.按照结构原理,信息检索语言可以分为_____________________、____________________、

信息检索题目(含答案)

2013年(秋)《信息检索》练习 单选题(每题1分,共45题,45分) 1.计算机中使用的0与1的二进制代码是(C) A.自然信息 B.生物信息 C.机器信息 D.人类信息 2.以下(B)不是信息的基本要素。 A.载体 B.数据库 C.信源 D.信宿 3.国际标准书号中地区号为7,代表其是(B)出版的图书。 A.美国 B.中国大陆 C.俄语系国家 D.法语系 4.以下(D)不是信息的特征。 A.共享性 B.价值型 C.时效性 D.不可扩充性 5.(A)使用的是http协议。 A.WWW网络资源 B.FTP信息资源 C.TELNET信息资源 D.用户服务组资源 6.(B)使用的是ftp协议。 A.WWW网络资源 B.FTP信息资源 C.TELNET信息资源 D.用户服务组资源 7.分类法用(A)作为文献容标识和检索标识。 A.分类号 B.词语 C.阿拉伯数字 D.英文字母

8.主题法用(A)做描述文献主题的标识和检索标识。 正确答案:B A.分类号 B.词语 C.阿拉伯数字 D.英文字母 9.关键词语言属于(B) 正确答案:A A.自然语言 B.标题词语言 C.叙词语言 D.分类语言 10.以下族性检索功能最强的是(A) A.分类途径 B.文献名途径 C.著者途径 D.主题途径 11.(D)是从参考文献着手来查找文献的方法。 A.顺查法 B.倒查法 C.抽查法 D.追溯法 12.一个截词符代表多个字符指的是(D) 正确答案:C A.后截词 B.中截词 C.无限截词 D.有限截词 13.在布尔逻辑检索技术中,用(B)表示在检索结果中只需包含A或者B即可。正确答案:D A. A not B B. A and B C. A - B D. A or B 14.(B)之前,必须输入一个空格。 正确答案:C A.与运算 B.或运算

文献检索选择题(含答案)

1.用“肝?疫苗”能检索到: A 肝炎疫苗 B 肝核酸疫苗 C 肝炎灭活疫苗 D 肝炎联合疫苗 正确答案:A 2.通过主题途径检索有关肺癌的文献,以下哪个是正确的主题词: A 肺肿瘤 B 肺肉瘤 C 肺癌 D 肺脓肿 正确答案:A 3.《中国图书馆分类法(第四版)》将知识门类分为“哲学”、“社会科学”和()三大部类。 A 自然科学 B 人文社科 C 医药科学 D 政治学 正确答案:A 4.专利说明书属于下列哪种类型的文献: A 一次文献 B 零次文献 C 二次文献 D 三次文献 正确答案:A 5.“语种”的字段简称是下面哪一个: A LA B AB C TI D SO 正确答案:A 6.下列检索算符哪个是位通配符? A ? B = C < D + 正确答案:A 7.检索有关肝癌最新研究进展的最佳检索式是:

A 肝肿瘤[扩展全部树]/全部副主题词and 综述in PT B 肝癌[扩展全部树]/全部副主题词and 综述in PA C 肝癌[扩展全部树]/全部副主题词and 进展 D 肝肿瘤[扩展全部树]/全部副主题词and 研究进展 正确答案:A 8.每一种正式出版的图书都有一个代表图书基本信息的号码,它的名称是: A ISBN B ISSN C IBM D IBSN 正确答案:A 9.手稿文属于下列哪种类型的文献: A 零次文献 B 一次文献 C 二次文献 D 三次文献 正确答案:A 10.字段简称“AU”的意思是以下哪一个: A 著者 B 出处 C 摘要 D 地址 正确答案:A 11.下列文献类型哪个属于三次文献? A 综述 B 专利说明书 C 期刊论文 D 文摘 正确答案:A 12.通过主题途径检索“隐球菌并发的糖尿病(两病并存而未指明因果关系)”, 其中一个主题词是“隐球菌病/并发症”,另一个主题词是: A 糖尿病/并发症 B 糖尿病/病因学 C 糖尿病/副作用 D 糖

《信息的检索与利用》复习资料

《信息检索与利用》期末复习资料 试题的难易程度和题量适当,按难易程度分为三个层次:容易占40%,一般占40%,较难占20%。 一、填空题 1.__是自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互关系、相互作用等运动状态的表达。信息 2.__是在改造客观世界的实践中获得的对客观事物存在和运动规律的认知和总结,是人的大脑通过思维重新组合的系统化的信息的集合。知识 3.__ 是人们用来解决特定问题所需要的、经过激活过程活化了的具有使用价值的知识或信息。情报 4.___是在存储检索利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、载体上或依附载体而存有信息或数据的载体。文献 5.___是指在国内外学术或非学术会议上发表的论文或报告。会议文献 6.___是高等院校和科研机构的毕业生为获取各级学位在导师指导下撰写和提交和科学研究、科学实验的书面报告。学位论文 7.___是对文献内容和形式特征进行选择和记录的过程。著录8.___是指特定的数值型数据为对象的检索。数据检索 9.___是指以特定的事实为目标的检索。事实检索 10.事实与数据检索工具主要依靠各类___完成各种数据或事实的查询。参考工具书 11.按照结构原理,信息检索语言可以分为____、___、___等多种类型。分类语言,主题语言,代码语言 12.Internet是基于 ___协议的网络。TCP/IP 13.二级域名https://www.doczj.com/doc/138238580.html,是指__。教育机构 14.目前WWW环境中使用较多的浏览器有Microsoft公司的__和Netscape公司的___。Internet Explorer,Netscape 15.FTP信息资源检索中匿名登录的用户名是___。Anonymous 16.网络信息检索工具一般由___、___、___三部分组成。信息采集子系统,数据库,检索代理软件 17.据互联网统计公司comScore发布的2007年12月世界搜索引擎市场份额前几名中,主要的搜索引擎公司有___、___、____等。谷歌(Google),雅虎(Yahoo),百度(Baidu) 18.大多数搜索引擎允许用户使用布尔逻辑运算符,以及与之对应的___表示限定搜索结果中必须包含的词汇,___表示限定搜索结果中不能包含的词汇。+,— 19.一些搜索引擎提供了按链接和网域等进行搜索范围的限制,比如,用___表示搜索结果局限于某个网站。site: 20.一些搜索引擎提供了按链接和网域等进行搜索范围的限制,比如,用____表示到某个URL地址指定的网页内进行检索。link: 21.搜索引擎中,在普通查询词后面加一个_____表示文档类型限定。filetype: 22.CNKI数据库需要下载安装______全文浏览器软件或_____全文浏览器软件才能阅读资源。CAJViewer,Adobe Reader 23.维普资讯网的高级检索中,查询语句“K=(CAD+CAM)*R=机械”表示___。文献或文摘中含有“机械”,并且关键词中含有CAD或CAM 24.万方数据库简单检索页面中默认只提供两个检索项选择框,可以通过___按钮增加检索项选择框。+ 25.___又称数据图书或eBook,是电子出版物中最常见的文献形式。电子图书 26.国内提供电子图书服务的网络站点很多,常用的有____、___、___等。超星数字图书馆,书生之家数字图书馆,北大方正Apabi 数字图书馆 27.Dialog系统提供通过____、___、___三种方式接入系统。Internet 接入,Telnet远程登录,专线接入 28.若文献B引用了文献A,则文献A称为文献B的_____。引文(参考文献) 29.SCI的中文名称为_____。科学引文索引 30.SSCI的中文名称为____。社会科学引文索引31.A&HCI的中文名称为____。艺术与人文科学引文索引32.EI的中文名称为_____。工程索引 33.ISTP的中文名称为_____。科学技术会议录索引 34.CSSCI的中文名称为______。中国社会科学引文索引 35.____是最主要的会议文献,通过体现了学科中的新发现、新进展、新成就等。会议论文 36.学位论文一般分为两大类型,一类是____,另一类是______。理论研究型,调研综述型 37.从分类角度管理和检索专利文献的工具中,国际上广泛采用的是______。《国际专利分类法》 38.中国专利信息的检索主要通过三种方式,一是通过____,二是通过_____,三是利用______。印刷型检索工具,光盘型检索工具,网络型检索工具 39._____是对科学、技术研究结果的报告或研究进展的记录。科技报告 40.科技报告按保密程度划分为______、______、______、____、____。绝密报告,秘密报告,非密限制发行报告,非保密报告,解密报告 41._____是指按照规定程序编制并经过一个公认的权威机构批准的,供在一定范围内广泛而多次使用的特种科技文献体系。标准文献 42.数据与事实型信息的检索主要通过利用_____、____和___三种途径来实现。参考工具书,数据与事实型数据库,数据与事实型资源网站 43.根据一定的社会需要,以特定的编排方式和检索方法,汇编某学科或特定范围的知识和资料,专为人们解决疑难和提供数据或事实信息为目的,作为工具使用的专供查考的特定类型的图书,称为___。 参考工具书 44.中文工具书的排检方法主要有_____、_____、_____和____四大类。字顺法,分类法,主题法,自然顺序法 二、选择题 1.下面哪项不是情报构成的三要素之一()。D A.本质是知识B.经过传递 C.经过用户使用产生效益D.通过购买获取 2.一次文献是()。B A.最原始的信息资源B.最主要的信息资源 C.对文献的集中提炼和有序化D.按知识门类或专题重新组织、高度浓缩而成 3.下面哪一项是白色文献()。A A.期刊文献B.科技报告C.专利文献D.学位论文 4.报纸区别于其它文献的特征是()。B A.创新性B.及时性C.学术性D.全面性 5.具有法律约束力和一定的时效性,经权威机构批准的规章性文献是()。 A A.标准文献B.学位论文C.档案文献D.科技报告 6.一般存在相应二次文献的是()。 A A.期刊B.产品样本C.档案 D.报纸 7.常见的事实和数据检索工具书不包括()。D A.百科全书B.年鉴C.机构指南D.杂志 8.在信息检索语言的分类语言中,国际上使用较多的分类表是()。D A.中国图书馆分类法B.人民大学图书馆分类法 C.科学院图书馆分类法D.国际十进分类法 9.传统信息资源检索技术中常用的布尔逻辑运算符中不包括()。D A.或B.与C.非 D.异或 精彩文档

文献检索复习题(名解-简答)

文献检索复习题(名解-简答)

文献检索复习题 一、名词解释 1.二次文献信息:二次文献也称二级文献,它是将大量分散、零乱、无序的一次文献进行整理、浓缩、提炼,并按照一定的逻辑顺序和科学体系加以编排存储,使之系统化,以便于检索利用。 2.学科化服务:指图书馆设专人与某一学科专业作为对口单位建立联系,在院系、学科专业与图书馆之间架起一座桥梁,相互沟通,为用户主动地,有针对性的收集和提供文献信息的服务。 3.网络电子图书:以电子图书形式发行,以互联网为流通渠道,以数字内容为流通介质,以网上交易为主要支付手段的图书。 4.专利文献:是实行专利制度的国家、地区及国际性专利组织在审批专利过程中产生的官方文件及其出版物的总称。 5.引文分析法:引文分析法,就是利用各种数学及统计学的方法进行比较、归纳、抽象、概括等的逻辑方法,对科学期刊、论文、著者等分析对象的引用和被引用现象进行分析,以揭示其数量特征和内在规律的一种信息计量研究方法。

6.书目数据库:是指存储某些或某一个领域的二次文献书目数据的一类数据库。 7.个性化导读服务:又称阅读指导服务,是图书馆针对各类型读者,采取各种措施主动诱导读者的阅读行为,提高其阅读意识,阅读能力和阅读效益的一种教育活动。 8.双词频控制检索:指对一个检索项中的两检索词分别实行词频控制,也就是一个检索项使用了两次词频控制。是针对单项双词组合检索而设置的。 9.专利法:专利法是确认发明人(或其权利继受人)对其发明享有专有权,规定专利权人的权利和义务的法 10.网络信息资源:网络信息资源是指通过计算机网络可以利用的各种信息资源的总和。具体的说是指所有以电子数据形式把文字、图像、声音、动画等多种形式的信息存储在光、磁等非纸介质的载体中,并通过网络通信、计算机或终端等方式再现出来的资源。 11.参考数据库:指为用户提供信息线索的数据库,它可以指引用户获取原始信息。参考数据库包括书目数据库(Bibliographic Database)和指南数据库(Referral Database)。

信息检索与利用试题1答案

信息检索与利用复习题 一、单选题(20分,每题1分) 1、个人信息源又称为(C)。 A、文献信息源 B、口头信息源 C、生物信息源 D、实物信息源 2、文献是记录有知识的(A)。 A、载体 B、纸张 C、光盘 D、磁盘 3、下列哪种文献属于一次文献( A)。 A、期刊论文 B、百科全书 C、综述 D、文摘 4、下列哪种文献属于二次文献( D)。 A、专利文献 B、学位论文 C、会议文献 D、目录 5、下列哪种文献属于三次文献( C)。 A、标准文献 B、学位论文 C、综述 D、文摘 6、下列选项中属于连续出版物类型的选项有(A)。 A、人民日报 B、学位论文 C、科技期刊 D、会议文献 7、下列选项中属于特种文献类型的有(D )。 A、学位论文 B、图书 C、科技期刊 D、标准文献 8、纸质信息源的载体是(D ) A、光盘 B、缩微平片 C、感光材料 D、纸张 9、《中国图书分类法》(简称《中图法》)将图书分成(A ) A 5大部分22个大类 B 5大部分26个大类

C 6大部分22个大类 D 6大部分26个大类 10、《中国图书分类法》(简称《中图法》)是我国常用的分类法,要检索农业方面的图书,需要在(A)类目下查找。 A、S类目 B、Q类目 C、T 类目 D、R类目 11、使用逻辑“与”是为了(B ) A、提高查全率 B、提高查准率 C、减少漏检率 D、提高利用率 12、使用逻辑“或”是为了(A) A、提高查全率 B、提高查准率 C、缩小检索范围 D、提高利用率 13、利用文献末尾所附参考文献进行检索的方法是(C) A、倒查法 B、顺查法 C、引文追溯法 D、抽查法 14、至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合,称为(A)。 A、数据库 B、记录 C、字段 D、文档 15、广义的信息检索包含两个过程(B) A、检索与利用 B、存储与检索 C、存储与利用 D、检索与报道 16、要查找李平老师所发表的文章,首选途径为(A ) A、著者途径 B、分类途径 C、主题途径 D、刊名途径 17、狭义的专利文献是指(C ) A、专利公报 B、专利目录 C、专利说明书 D、专利索引

文献检索试题和答案

文献检索试题和答案 TTA standardization office【TTA 5AB- TTAK 08- TTA 2C】

文献检索课习题卷答案 一、不定项选择题(共50分,每题1分,少选多选均不给分) 1.信息是“用来消除不确定性的东西”,是那个科学家提出来的( D.申农) 2.现代社会中,人们把( B.信息、物质、能量)称为构成世界的三大要素 3.以下属于一次信息资源的是:( B.学位论文) 4. 属于一次信息资源的有(A 会议记录 B 专着 C 专利说明书 D 研究报告) 5. 关于文献,下列说法错误的是( CD )。 A 文献记录的是显性知识 B 检索工具书都属于二次文献 C 文献可以没有载体 D 文献记录的是隐性知识 6. 关于文献,下列说法正确的是:( A 私人笔记属于零次文献 B 学位论文属于一次文献C 百科全书属于三次文献 ) 7. 关于信息资源,下列说法错误的是( A )。 A. 信息资源同时只能被一个使用者所利用 B. 信息资源必须依赖一定的载体才能体现出来 C. 从某种意义上讲,信息资源的价值取决于信息的时效性 D. 信息资源的扩散速度与传递技术的发展成正比 8.推广优秀职员的营销经验使公司业绩大提高,职员经验交流说明了信息具有(C.共享性) 9.关于信息的特征,下列说法正确的是( D.信息需要依附于一定的载体形态) 10.下列叙述中,其中( D )是错误的。 A. 信息可以被多个信息接收者接收并且多次使用 B. 信息具有时效性特征 C. 同一个信息可以依附于不同的载体 D. 获取了一个信息后,它的价值永远存在 11.信息素养的核心是( C.信息能力) 12.关于检索语言,下列说法正确的是( C 中国图书馆图书分类法属于体系分类语言)13.图书的外部特征有( A、着者 B、价格 C、书名 D、出版社) 14.以下检索途径,哪些是反映信息外部特征的(A 题名途径 B 着者途径 C 代码途径) 15.《中国图书馆图书分类法》(简称《中图法》)将图书分成(A. 5大部类,22个基本大类) 16.按照中国图书分类法,下列分类号排序正确的是(C F123、、F13 ) 17.长篇小说《射雕英雄传》的分类号为(A ) 18.根据《中图法》的分类标准,鲁迅《朝花夕拾》的分类号是( B. ) 19.巴金长篇小说《家》的分类号为( A ) 20.利用文献后所附参考文献进行检索的方法叫( A.追溯法)。 21.利用选定的检索工具由近及远地逐年查找,直到查到所需文献为止的检索方法是( B. 倒查法)22.逻辑算符包括( ABCD )算符。 A.逻辑“与” B.逻辑“或” C.逻辑“非” D.以上三项 23.关于布尔逻辑检索,下列说法正确的是( BD ) B.多个检索词间使用“逻辑与”匹配可以缩小检索范围 D多个检索词间使用“逻辑非”匹配可以缩小检索范围 24.布尔逻辑检索算符有(A and C not D or) 25.二次检索指的是( C 在检索结果中运用“与、或、非”进行再限制检索)

信息检索与利用考试试题

《信息检索与利用》课程考试试题 目的:检验主要理论要点和实际操作技术。 方式:开卷考试。 一、多选题(每题1分,合计10分) 1.下面哪些属于二次文献(BCD )。 A.手册; B.文摘; C.目录; D.题录. 2.针对不同时间要求的文献应使用不同的文献类型,就最新的文献信息而言,例如近一两个月的文献信息,应该使用(BD )。 A.图书; B.期刊或报纸; C.专利; D.互联网. 3.在计算机检索中,同一概念的同义词扩展方法有(A )等。 A. 学名或俗名; B.简称和全称; C.上位和下位; D.术语和代码. 4.概念(AB )之间属于上下位关系。 A.家用电器与电视机 B.局域网与LAN C.计算机与电脑 D.硅酸盐与陶瓷 5. 概念(A )之间属于同一概念的扩展关系。 A. 乙醇与酒精; B.手机与移动电话; C.fiber与fibre; D.因特网与局域网。 6. ( A D )的基本作用是扩大检索范围,增加命中篇数,提高查全率。 A. 逻辑“或”; B.优先算符; C. 逻辑“与”; D.截词 7. (BC )的基本作用是缩小检索范围,减少命中篇数,提高查准率。 A. 逻辑“或”; B.优先算符; C. 逻辑“与”; D.逻辑“非” 8. 从概念之间的关系和检索策略的常识判断,(AD )是符合逻辑的。 A.世界贸易组织OR WTO; B. 世界贸易组织AND WTO; C.bank OR company ; D. bank AND company. 9.通过谷歌(Google)查得的结果过多,可通过(ABCD )方法,优化检索结果。 A.词组检索; B.字段限定; C.增加同义词; D.使用优先算符. 10. 如果检索结果过少,查全率很低,需要调整检索范围,此时,调整检索策略的方法有( BEF )等。 A. 用逻辑“与”或者逻辑“非”增加限制概念;B.用逻辑“或”或截词增加同族概念; C. 用字段算符或年份增加辅助限制; D. 用“在结果中检索”增加限制条件.E.找出词干的上位词; F.在词干相同的单词后使用截词符”?”

2021年文献检索总复习题参考答案

-经济学院《文献检索与运用》总复习题库 单选题 1.下列属于布尔逻辑算符是(D)。 A、与 B、或 C、非 D、以上都是 2、信息素养核心是(C). A、信息意识; B、信息知识; C、信息能力; D、信息道德 3、20世纪70年代,联合国教科文组织提出:人类要向着( B )发展. A、终身学习; B、学习型社会; C、创新发展; D、信息素质 4.参照文献原则著录格式是( A )。 A、著者篇名来源出处; B、篇名著者来源出处 5.请标出文献:马品仲. 大型天文望远镜研究. 中华人民共和国空间科学技术,1993,13(5)P6-14,ISSN1000-758X 属于哪种文献类型( C )。 A、图书; B、科技报告; C、期刊; D、报纸 6.惯用检索系统有( D )。 A、目录检索系统 B、文摘检索系统 C、全文检索系统 D、以上都是 7、哪一种布尔逻辑运算符用于交叉概念或限定关系组配?( A )。 A.逻辑与()B.逻辑或(OR)C.逻辑非(NOT)D.逻辑与和逻辑非 8、依照国家有关原则,文献定义是指“记录关于( C )一切载体。” A.情报B.信息. C.知识D.数据 9、( D )是指通过文献信息资料主题内容进行检索途径。 A.题名检索途径 B.作者检索途径 C.分类检索途径 D.主题检索途径 10、搜索具有“data bank”PDF文献,对的检索式为:( A) A."data bank" filetype:pdf B.data and bank and pdf 11、从文献( B )角度区别,可将文献分为印刷型、电子型文献。 A.内容公开次数B.载体类型. C.出版类型D.公开限度 12、按照出版时间先后,应将各个级别文献排列成( C)

武汉大学《信息检索》试卷及答案(两套)

武汉大学信息管理学院2008-2009学年度第二学期 《信息检索》课程考试卷(A卷) 年级专业图书馆学姓名学号 (请务必将答案写在答题纸上,否则无效) 一、名词解释(5 x 4分=20分) 1.信息检索 2.引文索引 3.CALIS 4.邻近检索 5.搜索引擎 二.简答(5 x 6分=30分) 1.电子图书有哪些特点? 2.对搜索引擎的选择与比较主要从哪些方面考虑? 3.网络信息选择的标准有哪些? 4.查找国内外引文与学位论文分别有哪些数据库?每类中分别举2个英文数据库(包括全称、简称与中译)和1个中文数据库。 5.除商业数据库和搜索引擎外,还可以从哪些途径获取网络信息资源?请至少给出5种,每种举一例。三.选择填空(4 x 5分=20分) 此题为多项选择题,选错者不倒扣分,但所选答案不得多于5个。 1.下列中不能用于查找期刊论文引用信息的有: a. SSCI b. CSSCI c. Journal Citation Report d. Ulrich’s International Directory of Periodicals e. SCI f. A&HCI g. ProQuest Digital Dissertations h. Web of Knowledge i.VIP Chinese Scientific Journal Database j.Chinese Enterprises and Companies Database 2.检索图书馆学、信息管理学的期刊论文,可用的检索工具有: a. LISA b. ISA c. BA d. CA e. Web of Knowledge f. Ei g. SSCI h. SCI i. ProQuest Digital Dissertations 3.下列中可用于查找机构信息的有: a. ProQuest Digital Dissertations b. Ulrich’s International Directory of Periodicals c.Chinese Enterprises and Companies Database d. Foundation Directory e. Peter son’s Gradline f. Who is Who g. World of Learning h. Encyclopedia of Associations 4.下列中可用于查找期刊论文信息的有: a. ProQuest Digital Dissertations b. Ulrich’s International Directory of Periodicals

《文献检索》期末考试复习题及答案

《文献检索》试题 1 一、单项选择题 1.信息成为情报必须具有的三个基本要素是( C )。 A.选择、综合、分析 B.综合、筛选、重新组合 C.知识、传递、效益 D. 筛选、组合、系统化 2.下面对查全率和查准率描述错误的是( A )。 A.若某检索工具的查全率较高,则查准率也会相对较高 B.查准率为检出的相关文献量占检出文献总量的百分比 C.查全率和查准率是反映文献标引深度的两个最主要的指标 D.查准率和查全率存在互逆关系 3.下面对叙词语言描述正确的是( A )。 A.叙词语言是后组式语言 B.叙词语言是非规范性语言 C.叙词语言是字面组配 D.叙词直接取自文献中有实际意义的词 4.下面哪项不是代查代检的服务项目( D ) A.专题文献检索服务 B.论文发表快速通道检索证明 C.论文收录与引用情况报告 D.电子阅览服务 5.个性化导读服务的原则是( C )。 A.预测性原则与科学性原则 B.选择性原则与针对性原则 C.主动性原则与双向性原则 D.综合性原则与及时性原则 6.读秀电子图书的专用全文阅读器是( C )。 A. DjVu Reader C. ApabiReader

7.中国生物医学文献服务系统(SinoMed)中能检索出含有“肝炎疫苗”、“肝炎病毒基因疫苗”、“肝炎减毒活疫苗”、“肝炎灭活疫苗”等文献的检索式是( B )。 A.肝炎疫苗 B.肝炎%疫苗 C.肝炎*疫苗 D.肝炎$疫苗8.EMBASE com数据库中检索韩冬季(Han Dongji)的文章,检索式输入错误的是( C )。 A.Han B.Han D J C.Han DJ D.Han D. 9.支持视觉搜索的数据库是( D )。 A.PubMed B.SinoMed C.EMBASE.com D.CINAHL 10.通过Web of Science数据库检索北京大学附属医院师生发表的文献,可用的检索式是( B )。 A. Peking Univ AND hosp Univ SAME hosp C. Peking Univ WITH hosp Univ NEAR hosp 11.以下不属于特种文献的是( B )。 A.专利文献 B.期刊论文 C.学位论文 D.会议论文 12.我国发明、实用新型和外观设计三种类型专利的有效期分别为( C )。 A. 20年、15年、10年 B.10年、20年、10年 C.20年、10年、10年 D.15年、10年、10年 13.下面错误描述Google的是( B )。 A.Google属于综合性搜索引擎 B.Google属于元搜索引擎 C.Google属于通用型搜索引擎 D.Google不属于专题搜索引擎14.下面为开放获取期刊网站的是( D )。

相关主题
文本预览
相关文档 最新文档