当前位置:文档之家› 信息检索习题汇总及答案

信息检索习题汇总及答案

信息检索习题汇总及答案
信息检索习题汇总及答案

一、填空题

1.数据的记载方式主要有数值型_、文字型、_语音型、_图像型。

2.数据与信息的关系可看作是原料_和_成品_的关系。

3.信息分析过程是将数据转换为_信息_的过程。

4.信号分为_信息_信号和_人为_信号。

5.信息一般表现为_数据_、文本_、_声音、_图像_等形态。

6.一般认为,信息由_语义_、_差异_、_传递_、_载体_等要素构成。

7.信息的加工按加工对象的不同可分为对_外表_信息的描述,对_整体_信息的描述,如文摘对_内容_信息的描述。

8.信息管理的过程包括信息_收集_、信息_传输_、信息加工_、信息储存_。

9.信息加工包括_信息形式的变换和_信息内容的处理。

10.信息动机的形成原因有_内在的信息需要_和_外在刺激_。

11.主题语言包括_标题词_、_单元词_、_叙词_、_关键词_。

12.在信息存储的结构中,基本的逻辑结构有_线性结构_、_非线性结构、_树形结构_、网状结构。

13.总体上,信息检索系统可分为_数据预处理_、_索引生成_、_查询处理、_检索_。

二、名词解释

1. 数据:是指记载下来的事实,是客观实体属性的值,它是由原始事实组成的。

2.信息加工:是指对获取的信息进行判别、筛选、分类、排序、分析、计算和研究等一系列过程,使收集到的信息成为对我们有用的信息资源。

3.信息组织:即信息序化或信息整序,也就是利用一定的科学规则和方法,通过对信息外在特征和内容特征的表征和序化,实现无序信息流向有序信息流的转换,从而保证用户对信息的有效获取和利用及信息的有效流通和组合。

4.检索标识:就是为沟通文献标引与文献检索而编制的人工语言,也是连接信息存储和检索两个过程中标引人员与检索人员双方思路的渠道,是用于文献标引和检索提问的约定语言。

5.信息检索:可以从广义和狭义两个角度理解。广义的信息检索是指将信息按一定方式组织和存储起来,并根据用户的需要找出相关信息的过程,其中包括存与取两个方面。狭义的信息检索仅指信息查找过程。

6.信息检索系统:是指按某种方式、方法建立起来的用于检索信息的一种有层次的体系,是表征有序的信息特征的集合体。

7.检索效果:是指利用检索系统(或工具)开展检索服务时所产生的有效结果。

三、简答题

1.简述了解用户信息需求的作用

答:用户信息需求是信息系统发展的动力,也是制定信息政策的出发点和依据。了解用户需求的特点、心理规律、查询行为及需求方式,有助于系统制订合理的信息搜集方针和信息资源的合理布局,从而提高服务效益和质量。

2.简述影响信息动机向信息行为转化的主要因素

答:(1)信息动机强度(2)认知能力(3)抱负水平

3.简述信息需要的特点

答:(1)信息需要的广泛性(2)信息需要的社会性

(3)信息需要的发展性(4)信息需要的多样性

4.简述信息检索系统的构成模式

答:(1)信息数据的选择、处理、录入、维护子系统(2)词表和标引子系统(3)检索子系统(4)系统-用户接口子系统

8.简述信息检索系统的流程

系统可分为数据预处理、索引生成、查询处理和检索四个部分。

四、论述题

1.有人说,信息加工是一个体系,你如何理解,请着重从“体系”这个角度加以说明

答:(1)加工的方式、方法多种多样。

(2)加工的方式、方法相互之间有关联,从不同角度对信息进行加工的。

(3)加工过程有其内在联系,构成一个完整的系统。

(4)整个加工体系会随着时间的变化,信息数量的变化,载体的变化和技术的变化而不断变化和完善。

(5)信息的加工按其加工对象的不同可分为对外表信息的描述与加工,对整体信息的描述与加工,还有对内容信息的描述与加工。

2.请探讨一下信息加工的层次性

根据信息加工特点,信息加工分为6个层次:

①外表信息的加工是描述性的,给用户提供的是信息的线索;

②整体信息的加工是概述性的,给用户提供的是信息的内容特点;

③内容信息的加工要深入信息内部,对有用的信息给予揭示标引,使读者利用信息有据可查;

④精粹信息的加工是通过比较鉴别的方法,选取价值高的整体或局部信息,给用户直接提供信息的精华,满足用户对实质性信息的要求;

⑤深度信息的加工是研究性和评价性的,解决信息的优劣和有关信息的有效组合问题,给用户以启迪和决策依据;

⑥相关信息的加工是信息的外延和扩展,使有关信息根据一定关系进行链接,给用户检索和直接利用的方便。

******************************* 二 ********************************************

一、填空题

1.数据库的定义功能主要是对数据库的结构进行描述,这些定义都保存数据字典中。

2.数据库系统提供了两种机制来支持完整性约束:第一种是完整性定义机制,第二种是完整性_验证约束机制_。

3.数据库的三级模式是指_外模式_、_内模式_、_模式_。

4.对文献数据库而言,加工深度表现为_题录_、_文摘_、_全文三个层次。

5.标引工作可分为_人工标引_、_计算机辅助标引_、_自动标引三种方式。

6.信息检索过程实际上是将检索提问式与文献记录标引词进行_对比匹配_的过程。

7.为提高检索效率,计算机检索系统从_概念相关性_、_位置相关性_等方面对检索提问实行技术处理。

8.用向量模型计算机向量时,一般采用向量的_夹角余弦_来表示。

9.通常,智能信息检索系统由_知识库_、_文本处理_、_智能接口_三部分组成。

二、名词解释

1.数据模型:是描述数据、数据联系、数据操作、数据语义以及一致性约束的概念工具的集合。

2.著录:就是对信息外部特征进行分析、选择与记录的过程。

3.标引:就是指对信息内容特征进行分析,赋予信息以检索标识的过程。

4.词位检索:是以数据库原始记录中的检索词之间的特定位置关系为对象的运算,又称全文检索、邻近检索。

三、简答题

1.什么是倒排文档?为什么要使用倒排文档?

答:倒排文档是将主文档中的可检字段抽出,按某种顺序重新排列起来所形成的一种文档。

按表达文献内容特征的主题词排列的文档称为基本索引文档;按表达文献外部特征排列的文档称为辅助索引文档。在实施检索时,必须和顺排文档配合使用。倒排文档类似于检索工具中的辅助索引。2.简述布尔模型及其优缺点

答:布尔模型是最简单的信息检索模型。这种模型的理论基础是集合论。

布尔模型最大的优点是理论简单、使用方便。

缺点是:(1)它只能给出精确匹配的结果;(2)检索结果有可能因查询词在大量文档中出现而数量太多;(3)由于找不到与查询词完全匹配的文档而使结果太少。

3.简述向量空间模型及其优点

答:向量空间模型是一种简便、高效的文本表示模型,其理论基础是代数学。

向量空间模型最主要的优点在于:(1)该模型的权重计算方法能够提高系统的检索性能;(2)模型中使用的部分匹配方法能检索出与用户的查询输入条件“近似”的文档;

(3)在模型中可以根据检索出的结果与查询条件的相关程度对结果进行排序。另外,向量空间模型计算简单,检索速度快。

4.简述“网播”的信息推送方式

答:(1)频道式推送(2)邮件式推送(3)网页式推送(4)专用式推送

5.简述智能信息检索的系统结构

答:智能信息检索系统是由知识库、文本处理和智能接口三部分组成。

6.简述智能信息检索的主要方法

答:(1)统计方法(2)文本分析方法(3)人工智能方法(4)语料库方法

7.有哪些种类的加权检索?各有哪些特征?

加权检索把量化思想引入定性检索之中,是改善和提高检索效果的一种重要手段。分标引加权和检索加权;

检索加权是指检索者在给出检索词的同时,并为每个检索词赋予权值,以区分每个检索词在检索中的重要程度。通过加权,明确了各检索词的重要程度,使检索更有针对性,并且能依据权值的大小,对命中记录的重要性进行排序

词频加权检索是根据检索词在记录中出现的频次来计算命中记录的权和,依据命中记录权和数从大到小排列,最后由阈值控制输出命中结果。

与检索词加权检索不同的是,词的权值是由数据库记录中的词频决定,不是由检索者指定,不需人工干预,减轻了检索者的负担。

词频加权检索方法应建立在对全文数据库和文摘数据库基础之上,否则词频加权将失去意义。

简单词频加权检索:指检索时累计检索词在记录中出现的次数来决定记录的权值,然后累计该记录每个检索词权值之和来决定该记录是否为命中记录。

相对词频加权检索:是将每一个检索词在本文中频率和在整个数据库中的频率综合考虑,进行加权检索的方法。

标引加权检索是指在对文献进行标引时,根据每个标引词在文献中的重要程度不同,为它们附上不同的权值,检索时通过对检索词的标引权值相加来筛选命中记录。

四、论述题

1.扩展的检索技术很多,请从提高可是查准率和查全率两个角度探讨一下扩展的检索技术。循此思路。你还有什么新的解决方法?

2.如何理解布尔逻辑表达式的逆波兰转换?

3.请用实例说明信息推送的实际应用

******************************* 四 ******************************************

一、填空题

1.全文检索主要研究对整个文档信息的_表示_、_存储_、_组织_、_访问_。

2.全文检索的中心环节是_文件内容表达_、_信息查询的获得_、_相关信息的匹配_。

3.按检索对象来区分,全文检索可分为_基于文本_和_基于Web _两种类型;根据索引库中索引元素的不同,全文检索可分为_基于字表_的全文检索和_基于词表_的全文检索。

4.基于理解的分词系统通常包括_分词子系统_、_句法语义子系统_、_总控部分_等三个部分

5.自动标引又分为_自动主题标引_、_自动分类标引_。

6.自动标引的方法主要有_统计标引法_、概率标引法_、_句法分析法_、_语义分析法、_人工智能法_。

7.一个自动标引系统通常包括文本输入_、_词典_、_抽词_、_知识库_、_综合与转换_、_输出_等六个子系统。

8.文本有_词频_、_标题_、_位置、_句法结构_、_线索词_、_指示性短语等新课程形式特征,这些特征是自动摘录的依据。

9.汉字全文检索系统主要包括两方面的核心技术,一是如何建立和维护全文检索的_索引数据库_,二是如何提供快速有效的_检索机制_。

10.索引数据库一般由一个变长的_主文件_和一个在索引文件控制下的_倒排文件_组成。

11.全文检索索引数据库的生成包括_数据准备_、_文本预处理_、_数据加载三个步骤。

二、名词解释

1.全文检索自动标引主题词标引自动文摘

三、简答题

1.简述全文检索的优缺点

2.简述基于字符串匹配分词方法的一般模型

3.简述单汉字标引法及其优缺点

4.简述主题词标引的基本思路

5.简述主题词标引的实现

6.简述自动标引的基本流程

7.简述词索引的全文检索系统的索引算法

8.简述全文检索系统的系统结构

9.简述自动标引的基本方法

10.简述汉语自动标引的方法

11.简述自动标引的系统构成

四、论述题

1.针对全文检索存在的问题,你准备采取什么方式进行解决?

2.根据简单匹配全文检索算法,画出其流程图

3.请简要论述一下全文检索算法的发展轨迹

4.请谈一下你对几种分词方法的看法。

******************************* 五 ********************************************

一、填空题

1.搜索引擎的工作过程可以看作三步,_从互联网上抓取网页_、_建立索引数据库、_在索引数据库中搜索排序_

2.目前,Internet上的搜索引擎大致可分为_目录式_、_机器人_、_元_

3.搜索引擎一般由_搜索器_、_索引器_、_检索器_、_用户接口_四个部分组成

4.搜索引擎中主要有_页面数据_、_索引数据_、_ URL数据_等三类典型的数据

5.Robot的主要瓶颈是_域名服务器(DNS)的查找

6.Robot技术中最关键的一部分是_站点爬行

7.在站点爬行过程中必须要解决_消除重复_、_辨别类型_、_限制范围_、_限制深度_

8.Robot使用_深度优先_、_广度优先_两种基本的搜索策略

9.对于网页内容的提取,网络蜘蛛系统一般采用_插件_的形式

10.文本预处理中,词法分析的过程是将_字符串_转换成_词条_的过程

11.在信息获取系统中,词典是用来根据词汇找到对应词汇信息的_数据汇编

12.倒排文件机制是一种面向_单词_的机制

13.倒排文件结构由_词汇_和_词汇出现情况_两部分组成

14.一个搜索引擎的有效性在很大程度上取决于__索引_的质量

15.索引数据库建立的策略在很大程度上影响搜索引擎的_效率_与_准确性_

16.垂直搜索技术主要分为_模板级_、_网页库级_两个层次

17.垂直搜索引擎的技术评估是从_全面性_、_更新性_、_准确性_、_功能性_等几个方面来进行的

18.目前,智能化搜索引擎在形式上采用了“_以网对网_”的二级映射模式来代替传统的_一级映射模式_

19.智能化搜索引擎中,词典维护工具有_词典生成工具_、_词典导出工具_、_词典连接工具

20.Innernet网就是_语意分析器、_词典维护工具_、_关键词分析_三个部分组成的有机整体

二、名词解释

1.搜索引擎垂直搜索 Innernet网

三、简答题

1.简述搜索引擎的特点

2.简述搜索引擎四个组成部分的功能

3.Robot程序设计时需要考虑的问题是什么

4.简述网络蜘蛛的工作过程

5.简述文本预处理的步骤

6.简述检索器的功能

7.倒排文件如何搜索

8.简述PageRank算法的计算公式

9.简述垂直搜索的特点

10.简述模板级垂直搜索和网页库级垂直搜索的优缺点

11.简述个性化搜索中用户兴趣信息存放的解决方案

12.简述智能化搜索引擎的特征

13.简述垂直搜索的内容来源

14.简述垂直搜索所需要的技术

15.搜索引擎所使用的信息检索模型有那些?各有什么特点?

16.简述建立搜索引擎的关键技术

17.搜索引擎如何对网页的内容进行提取

四、论述题

1.请尝试着比较一下搜索引擎与全文检索

2.请评价一下收费排名

3.如何看待垂直搜索的信息采集策略

4.你如何看待传统搜索引擎技术的不足?你准备如何解决?

******************************* 六 ********************************************

一、填空题

1.多媒体内容的处理包括_内容获取_、_内容描述_、_内容操纵_三个步骤

2.视频可用_场景_、_镜头、_帧_来描述

3.在基于内容的视频检索中,检索的基本单元是_镜头_

4.基于内容的视频检索的关键技术是_视频分割_、_代表帧_、_动态特征提取_

5.镜头之间的转换方式主要有_突变_和_渐变_

6.音频检索主要采用_示例查询_

二、名词解释

1.基于内容的图像检索

三、简答题

1.简述基于内容检索的特点

2.简述基于内容检索的过程

3.简述基于内容检索的系统结构

4.简述基于内容检索的关键技术

5.简述基于内容检索的评价标准

6.简述基于特征的图像检索过程

******************************* 七 ********************************************

一、填空题

1.信息分析与预测的基本方法分为三类:_逻辑学方法_、_数量分析方法_、_系统科学方法

2.竞争情报是经过筛选、提炼和分析过的,可据此采取行动的有关_竞争对手_和_竞争情况_的信息集合。

3.竞争情报的来源分为_公共领域_信息和_非公共领域信息。

4.一般认为,竞争情报的实施分为_情报规划_、收集数据、分析情报和_传播等几个步骤。

5.数据挖掘所得到的信息应具有_未知_、_有效_、_可实用_三个特征

6.数据挖掘系统是从被挖掘的数据中形成特定知识表示过程的实现机制,因此它与被挖掘的_数据组织形式_和所采用的_知识表示_及_推理方式_有关。

7.按挖掘的对象不同,网络信息挖掘可分为_ Web内容挖掘_、_ web结构挖掘_、_ Web使用记录挖掘_

8.Web使用记录挖掘可分为_一般存取路径追踪_、_专用化追踪_

9.Web用法挖掘分为_个性挖掘_、_系统改进_、_站点修改_、_智能商务、_ Web特征描述_

10.文本挖掘的准备工作由_文本收集_、_文本分析、_特征修剪组成。

二、名词解释

1.信息分析数据挖掘 Web数据挖掘文本挖掘个性化信息服务

三、简答题

1.简述信息分析的特点

2.简述信息分析的工作程序

3.简述信息分析报告的内容和结构

4.简述数据挖掘的功能

5.简述数据挖掘的过程

6.简述Web挖掘的基本原理

7.简述个性化信息服务的特点

8.简述个性化信息服务的类型

9.个性化信息模型的构建方法

四、论述题

1.尝试着比较一下Web挖掘与Web信息检索的区别与联系

2.如何获取用户的个性化需求

3.个性化信息服务模型的构建

答案

******************************* 一 ********************************************

填空

1.数值型文字型(字符)语音型图像型

2.原料成品

3.信息

4.自然人为

5.数据文本声音图像

6.语义差异传递载体

7.外表整体内容

8.收集传输加工储存(存储)

9.信息形式信息内容

10.内在的信息需要外在刺激

11.标题词单元词叙词关键词

12.线性结构非线性结构树形结构网状结构

13.数据预处理索引生成查询处理检索

名词解释

1.数据:是指记载下来的事实,是客观实体属性的值,它是由原始事实组成的。

2.信息加工:是指对获取的信息进行判别、筛选、分类、排序、分析、计算和研究等一系列过程,使收集到的信息成为对我们有用的信息资源。

3.信息组织:即信息序化或信息整序,也就是利用一定的科学规则和方法,通过对信息外在特征和内容特征的表征和序化,实现无序信息流向有序信息流的转换,从而保证用户对信息的有效获取和利用及信息的有效流通和组合。

4.检索标识:就是为沟通文献标引与文献检索而编制的人工语言,也是连接信息存储和检索两个过程中标引人员与检索人员双方思路的渠道,是用于文献标引和检索提问的约定语言。

5.信息检索:可以从广义和狭义两个角度理解。广义的信息检索是指将信息按一定方式组织和存储起来,并根据用户的需要找出相关信息的过程,其中包括存与取两个方面。狭义的信息检索仅指信息查找过程。

6.信息检索系统:是指按某种方式、方法建立起来的用于检索信息的一种有层次的体系,是表征有序的信息特征的集合体。

7.检索效果:是指利用检索系统(或工具)开展检索服务时所产生的有效结果。

简答题

1.简述了解用户信息需求的作用

答:用户信息需求是信息系统发展的动力,也是制定信息政策的出发点和依据。了解用户需求的特点、心理规律、查询行为及需求方式,有助于系统制订合理的信息搜集方针和信息资源的合理布局,从而提高服务效益和质量。

2.简述影响信息动机向信息行为转化的主要因素

答:(1)信息动机强度(2)认知能力(3)抱负水平

3.简述信息需要的特点

答:(1)信息需要的广泛性(2)信息需要的社会性

(3)信息需要的发展性(4)信息需要的多样性

4.简述信息检索系统的构成模式

答:(1)信息数据的选择、处理、录入、维护子系统(2)词表和标引子系统(4)检索子系统(4)系统-用户接口子系统

8.简述信息检索系统的流程

系统可分为数据预处理、索引生成、查询处理和检索四个部分。

论述题

1.有人说,信息加工是一个体系,你如何理解,请着重从“体系”这个角度加以说明

答:(1)加工的方式、方法多种多样。

(2)加工的方式、方法相互之间有关联,从不同角度对信息进行加工的。

(3)加工过程有其内在联系,构成一个完整的系统。

(4)整个加工体系会随着时间的变化,信息数量的变化,载体的变化和技术的变化而不断变化和完善。

(5)信息的加工按其加工对象的不同可分为对外表信息的描述与加工,对整体信息的描述与加工,还有对内容信息的描述与加工。

2.请探讨一下信息加工的层次性

根据信息加工特点,信息加工分为6个层次:

①外表信息的加工是描述性的,给用户提供的是信息的线索;

②整体信息的加工是概述性的,给用户提供的是信息的内容特点;

③内容信息的加工要深入信息内部,对有用的信息给予揭示标引,使读者利用信息有据可查;

④精粹信息的加工是通过比较鉴别的方法,选取价值高的整体或局部信息,给用户直接提供信息的精华,满足用户对实质性信息的要求;

⑤深度信息的加工是研究性和评价性的,解决信息的优劣和有关信息的有效组合问题,给用户以启迪和决策依据;

⑥相关信息的加工是信息的外延和扩展,使有关信息根据一定关系进行链接,给用户检索和直接利用的方便。

******************************* 二 ********************************************

填空

1.数据字典

2.定义机制验证约束机制

3.外模式内模式模式

4.题录文摘全文

5.人工标引计算机辅助标引自动标引

6.对比匹配

7.概念相关性位置相关性

8.夹角余弦

9.知识库文本处理智能接口

名词解释

1.数据模型:是描述数据、数据联系、数据操作、数据语义以及一致性约束的概念工具的集合。

2.著录:就是对信息外部特征进行分析、选择与记录的过程。

3.标引:就是指对信息内容特征进行分析,赋予信息以检索标识的过程。

4.词位检索:是以数据库原始记录中的检索词之间的特定位置关系为对象的运算,又称全文检索、邻近检索。

简答题

1.什么是倒排文档?为什么要使用倒排文档?

答:倒排文档是将主文档中的可检字段抽出,按某种顺序重新排列起来所形成的一种文档。

按表达文献内容特征的主题词排列的文档称为基本索引文档;按表达文献外部特征排列的文档称为辅助索引文档。在实施检索时,必须和顺排文档配合使用。倒排文档类似于检索工具中的辅助索引。2.简述布尔模型及其优缺点

答:布尔模型是最简单的信息检索模型。这种模型的理论基础是集合论。

布尔模型最大的优点是理论简单、使用方便。

缺点是:(1)它只能给出精确匹配的结果;(2)检索结果有可能因查询词在大量文档中出现而数量太多;(3)由于找不到与查询词完全匹配的文档而使结果太少。

3.简述向量空间模型及其优点

答:向量空间模型是一种简便、高效的文本表示模型,其理论基础是代数学。

向量空间模型最主要的优点在于:(1)该模型的权重计算方法能够提高系统的检索性能;(2)模型中使用的部分匹配方法能检索出与用户的查询输入条件“近似”的文档;

(3)在模型中可以根据检索出的结果与查询条件的相关程度对结果进行排序。另外,向量空间模型计算简单,检索速度快。

4.简述“网播”的信息推送方式

答:(1)频道式推送(2)邮件式推送(3)网页式推送(4)专用式推送

5.简述智能信息检索的系统结构

答:智能信息检索系统是由知识库、文本处理和智能接口三部分组成。

6.简述智能信息检索的主要方法

答:(1)统计方法(2)文本分析方法(3)人工智能方法(4)语料库方法

8.有哪些种类的加权检索?各有哪些特征?

加权检索把量化思想引入定性检索之中,是改善和提高检索效果的一种重要手段。分标引加权和检索加权;

检索加权是指检索者在给出检索词的同时,并为每个检索词赋予权值,以区分每个检索词在检索中的重要程度。通过加权,明确了各检索词的重要程度,使检索更有针对性,并且能依据权值的大小,对命中记录的重要性进行排序

词频加权检索是根据检索词在记录中出现的频次来计算命中记录的权和,依据命中记录权和数从大到小排列,最后由阈值控制输出命中结果。

与检索词加权检索不同的是,词的权值是由数据库记录中的词频决定,不是由检索者指定,不需人工干预,减轻了检索者的负担。

词频加权检索方法应建立在对全文数据库和文摘数据库基础之上,否则词频加权将失去意义。

简单词频加权检索:指检索时累计检索词在记录中出现的次数来决定记录的权值,然后累计该记录每个检索词权值之和来决定该记录是否为命中记录。

相对词频加权检索:是将每一个检索词在本文中频率和在整个数据库中的频率综合考虑,进行加权检索的方法。

标引加权检索是指在对文献进行标引时,根据每个标引词在文献中的重要程度不同,为它们附上不同的权值,检索时通过对检索词的标引权值相加来筛选命中记录。

******************************* 四 ********************************************

填空

1.表示存储组织访问

2.文件内容表达信息查询的获得相关信息的匹配

3.基于文本基于Web 基于字表基于词表

4.分词子系统句法语义子系统总控部分

5.自动主题标引自动分类标引

6.统计标引法概率标引法句法分析法语义分析法人工智能法

7.文本输入词典抽词知识库综合与转换输出

8.词频标题位置句法结构线索词指示性短语

9.索引数据库检索机制

10.主文件倒排文件

11.数据准备文本预处理数据加载

名词解释

1.全文检索:是指以全文本信息作为检索对象,建立全文数据库,除了具有布尔逻辑检索功能外,还具有文本检索功能,并允许用户以自然语言检索,直接获得原文中的有关章节和段句。

2.自动标引:是根据文献内容,依靠计算机系统全部或部分地自动给出标引符号的过程。

3.主题词标引:是指抽取信息中能够表达其核心内容的词或词组,并将这些词或词组转化为受控词的过程。

4.自动文摘:就是利用计算机自动地从原始文献中提取文摘。

简答题

1.简述单汉字标引法及其优缺点

答:单汉字标引法是众多标引方法中比较有影响的一种。吸收了西文自动抽词标引的思想,把一个单汉字看成一个西文单词而作为标引词,检索时先匹配单字,再进行词组重组。另外增加了一个停用字表,提高了标引效率。

优点:单汉字法绕开切分问题,容易实现,便于系统维护,标引速度快、深入、客观且一致,词语组配灵活。

缺点:检索速度不快,增加了用户的智力负担,浪费了计算机存储空间,牺牲了隐含概念主题及词

汇间相互关系的表达,系统的查全率和查准率都不能令人满意。

2.简述主题词标引的基本思路

答:主题词标引的基本思路是利用汉语自动分词的研究成果,采用词典分词法将文献进行切分,通过词加权或词频统计法对切分后的词进行排序确定关键词,利用主题词表将关键词转化、合并、去重、重新排序后确定系统正式使用的主题词,并追加文献代号送入系统主题词字段中。

3.简述主题词标引的实现

答:(1)构造词表①构造切分词表②构造主题词表

(2)主题词标引①抽取关键词②归并关键词③确定标引词④主题词标引

4.简述自动标引的基本流程

答:自动标引的基本流程包括:确定标引源、输入标引源内容、预处理、分词处理、确定关键词、转换为受控词、给出主题标识符。

9.简述自动标引的基本方法

自动标引的方法主要有:(1)统计标引法;(2)概率标引法;(3)句法分析法;(4)语义分析法;(5)人工智能法

10.简述汉语自动标引的方法

较典型的汉语自动标引方法包括:词典标引法、切分标引法、语法分析标引法、汉语自动标引专家系统、单汉字标引法等。

11.简述自动标引的系统构成

一个自动标引系统通常包括文本输入、词典、抽词、知识库、综合与转换以及输出等6个子系统。******************************* 五 ********************************************

填空

1.从互联网上抓取网页建立索引数据库在索引数据库中搜索排序

2.目录式机器人元

3.搜索器索引器检索器用户接口

4.页面数据索引数据 URL数据

5.域名服务器(DNS)

6.站点爬行

7.消除重复辨别类型限制范围限制深度

8.深度优先广度优先

9.插件

10.字符串词条

11.数据汇编

12.单词

13.词汇词汇出现情况

14.索引

15.效率准确性

16.模板级网页库级

17.全面性更新性准确性功能性

18.以网对网一级映射模式

19.词典生成工具词典导出工具词典连接工具

20.语意分析器词典维护工具关键词分析

名词解释

1.搜索引擎:从狭义的角度来说,搜索引擎由信息收集软件、索引数据库和查询接口三部分组成。从广义的角度上讲,搜索引擎是互联网上的一类网站,是提供查询、搜索的网站。

2.垂直搜索:是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,它通过定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。

3.Innernet网:就是由一个或多个相关的词典组成的反映人的知识网络及相关工具的系统。

简答题

1.简述搜索引擎的特点

答:(1)信息服务的综合性(2)信息服务的智能性(3)信息服务的个性化

(4)具有支持Agent的能力(5)具有与电子商务灵活结合的能力

2.Robot程序设计时需要考虑的问题是什么

答:(1)与平台无关性

(2)要考虑是否直接影响访问Web的效率,影响搜索数据库的质量

(3)要考虑对网络或被访问站点的影响(4)还应遵守一些协议

3.简述网络蜘蛛的工作过程

答:(1)网络蜘蛛向被访问的站点标明自己的身份

(2)一般会访问一个特殊的文本文件Robots.txt

(3)遵守相关协议

(4)网络蜘蛛在下载网页的时候,会去识别网页的HTML代码。

4.简述文本预处理的步骤

答:(1)文本的词法分析(2)无用词汇的删除(3)词干提取

(4)索引词条/词干的选择(5)构造词条的分类结构

5.简述检索器的功能

答:检索器的功能是根据用户输入的查询关键字在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并实现某种用户相关性反馈机制。

6.倒排文件如何搜索

答:(1)词汇查找(2)查询词汇出现情况(3)词汇出现情况的操作

7.简述PageRank算法的计算公式

答:网页A级别=(1-系数)+系数×

( 网页1级别 + 网页2级别 + …网页N级别 )

网页1链出个数网页2链出个数网页N链出个数

8.简述垂直搜索的特点

答:(1)垂直搜索的表现方式和一般的搜索引擎表现方式不同,结构化的搜索和非结构化的搜索并用。

(2)从广告模式上,提供了除Google adsense和百度竞价排名广告之外的另一种可能。

(3)垂直搜索引擎抓取的数据来源于垂直搜索引擎关注的行业站点,倾向于结构化数据和元数据。

(4)垂直搜索引擎的搜索行为是基于结构化数据和元数据的结构化搜索。

(5)垂直搜索引擎的搜索结果要覆盖整个行业。

(6)垂直搜索引擎的Web2.0需求。

(7)垂直搜索引擎的目标是帮助用户解决问题。

(8)垂直搜索引擎的社区化特征。

9.简述模板级垂直搜索和网页库级垂直搜索的优缺点

答:垂直搜索技术主要分为两个层次:模板级和网页库级。模板级是针对网页进行模板设定或者自动生成模板的方式抽取数据,对网页的采集也是针对性的采集,适合规模比较小、信息源少且稳定的需求,优点是快速实施、成本低、灵活性强,缺点是后期维护成本高,信息源和信息量小。

网页库级就是在信息源数量上、数据容量上、检索容量上、稳定性可靠性上都是网页库搜索引擎级别的要求,其灵活性差、成本高。

10.简述个性化搜索中用户兴趣信息存放的解决方案

答:关于用户兴趣信息的存放有三种解决方案:一是将用户的兴趣信息存放在搜索引擎服务器上;二是将用户的兴趣信息存放在用户的机器上;三是用户的兴趣信息存放在其他服务器上。

11.简述智能化搜索引擎的特征

答:(1)网络蜘蛛的智能化

(2)为特定用户提供相关信息

(3)搜索引擎人机接口的智能化

13.简述垂直搜索的内容来源

垂直搜索的内容主要来源于:

①门户网站自身的资源;②以开放接口方式让行业用户提供的资源;③普通用户发布的资源;④抓取行业用户的资源。

14.简述垂直搜索所需要的技术

垂直搜索大致需要信息采集技术、网页信息抽取技术、信息的处理技术、语意相关性分析、分词技术和索引技术等。

15.搜索引擎所使用的信息检索模型有那些?各有什么特点?

布尔逻辑模型:布尔型信息检索是最简单的信息检索模型,用户利用布尔逻辑关系构造查询并提交,搜索引擎根据事先建立的倒排文件确定查询结果。

标准布尔逻辑模型为二元逻辑,并可用逻辑符“and”、“or”、“not”来组织关键词表达式。布尔型信息检索模型的查全率高,查准率低。

目前大多搜索引擎均使用布尔逻辑检索模型,查询结果一般不进行相关性排序。

模糊逻辑模型:这种模型在查询结果处理中加入模糊逻辑运算,将检索的数据库文档信息与用户的查询要求进行模糊逻辑比较,按照相关的优先次序排列查询结果。

模糊逻辑模型可以克服布尔型信息检索模型在查询中其结果具有无序性的问题。

向量空间模型:向量空间模型用检索项的向量空间来表示用户的查询要求和数据库文档信息。查询结果是根据向量空间的相似性而排列的。

向量空间模型可方便地产生有效的查询结果,能提供相关文档的文摘,并对查询结果进行分类,为用户提供准确的信息。

概率模型:基于贝叶斯概率论原理的概率模型利用相关反馈的归纳学习方法,获取匹配函数,这是一种较复杂的检索模型。

16.简述建立搜索引擎的关键技术

信息收集和存储一般分为人工和自动两种方式。

信息预处理包括信息格式支持与转换以及信息过滤。

信息索引技术就是创建文档信息的特征记录,以使用户能够快速地检索到所需信息。

17.搜索引擎如何对网页的内容进行提取

1.关键词的提取。网页处理阶段的一个基本任务,就是要提取出网页源文件的内容部分所包含的关键词。

2.重复或转载网页的消除

3.链接分析

4.网页重要程度的计算

论述题

1.请尝试着比较一下搜索引擎与全文检索

答:(1)数据量。全文检索的数据量只有几百万条,而搜索引擎的数据量极大。

(2)内容相关性。全文检索强调内容相关性,而搜索引擎不强调内容相关性。

(3)安全性。全文检索有安全性要求,而搜索引擎没有安全性要求。

(4)个性化和智能化。全文检索的个性化和智能化要比搜索引擎的更好。

2.请评价一下收费排名

答:收费排名并不属于排序技术,而是一种搜索引擎的赢利模式。但收费排名已经最直接的影响到了搜索引擎的排序。收费排名一方面给搜索引擎公司带来收益,一方面给企业带来访问量,另外对访问者也有一定好处。对于企业来说,收费排名是提升网站在搜索引擎中排名的最直接和最简单的办法。3.如何看待垂直搜索的信息采集策略

答:采集可通过人工设定网址和网页分析URL方式共同进行。策略上可以评估网站/网页更新的系数、

网站/网页的重要系数、用户点击系数、网站稳定系数,根据这些系数来确定对这些网站/网页更新的频率,对网页进行很好的分级可以以低成本很好的解决更新问题。

4.你如何看待传统搜索引擎技术的不足?你准备如何解决?(解决办法自己写)

答:传统的搜索引擎,一方面存在“文海捞针”的问题,但另一方面又存在“信息丢失”的问题。它是由以下四个深层次的问题引起的。这四个问题都与词汇紧密相关。第一个是“忠实表达”问题,第二个是“表达差异”问题,第三个是“词汇孤岛”问题,第四个是“机械式匹配”问题。

******************************* 六 ********************************************

填空

1.内容获取内容描述内容操纵

2.场景镜头帧

3.镜头

4.视频分割代表帧动态特征提取

5.突变渐变

6.示例查询

名词解释

1.基于内容的图像检索:是基于内容检索技术的一种,是指利用图像的颜色、形状、纹理、语义等特征对图像进行查询,试图在理解图像内容的基础上,检索出与示例相类似的图像。

简答题

1.简述基于内容检索的特点

答:(1)以综合性学科为基础(2)从媒体内容中提取信息线索

(3)相识性比较(4)交互性查找

(5)直观的查询方式(6)大型数据库的快速检索

2.简述基于内容检索的过程

答:(1)初始查询说明(2)相似性匹配(3)相似度排列(4)特征调整

3.简述基于内容检索的系统结构

答:完整的CBR系统一般由两个子系统构成,即数据库生成子系统和查询子系统。

(1)对象标识(2)特征提取(3)数据库

(4)用户查询和浏览接口(5)检索引擎(6)索引/过滤器

4.简述基于内容检索的评价标准

答:(1)易用性(2)性能(3)可移植性(4)经济性(5)可维护性

5.简述基于特征的图像检索过程

答:(1)图像的预处理(2)图像特征的抽取(3)数据库系统

******************************* 七 ********************************************

填空

1.逻辑学方法数量分析方法系统科学方法

2.竞争对手竞争情况

3.公共领域非公共领域

4.情报规划收集数据分析情报传播

5.未知有效可实用

6.数据组织形式知识表示推理方式

7.Web内容挖掘 web结构挖掘 Web使用记录挖掘

8.一般存取路径追踪专用化追踪

9.个性挖掘系统改进站点修改智能商务 Web特征描述

10.文本收集文本分析特征修剪

名词解释

1.信息分析:是运用科学的理论和方法,通过对信息的加工处理,使信息成为全新的信息,并从中找出描述该事物发展规律的数学模型,进而对其未来的发展状态进行分析预测,为决策提供科学的依据的过程。

2.数据挖掘:是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的,但又是潜在有用的信息和知识的过程。

3.文本挖掘:是抽取有效、新颖、有用、可理解的、散布在文本文件中的有价值知识,并且利用这些知识更好的组织信息的过程。

简答题

1.简述信息分析的特点

答:(1)综合性(2)针对性(3)政策性(4)客观性(5)先导性(6)趋优淘劣性

2.简述信息分析的工作程序

答:(1)选题(2)制定研究计划(3)信息反馈与决策跟踪

3.简述信息分析报告的内容和结构

答:信息分析研究报告应该包括以下内容

(1)提出拟解决的问题和要达到的目标(2)研究背景情况,描述与分析

(3)分析研究方法(4)结论与论证(5)具体实施的建议、方案与措施

结构:研究报告由题目、摘要、引言、正文、结论、参考文献、注释等组成。

4.简述数据挖掘的功能

答:(1)自动预测趋势与行为(2)数据关联(3)聚类(4)概念描述(5)偏差检测

5.简述数据挖掘的过程

答:(1)定义问题(2)获取数据(3)整理和初探数据(4)选择和准备数据(5)挖掘数据(6)解释结果(7)运用知识

6.简述Web挖掘的基本原理

答:目标数据集就是根据用户要求,从Web资源中提取的相关数据;预处理是从目标数据集中除去明显错误的数据和冗余的数据,并将数据转换成有效形式,以使数据开采算法寻求感兴趣的模型;模式分析是对发现的模式进行解释和评估,最后将发现的知识以能够理解的方式提供给用户。

7.简述个性化信息服务的特点

答:(1)以用户为中心(2)允许用户充分表达个性化需求,能够对用户需求行为进行挖掘(3)服务方式更加灵活、多样(4)能够主动将用户所需信息推送给用户

8.简述个性化信息服务的类型

答:(1)个性化内容定制服务(2)个性化信息检索定制服务

(3)个性化界面定制服务(4)个性化信息推荐服务

9.个性化信息模型的构建方法

个性化信息模型的构建方法:信息Agent的自主学习方法、信息过滤的方法、基于多Multi-Agent System的合作方法

用户模型的构建方法:在对用户的信息服务中,用户所处的领域不同,使用的信息服务系统不同,获取用户信息的方法不同,建模的方法也不同。通常情况下,通过与用户交互,获取用户信息来建立模型较为简单,较易实现。对于隐式建模方法,用户模型的建设过程主要有四步:

①内容向量。

②一列当前活动的上下文(或用户以往信息行为的文档)。

③一列当前活动的特征。

④一个用户关键词的集合。

论述题

1.尝试着比较一下Web挖掘与Web信息检索的区别与联系

答:Web上的挖掘和信息检索是两种不同的技术,其区别主要表现在以下几个方面:(1)方法论不同。信息检索是目标驱动的;而挖掘是机会主义的,其结果独立于用户的信息需求,

也是用户所无法预知的。

(2)着眼点不同。信息检索着重于文档中显示存储的字词和链接;而挖掘试图更多地理解其内容和结构。

(3)目的不同。信息检索的目的在于帮助用户发现资源;而挖掘是为了揭示文档中隐含的知识。

(4)评价方法不同。信息检索使用精度和召回率来评价其性能;而挖掘采用收益、置信度、简洁性等来衡量所发现知识的有效性、可用性和可理解性。

(5)使用场合不同。信息检索系统返回太多的结果以致用户无法一一浏览,在某些场合下,就需要使用挖掘技术。

联系:尽管Web挖掘是比信息检索层次更高的技术,但它并不是用来取代信息检索技术,二者是相辅相成的。一方面,这两种技术各有所长,有各自适用的场合;另一方面,我们可以利用Web挖掘的研究成果来提高信息检索的精度和效率,改善检索结果的组织,使信息检索系统发展到一个新的水平。2.如何获取用户的个性化需求

答:(1)用户访问记录的挖掘

(2)利用Bookmark获取用户的个性化需求

(3)利用智能Agent获取用户个性化需求

3.个性化信息服务的构建

个性化信息服务是个性化信息服务是基于信息用户的信息使用行为、习惯、偏好和特点,来向用户提供满足其各种个性化需求的一种服务。

就现阶段的环境条件而言,个性化信息服务至少应包括个性化内容定制服务、个性化信息检索定制服务、个性化界面定制服务和个性化信息推荐服务四个方面。

对用户需求、兴趣、爱好的了解和获取是个性化信息服务具备针对性的关键,而对用户网络信息需求的分析、获取和管理是保证个性化信息服务实施的基础。

对用户需求的获取,目前主要有两大类方法:一类是通过人,机交互模式获取用户的信息需求。这类方法的优点是可以准确地获得用户的需求信息,也是目前绝大多数检索系统所采用的方法。缺点是主动性差。另一类是通过对用户访问记录的挖掘,获取用户的需求、兴趣和爱好等。这种方法的主动性强,一般用于个性化主动信息服分系统中,对用户需求行为的挖掘,目前有三种方法:一是通过Cookie logs 挖掘;二是通过Bookmark(书签)进行网络信息过滤;三是利用智能Agent跟踪用户信息行为。

要实现个性化信息服务,系统必须具备两方面的能力:一是构建个性化信息Agent模型,即将个性化信息从全局信息空间中分离出来;二是构建用户Agent模型,即跟踪用户行为,学习、记忆用户兴趣,通过描述用户的兴趣特征来建立个性化用户模型。此外,还需要有功能强大的网络信息搜索能力和友好的用户界面,这既是构建信息Agent和用户Agent的基础,也是实现个性化信息服务的保障。

个性化信息模型的构建方法:信息Agent的自主学习方法、信息过滤的方法、基于多Multi-Agent System的合作方法

用户模型的构建方法:在对用户的信息服务中,用户所处的领域不同,使用的信息服务系统不同,获取用户信息的方法不同,建模的方法也不同。通常情况下,通过与用户交互,获取用户信息来建立模型较为简单,较易实现。对于隐式建模方法,用户模型的建设过程主要有四步:

①内容向量。

②一列当前活动的上下文(或用户以往信息行为的文档)。

③一列当前活动的特征。

④一个用户关键词的集合。

用户模型建立后,对其更新也要遵循一定的规则。通常是根据用户的反馈信息相应地更新用户模型的不同部分。

个性化服务的关键是用户需求信息的获取。真正的用户动态需求信息的获取,必须利用智能代理技术。在这方面的研究,虽然取得了一定的成果,但距离实际应用或用户的要求还有较大的差距。

大学生信息检索习题以及答案

大学生信息检索概论》模拟试题 一、填空题 1、文献的级次分为零次文献、一次文献、二次文献、三次文献 2、《中图法》有五个基本部类,分别是马克思主义、列宁主义、毛泽东思想 、哲学;社会科学;自然科学和综合性图书,在此基础上又划分为22 个大类。 3、按内容可将计算机检索系统的数据库类型分为:文献书目型数据库、事 实型数据库、数值型数据库和全文型数据库。 4、我国标准可分为国家标准、部标准和企业标准三大类。 5、在实际检索中,文献的检索方法主要有:直查法、追溯法、工具法 和综合法。 6、国际标准化组织简称:ISO 、本标准每5 年修订一次 二、选择题1、如果需要检索某位作者的文献被引用的情况,应该使用(C )检索。 A. 分类索引 B.作者索引C?引文索引D ?主题索引 2、利用图书馆的据库检索期刊论文时,可供选择的中文数据库是( D )。 A.超星数字图书馆B ?万方学位论文 C ?国研网D ?维普科技期刊E. 高校财经库 3、如果检索有关多媒体网络传播方面的文献,检索式为( A D)。 A.多媒体and网络传播B ?多媒体+网络传播 C ?多媒体or网络传播 D.多媒体*网络传播 4、如果对某个课题进行主题检索时,可选择的检索字段有( A D E )。 A.关键词B .作者C .刊名D .题名E .文摘 5、二次文献又称检索工具,包括:(A C D )。 A.书目 B.百科 C.索引 D.文摘 E.统计数据 三、名词解释题 1、文献 用文字、图形、符号、声频、视频等技术手段记录人类知识的一种载体,或理解为固化在一 定物质载体上的知识。也可以理解为古今一切社会史料的总称。 2、体系分类语言 体系语言是以科学分类为基础,运用概念的划分与概括的逻辑方法,形成一个概念等级体系,按知识门类的逻辑次序,按照从总到分,从一般到具体,从低级到高级,从简单到复杂的原则进行概念的综分,层层划分,累累隶属,逐步展开而形成的一个等级体系。 3、引文语言 引文语言是根据文献所附参考或引用文献的特征进行检索的语言。 4、事实检索 以事项为检索内容的文献信息检索 5、二次文献 对一次文献进行加工整理后的产物,即对无序的一次文献的外部特征如题名、作者、出处等进行著录,或将其内容压缩成简介、提要或文摘,并按照一定的学科或专业加以有序化而形成的文献形式,如目录、文摘杂志(包括简介式检 索刊物)等

信息检索考题及答案

一、单选 1、报道范围主要为能源方面的科技报告为( D、DOE)。 2、(C报纸)是出版周期最短的定期连续出版物。 3、( A学术论文)是高校或科研机构的毕业生为获取学位而撰写的。 4、了解各个国家政治、经济、科技发展政策的重要信息源是(B政府出版物) 5、年鉴属于下列哪一类别(D三次信息) 6、下列哪种文献属于一次文献(A图书)。 7、下列文献中属于一次信息的是( A专利说明书) 8、以下各项属于二次信息的是( A 索引) 21、(D 漏检率)是指未检出的相关信息量与检索系统中实际与课题相关的信息总量的比率。 22、《四级英语阅读与完型填空》这本图书在中图法体系中的分类号可能是(D、H319 )。 23、布尔逻辑表达式:在职人员NOT(中年AND教师)的检索结果是(A检索出除了中年教师以外的在职人员的数据) 24、布尔逻辑检索中检索符号“OR”的主要作用在于( B提高查全率)。 25、根据一定的需要,将特定范围内的某些文献中的有关知识单元或款目按照一定的方法编排,并指明出处,为用户提供文献线索的一种检索工具是(C索引)。 26、将存储于数据库中的整本书、整篇文章中的任意内容查找出来的检索是(A全文检索) 27、截词检索中,“?”和“*”的主要区别在于(A 字符数量的不同)。 28、尽管不同的检索系统对截词符的定义不尽相同,一般而言,多数用(C* )表示无限限检索。 29、尽管不同的检索系统对截词符的定义不尽相同,一般而言,多数用(A?)表示有限检索。 30、利用截词技术检索“?ake”,以下检索结果正确的是(D take) 31、利用图书末尾所附参考文献进行检索的方法是(D追溯法)。 32、位置运算符号(W)和(N)的主要区别在于(D 检索词是否出现在同一文献中)。 33、我国最早的分类法是(B 《七略》) 34、要查找吴敬琏所发表的文章,首选途径为(C责任者途径)。 主题较复杂、研究范围较大、研究时间较久的科研课题适用的检索方法为(A顺查法) 《科学引文索引》是基于(B追溯法)检索方法而编制出来的检索工具: 下列检索工具哪个不属于事实数据检索工具(A词典): 按检索手段分,搜索引擎属于(C网络检索工具) Adobe Reader可以阅读(D、PDF )格式文件。 ISBN是( A国际标准刊号)的缩写。 超星数字图书馆可以为我们提供( A图书的原文) 浏览超星数字图书馆,应首先安装(D、SSReader )。 下列不属于图书特点的是(D信息较新颖) CAJviewer(俗称:CAJ阅读器)是(A 超星数字图书馆)数据库的全文阅读软件。EBSCO数据库中,输入检索词“Chin﹡”表示要求查出含有(A、 Chin词干后允许有一个字母)变化的单词的文献 查找中文科技期刊数据库,如选择作者字段,检索“曙光”,精确检索和模糊检索得到的检索结果(B模糊检索多)。 对于中国期刊全文数据库(CNKI)的使用权限的说法,(A从任何公网终端都可访问其全文信息)是不正确的。

中国科学院大学现代信息检索课后习题答案

《信息检索导论》课后练习答案 王斌 最后更新日期 2013/9/28 第一章布尔检索 习题1-1 [*] 画出下列文档集所对应的倒排索引(参考图1-3中的例子)。 文档 1 new home sales top forecasts 文档 2 home sales rise in july 文档 3 increase in home sales in july 文档 4 july new home sales rise 习题1-2 [*] 考虑如下几篇文档: 文档1 breakthrough drug for schizophrenia 文档2 new schizophrenia drug 文档3 new approach for treatment of schizophrenia 文档4 new hopes for schizophrenia patients a. 画出文档集对应的词项—文档矩阵; 解答: breakthrough 1 0 0 0 drug 1 1 0 0 for 1 0 1 1 hopes 0 0 0 1 new 0 1 1 1

patients 0 0 0 1 schizophrenia 1 1 1 1 treatment 0 0 1 0 b. 画出该文档集的倒排索引(参考图 1-3中的例子)。 解答:参考a。 习题1-3 [*] 对于习题1-2中的文档集,如果给定如下查询,那么返回的结果是什么? a.schizophrenia AND drug 解答:{文档1,文档2} b.for AND NOT (drug OR approach) 解答:{文档4} 习题1-4 [*] 对于如下查询,能否仍然在O(x+y)次完成?其中x和y分别是Brutus和Caesar所对应的倒排记录表长度。如果不能的话,那么我们能达到的时间复杂度是多少? a.Brutus AND NOT Caesar b.Brutus OR NOT Caesar 解答: a.可以在O(x+y)次完成。通过集合的减操作即可。具体做法参考习题1-11。 b.不能。不可以在O(x+y)次完成。因为NOT Caesar的倒排记录表需要提取其他所有词项对应的倒 排记录表。所以需要遍历几乎全体倒排记录表,于是时间复杂度即为所有倒排记录表的长度的和 N,即O(N) 或者说O(x+N-y)。 习题1-5 [*] 将倒排记录表合并算法推广到任意布尔查询表达式,其时间复杂度是多少?比如,对于查询 c.(Brutus OR Caesar) AND NOT (Antony OR Cleopatra) 我们能在线性时间完成合并吗?这里的线性是针对什么来说的?我们还能对此加以改进吗? 解答:时间复杂度为O(qN),其中q为表达式中词项的个数,N为所有倒排记录表长度之和。也就是说可以在词项个数q及所有倒排记录表长度N的线性时间完成合并。由于任意布尔表达式处理算法复杂度的上界为O(N),所以上述复杂度无法进一步改进。 习题1-6 [**] 假定我们使用分配律来改写有关AND和OR的查询表达式。 a. 通过分配律将习题1-5中的查询写成析取式; 12 b. 改写之后的查询的处理过程比原始查询处理过程的效率高还是低? c. 上述结果对任何查询通用还是依赖于文档集的容和词本身? 解答: a. 析取式为:(Brutus And Not Anthony And Not Cleopatra) OR (Caesar AND NOT Anthony AND NOT Cleopatra) b. 这里的析取式处理比前面的合取式更有效。这是因为这里先进行AND操作(括号),得到的倒排记录表都不大, 再进行OR操作效率就不会很低。而前面需要先进行OR操作,得到的中间倒排记录表会更大一些。 c. 上述结果不一定对,比如两个罕见词A和B构成的查询 (A OR B) AND NOT(HONG OR KONG),假设HONG KONG一 起出现很频繁。此时合取方式可能处理起来更高效。如果在析取式中仅有词项的非操作时,b中结果 不对。 习题 1-7 [*] 请推荐如下查询的处理次序。 d. (tangerine OR trees) AND (marmalade OR skies) AND (kaleidoscope OR eyes)

《信息检索》总复习题库及答案

2011-2012经济学院《文献检索与利用》总复习题库 备注:红色为不确定答案,紫色是为了个人强化记忆。 单选题题库 1.下列属于布尔逻辑算符的是(D )。 A、与 B、或 C、非 D、以上都是 2、信息素养的核心是(C ). A、信息意识; B、信息知识; C、信息能力; D、信息道德 3、20世纪70年代,联合国教科文组织提出:人类要向着( B )发展. A、终身学习; B、学习型社会; C、创新发展; D、信息素质 4.参考文献的标准著录格式是( A )。 A、著者篇名来源出处; B、篇名著者来源出处 5.请标出文献:马品仲. 大型天文望远镜研究. 中国的空间科学技术,1993,13(5)P6-14, 1000-758X 属于哪种文献类型( C )。 A、图书; B、科技报告; C、期刊; D、报纸 6.常用的检索系统有( D )。 A、目录检索系统 B、文摘检索系统 C、全文检索系统 D、以上都是 7、哪一种布尔逻辑运算符用于交叉概念或限定关系的组配?( A )。A.逻辑与()B.逻辑或() C.逻辑非()D.逻辑与和逻辑非 8、根据国家相关标准,文献的定义是指“记录有关( C )的一切载体。”A.情报 B.信息. C.知识 D.数据 9、( D )是指通过文献信息资料的主题内容进行检索的途径。 A.题名检索途径 B.作者检索途径 C.分类检索途径 D.主题检索途径 10、搜索含有“”的文件,正确的检索式为:( A )

A." " B. 11、从文献的( B )角度区分,可将文献分为印刷型、电子型文献。A.内容公开次数 B.载体类型. C.出版类型 D.公开程度 12、按照出版时间的先后,应将各个级别的文献排列成( C ) A.三次文献、二次文献、一次文献B.一次文献、三次文献、二次文献C.一次文献、二次文献、三次文献 D.二次文献、三次文献、一次文献13、利用文献后面所附的参考文献进行检索的方法称为( A )。 A.追溯法 B.直接法. C.抽查法 D.综合法 14、《中国学术期刊全文数据库》给出的检索结果为( D )。 A.仅题录 B.仅文摘. C.仅全文 D.题录、文摘和全文三种 15、以作者本人取得的成果为依据而创作的论文、报告等,并经公开发表或出版的各种文献,称为( B ) A.零次文献 B.一次文献. C.二次文献 D.三次文献 16、学术论文写作的六个步骤的正确顺序是( C ): ①搜集资料②研究资料③执笔撰写④选择课题⑤明确论点⑥修改 定稿 A.①⑤④③②⑥ B.⑤③④②①⑥C.④①②⑤③⑥D.②④ ③①⑤⑥ 17、毕业论文答辩的一般程序是( B D ) ①学生答辩②学生作说明性汇报③毕业答辩小组提问④评定成绩 A.③④②①B.②③①④C.③②①④D.②③①④ 18、下列文献中属于哪类属于一次文献( C )? A.文摘 B.索引C.科技报告D.题录 19、如果检索结果过少,查全率很低,需要调整检索范围,此时调整检索策

信息检索与利用习题与答案

医学信息检索习题 单项选择题 1. 关于信息的说法错误的是() A. 信息和物资、能量构成社会三大资源 B. 信息的运动状态和方式是固定不变的 C. 信息是客观事物的运动状态和特征的反映 D. 信息的存储形式有多种多样 2. 下列文献中属于一次文献的是() A. 期刊论文 B. 年鉴 C. 目录 D. 文摘 3. 下列文献中属于二次文献的是() A. 索引 B. 述评 C. 研究报告 D. 专著 4. 下列哪个途径是从文献的内部特征进行检索的?() A. 刊名途径 B. 号码途径 C. 作者途径 D. 分类途径 5. 非规范化检索语言是指哪一项?() A. 主题检索语言 B. 关键词语言 C. 标题词语言 D. 叙词语言 6. 计算机文献检索中,每一种文献特征对应于计算机数据库中的() A. 一条记录 B. 一篇文献 C. 一个字段 D. 一个文档 7. 在CBMdisc检索中,如果在一个检索式中同时包含多个运算符,那么它们的运算优先级次序正确的为() A. AND>OR>NOT B. ( )> OR >AND> C. AND NOT>OR>AND D. ( )>AND NOT>AND>OR 8. Medline光盘数据库的内容涵盖三种重要的纸本医学文献检索工具,它们是() A. IM、Index to Dental Literature、International Nursing Index B. BA、IM、EM C. BA、EM、International Nursing Index D. BA、Index to Dental Literature、International Nursing Index 9. 下面哪个检索式的作用与短语检索"digiatal camera"等价:() A. digiatal (W) camera B. digiatal (N) camera C. digiatal AND camera D. digiatal OR camera 10. 检索工具的功能主要体现在() A. 使用说明 B. 目次表格 C. 索引部分 D. 附录部分 11. 在中国知网中,要求比较全面的检索有关“手术治疗近视”方面的文献,较好的检索策略为()(检索项:主题) A. 手术治疗近视 B. 手术并且治疗并且近视 C. 手术并且近视 D. 术并且近视 12. 在CBMdisc检索中,查找期刊《癌症》上的文献,其正确表达式为() A. 癌症in SO B. SO=癌症 C. 癌症in TA D. TA=癌症 13. 使用CBMdisc检索主题途径“卡介苗接种预防结核”的文献,检索表达式为() A. 卡介苗/治疗应用and 结核/预防与控制 B. 卡介苗预防and 结核 C. 卡介苗/预防and 结核/治疗 D. 卡介苗and 预防and 结核 14. 在Pubmed检索中,查找林立发表的文献,检索表达式应该是()

信息检索技术习题答案

《信息检索技术》(第三版)书后习题及参考答案(部分) 第1章绪论 【综合练习】 一、填空题 1.文献是信息的主要载体,根据对信息的加工层次可将文献分为_________文献、__________文献、___________文献和___________文献。 2.追溯法是指利用已经掌握的文献末尾所列的__________,进行逐一地追溯查找_________的一种最简便的扩大情报来源的方法。 3.用规范化词语来表达文献信息__________的词汇叫主题词。主题途径是按照文献信息的主题内容进行检索的途径,利用能代表文献内容的主题词、关键词、叙词、并按字顺序列实现检索。 4.计算机信息检索过程实际上是将___________与____________进行对比匹配的过程。 5.无论是手工检索还是计算机检索,都是一个经过仔细地思考并通过实践逐步完善查找方法的过程。检索过程通常包含以下几个步骤_________、__________、__________、__________、_________。 6.检索工具按信息加工的手段可以分文__________、____________、___________。 7.《中国图书馆图书分类法》共分___________个基本部类,下分________个大类。 8.索引包括4个基本要素:索引源、___________、___________、和出处指引系统。 答案1.零次,一次,二次,三次 2.参考文献,引文 3.内容特征 4.检索提问词,文献记录标引词 5.分析课题,选择检索工具,确定检索途径及检索式,进行检索,获取原文 6.手工检索工具,机械检索工具,计算机检索工具 7.五,22 8.索引款目,编排方法 二、判断题 1.在检索信息时,使用逻辑符“AND”可以缩小收缩范围。() 2.逆查法是由近及远地查找,顺着时间的顺序利用检索工具进行文献信息检索的方法。() 3.按编制方法划分,信息检索工具可以分为:手工检索工具、机械检索工具、计算机检索工具。() 4.请判断下面图书的国际标准书号的格式是否正确。ISBN:978-030-26151-X。() 5.文献的专利号、报告号、合同号、标准号、索取号、国际标准书号、刊号属于文献的内部特征。 6.二次检索是指在第一次检索结果不符合要求时,重新选择检索条件再次进行检索。 答案1.√2.×3.×4.√5.√6.× 三、选择题(单选或多选)

信息检索习题与答案

注意: 1、通读教材,根据页码提示完成下列题目。 2、最后一次上机课在线测试,围不超出如下题 目。 第一章 一、单选 1、报道围主要为能源方面的科技报告为( D)。 A、AD B、PB C、NASA D、DOE{第7页} 2、( C)是出版周期最短的定期连续出版物。 A、图书 B、期刊 C、报纸 D、学位论文{第6页} 3、( A)是高校或科研机构的毕业生为获取学位而撰写的。A、学位论文 B、科技报告 C、会议文献 D、档案文献{第6页} 4、了解各个国家政治、经济、科技发展政策的重要信息源是(B ) A、科技报告 B、政府出版物 C、标准文献 D、档案文献{第8页} 5、年鉴属于下列哪一类别( D) A、零次信息 B、一次信息 C、二次信息D、三次信息{第7页} (一次信息:图书、期刊论文、科技报告、会议论文、专利说明书及科技日记、杂记、实践记录) 6、下列哪种文献属于一次文献(A )。 A、图书 B、百科全书 C、综述 D、文摘 {第4页} 7、下列文献中属于一次信息的是(A )A、专利说明书 B、百

科全书 C、目录 D、综述{第4页} 8、以下各项属于二次信息的是(A) A、索引 B、期刊 C、学位论文 D、百科全书{第4页} (二次信息;目录、题录、文摘、索引、书目对一次信息有指引和报道作用) 二、多选 9、二次信息主要包括()等。 A、手册 B、年鉴C、目录 D、题录{第4页} 10、信息的属性包括()A、客观性 B、时效性 C、传递性 D、共享性{第3页} 11、信息素质的涵主要包括()。 A、信息意识素质 B、信息能力素质 C、信息道德素质 D、信息职业素质{第9页} 12、以下类型的信息属于三次信息的是()。 A、目录B、词典 C、百科全书 D、科技报告{第4页} 附加: I)信息道德规信息行为,主要包括()。A、不制作、传播、消费不良信息B、不侵犯他人的知识产权、商业秘密、隐私权C、恰当使用与合理开发信息技术D、私下交易个人信息(第10页) II)根据信息的载体和表达方式的不同,信息源可分为()。A、语言信息源B、二次信息C、实物信息源D、文献信息源(第4页) III)文献的基本要素有()。A、有一定的知识容B、一定要记录

信息检索考题及答案教学文稿

信息检索考题及答案

一、单选 1、报道范围主要为能源方面的科技报告为( D、)。 2、(C报纸)是出版周期最短的定期连续出版物。 3、( A学术论文)是高校或科研机构的毕业生为获取学位而撰写的。 4、了解各个国家政治、经济、科技发展政策的重要信息源是(B政府出版物) 5、年鉴属于下列哪一类别(D三次信息) 6、下列哪种文献属于一次文献(A图书)。 7、下列文献中属于一次信息的是( A专利说明书) 8、以下各项属于二次信息的是( A索引) 21、(D 漏检率)是指未检出的相关信息量与检索系统中实际与课题相关的信息总量的比率。 22、《四级英语阅读与完型填空》这本图书在中图法体系中的分类号可能是(D、H319 )。 23、布尔逻辑表达式:在职人员(中年教师)的检索结果是(A检索出除了中年教师以外的在职人员的数据) 24、布尔逻辑检索中检索符号“”的主要作用在于( B提高查全率)。 25、根据一定的需要,将特定范围内的某些文献中的有关知识单元或款目按照一定的方法编排,并指明出处,为用户提供文献线索的一种检索工具是(C索引)。

26、将存储于数据库中的整本书、整篇文章中的任意内容查找出来的检索是(A全文检索) 27、截词检索中,“?”和“*”的主要区别在于(A 字符数量的不同)。 28、尽管不同的检索系统对截词符的定义不尽相同,一般而言,多数用(C* )表示无限限检索。 29、尽管不同的检索系统对截词符的定义不尽相同,一般而言,多数用(A?)表示有限检索。 30、利用截词技术检索“?”,以下检索结果正确的是(D ) 31、利用图书末尾所附参考文献进行检索的方法是(D追溯法)。 32、位置运算符号(W)和(N)的主要区别在于(D 检索词是否出现在同一文献中)。 33、我国最早的分类法是(B 《七略》) 34、要查找吴敬琏所发表的文章,首选途径为(C责任者途径)。 I)主题较复杂、研究范围较大、研究时间较久的科研课题适用的检索方法为(A顺查法) B追溯法)检索方法而编制出来的检索II)《科学引文索引》是基于( 工具: A词典): III)下列检索工具哪个不属于事实数据检索工具( C网络检索工具) IV)按检索手段分,搜索引擎属于( D、)格式文件。 64、可以阅读( A国际标准刊号)的缩写。 65、是(

文献检索复习题及参考答案

医学文献检索复习资料 第一章 一、信息、知识、情报、文献(选择、判断改错) 1、信息:是物质存在或运动方式与状态的表现形式或反映,是现实世界事物的反映,它提供了客观世界事物的消息、知识,是事物的一种普遍属性。 2、知识:是人类在认识和改造客观世界实践中获得的对事物本质的认识和经验的综合,是人们通过实践对客观事物及其运动过程和规律的认识。 3、情报:是指人们以各种方式传递与交流的具有一定目的与时效的信息,是人们为一定目的搜集的有使用价值的知识或信息。 情报的重要属性:知识性、传递性、效用性。 4、文献:是指以文字、图象、公式、声频、视频、代码等手段记录或描述在一定的物质载体上,并能起到存储和传播信息情报和知识作用的一切载体。(记录有知识的一切载体。)文献由三个基本要素构成:内容上的知识或信息;揭示和表达知识信息的表示符号;记录信息符号的物质载体。 信息、知识、文献、情报的包含关系:信息、知识、情报必须固定在一定的物质载体上,形成文献后才能进行传递,才能被人们所利用,文献是信息、知识、情报存储、传递、利用的重要方式。信息可以成为情报;信息是知识的重要组成部分,但不是全部;情报是知识或信息经传递并起作用的部分。 第二章医学文献信息资源 一、文献信息资源类型的划分 1、按载体类型划分: (1)书写型文献:古代文献、书法作品、手稿、书信、原始记录等 (2)印刷型文献:图书、期刊、会议文献、政府出版物、专利文献、技术标准、产品资料、学位论文、技术档案 (3)缩微型文献:微缩胶卷、微缩胶片、微缩照片等 (4)视听型文献:唱片、录音带、录像带、科技电影、幻灯片、电视片等 (5)电子型文献: 电子型文献按发布形式分为:①参考数据库:A.书目数据库:中药在线、CBM、PubMed B.文摘和索引数据库 ②全文数据库 ③事实数据库 ④搜索引擎/分类指南 ⑤网络学术资源学科导航 ⑥FTP资源 ⑦其他 2、按出版类型划分: (1)图书:是现代出版物中最普通的一种类型,有封面、书名、作者、出版地、出版者,并装订成册。在每一种正式出版图书的版权页或其他明显部位都标有一个由10位或13位数组组成的国际标准书号ISBN,形式如ISBN 978-7-,这是一种国际通用的出版物代码,代表某种特定图书的某一版本,具有唯一性和专指性,读者可借此通过某些文献信息系统查询某种特定图书。图书基本上有两类:一类是供读者阅读的图书,包括专着、教材;一类是供读者查阅的图书(工具书)。 (2)期刊:是一种连续出版发行的文献。(期刊的内容新颖、出版周期短,通报速度快,信息量大,是情报的主要来源。) 期刊特点:①有固定的名称(刊名) ②相对固定的版式、篇幅和内容范围 ③定期连续出版发行 ④按一定的卷期号或年月顺序号连续出版 每种期刊均有一个由8位数字组成的国际标准连续出版物号ISSN,例如ISSN 0317-8471 前7位代表期刊代号,末位是校验号。

网络信息检索试题及答案

第一部分 1、一条及时的信息可能使濒临破产的企业起死回生,一条过时的信息可能分文不值,甚至是企业丧失难得的发展机遇,造成严重后果,这说明信息具有()特征。 A、差异性 B、传递性 C、时效性 D、共享性 2、培养学生养成良好的信息素养,主要从四个方面进行,其中不包含(): A、信息意识 B、信息心理 C、信息能力 D、信息道德 3、哈佛大学经济学专业学生能够依据图书馆中哪些极为平常、完全公开的图书资料,撰写出核专家都感到惊异的“制造核弹的方法”的报告,反映出良好的信息素养是()。 A、获取知识的捷径 B、科学研究的向导 C、终身教育的基础 D、创新知识的源泉 4、按照信息处理的级别来划分,可以将信息分为零次、一次、二次和三次信息,下面()是一次信息的别称。 A、灰色信息 B、原始信息 C、检索性信息 D、参考性信息 5、“便于保存传递、但需要借助阅读机阅读”是以感光材料记录文字及相关信息的()信息载体类型的特点。 A、印刷型 B、电子型 C、声像型 D、微缩型 6、谈谈你对“信息”的理解。 特征:客观性和普遍性、差异性、传递性、时效性、可转换性、共享性。 7、下列文献哪个是二次文献?( A ) A. 文摘 B. 会议文献 C. 辞典 D.百科全书 8、“文章草稿”、“私人笔记”及“会议记录”属于( A )。 A. 零次文献 B. 一次文献 C. 二次文献 D. 三次文献 9、下列选项中哪一项属于“国内统一刊号”(C )。 A. ISBN 7-04-014623-1 B. ISSN 0254-4164 C. CN 11-2127/TP D. 0254-4164/TP 10、根据国标GB/T 7714-2005规定,下面的横线上的信息是对( C )参考文献的著录条目描述。 萧钰.出版业信息化迈入快车道[EB/OL] .(2001-12-19) [2002-04- 15]. http:∥www. ….htm. A、标准文献 B、期刊(杂志) C、电子文献 D、会议文献 11、根据国标GB/T 7714-2005规定,下面的横线上的信息是对( B )参考文献的著录条目描述。 昂温G,昂温P S .外国出版史[M]. 陈生铮,译. 北京:中国书籍出版社, 2001:15-20 A、期刊(J) B、图书 C、科技报告(R) D、会议文献(Z) 12、下面哪些资料属于三次信息?(ACFLOP) A、《2009年山东省统计年鉴》 B、美国《工程索引》 C、《新华字典》 D、《新华文摘》 E、《机械工业出版社2012年图书征订目录》 F、《计算机科学技术百科全书》 G、《计算机工程与应用》 H、《网络营销》 I、《NASA报告》。 J、《博士论文:论网络时代的商务模

信息检索练习题及参考答案

《信息检索》练习题 第一章练习 一、名词解释 1.信息——是世界上一切事物的状态和特征的反映,是用文字、数据或信号等形式,通过一定的传递和处理,来表现各种相互联系客观事物在运动变化中所具有特征内容的总称。2.信息资源——是指经过人类的选取、组织、序化等整理与开发后的信息的集合。 3.白色文献——是指公开出版发行的、通过正常渠道可以得到的常规文献。 二、填空题 1.信号只是信息的(),信息是信号所载荷的()。载体、内容 2.现实的信息资源依据传递信息的载体和表述方式的不同,可以划分为(),(),(),(),()。口语信息资源、体语信息资源、文献信息资源、实物信息资源、网络信息资源 3.口语信息资源、体语信息资源和实物信息资源,通过计算机技术的转化,成为(),如果有长期开发的价值,往往会转化成()。网络信息资源、文献信息资源 ^ 4.()是记录有信息和知识的一切有形载体,是将知识用文字、符号、图像、音频、视频等方式记录在一定的固态物质载体的结合体。文献 5.期刊按内容和性质划分,可以分为(),(),()。学术性期刊、检索性期刊、其他类型期刊 6.()是指未经出版发行的或未以公开形式进入社会交流的最原始的文献。零次文献 三、判断题 1.情报只是一类专门的信息,是信息的一个子集。() 2.网络信息资源也称虚拟信息资源,是指以数字化形式记录的,以多媒体形式表达的,存储在网络计算机磁介质、光介质以及各类通讯介质上的。() 3.机读型文献是以磁性材料为存储介质,采用计算机技术、磁性存储技术、激光技术,以键盘输入、文件拷贝、刻录或光学扫描等方法作为记录手段,通过计算机处理而产生的一种新的文献。() 4.缩微型文献是以印刷型文献为母本,以感光材料为载体,采用光学缩微技术将文字或图像记录存储在感光材料上而形成的文献。() 5.声像型文献是一种以磁性和光学材料为载体,将声音和图像记录存储在磁性或光学材料上的非文字形式的文献。() # 6.书写型文献是指印刷术发明以前的古代文献和当今尚未正式付印的文献,主要以手写和刻划的方式,将知识信息记录在各种自然材料和布帛,纸张等载体上的文献。()7.三次文献具有综合性高、汇集性、工具性、针对性强、系统性好、知识信息面广的特点,有较高的实际使用价值,能直接提供参考、借鉴和利用。()

信息检索技术习题答案样本

《信息检索技术》( 第三版) 书后习题及参考答案( 部分) 第1章绪论 【综合练习】 一、填空题 1.文献是信息的主要载体, 根据对信息的加工层次可将文献分为_________文献、 __________文献、 ___________文献和___________文献。 2.追溯法是指利用已经掌握的文献末尾所列的__________, 进行逐一地追溯查找_________的一种最简便的扩大情报来源的方法。 3.用规范化词语来表示文献信息__________的词汇叫主题词。主题途径是按照文献信息的主题内容进行检索的途径, 利用能代表文献内容的主题词、关键词、叙词、并按字顺序列实现检索。 4.计算机信息检索过程实际上是将___________与____________进行对比匹配的过程。 5.无论是手工检索还是计算机检索, 都是一个经过仔细地思考并经过实践逐步完善查找方法的过程。检索过程一般包含以下几个步骤_________、 __________、 __________、 __________、_________。 6.检索工具按信息加工的手段能够分文__________、____________、 ___________。

7.《中国图书馆图书分类法》共分___________个基本部类, 下分________个大类。 8.索引包括4个基本要素: 索引源、___________、___________、和出处指引系统。 答案1.零次, 一次, 二次, 三次 2.参考文献, 引文 3.内容特征 4.检索提问词, 文献记录标引词 5.分析课题, 选择检索工具, 确定检索途径及检索式, 进行检索, 获取原文 6.手工检索工具, 机械检索工具, 计算机检索工具 7.五, 22 8.索引款目, 编排方法 二、判断题 1.在检索信息时, 使用逻辑符”AND”能够缩小收缩范围。( ) 2.逆查法是由近及远地查找, 顺着时间的顺序利用检索工具进行文献信息检索的方法。( ) 3.按编制方法划分, 信息检索工具能够分为: 手工检索工具、机械检索工具、计算机检索工具。( ) 4.请判断下面图书的国际标准书号的格式是否正确。ISBN: 978-030-26151-X。( ) 5.文献的专利号、报告号、合同号、标准号、索取号、国

信息检索考题

单选题(每题1分,共45题,45分) 1.下列哪种属于一次文献(未作答)正确答案:A A.期刊论文 B.百科全书 C.综述 D.文摘 2.下列哪种属于二次文献(未作答)正确答案:D A.专利文献 B.学位论文 C.会议文献 D.目录 2.学位论文是(未作答)正确答案:B A.零次文献 B.一次文献 C.二次文献 D.三次文献 3.题录是(未作答)正确答案:C A.零次文献 B.一次文献 C.二次文献 D.三次文献 2.百科全书是( D )。正确 A.零次文献

C.二次文献 D.三次文献 4.下列哪种属于三次文献(未作答)正确答案:C A.标准文献 B.学位论文 C.综述 D.目录 5.科研利用率最高的是(未作答)正确答案:D A.图书 B.学位论文 C.会议文献 D.期刊 17.用主题词进行检索,一般可检索出对应的(未作答)篇文献。正确答案:D A.1 B.2 C.3 D.多 1.计算机中使用的"0"与"1"的二进制代码是(未作答)正确答案:C A.自然信息

C.机器信息 D.人类信息 6.以下数据库中收录期刊最全的是(未作答)。正确答案:A A.维普 https://www.doczj.com/doc/5f5650873.html,KI C.万方 7.影响因子是评价(未作答)的重要指标。正确答案:D A.图书 B.报纸 C.论文 D.期刊 12.等级体系分类法以文献的(未作答)为对象。正确答案:B A.出版时间 B.学科性质 C.主题概念 D.题名 29.对工具书进行检索,最好选择(未作答)正确答案:A A.中国知网 B.中国高等教育文献保障系统 C.中刊库 D.万方学位论文数据库

20.利用分类途径进行检索,其检索标识是(未作答)正确答案:C A.主题词 B.关键词 C.分类号 D.分子式 6.主题法用(未作答)做描述文献主题的标识和检索标识。正确答案:B A.分类号 B.词语 C.阿拉伯数字 D.英文字母 21.OCR电子图书指的是( D )正确答案:B A.扫描书 B.光学字符识别书 C.直接录入的电子图书 D.格式转换电子书 1.以下(未作答)不是信息的基本要素。正确答案:B A.载体 B.数据库 C.信源 D.信宿 3.以下(未作答)不是信息的特征。正确答案:D A.共享性

信息检索与利用试题1答案

信息检索与利用复习题 一、单选题(20分,每题1分) 1、个人信息源又称为(C)。 A、文献信息源 B、口头信息源 C、生物信息源 D、实物信息源 2、文献是记录有知识的(A)。 A、载体 B、纸张 C、光盘 D、磁盘 3、下列哪种文献属于一次文献( A)。 A、期刊论文 B、百科全书 C、综述 D、文摘 4、下列哪种文献属于二次文献( D)。 A、专利文献 B、学位论文 C、会议文献 D、目录 5、下列哪种文献属于三次文献( C)。 A、标准文献 B、学位论文 C、综述 D、文摘 6、下列选项中属于连续出版物类型的选项有(A)。 A、人民日报 B、学位论文 C、科技期刊 D、会议文献 7、下列选项中属于特种文献类型的有(D )。 A、学位论文 B、图书 C、科技期刊 D、标准文献 8、纸质信息源的载体是(D ) A、光盘 B、缩微平片 C、感光材料 D、纸张 9、《中国图书分类法》(简称《中图法》)将图书分成(A ) A 5大部分22个大类 B 5大部分26个大类

C 6大部分22个大类 D 6大部分26个大类 10、《中国图书分类法》(简称《中图法》)是我国常用的分类法,要检索农业方面的图书,需要在(A)类目下查找。 A、S类目 B、Q类目 C、T 类目 D、R类目 11、使用逻辑“与”是为了(B ) A、提高查全率 B、提高查准率 C、减少漏检率 D、提高利用率 12、使用逻辑“或”是为了(A) A、提高查全率 B、提高查准率 C、缩小检索范围 D、提高利用率 13、利用文献末尾所附参考文献进行检索的方法是(C) A、倒查法 B、顺查法 C、引文追溯法 D、抽查法 14、至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合,称为(A)。 A、数据库 B、记录 C、字段 D、文档 15、广义的信息检索包含两个过程(B) A、检索与利用 B、存储与检索 C、存储与利用 D、检索与报道 16、要查找李平老师所发表的文章,首选途径为(A ) A、著者途径 B、分类途径 C、主题途径 D、刊名途径 17、狭义的专利文献是指(C ) A、专利公报 B、专利目录 C、专利说明书 D、专利索引

信息检索考试习题汇总(附答案)

欢迎阅读4.国际标准书号的英文简称ISBN,新版国际标准书号2007年正一、单项选择题(从下列各题四个备选答案中选出一个正确答案,式实施,国际标准书号由10位升至13位。(√)并将其代号写在答题纸相应位置处。每题2分,共30分)5.检索效果的评价指标主要有查全率和漏检率。(×)1._C_是题录型检索工具1.NSTL是(国家科技图书文献中心)的简称。A.CABIB.中国学术期刊文摘C.全国报刊索引(自然版)D.经济纵2.(信 系统 4.利用baidu 号( (_A。 称是 年开始A. 动C.数据检索、事实检索、文献检索 D.计算机检索、手工检索7.电子期刊,指以(数字或称电子)形式出版发行的期刊,英文7.国际上评价期刊最有影响力的一个指标是___A_____。为(electronic A.影响因子B.读者统计数据C.引文量D.价格 Journal),简称e-journal. 8.二次检索指的是:___C__________。8.国家知识基础设施(NationalKnowledgeInfrastructure,NKI)A.第二次检索B.检索了一次之后,结果不

满意,再检索一次的概念,由世界银行提出于1998年。CNKI是指(中国基础知识C.在检索结果中运用“与、或、非”进行再限制检索D.以上设施工程),它是以实现全社会知识资源传播共享与增值利用为都不是目标的信息化建设项目,由清华大学、清华同方发起,始建于9.国际连续出版物编号___A__________。(1999)年6月。平台的检索方式有(单库检索)、(跨库检索)、(数据10.下列搜索引擎具有书名号检索功能的有 A.2004版的“11. 人)公 A ISO在 )刊名必须有(两个)词以上才可用缩写;限定。3)单词的缩写大多数采用(减少音节)的方法,如“Chemistry”A.“”(双引号)B.()(括号)C.+(加号)D.-(减号)缩写成(chem),只有极少数常用单词用首字母表示,如“Journal”二、判断正误(在正确答案后面划√,在错误答案后面划×,每缩写成(J);小题2分,共10分)4)刊名缩写时,刊名第一个单词的首字母一定要(大写)。 1.专利文献根据发明创造的性质可以分为发明、

大学—医学信息检索——考试题库与答案

单选题 1、下列哪个文献的类型是属于零次文献:B 2、我国首次开通国际联机情报检索是在(C)。 3、我国首次开通国际联机情报检索是在(A)。 4、下列属于文献的外表特征的选项是(D)。 5、下列哪个文献的类型不属于三次文献( A)。 6、在中国生物医学文献光盘数据库(CBMdisc)的记录中出现的“AU”字段代表的是( A)。 7、用Google准确搜索重庆医科大学应用技术学院有关资料应使用(C) 8、下列哪一过程是文献检索过程的最后一步(A)。 9、中文医学文献文摘式检索工具是(D)。 10、通用载体通常指的是(A)。 11、关键词可帮助读者在检索中:(D ) 12、下列属于二次文献的是:(A) 13、下列属于文献内容特征的是(B )。 14、在中国生物医学文献光盘数据库(CBMdisc)的记录中,代表文献“题目”的字段是:(A ) 15、用Adobe Reader可以阅读下列哪种格式的文章。A 16、下列哪一过程是文献检索过程的最后一步:(C) 17、下列属于文献内容特征的是:(A ) 18、下列哪一个是供读者使用的查阅IM的指南(D) 19、利用《中文科技资料目录》(医药卫生)查找有关“中药治疗高血压”方面的文献,如果从主题途径查找,本课题的检索策略是(A)。 20、下列属于三次文献的是:(D ) 21、下列哪个文献的类型不属于一次文献(C )。 22、属于文献内容特征的选项是(D) 23、某护士检索有关“哮喘患者自理行为”方面的文献,她从现在的开始往前逐年进行文献24、查找,此种检索方法称为:(A) 25、不属于文献外部特征的是(B)。 26、在中国生物医学文献光盘数据库(CBMdisc)的记录中出现以下哪个字段代表的是文献的“著者”? :(D) 27、在《中文科技资料目录》(医药卫生)中,护理学的分类号为(D)。 28、在中国生物医学文献光盘数据库(CBMdisc)的记录中,代表文献“题目”的字段是(A )。 29、使用搜索引擎进行信息检索时,下列措施中对提高查全率没有帮助的是D 30、CBMdisc35个字段中AF代表的是(A)。 30、在中国生物医学文献光盘数据库(CBMdisc)的记录中出现的“AU”字段代表的是:(A ) 31、下列哪个文献的类型是属于零次文献(B )。 32、下列属于文献的外表特征的选项是(C )。 33、利用综述文献后面所附的参考文献进行文献查找的方法称为(C)。 34、在中国生物医学文献光盘数据库(CBM disc)的记录中出现的“AB”字段代表的含义是:(A) 35、选项中哪一种文献属于一次文献(C )。 36、使用搜索引擎进行信息检索时,下列措施中对提高查准率有帮助的是D 37、下列哪个数据库是全文数据库?A 38、检索有关脑卒中康复效果及影响因素研究的中文相关文献,下列检索策略中,较好的检索式应为(C)

大学生信息检索习题以及答案

《大学生信息检索概论》模拟试题 一、填空题 1、文献的级次分为零次文献、一次文献、二次文献、三次文献 2、《中图法》有五个基本部类,分别是马克思主义、列宁主义、思哲 学;社会科学;自然科学和综合性图书,在此基础上又划分为_22_个大类。 3、按容可将计算机检索系统的数据库类型分为:文献书目型数据库、事实型数据库、数值型数据库和全文型数据库。 4、我国标准可分为国家标准、部标准和企业标准三大类。 5、在实际检索中,文献的检索方法主要有:直查法、追溯法、工具法和综合法。 6、国际标准化组织简称:ISO 、本标准每 5 年修订一次 二、选择题1、如果需要检索某位作者的文献被引用的情况,应该使用( C )检索。A.分类索引B.作者索引C.引文索引 D.主题索引 2、利用图书馆的数据库检索期刊论文时,可供选择的中文数据库是( D )。A.超星数字图书馆 B.万方学位论文 C.国研网 D.维普科技期刊 E.高校财经库 3、如果检索有关多媒体网络传播方面的文献,检索式为(A D)。A.多媒体and 网络传播 B.多媒体+网络传播 C.多媒体or 网络传播 D.多媒体*网络传播 4、如果对某个课题进行主题检索时,可选择的检索字段有( A D E )。A.关键词 B.作者 C.刊名 D.题名 E.文摘 5、二次文献又称检索工具,包括:( A C D )。A.书目B.百科C.索引D.文摘E.统计数据 三、名词解释题1、文献:用文字、图形、符号、声频、视频等技术手段记录人类知识的一种载体,或理解为固化在一定物质载体上的知识。也可以理解为古今一切社会史料的总称。2、体系分类语言:是以科学分类为基础,运用概念的划分与概括的逻辑方法,形成一个概念等级体系,按知识门类的逻辑次序,按

相关主题
文本预览
相关文档 最新文档