当前位置:文档之家› 工程信息检索教程(第二版)-第一章答案-王知津

工程信息检索教程(第二版)-第一章答案-王知津

工程信息检索教程(第二版)-第一章答案-王知津
工程信息检索教程(第二版)-第一章答案-王知津

第一章基础篇

习题

1、简述信息检索的含义。

就信息检索这个概念而言,使用这个术语的不同使用者有不同的理解和解释,大体上可以分为两类:

第一类是广义的,是指将有用信息按照一定的方式组织存放起来,当用户需要这些信息时,再把它们从存放的地方查找和提取出来。因此,广义的信息检索是包含“存储”和“检索”这样两个阶段和过程,缺一不可。

第二类是狭义的,是指按照一定的方式从现有的信息集合或数据库中,找出并提取所需要的信息。可见,狭义的信息检索仅指“检索”这一个阶段或过程。

2、简述信息检索的基本原理。

广义信息检索的基本原理如图1-1所示。

图1-1 广义信息检索基本原理

在存储过程中,专门负责信息检索系统和数据库建立的人从各种各样的信息资源中搜集有用信息,对有用信息进行主题内容的分析,找出能够全面、准确表达主题内容的概念,借助于检索语言(通常是检索词表)把分析出来的概念转换成检索系统所采用的词语,或者直接使用自然语言,再按照一定的规则和方式将这些有用信息组织成可供检索用的数据库,并存储在定的介质上。

检索是存储的相似过程。信息用户在工作、学习和生活中产生了信息需求,为了检索并获取自己所需要的信息,用户必须对自己的需求进行主题内容的分析,找出能够全面、准确表达主题内容的概念,也要借助于检索语言(通常是检索词表)把分析出来的概念转换成检索系统所采用的词语,或者直接使用自然语言,再按照一定的检索规则和方式,制定检索策略,构造检索式,从数据库中查找并获取自己所需要的信息,最后,输出检索结果。当然,检索的全过程还应当包括对检索结果进行评价、反馈,或许还有重新制定检索策略,重新构造检索式,反复进行检索,直至检索出满意的结果为止。

狭义信息检索的基本原理就是广义信息检索中信息检索过程的那部分原理。

信息检索基本原理中的核心部分是用户所使用的检索词或者由检索词和运算符所组成的检索式与数据库中的检索词及其逻辑关系之间的比较和匹配机理。两者相匹配的信息被检索出来(命中),不相匹配的信息被拒绝。

3、简述信息检索的类型和特点。

按照检索对象划分,包括文献检索、数值检索和事实检索。文献检索的对象是文献,

数值检索的对象是数值,事实检索的对象是事实。文献检索是一种相关性检索,检索出的结果具有不确定性。相比之下,数值检索和事实检索是确定性检索,检索出来的结果要么有、要么无、要么是、要么否,直接回答用户的具体问题,毫不含糊。此外,如上所述,事实检索是三种检索类型中最复杂的。

文献检索是信息检索的核心和主体部分,与数值检索和事实检索相比,内容更丰富,方法更灵活,是信息用户最经常使用的。按照内容的完整性,文献检索又可以分为书目检索和全文检索。所谓书目检索,是指检索对象为原始文献的替代品,即文献线索,而不是原始文献本身,要想阅读原始文献,还必须依据文献线索去进一步找到和获取原始文献。书目检索通常借助于文摘数据库、索引数据库、目录数据库来完成。所谓全文检索,是指检索对象为原始文南本身,检索结果就是原始文献,可以直接阅读和使用原始文献。全文检索通常借助于全文数据库来完成。

按照计算机检索技术划分,包括联机检索、光盘检索和网络检索。联机检索以联机检索提供商为中心,提供商硏制自己的检索软件,建立自己的联机检索系统,数据库则是从数据库生产商那里购买的。用户利用联机检索终端,通过专用的或公用的电话线路等数据通讯网络与联机检索系统相连,按照提供商所制定的各项检索规则进行检索。由于联机检索系统的功能较强、数据库的质量较好,所以联机检索的费用较高。联机检索的鼎盛时期是20世纪60年代中期到80年代中期,至今仍被使用。光盘检索分单机系统和联机系统两种,光盘单机检索系统自成系统,提供单个用户使用通常由微机、光盘驱动器、光盘数据库及相应的检索软件和驱动软件组成。光盘联机检索系统是在光盘网络的环境下运行的,光盘网络受到光盘塔和局域网的支撑,在局域网内提供多个用使用,由服务器管理。

光盘数据库大多由联机检索提供商提供,因此两者的检索方法大体相同。光盘检索费用低,但数据更新慢。光盘检索的鼎盛时期是20世纪80年代中期到90年代初,至今仍被使用。

基于搜索引擎技术的网络检索是随着Internet的兴起和普及而出现的。Internet上的信息非常广泛、丰富,但又非常杂乱、无序,网络信息资源分布在世界各地的主机上,信息量巨大,动态更新,主要依靠搜索引擎获取。Web搜索引擎是当今网络检索工具的主流,不仅能够提供文本检索,还可以提供图形、图像、音频、视频、动画等多媒体检索。目前,网络信息检索已经成为信息检索的主要途径。

4、简述常用信息源与其特点。

1)科技图书。科技图书的特点内容比较全面、系统、成熟、可靠,但出版周期较长,通常不能反映最新科技成果。科技图书一般不作为信息检索的重点,但各种参考

工具书可供工程技术人员进行数值检索和事实检索。

2)科技期刊。科技期刊的特点是内容新颖、出版周期短、报道速度快、发行面广、影响力大,是工程技术人员了解科技动态、水平和趋势经常使用的信息源。

3)专利文献。专利文献的特点是内容新颖、实用、可靠。

4)会议文献。会议文献的特点是内容集中、针对性强,能够反映本领域的最新成果、研究热点、水平和趋势,是工程技术人员了解本行业动向的重要信息源。

5)科技报告。科技报告的特点是选题通常高、精内容专深、详尽,保密性强。

6)学位论文。学位论文的特点是偏重理论,内容专深,有一定的创造性,但不易获得。

7)政府出版物。政府出版物的特点是有助于了解一个国家(地区、部门等)治、经济、军事、文化、教育、科技等方面的方针、政策。

8)技术标准。技术标准的特点是具有律约束力和时效,随着技术的发展不断修订、补充或废除,更新比较频繁,是工程技术人员常使用的信息源。

9)科技档案。科技档案的特点是保密性强,一般仅供内部使用,不对外公开,一般不易获得。

10)产品文献。产品文献的特点是图文并茂,形象直观,是工程技术人员进行技术革新、设备改造、试制新产品的重要信息源。

5、简述检索工具的类型与选择。

按照记录信息的技术划分:印刷型检索工具和数字型检索工具;按照记录信息的完本性划分:全文检索工具和二次检索工具;按照记录信息的边界划分:数据库检索工具和搜索引擎检索工具。

检索工具的选择我们应当考虑两个方面:一个是检索工具与检索课题相符合;另一个是检索工具自身条件

选择检索工具首先必须考虑检索工具是否与检索课题相符合。具体来讲,应当明确:1)要检索中文(国内)信息,还是外文(国外)信息;2)要检索什么类型的信息,比如,是期刊论文,还是专利文献:3)要检索全文,还是二次信息;4)要检索文献信息,还是事实与值;5)要检索什么专业领域的信息,等等。针对这些问题选择对口的检索工具。一般地说,选择检索工具应当是先中文(国内)后外文(国外),先专业后综合,先全文后二次,线先数据库后搜索引擎。

根据检索工具的自身条件来选择检索工具,一般应当考虑

1)收录范围。尽量选择涵盖国家多、专业面广、类型齐全、数据星大的检索工具。

2)报道量。报道量是指每年或每月报道信息的数量,报道量越大,信息密度越大,信息

来源越广,有利于检全

3)新颖性。新颖性是指信息的更新速度,更新越快,就越能检索到最新的信息4)编辑

质量。编辑质量包括著录格式是否规范,检索标识是否准确,检索手段是否完备,检索功能是否强大等。

5)检索途径。检索途径越多,就越能够从不同角度来检索,用户越感到方便。

选择合适的检索工具要综合考虑、全面衡量上述各种因素。另外,鉴别一个检索工具的优劣,归根结底,还是要通过反复实践来检验,从而全面、准确地看待一个检索工具。6、简述数据信息检索的途径及其选择。

选择检索途径必须考虑:一个是我打算从哪个或哪些途径入手;另—个是所选的检索工具能够提供哪些途径。

1)内容特征途径。这是指从信息的内容(内部)特征角度进行检索的途径,主要包括主题途径和分类途径:a.主题途径。b.分类途径。

2)形式特征途径。这是指从信息的形式(外部)特征角度进行检索的途径,主要包括:

a.作者途径。

b.机构途径。

c.号码途径。

d.引文途径。

7、简述信息检索的基本步骤。

信息检索通常按照以下步骤展开:

1)分析检索课题。分析检索课题的目的是要明确课题的性质和要求。为了取得满意

的检索结果,必须对检索课题进行认真分析。分析课题通常要解决以下问题:课题的范围、类型及所属的专业领域;课题的主要内容和重点;课题的核心概念和术语;课题所需信息的时间范围和语种;课题对检全和检准的倾向性,等等。分析课题是检索过程中最重要的环节,直接影响检索结果与效果。

2)选择检索工具。在了解相关检索工具的性质、内容和特点的基础上,比较各种检索

工针对检索课题的各种要求,选择一种或多种合适的检索工具。

3)选择检索方法。根据检索条件、检索要求,选择一种或多种合适的检索方法。

4)选择检索途径。检索途径的选择主要取决于两个方面:一是课题的范围、已知条件

以及对检全和检准的要求;二是所选检索工具能够提供的检索途径。如果已知作者、专利权人、专利号、报告号、标准号等,则可选形式特征途径。如果只提出了内容上的要求,则使用主分类、代码等内容特征途径。如果倾向于检全,可采用分类途径,如果倾向于检

准,可采用分类途径。

5)选择检索标识。对于分类途径来说,检索标识就是分类号,选择分类号就是通过查阋分类表来确定分类号。对于主题途径来说,检索标识就是检索词,选择检索词首先要搞清楚所选检索工具使用的是受控语言还是非控语言。如果使用受控语言还要通过查阅主题词表来确定检索词

6)制定检索策略。检索策略是由检索标识和检索算符組合而成的,检索算符主要是指逻辑运算符,包括“与”(AND)、“或”(OR)、“非”(NOT)以及截断算符、位置符、左右括号等。制定检索策略分初级检索、高级检索和专业检索等3种类型。以《中囯期刊文数据库》为例,初级检索的策略是一步一步地制定和实施的,每一步都要选择检索项、检索词及其他检索条件,后续步骤是在前一步骤的检索结果中再进行检索。高级检索的检索策略是一次性制定和实施的,逻辑运算符、检索项、检索词以及括号内的逻辑关系都是系统事先布局好的,用户只需加以选择和往里填写即可,但参加运算的检索词的数目受到系统的限制。专业检索的检索策略也是—次性制定和实施的,但检索策略完全是由用户按照系统的规定自己制定的,这需要具有较高的信息检索专业水平。

7)实施和调整检索策略。每一次检索之后都要对检索结果进行检查和评价,如果与信息需求不符合,则需要修改和调整检索策略,重新进行检索,这个过程可能反复多次。直至获得满意的检索结果为止。对于较大型的检索课题来说,在正式检索之前,通常需要进行少量的、快速的试检,以此来检验所制定的检索策略是否合理、有效。如果检索结果不理想,则修改检索策略;如果对检索结果满意,则可开始正式检索

8)获取全文。对于直接使用全文检索工具的检索来说,这一步可以省略。对于使用二次检索工具的检索来说,检索结果只是全文的替代品,而不是全文,在这种情况下,就要根据检索出来的文献线索找到全文,这通常需要使用各个图书情报信息单位的联合目录和馆藏目录最后索取全文

相关主题
文本预览
相关文档 最新文档