联机信息检索
- 格式:docx
- 大小:16.96 KB
- 文档页数:6
信息检索知识点 Revised by Liu Jing on January 12, 2021信息检索考点整理1.信息检索的概念广义的信息检索是指将信息按一定的方式组织、存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储和检索两个过程;而狭义的信息检索仅指有序化信息的检索查找。
2.信息检索的原理就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进行相符性比较,凡是信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问的标识,则具有该特征的信息就从检索工具中输出,输出的信息就是初步命中检索所需的信息。
3.为什么说信息存储和检索是两个不可分割的有机体?检索的全过程包括存储和检索两个过程,存储和检索是相辅相成、不可分割的。
存储过程主要是利用检索语言对文献进行标引,形成文献特征标识并输入检索工具,为检索提供有规律的检索途径;检索过程主要是利用检索语言对检索提问进行标引,形成检索提问标识,再按照存储所提供的检索途径,将检索提问标识与文献特征标识进行比较。
检索过程是存储过程的逆过程。
因此,检索者只有在全面了解存储者是怎样把文献存入到检索工具中去以后,才知道怎样从检索工具中把所需要的信息检索出来。
4.信息检索的方法(1)顺查法(2)倒查法(3)抽查法(4)追溯法(5)循环法5.信息检索的途径(1)内部特征途径a)分类途径b)主题途径(2)外部特征途径a)题名途径b)着者途径c)文献编号途径d)目录检索途径e)机构检索法f)引文检索途径6.布尔模型的优缺点优点:(1)简单,形式简洁,易于理解;(2)可操作性强,应用广泛;(3)构成的逻辑提问式可以表达与用户思维习惯相一致的查询要求,提供非常精确的语义概念;(4)能处理结构化提问。
缺点:(1)表达用户复杂需求效果欠佳(2)准确匹配无法提供定量比较(3)匹配标准不尽合理(4)检索结果不易控制7.概率排序原则:如果一个检索系统对用户的每个检索提问的反应是以文献集合中的文献按相关性递减的顺序排列的,那么系统的总体效果是最好的。
网络信息检索与利用一、名词解释题:网络信息资源:是将文字、图像、声音、动画等各种形式的信息,以数字化形式存储并借助计算机与网络通讯设置发布,收集、组织、存储、传递、检索和利用信息资源。
www:信息检索数据库:是至少有一个文档组成并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合。
联机检索:指用户利用计算机联合通过通讯网络与世界各地的信息检索系统联机,从检索系统的数据库中查找出所需信息的过程。
它允许用户以智能机对话,联机会话,这样交互的方式直接访问检索系统及数据库、检索是实时在线进行。
查全率:是指检出文献中合乎需要的文献数量占数据库中存在的合乎该需要的所有文献的比例。
查准率:是指检出文献中合乎需要的文献的数量占检出文献的全部数量。
关键词:关键词又称自由词,它属于自言语言范畴。
关键词是直接来自文献本身,能够反映文献主题概念,具有实际检索意义的词语。
以搜索引擎为代表的基于关键词的检索工具能够利用全文索引技术。
布尔逻辑检索:又称布尔代数是指使用,and,or,not等运用符,查找含有某种词语特定主配形式的网页。
搜索引擎:是一个可以用文件名查找文件的系统。
元搜索引擎:是一种基于搜索引擎的网络检索工具。
它是将多个搜索引擎集合在一起,通过一个统一的检索界面接收并处理用户的查询提问。
在进行检索时调用一个或者多个独立搜索引擎的数据库。
桌面元搜索引擎:顾名思义,桌面元搜索引擎不是通过网上调用方式在线使用,而是直接在用户的计算机上进行,相当于用户自己拥有一个元搜索引擎,所以称之为桌面元搜索引擎。
All-in-One式元搜索引擎:又称搜索引擎元目录,它将主要的搜索引擎集中起来,并按类型或检索问题等编排组织成目录帮助导引用户根据检索需求来选择适用的搜索引擎。
联合书目数据库:联合目录是揭示报道若干个文献收藏单位的文献入藏情况,汇总若干个单位馆藏的书目信息的目录。
参考信息:是指人名、地名、机构、事件、统计数据等一类数据,事实信息,是人们的工作研究和日常生活中经常要查考、引用的信息。
信息检索知识点信息检索考点整理 1 、信息检索的概念广义的信息检索就是指将信息按一定的方式组织、存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储与检索两个过程; 而狭义的信息检索仅指有序化信息的检索查找。
2. 信息检索的原理就就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进行相符性比较,凡就是信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问的标识,则具有该特征的信息就从检索工具中输出,输出的信息就就是初步命中检索所需的信息。
3 、为什么说信息存储与检索就是两个不可分割的有机体?检索的全过程包括存储与检索两个过程,存储与检索就是相辅相成、不可分割的。
存储过程主要就是利用检索语言对文献进行标引,形成文献特征标识并输入检索工具,为检索提供有规律的检索途径;检索过程主要就是利用检索语言对检索提问进行标引,形成检索提问标识,再按照存储所提供的检索途径,将检索提问标识与文献特征标识进行比较。
检索过程就是存储过程的逆过程。
因此,检索者只有在全面了解存储者就是怎样把文献存入到检索工具中去以后,才知道怎样从检索工具中把所需要的信息检索出来。
4 、信息检索的方法 (1)顺查法 (2)倒查法 (3)抽查法(4)追溯法 (5)循环法 5 、信息检索的途径 (1)内部特征途径a) 分类途径 b) 主题途径 (2)外部特征途径 a) 题名途径 b) 著者途径 c) 文献编号途径 d) 检索途径 e) 机构检索法 f) 引文检索途径 6 、布尔模型的优缺点优点:(1)简单,形式简洁,易于理解;(2) 可操作性强,应用广泛;(3) 构成的逻辑提问式可以表达与用户思维习惯相一致的查询要求,提供非常精确的语义概念;(4) 能处理结构化提问。
缺点:(1)表达用户复杂需求效果欠佳(2)准确匹配无法提供定量比较(3)匹配标准不尽合理(4)检索结果不易控制7 、概率排序原则: 如果一个检索系统对用户的每个检索提问的反应就是以文献集合中的文献按相关性递减的顺序排列的,那么系统的总体效果就是最好的。
网络信息检索技术网络信息检索中,基本的检索技术有布尔逻辑检索、截词检索、位置检索、限制检索等。
一、布尔逻辑检索逻辑检索是一种开发较早、比较成熟、在信息检索系统中广泛应用的技术。
布尔逻辑检索就是采用布尔关系运算符来表达检索词与检索词之间逻辑关系的检索方法,目前最常用的布尔逻辑运算符主要包括逻辑“与"(AND)、逻辑“或"(OR)、逻辑“非”(NOT)。
(一)逻辑“与”逻辑“与”,也称为逻辑乘,用AND表示,是用来组配不同含义检索词之间的限定关系。
检索词A、B以AND (或“*")相连,即A AND B (或A*B),表示同时包含A、B两词的文献才是命中记录,因而逻辑“与”运算用于对检索词进行限定,从而缩小检索范围,提高检索结果的查准率。
例如,要查找children education (儿童教育)方面的文献,检索逻辑式可表示为“children * education”或者“children AND education” o运算的结果是同时含有检索词children和检索词education的文献才被检索出来。
(二)逻辑“或”逻辑“或”,也称为逻辑加,用OR或者"+”表示,是用来组配同义或者同族检索词之间的并列关系。
检索词A、B若以OR或“+”相连,即A OR B(或A+B),表示只要含有A、B之一或者同时包含A、B的文献都是命中记录。
因而逻辑“或” 运算可用于扩大检索范围。
例如,要查找“汽车”方面的文献,因为汽车在英语中可以用car或者automobile表示,所以为了将有关汽车的文献全部检出,避免漏检,检索逻辑式就可表示为“car OR automobile”或者“car + automobile” o运算的结果是含有car或者automobile任意一个或者同时两个的文献均被检索出来。
(三)逻辑“非”逻辑“非”用NOT或者"-”来表示,是用来组配概念的包含关系,可以从原检索范围中排除一部分,因而使用逻辑“非”运算可以缩小检索范围。
简谈利用网络获取文献的方法【摘要】本文阐述了文献信息检索方法,检索类型及检索工具使用;用户如何利用检索工具既快速又准确地检索所需文献信息,供用户参考。
【关键词】检索方法;检索类型;检索工具使用面对大量庞杂的信息资源,如果用户不掌握文献信息检索的知识和方法,要获取有价值的信息是困难和低效的。
用户只有掌握文献信息检索的方法和技能,才能快速、准确地利用图书馆数字网络资源获取用户所需要的信息,才能实现知识的创新。
目前以计算机为工具的信息检索已成为文献检索的主要方式,下面介绍常用的信息检索方法和检索工具的使用。
1 常用的文献信息检索方法①顺查法:按从远到近的时间顺序查找文献信息的方法。
一般用于重大课题和各学科发展史以及新兴学科等方面的研究课题的全满检索。
②倒查法:是一种逆时间顺序由近及远地回溯性查找文献的方法,目的是获取近期发表地最新文献信息。
是一般科研人员最常用地方法。
在确认某项成果是否创新时,也适合用倒查法。
③抽查法:是针对某一学科内的课题,重点对某一时间段进行检索,这种方法多用于检索专题调查报告。
④追溯法:是利用已掌握文献后面的参考文献或引用文献追踪查找相关文献的方法,也叫追踪法或引文追溯法,具体检查法有2种:一种是利用原始文献新附的参考文献追溯检索;另一种是利用专门编制的引文索引进行追溯查找。
⑤分段法:是将常用法(工具法)与追溯法交替使用的方法,也称循环法或交替法。
⑥浏览法:即对纸质型或电子文献目录内容的浏览方法。
2 常用的文献信息检索类型①目录,目录是著录一批相关文献,并按照一定次序排列而成的一种揭示与报道文献的工具。
不同的目录指出了不同的查找途径。
图书馆目录通常有三套.即书名目录、分类目录和著者目录,有的还有一套主题目录。
任何一本馆藏图书都可以通过这四个途径来找到。
其中书名目录是按文献题名的字顺组织起来的目录,能从题名这个特征来检索特定文献。
分类目录是按文献内容的科学体系进行分类排列组织起来的目录,能帮助读者从学科内容检索文献。
专业科训信息检索(Information Retrieval)是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。
狭义的信息检索就是信息检索过程的后半部分,即从信息集合中找出所需要的信息的过程,也就是我们常说的信息查寻(Information Search 或Information Seek)。
信息检索有广义和狭义的之分。
广义的信息检索全称为“信息存储与检索”,是指将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程。
狭义的信息检索为“信息存储与检索”的后半部分,通常称为“信息查找”或“信息搜索”,是指从信息集合中找出用户所需要的有关信息的过程。
狭义的信息检索包括3个方面的含义:了解用户的信息需求、信息检索的技术或方法、满足信息用户的需求。
一·按存储与检索对象划分,信息检索可以分为:1·文献检索·2数据检索 3·事实检索以上三种信息检索类型的主要区别在于:数据检索和事实检索是要检索出包含在文献中的信息本身,而文献检索则检索出包含所需要信息的文献即可。
二·按存储的载体和实现查找的技术手段为标准划分:1·手工检索 2·机械检索 3·计算机检索其中现在发展比较迅速的计算机检索是“网络信息检索”,也即网络信息搜索,是指互联网用户在网络终端,通过特定的网络搜索工具或是通过浏览的方式,查找并获取信息的行为。
按检索途径划分:(1)直接检索,(2)间接检索三·检索方法信息检索方法包括:普通法、追溯法和分段法。
1.普通法是利用书目、文摘、索引等检索工具进行文献资料查找的方法。
运用这种方法的关键在于熟悉各种检索工具的性质、特点和查找过程,从不同角度查找。
普通法又可分为顺检法和倒检法。
顺检法是从过去到现在按时间顺序检索,费用多、效率低;倒检法是逆时间顺序从近期向远期检索,它强调近期资料,重视当前的信息,主动性效果较好。
第3章专利信息源及其检索方法专利文献是人类创造的巨大知识宝库。
如何从浩瀚的信息海洋中获取所需的信息、知识和情报,使科学技术活动在继承的基础上发展,站在巨人的肩膀上,是信息分析从业者的重大使命。
作为信息分析的重要程序,本章论述了从专利信息集合中查询所需信息的基本概念和过程,包括专利信息源、专利信息检索、专利信息的手工检索和专利信息的计算机检索4部分,作为专利信息采集的导引。
3.1 专利信息源信息源就是信息的来源。
专利信息源是世界上最大的技术情报源,具有内容广泛和新颖、技术细节详尽、实用性强等特点。
它既有一般信息源的构成和特点,又具有其自身特点。
3.1.1文献型信息源一般认为,信息的来源可分为语言型和文献型两种。
语言型主要包括电视、广播和电影等大众媒体。
文献型主要包括图书、报刊等各种载体形式的文献。
本文重点介绍文献型信息源。
常见的文献型信息源:印刷型文献,如图书、报纸、杂志,行业和政府机构等的出版物;电子信息源;网络信息源,如各种数据库。
1.印刷型文献这是最传统的信息源,包括公开出版物和非正式出版物的文献。
公开出版物包括各类图书(如企业名录、专利文献、科技报告、统计年鉴等)和报刊。
图书是最主要的文献型信息来源,如年鉴能提供准确、权威的数据、图表、统计资料等,是了解对手市场信息、产品资料、掌握对手生产发展趋势的信息源。
报纸、刊物是社会及经济活动的重要信息源,包含了大量经济新闻、经济政策法规、经济动态等信息。
非正式出版的文献包括业务信函、内部刊物、档案、财政报告、展览(或展销)的介绍资料、各类交流会议的资料、产品目录和资信报告等。
2.电子信息源20世纪70年代以来,随着计算机技术和其他电子技术的发展,产生了种类繁多、形式各异的电子信息资源。
电子信息资源是指以电子数据的形式把文字、图像、声音和动画等多种形式的信息存放在光、磁等载体中,并通过计算机或终端等方式再现出来的信息源。
它具有存取方便、检索速度快等优点,但需要特定的阅读设备。
信息组织名词解释1.信息超载:指系统或个人所接受的信息超过其自身的处理能力或信息未能有效利用的状况。
2.“指数增长规律”:美国科学家普赖斯对科技文献增长规律进行了研究,提出了著名的“指数增长规律”,即科学文献增长与时间成指数函数关系。
3.“梅特卡夫定律”:梅特卡夫针对网络资源的增长特点,指出,随着上网人数的增长,网上资源将呈几何级数增长。
4.机械检索:利用探针或检索器件,对代表检索标识的穿孔卡片进行选取的一种检索方式。
5.光电检索:即把检索标识变成黑白点矩阵或条形码,存储在缩微介质上,利用光电效应,通过检索机进行查找的一种检索方式。
6.计算机检索:把检索标识转换成二进制编码,存储在磁性或激光载体上,由计算机根据程序进行查找和输出。
7.信息描述:广义的信息描述包括信息标引,狭义的信息描述是指对信息的外部特征的描述,即不包括对信息内容的揭示性标引。
信息描述是信息组织的重要环节和前提。
8.信息标引:信息标引即对信息内容进行分析并充分而有效地予以揭示。
从学科揭示信息内容就是分类标引,从主题特征揭示信息内容就是主题标引。
9.检索语言:般称为情报检索语言(Information Retrival Language,IRL),随着信息检索范围的扩大以及信息概念的更加普及,也有称之为信息检索语言;其他的概念名称还有标引语言、索引语言、信息表示语言、信息组织语言或知识组织语言等。
张琪玉教授系统建立了情报检索语言及其相关概念的体系,并使其规范化,统一了概念名称。
他对情报检索语言的定义是:“根据情报检索的需要而创制的,专门用于各种手工的和计算机化的文献情报存贮检索系统,能够唯一地表达各种概括文献情报内容的概念(主题概念),能够显示概念之间的相互关系,并便于进行系统排列,便于将标引用语和检索用语进行相符性比较的人工语言”。
10.计算语言学:是在语言学、数学、计算机科学、自动化技术和认知科学的基础上发展起来的。
是一门通过建立形式化的数学模型,来分析、处理自然语言,并在计算机上用程序来实现分析和处理的过程,从而达到以机器模拟人的部分乃至全部语言能力的目的的学科。
云南大学软件工程硕士(江西办学点)10年春季班信息检索课程考试试卷一、名词解释(每小题4分,共20分)1.信息检索2.信息检索语言3.叙词4.联机信息检索5.信息门户二、填空题(每空1分,共20分)1.物质、和一起被称为现代文明的三大支柱。
2.信息检索已经经历了手工检索、、三个发展时期。
3.根据检索对象的不同,可将信息检索划分为文献检索、和检索三种类型。
4.检索语言可分为和两大范畴。
5.截词的处理方式可分为4种形式,即前方截断、、和。
6.通常检索的目的可分为科研攻关型、和三种。
7.检索质量指标主要通过和进行评价。
8.文献检索的最终目的是。
9.搜索引擎有三种,分别是全文搜索引擎、和。
10.在Internet上,WWW信息资源的一般检索方法有:基于超文本链接的信息查询、和。
三、简答题(每小题6分,共30分)1.信息检索原理是什么?2.信息检索的程序是什么?3.网络信息检索的特点有哪些?4.关键词索引的类型及其特点?5.何谓一次文献?二次文献?三次文献?四、论述题(每题15分,共30分)1.谈谈你对网络信息检索的发展趋势的理解。
答:网络信息检索从开始的难以掌握发展到现在的简单易用,所有互联网的用户都可以方便使用网络进行信息的检索, 而且随着现代化技术的发展, 网上检索将会变得越来越简单,未来的网络信息检索将朝着以下几个方面发展:1、网络检索简单化随着计算机高科技的不断发展, 网络会朝着简单化、智能化、网络化、人性化方向发展, 操作系统会越来越简单。
任何人都可以很容易地进行网上搜索准确地获得所需信息。
2、网络检索多样化表现在网上检索工具多样化、网上检索信息多样化。
网上检索工具不仅能检索文献信息, 而且还能检索新闻、天气、股票、地图、交通运输时刻表、站点评论等。
网络检索工具同时能进行一定程度的评价、导向, 有知识“过滤”的作用, 有一定的信息资源控制功能。
检索语言向多语种发展。
网上检索信息形态多样化体现在多媒体信息检索将会变得越来越普遍。
工 作 研 究
第2期 2002年2月 坝代 情报 No.2
Februatw 2【)O2
因特网信息检索与国际联机检索比较研究 陈海龙 (长安大学,西安710061)
[摘要] 本文分析了因特网信息检索与国际联机世索各自的特点,论述了因特网信息检索与国 斥联机检索时区剐瘦关系.指出了两者之间应"-3互相借鉴.取长补短,共同满足用户信息检索的要求 [美键词] 因特网;信息检索;联机检索 [中国分类号]G254 [文献标识码]C [文章编号]1008—0821{21302】02—13078—02
l 因特网信息检索与国际联机检索的特点 1.1 因特网信息辁索的特点 I I.1 因特网信息检索涉及的范围广 内容多 数量大 因特同目前覆盖了全世界170多个国家,拥有用户数 超过I亿并且还在不断地迅速增加.网上信息资源盎多. 有科学论文、小说 诗歌 新闻 政府信息 统计资料、 通讯、指南、名录、索引甚至影像等。随着现代社会信息 化进程的进一步加快,各种各样的信息还在源源不断地进 ^因特网.因特网上信息的增加速度超出了人们的想象。 特剐是WEB服务器的出现,全球共享的信息资源越来越 多。在因特网环境下.信息检索的范围不仅涵盖许多不同 的学科、不同的专业应用钡域,还涉及人类社会生活的众 多方面。 1.1 2信息检索关联性强 因特网信息以网站和网页的形式存在和表达.同站之 间具有可连接性,网页通过超文本技术 超链接的形式相 互连接,因此 因特同信息检索关联性强。 1.1.3信息发布具有较强的实时性.信息更新及时 因特网上提供的信息是海量的实时信息,信息变化较 快。传统文献中更新快的莫过于报纸了 但是报纸一经出 版其信息即无法变动。而因特网信息则不同,它不仅可以 快速发布 而且可 根据用户的意见及时作出变更。 I 1 4检索的信息呈无序性丹布 因特网信息资源以非线性排列、呈无序化分布.信息 缺乏标准化 丹娄方法混乱等,导致信息组织的不规范、 信息检索结果容易产生大量冗亲信息。 j l 5信息形式的多样性 既有文字的信息,还提供图形、声音、视频等多媒体 信息.信息形式多样化使信息检索的内窖更加丰富、多彩。 1.1 6支持多语种检索 因特网信息检索使用不同的自然语言描述各种信息。 有用中文描述的信息检索系统,也有英文、日文、德文、 法文等不同的语言描述的信息检索系统。最新的检索工具 还支持多语种检索如日∞ 等。 1.2 国际联机检索的特点 国际联机检索是使用终端设备.通过通讯线路或网络, 检索远程信息数据库系统。国际联机检索系统在国外发展 较早,目前已发展到相当高的水平。如美国DIALOG系统 是世界上最大的国际联机检索系统,它拥有450多个数据 库,文献量达数亿篇,涉及所有学科领域.用户终端选lO 万多个.几乎遍及世界各大、中城市。DIALOG、BRS、STr'; 等1O多个较大型的国际联机检索系统联机。可检索约数十 亿条信息记录,包括日前世界2/3以上专业领域的文献, 以及金融、商业、产品和新闻等信息。国际联机检索一直 以快捷、全面、方便而在科技信息检索和查新的钡域中占 居统治地位。它的特点如下: 1.2.I文献收藏范围广、时问跨度长 国际联机检索系统具有丰富的庸报源。文献资源丰富+ 可供选择的数据库众多,学科覆盖面广。此外联机数据库 收录文献的时间跨度长,可以进行追溉检索。 1.2 2数据库的数据标引质量高,并提供原始文献 国际联机检索数据库蹦线性排列,信息组织有序、规 范,并采用关键词标引,数据标引质量高。一般多以二、 三次文献为主,检索^口点多,且具有原文支持能力。如 DL, ̄LOG可通过原文订购.为用户提供原始文献服务。 1 2.3检索速度快、检索结果准确率高 国厍联机检索系统都有较好的用户检索界面和检索诺 言.能够方便、快捷、准确地扫描大量的文献.通常在十 多丹钟至几十丹钟就能完成一十较复杂的检索课题.一般 课题可以在几分钟之内完成联机检索过程。而且准确率比 较高,是目前我国科技情报界查新检索服务的必备手段。 l 2 4数据库定期更新 国际联机检素数据库采取定期更新的方法.如CA、 BA等均是每周更新 可及时得到最新信息。联机数据库的 信息比书本式工具书快一至两个月。 1.2 5商业性服务、收费较高 国际联机检索系统一般提供的都是商业性的有偿服务, 国际联机检索系统中的数据库基本上都是收费的且费用较
《信息检索》名词解释[1] 信息答:答案:信息是指应用文字、数据或信号等形式通过一定的传递和处理,来表现各种相互联系的客观事物在运动变化中所具有特征性的内容的总称。
[2] 信息检索答:答案:是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关的信息过程。
[3] 文献答案:文献就是用文字、图形、符号或声像、视频等技术手段记录知识信息的物质载体,或曰固化在物质载体上的知识信息。
[4] 检索语言答:即情报检索语言,是根据信息检索的需要创造出来的一种人工语言,是在文献检索领域中用来描述文献特征和表达信息检索提问的一种专用语言。
[5] 检索工具答案:检索工具是指用以报导、存贮和查找文献线索的工具。
它是附有检索标识的某一范围文献条目的集合,是二次文献[6] 数据检索答案:数据检索是以数值或图表形式表示的数据为检索对象的信息检索。
数据检索是一种确定性检索。
[7] 事实检索答案:事实检索是以从文献中抽取的事项为检索内容的信息检索。
其检索对象既包括非数值信息,也包括一些数据信息。
事实检索是确定性检索。
[8] 索引答案:索引是从正文各文献条目中选出的词或代码的顺序表。
索引主要由检索标识和文献条目顺序号两部分组成。
灵活掌握检索工具索引的使用,是学会使用检索工具的实质。
[9] 计算机信息检索答:计算机信息检索是指利用计算机存储和检索信息。
具体地说,就是指人们在计算机或网络终端上使用特定的检索指令、检索词和检索策略,从计算机检索系统的数据库中检索出所需的信息,然后再由终端设备显示、打印的过程。
[10] 联机检索系统答:联机检索系统是由一台主机带多个终端的信息检索系统。
这种系统具有分时的操作能力,能够使许多相互独立的终端同时进行检索。
检索是以人机对话的方式进行的,用户在自己的终端上输入检索提问式,联机服务中心的计算机就可以立即处理用户的请求,在数据库中查找符合用户提问的数据,并将检索结果回送至用户的检索终端上。
信息检索考点整理1.信息检索的概念广义的信息检索是指将信息按一定的方式组织、存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储和检索两个过程;而狭义的信息检索仅指有序化信息的检索查找。
2.信息检索的原理就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进行相符性比较,凡是信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问的标识,则具有该特征的信息就从检索工具中输出,输出的信息就是初步命中检索所需的信息。
3.为什么说信息存储和检索是两个不可分割的有机体?检索的全过程包括存储和检索两个过程,存储和检索是相辅相成、不可分割的。
存储过程主要是利用检索语言对文献进行标引,形成文献特征标识并输入检索工具,为检索提供有规律的检索途径;检索过程主要是利用检索语言对检索提问进行标引,形成检索提问标识,再按照存储所提供的检索途径,将检索提问标识与文献特征标识进行比较。
检索过程是存储过程的逆过程。
因此,检索者只有在全面了解存储者是怎样把文献存入到检索工具中去以后,才知道怎样从检索工具中把所需要的信息检索出来。
4.信息检索的方法(1)顺查法(2)倒查法(3)抽查法(4)追溯法(5)循环法5.信息检索的途径(1)内部特征途径a)分类途径b)主题途径(2)外部特征途径a)题名途径b)著者途径c)文献编号途径d)目录检索途径e)机构检索法f)引文检索途径6.布尔模型的优缺点优点:(1)简单,形式简洁,易于理解;(2)可操作性强,应用广泛;(3)构成的逻辑提问式可以表达与用户思维习惯相一致的查询要求,提供非常精确的语义概念;(4)能处理结构化提问。
缺点:(1)表达用户复杂需求效果欠佳(2)准确匹配无法提供定量比较(3)匹配标准不尽合理(4)检索结果不易控制7.概率排序原则:如果一个检索系统对用户的每个检索提问的反应是以文献集合中的文献按相关性递减的顺序排列的,那么系统的总体效果是最好的。
8.什么是计算机信息检索?所谓计算机信息检索,就是在计算机和人的共同作用下,按照一定的方法组织和存储信息,并通过人机对话从计算机存储的大量数据中自动输出用户所需的那部分信息的过程。
联机信息检索一、联机信息检索概述联机信息检索起源于20世纪60年代,由美国最先发起并且逐渐形成了覆盖全球的信息检索系统,如DIALOG、OCLC等。
我国从20世纪80年代开始从事国际联机检索服务,现在已经建立了自己的联机检索系统。
(一)联机信息检索的定义与特点1、联机信息检索的定义联机信息检索是指用户利用计算机终端设备,通过通信网络与分布在世界各地的信息检索系统联机,以人——机对话方式,运用特定的检索指令与策略,访问检索系统的数据库,查找所需信息的过程。
这种检索方式是实时(real-time). 在线(online)进行的,用户提问一旦传到检索系统主机被接收后,计算机便立刻执行检索运算,并很快将检索结果传送到用户终端,用户可反复修改检索式,直至获得满意的检索结果。
2、联机信息检索的特点由于联机信息检索不仅实现了信息资源的集中管理和共享,而且打破了信息检索的地域和时间限制,因而与手工检索或者其他形式的计算机信息检索相比,它在检索方面具有独特的优势,具体表现在以下几个方面:(1)检索内容丰富联机信息检索系统有丰富的信息资源,世界上公开出版发行文献的90%都可以通过几种主要的联机信息检索系统查到。
如DIALOG、OCLC等,这些系统中存有数百个数据库,拥有上亿条文献记录,内容涉及各个领域,能满足不同学科检索的要求。
(2)检索效率高利用联机检索系统可以同步查询多个数据库,3-5分钟内即可完成一个或多个检索课题。
而且用户可以在检索过程中随时根据需要调整修改检索策略,从而保证了检索的快速性以及检索结果的查全率和查准率。
(3)检索内容新颖为了满足用户对信息及时性的要求,联机检索系统一般都是由专业人士负责管理,数据库中的信息定期更新,而且更新周期日益加快,尤其是一些时效性强信息的更新速度更快,有的随时都在更新。
如DIALOG系统的工程索引每周更新,报纸类数据库每天更新,商情数据库有的每天更新,有的随时都在更新。
(4)检索系统安全、可靠联机信息检索系统多数采用集中式管理,有专人负责对系统更新与维护,对数据库中的信息进行细致、严格、有序的组织与管理,同时滤去了许多无用信息,确保了信息的可靠性和系统的安全性。
(二)联机信息检索系统的组成一个联机检索系统由联机中心、通信网络、用户检索终端三大部分组成。
1、联机中心。
联机检索中心是联机信息检索系统的中枢部分,由中央主机、数据库、数据库管理与检索软件以及相应的检索服务体制组成。
(1)中央主机中央主机是整个联机检索系统的核心部分,对整个系统的运行进行管理和控制。
其功能是在系统软件和检索软件的支持下,完成信息的存储、处理和检索操作。
联机检索系统一般拥有多台中央主机,可以随时切换,保证检索过程不会因主机故障而中断。
(2)数据库数据库是实现联机检索的物质基础,是联机信息检索操作的对象,是由若干相互关联的数据库(称为文档),按适当的结构形式组成的一个文献信息集合体。
数据库的品种、文献数量和回溯年限是衡量联机信息检索系统规模的重要标志。
一个联机信息检索系统一般可以提供数十到数百个数据库用于检索,而各个数据库存储内容的学科主题、信息类型以及提供的检索途径都存在不同,因此了解各个数据库的特性是进行联机信息检索的基础和前提。
(3)数据库管理与检索软件数据库管理与检索软件是控制中央主机或者服务器进行数据库检索操作的程序,在整个检索系统中发挥着至关重要的作用,其性能和质量将直接影响用户所获取信息与检索需求的匹配程度。
不同联机信息检索系统采用的数据库管理与检索软件的功能是不同的。
2、通信网络通信网络是连接联机信息检索中心和检索终端设备的桥梁,在两者之间传输信息和数据。
联机信息检索系统的通信网络已经从最初的依托于公用电话线、专用线,以及通信卫星和海底电缆构成的国际通信网络,发展到依托于因特网,以Telnet(远程登录)方式或者WWW方式与信息检索系统联机。
3、检索终端检索终端是用户向联机信息检索中心发送或者接收信息的设备。
目前检索终端已经从最初的屏幕显示终端,即只由一个用于输入的键盘和一个用于输出的显示屏幕组成,不具备信息处理能力,只能接收或者发送信息,发展到现在的微机终端,即以一般的PC机为终端,可以对接收的数据进行处理(套录进数据库或者打印等)。
(三)联机信息检索的功能联机信息检索服务系统的功能,即提供的服务方式主要有以下几种:1、回溯检索(Retrospective Searching)一般的联机信息检索系统除了提供最新信息的检索服务外,都回溯收录了很长时间范围的数据,供用户回溯检索。
这种服务对于申请专利、课题开题、某一项目鉴定、撰写综合性论文等非常有用。
2、定题服务(Selecting Dissemination Of Information)定题服务是将用户预先制订的检索表达式长期保留在检索系统的主机中,在相应的数据库更新时,由中央主机自动按保留的检索式,对储存到数据库中的最新文献信息检索,并将检索结果定期反馈给用户。
这种服务对于用户掌握某一学科最新水平和发展动向特别有用,而且信息提供及时,费用相对也比较低。
3、联机订购原文(Online Ordering Full Copies)联机信息系统检索到的信息多数是二次文献,如题录、索引、文摘等,如果用户想要获取原文,可以通过联机终端直接向检索系统递交联机订购原文的请求。
联机信息检索系统自动将用户的订购要求发送到数据库文献提供者,数据库文献提供者将用户所需的文献发给用户。
4、电子邮件服务(E-mail Service)一些大型联机信息系统(如DIALOG、ORBIT等)都设有电子邮件服务,它允许用户发送电子信息到联机检索系统各部门和同一系统中的各个用户。
二、中文联机检索系统选介(一)CALIS 系统1、CALIS 介绍中国高等教育文献保障系统项目(China Academic Library & Information System,简称CALIS),是经国务院批准的我国高等教育“211工程”、“九五”、“十五”总体规划中三个公共服务体系之一。
CALIS的宗旨就是在教育部的领导下,把国家的投资、现代图书馆的理念、先进的技术手段、高校丰富的文献资源和人力资源整合起来,建设以中国高等教育数字图书馆为核心的教育文献联合保障体系,实现信息资源共建、共知、共享,以发挥最大的社会效益和经济效益,为中国的高等教育服务。
CALIS管理中心设在北京大学图书馆,下设了文理、工程、农学、医学四个全国文献信息服务中心,华东北、华东南、华中、华南、西北、西南、东北七个地区文献信息服务中心和一个东北地区国防文献信息服务中心。
全国文理文献信息中心——北京大学图书馆全国工程文献信息中心——清华大学图书馆全国医学文献作息中心——北京大学医学图书馆全国农林文献信息中心一一中国农业大学图书馆华东北地区中心——南京大学图书馆华东南地区中心——上海交通大学图书馆华中地区中心——武汉大学图书馆华南地区个心一一中山大学图书馆西北地区中心——西安交通大学图杉馆西南地区中心——四川大学图书馆东北地区中心——吉林大学图书馆东北地区国防信息中心一一哈尔滨工业大学图书馆CALIS在全国高校系统内构成了三级保障体系的框架,第一级是各个高校图书馆,第二级是地区中心,第三级是全国中心。
如果全国文献中心仍然不能满足需要时,则可以通过全国文献中心向CALIS系统以外的国内外图书馆或文献服务中心提出需求。
自1998年开始建设以来,CALIS管理中心引进和共建了一系列国内外文献数据库,包括大量的二次文献库和全文数据库,采用独立开发与引用消化相结合的道路,主持开发了联机合作编目系统、文献传递与馆际互借系统、统一检索平台、资源注册与调度系统,形成了较为完整的CALIS文献信息服务网络。
迄今参加CALIS项目建设和获取CALIS服务的成员馆己超过500家。
2、CALIS 服务CALIS的服务功能分为两大块。
一是面向读者,二是面向图书馆。
面向读者的服务功能主要有以下几项:(1)公共检索用户可以按照本校——本地区——邻近地区——北京一一国外的顺序,在网上查找全国性或地区性的书刊联合目录数据库,了解所需文献是否有及在哪里收藏。
也可以通过联机(或委托)检索CALIS国内外各种类型的文献数据库,得到某一学科或专题的详尽的文献线索乃至电子版全文。
(2)馆际互借对于本馆没有的文献(如图书),在本馆用户需要时,根据CALIS统一的制度、协议和办法,向其他馆借入;反之,在其他馆用户提出互借请求时,借出本馆所拥有的文献,满足用户的文献需求。
(3)文献传递对于本馆没有的文献(如期刊文章或学位论文),在本馆用户需要时,根据CALIS系统的制度、协议和办法,从其他馆获取;反之,在其他馆用户提出请求时,将本馆所拥有的文献传递给对方。
(4)电子资源导航根据各校重点学科建设的需要进行统筹规划和分工,对网上的电子资源(如研究进展报告、电子期刊论文、研究机构、专家学者等)按图书馆学的原理和方法进行收集、加工和整序,形成虚拟图书馆资源,补充和扩大CALIS的文献资源,提供用户浏览和查询。
面向图书馆的服务主要有以下5项功能。
(1)联机合作编目合作建立具有统一标准的书刊联合目录数据库,在此基础上实现联机共享编目,即任一授权成员馆对入馆新书(刊)编目上载以后,其他馆就可从网上查询并下载,从而大大减少书刊编目工作中的重复劳动,提高编目工作效率和书目数据质量,实现书目资源的共享。
(2)文献采购协作根据各校重点学科建设的需要进行资源分工和布局,在CALIS系统内首先实现国外文献订购前的查重与协调,减少不必要的重复,保证必要的品种,达到文献信息资源的合理分布与经费的合理使用。
(3)培训服务每隔一定阶段,针对CALIS提供的各种服务,CALIS管理中心将组织免费或少量收费的培训。
目前的培训服务主要集中在:联机编目人员的培训、馆际互借与文献传递的培训、系统管理员的培训。
希望接受培训的人员请先通过E-mail 或电话在CALIS管理办公室登记,CALIS工作人员以此为依据,发送培训通知。
培训对象为图书馆相关技术人员。
(4)数据库服务及存档服务CALIS可以对各图书馆或信息服务机构的特色资源提供数据库建设与加工服务,对各图书馆或信息服务机构需要保存的资源提供存档服务。
申请此项服务时,请先提出相关的建设方案,然后和CALIS系统运行部联系。
(5)技术支持CALIS对各图书馆或信息服务机构的自动化系统建设和数字图书馆建设提供完整的技术解决方案。
依据提供咨询的深度收取费用或免费。
CALIS对使用CALIS软件的各图书馆或信息服务机构提供完全的技术支持。
3、CALIS查询方法CALIS检索数据范围包括中、西、日、俄文所有数据,系统提供简单检索和高级检索两种检索方式,具有多种检索入口,从而提高了文献的检全率和检准率,节约检索时间,提高检索效率。