当前位置:文档之家› 信息检索的基本原理

信息检索的基本原理

图书馆胡小莉

目录

第一节信息检索的涵义及类型

第二节信息与信息源

第三节信息检索途径与步骤

第四节信息检索效果的评价

4123

学习目的和要求

1、掌握信息检索的基本概念和类别

2、掌握常用的布尔逻辑、截词、位置检索等检索技术

3、了解信息检索的基本流程

第一节信息检索的涵义及类型

信息检索的涵义

广义:是指将信息按一定的方式组织和存储起来, 并根据信

息用户的需要找出有关信息的过程和技术。全称为“信息存

储与检索”。

狭义:是指该过程的后半部分,即从信息集合中找出所需要

的信息的过程, 相当于人们通常所说的信息查寻。

信息检索的原理:就是将读者(用户)的信息需求与存贮在信息集合体中的信息进行比较和选择,即匹配(match)的过程。即对信

息集合与需求的匹配与选择。

检索与查找的区别

检索查找、搜索、搜寻英文Retrival或Retrieval search

过程和方法有一定的策略,是

系统的查找资料随机或更随意一些。

技能需要一定的专门知

识和技能

简单,任意词用途课题或专题日常生活

结果检索前通常不知道

会有什么结果

通常知道结果效率迅速、准确一般

如果不刻意区分:你完全可以认为它们没有区别!

信息检索的类型

根据信息检索对象形式不同,分为:

分类检索内容

书目检索以文献线索为检索对象的文献检索;

信息用户通过检索获得的是与检索课题有关的一系列文

献线索,然后再通过阅读决定取舍。

全文检索以文献所含的全部信息作为检索内容的;

可以查找到原文或相关的句、段、节、章等文字。

计算机检索发展趋势之一

数据检索以数值或图表形式表示的数据为检索对象;

数据检索是一种确定性检索,用户检索到的各种数据是

经过专家测试、评价、筛选过的,可直接用来进行定量

分析。

事实检索以从文献中抽取的事项为检索内容;

包括事实、概念等非数值信息和数据信息;

确定性检索,用户获得的是有关某一事物的具体答案

问答:下面这些图片所示属于什么类

型的信息检索?

信息检索的类型

根据信息储存媒体和检索手段不同,分为:

分类检索工具利弊应用备注

手工检索(手检)书本式和卡

片式的书

目、索引、

文摘和各类

工具书

优点:方便、灵活、直

观,查准率较高,回溯

查找的年份不受限制

缺点:检索效率低,漏

检现象比较严重,不利

于进行复杂概念课题的

检索。

查找数据

库中通常

没有收录

的文献

依靠印刷

载体,由

人脑进行

筛选

计算机检索(机检)计算机设

备、终端、

通信设施、

数据库和检

索应用软件

优点:速度快、效率

高、查全率高。

缺点:成本高、费用

大、回溯年份有限。

光盘检索

系统、联

机系统和

互联网信

息检索系

利用计算

机存储和

检索信息

信息检索的类型

根据信息检索信息形式不同,分为:

分类检索内容

文本检索(自然语言检索)不对文献进行任何标引,直接通过计算机以自然语言中的词语匹配查找的系统。

多媒体检索能够支持两种以上媒体的数据库检索,

查找含有特定信息的多媒体文献的检

索。

超文本检索用超链接的方法,将各种不同空间的文

字信息组织在一起的网状文本。我们日

常浏览的网页上的链接都属于超文本。

信息检索的意义及目的

1、信息检索是获取新知识的捷径,节省学习者的时间

据估计,现在全世界每年出版的图书有80万种以上,科技期刊8

万种以上;发表期刊论文大于600万篇以上;公开的专利说明书

100多万件;国际会议文献1万多件;美、英、德、日等国产生的

科技报告达20万件左右。科技文献浩如烟海,具备一定的信息检

索能力才能查找出有用的科技信息。

信息检索的意义及目的

2、信息检索是科学研究的向导,避免重复研究或走弯

路。

美国在实施“阿波罗登月计划”中,对阿波罗飞船的燃料箱进行压力实验时,发现甲醇会引起钛应力腐蚀,为此付出了数百万美元来研究解决这一问题,事后查明,早在十多年前,就有人研究出来了,方法非常简单,只需在甲醇中加入2%的水即可,检索这篇文献的时间是10多分钟。

在科研开发领域里,重复劳动在世界各国都不同程度地存在。据统计,美国每年由于重复研究造成的损失,约占全年研究经费的38%,达20亿美元之巨。日本有关化学化工方面的研究课题与国外重复的,大学占40%、民间占47%、国家研究机构占40%,平均重复率在40%以上;我国的重复率则更高。

信息检索的意义及目的

2、信息检索是终身教育的基础

学校培养学生的目标是学生的智能:包括自学能力、研究能力、思维能力、表达能力和组织管理能力。

联合国教科文组织提出,教育已扩大到一个人的整个一生,认为唯有全面的终身教育才能够培养完善的人,可以防止知识老化,不断更新知识,适应当代信息社会发展的需求。

第二节信息与信息源

一、信息

(一)什么是信息?(Information)

信息论的奠基人,美国数学家克劳德·香农(Claude E. Shannon):“信息是用来消除不确定性的东西。”

控制论的创始人,美国科学家维纳(N. Wiener):“信息是人们在适应外部世界并使这种适应反作用于外部世界的过程中,同外部世界进行相互交换的内容的名称。”

中国学者钟义信:“信息是事物运动的状态与方式,是物质的一种属性。”

信息爆炸

客观性载体性传递性可塑性

时效性

信息的使用周期越来越短可以进行加工和处理

必须依附于

一定的载体

才能流通和

传递是实现信息资

源共享的基础共享性可被多个用户使用

信息可被感知、获取、传

递和利用

(二)信息的特征

二、信息源

信息源,顾名思义,就是信息的来源。联合国教科文组织出版的《文献术语》将其定义为:个人为满足其信息需要而获得信息的来源。

类型存在方式特点

口语信息源交谈、聊天、授课、讨论等方

式传递快、互动性强、但稍纵即逝、久传易出差异

体语信息源手势、表情、姿态等方式直观性强、生动丰富、印象深刻、富有

感染力

实物信息源以实物如文物、产品样本、模

型、碑刻、雕塑等形式表示直观性强、感受实在、信息量大,但需要通过知识、智慧、经验和工具挖掘大量隐含的信息

文献信息源以文字、图形、符号、声频、

视频等方式记录在各种载体上

的知识和信息经过加工、整理,较为系统、准确、可靠,便于保存与利用,但也存在信息相对滞后、部分信息尚待证实的情况。

(一)零次信息源不借助实物媒体,通过直

接交流所获得的的信息来源。包括口头交谈、参观、现场交流、听演讲、听报

告会等。

已出版的原始文献、科研人员根据科研成果撰写的文稿、第一手资料就是一次信息源。它包括:专著、期刊论文、科技报告、会议论文、专利说明书、学位论文等,是人们检索和利用的主要对象。

通过对大量分散、无序的一次信息源进行加工、提炼、浓缩和组织,成为系统的、便于查找一次信息的工具,如收录目录、索引、文摘等的数据库与网络检索工具。它不产生新的知识,但提供了一次信息源的线索。信息检索主要讲的就是二次信息的编排体系和使用方法。

文献检索的方法

文献检索的方法 一、文献检索方法 查找文献的方法分为如下三种: 1. 直接法 直接利用检索工具(系统)检索文献信息的方法,这是文献检索中最常用的一种方法。它又分为顺查法、倒查法和抽查法。 (1)顺查法 按照时间的顺序,由远及近地利用检索系统进行文献信息检索的方法。这种方法能收集到某一课题的系统文献,它适用于较大课题的文献检索。例如,已知某课题的起始年代,现在需要了解其发展的全过程,就可以用顺查法从最初的年代开始,逐渐向近期查找。 (2)倒查法 倒查法是由近及远,从新到旧,逆着时间的顺序利用检索工具进行文献检索的方法。此法的重点是放在近期文献上。使用这种方法可以最快地获得最新资料。 (3)抽查法 抽查法是指针对项目的特点,选择有关该项目的文献信息最可能出现或最多出现的时间段,利用检索工具进行重点检索的方法。 2. 追溯法 不利用一般的检索工具,而是利用已经掌握的文献末尾所列的参考文献,进行逐一地追溯查找“引文”的一种最简便的扩大信息来源的方法。它还可以从查到的“引文”中再追溯查找“引文”,像滚雪球一样,依据文献间的引用关系,获得越来越多的相关文献。 3. 综合法 综合法又称为循环法,它是把上述两种方法加以综合运用的方法。综合法既要利用检索工具进行常规检索,又要利用文献后所附参考文献进行追溯检索,分期分段地交替使用这两种方法。即先利用检索工具(系统)检到一批文献,再以这些文献末尾的参考目录为线索进行查找,如此循环进行,直到满足要求时为止。 综合法兼有常用法和追溯法的优点,可以查得较为全面而准确的文献,是实际中采用较多的方法。对于查新工作中的文献检索,可以根据查新项目的性质和检索要求将上述检索方法融汇在一起,灵活处理。 二、文献检索途径

信息检索知识点优选稿

信息检索知识点 文件管理序列号:[K8UY-K9IO69-O6M243-OL889-F88688]

信息检索考点整理 1.信息检索的概念 广义的信息检索是指将信息按一定的方式组织、存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储和检索两个过程;而狭义的信息检索仅指有序化信息的检索查找。 2.信息检索的原理 就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进行相符性比较,凡是信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问的标识,则具有该特征的信息就从检索工具中输出,输出的信息就是初步命中检索所需的信息。 3.为什么说信息存储和检索是两个不可分割的有机体? 检索的全过程包括存储和检索两个过程,存储和检索是相辅相成、不可分割的。存储过程主要是利用检索语言对文献进行标引,形成文献特征标识并输入检索工具,为检索提供有规律的检索途径;检索过程主要是利用检索语言对检索提问进行标引,形成检索提问标识,再按照存储所提供的检索途径,将检索提问标识与文献特征标识进行比较。检索过程是存储过程的逆过程。因此,检索者只有在全面了解存储者是怎样把文献存入到检索工具中去以后,才知道怎样从检索工具中把所需要的信息检索出来。 4.信息检索的方法 (1)顺查法 (2)倒查法

(3)抽查法 (4)追溯法 (5)循环法 5.信息检索的途径 (1)内部特征途径 a)分类途径 b)主题途径 (2)外部特征途径 a)题名途径 b)着者途径 c)文献编号途径 d)目录检索途径 e)机构检索法 f)引文检索途径 6.布尔模型的优缺点 优点:(1)简单,形式简洁,易于理解; (2)可操作性强,应用广泛; (3)构成的逻辑提问式可以表达与用户思维习惯相一致的查询要求,提供非常精确的语义概念; (4)能处理结构化提问。 缺点:(1)表达用户复杂需求效果欠佳 (2)准确匹配无法提供定量比较

文献检索综合考试题

文献检索综合考试题 Revised by BETTY on December 25,2020

文献检索综合考试题 一.总结你在《信息检索》课中学到的知识点,谈谈学习感受。第一章:大学生信息素养:信息意识、信息能力、信息道德文献基础知识;信息、知识、情报、文献等概念 文献的类型文献检索途径馆藏文献排列规律;《中国图书馆分类法》和书目数据库的使用等等,我们学会了大学生必备的信息素养。 第二讲:搜索引擎,检索方法与检索途径,包括逻辑运算符的使用与如何使用检索词和如何提高查全率与查准率。 第三讲:权威信息源 1.教育信息源 教育部网站是发布教育信息的权威网站。新职业网站提供全方位的大学生就业信息。 精品课程网是教育部2003-2010年建设的课程资源,具有1万多门3级精品课程。教育部的爱课程网站资源提供精品课程的视频录像,包括视频公开课和资源共享课。 MeTel目前国内最大的双语教学的多媒体课程数据库。 中国研究生招生信息网——考研报名和调剂指定网站。 1.新闻信息源

新华网是国内最权威的新闻网站,提供全世界范围的动态新闻。 人民网提供国内全方位的新闻信息,是国内最早的新闻网站。 光明网号称“知识分子网上精神家园权威思想理论文化网站”。 计世网报道最新的信息技术动态 2.工具资源 词典类以注释词义为主,主要用于语言的学习和概念的掌握;熟练应用不同翻译站点 百科全书的内容包罗万象,广泛提供系统知识; 年鉴能及时提供可靠的数据信息。 国家统计局网站全面提供国内第一手经济数据信息。 国研网是国内权威的经济研究网站,向决策者提供经济决策帮助的信息平台。 第四讲:科学文献资源 图书:超星、Springer电子图书 期刊论文:中文:CNKI、维普、英文:EBSCO、 Emerald、Springerlink、ScienceDirect、Wiley 学位论文:CNKI、万方、Proquest 会议论文:CNKI、万方 科技报告:Peter-科技报告数据库

搜索引擎基本工作原理

搜索引擎基本原理 一.全文搜索引擎 在搜索引擎分类部分我们提到过全文搜索引擎从网站提取信息建立网页数据库的概念。搜索引擎的自动信息搜集功能分两种。一种是定期搜索,即每隔一段时间(比如Google一般是28天),搜索引擎主动派出“蜘蛛”程序,对一定IP地址范围内的互联网站进行检索,一旦发现新的网站,它会自动提取网站的信息和网址加入自己的数据库。 另一种是提交网站搜索,即网站拥有者主动向搜索引擎提交网址,它在一定时间内(2天到数月不等)定向向你的网站派出“蜘蛛”程序,扫描你的网站并将有关信息存入数据库,以备用户查询。由于近年来搜索引擎索引规则发生了很大变化,主动提交网址并不保证你的网站能进入搜索引擎数据库,因此目前最好的办法是多获得一些外部链接,让搜索引擎有更多机会找到你并自动将你的网站收录。 当用户以关键词查找信息时,搜索引擎会在数据库中进行搜寻,如果找到与用户要求内容相符的网站,便采用特殊的算法——通常根据网页中关键词的匹配程度,出现的位置/频次,链接质量等——计算出各网页的相关度及排名等级,然后根据关联度高低,按顺序将这些网页链接返回给用户。 二.目录索引 与全文搜索引擎相比,目录索引有许多不同之处。 首先,搜索引擎属于自动网站检索,而目录索引则完全依赖手工操作。用户提交网站后,目录编辑人员会亲自浏览你的网站,然后根据一套自定的评判标准甚至编辑人员的主观印象,决定是否接纳你的网站。 其次,搜索引擎收录网站时,只要网站本身没有违反有关的规则,一般都能登录成功。而目录索引对网站的要求则高得多,有时即使登录多次也不一定成功。

尤其象Yahoo!这样的超级索引,登录更是困难。(由于登录Yahoo!的难度最大,而它又是商家网络营销必争之地,所以我们会在后面用专门的篇幅介绍登录Yahoo雅虎的技巧) 此外,在登录搜索引擎时,我们一般不用考虑网站的分类问题,而登录目录索引时则必须将网站放在一个最合适的目录(Directory)。 最后,搜索引擎中各网站的有关信息都是从用户网页中自动提取的,所以用户的角度看,我们拥有更多的自主权;而目录索引则要求必须手工另外填写网站信息,而且还有各种各样的限制。更有甚者,如果工作人员认为你提交网站的目录、网站信息不合适,他可以随时对其进行调整,当然事先是不会和你商量的。 目录索引,顾名思义就是将网站分门别类地存放在相应的目录中,因此用户在查询信息时,可选择关键词搜索,也可按分类目录逐层查找。如以关键词搜索,返回的结果跟搜索引擎一样,也是根据信息关联程度排列网站,只不过其中人为因素要多一些。如果按分层目录查找,某一目录中网站的排名则是由标题字母的先后顺序决定(也有例外)。 目前,搜索引擎与目录索引有相互融合渗透的趋势。原来一些纯粹的全文搜索引擎现在也提供目录搜索,如Google就借用Open Directory目录提供分类查询。而象 Yahoo! 这些老牌目录索引则通过与Google等搜索引擎合作扩大搜索范围。在默认搜索模式下,一些目录类搜索引擎首先返回的是自己目录中匹配的网站,如国内搜狐、新浪、网易等;而另外一些则默认的是网页搜索,如Yahoo。

信息检索复习知识点

1.信息(Information) 信息是物质存在的一种方式、形态或运动状态,也是事物的一种普遍属性,一般指数据、消息中所包含的意义,可以使消息中所描述事件的不确定性减少。 * 信息的属性——客观存在性 * 信息的作用——消除不确定性 * 信息的形式——数据、消息等事实 2.各种客观存在的、可供人们直接或间接开发与利用的信息的集合总称为信息资源 3. 信息用户Information User 信息的使用者即是信息用户。 使用的情况可以包括需要信息、接受信息和利用信息。 4. 信息需求Information Demand 人们在社会实践活动中,为了解决各种实际问题,会产生对信息的需要,这种需要可表现为对信息的必要感和不满足感。我们把意识到的信息需要定义为信息需求 5. 信息检索Information Retrieval 对信息用户而言,信息检索就是根据各自的目的和要求,选择恰当的信息资源,采用适当的检索手段、检索技术、检索方法,对所需要的信息进行查找、筛选和索取的过程或活动。 6. 信息素质:人们能够敏锐地察觉信息需求,并能进行相应的信息检索、评估以及有效利用所需信息的水平。 * 信息意识 * 信息能力 * 信息道德 7. 信息社会是以知识和信息为基础从而促进社会高速发展的一种社会形态。 8. 经济领域的特征 a.劳动力结构出现根本性的变化,从事信息职业的人数与其它部门职业的人数相比已占绝对优势; b.在国民经济总产值中,信息经济所创产值与其它经济部门所创产值相比已占绝对优势; c.能源消耗少,污染得以控制; d.知识成为社会发展的巨大资源。 9. 社会、文化、生活方面的特征 10.社会观念上的特征 11当代信息环境特征描述 * 信息超载严重 信息超载又称信息泛滥或信息爆炸。它是指在信息时代,伴随着科学技术的迅速发展,出现的数据爆炸、信息平庸化以及噪音化趋势,人们无法根据自己的需要和当前的信息能力选择并消化自己所需要的信息。 * 信息失衡明显 所谓信息失衡是对由于各国经济水平、科技水平和其它多种相关因素的影响,不同国家、不同地区以及不同阶层的人群在信息占有水平以及利用程度上存在极大差距的描述。 * 信息污染成灾 信息污染是指社会信息流中充斥或伴随着的许多不利于人们健康而有效地进行工作、学习、生活的不良信息,危害人类信息环境、影响人们对有效信息予以及时而正常地吸收及利用的社会现象。 * 信息障碍加剧

信息检索知识点

信息检索考点整理 1.信息检索的概念 广义的信息检索是指将信息按一定的方式组织、存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储和检索两个过程; 而狭义的信息检索仅指有序化信息的检索查找。 2.信息检索的原理 就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进行相符性比较,凡是信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问的标识,则具有该特征的信息就从检索工具中输出,输出的信息就是初步命中检索所需的信息。 3.为什么说信息存储和检索是两个不可分割的有机体? 检索的全过程包括存储和检索两个过程,存储和检索是相辅相成、不可分割的。存储过程主要是利用检索语言对文献进行标引,形成文献特征标识并输入检索工具,为检索提供有规律的检索途径;检索过程主要是利用检索语言对检索提问进行标引,形成检索提问标识,再按照存储所提供的检索途径,将检索提问标识与文献特征标识进行比较。检索过程是存储过程的逆过程。因此,检索者只有在全面了解存储者是怎样把文献存入到检索工具中去以后,才知道怎样从检索工具中把所需要的信息检索出来。 4.信息检索的方法 (1)顺查法 (2)倒查法 (3)抽查法 (4)追溯法 (5)循环法 5.信息检索的途径 (1)内部特征途径 a)分类途径 b)主题途径 (2)外部特征途径 a)题名途径 b)著者途径 c)文献编号途径 d)目录检索途径 e)机构检索法 f)引文检索途径 6.布尔模型的优缺点 优点:(1)简单,形式简洁,易于理解; (2)可操作性强,应用广泛; (3)构成的逻辑提问式可以表达与用户思维习惯相一致的查询要求,提供非常精确

网络信息资源开发练习题第1章 信息资源检索基础知识

第1章信息资源检索基础知识 第一部分选择题 一、单项选择题。在每小题列出的备选项中只有一项是最符合题目要求的,请将其选出。 1.文献的三个基本属性是知识性、物质性和(D) A.符号性 B.交流性 C.传递性 D.记录性 2.在信息概念的诸多层次中,最重要的两个层次是从客体出发的本体论层次和从主体出发的(B) A.客观论层次 B.认识论层次 C.主观论层次 3.通常依据信息表达形式和所依附的载体将信息资源分为口语信息资源、体语信息资源、文献信息资源和(A) A.实物信息资源 B.记录型信息资源 C.多媒体信息资源 D.样本信息资源 4.一般是以纸张为存储载体,以印刷技术为主要记录手段,如油印、胶印、复印、激光打印等的文献信息资源是(D) A.书写型信息资源 B.记录型信息资源 C.声像型信息资源 D.印刷型信息资源 5.属于一次信息资源的是( A ) A.期刊论文 B.百科全书 C.综述 D.文摘 6.文献检索工具可以进一步细分为四种检索工具:目录、文摘、索引和 ( B ) A.书目 B.题录 C.摘要 D.年鉴

7.在布尔检索法中,“A or B”表示査找出( C ) A.含有检索词 A同时含有检索词 B的文献 B.含有检索词 A而不含检索词 B的文献 C.含有 A、B之一或同时包含 AB两词的文献 D.含有检索词 B而不含检索词 A的文献 8.使用国家图书馆的高级检索方式,检索式“主题=(民用飞机)”的含义是(A) A.检索主题词字段含有民用飞机的记录 B.检索作者字段含有民用飞机的记录 C.检索标题字段含有民用飞机的记录 D.检索关键词字段含有民用飞机的记录 9.以刊载新闻为主的出版周期最短的定期连续性出版物是(B) A.图书 B.报纸 C.期刊 D.会议论文 10.用来组配检索词的并列关系的组配运算符是(A) A.逻辑“与” B.逻辑“或” C.逻辑“非” D.以上均不是 11.以磁性材料为载体,以磁录技术为主要记录手段而形成的,如磁带、磁盘、光盘等的文献信息资源是( C ) A.多媒体信息资源 B.记录型信息资源 C.声像型信息资源 D.机读型信息资源 12.二次检索指的是(C ) A.第二次检索 B.检索了一次之后,结果不满意,再检索一次 C.在上一次检索的结果集上进行优化的检索 D.与上一次检索的结果进行对比,得到的检索 13.检索语言中,用未经规范化处理的自然语言词汇表达的是( D ) A.标题词 B.主题词 C.叙词 D.关键词 14.检索有关“飞机”、“车辆”、“轮船”等文献,从理论上说主题词应该是( D ) A.“飞机”、“车辆”、“轮船”任意一个 B.“交通工具” C.“飞机”、“车辆”、“轮船”三者 D.这三个词的任意一个加上“交通工具” 15.位置检索主要有词位置检索、同字段检索和 ( A ) A.同句检索 B.F算符检索 C.L算符检索 D.X算符检索

信息检索复习重要知识

一、名词解释(4题,20分) 目录:以一个完整的出版单位或收藏单位作为著录的基本单位,将一批著录款目按照一定的次序编排而成的一种揭示及报道文献的工具。 索引:将某一信息集合中的相关信息按照某中可查顺序排列并系统地指引给读者的一种检索工具。 年鉴:一种按年度出版,概述或反映上一年度有关领域的重大事件、重大进展和重要成果,汇集重要文献、详尽数据很统计资料的连续出版物。 手册:是汇集某一范围内基础知识和基本数据资料,以便于人们在生产、科研、教学等具体工作过程中可以经常查证的实用便览型参考工具。 OPAC:由开放的公共查询目录演化而来,是20世纪70年代末由美国一些大学图书馆和公共图书馆共同开发的供读者查询馆藏数据的联机书目检索系统。 CALIS:是经国务院批准的我国高等教育公共服务体系之一,在教育部的领导下,把国家的投资、现代图书馆理念、先进的技术手段、高校丰富的文献资源和人力资源整合起来。 信息检索:广义上,信息检索是指信息存储与查找的过程,狭义上,指信息查找的过程,信息查找是指通过查询机制从各种检索系统中查找出用户所需要的特定信息的过程。 搜索引擎:泛指网络上以一定的策略搜集信息,对信息进行组织和处理,并为用户提供信息检索服务的工具和系统,是网络资源检索工具的总称。 百科全书:是指收录了各个知识门类的知识,或者系统而完备地概述了某一知识门类知识的大型参考性工具,是最完备的参考工具,有“工具书之王”的美誉。 学位论文:学位论文是伴随着学位制度的实施而产生的,是高等院校或科研机构的毕业生为获取学位资格而撰写的学术性研究论文。 特种文献:一种介于图书与期刊之间的文献类型,通常在出版发行或获取途径方面比较特殊,因此也被称为灰色文献。 电子图书:是指以数字形式加工,通过计算机网络进行传播,,并借助于计算机或类似设备来阅读的图书,是电子出版物中最常见的文献形式。 参考工具书:是根据一定的社会需要以特定的编排方式和检索方法汇编某学科或特定范围的知识和资料,其目的是为人们解决疑难和提供数据或事实信息,是作为工具使用的专供查考的特定类型的图书。 元搜索引擎:是对搜索引擎进行搜索的搜索引擎,是对多个独立搜索引

信息检索基础知识练习题

1. 文献是记录有知识的(A) A 载体 B 纸张 C 光盘 D 磁盘 2. 下列哪种文献属于一次文献( A ) A 期刊论文 B 百科全书 C 综述 D 文摘 3. 下列哪种文献属于二次文献( D ) A 专利文献 B 学位论文 C 会议文献 D 目录 4. 下列哪种文献属于三次文献( C ) A 标准文献 B 学位论文 C 综述 D 文摘 5. 下列选项中属于连续出版物类型的选项有(C) A 图书 B 学位论文 C 科技期刊 D 会议文献 6. 下列选项中属于特种文献类型的有(D) A 报纸 B 图书 C 科技期刊 D 标准文献 7. 以刊载新闻和评论为主的文献是(B) A 图书 B 报纸 C 期刊 D 会议文献 8.《中国图书馆分类法》(简称《中图法》)将图书分成( A ) A 5大部分22个大类

B 5大部分26个大类 C 6大部分22个大类 D 6大部分26个大类 9. 利用文献末尾所附参考文献进行检索的方法是(C) A 倒查法 B 顺查法 C 引文追溯法 D 抽查法 10. 至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合,称为(A) A 数据库 B 记录 C字段 D 文档 11. 广义的信息检索包含两个过程(B) A 检索与利用 B 存储与检索 C 存储与利用 D 检索与报道 12. 中国国家标准的代码是(A) A GB B CB C ZG D CG 13.下列数据库中可以检索期刊论文的是(A) A 万方数据库资源系统 B 超星数字图书馆 C书生之家数字图书馆 D 方正Apabi数字图书馆 14. 期刊论文记录中的“文献出处”字段是指:(C) A 论文的作者 B 论文作者的工作单位 C 刊载论文的期刊名称及年卷期、起止页码 D 收录论文的数据库 15. 以下检索出文献最少的检索式是(C) A a and b B a and b or c

信息检索知识点

计算机检索 1.信息素养(信息素质、信息能力):作为具有IL(information literacy)能力的人,必须能够充分地认识到何时需要信息,并有能力去有效地发现、检索、评价和利用所需要的信息,从而具有终身学习的能力,总能够为任何任务和决策找到所需信息。 2.信息检索 广义:指将信息按照一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程和技术。包括存储和检索两个过程。 狭义:从信息集合中找出所需信息的过程。 信息查找(Information Search,Information Seeking) 2.1信息现状分析 1)信息爆炸 导致文献量急剧增加,内容相互渗透,语种增多; 文献分布异常分散; 文献寿命愈来愈段; 2)由于条件限制,人们吸收和利用信息的能力并未得到相应的提高。 3.检索的作用 1)促进智力资源的开发; 2)协助管理者做出正确的决策; 3)帮助科研人员借鉴前人的研究成果,避免重复劳动; 4)信息检索是知识更新的手段。

4.数据库类型(1):作为图书馆数字资源的数据库特指为科学、教学、学习所需各种参考资料的集合,以数据库的形式管理和利用。 自建数据库:馆藏目录(OPAC),本校学位论文数据库。 商业性数据库:数据库商、出版商和其他机构以商业化方式提供的各种电子资源,图书馆需要支付一定的费用购买数据库的使用权再提供给一定的读者群。 免费数据库:开放获取资源、机构典藏和其他免费的网络资源。 5.数据库类型(2) 从收录文献的内容分,有综合性数据库和专业性数据库之分; 从收录文献的类型分,有图书数据库、期刊数据库、学位论文数据库、报纸数据库、会议文献数据库、专利文献数据库、标准数据库等; 从提供文献的形式分,有全文数据库、文摘数据库、引文数据库; 各数据库举例: 专业数据库:Petroleum Abstract(PA)、EnCSciFinder Schoiar(CA) 综合性数据库:读秀、Scopus、EI、SCI 特定文献类型,如图书、期刊、学位论文等:超星、EIsevier ScienceDirect、PQDT 全文数据库:CNKI、维普、SPE 摘要性数据库:EI、PA 引文数据库:Web of Science、CSSCI(中文社会科学引文索引)

信息检索重点知识

信息:信息是事物存在的方式,运动状态及其特征的反映,是事物发出的信号,消息 信息的特征:载体依附性无线共享性永不枯竭性开发增值性应用时效性存在普遍性 知识:知识是信息的升华和结果,系统化理论化的的信息就称为就称为知识 文献:用一定的方式记录在一定的载体上的知识都称之为文献 信息源:个人为满足信息的需要而获得信息来源称之为信息源 信息源类型:①个人信息源②组织机构信息源③实物型信息源④文献信息源⑤电子型信息源①及时、新颖、传递迅速、但带有主观随意性,久传易出错②内部信息源,共管理人员分析③直观性强,信息量大,有一定隐蔽性④当今数量最大,利用率最高的信息资源⑤内容广泛、使用简便 信息资源:即作为资源的信息。 信息资源的构成要素: 信息生产者,信息,信息技术。 文献信息源分为:图书期刊学位论文科技报告专利文献标准文献产品样本会议文献政府出版物 零次文献:未经出版发行或者未进入社会交流的最原始的文献 一次文献:以作者本人取得的成果为依据而创作的作文报告等公开发表或出版的各种文献 二次文献:按照特定的目的进行筛选,即所谓用一定的检索工具进行过加工的文献 三次文献:根据二次文献提供的线索,选用大量一次文献的内容,经过筛选分类综合和浓缩而再度出版的文献 信息素养DY:能认识到何时需要信息和有效的搜索评估和使用所需要信息的能力 医学信息素养内容:信息意识信息知识信息能力信息道德(DY以医学信息获取、评价和利用等处理能力为核心) 信息检索DY:信息检索包括信息储存和信息获取两个过程,信息的存储:根据信息的外表和内部特征,按照一定的组织编排,使之成为有序化信息集合的过程。信息的获取:根据特定的需要,运用组织好的检索系统和工具,将特定信息找出来的过程。 信息检索的类型:文献检索事实检索数据检索 信息检索原理:是通过对大量分散无序的文献信息进行收集,加工,组织,存储,建立各种各样的检索系统。并通过一定量的方法和手段使存储与检索这两个过程所采用的特征标识达到一致,以便有效的获取和利用信息源。 数据库由文档记录和字段组成 信息检索语言分类:分类语言(体系分类语言和组配语言)和主题语言信息检索的主题语言:标题词、元词、叙词、关键词 信息检索的途径:分类途径主题途径关键词途径著者途径题名途径号码途径 信息检索技术:布尔逻辑检索截词检索位置检索限定字段检索 信息检索的策略(步骤):一分析检索课题,明白目的和要求二,检索系统和数据库的选择三选择检索途径确定检索标识四编制检索表达式调整检索策略五获取原始文献 信息检索的基本要求:全面准确快速 查准率:表示检出的文献中所需要相关文献所占的比例。 查全率:表示检出的相关的文献与全部文献库中实际存储的相关文献的比例 提高查全率的措施:1尽量采取主题词语关键词相结合进行检索 2主题词检索时要进行扩展检索和使用全部副主题词检索 3 分类检索时要进行扩展检索和全部复分检索 4删除某个不甚重要的概念组面,减少AND运算 5多用同义词进行“OR”运算检索6 采用截词检索 提高查准率的的措施:1采用规范化的主题词与副主题词组配进行检索,少用或不用自由词 2采用限定主要概念主题词字段的加权方式进行检索 3增加概念组面,用AND运算符进行连接 4用NOT算符排除无关概念 5限制检索字段如文献类型语种作者刊名等 6调整放宽位置算符等 信息检索的作用 信息检索是信息素养教育的主要内容 信息检索是创新型人才的基本技能 信息检索是科学研究的重要环节 信息检索是开发信息资源的重要途径 信息检索是科学决策的重要前提。 信息素养DY是指判断何时、何地需要信息,并有效地定位、获取、评价和利用信息的一系列能力的总和。 Site:https://www.doczj.com/doc/7310183352.html, filetype:ppt

检索步骤即检索过程

检索步骤即检索过程,是根据检索课题要求,选择检索系统,确定检索标识,按 照一定的检索途径和方法,查找出特定文献的过程。 1.分析研究课题 分析课题的目的是使检索者确定课题要解决的实质问题,即它所含的概念和具体要求及其之间的关系,这是制定检索策略的根本出发点,也是影响检索效率高低或成败的重要因素。 本步骤需明确以下具体问题: (1)研究课题主题; (2)课题所涉及的学科范围; (3)课题所需文献的内容及其特征; (4)课题所需文献的类型,包括文献的出版类型、所需文献量、年代范围、涉及语种、有关著者机构等; (5)课题对查新、查准和查全的指标要求。若要了解某学科、理论、课题、工艺过程等最新进展和动态,则要检测最近文献信息,强调一个“新”字;若要解决研究中某具体问题,找出技术方案,则检索要有针对性,能解决实际问题的文献信息强调一个“准”字;若要撰写综述、述评或专著,要了解课题、事件的前因后果,历史和发展,则检索详尽、全面系统的文献信息,强调一个“全”字。 2.选择检索工具/ 系统,确定检索方法 选择检索系统应注意: (1)根据课题学科范围、所需文献类型,选择合适的检索系统; (2)根据所具备的条件选择手工检索工具或计算机检索数据库,也可采用二者结合的方法; (3)选择报道及时、收录文献全面、索引系统完备的检索系统; (4)既要选择使用综合性的检索工具,也应注意选择使用专业性或单一性的检索工具。 检索的方法很多,在选择检索方法时,可根据课题性质、检索对象、检索范围和实际可能,确定某个具体课题的检索法,如采用追溯法、抽查法等。

3.确定检索途径 在利用检索工具查找文献时,主要利用检索工具的各种索引,即通过检索途径来查找文献线索。检索工具检索途径类目很多。首先应充分利用文献的外部特征即篇名、著者、文种序号等,利用文献外部特征进行检索,非常方便且查准率比较高。但在检索时,仅仅知道要检索的课题,就要利用主题索引和分类索引等。其中主题途径是应用最普遍的途径。 4.确定检索标识(适用于计算机检索) 确定检索标识即选取检索词与构造检索式。然而在实际检索电子资源过程中,我们往往会遗漏一些重要的检索词或选择了不恰当的检索词,这是因为对同一事物不同的人有不同的称呼和表达。我们可以根据相关词汇的生成方式,总结出选取检索用词的几种方法: (1)选取检索词 内容分析所谓内容分析,就是具体说明事物的组成部分。以“ 发电厂烟气净化”为课题作内容分析:发电厂烟气中含有: 灰尘、二氧化硫、氮氧化物;净化操作则由: 除尘、脱硫、脱硝组成。 经过进一步分析可得出:与除尘有关的内容有静电除尘、过滤、脉冲放电等相关的词;与脱硫有关的内容有碱性吸附剂等相关的词;与脱硝有关的内容有流态燃烧技术等相关的词。 对事物的内容和组成了解的越多,才可能提出较全的检索词,如果仅根据一两个浮于表面的抽象词语就会遗漏不少有用的检索词,所得到的文献也不能全面反映课题的内容。 “内容分析”方法可使用于集中检索某一专题的文献。 异称分析

信息检索的基本原理

图书馆胡小莉

目录 第一节信息检索的涵义及类型 第二节信息与信息源 第三节信息检索途径与步骤 第四节信息检索效果的评价 4123

学习目的和要求 1、掌握信息检索的基本概念和类别 2、掌握常用的布尔逻辑、截词、位置检索等检索技术 3、了解信息检索的基本流程

第一节信息检索的涵义及类型 信息检索的涵义 广义:是指将信息按一定的方式组织和存储起来, 并根据信 息用户的需要找出有关信息的过程和技术。全称为“信息存 储与检索”。 狭义:是指该过程的后半部分,即从信息集合中找出所需要 的信息的过程, 相当于人们通常所说的信息查寻。 信息检索的原理:就是将读者(用户)的信息需求与存贮在信息集合体中的信息进行比较和选择,即匹配(match)的过程。即对信 息集合与需求的匹配与选择。

检索与查找的区别 检索查找、搜索、搜寻英文Retrival或Retrieval search 过程和方法有一定的策略,是 系统的查找资料随机或更随意一些。 技能需要一定的专门知 识和技能 简单,任意词用途课题或专题日常生活 结果检索前通常不知道 会有什么结果 通常知道结果效率迅速、准确一般 如果不刻意区分:你完全可以认为它们没有区别!

信息检索的类型 根据信息检索对象形式不同,分为: 分类检索内容 书目检索以文献线索为检索对象的文献检索; 信息用户通过检索获得的是与检索课题有关的一系列文 献线索,然后再通过阅读决定取舍。 全文检索以文献所含的全部信息作为检索内容的; 可以查找到原文或相关的句、段、节、章等文字。 计算机检索发展趋势之一 数据检索以数值或图表形式表示的数据为检索对象; 数据检索是一种确定性检索,用户检索到的各种数据是 经过专家测试、评价、筛选过的,可直接用来进行定量 分析。 事实检索以从文献中抽取的事项为检索内容; 包括事实、概念等非数值信息和数据信息; 确定性检索,用户获得的是有关某一事物的具体答案

最新整理信息检索重点总结及题型知识讲解

信息检索考试内容: 1名词解释(5题,共15分) 2填空(40分) 3简答(难,拉分题,35分) 4著录格式(10分) 书本基础知识: 第一章: 1 信息:是事物属性的再现,是由事物发出的消息、指令、数据等所包含的内容,广泛地存在于自然界和人类社会中。 2 知识:人们对客观事物运动规律的认识,是经过人脑加工处理过的系统化了的信息。知识是人类经验和智慧的总结,是人们科学地认识世界、改造世界的力量。 3 情报:指传递着的有特定效用的知识。是人们为了解决某个具体问题所需的新的知识信息。基本属性:知识性、传递性和效用性。信息>知识>情报。 4文献:记录有知识的一切载体。文献的三要素:知识、载体、记录方式。 5科技文献:记录有科学技术信息或知识的一切载体。 科技文献的类型: 按照载体形式划分:①印刷型文献②微缩型③声像型④电子型 按照出版形式划分:图书/期刊/会议文献/科技报告/专利文献/学位论文/技术标准/政府出版物/产品样品和说明书/技术档案/报纸。 按照加工层次分:①一次文献:作者以本人的研究成果为基本素材而创作(或撰写)的文献。包括:期刊论文、专利说明书、会议论文、科技报告、学位论文。 ②二次文献:是指文献情报工作者对一次文献进行加工整理后所得到的产物,也是为了便于管理和利用一次文献,由文献情报工作人员编辑、出版和积累起来的工具性的文献。二次文献的重要性在于可以帮助人们查找一次文献。包括:目录、题录、文摘、索引、各种数目数据库。 ③三次文献:是指利用二次文献,选用一次文献内容,经综合,分析和评述后形成的指南性文献。如综述、述评、词典、手册、百科全书、年鉴、指南数据库、专著、教科书、论文丛集、文献指南、数目的目录。6图书的主要外部特征是:书名、著者、出版社名称、出版地点、出版时间、图书总页数、国际标准书号(ISBN)。国际标准书号具有唯一性。 ①ISBN(International Standard Book Number)由10位数字分成4段组成,各段依次是:地区或语种号-出版商代号-书名号-校验号如:7-302-02372-7,表示中国大陆代号为302的(清华大学)出版社,出版的一种图书,其书号为02372、该书的校验码为7 。 ②国际标准书号由13位数字组成。前三位数字代表图书,中间的9个数字分为三组,分别表示组号、出版社号和书序号,最后一个数字是校验码 7核心期刊:某学科(或某领域)的核心期刊,是指那些发表该学科(或该领域)论文较多、使用率(含被引率、摘转率和流通率)较高、学术影响较大的期刊。 ISSN:国际标准连续性出版物编号(International Standard Serial Number)。 ISSN由8位数字分两段组成,期刊代号+末位是校验号如,ISSN1001--8867为《中国图书馆学报》的国际标准编号。 CN:我国正式出版的期刊都有国内统一刊号(CN),它由地区号、报刊登记号和《中图法》分类号组成,如CN11-2257/G3。地区号依《中华人民共和国行政区划编码表 GB2260-82》取前两位,如北京为11、天津12、上海31、辽宁21、吉林22等。

网络信息资源检索与利用 知识点

第一章 1、情报定义:情报室人们用来解决特定问题所需要的,经过激活过程活化了的,具有使用价值的知识或信息。 2、文献定义:文献是记录知识的一切载体,即用文字、图形、符号或者声频等技术手段记录知识的物质载体。或固化在物质载体上的知识。文献具有三个属性即文献的知识性、记录性、物质性。 3、信息、知识、情报和文献的关系 信息是物质存在的方式、形态和运动规律的表征,人脑对物质属性的感知形成信息,信息是起源,是基础;文献是信息、知识、情报的存储载体和重要的传播工具,信息知识和情报的内容只有记录在物质载体上才能构成文献;文献通过传递、应用于理论和实践又会产生新信息。 4、文献信息源文献信息也称文献资源,是用一定的记录手段将系统化的信息内容存储在各类载体上而形成的一类信息源。 5、文献信息源类型 按照信息源的载体类型划分:印刷型缩微型声像型电子型 按照信息源的加工程度划分: 1)零次文献:零次文献是指尚未经过系统整理形成正式文献的零散资料或最原始的记录,如书信、手稿、笔记等。 2)一次文献:一次文献又称原始文献,是作者对自己研究的成果或创造性活动成果的直接记录。一般是指公开出版的著作,期刊论文、科技报告、会议文献、学位论文、专利文献等。3)二次文献:二次文献是将大量分散、无序的一次文献经过筛选、分析、整理,按其内容特征和外部特征进行提炼、浓缩,并按照一定的逻辑顺序和科学体系编制而成的系统化的文献。二次文献包括目录、文摘、索引等,它们是二次文献的核心。 4)三次文献:三次文献是通过二次文献提供的线索,对某一范围的一次文献进行分析、综合研究、归纳、整理等深加工所生成的文献,包括素萍,百科全书、报告、年鉴、手册、字典等。 6、信息检索:广义上说信息检索是指将信息按照一定的方式组织和储蓄起来。并根据信息用户的需求查找出相关信息的过程。 7、著录:是根据一定的规则,对文献的内容和形式特征进行分析、选择和记录的过程。 8、标引:1)按照标引的的工作方式分类:分为人工标引、计算机辅助标引、自动标引。 2)按照标引使用的语言分类:分为主体标引、分类标引。 9、信息检索的类型 按照检索对象的内容划分: 1)文献检索:文献检索包含全文信息检索、目录、题录、索引、文摘等二次文献信息索引。 2) 数据检索:是指以特定的数值型数据为对象的检索。 3)事实检索:是指以特定的事实为目标的检索。 按检索要求划分 1)特性检索:特性检索也称为强相关性检索,强调向用户提供高度对口的信息。 2)族性检索:也称若相关检索。 按照时间跨度划分: 1)定题检索:是根据用户的检索课题的内容和检索的需要,制定检索提问式并将制定好的检索提问式预先存入检索系统中,并定期对检索系统中的信息进行查询。

《信息检索》知识点

5、《信息检索》若干问题 金燕zhihuawang@https://www.doczj.com/doc/7310183352.html, 一、信息检索的基本概念 (一)信息 1、什么是信息 ●信息的概念,至今众说纷纭 ●信息是不确定性的消除 ●信息是负熵 ●信息是客观事物自然性状的外露和表现 ●信息不是物质,也不是能量,信息就是信息 2、信息的特征: (1)客观性与普遍性(2)流动性与传递性 (3)多样性与综合性(4)相对性与有效性 (5)积累性与价值性(6)时效性 3、信息与其他相关概念的关系 ●数据是信息的载体 ●知识是正确的信息 ●情报是知识中的一部分,知识+人的背景、思维方式 4、信息的类型 (1)按信息的加工程度:一次信息、二次信息(目录、文献、索引等)、三次信息(评论、年鉴、百科全书、指南等) (2)按信息的表现形式:文字信息、音频信息、视频信息、实物信息等。(3)按信息的出版类型:图书、期刊、报纸、会议论文等、网络信息、 5、信息的载体类型 (1)印刷型(如纸) (2)缩微型(如缩微胶片、缩微胶卷) (3)声像型(如录音带、录像带) (4)电子型(指采用电子型载体。如光盘、软盘、网络载体等) (二)信息检索 1、信息检索的概念 信息检索是从任何信息集合中识别和获取所需信息的过程及其所采取的一系列方法和策略。 广义上,它包括存储与检索两个方面。 侠义上,仅仅指信息检索的过程。 信息的存储主要包括对在一定专业范围内的信息选择基础上进行信息特征描述、加工并使其有序化的过程,目的是建立有序信息集合。 信息的检索是借助一定的设备与工具,采用一系列方法与策略从数据库中查找出所需信息的过程。 信息检索的本质就是信息检索系统对信息集合与信息需求的匹配与选择。 2、信息检索的基本原理

文献检索的途径和步骤

文献检索的途径和步骤 文献检索途径 著者途径 许多检索系统备有著者索引、机构(机构著者或著者所在机构)索引,专利文献检索系统有专利权人索引,利用这些索引从著者、编者、译者、专利权人的姓名或机关团体名称字顺进行检索的途径统称为著者途径。题名包括书名刊名等途径一些检索系统中提供按题名字顺检索的途径,如书名目录和刊名目录。 分类途径 按学科分类体系来检索文献。这一途径是以知识体系为中心分类排检的,因此,比较能体现学科系统性,反映学科与事物的隶属、派生与平行的关系,便于我们从学科所属范围来查找文献资料,并且可以起到"触类旁通"的作用。从分类途经检索文献资料,主要是利用分类目录和分类索引。 主题途径 通过反映文献资料内容的主题词来检索文献。由于主题法能集中反映一个主题的各方面文献资料,因而便于读者对某一问题、某一事物和对象作全面系统的专题性研究。我们通过主题目录或索引,即可查到同一主题的各方面文献资料。 引文途径 文献所附参考文献或引用文献,是文献的外表特征之一。利用这种引文而编制的索引系统,称为引文索引系统,它提供从被引论文去检索引用论文的一种途径,称为引文途径。 序号途径 有些文献有特定的序号,如专利号、报告号、合同号、标准号、国际标准书号和刊号等。文献序号对于识别一定的文献,具有明确、简短、唯一性特点。依此编成的各种序号索引可以提供按序号自身顺序检索文献信息的途径。 代码途径 利用事物的某种代码编成的索引,如分子式索引、环系索引等,可以从特定代码顺序进行检索。 专门项目途径 从文献信息所包含的或有关的名词术语、地名、人名、机构名、商品名、生物属名、年代等的特定顺序进行检索,可以解决某些特别的问题。 编辑本段文献检索方法 直接法 又称常用法,是指直接利用检索系统(工具)检索文献信息的方法。它又分为顺查法、倒查法和抽查法。 顺查法 顺查法是指按照时间的顺序,由远及近地利用检索系统进行文献信息检索的方法。这种方法能收集到某一课题的系统文献,它适用于较大课题的文献检索。例如,已知某课题的起始年代,现在需要了解其发展的全过程,就可以用顺查法从最初的年代开始,逐渐向近期查找。倒查法 倒查法是由近及远,从新到旧,逆着时间的顺序利用检索工具进行文献检索的方法。此法的重点是放在近期文献上。使用这种方法可以最快地获得最新资料。 抽查法 抽查法是指针对项目的特点,选择有关该项目的文献信息最可能出现或最多出现的时间段,利用检索工具进行重点检索的方法。

计算机检索的步骤和方法

计算机检索的步骤和方法 1、明确检索要求和检索目标 计算机检索的第一步准备工作是明确检索要求和检索目标。明确检索要求就是要搞清楚本课题属于什么学科,所需文献的类型及语种,查找文献的年代,所需文献的最佳篇数,允许支配的检索费用。这些要求对选择数据库、构造检索策略都是十分重要的。 确定检索目标也是进行计算机信息检索前应搞清楚的准备工作。例如:如果属于开题调研,则应尽可能地检索出与之相关的全部文献,即要求较高的查全率;以便充分地做好开题的准备工作;如果属于探索性、开创性的课题,则只需要查出一些启发性的文献,对查准率和查全率要求都不一定有很高的要求。 2、课题分析 2.1课题概念的分析方法 分析课题就是分析出课题所涉及的主要概念,并找出能代表这些概念的若干个词或词组,进而分析概念之间的上、下、左、右关系。对于新学科、交叉学科和边缘学科的课题,则要搞清楚这些概念之间的关系。概念分析的结果应以概念组为单元的词或词组的形式列出,以便下一步制订检索策略时使用。 2.2隐含概念的分析方法 有些课题的实质性内容往往很难从课题的名称上反映出来,课题所隐含的概念和相关的内容需要从课题所属的专业角度作深入分析,才能提炼出能够确切反映课题内容的检索概念。例如:"社会保障"包含"养老保险"、"失业保险"、"医疗保险"和"社会救济"等概念,如果要检索社会保障方面的文献,应该析出上述概念,才能保证文献的查全率。 2.3 核心概念的选取 有些检索词中已经含有的某些概念,在概念分析中应予以排除。例如:课题"公司劳动奖励、职工培训和养老保险制度管理的理论和实践",如果把"劳动奖励","职工培训","养老保险","公司","制度","管理"六个概念全部组配起来,则会造成大量文献漏检。实际上,劳动力资源管理已经包含了劳动奖励、职工培训和养老保险三个方面,而且,劳动力管理必然是针对该三个方面而言的。因此,本课题只须采用"劳动力资源"和"管理"这两个本质概念即可。 为了提高文献的查准率,应该从相应的规范词表中选择所需的检索词。并且在确定检索词时,除了要考虑反映主题概念的同义词、近义词等相关的检索词外,还要注意选择被选用

相关主题
文本预览
相关文档 最新文档